من بين الابتكارات التي غيّرت مسار الذكاء الاصطناعي في السنوات الأخيرة، تبرز تقنية المحوِّلات (Transformers) بوصفها الشرارة التي أطلقت الثورة الحديثة في فهم اللغة والتفاعل الذكي مع الإنسان. فبينما نتعامل اليوم مع تطبيقات مثل ChatGPT أو Deep Seek أو غيرها من النماذج الذكية، ننسى أن هذه الأدوات تقوم على فكرة واحدة وُلدت داخل مختبرات «غوغل» عام 2017، عندما نشر فريق بحثي ورقة بعنوان Attention Is All You Need، لتعلن بداية عصر جديد في معالجة اللغة الطبيعية.

قبل ظهور المحوِّلات، كانت أنظمة الذكاء الاصطناعي تتعلم اللغة بطريقة تشبه قراءة كتاب سطرًا بسطر، كلمة تلو أخرى. هذه الطريقة، رغم بساطتها، كانت محدودة في فهم المعنى الكلي للجمل الطويلة؛ لأن النموذج لا يستطيع النظر إلى كل الكلمات في الوقت نفسه. أما المحوِّل فغيَّر القاعدة تمامًا؛ إذ سمح للآلة بأن تفهم النص كاملاً دفعة واحدة، من خلال ما يُعرف بآلية الانتباه الذاتي (Self-Attention)، وهي الطريقة التي تمكِّن النموذج من التركيز على الكلمات الأكثر أهمية في الجملة، وفهم العلاقة بينها بطريقة تشبه طريقة الإنسان في التفكير.

فكِّر مثلًا في الجملة: الطالب الذي اجتهد طوال العام نجح بتفوُّق. عندما نحاول تحديد من الذي نجح، ينتبه العقل مباشرة إلى كلمة «الطالب» ويتجاهل «العام» لأنها ليست جوهر المعنى. المحوِّل يفعل الشيء نفسه، ولكن بطريقة رياضية دقيقة؛ إذ يوزِّع "انتباهه" على الكلمات التي تمنح النص معناه الحقيقي. بهذه الآلية، أصبح الذكاء الاصطناعي قادرًا على التعامل مع النصوص الطويلة وفهمها بعمق غير مسبوق.

ولتبسيط الفكرة أكثر، يمكننا النظر إلى مثال تطبيقي يوضح كيف يعمل المحوِّل في الممارسة. تخيَّل أنك تقول للجهاز: "الولد رمى الكرة؛ لأنها كانت خفيفة."

إذا سألناه بعد ذلك: ما الذي كان خفيفًا؟

فالنماذج القديمة ربما تجيب بشكل غير دقيق؛ لأنها لا تربط بين الكلمة "كانت" و"الكرة" بشكل صحيح.

أما نموذج الـTransformer فيفعل العكس تمامًا. فعندما يصل إلى كلمة "كانت"، يوجّه انتباهه تلقائيًا نحو كلمة "الكرة" في بداية الجملة، فيفهم أن الحديث عنها، وليست عن "الولد". النتيجة: إجابة صحيحة وسياق منطقي.

هكذا يتعامل النموذج مع النصوص: لا يقرأها خطيًا بل يفهم العلاقات بين الكلمات، مثل شبكة تربط المعاني ببعضها.

منذ ذلك الاكتشاف، تغيّر المشهد كليًّا. ظهرت نماذج جديدة مثل BERT وGPT وT5 وClaude، وكلها مبنية على المحوِّلات. هذه النماذج لم تكتفِ بفهم النصوص، بل بدأت تولّدها أيضًا: تكتب، تلخّص، تترجم، وتبرمج. ما كان يُعدّ سابقًا خيالًا علميًّا أصبح اليوم جزءًا من حياتنا اليومية. فعندما تطلب من ChatGPT كتابة مقال أو تلخيص نص، أو حين تستخدم Google Translate لترجمة فقرة طويلة، فإن المحوِّل هو من يعمل في الخلفية، يفكك الجمل، ويعيد تركيبها بطريقة تحافظ على المعنى والسياق.

تأثير هذه التقنية تجاوز اللغة إلى مجالات أخرى. فنسخ مطوَّرة من المحوِّلات تُستخدم اليوم في تحليل الصور، وتعرُّف الأصوات، وحتى في أبحاث الطب والفضاء. وبذلك تحولت فكرة واحدة إلى أساس تكنولوجي يقف خلف أغلب إنجازات الذكاء الاصطناعي الحديثة.

أما العلاقة بين المحوِّلات والذكاء الاصطناعي التوليدي فهي علاقة جوهرية. فالمحوِّل هو الذي منح النماذج القدرة على التنبؤ بالكلمة التالية في النص بدقة مذهلة، وهي الآلية التي تقوم عليها كل النماذج اللغوية الضخمة. دون هذه البنية، لم يكن بالإمكان ظهور أدوات مثل GPT-4 أو Gemini أو Claude، ولم يكن العالم ليدخل هذه المرحلة الجديدة من الحوار الذكي بين الإنسان والآلة.

اليوم يعمل الباحثون على تطوير نسخ أكثر كفاءة من المحوِّلات، تقلل استهلاك الطاقة وتفهم لغات وثقافات متعددة. ومع هذا التطور المستمر، يبدو أن المحوِّلات ستبقى القلب النابض في جسد الذكاء الاصطناعي الحديث، فهي التي علّمت الآلة كيف "تفهم" قبل أن "تجيب"، وكيف تربط بين المعاني بدل أن تكرر الكلمات. إنها ببساطة، العقل الذي يقف خلف الثورة الذكية التي نعيشها اليوم.

