اهلا وسهلا...
موقع العهد الاخباري

كانت البداية في 18 حزيران/ يونيو 1984 في جريدة اسبوعية باسم العهد، ومن ثم في 5 تشرين الثاني/ نوفمبر 1999 أطلقت النسخة الاولى من جريدة العهد على الانترنت إلى ان أصبحت اليوم موقعاً إخبارياً يومياً سياسياً شاملاً

للتواصل: [email protected]
00961555712

المقال التالي تحسّبًا لأيّ حرب جديدة مع إيران.. مستوطنة "غوش عتسيون" تنشر المزيد من الغرف المحصّنة

تكنولوجيا

تطور طريقة تفكير الذكاء الاصطناعي من الحفظ إلى البحث
تكنولوجيا

تطور طريقة تفكير الذكاء الاصطناعي من الحفظ إلى البحث

يمثل التوليد المعزز بالاسترجاع (RAG) تحولاً مهمًا في مسار الذكاء الاصطناعي التوليدي.
60

أستاذ جامعي وباحث في الذكاء الاصطناعي وأمن المعلومات، أُعنى بنشر المعرفة وتبسيط مفاهيم التكنولوجيا بلغةٍ سهلة تُناسب الجميع.
أكتب لأجعل التقنية مفهومة وآمنة في حياتنا اليومية، ولأساهم في بناء وعي رقمي مسؤول.

في السنوات الأخيرة، لم يعد الحديث عن نماذج اللغة الكبيرة مجرد نقاش أكاديمي داخل المختبرات، لقد أصبح جزءًا من الحياة اليومية لملايين المستخدمين عبر محركات البحث الذكية والمساعدات الرقمية وأنظمة دعم القرار. مع هذا الانتشار الواسع، برزت مشكلة جوهرية واجهت الذكاء الاصطناعي التوليدي منذ بداياته، وهي أن هذه النماذج تعتمد على معرفة ثابتة مخزنة في أوزانها، ولا تمتلك وصولاً مباشرًا إلى معلومات حديثة أو مصادر موثوقة يمكن التحقق منها. من هنا؛ ظهر مفهوم Retrieval-Augmented Generation، المعروف اختصارًا بـ RAG، بصفته تحولًا نوعيًا في طريقة تصميم نماذج اللغة الكبيرة واستخدامها.

يقوم RAG على فكرة بسيطة في ظاهرها، لكنها عميقة في آثارها. فبدلاً من أن يعتمد النموذج اللغوي على ذاكرته الداخلية فقط، يُربط بنظام استرجاع معلومات خارجي، غالبًا ما يكون قاعدة بيانات نصية أو مستودعًا معرفيًا ضخمًا. 
عند طرح سؤال أو طلب من المستخدم، لا يكتفي النموذج بتوليد الإجابة مباشرة، تسبق ذلك خطوة بحث واسترجاع لمقاطع نصية ذات صلة من مصادر محددة، ثم تُستخدم هذه المقاطع مدخلات إضافية في أثناء عملية التوليد. بهذا الشكل، تصبح الإجابة مزيجًا بين قدرة النموذج على الفهم اللغوي ودقة المعلومات المسترجعة من مصادر خارجية.

تاريخيا؛ تعود الجذور العلمية لهذا النهج إلى تقاطع مجالين بحثيين راسخين، هما استرجاع المعلومات ونماذج التوليد العصبية. إلا أن الصياغة الواضحة لمفهوم RAG تبلورت مع تطور بنية Transformer وانتشار نماذج اللغة واسعة النطاق. إذ في عالام 2020، قدم باحثون من مختبر فيسبوك للذكاء الاصطناعي إطارًا بحثيًا، جمع بشكل صريح بين وحدة استرجاع تعتمد على تمثيلات دلالية ونموذج توليدي عميق مع تدريب يسمح للنظام بالإفادة من المعرفة الخارجية في أثناء التوليد. منذ تلك اللحظة، أصبح RAG مرجعًا أساسيًا لأي محاولة جادة لجعل نماذج اللغة أكثر ارتباطا بالواقع.

تكمن الأهمية العملية لـ RAG، في دوره المباشر، في معالجة واحدة من أكثر مشكلات الذكاء الاصطناعي التوليدي إثارة للقلق. وهي ظاهرة الهلوسة، حيث ينتج النموذج معلومات تبدو لغويًا مقنعة؛ لكنها غير صحيحة أو مختلقة. عندما يستند النموذج إلى نصوص مسترجعة من مصادر محددة، تقل احتمالية اختلاق المعلومات، وتزداد فرصة تتبع مصدر الإجابة والتحقق منه. هذا الجانب جعل RAG محورًا أساسيًا في التطبيقات الحساسة، مثل الطب والقانون وأمن المعلومات، حيث لا يمكن الاعتماد على إجابات غير موثوقة.

في هذا السياق، يبرز التدريب المسبق Fine-Tuning نهجًا مختلفًا في التعامل مع محدودية نماذج اللغة. يعتمد Fine-Tuning على إعادة تدريب النموذج جزئيًا باستخدام بيانات متخصصة، بهدف توجيهه نحو مجال معين أو تحسين أدائه في مهمة محددة. 

على الرغم من أن هذا الأسلوب يمنح النموذج فهما أعمق للسياق المطلوب، فإنّ المعرفة الناتجة تظل مخزنة داخل أوزانه، ما يجعل تحديثها عملية مكلفة ومعقدة. بخلاف ذلك، لا يسعى RAG إلى تعديل المعرفة الداخلية للنموذج، بل يمنحه القدرة على الوصول الديناميكي إلى مصادر خارجية محدثة. لهذا، ينظر إلى Fine-Tuning اليوم على أنه أداة لضبط السلوك والأسلوب، بينما يمثل RAG آلية لربط النموذج بالمعرفة الحية، وهو ما يفسر الاتجاه المتزايد نحو الجمع بين الأسلوبين في الأنظمة المتقدمة.
مع توسع استخدام نماذج اللغة في البيئات المؤسسية، تحول RAG إلى أداة استراتيجية لربط الذكاء الاصطناعي بالبيانات الداخلية للمؤسسات من دون الحاجة إلى إعادة التدريب. إذ بدلاً من إدخال الوثائق الحساسة ضمن بيانات التدريب، يمكن للنموذج الوصول إليها عند الحاجة فقط، وتوليد إجابات مبنية على سياسات الشركة وتقاريرها وسجلاتها التقنية. أصبح هذا النهج شائعًا، بشكل خاص، في أنظمة الدعم الفني الذكية ومراكز عمليات الأمن السيبراني، حيث تتطلب القرارات معلومات دقيقة ومحدثة باستمرار.

أما من حيث المنصات، فقد بدأ استخدام RAG في الأطر البحثية والتجريبية، ثم انتقل بسرعة إلى البيئات الصناعية. اليوم، توفر معظم منصات تطوير نماذج اللغة بنى جاهزة لتطبيق هذا النهج، سواء عبر قواعد بيانات أم محركات بحث دلالية متقدمة. يعكس هذا الانتشار قناعة متزايدة بأن مستقبل الذكاء الاصطناعي التوليدي لا يكمن في نماذج معزولة، بل في أنظمة هجينة تجمع بين الفهم اللغوي العميق والوصول المنهجي إلى المعرفة.

في سياق تطور الذكاء الاصطناعي التوليدي، يمكن النظر إلى RAG كونه خطوة انتقالية نحو نماذج أكثر مسؤولية وشفافية. هو لا يهدف إلى جعل النموذج أذكى عبر زيادة عدد المعاملات فقط، بل إلى جعله أكثر ارتباطا بالمعلومة الصحيحة وأكثر قابلية للمساءلة. في الخلاصة، يمكن تبسيط الفكرة بالقول إن RAG يحول نموذج اللغة من آلة تعتمد على الذاكرة وحدها، إلى باحث رقمي يقرأ أولا ثم يجيب.

ختامًا، لا يمثل Retrieval-Augmented Generation مجرد تقنية إضافية، بل يعكس تحولاً فلسفيًا في تصميم أنظمة الذكاء الاصطناعي. إذ بدلاً من السعي لبناء نماذج تعرف كل شيء، يتجه الباحثون والمطورون إلى بناء نماذج تعرف كيف تصل إلى المعرفة الصحيحة في الوقت المناسب. 

هذا التحول يعدّ من العوامل الحاسمة التي ستشكل مستقبل الذكاء الاصطناعي التوليدي، لا سيما في المجالات التي تتطلب دقة عالية وتحديثًا مستمرًا، وثقة في المخرجات.

الكلمات المفتاحية
مشاركة