تكنولوجيا
لماذا لا تُحقّق أدوات الذكاء الصناعي توقعاتك دائمًا؟
كثر من صانعي المحتوى يلجأون إلى أدوات توليد الصور بالذكاء الصناعي، مثل Midjourney أو DALL·E أو Stable Diffusionأو chat-gpt، آملين تحويل أفكارهم البصرية إلى صور واقعية تعكس أفكارهم. لكنهم غالبًا ما يُصابون بالإحباط: الكلمات نفسها، الفكرة نفسها ونتائج مختلفة تمامًا، أو بعيدة عن التوقع.
السبب ليس في ضعف الأداة، بل في سوء فهم طريقة "رؤية" الذكاء الصناعي للعالم البصري. نحن البشر نرى الصورة قصة أو رسالة أو مشهد مليء بالمعنى، بينما يرى الذكاء الصناعي الصورة مجموعة من الأنماط الرقمية والعلاقات اللونية وتوزيعات الضوء، أي بيانات رياضية لا على أنها تجارب إنسانية.
هذا المقال لا يهدف إلى شرح الذكاء الصناعي من الناحية النظرية، بل إلى تزويدك -بصفتك صانع محتوى- بفهم عملي لكيفية تفكير النماذج البصرية، وكيف يمكنك تحويل العشوائية إلى تحكّم دقيق عبر كتابة Prompts ذكية.
أولًا- الذكاء الصناعي لا "يرى"… بل "يحسب"
الإنسان يدرك الصورة كوحدة ذات سياق عاطفي وثقافي. أما الذكاء الصناعي، فيتعامل معها كـ:
* شبكة من البكسلات
* أنماط متكررة في البيانات
* احتمالات رياضية لترتيب الألوان والأشكال
لذلك، عندما تكتب "شاب يبتسم"؛ هو لا يتخيل النموذج "ابتسامة دافئة تعكس الأمل"، بل يبحث في بياناته عن التركيبات الأكثر احتمالًا التي تجمع بين "شاب" و"ابتسامة" استنادًا إلى ملايين الصور التي تعلّم منها.
ثانيًا: لا تتوقع من الذكاء الصناعي أن يفهم القصد… بل علّمه إياه بدقة.
كيف تُولَد الصورة من العدم؟ (نموذج الانتشار)
تعتمد معظم أدوات توليد الصور الحديثة على ما يُعرف بنماذج الانتشار (Diffusion Models).
الفكرة ببساطة:
1. يُدرّب النموذج على تحويل صور حقيقية إلى (ضوضاء) (Noise) تدريجيًا.
2. ثم يُدرّب على عكس العملية: من الضوضاء إلى صورة منطقية.
عندما تكتب Prompt، فأنت لا "تطلب صورة"، بل تُوجّه عملية إعادة البناء هذه.
كلما كانت كلماتك غامضة ("جميل"، "واقعي")، زادت احتمالات التفسير الخاطئ.
كلما كانت محددة (إضاءة جانبية ناعمة، ألوان دافئة، خلفية ضبابية)، زاد تحكمك في النتيجة.
ثالثًا: Prompt الجيد ليس وصفًا عامًا، بل تعليمات تقنية بصرية.
لماذا تختلف النتائج على الرغم من ثبات الـPrompt؟
هناك ثلاثة عوامل جوهرية تفسّر هذا التباين:
1. الطبيعة الاحتمالية للنموذج: لا يُنتج الذكاء الصناعي "الصورة الصحيحة"، بل أحد الاحتمالات الممكنة ضمن نطاق واسع.
2. السياق اللغوي: كلمة مثل "سينمائي" قد تعني أشياء مختلفة بحسب السياق: هل تقصد إضاءة درامية؟ أم تركيب إطار سينمائي؟ أم تدرج ألوان معيّنًا؟
3. غياب القصد الفني: النموذج لا يعرف جمهورك، ولا هدفك التسويقي، ولا الرسالة التي تريد إيصالها إلا إذا أدخلتها أنت في الـPrompt.
رابعًا: الذكاء الصناعي يعكس ما تكتبه؛ فهو مرآة لوضوح تفكيرك
أنت المستخدم لا بد لك لتحصل على نتائج احترافية، بعيدًا عن العشوائية، من أن تغير نهج التفكير وطريقة الطلب. مثال ذلك إذا كنت تريد صورة: لا تقل: "أريد صورة جميلة للنصر". قل:"شاب لبناني في الثلاثينيات، يزرع أرضه في بلدة مارون الرأس؛ حيث يرفع راية النصر في وسط حقل القمح، بإضاءة سينمائية ناعمة (soft cinematic lighting)، تدرج ألوان أزرق - برتقالي، عمق مجال ضحل (shallow depth of field)، تصوير فوتوغرافي واقعي بأسلوب عدسة 35 مم".

النتيجة؟
صورة بصرية واضحة تعكس طلبك ذات محتوى مقنع وجيد. هذه هي المحاولة الأولى لنموذج chat.qwen.ai المجاني؛ فالصورة جيدة من ناحية التركيب والمكونات، فالشاب يبدو لبنانيًا وفي الثلاثين من عمره وسط الحقل الزراعي رافعًا العلم اللبناني. هذه الصورة جيدة جدًا تعكس الطلب وتجسد الفكرة بشكل مقنع وصالحة للاستخدام.
بعد تعديل الـ "prompt" بإضافة أريد شكل الشاب مزارعًا واليد الثانية رافعة "شارة النصر" كانت هذه النتيجة.

خامسًا: القاعدة لتحصل على الدقة البصرية = التحكّم + التكرار + التحليل.
هناك العديد من الأخطاء الشائعة سنوضح عددًا منها وكيفية تجنبها:
* الاعتماد على Prompts قصيرة أو عامة يؤدي إلى نتائج مبهمة.
* توقع الكمال من المحاولة الأولى غير مجدٍ؛ فالذكاء الصناعي أداة تكرارية، فلا بد لك من إعادة التوجيه لتحصل على النتيجة المرجوة.
* لا تعد النموذج "فنانًا" بل أداة، فهو لا يبتكر، بل يعيد تركيب ما تعلّمه لذلك دورك أن تلعب دور الفنان وتعطيه الشرح المفصل من ناحية السياق والتركيب. لذلك أنت مصدر الإلهام؛ وعليك تخيل المشهد من ناحية زوايا التصوير وتركيب المشهد والتفاصيل الفنية، فالصورة عبارة عن "توقف لحظة من الزمان" وهذه اللحظة أنت من يصنعها.
خلاصة ما تقدم: الذكاء الصناعي لا يفهم… بل يستجيب
* لا يرى المعنى، بل الأنماط.
* لا يختار، بل يحسب الاحتمالات.
* لا يبدع، بل يُعيد التركيب.
لكن أنت – كونك صانع محتوى- تملك ما لا يملكه: القصد، المشاعر، السياق، والرؤية... الخ
مع Prompt ذكي وتجربة متكررة وفهم لطريقة عمل النموذج؛ يمكنك تحويل الذكاء الصناعي من مصدر للإحباط إلى شريك بصري يُعتمد عليه.
ماذا بعد؟
في المقال القادم: "أسرار الـPrompt التي يستخدمها المحترفون: من الكلمات إلى اللغة البصرية"، حيث سنغوص في تقنيات متقدمة لتحويل الأفكار إلى صور دقيقة، متسقة، وجاهزة للنشر.