لم يعد توليد الصور بالذكاء الاصطناعي مجرد تجربة لإنتاج مشاهد جميلة، بل أصبح مجالًا يتطور بسرعة نحو الاحترافية الكاملة، جاء إعلان OpenAI عن نموذج ChatGPT Image 2 ليؤكد أن المرحلة القادمة لن تعتمد فقط على جودة الصورة، بل على دقة التفاصيل داخلها، خاصة النصوص، حيث إنه يجعل الصور المُولدة بالذكاء الاصطناعي أقرب إلى الأعمال الجاهزة للنشر والاستخدام التجاري.
يعتمد النموذج على مجموعة من الخصائص التقنية التي تعكس تطورًا واضحًا في قدراته:
كتابة نصوص دقيقة وواضحة داخل الصور دون تشويه.
تنفيذ التعليمات المعقدة بدرجة عالية من الفهم.
إنتاج عدة تصاميم مختلفة من نفس الطلب.
تحسين النتائج تلقائيًا قبل عرضها.
دعم لغات متعددة، بما في ذلك اللغات غير اللاتينية.
إنشاء صور بجودة تصل إلى 2K.
التعامل مع التفاصيل الصغيرة مثل الأيقونات والعناصر الدقيقة.
إلى جانب الجانب التقني، يقدم نموذج ChatGPT Image 2 تجربة استخدام أكثر سلاسة واحترافية، حيث يتميز بما يلي:
إمكانية الاعتماد على الصور مباشرة في المشاريع دون تعديل.
مناسب لإنشاء الإعلانات والمحتوى التسويقي.
يساعد في إنتاج قصص مصورة متعددة الإطارات بسهولة.
يقلل من الحاجة إلى إعادة الطلب أو التعديل.
يوفر وقتًا كبيرًا مقارنة بالتصميم اليدوي.
يقدم نتائج أقرب للواقع وأكثر اتساقًا.
ما يميز هذا النموذج أنه لا يكتفي بتنفيذ الطلب، بل يتعامل معه بذكاء أكبر.
فهو قادر على إنتاج أكثر من نسخة للصورة، وتحسينها قبل عرضها، ما يجعل النتائج أقرب لما يتوقعه المستخدم من البداية.
رغم التقدم الكبير في نماذج انتاج الصور بالذكاء الاصطناعي السابقة، ظل هناك عنصر يكشفها بسهولة وهي أن الكلمات داخل الصور غالبًا ما كانت تظهر بشكل عشوائي أو غير صحيح، وهو ما كان يضعف من مصداقية التصميم بالكامل، حتى لو كان الشكل العام جيدًا.
هذه المشكلة لم تكن مجرد خطأ تقني، بل نتيجة لطبيعة بناء الصور في تلك النماذج، التي لم تكن تعطي أولوية كافية للتفاصيل الدقيقة.
في الإصدارات الأقدم، كانت عملية إنشاء الصور تعتمد على Diffusion Models، وهي طريقة تبدأ من ضوضاء رقمية ثم تعيد تشكيل الصورة تدريجيًا، مع التركيز على التكوين العام.
أما في النموذج الجديد، فقد تم تبني أساليب أقرب لطريقة تفكير نماذج اللغة، مثل Autoregressive Models، حيث يتم بناء الصورة بشكل منظم ومتسلسل، ما يساعد على فهم العلاقة بين العناصر البصرية والنصوص داخلها.
هذا التغيير هو السبب الرئيس وراء التحسن الملحوظ في جودة الكلمات داخل الصور.
أصبح نموذج ChatGPT Image 2 متاحًا للمستخدمين اعتبارًا من 21 أبريل/نيسان 2026، مع مزايا إضافية للمشتركين في الخطط المدفوعة، بالإضافة إلى توفير واجهة gpt-image-2 API للمطورين الراغبين في دمج هذه التقنية داخل تطبيقاتهم.