وداعًا للأخطاء الإملائية.. "أوبن إيه آي" تطلق نموذجها الجديد ChatGPT Images 2.0
أطلقت شركة أوبن إيه آي نموذجها الجديد ChatGPT Images 2.0، الذي يمثل نقلة نوعية في عالم توليد الصور بالذكاء الاصطناعي.
ويتميز النموذج الجديد بقدرات متقدمة في التعامل مع النصوص داخل الصور، وهي نقطة ضعف عانت منها النماذج السابقة مثل DALL·E 3، حيث كان من السهل اكتشاف الأخطاء الإملائية أو الكلمات غير المفهومة في القوائم أو الملصقات.
ووفقًا لتقرير نشرته "TechCrunch"، أوضح أسميلاش تيكا هادغو، الرئيس التنفيذي لشركة Lesan AI، أن النماذج السابقة لتوليد الصور كانت تعتمد على تقنية "الانتشار"، وهي آلية تبدأ من صورة مشوشة وتعيد بناءها تدريجيًا حتى تكتمل.
وجعلت هذه الطريقة النصوص المكتوبة داخل الصور تظهر بشكل ضعيف أو غير دقيق، لأنها تشغل مساحة صغيرة يصعب على النموذج التركيز عليها.
أمّا الآن، فقد اتجه الباحثون إلى استخدام "النماذج التوليدية التنبؤية" (Autoregressive Models)، التي تعمل بطريقة أقرب إلى نماذج اللغة مثل ChatGPT، حيث تتنبأ بما يجب أن يظهر في كل جزء من الصورة خطوة بخطوة.
وساعد هذا الأسلوب بشكل كبير على تحسين دقة النصوص داخل الصور وجعلها أوضح وأكثر واقعية.
قدرات جديدة في Images 2.0
ويتمتع النموذج الجديد بما وصفته أوبن إيه آي بـ "قدرات التفكير"، حيث يمكنه البحث عبر الإنترنت، إنشاء عدة صور من وصف نصي واحد، والتحقق من النتائج قبل عرضها.
وتمنح هذه الميزات للمستخدمين القدرة على إنتاج أصول تسويقية بأحجام مختلفة، إضافة إلى قصص مصورة متعددة اللوحات، وكل ذلك بدقة تصل إلى 2K.
وأكدت الشركة أن النموذج أصبح أكثر قدرة على التعامل مع النصوص غير اللاتينية مثل اليابانية والكورية والهندية والبنغالية، ما يفتح المجال أمام استخدامات أوسع في الأسواق العالمية.
إتاحة Images 2.0 وتحديات الدقة الزمنية والمعرفية
وأصبح ChatGPT Images 2.0 متاحًا لجميع مستخدمي ChatGPT وCodex منذ يوم الثلاثاء، مع منح المشتركين المدفوعين إمكانية الوصول إلى مخرجات أكثر تقدمًا.
ووفّرت الشركة واجهة برمجية (API) باسم gpt-image-2، بأسعار تعتمد على جودة ودقة الصور المنتجة.
وأوضحت أوبن إيه آي أن النموذج تمكن من إنتاج صور معقدة تحافظ على التفاصيل الدقيقة مثل النصوص الصغيرة، الأيقونات، عناصر واجهة المستخدم، والتراكيب الكثيفة، وهي نقاط كانت تمثل تحديًا كبيرًا للنماذج السابقة.
وفي الوقت نفسه، أشارت الشركة إلى أن قاعدة معرفة النموذج توقفت عند ديسمبر 2025، ما قد يؤثر على دقة بعض الأحداث الحديثة عند استخدامها في الأوصاف النصية الخاصة بتوليد الصور.
