GPT-5.4 .. تفوق في التفكير والبرمجة وإدارة المهام
بعد يومين من طرح GPT-5.3 Instant، أعلنت OpenAI إطلاق نموذج الذكاء الاصطناعي الجديد GPT-5.4، الذي وصفته بأنه الأكثر قدرة وكفاءة حتى الآن، مع تحسينات كبيرة في قدرات التفكير المنطقي والبرمجة وإدارة المهام الاحترافية. بدأ طرح النموذج عبر تطبيق ChatGPT إضافة إلى الواجهة البرمجية API وأداة Codex المخصصة للمبرمجين، لكن ما الجديد؟
التحكم في الحاسوب
نبدأ بالميزة الأبرز، التي تسمح للنموذج بالتحكم في الحاسوب مباشرةً (مثل الذكاء الاصطناعي الوكيل)، من النقر على الماوس، والكتابة على لوحة المفاتيح، والتنقل بين البرامج وغير ذلك. أصبح بإمكانك الآن أن تنشئ وكيلًا ذكيًا يُشغّل المواقع والتطبيقات فعليًا دون الاكتفاء بالوصف وكتابة النصوص.
في اختبار OSWorld-Verified، وهو مقياس يختبر قدرة النماذج على التعامل مع بيئة حاسوب حقيقية، حقق GPT-5.4 نسبة 75%، وهذه النتيجة أعلى بكثير من نتيجة الإصدار السابق GPT-5.2 التي بلغت 47.3%، كما أنها تفوقت قليلًا على متوسط أداء البشر في الاختبار نفسه، والذي يبلغ 72.4%.
أسرع من أي نموذج آخر
وصفت OpenAI نموذج GPT-5.4 بأنه "أكثر النماذج قدرة وكفاءة للأعمال الاحترافية"، كما كشفت عن نسختين إضافيتين تستهدفان الباحثين عن أعلى أداء، وهما: "GPT-5.4 Thinking" و"GPT-5.4 Pro".
كذلك أوضحت الشركة أن نموذج GPT-5.4 أصبح أكثر كفاءة في استهلاك الموارد مقارنةً بكل الإصدارات السابقة، إذ يستخدم الرموز Tokens بكفاءةٍ عالية ومن ثم يحل المشكلة بأقل كمية ممكنة من البيانات، ما يترتب عليه استجابة أعلى وتكلفة أقل.
اقرأ أيضًا: صراع الذكاء الاصطناعي: Gemini 3 بمواجهة GPT-5.1
أداء أقوى في المهام المعقدة
بفضل GPT-5.4، أصبح ChatGPT أفضل كثيرًا في المهام المعقدة التي يقوم بها الموظفون في الحقيقة، وهي المهام التي تتطلب فكرًا وتحليلًا ومنطقًا، مثل البرمجة، وكتابة التقارير المعقدة، وتحليل البيانات، وهكذا.
وفقًا لاختبار GDPval، وهو اختبار يقيس مدى قدرة أنظمة الذكاء الاصطناعي على أداء مهام مهنية عبر 44 وظيفة مختلفة، حقق النموذج الجديد نتائج متقدمة للغاية، إذ طابق أداء البشر المتخصصين أو تفوق عليهم في 83% من المقارنات، في حين أن نموذج GPT-5.2 حقق 70.9% فقط!
في اختبار خاص بنمذجة البيانات المالية، سجل النموذج نسبة 87.5% مقارنةً بنحو 68.4% فقط لنموذج GPT-5.2، وفي اختبار لإنشاء العروض التقديمية، فضّل المقيمون البشريون نتائج GPT-5.4 على GPT-5.2 بنسبة 68%.
أخطاء أقل
على الرغم من أن نماذج الذكاء الاصطناعي لم تعد تهلوس كما كانت، فإن مشكلة الهلوسة ستظل قائمة. الباحثون يقولون إن القضاء على هذه المشكلة أمر مستحيل، لكن مما لا شك فيه أنه يتحسن؛ قارن بين أول وآخر مرة استخدمت فيها هذه النماذج وستعرف الفرق.
ستعرف الفرق أيضًا عندما تستخدم GPT-5.4، الذي يقدم معلومات دقيقة جدًا بعدما انخفضت نسبة الهلوسة والادعاءات الخاطئة التي قد يذكرها بنحو 33%. كذلك انخفضت نسبة الأخطاء داخل المحادثات أو الإجابات الكاملة بنسبة 18%، وهذه أرقام جيدة عند الأخذ في الحسبان أنها جزء من نسب أكبر.
تجربة مختلفة
يقدم نموذج GPT-5.4 Thinking طريقة جديدة للتفاعل، فعندما تسأله سؤالًا يحتاج إلى تفكير، يعرض عليك خطة العمل وخطوات حل المشكلة قبل البدء في التنفيذ، وهذا يسمح بتعديل اتجاه الإجابة أثناء تنفيذ الطلب؛ شيء أشبه بنماذج التفكير العميق لدى ChatGPT وGemini.
إلى جانب ذلك، صار نموذج GPT-5.4 قادرًا على إدارة المحادثات الطويلة والمهام متعددة الخطوات دون أن يفقد السياق وينسى ما الذي كنت تُحدثه عنه، وهذه إضافة قوية لمن يعمل على مشروع أو يحتاج إلى متابعة طويلة في المحادثة نفسها.
اقرأ أيضًا: بعد الجدل الواسع.. هل حل GPT-5 مشكلات إيردوش الرياضية؟
أفضل وأسرع للمبرمجين
تحول نموذج GPT-5.4 ليكون النموذج الأساسي للبرمجة في OpenAI، ليُغني بذلك المستخدمين عن اختيار نموذج خاص بالبرمجة. يمكنك الآن كتابة كود أو تعديل آخر داخل ChatGPT مباشرةً، والنموذج الأحدث سيتولى الأمر بكفاءة.
كما قدمت OpenAI وضعًا سريعًا جديدًا داخل Codex يوفر تحسنًا في السرعة يصل إلى 1.5 مرة، إضافة إلى ميزة تجريبية تسمح للنموذج باختبار تطبيقات الويب أثناء تطويرها، أي يمكنك فتح التطبيق وتجربة الأزرار والصفحات ثم اكتشاف الأخطاء واقتراح التحسينات.
أداء أفضل في Excel
أخيرًا، أعلنت شركة OpenAI عن ميزة جديدة -مخصصة للشركات- من خلال دمج ChatGPT ببرنامج Microsoft Excel وتحسين أدائه، بحيث يمكن الاستفادة من قدرات النموذج في إنشاء الجداول وإدارتها وتحليل البيانات بشكل أكثر دقة وكفاءة.
جدير بالذكر أن استخدام نموذج GPT-5.4 حاليًا يتطلب اشتراكًا مدفوعًا.
