OpenAI تطلق ChatGPT Agent رسميًا.. فما الذي يميّزه عن Operator وأين يتفوّق؟
تخيل أنك تريد إنجاز مهمة متعددة الخطوات على الحاسوب، ولتكن حجز مطعم ما -لم تستقر عليه بعد- لسهرتك القادمة، في الظروف العادية، ستفتح الحاسوب، تبحث عن مطاعم الأسماك واللحوم، أو مطاعم المأكولات البحرية، أو مطاعم النباتيين، أو أيًا كان ما تفضله من مطاعم؛ تبدأ في قراءة تقييمات العملاء على جوجل، ثم تقارن الأسعار وقوائم الطعام، وربما تفتح الخرائط لترى "اللوكيشن"، وإذا حسمت قرارك، فربما تنتقل إلى موقع المطعم الإلكتروني وتبحث عن رقم الهاتف لتحجز طاولتك.
ومع دخول الذكاء الاصطناعي، أصبحت العملية أسهل قليلًا، حيث بات بإمكانك أن تسأل ChatGPT -أو أي روبوت آخر للدردشة- عما تريده وسيجلب لك المعلومات التي تحتاجها بالضبط، دون أن تتصفح أكثر من نتيجة بحث وتضيع وقتك، وإن كان من الوارد أن يُخطئ ChatGPT -أو غيره- كونه مُبرمَجًا على ألا يقول "لا أعرف".
ومع ذلك، تظل المشكلة قائمة، فعلى الرغم من أن الذكاء الاصطناعي يمكنه أن يختصر عليك الكثير من الوقت، فإن قدراته تظل مقتصرة على توليد البيانات، سواء كانت صورًا أو فيديوهات أو أصوات، إلخ، وليس اتخاذ القرارات؛ فأنت الذي عليه أن يذهب لموقع المطعم ويحجز الطاولة، ولكن مع تحديث OpenAI الأخير، يبدو أن كل هذا سيصبح في خبر كان، إذ بات بإمكان ChatGPT أن يكون فاعلًا، وبكفاءة!
ChatGPT Agent: ذكاء اصطناعي يُنفّذ بكفاءة!
الكشف عن وكيل OpenAI الجديد تم من خلال منشورٍ على موقع X، قالت فيه OpenAI: "تشات جي بي تي يمكنه الآن العمل نيابةً عنك باستخدام حاسوبه الخاص".
"ChatGPT Agent" مُتاحٌ الآن عبر الخطط المدفوعة؛ الـ Pro، وPlus، وTeam (بباقات تبدأ من 40 طلبًا شهريًا في الخطط الأقل وحتى 400 طلب شهريًا لباقة الـ Pro)، ويُمكنك تجربته عبر أيقونة "الأدوات Tools" الموجودة في خانة المحادثات، فيما ليس معروفًا ما إذا كانت OpenAI ستطرح هذه الأداة لمشتركي الخطط المجانية، ولكن كل شيء وارد.
تُشبه أداة "ChatGPT Agent" أداة "Operator" التي قدمتها OpenAI في يناير الماضي، لكن الفرق بينهما واضح، فبينما تتيح الأداة الأخيرة تصفح الويب والتفاعل معه بطريقة محدودة، تستطيع أداة "ChatGPT Agent" أن تفعل ما هو أكثر من ذلك بكثير، حيث تستطيع توليد البيانات، وتصفح الإنترنت، وكتابة وتحرير الملفات، مثل ملفات الـ PowerPoint والـ Excel، واستخدام أداة "تيرمينال" وتشغيل الأكواد.
ولعل ما يميز أداة "ChatGPT Agent" أيضًا أنها تجمع بين "Operator" وخاصية "البحث العميق Deep Research"، ولهذا من الصعب أن تختلق الإجابات، لأنها تستعين بمصادر من الويب، وغالبًا ما تكون موثوقة كونها تُحلل كمًّا مهولًا من البيانات، وتستقر على المعلومات المُتفَق عليها.
الشيء المشترك بين الأداتين أنك تستطيع التواصل مع الذكاء الاصطناعي بـ"اللغة الطبيعية Natural Language"، ما يعني أنك تستطيع تحقيق نتائج مذهلة بكلمات بسيطة ودارجة، لكن كما نقول دائمًا؛ كلما كان وصف الشيء الذي تريده دقيقًا، كانت النتائج أفضل.
ما الذي يفعله ChatGPT Agent بالضبط؟
قدرات وإمكانيات الأداة الجديدة غير محدودة، لكن OpenAI استشهدت بمثالين جيدين ومختلفين يُبيّنان كل شيء.
في المثال الأول أشادت OpenAI بقدرة "ChatGPT Agent" على تحليل 3 منافسين وإعداد عرض تقديمي عنهم، وهذه ليست مهمة سهلة البتة، إذ تتطلب أكثر من مجرد جمع للبيانات، وإلّا لكانت نماذج مثل "GPT-4o" أو "o3" فعلتها.
نحن هنا نتحدث عن عمليةٍ شاملة تتطلب فهمًا عميقًا لبيانات الشركات أو المواقع المنافسة، ثم تحليلها عن طريق قراءة كل ما يتعلق بها من بيانات رسمية أو تقارير أو أخبار موثوقة، ثم تلخيص كل ذلك في عرضٍ تقديمي مكون من "شرائح Slides" جاهزة للتحميل، وقابلة للفهم والاستيعاب من جهة البشر.
في المثال الثاني، قالت OpenAI إنك تستطيع الاستفادة من وكيلها الجديد وتجعله "يُخطط ويشتري مكونات فطورٍ ياباني لـ4 أشخاص"، وهذه أيضًا ليست مهمة سهلة، حتى على البشر، حيث تتطلب فهم مكونات الفطور الياباني، ومعرفة المتاجر أو المواقع الإلكترونية التي تبيعه، والكمية اللازمة لإرضاء الأشخاص الأربعة، وأخيرًا إجراء العملية ودفع النقود، ويستطيع "ChatGPT Agent" أن يقوم بكل ذلك نيابةً عنك أيضًا، بدايةً من فهم الطلب وحتى إجرائه، بينما لن يكون عليك سوى الانتظار.
جدير بالذكر أن فُرص الأخطاء هنا تكون قليلة، وذلك لاعتماد الأداة على خاصية "البحث العميق" التي تُرفق لك الإجابات بمصادرها، والتي عادةً ما تكون موثوقة بدورها.
كذلك يجب أن تعرف أن أي طلب من "ChatGPT Agent" قد يستغرق وقتًا طويلًا ربما يصل إلى النصف ساعة، حيث إن النظام ليس مصممًا ليكون الأسرع، بل ليقوم بالمهام المعقدة التي تتطلب دمج عدة خطوات وأدوات معًا، لكن في النهاية، ستحصل على ما تريده بأفضل نتيجة مقارنةً بالتنفيذ اليدوي، وبالطبع ستوفر الوقت بالمجمل.
وكما قلنا، إمكانيات "ChatGPT Agent" غير محدودة، ويمكنك أن تطلب منه الكثير والكثير من الأشياء، مثل: الوصول للبريد الإلكتروني خاصتك وتلخيصه، وأتمتة بعض المهام الروتينية على أساس يومي أو أسبوعي، وجدولة وتنظيم رحلات السفر بشكلٍ كامل، وتعبئة الاستمارات الإلكترونية بسهولة، وغيرها الكثير من الأمور؛ فقط أطلق العنان لخيالك وامنح الأداة الصلاحيات اللازمة وستتولى الأمر.
اقرأ أيضًا: كيف يختلف Manus AI عن نماذج الذكاء الاصطناعي الأخرى؟
ماذا عن الخصوصية؟
بما أننا ذكرنا الصلاحيات، فيجب أن نذكر الخصوصية، وهنا تقول OpenAI إنها اتخذت مجموعة من التدابير الاحتياطية للحد من أخطاء النموذج، خاصةً أنه أصبح قادرًا على إجراء مهام تؤثر وتتأثر بالعالم الحقيقي.
مبدئيًا، لا يمكن لهذه الأداة أن تفعل شيئًا دون موافقتك الصريحة، التي ستُطلَب منك قبل اتخاذ أي إجراء قد يكون له عواقب، مثل إجراء عملية شراء.
بعض المهام الحساسة، مثل إرسال الإيميلات، ستتطلب إشرافك المباشر والنشط حتى لا تحدث أخطاء جسيمة أو حتى بسيطة تؤثر عليك أو على الآخرين بشكلٍ ما.
وإذا أردت من "ChatGPT Agent" أن يؤدي مهمةً حساسة ونسبة المخاطرة فيها عالية، مثل التحويلات البنكية، فأغلب الظن أن الطلب سيُرفَض.
تقول OpenAI أيضًا إنك تستطيع حذف جميع بيانات التصفح، والخروج فوريًا من جميع الجلسات النشطة على المواقع بضغطة زر واحدة، لكنها تُنبّه إلى الاحتفاظ بملفات تعريف الارتباط (الكوكيز) بناءً على سياسات كل موقع تزوره، وهذا ما يرفضه البعض عادةً.
أخيرًا وليس آخرًا، تدّعي الشركة أنه عند التفاعل مع الويب، لا يتم التجسس أو الاحتفاظ بالبيانات الخاصة مثل كلمات المرور أو غيرها من البيانات التي لا يحتاج إليها النموذج.
هل تثق بإمكانيات ChatGPT Agent؟
في الوقت الراهن، لا يُنصَح بالوثوق في الذكاء الاصطناعي ثقةً عمياء، وذلك ببساطة لأنه يُخطئ في أمورٍ بسيطة رُغم إمكانياته الجبارة، ومهما كانت هذه الأخطاء نادرة، فإن فرص حدوثها تظل قائمة، ولا أحد يعرف متى يمكن أن تحدث، وما التأثير الذي يمكن أن تتسبب به.
ووفقًا لاختبارات OpenAI الداخلية، فإن أداة "ChatGPT Agent" تتفوق على جميع نماذجها الأخرى، بل على البشر أنفسهم في الاختبارات المتعلقة بالمهام الاقتصادية المعقدة، ليس في كل الحالات طبعًا، لكن في نسبةٍ كبيرة منها.
ومع ذلك، لا يزال من المهم مراجعة إجابات "ChatGPT Agent" والتأكد من كل شيء؛ هذه نصيحة OpenAI نفسها، التي تعترف أن هذا الوكيل لا يزال في مراحله الأولى، وأنه قد يخطئ أحيانًا رُغم ما يمكن أن يؤديه من مهام معقدة.
