دراسة: تكتيكات نفسية تقنع روبوتات الدردشة بخرق القواعد
.
أظهرت دراسة أكاديمية حديثة أن روبوتات الدردشة الذكية قد تخضع لتأثير تكتيكات نفسية بسيطة، على نحو يشبه السلوك البشري.
وأكد باحثون من جامعة بنسلفانيا أن نماذج لغوية متطورة، من بينها GPT-4o Mini من شركة OpenAI، تجاوبت مع طلبات كانت سترفضها عادة، عندما استُخدمت أساليب إقناع محددة.
مخاطر روبوتات الدردشة
وأوضح الباحثون أن هذه الأساليب استندت إلى المبادئ التي وضعها عالم النفس الأميركي روبرت سيالديني في كتابه الشهير Influence: The Psychology of Persuasion.
اقرأ أيضًا: بفضل الذكاء الاصطناعي.. علي بابا ترفع قيمتها السوقية بهذا الرقم الخيالي
وشملت هذه المبادئ سبع تقنيات: السلطة، الالتزام، الإعجاب، المعاملة بالمثل، الندرة، الدليل الاجتماعي، والوحدة.
تكتيكات نفسية تكشف ثغرات الذكاء الاصطناعي
الدراسة بيّنت أن نجاح التأثير يعتمد على طريقة صياغة السؤال وسياقه، فعلى سبيل المثال، حين طُلب من الروبوت مباشرة شرح كيفية تصنيع مادة كيميائية محظورة، تجاوب بنسبة 1% فقط.
لكن عندما مُهّد له بسؤال أبسط عن تركيب مادة مسموحة مثل الفانيلين، ارتفعت نسبة الامتثال إلى 100% عند إعادة السؤال عن المادة المحظورة.
اقرأ أيضًا: هل تفوق الذكاء الاصطناعي على البشر في الأفكار؟ دراسة تحسم الجدل
كما أظهرت التجارب أن استخدام الإطراء أو عبارات مهينة خفيفة قد زاد من احتمالية تجاوب الروبوت مع طلبات مرفوضة.
كذلك عززت الإشارة إلى أن "نماذج لغوية أخرى تقوم بالفعل بهذا الأمر" من فرص الامتثال بنسبة وصلت إلى 18%.
ويرى الباحثون أن هذه النتائج تُبرز الحاجة إلى تطوير معايير أمان أكثر صرامة للذكاء الاصطناعي، لا سيما مع تزايد الاعتماد على روبوتات الدردشة في قطاعات حساسة.
اقرأ أيضًا: شريك لا منافس: كيف يساعد الذكاء الاصطناعي رواد الأعمال على زيادة الإنتاجية والنمو؟
وأكدوا أن الإقناع النفسي قد يُستخدم لاستغلال الثغرات ودفع النماذج إلى تجاوز ضوابطها المبرمجة.
