ديب سيك تحذر من ثغرات "جليبريك" في نماذجها مفتوحة المصدر
أعلنت شركة ديب سيك ومقرها هانغتشو لأول مرة عن تحذيرات من مخاطر النماذج مفتوحة المصدر، مشيرة إلى أن هذه النماذج تكون عرضة لمحاولات "جليبريك" “jailbreak” من قبل مستخدمين خبيثين.
وأوضحت الشركة في ورقة بحثية نشرت في مجلة نيتشر الأكاديمية أنها اختبرت نماذجها باستخدام معايير الصناعة واختبارات داخلية للكشف عن نقاط الضعف في السلامة.
ورغم أن الشركات الأمريكية كانت أكثر شفافية بشأن المخاطر وإجراءات التخفيف مثل سياسات المسؤولية لدى أنثروبي وإطار الاستعداد لدى أوبن إيه آي، إلا أن ديب سيك جاءت لتسلط الضوء على المخاطر المحتملة للنماذج المفتوحة المصدر، بما فيها المخاطر الحرجة التي سبق تقييمها داخليًا.
كيف اختبرت ديب سيك سلامة نماذجها؟
تضمنت تحذيرات ديب سيك من مخاطر النماذج مفتوحة المصدر تفاصيل دقيقة عن منهجية الاختبارات، بما في ذلك اختبارات الفريق الأحمر التي تحاول إجبار النماذج على إنتاج محتوى ضار.
وقد أظهرت النتائج أن نموذج R1 للقياس الاستدلالي ونموذج V3 الأساسي حققا درجات أعلى قليلًا من المتوسط في ستة معايير صناعية مقارنة بنماذج أوبن إيه آي وأنتروبيك.
ومع ذلك، أظهر نموذج R1 “عدم الأمان النسبي” عند إزالة آلية التحكم بالمخاطر الخارجية، مشيرًا إلى أن أي نموذج مفتوح المصدر قد يكون عرضة للإساءة إذا لم تُطبق تدابير السلامة المناسبة.
كما لفتت الشركة إلى أن جميع النماذج أظهرت زيادة ملحوظة في الاستجابات الضارة عند اختبارها ضد هجمات jailbreak، وكانت R1 ونموذج كوان 2.5 التابع لشركة علي بابا الأكثر عرضة بسبب كونها مفتوحة المصدر.
اقرأ أيضًا: أجهزة OpenAI الجديدة تنطلق رسميًا بحلول 2027.. تعرف على التفاصيل
ما هي التوصيات والسياسات للتخفيف من المخاطر؟
تضمنت تحذيرات ديب سيك من مخاطر النماذج مفتوحة المصدر توصيات للمطورين، تحثهم على اعتماد تدابير تحكم بالمخاطر عند استخدام النماذج مفتوحة المصدر في خدماتهم.
وأكدت الورقة البحثية أن المشاركة المفتوحة للتقنيات المتقدمة تعزز الابتكار لكنها تحمل مخاطر إساءة الاستخدام. جاء هذا التحذير بالتزامن مع تحذيرات هيئة المعايير التقنية الصينية المرتبطة بإدارة الفضاء الإلكتروني حول خطر تسرب ثغرات النماذج إلى التطبيقات الأخرى.
كما كشف التقرير لأول مرة عن تكلفة تدريب نموذج R1 التي بلغت 294 ألف دولار، وهو أقل بكثير من تكلفة التدريب المعلنة للنماذج الأمريكية المماثلة.
وأكد التقرير أيضًا أن ديب سيك لم تعتمد على نسخ بيانات من نماذج أوبن إيه آي، لتفنيد أي اتهامات حول استنساخ النماذج. ويأمل الخبراء أن تشجع هذه الورقة البحثية الشركات الصينية الأخرى على الشفافية حول إجراءات السلامة والأمان.
