ثورة في الذكاء الاصطناعي.. FlexOlmo يسمح بحذف البيانات حتى بعد استخدامها
في خطوة قد تعيد رسم طريقة بناء نماذج الذكاء الاصطناعي، كشف معهد Allen Institute for AI Ai2 عن نموذج لغوي جديد باسم FlexOlmo، يمنح أصحاب البيانات قدرة غير مسبوقة على التحكم في استخدام بياناتهم حتى بعد إدراجها في عملية التدريب.
وعلى عكس ما هو متّبع حاليًا حيث تصبح البيانات غير قابلة للفصل عن النموذج بمجرد التدريب، يقدم FlexOlmo مقاربة مبتكرة تشبه، كما وصفها الباحثون، "استخراج البيض من كعكة مخبوزة".
كيف يعمل FlexOlmo؟
يعتمد النموذج على بنية تُعرف باسم "مزيج الخبراء" (Mixture of Experts)، بحيث تُدرّب كل مجموعة بيانات بشكل مستقل في نموذج فرعي، ثم يُدمج لاحقًا مع نموذج أساسي يُعرف باسم Anchor.
الرئيس التنفيذي لـAnthropic: نماذج الذكاء الاصطناعي تهلوس أقل من البشر!
وهذه الآلية تُتيح لصاحب البيانات تدريب النموذج الفرعي على بياناته دون الكشف عنها، ثم دمجه مع النموذج النهائي.
والأهم من ذلك، أنه يمكن لاحقًا إزالة هذا النموذج الفرعي المرتبط ببيانات معيّنة دون الإضرار بالبنية الكاملة للنموذج النهائي، ما يمنح مرونة فريدة في إدارة البيانات.
وهذا النموذج يُعدّ مفيدًا للمؤسسات الإعلامية مثلًا، إذ يمكنها مشاركة محتوى أرشيفها مع نموذج ذكاء اصطناعي، مع الاحتفاظ بحق سحب مساهمتها في أي وقت حال ظهور خلاف قانوني أو تجاري.
ويقول علي فرهادي، الرئيس التنفيذي لـAi2: "تقليديًا، إذا استخدمتُ بياناتك، فأنت تفقد السيطرة عليها. FlexOlmo يغيّر هذه القاعدة تمامًا".
واعتمد الباحثون على مجموعة بيانات خاصة أطلقوا عليها اسم Flexmix، جمعت من كتب ومواقع إلكترونية، لبناء نموذج يحتوي على 37 مليار معلمة، أي نحو عُشر حجم أكبر نموذج مفتوح المصدر لدى Meta.
وأظهرت التجارب أن النموذج الجديد تفوّق على النماذج الفردية في جميع المهام، بل وتجاوز أداء تقنيات دمج مشابهة بنسبة 10% في بعض المعايير القياسية.
تحديات الخصوصية والآفاق المستقبلية
ورغم أن البيانات لا تُسلم فعليًا للمطورين، يُحذّر الباحثون من احتمال إمكانية استعادة بعض المعلومات من النماذج المدمجة. ولهذا، يقترحون استخدام تقنيات مثل الخصوصية التفاضلية لضمان سلامة البيانات عند الاستخدام في بيئات حساسة.
خبراء يحذرون: لا تثق بكل ما يُقال عن تفوق نماذج الذكاء الاصطناعي
ويقول الباحث سيوون مين، التي قادت الجانب الفني في المشروع: "أعتقد أن البيانات هي العائق الأكبر حاليًا أمام بناء نماذج ذات مستوى عالمي.. وهذا الأسلوب قد يفتح الباب لبناء نماذج تشاركية دون التنازل عن الخصوصية أو السيطرة".
