تقنية جديدة تحمي الأصوات من التزوير باستخدام الذكاء الاصطناعي
كشفت دراسة جديدة عن إمكانية تدريب برامج الذكاء الاصطناعي على "نسيان" أصوات بعينها، وهو تطور واعد قد يشكل درعًا تقنيًا في مواجهة ظاهرة التزييف الصوتي التي باتت تُستخدم في عمليات الاحتيال والتلاعب بالمعلومات.
البحث، الذي نُشر في مجلة MIT Technology Review، يستند إلى تقنية تُعرف باسم "التعلّم العكسي" (Machine Unlearning)، تسمح بإزالة معلومات محددة من ذاكرة النماذج الذكية، بما في ذلك الأصوات التي تم تدريب النظام على محاكاتها.
الدراسة يقودها كل من البروفيسور "جونغ هوان كو" Jong Hwan Ko والباحثة "جينجو كيم" Jinju Kim من جامعة سونغ كيونكوان في كوريا، وتهدف إلى الحد من قدرة نماذج تحويل النص إلى صوت على تقليد أصوات حقيقية دون إذن أصحابها. ويقول كو: "الناس بدأوا يطالبون بحقهم في رفض استخدام أصواتهم دون موافقتهم".
اقرأ أيضًا: دراسة: مستخدمو الذكاء الاصطناعي يدفعون ثمنًا اجتماعيًا في العمل
ورغم أن الشركات المطوّرة للذكاء الاصطناعي تعتمد عادة على آليات الحماية الخارجية مثل الفلاتر التي تمنع النماذج من تقديم نتائج محظورة، إلا أن هذه الدراسة تذهب خطوة أبعد بمحاولة مسح الأصوات من أصل النموذج نفسه.
تعتمد التقنية على أخذ النموذج "المسرّب" والبيانات المراد حذفها، وإعادة تدريب النموذج ليُصبح كما لو لم يتعلم هذه البيانات مطلقًا. وقد استخدم الفريق نسخة من نموذج VoiceBox الذي طوّرته شركة Meta، ونجحوا في جعله يردّ بأصوات عشوائية عند الطلب بأحد الأصوات المحذوفة، بدلًا من تنفيذ الطلب بدقة.
تقنية التعلّم العكسي تقلل التزييف الصوتي بنسبة 75%
عند اختبار النموذج الجديد باستخدام أدوات قياس تشابه الأصوات، تبيّن أن قدرته على تقليد الأصوات المنسية قد انخفضت بنسبة تتجاوز 75% مقارنة بالنسخة الأصلية، وهو ما يجعلها عمليًا مختلفة تمامًا. لكن الفريق يقر بأن هذه "الذاكرة القصيرة" تأتي بثمن، إذ انخفض أداء النموذج بنسبة 2.8% في تقليد الأصوات المسموح بها.
كما أوضح الفريق أن عملية النسيان تستغرق عدة أيام بحسب عدد الأصوات المطلوب حذفها، وتتطلب مقطعًا صوتيًا لا يقل عن خمس دقائق لكل متحدث. وتُستبدل البيانات الأصلية داخل النموذج بعناصر عشوائية يصعب إعادة توليد الصوت منها لاحقًا.
وقالت كيم: "في حين تعمل الحواجز كشبك خارجي يحجب البيانات، يعمل التعلّم العكسي على إزالة تلك البيانات تمامًا". وتضيف: "ما من سياج أصلًا لتتخطاه".
اقرأ أيضًا: الرئيس التنفيذي لـNvidia: الذكاء الاصطناعي لن يسرق وظيفتك بل سيُغيّرها
ورغم أن التقنية لا تزال في بداياتها، خصوصًا أن نماذج "زيرو شوت" (zero-shot) قادرة على تقليد أصوات حتى من دون تدريب مباشر عليها، إلا أن النتائج الأولية تُبشّر بقدرة النماذج الذكية مستقبلًا على نسيان بيانات حساسة دون الإضرار الكبير بكفاءتها،وقال كو: "نحن بحاجة إلى حلول أسرع وأكثر قابلية للتوسّع في التطبيقات الواقعية. نعمل على الوصول إليها".
ومن جهتها، ترى الباحثة "فايديهي باتيل" Vaidehi Patil من جامعة نورث كارولاينا، أن هذا النوع من الأبحاث يُمثل خطوة مهمة نحو تقنيات أكثر أمانًا، رغم التنازلات التقنية المحتّمة. وتختم بالقول: "لا وجود لوجبة مجانية في الذكاء الاصطناعي، كل خطوة تتطلب ثمنًا".
