Translate Gemma من غوغل: ثورة في ترجمة النصوص والصور بسرعة وخصوصية
خطت شركة غوغل خطوة كبرى في تكنولوجيا اللغات، بإطلاقها نماذج Translate Gemma، وهي مجموعة من أدوات الترجمة "مفتوحة المصدر" تدعم 55 لغة حول العالم.
صُممت هذه النماذج لتكون متاحة للجميع بثلاثة أحجام مختلفة، لتناسب كافة الاستخدامات؛ بدءاً من الهواتف الذكية البسيطة، وصولاً إلى الحواسيب الشخصية والخوادم العملاقة، مما يجعل الترجمة الاحترافية في متناول اليد في أي وقت ومكان.
وقد أثبتت التجارب التقنية أن طراز 12Bضمن نماذج Translate Gemma، استطاع التفوق على نماذج أكبر منه بضعفين في الدقة والجودة، واللافت أنه حقق ذلك باستخدام أقل من نصف قوة المعالجة المطلوبة عادةً.
هذا الإنجاز يعني أن مستخدمي الحواسيب المحمولة سيتمكنون من الحصول على ترجمة عالية الجودة مباشرة من أجهزتهم، دون الحاجة لإرسال بياناتهم إلى خوادم الشركة عبر الإنترنت، وهو ما يعزز الخصوصية والسرعة بشكل كبير.
ولضمان أعلى مستويات الدقة، دمجت غوغل في تطوير هذه النماذج بين خبرات المترجمين البشر وبين البيانات الذكية المولدة بواسطة نموذج جيمناي الشهير.
كما خضعت نماذج Translate Gemma لمرحلة تدريب مكثفة، لضمان أن تكون صياغة الجمل طبيعية وانسيابية تماماً كأنها بقلم كاتب محترف، مما أدى إلى خفض الأخطاء اللغوية بنسب كبيرة، مقارنة بالإصدارات السابقة.
مميزات نموذج Translate Gemma من غوغل
لم تتوقف قدرات نماذج Translate Gemma عند النصوص المكتوبة فحسب، بل امتدت لتشمل ميزة مبهرة وهي ترجمة النصوص داخل الصور مباشرة.
وتبرز القوة الحقيقية لهذه النماذج في وراثتها للذكاء المتعدد الوسائط من طراز "Gemma 3"؛ فبما أن النموذج الأم مصمم أصلاً لفهم النصوص والصور معًا، فقد انتقلت هذه القدرة تلقائياً إلى نماذج Translate Gemma.
هذا الترابط التقني جعل النماذج الجديدة قادرة على قراءة وترجمة الكلمات المدمجة داخل الصور الفوتوغرافية، مثل لوحات الشوارع، وقوائم الطعام، والوثائق المصورة، بكفاءة مذهلة، وهي ميزة 'فطرية' اكتسبتها من بنية Gemma 3 دون الحاجة لبرمجتها أو تدريبها بشكل منفصل على ترجمة الصور.
تشمل اللغات المدعومة لغات عالمية كبرى مثل الإسبانية، والفرنسية، والماندرين الصينية، إلى جانب عشرات اللغات الأخرى.
وقد وفرت غوغل نماذج Translate Gemma حاليًا عبر منصات تقنية شهيرة مثل "Kaggle" و"Hugging Face"؛ حيث تتوفر النسخة الخفيفة للهواتف، والنسخة المتوسطة للحواسيب الشخصية، بينما تُخصص النسخة العملاقة للأعمال البرمجية المعقدة، التي تتطلب معالجات رسومية متطورة.
