"أصوات" تفتح كنز اللهجات السعودية أمام الذكاء الاصطناعي
أعلن مجمع الملك سلمان العالمي للغة العربية عن إطلاق "مدونة أصوات"، وهي أول قاعدة بيانات صوتية مكتوبة تمثل مختلف اللهجات السعودية، إلى جانب اللغة العربية الفصحى، وفق أحدث المعايير العلمية.
ويُعد المشروع نقلة نوعية في توثيق وتحليل التنوّع اللغوي داخل المملكة، إذ لا يكتفي بتجميع التسجيلات، بل يُفرّغها ويُحللها نحويًا ودلاليًا، مع تمثيل شامل لمختلف فئات المجتمع: كبار، أطفال، نساء، ورجال.
لهجات من 40 موقعًا جغرافيًا.. ودقة حاسوبية
تغطي مدونة أصوات أكثر من 40 نقطة جغرافية داخل السعودية، بما يعكس ثراء المشهد اللهجي في البلاد. وتُستمد التسجيلات من مواقف حياتية واقعية، لتعكس طبيعة التحدث اليومية بعيدًا عن التنميط أو الاصطناع.
ويمثل هذا التنوع أداة قوية لفهم الفروقات بين اللهجات، وهو ما يمنح الباحثين رؤى دقيقة حول تطوّر اللغة، وتوزيعها الجغرافي، وتحولاتها في المجتمع المعاصر.
اقرأ أيضًا: الجوازات توضح شروط تجديد الجواز السعودي بعد انتهاء صلاحيته
أداة للمستقبل: من اللغويين إلى مبرمجي الذكاء الاصطناعي
يتجاوز المشروع طموح التوثيق إلى خدمة الذكاء الاصطناعي، حيث توفّر "مدونة أصوات" قاعدة بيانات قابلة للقراءة الآلية، يمكن استخدامها في تدريب أنظمة الإملاء الصوتي، وبناء المعاجم الإلكترونية، وتطوير أدوات لغوية ذكية.
وتستهدف المدونة المبرمجين، الأكاديميين، صناع المعاجم، ومطوري التقنيات اللغوية، لتكون منصة مرجعية للتعامل مع اللغة المنطوقة بذكاء علمي وتقني.
