“مدونة اللغة العربية المعاصرة”.. مشروع لتوظيف تقنيات الذكاء الاصطناعي لخدمة القارئ العربي
أعلن مجمع الملك سلمان قبل أيام عن إنشاء مشروع “مدونة اللغة العربية المعاصرة”، لتكون أهم المصادر اللغوية الداعمة لتوظيف تقنيات الذكاء الاصطناعي وبناء التطبيقات الحاسوبية.
وتعمل المدونة على رصد الظواهر اللغوية، وتحليل اللغة عبر منصة إلكترونية متخصصة تسهل البحث والاسترجاع والتحليل، والاستفادة منها في اختبار نماذج الذكاء الاصطناعي وتدريبها.
ومن المرتقب أن تركز المدونة على اللغة العربية المعاصرة في آخر 100 سنة، لتكون الأساس لمعجم حديث للغة العربية، يخدم القارئ العربي والمتعلم والباحث في حوسبة اللغة.
والمدونة اللغوية هي نصوص إلكترونية تجمع لغرض معين بناء على معايير خارجية، والمقصود بالمعايير الخارجية أي التي ليس لمحتوى النص علاقة بها، مثل أوعية النشر أو تاريخ النشر، أي أنه يتم وضع المعايير التي تناسب الغرض ثم يعقب ذلك البحث عن النصوص التي تحقق هذه المعايير بغض النظر عن المحتوى.
وتختلف الأغراض التي على أساسها تبنى المدونة، فالمدونات في الأساس تبنى لدراسة اللغة أو لبناء النماذج الحاسوبية لها، علما بأن المدونة اللغوية ليست مكتبة إلكترونية لاستعراض وقراءة النصوص.
ويسعى قطاع الحوسبة اللغوية في مجمع الملك سلمان العالمي للغة العربية إلى تعزيز المصادر اللغوية التي تسهم في تسريع وتيرة البحث العلمي في اللغة العربية، ورفع موثوقية المنهجيات العلمية المستعملة فيها، وذلك من خلال توفير مصادر لغوية موثوقة للاستعمال والتحليل اللغوي.
ومن أبرز أهداف مدونة اللغة العربية المعاصرة: بناء مصدر لغوي يمثل اللغة العربية المعاصرة وفق معايير تصميم محددة، ودعم الأبحاث اللغوية واستخراج المعلومات بطريقة ميسرة للباحث عن الظواهر اللغوية، بالإضافة إلى تيسير توظيف الذكاء الاصطناعي لبناء أدوات ذكية ونماذج حاسوبية مبنية على المدونة. ووفقا لمجمع الملك سلمان العالمي للغة العربية، تحتوي المدونة اللغوية المعاصرة على 300 مليون كلمة تمثل عينة متوازنة للغة العربية المعاصرة، كما تنقسم إلى أطر زمنية وجغرافية وأوعية وموضوعات مختلفة، كما تحتوي على مواد منطوقة ومكتوبة.
وسائل إعلام