تطوير برمجيات المعالجة الآلية للغة العربية

إن تطوير محرك بحث قوي يدعم خصائص اللغة العربية، وخاصة الصرفية والنحوية والدلالية، من شأنه تحسين وتسريع الوصول إلى المعلومات والمعارف العربية المنشورة على الشابكة (الإنترنت). كما أن توفير محرّك بحث عربي قوي ومدعوم بفهرس شامل للمحتوى العربي على الشابكة (الإنترنت)، يشكل دافعا قويا لأصحاب المعلومات والمعارف لنشر ما لديهم إلكترونيا. وسيؤدي هذا إلى زيادة كمية المحتوى العربي عالي الجودة علىالشابكة (الإنترنت)، وهو مطلب ملح وهام اقتصادياً واجتماعياً وثقافياً لكل الدول العربية.
تكمن أهمية المشروع في قدرته على إثراء المحتوى الرقمي العربي على الشابكة (الإنترنت) وتصحيحه وهيكلته وإعادة ترتيبه، بما يخدم اللغة العربية ومتحدثيها والباحثين فيها ويثريها بأرشيف ومعلومات ذات فائدة. وفيما يلي بعض النقاط التي تبرز أهمية وجود محرّك بحث عربي مفتوح المصدر:
• إن وجود محرّك بحث عربي يمتاز بالذكاء الاصطناعي وبالقدرة على التعامل الدقيق والعلمي مع خصائص اللغة وخاصة الدلالية منها، وهي الجيل القادم للشابكة (الإنترنت)، سيساعد على تحسين نوعية وكفاءة المعلومات المسترجعة وعلى فهرسة المحتوى العربي بشكل دقيق وذكي.
• إن محرّكات البحث الحالية لم تصمّم لخدمة اللغة العربية، وبالتالي فهي لا تلبّي هدف وحاجة البحث باللغة العربية بالشكل المطلوب مما يضعف كفاءتها ونوعية المعلومات المسترجعة منها.
• إن وجود محرّك بحث عربي قادر على دعم المسح الضوئي للمستندات والمعلومات المكتوبة باللغة العربية، وعلى فهرسة الصحف والمستندات بدرجة عالية من الجودة، سيثري اللغة العربية بكنوز معلوماتية ترتقي بها إلكترونيا وتصب في زيادة وتحسين المحتوى الرقمي العربي على الشابكة (الإنترنت)، الذي يعاني حاليا من ضعفه وعدم كفاءته وتدنّي جودته.
• النقص الشديد في التقنيات اللغوية مفتوحة المصدر الداعمة للغة العربية مثل المصححات الإملائية والمصنفات والملخصات الآلية والمعالجات الصرفية وغيرها من الأدوات المهمة في أرشفة وفهرسة ومعالجة المحتوى الرقمي العربي، والتي بطبيعتها تحسن الوصول إلى المعلومة وتزيد من قدرة محرّك البحث في تصنيف وترتيب المعلومات المسترجعة.
• تكمن أهمية محرك البحث مفتوح المصدر في إشراك العديد من الخبراء اللغويين والمبرمجين والمختصين في البحث والتقنيات العربية في بناء هذا المحرك مما يضمن له الاستمرارية والتقدم.
الأهداف المنشودة من المشروع: 
يسعى المشروع إلى الوصول لما يلي:
• تصميم محرك بحث عربي مفتوح المصدر بمواصفات متميزة ومتخصص في مجال الجامعات والمراكز البحثية العربية. 
• التركيز على اللغة العربية وخاصة خصائصها الدلالية، بشكل يميزه عما هو متوفر في الأسواق من حيث الفعالية والقدرة على التعامل مع خصائص اللغة العربية. 
• تطوير حزمة من الأدوات الخاصة بمعالجة اللغة الطبيعية التي تسخر تقنيات الذكاء الاصطناعي. 
• تسهيل إضافة محتوى جديد باللغة العربية إلى الشابكة.
• تطوير حزمة أدوات لمعالجة المحتوى الرقمي العربي على الشابكة (الإنترنت).
• إدراج مفاهيم بحثية جديدة للبحث في الشابكة (الإنترنت) باللغة العربية.
• تمكين المستخدم العربي غير المتمكن من اللغة الانجليزية من الوصول إلى المعلومات المنشورة على الشابكة (الإنترنت) بيسر وسهولة.