English أتصل بنا | بحث
القراءة الآلية للنصوص العربية
مشروع القراءة الآلية للنصوص العربية المطبوعة تعمل على مختلف الخطوط
تقنيات معالجة اللغة العربية
تقنيات معالجة الكلام المنطوق
تلخيص النصوص العربية
القراءة الآلية للنصوص العربية
الذخائر اللغوية العربية
أدوات خدمة النص القرآني
تجربة تقنيات آر دي آي
أوراق بحثية
كِلِيفـَرْ بِيجْ©

لقد كان مجتمع المشتغلين بتجميع النظم من أجل بناء وتسويق التطبيقات الداعمة للغة العربية يبحثون دائمًا عن تقنية برمجية رفيعة الأداء ذات موثوقية من أجل القراءة الآلية للنصوص العربية المطبوعة يعمل على مختلف الخطوط.

وكما هو الحال مع نظم القراءة الآلية للنصوص، فإن مثل تلك التقنية تستقبل وثائق عربية مطبوعة بعد مسحها ضوئيـًّا، ثم تنتج آليـًّا الملفات النصية الرقمية المقابلة لهذه الوثائق كما لو كان عامل بشري على لوحة المفاتيح قد قام بنسخها يدويـًّا.

إن نظم إدارة الوثائق، وتحويل المكتبات للنظام الرقمي، واستعادة المعلومات، وإدخال النصوص أحادي الوسيط/متعدد الوسائط، ومساعدة المكفوفين في القراءة ... إلخ هي كلها مجرد أمثلة على التطبيقات التي يمكن أن تستفيد من القراءة الآلية للنصوص العربية المطبوعة. وعلاوة على ذلك، فإنه يمكن أيضًا لبرمجيات راسخة للقراءة الآلية للنصوص العربية المطبوعة أن تفيد لغات أخرى تستخدم نظم خِطاطة مشابهة للخِطاطة العربية مثل اللغة الفارسية، واللغة الأردية، والكردية ... إلخ.

ومن اللافت للنظر أن نظم القراءة الآلية على وجه العموم يجري تطويرها منذ عقود، وأن عشرات من النظم التجريبية لنظم القراءة الآلية العربية قد تم تطويرها أكاديميـًّا، وأنه قد جرى حتى طرح حفنة من برمجيات القراءة الآلية العربية في الأسواق. ورغم ذلك، فإن توافر برمجيات في الأسواق يُعتمَد عليها للقراءة الآلية العربية تستطيع العمل على الوثائق العربية المطبوعة بظروفها الواقعية (ذات خطوط متعددة، ومقاسات متعددة، وربما تحتوي على شوشرة ... إلخ) وتعطي دقة تَعرّف في حدود 3% ، ما زال بعيدًا عن التحقق.

وقد دخلت آر دي آي إلى هذا المجال بتقنية جديدة أثبتت فعاليتها وتقوم على أسس شبيهة بتلك المستخدمة في الأنظمة الرقمية للتعرف الآلي على الكلام المنطوق. ففي نظام آر دي آي ©CleverPage تستخدم نماذج ماركوف المخبأة HMM الشهيرة كأداة التعرف، كما ابتكر باحثو الشركة التفاضلات العَرْضية ذاتية التسوية لتكون خاصية التعرف، كما تم تصميم خوارزم جديد لتقطيع السطور والكلمات.

وقد أبدت الإصدارات المبكرة من هذا النظام نتائج ممتازة عندما جرى تجريبه على عدد ضخم من الوثائق التي تحتوي على خطوط مختلفة وأحجام مختلفة. وفي الواقع، فإن هذه النتائج هي أفضل ما يوجد في الأبحاث المنشورة حتى الآن فيما يتعلق بأنظمة القراءة الآلية للنصوص العربية المطبوعة التي تعمل على مختلف الخطوط.

إن التاريخ الطويل لآر دي آي وخصوصًا أ.د. محسن رشوان، و د. محمد عطية في هذا المجال بما في ذلك العديد من أطروحات الدكتوراة والماجستير، والأوراق البحثية المنشورة في المؤتمرات الدولية والدوريات، والنظم التجريبية التي تم تطويرها فضلاً عن براءة اختراع دولية، تمثل جميعها قاعدة قوية ترسي نجاح هذه التقنية الأساسية من آر دي آي.

للمزيد من المعلومات التفصيلية...

نظام للقراءة الآلية للنصوص العربية المطبوعة شبيه بنظم التعرف الآلي على الكلام المنطوق القائمة على نماذج ماركوف المخبأة، ديسمبر 2007م.
(ملف بي دي إف، 429 كيلو بايت)

نظام موسع قائم على نماذج ماركوف المخبأة للقراءة الآلية للنصوص المطبوعة ذات نظم الخِطاطة متصلة الحروف، يعمل على مختلف الخطوط: أطروحة دكتوراة من إعداد محمد المحلاوي، جامعة القاهرة، أبريل 2008م.
(ملف بي دي إف، 625 كيلو بايت)

النتائج التجريبية والخلاصات.
(ملف بي بي إس، 5,135 كيلو بايت)

مقارنة تحليلية مع الأنظمة التجارية الأخرى للقراءة الآلية للنصوص العربية - يناير 2008.
(ملف بي دي إف - عربي - 728 كيلو بايت)

عرض تقديمي لخوارزم آر دي آي لتقطيع السطور والكلمات.
(ملف بي بي إس، 1,888 كيلو بايت)

التاريخ البحثي لآر دي آي في القراءة الآلية للنصوص العربية - سبتمبر 2007م.
(ملف بي دي إف، 116 كيلو بايت) 

تحميل | وظائف
www.rdi-eg.com
.RDI© - الشركة الهندسية لتطوير النظم الرقمية
.منذ 1993 جميع الحقوق محفوظة