أهلا بكم في مدونة الدكتور محمود إسماعيل صالح

الجمعة، 27 ديسمبر 2013


في سبيل خدمة اللغة العربية حاسوبيا:

التعاون بين اللغويين والحاسوبيين

د/ محمود إسماعيل صالح

أستاذ اللسانيات التطبيقية
 
(هذا نص ورقة كتبت في العام 1428هـ  /  2007م)
 
من ذاكرة التاريخ:

إن الحديث عن المعالجة الآلية للغة لحديث ذو شجون خاصة لإنسان  مثلي بدأ اهتمامه به منذ أكثر من أربعين عاما ، وذلك عندما زرت المعرض الدولي World Fair الذي عقد في عام 1965بمدينة نيويورك ودعاني ممثل شركة آي بي إم ليعرض علي إحدى معجزات الحاسوب ، وهو الترجمة الآلية من الروسية إلى الإنجليزية (على ما كانت عليه من حالة بدائية آنذاك ). ثم ترسخ اهتمامي باللغويات الحاسوبية عندما وصلت إلى جامعة جورج تاون في واشنطن ، حيث كانت المطور الرئيس لمشروع الترجمة الآلية المشار إليه أعلاه . فكان مقرر اللغويات الحاسوبية من المقررات التي عزمت على دراستها في الجامعة ، وقد فعلت .

لقد طرأت تغيرات كبيرة في شتى مجالات المعرفة ذات العلاقة منذ ذلك التاريخ : فاللسانيات ظهرت فيها اتجاهات ومدارس عديدة عاش بعضها وتطور وخبا نور بعضها . ومن أهم مدارسها المدرسة التوليدية التحويلية Transformational Generative Grammar ومشتقاتها وتطوراتها ، مثل النحو المعجمي الوظيفي Lexical Functional Grammar والتحكم والربط  Government and Government and Binding ونحو الحالة الإعرابية Case Grammar وغيرها، وقد كان لمعظم هذه الاتجاهات تأثيرها في اللسانيات الحاسوبية وتطبيقاتها المختلفة.
 



من حيث الحواسيب والبرمجيات ، طرأت هناك تغيرات جوهرية نقلت الحاسوب من أجهزة ومعدات تملأ مبنى كاملا وتسير بسرعة بطيئة إلى عالم الحواسيب المحمولة ، وحواسيب الجيب ، كما زادت ذاكراتها من آلاف البايتات إلى آلاف الميقا والقيقا بايت وما صاحب ذلك من سرعات هائلة في عمل المعالجات . ولمعالجة العمليات الأكثر تطورا وتعقيدا (مثل اللغات البشرية) ، ظهرت أيضا الحاجة إلى تطوير لغات البرمجة المختلفة ، فلم تعد لغات الفورتران والكوبول ثم البيسك وغيرها تفي بمتطلبات البرمجة والمعالجة المتطورة ، مما يتطلب أكثر من مجرد الحساب الرياضي ، مثل متطلبات الذكاء الاصطناعي وقواعد الخبرة أو الأنظمة الخبيرة ، إضافة إلى الترجمة الآلية للنصوص المكتوبة والمنطوقة (ما كان يطلق عليه بحواسيب الجيل الخامس) .

ومنذ ذلك الحين سعدت بالحضور والمشاركة في عدد من اللقاءات المتعلقة بالموضوع ، خاصة فيما يتعلق باللغة العربية .

لاشك أن نظرة سريعة إلى الميدان تبين لنا أن قضايا المعالجة الحاسوبية للغات الطبيعية كثيرة ومتشعبة ، منها ما يتعلق بالأصوات (تعرفا وتوليفا recognition and synthesis) مع استخداماتها المختلفة ، ومنها ما يتعلق بالكلمات (تحليلا صرفيا وتركيبا) ومنها ما يتعلق بالتراكيب النحوية (إعرابا وتأليفا) ، ومنها مايتعلق بالجوانب الدلالية semantic  للغة ومايسمى بالحالات الإعرابية case ، وذلك لأغراض متباينة ، مثل التكشيف indexing والاستعلام retrieval الآليين ومنها الترجمة الألية machine translation والترجمة بمعاونة الحاسوب computer aided translation إلى غير ذلك من استخدامات لاحصر لها .

 وإذا نظرنا إلى ميدان اللغة العربية سنجد أنه منذ المحاولات الأولي لتعريب معدات الحاسوب (بدءا بلوحة المفاتيح) وبعض لغات البرمجة (البيسك خاصة) التي قام بها رواد عرب من بلدان مختلفة ، قامت جهود لابأس بها لمعالجة جوانب من اللغة العربية (الكتابة والأصوات والصرف ، بل والأوزان الشعرية) ، تمت جميعها باستثناء حالات قليلة بدعم من القطاع الخاص . ولعل أبرز هذه البرمجيات ما يتعلق بالتحليل الصرفي للغة العربية والتي تم تطوير عدد منها في الكويت (مركزآي بي إم الذي انتقل لاحقا إلى القاهرة ، وشركة العالمية التي انتقل نشاطها إلى القاهرة كذلك) وفي المغرب ، ثم التدقيق الإملائي ومحاولات التصحيح النحوي، وأخيرا مشروعات الترجمة الآلية التي خرج عدد منها إلى السوق ، مثل المترجم العربي وترجمان والوسيط ، بل إن بعضها يعمل على الشبكة العنكبوتية ، مثل عجيب ومسبار .

وقد ظهرت ولا تزال تظهر عشرات البرامج الحاسوبية التعليمية العامة أو المنهجية، منذ بدأت شركة صخر بتطوير هذه البرامج التي كانت تعمل على حواسيب خاصة ، ثم على الحواسيب الصغيرة العامة .

إن ما يهمنا اليوم هو الحديث عن جانب واحد للتعاون بين اللغويين والحاسوبيين ، ألا وهو ما يسمى بلسانيات المدونات . ويتلخص الموضوع في استخدام الحاسوب في معالجة المدونات اللغوية (مجموعات من النصوص اللغوية) للوصول إلى معلومات صوتية phonological/ phonetic أو صرفية morphological أو معجمية lexical أونحوية syntactic أو خطابية discourse ، وذلك لأغراض مختلفة ، كما في إعداد المعاجم الحديثة وإعداد المراجع اللغوية المبنية على النصوص الحقيقية ، كما فعل علماء العرب الأوائل حينما جمعوا النصوص من أفواه الأعراب ، كما فعل الأصمعي مثلا ،ومن النصوص الشعرية والنثرية ، وهو ما تفعله كثير من الأمم المتقدمة علميا وتقنيا .

رواد في معالجة النصوص العربية بالحاسوب :

الدراسة الحاسوبية للقرآن الكريم:

إذا استعدنا ذاكرتنا في هذا المجال سنجد أنه ربما كان أول من استخدم الحاسوب في معالجة النصوص العربية هو الدكتور رشاد خليفة في أريزونا ، حيث قام بتخزين القرآن الكريم كاملا في الحاسوب، مستخدما الحرف اللاتيني ، حيث أجرى العديد من الدراسات الإحصائية علي النص القرآني وخرج بنتائج عن مظاهر الإعجاز العددي للقرآن الكريم ، كانت مذهلة لكثير ممن قرأوا أو سمعوا عنه في العقد السابع من القرن الماضي .

مشروع المعالجة الحاسوبية للمعلقات السبع:

ومن الرواد أيضا صديقنا الدكتور عبدالرحمن الحاج صالح الذي عرض لي عند زيارتي له في معهد اللسانيات والصوتيات بجامعة الجزائر في النصف الثاني من السبعينيات جهود معهده في تخزين المعلقات السبع ، كخطوة أولى ربما في مشروعه الطموح الذي ظل يدعو إليه طوال سنوات ، وهو "مشروع الذخيرة العربية" .

مشروع المعالجة الحاسوبية للحديث النبوي الشريف:

أما المشروع الريادي الثالث فهو العمل الجبار الذي قام به صديقنا الأستاذ الدكتور مصطفى الأعظمي (الذي كان أستاذا في قسم الثقافة الإسلامية بجامعة الملك سعود) وهو تخرين الحديث النبوي الشريف في الحاسوب الذي الذي أنفق عليه عشرات الآلاف من الريالات من جيبه الخاص ، حيث كان يستخدم حاسوبا متوسط الحجم (ربما PDP 11 ) ، وقد كان بحق مشروعا جبارا وطموحا في حينه بالنظر إلى الصعوبات الجمة في تعامل الحاسوب بالنصوص العربية ، حتى في أبسط الأمور مثل إدخال النصوص . وقد سعدنا كثيرا لمنح الدكتور الأعظمي جائزة الملك فيصل لخدمة الحديث الشريف ، وهو ما كان جديرا به ، نظرا للتضحيات التي قدمها في سبيل هذا العمل من جهد ووقت ومال (بل وربما كان هذا أحد أسباب تخصصه ابنه الدكتور عقيل الأعظمي في مجال الحاسوب) .

الدراسة الإحصائية لجذور بعض المعاجم العربية:

من الأعمال الريادية في استخدام الحاسوب لخدمة اللغة العربية الدراسات التي قام بها الدكتور حلمي موسى في جامعة الكويت بالتعاون مع اثنين من اللغويين العرب ، وصدر كتابان أحدهما يتعلق أحدهما بمعجم الصحاح وآخر بلسان العرب .

من أهم التطورات في العمل الحاسوبي العربي:

ويجب أن لا ننسى القفزة المهمة في تطوير نظام الحرف الواحد في كتابة النصوص العربية (بوساطة ما كان يعرف بالنظام الحساس للسياق) ، حيث طورت شركة في كندا (ALIS  ، إن لم تخني الذاكرة) نظاما لم يعد المستخدم فيه مضطرا إلى التعامل مع لوحة الطباعة متعدد الرموز للحرف العربي ، كما هو الحال في الآلة الطابعة (الراقنة typewriter) . فكل ما علينا عمله هو الضغظ على مفتاح الحرف باء مثلا ويقوم الحاسوب باختيار الشكل الصحيح له (أول الكلمة أو وسطها أو آخرها) ، وهو أمر على الرغم من بساطته كما يبدو يعتبر إنجازا مهما في مجاله .

ومن الخطوات المهمة للتعامل الحاسوبي مع اللغة العربية تطوير نظام الشفرة العربية الموحدة ، مما ساعد كثيرا في إمكانية نقل البيانات المخزونة مغناطيسيا (رقميا) والتعامل مع النصوص العربية في صور مختلفة .

برمجيات التعريب البينية:

وقد مهدت كل هذه التطورات ، إضافة إلى إمكانية إدخال التشكيل للنصوص العربية، لتنفيذ أعمال تأسيسية مثل برمجيات التعريب البينية المختلفة للاستفادة من البرمجيات المعدة للغات الغربية سواء لتنسيق النصوص أو لبناء قواعد المعلومات. ومن أهمها برنامجي نوافذ وصخر للتعريب ، مما ساعد الباحثين والمستخدمين العرب في الاستفادة من البرمجيات الأجنبية المعروفة ، مثل Word, dBase III, IV وغيرها.

 وظهر على إثر ذلك مشروعات تطبيقية، مثل بناء قواعد البيانات العربية وبنوك المصطلحات متعددة اللغات ، والتعامل مع النصوص العربية تخزينا ومعالجة واسترجاعا ، ومشروعات التحليل الصرفي للغة العربية والتدقيق الإملائي ، والذي ساهم بدوره في إمكانية تخزين النصوص العربية الكاملة والبحث فيها ، فصدرت برمجيات البحث الحاسوبي في القرآن الكريم والحديث النبوي الشريف وآلاف النصوص الأخرى مما تزخر به السوق الإلكترونية في العالم العربي .

ما ذا بعد؟

مما لا شك فيه أن ما تم حتى تاريخه له أهميته القصوى في خدمة اللغة العربية والحاسوبيين المتعاملين معها في مشروعاتهم العملية والبحثية . غير أننا نجد أن أمامنا طريقا طويلا لازال علينا تخطيه لنصل بالعمل اللغوي الحاسوبي في العالم العربي إلى المستويات التي نرنو إليها ، بعض هذه المهام لغوية بحت وبعضها لغوي حاسوبي .

أمثلة من المهام اللغوية :

لا زال اللغويون العرب مقصرون في توفير البنى الأساسية للباحثين الحاسوبيين ، فليس لدينا مثلا معاجم متطورة أو مراجع في النحو العربي ليستفيد منها الباحث الحاسوبي ، فلا زالت معاجمنا وكتب النحو لدينا تتحدث عن التقسيم الثلاثي للكلم العربي (اسم وفعل وحرف الكلم ، كما في ألفية بن مالك) ، وهو ما يعوق العمل اللغوي الحاسوبي الذي يتطلب تقسيمات أكثر دقة ووضوحا . ثم لازالت كثير من المعلومات الأساسية الأخرى ناقصة في معاجمنا العربية  مما تحدثت عنه تفصيلا في بحث لي بعنوان "نحو معجم عربي للتطبيقات الحاسوبية"  قدمته في "المؤتمر الدولي الأول حول اللغة العربية والتقنيات المتقدمة" التي عقدت في الرياض في العام 1991م .

وجدير بالذكر أنه على الرغم من الدعوات المتكررة لبعضهم (مثل الدكتور عبدالرحمن حاج صالح) بإعداد مدوناتcorpora للغة العربية تخزن فيها النصوص العربية من العصور المختلفة ، لم يتم ذلك بصورة منهجية حتى تاريخنا هذا ، حسب علمي (ونود التنويه هنا بالمشروع الذي تعمل عليه شركة أي تي أي لتقنية البرمجيات ATA Software  الذي يذكر مديرها التنفيذي بأن لديها مدونة بها حوالي بليون كلمة)  .

وتكمن أهمية مثل هذه المدونات في الحاجة إليها للاستفادة من الحاسوب في القيام بالبحوث اللغوية المعجمية والنحوية والتاريخية والمصطلحية ،بل والأدبية كذلك . كذلك يحتاج الباحث الحاسوبي في مجال اللغة العربية إلى مثل هذه المدونات لاستنتاج بعض القواعد اللغوية الحاسوبية أو للتثبت مما يتوصل إليه من تلك القواعد ، وهو ما يعرف باسم data set .

هناك حسب علمي بعض من هذه المدونات ، لكنها ملكية خاصة لبعض المؤسسات التي طورتها كما أنها محدودة من حيث نوع المادة اللغوية (من الأمثلة ما قامت به شركة العالمية وشركة آي بي إم وغيرهما).

 ومن المشروعات الكبيرة التي تقوم بها مؤسسة حكومية المشروع الذي يتولاه المعهد العالي للعلوم التطبيقية والتكنولوجيا في دمشق في إطار مشروع "المعجم الحاسوبي" الذي يقول عنه مروان البواب وزملاؤه :"أنه يستغرق جميع ماورد في معجمات اللغة العربية قديمها وحديثها ، متلافيا ما أَخذ عل معظمها من قصور..." (مقدمة كتاب : المعجم الحاسوبي 1 : إحصاء الأفعال العربية في المعجم الحاسوبي ، من إعداد البواب ومراياتي ومير علم والطيان ، 1996).

مشروع المعجم المدرسي:

من المشروعات المهمة المبنية على المدونات اللغوية ، ربما الأولى من نوعها ، مشروع المعجم المدرسي : معجم المرحلة الإبتدائية ومعجم المرحلتين المتوسطة والثانوية ، الذي مول جزء منه مدينة الملك عبدالعزيز للعلوم والتقنية والجزء الآخر وزارة التربية السعودية ، حيث تم تخزين عشرات النصوص المنهجية (جميع كتب المراحل التعليمية الثلاث) ، إضافة إلى نصوص إعلامية مطبوعة ومنطوقة مما هو موجه للشباب ، ثم نصوص من إنتاج التلاميذ من الجنسين . وقد بلغ مجموع ألفاظ المدونة  أكثر من ثلاثة مليون كلمة .

هذا وقد تعاقدت إدارة المشروع مع إحدى الشركات المتخصصة في تخزين النصوص حاسوبيا وتحليلها إحصائيا للوصول إلى ترتيب إحصائي للكلمات الواردة في النصوص المشار إليها وفق شيوعها ، مع بيان تكرار الكلمة حسب كل معنى مختلف لها وسياقاتها اللغوية وبيان مصادرها ، وذلك لإعداد المعاجم المناسبة لطلاب المدارس .

قاعدة بيانات أصوات اللغة العربية:

من الأعمال الرائدة في خدمة البحث اللغوي العربي العملان اللذين قام بهما صديقنا الدكتور منصور الغامدي في مدينة الملك عبدالعزيز للعلوم والتقنية بالتعاون مع بعض الباحثين السعوديين ، هما : قاعدة بيانات أصوات اللغة العربية : الألفاظ  ، و قاعدة بيانات أصوات اللغة العربية : الجمل . ولا شك أنه سيكون لهاتين القاعدتين أثرهما الكبير في البحث الصوتي الحاسوبي للغة العربية وتطبيقاته المختلفة .

مدونة اللغة العربية :

كنت قد أشرت سابقا إلى حاجتنا إلى مدونة corpus أو مجموعة مدونات corpora للغة العربية منذالعصر الجاهلي حتى العصر الحديث ، وهو ماقد يصل إلى مليارات الألفاظ ، يمكننا الاستفادة في تخزينها حاسوبيا مماهو متاح فعلا في صورة رقمية مع مراجعتها وتصنيفها وفق معايير علمية محددة (موضوعيا وتاريخيا وجغرافيا إلىغير ذلك) .

وأود أنوه هنا بالجهود التي بذلها بعض الرواد في هذا المجال . وأخص بالذكر صديقنا الدكتور عبدا لرحمن حاج صالح من الجزائر الذي بدأ منذ مايربو على الثلاثين عاما جهودا جبارة في هذا الاتجاه ، حيث بدأ بتخزين المعلقات السبع ومافتىء يدعو العرب طيلة سنوات عديدة إلى إيجاد ما أسماه بذخيرة للغة العربية . ومن جهة أخرى أود أن أشيد بالجهود الفردية لشركة أي تي أي الذي ظل مديرها يعمل في لندن في صمت ليبني مدونة تربو على البليون كلمة للغة العربية. وقد تقدم بمشروع لتخزين عشرة ملايين كلمة من نصوص عربية مختلفة إلى بعض الجهات التي نأمل أن تتجاوب معه في سبيل تحقيق ذلك ، وخاصة في ظل المشروع العربي الطموح لإعداد معجم عربي تاريخي ، وهو مالا يمكن تنفيذه في غياب مثل هذه المدونة .

مواصفات المدونة المطلوبة:

إضافة إلى الجهود التي أشرت إليها أعلاه ،هناك مشروع مدينة الملك عبدالعزير متعاونة مع وزارة التربية السعودية التي أعدت مدونتان رائدتان لتنفيذ مشروع المعجم العربي المدرسي لطلاب المراحل الابتدائية والمتوسطة والثانوية .

ولكن لابد لنا في هذا المقام من التنويه إلى أن قيمة أية مدونة أو مدونات تعتمد على مدى تحقيق عدد من الشروط التي يشير إليها خبراء ما يسمى ب"لسانيات المدونات Corpus Linguistics"، كما نلاحظ  في المدونات التي أنجزت في الإنجليزية (مثلا:  (1) Co-Build Corpus, (2) British National Corpus, (3) London-Lund Corpus, (4) Lancaster-Oslo/Bergen Corpus, Longman-Lancaster Corpus, Brown University Corpus) مما أنجز بعضه على مستوى دولي ، كما في المثالين 3 و4 أعلاه.

 وتبين لنا الدراسات المصاحبة للمدونات أعلاه والتي أجريت عليها أعلاه معايير الاختيار المختلفة.

 .وأهم هذه المعايير ما يلي:

1-      التمثيل الحقيقي للغة :

ويعني ذلك تمثيل العينة للغة المراد دراستها تمثيلا صادقا ، غير متحيز، آخذة بعين الاعتبار الجوانب التاريخية والجغرافية والأسلوبية ونوعية النصوص واختلاف الموضوعات والمؤلفين والتنوعات اللغوية وطبيعة النص من حيث المنطوق والمكتوب.

2-      التنوع :

من المزالق التي تقع فيها بعض المدونات الاعتماد على نصوص معينة قد ترتبط بجهة أو فئة من الكتاب أو الكتب أو حقبة زمنية محددة ، مما يفقدها مصداقية تمثيل اللغة بصورها وأنماطها واستعمالاتها المختلفة. فالاعتماد مثلا على صحافة حقبة تاريخية معينة تجعل النصوص متحيزة لتلك الفترة ، من حيث الأسلوب والقضايا والموضوعات ، من ثم الألفاظ والمصطلحات  . فهناك فترة الحربين العالميتين (حيث تتكرر أسماء دول معينة ومصطلحات مثل دول التحالف والمحور ...) ، ثم فترة ظهور الاشتراكية (مع ما رافقتها من ألفاظ متكررة ، مثل الامبريالية والإقطاعية والبرجوازية ...) ثم السنوات القليلة الماضية ، منذ أحدات 11 سبتمبر في أمريكا وما قبلها بقليل، (حيث تتكرر ألفاظ ، مثل العولمة والإرهاب ومكافحة الإرهاب والأصولية والتطرف ...).

3-      حجم المدونة:

ينبهنا الإحصائيون إلى أهمية حجم العينة لتكون ممثلة صادقة للمادة المطلوب دراستها . هنا يجدر بنا أن نشير إلى معنى الحجم ، حيث يشمل عدة جوانب مهمة، لعل من أبرزها ما يلي:

(أ‌)                مجموع عدد الألفاظ ، وهو ما يتبادر إلى ذهن كثير من الباحثين في الميدان. غير أن ذلك لايكفي ، حيث لا بد من توافر الشروط الثلاثة الأخرى .

(ب‌)           عدد النصوص من كل فئة أو نوعية .

(جـ )  عدد العينات من كل نص .

(د)    عدد ألفاظ كل عينة .

التعاون بين الحاسوبيين واللغويين :

ويأتي دور التعاون بين اللغويين والحاسوبيين في الاستفادة المثلى من مثل هذه المدونات ، بعد توافرها ، في أمورعدة:

أ‌-       لعل أهم عمل يمكن للحاسوبيين أن يعملوه مع زملائهم من اللغويين هو إعداد حزمة برمجية للتحليل والمعالجة الحاسوبيين للنصوص العربية ، على نمط ما هو متاح للباحثين في اللغات العالمية الأخرى ، مثل الإنجليزية ، نذكرمنها على سبيل المثال برنامج wordsmith من إنتاج مطبعة جامعة أكسفورد ، وبرنامج Concordance الذي يذكر مطوروه بأنه يستعمل مع عشرات اللغات المختلفة . وتتمثل أهم العمليات التي يقوم بها مثل هذا البرنامج ما يلي:


1-    الدراسة الإحصائية للألفاظ والتعبيرات الاصطلاحية العربية .

2-    توفير مسارد للألفاظ  concordancesمع سياقاتها ، ما يعرف بعبارة "الكلمة الأساس في سياق key word in context- KWIC "  (في حدود عدد معين من الكلمات على يمين اللفظة وعلى يسارها) ، مما يساعد الباحث في التعرف على معاني الكلمات المختلفة وفقا للسياق ، كذلك التعرف على المصاحبات اللفظية collocations ، أو ما يعرف أحيانا بالمتلازمات اللفظية ، ثم التعبيرات الاصطلاحية التي سماها البعض "العبارات المسكوكة" ، إلى غير ذلك من فوائد لغوية .

3-    ترتيب الألفاظ الواردة في النص وفقا لتكراره أو لترتيبه الألفبائي ، مع بيان تكراره .

4-    إيراد مجموعات الألفاظ الواردة وفقا لمعايير مختلفة ، مثل : الصيغة الصرفية أو البنية النحوية أوالمصدر(كتاب أو مجلة ...) أوالموضوع (طب أو هندسة...)  أوالمؤلف أو التاريخ وغير ذلك .

ويراعى توفير مثل هذه الحزمة للاستعمال العام والفردي برسوم معينة أو بالبيع ، حتى يتسنى استخدامها من قبل الأفراد والمؤسسات البحثية المختلفة ، مما سيكون له  أكبر الأثر في تشجيع البحث اللغوي واللغوي الحاسوبي وفق أسس علمية في العالم العربي.

ب‌-  تطوير برنامج لتصنيف الألفاظ العربية وفقا لنوعها (أقسام الكلام) ووسمها آليا automatic tagging ، مما هو ضروري لإجراء أي بحث نحوي أو صرفي أومعجمي إجصائي على النصوص أوالمدونة corpus  ، وهو ما أحسبه لن يكون صعبا جدا نظرا لتوافر برمجيات التحليل الصرفي للغة العربية منذ سنوات عديدة . ولكن ذلك يتطلب جهدا من اللغويين العرب من حيث إيجاد نظام تصنيفي جديد لألفاظ اللغة العربية ، وهو ما أشرنا إليه آنفا ، حتى يتسنى إعداد البرنامج الحاسوبي المناسب.

إن إعداد المدونات المذكورة والبرمجيات الحاسوبية لتحليلها سيكون له أكبر الأثر في تطوير البحوث اللغوية العربية (من ثم إعداد معاجم ومراجع  لغوية أخرى تخدم اللغويين والحاسوبيين على حد سواء) و البحوث اللغوية الحاسوبية والمشروعات التطبيقية المختلفة المبنية عليها، بما في ذلك التكشيف الآلي وتخزين المعلومات وإعداد المستخلصات  abstracts آليا واسترجاع المعلومات بطرق مختلفة والترجمة الآلية من العربية وإليها وبرمجيات خدمة المعاقين (سمعيا أو بصريا أوجسديا) وتعليم اللغة للعرب والعجم والفهم الآلي للغة العربية والقراءة الآلية للنصوص  OCR (قراءة المحارف البصرية ) والإملاء الآلي والتدقيق الإملائي والتشكيل الآلي والتصحيح اللغوي ، إضافة إلى تطوير البحث والعمل اللغوي البحت في العالم العربي ، من إعداد معاجم مختلفة الأغراض ومراجع لغوية أخرى مبنية على مادة لغوية حقيقية ، كما فعل أسلافنا الأوائل من أمثال أبي الأسود الدؤلي والخليل بن أحمد الفراهيدي وسيبويه وغيرهم ممن أسسوا للدرس اللساني العربي في عصور الإسلام الأولى ، وهو أمر ضروري لأي تطوير للغة العربية لمواكبة التطور العلمي والتقني الحديث ولتتبوأ العربية مكانتها العالمية التي تليق بلغة القرآن الكريم .

هناك 4 تعليقات: