أهلا بكم في مدونة الدكتور محمود إسماعيل صالح

الأحد، 29 ديسمبر 2013


أعمال مبنية على مدونات لغوية عربية
د/ محمود إسماعيل صالح
أستاذ اللسانيات التطبيقية ، جامعة الملك سعود



يلاحظ الدارس اللغوي أن ظاهرة الاستفادة من المدونات اللغوية تقليد قديم لدى اللغويين العرب ، حيث بني النحو والمعجم العربيين في ضوء النصوص المتاحة للعلماء في عصور مختلفة ، فالبحث الميداني الذي اتسمت به الدراسات اللغوية العربية في عصورها الأولى إنما هو نوع من الدرس المبني على المدونات اللغوية (أي مجموعات من النصوص) . ويتضح ذلك بجلاء في الاستشهادات التي يوردها علماء العربية من قرآن وحديث نبوي وشعر. فالعمل المبني على المدونات اللغوية لا يتطلب وجود مدونة محوسبة . كذلك لا بد من الإشارة إلى أن البحث في المدونة المحوسبة لايشترط أن يتم آليا . فالبحث اللغوي والمدونة اللغوية قد يتم في صور مختلفة : (1) مدونة يدوية وبحث يدوي (2) مدونة يدوية وبحث باستخدام الحاسوب في بعض جوانبه على الأقل (3) مدونة محوسبة وبحث يدوي أو شبه آلي (4) مدونة محوسبة وبحث آلي ، كالدراسة الإحصائية عن طريق المكشاف السياقي concordancer . ولكن يلاحظ أنه حتى في بعض أنواع البحث الآلي في المدونة المحوسبة لابد أحيانا من تدخل بشري (مثل وسم المشتركات اللفظية ) كما أشرنا إلى ذلك في حديثنا عن متطلبات الاستفادة من المدونات اللغوية.

في الصفحات التالية ، نورد نماذج لأعمال قام بها الباحثون في إحدى الصور الأربع السابقة ، مع التركيز على الأعمال المبنية على المدونات المحوسبة قدر الإمكان ، بدءا بالدراسات الصوتية ثم النحوية والنصية والمعجمية ، مع ملاحظة التداخل بين هذه الفئات اللسانية : فالبحث قد يكون معجميا ونحويا في الوقت نفسه ، مثل الألفاظ الشائعة في مدونة ما ، ثم تصنيف هذه وفقا لأقسام الكلام (من اسم وفعل وحرف) مثلا.  كذلك سنتحدث عن أمثلة لاستخدام المدونات في إعداد المعاجم وفي تطوير البرمجيات الحاسوبية . ونود أن نؤكد على أن هذه الدراسة تقتصر على نماذج فحسب ، ولا يقصد منها حصر كل الأعمال ، كما أن الحديث هنا موجه أساسا للغويين ، وليس الحاسوبيين .

دراسات صوتية:

لا شك أن جل إن لم يكن كل الدراسات اللغوية الحاسوبية التي تجرى في مجال التعرف على الأصوات وتوليفها speech recognition and synthesis لابد أن تكون مبنية على أنواع من المدونات اللغوية . ولكننا سنذكر مثالا لبحث استخدم فيه الحاسوب في دراسة صوتية لمدونة لغوية.
لعل أفضل مثال لهذا النوع من الأعمال المبنية على المدونات اللغوية ما قام به رائد هذا النوع من الدراسات في هذا المجال عالم الفيزياء المصري وأول من قام ببحث حاسوبي للمعجم العربي ، هو الدكتور حلمي موسى ، حيث يقول في أحد دراساته المنشورة: 

"العلاقة بين الصوامت والحركات:

العلاقة بين الصوامت والحركات في اللغة العربية من الوجهة الإحصائية وما ينتج عنها لم تكن محل دراسة من قبل رغم أهميتها القصوى في دراسة بنية اللغة. والأصوات العربية معروفة، والحركات: ثلاث قصيرة: الفتحة والضمة والكسرة وثلاث طويلة: الألف والواو والياء، ثم السكون. والحرف المشكل بشدة يعتبر حرفين أولهما ساكن وثانيهما مشكل بالحركة المصاحبة للشدة.

والدراسة التي نعرضها اليوم تمت على عينتين من القرآن الكريم إحداهما مكية وهي سورة الأعراف وبعض قصار السور والأخرى مدنية وهي سورة البقرة. ونظراً لأن الدراسة تتم على القرآن كما نسمعه وليس كما نكتبه فقد اتبعت الطريقة الصوتية كما تظهر سورة الفاتحة قبل جدول رقم (27)، حيث نتبع طريقة قراءة حفص مع الوقوف على رؤوس الآيات.

ويوضح الجدول رقم (27) تردد الحركات في العينتين مع حساب النسب المئوية لكي تسهل المقارنة نظراً لاختلاف عدد الأصوات والحركات في كل عينة. ويوضح الجدولان التاليان (28، 29) عدد الحركات المصاحبة لكل صوت.

ومن الجداول الثلاثة يمكننا استنباط النتائج الآتية:
يوجد تقارب واضح في النسب المئوية للحركات في كل من العينتين المكية والمدنية.
تستخدم الفتحة أكثر من غيرها من الحركات في تشكيل لغة القرآن بنسبة 44% من جميع الحركات (بدون السكون).
تلي الفتحة في قوة التردد الكسرة بنسبة 18% ثم الألف بنسبة 15% وتليها الضمة بنسبة 14% وفي آخر القائمة تأتي كل من الواو بنسبة 5% والياء بنسبة 4%.
على الرغم من أن الكسرة ترد أكثر من الضمة، إلا أن الكسرة الطويلة (الياء) ترد أقل من الضمة الطويلة (الواو).

يتشكل ثلاثة وعشرون حرفاً بالفتحة أكثر من الحركات الأخرى، وهذه النتيجة تتفق مع شيوع الفتحة، وباقي الأحرف الخمسة تشكل بحركات أخرى أكثر من الفتحة، وهذه الأحرف هي الباء والذل والظاء والكاف والهاء. فحرف الباء يشكل بالكسرة أكثر من غيرها وتشكل كل من الظاء والكاف والهاء بالضمة أكثر من غيرها، أما حرف الذال فتؤثر عليه حركة الباء أكثر من باقي الحركات. وفي العينة المكية فقط يشكل حرف الميم بالكسرة أكثر من غيرها ويشكل حرف الصاد بالألف أكثر من غيرها.

حركة الواو لا تؤثر على حرف الخاء في العينتين، ولا تؤثر على حرف الزاي في العينة المكية ولا على حرف الشين في العينة المدنية.
أكثر من ربع الأصوات تؤثر عليها السكون، وذلك بسبب وضع السكون على الحرف الأخير من الآية.
تسعة وخمسون بالمائة من تردد السكون يؤثر على ثلاثة حروف فقط هي اللام والميم والنون."
(أنظرعلي حلمي موسى (2001) "حوسبة التراث العربي")

ولرائد الدراسات الصوتية الحديثة للغة العربية ، إبراهيم أنيس ، ملاحظات قيمة على بعض فوائد الدراسة الإحصائية للجذور لبيان قيمتها من حيث توارد الحروف / الأصوات العربية وتجاورها مع بعضها البعض (انظرمقدمة كتاب (دراسة إحصائية لجذور معجم الصحاح) لعلي حلمي موسى. ويبدو أن مثل هذه المعلومات لها فوائد فيما يسمى بالتعمية encryption في اللغة العربية.

ومن المشروعات المهمة في مجال الأصوات المشروع الذي قام به الدكتورمنصور  الغامدي في مدينة الملك عبد العزيز للعلوم والتقنية في الرياض . (انظر: منصور محمد الغامدي "قاعدة بيانات الصوتيات العربية وقراءة الشفاه".)
مجال النحو العربي:
هناك دراسة  طريفة  في مجال النحو العربي والأساليب للمستشرق مارك فان مول  van Mol (2000b) "الذي حلل مدونة موسومة لنشرات إخبارية من الجزائر ومصر والسعودية قوامها 240000 كلمة. وقد أظهرت المدونة أن استعمال السين وسوف للاستقبال لم يميز بين المستقبل القريب والبعيد ، كما تذكر كتب النحو التقليدية. كما أظهرت الدراسة اختلافات جغرافية في استعمال عبارتي "في الوقت نفسه " و"في نفس الوقت" اللتان وردتا بنفس العدد من التكرار ، غير أنه كان هناك اختلاف في  استعمالهما في الدول المختلفة . فعبارة "في الوقت نفسه" ترد بكثرة في النصوص المصرية ، بينما لا ترد في النصوص الجزائرية . أما في النصوص السعودية فالعبارتان تردان بدرجة متساوية..." Latifal Al-Sulaitni and Eric Atwell, 2006) ).

ومن الدراسات المهمة في هذا المجال الدراسة التي قامت بها الباحثة أفراح التميمي ، والتي نورد لمحات منها في القسم الخاص بالدراسات المعجمية ، حيث تورد الباحثة النسب المئوية لكل من الأسماء والأفعال والحروف في قائمة أشيع ثلاثمائة كلمة في مدونة اللغة العربية (انظر أدناه).

دراسات النص والخطاب:
أدوات ربط  الجمل العربية:

لعل من أحدث الدراسات المتعلقة بالمدونات العربية وأهمها مشروع التحشية النصية أو تحشية الخطاب discourse annotation (انظر السيف وماركرت Al-Saif and Markert في قائمة المراجع.  وتنبع أهمية هذه الدراسة بأنها قد تكون أول محاولة لمثل هذا العمل في مجال المدونات اللغوية العربية.
ونظرا لأهمية هذا العمل فسنقدم عرضا موجزا لبعض أجزائه . هذا وقد اعتمدت الباحثتان على نموذج جامعة بنسلفانيا الخاصة باللغة الإنجليزية والمعروف باسم بنك بن لشجرات الخطاب Penn Discourse Treebank والذي تم تطبيقه ، كما تذكر الباحثتان ، على عدد من اللغات ، مثل التركية والصينية والهندية .

 وطبق النموذج المذكور على مدونة من النصوص الإخبارية العربية الصادرة من وكالة الأنباء الفرنسية التي تشتمل على 734 ملفا تتكون من حوالي166 ألف كلمة . وتذكر الباحثتان أنهما وجدتا 5651 رابطا خطابيا (نصيا) في 537 نص إخباري، علما بأن الرابط الخطابي discourse connector في تعريفهما هو: حرف أوكلمة أو عبارة تربط بين جملتين لأغراض مختلفة (مثل العطف أوبيان السببية أو التفصيل وغير ذلك من علاقات . (انظر المرجع السابق).

ونورد أدناه الروابط العشرة الأكثر تكرارا في المدونة المذكورة ، مع عدد كل منها:
واو عطف الجمل (3826) ، لام السببية (261) ، لكن (208) ، بعد (167) فاء العطف (91) ، لأن (82) ، قبل (79) ، إثر – بمعنى بعد- (63) ، باء السببية (45) ، كما (60). وعلى الرغم من أننا لا نتفق مع الباحثتين على استتنتاجاتهما ، فإننا نرى أن العمل جدير بالاهتمام والدراسة ، خاصة في شرحهما لأسلوب التحشية والخطوات التي اتبعتاها في هذا العمل الرائد. كذلك يجدر التنبيه إلى نظرتهما إلى بعض الحروف العربية ودورها في ربط الجمل بعضها ببعض (انظر الأمثلة في الدراسة المذكورة. )

من الواضح أن الدراسة نشرت في عام 2010 أو بعدها ، كما يظهر من تاريخ بعض المراجع المذكورة فيها.

هناك دراسة أخرى لا تقل أهمية من دراسة أمل السيف وكاتيا ماركرت ، تتعلق بوسائل الربط في اللغة العربية، ولكن من منظور تعليمي . وهي الدراسة التي قامت بها الباحثتان الماليزيتان من جامعة ماليزيا الإسلامية الدولية ، الدكتورة حاسلينا حسن ونوريحان داود ، بعنوان "الروابط : تحليل مبني على مدونة: المشكلات التي يواجهها دارسو العربية في مجال المتلازمات اللفظية ("Corpus Analysis of Conjunctions: Arabic Learners' Difficulties with Collocations")
تذكر الباحثتان أن الدراسة بنيت على مدونة لغة المتعلمين learner corpus اشتملت على نصوص أنتجها الطلاب في الجامعة المذكورة قوامها حوالي 240000 (مائتان وأربعون ألف كلمة). وقد استخدمت الباحثتان كلا من برنامج وورد لتخزين النصوص و sketch engine ، إضافة إلى المعالجة البشرية , للمساعدة في البحث عن الروابط.
وقد قسمت الباحثتان الروابط النصية إلى 16 فئة وفقا لمكوناتها (حروف (سميت خطأ"حروف جر prepositions" وأسماء ...) ، مثلا حرف +اسم+حرف (مثل بالرغم من ، من أجل ذلك) و اسم +حرف +اسم (مثل: جدير بالذكر ، إضافة إلى ذلك) أو فعل +حرف+ اسم (مثل: زد على ذلك) .... وتذكر الباحثتان أن مجموع الروابط النصية في العربية الفصحى 83 رابطا، استعمل الدارسون 48 منها فقط.

مما يجدر ذكره أن اللغويين العرب قد لايتفقون على بعض المسميات لمكونات الروابط النصية. لكن ذلك لا يقلل من قيمة هذا العمل الريادي المبني على مدونة لغة المتعلمين .) (انظر Hassan, Haslina and Nurahihan Mat Daud في قائمة المراجع.)

 وتتميز هذه الدراسة باستخدام المدونة اللغوية في تحليل الأخطاء اللغوية التي يقع فيها الدارسون . فتذكران تكرار الأخطاء في استعمال الروابط . من ثم قد تكون الدراسة أنموذجا يحتذى في هذا المجال المهم من تعليم اللغة ، خاصة العربية لغير الناطقين بها.

تحليل الخطاب:
من الدراسات المتعلقة بتحليل الخطاب أطروحة الدكتوراة للدكتورة إيمان عبدالقادر كمال (2008) "بنية الأساليب الجدلية في افتتاحيات الصحف العربية الإنجليزية: دراسة تحليلية مقارنة" (رسالة دكتوراة باللغة الإنجليزية ،غير منشورة ، جامعة الملك سعود ، الرياض . انظر Kamal, Eman (2008) في قائمة المراجع). وتختلف هذه الدراسة والتي تليها عن غيرها مما نورد في دراستنا هذه في كونهما دراستين تقابليتين تعتمد ان على مايسمى بالمدونة المقارنة. ونورد أدناه مقتطفات من ملخص الباحثة لأطروحتها ، حيث تقول:

"تهدف هذه الدراسة إلى عمل تحليل مقارن للبنية الجدلية لافتتاحيات الصحف الإنجليزية والعربية.  تتألف عينة الدراسة من 32  نصاً من افتتاحيات كبرى الصحف الأمريكية والبريطانية والعربية. يقسّم التحليل البنية الجدلية للافتتاحية إلى عنصرين رئيسين: ادعاءات (claims)  يطرحها الكاتب ومن ثم أساليب دعمها (means of support). ومن خلال التحليل يتم التدقيق في صيغ الادعاءات ودرجة وضوحها بين الافتتاحيات الإنجليزية والعربية ، وتبحث الدراسة كذلك عن أوجه الاختلاف أو الشبه  بين الأنواع المختلفة لوسائل الدعم ، ونسب تواجدها حسب النوع ، في النصوص من اللغتين.

"... وبصورة عامة، يكشف التحليل عن تبني كتاب الافتتاحيات العرب أسلوباً في الجدل يختلف عن نظيره في افتتاحيات الصحف الإنجليزية من حيث عدم وضوح أجزاء البنية الجدلية وكذلك غموض الروابط بين تلك الأجزاء.

و تبحث الدراسة كذلك فيما ذكرته بعض الدراسات من تفضيل الكتابة العربية لأسلوب جدلي ’أحادي الجانب‘ (through-argumentation) يعرض الكاتب من خلاله ادعاءاته ومن ثم يحاول إثباتها من دون أن يورد ادعاءات مخالفة لرأيه (counterclaims). وتكشف الدراسة شيوع هذا الأسلوب ليس فقط في النصوص العربية، بل كذلك في النصوص الإنجليزية. وتكشف أيضاً عن وجود ’الأسلوب الجدلي المضاد‘ (counter-argumentation)، الذي يعرض ادعاءات  مخالفة ليدحضها أو يقلل من أهميتها، بنسب يسيرة في النصوص من اللغتين، في الإنجليزية أكثر منها في العربية. و تظهر الدراسة أن هذا الأسلوب يتسم بالوضوح في النصوص الإنجليزية عنها في العربية من حيث الارتباط بين الادعاء المضاد والرد عليه rebuttal). ...

"وأخيراً تكشف الدراسة عن أن نسبة التكرار، على مستوى المفردات والتراكيب، في افتتاحيات الصحف العربية ضئيلة. كما توضح وجود التراكيب المتوازية (parallel structures)، وهي من أنواع التكرار على مستوى التراكيب، بنسب عالية في النصوص الإنجليزية.  وبالتالي فإن نتائج الدراسة لا تؤيد الرأي القائل بتميز الكتابة العربية بشيوع التكرار فيها وفاعليته كإستراتيجية جدلية." (( Eman Kamal (2008): 1-2

في العام 2011 قام عدد من الباحثين من جامعة الحسين بن طلال في معان بالأردن بإجراء دراسة مبنية على مدونة لمقابلات متلفزة عربية وإنجليزية (مدونة مقارنة) عن ما أسموه "المراوغة hedging  في الخطاب السياسي ، نورد ترجمة للملخص الذي كتبه الباحثون عبير الطويل وعماد سعيدات وحسين وأحمد سعيدات في بحث "المراوغة في الخطاب السياسي Hedging in political discourse"

يذكرالباحثون أن "الدراسة تحاول أن تفحص ثلاثة جوانب من المراوغة في الخطاب السياسي الشفوي وتحليلها ، هي: (1) وسيلة التعبير ، (2) كثافة العلامات المعجمية والنحوية و (3) الوظائف التداولية. وتتكون المدونة من 17 مقابلة متلفزة مع عدد من السياسيين والقادة العرب أثناء حرب الخليج. ... وقد اشتملت المدونة على 13,168 كلمة للدراسة التحليلية : 6573 كلمة من المقابلات العربية و6595 من المقابلات الإنجليزية. ويوردون أن التجنب هو أكثر استراتيجية شائعة اتصف بها الخطاب السياسي ، (2) لم يلتزم باستراتيجيات الحوار والخطاب ، بما في ذلك قواعد غرايس Grice maxims ، إلا في حالات قليلة من الخطاب السياسي. (3) تتأثر المراوغة بصورة مباشرة وواسعة<بما يسمى> تصميم المستقبِل recipient design." (ص 169)
دراسات الخطاب النقدي العقائدي:

لعل أهم دراسة معروفة لدينا هي دراسة رجب جمعان الزهراني التي حصل بها على درجة الدكتوراة من جامع لانكاستر البريطانيا منذ عهد قريب (ديسمبر 2013) ، بعنوان :"تحليل خطاب نقدي مبي على مدونات للتمظهرات الإيديولجية والشرعنة في الخطاب السلفي في السعودية للفترة بين 1980 حتى 2000 )Alzahrani, Rajab Jamaan (2013). "A Corpus-Based Critical Discourse Analysis of the Ideological Representations and Legitimation in the Salafi Discourse in Saudi Arabia (1980-2000) )

وتكمن أهمية الدراسة في عدد من الجوانب ، لعل مايهمنا منها هو المنهجية التي اتبعها الباحث ، مما يفيد الراغبين في خوض هذا المجال الحديث من البحث اللساني. ونورد أدناه ترجمة لملخص الأطروحة:

"تدرس هذه الأطروحة التمظهرات الأيديوجية ideological representations للخطاب السلفي في السعودية من الفترة 1980-2000 وتحاول أن تجيب عن االسؤال التالي:  ما مدى وشكل تجانس الخطاب السلفي في السعودية  في الفترة بين 1980 و2000.

وقد استخدم الباحث عددا من أدوات البحث من تحليل الخطاب النقدي والمقاربة التاريخية للخطاب ونظرية الفاعل الاجتماعي ولسانيات المدونات اللغوية ونظرية الحجاج  ، وذلك في فحص الملامح البارزة  للتركيز الدلالي و مخططات الفاعل الاجتماعي والحجاج في نصوص دينية  لاتجاهين للسلفية السعودية. وقد جمع مجموعتين من النصوص (مدونتين لغويتين) من أعمال كاتبين سلفيين بارزين : خطاب سلفي ذي توجه ديني ثمثلها كتابات الشيخ عبد العزيز بن باز وخطاب ذي توجه سياسي تمثله كتابات الشيخ سفر الحوالي.

و تتمحور الأطروحة حول تحليل الكلمات المفتاحية باستخدام المتلازمات اللفظية و تجمعات الكلمات والتحليل المبني على الكشاف السياقي  ، وذلك بغرض التعرف على أوجه التشابه والاختلاف في التمظهرات الأيديوجية للاتجاهين السلفيين المذكورين آنفا. 

وتبين لنا نتائج الدراسة أن الكاتبين السلفيين يتشاركان في بعض جوانب التمظهرات الأيديوجية (العقدي والسياسي). غير أن لديهم اختلافات في التمظهرات الأيديوجية من حيث الدوافع السياسية." (انظر Rajab Alzahrani, 2913)

دراسات في علم النص:

من الدراسات الجديرة بالذكر مجموعة الأعمال التي نشرها كرسي صحيفة الجزيرة لدراسات اللغة العربية بجامعة الأميرة نورة  تحت عنوان دراسات في علم اللغة النصي: مقاربة تطبيقية على مدونة صحيفة الجزيرة. ونورد أدناه تعريفا موجزا لهذه الدراسات لعلها تكون حافزا للقارىء للاطلاع عليها.

1-    د/ نعمان بوقرة (2012) "استراتيجيات الإقناع في الخطاب الصحفي السعودي- دراسة نصية تداولية".يذكر الباحث أن النصوص التي اعتمدها هي "مقالات رقية سليمان" ويقول: "ويقوم اختيار مدونة البحث على حصر أهم المقالات التي نشرتها صحيفة الجزيرة للكاتبة ابتداء من 3/1/2010 إلى 30/12/2010م ، واختيار نماذج منها اختيارا عشوائيا لم يراع فيه إلا منطق التنوع الموضوعي..." (: 27). ويذكر في ملخص البحث: "وتقوم هذه الدراسة التطبيقية على محاولة الكشف عن الاختيارات اللسانية التي تتأسس عليها استراتيجية الإقناع الإعلامي بصورة شمولية ، والتعرف على أهم مرتكزات الانسجام النصي التي تبني العلاقة بين النص والكاتبة والقارىء ، وتحدد رؤية كل منهما..." (ص 21).

2-               الدراسة الثانية في كتاب دراسات في علم اللغة النصي : كتبت الدراسة الثانية د/ نوال الحلوة ، بعنوان "أثرالتكرار في التماسك النصي- مقاربة معجمية تطبيقية". تذكر الباحثة أن النصوص التي أخضعت للبحث : "ست مقالات للكاتب د. خالد المنيف في سنة 1431هـ/ 2010م" . وخلصت إلى "(1) أن مقالات الكاتب استوعبت كافة أشكال التكرار مما يثبت صحة نظرية علم النص وشرعيتها. (2) أن الدراسة التطبيقية أثبتتأن دور التكرار في التماسك النصي لايقف على اللفظ فقط بل يتعداه إلى المعنى." (ص 93).

3-               الدراسة الثالثة كتبتها د/ نوال الثنيان بعنوان : "الإحالة الضميرية : دراسة نحوية نصية". وقد اعتمدت الباحثة على دراسة "خمس مقالات للكاتب خالد المالك في مجال الحوار والاختلاف منشورة خلال العامين 1428 و1429هـ" (ص 195). وتخلص الباحثة إلى الكاتب استخدم الإحالة الضميرية في مقالاته استعمالا متوازنا...وأن الإحالة الضميرية ... حققت وظائفها التي من بينها الربط بين الجمل ، والاختزال الذي أعنى عن التكرار، والتوكيد لما يريد توكيده ..." (195).

تصف الباحثة درستها بقولها: قمت باستقراء انتقائي للضمائر التي وردت في مقالات الكاتب الخمسة ، حسب مايحتاجه البحث في هذا العلم ، واستغنت في هذا الوصف بالشبكة التي وضعها هاليداي ورقية حسن ، وطبقها محمد خطابي وآخرون في وصف اتساق أي نص من النصوص ، مع بعض التعديل بما يتناسب مع نوع النصوص التي هي مجال الدراسة، وطولها، ووحدة موضوعها العام مع تنوع مضامينها الفرعية والأهداف التي أسعى للوصول إليها في مستوى اتساق هذه النصوص..." (الثنيان ، 2012: 207). وقد فحصت الباحثة المدونة من جوانب عدة ، مثل ألفاظها والمستتر منها و"السمات الدلالية للضمير ، من حيث التكلم أو الخطاب أو الغيبة..." وإذا ما كان منها مقاميا (المتكلم أوالمخاطب) أو نصيا (للغائب) . كذلك ناقشت الباحثة "رتبة مضمر الضمير، بذكره ، قبله أو بعده ..." وذلك بالإضافة إلى "المسافة التفسيرية ، أي عدد الجمل التي تفصل بين الضمير ومضمره الذي يحيل إليه..." (صص 207-208).

4-               أما الدراسة الرابعة ، فهي الأكثر محدودية من حيث حجم المادة المدونة ، حيث تقول الباحثة: "ينطلق هذا البحث من قراءة إحدى مقالات سلمان العودة المعنونة بـ"فتاة مهمة" في ضوء المقاربة المنهجية المستقاة من مقولات نحوالنص ومنهج الخطاب قراءة داخلية تمتحن تماسكه واستمراره في بنيته  الداخلية ومقاصده الخطابية ضمن سياقه الثقافي المحيط به ..." (ليلى  بايزيد ، 2012 ، 297). وتعالج الدراسة "الاتساق النحوي" الذي من مظاهره "المتجسدة في النص، وهي: الإحالات بأنوعها : الضمائر، والإحالة بالأسماء الموصولة ، والإحالة بأسماء الإشارة، والربط : الربط  الإضافي ، والربط السببي ، والربط الزمني ، والربط الاستدراكي ، والربط الشرطي.

"الاتساق المعجمي ... التكرار بأنماطه المختلفة ... والتضام : الارتباط بموضوع معين والتضاد." ووسائل الانسجام (الترابط المفهومي) ... والعمليات التي تساهم في بناء الانسجام ...والعلاقات التي تربط النص داخليا : علاقة الإضافة ، وعلاقة السبب والنتيجة ، وعلاقة الإجمال والتفصيل ، وعلاقة العموم والخصوص ، وعلاقة المفارقة..." (صص 297-298).

دراسات معجمية:

لاشك أن الدراسات التي قام بها الدكتور/ علي حلمي موسى بالتعاون مع لسانيين عرب معروفين كانت أول انطلاقة بارزة في ميدان البحث الحاسوبي لمدونات معجمية عربية. وقد أشرنا إليها سابقا في مكانه في هذه الدراسة.
ومن الدراسات المهمة في اللغة العربية الدراسة التي قام بها الدكتور/ محمد حسين أبو الفتوح في معهد اللغة العربية بجامعة الملك سعود بعنوان : قائمة معجمية بألفاظ القرآن الكريم ودرجات شيوعها ، من منشورات مكتبة لبنان في بيروت. والتي ذكر الباحث فيها أن النص القرآني يتكون حوالي 80 % منه من حوالي ثمانمائة كلمة ، وهي التي ترد عشرين مرة فأكثر في القرأن الكريم، بدءا بلفظ الجلالة "الله" الذي يرد أكثر من ألفي مرة.

وجدير بالذكر الدراسة التي قامت بها الباحثية أفراح عبدالعزيز التميمي بعنوان "نظرات فيالثلاثمائة لفظة الأكثر شيوعا في المدونة العربية" والتي قامت فيها بدراسة لهذه الألفاظ في أكبر مدونة مفتوحة المصدر (من إنشاء مدينة الملك عبدالعزيز للعلوم والتقنية بالرياض ، قوامها أكثر من 700 مليون كلمة). وتذكر الباحثة الحقائق المهمة التالية:

"ويبين شكل(1) نسبة الألفاظ الثلاثمائة الأكثر شيوعا من مجموع ألفاظ المدونة، إذ تشكل ما نسبته 31% من حجم المدونة، وهي نسبة كبيرة تؤكدها زيادة نسبة التكرار النسبي لهذه الألفاظ أكثر من غيرها، انظر جدول (1)، جدول (2)، جدول (3). وبالتالي فإنه يفترض أن تكون لهذه الألفاظ أهمية أكبر من غيرها في الدرس اللغوي.

ويبين شكل(2) نسبة كل مائة لفظة من حجم المدونة، ويلاحظ زيادتها في المائة الأولى بفارق كبير عن المائة الثانية والثالثة بينما تتقارب المائتين الثانية والثالثة. وهذا يؤكد على ضرورة التركيز على المائة الأولى والتي تشكل النسبة الأكبر من حجم المدونة.
                                                             
م
اللفظة
نسبتها من كلمات المدونة
1
في، من، على، أن، عن، الله، بن، إلى، لا، ما
10.26466
2
التي، ان، قال، هذا، أو، الذي، الى، مع، عليه، هذه
3.528318
3
كان، ذلك، و، لم، بين، هو، بعد، كما، كل، عبد
2.222026
4
ولا، له، فِي، محمد، وهو، علي، أي، به، قد، ابن
1.663273
5
إن، ثم، وفي، غير، وقد، فيه، حتى، وقال، خلال، صلى
1.354574
6
إذا، أنه، مِنْ، أبي، قبل، إلا، ومن، وسلم، ص، كانت
1.190608
7
فيها، حيث، أبو، هي، بها، بعض، يكون، عَلَى، العربية، قوله
1.029479
8
لها، أَوْ، عام، العام، عنه، فى، ج، عند، فإن، وهي
0.824593
9
وكان، رسول، منها، لَا، بل، الذين، وما، تعالى، رئيس، او
0.748561
10
مثل، أحمد، منه، هناك، فقال، تلك، ولم، يا، العراق، ح
0.696602
 
المجموع
23.5226

 
قائمة الألفاظ المائة الأولى الأكثر شيوعا                                       جدول (1)
 
 
على الرغم من عدم تمييز الباحثة بين الكلمة المعجمية (في ، و، هو) والكلمة بمفهومها الحاسوبي (أي مجموعة حروف يسبقها فراغ ويتبعها فراغ ، مثل: فيها ، وهو، وكان ، قوله) ، فإن النتائج التي توصلت إليها لها دلالات مهمة كثيرة ، مثل نسبة ورود الأسماء (35%) مقارنة بالأفعال (5%) . وهذه معلومة لم يرد ذكرها في أي من الدراسات المعنية باللغة العربية من قبل.

دراسة معجمية أسلوبية:
ومن الأعمال غير المنشورة  الدراسة التي قام بها الباحثان أحمد الشيبان وبدر العبدالقادر في مجال الألفاظ تحت عنوان "البيان والتبيين: دراسة أسلوبية في ضوء المدونات باستخدام المكشاف السياقي" ، يورد الباحثان ما أسمياه الكلمات المائة الأكثر شيوعا. (صص 12-16). ويذكران أن كلمة "مِن" هي أكثرها شيوعا (بتكرار 2732 مرة) ، وآخر المائة كلمة "رسول" (بتكرار126 مرة).

ولكن يؤخذ على هذه الدراسة ، كما على الدراسة السابقة ، اعتماد الباحثين على مفهوم "كلمة" بتعريفها الحاسوبي الشكلي فحسب.  فنحن إذا نظرنا إلى القائمة وأعدنا تحليلها سنجد أن أكثر الكلمات شيوعا هي "و" العطف ، حيث ترد 4929 مرة ، كذلك سنجد أن "في" ترد 3061 مرة. أما سبب عدم إشارة الباحثين إلى هذه الحقيقة فيرجع إلى عدم الفصل بين الكلمتين المذكورتين وبين الكلمة أو الضمير المتصل بهما . فالواو مثلا وردت مع "قال" ( "و+قال") 1722 مرة كما وردت مع كلمات أخرى (ولا ، وكان، وهو ، ومن ، وقد ..." ) مما يجعل مجموع تكراراتها 4929 مرة ، كما أشرنا من قبل . كذلك نجد أن "في" جاء تكرارها 2671 في القائمة ، بينما الصحيح هو 3061 مرة ، إذا أخذنا بعين الاعتبار "كلمتي" فيه (228مرة)  وفيها (162 مرة) . كذلك يلاحظ أنه لم يأخذ الباحثان بمفهوم الجذع بوصفه الصورة الأساس للأفعال والأسماء. ولم يشيرا مثلا إلى أن "كان" ترد في النص أكثر من 804 مرة ، وذلك في صور مختلفة (مثل "يكون" -191 مرة ، و "كنت" -182 مرة ، و"كانت" (128 مرة). فيكون مجموع تكرار الفعل "كان" في النص 1315 مرة. أما الفعل "قال" فنجد أن تكرارها يصل إلى 5366 مرة. وهذه حقيقة جديرة بالاهتمام ، لأن الدراسة تثبت أن الفعل "قال" هو أكثر الكلمات تكرارا في كتاب (البيان والتبيين) ، حيث يزيد حتى على تكرارات واو العطف التي تأتي في المرتبة الثانية (4929 مرة).
ولكن الدراسة تتميز بتحليلات وملاحظات دلالية وأسلوبية وثقافية جديرة بالاهتمام . ومن أمثال ذلك قول الباحثين:  بوجود "دلائل تحقق أسلوب الاطراد والإسهاب عند الجاحظ من خلال تكرار ألفاظ ذات علاقة بأسلوب الاطراد والإسهاب تتمثل فيما يأتي:
ورود مشتقات الفعل (قال) في ست صور ، هي : قال ، وقال ، فقال ، يقول ، قالوا ، قول... " والصحيح أن الفعل ورد في ثلاث صور فحسب (قال ، يقول، قالوا) ، كما ورد المصدر في صورة واحدة . ويستطرد الباحثان بقولهما :"وهذا يدل على كثرة نقول الجاحظ ، مما يؤكد اعتماده على معارف من سبقه ، كما أن تكرار كلمات لها ارتباط بمصدر الأخبار دلالة على كثرة نقوله من الأشخاص ، وتثبُّته مما ينقله عن غيره ، ..." (ص 17)

لا شك أن هذه الدراسة تعتبر سابقة جيدة في هذا النوع من التحليلات في مجال لسانيات المدونات اللغوية ، حيث تجمع بين كل من التحليل الكمي والكيفي أو النوعي .

دراسة مبنية على معاجم عربية:
ومن الدراسات الجديرة بالذكر ما قام به مركز الدراسات والبحوث العلمية في دمشق . ونورد وصف  الدكتور محمد علي الزركان للمشروع المذكور، لها فيما يلي:

"لقد أعدّ مركز الدراسات والبحوث العلمية في دمشق دراسة حول توصيف المعجم العربي والتي تدور حول إحصائية الجذور اللغوية العربية، حيث أنجز خبراء هذا المركز المعجم الحاسوبي ضمن قاعدة معطيات DATA BASE وعلى القوانين الصرفية والنحوية لقواعد الاشتقاق، ويحتوي على جميع الجذور المعجمية الثنائية والثلاثية والرباعية والخماسية، وقد بلغ عددها في الإحصائية: 11347 جذرا توزعت على النحو التالي:
-        115 جذرا ثنائيا، وهذه الجذور هي تراكيب لا اشتقاق فيها.
-        7198 جذرا ثلاثيا وهي أكثر الجذور خصوبة.
-        3739 جذرا رباعيا وهي دون الثلاثية في الخصوبة.
-        295 جذرا خماسيا وهي أقل الجذور خصوبة[17].

وقد عمد المركز على استخراج جذور اللغة العربية المثبتة في خمسة (05) معاجم أصول هي:
    1- جمهرة اللغة لابن دريد (ت321ه).
    2- تهذيب اللغة للأزهري (ت 370ه).
    3- المحكم والمحكم المحيط لابن سيّده (ت458ه).
    4- لسان العرب لابن منظور(ت711ه).
    5- القاموس المحيط للفيروزأبادي (ت816ه).

وقد جرى المركز في إحصاء الجذور على الالتزام بالنقاط التالية:
     1- قراءة المواد اللغوية بتمامها وذلك لأنّ الاكتفاء باستلال المواد المعجمية دون قراءة شرحها يترتب عليه سقوط مواد لغوية بسبب اشتمال المعاجم على ظواهر معجمية مختلفة.

     2- تمييز ما أجمعت المعاجم الخمسة على إيراده مما انفرد به معجم أو أكثر برموز خاصة.

     3- قراءة الأصل في حروف الجذور وذلك بردّ كل حرف غير أصلي إلى أصله إذ الألف لا تكون أصلية في الجذور بل منقلبة عن واو أو ياء.

     4- فصل الواوي عن اليائي في الجذور المعتلّة، وهو أمر عسير جدّا نتج عنه تخليط كثير من المعاجم العربية فيه.

     5- تمييز الأعجمي والموّلد والمعرّب والنادر والغريب والشاذ وذلك بتدوين ملاحظات المتقدمين على ما كانت هذه سبيله من المواد اللغوية.

     6- تمييز الجذور الخصبة الاشتقاق من أخواتها المجدبة التي لا يتجاوز ما استعمل منها كلمة واحدة وهو قليل في الثلاثي، كثير فاشٍ في الرباعي والخماسي.

     7- تصحيح ما أمكن الوقوف عليه مما ورد في المعاجم السالفة من ظواهر لغوية عديدة كالمواد المصحفة عن أصولها والتي وردت في غير موضعها لاعتبار لغوي ما[18].
(ينظر: اللسانيات و برمجة اللغة العربية في الحاسوب، د.محمّد علي الزركان، ص: 55.)
 

دراسات تتعلق بالكلمات الجديدة والتعبيرات الاصطلاحية :

تحت عنوان "الكلمات الجديدة بنية ودلالة" في: محمد محمد حلمي هليل (2008)"نحو معجم عربي معاصر"   من بحوث الاجتماع الثاني لخبراء المعجم الحاسوبي للغة العربية. الرياض: مدينة الملك عبدالعزير للعلوم والتقنية. يذكر هليل أن وفاء فايد (2000) ناقشت "بعض مظاهر تغير الصيغ الصرفية في العربية المعاصرة" في: بحوث الندوة الدولية للمعاجم اللغوية العامة والمختصة .(المنعقدة في الكويت في 14-17 مارس ، 1999) تحرير محمد حلمي هليل وسعد مصلوح وحشان العجمي. الكويت: جامعة الكويت." (انظر هليل ,2008).
و هناك عدد من الدراسات التي قام بها بعض الباحثين على مستوىي التعبيرات الاصطلاحية والمتلازمات اللفظية في اللغة العربية.

ومن هذه الدراسات الدراسة قام بها أشرف عبدو في مجال التعبيرات الاصطلاحية ونشرت بالإنجليزية في عام 2011   بعنوان التعبيرات الاصطلاحية العربية : دراسة مبنية على مدونة لغوية. (انظر Abdou, Ashraf في قائمة المراجع.)
وفي تاريخ سابق(2004) كتب عبدالحميد عليوة رسالة الدكتوراة حول التلازم اللفظي والترادف في العربية الفصحى ، وهو متاح على الشابكة باللغة الإنجليزية ، باسمه Abdul-Hamid Elewa. وقد اعتمد العمل المذكور على مدونة العربية الفصحى Classical Arabic Corpus (CAC) في جامعة مانشستر ، والتي تشتمل على نصوص من القرون الأربعة الأولى من الهجرة قوامها 5 ملايين كلمة. (انظر Elewa, 2004.)

وهناك دراسة قام فيها الباحث المهنا في رسالة للدكتوراة  بجامعة مانشسترفي العام 2003. وقد درس المهنا في أطروحته  المصطلحات العلمية المركبة (تركيبا إضافيا أو وصفيا) في النصوص العلمية العربية في مدونة قوامها مليون كلمة . وقد قارن نتائج دراسته بالمصطلحات الصادرة من مجامع اللغة العربية . (انظر( Latifal Al-Sulaitni and Eric Atwell, 2006).

وهناك دراسة أخرى تحدث عنها الباحثان السليطني وأتويل ، حيث نقرأ:
"بحث غزالي وبراهام (Ghazali  & Braham, 2000 ) في ضوء مدونة قوامها مائة وخمسين ألف كلمة المعاني المختلفة للكلمة "أخذ" ، حيث وجدا أنه ، إضافة إلى معناها الحرفي ، هناك معنييان أخريان للكلمة : هما "بدأ عملا ما" و"أخذ بعين الاعتبار" ، عندما تتلوها بعض التراكيب. وقد ورد المعنى الأخير في 11% من الحالات التي وردت بها الكلمة ، ومع ذلك لا نجد لا في المعجم التقليدي (الوسيط) ولا في المعاجم الأحدث ذكرا لهذا المعنى."  (انظر: Latifal Al-Sulaitni and Eric Atwell (2006) في قائمة المراجع.)

دراسات معجمية تداولية:

من الدراسات الجديرة بالذكر في هذا المجال الدراسات الثلاث التي وردت في كتاب (التعابير الاصطلاحية في ضوء النظريات اللسانية الحديثة : دراسة تطبيقية على مدونة صحيفة الجزيرة). التي نشرها كرسي بحث صحيفة الجزيرة للدراسات اللغوية الحديثة في جامعة الأميرة نورة بالرياض.

1-     سنورد لمحات من الدراسة الأولى للدكتورة ثناء محمد سالم والتي عنوانها : "الأبعاد التداولية للتعبير الاصطلاحي" ، حيث إنها من الدراسات القليلة التي تعاملت مع هذا الموضوع بصورة أكاديمية متميزة.

أولا: يلاحظ أن على الرغم من عنوان الكتاب ، فإن الباحثة لم تكتف بمدونة جريدة الجزيرة ، حيث تقول:

"والمدونات المعتمدة في التطبيق تمثلها: نصوص حوارية قصيرة متنوعة المواقف ، اشتمل الخطاب فيها على تعبير اصطلاحي أو أكثرمدمج في الخطاب ، تنوعت مصادرها بين التراثي والمعاصر في الخطب والمقالات والأخبار والحوارات ممثلة في : زهر الآداب ، العقد الفريد ، الأذكياء ، وأخبار الحمقى والمغفلين للجوزي ، رسائل الجاحظ ، وأربعة أعداد من صحيفة الجزيرة ...." (ثناء سالم ، 2012 : 23-24).

وقد اشتملت على ثلاثة مباحث ، تحدثت فيها الباحثة عن قضايا مثل تصنيف التعبيرات الاصطلاحية  و"أشكال تعدد المعنى في التعبير الاصطلاحي" و"الكفاءة التداولية التواصلية واستراتيجية التأثير" . (انظر: ثناء محمد سالم (2012).)

2- في الدراسة الثانية في الكتاب المذكور أعلاه ، بعنوان " ظاهرة الاقتران الدلالي – دراسة معجمية تطبيقية) تذكر الباحثة د/ نوال بنت علي الفلاج أنها اعتمدت على "مدونة (صحيفة الجزيرة) في واحد من أعدادها ، لإحصاء الظاهرة وإخضاعها للتحليل." (نوال الفلاج ، 2012 : 132). وتعالج الباحثة "تعريف الاقتران في اللغة والاصطلاح اللساني وأنواع المدى ، والاقتران والتوافق الدلالي. وتقول الباحثة:

"أما المبحث الثاني: تطبيقات نظرية الاقتران ، التطبيق على الاقتران والمعنى المجازي، والانحراف في قوانين الاختيار ، وأنماط الاقتران الدلالي للاستعارة ، ونماذج للتحليل للاستعارة والانحراف في الأدوار الدلالية للمجاز المرسل..." (صفحة 132).

3- أما في الدراسة الثالثة ،وعنوانها : "العلاقات الدلالية للتعبيرات الاصطلاحية في مجال الرياضة" ،  فتقول الباحثتان : "وقد استوعب هذا البحث التعبيرات الاصطلاحية بسياقاتها المتعددة في المجال الرياضي في لغة الإعلام المقروء من خلال مدونة صحيفة (الجزيرة) في أعداد محدودة منها ، وعددين من صحيفتي الحياة والرياض..." (رائدة المالكي وهند القحطاني، 2012 : 181).

صناعة  المعاجم:

لعل أحدث عمل معجمي مبني على المدونات اللغوية العربية العمل القيم الذي قام به المستشرقان الأمريكيان تيم بكوولتر وديل باركنسون Tim Buckwalter and Dillwoth Parkingon بعنوان (معجم شيوع للمفردات العربية للمتعلمين) A Frequency Dictionary of Arabic Vocabulary for Learners ، والذي يشتمل على الخمسة آلاف أشيع كلمة في اللغة العربية بناء على المدونة التي اشتملت على نصوص فصيحة وعامية ، مشروحة باللغة الإنجليزية. وهو عمل متميز من حيث إيراده الألفاظ مرتبة حسب شيوعها (تكرارها) ، كما يورد قائمة ألفبائية بالكلمات مع بيان شيوع كل كلمة. ولعل أهم مايؤخذ على المعجم إيراده للألفاظ العامية وترتيب مداخله بناء على الشيوع، مما يتعب الباحث عن الكلمات ، حيث يضطر إلى الرجوع إلى الكشاف الألفبائي ليعرف أين يبحث عن كلمة ما في القسم الأساس للمعجم ، والمرتب حسب شيوع الكلمات. ويعتبرجعل المعجم المذكور "ال" التعريف كلمة سابقة في معالجة اللغة العربية.
ولعل أهم معجمين سيصدران في العالم العربي من هذه الفئة من المعاجم معجمي التلميذ السعودي للمرحلة الابتدائية والمرحلتين المتوسطة والثانوية ، يتوقع صدورهما قريبا من مكتبة لبنان – ناشرون في بيروت.

ومن المعاجم المعروفة التي استفادت من المدونات اللغوية:
1-    معجم اللغة العربية المعاصرة (عربي-إنجليزي) الذي ألفه المستشرق هانز فير بالألمانية ثم ترجم إلى اللغة الإنجليزية ، ونشرته جامعة كورنيل Cornell الأمريكية، وطبعت نسخة من الطبعة الثالثة منه في بيروت (مكتبة لبنان). ويشير مؤلف المعجم أنه اعتمد في عمله على نصوص عربية مختلفة المصادر. ولكننا لا نستطيع للأسف أن نطلع على هذه المدونات التي أشار إليها معد المعجم لعدم توافرها مجموعة في مدونة معروفة.

2-    معجم السبيل (معجم عربي-فرنسي وفرنسي-عربي) من منشورات دار لاروس في باريس، 1983 والذي يذكر مؤلفه الدكتوردانيال ريغ في مقدمته  أن مادته استقيت من نصوص عربية حديثة ، حيث تقول المقدمة: "فقد انطلق بناء هذا السبيل من صميم اللغة العربية الحية بالذات . الحية في الأوساط السياسية والدواوين الوزارية ... الحية في الصحف والكتب . ...في كلية الآداب والعلوم والفنون ...الحية في الأغاني والأفلام والإذاعة والتلفزة ... لقد فرزت آلاف الوثائق على اختلاف أنواعها ... ثم نقلت هذه المفردا والعبارات المفرزة إلى ألاف و آلاف من الجزازات .

"غير أن مجموعة الوثائق هذه، المتعددة الأنواع، بقيت مرتكزة على ثلاثة عناصر أساسية هي: أولا الكتب المدرسية. ثانيا الصحف اليومية والأسبوعية. وثالثا مؤفقات الأدباء المعاصرين." (السبيل ، ص 9).

3- المعجم العربي الهولندي The Nijmegen University Dutch Arabic Dictionary الذي نشر في آمستردام في العام 2003 والذي اختيرت مادته من مدونة للعربية المعاصرة (انظر عليوة Elewa  2004).

4- ومن المعاجم الأخرى المعروفة المصدر نجد: محمود صيني وحيمور يوسف (1991) (معجم الطلاب : معجم سياقي للمفردات الشائعة) . بيروت : مكتبة لبنان.  وهو معجم بني على الثلاثة آلاف كلمة الشائعة في اللغة العربية ، وفقا لكتاب داود عبده (المفردات الشائعة في اللغة العربية) من منشورات جامعة الملك سعود ،1979 . ولكن المعجم المذكور لم يعتمد على دراسة مباشرة لمدونة لغوية ، بل أعد بناء على دراسة داود عبده المبنية على مدونات لغوية (انظر داود عبده ، 1979).
 
5- -من المعاجم الحديثة التي اعتمدت مدونة عربية معجم التعابير الاصطلاحية الذي أعدته د/ وفاء كامل فايد.
يذكر د/ عبدالإله النبهان مايلي عن المعجم المذكور:

"اعتمدت واضعة المعجم المذكور على استقراء اللغة العربية المعاصرة المكتوبة في أعداد كثيرة مختارة من إحدى وثلاثين مجلة تصدر في العالم العربي كالهلال والعربي وكلية آداب القاهرة وأدب ونقد وصباح الخير وروز اليوسف وزهرة الخليج والكويت والأهرام العربي والأهرام الرياضي وغيرها، كما اعتمدت استقراء أعداد مختارة كثيرة من ست وعشرين صحيفة مما يصدر في العالم العربي كالأهرام والأخبار والبعث وتشرين والثورة والدستور وغيرها، كما اعتمدت تسعة كتب مدرسية مما صدر في العربية السعودية إضافة إلى استقراء أربعة وثلاثين ومئة كتاب لواحد وتسعين كاتباً من المعاصرين كنجيب محفوظ ويحيى حقّي ويوسف السباعي وأحمد تيمور وإميل حبيبي وتوفيق الحكيم... وكانت هذه الكتب منوعة من حيث الجنس فمنها الرواية والقصة والدراسة والمذكرات... كما امتد الاستقراء إلى الكتب المترجمة، وقد اختارت صانعة المعجم أربعة عشر عملاً مترجماً لتكون مصدراً من مصادر جمع المادة..." (انظر مقالة النبهان في موقع : منتدى قناديل الفكر والأدب)

أعمال رائدة :
قبل أن نختم استعراضنا للجهود المعجمية المنية على المدونات اللغوية أوالنصوص العربية .لابد من التنويه بالعمل الرائد الذي قام به المستشرق رينهارد دوزي في القرن التاسع عشر ، ونشره تحت عنوان : (تكلمة المعاجم العربية) ، الذي استقى معلوماته فيه من النصوص العربية التي اطلع عليها. وكذلك كتاب (مد القاموس) للمستشرق الإنجليزي إدوارد لين Edward Lane الذي اعتمد كما نفهم من عمله أنه مبني على دراسة الآلاف من النصوص العربية. وكلا العملين نشرتهما مكتبة لبنان.

تعليق على الأعمال المعجمية:
لعل من نافل القول أن العمل المعجمي الحقيقي يجب أن يكون مبنيا على مدونات لغوية (قد تشمل معاجم ) ، وليس مجرد نقل من معاجم سابقة ، كما هو الحال مع معظم معاجمنا العربية الحديثة . وهذا هو مايدعو إليه كثير من اللسانيين العرب.

مجال علم اللغة الاجتماعي:

تقول لطيفة السليطني وإريك أتويل Latifal Al-Sulaitni and Eric Atwell (2006) في بحث لهما عن مشروع مدونة اللغة العربية بجامعة ليدز:

"من الدراسات المبنية على المدونات المتعلقة بالعربية كانت دراسة باركنسون (1985) اللغوية الاجتماعية لنظام ألفاظ المخاطبة  في اللهجة المصرية، والتي هدفت إلى تحديد من يستعمل ماذا من العبارات؟ وفي مخاطبة من؟ والمواقف التي تستخدم فيها تلك العبارات. .. وقد عكف الباحث خلال عام كامل على جمع مادته من عدة مناطق من القاهرة للحصول على أمثلة ممثلة للطبقات وأساليب المعيشة المختلفة. وجمع أكثر من خمسة آلاف مثال من عبارات المخاطبة تمثل مجموعة كبيرة من المواقف الاجتماعية. وقد تم البحث في هذه المدونة الخاصة يدويا ، حيث سجلت كل عبارة على بطاقة بها معلومات عن الموقف والجنس والعمر والطبقة الاجتماعية ... إلخ. وحللت المادة كما وكيفا..."
الكتب التعليمية :

من المعروف أن من أهم أهداف دراسات المدونات اليدوية والمحوسبة إحصاء الألفاظ (والتراكيب إلى حد ما) لأغراض إعداد المعاجم والكتب التعليمية ، خاصة كتب القراءة الميسرة ، كما فعلت لونغمان Longman في العديد من مشروعاتها المعجمية والكتب التعليمية والقراءة الميسرة simplified والمتدرجة graded لدارسي الإنجليزية من غير أهلها والتي اعتمدت كثيرا على مشروع مايكل وست Michael West الإحصائي للكلمات الإنجليزية ، ومن الأمثلة المشهورة  دار كولنز Collins مؤخرا في مشروعات معاجم  وكتبBuild  Co- التعليمية التي اعتمدت على مدونتها المشهورة Co-Build Corpus .

جدير بالذكر أن معهد اللغة العربية بجامعة الملك سعود  كان قد تنبه لأهمية هذا الأمرمنذ نشأته في العام 1975. لذلك كلف أحد منسوبيه ، الدكتور داود عبده ، بإعداد دراسة للمفردات الشائعة في اللغة العربية والتي نشرها المعهد في العام 1979.

ومن الكتب العربية التي أعدت في ضوء الدراسات الإحصائية المبنية على المدونات الكتب التالية التي أعدها أساتذة من معهد اللغة العربية بجامعة الملك سعود ، وذلك بهدف تيسيرتعليم اللغة العربية للناطقين بغيرها :

1-    سلسلة القراءة الميسرة  (ثلاثة أجزاء)، من إعداد محمود إسماعيل صيني وعادل شعبان ، ومنشورات جامعة الملك سعود . وقد أعدت بناء على دراسة داود عبده الإحصائية لنصوص عربية مختلة وبناء على دراسات قام بها فاخر عاقل لكتب مدرسية سورية والمستشرق لانداو لنصوص عربية معاصرة والمستشرق موسى بريل للغة الصحافة في أربعينيات القرن الماضي.

2-    سلسلة القراءة العربية للمسلمين (ثلاثة أجزاء) ، من إعداد محمود إسماعيل صيني وآخرين ، ومن منشورات مكتبة لبنان . وقد اعتمد المؤلفون على دراسات إحصائية للقرآن الكريم وصحيح البخاري وعدد من كتب الثقافة الاسلامية .

أمثلة للاستفادة من المدونات في إنتاج برمجيات لغوية حاسوبية:
لعل من أفضل الأمثلة على الاستفادة من المدونات اللغوية في تطوير البرمجيات الحاسوبية ماقامت به شركة صخر في الاستفادة من مدونتها (ما أسماه أبو العزم بمكنز صخر). ونورد أدناه وصفا موجزا لبعض هذه البرمجيات أو المنتجات الحاسوبية ، وفقا للباحث عبدالغني أبو العزم.

-       المحلل الصرفي الآلي:

"يعد المحلل الصرفي الآلي من الآليات الأساسية للتعامل مع طبيعة الكلمات سواء كانت مجردة أو مرتبطة بزوائد ولواحق، وذلك باستخلاص العناصر الأولية لبنية الكلمة وتحديد سماتها الصرفية...."

 التشكيل والإعراب الآلي:
"حيث بإمكان المستخدم لهذا البرنامج أن يحدد نوع التشكيل المطلوب سواء أكان تشكيلا كاملا أم تشكيلا جزئيا لازما لفك اللبس الصرفي، سواء تعلق الأمر باللغة العربية في نصوصها القديمة أو المعاصرة."

     المصحح الآلي:

المدقق الإملائي والمصحح النحوي.

- المصنف الآلي:

" تكمن أهمية المصنف الآلي في قدرته على تحديد مواضيع الوثائق بطريقة آلية، كما يقوم بإتاحة خيار عرض الموضوعات العامة في الوثيقة فقط، أو عرض جميع الموضوعات التي يتضمنها محتوى الوثيقة...."
 المفهرس الآلي:

"يشكل المفهرس الآلي خطوة كبرى في مجال العقلنة الآلية لفهرسة الكتب العربية ويعد هذا البرنامج الأول من نوعه على الصعيد العربي، وينجز بدقة أعقد عمليات الفهرسة للمكتبات."

    - الملخص الآلي:

  " ويتميز هذا البرنامج بخاصية التلخيص الآلي للوثائق، والبريد الإلكتروني وصفحات الإنترنت بالإضافة إلى استعراض الأفكار الرئيسية التي يتضمنها أي نص باللغتين العربية والأنجليزية...."

 - القارئ الآلي O C R :

وهو ما يعرف باسم قارىء المحارف البصري optical character reader  فبوساطته "أصبح بالإمكان التعرف على النصوص العربية بمختلف أشكال كتابة حروفها سواء كانت مشكلة أو غير مشكلة، حيث يتم تحويلها إلى ملفات إلكترونية قابلة للمعالجة والتصرف فيها بالإضافة أو الحذف..."

(انظر: (انظر عبد الغني أبو العزم "اللغة العربية والمعالجة الآلية: برامج صخر نموذجا")


المراجع

أحمد الشيبان وبدر العبدالقادر (2013) :" البيان والتبيين : دراسة أسلوبية في ضوء المدونات باستخدام المكشاف السياقي". بحث غير منشور مقدم في مادة "الحاسوب واللغة"في معهد تعليم اللغة العربية ، جامعة الإمام محمد بن سعود الإسلامبة ، الرياض.

أفراح عبدالعزيز التميمي (2103)  "نظرات فيالثلاثمائة لفظة الأكثر شيوعا في المدونة العربية" بحث غير منشور مقدم في مادة "الحاسوب واللغة"في معهد تعليم اللغة العربية ، جامعة الإمام محمد بن سعود الإسلامبة ، الرياض.

التعابير الاصطلاحية في ضوء النظريات اللسانية الحديثة : دراسة تطبيقية على مدونة صحيفة الجزيرة. الرياض: جامعة الأميرة نورة.

ثناء محمد سالم (2012) "الأبعاد التداولية للتعبيرالاصطلاحي" في : التعابير الاصطلاحية في ضوء النظريات اللسانية الحديثة : دراسة تطبيقية على مدونة صحيفة الجزيرة ، صص 17-128.

دراسات في علم اللغة النصي: مقاربة تطبيقية على مدونة صحيفة الجزيرة (2012) الرياض: جامعة الأميرة نورة.

رائدة المالكي وهند القحطاني (2012) "العلاقات الدلالية للتعبيرات الاصطلاحية في مجال الرياضة" في : التعابير الاصطلاحية في ضوء النظريات اللسانية الحديثة : دراسة تطبيقية على مدونة صحيفة الجزيرة ، صص 129-177.

عبدالغني أبو العزم " اللغة العربية والمعالجة الآلية: برامج صخر نموذجا") في الموقع:
www.aljabriabed.net/n31_04abualazm.(2).htm

عبد الغني أبو العزم، الحاسوب والصناعة المعجماتية، مجلة اللسان العربي، العدد 46،  1998م،  صص28-39 .

  علي حلمي موسى (2001) "حوسبة التراث العربي" محاضرة ألقيت في مجمع اللغة العربي الأردني في 17 نيسان (أبريل) ، 2001.

ليلى بايزيد (2012) "الترابط النصي في المقال الموسوم (فتاة مهمة ) لسليمان العودة بين الشكل والمضمون" في : دراسات في علم اللغة النصي: مقاربة تطبيقية على مدونة صحيفة الجزيرة (2012) الرياض: جامعة الأميرة نورة ، 295-364.

محمد حسين أبو الفتوح : قائمة معجمية بألفاظ القرآن الكريم ودرجات شيوعها بيروت : مكتبة لبنان.
محمد محمد حلمي هليل (2008)"نحو معجم عربي معاصر"   من بحوث الاجتماع الثاني لخبراء المعجم الحاسوبي للغة العربية. الرياض: مدينة الملك عبدالعزير للعلوم والتقنية.
محمد حلمي هليل وسعد مصلوح وحشان العجمي (2000 ، تحرير) بحوث الندوة الدولية للمعاجم اللغوية العامة والمختصة .(المنعقدة في الكويت في 14-17 مارس ، 1999)  الكويت: جامعة الكويت.
محمد علي الزركان (1993) "اللسانيات و برمجة اللغة العربية في الحاسوب"،  في: وقائع المؤتمر الدولي الأول حول اللغة العربية والتقنيات المتقدمة ، الرياض ، 10-14/5/1992، الرياض: مكتبة الملك عبدالعزيز، 1993م ،  صص 55-.

محمود إسماعيل صالح (2012) الحاسوب في البحث اللغوي: المدونات اللغوية نموذجا. الرياض : كرسي الجزيرة للغة العربية ، جامعة الأميرة نورة.
مروان البواب (2012) محركات البحث في النصوص العربية. من بحوث المؤتمر السابع لمجمع اللغة العربية بدمشق (تاريخ الإضافة 23/9/2012م)

1-    www.aluka.net/ literature_language/0/7728/

مروان البواب (2009) أثر التقانات الحديثة في تجديد المعجم العربي (تاريخ الإضافة 18/3/2009) www.aluka.net

نعمان بوقرة (2012) "استراتيجيات الإقناع في الخطاب الصحفي السعودي- دراسة نصية تداولية" في : دراسات في علم اللغة النصي: مقاربة تطبيقية على مدونة صحيفة الجزيرة (2012) الرياض: جامعة الأميرة نورة، 19-90.
نوال الثنيان (2012) "الإحالة الضميرية- دراسة نحوية نصية" في : دراسات في علم اللغة النصي: مقاربة تطبيقية على مدونة صحيفة الجزيرة (2012) الرياض: جامعة الأميرة نورة، 193-293.

نوال الحلوة (2012) " أثرالتكرار في التماسك النصي- مقاربة معجمية تطبيقية" في : دراسات في علم اللغة النصي: مقاربة تطبيقية على مدونة صحيفة الجزيرة (2012) الرياض: جامعة الأميرة نورة، 91-190.

نوال الفلاج (2012) "ظاهرة الاقتران الدلالي – دراسة معجمية تطبيقية" في : التعابير الاصطلاحية في ضوء النظريات اللسانية الحديثة : دراسة تطبيقية على مدونة صحيفة الجزيرة، صص 177-271.

وفاء كامل فايد (2007) معجم التعابير الاصطلاحية في العربية المعاصرة. القاهرة: ؟؟

وفاء فايد (2000) "بعض مظاهر تغير الصيغ الصرفية في العربية المعاصرة" في: بحوث الندوة الدولية للمعاجم اللغوية العامة والمختصة .(المنعقدة في الكويت في 14-17 مارس ، 1999)
  وليد أحمد العناتي "اللسانيات الحاسوبية العربية: رؤية ثقافية" الموقع: www.aljabriabed.net/n82_03alinati.(1).htm

Abdou, Ashraf (2011) Arabic Idioms: A Corpus Based Study.  London and New York: Routledge.

Al-Ansary, S. (2003). NP-Structure Types in Spoken and Written Modern Standard Arabic (MSA) Corpora. In D. Parkinson & S. Farwaneh (Eds.), Perspectives on Arabic Lin­guistics XV: Papers from the Fifteenth Annual Symposium on Arabic Linguistics (pp. 149–180). Salt Lake City.

Al-Muhanna,  Amin. (2004). Scientific and technological terms transfer into Arabic: A corpus-based study of Arabic noun+noun and noun+adjective compounds. Ph. D. thesis, UMIST, Manchester.

Al-Saif, Amal and Katja Markert: The Leeds Arabic Discourse Treebank: Annotating Discourse Connectives in Arabic at: www.comp.leeds.ac.uk/markert/Papers/LREC2010-LADTB.pdf

Al-Sulaitni, Latifa and Atwell, Eric. (2006). "The design of a corpus of contemporary Arabic." International Journal of Corpus Linguistics., vol. 11, pp. 135-171.

Alzahrani, Rajab Jamaan (2013). "A Corpus-Based Critical Discourse Analysis of the Ideological Representations and Legitimation in the Salafi Discourse in Saudi Arabia (1980-2000)" A Ph. D. dissertation. Lancaster University, U.K.

Atkins, Sue, Jeremy Clear and Nicholas Ostler. (1993) Corpus Design Criteria, in Literary and Linguistic Computing, 7 (1), Pp.1-16.
 (  2011(Buckwalter, Tim and Dillwoth Parkingon A Frequency Dictionary of Arabic: Core Vocabulary for Learners. London and New York: Routledge, Taylor and Francis Group
 
.Ghazali, S. & Braham, A. (2001). Dictionary Definitions and Corpus-Based Evidence in Modern Standard Arabic. Arabic NLP Workshop at ACL/EACL,Toulouse,France. (http://www.elsnet.org/arabic2001/ghazali.pdf)
Elewa, Abdul-Hamid (2004) Collocation and Synonymy in Classical Arabic: A Corpus Based Study. Ph. D. Thesis, University of Manchester.
Hassan, Haslina and Nuraihan Mat Daud (2011). Corpus Analysis of Conjunctions: Arabic Learners' Difficulties with Collocations. In: Workshop on Arabic Corpus Linguistics (WACL), 11th -12th April 2011, Lancaster University, UK. At:  http://ucrel.lancs.ac.uk/wacl/slides-HASSAN-DAUD.pdf
Kamal, Eman (2008) The Structure of Arguments in English and Arabic Newspaper Editorials: A Contrastive Study." An unpublished Ph. D. dissertation, King Saud University, Riyadh.
Parkinson, D. (1985). Constructing the social context of communication: terms of address in Egyptian Arabic. Berlin/New York/Amsterdam: Mouton de Gruyter.
---------------. (2003). Future Variability: A Corpus Study of Arabic Future Particles. In D. Parkinson & S. Farwaneh (Eds.), Perspectives on Arabic Linguistics XV: Papers from the Fifteenth Annual Symposium on Arabic Linguistics (pp.191–211). Salt Lake City.
Parkinson, D. & Farwaneh, S. (Eds.) (2003). Perspectives on Arabic Linguistics XV: Papers from the Fifteenth Annual Symposium on Arabic Linguistics, Salt Lake City. . Amsterdam: John Benjamins Publishers.
Taylor, S. (2003). Comparing Frequencies of Lexical Productions in Arabic Words. In D. Parkinson & S. Farwaneh (Eds.), Perspectives on Arabic Linguistics XV: Papers from the Fifteenth Annual Symposium on Arabic Linguistics (pp. 181–189). Salt Lake City.
Taweel, Abeer Q., Saidat, Emad M Rafayah, Hussein A., & Saidat, Ahmad M." Hedging in Political Discourse" in The Linguistics Journal. June 2011 Volume 5 Issue 1: 169-196.
van Mol, Mark (2000a). The development of a new learner’s dictionary for Modern Standard Arabic: the linguistic corpus approach. In U. Heid, S. Evert, E. Lehmann & C. Rohrer (Eds.), Proceedings of the ninth EURALEX International Congress (pp. 831–836). Stutt­gart, 8–12 August. (http://www.ilt.kuleuven.ac.be/ilt/arabic/_pdf/stuttgart.pdf)
------------- (2000b). Exploring annotated Arabic corpora: preliminary results.

--------------- (2003a). Evolution of MSA, the Case of Some Complementary Particles. In D. Parkinson & S. Farwaneh (Eds.), Perspectives on Arabic Linguistics XV: Papers from the Fifteenth Annual Symposium on Arabic Linguistics (pp. 135–147). Salt Lake City.

--------------- (2003b). Variation in Modern Standard Arabic in radio news broadcasts, a syn­chronic descriptive investigation into the use of complementary particles. Bel­gium: Peeters.

---------------. & Paulussen, H. (2001). AraLat: a relational database for the development of bi­lingual Arabic dictionaries. In S. Lee (Ed.), Proceedings of Asialex 2001, Asian Bilingual­ism and the Dictionary (pp. 206–211). Seoul, August 2001. (http://www.ilt.kuleuven.ac.be/ilt/arabic/_pdf/asialex.pdf)

 

 

ليست هناك تعليقات:

إرسال تعليق