الإعراب الإحصائي

الإعراب الإحصائي Statistical parsing هو مجموعة الطرق الإعرابية التي تدخل في معالجة اللغة الطبيعية، والتي تشترك في إدراجها ل قواعد النحو انطلاقا من احتمالات معينة. إن اللسانيات الحاسوبية تنظر إلى قواعد النحو بمنظار تقليدي، فهي تحصر دور هذه الأخيرة في تحديد صلاحية الجمل (صحة صياغة الجمل) في أي لغة من اللغات. و عليه، إذا انطلقنا من هذا النسق من التفكير القائم على ربط كل قاعدة نحوية باحتمال معين، سنحصل على نسبة تكرار كل قاعدة، و بهذا نستنتج الإحتمال الموافق للأعراب التام لأي جملة من الجمل. ( بامكاننا إستقراء الإحتمال الذي يُرفق بكل قاعدة نحوية، و لكن تطبيق هذه القاعدة النحوية ضمن شجرة الإعراب، و كذا حساب الإحتمال المرفق بهذه الأخيرة (الشجرة الإعرابية)، والذي يعتمد أساسا على القواعد النحوية المكونة لها هو عبارة عن عملية إستنتاجية.

وانطلاقا من هذا المفهوم تمكن المختصون في الإعراب الإحصائي من إيجاد طريقة تستعمل للبحث عن كافة إمكانيات الإعراب، و حساب الإحتمال المرفق بكل إمكانبة، و هذا بهدف الوصول إلى إشتقاق الإعراب الأرجح لكل جملة. و يعد خوارزمية التوقع الأقصى The expectation maximization algorithm من بين الطرق الأكثر إستعمالا في البحث عن أقصى الإحتمالات دقة لإعراب الجمل.

إنّ البحث في هذا السياق يتطلب تطبيق واحدة من أكثر العمليات إستعمالا في مجال الذكاء الإصطناعي، وهو ما يعرف ب خوارزمية البحث Search Algorithm. إليك المثال التالي، إقرأه، وتدبّر معناه:

قال أبو الفتح البستي:

"إذا لم يكن ملك ذا هبة        فدعه فدولته ذاهبة".

إنّ القارئ لهذا البيت سيلفت انتباهه استعمال العبارة " ذا هبة" في الشطر الأوّل من البيت، و العبارة "ذاهبة" في الشطر الثاني، ولكن و على الرغم من التشابه في النطق بين العبارتين، إلا أنّ معناهما مختلف، و هذا الفرق في المعنى سيظهر جليا، عن طريق الإعراب التفصيلي لإجزاء من الجملة.

يفتتح الشطر الأوّل من البيت بالأداة "إذا" وهي أداة شرط غير جازمة، يليها "لم"، وهو حرف جازم، يجزم الفعل المضارع، و "يكن" و هو فعل مضارع ناقص، يدخل على [الجملة الاسمية]، فيرفع الأول و يسمى اسمه، و ينصب الثاني و يسمى خبره، و عليه فإنّ الجملة الاسمية (ملك ذا هبة) تتكون من الاسم "ملك" و هو اسم "يكن" مرفوع، و علامة رفعه الضّمة الظاهرة على أخره، و خبره "ذا" و هو اسم من [الأسماء الخمسة]، منصوب و علامة نصبه الألف لأنه مثنى، و هو مضاف، و الاسم "هبة" مضاف إليه مجرور و علامة جره الكسرة الظاهرة على أخره.

ولكن قد تختلف القراءة لنفس العبارة من شخص إلى آخر، فقد يقرأها البعض على أنها مفردة واحدة "ذاهبة"، في الشطر الأوّل و كذا في الثاني الشطر الثاني من البيت. ( "ذاهبة" اسم فاعل، مشتق من الفعل الثلاثي "ذهب"، يذهب، فهو ذاهب، و هي ذاهبة، وبهذا يختل معنى البيت أو ينعدم).

إذاً هنالك إمكانيتين مختلفتين للفهم، إما أن يصل القارئ للترجمة الأولى للبيت، وهذا في حال إدراكه أنّ عبارة "ذا /هبة" في الشطر الأوّل منه تتكون في الحقيقة من كلمتين "ذا" و "هبة"، بينما هي عبارة عن مفردة واحدة "ذاهبة" في الشطر الثاني منه. و إما أن يلتبس عليه الأمر، وفي هذه الحال يقرأ العبارتين بنفس الطريقة، أي كمفردة واحدة، في الشطرين كلاهما. و لكن و حتى في هذه الحال، و على الرغم من عدم وضوح المعنى، أو ربما انعدامه (في بعض الأحيان)، فإنّ معظم علماء اللسانيات لا يعتبرون هذا مشكلا في حد ذاته. (للمزيد من النقاش حول الموضوع، انظر Colourless green ideas sleep furiosly .

أما من وجهة نظر البراگماتيون Pragmatics، فإنه يحبّذ الوصول إلى الترجمة الأولى للبيت عوضا عن الترجمة الثانية، و هذا لأنّهم يرون أنه لا معنى للكلمة إلاّ في سياقها، فعلى القارئ أولا تحديد الوظائف النحوية للمفردات بكل دقة، ثم ربط معانيها بسياق الحديث The context.

تعتبر اللغة وسيلة لنقل الأفكار و نقل الحضارات، وهي أداة للاتصال بين الأفراد، وبالتالي فانّ استعمالها غالبا يقتضي وجود سياق محدد للحديث. أما و إن وجد ما يعيق فهم هذاالسياق من الحديث، كتشابه الألفاظ في الشكل أو النطق و اختلافها في المعنى، فإنّ هذا سيؤدي إلى فهم مختلف للكلام ذاته.

و مثال هذا قول الشاعر إسماعيل صبري باشا:

طرقتُ البَابَ حتىَّ كلَّ مـَتـْني        فلمّا كلَّ متْنِي كلَّمتنِي. فقـُلتُ أيا أسما عـيـلَ صـَبري        فقالـَت أيا إسماعيلَ صـَبراً.


. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

رواد الإعراب الإحصائي


انظر أيضاً

المصادر

  1. ^ Eugene Charniak (1997). "Statistical techniques for natural language parsing". AI Magazine. Retrieved 2009-03-11.
  2. ^ Frederick Jelinek (2009). "صفحة الأستاذ". جامعة جونز هوپكنز. Retrieved 2009-03-11.
  3. ^ David M. Magerman (2009). "صفحة الأستاذ". جامعة ستانفورد. Retrieved 2009-03-11.
  4. ^ James Curran (2009). "صفحة الأستاذ". جامعة سيدني. Retrieved 2009-03-11.
  5. ^ Michael Collins (2009). "صفحة الأستاذ". معهد مساتشوستس للتقنية. Retrieved 2009-03-11.
  6. ^ Joshua Goodman (2009). "صفحة الأستاذ". ميكروسوفت. Retrieved 2009-03-11.