أنظمة الحوار
نظام الحوار dialogue system، أو عميل المحادثة (CA)، عبارة عن نظام حاسب يهدف إلى التحدث مع الإنسان. تستخدم أنظمة الحوار واحداً أو أكثر من النصوص والكلام والرسومات والحركات اللمسية والإيماءات وأنماط أخرى للاتصال على قناة الإدخال والإخراج.
لم يتم تحديد عناصر نظام الحوار[بحاجة لمصدر]، ومع ذلك فهو يختلف عن روبوت الدردشة.[1] تشارك وزارد GUI في نوع من الحوار، لكنها تتضمن عدداً قليلاً جداً من مكونات نظام الحوار الشائعة، وتكون حالة الحوار سطحية بسيطة.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
خلفية
بعد أنظمة الحوار التي تعتمد فقط على معالجة النصوص المكتوبة بدءاً من أوائل الستينيات،[2] تم إصدار أول نظام حوار متحدث من قبل مشروع دارپا في الولايات المتحدة الأمريكية في عام 1977.[3] بعد انتهاء هذا المشروع الذي استمر 5 سنوات، أصدرت بعض المشاريع الأوروبية أول نظام حوار قادر على التحدث بعدة لغات (أيضاً الفرنسية والألمانية والإيطالية).[4]تم استخدام هذه الأنظمة الأولى في صناعة الاتصالات لتوفير خدمات الهاتف المتنوعة في مجالات محددة، على سبيل المثال جدول الأعمال الآلي وخدمة طاولات القطار.
المكونات
ما هي مجموعات المكونات التي يتم تضمينها في نظام الحوار، وكيف تختلف هذه المكونات في المسؤوليات من نظام إلى نظام. يعد مدير الحوار العنصر الأساسي في أي نظام حوار، وهو مكون يدير حالة الحوار واستراتيجية الحوار. تحتوي دورة النشاط النموذجية في نظام الحوار على المراحل التالية:[5]
- يتحدث المستخدم، ويتم تحويل الإدخال إلى نص عادي بواسطة أداة التعرف / وحدة فك التشفير الخاصة بالنظام، والتي قد تتضمن:
- يتم تحليل النص بواسطة وحدة فهم اللغة الطبيعية (NLU)، والتي قد تتضمن:
- تحديد الاسم الصحيح
- وضع علامات على جزء من الكلام
- المفسر النحوي / الدلالي
- يتم تحليل المعلومات الدلالية بواسطة مدير الحوار، مما يحافظ على تاريخ الحوار وحالته ويقوم بإدارة التدفق العام للمحادثة
- عادةً، يتصل مدير الحوار بواحد أو أكثر من إدارات المهام، الذين لديهم معرفة بمجال المهمة المحدد.
- ينتج مدير الحوار مخرجات باستخدام مولد الإخراج، والذي قد يتضمن:
- أخيراً، يتم تقديم الإخراج باستخدام مقدم الإخراج، والذي قد يتضمن:
- محرك نص إلى كلام (TTS)
- رأس متحدث
- روبوت أو صورة رمزية
تحتوي أنظمة الحوار التي تعتمد على واجهة نصية فقط (مثل الدردشة النصية) على مراحل 2–5 فقط.
أنواع الأنظمة
تندرج أنظمة الحوار في الفئات التالية المدرجة هنا على طول بضعة أبعاد. تتداخل العديد من الفئات وقد لا يتم تحديد الفروق بشكل جيد.
- حسب طريقة
- حسب الجهاز
- الأنظمة القائمة على الهاتف
- أنظمة PDA
- أنظمة داخل السيارة
- أنظمة الروبوت
- أنظمة سطح المكتب / الحاسب المحمول
- المحلية
- في أنظمة - المتصفح
- في - الآلة الافتراضية
- في - البيئة الافتراضية
- الروبوتات
- حسب التصميم
- الاستناد إلى الأوامر
- مقادة بالقائمة
- اللغة الطبيعية
- كتابات الكلام
- حسب البداية
- بداية النظام
- بداية المستخدم
- البداية المختلطة
Natural dialogue systems
قالب:Undue weight section "نظام الحوار الطبيعي هو شكل من أشكال نظام الحوار الذي يحاول تحسين قابلية الاستخدام ورضا المستخدم من خلال محاكاة السلوك البشري" [6] (بيرج، 2014). يتناول ميزات الحوار بين الإنسان (مثل الحوارات الفرعية وتغييرات الموضوعات) ويهدف إلى دمجها في أنظمة الحوار للتفاعل بين الإنسان والآلة. في كثير من الأحيان، يتطلب أنظمة الحوار (المنطوقة) من المستخدم التكيف مع النظام لأن النظام قادر فقط على فهم مفردات محدودة للغاية، وغير قادر على الرد على تغييرات الموضوعات، ولا يسمح للمستخدم للتأثير على تدفق الحوار. البداية المختلطة هي وسيلة لتمكين المستخدم من أن يكون له دور نشط في الحوار بدلاً من إجابة الأسئلة فقط. ومع ذلك، فإن مجرد وجود مبادرة مختلطة لا يكفي لتصنيفها على أنها نظام حوار طبيعي. وتشمل الجوانب الهامة الأخرى:[6]
- تكيف النظام
- دعم التأكيد الضمني
- استخدام أسئلة التحقق
- احتمالات تصحيح المعلومات التي تم تقديمها بالفعل
- المبالغة في المعلوماتية (التزويد بالمعلومات أكثر مما تم طلبه)
- دعم الرفض
- فهم المراجع من خلال تحليل الخطاب والجناس
- توليد اللغة الطبيعية لمنع المطالبات الرتيبة والمتكررة
- صياغة تكيفية ومراعية للوضع
- السلوك الاجتماعي (التحية ، نفس المستوى من شكليات المستخدم، الأدب)
- جودة التعرف على الكلام والتوليف
على الرغم من أن معظم هذه الجوانب هي قضايا تتعلق بالعديد من المشاريع البحثية المختلفة، إلا أن هناك نقصاً في الأدوات التي تدعم تطوير أنظمة الحوار التي تتناول هذه الموضوعات.[7] بصرف النظر عن VoiceXML الذي يركز على أنظمة الاستجابة الصوتية التفاعلية وهو الأساس للعديد من أنظمة الحوار المنطوقة في الصناعة (تطبيقات دعم العملاء) و AIML المشهورة بـ ALICE chatbot، وهي تدمج السمات اللغوية مثل أعمال الحوار أو توليد اللغة. لذلك، يعطي NADIA (نموذج بحث أولي) فكرة عن كيفية سد هذه الفجوة ويجمع بين بعض الجوانب المذكورة أعلاه مثل توليد اللغة الطبيعية والصياغة التكيفية والحوارات الفرعية.
الأداء
يقيس بعض المؤلفين أداء نظام الحوار من حيث النسبة المئوية للجمل الصحيحة تماماً، من خلال مقارنة نموذج الجمل (يُطلق على هذا المقياس اسم دقة جملة المفهوم[8] أو فهم الجمل[4]).
التطبيقات
يمكن أن تدعم أنظمة الحوار مجموعة واسعة من التطبيقات في مؤسسات الأعمال والتعليم والحكومة والرعاية الصحية والترفيه.[9] على سبيل المثال:
- الرد على أسئلة العملاء حول المنتجات والخدمات عبر موقع الشركة على الوب أو بوابة الشبكة الداخلية
- قاعدة معرفة وكيل خدمة العملاء: يسمح للوكلاء بكتابة سؤال العميل وتوجيههم بالرد
- البيع الموجه: تسهيل المعاملات من خلال تقديم إجابات وإرشادات في عملية البيع، خاصة بالنسبة للمنتجات المعقدة التي يتم بيعها للعملاء المبتدئين
- مكتب المساعدة: الرد على أسئلة الموظفين الداخلية، على سبيل المثال، الرد على أسئلة الموارد البشرية
- التنقل في موقع الوب: توجيه العملاء إلى الأجزاء ذات الصلة من مواقع الوب المعقدة - بواب موقع الوب
- الدعم الفني: الاستجابة للمشكلات الفنية، مثل تشخيص مشكلة بمنتج أو جهاز
- الخدمة الشخصية: يمكن لوكلاء المحادثة الاستفادة من قواعد البيانات الداخلية والخارجية لتخصيص التفاعلات، مثل الإجابة على الأسئلة حول أرصدة الحسابات، وتوفير معلومات الحافظة، وتقديم النشر المتكرر أو معلومات العضوية، على سبيل المثال
- التدريب أو التعليم: يمكنهم تقديم مشورة لحل المشكلات أثناء تعلم المستخدم
- تستخدم أنظمة الحوار البسيط على نطاق واسع لتقليل عبء العمل البشري في مراكز الاتصال. في هذا التطبيق وغيره من تطبيقات المهاتفة الصناعية، تُعرف الوظيفة التي توفرها أنظمة الحوار باسم الاستجابة الصوتية التفاعلية أو IVR.
في بعض الحالات، يمكن لوكلاء المحادثة التفاعل مع المستخدمين باستخدام أحرف اصطناعية. ويشار بعد ذلك إلى هؤلاء العملاء باسم الوكلاء المتجسدين.
مجموعات الأدوات والبنى
مسح للأطر واللغات والتقنيات الحالية لتحديد أنظمة الحوار.
الاسم & الوصلات | نوع النظام | الوصف | التبعيات | البيئات | التعليقات |
---|---|---|---|---|---|
AIML | لغة Chatterbot | XML اللهجة لإنشاء وكلاء برامج لغة طبيعية | رتشارد والاس، شركة پاندورابوتس | ||
ChatScript | لغة Chatterbot | لغة / محرك لإنشاء وكلاء برامج لغة طبيعية | بروس ويلكوكس | ||
CSLU Toolkit |
بيئة النماذج الأولية لواجهة الكلام القائمة على الحالة | مدرسة OGI للعلوم والهندسة إم. ماك تير رون كول |
publications من 1999. | ||
NLUI Server | مجموعة أدوات مستقلة عن المجال | إطار كامل متعدد اللغات لبناء أنظمة واجهة مستخدم للغة الطبيعية | LinguaSys | دعم خارج الصندوق لحوارات المبادرات المختلطة | |
أولمپس | إطار كامل لتنفيذ أنظمة الحوار المنطوق | جامعة كارنيگي ميلون | [1] | ||
Nextnova | منصة متعددة الوسائط | منصة لتطوير تطبيقات البرمجيات متعددة الوسائط. استناداً إلى XML لمخطط الحالة (SCXML) | شركة پونڤيا التقنية. | ||
VXML Voice XML |
الحوار المنطوق | لغة تشفير الحوار متعدد الوسائط | تم تطويره في البداية بواسطة AT&T ثم إدارته بواسطة اتحاد صناعي وأخيراً تعيين W3C | مثال | في المقام الأول للاتصالات الهاتفية. |
SALT | لغة توصيف النص | لغة ترميز الحوار متعدد الوسائط | مايكروسوفت | "لم يصل إلى مستوى نضج VoiceXML في عملية المعايير". | |
Quack.com - QXML | بيئة تطوير | تم شراء الشركة من قبل AOL | |||
OpenDial | مجموعة أدوات مستقلة عن المجال | إطار رمزي / إحصائي هجين لأنظمة الحوار المنطوق، تم تنفيذه في جاڤا | جامعة أوسلو | ||
NADIA | محرك الحوار ونمذجة الحوار | إنشاء أنظمة حوارات / حوارات طبيعية. يدعم أعمال الحوار، بداية مختلطة، NLG. تم تنفيذه بلغة جاڤا. | ماركس إم. بيرج | إنشاء ملفات حوار قائمة على XML، ولا حاجة لتحديد القواعد النحوية، تم نشرها من عام 2014 |
انظر أيضاً
المراجع
- ^ Klüwer, Tina. "From chatbots to dialog systems." Conversational agents and natural language interaction: Techniques and Effective Practices. IGI Global, 2011. 1-22.
- ^ McTear, Michael, Zoraida Callejas, and David Griol, The conversational interface: Talking to smart devices, Springer, 2016.
- ^ Giancarlo Pirani (ed), Advanced algorithms and architectures for speech understanding, Vol. 1. Springer Science & Business Media, 2013.
- ^ أ ب Alberto Ciaramella, A prototype performance evaluation report, Sundial workpackage 8000 (1993).
- ^ Jurafsky & Martin (2009), Speech and language processing. Pearson International Edition, ISBN 978-0-13-504196-3, Chapter 24
- ^ أ ب Berg, Markus M. (2014), Modelling of Natural Dialogues in the Context of Speech-based Information and Control Systems, Akademische Verlagsgesellschaft AKA, ISBN 978-3-89838-508-4, http://nbn-resolving.de/urn:nbn:de:gbv:8-diss-167394
- ^ Berg, Markus M. (2015), "NADIA: A Simplified Approach Towards the Development of Natural Dialogue Systems", Natural Language Processing and Information Systems, Lecture Notes in Computer Science, 9103, pp. 144–150, doi: , ISBN 978-3-319-19580-3
- ^ Bangalore, Srinivas, and Michael Johnston. "Robust understanding in multimodal interfaces." Computational Linguistics 35.3 (2009): 345-397.
- ^ Lester, J.; Branting, K.; Mott, B. (2004), "Conversational Agents", The Practical Handbook of Internet Computing, Chapman & Hall
للاستزادة
- Will, Thomas (2007). Creating a Dynamic Speech Dialogue. VDM Verlag Dr. Müller. ISBN 978-3-8364-4990-8.