نظم التعرف على الصوت

(تم التحويل من نظام التعرف على الصوت)

نظم التعرف على الصوت.. لتصفح الإنترنت الجوال

تزداد إتقانا وتنوعا


. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

خدمة گوگل للتعرف على الصوت

خدمة جوجل للتعرف على الصوت

الإنترنت يقدم الكثير من الفوائد للأشخاص الذين يتصفحونه عن طريق جهاز الكومبيوتر. إلا أن البحث عن الكنوز المختفية في الفضاء المعلوماتي باستخدام لوحات مفاتيح الهواتف الجوالة، أو تلك التي تعمل باللمس، هو أمر في غاية التحدي. وهنا يأتي دور الصوت وتقنيات التعرف عليه، في تسهيل البحث على الشبكة بالأجهزة الجوالة. وكنت أقوم باختبار الخدمات المقدمة من «غوغل» و«ياهو» والخدمات الجديدة التي ظهرت أخيرا، مثل «تشاتشا» ChaCha و«فلينغو» Vlingo التي تسمح جميعها بالبحث عن المعلومات بمجرد طرح السؤال بصوت عال.


أسئلة وإجابات

  • وقد تتساءل ما إذا كانت رحلتك الجوية ستقلع في موعدها المحدد؟ وماذا سيكون عليه الطقس لدى وصولك إلى وجهتك؟ أو تريد معرفة المكان الذي ستتناول فيه عشاءك، أو أقرب مقهى إلى فندقك؟ أو ما هي أكثر السيارات أمنا على الطرقات؟ أو ما هو الصفر المطلق ؟

لقد قدمت هذه الأسئلة مع غيرها لاختبار هذه الخدمات. وجاءت الأجوبة بأساليب مختلفة، فمع «غوغل» هناك وصلات ربط تقودك إلى صفحات على الانترنت. ومع «تشاتشا» التي هي المفضلة لدي، فإنها تعتمد على البشر لتوفير الإجابات، إذ يقوم دليل من أدلاء الشركة بتصفح الشبكة نيابة عنك لإرسال الأجوبة نصيا إليك خلال دقائق قليلة.

والبحث الجوال عن طريق الصوت عبر الأجهزة الجوالة ليس بالأمر الجديد، لكنه أخذ يتطور بسرعة، وفي بعض الحالات فإنه يستغل المعلومات الخاصة بالموقع ذاته. وفي حالات أخرى يمكن دمج البحث بواسطة الصوت مع القدرات الأخرى، ربما عن طريق طلب بعض الخرائط.

نظم للتعرف على النطق لمساعدة المعوقين على التواصل مع النظم الالكترونية (أم سي تي)


أما البحث بواسطة الصوت في «غوغل» فقد وصل لتوه إلى هاتف «تي-موبايل أندرويد جي 1» كجزء من طرح مجموعة من البرمجيات الرئيسية الجديدة. وهنالك نسخة منها سلفا في هاتف «آي فون». وقبل أسبوعين قامت «ياهو» بتوسيع خدمات بحثها «وان سيرتش» عن طريق الصوت، زيادة على المميزات الأخرى التي تتصف بها بعض هواتف «نوكيا» و«بلاك بيريز»، وذلك عن طريق إضافة هذه الميزة الجديدة إلى بعض هواتف «ويندوز» الجوالة. وفي الواقع تعمل بعض عمليات البحث بالصوت فقط على بعض الأجهزة المحددة، في حين تعمل «تشاتشا» على أغلبيتها.

ولا تخلو جميع الخدمات من الأخطاء، ونصف المعركة تنحصر في التعرف على السؤال، خاصة في ما يتعلق بنبرة الصوت، أو اللهجة، أو الضجيج الذي يحيط بالمكان، أو في ما يتعلق بالتغطية الجوالة ذاتها. وهذه جميعها لها تأثيرها ووقعها الكبير. وغالبا ما يكون القصر والإيجاز كافيا. إذ يكفي أن تقول «الطقس، أسبن» (مدينة في أميركا)، أو «الخطوط الجوية الأميركية الرحلة 972» لتحصل على النشرة الجوية، أو المستجدات الخاصة بهذه الرحلة.


خدمات متنوعة

  • وعلى افتراض أن السؤال كان مفهوما، فإنك تتوقع إجابات، أو نتائج مفيدة وسريعة وذات معنى. لكن تجربتي كانت بين بين، وإليكم التفاصيل:

في ما يتعلق بخدمة «تشاتشا» التي يفضلها الجميع فقد يحلو لك أن تسأل أي شيء، وغالبا ما تحصل على الجواب الصحيح. ما الذي يملك سعرات حرارية أكثر، البازلاء أو الجزر؟ (الجواب البازلاء). وهكذا يمكن أن تتصل بـ«تشاتشا» من أي هاتف جوال قادر على إرسال الرسائل النصية. واستخدمت لهذه الغاية هاتف «جي 1» و«آي فون». وهناك حد أقصى لا ينبغي تجاوزه، وهو 20 اتصالا استفهاميا في الشهر. و«تشاتشا» هي خدمة مجانية على الرغم من أن رسوم الرسائل النصية العادية تكون مطبقة. وتتضمن الأجوبة النصية بعض الإعلانات. وقد تنتظر نحو خمس دقائق لتحصل على الجواب، وإن كانت فترة الدقيقتين هي الغالبة. ومع وجود الأدلة من البشر الذين يربو عددهم على الـ55 ألفا، يكون احتمال فهم سؤالك واستيعابه أكثر احتمالا. وعلى الرغم من أن نظام التعرف على الأصوات في «تشاتشا» تصور أنني أسأل عن التسجيلات والنقاط الأخيرة للاعب البيسبول يوغي بيرز، إلا أنه رد علي بالتسجيلات والنقاط التي سجلها اللاعب بيرا وليس بيرز. وهكذا دواليك. فإن سألنا عن موعد آخر قطار من نيويورك إلى واشنطن، فقد يأتيك الجواب بين نيويورك وورثينغتون، بدلا من واشنطن. فالبشر يخطئون أيضا. وقد يحصل أحيانا أن يأتيك نص يطلب منك توضيحات أكثر لسؤالك، أو إضافة المزيد من التفاصيل عليه لتبديد بعض الغموض. أما ما يخص خدمة «غوغل» فقد اختبرت البحث بالصوت على هاتف «آي فون» و«جي 1». وفي الأخير يمكن النقر على أيقونة ميكروفون صغيرة، وبالتالي الشروع بالكلام. أما في «آي فون» فيكفي فقط تقريب الهاتف من أذنك وانتظار إشارة صوتية خافتة، قبل الشروع بالكلام. وبكلتا الطريقتين لا يتوجب عليك النقر، أو القيام بأي شيء خاص لدى التوقف عن الكلام. وفي غالبية الأوقات قدمت «غوغل» نتائج ذات معنى لدى سماعها السؤال بشكل صحيح. ولكن في كلا الجهازين كان التعرف على الأصوات ضعيفا، فقد خلط بين الألفاظ القريبة من بعضها البعض لتأتي الأجوبة متباينة طبعا. وعلى صعيد خدمة «فلينغو» فقد اختبرت تطبيقا مجانيا لها على هاتف «آي فون». إذ يتوجب البدء بالنقر على زر للشروع بالكلام، والنقر عليه ثانية لدى الانتهاء منه. وتستخدم «فلينغو» و«غوغل» أو «ياهو» كمحرك بحث وفقا للذي تفضله. وهي تقوم بأكثر من عمليات البحث، إذ يمكن استخدامها لتعديل ما يخصك على «فيس بوك»، أو «تويتر» عن طريق الصوت. والجزء المتعلق منه بالتعرف على الأصوات كان جيدا، لكنه تعرف على «الرئيس الـ32 للولايات المتحدة» تعرف عليه على أنه «رئيس للولايات المتحدة لمدة 30 ثانية». غير أنه من حسن الحظ فإن خدمة «فلينغو» أدركت محدودياتها، إذ كان لي الخيار لكي أطبع «هل تقصد الرئيس الـ32 للولايات المتحدة؟». وفي ما يخص خدمة «ياهو» «وان سيرتش»، فإن «فلينغو» توفر لها التقنية الأساسية، مع تقنية التعرف على الأصوات. وكان علي في هاتف «بيرل» الكبس على زر والاستمرار بذلك على هذه الحالة طوال الوقت الذي كنت أملي فيه السؤال. بيد أن تقنية التعرف على الصوت كانت جيدة هنا، وتقوم «ياهو» بعمل جيد في تقديم الأجوبة في فئات ومجموعات متقاربة. وفي ما يتعلق بسؤالي عن أفضل سيارة على صعيد الأمان قادتني وصلات الربط إلى «ويكيبيديا»، التي أشارت الأخيرة علي بسيارة من طراز «فولفو». وتقدم «ياهو» مع أجوبتها التي يعدها الأشخاص، أسماء المواقع والصور والآراء والتعليقات أيضا. لكن سؤالي المتعلق بالطقس في أسبن جاء بردود لمواقع لا معنى لها، على الرغم من نيتي الحصول فقط على نشرة جوية سريعة في تلك المدينة. وخلافا لـ«فلينغو» فلم تقدم «وان سيرتش» بديلا لجوابها الذي ارتكبت فيه الخطأ ذاته المتعلق برئيس الولايات المتحدة.

المصادر

المراجع

الروابط الخارجية


  • خدمة «يو إس أيه توداي»
الكلمات الدالة: