ترجمة آلية

جزء من سلسلة مقالات عن
الترجمة
أنواع الترجمة
تقنيات الترجمة
مفاهيم ذات صلة

الترجمة الآلية Machine translation، أو MT (يجب عدم الخلط بينها وبين الترجمة بمساعدة الحاسوب، الترجمة بمساعدة الآلات MAHT والترجمة التفاعلية) هي فرع من فروع اللسانيات الحاسوبية وتتناول برامج الحاسب لترجمة نص أو خطاب من لغة إلى أخرى وتقوم الترجمة الآلية بمستوياتها الأساسية باستبدال بسيط لكلمات بلغة معينة إلى لغة أخرى.

تتوفر مجموعة من التقنيات التي يمكن استخدامها لترجمة النصوص الأكثر تعقيداً، مما يتيح الفرصة لمعالجة الاختلافات على نحو أفضل. وذلك عن طريق التصنيف اللغوي وتمييز العبارات وترجمة التعابير، فضلا عن عزل الحلات الشاذة.

كثيرا ما تسمح الترجمة الآلية حاليا بالتصنيف بحسب المجال أو المهنة (مثل تقارير الطقس) — مما يحسن الناتج عن طريق الحد من نطاق البدائل المتاحة. وتعتبر هذه التقنية فعالة بشكل خاص في المجالات التي تستخدم لغة رسمية أو بيانية. ويتبع ذلك أن الترجمة الآلية للوثائق القانونية والحكومية تكون أفضل منها للمحادثات والنصوص الأقل رسمية.

ويمكن تحسين نوعية الناتج من خلال التدخل البشري. مثلاً، باستطاعة بعض البرامج الترجمة بدقة أكبر إذا حدد المستخدم دون لبس الأسماء الموجودة بالنص. وبمساعدة هذه التقنيات، أثبتت الترجمة أنها ناجحة حين تساعد المترجم، ومن الممكن أن تنتج في بعض الأحوال نتائج يمكن استخدامها "كما هي". لكن برامج الترجمة الحالية ليست قادرة على الترجمة بنفس الجودة التي يترجم بها المترجم البشري وخاصة عندما تكون اللغة المستخدمة غير رسمية.


. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

التاريخ

بدأ تاريخ الترجمة الآلية في الخمسينات، بعد الحرب العالميّة الثانية. تضمنت تجربة جورج تاون في عام 1954 ستون جملة تُرجِمت كلها آلياً من اللغة الروسيّة إلى الإنجليزية. كما لاقت التجربة نجاحاً هائلاً, وتمويلاً مالياً لأبحاث الترجمة الآليّة. إدّعى المبتكرون أنّ مشكلة الترجمة الآلية ستُحلّ خلال ثلاث إلى خمس سنوات.

ولكن كان التطوّر الحقيقي أبطأ بكثيرأ وبعد أن توصل تقرير ألپاك (ALPAC) في عام 1966 إلى أنّ بحث العشر السنوات قد خيّب الآمال، انخفض التمويل بدرجة كبيرة. ومع آواخر الثمانينيّات، زادت القوة الحاسوبية، وأصبح الحاسب أقل تكلفة مما أدّى إلى اهتماماً ظاهراً في النّماذج الإحصائية للتّرجمة الآليّة.

اقترحَ أ.د. بووث في عام 1946 م فكرة استخدام الحواسيب الرّقميّة لترجمة اللغات الإنسانية. وفي عام 1954 أثبتت التجربة في مبادئ الترجمة من الإنجليزية إلى الفرنسية على أجهزة أپيكسي (APEXC) في كلية بيركبيك بجامعة لندن أنّ تجربة جورج تاون لم تكن أوّل تطبيق في هذا المجال.


عملية الترجمة

يمكن أن تُوصف عملية الترجمة البشرية على أنها:

  1. فك التشفير اللغوى من النص الأصلى ؛
  2. إعادة تشفير هذا معنى في اللغة المستهدفة.

وراء هذا الإجراء البسيط ظاهريا تكمن معقدة الإدراكية و فك شفرة المعنى الوارد في النص المصدر في مجمله ، المترجم يجب أن يفسر ويحلل جميع سمات النص ، وهي عملية تتطلب معرفة متعمقة لقواعد ، و مدلول الكلمات اللغوية و التعابير .. الخ. في اللغة الأصلية و الثقافة للمتكلمين بها. المترجم يحتاج , إلى معرفة متعمقة بالمثل إلى إعادة تشفير المعنى في اللغة المستهدفة. وهنا يكمن التحدي في الترجمة الآلية : كيف يمكن أن برنامج الحاسوب سوف "يغهم " النص كما يفهمه الشخص , و أنه سوف "يخلق" نصا جديدا في اللغة المستهدفة و التى سوف تبدوا كما لو كانت كتبت من قبل إنسان (النص المترجم). هذه المشكلة يمكن تناولها بعدد من الطرق.

النهج

تخطيط هرمي يظهر المقارنة أعماق الوسيط التمثيل، الترجمة الآلية بين اللغات في ذروتها ، ثم الترجمة بالنقل، ثم الترجمة المباشرة.

في الترجمة الآلية يمكن استخدام طريقة تستند إلى القواعد اللغوية، مما يعني أن تترجم الكلمات بطريقة لغوية وأنسب الكلمات (المتكلمة شفويا) وهي كلمات اللغة المستهدفة، سوف تحل محل تلك الكلمات من اللغة المصدر. فإنه كثيرا ما يقال أن نجاح الترجمة الآلية تتطلب أن مشكلة فهم اللغة الطبيعية يجب حلها أولا.

عموما، يقوم على قواعد وأساليب تحليل النص، وعادة ما يتم خلق وسيط، وتمثيل رمزي، والذي منه سوف يخلق النص في اللغة المستهدفة وفقا لطبيعة الوسيط المتمثل في النص المؤقت، هذا النهج يوصف بأنهالترجمة الآلية بين اللغات أو الترجمة الآلية المعتمدة على النقل. وتتطلب هذه الأساليب على نطاق واسع قواميس مع مورفولوجينحوي، والدلالية والمعلومات، ومجموعات كبيرة من القواعد.

وحيثما تتوافر البيانات الكافية، فإن برامج الترجمة الآلية، غالبا ما تعمل بطريقة حسنة بالنسبة للمتكلم باللغة الأم للغة معينة للحصول على المعنى التقريبي، لما هو مكتوب، لمتكلم لغة أم أخرى. الصعوبة هي الحصول على بيانات كافية، من النوعية الصحيحة، كى تدعم الأسلوب الصحيح. فمثلا، مجموعة الكبيرة متعددة اللغات من البيانات الأساليب الإحصائية اللازمة للعمل وليس من الضروري بالنسبة لقواعد اللغة القائمة وأساليب العمل. ولكن بعد ذلك، نحن بحاجة الى قواعد اللغة وأساليب مترجمين مهرة على علم بالتصاميم اللغوية لتصميم قواعد اللغة التي يستخدمونها، وللترجمة بين لغات شديدة التقارب، فإن تقنية تعرف الترجمة الآلية ذات الأنتقال الضحل يمكن إستخدامها .

الأسلوب القائم على القواعد

القواعدالقائمة على الترجمة الآلية وتشمل نقل النموذج القائم على الترجمة الآلية ، واللغات والترجمة الآلية المشتملة على قاموس الترجمة الآلية القائمة على النماذج.


ترجمة آلية معتمدة على النقل

اللغة البينية

الترجمة الآلية المعتمدة على التداخل اللغوي هي مثال على طريقة الترجمة الآلية المعتمدة على القواعد. في هذه الطريقة يحول النص المصدري أي الذي تجب ترجمته إلى لغة بينية أي طريقة تمثيل مستقلة عن اللغة الهدف ولغة المصدر. ومن ثم يتم تشكيل اللغة المستهدفة من اللغة البينية.

معتمدة على القاموس

يمكن للترجمة الآلية أن تعمد على مدخلات القاموس، ويعني ذلك أن الكلمات سوف تترجم كما ترجمت في القاموس.


احصائية

تحاول الترجمة الآلية الإحصائية توليد الترجمة باستخدام طرق إحصائية بالاعتماد على المكانز ثنائية اللغة كمكنز الهانسرد الكندي والسجل البرلماني الكندي ذو اللغتين الإنگليزية والفرنسية وسجل البرلمان الأوروبي. في المكان الذي توجد فيه هكذا مكانز يمكن أن تحقق نتائج مذهلة في ترجمة نصوص من نفس النوع، لكن هكذا مكانز ما تزال نادرة جداً. أول برنامج ترجمة آلية إحصائية كان كانديد CANDIDE إنتاج شركة آي بي إم. استخدمت گوگل سيستران SYSTRAN لعدة سنوات، لكنها انتقلت إلى طريقة الترجمة الإحصائية في أكتوبر 2007، وقامواً مؤخراً بتطوير قدراتهم في الترجمة عن طريق إدخال ما يقارب الـ 200 مليار كلمة من مواد الأمم المتحدة لتدريب نظامهم، وقد تحسنت دقة الترجمة[1]

الترجمة المعتمدة على الأمثلة

غالباً ما تحدد خواص طريقة الترجمة المعتمدة على الأمثلة (EBMT) باستخدامها لمكنز ثنائي اللغة أثناء التشغيل كقاعدة معرفتها الأساسية. وهي بشكل أساسي ترجمة بالقياس ويمكن اعتبارها تطبيقاً لطريقة الحكم بالمقارنة في التعلم الآلي.

الترجمة الآلية المهجنة

ترفع الترجمة الآلية المهجنة (HMT) قوة أنماط الترجة الإحصائية والترجمة المعتمدة على القواعد. العديد من شركات الترجمة الآلية (مثل آسيا أون لاين Asia online وسِستران Systran) تدعي أنها تستخدم نموذجاً مهجناً باستخدام الطريقتين الإحصائية والمعتمدة على القواعد. ويختلف النموذج بعدد من الطرق:

  • قواعد تعالج فيما بعد بالأحصائيات: تتم الترجمات باستخدام محرك يعتمد على القواعد، ومن ثم تستخدم الإحصائيات في محاولة لتعديل أو تصحيح خرج محرك القواعد.
  • إحصائية موجهة بالقواعد: تستخدم القواعد في المعالجة المسبقة للمعطيات في محاولة لتوجيه المحرك الإحصائي بشكل أفضل. وتستخدم القواعد أيضاً في معالجة لاحقة للخرج الإحصائي لتحقيق وظائف كالتسوية normalization. وإن لدى هذا النموذج قوة ومرونة وتحكماً أكثر بكثير عند الترجمة.

قضايا هامة

التوضيح

يهتم موضوع توضيح معنى الكلمة بإيجاد ترجمة مناسبة حين يكون لكلمة ما أكثر من معنى. تم طرح المشكة لأول مرة في الخمسينات من قبل يهوشوا بار هيلِل Yehoshua Bar-Hillel [2] وقد أوضح أنه لا يمكن لآلة أن تميز بين معنيين مختلفين لكلمة من دون "موسوعة عاليمة".[3] يوجد اليوم كم هائل من الطرق للتغلب على هذه المشكلة، ويمكن تقريباً تقسيمها إلى طرق "سطحية" وطرق "عميقة". و لا تفترض الطرق السطحية أية معرفة للنص. فهي ببساطة تطبق طرقا إحصائية على الكلمات التي تحيط بالكلمة غامضة المعنى. و تفترض الطرق العميقة معرفة وافية للكلمة. وحتى الآن، ;كانت الطرق السطحية أكثر نجاحاً

The late Claude Piron, a long-time translator for the United Nations and the World Health Organization, wrote that machine translation, at its best, automates the easier part of a translator's job; the harder and more time-consuming part usually involves doing extensive research to resolve ambiguities in the source text, which the grammatical and lexical exigencies of the target language require to be resolved:

Why does a translator need a whole workday to translate five pages, and not an hour or two? ..... About 90% of an average text corresponds to these simple conditions. But unfortunately, there's the other 10%. It's that part that requires six [more] hours of work. There are the ambiguities one has to resolve. For instance, the author of the source text, an Australian physician, cited the example of an epidemic which was declared during World War II in a "Japanese prisoner of war camp". Was he talking about an American camp with Japanese prisoners or a Japanese camp with American prisoners? The English has two senses. It's necessary therefore to do research, maybe to the extent of a phone call to Australia. [4]

The ideal deep approach would require the translation software to do all the research necessary for this kind of disambiguation on its own; but this would require a higher degree of AI than has yet been attained. A shallow approach which simply guessed at the sense of the ambiguous English phrase that Piron mentions (based, perhaps, on which kind of prisoner-of-war camp is more often mentioned in a given corpus) would have a reasonable chance of guessing wrong fairly often. A shallow approach that involves "ask the user about each ambiguity" would, by Piron's estimate, only automate about 25% of a professional translator's job, leaving the harder 75% still to be done by a human.


تسمية الكيانات

Related to named entity recognition in information extraction.


. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

التطبيقات

يوجد عدة برامج لترجمة اللغات الطبيعية، كثير منها أونلاين، مثل: أنوساركا

يوجد عدد من برامج الترجمة الآلية المجانية مثل ForeignDeskومتعدد المنصات مثل Okapi Framework[6]، Free Arabic Translator وOmegaT+.

While no system provides the holy grail of fully automatic high-quality machine translation of unrestricted text, many fully automated systems produce reasonable output.[7][8][9] The quality of machine translation is substantially improved if the domain is restricted and controlled.[10]

Despite their inherent limitations, MT programs are used around the world. Probably the largest institutional user is the European Commission. The MOLTO project, for example, coordinated by the University of Gothenburg, received more than 2.375 million euros project support from the EU to create a reliable translation tool that covers a majority of the EU languages.[17]

Google has claimed that promising results were obtained using a proprietary statistical machine translation engine.[11] The statistical translation engine used in the Google language tools for Arabic <-> English and Chinese <-> English had an overall score of 0.4281 over the runner-up IBM's BLEU-4 score of 0.3954 (Summer 2006) in tests conducted by the National Institute for Standards and Technology.[12][13][14]

With the recent focus on terrorism, the military sources in the United States have been investing significant amounts of money in natural language engineering. In-Q-Tel[15] (a venture capital fund, largely funded by the US Intelligence Community, to stimulate new technologies through private sector entrepreneurs) brought up companies like Language Weaver. Currently the military community is interested in translation and processing of languages like Arabic, Pashto, and Dari.[بحاجة لمصدر] The Information Processing Technology Office in DARPA hosts programs like TIDES and Babylon Translator. US Air Force has awarded a $1 million contract to develop a language translation technology.[16]

The notable rise of social networking on the web in recent years has created yet another niche for the application of machine translation software – in utilities such as Facebook, or instant messaging clients such as Skype, GoogleTalk, MSN Messenger, etc. – allowing users speaking different languages to communicate with each other. Machine translation applications have also been released for most mobile devices, including mobile telephones, pocket PCs, PDAs, etc. Due to their portability, such instruments have come to be designated as mobile translation tools enabling mobile business networking between partners speaking different languages, or facilitating both foreign language learning and unaccompanied traveling to foreign countries without the need of the intermediation of a human translator.

التقييم

هناك وسائل مختلفة لتقييم أداء أنظمة الترجمة الآلية. أقدمها هو استخدام حكم الإنسان لتقييم جودة الترجمة. وفي الآونة الأخيرة، اشتملت تلك الوسائل على بعض أساليب التقييم الآلية:

  • بلو (BLEU)
  • نيست (NIST)
  • ميتيور (METEOR)

لكن الاعتماد كلياً على الترجمة الآلية يغفل حقيقة أن الاتصال في لغة الإنسان هو جزء لا يتجزأ من السياق، وأن الإنسان هو القادر على فهم سياق النص الأصلي على نحو كاف. كما أن الترجمة التي يستخدم فيها القدرات البشرية فقط هي عرضة للخطأ. لذلك وحتى نضمن أن تكون الترجمة الآلية عالية الجودة ومفيدة للإنسان، لابد من أن يقوم المترجم "الإنسان" بمراجعتها وتصحيحها.

ومع ذلك فقد تم التأكد من أنه في بعض التطبيقات، على سبيل المثال في مواصفات المنتجات المكتوبة باللغة المتحكم بها، ينتج نظام الترجمة الآلية القائم على أساس استخدام القاموس ، في بيئه إنتاج، ترجمة متقنة لا تحتاج إلى أي تدخل بشري.

انظر أيضاً

هوامش

المصادر

  • Cohen, J.M., "Translation", Encyclopedia Americana, 1986, vol. 27, pp. 12–15.
  • Hutchins, W. John (1992). An Introduction to Machine Translation. London: Academic Press. ISBN 0-12-362830-X. {{cite book}}: Unknown parameter |coauthors= ignored (|author= suggested) (help)
  • Claude Piron, Le défi des langues — Du gâchis au bon sens (The Language Challenge: From Chaos to Common Sense), Paris, L'Harmattan, 1994.


. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

وصلات خارجية