لغة الترميز القابلة للامتداد

XML (standard)
Extensible Markup Language
Extensible Markup Language (XML) logo.svg
الوضعPublished, W3C recommendation
سنة البدء1996; 28 years ago (1996
أول نشر10 فبراير 1998; منذ 26 سنة (1998-02-10
أحدث نسخة1.1 (2nd ed.)
29 سبتمبر 2006; منذ 18 سنة (2006-09-29
المنظمةWorld Wide Web Consortium (W3C)
المحررونTim Bray, Jean Paoli, Michael Sperberg-McQueen, Eve Maler, François Yergeau, John W. Cowan
المعايير الأساسيةSGML
المعايير ذات الصلةW3C XML Schema
النطاقSerialization
الاختصارXML
الموقع الإلكترونيwww.w3.org/xml
XML (file format)
امتداد اسم الملف.xml
نوع وسائط الإنترنتapplication/xml, text/xml[1]
Uniform Type Identifier (UTI)public.xml
UTI conformationpublic.text
Magic number<?xml
طورهWorld Wide Web Consortium
نوع الصيغةMarkup language
Extended fromSGML
Extended toNumerous languages, including XHTML, RSS, Atom, and KML
Standard
  • 1.0, 5th ed. (26 نوفمبر 2008; منذ 16 سنة (2008-11-26)
  • 1.1, 2nd ed. (16 أغسطس 2006; منذ 18 سنة (2006-08-16)
Open format?Yes

لغة الترميز القابلة للإمتداد (إكس إم إل) هي لغة ترميز عامة لخلق لغات الترميز ذات الغرض الخاصّ، قادرة على وصف العديد من الأنواع المختلفة للبيانات. بمعنى آخر، إكس إم إل هي طريقة لوصف البيانات. ملف إكس إم إل يمكن أن يحتوي البيانات أيضاً، كما في قاعدة البيانات. وهي مجموعة ثانوية مبسطة من لغة الترميز ذات المعيار المعمّم (إس جي إم إل). غرضه الرئيسي أن يسهّل إشتراك البيانات عبر الأنظمة المختلفة، خصوصا الأنظمة الموصلة عن طريق الإنترنت. اللغات المستندة على إكس إم إل (على سبيل المثال، لغة الترميز الجغرافي (جي إم إل)، آر دي إف / إكس إم إل، آر إس إس، أتوم، ماث إم إل، إكس إتش تي إم إل، إس في جي، إكس يو إل، إي أي دي، كليب وميوسيك إكسمل) معرّفة على نحو رسمي، يسمح للبرامج بتعديل وتصديق الوثائق في هذه اللغات بدون علم مسبق بشكلهم المعيّن.

لغة الترميز الموسعة تستخدم في وصف وتخزين وتنظيم البيانات بخلاف لغة ترميز النصوص التشعبية HTML التي تستخدم لكيفية عرض البيانات على المتصفح. وهى مشتقة من لغة SGML وقواعد لغة XML قريبة من HTML وقد اعتمدتها منظمة W3C كلغة ترميز قياسية وظهر الجيل المطور منها وهو XML 2.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

تاريخ

تعدد استعمال إس جي إم إل لعرض المعلومات الدينامي فهم من قبل ناشري الإعلام الرقمي مبكرا في أواخر الثمانينات قبل نهضة الإنترنت. في منتصف التسعينات، بعض مستخدمي إس جي إم إل كسبوا تجربة بالويب العالمي الجديد آنذاك، وإعتقدوا بأنّ إس جي إم إل عرض الحلول لبعض المشاكل التي كانت من المحتمل أن تواجه الويب حينما يتطور. أضاف دان كونولي إس جي إم إل إلى قائمة نشاطات دبليو 3 سي عندما إنضمّ إلى الموظّفين في 1995؛ العمل بدأ في منتصف 1996 عندما طور جون بوساك الدستور وجنّد المتعاونين. بوساك كان حسن العلاقات مع المجموعة الصغيرة من الناس التي كان عندها تجربة في إس جي إم إل والويب. إستلم دعما لجهوده من مايكروسوفت.

إكس إم إل صمّمت بمجموعة عمل عدد أعضاؤها أحد عشر، مدعومة من قبل مجموعة ذات إهتمامات خاصة عدد أعضاؤها 150. النقاش التقني الذي حدث على قائمة العناوين وقضايا المجموعة ذات الإهتمامات الخاصة حل بالإجماع أو، عندما فشل، صوت الأغلبية لمجموعة العمل. سجل القرار جمع من قبل مايكل سبيربيرج مكويين في 4 ديسمبر/كانون الأول 1997. عمل جيمس كلارك كقائد تقني لمجموعة العمل، وساهم خصوصاً في العنصر الفارغ "<empty/>" والاسم "إكس إم إل". الأسماء الأخرى التي كانت قد قدّمت للإعتبار تضمّنت "ماغما" (الهندسة المعمارية الأدنى لتطبيقات الترميز المعمّمة)، "سليم" (اللغة المنظّمة لترميز الإنترنت) و "إم جي إم إل" (لغة الترميز الأدنى المعمّمة). المحرّرون المشاركون للمواصفات كانوا أصلا تيم براي ومايكل سبيربيرج مكويين. في منتصف المشروع قبل براي إرتباطا بالنيتسكيب، مثيراً إحتجاجات صاخبة من مايكروسوفت. براي طلب ترك منصب رئيس التحرير بشكل مؤقت. هذا قاد إلى النزاع الحادّ في مجموعة العمل، وحلّت المشكلة في النهاية بتعيين جين باولي من مايكروسوفت كمحرّر مشارك ثالث.

مجموعة عمل إكس إم إل لم تجتمع وجها لوجه؛ التصميم أنجز بإستعمال مجموعة من البريد الإلكتروني والمؤتمرات الهاتفية إسبوعياً. قرارات التصميم الرئيسية وصلت في عشرون إسبوع من العمل الحادّ بين يوليو/تموز ونوفمبر/تشرين الثّاني من 1996. عمل التصميم الآخر إستمرّ إلى 1997، وإكس إم إل 1.0 أصبح توصية من دبليو 3 سي في فبراير/شباط 10، عام 1998.

إكس إم إل 1.0 أنجز أهداف مجموعة العمل من استخدام الإنترنت، والاستخدام العام، والتوافق مع إس جي إم إل، وتسهيل التطوير لمعالجة البرامج، وتحقيق الحدّ الأدنى من الميزّات الإختيارية، والوضوح، والإيجاز، وسهولة التأليف.

التوضيحات والتغييرات الثانوية جمّعا في الأخطاء المنشورة وبعد ذلك دمجا مع الطبعة الثانية لتوصية إكس إم إل 1.0 في أكتوبر/تشرين الأول 6، عام 2000. الأخطاء اللاحقة دمجت مع الطبعة الثالثة في فبراير/شباط 4، عام 2004.

نشرت أيضا في نفس اليوم (كإكس إم إل 1.0 الطبعة الثالثة) إكس إم إل 1.1، وهو إكس إم إل مغاير يشجّع على المزيد من الإتساق في كيفية التمثيل ويخفّف القيود على الأسماء، والحروف الجائزة. في أغسطس/آب 16 عام 2006، نشر إكس إم إل 1.0 الطبعة الرابعة وإكس إم إل 1.1 الطبعة الثانية لدمج الأخطاء المتراكمة. كلا إكس إم إل 1.0 الطبعة الرابعة وإكس إم إل 1.1 الطبعة الثانية يعتبران نسخ حالية لإكس إم إل.


خصائص

نقاط القوة

بعض ميزّات إكس إم إل التي تجعله مناسباً لنقل البيانات:

  • صيغته الإنسانية والمقروءة بالماكنة بشكل آني.
  • له دعم لنظام الحروف الدولي الموحد، يسمح تقريبا لأيّ معلومات بأيّ لغة إنسانية مكتوبة تتصلان.
  • القدرة على تمثيل تراكيب بيانات علم الحاسبات الأكثر عمومية: السجلات والقوائم والأشجار.
  • صيغة التوثيق الذاتية التي تصف التركيب وأسماء الحقل بالإضافة إلى القيم المعيّنة.
  • النحو الصارم وإعراب المتطلبات اللذان يسمحان لخوارزميات الإعراب الضرورية بالبقاء ثابتة وكفوءة وبسيطة.

إكس إم إل يستعمل أيضا بشدّة كصيغة للتخزين ومعالجة الوثائق، المتصلة بالإنترنت وغير المتّصلة، ويعرض عدّة منافع:

  • الصيغة المتينة القابلة للإثبات منطقيا مستندة على المستويات الدولية.
  • إنّ التركيب المرتبي مناسب لأكثر (لكن ليس كلّ) أنواع الوثائق.
  • يظهر كملفات نصّ عادي، غير مثقل بالرخص أو القيود.
  • كونه مستقل، وهكذا يكون محصّناً نسبيا ضدّ التغييرات في التقنيات.
  • هو وسابقه، الإس جي إم إل، كانا قيد الإستعمال منذ 1986، لذا هناك خبرة شاملة وبرامج متوفرة.

نقاط الضعف

لبعض التطبيقات، إكس إم إل له نقاط الضعف التالية أيضا:

  • التركيب مضجر وعاطل. هذا يمكن أن يؤذي مقروئية الإنسان وكفاءة التطبيق، ويسبب كلفة تخزين أعلى. يمكن أن يجعل إكس إم إل صعباً أيضا للإنطباق في بعض الحالات حينما تكون الموجة محدّدة، مع أن يمكن للضغط أن يخفّض المشكلة في بعض الحالات. هذا صحيح بشكل خاص للتطبيقات المتعددة الأوساط التي تجري على الهواتف الخلوية والبي دي أي التي تريد إستعمال إكس إم إل لوصف الصور والفيديو.
  • يعتبر البعض أن النحو أو التركيب يحتوي على عدد من الميزّات الغامضة وغير الضرورية المولودة من تراث التوافق مع إس جي إم إل.
  • متطلبات الإعراب الأساسية لا تدعم المجموعات المرتبة الواسعة من أنواع البيانات لذا فإن التفسير يتضمّن عمل إضافي أحيانا لكي يعالج البيانات المطلوبة من الوثيقة. ليس هناك بند في إكس إم إل، على سبيل المثال، للتخويل بأنّ "3.14159" عدد عائم النقاط بدلا من سلسلة من سبعة حروف.
  • يستعمل النموذج المرتبي للتمثيل، والذي هو محدد مقارنة مع النموذج العلائقي، لأنه يعطي فقط وجهة نظر ثابتة للمعلومات الفعلية.
  • تخطيط إكس إم إل إلى الأمثلة العلائقية أو أمثلة الأجسام الموجهة متعب في أغلب الأحيان.
  • جادل البعض بأنّ إكس إم إل يمكن أن يستعمل لخزن البيانات فقط إذا كان الملف من الحجم المنخفض لكن هذه في واقع الأمر معطيات فرضيات حقيقية معيّنة حول الهندسة المعمارية، والبيانات، والتطبيق، وقضايا أخرى.
  • سلسلة ضربات المفاتيح لطباعة تعابير إكس إم إل على لوحة مفاتيح قياسية حاسوبية صعبة جدا.

امتدادات XML

  • إكس باث يجعل من الممكن الإشارة إلى الأجزاء الفردية لوثيقة إكس إم إل. هذا يزوّد الوصول العشوائي إلى بيانات إكس إم إل للتقنيات الأخرى، بضمن ذلك إكس إس إل تي، إكس إس إل فو، إكس كويري، وغير ذلك. تعابير إكس باث يمكن أن تشير إلى كلّ أو جزء من النصّ والبيانات والقيم في عناصر إكس إم إل، وخواصه، ومعالجة أوامره، وتعليقاته، وغير ذلك. يمكن أن يدخلوا أسماء العناصر أيضا والخواص. إكس باث يمكن أن يستعمل في كل من إكس إم إل الصحيح وذي الشكل الجيد.
  • إكس كويري وهو حاليا فقط لقراءة البيانات.
  • يمكّن إكس إم إل Namespaces نفس الوثيقة لإحتواء عناصر وخواص الإكس إم إل المأخوذة من المفردات المختلفة، بدون حدوث أيّ اصطدام للتسمية.
  • يعرّف توقيع إكس إم إل قواعد التركيب والمعالجة لخلق التواقيع الرقمية على محتوى إكس إم إل.
  • يعرّف تشفير إكس إم إل قواعد التركيب والمعالجة لتشفير محتوى إكس إم إل.
  • إكس بوينتر هو نظام لعنونة مكوّنات أجهزة إعلام الإنترنت المستندة على إكس إم إل.

إصدارات XML

هناك نسختان حاليتان لإكس إم إل. الأولى، إكس إم إل 1.0، التي عرّفت أوليا في 1998. مرّت بالتنقيحات البسيطة منذ ذلك الحين، بدون أن تعطي عدد لنسخة جديدة، وهي حاليا في طبعتها الرابعة، التي نشرت في أغسطس/آب 16، عام 2006. وهي تطبّق على نحو واسع وما زالت موصّى بها للإستعمال العامّ. الثانية، إكس إم إل 1.1، نشرت أوليا في فبراير/شباط 4، عام 2004، في نفس يوم إكس إم إل 1.0 الطبعة الثالثة، وهي حالياً في طبعتها الثانية، التي نشرت في أغسطس/آب 16، عام 2006. وتحتوي الميزّات التي تنوي جعل إكس إم أسهل للإستعمال لبعض أصناف المستعملين (مبرمجو الحاسبات الكبرى بشكل رئيسي). إكس إم إل 1.1 لم يطبّق بشكل واسع وهو موصّى به للإستعمال فقط بواسطة أولئك الذين يحتاجون ميزّاته الفريدة.

إكس إم إل 1.0 وإكس إم إل 1.1 يختلفان في متطلبات الحروف المستعملة لأسماء العناصر والخواص: يسمح إكس إم إل 1.0 فقط للأحرف المعرّفين في نظام الحروف الدولي الموحد 2.0، الذين يتضمّنون أكثر المخطوطات العالمية، ولكن باستثناء تلك التي أضيفت في نسخ أنظمة الحروف الدولية الموحدة التالية. بين المخطوطات المستثناة المنغولية، والكمبودية، والأمهرية، والبورمية، وغيرهم.

يمكن لأيّ حرف من نظام الحروف الدولي الموحد تقريباً أن يستعمل في بيانات حروف وقيم خواص وثائق إكس إم إل 1.1، حتى لو كان الحرف غير معرّف، في النسخة الحالية لنظام الحروف الدولي الموحد. في بيانات الحروف وقيم الخواص، يسمح إكس إم إل 1.1 لإستعمال حروف السيطرة أكثر من إكس إم إل 1.0، لكن أغلب حروف السيطرة المقدّمة في إكس إم إل 1.1 يجب أن تبدي كمراجع حرفية عددية.

روابط خارجية

المصادر

  1. ^ "XML Media Types, RFC 7303". Internet Engineering Task Force. July 2014.