ضغط البيانات

في معالجة الإشارات ، ضغط البيانات data compression، ترميز المصدر source coding,[1] أو تخفيض معدل البتات bit-rate reduction هو عملية تشفير معلومات باستخدام عدد أقل من البتات من التمثيل الأصلي.[2] أي ضغط معين هو فقد أو بدون فقد. يقلل الضغط بدون فقد البتات من خلال تحديد وإزالة التكرار الإحصائي. لا يتم فقدان أي معلومات في الضغط بدون فقد. يقلل الضغط المفقود من البتات عن طريق إزالة المعلومات غير الضرورية أو الأقل أهمية.[3] عادةً ، ما يُشار إلى الجهاز الذي يقوم بضغط البيانات باسم المشفر ، والجهاز الذي يقوم بعكس العملية (فك الضغط) كمفكك الشفرة.

غالبًا ما يشار إلى عملية تقليل حجم ملف البيانات باسم ضغط البيانات. في سياق نقل البيانات ، يطلق عليه تشفير المصدر ؛ الترميز الذي يتم في مصدر البيانات قبل تخزينها أو إرسالها.[4] لا ينبغي الخلط بين تشفير المصدر و تشفير القناة ، للكشف عن الأخطاء وتصحيحها أو تشفير الخط ، وسائل ربط البيانات على إشارة.

يعد الضغط مفيدًا لأنه يقلل الموارد المطلوبة لتخزين البيانات ونقلها. يتم استهلاك الموارد الحاسوبية في عمليات الضغط وإلغاء الضغط. يخضع ضغط البيانات إلى مبادلة تعقيد الزمكان. على سبيل المثال ، مخطط ضغط للفيديو قد يتطلب أجهزة باهظة الثمن حتى يتم فك ضغط الفيديو بسرعة كافية لعرضه أثناء فك ضغطه ، وخيار إلغاء ضغط الفيديو بالكامل قبل مشاهدته قد يكون غير مريح أو يتطلب مساحة تخزين إضافية. يتضمن تصميم مخططات ضغط البيانات مقايضات بين عوامل مختلفة ، بما في ذلك درجة الضغط ، ومقدار التشويه الذي تم إدخاله (عند استخدام ضغط البيانات الضائع) ، والموارد الحسابية المطلوبة لضغط البيانات وفك ضغطها.[5][6]

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

بدون فقد للبيانات

عادة ما يستخدم ضغط البيانات بدون فقد خوارزمية التكرار الإحصائي لتمثيل البيانات دون فقدان أي معلومات ، بحيث تكون العملية قابلة للعكس. الضغط بدون فقد ممكن لأن معظم البيانات الواقعية تظهر تكرارًا إحصائيًا. على سبيل المثال ، قد تحتوي الصورة على مساحات من الألوان لا تتغير عبر عدة وحدات بكسل ؛ بدلاً من ترميز "پكسل أحمر ، پكسل أحمر ، ..." قد يتم ترميز البيانات كـ "279 پكسل أحمر". هذا مثال أساسي على التشفير بطول التشغيل ؛ و هنالك العديد من المخططات لتقليل حجم الملف من خلال التخلص من التكرار.

تعد طرق الضغط لمپل - زيڤ (LZ) من بين الخوارزميات الأكثر شيوعًا للتخزين بدون فقد.[7] DEFLATE هو اختلاف عن LZ وهو محسّن لسرعة الضغط ونسبة الضغط ، ولكن الضغط يمكن أن يكون بطيئًا. في منتصف الثمانينيات ، وبعد العمل الذي قام به تيري ويلش ، أصبحت خوارزمية لمپل - زيڤ - ولش (LZW) بسرعة الطريقة المفضلة لمعظم أنظمة الضغط للأغراض العامة. يتم استخدام LZW في الصور GIF والبرامج مثل PKZIP والأجهزة مثل أجهزة المودم.[8]تستخدم طرق LZ نموذج ضغط مستند إلى جدول حيث يتم استبدال إدخالات الجدول بسلاسل البيانات المتكررة. بالنسبة لمعظم طرق LZ ، يتم إنشاء هذا الجدول ديناميكيًا من البيانات السابقة في الإدخال. غالبًا ما يكون الجدول نفسه ترميز هفمان. الرموز المستندة إلى القواعد يمكن أن يضغط مثل هذا الإدخال المتكرر للغاية بشكل فعال للغاية ، على سبيل المثال ، جمع البيانات البيولوجية من نفس النوع أو الأنواع ذات الصلة الوثيقة ، مجموعة كبيرة من المستندات ذات النسخ ، أرشفة الإنترنت ، إلخ. المهمة الأساسية للقواعد النحوية- تقوم الرموز المستندة إلى إنشاء قواعد خالية من السياق اشتقاق سلسلة واحدة. تتضمن خوارزميات ضغط القواعد العملية الأخرى خوارزمية سكوتشر و Re-Pair.

أقوى الضاغطات الحديثة التي لا تحتاج إلى فقد تستخدم نماذج احتمالية ، مثل التنبؤ بالمطابقة الجزئية. يمكن أيضًا النظر إلى تحويل بوروز- ويلر كشكل غير مباشر من النمذجة الإحصائية.[9] في تحسين إضافي للاستخدام المباشر ل النموذج الاحتمالي ، يمكن ربط التقديرات الإحصائية بخوارزمية تسمى الترميز الحسابي. التشفير الحسابي هو أسلوب تشفير أكثر حداثة يستخدم الحسابات الرياضية لـ آلة الحالة المحدودة لإنتاج سلسلة من البتات المشفرة من سلسلة من رموز بيانات الإدخال. يمكن أن يحقق ضغطًا فائقًا مقارنة بالتقنيات الأخرى مثل خوارزمية هفمان المعروفة. يستخدم حالة ذاكرة داخلية لتجنب الحاجة إلى إجراء تعيين واحد لواحد لرموز الإدخال الفردية لتمثيلات مميزة تستخدم عددًا صحيحًا من البتات ، وتزيل الذاكرة الداخلية فقط بعد تشفير السلسلة الكاملة لرموز البيانات . ينطبق الترميز الحسابي بشكل جيد بشكل خاص على مهام ضغط البيانات التكيفية حيث تختلف الإحصاءات وتعتمد على السياق ، حيث يمكن أن يقترن بسهولة بنموذج تكيف التوزيع الاحتمالي لبيانات الإدخال. كان أحد الأمثلة المبكرة على استخدام التشفير الحسابي هو ميزة اختيارية (ولكن لم يتم استخدامها على نطاق واسع) لمعيار تشفير الصور JPEG.[10] ومنذ ذلك الحين تم تطبيقه في تصميمات أخرى مختلفة بما في ذلك H.263 و H.264 / MPEG-4 AVC و HEVC لتشفير الفيديو.[11]


مع فقد للبيانات

في أواخر الثمانينيات ، أصبحت الصور الرقمية أكثر شيوعًا ، وظهرت معايير ضغط الصور بدون فقدان. في أوائل التسعينات ، بدأ استخدام طرق الضغط ذات فقد للبيانات على نطاق واسع.[8] في هذه المخططات ، يتم قبول بعض من فقدان المعلومات لأن إسقاط التفاصيل غير الأساسية يمكن أن يوفر مساحة التخزين. يوجد مبادلة مقابلة بين حفظ المعلومات وتقليل الحجم. تم تصميم مخططات ضغط البيانات المفقودة من خلال البحث حول كيفية إدراك الأشخاص للبيانات المعنية. على سبيل المثال ، تكون العين البشرية أكثر حساسية للتغيرات الدقيقة في النصوع من الاختلافات في اللون. يعمل JPEG ضغط الصور جزئيًا بتقريب أجزاء غير ضرورية من المعلومات.[12] يستغل عدد من تنسيقات الضغط الشائعة هذه الاختلافات الإدراكية ، بما في ذلك الصوتيات للصوت ، و البصريات للصور والفيديو.

تعتمد معظم أشكال الضغط مع فقد للبيانات على تحويل التشفير ، وخاصة تحويل جيب التمام المنفصل (DCT). تم اقتراحه لأول مرة عام 1972 بواسطة ناصر أحمد ، الذي طور بعد ذلك خوارزمية عاملة مع T. Natarajan و ك. ر. راو عام 1973 ، قبل تقديمه في يناير 1974.[13][14] DCT هي أكثر طرق الضغط مع الفقد استخدامًا ، وتستخدم في تنسيقات الوسائط المتعددة لـ الصور (مثل JPEG و HEIF),[15] الفيديو (مثل MPEG ، AVC و HEVC) والصوت (مثل MP3 ، AAC و Vorbis).

يستخدم ضغط الصور الفقد في الكاميرا الرقمية ، لزيادة سعات التخزين. وبالمثل ، تستخدم DVD و Blu-ray و دفق الفيديو تنسيق ترميز الفيديو مع فقد للبيانات.

في الضغط الصوتي مع فقد ، تُستخدم طرق الصوتيات لإزالة المكونات غير المسموعة (أو الأقل سماعية) من الإشارة الصوتية. غالبًا ما يتم تنفيذ ضغط الكلام البشري بتقنيات أكثر تخصصًا ؛ يتميز [[ترميز الكلام] بأنه نظام منفصل عن الضغط الصوتي للأغراض العامة. يتم استخدام ترميز الكلام في الاتصال عبر الإنترنت ، على سبيل المثال ، يتم استخدام ضغط الصوت لنسخ الأقراص المضغوطة ويتم فك تشفيرها بواسطة مشغلات الصوت.[9]

نظرية

يتم توفير الأساس النظري للضغط بواسطة نظرية المعلومات ، وبشكل أكثر تحديدًا ، نظرية المعلومات الخوارزمية للضغط بدون خسارة و نظرية المعدل- التشويه للضغط الضائع. تم إنشاء هذه المجالات من الدراسة بشكل أساسي بواسطة كلود شانون ، الذي نشر أوراقًا أساسية حول هذا الموضوع في أواخر الأربعينيات وأوائل الخمسينيات. تشمل المواضيع الأخرى المرتبطة بالضغط نظرية الترميز و الاستدلال الإحصائي.[16]

التعلم الآلي

هناك صلة وثيقة بين التعلم الآلي والضغط. يمكن استخدام نظام يتنبأ بـ الاحتمالات اللاحقة للتسلسل بالنظر إلى تاريخه بالكامل من أجل ضغط البيانات الأمثل (باستخدام الترميز الحسابي على توزيع المخرجات). يمكن استخدام الضاغط الأمثل للتنبؤ (من خلال إيجاد الرمز الذي يضغط بشكل أفضل ، بالنظر إلى التاريخ السابق). تم استخدام هذا المعادل كمبرر لاستخدام ضغط البيانات كمعيار لـ "الذكاء العام".[17][18][19]

يمكن أن تُظهر طريقة عرض بديلة خوارزميات الضغط تعيين السلاسل ضمنيًا في متجهات الفضاء المميز ضمنيًا ، وتحسب مقاييس التشابه القائمة على الضغط التشابه داخل مساحات المعالم هذه. لكل ضاغط C(.) نحدد فضاء المتجه المرتبط ، مثل C(.) يرسم سلسلة إدخال x ، يتوافق مع معيار المتجه ||~x||. يمنع الفضاء من الفحص الشامل للمساحات المميزة التي تقوم عليها جميع خوارزميات الضغط. بدلاً من ذلك ، تختار متجهات الميزات فحص ثلاث طرق ضغط تمثيلية بدون فقد ، LZW و LZ77 و PPM.[20]

اختلاف البيانات

يمكن اعتبار ضغط البيانات كحالة خاصة لـ اختلاف البيانات.[21][22] يتكون اختلاف البيانات من إنتاج "اختلاف" مع إعطاء "مصدر" و "هدف" ، مع تصحيح إعادة إنتاج "الهدف" مع إعطاء "مصدر" و "اختلاف". نظرًا لعدم وجود مصدر أو هدف منفصل في ضغط البيانات ، يمكن للمرء أن يعتبر ضغط البيانات اختلافًا عن البيانات مع بيانات المصدر الفارغة ، ويتوافق الملف المضغوط مع اختلاف عن لا شيء. هذا هو نفس اعتبار المطلقة entropy وهو مقياس لوگاريتمي لمعدل نقل المعلومات في رسالة أو لغة معينة.(المقابلة لضغط البيانات) كحالة خاصة لـ الإنتروپيا النسبية (المقابلة لاختلاف البيانات) بدون بيانات أولية.

يستخدم مصطلح "الضغط التفاضلي" للتأكيد على اتصال اختلاف البيانات.

استخدامات

صورة

نشأ ترميز الانتروبيا في أربعينيات القرن العشرين بإدخال ترميز شانون- فانو,[23] أساس ترميز هفمان الذي تم تطويره في عام 1950.[24] يعود ترميز التحويل إلى أواخر الستينيات ، مع إدخال تحويل فورييه السريع (FFT) الترميز في عام 1968 و تحويل هادامارد في عام 1969.[25]

إحدى تقنيات ضغط الصور المهمة هي تحويل جيب التمام المنفصل (DCT) ، وهي تقنية تم تطويرها في أوائل السبعينيات.[13]DCT هي أساس JPEG ، تشكيل ضغط مع فقد تم تقديمه بواسطة مجموعة خبراء التصوير المشتركة (JPEG) في عام 1992.[26] يقلل JPEG بشكل كبير من كمية البيانات المطلوبة لتمثيل صورة على حساب انخفاض صغير نسبيًا في جودة الصورة وأصبح الأكثر استخدامًا تنسيق ملف صورة.[27][28]كانت خوارزمية الضغط القائمة على DCT ذات الكفاءة العالية مسؤولة إلى حد كبير عن الانتشار الواسع لـ الرسم الرقمي و الصورة الرقمية.[29]

لمپل– زيڤ– ولش (LZW) عبارة عن خوارزمية للضغط بدون فقد تم تطويرها عام 1984. يتم استخدامها بتنسيق GIF ، الذي تم تقديمه في عام 1987.[30] DEFLATE ، خوارزمية ضغط بدون فقد تم تحديدها في عام 1996 ، يتم استخدامها في تشكيل رسومات الشبكة المحمولة (PNG).[31]

ضغط التموجات ، بدأ استخدام التموجات في ضغط الصور ، بعد تطوير تشفير DCT.[32] تم تقديم معيار JPEG 2000 في عام 2000.[33]على النقيض من خوارزمية DCT المستخدمة بواسطة تنسيق JPEG الأصلي ، يستخدم JPEG 2000 بدلاً من ذلك خوارزميات تحويل تموجات منفصلة (DWT).[34][35][36] تم اختيار تقنية JPEG 2000 ، التي تتضمن امتداد Motion JPEG 2000 ، معيار ترميز الفيديو لـ السينما الرقمية في عام 2004.[37]

صوت

ضغط البيانات الصوتية ، يجب عدم الخلط بينه وبين ضغط النطاق الديناميكي ، يمكن أن يقلل من عرض النطاق الترددي للإرسال ومتطلبات تخزين البيانات الصوتية. يتم تنفيذ خوارزميات ضغط الصوت في برنامج ترميز صوتي. توفر خوارزميات ضغط الصوت ذات الفقد ضغطًا أعلى بتكلفة الدقة وتستخدم في العديد من التطبيقات الصوتية. تعتمد جميع هذه الخوارزميات تقريبًا على الصوتيات لإزالة دقة الأصوات الأقل سماعية أو تقليلها ، وبالتالي تقليل المساحة المطلوبة لتخزينها أو نقلها.[2]

في كل من الضغط ذو فقد للبيانات و بدون فقد للبيانات، يتم تقليل تكرار المعلومات ، باستخدام طرق مثل التشفير و التعرف على الأنماط و التنبؤ الخطي إلى تقليل كمية المعلومات المستخدمة لتمثيل البيانات غير المضغوطة.

تعتمد المفاضلة المقبولة بين فقدان جودة الصوت وحجم الإرسال أو التخزين على التطبيق. على سبيل المثال ، يحتوي قرص مضغوط (CD) ذو سعة 640 MB على ساعة واحدة تقريبًا من الموسيقى دقة عالية ، أو أقل من ساعتين من الموسيقى المضغوطة بدون فقد ، أو 7 ساعات من الموسيقى المضغوطة في MP3 بتنسيق معدل البت المتوسط. يمكن أن يقوم مسجل الصوت الرقمي عادةً بتخزين حوالي 200 ساعة من الكلام الواضح بوضوح في 640 640 MB.[38]

ينتج عن الضغط الصوتي بدون فقد تمثيل للبيانات الرقمية التي يتم فك ضغطها إلى نسخة رقمية دقيقة من الدفق الصوتي الأصلي ، على عكس التشغيل من تقنيات الضغط ذات الفقد مثل Vorbis و MP3. نسب الضغط حوالي 50-60٪ من الحجم الأصلي ،[39] وهو مشابه لتلك الخاصة بضغط البيانات العامة دون فقد. لا يمكن للضغط بدون فقد الحصول على نسب ضغط عالية بسبب تعقيد التشكيلات الموجية والتغيرات السريعة في أشكال الصوت. تستخدم برامج الترميز مثل FLAC و Shorten و TTA التنبؤ الخطي لتقدير طيف الإشارة. تستخدم العديد من هذه الخوارزميات الالتفاف مع المرشح [-1 1] إلى التبييض قليلاً أو تسطيح الطيف ، مما يسمح للضغط التقليدي بدون فقد للعمل بكفاءة أكبر. يتم عكس العملية عند فك الضغط.

عندما تتم معالجة الملفات الصوتية ، إما عن طريق مزيد من الضغط أو من أجل التحرير ، من المستحسن العمل من نسخة أصلية غير متغيرة (غير مضغوطة أو مضغوطة بدون فقد). عادة ما ينتج عن معالجة ملف مضغوط بشكل خاطئ لسبب ما نتيجة نهائية أقل من إنشاء نفس الملف المضغوط من نسخة أصلية غير مضغوطة. بالإضافة إلى تحرير الصوت أو مزجه ، غالبًا ما يستخدم ضغط الصوت بدون فقد للتخزين الأرشفي ، أو كنسخ رئيسية.

يوجد عدد من تشكيلات ضغط الصوت بدون فقد. Shorten كان تنسيقًا أولياً بدون فقد. تتضمن الإصدارات الأحدث برنامج ترميز الصوتيات ذات الفقد (FLAC) و آپل Apple Lossless (ALAC) و MPEG-4 ALS و مايكروسوفت Windows Media Audio 9 بدون فقد (WMA بدون فقد) ، Monkey's Audio ، TTA ، و WavPack. راجع قائمة برامج الترميز بدون فقد للحصول على قائمة كاملة.

تتميز بعض تشكيلات الصوت بمزيج من التشكيل ذو فقد وتصحيح بدون خسارة ؛ هذا يسمح بتجريد التصحيح للحصول على ملف ذو فقد بسهولة. تتضمن هذه التشكيلات MPEG-4 SLS (قابلة للتحجيم إلى بدون فقد للبيانات) و WavPack و OptimFROG DualStream.

ترتبط التشكيلات الأخرى بنظام مميز ، مثل:

ضغط الصوت ذو فقد للبيانات

مقارنة بين طيفي من الصوت بتنسيق غير مضغوط والعديد من التنسيقات ذات فقد. تُظهر مخططات الأطياف ذات الفقد النطاق الترددي للترددات الأعلى ، وهي تقنية شائعة مرتبطة بضغط الصوت ذو الفقد.

يستخدم ضغط الصوت ذو الفقد في مجموعة واسعة من التطبيقات. بالإضافة إلى التطبيقات المباشرة (مشغلات MP3 أو أجهزة الكمبيوتر) ، يتم استخدام تدفقات الصوت المضغوطة رقميًا في معظم أقراص DVD للفيديو ، والتلفزيون الرقمي ، ووسائط البث على الإنترنت ، والقمر الصناعي وراديو الكابل ، وبشكل متزايد في عمليات البث الإذاعي الأرضي. عادةً ما يحقق الضغط ذو الفقد ضغطًا أكبر بكثير من الضغط بدون فقد (5-20٪ من الحجم الأصلي ، بدلاً من 50-60٪) ، من خلال تجاهل البيانات الأقل أهمية.[40]

كان ابتكار الضغط الصوتي ذو الفقد هو استخدام الصوتيات لإدراك أنه لا يمكن إدراك كل البيانات في دفق صوتي بواسطة النظام السمعي البشري. تقلل معظم الضغوطات ذات الفقد التكرار الإدراكي من خلال التعرف أولاً على الأصوات غير الملائمة إدراكيًا ، أي الأصوات التي يصعب جدًا سماعها. تتضمن الأمثلة النموذجية الترددات العالية أو الأصوات التي تحدث في نفس الوقت مع الأصوات الأعلى. يتم ترميز هذه الأصوات بدقة منخفضة أو لا يتم إطلاقها على الإطلاق.

نظرًا لطبيعة الخوارزميات ذات الفقد ، تعاني جودة الصوت عند فك ضغط الملف وإعادة ضغطه من (فقدان التوليد الرقمي). وهذا يجعل الضغط ذو الفقد غير مناسب لتخزين النتائج الوسيطة في تطبيقات هندسة الصوت الاحترافية ، مثل تحرير الصوت وتسجيل المسارات المتعددة. ومع ذلك ، فهي تحظى بشعبية كبيرة لدى المستخدمين النهائيين (خاصة MP3) حيث يمكن للميگابايت تخزين حوالي دقيقة من الموسيقى بجودة مناسبة.


. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

طرق الترميز

لتحديد ما هي المعلومات في الإشارة الصوتية غير المرتبطة من الناحية الإدراكية ، تستخدم معظم خوارزميات الضغط ذات الفقد تحويلات مثل تحويل جيب التمام المنفصل المعدل (MDCT) لتحويل مجال الزمن أشكال الموجة المستندة إلى عينات إلى مجال تحويل. بمجرد تحويلها ، عادة إلى مجال التردد ، يمكن جعل البتات المخصصة للترددات المكونة بتات وفقًا لمدى سماعها. مسموعة المكونات الطيفية المحسوبة باستخدام عتبة السمع المطلق ومبادئ إخفاء متزامن - الظاهرة التي تحجب فيها إشارة بإشارة أخرى مفصولة بالتردد - وفي بعض الحالات ، التقنيع الزمني - حيث تحجب إشارة بإشارة أخرى مفصولة بالزمن. يمكن استخدام خطوط الصوت المتساوي أيضًا لتقدير الأهمية الإدراكية للمكونات. غالبًا ما تسمى نماذج تركيبة الأذن-الدماغ البشرية التي تتضمن هذه التأثيرات نموذج صوتي سمعي.[41]

الأنواع الأخرى من الضاغطات ذات الفقد ، مثل التشفير التنبئي الخطي (LPC) المستخدم مع الكلام ، هي المبرمجات القائمة على المصدر. يستخدم هؤلاء المبرمجون نموذجًا لمولد الصوت (مثل الجهاز الصوتي البشري مع LPC) لتبييض الإشارة الصوتية (أي تسطيح طيفها) قبل التكمية. يمكن التفكير في LPC باعتباره تقنية أساسية للتشفير الإدراكي: إعادة تشكيل إشارة صوتية باستخدام توقع خطي يشكل ضجيج تكويد المبرمج في طيف الإشارة المستهدفة ، ويخفيها جزئيًا.[40]

غالبًا ما تستخدم التنسيقات ذات الفقد لتوزيع دفق الصوت أو التطبيقات التفاعلية (مثل تشفير الكلام للإرسال الرقمي في شبكات الهاتف الخلوي). في مثل هذه التطبيقات ، يجب إلغاء ضغط البيانات أثناء تدفقها ، وليس بعد إرسال دفق البيانات بالكامل. لا يمكن استخدام جميع برامج الترميز الصوتية لتطبيقات التدفق ، وبالنسبة لهذه التطبيقات ، عادةً ما يتم اختيار برنامج ترميز مصمم لتدفق البيانات بشكل فعال.[40]

ينتج زمن الانتقال عن الأساليب المستخدمة لتشفير البيانات وفك تشفيرها. ستقوم بعض برامج الترميز بتحليل مقطع أطول من البيانات لتحسين الكفاءة ، ثم ترميزها بطريقة تتطلب شريحة أكبر من البيانات في وقت واحد لفك الشفرة. (غالبًا ما تنشئ برامج الترميز مقاطع تسمى "إطارًا" لإنشاء مقاطع بيانات منفصلة للتشفير وفك التشفير.) يمكن أن يكون الكمون المتأصل في خوارزمية التشفير حرجاً ؛ على سبيل المثال ، عندما يكون هناك إرسال للبيانات في اتجاهين ، كما هو الحال مع محادثة هاتفية ، قد يؤدي التأخير الكبير إلى تدهور الجودة الملحوظة بشكل حاد.

على عكس سرعة الضغط ، التي تتناسب مع عدد العمليات التي تتطلبها الخوارزمية ، يشير الكمون هنا إلى عدد العينات التي يجب تحليلها قبل معالجة كتلة الصوت. في الحالة الدنيا ، يكون الكمون عبارة عن عينات صفرية (على سبيل المثال ، إذا قلل المبرمج / مفكك التشفير ببساطة عدد البتات المستخدمة لقياس الإشارة). غالبًا ما تحتوي خوارزميات المجال الزمني مثل LPC أيضًا على زمن وصول منخفض ، وبالتالي فإن شعبيتها في تشفير الكلام للهاتف. في الخوارزميات مثل MP3 ، ومع ذلك ، يجب تحليل عدد كبير من العينات لتنفيذ نموذج صوتي نفسي في مجال التردد ، ويكون زمن الانتقال على أساس 23 مللي ثانية (46 مللي ثانية للاتصال ثنائي الاتجاه).

ترميز الكلام

ترميز الكلام فئة هامة من ضغط البيانات الصوتية. تختلف النماذج الإدراكية المستخدمة لتقدير ما يمكن للأذن البشرية سماعه بشكل عام إلى حد ما عن تلك المستخدمة للموسيقى. عادة ما يكون نطاق الترددات اللازمة لنقل أصوات الصوت البشري أضيق بكثير من ذلك المطلوب للموسيقى ، وعادة ما يكون الصوت أقل تعقيدًا. ونتيجة لذلك ، يمكن تشفير الكلام بجودة عالية باستخدام معدل بت منخفض نسبيًا.

إذا كانت البيانات المراد ضغطها تمثيلية (مثل الجهد الذي يختلف مع الزمن) ، يتم استخدام القياس الكمي لرقمنتها إلى أرقام (أعداد صحيحة في العادة). ويشار إلى هذا بالتحويل التناظري إلى الرقمي (A / D). إذا كانت الأعداد الصحيحة المتولدة عن التكمية 8 بتات لكل منها ، فإن النطاق الكامل للإشارة التناظرية ينقسم إلى 256 فاصلًا ويتم حساب جميع قيم الإشارة ضمن فاصل زمني بنفس الرقم. إذا تم إنشاء أعداد صحيحة 16 بت ، فسيتم تقسيم نطاق الإشارة التناظرية إلى 65.536 فاصل زمني.

توضح هذه العلاقة الحل الوسط بين الدقة العالية (عدد كبير من الفواصل التناظرية) والضغط العالي (عدد صحيح صغير تم إنشاؤه). يتم استخدام تطبيق القياس هذا من خلال العديد من طرق ضغط الكلام. يتم تحقيق ذلك ، بشكل عام ، من خلال مزيج من نهجين:

  • فقط ترميز الأصوات التي يمكن أن يصدرها صوت بشري واحد.
  • التخلص من المزيد من البيانات في الإشارة - الاحتفاظ بما يكفي لإعادة بناء صوت "واضح" بدلاً من نطاق التردد الكامل لسماع الإنسان.

ربما كانت أقدم الخوارزميات المستخدمة في تشفير الكلام (وضغط البيانات الصوتية بشكل عام) هي خوارزمية A-law و خوارزمية μ-law.

تاريخ

Solidyne 922: أول ضغط بت صوتي تجاري في العالم بطاقة الصوت لكمبيوتر شخصي ، 1990

في عام 1950 ، قدمت مختبرات Bell براءة اختراع تعديل شفرة النبض التفاضلي (DPCM).[42]تم تقديم DPCM ( تكيفي ADPCM) بواسطة پي. كمسكي و نيكيل س. جايانت و جيمس ل. فلانگان في مختبرات Bell في عام 1973.[43][44]

تم استخدام الترميز الإدراكي لأول مرة لضغط تشفير الكلام ، مع التشفير التنبؤي الخطي (LPC).[45] تعود المفاهيم الأولية لـ LPC إلى عمل فوميتادا إتاكورا (جامعة ناگويا) وشوزو سايتو (تلگراف و تلفون نپون) في عام 1966.[46]خلال السبعينيات ، طور بشنو س. أتال و مانفراد ر. شرودر في مختبرات Bell شكلًا من LPC يُسمى الترميز التنبؤي التكيفي (APC) ، خوارزمية ترميز إدراكي حيث استغل خصائص إخفاء الأذن البشرية ، متبوعة في أوائل الثمانينيات باستخدام خوارزمية التنبؤ الخطي للرمز المثار (CELP) الذي حقق نسبة ضغط مهمة في ذلك الوقت.[45] يستخدم الترميز الإدراكي من خلال تنسيقات ضغط الصوت الحديثة مثل MP3[45] and AAC.

تم تطوير تحويل جيب التمام المنفصل (DCT) ، بواسطة ناصر أحمد ، ت. ناتاراجان و ك. ر. راو عام 1974,[14] حيث قدم الأساس لـ تحويل جيب التمام المنفصل المعدل (MDCT) المستخدم بواسطة تشكيلات ضغط الصوت الحديثة مثل MP3[47] و AAC. تم اقتراح MDCT من قبل جي.پي. پرنسن و أ. و. جونسن و أ. ب. برادلي في عام 1987,[48] بعد عمل سابق من قبل پرنسن وبرادلي في عام 1986.[49] يتم استخدام MDCT من خلال تنسيقات ضغط الصوت الحديثة مثل Dolby Digital,[50][51] MP3,[47]و الترميز الصوتي المتقدم (AAC).[52]

تم تطوير أول نظام ضغط صوتي تجاري عالمي أتمتة البث من قبل أوسكار بونيلو ، أستاذ الهندسة في جامعة بوينس آيرس.[53] في عام 1983 ، باستخدام المبدأ الصوتي لإخفاء الحزم الحدية التي تم نشرها لأول مرة في عام 1967,[54] بدأ في تطوير تطبيق عملي يعتمد على الكمبيوتر IBM PC الذي تم تطويره مؤخرًا ، وتم إطلاق نظام أتمتة البث في عام 1987 تحت اسم Audicom. بعد عشرين عامًا ، كانت جميع محطات الراديو تقريبًا في العالم تستخدم تقنية مماثلة تم تصنيعها بواسطة عدد من الشركات.

تم نشر خلاصة أدبية لمجموعة كبيرة ومتنوعة من أنظمة التشفير الصوتي في مجلة IEEE في "مجالات مختارة في الاتصالات" ("JSAC") في فبراير 1988. وبينما كانت هناك بعض الأوراق من قبل ذلك الوقت ، فإن هذه المجموعة موثقة وكاملة من المبرمجين الصوتيين العاملين النهائيين ، وجميعهم تقريبًا يستخدمون تقنيات الإدراك الحسي (أي الإخفاء) ونوعًا من تحليل التردد والترميز النهائي الخلفي الصامت.[55] أشارت العديد من هذه الأوراق إلى صعوبة الحصول على صوت رقمي جيد ونظيف لأغراض البحث. معظم ، إن لم يكن جميع ، المؤلفين في إصدار "JSAC" كانوا نشطين أيضًا في لجنة الصوت MPEG-1 ، التي أنشأت تنسيق MP3.

ڤيديو

ضغط الفيديو هو تطبيق عملي لتشفير المصدر في نظرية المعلومات. من الناحية العملية ، يتم استخدام معظم برامج ترميز الفيديو جنبًا إلى جنب مع تقنيات ضغط الصوت لتخزين تدفقات البيانات المنفصلة ولكن كحزمة تكميلية واحدة مجمعة باستخدام ما يسمى تنسيق الصناديق".[56]

يتطلب فيديو غير مضغوط ارتفاعًا كبيرًا من معدل البيانات. على الرغم من أن ضغط الفيديو بدون فقد حيث تعمل برامج الترميز بعامل ضغط من 5 إلى 12 ، فإن H.264 فيديو ضغط فائت لديه عامل ضغط بين 20 و 200.[57]

إن الطريقتين الرئيسيتين لضغط الفيديو المستخدمة في معايير ترميز الفيديو هي تحويل جيب التمام المنفصل (DCT) و تعويض الحركة (MC). تستخدم معظم معايير تشفير الفيديو ، مثل تشكيلات H.26x و MPEG عادةً تشفير فيديو DCT المعوض عن الحركة (تعويض حركة الكتلة).[58][59]

نظرية الترميز

يمكن تمثيل بيانات الفيديو على أنها سلسلة من إطارات الصور الثابتة. عادة ما تحتوي هذه البيانات على كميات وفيرة من الزمانية والمكانية التكرار. تحاول خوارزميات ضغط الفيديو تقليل التكرار وتخزين المعلومات بشكل أكثر إحكاما.

تستغل معظم تشكيلات ضغط الفيديو و برامج الترميز التكرار المكاني والزمني (على سبيل المثال من خلال ترميز الاختلاف مع تعويض الحركة). يمكن تشفير التشابه عن طريق تخزين الاختلافات فقط على سبيل المثال الإطارات المجاورة مؤقتًا (التشفير بين الإطارات) أو وحدات الپكسل المجاورة مكانيًا (التشفير داخل الإطار). يعد ضغط داخل الإطار (ترميز دلتا المؤقت) أحد أقوى تقنيات الضغط. تستخدم (إعادة) البيانات من إطار واحد أو أكثر في وقت سابق أو لاحق في تسلسل لوصف الإطار الحالي. يستخدم الترميز داخل الإطار ، من ناحية أخرى ،البيانات من داخل الإطار الحالي فقط ،ضغط الصورة-لاتزال فعالة.[41]

تستخدم فئة التنسيقات المتخصصة المستخدمة في كاميرات الفيديو وتحرير الفيديو أنظمة ضغط أقل تعقيدًا تقصر تقنيات التنبؤ الخاصة بها على التنبؤ داخل الإطار.

عادةً ما يستخدم ضغط الفيديو أيضًا تقنيات الضغط مع فقد مثل التكمية التي تقلل من جوانب بيانات المصدر التي تكون (أكثر أو أقل) غير مرتبطة بالإدراك البصري البشري من خلال استغلال الميزات الإدراكية لرؤية الإنسان. على سبيل المثال ، يصعب إدراك الاختلافات الصغيرة في اللون من التغييرات في السطوع. يمكن لخوارزميات الضغط متوسط لون عبر هذه المناطق المتشابهة لتقليل المساحة ، بطريقة مشابهة لتلك المستخدمة في ضغط الصورة JPEG.[10] كما هو الحال في كل ضغط مع فقد ، هناك مبادلة بين جودة الفيديو و معدل البت ، وتكلفة معالجة الضغط وفك الضغط ، ومتطلبات النظام. قد يعرض الفيديو عالي الضغط مرئيًا أو مشتتًا بشكل صناعي.

بعض الطرق الأخرى غير تشكيلات التحويل القائمة على DCT ، مثل الضغط الكسري ، متابعة مطابقة واستخدام تحويل موجي منفصل (DWT) ، كانت موضوعًا لبعض الأبحاث ، ولكن لا يتم استخدامها عادةً في المنتجات العملية (باستثناء استخدام تشفير المويجات كمبرمج صورة ثابتة بدون تعويض الحركة). يبدو أن الاهتمام بضغط الفركتال يتضاءل ، بسبب التحليل النظري الأخير الذي يظهر نقصًا نسبيًا في فعالية مثل هذه الأساليب.[41]

التشفير بين الإطارات

يعمل التشفير بين الإطارات بمقارنة كل إطار في الفيديو مع الإطار السابق. تتم مقارنة الإطارات الفردية لتسلسل الفيديو من إطار إلى الإطار التالي ، ويرسل ترميز ضغط الفيديو الاختلافات فقط إلى الإطار المرجعي. إذا كان الإطار يحتوي على مناطق لم يتحرك فيها شيء ، فيمكن للنظام ببساطة إصدار أمر قصير ينسخ هذا الجزء من الإطار السابق إلى الإطار التالي. إذا تحركت أجزاء من الإطار بطريقة بسيطة ، يمكن أن ينبعث الضاغط أمرًا (أطول قليلاً) يخبر برنامج إلغاء الضغط بنقل النسخة أو تدويرها أو تفتيحها أو تغميقها. لا يزال هذا الأمر الأطول أقصر بكثير من ضغط الإطار الداخلي. عادة ما يقوم المشفر أيضًا بإرسال إشارة متبقية تصف الاختلافات الأكثر دقة إلى الصور المرجعية. باستخدام تشفير الإنتروبيا ، تتمتع إشارات البقايا هذه بتمثيل مضغوط أكثر من الإشارة الكاملة. في مناطق الفيديو ذات الحركة الأكبر ، يجب أن يقوم الضغط بترميز المزيد من البيانات لمواكبة العدد الأكبر من وحدات البكسل التي تتغير. عادة أثناء التفجيرات ، اللهب ، أسراب الحيوانات ، وفي بعض طلقات التحريك ، تؤدي التفاصيل عالية التردد إلى انخفاض الجودة أو زيادة في معدل البت المتغير.

صيغ التحويل الهجينة القائمة على الكتل

مراحل معالجة برنامج تشفير الفيديو النموذجي

واليوم ، تشترك جميع طرق ضغط الفيديو الشائعة الاستخدام تقريبًا (مثل تلك الموجودة في المعايير المعتمدة من قبل ITU-T أو ISO) في نفس البنية الأساسية التي يعود تاريخها إلى H. 261 الذي توحد في عام 1988 من قبل ITU-T. تعتمد في الغالب على DCT ، المطبقة على كتل مستطيلة من وحدات البكسل المجاورة ، والتنبؤ الزمني باستخدام متجهات الحركة ، وكذلك في الوقت الحاضر أيضًا خطوة تصفية داخل الحلقة.

في مرحلة التنبؤ ، يتم تطبيق تقنيات مختلفة إلغاء البيانات المكررة وتشفير الاختلافات التي تساعد على ربط البيانات ووصف البيانات الجديدة بناءً على البيانات المرسلة فعلياً.

ثم يتم تحويل الكتل المستطيلة للبيانات (البقايا) پكسل إلى مجال التردد لتسهيل استهداف المعلومات غير المرتبطة في القياس الكمي ولخفض بعض التكرار المكاني. تم إدخال تحويل جيب التمام المنفصل (DCT) المستخدم على نطاق واسع في هذا الصدد بواسطة ن. أحمد ، ت. ناتاراجان و ك. ر. راو عام 1974.[14]

في مرحلة المعالجة ذات الفقد الرئيسية ، يتم قياس البيانات من أجل تقليل المعلومات غير المرتبطة بالإدراك البصري البشري.

في المرحلة الأخيرة ، يتم التخلص من التكرار الإحصائي إلى حد كبير بواسطة المبرمج الأنتروپي والذي غالبًا ما يطبق شكلًا من أشكال الترميز الحسابي.

في مرحلة تصفية إضافية داخل الحلقة ، يمكن تطبيق مرشحات مختلفة على إشارة الصورة التي أعيد بناؤها. من خلال حساب هذه المرشحات أيضًا داخل حلقة التشفير ، يمكن أن تساعد في الضغط لأنه يمكن تطبيقها على المواد المرجعية قبل استخدامها في عملية التنبؤ ويمكن توجيهها باستخدام الإشارة الأصلية. المثال الأكثر شيوعًا هو مرشح إلغاء المنع الذي يطمس حجب التصنيعات من الانقطاعات الكمية في حدود كتلة التحويل.


. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

تاريخ

في عام 1967 ، اقترح أ.ه. روبنسون وسي.شيري مخططًا لضغط النطاق الترددي [التشفير بطول التشغيل] لإرسال إشارات التلفزيون التناظرية.[60] تحويل جيب التمام المنفصل (DCT) ، وهو أمر أساسي لضغط الفيديو الحديث ،[61] تم إدخاله بواسطة ناصر أحمد ، ت. ناتاراجان و ك. ر. راو عام 1974.[14][62]

H.261 ، الذي ظهر لأول مرة في عام 1988 ، قدم تجاريًا البنية الأساسية السائدة لتقنية ضغط الفيديو.[63] كان أول تشكيل ترميز الفيديو يعتمد على ضغط DCT ، والذي سيصبح فيما بعد المعيار لجميع تنسيقات ترميز الفيديو الرئيسية التي اتبعت.[61] تم تطوير H.261 بواسطة عدد من الشركات ، بما في ذلك هيتاشي و PictureTel و NTT و BT و توشيبا.[64]

كانت أشهر معايير ترميز الفيديو المستخدمة في برامج الترميز هي معايير MPEG. تم تطوير MPEG-1 بواسطة مجموعة خبراء الصور المتحركة (MPEG) في عام 1991 ، وتم تصميمه لضغط VHS - جودة الفيديو. وقد نجحت في عام 1994 بواسطة MPEG-2 / H.262,[63]التي طورها عدد من الشركات ، في المقام الأول سوني و تومسون و ميتسوبيشي الكتريك.[65]أصبح MPEG-2 تنسيق الفيديو القياسي لـ DVD و SD التلفزيون الرقمي.[63] في عام 1999 ، تبعتها MPEG-4 / H.263 ، التي كانت قفزة كبيرة إلى الأمام لتقنية ضغط الفيديو.[63] تم تطويره من قبل عدد من الشركات ، في المقام الأول ميتسوبيشي الكتريك ، هيتاشي و پاناسونيك.[66]

إن تنسيق ترميز الفيديو الأكثر استخدامًا هو H.264 / MPEG-4 AVC. تم تطويره في عام 2003 من قبل عدد من المنظمات ، في المقام الأول باناسونيك ، Godo Kaisha IP Bridge و LG الكترونكس.[67]قدم AVC تجاريًا خوارزميات التشفير الحسابي الثنائي المتكيف مع السياق (CABAC) و خوارزميات التشفير المتغير الطول المتكيف مع السياق (CAVLC). AVC هو المعيار الأساسي لترميز الفيديو لـ Blu-ray Disc s ، ويستخدم على نطاق واسع من خلال بث خدمات الإنترنت مثل يوتيوب و نتفلكس و ڤيميو و متجر iTunes ، وبرامج الويب مثل Adobe Flash Player و Microsoft Silverlight ، والعديد من عمليات البث HDTV عبر التلفزيون الأرضي والفضائي.

الأصول

خوارزميات ضغط الأصول هي أحدث جيل من الخوارزميات الخالية من الفقد التي تضغط البيانات (عادة سلاسل من النيوكليوتيدات) باستخدام كل من خوارزميات الضغط التقليدية والخوارزميات الجينية التي تتكيف مع نوع البيانات المحدد. في عام 2012 ، نشر فريق من العلماء من جامعة جونز هوپكنز خوارزمية ضغط جيني لا تستخدم الجينوم المرجعي للضغط. تم تصميم HAPZIPPER خصيصًا لبيانات HapMap ويحقق ضغطًا يزيد عن 20 ضعفًا (تقليل حجم الملف بنسبة 95٪) ، مما يوفر ضغطًا أفضل من 2 إلى 4 أضعاف وفي وقت أسرع بكثير من الأغراض العامة الرائدة مرافق ضغط. لهذا ، قدم كل من شندا و الحايك و بدر ترميزًا يستند إلى MAF (MAFE) ، مما يقلل من عدم تجانس مجموعة البيانات عن طريق فرز SNP حسب تردد الأليل الطفيف ، وبالتالي تجانس مجموعة البيانات.[68] خوارزميات أخرى في عامي 2009 و 2013 (DNAZip و GenomeZip) لها نسب ضغط تصل إلى 1200 ضعف ، مما يسمح بتخزين 6 مليار جينوم بشري ثنائي الأساس في 2.5 ميگابايت (بالنسبة إلى الجينوم المرجعي أو متوسطها على العديد من الجينومات).[69][70]لمعيار في ضواغط بيانات علم الوراثة / الجينوم ، انظر [71]

التوقعات والإمكانات غير المستخدمة حالياً

تشير التقديرات إلى أن إجمالي كمية البيانات المخزنة على أجهزة التخزين في العالم يمكن أن يتم ضغطه بشكل أكبر باستخدام خوارزميات الضغط الحالية بمعامل متوسط متبقي يبلغ 4.5: 1.[72] تشير التقديرات إلى أن السعة التكنولوجية المجمعة للعالم لتخزين المعلومات توفر 1300 إكسابايت من أرقام الأجهزة في عام 2007 ، ولكن عندما يتم ضغط المحتوى المطابق بشكل مثالي ، فإن هذا يمثل فقط 295 إكسابايت من معلومات شانون.[73]

انظر أيضاً

مصادر

  1. ^ Wade, Graham (1994). Signal coding and processing (2 ed.). Cambridge University Press. p. 34. ISBN 978-0-521-42336-6. Retrieved 2011-12-22. The broad objective of source coding is to exploit or remove 'inefficient' redundancy in the PCM source and thereby achieve a reduction in the overall source rate R.
  2. ^ أ ب Mahdi, O.A.; Mohammed, M.A.; Mohamed, A.J. (November 2012). "Implementing a Novel Approach an Convert Audio Compression to Text Coding via Hybrid Technique" (PDF). International Journal of Computer Science Issues. 9 (6, No. 3): 53–59. Retrieved 6 March 2013.
  3. ^ Pujar, J.H.; Kadlaskar, L.M. (May 2010). "A New Lossless Method of Image Compression and Decompression Using Huffman Coding Techniques" (PDF). Journal of Theoretical and Applied Information Technology. 15 (1): 18–23.
  4. ^ Salomon, David (2008). A Concise Introduction to Data Compression. Berlin: Springer. ISBN 9781848000728.
  5. ^ S. Mittal; J. Vetter (2015), "A Survey Of Architectural Approaches for Data Compression in Cache and Main Memory Systems", IEEE Transactions on Parallel and Distributed Systems (IEEE) 27 (5): 1524–1536, doi:10.1109/TPDS.2015.2435788 
  6. ^ Tank, M.K. (2011). "Implementation of Lempel-ZIV algorithm for lossless compression using VHDL". Implementation of Limpel-Ziv algorithm for lossless compression using VHDL. Berlin: Springer. pp. 275–283. doi:10.1007/978-81-8489-989-4_51. ISBN 978-81-8489-988-7. {{cite book}}: |work= ignored (help)
  7. ^ Navqi, Saud; Naqvi, R.; Riaz, R.A.; Siddiqui, F. (April 2011). "Optimized RTL design and implementation of LZW algorithm for high bandwidth applications" (PDF). Electrical Review. 2011 (4): 279–285.
  8. ^ أ ب Wolfram, Stephen (2002). A New Kind of Science. Wolfram Media, Inc. p. 1069. ISBN 978-1-57955-008-0.
  9. ^ أ ب Mahmud, Salauddin (March 2012). "An Improved Data Compression Method for General Data" (PDF). International Journal of Scientific & Engineering Research. 3 (3): 2. Retrieved 6 March 2013.
  10. ^ أ ب Lane, Tom. "JPEG Image Compression FAQ, Part 1". Internet FAQ Archives. Independent JPEG Group. Retrieved 6 March 2013.
  11. ^ G. J. Sullivan; J.-R. Ohm; W.-J. Han; T. Wiegand (December 2012). "Overview of the High Efficiency Video Coding (HEVC) Standard". IEEE Transactions on Circuits and Systems for Video Technology. IEEE. 22 (12): 1649–1668. doi:10.1109/TCSVT.2012.2221191.
  12. ^ Arcangel, Cory. "On Compression" (PDF). Retrieved 6 March 2013.
  13. ^ أ ب Ahmed, Nasir (January 1991). "How I Came Up With the Discrete Cosine Transform". Digital Signal Processing. 1 (1): 4–5. doi:10.1016/1051-2004(91)90086-Z.
  14. ^ أ ب ت ث Nasir Ahmed; T. Natarajan; Kamisetty Ramamohan Rao (January 1974). "Discrete Cosine Transform" (PDF). IEEE Transactions on Computers. C-23 (1): 90–93. doi:10.1109/T-C.1974.223784.
  15. ^ CCITT Study Group VIII und die Joint Photographic Experts Group (JPEG) von ISO/IEC Joint Technical Committee 1/Subcommittee 29/Working Group 10 (1993), "Annex D – Arithmetic coding", Recommendation T.81: Digital Compression and Coding of Continuous-tone Still images – Requirements and guidelines, pp. 54 ff, https://www.w3.org/Graphics/JPEG/itu-t81.pdf, retrieved on 2009-11-07 
  16. ^ Marak, Laszlo. "On image compression" (PDF). University of Marne la Vallee. Archived from the original (PDF) on 28 مايو 2015. Retrieved 6 مارس 2013.
  17. ^ Mahoney, Matt. "Rationale for a Large Text Compression Benchmark". Florida Institute of Technology. Retrieved 5 March 2013.
  18. ^ Shmilovici A.; Kahiri Y.; Ben-Gal I.; Hauser S. (2009). "Measuring the Efficiency of the Intraday Forex Market with a Universal Data Compression Algorithm" (PDF). Computational Economics. 33 (2): 131–154. CiteSeerX 10.1.1.627.3751. doi:10.1007/s10614-008-9153-3.
  19. ^ I. Ben-Gal (2008). "On the Use of Data Compression Measures to Analyze Robust Designs" (PDF). IEEE Transactions on Reliability. 54 (3): 381–388. doi:10.1109/TR.2005.853280.
  20. ^ D. Scully; Carla E. Brodley (2006). "Compression and machine learning: A new perspective on feature space vectors" (PDF). Data Compression Conference, 2006.
  21. ^ Korn, D.; et al. "RFC 3284: The VCDIFF Generic Differencing and Compression Data Format". Internet Engineering Task Force. Retrieved 5 March 2013.
  22. ^ Korn, D.G.; Vo, K.P. (1995). B. Krishnamurthy (ed.). Vdelta: Differencing and Compression. Practical Reusable Unix Software. New York: John Wiley & Sons, Inc.
  23. ^ Claude Elwood Shannon (1948). Alcatel-Lucent (ed.). "A Mathematical Theory of Communication" (PDF). Bell System Technical Journal. 27 (3–4): 379–423, 623–656. Retrieved 2019-04-21.
  24. ^ David Albert Huffman (September 1952), "A method for the construction of minimum-redundancy codes", Proceedings of the IRE 40 (9): 1098–1101, doi:10.1109/JRPROC.1952.273898, http://compression.ru/download/articles/huff/huffman_1952_minimum-redundancy-codes.pdf 
  25. ^ William K. Pratt, Julius Kane, Harry C. Andrews: "Hadamard transform image coding", in Proceedings of the IEEE 57.1 (1969): Seiten 58–68
  26. ^ "T.81 – DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES – REQUIREMENTS AND GUIDELINES" (PDF). CCITT. September 1992. Retrieved 12 July 2019.
  27. ^ "The JPEG image format explained". BT.com. BT Group. 31 May 2018. Retrieved 5 August 2019.
  28. ^ Baraniuk, Chris (15 October 2015). "Copy protections could come to JPEGs". BBC News. BBC. Retrieved 13 September 2019.
  29. ^ "What Is a JPEG? The Invisible Object You See Every Day". The Atlantic. 24 September 2013. Retrieved 13 September 2019.
  30. ^ "The GIF Controversy: A Software Developer's Perspective". Retrieved 26 May 2015.
  31. ^ قالب:Cite IETF
  32. ^ Hoffman, Roy (2012). Data Compression in Digital Systems. Springer Science & Business Media. p. 124. ISBN 9781461560319. Basically, wavelet coding is a variant on DCT-based transform coding that reduces or eliminates some of its limitations. (...) Another advantage is that rather than working with 8 × 8 blocks of pixels, as do JPEG and other block-based DCT techniques, wavelet coding can simultaneously compress the entire image.
  33. ^ Taubman, David; Marcellin, Michael (2012). JPEG2000 Image Compression Fundamentals, Standards and Practice: Image Compression Fundamentals, Standards and Practice. Springer Science & Business Media. ISBN 9781461507994.
  34. ^ Unser, M.; Blu, T. (2003). "Mathematical properties of the JPEG2000 wavelet filters" (PDF). IEEE Transactions on Image Processing. 12 (9): 1080–1090. Bibcode:2003ITIP...12.1080U. doi:10.1109/TIP.2003.812329. PMID 18237979.
  35. ^ Sullivan, Gary (8–12 December 2003). "General characteristics and design considerations for temporal subband video coding". ITU-T. Video Coding Experts Group. Retrieved 13 September 2019.{{cite web}}: CS1 maint: date format (link)
  36. ^ Bovik, Alan C. (2009). The Essential Guide to Video Processing. Academic Press. p. 355. ISBN 9780080922508.
  37. ^ Swartz, Charles S. (2005). Understanding Digital Cinema: A Professional Handbook. Taylor & Francis. p. 147. ISBN 9780240806174.
  38. ^ The Olympus WS-120 digital speech recorder, according to its manual, can store about 178 hours of speech-quality audio in .WMA format in 500 MB of flash memory.
  39. ^ Coalson, Josh. "FLAC Comparison". Retrieved 6 March 2013.
  40. ^ أ ب ت Jaiswal, R.C. (2009). Audio-Video Engineering. Pune, Maharashtra: Nirali Prakashan. p. 3.41. ISBN 9788190639675.
  41. ^ أ ب ت Faxin Yu; Hao Luo; Zheming Lu (2010). Three-Dimensional Model Analysis and Processing. Berlin: Springer. p. 47. ISBN 9783642126512.
  42. ^ US2٬605٬361 (PDF version) ({{{y}}}-{{{m}}}-{{{d}}}) C. Chapin Cutler, Differential Quantization of Communication Signals. 
  43. ^ P. Cummiskey, Nikil S. Jayant, and J. L. Flanagan, "Adaptive quantization in differential PCM coding of speech", Bell Syst. Tech. J., vol. 52, pp. 1105—1118, Sept. 1973
  44. ^ Cummiskey, P.; Jayant, Nikil S.; Flanagan, J. L. (1973). "Adaptive quantization in differential PCM coding of speech". The Bell System Technical Journal. 52 (7): 1105–1118. doi:10.1002/j.1538-7305.1973.tb02007.x. ISSN 0005-8580.
  45. ^ أ ب ت Schroeder, Manfred R. (2014). "Bell Laboratories". Acoustics, Information, and Communication: Memorial Volume in Honor of Manfred R. Schroeder. Springer. p. 388. ISBN 9783319056609.
  46. ^ Gray, Robert M. (2010). "A History of Realtime Digital Speech on Packet Networks: Part II of Linear Predictive Coding and the Internet Protocol" (PDF). Found. Trends Signal Process. 3 (4): 203–303. doi:10.1561/2000000036. ISSN 1932-8346.
  47. ^ أ ب Guckert, John (Spring 2012). "The Use of FFT and MDCT in MP3 Audio Compression" (PDF). University of Utah. Retrieved 14 July 2019.
  48. ^ J. P. Princen, A. W. Johnson und A. B. Bradley: Subband/transform coding using filter bank designs based on time domain aliasing cancellation, IEEE Proc. Intl. Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2161–2164, 1987.
  49. ^ John P. Princen, Alan B. Bradley: Analysis/synthesis filter bank design based on time domain aliasing cancellation, IEEE Trans. Acoust. Speech Signal Processing, ASSP-34 (5), 1153–1161, 1986.
  50. ^ Luo, Fa-Long (2008). Mobile Multimedia Broadcasting Standards: Technology and Practice. Springer Science & Business Media. p. 590. ISBN 9780387782638.
  51. ^ Britanak, V. (2011). "On Properties, Relations, and Simplified Implementation of Filter Banks in the Dolby Digital (Plus) AC-3 Audio Coding Standards". IEEE Transactions on Audio, Speech, and Language Processing. 19 (5): 1231–1241. doi:10.1109/TASL.2010.2087755.
  52. ^ Brandenburg, Karlheinz (1999). "MP3 and AAC Explained" (PDF). Archived (PDF) from the original on 2017-02-13.
  53. ^ "Summary of some of Solidyne's contributions to Broadcast Engineering". Brief History of Solidyne. Buenos Aires: Solidyne. Archived from the original on 8 March 2013. Retrieved 6 March 2013.
  54. ^ Zwicker, Eberhard (1967). The Ear As A Communication Receiver. Melville, NY: Acoustical Society of America. Archived from the original on 2000-09-14. Retrieved 2011-11-11. {{cite book}}: Unknown parameter |displayauthors= ignored (|display-authors= suggested) (help)
  55. ^ "File Compression Possibilities". A Brief guide to compress a file in 4 different ways.
  56. ^ "Video Coding". CSIP website. Center for Signal and Information Processing, Georgia Institute of Technology. Archived from the original on 23 مايو 2013. Retrieved 6 مارس 2013.
  57. ^ Dmitriy Vatolin (March 2007). Lossless Video Codecs Comparison '2007. Moscow State University. Archived from the original. You must specify the date the archive was made using the |archivedate= parameter. http://compression.ru/video/codec_comparison/pdf/msu_lossless_codecs_comparison_2007_eng.pdf. 
  58. ^ Chen, Jie; Koc, Ut-Va; Liu, KJ Ray (2001). Design of Digital Video Coding Systems: A Complete Compressed Domain Approach. CRC Press. p. 71. ISBN 9780203904183.
  59. ^ Li, Jian Ping (2006). Proceedings of the International Computer Conference 2006 on Wavelet Active Media Technology and Information Processing: Chongqing, China, 29-31 August 2006. World Scientific. p. 847. ISBN 9789812709998.
  60. ^ Robinson, A. H.; Cherry, C. (1967). "Results of a prototype television bandwidth compression scheme". Proceedings of the IEEE. IEEE. 55 (3): 356–364. doi:10.1109/PROC.1967.5493.
  61. ^ أ ب Ghanbari, Mohammed (2003). Standard Codecs: Image Compression to Advanced Video Coding. Institution of Engineering and Technology. pp. 1–2. ISBN 9780852967102.
  62. ^ Reader, Cliff (2016-08-31). "Patent landscape for royalty-free video coding". 9971: 99711B, San Diego, California: Society of Photo-Optical Instrumentation Engineers. doi:10.1117/12.2239493.  Lecture recording, from 3:05:10.
  63. ^ أ ب ت ث http://www.real.com/resources/digital-video-file-formats/
  64. ^ "Patent statement declaration registered as H261-07". ITU. Retrieved 11 July 2019.
  65. ^ "MPEG-2 Patent List" (PDF). MPEG LA. Retrieved 7 July 2019.
  66. ^ "MPEG-4 Visual - Patent List" (PDF). MPEG LA. Retrieved 6 July 2019.
  67. ^ "AVC/H.264  – Patent List" (PDF). MPEG LA. Retrieved 6 July 2019.
  68. ^ Chanda P, Bader JS, Elhaik E (27 Jul 2012). "HapZipper: sharing HapMap populations just got easier" (PDF). Nucleic Acids Research. 40 (20): e159. doi:10.1093/nar/gks709. PMC 3488212. PMID 22844100.
  69. ^ Christley S, Lu Y, Li C, Xie X (Jan 15, 2009). "Human genomes as email attachments". Bioinformatics. 25 (2): 274–5. doi:10.1093/bioinformatics/btn582. PMID 18996942.
  70. ^ Pavlichin DS, Weissman T, Yona G (September 2013). "The human genome contracts again". Bioinformatics. 29 (17): 2199–202. doi:10.1093/bioinformatics/btt362. PMID 23793748.
  71. ^ M. Hosseini, D. Pratas, and A. Pinho. 2016. A survey on data compression methods for biological sequences. Information 7(4):(2016): 56
  72. ^ "Data Compression via Logic Synthesis" (PDF).
  73. ^ Hilbert, Martin; López, Priscila (1 April 2011). "The World's Technological Capacity to Store, Communicate, and Compute Information". Science. 332 (6025): 60–65. Bibcode:2011Sci...332...60H. doi:10.1126/science.1200970. PMID 21310967.

وصلات خارجية

قالب:Compression Software Implementations