التعلم الآلي
جزء من سلسلة عن |
التعلم الآلي والتنقيب في البيانات |
---|
جزء من سلسلة عن |
التعلم الآلي والتنقيب في البيانات |
---|
التعلم الآلي Machine learning) ML) هو دراسة خوارزميات الكمبيوتر التي تتحسن تلقائيًا من خلال الخبرة.[1] يُنظر إليه على أنه مجموعة فرعية من الذكاء الاصطناعي. تبني خوارزميات التعلم الآلي نموذجًا رياضيًا استنادًا إلى عينة بيانات ، تُعرف باسم "بيانات التدريب" ، من أجل وضع تنبؤات أو قرارات دون أن تتم برمجتها بشكل صريح للقيام بذلك.[2][3] يتم استخدام خوارزميات التعلم الآلي في مجموعة متنوعة من التطبيقات ، مثل تصفية البريد الإلكتروني و رؤية الكمبيوتر ، حيث يكون من الصعب أو غير العملي تطوير خوارزميات تقليدية لأداء المهام المطلوبة.
يرتبط التعلم الآلي ارتباطًا وثيقًا بـ الإحصائيات الحسابية ، التي تركز على عمل التنبؤات باستخدام أجهزة الكمبيوتر. تقدم دراسة التحسين الرياضي الأساليب والنظرية ومجالات التطبيق في مجال التعلم الآلي. استخراج البيانات هو مجال دراسي ذو صلة ، حيث يركز على تحليل البيانات الاستكشافية من خلال التعلم غير الخاضع للرقابة.[4][5] يُشار إلى التعلم الآلي أيضًا في تطبيقه عبر مسائل الأعمال على أنه تحليلات تنبؤية.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
استعراض
يتضمن التعلم الآلي أجهزة الكمبيوتر التي تكتشف كيف يمكنها أداء المهام دون أن تتم برمجتها بشكل صريح للقيام بذلك. للمهام البسيطة المعينة لأجهزة الكمبيوتر ، من الممكن برمجة خوارزميات تخبر الجهاز بكيفية تنفيذ جميع الخطوات المطلوبة لحل المشكلة في متناول اليد ؛ من جانب الكمبيوتر ، لا حاجة للتعلم. للمهام الأكثر تقدمًا ، قد يكون من الصعب على الإنسان إنشاء الخوارزميات المطلوبة يدويًا. من الناحية العملية ، يمكن أن تكون أكثر فاعلية لمساعدة الآلة على تطوير خوارزمية خاصة بها ، بدلاً من جعل المبرمجين البشر يحددون كل خطوة مطلوبة.[6][7]
يستخدم نظام التعلم الآلي مناهج مختلفة لمساعدة أجهزة الكمبيوتر على تعلم إنجاز المهام حيث لا تتوفر خوارزمية مرضية تمامًا. في الحالات التي توجد فيها أعداد كبيرة من الإجابات المحتملة ، يتمثل أحد الأساليب في تصنيف بعض الإجابات الصحيحة على أنها صالحة. يمكن استخدام هذا بعد ذلك كبيانات تدريب للكمبيوتر لتحسين الخوارزميات التي يستخدمها لتحديد الإجابات الصحيحة. على سبيل المثال ، لتدريب نظام لمهمة التعرف على الأحرف الرقمية ، غالبًا ما يتم استخدام مجموعة بيانات MNIST. [6][7]
أساليب التعلم الآلي
تقسم التصنيفات الأولية لأساليب التعلم الآلي أحيانًا إلى ثلاث فئات عريضة ، اعتمادًا على طبيعة "الإشارة" أو "التغذية العكسية" المتاحة لنظام التعلم. فكانت هذه:
التعلم تحت الإشراف: يتم تقديم الكمبيوتر مع أمثلة المدخلات والمخرجات المطلوبة ، والتي قدمها "المعلّم" ، والهدف هو معرفة قاعدة عامة أن مدخلات الخرائط للمخرجات
التعلم غير الخاضع للأشراف: لا يتم إعطاء تسميات لخوارزمية التعلم ، وتركها بمفردها للعثور على هيكل في مدخلاتها. يمكن أن يكون التعلم غير الخاضع للإشراف هدفًا في حد ذاته (اكتشاف الأنماط المخفية في البيانات) أو وسيلة لتحقيق غاية (ميزة التعلم).
التعلم مع التعزيز: يتفاعل برنامج الكمبيوتر مع البيئة الديناميكية التي يجب أن يؤدي فيها هدفًا معينًا (مثل قيادة مركبة أو لعب لعبة ضد الخصم) أثناء التنقل في فضاء مشكلته أو مسألته الخاصة ، يتم تزويد البرنامج بملاحظات مشابهة للمكافآت ، والتي تحاول تعظيمها. [3]
وقد تطورت أساليب أو عمليات أخرى منذ ذلك الحين لا تتناسب تمامًا مع هذا التصنيف ثلاثي الأبعاد ، وفي بعض الأحيان يتم استخدام أكثر من واحد بواسطة نفس نظام التعلم الآلي. على سبيل المثال نمذجة موضوع ما ، تقليل الأبعاد أو التعلم الخارق. [8] اعتبارًا من عام 2020 ، أصبح التعلم العميق هو الأسلوب السائد لكثير من العمل المستمر و الجاري في مجال التعلم الآلي . [6]
التاريخ والعلاقات مع المجالات الأخرى
آرثر ساميوِل، الريادي الأمريكي في مجال
صُمم مصطلح "التعلم الآلي" في عام 1959 من قبل آرثر صموئيل IBMer الأمريكي الرائد في مجال ألعاب الكمبيوتر و الذكاء الاصطناعي. [9][10] فقد كان كتاب نِلسن عن آلات التعلم الكتاب التمثيلي لبحوث التعلم الآلي خلال الستينيات ، والذي يتعامل في الغالب مع التعلم الآلي لتصنيف الأنماط.[11] استمرت الاهتمامات المتعلقة بالتعرف على الأنماط في السبعينيات ، كما وصفها دودا وهارت في عام 1973. [12] في عام 1981 تم تقديم تقرير عن استخدام استراتيجيات التعليم بحيث تتعلم الشبكة العصبية التعرف على 40 حرفًا (26 حرفًا و 10 أرقام و 4 رموز خاصة) من جهاز كمبيوتر. [13]
قدم توم م. متشل تعريفًا مقتبسًا وأكثر رسمية للخوارزميات التي تمت دراستها في مجال التعلم الآلي: "يُقال أن برنامج الكمبيوتر يتعلم من التجربة E فيما يتعلق ببعض فئات المهام T وقياس الأداء P إذا كان أدائه في المهام في "T" ، كما يقاس بـ "P" ، يتحسن مع التجربة "E"."[14] يقدم هذا التعريف للمهام التي يعنيها التعلم الآلي أساسًا تعريفًا تشغيليًا بدلاً من تحديد المجال من الناحية المعرفية. يتبع ذلك اقتراح آلان تورينج في ورقته "آلات الحوسبة والذكاء" ، التي طرح فيها السؤال "هل يمكن للآلات التفكير؟" يتم استبداله بالسؤال "هل يمكن للآلات أن تفعل ما يمكننا القيام به (ككيانات تفكير)?".[15]
العلاقة مع الذكاء الاصطناعي
كمسعى علمي ، نما التعلم الآلي من البحث عن الذكاء الاصطناعي. في الأيام الأولى من الذكاء الاصطناعي باعتباره انضباط أكاديمي ، كان بعض الباحثين مهتمين بتعلم الآلات من البيانات. حاولوا معالجة المشكلة بأساليب رمزية مختلفة ، وكذلك ما أطلق عليه بعد ذلك "الشبكة العصبية" ؛ كانت هذه في الغالب perceptrons و نماذج أخرى ADALINE التي تم اكتشافها لاحقًا على أنها اختراعات لـ نموذج خطي معمم للإحصاءات.[16] تم استخدام المنطق الاحتمالي أيضاً ، خاصة في التشخيص الطبي الآلي.[17]
ومع ذلك ، أدى التركيز المتزايد على النهج المنطقي القائم على المعرفة إلى حدوث شقاق بين الذكاء الاصطناعي والتعلم الآلي. تعاني الأنظمة الاحتمالية من المشكلات النظرية والعملية للحصول على البيانات وتمثيلها.[17] بحلول عام 1980 ، أصبحت النظم الخبيرة تهيمن على الذكاء الاصطناعي ، وكانت الإحصاءات غير مواتية.[18]استمر العمل في التعلم الرمزي / القائم على المعرفة داخل AI ، مما أدى إلى البرمجة المنطقية الاستقرائية ، ولكن الخط الإحصائي للبحث أصبح الآن خارج مجال الذكاء الاصطناعي الصحيح ، في التعرف على الأنماط و استرجاع المعلومات.[17] تم التخلي عن أبحاث الشبكات العصبية بواسطة الذكاء الاصطناعي و علوم الكمبيوتر في نفس الوقت تقريبًا. هذا الخط ، أيضًا ، استمر خارج مجال الذكاء الاصطناعي / علوم الكمبيوتر ، باسم "اتصالية" ، من قبل باحثين من تخصصات أخرى بما في ذلك هوپفلد ، روملهارت و هنتون. جاء نجاحهم الرئيسي في منتصف الثمانينيات مع إعادة اختراع الانتشار العكسي.[17]
بدأ التعلم الآلي ، الذي أعيد تنظيمه كحقل منفصل ، في الازدهار في التسعينيات. غيّر المجال هدفه من تحقيق الذكاء الاصطناعي إلى معالجة المشاكل القابلة للحل ذات الطبيعة العملية. حولت التركيز بعيدًا عن المقاربات الرمزية التي ورثتها عن الذكاء الاصطناعي ، ونحو الأساليب والنماذج المستعارة من الإحصاءات و نظرية الاحتمالات.[18]اعتبارًا من عام 2019 ، تواصل العديد من المصادر التأكيد على أن التعلم الآلي لا يزال مجالًا فرعيًا للذكاء الاصطناعي. ومع ذلك ، فإن بعض الممارسين ، على سبيل المثال الدكتور دانييل هولم ، الذي يقوم بتدريس الذكاء الاصطناعي ويدير شركة تعمل في هذا المجال ، و الذي يجادل بأن التعلم الآلي والذكاء الاصطناعي منفصلان. [7][19][6]
علاقة الاستكشاف والبحث عن البيانات
غالبًا ما يستخدم التعلم الآلي و استخراج البيانات نفس الأساليب و يتداخلان بشكل كبير ، ولكن بينما يركز التعليم الآلي على التنبؤ ، استنادًا إلى الخصائص "المعروفة" و التي تم الاستفادة منها من بيانات التدريب ، [يركز] استخراج البيانات على الاكتشاف للخصائص (غير المعروفة سابقًا) في البيانات (هذه هي خطوة التحليل لـ اكتشاف المعرفة في قواعد البيانات). تستخدم عملية اكتشاف و التنقيب عن البيانات العديد من أساليب التعلم الآلي ، لكن مع أهداف مختلفة ؛ من ناحية أخرى ، يستخدم التعلم الآلي أيضًا أساليب استخراج البيانات كـ "تعلم غير خاضع للإشراف" أو كخطوة قبل المعالجة لتحسين دقة المتعلم. الكثير من الالتباس بين هاتين المجموعتين من البحوث (التي غالباً ما يكون لها مؤتمرات منفصلة ومجلات منفصلة ، ECML PKDD كونها استثناءً رئيسيًا) يأتي من الافتراضات الأساسية التي تعمل بها: في التعلم الآلي ، يتم تقييم الأداء عادةً بالأخذ بعين الاعتبار "إعادة إنتاج إدراكاً أو علماً معروفاً" ، بينما في اكتشاف المعرفة واستخراج البيانات (KDD) المهمة الأساسية هي اكتشاف علماً أو إدراكاً "غير معروفاً" سابقًا. عند تقييمها فيما يتعلق بالعلم المعروف، سيتم بسهولة تفوق طريقة (غير خاضعة للإشراف أو غير مراقبة) و غير معروفة بطرق أخرى خاضعة للإشراف ، بينما في مهمة KDD النموذجية، لا يمكن استخدام الطرق الخاضعة للإشراف بسبب عدم توفر بيانات التدريب.
العلاقة بعملية التحسين
يرتبط التعليم الآلي أيضًا بعلاقة قوية بـ التحسين: حيث تم صياغة العديد من مشكلات التعلم كتقليل لبعض دالة الخسارة و الضياع على مجموعة من الأمثلة التدريبية. تعبر وظائف أو توابع الخسارة عن التناقضات بين تنبؤات النموذج الذي يتم تدريبه وحالات المشكلة الفعلية (على سبيل المثال ، في التصنيف ، يريد المرء تعيين تسمية للحالات ، ويتم تدريب النماذج على التنبؤ بشكل صحيح بالتسميات المعينة مسبقًا لمجموعة من أمثلة). ينشأ الاختلاف بين الحقلين من هدف التعميم: في حين أن خوارزميات التحسين يمكن أن تقلل من الخسارة في مجموعة التدريب ، بينما يهتم التعلم الآلي بتقليل الخسارة في العينات غير المرئية.[20]
العلاقات الإحصائية
يرتبط مجال التعلم الآلي بمجال الإحصائيات ارتباطًا وثيقًا من حيث الطرق و النظريات ، لكنهما تتميزان في هدفهما الرئيسي:حيث أن الإحصائيات تجذب قطاع السكان من خلال الاستدلالات من نموذج ، في حين تجد الآلة أن التعلم يتطلب أنماطًا تنبؤية قابلة للتعميم. [21] وفقًا لـ Michael I. Jordan ، تم استنباط أفكار التعلم الآلي ، من المبادئ المنهجية إلى الأدوات النظرية ، و كان لها تاريخ طويل في الإحصاء.[22] قام أيضاً باقتراح مصطلح علم البيانات كعنصر نائب لاستدعاء كامل الحقل .[22]
قام ليو بريمان بالتمييز بين نمطين للنمذجة الإحصائية و هما : نموذج البيانات ونموذج الخوارزمية ،[23] هذا يعني أن مصطلح "نموذج الخوارزمية" يعني أكثر أو أقل من خوارزميات التعلم الآلي مثل مجموعة عشوائية.
اعتمد بعض الإحصائيين على أساليب من التعلم الآلي ، مما أدى إلى الحصول على حقل مشترك سمي "بالتعلم الإحصائي"'.[24]
أنواع الخوارزميات
- التعلم الخاضع للإشراف يقوم بتوليد وظيفة تقوم بتخطيط المدخلات للمخرجات المطلوبة. على سبيل المثال ، في مسألة تصنيف ، يقارب المتعلم دالة ما تقابل بدورها متجهًا إلى فئات و طبقات من خلال النظر في أمثلة المدخلات والمخرجات للدالة.
- التعلم غير الخاضع للإشراف يمثل مجموعة من المدخلات ، مثل التجميع.
- تعليم شبه خاضع للإشراف يجمع بين كلا من الأمثلة المصنفة وغير المُعلَّمة لإنشاء وظيفة أو مصنف مناسب.
- التعلم التعزيز يتعلم هذاالنوع كيفية التصرف مع ملاحظة الجو المحيط . فكل إجراء له بعض التأثير في البيئة المحيطة ، وتوفر هذه البيئة ملاحظات و نتائج في شكل مكافآت (تغذية عكسية) تقوم بتوجيه خوارزمية التعلم.
- التوضيح يحاول هذا النوع بالتنبؤ بمخرجات جديدة بناءً على مدخلات التدريب ونتائج التدريب ومدخلات الاختبار.
- تعلم التعلم فتتعلم التحيز الاستقرائي الخاص بها بناءً على التجربة السابقة.
النظرية
الهدف الأساسي للمتعلم هو التعميم من تجربته.[3][25] التعميم في هذا السياق هو قدرة جهاز التعلم على الأداء بدقة في أمثلة / مهام جديدة غير مرئية بعد تجربة مجموعة بيانات تعليمية. وتأتي أمثلة التدريب من توزيع الاحتمالات الغير المعروف بشكل عام (الذي يُعتبر ممثلاً لفضاء الحوادث) وعلى المتعلم بناء نموذج عام حول هذه المساحة يمكّنه من إنتاج تنبؤات دقيقة بما فيه الكفاية عند وجود حالات جديدة.
التحليل الحسابي لخوارزميات التعلم الآلي وأدائها هو فرع من علوم الكمبيوتر النظرية المعروفة باسم نظرية التعلم الحسابية. نظرًا لأن مجموعات التدريب محدودة و مستقبل ذلك غير مؤكد ، فإن نظرية التعلم عادة لا تقدم ضمانات لأداء الخوارزميات. بدلاً من ذلك ، تعتبر الحدود الاحتمالية للأداء شائعة جدًا. يعد تحلل التباين - التباين إحدى الطرق لتحديد تعميم الأخطاء والمخلفات أو رواسب عملية ما.
للحصول على أفضل أداء في سياق التعميم ، يجب أن يتطابق تعقيد الفرضية مع تعقيد الوظيفة التي تقوم عليها البيانات. إذا كانت الفرضية أقل تعقيدًا من الوظيفة ، فإن النموذج يكون مناسبًا للبيانات. إذا تم زيادة تعقيد النموذج استجابةً لذلك ، فسيقل خطأ التدريب. ولكن إذا كانت الفرضية معقدة للغاية ، فسيكون النموذج عرضة لـ التركيب بشكل زائد وسيضعف مستوى التعميم .[26]
بالإضافة إلى حدود الأداء ، يدرس الباحثون في المجال النظري من التعلم الحسابي تعقيد الوقت وجدوى التعلم. في نظرية التعلم الحسابي ، يعتبر الحساب ممكنًا إذا كان يمكن القيام به في وقت كثير الحدود. هناك نوعان من نتائج تعقيد الوقت. تظهر النتائج الإيجابية على أنه يمكن تعليم فئة معينة من الوظائف في وقت متعدد الحدود. في حين تشير النتائج السلبية إلى أنه لا يمكن تعليم بعض الفئات في وقت كثير الحدود.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
المقاربات
أنواع خوارزميات التعلم
تختلف أنواع خوارزميات التعلم الآلي في أسلوبها ونوع البيانات التي تقوم بإدخالها وإخراجها ونوع المهمة أو المشكلة التي تهدف إلى حلها.
التعلم تحت المراقبة و الإشراف
تقوم خوارزميات التعلم الخاضعة للإشراف و المراقبة بإنشاء نموذج رياضي لمجموعة من البيانات و التي تحتوي على كل من المدخلات والمخرجات المطلوبة.[27] تُعرف البيانات باسم بيانات التدريب training data، وتتكون من مجموعة من الأمثلة التدريبية. لكل مثال تدريب واحد أو أكثر من المدخلات والمخرجات المطلوبة ، والمعروف أيضا باسم إشارة إشرافية أو إشارة مراقبة. في النموذج الرياضي ، يتم تمثيل كل مثال تدريبي بواسطة نسَق أو متجه ، يُسمى أحيانًا متجه المعالم ، ويتم تمثيل بيانات التدريب بواسطة مصفوفة . من خلال التحسين المكرر و المعاد ل دالة موضوعية ، تقوم خوارزميات التعلم الخاضعة للإشراف بتعلم وظيفة ما يمكن استخدامها للتنبؤ بالمخرجات المرتبطة بمدخلات جديدة.[28] تسمح الوظيفة الأمثلية للخوارزمية بتحديد إخراج المدخلات التي لم تكن جزءًا من بيانات التدريب بشكل صحيح. يقال إن الخوارزمية التي تعمل على تحسين دقة مخرجاتها أو تنبؤاتها بمرور الوقت بأنها تعلمت القيام بهذه المهمة.[14] تتضمن خوارزميات التعلم الخاضعة للإشراف كل من التصنيف و الانحدار.[29]تُستخدم خوارزميات التصنيف عندما تقتصر المخرجات على مجموعة محدودة من القيم ، ويتم استخدام خوارزميات الانحدار عندما يكون للنواتج أي قيمة عددية داخل نطاق ما. تشابه التعلم عبارة عن مجال للتعلم الآلي الخاضع للإشراف و الذي يرتبط ارتباطًا وثيقًا بالانحدار والتصنيف ، لكن هدف ذلك هو التعلم من الأمثلة باستخدام دالة التشابه التي تقيس مدى تشابه أو تشابه موضوعين معينين . لدى هذه الخوارزميات تطبيقات في الترتيب ، أنظمة التوصية، وتتبع الهوية المرئية ، والتحقق من الوجوه ، والتحقق من الناطق أو مصدر الصوت. في حالة خوارزميات التعلم نصف الإشراف ، تفتقد بعض الأمثلة التدريبية إلى علامات التدريب ، ولكن مع ذلك يمكن استخدامها لتحسين جودة النموذج. في حالة التعلم الخاضع للإشراف ضعيف، إما أن تصبح علامات التدريب واضحة أو محدودة أو غير دقيقة ؛ ومع ذلك ، غالبًا ما يصبح الحصول على هذه العلامات أسهل ، مما ينتج عنه مجموعات تدريب ذات فعالية أكبر.[30]
التعلم الغير خاضع للإشراف و المراقبة
تأخذ خوارزميات التعلم غير الخاضعة للرقابة مجموعة من البيانات التي تحتوي على مدخلات فقط ، وتجد بنية في هذه البيانات ، مثل تجميع نقاط البيانات أو تركيبها . لذلك تتعلم هذه الخوارزميات من بيانات الاختبار التي لم يتم وضعها بعلامة أو تبويبها أو تصنيفها .و بدلاً من الاستجابة للنتائج العكسية ، تحدد خوارزميات التعلم غير الخاضعة للرقابة القواسم المشتركة في البيانات وتتفاعل بناءً على وجود أو عدم وجود مثل هذه القواسم المشتركة في كل جزء جديد من البيانات. حيث يوجد تطبيق مركزي للتعلم غير الخاضع للإشراف في مجال تقدير الكثافة density estimation و في إحصائيات statistics,[31] , و كذلك فإن التعلم غير الخاضع للإشراف يشمل مجالات أخرى تتضمن تلخيص وشرح ميزات البيانات.
التحليل المُجمع عبارة عن تخصيص مجموعة من الملاحظات في مجموعات فرعية (تسمى "كتل") بحيث تكون هذه الملاحظات داخل المجموعة نفسها متشابهة وفقًا لمعيار واحد أو أكثر محدد مسبقًا ، في حين تختلف الملاحظات المستقاة من مجموعات مختلفة . و تقوم تقنيات التجميع المختلفة بافتراضات مختلفة حول بنية البيانات ، وغالبًا ما يتم تعريفها بواسطة بعض "مقياس التشابه" ويتم تقييمها ، على سبيل المثال ، بواسطة "التوافق الداخلي" ، أو التشابه بين أعضاء المجموعة نفسها ، " الفصل " ، والفرق بين المجموعات .في حين تعتمد الطرق الأخرى على "الكثافة المُقدرة" و "اتصال الرسم البياني".
التعلم النصف مراقَب
يقع التعلم شبه الخاضع للإشراف بين التعلم غير الخاضع للرقابة (بدون أي بيانات تدريب مصنفة) و التعلم الخاضع للإشراف (مع بيانات التدريب المصنفة بالكامل). تفتقد بعض أمثلة التدريب إلى علامات التدريب ، إلا أن العديد من الباحثين في مجال التعلم الآلي وجدوا أن البيانات غير المصنفة ، عند استخدامها جنبًا إلى جنب مع كمية صغيرة من البيانات المصنفة ، يمكن أن تؤدي إلى تحسن كبير في دقة التعلم.
في التعلم الضعيف الإشراف ، تكون مصنفات التدريب مشوشة أو محدودة أو غير دقيقة ؛ ومع ذلك ، غالبًا ما يكون الحصول على هذه المصنفات أسهل ، مما يؤدي إلى مجموعات تدريب فعالة أكبر.[32]
التعلم المعزز
تعلم المعزز أو المقوى عبارة عن مجال من تعلم الآلة يهتم بكيفية أخذ وكلاء البرمجيات الإجراءات في بيئة ما من أجل تعظيم مفهوم المكافأة التراكمية. نظرًا لعموميته ، تتم دراسة الحقل في العديد من التخصصات الأخرى ، مثل نظرية التشغيل ، نظرية التحكم، بحوث العمليات ، نظرية المعلومات، التحسين القائم على المحاكاة ، نظام متعدد الوكلاء ، سرب أو حشد الذكاء ، الإحصائيات و الخوارزميات الوراثية . ففي التعلم الآلي ، يتم تمثيل البيئة بشكل نموذجي عملية اتخاذ القرار في (Markov (MDP . حيث تستخدم العديد من خوارزميات التعلم المعزز البرمجة الديناميكية.[33]لا تفترض خوارزميات التعلم المعزز معرفة نموذج رياضي دقيق لـ MDP ، ويتم استخدامها عند صعوبة الحصول على نماذج دقيقة . تستخدم خوارزميات التعلم المعزز و المقوى في المركبات ذاتية الحكم أو في تعلم لعب لعبة ضد خصم بشري.
التعلم الذاتي
تم تقديم نموذج التعلم الذاتي كنموذج للتعلم الآلي في عام 1982 مع شبكة عصبية قادرة على التعلم الذاتي باسم Crossbar Adaptive Array (CAA). [34]إنه تعلم بدون مكافآت خارجية ولا يوجد نصائح و تدخلات من معلمين خارجيين.حيث تحسب خوارزمية التعلم الذاتي في CAA ، بطريقة عرضية ، من القرارات المتعلقة بالإجراءات والعواطف (المشاعر) بشأن نتائج المواقف و الحالات. يقاد هذا النظام عن طريق التفاعل بين الإدراك والعاطفة. [35]
تقوم خوارزمية التعلم الذاتي بتحديث مصفوفة ذاكرة W = || w (a، s) || بحيث يتم تنفيذ روتين التعلم الآلي التالي في كل تكرار: في الموقف s يتم تنفيذ الإجراء a تلقي نتيجة الموقف 's حساب العاطفة من كونها نتيجة موقف v(s’) ؛ تحديث الذاكرة العرضية w '(a، s) = w (a، s) + v (s').
إنه نظام يحتوي على إدخال واحد فقط ، وموقف ، ومخرج واحد فقط ، أو إجراء (أو سلوك) واحد. لا يوجد مدخل تعزيز منفصل ولا مشورة أو تدخل من البيئة المحيطة . القيمة الخلفية (التعزيز الثانوي) هي العاطفة تجاه نتيجة الموقف . يوجد المرجع المصدق (CAA) في بيئتين ، أحدهما بيئة سلوكية حيث يقوم بالتصرف ، والآخر هو بيئة وراثية ، حيث يتلقى منها في البداية وفقط مرة واحدة العواطف الأولية حول المواقف التي يجب مواجهتها في البيئة السلوكية. بعد تلقي ناقل الجينوم (الأنواع) من البيئة الوراثية ، يتعلم الجهاز المركزي للمحاسبات سلوكًا يبحث عن هدف ، في بيئة تحتوي على مواقف مرغوبة وغير مرغوب فيها. [36]
التعلم المميز
تهدف العديد من خوارزميات التعلم إلى اكتشاف تمثيل و تصوير أفضل للمدخلات المقدمة أثناء التدريب.[37]تشمل الأمثلة الكلاسيكية كل من تحليل المكونات الرئيسية وتحليل الكتلة. غالبًا ما تحاول خوارزميات التعلم المميزة ، والتي تسمى أيضًا خوارزميات تعلم التمثيل ، الحفاظ على المعلومات في مدخلاتها وأيضًا تحويلها بطريقة تجعلها مفيدة ،و ذلك يتم غالبًا كخطوة ما قبل المعالجة و قبل إجراء التصنيف أو التنبؤات . تتيح هذه التقنية إعادة بناء المدخلات الواردة من التوزيع غير المعروف لتوليد البيانات ، بينما لا تطابق بالضرورة للتكوينات غير المحتملة ضمن هذا التوزيع . يحل هذا محل الدليل هندسة الميزات ، ويسمح للآلة بتعلم الميزات واستخدامها لأداء مهمة محددة.
التعلم المميز يمكن أن يكون إما تحت المراقبة أو غير خاضع للرقابة . في التعلم الميز الخاضع للإشراف و المراقبة ، يتم تعليم الميزات باستخدام بيانات المدخلات ذات العلامات . ومن الأمثلة على ذلك الشبكة العصبية الاصطناعية ، و الإدراك المتعدد الطبقات ، والإشراف على تعلم القاموس . أما في تعلم الميزات غير الخاضعة للرقابة ، يتم تعليم الميزات باستخدام بيانات الإدخال غير المسماة. ومن الأمثلة على ذلك تعلم القاموس ، تحليل مكون مستقل ، التشفير التلقائي ، مصفوفة عامل [38] وأشكال مختلفة من التجميع.[39][40][41]
تحاول خوارزميات التعلم المنوع المتشعب Manifold learning القيام بذلك في ظل القيد القائل بأن التمثيل المتعلم منخفض الأبعاد. في حين تحاول الخوارزميات الترميز المتناثر و الضئيل Sparse coding القيام بذلك في ظل القيد القائل بأن التمثيل المتعلم هو متفرق ، مما يعني أن النموذج الرياضي له العديد من الأصفار. تهدف خوارزميات تعلم الفضاء الفرعي متعدد الخطوط إلى تعلم التمثيلات المنخفضة الأبعاد مباشرةً من تمثيلات مجموعة كتجهات للبيانات متعددة الأبعاد ، دون إعادة تشكيلها في متجهات ذات أبعاد أعلى.[42] تكشف خوارزميات التعلم العميق مستويات متعددة من التمثيل ، أو تسلسل هرمي من الميزات ، مع مميزات المستوى الأعلى وأكثر تجريدية محددة من حيث (أو إنشاء) ميزات المستوى الأدنى . لذلك فإن الآلة الذكية هي الآلة التي تتعلم التمثيل الذي يفسر العوامل الكامنة وراء الاختلاف التي تفسر البيانات التي تم ملاحظتها .[43]
يتم تحفيز التعلم المميز من خلال حقيقة أن مهام التعلم الآلي ، مثل التصنيف ، غالبًا ما تتطلب مدخلات ملائمة رياضياً وحسابياً للمعالجة. ومع ذلك ، فإن بيانات العالم الحقيقي ، مثل الصور والفيديو والبيانات الحسية ، لم تسفر عن محاولةً لتحديد ميزات محددة حسابيًا. البديل هو اكتشاف مثل هذه الميزات أو التمثيلات من خلال الفحص ، دون الاعتماد على خوارزميات واضحة.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
التعلم من قاموس نحيل
يعد تعلم القاموس المتناثر أو النحيل طريقة تعلم مميزة حيث يتم تمثيل مثال تدريبي على أنه مزيج خطي من دالة الأساس، ويُفترض أنه مصفوفة متفرقة متناثرة . الطريقة هي NP-hard الفعالة strongly NP-hard ويصعب حلها تقريبًا.[44]الطريقة الشائعة ارشاد و المساعدة على الكشف لتعلم القاموس المتناثر هي خوارزمية K-SVD. تم تطبيق تعلم القاموس المتناثر في العديد من السياقات. في عملية التصنيف ، تكمن المشكلة في تحديد الفصل الذي ينتمي إليه مثال التدريب غير المرئي سابقًا. بالنسبة لقاموس تم فيه بناء كل فصل بالفعل ، يرتبط كل مثال تدريبي جديد بالفصل الذي يتم تمثيله بشكل أفضل من خلال القاموس المقابل . تم تطبيق تعلم القاموس المتناثر أيضًا في تنقية الصورة. الفكرة الأساسية هي أنه يمكن تمثيل تصحيح صورةما بشكل ضئيل بواسطة قاموس صور ، لكن لا يمكن ذلك في حالة الضجيج .[45]
إكتشاف الشذوذ
في استخراج البيانات data mining، يُعرف كشف الشذوذ أيضًا باسم الاكتشاف الخارجي ،و هو تحديد العناصر النادرة أو الأحداث أو الملاحظات التي تثير الشكوك من خلال الاختلاف بشكل كبير عن غالبية البيانات.[46] عادة ، تمثل العناصر الشاذة مشكلة مثل التزوير المصرفي bank fraud ، عيب هيكلي ، مشاكل طبية أو أخطاء في النص . يشار إلى الحالات الشاذة بـ outlier s ، المستجدات ، والضوضاء ، والانحرافات والاستثناءات.[47]
على وجه الخصوص ، في سياق إساءة الاستخدام واكتشاف اختراق الشبكة ، لا تكون المواضيع المثيرة للاهتمام في كثير من الأحيان أهداف نادرة ، ولكنها حركات غير متوقعة في النشاط. لا يلتزم هذا النمط بالتعريف الإحصائي الشائع للمصدر الخارجي باعتباره موضوعاً نادرًا ، وستفشل العديد من طرق الكشف الخارجي (خاصة الخوارزميات غير الخاضعة للإشراف) في هذه البيانات ، ما لم يتم تجميعها بشكل مناسب. بدلاً من ذلك ، قد تتمكن خوارزمية تحليل الكتلة من اكتشاف المجموعات الصغيرة التي تشكلها هذه الأنماط.[48]
يوجد ثلاث فئات واسعة من تقنيات الكشف عن الشذوذ .[49]تكشف تقنيات الكشف عن الحالات الشاذة غير الخاضعة للرقابة عن الحالات الشاذة في مجموعة بيانات الاختبار غير المسماة وفقًا لافتراض أن غالبية الحالات في مجموعة البيانات طبيعية ، من خلال البحث عن الحالات التي تبدو أقل ملاءمة لبقية مجموعة البيانات. تتطلب تقنيات الكشف عن الحالات الشاذة الخاضعة للإشراف مجموعة بيانات تم تصنيفها على أنها "طبيعية" و "غير طبيعية" وتتضمن تدريب مصنف ما (الاختلاف الرئيسي للعديد من مشكلات التصنيف الإحصائي الأخرى هو الطبيعة غير المتوازنة الكامنة للكشف المذهل). تقوم تقنيات الكشف عن الحالات الشاذة تحت الإشراف ببناء نموذج يمثل السلوك الطبيعي من مجموعة بيانات تدريب معيّنة ، ثم يختبر احتمال ظهور نسخة اختبار من النموذج.
تعلم الروبوت
في الروبوتات التطويرية ، تولد خوارزميات تعلم الروبوت تسلسلاتها الخاصة من تجارب التعلم ، والمعروفة أيضًا بالمنهج الدراسي ، لاكتساب مهارات جديدة بشكل تراكمي من خلال الاستكشاف الموجه ذاتيًا والتفاعل الاجتماعي مع البشر. تستخدم هذه الروبوتات آليات إرشادية مثل التعلم النشط والنضج التآزر الحركي والتقليد.
قواعد الربط
تعتبر طريقة تعلُّم قاعدة الارتباط تعلم الآلة استنادًا إلى القواعد لاكتشاف العلاقات بين المتغيرات في قواعد البيانات الكبيرة. الغرض منه هو تحديد القواعد القوية المكتشفة في قواعد البيانات باستخدام مقدار من "الاهتمام".[50] التعلم الآلي المستند إلى القواعد هو مصطلح عام لأي طريقة تعلم آلي تحدد "القواعد" أو تتعلمها أو تطورها لتخزين المعرفة أو معالجتها أو تطبيقها. السمة المميزة لخوارزمية التعلم الآلي المستندة إلى القواعد هي تحديد واستخدام مجموعة من القواعد العلائقية التي تمثل مجتمعةً المعرفة التي اكتسبها النظام. هذا على عكس خوارزميات التعلم الآلي الأخرى التي تحدد عادة نموذجًا فرديًا يمكن تطبيقه عالميًا على أي حالة من أجل إجراء تنبؤ ما.[51]تشمل أساليب تعلم الآلة القائمة على القواعد أنظمة تصنيف التعلم ، وتعلم قواعد الارتباط ، و أنظمة التحصين الاصطناعية. استنادًا إلى مفهوم القواعد المتينة ، قدّم كل من راكش آگراول و توماس إميلنسكي و آرن سوامي قواعداً للارتباط لاكتشاف الانتظام بين المنتجات في بيانات المعاملات واسعة النطاق المسجلة بواسطة نقاط البيع في محلات السوبر ماركت.[52]على سبيل المثال ، تشير القاعدة الموجودة في بيانات مبيعات سوبر ماركت إلى أنه إذا قام العميل بشراء البصل والبطاطس معًا ، من المحتمل أن يشتروا أيضًا لحم الهامبرغر. يمكن استخدام هذه المعلومات كأساس لاتخاذ القرارات المتعلقة بأنشطة التسويق ، مثل التسعير أو أماكن المنتجات. بالإضافة إلى تحليل سلة السوق ، تُستخدم قواعد الارتباط اليوم في مجالات التطبيق بما في ذلك استخدام الكشف في الويب و كشف الاحتيال و الانتاج المستمر و المعلوماتية الحيوية. على النقيض من اكتشاف التتابع ، عادةً لا يتم الأخذ بعين الاعتبار ترتيب العناصر في تعلم قاعدة الارتباط بل إما داخل الإجراء أو عبر هذا الإجراء. تعد أنظمة تصنيف التعلم (LCS) مجموعة من خوارزميات تعلم الآلة التي تعتمد على القواعد والتي تجمع بين مكون الاكتشاف ، عادةً ما تؤدي الخوارزمية الوراثية ، مع مكون تعليمي ، إما إلى التعلم الخاضع للإشراف ، التعلم المعزز ، أو التعلم غير الخاضع للإشراف. حيث تم السعي إلى تحديد مجموعة من القواعد المعتمدة على السياق التي تخزن وتطبِّق بشكل جماعي المعرفة أو العلم بطريقة مجزأة من أجل إجراء التنبؤات.[53] البرمجة المنطقية الاستقرائية (ILP) عبارة عن طريقة لتعلم القواعد باستخدام البرمجة المنطقية كتمثيل موحد لأمثلة المدخلات والمعرفة الأساسية والفرضيات. نظرًا لعملية تشفير الخلفية المعرفية المتعارف عليها مع مجموعة من الأمثلة الممثلة كقاعدة بيانات منطقية للوقائع ، فإن نظام ILP سيستمد برنامج منطق مفترضًا يستلزم جميع الأمثلة الإيجابية وليس السلبية. أما البرمجة الاستقرائية هو حقل ذو صلة يأخذ في الاعتبار أي نوع من لغات البرمجة لتمثيل الفرضيات (وليس فقط البرمجة المنطقية) ، مثل البرمجة الوظيفية. تفيد برمجة المنطق الاستقرائي بشكل خاص في المعلوماتية الحيوية و معالجة اللغة الطبيعية. حيث وضع كل من گوردون پلوتكين و إيهود شاپيرو الأساس النظري الأولي لتعليم الآلة كيفية الاستقراء ضمن بيئة منطقية.[54][55][56] بنى شاپيرو أول تطبيق له (نظام الاستدلال النموذجي) في عام 1981: برنامج Prolog الذي استنتج برامج المنطق بشكل استقرائي من الأمثلة الإيجابية والسلبية.[57]يشير المصطلح الاستقرائي هنا إلى الفلسفي ، ويقترح نظرية لتفسير الحقائق التي تم ملاحظتها ، بدلاً من الرياضيات ، مما يثبت الخاصية لجميع أعضاء المجموعة المنظمة.
النماذج
ينطوي أداء التعلم الآلي على إنشاء Statistical model|model ، والذي يتم تدريبه على بعض بيانات التدريب ومن ثم يمكنه معالجة بيانات إضافية لصنع تنبؤات. و تم استخدام أنواع مختلفة من النماذج والأبحاث في أنظمة التعلم الآلي.
الشبكات العصبية الاصطناعية
تعد خوارزمية التعلم الشبكة العصبية الاصطناعية (ANN)، أو أنظمة الارتباطية ، فأنظمة الحوسبة مستوحاة بشكل غامض من الشبكة العصبية البيولوجية التي تشكل [عقل] الكائن ."تتعلم" مثل هذه الأنظمة أداء المهام من خلال النظر في الأمثلة ، بشكل عام دون أن تكون مبرمجة مع كل القواعد الخاصة بالمهمة المطلوبة . ANN هو نموذج يستند إلى مجموعة من الوحدات أو العقد المرتبطة تسمى "عصبونات اصطناعية، والتي تقوم بنمذجة بشكل واسع للعصبون neuron في بيولوجية الدماغ. كل اتصال ، مثل المشابك في الدماغ بيولوجي ، يمكن أن ينقل المعلومات ، "إشارة" ، من خلية عصبية صناعية إلى أخرى. يمكن للخلية العصبية الاصطناعية التي تستقبل إشارة أن تعالجها ثم تشير إلى خلايا عصبية اصطناعية إضافية متصلة بها. في تطبيقات ANN الشائعة ، تكون الإشارة في اتصال بين الخلايا العصبية الاصطناعية رقم حقيقي، ويتم حساب ناتج كل خلية عصبية اصطناعية بواسطة وظيفة غير خطية لمجموع مدخلاتها. وتسمى الروابط بين الخلايا العصبية الاصطناعية "الحواف". عادة ما يكون للخلايا العصبية والحواف الاصطناعية وزن يتم ضبطه مع استمرار التعلم. يزيد الوزن أو يقلل من قوة الإشارة عند الاتصال. قد يكون للخلايا العصبية الاصطناعية عتبة بحيث لا يتم إرسال الإشارة إلا إذا تجاوزت الإشارة الكلية تلك العتبة. عادة ، يتم تجميع الخلايا العصبية الاصطناعية في طبقات. قد تقوم الطبقات المختلفة بإجراء أنواع مختلفة من التحويلات على مدخلاتها. تنتقل الإشارات من الطبقة الأولى (طبقة الإدخال) ، إلى الطبقة الأخيرة (طبقة الإخراج) ، وربما بعد اجتياز الطبقات عدة مرات. الهدف الأصلي لنهج ANN هو حل المشكلات بالطريقة نفسها التي يقوم بهاالدماغ البشري. ومع ذلك ، فبمرور الوقت ، انتقل التركيز إلى أداء مهام محددة ، مما أدى إلى الانحرافات عن البيولوجيا. تم استخدام الشبكات العصبية الاصطناعية في مجموعة متنوعة من المهام ، بما في ذلك رؤية الكمبيوتر ، التعرف على الكلام، الترجمة الألية ، ترشيح الشبكة الاجتماعية ، لوحة اللعب وألعاب الفيديو والتشخيص الطبي. التعلم العميق يتكون من طبقات متعددة مخفية في شبكة عصبية اصطناعية. تحاول هذه المقاربة نمذجة الطريقة التي يعالج بها الدماغ البشري الضوء والصوت في الرؤية والسمع. بعض التطبيقات الناجحة للتعلم العميق هي رؤية الكمبيوتر و التعرف على الكلام.[58]
شجرة القرارات
يتم استخدام تعلم شجرة القرار شجرة القرار كنموذج نموذج تنبؤي ، والذي يقوم بتخطيط الملاحظات حول عنصر ما (ممثلة في الفروع) لاستنتاج قيمة هدف هذا العنصر (ممثلة في الأوراق). إنه أحد أساليب النمذجة التنبؤية المستخدمة في الإحصاء واستخراج البيانات والتعلم الآلي.في نماذج الشجرة يمكن للمتغير المستهدف أن يأخذ مجموعة منفصلة من القيم تسمى أشجار التصنيف ؛ ففي هذه الهياكل الشجرية ، ورقة العقدة leaf node تمثل تسميات الفصل وتمثل الفروع المنطق الاقتراني من الميزات التي تؤدي إلى تسميات هذه الفئة. تسمى أشجار القرار حيث يمكن للمتغير المستهدف أن يأخذ قيمًا مستمرة عادةً أرقام حقيقية أشجار الانحدار. في تحليل القرار ، يمكن استخدام شجرة القرارات لتمثيل القرارات بشكل مرئي وصريح و صنع القرار . في استخراج البيانات ، تصف شجرة القرارات البيانات ، لكن يمكن أن تكون تصنيفات النتائج كدخل لاتخاذ القرارت.
التعلم العميق
أسهم انخفاض أسعار الأجهزة وتطوير GPU للاستخدام الشخصي في السنوات القليلة الماضية في تطوير مفهوم التعلم العميق الذي يتكون من طبقات مخفية متعددة في شبكة عصبية اصطناعية. تحاول هذه المقاربة نمذجة الطريقة التي يعالج بها الدماغ البشري الضوء والصوت في الرؤية والسمع. بعض التطبيقات الناجحة للتعلم العميق هي رؤية الكمبيوتر و التعرف على الكلام.[59]
برمجة المنطق الاستقرائي
البرمجة المنطقية الاستقرائية (ILP) هي طريقة لتعلم القواعد باستخدام البرمجة المنطقية كتمثيل موحد لأمثلة المدخلات والمعرفة الأساسية والفرضيات. نظرًا لتشفير علية الإدراك الأساسية المعروفة ومجموعة من الأمثلة الممثلة كقاعدة بيانات منطقية للوقائع ، فإن نظام ILP سوف يستنتج برنامج منطق مفترضًا يستلزم جميع الأمثلة الإيجابية وليس السلبية. فالبرمجة الاستقرائية عبارة عن حقل ذو صلة يأخذ في الاعتبار أي نوع من لغات البرمجة لتمثيل الفرضيات (وليس فقط البرمجة المنطقية) ، مثل البرامج الوظيفية.
آلات متجهات الدعم
تعد آلات متجه الدعم (SVM) ، والمعروفة أيضًا باسم شبكات متجهات الدعم ، عبارة عن مجموعة من الطرق ذات الصلة بالتعليم الخاضع للإشراف المستخدمة في التصنيف والانحدار. نظرًا لمجموعة من الأمثلة التدريبية ، يتم تمييز كل منها على أنه ينتمي إلى إحدى الفئتين ، تقوم خوارزمية تدريب SVM بإنشاء نموذج يتنبأ بما إذا كان مثال جديد يقع في فئة أو أخرى.[60] تعتبر خوارزمية تدريب SVM غير احتمالي ، ثنائي ، مصنف خطي ، على الرغم من وجود طرق مثل مقياس پلات لاستخدام SVM في إحتمالية وضع التصنيف. بالإضافة إلى إجراء التصنيف الخطي ، يمكن لأدوات SVM إجراء تصنيف غير خطي بكفاءة باستخدام ما يسمى بـ kernel trick ، معيّنًا ضمنيًا مدخلاتها في مسافات ميزة عالية الأبعاد.
الشبكات البايزية
شبكة البايزية، أو شبكة المعتقدات أو النموذج الرسومي غير الحلقي هو نموذج رسومي احتمالي يمثل مجموعة من متغيرات عشوائية و استقلالات مشروطة عبر موجّه الرسم البياني الحادّ (DAG). على سبيل المثال ، يمكن أن تمثل شبكة بايزي العلاقات الاحتمالية بين الأمراض (الاعتلال) والأعراض . بالنظر إلى الأعراض ، يمكن استخدام الشبكة لحساب احتمالات وجود أخطاء (اعتلالات) مختلفة. في حين توجد خوارزميات فعالة تؤدي للاستدلال والتعلم. لدينا الشبكات البايزية التي تنمذج تتابعاً من المتغيرات ، مثل إشارات الكلام أو سلاسل البروتين ، شبكة بايزي الحيوية. تسمى تعميمات الشبكات البايزية التي يمكنها تمثيل وحل مشاكل القرار في ظل عدم اليقين مخطط التأثير .
الخوارزميات الجينية
الخوارزمية الجينية (GA) هي خوارزمية بحث و إرشادية التي تحاكي عملية الانتقاء الطبيعي ، باستخدام طرق مثل طفرة و عبور لتوليد كرموسومات وراثية) جديدة على أمل إيجاد حلول جيدة لمشكلة معينة. في التعلم الآلي ، تم استخدام الخوارزميات الجينية في الثمانينيات والتسعينيات.[61][62] على العكس من ذلك ، تم استخدام تقنيات التعلم الآلي لتحسين أداء الخوارزميات الجينية و [[التطورية] .[63]
نماذج التدريب
عادة ما تتطلب نماذج التعلم الآلي الكثير من البيانات من أجل أن تقدم أداءً جيداً . فعند تدريب نموذج التعلم الآلي ، نيحتاج إلى جمع عينة تمثيلية كبيرة من البيانات من مجموعة التدريب. يمكن أن تكون البيانات من مجموعة التدريب متنوعة مثل مجموعة نصوص ومجموعة صور والبيانات التي تم جمعها من المستخدمين الفرديين للخدمة . يجب الانتباه إلى زيادة التركيب Overfitting عند تدريب نموذج للتعلم الآلي .
التعلم الموحد
يعد التعليم الموحد طريقة جديدة لتدريب نماذج التعلم الآلي التي تعمل على جعل العملية التدريبية غير مركزية ، مما يسمح بصيانة خصوصية المستخدمين من خلال عدم الحاجة إلى إرسال بياناتهم إلى مخدم مركزي . مما يزيد أيضاً من الكفاءة عن طريق تطبيق اللامركزية في عملية التدريب على العديد من الأجهزة. على سبيل المثال ، يستخدم Gboard تعلمًا آليًا متحدًا لتدريب نماذج تنبؤ استعلام البحث على هواتف المستخدمين المحمولة دون الحاجة إلى إرسال عمليات بحث فردية مرة أخرى إلى Google.[64]
التطبيقات
هنالك العديد من التطبيقات التعلم الآلي ، بما في ذلك:
- Precision agriculture الزراعة الدقيقة
- Computational anatomy التشريح
- Adaptive websites المواقع المتكيفة
- Affective computing الحوسبة ذات التأثير
- Banking الخدمات المصرفية
- Bioinformatics المعلوماتية الحيوية
- Brain–machine interfaces واجهات الدماغ-الآلة
- Cheminformatics معلوماتية كيميائية
- Network simulation|Computer Networks محاكاة الشبكات
- Computer vision رؤية الكمبيوتر
- Credit-card fraud detection كشف الاحتيال في بطاقة الائتمان
- Data quality جودة البيانات
- DNA sequence classification تصنيف تسلسل الحمض النووي
- Computational economicsالاقتصاد الحسابي
- Financial market analysis تحليل السوق المالية
- General game playing اللعب بألعاب و مباريات عامة
- Handwriting recognition التعرف على خط اليد
- Information retrieval استرجاع المعلومات
- Insurance التأمين
- Internet fraud detection كشف احتيالات الانترنت
- Computational linguistics علم اللغويات الحاسوبية
- Machine learning control التحكم بتعلم الآلة
- Machine perception إدراك الآلة
- Machine translation ترجمة الآلة
- Marketing التسويق
- Automated medical diagnosis|Medical diagnosis التشخيص الطبي الآلي
- Natural language processing معالجة البرمجة اللغوية العصبية
- Natural language understanding فهم اللغة الطبيعية
- Online advertising اعلانات الانترنت
- Mathematical optimization التحسين الرياضي
- Recommender systems أنظمة التوصية
- Robot locomotion تنقل الروبوت
- Search engines محركات البحث
- Sentiment analysis تحليل المشاعر
- Sequence mining التنقيب عن السلاسل
- Software engineering هندسة البرمجيات
- Speech recognition التعرف على الكلام
- Structural health monitoring مراقبة الصحة البنيوية
- Syntactic pattern recognition التعرف على الأنماط النحوية
- Telecommunication الاتصالات
- Automated theorem proving إثبات نظرية التحكم الآلي
- Time series forecasting التنبؤ بسلسلة زمنية
- User behavior analytics تحليل سلوك المستخدم
في عام 2006 ، عقد موفر خدمات الوسائط Netflix أول مسابقة "Netflix Prize" للعثور على برنامج للتنبؤ بشكل أفضل بتفضيلات المستخدم وتحسين الدقة في خوارزمية توصيات الأفلام الحالية من Cinematch بنسبة 10٪ على الأقل . فريق مشترك يتكون من باحثين من AT&T Labs - قام البحث بالتعاون مع فرق Big Chaos و نظرية براگماتية ببناء نموذج المجموعة للفوز بالجائزة الكبرى في عام 2009 مقابل مليون دولار.[65] بعد فترة وجيزة من منح الجائزة ، أدركت Netflix أن تقييمات المشاهدين لم تكن أفضل المؤشرات لأنماط المشاهدة الخاصة بهم ("كل شيء توصية") وقاموا بتغيير محرك التوصيات وفقًا لذلك.[66] في عام 2010 ، كتبت صحيفة وول ستريت جورنال عن شركة Rebellion Research واستخدامهم للتعلم الآلي للتنبؤ بالأزمة المالية.[67] في عام 2012 ، توقع المؤسس المشارك لـ Sun Microsystems ، ڤينود خوسلا ، فقدان 80٪ من وظائف الأطباء في العقدين المقبلين بسبب برامج التشخيص الطبي الآلي للتعلم الآلي.[68] في عام 2014 ، أفيد أنه تم تطبيق خوارزمية التعلم الآلي في مجال تاريخ الفن لدراسة اللوحات الفنية الجميلة ، وربما كشفت عن تأثيرات غير معروفة سابقًا بين الفنانين.[69] في عام 2019 ، نشرت Springer Nature أول كتاب بحث تم إنشاؤه باستخدام التعلم الآلي.[70]
القيود
على الرغم من أن التعلم الآلي قد تحول في بعض المجالات ، إلا أن برامج التعلم الآلي غالباً ما تفشل في تحقيق النتائج المتوقعة.[71][72][73] أسباب ذلك عديدة: نقص البيانات (المناسبة) ، عدم الوصول إلى البيانات ، تحيز البيانات ، مشاكل الخصوصية ، المهام والخوارزميات التي تم اختيارها بشكل سيئ ، الأدوات الخاطئة والأشخاص ، نقص الموارد ، ومشاكل التقييم.[74]
في عام 2018 ، فشلت سيارة ذاتية القيادة من أوبر Uber في اكتشاف أحد المشاة ،و الذي قُتل بعد تصادم .[75] فشلت محاولات استخدام التعلم الآلي في الرعاية الصحية مع نظام IBM Watson حتى بعد سنوات ومليارات من الاستثمار.[76][77]
الانحياز
أساليب التعلم الآلي على وجه الخصوص يمكن أن تعاني من تحيزات البيانات المختلفة. قد لا يتمكن نظام التعلم الآلي الذي تم تدريبه على العملاء الحاليين من التنبؤ باحتياجات مجموعات العملاء الجديدة غير الممثلة في بيانات التدريب. عند التدريب على البيانات التي من صنع الإنسان ، من المرجح أن يلتقط التعلم الآلي نفس التحيزات الدستورية واللاواعية الموجودة بالفعل في المجتمع.[78]تبين أن نماذج اللغة المستفادة من البيانات تحتوي على تحيزات تشبه تحيزات الإنسان.[79][80] وتم العثور على أنظمة التعلم الآلي المستخدمة لتقييم المخاطر الجنائية المنحازة ضد السود.[81][82] في عام 2015 ، كانت صور Google غالبًا ما تضع علامة على السود على أنهم غوريلا,[83]وفي عام 2018 ، لم يتم حل هذا الأمر بشكل جيد ، ولكن Google كانت لا تزال تستخدم الحل البديل لإزالة جميع الغوريلا من بيانات التدريب ، وبالتالي لم تتمكن من التعرف على الغوريلا الحقيقية على الإطلاق.[84]تم العثور أيضاً على مشكلات مماثلة في التعرف على الأشخاص غير البيض في العديد من الأنظمة الأخرى.[85] في عام 2016 ، قامت Microsoft باختبار chatbot التي تعلمتها من Twitter ، وسرعان ما التقطت اللغة العنصرية والجنسية.[86] بسبب هذه التحديات ، قد يستغرق الاستخدام الفعال للتعلم الآلي وقتًا أطول ليتم اعتماده في مجالات أخرى.[87]يتزايد اهتمام علماء الذكاء الاصطناعي ، بما في ذلك Fei-Fei Li ، من الحد من التحيز في التعلم الآلي ودفع استخدامه للصالح الإنساني ، بما في ذلك Fei-Fei Li الذي يذكر المهندسين بأنه "لا يوجد شيء مصطنع حول الذكاء الاصطناعي ... إنه مستوحى من الناس ، تم إنشاؤه من قبل الناس ، والأهم من ذلك ، أنها تؤثر على الناس ، إنها أداة قوية بدأنا للتو في فهمها ، وهي مسؤولية عميقة.”[88]
التقييمات النموذجية
يمكن التحقق من صحة نماذج تعلم آلة التصنيف عن طريق تقنيات تقدير الدقة مثل مجموعة الاختبار ، التي تقسم البيانات في مجموعة تدريب واختبار (عادةً مجموعة تدريب 2/3 وتعيين 1/3 مجموعة اختبار) وتقييم أداء نموذج التدريب على مجموعة الاختبار. بالمقارنة ، فإن K-fold - cross-validation تقوم بشكل عشوائي بتقسيم البيانات إلى مجموعات فرعية K ثم يتم إجراء تجارب K كل على التوالي مع الأخذ في الاعتبار مجموعة فرعية واحدة للتقييم والمجموعات الفرعية المتبقية من K-1 لتدريب النموذج. بالإضافة إلى طرق التعليق والتحقق المتبادل ، يمكن استخدام bootstrap ، التي تعيّن n عينات مع الاستبدال من مجموعة البيانات ، لتقييم دقة النموذج.[89] بالإضافة إلى الدقة الكلية ، يبلغ الباحثون كثيرًا عن الحساسية والنوعية بمعنى المعدل الإيجابي الحقيقي (TPR) والمعدل السلبي الحقيقي (TNR) على التوالي. وبالمثل ،و يبلغ الباحثون أحيانًا عن معدل الخطأ الإيجابية (FPR) بالإضافة إلى الخطأ السالب للمعدل (FNR). ومع ذلك ، فإن هذه المعدلات هي النسب التي تفشل في الكشف عن البسط والمقام . تعد إجمالي خصائص التشغيلة(TOC) طريقة فعالة للتعبير عن القدرة التشخيصية للنموذج. جدول المحتويات يوضح البسط والمقام للمعدلات المذكورة سابقًا ، وهكذا يوفر TOC مزيدًا من المعلومات أكثر من خصائص تشغيل المستقبِل الشائعة (ROC) والمساحة المرتبطة بها تحت المنحنى (AUC).[90]
آداب العمل
يطرح التعلم الآلي مجموعة من الأسئلة الأخلاقية. قد تظهر الأنظمة التي تم تدريبها على مجموعات البيانات التي تم جمعها بالتحيزات عند الاستخدام (الانحياز الحسابي) ، وبالتالي رقمنة التحيزات الثقافية.[91]على سبيل المثال ، قد يؤدي استخدام بيانات التوظيف من شركة لها سياسات توظيف عنصري إلى وجود نظام تعليمي آلي يكرر التحيز عن طريق تسجيل المتقدمين للوظيفة مقابل التشابه مع المتقدمين الناجحين السابقين.[92][93] المسؤول عن جمع البيانات وتوثيق القواعد الخوارزمية المستخدمة من قبل نظام هو جزء حساس من التعلم الآلي.نظرًا لأن اللغات البشرية تحتوي على تحيزات ، فإن الآلات المدربة على اللغة corpora ستتعلم حكماً هذه التحيزات.[94] هناك أشكال أخرى من التحديات الأخلاقية ، لا تتعلق بالتحيزات الشخصية ،حيث يتم رؤيتها بشكل أكبر في الرعاية الصحية. هناك مخاوف بين المتخصصين في الرعاية الصحية من أن هذه الأنظمة قد لا تكون مصممة للمصلحة العامة ، ولكن كآلات مدرة للدخل. هذا صحيح بشكل خاص في الولايات المتحدة حيث توجد معضلة أخلاقية دائمة لتحسين الرعاية الصحية ، ولكن أيضًا زيادة الأرباح. على سبيل المثال ، يمكن تصميم الخوارزميات لتزويد المرضى بفحوصات أو أدوية لا لزوم لها يمتلك فيها مالكو الخوارزمية حصصًا. هناك إمكانية هائلة للتعلم الآلي في مجال الرعاية الصحية لتزويد المهنيين بأداة رائعة للتشخيص والعلاج وحتى التخطيط مسارات الشفاء للمرضى ، ولكن هذا لن يحدث حتى تتم معالجة التحيز الشخصي "الجشع" المذكور سابقًا حيث يتم التعامل مع هذه التحيزات.[95]
البرمجيات
مجموعة البرامج Software suites التي تحتوي على مجموعة متنوعة من خوارزميات التعلم الآلي تشمل ما يلي:
البرمجيات المجانية والمفتوحة المصدر
- CNTK
- Deeplearning4j
- ELKI
- Keras
- Caffe
- ML.NET
- Mahout
- Mallet
- mlpack
- MXNet
- Neural Lab
- GNU Octave
- OpenNN
- Orange
- scikit-learn
- Shogun
- Spark MLlib
- Apache SystemML
- TensorFlow
- ROOT (TMVA with ROOT)
- Torch / PyTorch
- Weka / MOA
- Yooreeka
- R
برامج ذات حقوق ملكية مع إصدارات مجانية ومفتوحة المصدر
برامج ذات حقوق ملكية
- Amazon Machine Learning
- Angoss KnowledgeSTUDIO
- Azure Machine Learning
- Ayasdi
- IBM Data Science Experience
- Google Prediction API
- IBM SPSS Modeler
- KXEN Modeler
- LIONsolver
- Mathematica
- MATLAB
- Microsoft Azure Machine Learning
- Neural Designer
- NeuroSolutions
- Oracle Data Mining
- Oracle AI Platform Cloud Service
- RCASE
- SAS Enterprise Miner
- SequenceL
- Splunk
- STATISTICA Data Miner
المجلات
- Journal of Machine Learning Research
- Machine Learning
- Nature Machine Intelligence
- Neural Computation
المؤتمرات
نرى أيضا
المراجع
- ^ http://www.cs.cmu.edu/~tom/mlbook.html
- ^ The definition "without being explicitly programmed" is often attributed to Arthur Samuel, who coined the term "machine learning" in 1959, but the phrase is not found verbatim in this publication, and may be a paraphrase that appeared later. Confer "Paraphrasing Arthur Samuel (1959), the question is: How can computers learn to solve problems without being explicitly programmed?" in Koza, John R. (1996). "Automated Design of Both the Topology and Sizing of Analog Electrical Circuits Using Genetic Programming" in Artificial Intelligence in Design '96.: 151–170, Springer, Dordrecht. doi:10.1007/978-94-009-0279-4_9.
- ^ أ ب ت ث Bishop, C. M. (2006), Pattern Recognition and Machine Learning, Springer, ISBN 0-387-31073-8
- ^ Machine learning and pattern recognition "can be viewed as two facets of the same field."[3]
- ^ Friedman, Jerome H. (1998). "Data Mining and Statistics: What's the connection?". Computing Science and Statistics. 29 (1): 3–9.
- ^ أ ب ت ث Ethem Alpaydin (2020). Introduction to Machine Learning (Fourth ed.). MIT. pp. xix, 1–3, 13–18. ISBN 0262043793.
- ^ أ ب ت "The Elements of AI". University of Helsinki. Dec 2019. Retrieved 7 April 2020.
- ^ Metalearning: Applications to Data Mining (Fourth ed.). Springer Science+Business Media. 2009. pp. 10–14, passim. ISBN 3540732624.
{{cite book}}
: Cite uses deprecated parameter|authors=
(help) - ^ Samuel, Arthur (1959). "Some Studies in Machine Learning Using the Game of Checkers". IBM Journal of Research and Development. 3 (3): 210–229. CiteSeerX 10.1.1.368.2254. doi:10.1147/rd.33.0210.
- ^ R. Kohavi and F. Provost, "Glossary of terms," Machine Learning, vol. 30, no. 2–3, pp. 271–274, 1998.
- ^ Nilsson N. Learning Machines, McGraw Hill, 1965.
- ^ Duda, R., Hart P. Pattern Recognition and Scene Analysis, Wiley Interscience, 1973
- ^ S. Bozinovski "Teaching space: A representation concept for adaptive pattern classification" COINS Technical Report No. 81-28, Computer and Information Science Department, University of Massachusetts at Amherst, MA, 1981. https://web.cs.umass.edu/publication/docs/1981/UM-CS-1981-028.pdf
- ^ أ ب Mitchell, T. (1997). Machine Learning. McGraw Hill. p. 2. ISBN 978-0-07-042807-2.
- ^ Harnad, Stevan (2008), "The Annotation Game: On Turing (1950) on Computing, Machinery, and Intelligence", in Epstein, Robert; Peters, Grace, The Turing Test Sourcebook: Philosophical and Methodological Issues in the Quest for the Thinking Computer, Kluwer, pp. 23–66, ISBN 9781402067082
- ^ قالب:Cite citeseerx
- ^ أ ب ت ث قالب:Cite AIMA
- ^ أ ب Langley, Pat (2011). "The changing science of machine learning". Machine Learning. 82 (3): 275–279. doi:10.1007/s10994-011-5242-y.
- ^ "Satalia CEO Daniel Hulme has a plan to overcome the limitations of machine learning". Techworld. October 2019. Retrieved 7 April 2020.
- ^ Le Roux, Nicolas; Bengio, Yoshua; Fitzgibbon, Andrew (2012). "Improving First and Second-Order Methods by Modeling Uncertainty". In Sra, Suvrit; Nowozin, Sebastian; Wright, Stephen J. (eds.). Optimization for Machine Learning. MIT Press. p. 404.
- ^ Bzdok, Danilo; Altman, Naomi; Krzywinski, Martin (2018). "الإحصائيات مقابل Machine Machine". Nature Methods. 15 (4): 233–234. doi:10.1038 / nmeth.4642. PMC 6082636. PMID 30100822.
{{cite journal}}
: Check|doi=
value (help) - ^ أ ب Michael I. Jordan (2014-09-10). "statistics and machine learning". reddit. Retrieved 2014-10-01.
- ^ Cornell University Library. "Breiman: Statistical Modeling: The Two Cultures (with comments and a rejoinder by the author)". Retrieved 8 August 2015.
- ^ Gareth James; Daniela Witten; Trevor Hastie; Robert Tibshirani (2013). An Introduction to Statistical Learning. Springer. p. vii.
- ^ قالب:Cite Mehryar Afshin Ameet 2012
- ^ Alpaydin, Ethem (2010). Introduction to Machine Learning. London: The MIT Press. ISBN 978-0-262-01243-0. Retrieved 4 February 2017.
- ^ Russell, Stuart J.; Norvig, Peter (2010). Artificial Intelligence: A Modern Approach (Third ed.). Prentice Hall. ISBN 9780136042594.
- ^ Mohri, Mehryar; Rostamizadeh, Afshin; Talwalkar, Ameet (2012). Foundations of Machine Learning. The MIT Press. ISBN 9780262018258.
- ^ Alpaydin, Ethem (2010). Introduction to Machine Learning. MIT Press. p. 9. ISBN 978-0-262-01243-0.
- ^ Alex Ratner, Stephen Bach, Paroma Varma, Chris Ré And referencing work by many other members of Hazy Research. "Weak Supervision: The New Programming Paradigm for Machine Learning". hazyresearch.github.io. Retrieved 2019-06-06.
{{cite web}}
: CS1 maint: multiple names: authors list (link) - ^ Jordan, Michael I.; Bishop, Christopher M. (2004). "Neural Networks". In Allen B. Tucker (ed.). Computer Science Handbook, Second Edition (Section VII: Intelligent Systems). Boca Raton, Florida: Chapman & Hall/CRC Press LLC. ISBN 978-1-58488-360-9.
- ^ Alex Ratner; Stephen Bach; Paroma Varma; Chris. "Weak Supervision: The New Programming Paradigm for Machine Learning". hazyresearch.github.io. referencing work by many other members of Hazy Research. Retrieved 2019-06-06.
- ^ van Otterlo, M.; Wiering, M. (2012). Reinforcement learning and markov decision processes. Adaptation, Learning, and Optimization. Vol. 12. pp. 3–42. doi:10.1007/978-3-642-27645-3_1. ISBN 978-3-642-27644-6.
{{cite book}}
:|journal=
ignored (help) - ^ Bozinovski, S. (1982). "A self learning system using secondary reinforcement" . In Trappl, Robert (ed.). Cybernetics and Systems Research: Proceedings of the Sixth European Meeting on Cybernetics and Systems Research. North Holland. pp. 397–402. ISBN 978-0-444-86488-8.
- ^ Bozinovski, Stevo (2014) "Modeling mechanisms of cognition-emotion interaction in artificial neural networks, since 1981." Procedia Computer Science p. 255-263
- ^ Bozinovski, S. (2001) "Self-learning agents: A connectionist theory of emotion based on crossbar value judgment." Cybernetics and Systems 32(6) 637-667.
- ^ Y. Bengio; A. Courville; P. Vincent (2013). "Representation Learning: A Review and New Perspectives". IEEE Transactions on Pattern Analysis and Machine Intelligence. 35 (8): 1798–1828. arXiv:1206.5538. doi:10.1109/tpami.2013.50. PMID 23787338.
- ^ {{cite comultilayer perceptronsnference |author1=Nathan Srebro |author2=Jason D. M. Rennie |author3=Tommi S. Jaakkola |title=Maximum-Margin Matrix Factorization |conference=NIPS |year=2004}}
- ^ (2011) "An analysis of single-layer networks in unsupervised feature learning" in Int'l Conf. on AI and Statistics (AISTATS)..
- ^ (2004) "Visual categorization with bags of keypoints" in ECCV Workshop on Statistical Learning in Computer Vision..
- ^ Daniel Jurafsky; James H. Martin (2009). Speech and Language Processing. Pearson Education International. pp. 145–146.
- ^ Lu, Haiping; Plataniotis, K.N.; Venetsanopoulos, A.N. (2011). "A Survey of Multilinear Subspace Learning for Tensor Data" (PDF). Pattern Recognition. 44 (7): 1540–1551. doi:10.1016/j.patcog.2011.01.004.
- ^ Yoshua Bengio (2009). Learning Deep Architectures for AI. Now Publishers Inc. pp. 1–3. ISBN 978-1-60198-294-0.
- ^ Tillmann, A. M. (2015). "On the Computational Intractability of Exact and Approximate Dictionary Learning". IEEE Signal Processing Letters. 22 (1): 45–49. arXiv:1405.6664. Bibcode:2015ISPL...22...45T. doi:10.1109/LSP.2014.2345761.
- ^ Aharon, M, M Elad, and A Bruckstein. 2006. "K-SVD: An Algorithm for Designing Overcomplete Dictionaries for Sparse Representation." Signal Processing, IEEE Transactions on 54 (11): 4311–4322
- ^ Zimek, Arthur; Schubert, Erich (2017) (in en), Outlier Detection, Springer New York, pp. 1–5, doi: , ISBN 9781489979933
- ^ Hodge, V. J.; Austin, J. (2004). "A Survey of Outlier Detection Methodologies" (PDF). Artificial Intelligence Review. 22 (2): 85–126. CiteSeerX 10.1.1.318.4023. doi:10.1007/s10462-004-4304-y.
- ^ Dokas, Paul; Ertoz, Levent; Kumar, Vipin; Lazarevic, Aleksandar; Srivastava, Jaideep; Tan, Pang-Ning (2002). "Data mining for network intrusion detection" (PDF). Proceedings NSF Workshop on Next Generation Data Mining.
- ^ Chandola, V.; Banerjee, A.; Kumar, V. (2009). "Anomaly detection: A survey". ACM Computing Surveys. 41 (3): 1–58. doi:10.1145/1541880.1541882.
- ^ Piatetsky-Shapiro, Gregory (1991), Discovery, analysis, and presentation of strong rules, in Piatetsky-Shapiro, Gregory; and Frawley, William J.; eds., Knowledge Discovery in Databases, AAAI/MIT Press, Cambridge, MA.
- ^ Bassel, George W.; Glaab, Enrico; Marquez, Julietta; Holdsworth, Michael J.; Bacardit, Jaume (2011-09-01). "Functional Network Construction in Arabidopsis Using Rule-Based Machine Learning on Large-Scale Data Sets". The Plant Cell (in الإنجليزية). 23 (9): 3101–3116. doi:10.1105/tpc.111.088153. ISSN 1532-298X. PMC 3203449. PMID 21896882.
- ^ Agrawal, R.; Imieliński, T.; Swami, A. (1993). "Mining association rules between sets of items in large databases". Proceedings of the 1993 ACM SIGMOD international conference on Management of data - SIGMOD '93. p. 207. CiteSeerX 10.1.1.40.6984. doi:10.1145/170035.170072. ISBN 978-0897915922.
- ^ Urbanowicz, Ryan J.; Moore, Jason H. (2009-09-22). "Learning Classifier Systems: A Complete Introduction, Review, and Roadmap". Journal of Artificial Evolution and Applications (in الإنجليزية). 2009: 1–25. doi:10.1155/2009/736398. ISSN 1687-6229.
{{cite journal}}
: CS1 maint: unflagged free DOI (link) - ^ Plotkin G.D. Automatic Methods of Inductive Inference, PhD thesis, University of Edinburgh, 1970.
- ^ Shapiro, Ehud Y. Inductive inference of theories from facts, Research Report 192, Yale University, Department of Computer Science, 1981. Reprinted in J.-L. Lassez, G. Plotkin (Eds.), Computational Logic, The MIT Press, Cambridge, MA, 1991, pp. 199–254.
- ^ Shapiro, Ehud Y. (1983). Algorithmic program debugging. Cambridge, Mass: MIT Press. ISBN 0-262-19218-7
- ^ Shapiro, Ehud Y. "The model inference system." Proceedings of the 7th international joint conference on Artificial intelligence-Volume 2. Morgan Kaufmann Publishers Inc., 1981.
- ^ Honglak Lee, Roger Grosse, Rajesh Ranganath, Andrew Y. Ng. "Convolutional Deep Belief Networks for Scalable Unsupervised Learning of Hierarchical Representations" Proceedings of the 26th Annual International Conference on Machine Learning, 2009.
- ^ Honglak Lee, Roger Grosse, Rajesh Ranganath, Andrew Y. Ng. "Convolutional Deep Belief Networks for Scalable Unsupervised Learning of Hierarchical Representations" Proceedings of the 26th Annual International Conference on Machine Learning, 2009.
- ^ Cortes, Corinna; Vapnik, Vladimir N. (1995). "Support-vector networks". Machine Learning. 20 (3): 273–297. doi:10.1007/BF00994018.
- ^ Goldberg, David E.; Holland, John H. (1988). "Genetic algorithms and machine learning" (PDF). Machine Learning. 3 (2): 95–99. doi:10.1007/bf00113892.
- ^ Michie, D.; Spiegelhalter, D. J.; Taylor, C. C. (1994). "Machine Learning, Neural and Statistical Classification". Ellis Horwood Series in Artificial Intelligence. Bibcode:1994mlns.book.....M.
- ^ Zhang, Jun; Zhan, Zhi-hui; Lin, Ying; Chen, Ni; Gong, Yue-jiao; Zhong, Jing-hui; Chung, Henry S.H.; Li, Yun; Shi, Yu-hui (2011). "Evolutionary Computation Meets Machine Learning: A Survey". Computational Intelligence Magazine. 6 (4): 68–75. doi:10.1109/mci.2011.942584.
- ^ "Federated Learning: Collaborative Machine Learning without Centralized Training Data". Google AI Blog (in الإنجليزية). Retrieved 2019-06-08.
- ^ "BelKor Home Page" research.att.com
- ^ "The Netflix Tech Blog: Netflix Recommendations: Beyond the 5 stars (Part 1)". 2012-04-06. Archived from the original on 31 May 2016. Retrieved 8 August 2015.
- ^ Scott Patterson (13 July 2010). "Letting the Machines Decide". The Wall Street Journal. Retrieved 24 June 2018.
- ^ Vinod Khosla (January 10, 2012). "Do We Need Doctors or Algorithms?". Tech Crunch.
- ^ When A Machine Learning Algorithm Studied Fine Art Paintings, It Saw Things Art Historians Had Never Noticed, The Physics at ArXiv blog
- ^ Vincent, James (2019-04-10). "The first AI-generated textbook shows what robot writers are actually good at". The Verge. Retrieved 2019-05-05.
- ^ "Why Machine Learning Models Often Fail to Learn: QuickTake Q&A". Bloomberg.com. 2016-11-10. Retrieved 2017-04-10.
- ^ "The First Wave of Corporate AI Is Doomed to Fail". Harvard Business Review. 2017-04-18. Retrieved 2018-08-20.
- ^ "Why the A.I. euphoria is doomed to fail". VentureBeat (in الإنجليزية الأمريكية). 2016-09-18. Retrieved 2018-08-20.
- ^ "9 Reasons why your machine learning project will fail". www.kdnuggets.com (in الإنجليزية الأمريكية). Retrieved 2018-08-20.
- ^ "Why Uber's self-driving car killed a pedestrian". The Economist (in الإنجليزية). Retrieved 2018-08-20.
- ^ "IBM's Watson recommended 'unsafe and incorrect' cancer treatments - STAT". STAT (in الإنجليزية الأمريكية). 2018-07-25. Retrieved 2018-08-21.
- ^ Hernandez, Daniela; Greenwald, Ted (2018-08-11). "IBM Has a Watson Dilemma". Wall Street Journal (in الإنجليزية الأمريكية). ISSN 0099-9660. Retrieved 2018-08-21.
- ^ Garcia, Megan (2016). "Racist in the Machine". World Policy Journal (in الإنجليزية). 33 (4): 111–117. doi:10.1215/07402775-3813015. ISSN 0740-2775.
- ^ Caliskan, Aylin; Bryson, Joanna J.; Narayanan, Arvind (2017-04-14). "Semantics derived automatically from language corpora contain human-like biases". Science (in الإنجليزية). 356 (6334): 183–186. arXiv:1608.07187. Bibcode:2017Sci...356..183C. doi:10.1126/science.aal4230. ISSN 0036-8075. PMID 28408601.
- ^ Wang, Xinan; Dasgupta, Sanjoy (2016), Lee, D. D.; Sugiyama, M.; Luxburg, U. V. et al., eds., An algorithm for L1 nearest neighbor search via monotonic embedding, Curran Associates, Inc., pp. 983–991, http://papers.nips.cc/paper/6227-an-algorithm-for-l1-nearest-neighbor-search-via-monotonic-embedding.pdf, retrieved on 2018-08-20
- ^ "Machine Bias". ProPublica. Julia Angwin, Jeff Larson, Lauren Kirchner, Surya Mattu. 2016-05-23. Retrieved 2018-08-20.
{{cite web}}
: CS1 maint: others (link) - ^ "Opinion | When an Algorithm Helps Send You to Prison". New York Times (in الإنجليزية). Retrieved 2018-08-20.
- ^ "Google apologises for racist blunder". BBC News (in الإنجليزية البريطانية). 2015-07-01. Retrieved 2018-08-20.
- ^ "Google 'fixed' its racist algorithm by removing gorillas from its image-labeling tech". The Verge. Retrieved 2018-08-20.
- ^ "Opinion | Artificial Intelligence's White Guy Problem". New York Times (in الإنجليزية). Retrieved 2018-08-20.
- ^ Metz, Rachel. "Why Microsoft's teen chatbot, Tay, said lots of awful things online". MIT Technology Review (in الإنجليزية). Retrieved 2018-08-20.
- ^ Simonite, Tom. "Microsoft says its racist chatbot illustrates how AI isn't adaptable enough to help most businesses". MIT Technology Review (in الإنجليزية). Retrieved 2018-08-20.
- ^ Hempel, Jessi (2018-11-13). "Fei-Fei Li's Quest to Make Machines Better for Humanity". Wired. ISSN 1059-1028. Retrieved 2019-02-17.
- ^ Kohavi, Ron (1995). "A Study of Cross-Validation and Bootstrap for Accuracy Estimation and Model Selection" (PDF). International Joint Conference on Artificial Intelligence.
- ^ Pontius, Robert Gilmore; Si, Kangping (2014). "The total operating characteristic to measure diagnostic ability for multiple thresholds". International Journal of Geographical Information Science. 28 (3): 570–583. doi:10.1080/13658816.2013.862623.
- ^ Bostrom, Nick (2011). "The Ethics of Artificial Intelligence" (PDF). Retrieved 11 April 2016.
- ^ Edionwe, Tolulope. "The fight against racist algorithms". The Outline. Retrieved 17 November 2017.
- ^ Jeffries, Adrianne. "Machine learning is racist because the internet is racist". The Outline. Retrieved 17 November 2017.
- ^ Narayanan, Arvind (August 24, 2016). "Language necessarily contains human biases, and so will machines trained on language corpora". Freedom to Tinker.
- ^ Char, D. S.; Shah, N. H.; Magnus, D. (2018). "Implementing Machine Learning in Health Care—Addressing Ethical Challenges". New England Journal of Medicine. 378 (11): 981–983. doi:10.1056/nejmp1714229. PMC 5962261. PMID 29539284.
المزيد من القراءات
- Nils J. Nilsson, Introduction to Machine Learning.
- Trevor Hastie, Robert Tibshirani and Jerome H. Friedman (2001). The Elements of Statistical Learning, Springer. ISBN 0-387-95284-5.
- Pedro Domingos (September 2015), The Master Algorithm, Basic Books, ISBN 978-0-465-06570-7
- Ian H. Witten and Eibe Frank (2011). Data Mining: Practical machine learning tools and techniques Morgan Kaufmann, 664pp., ISBN 978-0-12-374856-0.
- Ethem Alpaydin (2004). Introduction to Machine Learning, MIT Press, ISBN 978-0-262-01243-0.
- David J. C. MacKay. Information Theory, Inference, and Learning Algorithms Cambridge: Cambridge University Press, 2003. ISBN 0-521-64298-1
- Richard O. Duda, Peter E. Hart, David G. Stork (2001) Pattern classification (2nd edition), Wiley, New York, ISBN 0-471-05669-3.
- Christopher Bishop (1995). Neural Networks for Pattern Recognition, Oxford University Press. ISBN 0-19-853864-2.
- Stuart Russell & Peter Norvig, (2009). Artificial Intelligence – A Modern Approach. Pearson, ISBN 9789332543515.
- Ray Solomonoff, An Inductive Inference Machine, IRE Convention Record, Section on Information Theory, Part 2, pp., 56–62, 1957.
- Ray Solomonoff, An Inductive Inference Machine A privately circulated report from the 1956 Dartmouth Summer Research Conference on AI.
روابط خارجية
- International Machine Learning Society
- mloss is an academic database of open-source machine learning software.
- Machine Learning Crash Course by Google. This is a free course on machine learning through the use of TensorFlow.
- CS1 errors: deprecated parameters
- CS1 errors: DOI
- CS1 errors: periodical ignored
- CS1 maint: unflagged free DOI
- CS1 الإنجليزية الأمريكية-language sources (en-us)
- CS1 maint: others
- CS1 الإنجليزية البريطانية-language sources (en-gb)
- Articles with hatnote templates targeting a nonexistent page
- Missing redirects
- Articles with long short description
- Short description is different from Wikidata
- تعلم آلي
- تعلم
- Cybernetics