التعلم الآلي (ML) هو فئة فرعية من الذكاء الاصطناعي (AI) التي تبني نماذج خوارزمية لتحديد الأنماط والعلاقات في البيانات.
في هذا السياق، تعد كلمة “الآلة” مرادفًا لبرنامج الكمبيوتر وتصف كلمة التعلم كيف تصبح خوارزميات ML أكثر دقة لأنها تتلقى بيانات إضافية.
إن هذا المفهوم ليس جديدًا، لكن تطبيقه العملي في الأعمال التجارية لم يكن ممكنًا من الناحية المالية حتى ظهور الإنترنت والتطورات الأخيرة في تحليلات البيانات الضخمة والحوسبة السحابية.
وذلك لأن تدريب خوارزمية تعلم الآلة للعثور على أنماط في البيانات يتطلب الكثير من موارد الحوسبة والوصول إلى البيانات الضخمة.
تُستخدم مصطلحات الذكاء الاصطناعي والتعلم الآلي أحيانًا كمرادفات لأنه حتى وقت قريب، كانت معظم مبادرات الذكاء الاصطناعي ضيقة وتم تصميم معظم نماذج ML لأداء مهمة واحدة، واستخدمت التعلم الخاضع للإشراف والمطلوبة مجموعات كبيرة من البيانات المصنفة للتدريب.
اليوم، يمكن استخدام أتمتة العمليات الآلية (RPA) لأتمتة عملية المعالجة المسبقة للبيانات وجعل التدريب على الخوارزمية أسرع بكثير.
شرح مفهوم التعلم الآلي (ML).
تتطلب نماذج التعلم الآلي عالية الجودة بيانات تدريب عالية الجودة وإمكانية الوصول إلى مجموعات كبيرة من البيانات. وذلك لاستخراج الميزات الأكثر صلة بأهداف العمل المحددة والكشف عن ارتباطات ذات مغزى.
نماذج التعلم الآلي
نموذج التعلم الآلي هو ببساطة ناتج خوارزمية ML التي تم تشغيلها على البيانات. تتضمن الخطوات المتبعة في بناء النموذج ما يلي:
- جمع بيانات التدريب.
- تحضير البيانات للتدريب.
- تحديد خوارزمية التعلم التي يجب استخدامها.
- تدريب خوارزمية التعلم.
- تقييم مخرجات خوارزمية التعلم.
- إذا لزم الأمر، ضبط المتغيرات (المعلمات الفائقة) التي تحكم عملية التدريب من أجل تحسين الإخراج.
في إعداد التعلم الآلي النموذجي، تتطلب الخوارزميات الخاضعة للإشراف مجموعة بيانات تتكون من أمثلة حيث يتكون كل مثال من مدخلات ومخرجات.
في مثل هذا الإعداد، يتمثل الهدف النموذجي لتدريب خوارزمية ML في تحديث معلمات النموذج التنبئي لضمان إنتاج أشجار القرار للنموذج النتائج المرجوة باستمرار.
هذا هو المكان الذي يأتي فيه الانتروبيا. الانتروبيا هي صيغة رياضية تستخدم لتقدير الاضطراب والعشوائية في نظام مغلق.
في مشروعات التعلم الآلي، يتمثل الهدف المهم في التأكد من بقاء الكون منخفضًا قدر الإمكان لأن هذا المقياس سيحدد كيف ستختار أشجار قرار النموذج تقسيم البيانات.
تدريب تعلم الآلة.
هناك ثلاثة أنواع رئيسية من الخوارزميات المستخدمة لتدريب نماذج التعلم الآلي: التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف والتعلم المعزز.
- التعلم الخاضع للإشراف – يتم إعطاء الخوارزمية بيانات تدريب معنونة (إدخال) وتظهر الإجابة الصحيحة (المخرجات). يستخدم هذا النوع من خوارزمية التعلم نتائج من مجموعات البيانات التاريخية للتنبؤ بقيم المخرجات للبيانات الواردة الجديدة.
- التعلم غير الخاضع للإشراف – يتم إعطاء الخوارزمية بيانات تدريب غير مصنفة. بدلاً من أن يُطلب منك توقع المخرجات الصحيحة ، يستخدم هذا النوع من خوارزمية التعلم بيانات التدريب لاكتشاف الأنماط التي يمكن تطبيقها بعد ذلك على مجموعات أخرى من البيانات التي تظهر سلوكًا مشابهًا. في بعض الحالات، قد يكون من الضروري استخدام كمية صغيرة من البيانات المصنفة مع كمية أكبر من البيانات غير المسماة أثناء التدريب. غالبًا ما يشار إلى هذا النوع من التدريب باسم التعلم الآلي شبه الخاضع للإشراف.
- التعلم المعزز – بدلاً من الحصول على بيانات التدريب ، يتم إعطاء الخوارزمية إشارة مكافأة وتبحث عن أنماط في البيانات التي ستمنح المكافأة. غالبًا ما يتم اشتقاق مدخلات خوارزمية التعلم هذا من تفاعل خوارزمية التعلم مع البيئة المادية أو الرقمية.
إقرأ أيضاً… نماذج وأنظمة التعلم العميق.
ما الذي يسبب التحيز في التعلم الآلي؟
هناك رغبة متزايدة لدى عامة الناس للذكاء الاصطناعي – وخوارزميات التعلم الآلي على وجه الخصوص – لتكون شفافة وقابلة للتفسير. لكن الشفافية الخوارزمية يمكن أن تكون أكثر تعقيدًا من مجرد مشاركة الخوارزمية التي تم استخدامها لعمل تنبؤ معين.
يفاجأ العديد من الأشخاص الجدد في تعلم الآلة عندما يكتشفون أن الخوارزميات الرياضية ليست سرية. في الواقع، معظم خوارزميات ML الشائعة المستخدمة اليوم متاحة مجانًا.
إنها بيانات التدريب التي لها قيمة خاصة وليست الخوارزمية المستخدمة. لسوء الحظ، نظرًا لأن البيانات المستخدمة لتدريب خوارزمية التعلم يتم اختيارها من قبل الإنسان. يمكن أن تؤدي عن غير قصد إلى التحيز في نموذج التعلم الآلي الذي يتم بناؤه.
يمكن أن تجعل الطبيعة التكرارية لخوارزميات التعلم من الصعب على مهندسي ML العودة وتتبع المنطق وراء تنبؤ معين.
عندما يكون من الممكن لعالم بيانات أو مهندس تعلم أن يشرح كيف تم إجراء تنبؤ محدد. يمكن الإشارة إلى نموذج ML على أنه ذكاء اصطناعي قابل للتفسير.
عندما لا يكون من الممكن الكشف عن كيفية إجراء تنبؤ محدد – إما لأن الرياضيات تصبح معقدة للغاية أو أن بيانات التدريب خاصة. يمكن الإشارة إلى نموذج ML باسم الصندوق الأسود AI.
إقرأ أيضاً… الفرق بين علم البيانات وتعلم الآلة.
MLops
عادةً ما يشرف علماء البيانات على مشروعات التعلم الآلي. تتضمن وظيفة عالم البيانات عادةً إنشاء فرضية وكتابة التعليمات البرمجية التي نأمل أن تثبت صحة الفرضية. تركز وظيفة مهندس ML على عمليات (MLOps).
عمليات التعلم الآلي هي نهج لإدارة دورة الحياة الكاملة لنموذج التعلم الآلي – بما في ذلك التدريب والضبط والاستخدام اليومي في بيئة الإنتاج والتقاعد النهائي.
لهذا السبب يحتاج مهندسوا ML إلى معرفة عملية بنمذجة البيانات وهندسة الميزات والبرمجة – بالإضافة إلى امتلاك خلفية قوية في الرياضيات والإحصاء.
من الناحية المثالية، سيتعاون علماء البيانات ومهندسوا ML في نفس المؤسسة عند تحديد نوع خوارزمية التعلم التي ستعمل بشكل أفضل لحل مشكلة عمل معينة. ولكن في بعض الصناعات تقتصر وظيفة مهندس ML على تحديد البيانات التي يجب استخدامها للتدريب. و كيف سيتم التحقق من صحة نتائج نموذج التعلم الآلي.