في عالم التقنية، كثيراً ما نسمع بمصطلحات مثل تعلم الآلة والآلات الذكية والتعلم العميق. سنركز في دليلنا التالي على موضوع التعلم العميق، مع بيان طرقه ومجالاته والأمثلة عليه.
المحتويات:
6. التعلم العميق والتعلم الآلي.
1. ما هو التعلم العميق؟
يمكن تعريف التعلم العميق على أنه “نوع من التعلم الآلي (ML) والذكاء الاصطناعي (AI) الذي يقلد الطريقة التي يكتسب بها البشر أنواعاً معينة من المعرفة”.
كما أنه يعد عنصراً مهماً في علم البيانات، والذي يتضمن الإحصاء والنمذجة التنبؤية. إنه مفيد للغاية لعلماء البيانات المكلفين بجمع وتحليل وتفسير كميات كبيرة من البيانات؛ التعلم العميق يجعل هذه العملية أسرع وأسهل.
في أبسط صوره، يمكن اعتباره وسيلة لأتمتة التحليلات التنبؤية. في حين أن خوارزميات التعلم الآلي التقليدية خطية، فإن خوارزميات التعلم العميق مكدسة في تسلسل هرمي يتزايد فيه التعقيد والتجريد.
لفهم التعلم العميق، تخيل طفلاً صغيراً تكون كلمته الأولى “قطة”. يتعلم الطفل ما هي القطة – وما هو ليس كذلك – بالإشارة إلى الأشياء وقول كلمة قطة. يقول الوالد، “نعم ، هذه قطة” ، أو “لا ، هذه ليست قطة”.
مع استمرار الطفل الصغير في الإشارة إلى الأشياء، يصبح أكثر وعياً بالسمات التي تمتلكها جميع القطط. ما يفعله الطفل، دون معرفة ذلك، هو توضيح تجريد معقد – مفهوم القطة – من خلال بناء تسلسل هرمي يتم فيه إنشاء كل مستوى من مستويات التجريد بالمعرفة التي تم اكتسابها من الطبقة السابقة للتسلسل الهرمي.
2. كيف يعمل التعلم العميق.
تمر برامج الحاسوب التي تستخدم التعلم العميق بنفس العملية التي يتعلم بها الطفل الصغير للتعرف على القطة. تطبق كل خوارزمية في التسلسل الهرمي تحويلًا غير خطي على مدخلاتها وتستخدم ما تتعلمه لإنشاء نموذج إحصائي كمخرج.
تستمر التكرارات حتى يصل الإخراج إلى مستوى مقبول من الدقة. إن عدد طبقات المعالجة التي يجب أن تمر البيانات من خلالها هو ما ألهم تسميته بـ”العميق”.
في التعلم الآلي التقليدي، يتم الإشراف على عملية التعلم، ويجب أن يكون المبرمج محدداً للغاية عند إخبار الحاسوب بأنواع الأشياء التي يجب أن يبحث عنها ليقرر ما إذا كانت الصورة تحتوي على قطة أو لا تحتوي على قطة.
هذه عملية شاقة تسمى استخراج الميزات، ويعتمد معدل نجاح الحاسوب كلياً على قدرة المبرمج على تحديد مجموعة ميزات للقطة بدقة. ميزة التعلم العميق هي أن البرنامج يبني الميزة التي حددها بنفسه دون إشراف. التعلم غير الخاضع للإشراف ليس فقط أسرع، ولكنه عادة ما يكون أكثر دقة.
آلية التدريب في التعلم العميق.
في البداية، قد يتم تزويد برنامج الحاسوب ببيانات التدريب، وهي مجموعة من الصور التي قام الإنسان بتسمية كل صورة لقطة أو ما هو ليس قطة باستخدام العلامات الوصفية.
يستخدم البرنامج المعلومات التي يتلقاها من بيانات التدريب لإنشاء مجموعة ميزات للقطة وبناء نموذج تنبؤي. في هذه الحالة، قد يتنبأ النموذج الذي ينشئه الحاسوب أولاً أنه يجب تسمية أي شيء في الصورة بأربعة أرجل وذيل بقطة.
بالطبع البرنامج ليس على علم بالتسميات الأربعة أرجل أو الذيل. سيبحث ببساطة عن أنماط البكسل في البيانات الرقمية. مع كل تكرار، يصبح النموذج التنبؤي أكثر تعقيداً وأكثر دقة.
على عكس الطفل الصغير، الذي سيستغرق أسابيع أو حتى شهوراً لفهم مفهوم القطة، يمكن عرض برنامج حاسوب يستخدم خوارزميات مجموعة تدريب وفرز ملايين الصور، وتحديد بدقة الصور التي تحتوي على قطط في غضون بضعة دقائق.
لتحقيق مستوى مقبول من الدقة، تتطلب برامج التعلم العميق الوصول إلى كميات هائلة من بيانات التدريب وقوة المعالجة، ولم يكن أي منهما متاحاً بسهولة للمبرمجين حتى عصر البيانات الضخمة والحوسبة السحابية.
نظراً لأن برمجته يمكن أن تنشئ نماذج إحصائية معقدة مباشرة من مخرجاتها التكرارية الخاصة، فهي قادرة على إنشاء نماذج تنبؤية دقيقة من كميات كبيرة من البيانات غير المنظمة وغير المنظمة.
ويعتبر هذا أمر مهماً لأن إنترنت الأشياء (IoT) يستمر في الانتشار، لأن معظم قواعد البيانات التي ينشئها البشر والآلات غير منظمة وغير مصنفة.
3. طرق التعلم العميق.
يمكن استخدام طرق مختلفة لإنشاء نماذج قوية للتعلم العميق. تتضمن هذه الأساليب التعلم من الاضمحلال، ونقل التعلم، والتدريب من نقطة الصفر والتسرب.
- تعلم معدل الاضمحلال.
معدل التعلم عبارة عن محدد فائق – عامل يحدد النظام أو يحدد شروطاً لتشغيله قبل عملية التعلم – يتحكم في مقدار التغيير الذي يمر به النموذج استجابةً للخطأ المقدر في كل مرة يتم فيها تغيير أوزان النموذج.
قد تؤدي معدلات التعلم المرتفعة جداً إلى عمليات تدريب غير مستقرة أو تعلم مجموعة من الأوزان دون المستوى الأمثل. كما قد تؤدي معدلات التعلم الصغيرة جداً إلى عملية تدريب طويلة من المحتمل أن تتعثر.
طريقة تحلل معدل التعلم – وتسمى أيضاً معدلات التعلم أو معدلات التعلم التكيفي – هي عملية تكييف معدل التعلم لزيادة الأداء وتقليل وقت التدريب. تتضمن التعديلات الأسهل والأكثر شيوعاً لمعدل التعلم أثناء التدريب تقنيات لتقليل معدل التعلم بمرور الوقت.
- نقل التعلم.
تتضمن هذه العملية إتقان نموذج تم تدريبه مسبقاً؛ يتطلب واجهة مع الأجزاء الداخلية لشبكة موجودة مسبقاً. أولاً، يقوم المستخدمون بتغذية الشبكة الحالية ببيانات جديدة تحتوي على تصنيفات لم تكن معروفة من قبل.
بمجرد إجراء التعديلات على الشبكة، يمكن تنفيذ مهام جديدة بقدرات تصنيف أكثر تحديداً. تتميز هذه الطريقة بأنها تتطلب بيانات أقل بكثير من غيرها، وبالتالي تقليل وقت الحساب إلى دقائق أو ساعات.
- التدريب من الصفر.
تتطلب هذه الطريقة من المطور تجميع مجموعة كبيرة من البيانات المسماة وتكوين بنية شبكة يمكنها التعرف على الميزات والنموذج. هذه التقنية مفيدة بشكل خاص للتطبيقات الجديدة، وكذلك التطبيقات التي تحتوي على عدد كبير من فئات الإخراج.
ومع ذلك، بشكل عام، فهو نهج أقل شيوعاً، لأنه يتطلب كميات هائلة من البيانات، مما يجعل التدريب يستغرق أياماً أو أسابيع.
- التسرّب.
تحاول هذه الطريقة حل مشكلة فرط التخصيص في الشبكات بكميات كبيرة من المحددات عن طريق إسقاط الوحدات بشكل عشوائي وتوصيلاتها من الشبكة العصبية أثناء التدريب.
لقد ثبت أن طريقة التسرّب يمكن أن تحسن أداء الشبكات العصبية في مهام التعلم الخاضعة للإشراف في مجالات مثل التعرف على الكلام وتصنيف المستندات وعلم الأحياء الحسابي.
الشبكات العصبية للتعلم العميق.
يدعم نوع من خوارزمية التعلم الآلي المتقدمة، والمعروف باسم الشبكة العصبية الاصطناعية Artificial Neural Network، معظم نماذج التعلم العميق.
نتيجة لذلك، قد يشار إليه أحياناً على أنه التعلم العصبي العميق أو الشبكات العصبية العميقة. تأتي الشبكات العصبية في عدة أشكال مختلفة، بما في ذلك الشبكات العصبية المتكررة، والشبكات العصبية التلافيفية، والشبكات العصبية الاصطناعية والشبكات العصبية المغذية، ولكل منها فوائد لحالات استخدام محددة.
ومع ذلك، فإنهم جميعاً يعملون بطرق متشابهة إلى حد ما، وذلك من خلال تغذية البيانات والسماح للنموذج بمعرفة ما إذا كان قد اتخذ التفسير الصحيح أو القرار الصحيح بشأن عنصر بيانات معين. تتضمن الشبكات العصبية عملية التجربة والخطأ، لذا فهي بحاجة إلى كميات هائلة من البيانات للتدريب عليها.
ليس من قبيل المصادفة أن الشبكات العصبية أصبحت شائعة فقط بعد أن تبنت معظم الشركات تحليلات البيانات الضخمة وتراكمت مخازن كبيرة من البيانات.
نظراً لأن التكرارات القليلة الأولى للنموذج تتضمن تخمينات متعلمة إلى حد ما حول محتويات صورة أو أجزاء من الكلام، يجب تسمية البيانات المستخدمة أثناء مرحلة التدريب حتى يتمكن النموذج من معرفة ما إذا كان تخمينه دقيقاً.
هذا يعني أنه على الرغم من أن العديد من الشركات التي تستخدم البيانات الضخمة لديها كميات كبيرة من البيانات، فإن البيانات غير المهيكلة تكون أقل فائدة.
لا يمكن تحليل البيانات غير المنظمة إلا من خلال نموذج التعلم العميق بمجرد أن يتم تدريبها وتصل إلى مستوى مقبول من الدقة، لكن النماذج لا يمكن أن تتدرب على البيانات غير المنظمة.
إقرأ أيضاً… ما هي البيانات في الوقت الحقيقي؟ ما هي أهميتها وفوائدها؟
4. أمثلة التعلم العميق.
نظراً لأن نماذج التعلم العميق تعالج المعلومات بطرق مشابهة للدماغ البشري، فيمكن تطبيقها على العديد من المهام التي يقوم بها الأشخاص. كما يستخدم حالياً في معظم أدوات التعرف على الصور الشائعة ومعالجة اللغة الطبيعية (NLP) وبرامج التعرف على الكلام.
بدأت هذه الأدوات في الظهور في تطبيقات متنوعة مثل السيارات ذاتية القيادة وخدمات الترجمة اللغوية. تتضمن حالات الاستخدام اليوم جميع أنواع تطبيقات تحليلات البيانات الضخمة، خاصة تلك التي تركز على البرمجة اللغوية العصبية وترجمة اللغة والتشخيص الطبي وإشارات تداول سوق الأوراق المالية وأمن الشبكة والتعرف على الصور.
تشمل المجالات التي يتم فيها استخدام التعلم العميق حالياً ما يلي:
- تجربة العملاء (CX).
يتم بالفعل استخدامه لروبوتات الدردشة. ومع استمرار نضجها، من المتوقع أن يتم تنفيذ التعلم العميق في العديد من الشركات لتحسين تجربة العملاء وزيادة رضا العملاء.
- توليد النص.
يتم تعليم الآلات القواعد النحوية وأسلوب جزء من النص ثم تستخدم هذا النموذج تلقائياً لإنشاء نص جديد تماماً يطابق الإملاء الصحيح والنحو والأسلوب الصحيح للنص الأصلي.
- الفضاء والجيش.
يتم استخدامه لاكتشاف الأشياء من الأقمار الصناعية التي تحدد مجالات الاهتمام، بالإضافة إلى المناطق الآمنة أو غير الآمنة للقوات.
- الأتمتة الصناعية.
في تطبيقات الأتمتة حيث أنه يعمل على تحسين سلامة العمال في بيئات مثل المصانع والمستودعات من خلال توفير الخدمات التي تكتشف تلقائياً عندما يقترب العامل أو الكائن كثيراً من الآلة.
- تلوين الصور.
يمكن إضافة الألوان إلى الصور ومقاطع الفيديو بالأبيض والأسود باستخدام نماذج التعلم العميق. في الماضي، كانت هذه عملية يدوية تستغرق وقتاً طويلاً للغاية.
- الأبحاث الطبية.
بدأ باحثو السرطان في تطبيقه في ممارساتهم كطريقة لاكتشاف الخلايا السرطانية تلقائياً.
- التطبيقات الحاسوبية.
لقد عزز هذا الأمر رؤية الحاسوب بشكل كبير، مما وفر أجهزة حاسوب بدقة فائقة لاكتشاف الأشياء وتصنيف الصور واستعادتها وتجزئتها.
إقرأ أيضاً… ما هي تطبيقات الذكاء الاصطناعي (AI) في الحياة الواقعية؟
5. القيود والتحديات.
أكبر قيود على نماذج التعلم العميق هو أنها تتعلم من خلال الملاحظات. هذا يعني أنهم يعرفون فقط ما كان موجوداً في البيانات التي تدربوا عليها. إذا كان لدى المستخدم كمية صغيرة من البيانات أو أنها تأتي من مصدر واحد محدد لا يمثل بالضرورة المجال الوظيفي الأوسع، فلن تتعلم النماذج بطريقة قابلة للتعميم.
تعد مسألة التحيزات أيضاً مشكلة رئيسية لنماذج التعلم العميق. إذا تدرب النموذج على البيانات التي تحتوي على تحيزات، فسيقوم النموذج بإعادة إنتاج تلك التحيزات في تنبؤاته. كانت هذه مشكلة مزعجة للمبرمجين لأن النماذج تتعلم التمييز بناءً على الاختلافات الدقيقة في عناصر البيانات.
في كثير من الأحيان، العوامل التي تحددها مهمة لا يتم توضيحها صراحة للمبرمج. هذا يعني، على سبيل المثال، أن نموذج التعرف على الوجه قد يتخذ قرارات بشأن خصائص الأشخاص بناءً على أشياء مثل العرق أو الجنس دون أن يكون المبرمج على دراية.
يمكن أن يصبح معدل التعلم أيضاً تحدياً كبيراً لنماذج التعلم العميق. إذا كان المعدل مرتفعاً جداً، فسيتقارب النموذج بسرعة كبيرة، مما ينتج عنه حل أقل من الأمثل.
إذا كان المعدل منخفضاً جداً، فقد تتعطل العملية، وسيكون من الصعب الوصول إلى حل. يمكن أن تؤدي متطلبات الأجهزة لنماذج التعلم العميق أيضاً إلى إنشاء قيود. يلزم وجود وحدات معالجة رسومات متعددة النواة عالية الأداء (GPU) ووحدات معالجة أخرى مماثلة لضمان تحسين الكفاءة وتقليل استهلاك الوقت.
ومع ذلك، فإن هذه الوحدات باهظة الثمن وتستهلك كميات كبيرة من الطاقة. تشمل متطلبات الأجهزة الأخرى ذاكرة الوصول العشوائي ومحرك الأقراص الثابتة (HDD) أو محرك الحالة الصلبة (SSD) المستند إلى ذاكرة الوصول العشوائي.
تشمل القيود والتحديات الأخرى ما يلي:
- يتطلب التعلم العميق كميات كبيرة من البيانات. علاوة على ذلك، ستحتاج النماذج الأكثر قوة ودقة إلى مزيد من المحددات، والتي بدورها تتطلب المزيد من البيانات.
- بمجرد التدريب، تصبح نماذج التعلم العميق غير مرنة ولا يمكنها التعامل مع المهام المتعددة. يمكنهم تقديم حلول فعالة ودقيقة ولكن فقط لمشكلة واحدة محددة. حتى حل مشكلة مماثلة يتطلب إعادة تدريب النظام.
- أي تطبيق يتطلب التفكير، مثل البرمجة أو تطبيق الطريقة العلمية، التخطيط طويل المدى ومعالجة البيانات مثل الخوارزميات يتجاوز تماماً ما يمكن أن تفعله تقنيات التعلم العميق الحالية، حتى مع البيانات الكبيرة.
6. التعلم العميق والتعلم الآلي.
التعلم العميق هو مجموعة فرعية من التعلم الآلي الذي يميز نفسه من خلال الطريقة التي يحل بها المشاكل. يتطلب التعلم الآلي خبيراً في المجال لتحديد معظم الميزات المطبقة.
من ناحية أخرى، يتفهم التعلم العميق الميزات بشكل تدريجي، وبالتالي يلغي الحاجة إلى خبرة المجال. هذا يجعل خوارزميات التعلم العميق تستغرق وقتاً أطول للتدريب من خوارزميات التعلم الآلي، والتي لا تتطلب سوى بضع ثوانٍ إلى بضع ساعات.
ومع ذلك، فإن العكس هو الصحيح أثناء الاختبار. تستغرق خوارزمياته وقتاً أقل لتشغيل الاختبارات مقارنة بخوارزميات التعلم الآلي، التي يزيد وقت اختبارها جنباً إلى جنب مع حجم البيانات.
علاوة على ذلك، لا يتطلب التعلم الآلي نفس الآلات المتطورة والمكلفة ووحدات معالجة الرسومات عالية الأداء التي يتطلبها العميق.
في النهاية، يختار العديد من علماء البيانات التعلم الآلي التقليدي على العميق نظراً لقابليته الفائقة في التفسير، أو القدرة على فهم الحلول. تُفضل خوارزميات التعلم الآلي أيضاً عندما تكون البيانات صغيرة.
تتضمن الحالات التي يصبح فيها التعلم العميق أفضل المواقف التي يكون فيها قدراً كبيراً من البيانات، أو نقصاً في فهم المجال لاستبطان الميزات، أو المشكلات المعقدة، مثل التعرف على الكلام ومعالجة اللغات الطبيعية.