تحليل البيانات الضخمة. جريدة الصباح الاخبارية

تحليل البيانات الضخمة. جريدة الصباح الاخبارية

يشير تحليل البيانات الضخمة إلى استراتيجية تحليل كميات كبيرة من البيانات أو البيانات الضخمة.

يتم جمع هذه البيانات الضخمة من مجموعة متنوعة من المصادر، بما في ذلك الشبكات الاجتماعية ومقاطع الفيديو والصور الرقمية وأجهزة الاستشعار وسجلات معاملات المبيعات.

الهدف من تحليل كل هذه البيانات هو الكشف عن الأنماط والروابط التي قد تكون غير مرئية بطريقة أخرى، والتي قد توفر رؤى قيمة حول المستخدمين الذين قاموا بإنشائها.

من خلال هذه الرؤية، قد تكون الشركات قادرة على التفوق على منافسيها واتخاذ قرارات أعمال متفوقة.

تحليل البيانات الضخمة.

تسمح تحليلات البيانات الضخمة لعلماء البيانات ومختلف المستخدمين الآخرين بتقييم كميات كبيرة من بيانات المعاملات ومصادر البيانات الأخرى التي لن تتمكن أنظمة الأعمال التقليدية من معالجتها.

قد تقصر الأنظمة التقليدية لأنها غير قادرة على تحليل أكبر عدد ممكن من مصادر البيانات. تُستخدم البرامج المتطورة لتحليلات البيانات الضخمة، لكن البيانات غير المهيكلة المستخدمة في تحليلات البيانات الضخمة قد لا تكون مناسبة تمامًا لمخازن البيانات التقليدية.

قد تؤدي متطلبات المعالجة العالية للبيانات الضخمة أيضًا إلى جعل تخزين البيانات التقليدي غير مناسب. ونتيجة لذلك، ظهرت بيئات وتقنيات أحدث وأكبر لتحليل البيانات، بما في ذلك قواعد بيانات Hadoop و MapReduce و NoSQL.

تشكل هذه التقنيات إطار عمل برمجي مفتوح المصدر يُستخدم لمعالجة مجموعات البيانات الضخمة عبر أنظمة مجمعة.

إقرأ أيضاً… طرق تحليل البيانات في اكسل التي يجب معرفتها.

كيف يعمل تحليل البيانات الضخمة؟

يقوم محللوا البيانات وعلماء البيانات والمصممون التنبئي والإحصائيون وغيرهم من المتخصصين في التحليلات بجمع ومعالجة وتنظيف وتحليل كميات متزايدة من بيانات المعاملات المنظمة بالإضافة إلى أشكال أخرى من البيانات التي لا تستخدمها برامج التحليلات واستخبارات الأعمال التقليدية.

فيما يلي نظرة عامة على الخطوات الأربع لعملية تحليل البيانات الضخمة:

1- متخصصوا البيانات يجمعون البيانات من مجموعة متنوعة من المصادر المختلفة.

غالبًا ما تكون مزيجًا من البيانات شبه المنظمة وغير المنظمة. بينما ستستخدم كل مؤسسة تدفقات بيانات مختلفة ، تتضمن بعض المصادر الشائعة ما يلي:

2- يتم إعداد البيانات ومعالجتها.

بعد جمع البيانات وتخزينها في مستودع بيانات أو بحيرة بيانات، يجب على متخصصي البيانات تنظيم البيانات وتكوينها وتقسيمها بشكل صحيح للاستعلامات التحليلية.

يؤدي الإعداد الدقيق للبيانات ومعالجتها إلى أداء أعلى من الاستعلامات التحليلية.

3- تنقية البيانات لتحسين جودتها.

يقوم متخصصوا البيانات بتنظيف البيانات باستخدام أدوات البرمجة النصية أو برامج جودة البيانات. يبحثون عن أي أخطاء أو تناقضات ، مثل التكرار أو أخطاء التنسيق، ويقومون بتنظيم البيانات وترتيبها.

4- يتم تحليل البيانات التي تم جمعها ومعالجتها وتنقيتها ببرمجيات التحليلات.

يتضمن ذلك أدوات من أجل: