أصبح علم البيانات و تحليل البيانات الضخمة من أهم وسائل صناعة الإستراتيجيات في عصرنا
تعرف في هذا المقال على كل ما يهم البيانات الضخمة
![]() |
كل ما تريد معرفته عن البيانات الضخمة |
البيانات الضخمة (بالإنجليزية Big Data) هي ببساطة مجموعة البيانات الكبيرة جدا و المعقدة و التي لا يمكن معالجتها بالأدوات و الوسائل "التقليدية" و العادية و هي بذلك تتجاوز الكم العادي الذي يقاس بوحدة قيس البيانات "إكسابايت" (EB) ما يجعلها تتخطى قدرت البرامج العادية لإلتقاط و إدارة و معالجة البيانات خلال وقت محدد
عموما، فإن البيانات الضخمة Big Data هي عبارة عن مصطلح يصف الحجم الكبير للبيانات (المهيكلة وغير المهيكلة) التي تغرق نشاطًا تجاريًا على أساس يومي لكنها ليست كمية البيانات المهمة بل إنها ما تفعله المؤسسات بالبيانات المهمة،
يمكن تحليل البيانات الكبيرة للأفكار التي تؤدي إلى قرارات أفضل و تطور تحركات الأعمال الاستراتيجية
يدفع هذا الحجم الهائل لهذه البيانات إلى إيجاد أشكال جديدة من المعالجة و الإدارة و التحليل
و تتميز البيانات الضخمة Big Data بسرعة عالية في التدفق و تنوع مصادرها و أنواعها و النمو المستمر لحجمها (كمية البيانات)
رغم أن مصطلح "البيانات الضخمة" (Big Data) هو مصطلح جديد نسبيًا إلا أن عملية جمع و تخزين كميات كبيرة من المعلومات لتحليلها يبقى أمرا قديما
إكتسب هذا المفهوم زخما مع أوائل العقد الأول من القرن الحالي عندما عبّر المحلل الصناعي "دوج لاني" (Doug Kanet) عن التعريف السائد حاليًا للبيانات الضخمة مثل نموذج (3Vs) أي نموذج للبيانات الضخمة Big Data يقوم على تفسيره كعنصر ثلاثي الأبعاد
و مؤخرا أصبح الحديث عن البيانات الضخمة Big Data أكثر توسعا و العمل عليها و جمعها و تحليلها أكبر، و من المؤكد أنها ستكون محور الثورة المستقبلية للتقنية و المعلومات و الذكاء الإصطناعي
تتميز البيانات الضخمة Big Data من حيث الإعتماد على النموذج الثلاثي للبيانات كمنصة دراسية بخصائص تعتبر في نفس الوقت نقاط الدراسة و محاور الإهتمام في هذا العلم، علم البيانات (Data Science)
هذه النقاط تتمثل أساسا في الحجم (أي الحجم الرهيب للبيانات) و في السرعة (أي سرعة تدفقها) و تنوعها
يمكن تفسيرها بشكل أوسع كالتالي :
الحجم :
تقوم المنظمات بجمع البيانات من مجموعة متنوعة من المصادر بما في ذلك معاملات الأعمال و الوسائط الاجتماعية و المعلومات من المستشعر أو البيانات من جهاز لآخر
في الماضي، كان تخزينها يمثل مشكلة لكن التقنيات الجديدة (مثل Hadoop و هي المنصة الرئيسية للبيانات الضخمة حيث يتم إستخدامها لتخزين و معالجة كميات هائلة من البيانات) خففت العبئ
السرعة :
تدفقات البيانات بسرعة لم يسبق لها مثيل و يجب التعامل معها في الوقت المناسب
تعمل علامات RFID و يعني تحديد ترددات الراديو (radio frequency identification) و أجهزة الاستشعار و القياس الذكي على زيادة الحاجة إلى التعامل مع السيول الهائلة من البيانات في الوقت الفعلي تقريبًا
التنوع :
تأتي البيانات في جميع أنواع التنسيقات من البيانات المنظمة و الرقمية في قواعد البيانات التقليدية إلى المستندات النصية غير المنظمة و البريد الإلكتروني و الفيديو و الصوت و بيانات مؤشر البورصة و المعاملات المالية و غيرها
لا تدور أهمية البيانات الضخمة Big Data حول مقدار البيانات المتوفرة لديك و لكن ما تفعله به، يمكنك أخذ البيانات من أي مصدر و تحليلها للعثور على الإجابات التي تكمن في التالي :
1) تخفيض التكاليف
2) تخفيض الوقت
3) تطوير المنتجات الجديدة و العروض المحسنة
4) صنع القرار الذكي
عند دمج البيانات الكبيرة مع التحليلات عالية الأداء، يمكنك إنجاز المهام المتعلقة بالأعمال التي يمكننا تلخيصها فيما يلي :
تحديد الأسباب الجذرية للفشل و القضايا و العيوب في الوقت الحقيقي تقريبا
إنشاء الكوبونات في نقطة البيع استنادًا إلى عادات الشراء لدى العميل
إعادة حساب محافظ المخاطر بالكامل في دقائق
اكتشاف السلوك الاحتيالي قبل أن يؤثر على مؤسستك
تؤثر البيانات الضخمة Big Data على المؤسسات عبر جميع الصناعات تقريبًا،
انظر كيف يمكن لكل صناعة الاستفادة من سيل المعلومات هذا :
الخدمات المصرفية :
مع تدفق كميات كبيرة من المعلومات من مصادر لا تعد و لا تحصى، تواجه البنوك تحدي إيجاد طرق جديدة و مبتكرة لإدارة البيانات الضخمة
و في حين أنه من المهم فهم العملاء و تعزيز مدى رضاهم، إلا أنه من المهم أيضًا تقليل المخاطر و الاحتيال إلى الحد الأدنى مع الحفاظ على الامتثال التنظيمي
تجلب البيانات الضخمة Big Data رؤى كبيرة، و لكنها تتطلب أيضًا أن تظل المؤسسات المالية متقدمة على اللعبة بتحليلات متقدمة
التعليم :
يمكن للمعلمين المسلحين بالمعلومات التي تعتمد على البيانات أن يكون لها تأثير كبير على النظم المدرسية و الطلاب و المناهج الدراسية
من خلال تحليل البيانات الضخمة، يمكنهم تحديد الطلاب المعرضين للخطر، و التأكد من أن الطلاب يحققون تقدمًا مناسبًا، و يمكنهم تنفيذ نظام أفضل لتقييم و دعم المعلمين و المديرين
الحكومات :
عندما تكون الوكالات الحكومية قادرة على تسخير التحليلات و تطبيقها على بياناتها الضخمة، فإنها تكتسب أهمية كبيرة عندما يتعلق الأمر بإدارة المرافق أو إدارة الوكالات أو التعامل مع الازدحام المروري أو منع الجريمة
و لكن، في حين أن هنالك العديد من المزايا للبيانات الضخمة يجب على الحكومات أيضا معالجة قضايا الشفافية و الخصوصية
الرعاية الصحية :
سجلات المرضى، خطط العلاج، معلومات وصفة طبية، عندما يتعلق الأمر بالرعاية الصحية، يجب القيام بكل شيء بسرعة و دقة - وفي بعض الحالات، مع شفافية كافية للوفاء بالقوانين الصارمة للصناعة عندما تتم إدارة البيانات الضخمة بفعالية يمكن لمقدمي الرعاية الصحية الكشف عن الأفكار الخفية التي تحسن رعاية المرضى
التصنيع :
و من خلال تزويدها ببصيرة تمكنهم من توفير البيانات الضخمة، يمكن للشركات المصنعة تعزيز الجودة و الإنتاج مع تقليل النفايات (و هي العمليات التي تعتبر أساسية في السوق التنافسية اليوم)
يعمل المزيد و المزيد من المصنعين في ثقافة قائمة على التحليلات، مما يعني أنهم قادرون على حل المشكلات بشكل أسرع واتخاذ قرارات أعمال أكثر مرونة
التجزئة :
يعتبر بناء العلاقات مع العملاء أمرًا بالغ الأهمية لصناعة البيع بالتجزئة، و أفضل طريقة لإدارة ذلك هي إدارة البيانات الضخمة
يحتاج تجار التجزئة إلى معرفة أفضل طريقة للتسويق للعملاء، و الطريقة الأكثر فاعلية للتعامل مع المعاملات، و الطريقة الأكثر استراتيجية لاستعادة الأعمال المنهارة
و تبقى البيانات الكبيرة في النهاية في قلب كل هذه الأشياء !
عموما، فإن البيانات الضخمة Big Data هي عبارة عن مصطلح يصف الحجم الكبير للبيانات (المهيكلة وغير المهيكلة) التي تغرق نشاطًا تجاريًا على أساس يومي لكنها ليست كمية البيانات المهمة بل إنها ما تفعله المؤسسات بالبيانات المهمة،
يمكن تحليل البيانات الكبيرة للأفكار التي تؤدي إلى قرارات أفضل و تطور تحركات الأعمال الاستراتيجية
يدفع هذا الحجم الهائل لهذه البيانات إلى إيجاد أشكال جديدة من المعالجة و الإدارة و التحليل
و تتميز البيانات الضخمة Big Data بسرعة عالية في التدفق و تنوع مصادرها و أنواعها و النمو المستمر لحجمها (كمية البيانات)
ما هو تاريخ مفهوم البيانات الضخمة Big Data ؟
رغم أن مصطلح "البيانات الضخمة" (Big Data) هو مصطلح جديد نسبيًا إلا أن عملية جمع و تخزين كميات كبيرة من المعلومات لتحليلها يبقى أمرا قديما
إكتسب هذا المفهوم زخما مع أوائل العقد الأول من القرن الحالي عندما عبّر المحلل الصناعي "دوج لاني" (Doug Kanet) عن التعريف السائد حاليًا للبيانات الضخمة مثل نموذج (3Vs) أي نموذج للبيانات الضخمة Big Data يقوم على تفسيره كعنصر ثلاثي الأبعاد
و مؤخرا أصبح الحديث عن البيانات الضخمة Big Data أكثر توسعا و العمل عليها و جمعها و تحليلها أكبر، و من المؤكد أنها ستكون محور الثورة المستقبلية للتقنية و المعلومات و الذكاء الإصطناعي
خصائص البيانات الضخمة
تتميز البيانات الضخمة Big Data من حيث الإعتماد على النموذج الثلاثي للبيانات كمنصة دراسية بخصائص تعتبر في نفس الوقت نقاط الدراسة و محاور الإهتمام في هذا العلم، علم البيانات (Data Science)
هذه النقاط تتمثل أساسا في الحجم (أي الحجم الرهيب للبيانات) و في السرعة (أي سرعة تدفقها) و تنوعها
يمكن تفسيرها بشكل أوسع كالتالي :
الحجم :
تقوم المنظمات بجمع البيانات من مجموعة متنوعة من المصادر بما في ذلك معاملات الأعمال و الوسائط الاجتماعية و المعلومات من المستشعر أو البيانات من جهاز لآخر
في الماضي، كان تخزينها يمثل مشكلة لكن التقنيات الجديدة (مثل Hadoop و هي المنصة الرئيسية للبيانات الضخمة حيث يتم إستخدامها لتخزين و معالجة كميات هائلة من البيانات) خففت العبئ
السرعة :
تدفقات البيانات بسرعة لم يسبق لها مثيل و يجب التعامل معها في الوقت المناسب
تعمل علامات RFID و يعني تحديد ترددات الراديو (radio frequency identification) و أجهزة الاستشعار و القياس الذكي على زيادة الحاجة إلى التعامل مع السيول الهائلة من البيانات في الوقت الفعلي تقريبًا
التنوع :
تأتي البيانات في جميع أنواع التنسيقات من البيانات المنظمة و الرقمية في قواعد البيانات التقليدية إلى المستندات النصية غير المنظمة و البريد الإلكتروني و الفيديو و الصوت و بيانات مؤشر البورصة و المعاملات المالية و غيرها
لماذا تعتبر البيانات الضخمة مهمة ؟
لا تدور أهمية البيانات الضخمة Big Data حول مقدار البيانات المتوفرة لديك و لكن ما تفعله به، يمكنك أخذ البيانات من أي مصدر و تحليلها للعثور على الإجابات التي تكمن في التالي :
1) تخفيض التكاليف
2) تخفيض الوقت
3) تطوير المنتجات الجديدة و العروض المحسنة
4) صنع القرار الذكي
عند دمج البيانات الكبيرة مع التحليلات عالية الأداء، يمكنك إنجاز المهام المتعلقة بالأعمال التي يمكننا تلخيصها فيما يلي :
تحديد الأسباب الجذرية للفشل و القضايا و العيوب في الوقت الحقيقي تقريبا
إنشاء الكوبونات في نقطة البيع استنادًا إلى عادات الشراء لدى العميل
إعادة حساب محافظ المخاطر بالكامل في دقائق
اكتشاف السلوك الاحتيالي قبل أن يؤثر على مؤسستك
من الذي يمكنه الإستفادة من البيانات الضخمة ؟
تؤثر البيانات الضخمة Big Data على المؤسسات عبر جميع الصناعات تقريبًا،
انظر كيف يمكن لكل صناعة الاستفادة من سيل المعلومات هذا :
الخدمات المصرفية :
مع تدفق كميات كبيرة من المعلومات من مصادر لا تعد و لا تحصى، تواجه البنوك تحدي إيجاد طرق جديدة و مبتكرة لإدارة البيانات الضخمة
و في حين أنه من المهم فهم العملاء و تعزيز مدى رضاهم، إلا أنه من المهم أيضًا تقليل المخاطر و الاحتيال إلى الحد الأدنى مع الحفاظ على الامتثال التنظيمي
تجلب البيانات الضخمة Big Data رؤى كبيرة، و لكنها تتطلب أيضًا أن تظل المؤسسات المالية متقدمة على اللعبة بتحليلات متقدمة
التعليم :
يمكن للمعلمين المسلحين بالمعلومات التي تعتمد على البيانات أن يكون لها تأثير كبير على النظم المدرسية و الطلاب و المناهج الدراسية
من خلال تحليل البيانات الضخمة، يمكنهم تحديد الطلاب المعرضين للخطر، و التأكد من أن الطلاب يحققون تقدمًا مناسبًا، و يمكنهم تنفيذ نظام أفضل لتقييم و دعم المعلمين و المديرين
الحكومات :
عندما تكون الوكالات الحكومية قادرة على تسخير التحليلات و تطبيقها على بياناتها الضخمة، فإنها تكتسب أهمية كبيرة عندما يتعلق الأمر بإدارة المرافق أو إدارة الوكالات أو التعامل مع الازدحام المروري أو منع الجريمة
و لكن، في حين أن هنالك العديد من المزايا للبيانات الضخمة يجب على الحكومات أيضا معالجة قضايا الشفافية و الخصوصية
الرعاية الصحية :
سجلات المرضى، خطط العلاج، معلومات وصفة طبية، عندما يتعلق الأمر بالرعاية الصحية، يجب القيام بكل شيء بسرعة و دقة - وفي بعض الحالات، مع شفافية كافية للوفاء بالقوانين الصارمة للصناعة عندما تتم إدارة البيانات الضخمة بفعالية يمكن لمقدمي الرعاية الصحية الكشف عن الأفكار الخفية التي تحسن رعاية المرضى
التصنيع :
و من خلال تزويدها ببصيرة تمكنهم من توفير البيانات الضخمة، يمكن للشركات المصنعة تعزيز الجودة و الإنتاج مع تقليل النفايات (و هي العمليات التي تعتبر أساسية في السوق التنافسية اليوم)
يعمل المزيد و المزيد من المصنعين في ثقافة قائمة على التحليلات، مما يعني أنهم قادرون على حل المشكلات بشكل أسرع واتخاذ قرارات أعمال أكثر مرونة
التجزئة :
يعتبر بناء العلاقات مع العملاء أمرًا بالغ الأهمية لصناعة البيع بالتجزئة، و أفضل طريقة لإدارة ذلك هي إدارة البيانات الضخمة
يحتاج تجار التجزئة إلى معرفة أفضل طريقة للتسويق للعملاء، و الطريقة الأكثر فاعلية للتعامل مع المعاملات، و الطريقة الأكثر استراتيجية لاستعادة الأعمال المنهارة
و تبقى البيانات الكبيرة في النهاية في قلب كل هذه الأشياء !
إقرأ أيضا :
مدونة مستقبل المعرفة©
Tags:
علم البيانات