Big Data

ماذا تعرف عن Big Data؟ (البيانات الضخمة)

نعيش اليوم في عصر تتراكم فيه البيانات بشكل كبير جدًا في كل لحظة، فلم يسبق للبشرية أن راكمت مثل هذا الكم من البيانات بأي شكل من الأشكال، ففي كل يوم منذ عام 2012 يقوم البشر بتخزين أكثر من بيتابايت (مليون مليار) من البيانات، وقد أشارت الدراسات إلى أن 90% من البيانات المتوفرة بالعالم تم إنشاؤها في آخر سنتين، نظرًا لما وفره الإنترنت من سهولة إدخال المعلومات ومشاركتها وتخزينها، وتسمى هذه البيانات المتراكم بـ “البيانات الضخمة Big Data“.

البيانات الضخمة Big Data

البيانات الضخمة هي أرصدة من البيانات التي تتميز بضخامة الحجم والسرعة والتنوع الذي يتطلب أشكالًا مبتكرة وفعالة لمعالجتها، وتختلف معالجة البيانات العادية بحيث تمكن مستخدميها من تحسين الرؤية واتخاذ القرارات وعملية التشغيل الآلي.

وهي مجموعة من البيانات المعقدة المتداخلة بشدة ولا يمكن الحصول عليها وتخزينها وإدارتها بواسطة برمجيات قواعد البيانات التقليدية، وينمو حجم هذه البيانات بسرعة بمرور الوقت ومع التطور التكنولوجي، وتوجد في تطبيقات مختلفة عن بعضها البعض، فهي بيانات  وتقاس بوحدات قياس عالية جدًا مثل التيرا بايت والبيتا بايت والاكسا بايت والزيتا بايت، والذي يساتوي تريليون غيغا بايت.

نشأة مصطلح البيانات الضخمة Big Data

ظهر مصطلح البيانات الضخمة في عام 2000م، وازداد استخدامه حديثًا حيث انتشر ضمن أوائل الاتجاهات التقنية المقبلة، وقد توقعة أهميتها العديد من المراكز والجهات التقنية، وفي عام 2007م كانت البشرية قادرة على تخزين 290 إكسا بايت من البيانات المضغوطة، وتنفيذ 6.4 إكسا بايت من التعليمات في الثانية على أجهزة الحاسب، كما تعددت مصادر المعلومات الرقمية الحالية سواء أكانت مقاطع فيدي أو الصور المتواجدة بالهواتف الذكية والتي يتم تحميلها على اليوتيوب، بالإضافة إلى البيانات المصرفية، وأجهزة الصراف الآلي، وتسجيلات الكاميرات، فضلًا عن بيانات الاصطدام الذري التي سجلتها منظمة الأبحاث النووية الأوروبية، ويمكن استخدام تحليلات البيانات الضخمة لاكتشاف أنماط الاستخدام في وسائل الإعلام الاجتماعية، والعلاقات المتبادلة في البيانات العلمية والطبية من الدراسات المنفصلة وتقاطع المعلومات الطبية مع البيانات الاجتماعية.

 خصائص البيانات الضخمة

تمثل البيانات الضخمة مرحلة هامة من مراحل تطور نظم المعلومات والاتصالات، فهي تعبر في مفهومها عن كمية هائلة من البيانات المعقدة التي يفوق حجمها قدرة البرمجيات والآليات التقليدية على تخزينها واستيعابها وتوزيعها، وتنقسم خصائص البيانات الضخمة إلى ثلاث مجالات رئيسة، وذلك على النحو التالي:

  • تحديات البيانات (Data).
  • تحديات العملية (Process).
  • تحديات الإدارة (Management).

وإليكم تفاصيل تلك المجالات:

أولًا: التحديات المتعلقة بالبيانات:

  1. الحجم: حيث يزداد حجم البيانات مع سرعة نمو البيانات كل عام، بظهور مصادر جديدة للبيانات، ويتمثل التحدي في الحجم في كيفية التعامل مع حجم البيانات الضخمة.
  2. التنوع: فهي تجمع بين مجموعة من البيانات المتعددة غير المنظمة وتكون كبيرة جدًا لإدارتها بشكل فعال، ويتمثل التحدي في مجال التنوع بكيفية التعامل مع التعدد في أنواع البيانات والمصادر والأشكال.
  3. السرعة: كلما حصلت الشركات على قيمة أكبر من التحليلات التي تجريها للبيانات الضخمة، فإن ذلك يخلق لديها مشكلة النجاح، إنها تريد البيانات المتاحة بشكل أسرع، ومن أهم التحديات في هذا المجال هي كيفية مواجهة فيضانات المعلومات في الوقت المطلوب أثناء التطبيق.
  4. المصداقية: تتميز البيانات الضخمة بجودتها وتوافرها، وتتمثل تحديات هذا المجال في:
    • مدى جودة البيانات، وشمولية تغطيتها.
    • مدى دقة قرار أخذ العينات، والوقت المناسب للقراءات.
    • البيانات المتوفرة.
  5. اكتشاف البيانات: وهي تتمثل في كيفية العثور على بيانات عالية الجودة من مجموعات ضخمة من البيانات التي توجد على الشبكة العنكبوتية.
  6. الجودة والصلة: يتمثل في تحديد نوعية مجموعات البيانات وعلاقتها بقضايا معينة.
  7. شمولية البيانات: وهي تتمثل في هل هناك مناطق بدون تغطية؟ وما هي الآثار المترتبة على ذلك.
  8. دوغماتية البيانات: حيث يمكن أن يقدم تحليل البيانات الكبيرة رؤى ملحوظة جدًا، ولكن يجب أن نكون حذرين من أن يكون للأرقام تأثير قوي علينا، ويجب أن يكون لخبراء المجال والمنطق السليم دور في هذا المجال.

ثانيًا: تحديات المعالجة

وتشمل ما يلي:

  • أسر البيانات.
  • المفاضلة بين البيانات من مصادر مختلفة.
  • تحويل البيانات إلى شكل قابل للتحليل.
  • نمذجة البيانات.
  • فهم المخرجات.

ثالثًا: التحديات الإدارية

وتشمل ما يلي:

أهمية البيانات الضخمة

تستخدم البيانات على نطاق واسع في القطاع المصرفي؛ لفهم العملاء، وفي القطاع التعليمي؛ لتحديد الطلاب المعرضين للخطر، وتمكين الطلاب من تحقيق تقدم دراسي، وفي العمل الحكومي مثل إدارة المرافق، والوكالات، والتعامل مع الازدحام المروري، أو منع الجريمة، وفي القطاع الصحي: مثل إدارة سجلات المرضى، وإعداد الخطط العلاجية والوصفات الطبية، وفي قطاع التصنيع؛ لتحسين الإنتاج والجودة.

كما يوفر تحليل البيانات الضخمة إمكانات لإيجاد إجابات للكثير من المشكلات المعقدة التي تواجه الإنسان، والتي تحتاج أوقاتًا أطول لدراستها، مثل تغير المناخ، والصراعات، والتنوع البولوجي، والهزات الأرضية.

كما تعمل على إضفاء الطابع الديمقراطي على العمل مع البيانات وتوفير فرص متعددة؛ لتوليد قيمة ورؤى جديدة من الكميات الضخمة من البيانات.

مصادر البيانات الضخمة

تتعدد مصادر البيانات الضخمة، وذلك على النحو التالي:

  1. المصادر الناشئة عن إدارة أحد البرامج: وهي المصادر سواء أكان البرنامج أو الإدارة لها تبعية حكومية أم لا، مثل السجلات المصرفية، وسجلات التأمين وبنوك الطعام، وبرامج التعليم، والبحث العلمي في الجامعات، والمراكز البحثية، والتعاملات البنكية.
  2. المصادر التجارية: مثل البطاقات الائتمانية، والمعاملات التي تجري عن طريق الإنترنت بوسائل مثل الأجهزة المحمولة.
  3. مصادر شبكات أجهزة الاستشعار: مثل التصوير بالأقمار الصناعية، وأجهزة استشعار الطرق، وأجهزة استشعار المناخ، ورادارات السرعة على الطرق.
  4. مصادر أجهزة التتبع: مثل تتبع البيانات المستمدة من الهواتف المحمولة والنظام العالمي لتحديد المواقع.
  5. مصادر البيانات السلوكية:  مثل عدد مرات البحث على الإنترنت عن منتج أو خدمة ما أو أي نوع آخر من المعلومات.
  6. مصادر البيانات المتعلقة بالآراء: مثل التعليقات على وسائل التواصل الاجتماعي.

اقرأ أيضًا:

Amaal El Nagar
Amaal El Nagar
المقالات: 11

اترك ردّاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *