التنقيب عن البيانات (Data Mining)
Data Mining
في أيامنا هذه تفرض ظروف الحياة العملية علينا أن نواجه كميات هائلة من البيانات ,وفي ضوء هذا النمو المتسارع للبيانات بتنا أمام ظاهرة أشبه بالانفجار الكبير إلى أنها انفجار من نوع آخر يدعى "انفجار البيانات".
في ظل هذا الكم الهائل من البيانات ظهرت الحاجة إلى وجود آلية معينة نستطيع من خلالها التعامل مع هذه البيانات الضخمة ومن هنا نشأ مفهوم التنقيب عن البيانات (المعلومات) "Data Mining" ليكون الغواصة التي نستكشف من خلالها أعماق بحر البيانات الكبير ,إذاً ما هي ال Data Mining ؟
Data Mining :
هي مجموعة من التقنيات المستخدمة من أجل اكتشاف نماذج من البيانات (معارف مفيدة) في قاعدة بيانات ضخمة وذلك بفعالية وكفاءة عالية .
وهنا يجب أن نتوقف قليلاً لنتساءل سويةً "ما هي نماذج البيانات التي نسعى لاكتشافها ؟ " .
لكن قبل أن نجيب عن هذا السؤال دعونا ننشئ كمية هائلة من البيانات , إليكم هذه الوصفة السحرية !!
أحضروا عدداً كبيراً من الجرائد وضعوها في صندوق كبير ورشوا عليها كمية من الأوراق بحيث يكون بعض هذه الأوراق فارغ وبعضها الآخر يحوي معلومات متنوعة ,ثم ضعوا بين شرائح الجرائد عدة مجلات متنوعة ,ولا تنسوا أن تزينوا هذه الطبخة ببعض الكتب المختلفة ,وتذكروا دوماً أن بعض المحتويات قد تكون تالفة بسبب رداءة الخط.
والآن نريد منكم جمع كافة المعلومات المتاحة في وصفتنا عن شخص معين يعمل في مجال الطب على سبيل المثال ,وذلك بافتراض أننا نعلم بوجود معلومات عن هذا الشخص .
ما رأيكم بذلك؟ وما هو السيناريو المتوقع في التنقيب عن المعلومات المتاحة عن هذا الشخص؟
من الطبيعي أن نصادف كمية كبيرة من المعلومات التي لا علاقة لها عما نبحث ,دعونا نقول أنها معلومات غير مفيدة ,ومن جانب آخر قد نعثر في إحدى المجلات عن عنوان يحمل اسم الشخص المنشود ,لكن لا تفرحوا كثيراً فالخط رديء للغاية ولا يمكننا تحصيل أي شيء من هذه الخربشة فهذه المعلومات غير مفهومة .....
دعونا نتوقف بالتفكير في هذا السيناريو المزعج ,ربما أصبحنا ندري ما هي نماذج البيانات التي نبحث عنها .
طبيعة نماذج البيانات التي نسعى لاكتشافها
تسعى دائماً تقنيات الData Mining لاكتشاف معارف تتصف بالآتي :
1- صالحة (Valid)
2- مفيدة (Useful)
3- مفهومة (Understandable)
4- مبتكرة أو غير مألوفة (Novel)
إذاً وبالرغم من وجود البيانات بصورة ضخمة ومبعثرة وعشوائية أحياناً تستطيع ال Data Mining تحليل هذه البيانات (الخام) وفق خوارزميات محددة لاستخراج المعارف والمعلومات المفيدة .
ما الآليات التي تستخدمها ال Data Mining"" ؟
تعتمد عملية التنقيب عن المعلومات عن على استراتيجيات وطرق مختلفة (مهام مختلفة ) مثل التصنيف والعنقدة والتنبؤ والاحتمالات وتحليل الارتباطات بين البيانات بالإضافة إلى عمليات البحث ,وسنكتفي بذكر هذه الطرق في هذا المقال , لكن إن أردتم معرفة المزيد عنها ترقبونا في المقالات القادمة .
ال ""Data Mining في حياتنا
من منا لا يعرف الفيسبوك!! هل تتخيلون حجم البيانات الهائل الذي يحمله موقع التواصل الاجتماعي هذا؟
هل تتصورون كم هي كبيرة البيانات الموجودة على محرك البحث العملاق غوغل!
في الحقيقة أصبحت ال Data Mining حاجة ضرورية لكثير من المواقع والشركات والمؤسسات والمنظمات وغيرها من الجهات التي تتعامل مع كميات هائلة من البيانات ,بكلمة أخيرة إن عملية التنقيب عن المعلومات باتت وسيلتنا الأساسية للتعامل مع هذا العالم الكبير الذي يعج بالبيانات .
المراجع :
2- Introduction to Data Mining with Case Studies
Author: G. K. Gupta
Prentice Hall India, 2006.
التنقيب عن البيانات (Data Mining)
بواسطة habeeb
on
11:32:00
Rating:
No comments