الأحد، 4 مايو 2008

التحليل والتنقيب في قواعد البيانات



إن التنقيب في قواعد البيانات يهدف إلى استخلاص المعلومات المخبأة فيها، وهي تكنولوجيا حديثة فرضت نفسها بقوة في عصر المعلوماتية، واستخدامها يوفر للشركات والمؤسسات في جميع المجالات القدرة على استكشاف، والتركيز على، أهم المعلومات في قواعد البيانات. كما تركز تقنيات التنقيب على بناء التنبؤات المستقبلية واستكشاف السلوك والاتجاهات، مما يسمح بتقدير القرارات الصحيحة واتخاذها في الوقت المناسب.وتجيب تقنيات التنقيب على العديد من الأسئلة، وفي وقت قياسي، بخاصة تلك النوعية من الأسئلة التي كان من الصعب الإجابة عليها، إن لم يكن مستحيلاً، باستخدام التقنيات الكلاسيكية، والتي كانت إن وجدت فإنها تستغرق وقتاً طويلاً والعديد من إجراءات التحليل.

وقد نشأ علم التنقيب في قواعد البيانات كنتيجة طبيعية للنمو ألأسي للبيانات وخاصة بعد الانتشار الواسع لاستخدام أنظمة المعلومات وتراكم الكم الهائل من البيانات التي أصبحت متداولة يومياً في العديد من المجالات، الأمر الذي أدى إلى الحاجة الملحة للإجابة على العديد من الأسئلة واستكشاف المعرفة والتقديرات والتنبؤات المستقبلية.
أساليب التحليل :
1 – التحليل الإحصائي التقليدي، ويندرج تحت هذه النوعية من التحليل كل من :
- وصف البيانات (الأشكال البيانية)
- مقاييس النزعة المركزية
- مقاييس التشتت والانحدار
- معاملات الارتباط بين المتغيرات
- الاختبارات الإحصائية
2 – التنقيب في قواعد البيانات
وهو يهدف إلى استكشاف المعلومات المخبأة في قواعد البيانات، وتشتمل عمليات التنقيب على كل من التحليل باستخدام الخوارزميات التالية :
- خوارزمية الجار الأقرب
- التجزئة العنقودية
- خوارزمية شجر القرار
- خوارزمية الشبكات العصبية
- استقراء القاعدة
اختيار التقنية المناسبة :
لا يوجد قاعدة محددة يتم بناء عليها اختيار تقنية من تقنيات التنقيب، ويتم الاختيار عادة بناءاً على الخبرة في هذا المجال والتجربة الفعلية للتقنيات ومدى فاعليتها، ومن جهة أخرى قد تكون المفاضلة أيضاً بين التقنيات التقليدية والتقنيات الحديثة بقدر ما يكون هناك توفراً للأدوات المناسبة والمحلل الخبير الذي يستطيع أن يقيم الخيارات ويحدد منها المناسب ويطبقه.
تخطيط عمليات التنقيب في البيانات :
يعتبر تخطيط عمليات التنقيب في البيانات من الأمور المهمة للحصول على أفضل النتائج، فالتخطيط الجيد يؤدي للنتائج الجيدة، و يمكن تلخيص الخطوات المتبعة في التحليل والتنقيب في البيانات في ما يلي :
1 – تحديد المشكلة أو القضية التي يتم التنبؤ بها لبحثها وإيجاد الحلول لها
2 – بناء قاعدة بيانات التحليل والتنقيب
3 – استكشاف البيانات
4 – تحضير البيانات للتحليل والتنقيب
5 – بناء نموذج التحليل أو التنقيب المناسب
6 – تطبيق النموذج
7 – استخراج النتائج
وفيما يلي شرحاً مختصراً لكل خطوة :
1 – تحديد المشكلة أو القضية التي يتم التنبؤ بها لبحثها وإيجاد الحلول لها
من الضروري لبحث حل مشكلة ما أن يتم تحديدها بشكل دقيق، وجمع كافة المعلومات المتعلقة بها، وتبدأ هذه العملية بمراجعة وافية لطبيعة عمل المؤسسة المعنية وأهدافها والبدء بتحديد طبيعة المشكلة وأسبابها وجذورها وتفرعاتها. وليس بالضرورة أن تكون هناك مشكلة بمعنى الكلمة ولكن قد تكون المشكلة مصاغة على شكل هدف معين أو تنبؤ محدد.
2 – بناء قاعدة البيانات
وتعتبر من ضمن العمليات المهمة في مراحل التحضير، وهي من المراحل الطويلة والتي قد تأخذ وقتاً طويلاً، وحتى إذا كانت هناك قاعدة بيانات موجودة بالفعل فإنه يستحسن بناء قاعدة بيانات أخرى جديدة بهدف التنقيب، بحيث تشتمل على أية تعديلات يمكن أن تلزم لأغراض التنقيب بشكل خاص.
3 – استكشاف البيانات
البدء باستكشاف البيانات وتحديد الحقول الأكثر أهمية والقيم التي يمكن من خلالها تقييم أهداف التحليل والتنقيب، كذلك تحضير بعض الأشكال البيانية التي يمكن أن تفيد في ذلك.
4 – تحضير البيانات للتحليل والتنقيب
وتشمل تحديد المتغيرات والسجلات وتخليق متغيرات جديدة بحسب الحاجة، كإنشاء متغيرات قابلة للقياس بدلاً من بعض المتغيرات غير الرقمية في قاعدة البيانات، وكذلك حساب متغيرات جديدة مبنية على أكثر من متغير إذا لزم الأمر.
5 – بناء نموذج التحليل أو التنقيب المناسب
اختيار أدوات التحليل الإحصائي، أو خوارزمية التنقيب المناسبة والبدء بإنشائها، وذلك وفق العديد من الاعتبارات التي يمكن الاستناد عليها، كالغرض من الخوارزمية وإمكانية تطبيقها وتحقيقها لهذا الغرض.
6 – تطبيق النموذج
تطبيق نموذج التحليل أو التنقيب وإجراء كافة التعديلات المناسبة بعد التطبيق الأولي في حالة وجود أخطاء، مع مراعاة أهداف المشكلة وبحث إمكانية حلها بالنموذج الذي تم بناءه.
7 – استخراج النتائج
استخراج النتائج وتوضيح الحلول للمشكلة أو التنبؤ وكيفية تطبيقها وفق النتائج التي تم التوصل إليها.

الخلاصة :
في الجدول التالي يمكن تلخيص عملية تطور وتعاظم الإمكانيات التي وفرتها تكنولوجيا المعلومات خلال العقود الماضية، وذلك من خلال توفير إمكانية الإجابة على التساؤلات التي توفرها التطبيقات المختلفة والتي تطورت تدريجياً منذ بدء استخدام الحاسوب وحتى الوصول إلى مستوى التنقيب في البينات كما يلي:
Evolutionary Step
Business Question
Data Collection (1960s)
"What was my total revenue in the last five years?"
Data Access (1980s)
"What were unit sales in Gaza last March?"
Data Warehousing & Decision Support (1990s)
"What were unit sales in Gaza last March? Drill down to Rafah."
Data Mining (Emerging Today)
"What’s likely to happen to Gaza unit sales next month? Why?"

ويتضح من هذا الجدول كيف أن تكنولوجيا المعلومات أصبحت توفر الإمكانات اللازمة للتنبؤ بالسلوك المستقبلي ومن ثم وضع الحلول المناسبة للمشكلات قبل وقوعها في حال إمكان حدوثها، أو من باب التنبؤ بهدف التطوير والتحديث بشكل عام في شتى المجالات. كل ذلك باستخدام تقنيات التحليل والتنقيب التي أصبحت الشغل الشاغل في العالم المتقدم، حيث أن علم التحليل والتنقيب في قواعد البيانات يعتبر حالياً من الهموم الكبيرة التي تقع على عاتق الدول بكافة مؤسساتها بشكل عام، وستظل قدرات التحليل والتنقيب هي العامل الأهم الذي يحدد مدى الاستفادة من تكنولوجيا المعلومات في شتى المجالات.
إعداد أ. مصطفى فؤاد عبيد
محلل وخبير متخصص في الشئون المعلوماتية

ليست هناك تعليقات: