دليل المتخصِّصين في علم البيانات للعمل في مجال الذكاء الاصطناعي
علم البيانات من العلوم الجذَّابة والمهمة في وقتنا الحالي، وليس سراً أن العديد من الصناعات تستفيد منه بشكل متزايد - ليس هناك ثمَّة شك في مدى الأهمية التي يتميَّز بها المجال.
تهدف هذه المقالة إلى توضيح سبب هذه الأهمية، من خلال وصف المهام التي عادة ما يقوم بها متخصصي علوم البيانات.
يهدف علم البيانات إلى تمكين المستخدم (العميل الذي نتعامل معه) من اتِّخاذ قرارات مناسبة تعتمد على البيانات، والتي يكون لها ثمَّة تأثير إيجابي على أعماله. ويتمثَّل هذا الأثر الإيجابي في المقام الأول في زيادة الأرباح وانخفاض النفقات و/أو تعزيز الكفاءة التشغيلية.
وتبدأ مثل هذه المساعي عادةً بالإشارة إلى الصِعاب التجارية (جوانب أعمالهم التي لديها مجال كبير للتحسين) التي يواجهها مستخدم البيانات، والتي يمكن تخفيفها بمساعدة علم البيانات. وقد يكون علم البيانات مفيدًا للكشف عن الاتجاهات الخفية في البيانات التي قد تستفيد منها الشركات، واستكشاف المشكلات في البيانات وإصلاحها، وبناء نماذج تنبؤ على بيانات سابقة لتوقُّع ما سيحدث مستقبلياً بدقة، وما إلى ذلك.
وفي ما يلي، تمت صياغة خريطة لمشروع في مجال علم البيانات، لاعطائكم لمحة عما يقوم به المتخصصين في المجال بشكل روتيني.
دعونا نكتشف ما يفعله المتخصِّصون في علم البيانات في يومهم...
مشروع في علم البيانات: من الألف إلى الياء
يتضمَّن كل مشروع من مشاريع مجال علم البيانات الخطوات الآتية: جمع البيانات، وتحويل البيانات، وتحليل البيانات، والنتائج المُستخلصة. تابعوا القراءة للتعرُّف على طبيعة كل خطوة من هذه الخطوات.
1. جمع البيانات
من البديهي القول إنه بدون البيانات لا يمكن أن يكون هناك ثمَّة علمٍ يُسمَّى علم بيانات؛ لذلك نحن بحاجة إلى البحث عن بعض البيانات أولاً.
ضع في اعتبارك أن البيانات التي يتم جمعها يجب أن تُمكِّننا من تحقيق الهدف الذي ذكرناه آنفًا؛ أي تقديم المساعدة لمستخدم البيانات على اتِّخاذ قرارات مؤثرة تفيد منظمته. ويجب أن يكون هذا الهدف هو العامل الأساسي الذي يرشدنا إلى البيانات التي يجب أن نولي تركيزًا على جمعها.
إذا كانت مجموعة البيانات المناسبة متاحة بالفعل (إما عبر الإنترنت أو مُقدَّمة من قاعدة بيانات الأعمال الحالية)،
فيمكنك المُضيّْ قدمًا والحصول عليها. وقد تقوم عِوضًا عن ذلك بجمع البيانات التي تحتاجها من الإنترنت أو حتى إجراء دراسة استقصائية لجمع البيانات المطلوبة.
ومع ذلك، في حالة الاتصال بأحد مختصي علم البيانات لتقديم الاستشارات لمشروع تجاري بدأ للتو وإنشاء البنية التحتية للبيانات الخاصة به، يحتاج اختصاصي علم البيانات هذا إلى أن يكون لديه الرؤية والبصيرة حول كيفية استخدام البيانات لمساعدة مستخدمي البيانات (ستانتون، 2012).
وذلك لأن مستخدم البيانات سيستفيد في النهاية من التحليلات المستقبلية للبيانات لاتِّخاذ القرارات التي ستؤثر على الأعمال التجارية، ويقع على عاتق اختصاصي علم البيانات في هذه الحالة التأكُّد من أن مستخدم البيانات سيتحلى بالقدرة في النهاية على القيام بذلك! وبعبارة أخرى، لكي تكون هذه التحليلات المهمة ممكنة في المستقبل، يجب على اختصاصي علم البيانات أن يكفل إدراج عناصر البيانات اللازمة حاليًا في هيكل قاعدة البيانات التي تُخزِّن جميع البيانات.
الآن بعد أن اكتملت عملية الجمع، فقد حان الوقت لتحويل هذه البيانات.
2. تحويل البيانات
هذه هي المرحلة التي ستقوم خلالها "بتنظيف" البيانات وتحويلها إلى تنسيقات يسهل الوصول إليها/مرغوب فيها لتحليلها. وتعد هذه المهمة هي الجزء الأكثر استهلاكًا للوقت في أي مشروع، حيث إن معظم مجموعات البيانات في الحقيقة لا تكون جاهزة للتحليل.
تشمل الأشياء النموذجية التي قد يواجهها/ينفذها اختصاصي علم البيانات على مجموعة من البيانات يعمل عليها الآتي:
القيم المفقودة في البيانات.
القيم الفاسدة في البيانات (أي القيم المُخزَّنة على نحوٍ غير صحيح).
ضم البيانات المبعثرة في جداول متعددة.
هيكلة ميزات جديدة مهمة للتحليل اللاحق.
الآن بعد أن تم تحويل البيانات، فقد حان الوقت لتحليلها!
3. تحليل البيانات
هناك ثمَّة أنواع مختلفة من التحليلات: التحليلات الوصفية والتشخيصية والتنبؤية والإلزامية. ويكمُن العامل الأساسي لكل منهم في حب الاستطلاع. حاول أن تضع في اعتبارك مجموعة من الأسئلة تريد الإجابة عليها قبل المُضيّْ قدمًا وتحليل البيانات. إذا لم تتمكن من طرح أسئلة، فابدأ بإحصاءات موجزة عن المجموعة البيانات التي تعمل عليها وكن فضوليًا لتقرر ما يجب القيام به بعد ذلك.
التحليلات الوصفية (Descriptive analytics)
تُعرف التحليلات الوصفية أيضًا باسم تحليل البيانات الاستكشافية، وتستلزم استكشاف البيانات للوقوف على أي اتِّجاهات تكمن فيها، وتجميع البيانات من وجهات نظر متعددة، ورسم صور متعددة تُمكِّننا من فهم البيانات بشكل أكبر (فكِّر في المدرج التكراري ومخطط الانتشار وما شابه ذلك).
يمكن أن يكون نطاق مشروع علم البيانات بمثابة بوصلة تساعد اختصاصي علم البيانات في اختيار العناصر التي يجب التركيز عليها. ويحدث ذلك بصفة خاصة إذا كانت البيانات كبيرة للغاية؛ أي أن البيانات تتألف من عناصر كثيرة لا يمكن تحليلها تحليلًا شاملًا (كقاعدة بيانات تحتوي على مئات الجداول تضم أنواع مختلفة من المعلومات).
التحليلات التشخيصية (Diagnostic analytics)
على غرار ما سبق، إلا أنه يتم في التحليلات التشخيصية نشر عددٍ من التقنيات لمراقبة ظهور نمط غير متوقع والوقوف على أسبابه.
التحليلات التنبؤية (Predictive analytics)
تعمل التحليلات التنبؤية التطلعية، بمساعدة مجموعة متنوعة من التقنيات الإحصائية، على ترحيل أي أنماط (مشكلات أو نتائج) من المحتمل حدوثها في المستقبل.
التحليلات الإلزامية (Prescriptive analytics)
يمثل هذا النوع من التحليلات خطوة إضافية إلى الأمام: بافتراض أننا نعرف المشكلة التي يواجهها العمل، فإننا نحاول تزويد مستخدمي البيانات بالإجراءات المقترحة التي، إذا تم تطبيقها، ستؤدي إلى تحسن مباشر في مؤشرات الأداء الرئيسية (KPIs) ذات الصلة.
هل تم إجراء التحليلات؟ إذا حان الوقت لإظهار ثمار عملنا...
4. عرض النتائج المُستخلصة
من الأهمية الانخراط في هذه المرحلة مع وضع مستخدم البيانات بعين الاعتبار. إنه من الضروري، على سبيل المثال، أن يفهم مستخدم البيانات ما الذي تقوم بعرضه عليه. وفي حال عدم فهمه لذلك، فإنه لن يتحلَّى بالقدرة على اتِّخاذ قرار تجاري حاسم.
وفي هذا الشأن، يُعد التمتُّع بفهمٍ سليم لمجال الأعمال الذي تعمل عليه أمرًا بالغ الأهمية. كما أنه يساعد على ضمان استخدام مصطلحات العميل الخاص بك حتى تتمكَّن من نقل رسالتك ونتائجك إليهم على نحوٍ مناسب وواضح.
وأخيرًا، لا تستهين على الإطلاق بقوة تصورات البيانات وأدواتها في إيصال رسالتك بطريقة يسهل فهمها والوصول إليها.
Kommentare