ما هي علوم البيانات - القوة الخفية وراء قرارات الشركات

البيانات نفط المستقبل

لم أبالغ يصديقي بقولي "البيانات نفط المستقبل". انظر للعالم من حولك ستجد أن كل شئ  اصبح يعتمد على البيانات بشكل كبير، وفي توجه مستمر نحو ذلك. الشركات باتت لا تأخذ أي قرار في البيزنس إلا بناءً على تحليل عميق للبيانات. أتظن يصديقي أن المنتجات التي يتم ترشيحها لك على أمازون أتت من فراغ أو حتى فيديوهات اليوتيوب!

ما هي علوم البيانات
ما هي علوم البيانات - القوة الخفية وراء قرارات الشركات
 
في مقال اليوم سنتناول ما هو تعريف علم البيانات (Data Science)، وكيف تستخدمه الشركات لاتخاذ قرارات أفضل، وما هي الأدوات والتقنيات المستخدمة في مجال علوم البيانات، كما سنتحدث عن مجالات علم البيانات المختلفة في سوق العمل. سعدت بوجودكم.

تعريف علوم البيانات

علم البيانات هو الوسيلة التي نستخدمها لاستخراج القيمة من البيانات الخام، مثلما يتم تكرير النفط الخام إلى منتجات مفيدة مثل البنزين والغاز الطبيعي.

 بشكل أكثر دقةً ووضوحاً، علم البيانات هو العلم المسؤول عن تحويل البيانات (Data) إلى معلومات (Information)، فنستخدم تلك المعلومات في اتخاذ قرارات مبنية على تحليل عميق. يمكننا الحصول على البيانات من كل شئ حرفياً.. تفاعلاتك على الفيسبوك ومنصات السوشيال ميديا.. بحثك على جوجل.. بحثك داخل موقع ما.. قواعد البيانات داخل مؤسسة ما.. إلخ، وقد تكون هذه البيانات هيكلية (Structured) أو غير هيكلية (Unstructured)، مثل نصوص.. صور.. فيديوهات.. إلخ.

سبب تطور وشهرة مجال علوم البيانات بهذا الشكل يرجع إلى تطور علم الذكاء الاصطناعي، كما أن الذكاء الاصطناعي نفسه تطور بسبب القدرة على معالجة كميات ضخمة من البيانات (لتجنب الإرباك أنصحك بقراءة هذا المقال لتفهم مقدار الترابط بين علم البيانات والذكاء الاصطناعي). علم البيانات لا يقوم على تقنيات الذكاء الاصطناعي فقط؛ بل يجمع أيضاً بين علم الاحصاء والرياضيات وعلوم الحاسب.

كيف تستخدم الشركات علوم البيانات لاتخاذ قرارات استراتيجية

علم البيانات يمكن الشركات من الإجابة على ثلاثة أسئلة استراتيجية رئيسية: ماذا حدث؟ لماذا حدث؟ وماذا سيحدث؟ هذه الأسئلة تغطي تحليل الماضي (البيانات القديمة أو التاريخية)، فهم الحاضر (البيانات اللحظية)، والتنبؤ بالمستقبل (التوقعات المستقبلية). استنادًا إلى هذه التحليلات، تستطيع الشركات اتخاذ قرارات مدروسة لتحقيق أهدافها.
  • ماذا حدث؟ يشير إلى التحليل الوصفي (Descriptive Analytics)، الذي يساعد في فهم البيانات التاريخية والحالية.
  • لماذا حدث؟ يعتمد على التحليل التشخيصي (Diagnostic Analytics) لفهم الأسباب وراء حدوث أمر ما.
  • ماذا سيحدث؟ يرتبط بالتحليل التنبؤي (Predictive Analytics)، الذي يستخدم النماذج (Models) للتنبؤ بالنتائج المستقبلية.
هذه الأنواع الثلاثة من التحليلات تعد من الركائز الأساسية في علم البيانات، وتستخدم بشكل تكاملي وليس منفرد.

التحليل التنبؤي (ماذا سيحدث؟) هو الذي يدخل فيه بشكل كبير علم الذكاء الاصطناعي وتعلم الآلة (AI & Machine Learning). باستخدام تقنية تعلم الآلة، نقوم ببناء نموذج يمكنه التنبؤ بما سيحدث بناءً على البيانات المتاحة، وكلما زادت كمية وجودة البيانات المتاحة، كلما زاد أداء ودقة هذا النموذج، مما يمكن الشركات من اتخاذ قرارات أكثر حكمة.

أدوات وتقنيات علوم البيانات

في هذه الجزئية يصديقي، سأذكر لك الأدوات والتقنيات الشائعة، والتي تسخدم بالفعل في سوق العمل في مجال الداتا:

1. لغة البرمجة Python: تعد بايثون الأشهر والأكثر استخداماً في مجال علوم البيانات، ومن أشهر مكتباتها:
  • Pandas لتحليل البيانات ومعالجتها؛ حيث تمكننا من معالجة البيانات بشكل فعال وسريع.
  • NumPy للتعامل مع المصفوفات والأرقام، فيمكننا مثلاً حساب الـ Standard Deviation والـ Normal Distribution .. إلخ.
  • Matplotlib و Seaborn لعرض البيانات بصور بيانية (Visualization).
2. لغة البرمجة R: توفر أدوات قوية للتحليل البياني والاحصائي للحصول على نتائج دقيقة. لغة R تستخدم أيضاً في سوق العمل، لكنها تستخدم أكثر في الجوانب البحثية (الـ Research).

3. أدوات معالجة البيانات الضخمة (Big Data Tools): مثل  Hadoop و Spark.

4. أدوات قواعد البيانات:
  • SQL: لتخزين واسترجاع البيانات من قواعد البيانات الهيكلية (المنظمة).
  • NoSQL مثل MongoDB: للتعامل مع البيانات غير الهيكلية (غير المنظمة) مثل النصوص والصور.
5. أدوات تعلم الآلة (Machine Learning Tools): كلهم عبارة أيضاً عن مكتبات في بايثون:
  • Scikit-learn:  تستخدم لبناء نماذج تعلم الآلة.
  • TensorFlow و Keras: مكتبات مفتوحة المصدر تستخدم لبناء نماذج تعلم الآلة المتقدمة، خاصة الشبكات العصبية العميقة (Deep Learning)
6. أدوات عرض البيانات بصورة مرئية (Data Visualization Tools): أشهرهم Tableau و Power BI.

7. الـ Cloud: شركات مثل Amazon Web Services (AWS) و Google Cloud و Microsoft Azure تقدم خدمات سحابية تمكن من معالجة وتخزين البيانات بشكل فعال جداً.

8. أدوات إدارة البيانات (Data Management Tools):
  • Apache Airflow: أداة لإدارة مهام معالجة البيانات بشكل فعال.
  • Jupyter Notebooks: مثل الـ IDE العادي لكتابة الكود، لكنه يمكنك من رؤية نتيجة كل جزء في الكود مباشرة.

مجالات علم البيانات

أعتقد يصديقي أنك سمعت من قبل بهذه المسميات Data Engineer و Data Analyst فضلاً عن Data Scientist، ولعلك تتسائل ما الفرق بين كل هذه المسميات؟

 كل هذه المسميات يصديقي في الأول والأخير تندرج تحت مجال الداتا، ببساطة لنوضح الأمر:

1. عالم البيانات Data Scientist: هو المسؤول عن إجابة سؤال "ماذا سيحدث؟" أي أنه هو الذي يبني النماذج (Models) لكي تتوقع ما سيحدث في المستقبل بناءً على البيانات المتاحة، وهو شخص يفهم البيزنس التي تقوم عليه الشركة أو المؤسسة جيداً. هو أيضاً الذي يقوم بتحسين النماذج، وتقديم الحلول الاستراتيجية للشركة. يمكن إعتباره أنه الرتبة الأعلى التي بيدها كل التقنيات والأدوات التي تمكنها من التعامل مع البيانات؛ فإذا تتطلب حل مشكلة ما القيام بمهام مهندس البيانات ومحلل البيانات (ما زلنا سنذكرها) قام بذلك بدون أدنى مشكلة.

2. محلل البيانات Data Analyst: محلل البيانات هو الشخص الذي يركز أكثر على سؤال "ماذا حدث؟ لماذا حدث؟". يمكننا اعتباره الشخص الذي يسبق عالم البيانات ليمهد له الأمور أكثر.

3. مهندس البيانات Data Engineer: مهندس البيانات هو الشخص الذي يتعامل بشكل أساسي مع الـ Big Data ويجعلها مناسبة ومهيأة لشغل محلل البيانات. يمكننا القول بأن البيانات تمر على ثلاث أشخاص بالترتيب لكي نتمكن من الاستفادة منها؛ مهندس البيانات.. محلل البيانات.. عالم البيانات.

هناك نقطة في غاية الأهمية يصديقي، وهي أن هذه الأمور نسبية إلى حد كبير باختلاف حجم الشركة ونوع السوق؛ فمثلاً قد تجد في شركات معينة عالم البيانات يقوم بكل هذه الوظائف لوحده وأعني بالتحديد الشركات الصغيرة (وبيرش ميه قدام الشركة كل يوم كمان هههه). قد تجد أيضاً هناك وظائف أخرى في مجال البيانات مثل Business Analyst و Business Intelligence Analyst؛ على حسب كل شركة.. وطبيعة سوق العمل الذي تتواجد فيه.

الخاتمة

إلى هنا يصديقي، أعتقد أنك عرفت بشكل مبسط ما هي علوم البيانات، وكيف تستخدمها الشركات والمؤسسات. تكلمنا عن الأدوات والتقنيات المستخدمة في المجال، ووضحنا الفرق بين التخصصات والوظائف المختلفة داخل علم البيانات نفسه. أرجو لي ولك التوفيق. إذا انتفعت مني بشئ ولو بسيط؛ فلا تنساني من صالح دعائك.

إذا وجدتم الفائدة، تابعوا مقالاتي  وانضموا لقناة التلجرام (نتحدث في مواضيع أخرى في المجال كما سينزل عليها كل جديد في الموقع). لا تترددوا في مشاركة آرائكم أو استفساراتكم حول مقال اليوم في قسم التعليقات أدناه. أقدر تفاعلكم جداً، فآراؤكم تساعدني على تحسين المحتوى وتقديم ما يلبي احتياجاتكم.


كان معكم علي وحيد.

"اللهم إن كان من توفيق فمنك وحدك وإن كان من خطأ أو نسيان فمني ومن الشيطان."

Ali Waheed

مرحبًا بكم، انا على وحيد طالب في كلية الذكاء الاصطناعي جامعة المنوفية. أتكلم عن مواضيع في الذكاء الاصطناعي والبرمجة. أشارك معكم تجارب شخصية في المجال، مراجعات كورسات... وإن شاء الله أكثر من ذلك. تشرفت بكم.

إرسال تعليق

أحدث أقدم

نموذج الاتصال