البيانات

مدخل إلى تحليل البيانات

كُتب بواسطة أسامة مقيطوف

البيانات حديث الساعة، وتحليها لغة العصر. تحليل البيانات هي عملية فحص وتدقيق وإعادة تشكيل للبيانات الأصلية أو ما تسمى بالخام بغرض استنباط من هذه البيانات بعض المعلومات والتي يمكن من خلالها اتخاذ وتحديد القرارات.

تحليل البيانات من العلوم التي تعتمد بشكل كبير على الإحصاء ومبادئه، لا أقول هذا الكلام من أجل تصعيبه على العامة أو المبتدئين، بل من أراد التوسع والتعمق فيه فلابد عليه من معرفة الإحصاء وكيف نستخدمه الاستخدام الأمثل. ونحن في هذا المقال سنبتعد قليلاً عن الأكاديميين ومتطلباتهم للدخول في هذا المجال، و سنستخدم بعض الأساسيات العامة والتي تفيدنا في جمعياتنا ومنظماتنا الخيرية.

أنا أؤمن أن تحليل البيانات من العلوم الفطرية والتي تتطور مع نمو تفكيرنا وتجاربنا في الحياة، فكل ما تعلمت تقنيات جديدة كل ما تحسنت جودة المخرجات وكل ما تعمقت أكثر في التحليل ستجد أن طرقك السابقة كانت خاطئة أو ناقصة، لهذا أحب أن أنوه أن هذا العلم سيبني نفسه مع ممارستك له في حياتك العملية.

حتى ندخل في هذا العالم لابد علينا من معرفة أنواع البيانات وقد تطرقنا لها في مقال سابق ( أنواع البيانات: البيانات النوعية والكمية ) لأننا سنتطرق في هذا المقال عن تحليل البيانات الكمية فقط.

حتى نبدأ في تحليل البيانات الكمية يجب عليك أن تراعي أن هناك ثلاث جوانب رئيسية يجب معرفتها

  1. قياس المركز (Measures of Center)
  2. قياس التشتت والانتشار (Measures of Spread)
  3. شكل البيانات (The Shape of the data)

وسنتطرق لها جميعا بتفصيل أكثر كلاً على حدة مع ذكر بعض الأمثلة والتطبيقات لكل جانب.

أولاً: قياس المركز

المركز هو المنتصف أو مكان تجمع البيانات بشكل أكبر، سيأتي في ذهنك الآن المتوسط الحسابي (Average)، نعم صحيح هو المتوسط الحسابي ولكنه نوع واحد من أنواع مختلفة ولكنه يكثر استخدامه في حياتنا اليومية حتى طغى على بقية الأنواع. سأذكر الآن أشهر ثلاث مقاييس لحساب المركز.

المتوسط الحسابي (Average mean)

وهو عبارة عن مجموع الأعداد جميعها مقسوم على عددها. لنقل أن لديك دراسة تبين أعمار المستفيدين من الخدمات التي تقدمها وهذه الدراسة شملت على ١٠٠ شخص. لهذا سنقوم بجمع جميع الأعمار ومن ثم نقسمها على ١٠٠ وهكذا نكون قد حصلنا على المتوسط الحسابي.

الوسيط Median:

وهو عبارة عن ترتيب الأعداد تصاعدياً (من الأدنى وحتى الأعلى) واختيار الرقم الذي يقسم المجموعة إلى قسمين متساويين.

مثلاً لو كان لدينا بيانات عن أعداد المتبرعين في كل ساعة موضحة في الجدول الآتي:

بعدها نقوم بترتيب البيانات من الأصغر إلى الأكبر ومن ثم نأخذ القيمة التي في المنتصف

في هذا المثال لدينا رقمين في المنتصف وليس رقم واحد لهذا سنقوم بجمع رقمين ونقسمها على اثنين لتصبح (٢٢+٢٨)/٢ = ٢٥ شخص.

لو تم حساب المتوسط الحسابي (Average) في هذا المثال سيكون الناتج ٢٣ شخص، فما هو الفرق وما هو الأصح؟ بالطبع كلتا الإجابتين صحيحة ونستطيع أن نستخدمها متى ما نشاء، لكن نستخدم الوسيط متى ما شعرنا أن هناك قيم متطرفة بشكل غريب فإن الأفضل في هذه الحالة حساب المركز عن طريق حساب الوسيط.

المنوال Mode:

وهي القيمة الأكثر تكراراً في مجموعة البيانات التي لديك. فمثلاً لو كان لديك هذه الأرقام (٥،٤،٦،٣،٣،٥،٦،٥) سنجد أن الرقم ٥ هو الأكثر تكراراً لهذا ستكون هي المركز لدينا، هذا المثال بسيط حتى تتضح لك الصورة فقط ولكن استخدامها الأمثل تكون عن طريق تكوين مجموعات رئيسية وتدخل جميع البيانات تبعاً لهذه المجموعات الرئيسية فمثلاً: لو استخدمنا الدراسة الأولى أن لدينا إحصائية عن أعمار ١٠٠ مستفيد من خدماتنا سنقوم في البداية بتكوين المجموعات (شرط: لابد أن تكون متساوية) موضحة في الجدول الآتي:

اقرأ أيضاً:  التحول التقني تنشر دراستها عن واقع استخدام البيانات في المنظمات

هنا نلاحظ أن عدد المستفيدين في أعمار (٢٠-٢٥) أكثر من غيرها لهذا سيكون مركز البيانات لدينا في هذه الحالة هو بين (٢٠-٢٥) سنة.

بهذا تعرفنا على أشهر ثلاث أنواع لحساب المركز، في أحسن الأحوال لدينا فإن الثلاث القيم السابقة لحساب المركز ستكون متشابهة وقد تختلف باختلاف طبيعة البيانات، ولكن دورنا نحن الآن أن نعرف ما هي الطريقة الأنسب لنا في حساب المركز.

ثانياً: قياس التشتت والانتشار

ثاني نقطة بعد حساب المركز هو حساب التشتت والانتشار، ويقصد فيه هنا هو كيف تبعد البيانات عن المركز. وهذه من النقاط الهامة جداً في التحليل وللأسف كثير من الدراسات ومتخذي القرارات لا يقومون بها أو لا يفهمونها.

تخيل معي المثال الآتي: دراسة لعدد ١٠٠ مستفيد من الجمعية بعد أخذ المتوسط الحسابي لأعمارهم وجدت أن المركز ٢٥ سنه و بطبيعة الحال ستركز أعمالك اليومية وبرامجك على هذا العمر ولكن هل وضعت في الحسبان وضع بقية البيانات؟ تخيل معي أن بياناتك بهذا الشكل:

هل تستطيع أن تقول أنه يجب عليك التركيز على فئة دون الأخرى؟ هنا يأتي دور حساب التشتت والانتشار.

هناك العديد من الأساليب والطرق لحسابه ولعلنا سنكتفي بأشهر اثنين وأكثرها استخداماً.

المدى Range:

هو الفارق بين أعلى قيمة وأدناه (يجب عليك مراعاة جانب البيانات المدخلة بشكل خاطئ لأنها ستؤثر بشكل كبير على النتائج)، وتعتبر من أسهل الطرق وأيسرها لحساب تشتت البيانات بحيث تضمن أن بياناتك جميعها داخل هذا المدى.

الانحراف المعياري Standard Deviation:

أشبه بمؤشر التقلّبات لأنه يُحدد بالتناسب مع حجم تشتت البيانات. يسجل الانحراف المعياري أعلى درجاته عندما تكون البيانات متباعدة جداً عن بعضها البعض (أي تكون البيانات شديدة التشتّت)، وأدناها عندما تكون البيانات متقاربة من بعضها البعض (أي تكون البيانات شديدة التمركز). هناك معادلات رياضية لحسابها ولكن أسهل طريقة لحسابها عن طريق Excel استخدم المعادلة الآتية   الناتج الذي ستحصل عليه هو عبارة عن انحراف معياري واحد، مثلاً لو افترضنا أن المركز يساوي ٢٠ والانحراف المعياري يساوي ٥  وتعني هنا (٢٠+٥=٢٥ ، ٢٠-٥=١٥) ف٦٨٪ من البيانات تكون ضمن ١٥ وحتى ٢٥، هذا الانحراف المعياري الواحد وفي الجدول التالي يوضح المثال

وفي الشكل التالي يوضح كيف تبتعد البيانات عن المركز

بهذا نكون قد انتهينا من أصعب نقطتين وأكثرها حساسية وهي قياس المركز والتشتت ولم يبقى لدينا إلا عرضها وإخراجها حتى نسهل على متخذ القرار أو المستفيد من مخرجات التحليل أن يتخذ القرار السليم.

ثالثاً: شكل البيانات

في السابق كانت هذه الخطوة تحتاج الكثير من العمل والجهد، لكن في عصرنا الحالي أصبح استخدامها أسهل بكثير بل إن الكثير يستخدمونها دون أي معرفة مسبقة بتحليل البيانات، وهذه هي قوة عصرنا الحالي حيث كثرت التطبيقات التي تسهل من استخدام العلوم ونطبقها بشكل احترافي في حياتنا اليومية.

سأكتب بإذن الله قريباً مقال منفصل خاص بهذا المجال، أعرض فيه أبرز النقاط الهامة والتطبيقات وما هي أبرز أشكال البيانات ومتى نستخدم كل شكل.

ختاماً .. عليك أن تعرف تماماً أن النجاح لا يكون إلا باتخاذ الأسباب المؤدية لذلك بعد توفيق الله سبحانه وتعالى، ومن أبرز الأسباب التي تعينك على النجاح هو التحليل الأمثل لبياناتك. كثير من القرارات التي نتخذها في منظماتنا مبنية على الحدس أو الخبرة ولا أقول أن هذا غير صحيح دائما بل لابد علينا من تعزيزها بتحليل جيد لبيانات مأخوذة بشكل جيد حتى نصل إلى نتائج مرضية بإذن الله.

 

عن الكاتب

أسامة مقيطوف

مهندس صناعي - طالب ماجستير ادارة هندسية KFUPM
مهتم في ادارة المشاريع في العمل الخيري

اترك تعليق