البحث

تسجيل الدخول

أو التسجيل كعضو جديد

البحث

مدخل إلى تحليل البيانات

الرابط المختصر:

mozn.ws/79898

التصنيف:

محاور المقال

البيانات حديث الساعة، وتحليها لغة العصر. تحليل البيانات هي عملية فحص وتدقيق وإعادة تشكيل للبيانات الأصلية أو ما تسمى بالخام بغرض استنباط من هذه البيانات بعض المعلومات والتي يمكن من خلالها اتخاذ وتحديد القرارات.

تحليل البيانات من العلوم التي تعتمد بشكل كبير على الإحصاء ومبادئه، لا أقول هذا الكلام من أجل تصعيبه على العامة أو المبتدئين، بل من أراد التوسع والتعمق فيه فلابد عليه من معرفة الإحصاء وكيف نستخدمه الاستخدام الأمثل. ونحن في هذا المقال سنبتعد قليلاً عن الأكاديميين ومتطلباتهم للدخول في هذا المجال، و سنستخدم بعض الأساسيات العامة والتي تفيدنا في جمعياتنا ومنظماتنا الخيرية.

أنا أؤمن أن تحليل البيانات من العلوم الفطرية والتي تتطور مع نمو تفكيرنا وتجاربنا في الحياة، فكل ما تعلمت تقنيات جديدة كل ما تحسنت جودة المخرجات وكل ما تعمقت أكثر في التحليل ستجد أن طرقك السابقة كانت خاطئة أو ناقصة، لهذا أحب أن أنوه أن هذا العلم سيبني نفسه مع ممارستك له في حياتك العملية.

حتى ندخل في هذا العالم لابد علينا من معرفة أنواع البيانات وقد تطرقنا لها في مقال سابق ( أنواع البيانات: البيانات النوعية والكمية ) لأننا سنتطرق في هذا المقال عن تحليل البيانات الكمية فقط.

حتى نبدأ في تحليل البيانات الكمية يجب عليك أن تراعي أن هناك ثلاث جوانب رئيسية يجب معرفتها

  1. قياس المركز (Measures of Center)
  2. قياس التشتت والانتشار (Measures of Spread)
  3. شكل البيانات (The Shape of the data)

وسنتطرق لها جميعا بتفصيل أكثر كلاً على حدة مع ذكر بعض الأمثلة والتطبيقات لكل جانب.

أولاً: قياس المركز

المركز هو المنتصف أو مكان تجمع البيانات بشكل أكبر، سيأتي في ذهنك الآن المتوسط الحسابي (Average)، نعم صحيح هو المتوسط الحسابي ولكنه نوع واحد من أنواع مختلفة ولكنه يكثر استخدامه في حياتنا اليومية حتى طغى على بقية الأنواع. سأذكر الآن أشهر ثلاث مقاييس لحساب المركز.

المتوسط الحسابي (Average mean)

وهو عبارة عن مجموع الأعداد جميعها مقسوم على عددها. لنقل أن لديك دراسة تبين أعمار المستفيدين من الخدمات التي تقدمها وهذه الدراسة شملت على ١٠٠ شخص. لهذا سنقوم بجمع جميع الأعمار ومن ثم نقسمها على ١٠٠ وهكذا نكون قد حصلنا على المتوسط الحسابي.

الوسيط Median:

وهو عبارة عن ترتيب الأعداد تصاعدياً (من الأدنى وحتى الأعلى) واختيار الرقم الذي يقسم المجموعة إلى قسمين متساويين.

مثلاً لو كان لدينا بيانات عن أعداد المتبرعين في كل ساعة موضحة في الجدول الآتي:

بعدها نقوم بترتيب البيانات من الأصغر إلى الأكبر ومن ثم نأخذ القيمة التي في المنتصف

في هذا المثال لدينا رقمين في المنتصف وليس رقم واحد لهذا سنقوم بجمع رقمين ونقسمها على اثنين لتصبح (٢٢+٢٨)/٢ = ٢٥ شخص.

لو تم حساب المتوسط الحسابي (Average) في هذا المثال سيكون الناتج ٢٣ شخص، فما هو الفرق وما هو الأصح؟ بالطبع كلتا الإجابتين صحيحة ونستطيع أن نستخدمها متى ما نشاء، لكن نستخدم الوسيط متى ما شعرنا أن هناك قيم متطرفة بشكل غريب فإن الأفضل في هذه الحالة حساب المركز عن طريق حساب الوسيط.

المنوال Mode:

وهي القيمة الأكثر تكراراً في مجموعة البيانات التي لديك. فمثلاً لو كان لديك هذه الأرقام (٥،٤،٦،٣،٣،٥،٦،٥) سنجد أن الرقم ٥ هو الأكثر تكراراً لهذا ستكون هي المركز لدينا، هذا المثال بسيط حتى تتضح لك الصورة فقط ولكن استخدامها الأمثل تكون عن طريق تكوين مجموعات رئيسية وتدخل جميع البيانات تبعاً لهذه المجموعات الرئيسية فمثلاً: لو استخدمنا الدراسة الأولى أن لدينا إحصائية عن أعمار ١٠٠ مستفيد من خدماتنا سنقوم في البداية بتكوين المجموعات (شرط: لابد أن تكون متساوية) موضحة في الجدول الآتي:

هنا نلاحظ أن عدد المستفيدين في أعمار (٢٠-٢٥) أكثر من غيرها لهذا سيكون مركز البيانات لدينا في هذه الحالة هو بين (٢٠-٢٥) سنة.

بهذا تعرفنا على أشهر ثلاث أنواع لحساب المركز، في أحسن الأحوال لدينا فإن الثلاث القيم السابقة لحساب المركز ستكون متشابهة وقد تختلف باختلاف طبيعة البيانات، ولكن دورنا نحن الآن أن نعرف ما هي الطريقة الأنسب لنا في حساب المركز.

ثانياً: قياس التشتت والانتشار

ثاني نقطة بعد حساب المركز هو حساب التشتت والانتشار، ويقصد فيه هنا هو كيف تبعد البيانات عن المركز. وهذه من النقاط الهامة جداً في التحليل وللأسف كثير من الدراسات ومتخذي القرارات لا يقومون بها أو لا يفهمونها.

تخيل معي المثال الآتي: دراسة لعدد ١٠٠ مستفيد من الجمعية بعد أخذ المتوسط الحسابي لأعمارهم وجدت أن المركز ٢٥ سنه و بطبيعة الحال ستركز أعمالك اليومية وبرامجك على هذا العمر ولكن هل وضعت في الحسبان وضع بقية البيانات؟ تخيل معي أن بياناتك بهذا الشكل:

هل تستطيع أن تقول أنه يجب عليك التركيز على فئة دون الأخرى؟ هنا يأتي دور حساب التشتت والانتشار.

هناك العديد من الأساليب والطرق لحسابه ولعلنا سنكتفي بأشهر اثنين وأكثرها استخداماً.

المدى Range:

هو الفارق بين أعلى قيمة وأدناه (يجب عليك مراعاة جانب البيانات المدخلة بشكل خاطئ لأنها ستؤثر بشكل كبير على النتائج)، وتعتبر من أسهل الطرق وأيسرها لحساب تشتت البيانات بحيث تضمن أن بياناتك جميعها داخل هذا المدى.

الانحراف المعياري Standard Deviation:

أشبه بمؤشر التقلّبات لأنه يُحدد بالتناسب مع حجم تشتت البيانات. يسجل الانحراف المعياري أعلى درجاته عندما تكون البيانات متباعدة جداً عن بعضها البعض (أي تكون البيانات شديدة التشتّت)، وأدناها عندما تكون البيانات متقاربة من بعضها البعض (أي تكون البيانات شديدة التمركز). هناك معادلات رياضية لحسابها ولكن أسهل طريقة لحسابها عن طريق Excel استخدم المعادلة الآتية   الناتج الذي ستحصل عليه هو عبارة عن انحراف معياري واحد، مثلاً لو افترضنا أن المركز يساوي ٢٠ والانحراف المعياري يساوي ٥  وتعني هنا (٢٠+٥=٢٥ ، ٢٠-٥=١٥) ف٦٨٪ من البيانات تكون ضمن ١٥ وحتى ٢٥، هذا الانحراف المعياري الواحد وفي الجدول التالي يوضح المثال

وفي الشكل التالي يوضح كيف تبتعد البيانات عن المركز

بهذا نكون قد انتهينا من أصعب نقطتين وأكثرها حساسية وهي قياس المركز والتشتت ولم يبقى لدينا إلا عرضها وإخراجها حتى نسهل على متخذ القرار أو المستفيد من مخرجات التحليل أن يتخذ القرار السليم.

ثالثاً: شكل البيانات

في السابق كانت هذه الخطوة تحتاج الكثير من العمل والجهد، لكن في عصرنا الحالي أصبح استخدامها أسهل بكثير بل إن الكثير يستخدمونها دون أي معرفة مسبقة بتحليل البيانات، وهذه هي قوة عصرنا الحالي حيث كثرت التطبيقات التي تسهل من استخدام العلوم ونطبقها بشكل احترافي في حياتنا اليومية.

سأكتب بإذن الله قريباً مقال منفصل خاص بهذا المجال، أعرض فيه أبرز النقاط الهامة والتطبيقات وما هي أبرز أشكال البيانات ومتى نستخدم كل شكل.

ختاماً .. عليك أن تعرف تماماً أن النجاح لا يكون إلا باتخاذ الأسباب المؤدية لذلك بعد توفيق الله سبحانه وتعالى، ومن أبرز الأسباب التي تعينك على النجاح هو التحليل الأمثل لبياناتك. كثير من القرارات التي نتخذها في منظماتنا مبنية على الحدس أو الخبرة ولا أقول أن هذا غير صحيح دائما بل لابد علينا من تعزيزها بتحليل جيد لبيانات مأخوذة بشكل جيد حتى نصل إلى نتائج مرضية بإذن الله.

 

الوسوم:

هل أعجبك المحتوى؟

اقرأ وطور معرفتك التقنية واكتسب المهارات

شارك المحتوى مع من تحب

التعليقات (2)

2 Responses

اترك تعليقاً

عن الكاتب

أسامة مقيطوف

مهندس صناعي | ماجستير ادارة هندسية KFUPM، مهتم في علم البيانات،مدير إدارة المشاريع في شركة التحول التقني.

اقرأ أيضًا

  تطبيقات القرآن الكريم في ضوء التقنيات الناشئة تلعب  التطبيقات القرآنية الناشئة دورًا مهمًا في توفير تجارب تعلم متميزة للمستخدمين. و باستخدام التقنيات الحديثة، يمكن تعزيز ......
الوظائف الإضافية Add-ins في اكسل وكيفية استخدامها الوظائف الإضافية (Add-ins) في اكسل  Excel تُعتبر أدوات صغيرة تعمل على توسيع قدرات البرنامج، مما يعزز من إنتاجيتك ويمكّنك من الق......
ميزة التخزين الشخصي في OneDrive لحماية ملفاتك عندما تبدأ يومك سوف تجد نفسك تتفاعل مع الكثير من الملفات وفي بعض المواقف تجد نفسك تتعمل مع معلومات دقيقة وسرية وتفضل أن تكون خاصة و......
استخدامات الذكاء الاصطناعي لأصحاب الأعمال في 2024 يعمل الذكاء الاصطناعي (AI)، على تحسين الكفاءة وتوفير الوقت والتكاليف. ومع التطورات المستمرة، أصبح الذكاء الاصطناعي مصدرًا مفيدً......
كيف تستخدم الذكاء الاصطناعي في منظمتك في العام 2024 يُستخدم الذكاء الاصطناعي (AI) بطرق متنوعة لتحسين الكفاءة وتوفير الوقت وبأقل التكاليف. مع التطورات المستمرة، يصبح الذكاء الاصط......
أفكار وحلول لتقنية التلعيب Gamification في التطبيقات القرآنية يعمل التلعيب أو Gamification على خلق تجربة مستخدم إيجابية  من رغبات النفس الطبيعية والمحفزات العاطفية والتي تعمل عل......

مجاني 100%

مميزات التسجيل في المنصة

كتابة التعليقات

إضافة المقالات إلى المفضلة

بحث متقدم

سبب الرفض
الملاحظات