إحصاء/مبادئ الإحصاء
هذا الكتاب أو المقطع بحاجة إلى إعادة كتابة وتنسيق باستخدام صيغ الويكي، وإضافة وصلات. الرجاء إعادة الصياغة بشكل يتماشى مع دليل تنسيق المقالات. بإمكانك إزالة هذه الرسالة بعد عمل التعديلات اللازمة. |
بسم الله الرحمن الرحيم
اما بعد العدد الأكثر شيوعا هو المنوال
إحصاء
عدلالإحصاء أحد فروع الرياضيات الواسعة ذات التطبيقات الواسعة ، يهتم علم الإحصاء بجمع و تلخيص و تمثيل و إيجاد استنتاجات من مجموعة البيانات المتوفرة ، محاولا التغلب على مشاكل مثل عدم تجانس البيانات و تباعدها . كل هذا يجعله ذا أهمية تطبيقية واسعة في شتى مجالات العلوم من الفيزياء إلى العلوم الاجتماعية و حتى الإنسانية ، كما يلعب دورا في السياسة و الأعمال . المصطلحات المفتاحية لعلم الإحصاء تنطوي على مفاهيم نظرية الاحتمالات بشكل أساسي : مجتمع إحصائي population ، عينة sample ، وحدة استعيان sampling unit ، احتمال probability . الخطوة الأولى في أي عملية إحصائية هي جمع البيانات data من خلال عملية الاستعيان sampling من ضمن المجتمع الإحصائي الضخم أو من خلال تسجيل الاستجابات لمعالجة ما في تجربة (تصميم تجريبي experimental design ) ، أو عن طريق ملاحظة عملية متكررة مع الزمن (متسلسلات زمنية time series ) ،من ثم وضع خلاصات رقمية و تمثيلية (مخططية) graphical باستخدام ما يدعى الإحصاء الوصفي descriptive statistics . الأنماط الموجودة ضمن البيانات يتم دمجها(تنمذج) modeling لأخذ استدلالات حول مجتمعات كبيرة ، لذلك يجب دراسة حجم العينة بحيث تكون ممثلة للمجتمع الإحصائي المسحوبة منه . تتم هذه العملية ضمن ما يدعى الإحصاء الاستدلالي inferential statistics ليأخذ بعين الاعتبار عشوائية و لادقة الملاحظات (القياسات) . الاستدلالات الاحصائية غالبا ما تأخذ شكل إجابات لأسئلة من نوع (نعم/لا) (فيما يدعى اختبار الفرضيات hypothesis testing )، تقدير خاصيات عددية (تقدير estimation )، التنبؤ prediction بملاحظات أو قياسات مستقبلية ، وصف ارتباطات و علاقات (ارتباط correlation ) ، أو نمذجة علاقات (انحدار regression ). مجمل العمليات و الإجرائيات و الفروع الإحصائية الموصوفة أعلاه تدخل في إطار ما يدعى إحصاء تطبيقي applied statistics ، يقابله إحصاء رياضي mathematical statistics أو النظرية الإحصائية statistical theory و هي أحد فروع الرياضيات التطبيقية التي تستخدم نظرية الاحتمالات و التحليل الرياضي لوضع الممارسة الإحصائية على أساس نظري متين .
تعريف الاحصاء
عدلالإحصاء علم جمع ووصف وتفسيرالبيانات وبمعنى آخر صندوق الأدوات الموضوع تحت البحث التجريبي. في تحرير البيانات ، هدف العلماء لوصف فهمنا للعالم، أوصاف العلاقات المستقرة بين الظواهر الجديرة بالملاحظة على شكل نظريات أحيانا مدعوة بأن تكون توضيحية مع ذلك الشخص يمكن أن يجادل بأن العلم يصف كيف تحدث الأشياء). اختراع النظرية عملية مبدعة لإعادة هيكلة المعلومات التي ضمنت في إيجاد (وقبول) النظريات ، وتنتزع المعلومات القابلة للاستغلال من العالم الحقيقي. (نحن نجرد من النظريات البديهية تماما التي اشتقت بالاستنتاج المنطقي). المدخل الاستكشافي الأول لمجموعات الظواهر تنفذ نموذجيا باستعمال طرق الوصف الإحصائي.
الإحصاء الوصفي
عدليتضمن الإحصاء الوصفي الأدوات التي ابتكرت لتنظيم وعرض البيانات في نماذج سهلة الوصول ، بمعنى آخر بطريقة ما لا تتجاوز الحدود المعرفية للعقل الانساني، يتضمن قياسات الظواهر المتكررة، خلاصة الإحصاءات المتنوعة، المتوسطات المحسوبة بشكل رئيسي، بيانات الأسطر والإحصاءات تعرض باستعمال الجداول والرسوم البيانية. الوصف الإحصائي يعرض رؤيات مهمة لحدوث الظواهر المفردة، ويشير للمشاركة بينهم، لكن هل يمكن ليزود النتائج التي تكون القوانين المعتبرة في سياق علمي. الإحصاءات وسائل تعامل مع الاختلافات في خصائص الأشياء المتميزة،الأشياء المفردة ليست عرضا بيانيا لمجتمع الأشياء، التي تمتلك الميزة القابلة للقياس موضع التحري، رغم تلك الاختلافات تكون نتيجة اختلاف المتغيرات الأخرى(المسيطرة والعشوائية).علم الفيزياء على سبيل المثال، مهتم بانتزاع والصياغة الرياضية للعلاقات المضبوطة، لا نترك مجالا للتقلبات العشوائية، في إحصاءات مثل هذه التقلبات العشوائية مشكلة العلاقات الإحصائية هكذا العلاقات التي تحدد النسبة المعينة للاختلاف الاحصائي.
الاحصاء الاستقرائي
عدلبالمقارنة مع مناطق واسعة من الفيزياء, تلاحظ العلاقات التجريبية احصائيا في العلوم الطبيعية ،وعلم الاجتماع وعلم النفس (ومواضيع أكثر انتقائية مثل الاقتصاد). العمل التجريبى في هذه الحقول ينتقل نموذجيا على قواعد التجارب أو مسوحات العينة التجريبية ، أما في حالة كامل المجتمع لا يمكن أن يلاحظ أما لاسباب عملية أو اقتصادية. الاستنتاج من العينة المحددة للاشياء لسيادة الخصائص في المجتمع هدف استنتاجي أو احصاء استقرائي, هنا التغير يكون انعكاس التباين في العينة واجراء العينة. الاحصاء والاجراء العلمي اعتماد على حالة التحقيق العلمي ،البيانات مفحوصة بتغير درجات المعلومات السابقة . البيانات ستجمع لاكتشاف الظاهرة في المدخل الأول ،لكنه يمكن أن يخدم الاختيار الاحصائي(التاكيد/ النفي) الفرضيات حول تركيب الخاصة موضع التحري. هكذا ، الاحصاء يطبق في كل مراحل العملية العلمية, حيثما الظواهر القابلة للقياس معقدة. هنا مفهومنا عام بما فيه الكفاية لاحاطة تشكيلة واسعة من المقترحات العلمية المثيرة. نأخذ على سبيل المثال افتراح نحلة طنانة تطير ، بحساب عدد الحوادث في أماكن مختلفة ، نحدد حدوث الظاهرة. على هذه القاعدة ، نحاول استنتاج امكانية مصادفة نحلة, تحت الظروف المعينة (مثال يوم صيفي ممطر في برلين).
1- البيانات – التوزيعات التكرارية. 2- الجداول التكرارية المتجمعة . 3- الأعمدة البيانية. 4- المضلع التكراري. 5- المنحني المتجمع الصاعد و الهابط. 6- القطاعات الدائرية. 7- المتوسط الحسابي. 8- الوسيط . 9- المنوال. 10- الانحراف المعياري.
تعريف : البيانات الإحصائية : عبارة عن معلومات كمية (رقمية) أو كيفية (وصفية) صحيحة ودقيقة تجمع من مصادر محددة ، وبطريقة سليمة .
أمثلة للمتغيرات الكمية الطول بالسم الوزن بالكيلو العمر بالشهر الدخل بالريال درجة الحرارة المئوية عدد أفراد الأسرة
أمثلة للبيانات الوصفية الكيفية)
نوع الجنس العرق النجاح
الرمز لون الشعر الجنسية
أنواع العينات : أ- العينة العشوائية : وهي العينة التي تختار بحيث تكون فرص الاختيار متكافئة لدي جميع أفراد المجتمع ، و يعرف هذا الأسلوب لدي العامة بالقرعة ، مثل كتابة أفرد المجتمع في أوراق صغيرة وإغلاقها واختيار إحداها . ب- العينة العمدية : وهي العينة التي يتم اختيارها بحيث تتوافر في كل عنصر شروط محددة ، مثلاُ : اختيار الطلاب الأذكياء لتطبيق دراسة عليهم . ت- العينة الطبقية : وهي العينة التي يتم اختيارها لتشتمل علي خواص المجتمع بالنسب ، فمثلاً إذا كان لدينا مجتمع تعليمي عدده 300 ، وكانت نسبة الذكور إلي الإناث 2 : 3 وإردنا أن نختار عينة من 50 شخص ، فلابد أن نختار 30 ذكر و 20 أنثي .
التوزيعات التكرارية :
أولاً : البيانات النوعية :
وهي البيانات التي لا يمكن التعبير عن مفرداتها بأرقام عددية مثل الصفات ، كالحالة الاجتماعية (لم يتزوج – متزوج – مطلق – أرمل) .
والتقدير في الامتحان (راسب – مقبول – جيد – جيد جداً – ممتاز)
وتوضع تلك البيانات في جداول تكرارية وذلك بحصر الصفات التي لم تشملها هذه البيانات وإيجاد عدد المفردات المناظر لتلك الصفات .
مثال (8-1) : تمثل البيانات التالية 40 طالباً من الامتحان النهائي في الصف الأول الثانوي من المدرسة أ
جيد جيد ممتاز ممتاز راسب جيد جداً جيد جيد مقبول جيد جيد جداً راسب مقبول جيد جداً جيد جيد جيد جداً جيد مقبول جيد مقبول ممتاز جيد ممتاز جيد جداً راسب جيد ممتاز مقبول راسب راسب جيد جيد جداً راسب جيد جداً جيد جيد جيد جداُ جيد جداً جيد
وسوف نقوم بتفريغ تلك البيانات في جدول تكرارى كما يلي :
جدول التفريغ
عدد الطلاب الحاصلين عليه العلامات التقدير 5 ممتاز 8 جيد جداً 16 جيد 5 مقبول 6 راسب 40 المجموع
نضع علامة كلما وجدنا التقدير ثم نجمع العلامات في العمود الثالث فمثلاُ عدد الطلاب الحاصلين علي تقدير ممتاز هم 5
التوزيع التكراري : للحصول علي توزيع تكراري نأخذ العمودين الأول والأخير من جدول التفريغ فيصبح لدينا الجدول التالي : الجدول التكراري (3) عدد الطلاب الحاصلين عليه التقدير 5 ممتاز 8 جيد جداً 16 جيد 5 مقبول 6 راسب 40 المجموع مثال (2) : إذا كانت نتيجة الامتحان النهائي لمجموعة مكونة من ثلاثين طالباً من الصف الأول الثانوي في المدرسة ب كما بالجدول التالي :
جدول (4)
عدد الطلاب الحاصلين عليه التقدير 3 ممتاز 6 جيد جداً 10 جيد 6 مقبول 5 راسب 30 المجموع هل يمكنك أن تقارن نتائج المدرستين أ ، ب؟ من الصعب مقارنة نتيجتي المدرستين بسهولة لذلك نلجأ إلي إنشاء جدول للتوزيع التكراري النسبي أو جدول التكرار النسبي
تعريف (4) التكرار النسبي لآي صفة هو تكرار تلك الصفة مقسوماُ علي مجموع التكرارات.
تعريف 5: التكرار المئوي لآي صفة هو التكرار النسبي لتلك الصفة مضروباُ في 100
المدرسة ب المدرسة أ التكرار المئوي التكرار النسبي التكرار التقدير التكرار المئوي التكرار النسبي التكرار التقدير 10 0.1 3 ممتاز 12.5 0.125 5 ممتاز 20 0.2 6 جيد جداً 20 0.2 8 جيد جداً 33 0.33 10 جيد 40 0.4 16 جيد 20 0.2 6 مقبول 12.5 0.125 5 مقبول 17 0.17 5 راسب 15 0.15 6 راسب 100 1 30 المجموع 100 1 40 المجموع
وهنا يمكن مقارنة النسبتين فنقول مثلاُ بأن 20 % من طلاب المدرستين حصلوا علي تقدير جيد جداً وأن الرسوب في المدرسة أ أصغر من الرسوب في المدرسة ب
البيانات الكمية (العددية)
هي البيانات التي يمكن التعبير عن مفرداتها بقيم عددية مثل درجة الطالب في الامتحان أو السن ، أو الدخل ..... الخ .
و هنا نلاحظ نوعين من البيانات
أ- المستمرة :مثل درجة الحرارة ويمكن أن تأخذ أي قيمة أي لا تحوي قفزات فالترمومتر يرتفع أو ينخفض ماراً بكل القيم .
ب- المتقطعة : مثل عدد أفراد الأسرة .... الخ 3 أو 4 فلا يوجد مثلاً 3.23 .
و لوضع البيانات الكمية في جدول التوزيع التكراري ، نقسم البيانات إلي فترات أو مجالات متساوية الطول عادة و تلك الفترات تسمي فئات ، ونضع العلامة الناتجة من آي مفردة أمام الفئة التي تقع فيها تلك القراءة ولتحديد طول الفئة المناسب يجب مراعاة ما يلي : 1- تحديد المدى الذي تنتشر فيه البيانات . 2- اختيار عدد مناسب من الفئات (من 6 إلي 12 فئة) . 3- أن لا يقل مفردات الفئة كثيراُ .
مثال (3) البيانات التالية تمثل الأجر اليومي لثمانين عاملاً في أحد المصانع بالريال . جدول (7) 91 63 60 50 82 51 61 89 72 55 77 100 84 74 102 75 83 89 81 82 71 63 86 75 85 81 71 59 61 105 88 89 90 81 58 85 80 81 65 81 119 69 112 51 77 118 75 99 101 91 95 66 82 73 85 81 83 56 109 78 67 102 117 65 66 115 84 56 112 107 87 65 106 74 72 96 88 75 85 91
و لإيجاد جدول تفريغ البيانات نتبع الخطوات التالية : أولاُ : نحدد المدى المطلق للبيانات و هو الفرق بين أكبر قراءة وأصغر قراءة
المدي المطلق = 119 – 50= 69 ريالاً .
ثانياً : نختار طولاً مناسباً للفئة وهو هنا 10 ريالات و بالتالي نقسم 69 ÷ 10 فيكون لدينا 7 فئات تقريبا ( 1 عدد صغير يمكن تجاهله) . ويمكن التعبير عن تلك الفئات كما يلي : الطريقة الثانية الطريقة الأولي 50 – 50 – 59 60- 60 – 69 ... ...
و نستمر حتى نهاية الفئات و الطريقة الثانية أفضل إذا احتوت القياسات علي كسور .
وفيما يلي جدول تفريغ أجور العمال بالريال
التكرار (عدد العمال في الفئة أو الشريحة) العلامات فئات أجور العمال 8 50- 12 60- 14 70- 24 80- 8 90- 8 100- 6 110- 80 المجموع
و يمكن عمل الجدول التكراري ، وكذلك الجدول التكراري النسبي والمئوي كما في البيانات الوصفية غير أننا نستبدل الصفات بالفئات العددية المقابلة كما بالجدولين (9) ، (10). الجدول التكراري النسبي و المئوي الجدول التكراري التكرار المئوي التكرار النسبي الفئات التكرار الفئات 10 0.1 50- 8 50- 15 0.15 60- 12 60- 17.5 0.175 70- 14 70- 30 0.3 80- 24 80- 10 0.1 90- 8 90- 10 0.1 100- 8 100- 7.5 0.075 110- 6 110- 100 1 المجموع 80 المجموع
الجداول التكرارية المتجمعة : يوجد نوعان من الجداول المتكررة هما جدول التكرار المتجمع الصاعد ، والمتجمع النازل أو الهابط . مثال : إذا كان المطلوب هو معرفة عدد العمال الذين يتقاضون أقل من 70 ريال ، فإننا نجمع 8 + 12 = 20 ، كذلك إذا أردنا حساب عدد العمال الذين يتقاضون أقل من 80 ريالاً في اليوم ، فيكون عددهم 8 + 12 + 14 = 34 ريالاً . ويسمي الجدول الذي يحوي أعداد العمال الذين يتقاضون أقل من الحدود العليا للفئات بالجدول المتجمع الصاعد ، أما الجدول الذي يحوي أعداد العمال الذين يتقاضون أكبر من الحدود الدنيا للفئات بالجدول المتجمع النازل كما هو موضح بالجدولين التاليين :
الجدول المتجمع النازل الجدول المتجمع الصاعد التكرار الحدود الدنيا للفئات التكرار الحدود العليا للفئات 80 50 فأكثر 8 أقل من 60 72 60 فأكثر 20 أقل من 70 60 70 فأكثر 34 أقل من 80 46 80 فأكثر 58 أقل من 90 22 90 فأكثر 66 أقل من 100 14 100 فأكثر 74 أقل من 110 6 110 فأكثر 80 أقل من 120
التمثيل البياني للجداول التكرارية: يهدف التمثيل البياني لتبسيط البيانات و عرضها بطريقة مرئية ومن أهم طرق عرض البيانات : 1- الأعمدة البيانية 2- المدرج التكراري 3- المضلع التكراري 4- المنحني التكراري . 5- المنحنيات المتجمعة . 6- القطاعات الدائرية .
أولاً الأعمدة البيانية :
نستخدم بيانات جدول 3
الجدول التكراري عدد الطلاب الحاصلين عليه التقدير 5 ممتاز 8 جيد جداً 16 جيد 5 مقبول 6 راسب 40 المجموع
1- نرسم محورين متعامدين أحدهما أفقي أو المحور السيني و الآخر رأسي أو المحور الصادي . 2- نحدد مثلاُ 2 سم لكل تقدير : راسب ، مقبول ، جيد ، جيد جداً ، ممتاز . 3- نرسم مستطيلات علي المحور الأفقي طول قاعدة كل منها 1 سم ونبدأ من بداية المجال و يكون ارتفاع المستطيل هو تكرار الفئة . 4- نضع تعريف لبيانات الرسم .
و بنفس الطريقة نرسم بيانات جدول 4
عدد الطلاب الحاصلين عليه التقدير
3 ممتاز
6 جيد جداً
10 جيد
6 مقبول
5 راسب
30 المجموع
و يمكن وضع بيانات الجدولين في نفس الرسم كما يلي :
المدرج التكراري
المدرج التكراري يشبه الأعمدة البيانية و لكن الأعمدة ترسم متلاصقة و فيما يلي رسم بيانات جدول 9 :
الجدول التكراري التكرار الفئات 8 50- 12 60- 14 70- 24 80- 8 90- 8 100- 6 110- 80 المجموع
المضلع التكراري : يرسم المضلع التكراري كما سبق و لكن يجب أن نحدد مركز الفئة أو منتصفها كما يلي : مركز الفئة = (الحد الأعلي للفئة + الحد الأدنى للفئة) \ 2 و كل فئة تمثل بنقطة إحداثيها السيني = مركز الفئة ، وإحداثيها الصادي التكرار ولكن نصل كل نقطة بالنقطة التالية لها.
المنحني المتجمع الصاعد :
نرسم محورين متعامدين و نخصص المحور الأفقي للحدود العليا للفئات ، والمحور الرأسي للتكرارات المتجمعة . ثم نحدد النقاط علي الشكل بحيث تكون الإحداثيات السينية للنقاط هي الحدود العليا للفئات و الإحداثيات الصادية لها هي التكرارات المتجمعة الصاعدة المناظرة لتلك الفئات .
مثال (6)
ارسم المنحني المتجمع الصاعد باستخدام بيانات الجدول التالي :
الجدول التكراري
التكرار الفئات
8 -60
20 -70
34 -80
58 -90
66 -100
74 -110
80 -120
الحل :
نرسم المحاور ونقسم المحور الأفقي لفئات حسب الحدود العليا للفئات. نقسم المحور الرأسي إلي أقسام متساوية لتشمل التكرارات المتجمعة المناظرة أي نأخذ النقاط : (60 ، 8) ، (70 ، 20) .... نصل النقاط بخط لنحصل علي المنحني السابق.
التكرار المتجمع النازل : نرسم محورين متعامدين و نخصص المحور الأفقي للحدود العليا للفئات ، والمحور الرأسي للتكرارات المتجمعة . ثم نحدد النقاط علي الشكل بحيث تكون الإحداثيات السينية للنقاط هي الحدود العليا للفئات و الإحداثيات الصادية لها هي التكرارات المتجمعة النازلة المناظرة لتلك الفئات . مثال 7 : ارسم التكرار المتجمع النازل لبيانات الجدول التالي :
الجدول التكراري التكرار الفئات 8 50- 20 60- 34 70- 58 80- 66 90- 74 100- 80 110-
سادساً : القطاعات الدائرية : إذا كانت البيانات المتوفرة لدينا عبارة عن مجموع مقسم إلي أجزاء فيمكن تمثيل هذه البيانات بمساحة دائرة ، فيمثل كل جزء من هذه البيانات قطاعاً من الدائرة تتناسب مساحته مع الجزء المناظر من البيانات ، ويتم عادة تمييز كل قطاع بلون أو تظليل مختلف عن غيره ، ولرسم الدوائر الممثلة للبيانات نتبع الخطوات التالية: 1- نرسم دائرة ذات مساحة مناسبة. 2- نحدد زاوية كل قطاع باستخدام العلاقة التالية : 3- زاوية القطاع = قيمة التكرار \ مجموع التكرارات × 360 ْ 4- بعد تحديد الزاوية المناظرة لكل قطاع نستخدم المنقلة لتحديد الزوايا علي الدائرة مع ملاحظة أن مجموع زوايا القطاعات = 360ْ . مثال : البيانات التالية تمثل عدد السيارات المنطلقة من إحدى المدن الصغيرة إلي مدينة مكة المكرمة خلال الخمسة أيام الأولي من شهر ذي الحجة ، حيث يرمو الرمز أ للسيارات التي سعة ركابها 9 ركاب ، ب للسيارات التي سعة كل منها 20 راكباُ ، جـ 25 راكباً ، د 30 راكباً ، هـ 40 راكباُ وفق الجدول التالي : المجموع هـ ء جـ ب أ المجموعة 36 5 7 4 8 12 التكرار
الحل : 1- نرسم دائرة نصف قطرها مناسب و ليكن 3 سم . 2- لدينا 5 فئات ، فنحسب زاوية قطاع كل فئة زاوية القطاع أ = 12\36 × 360 ْ = 120 ْ زاوية القطاع ب = 8\ 36 × 360 ْ = 80 ْ زاوية القطاع جـ = 4\36 × 360 ْ = 40 ْ زاوية القطاع د = 7\36 × 360 ْ = 70 ْ زاوية القطاع هـ = 5\36 × 360 ْ = 50 ْ 3- نرسم القطاعات السابقة علي دائرة ونظللها كما بالشكل التالي : المجموع هـ ء جـ ب أ المجموعة 36 5 7 4 8 12 التكرار
مقاييس المتوسطات : ابتكر الإحصائيون ثلاثة أنواع من الممقاييس وهي : المتوسط الحسابي ، الوسيط ، والمنوال . أولاً المتوسط الحسابي : يعتبر الوسط الحسابي أو المتوسط أو المعدل من أكثر المقاييس استخداماُ .
تعريف 6 : هو القيمة التي لو حلت محل كل قيمة كل مفردة في المجموعة لكان مجموع هذه القيم مساوية لمجموع القيم الأصلية .
وبلغة بسيطة هو مجموع القيم مقسوماً علي عدد تلك القيم . وفيما يلي طريقة حساب الوسط الحسابي : أولاً البيانات المبوبة : إذا كان لدينا ن قيمة ، وكانت تلك القيم هي :
س1 ، س2 ، .... سن
فإن الوسط الحسابي = مجموع القيم \ عددها فإذا رمزنا للوسط الحسابي بالرمز س ، فإن : س = (س1 ، س2 ، .... سن ) \ ن و للاختصار نستخدم الرمز = س \ ن مثال : أوجد الوسط الحسابي لدرجات عشرة طلاب في مادة الرياضيات من البيانات التالية :
س10 س9 س8 س7 س6 س5 س4 س3 س2 س1 60 85 93 61 90 75 58 77 69 82
الحل : = س \ ن عدد الطلاب ن = 10 س= (82 + 69 + 77 + 58 + 75 + 90 + 61 + 93 + 85 + 60) \ 10 = 750 \ 10 = 75 (ب) البيانات المبوبة : نلاحظ في المثال السابق أن طالباً واحداً حصل علي 82 درجة و طالباً آخر حصل علي 69 درجة ، أما إذا كان عدد الطلاب كبيراً جداً فمن الممكن أن يحصل أكثر من طالب علي الدرجة نفسها و لتوضيح ذلك نعرض المثال التالي :
مثال (10) : إذا كانت درجات 30 طالباً في امتحان الفيزياء للشهر الأول من الدراسة في إحدى المدارس الثانوية حيث الدرجة العظمي 10 درجات كما بالجدول التالي :
عدد الطلاب الدرجة 5 3 7 5 10 8 6 9 2 10 فاحسب الوسط الحسابي . الحل : حتي يتسني لنا أن نحسب مجموع الدرجات ينبغي أن نحسب الدرجة × تكرارها كما بالجدول التالي : الدرجة × التكرار ( س × ك) التكرار (ك) الدرجة (س) 15 5 3 35 7 5 80 10 8 54 6 9 20 2 10
ك × س = 204 ك = 30
المجموع
من الجدول السابق نرى أن :
ك = 30
س × ك = 204 و بالتالي فإن الوسط الحسابي هو : = 204 \ 30 = 6.8 درجة .
و بالتالي تكون صيغة الوسط الحسابي هي : = س × ك \ ك
مثال 11 :
أوجد الوسط الحسابي لأجور العمال بالجدول التالي :
التكرار مراكز الفئات فئات الأجر 8 55 50- 12 65 60- 14 75 70- 24 85 80- 8 95 90- 8 105 100- 6 115 110- لإيجاد الوسط الحسابي نتبع ما يلي : 1- نكون جدولاً تكرارياً يحتوي العمود الأول منه علي مراكز الفئات و الثاني علي التكرارات و الثالث علي حاصل ضرب مراكز الفئات × التكرارات المناظرة كما يلي : س × ك التكرار(ك) مراكز الفئات(س) 440 8 55 780 12 65 1050 14 75 2040 24 85 760 8 95 840 8 105 690 6 115 6600 80 المجموع
من الجدول السابق نجد أن : = س × ك \ ك = 6600 \ 80 = 82.5 ريالاً .
مزايا الوسط الحسابي : أ- يأخذ جميع القيم في الاعتبار . ب- شائع الاستخدام . ت- لا يحتاج لإعادة ترتيب البيانات .
عيوب الوسط الحسابي : أ- يتأثر بالقيم المتطرفة ( الكبيرة والصغيرة) . ب- لا يستخدم في البيانات الوصفية . ت- لا يحتاج لإعادة ترتيب البيانات .
ثانياُ : الوسيط : تعريف 7 : الوسيط هو القيمة العددية التي تقسم البيانات إلي مجموعتين متساويتين – في العدد – بعد ترتيب البيانات تصاعدياً أو تنازلياً .
أ- البيانات غير المبوبة : أولاً نرتب البيانات – تصاعدياً أو تنازلياً – و هنا يكون لدينا حالتين الأولي عندما يكون عدد البيانات فردياً ، وهنا يكون ترتيب الوسيط هو (ن +1)\2 ، أما إذا كان عدد البيانات فرديا فإن الوسيط يكون هو الوسط الحسابي للقراءتين التي ترتيبهما ن\2 ، ن\2 + 1 .
مثال : أوجد الوسيط لأوزان لاعبي كرة القدم الأساسيين لمنتخب إحدى الدول العربية إذا كانت أوزانهم هي : 62 ، 50 ، 63 ، 55 ، 48 ، 53 ، 51 ، 57 ، 67 ، 58 ، 64 . الحل : نرتب الأوزان تصاعدياً مثلاً كما يلي : 48 ، 50 ، 51 ، 53 ، 55 ، 57 ، 58 ، 62 ، 63 ، 64 ، 67 عدد البيانات =11 و هو فردي إذن ترتيب الوسيط = (11 + 1)\2 = 6 القراءة رقم 6 = 57
مثال (13) : أوجد الوسيط لدرجات الطلاب في مادة الرياضيات كما بالجدول التالي : ى ط ح ز و هـ د ج ب أ التلميذ 60 85 93 61 90 75 58 77 69 82 الدرجة
الحل : نرتب الدرجات تصاعدياً : 10 9 8 7 6 5 4 3 2 1 ح و ط أ ج هـ ب ز ى د التلميذ 93 90 85 82 77 75 69 61 60 58 الدرجة
عدد الطلاب ن= 10 و هو عدد زوجي . و بالتالي فإننا نبحث في القيم المرتبة عن التلميذين اللذين ترتيبهما 10\2 =5 ، 10\2 + 1 = 6 ، وبذلك يكون الوسيط بين التلميذين هـ ، ج (74 ، 77) أي أن : الوسيط = (75 + 77) \2 = 66 درجة .
(ب) البيانات المبوبة نستطيع حساب الوسيط للبيانات المبوبة بطريقتين إما حسابياُ أو بيانيا ( آي بطريقة الرسم )
الطريقة الحسابية : 1- نكون الجدول المتجمع الصاعد من الجدول التكراري . 2- نوجد ترتيب الوسيط و هو ترتيب الوسيط = ك \2 3- نحدد الفئة الوسيطية وهي الفئة التي يقع فيها ترتيب الوسيط 4- نحسب الوسيط من العلاقة :
(1\2) ك – ك1
أ + ــــــــــــــــــــ × ل الوسيط
(ك2 – ك1)
حيث أ هو الحد الأدنى للفئة الوسيطية أو بدايتها .
ك1 هو التكرار المتجمع المناظر للحد الأدنى للفئة الوسيطية . ك2 هو التكرار المتجمع المناظر للحد الأعلي للفئة الوسيطية . ل هو طول الفئة الوسيطية .
أي أن قيمة الوسيط تبعد عن بداية الفئة الوسيطية بمقدار يتناسب مع نسبة التكرارات المتبقية . مثال : أو الوسيط لبيانات أجور العمال المعطاة بياناتهم كما بالجدول التالي :
الجدول التكراري التكرار الفئات 8 -60 20 -70 34 ك1 -80 الوسيط 58 ك2 -90 66 -100 74 -110 80 -120
ترتيب الوسيط = ك \2 = 80\2 = 40 و بذلك يقع الوسيط في الفئة الوسيطية –80 و بذلك يكون أ= 80
ك = 40 ك1 =34 ك2 =58 ل=90 – 80 = 10
و بذلك يمكن حساب الوسيط كما يلي :
(1\2) ك – ك1
أ + ــــــــــــــــــــ × ل الوسيط=
(ك2 – ك1) = 80 + (40 –34)\(58 –34) × 10 = 80 + 6\24 × 10 = 80 +2.5 = 82.5 .
الطريقة البيانية : تتلخص الطريقة البيانية في الخطوات التالية : 1- نكون الجدول المتجمع الصاعد . 2- نرسم الجدول المتجمع الصاعد . 3- نحدد ترتيب الوسيط وهو ك \2 ، ومن هذه النقطة ارسم مستقيماً موازياً للمحور الأفقي حتي يلتقي مع العمود المقام من نقطة ترتيب الوسيط المحور الأفقي.
مثال –15 أوجد قيمة الوسيط للجدول التالي بالرسم الجدول التكراري التكرار الفئات 8 -60 20 -70 34 ك1 -80 58 ك2 -90 66 -100 74 -110 80 -120
الحل ترتيب الوسيط = 80\2 = 40
نرسم من النقطة 40 علي المحور الرأسي مستقيما يوازي المحور الأفقي نسقط من ب عمود علي المحور الأفقي فيكون الوسيط هو نقطة إلتقاء العمود مع المحور الأفقي .
مزايا الوسيط : 1- لا يتأثر بالقيم الشاذة (الكبيرة جداً و الصغيرة جدا). 2- يمكن أن يستخدم مع البيانات الوصفية . عيوب الوسيط : 1- لا يأخذ جميع القيم في الاعتبار . 2- يصعب الاستدلال به منفرداً في الدراسات الإحصائية .
ثالثاُ : المنوال
تعريف –8 المنوال لمجموعة من القراءات هو القراءة الأكثر تكراراً أو شيوعاً .
أ- البيانات غير المبوبة : نحسب القراءة الأكثر تكراراً و هي المنوال .
مثال : أوجد المنوال لأعمار عينة مكونة من 10 طلاب بالمرحلة الثانوية : رياض شوقي أسامة حازم سيد فهد علي خالد محمد أحمد الطالب 15 18 20 17 18 16 17 19 16 18 عمره
الحل : نلاحظ أن العمر 18 في العينة قد تكرر 3 مرات وهو رياض شوقي أسامة حازم سيد فهد علي خالد محمد أحمد الطالب 15 18 20 17 18 16 17 19 16 18 عمره 1 3 1 2 3 1 2 1 2 3 ك
مثال –18 أوجد المنوال لأعمار عينة مكونة من 10 طلاب بالمرحلة الابتدائية : 8 6 7 6 7 8 7 8 6 7 عمره 7 8 9 8 9 8 7 8 8 7 7
الحل نلاحظ أن العمر 8 تكرر 8 مرات
7 تكرر 8 مرات
وهما أعلي التكرارات وبالتالي تكون العينة ثنائية المنوال .
ب البيانات المبوبة : طريقة الرسم : 1- نرسم المدرج التكراري نصل بين أركان الخلية الأكبر تكراراً و وحواف الفئتين السابقة واللاحقة كما بالرسم التالي :
مثال (19) : أوجد قيمة المنوال للجدول التكراري التالي والذي يوضح كميات الأمطار النازلة علي منطقة ما بالمليمتر خلال 60 شهر .
الحل : نلاحظ أن الفئة المنوالية أ=20 وهي الفئة الأكثر تكراراُ (21) .
ك1=13 ك2 =9 ل = 10
نعوض في العلاقة التالية :
ك – ك1
أ + ــــــــــــــ × ل المنوال =
2 ك0 – ك1 – ك2
نجد أن
21 – 13
أ + ــــــــــــــ × 10 المنوال =
2 × 21 –13 - 9 = 20 + 4 = 24 مليمتر .
طريقة الرسم 1- نرسم المدرج التكراري 2- نصل أركان الفئة المنوالية مع حواف الفئتين السابقة واللاحقة كما يلي :
مزايا المنوال :
1- لا يتأكثر بالقيم المتطرفة ( الكبيرة جداً أو الصغيرة جداً) .
2- يمكن حسابه مع البيانات الوصفية.
عيوب المنوال : 1- لا يأخذ جميع القيم في الحسبان . 2- قد يكون للبيانات أكثر منوال و بالتالي يصعب القياس بالنسبة له . الانحراف المعياري : الانحراف المعياري هو مقياس يحدد مدى تباعد أو تقارب القراءات عن وسطها الحسابي .
البيانات غير المبوبة : إذا كان لدينا ن من القراءات و هي : س1 ، س2 ، ...... ، سن ووسطها الحسابي تكون هذه القراءات متقاربة مع بعضها إذا كانت قريبة من وسطها الحسابي ، آي إذا كانت انحرافاتها عن صغيرة ، وبالتالي فإنه يمكن استخدام انحرافات القراءات عن وسطها الحسابي كمقياس للتشتت ، ويمكن أخذ متوسط هذه الإنحرافات ، وبما أن مجموع انحرافات القراءات لآى بيانات يساوي صفراً ، لآن بعض الإنحرافات يكون موجبا ، و البعض الآخر يكون سالباً ، فتتلاشي قيم هذه الإنحرافات مع بعضها البعض ، والإنحراف المعياري يأخذ مربع الإنحرافات بدلاُ من الإنحرافات ذاتها أي أن الانحراف المعياري :
وهذ يسمي بالتباين ، والتباين هو مربع الانحراف المعياري .
تعريف –9 الانحراف المعياري هو الجذر التربيعي للوسط الحسابي لمربعات انحرافات القراءات عن وسطها الحسابي .
وعادة يرمز للانحراف المعياري بالرمز ع و هو :
مثال – 21 أوجد الانحراف المعياري للقراءات التالية : 15 ، 12 ، 10 ، 9 ، 14
الحل : نحسب المتوسط الحسابي :
س
ـــ = ن =(15 + 12 + 10 + 9 + 14) \ 5 = 60 \ 5 = 12 نكون جدولاُ لحساب الانجراف المعياري يتكون من الدرجة ، وانحراف الدرجة عن الوسط الحسابي ، ومربع الانحراف كما يلي :
( س - )2 س - س 9 3 15 0 0 12 4 -2 10 9 -3 9 4 2 14 26 0 60 المجموع
التباين هو : = (1\5) × 26 = 5.2 و الانحراف المعياري هو : = 2.28 و للإنحراف المعياري صيغة مختصرة هي :
و بالطبع فالتباين هو مربع الانحراف المعياري .
مثال – 22 أوجد الانحراف المعياري للبيانات التالية بالطريقة المختصرة : 15 ، 12 ، 10 ، 9 ، 14 الحل : نحسب المتوسط الحسابي :
س
ـــ = ن =(15 + 12 + 10 + 9 + 14) \ 5 = 60 \ 5 = 12 نكون جدولاً للحسابات يكون فيه العمود الأول للقراءات والعمود لمربعات القراءات كما يلي :
س2 س 225 15 144 12 100 10 81 9 196 14
س2=746 س= 60
المجموع ومن ذلك نجد أن :
س2=746 س= 60
و بذلك يكون التباين : = (1\5) × 746 – (60\5)2 =149.2 – 12 × 12 = 5.2
ومن ذلك يكون الانحراف المعياري : = 2.18
البيانات المبوبة : من تعريف الانحراف المعياري في حالة البيانات غير المبوبة ، فإنه يمكن استنساخ صيغة الانحراف المعياري للبيانات المبوبة في جدول تكراري كما يلي :
حيث أن : س ترمز لمراكز الفئات
ك التكرار المناظر لمركز الفئة . ن مجموع التكرارات = ك الوسط الحسابي = ( س ك)\ ن
ولو استخدمنا خواص التجميع يكون لدينا الصيغة المختصرة التالية :
مثال –23 أوجد الانحراف المعياري لبيانات أجور:
التكرارات ك مراكز الفئات س 8 55 12 65 14 75 24 85 8 95 8 105 6 115 80 المجموع
نكون الجدول التالي :
س2 ك س ك التكرارات ك مراكز الفئات س 24200 440 8 55 50700 780 12 65 78750 1050 14 75 173400 2040 24 85 72200 760 8 95 88200 840 8 105 79350 690 6 115 566800 6600 80 المجموع
ومن ذلك نجد أن : =1\80 × 566800 – ( 6600 \80)2 = 7085 – (82.5) 2 = 7085 – 6806.25 = 278.75 ومن ذلك فالانحراف المعياري = 16.696