معامل ارتباط رتبة كيندال. معامل ارتباط رتبة كيندال. حل هاتين المعادلتين يعطي

العرض والمعالجة المسبقة لتقييمات الخبراء

يتم استخدام عدة أنواع من التقييمات في الممارسة العملية:

- النوعية (غالبًا - نادرًا، الأسوأ - الأفضل، نعم - لا)،

- تقييمات المقياس (نطاقات القيمة 50-75، 76-90، 91-120، وما إلى ذلك)،

نقاط من فترة زمنية معينة (من 2 إلى 5، 1 -10)، مستقلة بشكل متبادل،

مرتبة (يتم ترتيب الكائنات من قبل الخبير بترتيب معين، ويتم تخصيص رقم تسلسلي لكل منها - رتبة)،

المقارنة، يتم الحصول عليها بإحدى طرق المقارنة

طريقة المقارنة التسلسلية

طريقة المقارنة الزوجية للعوامل.

في الخطوة التالية لمعالجة آراء الخبراء، من الضروري التقييم مدى الاتفاق بين هذه الآراء.

يمكن اعتبار التقييمات الواردة من الخبراء كمتغير عشوائي، ويعكس توزيعه آراء الخبراء حول احتمال اختيار حدث معين (عامل). لذلك، لتحليل انتشار واتساق تقييمات الخبراء، يتم استخدام الخصائص الإحصائية المعممة - متوسطات ومقاييس الانتشار:

متوسط ​​مربع الخطأ،

نطاق التباين: الحد الأدنى - الحد الأقصى،

- معامل الاختلاف V = متوسط ​​مربع الانحراف / المتوسط ​​الحسابي (مناسبة لأي نوع من التقييم)

V i = σ i / x i متوسط

للمعدل تدابير التشابهوالآراء كل زوج من الخبراءيمكن استخدام مجموعة متنوعة من الأساليب:

معاملات الارتباطوالتي يتم من خلالها أخذ عدد الإجابات المتطابقة وغير المتطابقة بعين الاعتبار،

معاملات عدم الاتساقآراء الخبراء،

ويمكن استخدام كل هذه المقاييس إما لمقارنة آراء خبيرين، أو لتحليل العلاقة بين سلسلة من التقييمات بشأن خاصيتين.

معامل ارتباط الرتب المزدوج لسبيرمان:

حيث n هو عدد الخبراء،

c k – الفرق بين تقديرات الخبراء i-th وj-th لجميع عوامل T

يعطي معامل ارتباط رتبة كيندال (معامل التوافق) تقييمًا شاملاً لاتساق آراء جميع الخبراء في جميع العوامل، ولكن فقط في الحالات التي تم فيها استخدام تقديرات الرتبة.

لقد ثبت أن قيمة S، عندما يعطي جميع الخبراء نفس التقييمات لجميع العوامل، لها قيمة قصوى تساوي

حيث n هو عدد العوامل،

م – عدد الخبراء .

معامل التوافق يساوي النسبة

علاوة على ذلك، إذا كانت W قريبة من 1، فقد أعطى جميع الخبراء تقديرات متسقة إلى حد ما، وإلا فإن آرائهم غير متسقة.

صيغة حساب S موضحة أدناه:

حيث r i هي تقديرات الترتيب للعامل i بواسطة الخبير j،

r avg هو متوسط ​​الرتبة على مصفوفة التقييم بأكملها ويساوي

وبالتالي فإن صيغة حساب S يمكن أن تأخذ الشكل:

إذا تزامنت التقييمات الفردية من أحد الخبراء، وتم توحيدها أثناء المعالجة، فسيتم استخدام صيغة أخرى لحساب معامل التوافق:



حيث يتم احتساب Tj لكل خبير (إذا تكررت تقييماته لكائنات مختلفة) مع مراعاة التكرارات وفقاً للقواعد التالية:

حيث t j هو عدد المجموعات ذات الرتب المتساوية للخبير j-th، و

h k هو عدد الرتب المتساوية في المجموعة k من الرتب ذات الصلة للخبير j.

مثال. دع 5 خبراء يجيبون على الترتيب الستة كما هو موضح في الجدول 3:

الجدول 3 - إجابات الخبراء

الخبراء O1 O2 O3 O4 O5 O6 مجموع الرتب حسب الخبير
ه1
ه2
ه3
هـ4
ه5

ونظراً لأننا لم نحصل على تصنيف صارم (تقييمات الخبراء مكررة، ومجموع الرتب غير متساو)، فسوف نقوم بتحويل التقييمات والحصول على الرتب المرتبطة بها (الجدول 4):

الجدول 4 - الرتب ذات الصلة لتقييمات الخبراء

الخبراء O1 O2 O3 O4 O5 O6 مجموع الرتب حسب الخبير
ه1 2,5 2,5
ه2
ه3 1,5 1,5 4,5 4,5
هـ4 2,5 2,5 4,5 4,5
ه5 5,5 5,5
مجموع الرتب للكائن 7,5 9,5 23,5 29,5

الآن دعونا نحدد درجة الاتفاق بين آراء الخبراء باستخدام معامل التوافق. وبما أن الرتب مرتبطة ببعضها البعض، فسوف نحسب W باستخدام الصيغة (**).

ثم ص أف = 7*5/2=17.5

س = 10 2 +8 2 +4.5 2 +4.5 2 +6 2 +12 2 = 384.5

دعنا ننتقل إلى حسابات W. للقيام بذلك، نحسب بشكل منفصل قيم T j. في المثال، يتم تحديد التقييمات بشكل خاص بحيث يكون لكل خبير تقييمات متكررة: الأول له اثنان، والثاني له ثلاثة، والثالث له مجموعتان من تقييمين، والرابع والخامس لهما تقييمان متطابقان. من هنا:

ت 1 = 2 3 - 2 = 6 ت 5 = 6

ت 2 = 3 3 - 3 = 24

ت 3 = 2 3 –2+ 2 3 –2 = 12 ت 4 = 12

نرى أن اتساق آراء الخبراء مرتفع جدًا ويمكننا الانتقال إلى المرحلة التالية من الدراسة - تبرير واعتماد الحل البديل الذي أوصى به الخبراء.

وبخلاف ذلك، يجب عليك العودة إلى الخطوات من 4 إلى 8.

لكي يحسب معامل كينداليتم ترتيب قيم العامل المميز مسبقًا، أي أن الرتب حسب X تتم كتابتها بشكل صارم بترتيب تصاعدي للقيم الكمية.

1) لكل رتبة في Y، ابحث عن العدد الإجمالي للرتب اللاحقة التي تكون أكبر في القيمة من الرتبة المعطاة. يتم أخذ العدد الإجمالي لمثل هذه الحالات في الاعتبار بعلامة "+" ويشار إليها بالرمز P.

2) لكل رتبة في Y، حدد عدد الرتب اللاحقة التي تكون أقل قيمة من الرتبة المعطاة. ويؤخذ العدد الإجمالي لهذه الحالات في الاعتبار بعلامة "-" ويشار إليه بالرمز Q.

3) احسب S=P+Q=9+(-1)=8

4) يتم حساب معامل كيندل باستخدام الصيغة:

يمكن لمعامل كيندل أن يأخذ القيم من -1 إلى +1، وكلما اقترب من ذلك، كانت العلاقة بين الخصائص أقوى.

وفي بعض الحالات، لتحديد اتجاه العلاقة بين خاصيتين، يتم حسابهما معامل فيشنر. يعتمد هذا المعامل على مقارنة سلوك انحرافات القيم الفردية للعامل والخصائص الناتجة عن قيمتها المتوسطة. يتم حساب معامل Fechner باستخدام الصيغة:

; حيث يكون مجموع C هو إجمالي عدد مصادفات علامات الانحرافات، ومجموع H هو إجمالي عدد حالات عدم تطابق علامات الانحرافات.

1) احسب القيمة المتوسطة لخاصية العامل:

2) تحديد علامات انحرافات القيم الفردية للعامل المميز عن القيمة المتوسطة.

3) احسب متوسط ​​قيمة الخاصية الناتجة: .

4) ابحث عن علامات انحرافات القيم الفردية للخاصية الناتجة عن القيمة المتوسطة:

خاتمة: الاتصال مباشر، والمعامل لا يدل على قرب الاتصال.

ولتحديد درجة قرب الارتباط بين الخصائص الثلاث المرتبة، احسب المعامل فهرس أبجدي.يتم حسابه بواسطة الصيغة:

، حيث m هو عدد المعالم المصنفة؛ n هو عدد وحدات المراقبة المرتبة.

الصناعات X1 X2 X3 ر1 R2 ر3
صناعة الطاقة الكهربائية 7,49
وقود 12,70
تشيرنايا م. 5,92
تسفيتنايا م. 9,48
مهندس ميكانيكى 4,18
نتيجة:

X1- عدد الموظفين (ألف شخص)؛ X2- حجم المبيعات الصناعية (مليار روبل)؛ X3- متوسط ​​الراتب الشهري .

1) نقوم بترتيب قيم جميع الميزات ونضع الرتب بدقة من أجل زيادة القيم الكمية.

2) في كل سطر، حدد مجموع الرتب. يتم حساب الصف الإجمالي من هذا العمود.

3) احسب .

4) لكل صف، ابحث عن الانحرافات التربيعية لمجموع الرتب وقيم T. باستخدام نفس العمود، نحسب الصف الأخير، الذي نشير إليه بـ S. يمكن لمعامل التوافق أن يأخذ القيم من 0 إلى 1، وكلما اقترب من 1، كانت العلاقة بين الخصائص أقوى.

يتم استخدامه لتحديد العلاقة بين المؤشرات الكمية أو النوعية، إذا كان من الممكن ترتيبها. يتم عرض قيم المؤشر X بترتيب تصاعدي والرتب المخصصة. يتم ترتيب قيم مؤشر Y وحساب معامل ارتباط كيندال:

أين س = صس.

ص كبيرقيمة الرتب Y

س- إجمالي عدد الملاحظات التالية للملاحظات الحالية الأصغرقيمة الرتب Y. (لا تؤخذ الرتب المتساوية بعين الاعتبار!)

إذا كانت البيانات قيد الدراسة متكررة (لها نفس الرتب)، فسيتم استخدام معامل ارتباط كيندال المعدل في الحسابات:

ر- عدد الرتب المرتبطة في السلسلة X و Y على التوالي.

19. ما الذي يجب أن ننطلق منه عند تحديد موضوع الدراسة وموضوعها وهدفها وأهدافها وفرضيتها؟

يتكون برنامج البحث، كقاعدة عامة، من قسمين: منهجي وإجرائي. يتضمن الأول تبرير أهمية الموضوع، وصياغة المشكلة، وتعريف الموضوع والموضوع، وأهداف وغايات الدراسة، وصياغة المفاهيم الأساسية (الجهاز الفئوي)، والتحليل المنهجي الأولي لموضوع الدراسة والصياغة من فرضية العمل. ويكشف القسم الثاني عن التصميم الاستراتيجي للدراسة، وكذلك التصميم والإجراءات الأساسية لجمع وتحليل البيانات الأولية.

بادئ ذي بدء، عند اختيار موضوع البحث، يجب على المرء أن ينطلق من أهميته. تبرير الأهميةيتضمن إشارة إلى الحاجة وتوقيت الدراسة وحل المشكلة لمواصلة تطوير نظرية وممارسة التدريس والتعليم. يقدم البحث الحالي إجابات على الأسئلة الأكثر إلحاحا في هذا الوقت، ويعكس النظام الاجتماعي للمجتمع بالنسبة للعلوم التربوية، ويكشف عن أهم التناقضات التي تحدث في الممارسة العملية. إن معيار الملاءمة ديناميكي ومرن ويعتمد على الوقت، مع مراعاة ظروف محددة ومحددة. في صورتها الأكثر عمومية، تحدد الملاءمة درجة التناقض بين الطلب على الأفكار العلمية والتوصيات العملية (لتلبية حاجة معينة) والمقترحات التي يمكن أن يقدمها العلم والممارسة في الوقت الحاضر.

الأساس الأكثر إقناعا لتحديد موضوع البحث هو النظام الاجتماعي، الذي يعكس المشاكل الأكثر إلحاحا وذات أهمية اجتماعية والتي تتطلب حلولا عاجلة. يتطلب النظام الاجتماعي تبريرًا لموضوع معين. عادةً ما يكون هذا تحليلًا لدرجة تطور السؤال في العلوم.

إذا كان النظام الاجتماعي يتبع من تحليل الممارسة التربوية، إذن مشكلة علميةفي مستوى مختلف. إنه يعبر عن التناقض الرئيسي الذي يجب حله عن طريق العلم. عادة ما يكون حل المشكلة الغرض من الدراسة.الهدف هو إعادة صياغة المشكلة.

صياغة المشكلة تستلزم اختيار الكائنبحث. يمكن أن تكون عملية تربوية، أو مجالًا للواقع التربوي، أو علاقة تربوية تحتوي على تناقض. بمعنى آخر، يمكن أن يكون الكائن أي شيء يحتوي بشكل صريح أو ضمني على تناقض ويؤدي إلى موقف إشكالي. الكائن هو ما تهدف إليه عملية الإدراك. موضوع الدراسة -جزء، جانب من كائن. هذه هي أهم الخصائص والجوانب والمميزات للكائن من الناحية العملية أو النظرية والتي تخضع للدراسة المباشرة.

وفقا لغرض وموضوع وموضوع الدراسة، يتم تحديد البحث مهام،والتي تهدف عادة إلى التحقق فرضيات.والأخيرة عبارة عن مجموعة من الافتراضات المبنية على النظرية، والتي تخضع صحتها للتحقق.

معيار الجدة العلميةتنطبق على تقييم جودة الدراسات المكتملة. وهو يصف الاستنتاجات النظرية والعملية الجديدة، وأنماط التعليم، وهيكله وآلياته، ومحتواه، ومبادئه وتقنياته، والتي لم تكن معروفة في هذا الوقت ولم يتم تسجيلها في الأدبيات التربوية. يمكن أن يكون لحداثة البحث أهمية نظرية وعملية. تكمن الأهمية النظرية للبحث في خلق مفهوم، والحصول على فرضية، ونمط، وطريقة، ونموذج لتحديد المشكلة، والاتجاه، والاتجاه. تكمن الأهمية العملية للبحث في إعداد المقترحات والتوصيات وما إلى ذلك. تختلف معايير الجدة والأهمية النظرية والعملية باختلاف نوع البحث، كما تعتمد على وقت الحصول على المعرفة الجديدة.

لحساب معامل ارتباط رتبة كيندال ص كومن الضروري ترتيب البيانات حسب إحدى الخصائص ترتيباً تصاعدياً وتحديد الرتب المقابلة للخاصية الثانية. ثم، لكل رتبة من السمة الثانية، يتم تحديد عدد الرتب اللاحقة الأكبر في القيمة من الرتبة المأخوذة، ويتم العثور على مجموع هذه الأرقام.

يتم إعطاء معامل ارتباط رتبة كيندال بواسطة


أين ص ط– عدد مراتب المتغير الثاني ابتداء من أنا+1، قيمته أكبر من قيمته أنا-الرتبة الرابعة لهذا المتغير.

توجد جداول بالنقاط المئوية لتوزيع المعاملات ص كمما يتيح لك اختبار الفرضية حول أهمية معامل الارتباط.

لأحجام العينات الكبيرة، القيم الحرجة ص كلم يتم جدولتها، ويجب حسابها باستخدام صيغ تقريبية، والتي تعتمد على حقيقة أنه في ظل الفرضية الصفرية H 0: ص ك=0 وأكبر نقيمة عشوائية

موزعة تقريبًا وفقًا للقانون العادي القياسي.

40. الاعتماد بين السمات المقاسة على المقياس الاسمي أو الترتيبي

غالبًا ما تنشأ مهمة التحقق من استقلالية خاصيتين يتم قياسهما على مقياس اسمي أو ترتيبي.

دع بعض الأشياء لها خاصيتين يتم قياسهما Xو يمع عدد المستويات صو سعلى التوالى. ومن الملائم تقديم نتائج هذه الملاحظات في شكل جدول يسمى جدول الخصائص المحتملة.

في الطاولة ش ط(أنا = 1, ..., ص) و ضد ي (ي= 1, ..., س) - القيم المقبولة بالخصائص والقيمة ن ج- عدد الكائنات من العدد الإجمالي للكائنات التي لها السمة Xقبلت القيمة ش ط، والعلامة ي- معنى ضد ي

دعونا نقدم المتغيرات العشوائية التالية:

ش ط


– عدد الأشياء التي لها قيمة ضد ي


وبالإضافة إلى ذلك، هناك مساواة واضحة



المتغيرات العشوائية المنفصلة Xو يمستقلة إذا وفقط إذا

لجميع الأزواج أنا, ي

ولذلك فإن الفرضية حول استقلال المتغيرات العشوائية المنفصلة Xو ييمكن كتابتها مثل هذا:

وكبديل، كقاعدة عامة، يتم استخدام الفرضية

ينبغي الحكم على صحة الفرضية H 0 على أساس ترددات العينة ن ججداول الطوارئ. وفقا لقانون الأعداد الكبيرة متى ن→∞ الترددات النسبية قريبة من الاحتمالات المقابلة:



يتم استخدام الإحصائيات لاختبار الفرضية H 0

والتي، إذا كانت الفرضية صحيحة، لها توزيع χ 2 ثانية روبية − (ص + س- 1) درجات الحرية.

معيار الاستقلال χ 2 يرفض الفرضية H 0 بمستوى الأهمية α إذا:


41. تحليل الانحدار. المفاهيم الأساسية لتحليل الانحدار

لوصف العلاقات الإحصائية بين المتغيرات المدروسة رياضيا، ينبغي حل المسائل التالية:

ü حدد فئة من الوظائف التي يُنصح فيها بالبحث عن أفضل تقريب (بمعنى معين) لاعتماد الاهتمام؛

ü إيجاد تقديرات للقيم المجهولة للمعلمات المتضمنة في معادلات الاعتماد المرغوبة؛

ü إثبات مدى كفاية المعادلة الناتجة للعلاقة المرغوبة؛

ü تحديد متغيرات الإدخال الأكثر إفادة.

مجمل المهام المدرجة هو موضوع بحث تحليل الانحدار.

دالة الانحدار (أو الانحدار) هي اعتماد التوقع الرياضي لمتغير عشوائي واحد على القيمة المأخوذة من متغير عشوائي آخر، وتشكل مع الأول نظام ثنائي الأبعاد من المتغيرات العشوائية.

ليكن هناك نظام للمتغيرات العشوائية ( X,ي)، ثم وظيفة الانحدار يعلى X

وظيفة الانحدار Xعلى ي

وظائف الانحدار F(س) و φ (ذ)، لا يمكن عكسهما بشكل متبادل، إلا إذا كانت العلاقة بينهما Xو يغير وظيفية.

متى ن-ناقل الأبعاد مع الإحداثيات X 1 , X 2 ,…, Xnيمكن للمرء أن ينظر في التوقع الرياضي المشروط لأي مكون. على سبيل المثال، ل X 1


يسمى الانحدار X 1 لكل X 2 ,…, Xn.

لتحديد دالة الانحدار بشكل كامل، من الضروري معرفة التوزيع الشرطي لمتغير الإخراج للقيم الثابتة لمتغير الإدخال.

وبما أنهم لا يملكون مثل هذه المعلومات في الوضع الحقيقي، فإنهم عادةً ما يقتصرون على البحث عن دالة تقريبية مناسبة و أ(س) ل F(س) بناءً على بيانات إحصائية من النموذج ( × ط, ذ ط), أنا = 1,…, ن. هذه البيانات هي النتيجة نملاحظات مستقلة ذ 1 ,…, ذ نمتغير عشوائي يلقيم متغير الإدخال س 1 ,…, س نبينما في تحليل الانحدار يفترض أن قيم متغير الإدخال محددة بدقة.

مشكلة اختيار أفضل وظيفة تقريبية و أ(س)، كونه العامل الرئيسي في تحليل الانحدار، وليس لديه إجراءات رسمية لحلها. في بعض الأحيان يتم تحديد الاختيار بناء على تحليل البيانات التجريبية، وفي كثير من الأحيان من الاعتبارات النظرية.

إذا كان من المفترض أن تكون دالة الانحدار سلسة بما فيه الكفاية، فإن الدالة تقاربها و أ(س) يمكن تمثيلها على أنها مجموعة خطية من مجموعة معينة من الوظائف الأساسية المستقلة خطيًا ψك(س), ك = 0, 1,…, م−1، أي في النموذج


أين م- عدد المعلمات غير المعروفة θ ك(في الحالة العامة الكمية غير معروفة، تم تحسينها أثناء بناء النموذج).

مثل هذه الوظيفة خطية في معلماتها، لذلك في الحالة قيد النظر نتحدث عن نموذج دالة الانحدار الذي يكون خطيًا في معلماته.

ثم مهمة إيجاد أفضل تقريب لخط الانحدار F(س) يقلل من العثور على قيم المعلمات هذه و أ(س؛ θ) هو الأكثر ملاءمة للبيانات المتاحة. إحدى الطرق التي تسمح لك بحل هذه المشكلة هي طريقة المربعات الصغرى.

42. طريقة المربع الأصغر

دع مجموعة النقاط ( × ط, ذ ط), أنا= 1,…, نتقع على متن طائرة على طول خط مستقيم

ثم كوظيفة و أ(س)، والذي يقارب دالة الانحدار F(س) = م [ي|س] من الطبيعي أن تأخذ دالة خطية للوسيطة س:


أي أن الوظائف الأساسية المختارة هنا هي ψ 0 (س)≡1 و ψ 1 (س)≡س. ويسمى هذا النوع من الانحدار بالانحدار الخطي البسيط.

إذا كانت مجموعة النقاط ( × ط, ذ ط), أنا= 1,…, نتقع على طول بعض المنحنى، ثم و أ(س) فمن الطبيعي أن نحاول اختيار عائلة من القطع المكافئة

هذه الوظيفة غير خطية في المعلمات θ 0 و θ 1، ومع ذلك، عن طريق التحويل الوظيفي (في هذه الحالة، اللوغاريتم)، يمكن اختزاله إلى دالة جديدة و أ(س) خطي في المعلمات:


43. الانحدار الخطي البسيط

أبسط نموذج انحدار هو نموذج خطي بسيط (أحادي المتغير، عامل واحد، مقترن)، والذي له الشكل التالي:


أين εi- المتغيرات العشوائية (الأخطاء) غير المترابطة مع بعضها البعض، والتي ليس لها توقعات رياضية وتباينات متطابقة σ 2 , أو ب- المعاملات الثابتة (المعلمات) التي يلزم تقديرها من قيم الاستجابة المقاسة ذ ط.

للعثور على تقديرات المعلمة أو بالانحدار الخطي، وتحديد الخط المستقيم الذي يلبي البيانات التجريبية بشكل أفضل:


يتم استخدام طريقة المربعات الصغرى.

وفق طريقة المربعات الصغرى تقديرات المعلمة أو بوجدت من شرط التقليل من مجموع الانحرافات التربيعية للقيم ذ طعموديًا من خط الانحدار "الحقيقي":

دع عشر ملاحظات لمتغير عشوائي يللقيم الثابتة للمتغير X

لتصغير ددعونا نساوي صفر المشتقات الجزئية فيما يتعلق أو ب:



ونتيجة لذلك، نحصل على نظام المعادلات التالي لإيجاد التقديرات أو ب:


حل هاتين المعادلتين يعطي:



تعبيرات لتقديرات المعلمة أو بيمكن أيضًا تمثيلها على النحو التالي:

ثم المعادلة التجريبية لخط الانحدار يعلى Xيمكن كتابتها على النحو التالي:


مقدر التباين غير المتحيز σ 2 انحرافات القيمة ذ طمن خط الانحدار المستقيم المجهز يتم تقديمه بواسطة

دعونا نحسب معلمات معادلة الانحدار


وهكذا يبدو خط الانحدار كما يلي:


وتقدير تباين انحرافات القيم ذ طمن خط الانحدار المستقيم المجهز


44. التحقق من أهمية خط الانحدار

تقدير وجدت بقد يكون ≠ 0 بمثابة إدراك لمتغير عشوائي يساوي توقعه الرياضي صفرًا، أي أنه قد يتبين أنه لا يوجد في الواقع أي اعتماد على الانحدار.

ولمعالجة هذه الحالة عليك اختبار الفرضية H0: ب= 0 مع الفرضية المنافسة H 1: ب ≠ 0.

يمكن اختبار أهمية خط الانحدار باستخدام تحليل التباين.

خذ بعين الاعتبار الهوية التالية:

ضخامة ذ طŷ ط = εiويسمى الباقي وهو الفرق بين كميتين:

ü انحراف القيمة المرصودة (الاستجابة) عن متوسط ​​الاستجابة الإجمالية؛

ü انحراف قيمة الاستجابة المتوقعة ŷ طمن نفس المتوسط

يمكن كتابة الهوية المكتوبة في النموذج


عن طريق تربيع كلا الجانبين والجمع أنا، نحن نحصل:


حيث يتم تسمية الكميات:

المجموع الكامل (الإجمالي) للمربعات SC n، وهو يساوي مجموع الانحرافات المربعة للملاحظات بالنسبة إلى متوسط ​​قيمة الملاحظات

مجموع المربعات بسبب انحدار SC p، وهو ما يساوي مجموع الانحرافات المربعة لقيم خط الانحدار بالنسبة لمتوسط ​​الملاحظات.

المبلغ المتبقي من المربعات CK 0 . وهو يساوي مجموع الانحرافات التربيعية للملاحظات بالنسبة لقيم خط الانحدار

وهكذا انتشر ييمكن أن يُعزى -kov بالنسبة إلى متوسطها إلى حد ما إلى حقيقة أنه ليست كل الملاحظات تقع على خط الانحدار. إذا كان الأمر كذلك، فإن مجموع المربعات بالنسبة للانحدار سيكون صفرًا. ويترتب على ذلك أن الانحدار سيكون مهمًا إذا كان مجموع مربعات SC p أكبر من مجموع مربعات SC 0.

يتم إجراء الحسابات لاختبار أهمية الانحدار في جدول ANOVA التالي

إذا كانت الأخطاء εiيتم توزيعها وفقا للقانون الطبيعي، فإذا كانت الفرضية H 0 صحيحة: ب= 0 إحصائيات:


موزعة حسب قانون فيشر بعدد درجات الحرية 1 و ن−2.

سيتم رفض الفرضية الصفرية عند مستوى الأهمية α إذا كانت القيمة المحسوبة للإحصاء Fسيكون أكبر من النقطة المئوية α F 1;ن−2;α توزيعات فيشر.

45. التحقق من مدى كفاية نموذج الانحدار. الطريقة المتبقية

إن كفاية نموذج الانحدار المبني يعني أنه لا يوجد نموذج آخر يوفر تحسنا كبيرا في التنبؤ بالاستجابة.

إذا تم الحصول على جميع قيم الاستجابة بقيم مختلفة س، أي أنه لا توجد قيم استجابة متعددة يتم الحصول عليها في نفس الوقت × ط، عندها لا يمكن إجراء سوى اختبار محدود لمدى كفاية النموذج الخطي. أساس هذا الفحص هو الأرصدة:

الانحرافات عن النمط المعمول به:

بسبب ال X- متغير أحادي البعد، نقاط ( × ط, د ط) يمكن تصويرها على مستوى في شكل ما يسمى بالرسم البياني المتبقي. يتيح هذا التمثيل أحيانًا اكتشاف نوع ما من الأنماط في سلوك البقايا. بالإضافة إلى ذلك، يسمح التحليل المتبقي بتحليل الافتراضات المتعلقة بقانون توزيع الأخطاء.

في الحالة التي تكون فيها الأخطاء موزعة حسب القانون العادي ويوجد تقدير مسبق لتباينها σ 2 (تم الحصول على التقدير على أساس القياسات التي تم إجراؤها مسبقًا)، فمن الممكن إجراء تقييم أكثر دقة لمدى كفاية النموذج.

باستخدام F- يمكن استخدام اختبار فيشر للتحقق مما إذا كان التباين المتبقي معنويا أم لا س 0 2 يختلف عن التقدير المسبق. إذا كان أكبر بكثير، فهذا يعني أن هناك عدم كفاية ويجب مراجعة النموذج.

إذا كان التقدير المسبق σ 2 لا، ولكن قياسات الاستجابة يتكرر مرتين أو أكثر بنفس القيم Xثم يمكن استخدام هذه الملاحظات المتكررة للحصول على تقدير آخر σ 2 (الأول هو التباين المتبقي). ويقال إن مثل هذا التقدير يمثل خطأ "محضًا"، لأنه إذا سمتطابقة لملاحظتين أو أكثر، فإن التغييرات العشوائية فقط هي التي يمكن أن تؤثر على النتائج وتخلق تشتتًا بينها.

ويتبين أن التقدير الناتج هو تقدير أكثر موثوقية للتباين من التقديرات التي تم الحصول عليها بالطرق الأخرى. لهذا السبب، عند التخطيط للتجارب، من المنطقي إجراء تجارب مع التكرار.

لنفترض أن هناك ممعان مختلفة X : س 1 , س 2 , ..., س م. دعونا لكل من هذه القيم × طمتاح ن طملاحظات الاستجابة ي. إجمالي الملاحظات هي:

ومن ثم يمكن كتابة نموذج الانحدار الخطي البسيط على النحو التالي:


دعونا نجد تباين الأخطاء "البحتة". هذا التباين هو تقدير التباين المجمع σ 2 إذا تخيلنا قيم الاستجابة ذ جفي س = × طكحجم العينة ن ط. ونتيجة لذلك فإن تباين الأخطاء "البحتة" يساوي:

هذا التباين بمثابة تقدير σ 2 بغض النظر عما إذا كان النموذج المجهز صحيحًا.

دعونا نبين أن مجموع مربعات "الأخطاء الصرفة" هو جزء من مجموع المربعات المتبقية (مجموع المربعات المدرجة في التعبير عن التباين المتبقي). المتبقية ل يالملاحظة في × طيمكن كتابتها على النحو التالي:

إذا قمنا بتربيع طرفي هذه المعادلة ثم جمعناهما يوبواسطة أنا، فنحصل على:

على اليسار في هذه المساواة يوجد مجموع المربعات المتبقية. الحد الأول على الجانب الأيمن هو مجموع مربعات الأخطاء "البحتة"، ويمكن تسمية الحد الثاني بمجموع مربعات عدم الملاءمة. المبلغ الأخير لديه م−2 درجة من الحرية، وبالتالي تباين عدم الملاءمة

المعيار الإحصائي لاختبار الفرضية H0: النموذج الخطي البسيط كافي، مقابل الفرضية H1: النموذج الخطي البسيط غير كافي، متغير عشوائي

إذا كانت الفرضية الصفرية صحيحة، فإن القيمة Fلديه توزيع فيشر مع درجات الحرية م-2 و نم. يجب رفض فرضية الخطية لخط الانحدار عند مستوى الأهمية α إذا كانت القيمة الإحصائية الناتجة أكبر من النقطة المئوية α لتوزيع فيشر مع درجات الحرية م-2 و نم.

46. التحقق من كفاية نموذج الانحدار (انظر 45). تحليل التباين

47. التحقق من كفاية نموذج الانحدار (انظر 45). معامل التحديد

في بعض الأحيان يتم استخدام معامل تحديد العينة لوصف جودة خط الانحدار ر 2، يُظهر الجزء (المشاركة) مجموع المربعات بسبب الانحدار، SC p، الذي يشكله في مجموع المربعات SC p:

الاقرب ر 2 بالنسبة للوحدة، كلما كان الانحدار يقترب بشكل أفضل من البيانات التجريبية، كلما كانت الملاحظات أقرب إلى خط الانحدار. لو ر 2 = 0، فإن التغيرات في الاستجابة ترجع بالكامل إلى تأثير العوامل غير المحسوبة، ويكون خط الانحدار موازيًا للمحور س-س. وفي حالة الانحدار الخطي البسيط يكون معامل التحديد ر 2 يساوي مربع معامل الارتباط ص 2 .

لا يمكن تحقيق القيمة القصوى لـ R 2 = 1 إلا في حالة إجراء عمليات الرصد عند قيم x مختلفة. إذا كانت البيانات تحتوي على تجارب متكررة، فإن قيمة R 2 لا يمكن أن تصل إلى الوحدة، مهما كانت جودة النموذج.

48. فترات الثقة لمعلمات الانحدار الخطي البسيطة

مثلما أن متوسط ​​العينة هو تقدير للمتوسط ​​الحقيقي (متوسط ​​السكان)، كذلك تكون معلمات العينة لمعادلة الانحدار أو ب- ليس أكثر من تقديرات لمعاملات الانحدار الحقيقية. ستنتج العينات المختلفة تقديرات مختلفة للمتوسط، تمامًا كما ستنتج العينات المختلفة تقديرات مختلفة لمعاملات الانحدار.

على افتراض أن قانون توزيع الخطأ εiموصوفة بالقانون العادي، وتقدير المعلمة بسيكون لها توزيع طبيعي مع المعلمات:


منذ تقدير المعلمة أعبارة عن مزيج خطي من الكميات المستقلة الموزعة بشكل طبيعي، وسيكون لها أيضًا توزيع طبيعي مع التوقع الرياضي والتباين:


في هذه الحالة، (1 - α) فاصل الثقة لتقدير التشتت σ 2 مع الأخذ في الاعتبار أن النسبة ( ن−2)س 0 2 /σ 2ـ موزعة حسب القانون χ 2 درجات الحرية نسيتم تحديد −2 بالتعبير


49. فترات الثقة لخط الانحدار. فاصل الثقة لقيم المتغير التابع

نحن عادة لا نعرف القيم الحقيقية لمعاملات الانحدار أو ب. نحن نعرف فقط تقديراتهم. بمعنى آخر، قد يكون خط الانحدار الحقيقي أعلى أو أقل، أو أكثر انحدارًا أو استواءً، من الخط المبني من بيانات العينة. حسبنا فترات الثقة لمعاملات الانحدار. يمكنك أيضًا حساب منطقة الثقة لخط الانحدار نفسه.

دع الانحدار الخطي البسيط الذي نحتاجه لبناء (1− α ) فاصل الثقة للتوقع الرياضي للاستجابة يبالقيمة X = X 0 . هذا التوقع الرياضي يساوي أ+bx 0 ودرجتها

لأنه عندها.

التقدير الناتج للتوقع الرياضي هو مزيج خطي من القيم الموزعة بشكل طبيعي غير المترابطة وبالتالي له أيضًا توزيع طبيعي يتمركز عند نقطة القيمة الحقيقية للتوقع الرياضي المشروط والتباين

ولذلك، فإن فاصل الثقة لخط الانحدار عند كل قيمة س 0 يمكن تمثيلها ك


كما ترون، يتم الحصول على الحد الأدنى من فترة الثقة عندما س 0 يساوي القيمة المتوسطة ويزيد س 0 "يبتعد" عن المتوسط ​​في أي اتجاه.

للحصول على مجموعة من فترات الثقة المشتركة المناسبة لوظيفة الانحدار بأكملها، طوال طولها بالكامل، في التعبير أعلاه بدلاً من ذلك تينيسي −2,α /2 يجب استبداله

نظرية مختصرة

يتم استخدام معامل ارتباط كيندال عندما يتم تمثيل المتغيرات على مقياسين ترتيبيين، بشرط عدم وجود رتب مرتبطة. يتضمن حساب معامل كيندال حساب عدد التطابقات والانقلابات.

يختلف هذا المعامل ضمن الحدود ويتم حسابه باستخدام الصيغة:

بالنسبة للحساب، يتم ترتيب جميع الوحدات وفقًا لـ؛ حسب صف من صفة أخرى، لكل رتبة عدد الرتب اللاحقة التي تزيد على المعطاة (نشير إليها بـ)، وعدد الرتب اللاحقة التي تقل عن المعطاة (نشير إليها بـ).

يمكن أن يظهر ذلك

ويمكن كتابة معامل ارتباط رتبة كيندال على النحو التالي

من أجل اختبار الفرضية الصفرية عند مستوى الدلالة بأن معامل ارتباط رتبة كيندال العام يساوي الصفر في ظل فرضية منافسة، من الضروري حساب النقطة الحرجة:

أين هو حجم العينة؟

- النقطة الحرجة للمنطقة الحرجة ذات الوجهين، والتي تم العثور عليها من جدول دالة لابلاس بالمساواة

إذا - لا يوجد سبب لرفض فرضية العدم. ارتباط الرتبة بين الخصائص غير مهم.

إذا - تم رفض الفرضية الصفرية. هناك علاقة رتبة كبيرة بين الخصائص.

مثال على حل المشكلة

المهمة

أثناء عملية التوظيف، خضع سبعة مرشحين لشغل وظائف شاغرة لاختبارين. تظهر نتائج الاختبار (بالنقاط) في الجدول: امتحان 1 2 3 4 5 6 7 1 31 82 25 26 53 30 29 2 21 55 8 27 32 42 26

مُرَشَّح

حساب معامل ارتباط رتبة كيندال بين نتائج الاختبار لاختبارين وتقييم أهميته عند المستوى.

حل المشكلة

دعونا نحسب معامل كيندال

1 1 6 0 2 4 3 2 3 3 3 1 4 6 1 2 5 2 2 0 6 5 1 0 7 7 0 0 يتم ترتيب صفوف الخاصية العاملية بشكل صارم بترتيب تصاعدي، ويتم تسجيل الرتب المقابلة للخاصية الناتجة بالتوازي. لكل رتبة، من عدد الرتب التي تليها، يتم حساب عدد الرتب الأكبر منها في القيمة (يتم إدخالها في العمود) وعدد الرتب الأصغر منها في القيمة (يتم إدخالها في العمود). 16 5