Talaba koeffitsientini bilish qanday hollarda talab qilinadi? Juftlangan talabalarning t-testi - takroriy o'lchovlardagi farqlarning ahamiyatini baholash usuli


/-Talaba mezoni parametrikdir, shuning uchun uni eksperiment natijalari oxirgi ikki shkala - interval va nisbat bo'yicha o'lchovlar shaklida taqdim etilgandagina qo'llash mumkin. Keling, maxsus misol yordamida Student testining imkoniyatlarini ko'rsatamiz.

Aytaylik, siz ma'lum bir texnikadan foydalangan holda otishma mashg'ulotlarining samaradorligini bilib olishingiz kerak. Shu maqsadda qiyosiy pedagogik eksperiment o'tkaziladi, unda 8 kishidan iborat bir guruh (eksperimental) taklif qilingan eksperimental metodologiya bo'yicha o'rganadi, ikkinchisi (nazorat) an'anaviy, umumiy qabul qilinganga amal qiladi. Ishchi gipoteza shundan iboratki, siz taklif qilayotgan yangi texnika samaraliroq bo'ladi. Tajribaning natijasi beshta tortishishning nazorat otilishi bo'lib, uning natijalariga ko'ra (6-jadval) farqlarning ishonchliligini hisoblash va ilgari surilgan gipotezaning to'g'riligini tekshirish kerak.

6-jadval

Student's t-test yordamida farqlarning ahamiyatini hisoblash uchun nima qilish kerak?

1. Quyidagi formuladan foydalanib, har bir guruh uchun X ning o'rtacha arifmetik qiymatlarini alohida hisoblang:

Qayerda Xt -- bitta o'lchov qiymati; i - guruhdagi o'lchamlarning umumiy soni.

Jadvaldagi haqiqiy qiymatlarni formulaga kiritish. 6, biz olamiz:

O'rtacha arifmetik qiymatlarni taqqoslash shuni ko'rsatadiki, eksperimental guruhda bu qiymat (X = 35) nazorat guruhiga qaraganda yuqori. (Hk= 27). Biroq, eksperimental guruh ishtirokchilari yaxshiroq otishni o'rganganligi haqidagi yakuniy bayonot uchun hisoblangan o'rtacha arifmetik qiymatlar orasidagi farqlarning (/) statistik ahamiyatiga ishonch hosil qilish kerak.

2. Ikkala guruhda ham standart og‘ish (5) ni quyidagi formula yordamida hisoblang:

:de Ximax-- eng yuqori ko'rsatkich; Ximm-- eng past ko'rsatkich; TO-- jadval koeffitsienti. Standart og'ish (5) qanday hisoblanadi: -- aniqlang Xitrax ikkala guruhda; -- belgilash Ximia bu guruhlarda; -- har bir guruhdagi o'lchovlar sonini aniqlash (l); -- maxsus jadval yordamida koeffitsient qiymatini toping (12-ilova) TO, guruhdagi o'lchovlar soniga to'g'ri keladi (8). Buning uchun indeks ostidagi eng chap ustunda (i) biz 0 raqamini topamiz, chunki bizning misolimizdagi o'lchamlar soni 10 dan kam, yuqori qatorda esa 8 raqami; bu chiziqlar kesishmasida - 2.85, bu koeffitsient qiymatiga to'g'ri keladi.AGat 8 sinovlari --- olingan qiymatlarni formulaga almashtiring va kerakli hisob-kitoblarni bajaring:

3. O‘rtacha arifmetik (t)ning standart xatosini quyidagi formula yordamida hisoblang:

Bizning misolimiz uchun birinchi formula mos keladi, chunki P< 30. Вычислим для каждой группы значения:

4. Formula yordamida o'rtacha farq xatosini hisoblang:

5. Maxsus jadval (13-ilova) yordamida farqlarning ishonchliligini aniqlang. Buning uchun natijada olingan qiymat (t) 5% ahamiyatlilik darajasida chegara qiymati bilan solishtiriladi (t0fi5) Erkinlik darajalari soni bilan/= pe + kompyuter- 2, qayerda kompyuter to'plami ~ mos ravishda eksperimental va nazorat guruhlarida individual natijalarning umumiy soni. Agar tajribada nima olinganligi ma'lum bo'lsa t chegara qiymatidan katta (/0)o5)> t0 ikki guruhning arifmetik o‘rtachalari orasidagi farqlar hisobga olinadi. ishonchli 50% ahamiyatlilik darajasida va aksincha, olingan taqdirda t kamroq chegara qiymati t0<05, farqlar borligiga ishoniladi ishonchsiz va guruhlarning o'rtacha arifmetik ko'rsatkichlaridagi farq tasodifiydir. 5% ahamiyatlilik darajasidagi chegara qiymati (G0>05) quyidagicha aniqlanadi:

erkinlik darajalari sonini hisoblang/= 8 + 8 - 2 = 14;

jadvaldan chegara qiymatini toping (13-ilova) tofi5 da/= 14.

Bizning misolimizda jadval qiymati tQ<05 = 2.15, uni hisoblangan bilan solishtiring G, bu 1,7 ga teng, ya'ni. chegara qiymatidan kamroq (2.15). Shunday qilib, tajribada olingan o'rtacha arifmetik qiymatlar o'rtasidagi farqlar hisobga olinadi ishonchsiz, demak, bitta otishni o'rganish usuli boshqasidan ko'ra samaraliroq ekanligini aytish uchun etarli dalil yo'q. Bunday holda, biz yozishimiz mumkin: / = 1,7 bilan /» > 0,05, bu shuni anglatadiki, 100 ta o'xshash tajribada, ehtimollik. (R) eksperimental guruhlarning o'rtacha arifmetik ko'rsatkichlari nazorat guruhlaridan yuqori bo'lsa, 5% dan ortiq yoki 100 ta holatdan 95 tadan kam bo'lsa, shunga o'xshash natijalarni olish. Olingan hisob-kitoblarni hisobga olgan holda va iqtibos keltirgan holda jadvalning yakuniy dizayni. mos keladigan parametrlar shunday ko'rinishi mumkin.

Nisbatan ko'p sonli o'lchovlar bilan, agar arifmetik o'rtachalar orasidagi farq uning uchta xatosiga teng yoki undan ko'p bo'lsa, farqlar ishonchli deb hisoblanadi. Bunday holda, farqlarning ishonchliligi quyidagi tenglama bilan aniqlanadi:

Ushbu bo'limning boshida aytib o'tilganidek, Student's t-testi faqat o'lchovlar intervalli va nisbatlar shkalasida amalga oshirilgan hollarda qo'llanilishi mumkin. Biroq, ta'lim tadqiqotlarida ko'pincha Nomlash yoki Buyurtma shkalasi bo'yicha olingan natijalar o'rtasidagi farqlarning ishonchliligini aniqlashga ehtiyoj bor. Bunday hollarda foydalaning parametrik bo'lmagan mezonlar. Parametrik mezonlardan farqli o'laroq, parametrik bo'lmagan mezonlar olingan natijalarning ma'lum parametrlarini (o'rtacha arifmetik, standart og'ish va boshqalar) hisoblashni talab qilmaydi, bu ularning nomlari asosan bog'liqdir. Keling, tartib va ​​nomlash shkalasi bo'yicha olingan mustaqil natijalar o'rtasidagi farqlarning ahamiyatini aniqlash uchun ikkita parametrik bo'lmagan testni ko'rib chiqaylik.

Talabaning t-testidan qanday hollarda foydalanish mumkin?

Student t-testini qo'llash uchun asl ma'lumotlar bo'lishi kerak normal taqsimot. Mustaqil namunalar uchun ikkita namunali mezon qo'llanilganda, shartni qondirish ham kerak. dispersiyalarning tengligi (homosedastikligi)..

Agar ushbu shartlar bajarilmasa, namunaviy vositalarni taqqoslashda shunga o'xshash usullardan foydalanish kerak. parametrik bo'lmagan statistika, ular orasida eng mashhurlari Mann-Whitney U testi(mustaqil namunalar uchun ikkita namunali test sifatida) va belgi mezoni Va Wilcoxon testi(qaram namunalar holatlarida qo'llaniladi).

O'rtacha qiymatlarni solishtirish uchun Student t-testi quyidagi formula bo'yicha hisoblanadi:

Qayerda M 1- birinchi taqqoslangan aholining (guruhning) o'rtacha arifmetik qiymati; M 2- ikkinchi taqqoslangan aholining (guruhning) o'rtacha arifmetik qiymati; m 1- birinchi arifmetik o'rtachaning o'rtacha xatosi, m 2- ikkinchi arifmetik o'rtachaning o'rtacha xatosi.

Studentning t-test qiymatini qanday izohlash mumkin?

Olingan Studentning t-test qiymati to'g'ri talqin qilinishi kerak. Buning uchun har bir guruhdagi mavzular sonini bilishimiz kerak (n 1 va n 2). Erkinlik darajalari sonini topish f quyidagi formula bo'yicha:

f = (n 1 + n 2) - 2

Shundan so'ng biz talab qilinadigan ahamiyat darajasi (masalan, p = 0,05) va ma'lum miqdordagi erkinlik darajasi uchun Student t-testining kritik qiymatini aniqlaymiz. f jadvalga muvofiq ( pastga qarang).

Biz mezonning kritik va hisoblangan qiymatlarini solishtiramiz:

· Student t-testining hisoblangan qiymati bo'lsa teng yoki kattaroq kritik, jadvaldan topilgan, biz taqqoslangan qiymatlar orasidagi farqlar statistik ahamiyatga ega degan xulosaga keldik.

· Hisoblangan Student t-testining qiymati bo'lsa Ozroq jadvalli, ya'ni taqqoslangan qiymatlar orasidagi farqlar statistik ahamiyatga ega emas.

Student t-testini hisoblash misoli

Yangi temir preparatining samaradorligini o'rganish uchun anemiya bilan og'rigan bemorlarning ikki guruhi tanlangan. Birinchi guruhda bemorlar ikki hafta davomida yangi dori-darmonlarni qabul qilishdi, ikkinchi guruhda esa platsebo qabul qilishdi. Shundan so'ng periferik qondagi gemoglobin miqdori o'lchanadi. Birinchi guruhda gemoglobinning o'rtacha darajasi 115,4±1,2 g/l, ikkinchi guruhda esa 103,7±2,3 g/l (ma'lumotlar formatda keltirilgan) M±m), solishtirilayotgan populyatsiyalar normal taqsimotga ega. Birinchi guruhdagilar soni 34 nafar, ikkinchisida esa 40 nafar bemor. Olingan farqlarning statistik ahamiyati va yangi temir preparatining samaradorligi haqida xulosa chiqarish kerak.

Yechim: Farqlarning ahamiyatini baholash uchun biz o'rtacha qiymatlardagi farq kvadrat xatolar yig'indisiga bo'lingan holda hisoblangan Student t-testidan foydalanamiz:

Hisob-kitoblarni amalga oshirgandan so'ng, t-test qiymati 4,51 bo'lib chiqdi. Biz erkinlik darajalari sonini (34 + 40) - 2 = 72 deb topamiz. Olingan 4.51 Studentning t-test qiymatini jadvalda ko'rsatilgan p = 0.05 kritik qiymat bilan taqqoslaymiz: 1.993. Mezonning hisoblangan qiymati kritik qiymatdan kattaroq bo'lgani uchun biz kuzatilgan farqlar statistik ahamiyatga ega degan xulosaga kelamiz (muhimlik darajasi p<0,05).

Fisher taqsimoti tasodifiy o'zgaruvchining taqsimotidir

tasodifiy o'zgaruvchilar qayerda X 1 Va X 2 mustaqil va erkinlik darajalari soni bilan x-kvadrat taqsimotiga ega k 1 Va k 2 mos ravishda. Shu bilan birga, er-xotin (k 1 , k 2)- Fisher taqsimotining bir juft "erkinlik darajasi", xususan, k 1- numeratorning erkinlik darajalari soni, va k 2– maxrajning erkinlik darajalari soni. Tasodifiy o'zgaruvchining taqsimlanishi F asarlarida faol foydalangan buyuk ingliz statistikasi R. Fisher (1890-1962) nomi bilan atalgan.

Fisher taqsimoti regressiya tahlilida, dispersiyalarning tengligida va amaliy statistikaning boshqa muammolarida modelning adekvatligi haqidagi farazlarni sinab ko'rishda qo'llaniladi.

Talabaning tanqidiy qiymatlari jadvali.

Shaklning boshlanishi

Erkinlik darajalari soni, f Talabaning t-test qiymati p=0,05
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.040
2.037
2.035
2.032
2.030
2.028
2.026
2.024
40-41 2.021
42-43 2.018
44-45 2.015
46-47 2.013
48-49 2.011
50-51 2.009
52-53 2.007
54-55 2.005
56-57 2.003
58-59 2.002
60-61 2.000
62-63 1.999
64-65 1.998
66-67 1.997
68-69 1.995
70-71 1.994
72-73 1.993
74-75 1.993
76-77 1.992
78-79 1.991
80-89 1.990
90-99 1.987
100-119 1.984
120-139 1.980
140-159 1.977
160-179 1.975
180-199 1.973
1.972
1.960

Usul ikki umumiy populyatsiyaning o'rtacha qiymatlari taqqoslanganlari olinadigan gipotezani sinab ko'rishga imkon beradi. qaram namunalar bir-biridan farq qiladi. Bog'liqlik taxmini ko'pincha belgi bir xil namunada ikki marta, masalan, aralashuvdan oldin va undan keyin o'lchanganligini anglatadi. Umumiy holda, bitta tanlamaning har bir vakiliga boshqa namunadagi vakil tayinlanadi (ular juftlikda birlashtiriladi), shuning uchun ikkita ma'lumotlar seriyasi bir-biri bilan ijobiy bog'liqdir. Namuna bog'liqligining zaifroq turlari: 1 namuna - erlar, 2 namuna - ularning xotinlari; 1-namuna - bir yoshli bolalar, 2-namuna 1-namunadagi bolalarning egizaklaridan iborat va hokazo.

Tekshiriladigan statistik gipoteza, oldingi holatda bo'lgani kabi, H 0: M 1 = M 2(1 va 2 namunalardagi o'rtacha qiymatlar teng bo'lsa, u rad etilsa, alternativ gipoteza qabul qilinadi). M 1 ko'proq kamroq) M 2.

Dastlabki taxminlar statistik testlar uchun:

□ bitta tanlamaning har bir vakili (bir umumiy populyatsiyadan) boshqa tanlamaning (boshqa umumiy populyatsiyadan) vakili bilan bog'langan;

□ ikkita namunadagi ma'lumotlar ijobiy o'zaro bog'liqdir (juft shakllar);

□ har ikkala namunada o'rganilayotgan xarakteristikaning taqsimlanishi normal qonunga mos keladi.

Manba ma'lumotlarining tuzilishi: har bir ob'ekt uchun (har bir juftlik uchun) o'rganilayotgan xususiyatning ikkita qiymati mavjud.

Cheklovlar: har ikkala namunadagi xarakteristikaning taqsimlanishi odatdagidan sezilarli darajada farq qilmasligi kerak; har ikkala namunaga mos keladigan ikkita o'lchov ma'lumotlari ijobiy bog'liqdir.

Alternativlar: Wilcoxon T-testi, agar kamida bitta namuna uchun taqsimot odatdagidan sezilarli darajada farq qilsa; Mustaqil namunalar uchun t-Student testi - agar ikkita namuna uchun ma'lumotlar ijobiy korrelyatsiya bo'lmasa.

Formula Talabaning t testining empirik qiymati uchun farqlar uchun tahlil birligi ekanligini aks ettiradi farq (shift) har bir kuzatuv juftligi uchun xarakterli qiymatlar. Shunga ko'ra, N juft atribut qiymatlarining har biri uchun birinchi navbatda farq hisoblanadi d i = x 1 i - x 2 i.

(3) bu erda M d - qiymatlarning o'rtacha farqi; s d - farqlarning standart og'ishi.

Hisoblash misoli:

Aytaylik, treningning samaradorligini tekshirish jarayonida guruhning 8 a'zosining har biriga "Sizning fikringiz guruh fikrlari bilan qanchalik tez-tez mos keladi?" Deylik. - ikki marta, mashg'ulotdan oldin va keyin. Javoblar uchun 10 balllik shkala qo'llanildi: 1 - hech qachon, 5 - yarim vaqt, 10 - har doim. Mashg'ulot natijasida ishtirokchilarning o'zini-o'zi muvofiqlik (guruhdagi boshqalar kabi bo'lish istagi) o'sishi (a = 0,05) degan gipoteza sinovdan o'tkazildi. Oraliq hisoblar uchun jadval tuzamiz (3-jadval).

3-jadval

M d = (-6)/8= -0,75 farqi uchun o'rtacha arifmetik. Ushbu qiymatni har bir d dan (jadvalning oxirgi ustuni) olib tashlang.

Standart og'ish formulasi faqat X o'rniga d paydo bo'lishi bilan farq qiladi. Biz barcha kerakli qiymatlarni almashtiramiz va biz olamiz

s d = = 0,886.

Qadam 1. (3) formuladan foydalanib, mezonning empirik qiymatini hisoblang: o'rtacha farq Md= -0,75; standart og'ish s d = 0,886; t e = 2,39; df = 7.

2-qadam. T-Student mezonining kritik qiymatlari jadvalidan foydalanib, biz p-muhimlik darajasini aniqlaymiz. Df = 7 uchun empirik qiymat p = 0,05 va p - 0,01 uchun kritik qiymatlar orasida. Shuning uchun, p< 0,05.

df R
0,05 0,01 0,001
2,365 3,499 5,408

Qadam 3. Biz statistik qaror qabul qilamiz va xulosani shakllantiramiz. Vositalar tengligi haqidagi statistik gipoteza rad etiladi. Xulosa: treningdan so'ng ishtirokchilarning muvofiqligini o'z-o'zini baholash ko'rsatkichi statistik jihatdan sezilarli darajada oshdi (ahamiyat darajasida p< 0,05).

Parametrik usullarga quyidagilar kiradi mezon bo'yicha ikkita namunadagi dispersiyalarni solishtirish F-Fisher. Ba'zan bu usul qimmatli mazmunli xulosalarga olib keladi va mustaqil namunalar uchun vositalarni taqqoslaganda, dispersiyalarni taqqoslash amalga oshiriladi. majburiy tartib.

Hisoblash uchun F em siz ikkita namunadagi dispersiyalarning nisbatini topishingiz kerak va shuning uchun katta dispersiya hisoblagichda, kichiki esa maxrajda bo'ladi.

Farqlarni solishtirish. Usul taqqoslangan namunalar olingan ikki populyatsiyaning dispersiyalari bir-biridan farq qilishi haqidagi gipotezani sinab ko'rish imkonini beradi. Tekshirilgan statistik gipoteza H 0: s 1 2 = s 2 2 (1-namunadagi dispersiya 2-namunadagi dispersiyaga teng). Agar u rad etilsa, bir dispersiya boshqasidan kattaroq degan muqobil gipoteza qabul qilinadi.

Dastlabki taxminlar: o'rganilayotgan belgining normal taqsimlanishi bilan turli populyatsiyalardan tasodifiy ikkita namuna olinadi.

Manba ma'lumotlarining tuzilishi: o'rganilayotgan belgi ob'ektlarda (sub'ektlarda) o'lchanadi, ularning har biri taqqoslanayotgan ikkita namunadan biriga tegishli.

Cheklovlar: ikkala namunadagi belgining taqsimlanishi odatdagidan sezilarli darajada farq qilmaydi.

Alternativ usul: Leven testi, undan foydalanish normallik taxminini tekshirishni talab qilmaydi (SPSS dasturida qo'llaniladi).

Formula Fisherning F testining empirik qiymati uchun:

(4)

bu erda s 1 2 - katta dispersiya va s 2 2 - kichik dispersiya. Qaysi dispersiya kattaroq ekanligi oldindan ma'lum emasligi sababli, u p-darajasini aniqlash uchun ishlatiladi Yo'nalishsiz alternativlar uchun kritik qiymatlar jadvali. Agar F e > F Kp erkinlik darajalarining mos keladigan soni uchun, keyin R < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Hisoblash misoli:

Bolalarga oddiy arifmetik masalalar berildi, shundan so'ng o'quvchilarning tasodifiy tanlab olingan yarmiga testdan o'ta olmaganliklari aytildi, qolganlariga esa buning aksi aytildi. Keyin har bir boladan shunga o'xshash muammoni hal qilish uchun qancha soniya kerakligi so'ralgan. Tajribachi bolaning qo'ng'iroq qilgan vaqti va bajarilgan vazifaning natijasi (sekundlarda) o'rtasidagi farqni hisoblab chiqdi. Muvaffaqiyatsizlik xabari bolaning o'zini o'zi qadrlashida bir oz noadekvatlikka olib kelishi kutilgan edi. Tekshirilayotgan gipoteza (a = 0,005 darajasida) jami o'z-o'zini hurmat qilishning o'zgarishi muvaffaqiyat yoki muvaffaqiyatsizlik haqidagi hisobotlarga bog'liq emas edi (H 0: s 1 2 = s 2 2).

Quyidagi ma'lumotlar olindi:


1-qadam. Formulalar (4) yordamida mezonning empirik qiymati va erkinlik darajalari sonini hisoblang:

2-qadam. Fisher f-mezonining kritik qiymatlari jadvaliga ko'ra yo'naltirilmagan muqobillar uchun kritik qiymat topamiz df raqami = 11; df bilaman= 11. Biroq, faqat uchun kritik qiymat mavjud df raqami= 10 va df bilish = 12. Ko'proq erkinlik darajalarini olish mumkin emas, shuning uchun biz uchun kritik qiymatni olamiz df raqami= 10: uchun R = 0,05 F Kp = 3,526; Uchun R = 0,01 F Kp = 5,418.

Qadam 3. Statistik qaror va mazmunli xulosa chiqarish. Empirik qiymat kritik qiymatdan oshib ketganligi sababli R= 0,01 (va undan ham ko'proq p = 0,05), keyin bu holda p< 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (R< 0,01). Shunday qilib, muvaffaqiyatsizlik haqidagi xabardan so'ng, o'z-o'zini hurmat qilishning etishmasligi muvaffaqiyat haqidagi xabardan keyin yuqoriroqdir.

/ amaliy statistika / ma'lumotnoma materiallari / talaba t-test qiymatlari

Ma'nosit -Talabaning t testi 0,10, 0,05 va 0,01 ahamiyatlilik darajasida

ν - o'zgaruvchanlik erkinlik darajalari

Standart Studentning t-test qiymatlari

Erkinlik darajalari soni

Muhimlik darajalari

Erkinlik darajalari soni

Muhimlik darajalari

Jadval XI

Standart Fisher test qiymatlari ikkita namuna o'rtasidagi farqlarning ahamiyatini baholash uchun ishlatiladi

Erkinlik darajalari

Muhimlik darajasi

Erkinlik darajalari

Muhimlik darajasi

Talabaning t-testi

Talabaning t-testi- talabalar taqsimotiga asoslangan gipotezalarni (statistik testlar) statistik tekshirish usullari sinfining umumiy nomi. T-testning eng keng tarqalgan qo'llanilishi ikkita namunadagi vositalarning tengligini tekshirishni o'z ichiga oladi.

t-statistika odatda quyidagi umumiy printsip bo'yicha tuziladi: hisob nol matematik kutilmaga ega tasodifiy o'zgaruvchidir (agar nol gipoteza qanoatlansa) va maxraj - bu tasodifiy o'zgaruvchining kvadrat ildizi sifatida olingan namunaviy standart og'ishi. aralashmagan dispersiyani baholash.

Hikoya

Ushbu mezon Uilyam Gossett tomonidan Ginnes kompaniyasida pivo sifatini baholash uchun ishlab chiqilgan. Tijorat sirlarini oshkor etmaslik bo'yicha kompaniya oldidagi majburiyatlari bilan bog'liq holda (Ginnes rahbariyati o'z ishida statistik apparatlardan foydalanishni shunday deb hisoblaydi), Gossetning maqolasi 1908 yilda "Talaba" taxallusi bilan Biometrika jurnalida nashr etilgan.

Ma'lumotlar talablari

Ushbu mezonni qo'llash uchun dastlabki ma'lumotlar normal taqsimotga ega bo'lishi kerak. Mustaqil namunalar uchun ikkita namunali testni qo'llashda, shuningdek, dispersiyalarning tengligi shartiga rioya qilish kerak. Biroq, teng bo'lmagan dispersiyalarga ega bo'lgan vaziyatlar uchun Student t testiga alternativalar mavjud.

Ma'lumotlarning normal taqsimlanishi talabi aniq t (\displaystyle t) -testi uchun zarurdir. Biroq, boshqa ma'lumotlarni taqsimlashda ham, t (\displaystyle t) -statistikadan foydalanish mumkin. Ko'p hollarda bu statistik asimptotik tarzda standart normal taqsimotga ega - N (0, 1) (\displaystyle N(0,1)) , shuning uchun bu taqsimotning kvantillaridan foydalanish mumkin. Biroq, bu holatda ham, ko'pincha kvantlar standart normal taqsimotdan emas, balki aniq t (\displaystyle t) testida bo'lgani kabi, mos keladigan Student taqsimotidan foydalaniladi. Ular asimptotik jihatdan ekvivalentdir, lekin kichik namunalarda Student taqsimotining ishonch oraliqlari kengroq va ishonchliroqdir.

Bir namunali t-testi

Nol gipotezani tekshirish uchun foydalaniladi H 0: E (X) = m (\displaystyle H_(0):E(X)=m) matematik kutishning E (X) (\displaystyle E(X)) ga tengligi haqida. ba'zi ma'lum qiymat m ( \displaystyle m) .

Shubhasiz, agar nol gipoteza qanoatlansa, E (X ¯) = m (\displaystyle E((\overline (X)))=m) . Kuzatishlarning faraz qilingan mustaqilligini hisobga olgan holda, V (X ¯) = s 2 / n (\displaystyle V((\overline (X)))=\sigma ^(2)/n) . Xolis dispersiyani baholashdan foydalanish s X 2 = ∑ t = 1 n (X t − X ¯) 2 / (n − 1) (\displaystyle s_(X)^(2)=\sum _(t=1)^( n )(X_(t)-(\overline (X)))^(2)/(n-1)) quyidagi t-statistik ma’lumotlarni olamiz:

t = X ¯ - m s X / n (\displaystyle t=(\frac ((\overline (X))-m)(s_(X)/(\sqrt (n)))))

Nol gipotezaga ko'ra, bu statistikaning taqsimlanishi t (n - 1) (\displaystyle t(n-1)) dir. Binobarin, agar statistik ma'lumotlarning mutlaq qiymati berilgan taqsimotning kritik qiymatidan (ma'lum ahamiyatga egalik darajasida) oshsa, nol gipoteza rad etiladi.

Mustaqil namunalar uchun ikkita namunali t-testi

Oddiy taqsimlangan X 1, X 2 (\displaystyle X_(1),~X_(2) n 1, n 2 (\displaystyle n_(1)~,~n_(2)) hajmlarining ikkita mustaqil namunasi boʻlsin. )). Namuna ma'lumotlari yordamida H 0: M 1 = M 2 (\displaystyle H_(0):~M_(1)=M_(2)) tasodifiy o'zgaruvchilarning matematik taxminlari tengligining nol gipotezasini sinab ko'rish kerak.

Namuna vositalari orasidagi farqni ko'rib chiqing D = X ¯ 1 − X ¯ 2 (\displaystyle \Delta =(\overline (X))_(1)-(\overline (X))_(2)) . Shubhasiz, agar nol gipoteza to'g'ri bo'lsa E (D) = M 1 - M 2 = 0 (\displaystyle E(\Delta)=M_(1)-M_(2)=0) . Bu farqning dispersiyasi namunalarning mustaqilligiga qarab teng: V (D) = s 1 2 n 1 + s 2 2 n 2 (\displaystyle V(\Delta)=(\frac (\sigma _(1)) )^(2))( n_(1)))+(\frac (\sigma _(2)^(2))(n_(2)))) . Keyin xolis dispersiyani baholashdan foydalanib, s 2 = ∑ t = 1 n (X t − X ¯) 2 n − 1 (\displaystyle s^(2)=(\frac (\sum _(t=1)^(n)) ( X_(t)-(\overline (X)))^(2))(n-1))) biz tanlama oʻrtachalar orasidagi farq dispersiyasining xolis bahosini olamiz: s D 2 = s 1 2 n 1 + s 2 2 n 2 (\ displaystyle s_(\Delta )^(2)=(\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^() 2))(n_(2) ))) . Shuning uchun, nol gipotezani tekshirish uchun t-statistik

T = X ¯ 1 − X ¯ 2 s 1 2 n 1 + s 2 2 n 2 (\displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_( 2))(\sqrt ((\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^(2))(n_(2))))) ))

Agar nol gipoteza to'g'ri bo'lsa, bu statistik taqsimot t (d f) (\displaystyle t(df)) bo'ladi, bu erda d f = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n) 1) 2 / (n 1 − 1) + (s 2 2 / n 2) 2 / (n 2 − 1) (\displaystyle df=(\frac ((s_(1)^(2)/n_(1)) +s_(2 )^(2)/n_(2))^(2))((s_(1)^(2)/n_(1))^(2)/(n_(1)-1)+ (s_(2)^(2)/n_(2))^(2)/(n_(2)-1))))

Teng dispersiya holati

Agar namunalarning dispersiyalari teng deb qabul qilinsa, u holda

V (D) = s 2 (1 n 1 + 1 n 2) (\displaystyle V(\Delta)=\sigma ^(2)\left((\frac (1)(n_(1))))+(\ frac (1)(n_(2)))\o'ng))

Keyin t-statistika:

T = X ¯ 1 - X ¯ 2 s X 1 n 1 + 1 n 2 , s X = (n 1 - 1) s 1 2 + (n 2 - 1) s 2 2 n 1 + n 2 - 2 (\ displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_(2))(s_(X)(\sqrt ((\frac (1)(n_(1) )))+(\frac (1)(n_(2)))))))~,~~s_(X)=(\sqrt (\frac ((n_(1)-1)s_(1)^ ( 2)+(n_(2)-1)s_(2)^(2))(n_(1)+n_(2)-2))))

Bu statistik taqsimot t (n 1 + n 2 - 2) (\displaystyle t(n_(1)+n_(2)-2))

Bog'liq namunalar uchun ikkita namunali t-testi

Ikki qaramlik namunalari (masalan, vaqt oralig'i bilan bir xil testning ikkita namunasi) o'rtasidagi farqlar haqidagi gipotezani sinab ko'rish holatida t (\displaystyle t) -mezonining empirik qiymatini hisoblash uchun quyidagi formuladan foydalaniladi:

T = M d s d / n (\ displaystyle t = (\ frac (M_ (d)) (s_ (d) / (\ sqrt (n)))))

Bu erda M d (\displaystyle M_(d)) - qiymatlarning o'rtacha farqi, s d (\displaystyle s_(d)) - farqlarning standart og'ishi, n - kuzatishlar soni

Bu statistika t (n - 1) (\displaystyle t(n-1)) taqsimotiga ega.

Chiziqli regressiya parametrlari bo'yicha chiziqli cheklovni sinab ko'rish

T-testi oddiy eng kichik kvadratlar bilan hisoblangan chiziqli regressiya parametrlari bo'yicha ixtiyoriy (bitta) chiziqli cheklovni ham sinab ko'rishi mumkin. H 0 gipotezasini tekshirish zarur bo'lsin: c T b = a (\displaystyle H_(0):c^(T)b=a) . Shubhasiz, agar nol gipoteza qondirilsa, E (c T b ^ − a) = c T E (b ^) − a = 0 (\displaystyle E(c^(T)(\shapka (b))-a)= c^( T)E((\shapka (b)))-a=0) . Bu erda biz E (b ^) = b (\displaystyle E((\hat (b)))=b) model parametrlarining xolis eng kichik kvadratlar bahosi xususiyatidan foydalanamiz. Bundan tashqari, V (c T b ^ - a) = c T V (b ^) c = s 2 c T (X T X) - 1 c (\displaystyle V(c^(T)(\shapka (b))-a )=c^(T)V((\shapka (b)))c=\sigma ^(2)c^(T)(X^(T)X)^(-1)c) . Noma’lum dispersiya o‘rniga uning xolis bahosi s 2 = E S S / (n − k) (\displaystyle s^(2)=ESS/(n-k)) yordamida quyidagi t-statistik ma’lumotlarni olamiz:

T = c T b ^ − a s c T (X T X) − 1 c (\displaystyle t=(\frac (c^(T)(\shapka (b))-a)(s(\sqrt (c^(T)) (X^(T)X)^(-1)c)))))

Bu statistik, nol gipoteza qanoatlansa, taqsimot t (n - k) (\displaystyle t(n-k)) bo‘ladi, shuning uchun agar statistik qiymat kritik qiymatdan yuqori bo‘lsa, chiziqli cheklovning nol gipotezasi bo‘ladi. rad etiladi.

Chiziqli regressiya koeffitsienti haqidagi farazlarni tekshirish

Chiziqli cheklashning alohida holati b j (\displaystyle b_(j)) regressiya koeffitsienti a (\displaystyle a) ma'lum bir qiymatga teng degan gipotezani sinab ko'rishdir. Bunday holda, tegishli t-statistika:

T = b ^ j − a s b ^ j (\ Displaystyle t = (\ frac ((\ shapka (b)) _ (j) -a) (s_ ((\ shapka (b)) _ (j)))))

bu erda s b ^ j (\displaystyle s_((\hat (b))_(j))) koeffitsient bahosining standart xatosi - koeffitsient baholarining kovariatsiya matritsasi mos keladigan diagonal elementining kvadrat ildizi.

Agar nol gipoteza to'g'ri bo'lsa, bu statistikaning taqsimlanishi t (n - k) (\displaystyle t(n-k)) ga teng. Agar statistik ma'lumotlarning mutlaq qiymati kritik qiymatdan yuqori bo'lsa, u holda koeffitsient va a (\displaystyle a) o'rtasidagi farq statistik ahamiyatga ega (tasodifiy bo'lmagan), aks holda u ahamiyatsiz (tasodifiy, ya'ni haqiqiy koeffitsient bo'ladi). a (\ displey uslubi a)) taxminiy qiymatiga teng yoki juda yaqin

Izoh

Matematik taxminlar uchun bitta namunali test chiziqli regressiya parametrlari bo'yicha chiziqli cheklovni sinab ko'rishga qisqartirilishi mumkin. Bitta namunali testda bu doimiy qiymatdagi "regressiya" dir. Demak, regressiyaning s 2 (\displaystyle s^(2)) o‘rganilayotgan tasodifiy o‘zgaruvchining dispersiyasining namunaviy bahosi bo‘lib, X T X (\displaystyle X^(T)X) matritsasi n (\displaystyle n) ga teng. ) , va modelning "koeffitsienti" ni baholash o'rtacha tanlamaga teng. Bu yerdan umumiy holat uchun yuqorida berilgan t-statistik ifodani olamiz.

Xuddi shunday, teng namunali dispersiyalarga ega bo'lgan ikkita namunali test ham chiziqli cheklovlarni sinovdan o'tkazishga qisqartirishini ko'rsatish mumkin. Ikki namunali testda bu qiymatga (0 yoki 1) qarab kichik namunani aniqlaydigan doimiy va qo'g'irchoq o'zgaruvchidagi "regressiya": y = a + b D (\displaystyle y=a+bD) . Namunalarning matematik taxminlarining tengligi haqidagi gipotezani ushbu modelning b koeffitsientining nolga tengligi haqidagi gipoteza sifatida shakllantirish mumkin. Ushbu gipotezani tekshirish uchun tegishli t-statistika ikki namunali test uchun berilgan t-statistikaga teng ekanligini ko'rsatish mumkin.

Turli dispersiyalarda chiziqli cheklovni tekshirish uchun ham qisqartirilishi mumkin. Bunday holda, model xatolik dispersiyasi ikkita qiymatni oladi. Bundan siz ikkita namunali test uchun berilganga o'xshash t-statistikani ham olishingiz mumkin.

Parametrik bo'lmagan analoglar

Mustaqil namunalar uchun ikkita namunali testning analogi Mann-Whitney U testidir. Bog'liq namunalar bilan bog'liq vaziyat uchun analoglar belgi testi va Wilcoxon T-testidir

Adabiyot

Talaba. O'rtachaning mumkin bo'lgan xatosi. // Biometrika. 1908 yil. No 6 (1). B. 1-25.

Havolalar

Novosibirsk davlat texnika universiteti veb-saytida vositalarning bir xilligi haqidagi farazlarni tekshirish mezonlari to'g'risida

Sinov natijalarini sharhlashda nol gipoteza to'g'ri deb taxmin qilish ekvivalent yondashuv bo'ladi, biz qanchalik katta ekanligini hisoblashimiz mumkin. ehtimollik olish t- mavjud namunaviy ma'lumotlardan biz hisoblagan haqiqiy qiymatga teng yoki undan katta mezon. Agar bu ehtimollik ilgari qabul qilingan ahamiyatlilik darajasidan past bo'lsa (masalan, P< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

Aytaylik, bizda 11 ayol uchun oziq-ovqatdan kunlik energiya iste'moli (kJ / kun) bo'yicha ma'lumotlar mavjud (misol kitobdan olingan). Altman D. G. (1981) Tibbiy tadqiqotlar uchun amaliy statistika, Chapman & Hall, London):


Ushbu 11 ta kuzatuv uchun o'rtacha:


Savol: Ushbu namunadagi o'rtacha ko'rsatkich belgilangan me'yordan 7725 kJ/kun farq qiladimi? Bizning namunaviy qiymatimiz va ushbu standart o'rtasidagi farq juda muhim: 7725 - 6753,6 = 971,4. Ammo bu farq statistik jihatdan qanchalik katta? Bitta namuna bu savolga javob berishga yordam beradi. t-test. Boshqa variantlar kabi t-test, t.test() funksiyasi yordamida R da bitta namunali t testi bajariladi:


Savol: Bu o'rtacha ko'rsatkichlar statistik jihatdan farq qiladimi? Foydalanishda farq yo'qligi haqidagi gipotezani tekshirib ko'raylik t-test:

Ammo bunday hollarda aralashuvdan ta'sir mavjudligini statistik jihatdan qanday baholashimiz mumkin? Umuman olganda, Studentning t-testi quyidagicha ifodalanishi mumkin

Sinov natijalarini sharhlashda nol gipoteza to'g'ri deb taxmin qilish ekvivalent yondashuv bo'ladi, biz qanchalik katta ekanligini hisoblashimiz mumkin. ehtimollik olish t- mavjud namunaviy ma'lumotlardan biz hisoblagan haqiqiy qiymatga teng yoki undan katta mezon. Agar bu ehtimollik ilgari qabul qilingan ahamiyatlilik darajasidan past bo'lsa (masalan, P< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

Aytaylik, bizda 11 ayol uchun oziq-ovqatdan kunlik energiya iste'moli (kJ / kun) bo'yicha ma'lumotlar mavjud (misol kitobdan olingan). Altman D. G. (1981) Tibbiy tadqiqotlar uchun amaliy statistika, Chapman & Hall, London):


Ushbu 11 ta kuzatuv uchun o'rtacha:


Savol: Ushbu namunadagi o'rtacha ko'rsatkich belgilangan me'yordan 7725 kJ/kun farq qiladimi? Bizning namunaviy qiymatimiz va ushbu standart o'rtasidagi farq juda muhim: 7725 - 6753,6 = 971,4. Ammo bu farq statistik jihatdan qanchalik katta? Bitta namuna bu savolga javob berishga yordam beradi. t-test. Boshqa variantlar kabi t-test, t.test() funksiyasi yordamida R da bitta namunali t testi bajariladi:


Savol: Bu o'rtacha ko'rsatkichlar statistik jihatdan farq qiladimi? Foydalanishda farq yo'qligi haqidagi gipotezani tekshirib ko'raylik t-test:

Ammo bunday hollarda aralashuvdan ta'sir mavjudligini statistik jihatdan qanday baholashimiz mumkin? Umuman olganda, Studentning t-testi quyidagicha ifodalanishi mumkin

Muharrir tanlovi
Hammamiz Robinzon Kruzo haqidagi hayajonli hikoyani bilamiz. Ammo uning nomi haqida kam odam o'yladi va bu erda biz prototip haqida gapirmayapmiz ...

Sunniylar islomdagi eng katta mazhab, shialar esa islomning ikkinchi yirik mazhabidir. Keling, ular nimaga rozi bo'lishlarini va nimada ekanligini aniqlaymiz ...

Bosqichma-bosqich ko'rsatmalarda biz 1C Buxgalteriya 8.3 da tayyor mahsulotlar va ular uchun xarajatlarni hisobga olish qanday amalga oshirilishini ko'rib chiqamiz. Oldin...

Odatda, bank ko'chirmalari bilan ishlash mijoz-bank tizimi orqali avtomatik ravishda sozlanadi, ammo mijoz-bank va 1C ni birlashtirish imkoniyati mavjud...
Jismoniy shaxslardan olinadigan daromad solig‘ini ushlab qolishning mumkin emasligi to‘g‘risida soliq organlariga ma’lumot taqdim etilishi munosabati bilan soliq agentining vazifasi tugatilganda,...
Ismi: Irina Saltykova Yoshi: 53 yosh Tug'ilgan joyi: Novomoskovsk, Rossiya Bo'yi: 159 sm Og'irligi: 51 kg Faoliyati:...
Disforiya - bu hissiy tartibga solishning buzilishi bo'lib, g'azablangan va g'amgin kayfiyat epizodlari bilan namoyon bo'ladi ...
Siz Toros odami bilan munosabatda bo'ldingiz, siz unga kuchli hamdardlik his qilasiz, lekin sevgi haqida gapirishga hali erta. Ko'pgina ayollar ...
Tarozi burji uchun toshlar (24-sentyabr - 23-oktabr) Tarozi burji adolatni, Femida shohligini (ikkinchi xotini...) ifodalaydi.