Tabelul punctelor critice de distribuție a elevilor. Coeficienții elevilor

Pe tot parcursul exemplului, vom folosi informații fictive pentru ca cititorul să poată face singur transformările necesare.

Deci, să spunem, în cursul cercetării, am studiat efectul medicamentului A asupra conținutului de substanță B (în mmol/g) în țesutul C și concentrația substanței D în sânge (în mmol/l) la pacienți. împărțit după un criteriu E în 3 grupe de volum egal (n = 10). Rezultatele unui astfel de studiu fictiv sunt prezentate în tabel:

Conținut de substanță B, mmol/g

Substanța D, mmol/l

creșterea concentrației


Dorim să vă avertizăm că luăm în considerare eșantioanele de dimensiunea 10 pentru ușurința prezentării datelor și a calculelor, în practică, o astfel de dimensiune a eșantionului nu este de obicei suficientă pentru a forma o concluzie statistică;

Ca exemplu, luați în considerare datele din prima coloană a tabelului.

Statistica descriptivă

Eșantion mediu

Media aritmetică, adesea numită pur și simplu „medie”, se obține prin adăugarea tuturor valorilor și împărțirea acelei sume la numărul de valori din mulțime. Acest lucru poate fi arătat folosind o formulă algebrică. Un set de n observații ale unei variabile x poate fi reprezentat ca x 1 , x 2 , x 3 , ..., x n

Formula pentru determinarea mediei aritmetice a observațiilor (pronunțată „X cu o linie”):

= (X 1 + X 2 + ... + X n) / n

= (12 + 13 + 14 + 15 + 14 + 13 + 13 + 10 + 11 + 16) / 10 = 13,1;

Varianta eșantionului

O modalitate de a măsura dispersia datelor este de a determina gradul în care fiecare observație se abate de la media aritmetică. Evident, cu cât abaterea este mai mare, cu atât variabilitatea, variabilitatea observațiilor este mai mare. Cu toate acestea, nu putem folosi media acestor abateri ca măsură de dispersie, deoarece abaterile pozitive compensează abaterile negative (suma lor este zero). Pentru a rezolva această problemă, pătratăm fiecare abatere și găsim media abaterilor pătrate; această cantitate se numește variație sau dispersie. Să luăm n observații x 1, x 2, x 3, ..., x n, medie care este egal cu. Calcularea varianței aceasta, denumită de obicei cas2,aceste observatii:

Varianța eșantionului acestui indicator este s 2 = 3,2.

Abaterea standard

Abaterea standard (medie pătratică) este pozitivă rădăcină pătrată din dispersie. Folosind n observații ca exemplu, arată astfel:

Ne putem gândi la abaterea standard ca la un fel de abatere medie a observațiilor de la medie. Se calculează în aceleași unități (dimensiuni) ca și datele originale.

s = sqrt (s 2) = sqrt (3,2) = 1,79.

Coeficientul de variație

Dacă împărțiți abaterea standard la media aritmetică și exprimați rezultatul ca procent, obțineți coeficientul de variație.

CV = (1,79 / 13,1) * 100% = 13,7

Eroare medie eșantion

1,79/sqrt(10) = 0,57;

Coeficientul t al studentului (testul t pentru un eșantion)

Folosit pentru a testa ipoteza despre diferența dintre valoarea medie și o valoare cunoscută m

Numărul de grade de libertate se calculează ca f=n-1.

ÎN în acest caz, intervalul de încredere pentru medie se află între limitele 11,87 și 14,39.

Pentru nivelul de încredere de 95% m=11,87 sau m=14,39, adică= |13,1-11,82| = |13,1-14,38| = 1,28

În consecință, în acest caz, pentru numărul de grade de libertate f = 10 - 1 = 9 și nivelul de încredere de 95% t = 2,26.

Dialog Statistici de bază și tabele

În modul Statistici de bază și tabele hai sa alegem Statistica descriptivă.

Se va deschide o casetă de dialog Statistica descriptivă.

În câmp Variabile hai sa alegem Grupa 1.

Dând clic pe Bine, obținem tabele de rezultate cu statistici descriptive ale variabilelor selectate.

Se va deschide o casetă de dialog Testul t cu un eșantion.

Să presupunem că știm că conținutul mediu de substanță B în țesutul C este 11.

Tabelul de rezultate cu statistici descriptive și testul t Student este următorul:

A trebuit să respingem ipoteza că conținutul mediu de substanță B în țesutul C este 11.

Deoarece valoarea calculată a criteriului este mai mare decât valoarea tabelată (2.26), ipoteza nulă este respinsă la nivelul de semnificație selectat, iar diferențele dintre eșantion și valoarea cunoscută sunt considerate semnificative statistic. Astfel, concluzia despre existența diferențelor făcute cu ajutorul testului Student este confirmată prin această metodă.

Metoda vă permite să testați ipoteza că valorile medii a două populații generale din care sunt extrase cele comparate dependente selecțiile diferă unele de altele. Presupunerea dependenței înseamnă cel mai adesea că trăsătura este măsurată pe același eșantion de două ori, de exemplu, înainte de intervenție și după aceasta. În cazul general, fiecărui reprezentant al unui eșantion i se atribuie un reprezentant dintr-un alt eșantion (sunt combinați în perechi), astfel încât cele două serii de date să fie corelate pozitiv între ele. Tipuri mai slabe de dependență de eșantion: eșantionul 1 - soți, proba 2 - soțiile lor; proba 1 - copii de un an, proba 2 este formata din gemeni de copii din proba 1 etc.

Ipoteza statistica testabila, ca și în cazul precedent, H 0: M1 = M2(valorile medii din probele 1 și 2 sunt egale). Dacă este respinsă, se acceptă ipoteza alternativă că M 1 mai mult (mai putin) M 2.

Ipotezele inițiale pentru testarea statistica:

Fiecare reprezentant al unui eșantion (dintr-o populație generală) este asociat cu un reprezentant al altui eșantion (din altă populație generală);

Datele din cele două probe sunt corelate pozitiv (form perechi);

Distribuția caracteristicii studiate în ambele eșantioane corespunde legii normale.

Structura datelor sursă: există două valori ale caracteristicii studiate pentru fiecare obiect (pentru fiecare pereche).

Restrictii: distribuția caracteristicii în ambele probe nu trebuie să difere semnificativ de normal; datele a două măsurători corespunzătoare uneia și celeilalte probe sunt corelate pozitiv.

Alternative: testul Wilcoxon T, dacă distribuția pentru cel puțin o probă diferă semnificativ de normal; t-Test Student pentru probe independente - dacă datele pentru două probe nu se corelează pozitiv.

Formula căci valoarea empirică a testului t Student reflectă faptul că unitatea de analiză pentru diferenţe este diferenta (schimbarea) atribuiți valori pentru fiecare pereche de observații. În consecință, pentru fiecare dintre cele N perechi de valori de atribut, diferența este mai întâi calculată d i = x 1 i - x 2 i.

unde M d este diferența medie de valori; σ d - abaterea standard a diferenţelor.

Exemplu de calcul:

Să presupunem că, în timpul unui test de eficacitate a instruirii, fiecăruia dintre cei 8 membri ai grupului i s-a pus întrebarea „Cât de des coincide opinia dumneavoastră cu opinia grupului?” - de două ori, înainte și după antrenament. Pentru răspunsuri a fost utilizată o scală de 10 puncte: 1 - niciodată, 5 - jumătate din timp, 10 - întotdeauna. S-a testat ipoteza conform căreia în urma antrenamentului ar crește stima de sine a conformității (dorința de a fi ca ceilalți din grup) a participanților (α = 0,05). Să creăm un tabel pentru calcule intermediare (Tabelul 3).


Tabelul 3

Media aritmetică a diferenței M d = (-6)/8 = -0,75. Scădeți această valoare din fiecare d (penultima coloană a tabelului).

Formula pentru abaterea standard diferă doar prin aceea că d apare în ea în loc de X. Inlocuim toate valorile necesare, obtinem:

σ d = = 0,886.

Pasul 1. Calculați valoarea empirică a criteriului folosind formula (3): diferența medie Md= -0,75; abaterea standard σ d = 0,886; t e = 2,39; df = 7.

Pasul 2. Folosind tabelul de valori critice ale criteriului t-Student, determinăm nivelul p de semnificație. Pentru df = 7 valoarea empirică este între valorile critice pentru r= 0,05 și p — 0,01. Prin urmare, r< 0,05.

df R
0,05 0,01 0,001
2,365 3,499 5,408

Pasul 3. Luăm o decizie statistică și formulăm o concluzie. Ipoteza statistică a egalității valorilor medii este respinsă. Concluzie: indicatorul de autoevaluare a conformității participanților după antrenament a crescut semnificativ statistic (la nivel de semnificație p< 0,05).

Metodele parametrice includ compararea varianţelor a două eşantioane conform criteriului F-Fisher. Uneori, această metodă conduce la concluzii valoroase și semnificative, iar în cazul comparării mediilor pentru eșantioane independente, compararea variațiilor este obligatoriu procedură.

Pentru a calcula F em trebuie să găsiți raportul dintre variațiile celor două eșantioane și astfel încât varianța mai mare să fie în numărător, iar cea mai mică să fie în numitor.

Comparația de variații. Metoda vă permite să testați ipoteza că variațiile celor două populații generale din care sunt extrase eșantioanele comparate diferă între ele. Ipoteza statistică testată H 0: σ 1 2 = σ 2 2 (varianța din eșantionul 1 este egală cu varianța din eșantionul 2). Dacă este respinsă, se acceptă ipoteza alternativă că o varianță este mai mare decât cealaltă.

Ipotezele inițiale: două eșantioane sunt extrase aleatoriu din populații diferite cu o distribuție normală a caracteristicii studiate.

Structura datelor sursă: caracteristica studiată se măsoară în obiecte (subiecți), fiecare aparținând unuia dintre cele două eșantioane fiind comparate.

Restrictii: distribuțiile trăsăturii în ambele eșantioane nu diferă semnificativ de cele normale.

Metoda alternativa: Testul lui Levene, a cărui utilizare nu necesită verificarea ipotezei de normalitate (utilizat în programul SPSS).

Formula pentru valoarea empirică a testului F Fisher:

(4)

unde σ 1 2 dispersie mare, iar σ 2 2 - dispersie mai mică. Deoarece nu se știe în prealabil care dispersie este mai mare, atunci pentru a determina nivelul p se folosește Tabelul valorilor critice pentru alternativele nedirecționale. Dacă F e > F Kp pentru numărul corespunzător de grade de libertate, atunci r< 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Exemplu de calcul:

Copiilor li s-au dat probleme regulate de aritmetică, după care unei jumătăți alese aleatoriu dintre elevi li s-a spus că au picat testul, iar celorlalți li s-a spus contrariul. Fiecare copil a fost întrebat apoi câte secunde i-ar lua pentru a rezolva o problemă similară. Experimentatorul a calculat diferența dintre timpul în care copilul a sunat și rezultatul sarcinii finalizate (în secunde). Era de așteptat ca mesajul eșecului să provoace o anumită inadecvare a stimei de sine a copilului. Ipoteza testată (la nivelul α = 0,005) a fost că varianța stimei de sine agregate nu depinde de rapoartele de succes sau eșec (H 0: σ 1 2 = σ 2 2).

S-au obtinut urmatoarele date:

Pasul 1. Calculați valoarea empirică a criteriului și numărul de grade de libertate folosind formulele (4):

Pasul 2. Conform tabelului cu valorile critice ale criteriului Fisher f pentru nedirectional alternative pentru care găsim valoarea critică numărul df= 11; df stiu= 11. Cu toate acestea, există o valoare critică numai pentru numărul df= 10 și df stiu = 12. Nu se poate lua un număr mai mare de grade de libertate, deci luăm valoarea critică pentru numărul df= 10: Pentru r= 0,05 F Kp = 3,526; Pentru r= 0,01 F Kp = 5,418.

Pasul 3. Luarea unei decizii statistice și concluzie semnificativă. Deoarece valoarea empirică depăşeşte valoarea critică pentru r= 0,01 (și chiar mai mult pentru p = 0,05), atunci în acest caz p< 0,01 и принимается альтернативная гипо-теза: дисперсия в группе 1 превышает дисперсию в группе 2 (pag< 0,01). În consecință, după un mesaj despre eșec, insuficiența stimei de sine este mai mare decât după un mesaj despre succes.

Tabel de repartizare a elevilor

Tabelele integrale de probabilitate sunt utilizate pentru eșantioane mari dintr-o populație infinit de mare. Dar deja la (n)< 100 получается Несоответствие между

date tabelare și probabilitate limită; la (n)< 30 погрешность становится значительной. Несоответствие вызывается главным образом характером распределения единиц генеральной совокупности. При volum mare caracteristica de distribuție a probei în gene

populația generală nu contează, deoarece distribuția abaterilor indicatorului eșantionului de la caracteristica generală cu un eșantion mare se dovedește întotdeauna a fi normală.

nom. În eșantioane mici (n)< 30 характер распределения генеральной совокупности сказывается на распределении ошибок выборки. Поэтому для расчета ошибки выборки при небольшом объеме наблюдения (уже менее 100 единиц) отбор должен проводиться из со-

populație având o distribuție normală. Teoria eșantioanelor mici a fost dezvoltată de statisticianul englez W. Gosset (care a scris sub pseudonimul Student) la începutul secolului al XX-lea. ÎN

În 1908, el a construit o distribuție specială care permite, chiar și cu eșantioane mici, să se coreleze (t) și probabilitatea de încredere F(t). Pentru (n) > 100, tabelele de distribuție Student dau aceleași rezultate ca tabelele integrale de probabilitate Laplace pentru 30< (n ) <

100 de diferențe sunt neglijabile. Prin urmare, eșantioanele practic mici includ mostre cu un volum mai mic de 30 de unități (desigur, o probă cu un volum mai mare de 100 de unități este considerată mare).

Utilizarea de eșantioane mici în unele cazuri se datorează naturii populației care face obiectul anchetei. Astfel, în munca de reproducere, experiența „pură” este mai ușor de realizat cu un număr mic

parcele. Experimentul de producție și economic legat de costurile economice se desfășoară și pe un număr mic de încercări. După cum sa menționat deja, în cazul unui eșantion mic, atât probabilitățile de încredere, cât și limitele de încredere ale mediei generale pot fi calculate numai pentru o populație distribuită normal.

Densitatea de probabilitate a distribuției Student este descrisă de funcție.

1 + t2

f (t,n) := Bn

n - 1

t - variabila curentă n - dimensiunea eșantionului;

B este o mărime care depinde numai de (n).

Distribuția Student are un singur parametru: (d.f.) - numărul de grade de libertate (notat uneori (k)). Această distribuție, ca și cea normală, este simetrică față de punctul (t) = 0, dar este mai plată. Pe măsură ce dimensiunea eșantionului crește și, în consecință, numărul de grade de libertate, distribuția Student se apropie rapid de normal. Numărul de grade de libertate este egal cu numărul acelor valori individuale ale caracteristicilor care trebuie distribuite

presupune pentru a determina caracteristica dorită. Astfel, pentru a calcula varianța, trebuie cunoscută valoarea medie. Prin urmare, atunci când calculați varianța, utilizați (d.f.) = n - 1.

Tabelele de distribuție pentru studenți sunt publicate în două versiuni:

1. în mod similar cu tabelele cu integrale de probabilitate, valorile ( t ) și corespunzătoare

probabilitățile curente F(t) pentru diferite numere de grade de libertate;

2. valorile (t) sunt date pentru probabilitățile de încredere cele mai frecvent utilizate

0,70; 0,75; 0,80; 0,85; 0,90; 0,95 și 0,99 sau pentru 1 - 0,70 = 0,3; 1 - 0,80 = 0,2; …… 1 - 0,99 = 0,01.

3. la un număr diferit de grade de libertate. Acest tip de tabel este prezentat în anexă

(Tabelul 1 - 20), precum și valoarea (t) - testul Student la un nivel de semnificație de 0,7

Metoda vă permite să testați ipoteza că valorile medii a două populații generale din care sunt extrase cele comparate dependente probele diferă unele de altele. Presupunerea dependenței înseamnă cel mai adesea că trăsătura este măsurată pe același eșantion de două ori, de exemplu, înainte de intervenție și după aceasta. În cazul general, fiecărui reprezentant al unui eșantion i se atribuie un reprezentant dintr-un alt eșantion (sunt combinați în perechi), astfel încât cele două serii de date să fie corelate pozitiv între ele. Tipuri mai slabe de dependență de eșantion: eșantionul 1 - soți, proba 2 - soțiile lor; proba 1 - copii de un an, proba 2 este formata din gemeni de copii din proba 1 etc.

Ipoteza statistica testabila, ca și în cazul precedent, H 0: M1 = M2(valorile medii din probele 1 și 2 sunt egale dacă este respinsă, se acceptă ipoteza alternativă). M 1 mai mult (mai putin) M 2.

Ipotezele inițiale pentru testarea statistica:

□ fiecare reprezentant al unui eșantion (dintr-o populație generală) este asociat cu un reprezentant al altui eșantion (din altă populație generală);

□ datele din două probe sunt corelate pozitiv (form perechi);

□ distribuţia caracteristicii studiate în ambele eşantioane corespunde legii normale.

Structura datelor sursă: există două valori ale caracteristicii studiate pentru fiecare obiect (pentru fiecare pereche).

Restrictii: distribuția caracteristicii în ambele probe nu trebuie să difere semnificativ de normal; datele celor două măsurători corespunzătoare ambelor probe sunt corelate pozitiv.

Alternative: testul Wilcoxon T, dacă distribuția pentru cel puțin o probă diferă semnificativ de normal; t-Test Student pentru probe independente - dacă datele pentru cele două probe nu sunt corelate pozitiv.

Formula căci valoarea empirică a testului t Student reflectă faptul că unitatea de analiză pentru diferenţe este diferenta (schimbarea) valori caracteristice pentru fiecare pereche de observații. În consecință, pentru fiecare dintre cele N perechi de valori de atribut, diferența este mai întâi calculată d i = x 1 i - x 2 i.

(3) unde M d – diferența medie de valori; σ d – abaterea standard a diferenţelor.

Exemplu de calcul:

Să presupunem că, în timpul testării eficienței instruirii, fiecăruia dintre cei 8 membri ai grupului i s-a adresat întrebarea „Cât de des coincid opiniile dumneavoastră cu opiniile grupului?” - de două ori, înainte și după antrenament. Pentru răspunsuri a fost utilizată o scală de 10 puncte: 1 - niciodată, 5 - jumătate din timp, 10 - întotdeauna. S-a testat ipoteza conform căreia în urma antrenamentului ar crește stima de sine a conformității (dorința de a fi ca ceilalți din grup) a participanților (α = 0,05). Să creăm un tabel pentru calcule intermediare (Tabelul 3).

Tabelul 3

Media aritmetică pentru diferența M d = (-6)/8= -0,75. Scădeți această valoare din fiecare d (penultima coloană a tabelului).

Formula pentru abaterea standard diferă doar prin aceea că d apare în ea în loc de X. Înlocuim toate valorile necesare și obținem

σ d = = 0,886.

Pasul 1. Calculați valoarea empirică a criteriului folosind formula (3): diferența medie Md= -0,75; abaterea standard σ d = 0,886; t e = 2,39; df = 7.

Pasul 2. Folosind tabelul de valori critice ale criteriului t-Student, determinăm nivelul p de semnificație. Pentru df = 7, valoarea empirică este între valorile critice pentru p = 0,05 și p - 0,01. Prin urmare, p< 0,05.

df R
0,05 0,01 0,001
2,365 3,499 5,408

Pasul 3. Luăm o decizie statistică și formulăm o concluzie. Ipoteza statistică a egalității de mijloace este respinsă. Concluzie: autoevaluarea conformității participanților după antrenament a crescut semnificativ statistic (la nivel de semnificație p< 0,05).

Metodele parametrice includ compararea varianţelor a două eşantioane conform criteriului F-Fisher. Uneori, această metodă conduce la concluzii valoroase și semnificative, iar în cazul comparării mediilor pentru eșantioane independente, compararea variațiilor este obligatoriu procedură.

Pentru a calcula F em trebuie să găsiți raportul dintre variațiile celor două eșantioane și astfel încât varianța mai mare să fie în numărător, iar cea mai mică să fie în numitor.

Comparația de variații. Metoda vă permite să testați ipoteza că varianțele celor două populații din care sunt extrase eșantioanele comparate diferă unele de altele. Ipoteza statistică testată H 0: σ 1 2 = σ 2 2 (varianța din eșantionul 1 este egală cu varianța din eșantionul 2). Dacă este respinsă, se acceptă ipoteza alternativă că o varianță este mai mare decât cealaltă.

Ipotezele inițiale: două eșantioane sunt extrase aleatoriu din populații diferite cu o distribuție normală a trăsăturii studiate.

Structura datelor sursă: caracteristica studiată se măsoară în obiecte (subiecți), fiecare aparținând unuia dintre cele două eșantioane fiind comparate.

Restrictii: distribuțiile trăsăturii în ambele eșantioane nu diferă semnificativ de cele normale.

Metoda alternativa: Testul lui Levene, a cărui utilizare nu necesită verificarea ipotezei de normalitate (utilizat în programul SPSS).

Formula pentru valoarea empirică a testului F Fisher:

(4)

unde σ 1 2 - dispersie mare, iar σ 2 2 - dispersie mai mică. Deoarece nu se știe în prealabil care dispersie este mai mare, atunci pentru a determina nivelul p se folosește Tabelul valorilor critice pentru alternativele nedirecționale. Dacă F e > F Kp pentru numărul corespunzător de grade de libertate, atunci r < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Exemplu de calcul:

Copiilor li s-au dat probleme regulate de aritmetică, după care unei jumătăți alese aleatoriu dintre elevi li s-a spus că au picat testul, iar celorlalți li s-a spus contrariul. Fiecare copil a fost întrebat apoi câte secunde i-ar lua pentru a rezolva o problemă similară. Experimentatorul a calculat diferența dintre timpul în care copilul a sunat și rezultatul sarcinii finalizate (în secunde). Era de așteptat ca mesajul eșecului să provoace o anumită inadecvare a stimei de sine a copilului. Ipoteza testată (la nivelul α = 0,005) a fost că varianța stimei de sine agregate nu depinde de rapoartele de succes sau eșec (H 0: σ 1 2 = σ 2 2).

S-au obtinut urmatoarele date:


Pasul 1. Calculați valoarea empirică a criteriului și numărul de grade de libertate folosind formulele (4):

Pasul 2. Conform tabelului cu valorile critice ale criteriului Fisher f pentru nedirecţionată alternative pentru care găsim valoarea critică numărul df = 11; df stiu= 11. Cu toate acestea, există o valoare critică numai pentru numărul df= 10 și df stiu = 12. Este imposibil să luăm un număr mai mare de grade de libertate, așa că luăm valoarea critică pentru numărul df= 10: Pentru r = 0,05 F Kp = 3,526; Pentru r = 0,01 F Kp = 5,418.

Pasul 3. Luarea unei decizii statistice și concluzie semnificativă. Deoarece valoarea empirică depăşeşte valoarea critică pentru r= 0,01 (și chiar mai mult pentru p = 0,05), atunci în acest caz p< 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (pag< 0,01). În consecință, după un mesaj despre eșec, insuficiența stimei de sine este mai mare decât după un mesaj despre succes.

/ statistici practice / materiale de referință / valori ale testului t student

Senst -Testul studentului t la niveluri de semnificație de 0,10, 0,05 și 0,01

ν – grade de libertate de variație

Valorile testului t Standard Student

Numărul de grade de libertate

Niveluri de semnificație

Numărul de grade de libertate

Niveluri de semnificație

Masă XI

Valorile testului Fisher standard utilizate pentru a evalua semnificația diferențelor dintre două eșantioane

Grade de libertate

Nivel de semnificație

Grade de libertate

Nivel de semnificație

Testul t al elevului

Testul t al elevului- o denumire generală pentru o clasă de metode de testare statistică a ipotezelor (teste statistice) bazate pe distribuția Student. Cele mai frecvente utilizări ale testului t implică testarea egalității mediilor în două eșantioane.

t-statistica se construiește de obicei după următorul principiu general: numărătorul este o variabilă aleatoare cu așteptare matematică zero (dacă este îndeplinită ipoteza nulă), iar numitorul este abaterea standard eșantională a acestei variabile aleatoare, obținută ca rădăcină pătrată a estimarea varianței nemixte.

Poveste

Acest criteriu a fost dezvoltat de William Gossett pentru a evalua calitatea berii la compania Guinness. În legătură cu obligațiile față de companie privind nedezvăluirea secretelor comerciale (conducerea Guinness a considerat ca atare utilizarea aparatului statistic în activitatea sa), articolul lui Gosset a fost publicat în 1908 în revista Biometrics sub pseudonimul „Student”.

Cerințe de date

Pentru a aplica acest criteriu, este necesar ca datele originale să aibă o distribuție normală. În cazul aplicării unui test cu două eșantioane pentru probe independente, este, de asemenea, necesar să se respecte condiția de egalitate a variațiilor. Există, totuși, alternative la testul t Student pentru situații cu varianțe inegale.

Cerința distribuției normale a datelor este necesară pentru un test t (\displaystyle t) precis. Cu toate acestea, chiar și cu alte distribuții de date, este posibil să se utilizeze t (\displaystyle t) -statistici. În multe cazuri, această statistică are în mod asimptotic o distribuție normală standard - N (0, 1) (\displaystyle N(0,1)) , astfel încât cuantilele acestei distribuții pot fi utilizate. Cu toate acestea, chiar și în acest caz, adesea cuantilele sunt utilizate nu ale distribuției normale standard, ci ale distribuției Student corespunzătoare, ca în testul exact t (\displaystyle t). Ele sunt echivalente asimptotic, dar în eșantioane mici intervalele de încredere ale distribuției Student sunt mai largi și mai fiabile.

Testul t cu un eșantion

Folosit pentru a testa ipoteza nulă H 0: E (X) = m (\displaystyle H_(0):E(X)=m) despre egalitatea așteptărilor matematice E (X) (\displaystyle E(X)) la o valoare cunoscută m ( \displaystyle m) .

Evident, dacă ipoteza nulă este îndeplinită, E (X ¯) = m (\displaystyle E((\overline (X)))=m) . Luând în considerare independența presupusă a observațiilor, V (X ¯) = σ 2 / n (\displaystyle V((\overline (X)))=\sigma ^(2)/n) . Folosind o estimare imparțială a varianței s X 2 = ∑ t = 1 n (X t − X ¯) 2 / (n − 1) (\displaystyle s_(X)^(2)=\sum _(t=1)^( n )(X_(t)-(\overline (X)))^(2)/(n-1)) obținem următoarele t-statistici:

t = X ¯ - m s X / n (\displaystyle t=(\frac ((\overline (X))-m)(s_(X)/(\sqrt (n)))))

În ipoteza nulă, distribuția acestei statistici este t (n − 1) (\displaystyle t(n-1)) . În consecință, dacă valoarea absolută a statisticilor depășește valoarea critică a unei distribuții date (la un nivel de semnificație dat), ipoteza nulă este respinsă.

Test t cu două eșantioane pentru probe independente

Să existe două eșantioane independente de volume n 1, n 2 (\displaystyle n_(1)~,~n_(2)) de variabile aleatoare distribuite normal X 1, X 2 (\displaystyle X_(1),~X_(2) )). Este necesar să se testeze ipoteza nulă de egalitate a așteptărilor matematice ale acestor variabile aleatoare H 0: M 1 = M 2 (\displaystyle H_(0):~M_(1)=M_(2)) folosind date eșantion.

Luați în considerare diferența dintre mediile eșantionului Δ = X ¯ 1 − X ¯ 2 (\displaystyle \Delta =(\overline (X))_(1)-(\overline (X))_(2)) . Evident, dacă ipoteza nulă este adevărată E (Δ) = M 1 − M 2 = 0 (\displaystyle E(\Delta)=M_(1)-M_(2)=0) . Varianța acestei diferențe este egală, pe baza independenței eșantioanelor: V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 (\displaystyle V(\Delta)=(\frac (\sigma _(1) )^(2))( n_(1)))+(\frac (\sigma _(2)^(2))(n_(2)))) . Apoi, folosind estimarea varianței imparțiale s 2 = ∑ t = 1 n (X t − X ¯) 2 n − 1 (\displaystyle s^(2)=(\frac (\sum _(t=1)^(n)) ( X_(t)-(\overline (X)))^(2))(n-1))) obținem o estimare imparțială a varianței diferenței dintre mediile eșantionului: s Δ 2 = s 1 2 n 1 + s 2 2 n 2 (\ displaystyle s_(\Delta )^(2)=(\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^( 2))(n_(2) ))) . Prin urmare, statistica t pentru testarea ipotezei nule este

T = X ¯ 1 − X ¯ 2 s 1 2 n 1 + s 2 2 n 2 (\displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_( 2))(\sqrt ((\frac (s_(1))^(2))(n_(1))))+(\frac (s_(2)^(2))(n_(2))))) ))

Dacă ipoteza nulă este adevărată, această statistică are o distribuție t (d f) (\displaystyle t(df)), unde d f = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n 1) 2 / (n 1 - 1) + (s 2 2 / n 2) 2 / (n 2 - 1) (\displaystyle df=(\frac ((s_(1)^(2))/n_(1)) +s_(2 )^(2)/n_(2))^(2))((s_(1)^(2)/n_(1))^(2)/(n_(1)-1)+ (s_(2)^(2)/n_(2))^(2)/(n_(2)-1))))

Cazul de varianță egală

Dacă se presupune că varianțele eșantioanelor sunt egale, atunci

V (Δ) = σ 2 (1 n 1 + 1 n 2) (\displaystyle V(\Delta)=\sigma ^(2)\left((\frac (1)(n_(1)))+(\ frac (1)(n_(2)))\dreapta))

Atunci statistica t este:

T = X ¯ 1 − X ¯ 2 s X 1 n 1 + 1 n 2 , s X = (n 1 − 1) s 1 2 + (n 2 − 1) s 2 2 n 1 + n 2 − 2 (\ stilul de afișare t=(\frac ((\overline (X))_(1)-(\overline (X))_(2))(s_(X)(\sqrt ((\frac (1)(n_(1) )))+(\frac (1)(n_(2))))))~,~~s_(X)=(\sqrt (\frac ((n_(1)-1)s_(1)^ ( 2)+(n_(2)-1)s_(2)^(2))(n_(1)+n_(2)-2))))

Această statistică are distribuția t (n 1 + n 2 − 2) (\displaystyle t(n_(1)+n_(2)-2))

Test t cu două eșantioane pentru probe dependente

Pentru a calcula valoarea empirică a criteriului t (\displaystyle t) în situația testării unei ipoteze despre diferențele dintre două eșantioane dependente (de exemplu, două eșantioane ale aceluiași test cu un interval de timp), se utilizează următoarea formulă:

T = M re s d / n (\displaystyle t=(\frac (M_(d)))(s_(d)/(\sqrt (n)))))

unde M d (\displaystyle M_(d)) este diferența medie a valorilor, s d (\displaystyle s_(d)) este abaterea standard a diferențelor și n este numărul de observații

Această statistică are o distribuție t (n − 1) (\displaystyle t(n-1)) .

Testarea unei constrângeri liniare asupra parametrilor de regresie liniară

Testul t poate testa, de asemenea, o constrângere liniară arbitrară (unică) asupra parametrilor unei regresii liniare estimate prin cele mai mici pătrate obișnuite. Să fie necesară testarea ipotezei H 0: c T b = a (\displaystyle H_(0):c^(T)b=a) . Evident, dacă ipoteza nulă este îndeplinită, E (c T b ^ − a) = c T E (b ^) − a = 0 (\displaystyle E(c^(T)(\hat (b))-a)= c^( T)E((\hat (b)))-a=0) . Aici folosim proprietatea estimărilor nepărtinitoare ale celor mai mici pătrate ale parametrilor modelului E (b ^) = b (\displaystyle E((\hat (b)))=b) . În plus, V (c T b ^ - a) = c T V (b ^) c = σ 2 c T (X T X) - 1 c (\displaystyle V(c^(T)(\hat (b))-a )=c^(T)V((\hat (b)))c=\sigma ^(2)c^(T)(X^(T)X)^(-1)c) . Folosind în loc de varianța necunoscută estimarea sa imparțială s 2 = E S S / (n − k) (\displaystyle s^(2)=ESS/(n-k)) obținem următoarele t-statistici:

T = c T b ^ - a s c T (X T X) - 1 c (\displaystyle t=(\frac (c^(T))(\hat (b))-a)(s(\sqrt (c^(T)) (X^(T)X)^(-1)c)))))

Această statistică, atunci când ipoteza nulă este satisfăcută, are o distribuție t (n − k) (\displaystyle t(n-k)) , deci dacă valoarea statistică este mai mare decât valoarea critică, atunci ipoteza nulă a unei constrângeri liniare este respinsă .

Testarea ipotezelor despre coeficientul de regresie liniară

Un caz special al unei constrângeri liniare este testarea ipotezei că coeficientul de regresie b j (\displaystyle b_(j)) este egal cu o anumită valoare a (\displaystyle a) . În acest caz, statistica t corespunzătoare este:

T = b ^ j - a s b ^ j (\displaystyle t=(\frac ((\hat (b))_(j)-a)(s_((\hat (b))_(j)))))

unde s b ^ j (\displaystyle s_((\hat (b))_(j))) este eroarea standard a estimării coeficientului - rădăcina pătrată a elementului diagonal corespunzător al matricei de covarianță a estimărilor coeficientului.

Dacă ipoteza nulă este adevărată, distribuția acestei statistici este t (n − k) (\displaystyle t(n-k)) . Dacă valoarea absolută a statisticii este mai mare decât valoarea critică, atunci diferența dintre coeficient și a (\displaystyle a) este semnificativă din punct de vedere statistic (nealeatoriu), în caz contrar este nesemnificativă (aleatorie, adică coeficientul adevărat este probabil egală sau foarte apropiată de valoarea estimată a a (\ stilul de afișare a))

Comentariu

Un test cu un eșantion pentru așteptările matematice poate fi redus la testarea unei constrângeri liniare asupra parametrilor unei regresii liniare. Într-un test cu un singur eșantion, aceasta este o „regresie” pe o constantă. Prin urmare, s 2 (\displaystyle s^(2)) de regresie este un eșantion de estimare a varianței variabilei aleatoare studiate, matricea X T X (\displaystyle X^(T)X) este egală cu n (\displaystyle n ) , iar estimarea „coeficientului” modelului este egală cu media eșantionului. De aici obținem expresia pentru statistica t dată mai sus pentru cazul general.

În mod similar, se poate demonstra că un test cu două eșantioane cu variații egale de eșantion se reduce, de asemenea, la testarea constrângerilor liniare. Într-un test cu două eșantioane, aceasta este o „regresie” pe o constantă și o variabilă inactivă care identifică subeșantionul în funcție de valoarea (0 sau 1): y = a + b D (\displaystyle y=a+bD) . Ipoteza despre egalitatea așteptărilor matematice ale eșantioanelor poate fi formulată ca o ipoteză despre egalitatea coeficientului b al acestui model la zero. Se poate demonstra că statistica t adecvată pentru testarea acestei ipoteze este egală cu statistica t dată pentru testul cu două eșantioane.

De asemenea, se poate reduce la verificarea constrângerii liniare în cazul diferitelor dispersii. În acest caz, varianța erorii de model ia două valori. Din aceasta puteți obține și o statistică t similară cu cea dată pentru testul cu două eșantioane.

Analogi neparametrici

Un analog al testului cu două eșantioane pentru probe independente este testul Mann-Whitney U. Pentru situația cu probe dependente, analogii sunt testul semnului și testul T Wilcoxon

Literatură

Student. Eroarea probabilă a unei medii. // Biometrica. 1908. Nr. 6 (1). P. 1-25.

Legături

Cu privire la criteriile de testare a ipotezelor despre omogenitatea mijloacelor pe site-ul web al Universității Tehnice de Stat din Novosibirsk

Testul t al lui Student este un nume general pentru o clasă de metode de testare statistică a ipotezelor (teste statistice) bazate pe distribuția Student. Cele mai frecvente utilizări ale testului t implică testarea egalității mediilor în două eșantioane.

1. Istoricul dezvoltării testului t

Acest criteriu a fost elaborat William Gossett pentru a evalua calitatea berii în compania Guinness. Din cauza obligațiilor față de companie privind nedezvăluirea secretelor comerciale, articolul lui Gosset a fost publicat în 1908 în revista Biometrics sub pseudonimul „Student”.

2. Pentru ce este folosit testul t Student?

Testul t al lui Student este utilizat pentru a determina semnificația statistică a diferențelor de medii. Poate fi utilizat atât în ​​cazuri de comparare a probelor independente ( de exemplu, grupuri de diabetici și grupuri sănătoase), și la compararea populațiilor înrudite ( de exemplu, frecvența cardiacă medie la aceiași pacienți înainte și după administrarea unui medicament antiaritmic).

3. În ce cazuri poate fi folosit testul t al Studentului?

Pentru a aplica testul t Student, este necesar ca datele originale să aibă distributie normala. În cazul aplicării unui criteriu de două eșantioane pentru probe independente, este, de asemenea, necesară îndeplinirea condiției egalitatea (homoscedasticitatea) varianţelor.

Dacă aceste condiții nu sunt îndeplinite, ar trebui utilizate metode similare atunci când se compară mediile eșantionului. statistici neparametrice, printre care cele mai cunoscute sunt Testul U Mann-Whitney(ca test cu două eșantioane pentru probe independente) și criteriul semnuluiŞi testul Wilcoxon(utilizat în cazul probelor dependente).

4. Cum se calculează testul t al lui Student?

Pentru a compara valorile medii, testul t al lui Student este calculat folosind următoarea formulă:

Unde M 1- media aritmetică a primei populații (grup) comparate; M 2- media aritmetică a celei de-a doua populații (grup) comparate; m 1- eroarea medie a primei medii aritmetice, m 2- eroarea medie a celei de-a doua medii aritmetice.

5. Cum se interpretează valoarea testului t a Studentului?

Valoarea testului t Student rezultată trebuie interpretată corect. Pentru a face acest lucru, trebuie să cunoaștem numărul de subiecți din fiecare grupă (n 1 și n 2). Aflarea numărului de grade de libertate f după următoarea formulă:

f = (n 1 + n 2) - 2

După aceasta, determinăm valoarea critică a testului t Student pentru nivelul necesar de semnificație (de exemplu, p = 0,05) și pentru un număr dat de grade de libertate f conform tabelului ( vezi mai jos).

Comparăm valorile critice și calculate ale criteriului:

  • Dacă valoarea calculată a testului t Student egală sau mai mare critice, constatate din tabel, concluzionăm că diferențele dintre valorile comparate sunt semnificative statistic.
  • Dacă valoarea testului t Student calculat Mai puțin tabelar, ceea ce înseamnă că diferențele dintre valorile comparate nu sunt semnificative statistic.

6. Exemplu de calcul al testului t Student

Pentru a studia eficacitatea unui nou preparat de fier, au fost selectate două grupuri de pacienți cu anemie. În primul grup, pacienții au primit un nou medicament timp de două săptămâni, iar în al doilea grup au primit un placebo. După aceasta, au fost măsurate nivelurile de hemoglobină din sângele periferic. În primul grup, nivelul mediu de hemoglobină a fost de 115,4±1,2 g/l, iar în al doilea grup - 103,7±2,3 g/l (datele sunt prezentate în format M±m), populațiile comparate au o distribuție normală. Numărul primului grup a fost de 34, iar al doilea - 40 de pacienți. Este necesar să se tragă o concluzie despre semnificația statistică a diferențelor obținute și eficacitatea noului preparat de fier.

Soluţie: Pentru a evalua semnificația diferențelor, folosim testul t al lui Student, calculat ca diferența de valori medii împărțită la suma erorilor pătrate:

După efectuarea calculelor, valoarea t-test s-a dovedit a fi 4,51. Găsim numărul de grade de libertate ca (34 + 40) - 2 = 72. Comparăm valoarea testului t Student rezultată de 4,51 cu valoarea critică la p = 0,05 indicată în tabel: 1,993. Deoarece valoarea calculată a criteriului este mai mare decât valoarea critică, concluzionăm că diferențele observate sunt semnificative statistic (nivel de semnificație p<0,05).