17,513 matches
-
poate vorbi de o distribuție normală a variabilei. Comanda Boxplot are două opțiuni: opțiunea 'factors levels together' permite compararea distribuției dependentei pentru mai multe categorii ale variabilei independente opțiunea 'dependents together' permite compararea distribuției mai multor variabile sau a aceleiași variabile măsurate la momente de timp diferite. 7.7. Teste parametrice Odată ce am decis asupra formei distribuției putem opta pentru un test parametric (care presupune o distribuție normală) sau un test neparametric (care nu ține cont de distribuția variabilei analizate.) Testele
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
a aceleiași variabile măsurate la momente de timp diferite. 7.7. Teste parametrice Odată ce am decis asupra formei distribuției putem opta pentru un test parametric (care presupune o distribuție normală) sau un test neparametric (care nu ține cont de distribuția variabilei analizate.) Testele parametrice presupun, pe lângă cerința de normalitate a distribuției, și un nivel de măsurare de interval sau raport, precum și egalitatea dispersiilor grupurilor comparate. Testele t pot fi găsite în ANALYZE/COMPARE MEANS. Testul t poate avea mai multe forme
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Statistica test se calculează în modul următor: , undeeste media eșantionului, µ media din populație, iar ES eroarea standard a distribuției de eșantionare. Comanda în SPSS este ANALYZE/COMPARE MEANS/ONE SAMPLE T-TEST. Pentru aceasta se selectează din lista de variabile cea care urmează a fi testată (ac3 a: "În general, cam în câte zile dintr-o lună (cu aproximație), utilizați e-mailul?", în exemplul de mai jos) și se tastează valoarea test (8 în acest exemplu) care corespunde mediei la nivelul populației
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
contrar rezultatele putând fi eronate. Formula de calculare a valorii test este: , unde este media primului eșantion și media celui de al doilea eșantion. Ipoteza de nul este cea a egalității celor două medii. Exemplu: Presupunând în ceea ce urmează că variabila ac3 a are o distribuție normală, care poate fi caracterizată prin medie, vom aplica testul t al diferenței între medii, pentru a vedea dacă media variabilei diferă semnificativ între femei și bărbați. Pentru aceasta, vom accesa opțiunea ANALYZE/COMPARE MEANS/INDEPENDENT
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
de nul este cea a egalității celor două medii. Exemplu: Presupunând în ceea ce urmează că variabila ac3 a are o distribuție normală, care poate fi caracterizată prin medie, vom aplica testul t al diferenței între medii, pentru a vedea dacă media variabilei diferă semnificativ între femei și bărbați. Pentru aceasta, vom accesa opțiunea ANALYZE/COMPARE MEANS/INDEPENDENT SAMPLES T-TEST, iar în fereastra care se deschide vom selecta variabila ce urmează a fi testată (test variable) și cele două grupări pentru care
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
vom aplica testul t al diferenței între medii, pentru a vedea dacă media variabilei diferă semnificativ între femei și bărbați. Pentru aceasta, vom accesa opțiunea ANALYZE/COMPARE MEANS/INDEPENDENT SAMPLES T-TEST, iar în fereastra care se deschide vom selecta variabila ce urmează a fi testată (test variable) și cele două grupări pentru care se va calcula media (grouping variable, se indică cele 2 valori care reprezintă grupurile). În cazul nostru variabila test va fi ac3 a: "În general, cam în câte
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
grupurile). În cazul nostru variabila test va fi ac3 a: "În general, cam în câte zile dintr-o lună (cu aproximație), utilizați e-mailul?", iar grupările vor fi constituite pe baza variabilei sex cu valori 1 pentru masculin și 2 pentru feminin. Variabilele sunt luate din Barometrul de Opinie Publică, mai 2006. Rezultatul obținut este următorul: Group Statistics rsex N Mean Std. Deviation Std. Error Mean ac3 a masculin 260 10,72 13,032 ,808 feminin 248 9,43 12,679 ,805 Independent Samples
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Lower Upper ac3 a Equal variances assumed 2,092 ,149 1,128 506 ,260 1,288 1,142 -,955 3,531 Equal variances not assumed 1,129 505,800 ,259 1,288 1,141 -,953 3,529 Astfel vedem că media variabilei ac3 a pentru masculin este 10,72, în timp ce pentru feminin este de 9,43. În continuare, valoarea testului t este calculată atât în ipoteza egalității dispersiilor, cât și în ipoteza că aceste dispersii nu sunt egale. Valoarea testului F fiind 2
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
la fel de mult e-mailul. Atunci când se testează diferențele între mai mult de două sub-eșantioane, pentru a evita toate combinările posibile, putem utiliza comparația dintre media fiecărui sub-eșantion și media totală. Să presupunem, de exemplu, că vrem să aflăm cum diferă media variabilei discutate anterior în funcție de variabila varcat (vârsta pe categorii). Pentru aceasta se sortează și se împarte eșantionul în funcție de variabila vârstă, utilizând comanda SPLIT FILE, iar apoi se folosește testul t pentru un singur eșantion, unde ca valoare test se indică media
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
se testează diferențele între mai mult de două sub-eșantioane, pentru a evita toate combinările posibile, putem utiliza comparația dintre media fiecărui sub-eșantion și media totală. Să presupunem, de exemplu, că vrem să aflăm cum diferă media variabilei discutate anterior în funcție de variabila varcat (vârsta pe categorii). Pentru aceasta se sortează și se împarte eșantionul în funcție de variabila vârstă, utilizând comanda SPLIT FILE, iar apoi se folosește testul t pentru un singur eșantion, unde ca valoare test se indică media pe țară calculată pe
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
intergrupală este egală cu cea intragrupală. Dacă probabilitatea calculată pentru F este <0,05, se respinge ipoteza de nul și se presupune că cel puțin o pereche de medii este semnificativ diferită. Exemplu: Revenind la exemplul anterior referitor la media variabilei ac3 a, de data aceasta funcție de vârstă pe categorii, pentru a realiza analiza de variație vom selecta din meniul ANALYZE/COMPARE MEANS/ONE WAY ANOVA variabila dependentă ac3 a și cea independentă (factor variable) varcat. La Options vom bifa testul Bonferoni, care
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
o pereche de medii este semnificativ diferită. Exemplu: Revenind la exemplul anterior referitor la media variabilei ac3 a, de data aceasta funcție de vârstă pe categorii, pentru a realiza analiza de variație vom selecta din meniul ANALYZE/COMPARE MEANS/ONE WAY ANOVA variabila dependentă ac3 a și cea independentă (factor variable) varcat. La Options vom bifa testul Bonferoni, care va calcula mediile variabilei ac3 a și le va compara pe câte două categorii de vârste. Tabelul de mai jos reprezintă rezultatul procedurii ANOVA obținut în
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
aceasta funcție de vârstă pe categorii, pentru a realiza analiza de variație vom selecta din meniul ANALYZE/COMPARE MEANS/ONE WAY ANOVA variabila dependentă ac3 a și cea independentă (factor variable) varcat. La Options vom bifa testul Bonferoni, care va calcula mediile variabilei ac3 a și le va compara pe câte două categorii de vârste. Tabelul de mai jos reprezintă rezultatul procedurii ANOVA obținut în SPSS. ANOVA ac3 a Sum of Squares df Mean Square F Sig. Between Groups 3007,584 5 601,517 3
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
significant at the 0.05 level. Statistica F are valoarea de 3,733 și o probabilitate calculată (sig.) de 0,003. Aceasta fiind <0,05, respingem ipoteza de nul, ceea ce înseamnă că cel puțin două medii diferă între ele (mediile variabilei ac3 a de la cel puțin două categorii de vârstă vor fi semnificativ diferite între ele). După cum se observă în tabelul de rezultate de mai sus, testul Bonferoni, calculează diferența dintre media variabilei ac3 a pe grupuri de câte două categorii ale variabilei
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
că cel puțin două medii diferă între ele (mediile variabilei ac3 a de la cel puțin două categorii de vârstă vor fi semnificativ diferite între ele). După cum se observă în tabelul de rezultate de mai sus, testul Bonferoni, calculează diferența dintre media variabilei ac3 a pe grupuri de câte două categorii ale variabilei vârstă (în coloana Mean Difference) și pentru fiecare diferență de medii calculează câte o probabilitate (sig.) Practic se transformă într-un cumul de teste t pentru eșantioane independente. Acolo unde probabilitatea
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
variabilei ac3 a de la cel puțin două categorii de vârstă vor fi semnificativ diferite între ele). După cum se observă în tabelul de rezultate de mai sus, testul Bonferoni, calculează diferența dintre media variabilei ac3 a pe grupuri de câte două categorii ale variabilei vârstă (în coloana Mean Difference) și pentru fiecare diferență de medii calculează câte o probabilitate (sig.) Practic se transformă într-un cumul de teste t pentru eșantioane independente. Acolo unde probabilitatea este mai mică de 0,05, se respinge ipoteza
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
samples t-test) După cum am menționat deja, testul t pentru eșantioanele dependente este folosit cel mai des în cazul studiilor panel pentru măsurători repetate. Acest test poate fi folosit însă și atunci când vrem să comparăm distribuția, respectiv mediile, a două variabile cantitative măsurate pentru același eșantion. Să presupunem că am măsurat educația în ani a subiectului și a tatălui subiectului. Pentru a vedea dacă aceste două medii sunt egale selectăm opțiunea Paired samples t-test și perechea de variabile. Vom obține
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
a două variabile cantitative măsurate pentru același eșantion. Să presupunem că am măsurat educația în ani a subiectului și a tatălui subiectului. Pentru a vedea dacă aceste două medii sunt egale selectăm opțiunea Paired samples t-test și perechea de variabile. Vom obține un tabel asemănător cu cel analizat anterior (mai puțin testul F de egalitate a dispersiilor) prin care vom analiza dacă diferența dintre medii este statistic semnificativă sau nu. 7.8. Teste neparametrice Spre deosebire de testele parametrice, cele neparametrice nu
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
cu cel analizat anterior (mai puțin testul F de egalitate a dispersiilor) prin care vom analiza dacă diferența dintre medii este statistic semnificativă sau nu. 7.8. Teste neparametrice Spre deosebire de testele parametrice, cele neparametrice nu presupun o anumită formă a variabilelor (sunt denumite și distribution-free tests). Ori de câte ori condițiile pentru aplicarea testelor parametrice (distribuție normală, nivel de măsurare de raport sau interval, egalitatea dispersiilor grupurilor) sunt îndeplinite se recomandă folosirea acestora, deoarece sunt mai puternice comparativ cu cele neparametrice. În cazul testelor
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Ori de câte ori condițiile pentru aplicarea testelor parametrice (distribuție normală, nivel de măsurare de raport sau interval, egalitatea dispersiilor grupurilor) sunt îndeplinite se recomandă folosirea acestora, deoarece sunt mai puternice comparativ cu cele neparametrice. În cazul testelor neparametrice se verifică dacă distribuția variabilei (măsurată la nivel ordinal sau de interval) în eșantioanele comparate provine din aceeași populație (este asemănătoare sau nu). Respingerea ipotezei de nul conduce la concluzia că eșantioanele diferă din punctul de vedere al variabilei studiate. Ipoteza nu se referă deci
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
testelor neparametrice se verifică dacă distribuția variabilei (măsurată la nivel ordinal sau de interval) în eșantioanele comparate provine din aceeași populație (este asemănătoare sau nu). Respingerea ipotezei de nul conduce la concluzia că eșantioanele diferă din punctul de vedere al variabilei studiate. Ipoteza nu se referă deci la mediile celor două eșantioane, deoarece este posibil ca acestea să fie egale, iar forma distribuțiilor să fie diferită. Opțiunile pentru diferite teste neparametrice pot fi selectate din meniul ANALYZE/ NONPARAMETRIC TESTS. 7.8
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
iar forma distribuțiilor să fie diferită. Opțiunile pentru diferite teste neparametrice pot fi selectate din meniul ANALYZE/ NONPARAMETRIC TESTS. 7.8.1. Teste neparametrice pentru două eșantioane independente 7.8.1.1. Testul U propus de Mann-Whitney Testul este aplicabil variabilelor măsurate cel puțin la nivel ordinal. Modul de calcul este prezentat în următorul exemplu: Avem 2 eșantioane de volum na = nb = 4 pentru care s-a măsurat încrederea în biserică pe o scală de la 1 la 5. Pentru primul eșantion
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
nul. În acest caz p = 0,2 deci acceptăm ipoteza că nu există diferențe între cele două distribuții. 7.8.1.2. Testul Z propus de Kolmogorov-Smirnov Asemănător cu testul anterior, Kolmogorov-Smirnov este folosit pentru a verifica dacă distribuția unei variabile diferă sau nu în mod semnificativ între cele 2 eșantioane comparate. Modul de calcul este următorul: 1) Se calculează pentru fiecare eșantion procentele cumulate pentru fiecare rang. Astfel, pentru exemplu anterior în care variabila lua valori de la 1 la 5
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
pentru a verifica dacă distribuția unei variabile diferă sau nu în mod semnificativ între cele 2 eșantioane comparate. Modul de calcul este următorul: 1) Se calculează pentru fiecare eșantion procentele cumulate pentru fiecare rang. Astfel, pentru exemplu anterior în care variabila lua valori de la 1 la 5, vom obține următoarele frecvențe: A B 1 0 0 2 2 0 3 1 2 4 1 1 5 0 1 Se calculează apoi procentele, procentele cumulate și diferențele dintre acestea pentru fiecare rang
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
eșantionului (1 sau 2); În final, se aplică un test pentru a vedea dacă ordinea acestor valori (1 sau 2) este aleatoare sau nu; Dacă se observă abateri de la ordinea aleatoare, se respinge ipoteza de nul a distribuției identice a variabilei în cele două eșantioane. 7.8.1.4.Testul Moses al reacțiilor extreme Spre deosebire de testele anterioare care examinau diferențele ce există în tendința centrală a distribuțiilor comparate, testul Moses analizează diferențele în extremitățile (cozile) distribuției. Ca și în cazurile anterioare
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]