17,513 matches
-
caz), iar -1 asocierea maximă negativă. Coeficienții pot fi simetrici sau asimetrici. În cazul coeficienților simetrici nu contează care este variabilă independentă și care este cea dependentă (care urmează a fi explicată). Acești coeficienți vor avea aceeași valoare indiferent care variabilă este pe linie sau coloană. Coeficienții asimetrici indică asocierea dintre două variabile: cea independentă (de obicei așezată pe coloană) care prezice valorile celei de a doua variabile, cea dependentă. De exemplu, dacă am considera asocierea dintre votul pentru un partid
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
În cazul coeficienților simetrici nu contează care este variabilă independentă și care este cea dependentă (care urmează a fi explicată). Acești coeficienți vor avea aceeași valoare indiferent care variabilă este pe linie sau coloană. Coeficienții asimetrici indică asocierea dintre două variabile: cea independentă (de obicei așezată pe coloană) care prezice valorile celei de a doua variabile, cea dependentă. De exemplu, dacă am considera asocierea dintre votul pentru un partid și mediul urban/rural, în mod evident relația este una asimetrică, mediul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
care urmează a fi explicată). Acești coeficienți vor avea aceeași valoare indiferent care variabilă este pe linie sau coloană. Coeficienții asimetrici indică asocierea dintre două variabile: cea independentă (de obicei așezată pe coloană) care prezice valorile celei de a doua variabile, cea dependentă. De exemplu, dacă am considera asocierea dintre votul pentru un partid și mediul urban/rural, în mod evident relația este una asimetrică, mediul fiind un predictor al intenției de vot și nu invers. 7.1.5. Coeficienți de
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
De exemplu, dacă am considera asocierea dintre votul pentru un partid și mediul urban/rural, în mod evident relația este una asimetrică, mediul fiind un predictor al intenției de vot și nu invers. 7.1.5. Coeficienți de asociere pentru variabile nominale Atunci când este vorba despre coeficienți simetrici, coeficienții de asociere pot fi calculați în urma construirii tabelelor de contingență pentru a vedea măsura în care indivizii se comportă simultan după cele două variabile Un astfel de exemplu oferă tabelul nr. 7
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
invers. 7.1.5. Coeficienți de asociere pentru variabile nominale Atunci când este vorba despre coeficienți simetrici, coeficienții de asociere pot fi calculați în urma construirii tabelelor de contingență pentru a vedea măsura în care indivizii se comportă simultan după cele două variabile Un astfel de exemplu oferă tabelul nr. 7.11, unde: are un mare grad de libertate = (s-1)(t-1) cu 2 indici câți indivizi se găsesc simultan într-o clasă a lui A și una a lui B Tabelul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
11, unde: are un mare grad de libertate = (s-1)(t-1) cu 2 indici câți indivizi se găsesc simultan într-o clasă a lui A și una a lui B Tabelul nr. 7.11: Tabel de contingență pentru două variabile nominale B B1 B2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bt Total A1 A2 . . . . . . . . As k11 k12 . . . . . . . . . . . . . . . . . . . . . . . .k1t k21 k22 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .k2t ks1 ks2 . Clasa B1 conține total k1 indivizi din n. Spunem despre B că este independent de A, dacă se verifică relația: În acest caz
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
din n. Spunem despre B că este independent de A, dacă se verifică relația: În acest caz, într-o clasă a lui A nu obținem nici o informație în plus despre B față de ceea ce știam de la început. În tabelul de independență variabilele sunt independente, așadar, conform condiției generale de independență statistică se verifică relația: Măsurăm distanța dintre tabelul nostru și cel de independență astfel: se citește hi pătrat și măsoară diferența dintre frecvențele empirice și frecvențele teoretice. Indicii de asociere iau valori
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
independență statistică se verifică relația: Măsurăm distanța dintre tabelul nostru și cel de independență astfel: se citește hi pătrat și măsoară diferența dintre frecvențele empirice și frecvențele teoretice. Indicii de asociere iau valori între [0, 1] sau [-1, 1]. Pentru variabilele nominale/categoriale nu dăm semn indicatorului de asociere (nu există legătură între variabile, ele se pot așeza în tabel oricum). Semnul are sens pentru variabilele ordinale. 7.1.5.1. Șansa și raportul de șanse O modalitate relativ simplă, dar
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
independență astfel: se citește hi pătrat și măsoară diferența dintre frecvențele empirice și frecvențele teoretice. Indicii de asociere iau valori între [0, 1] sau [-1, 1]. Pentru variabilele nominale/categoriale nu dăm semn indicatorului de asociere (nu există legătură între variabile, ele se pot așeza în tabel oricum). Semnul are sens pentru variabilele ordinale. 7.1.5.1. Șansa și raportul de șanse O modalitate relativ simplă, dar foarte eficientă de a măsura asocierea dintre două variabile nominale este calcularea raportului
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
și frecvențele teoretice. Indicii de asociere iau valori între [0, 1] sau [-1, 1]. Pentru variabilele nominale/categoriale nu dăm semn indicatorului de asociere (nu există legătură între variabile, ele se pot așeza în tabel oricum). Semnul are sens pentru variabilele ordinale. 7.1.5.1. Șansa și raportul de șanse O modalitate relativ simplă, dar foarte eficientă de a măsura asocierea dintre două variabile nominale este calcularea raportului de șanse. Șansa se referă la o singură variabilă și reprezintă raportul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
nu există legătură între variabile, ele se pot așeza în tabel oricum). Semnul are sens pentru variabilele ordinale. 7.1.5.1. Șansa și raportul de șanse O modalitate relativ simplă, dar foarte eficientă de a măsura asocierea dintre două variabile nominale este calcularea raportului de șanse. Șansa se referă la o singură variabilă și reprezintă raportul dintre probabilitatea ca un anumit eveniment să aibă loc împărțită la probabilitatea ca acesta să nu aibă loc. De exemplu, dacă 15% votează cu
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
are sens pentru variabilele ordinale. 7.1.5.1. Șansa și raportul de șanse O modalitate relativ simplă, dar foarte eficientă de a măsura asocierea dintre două variabile nominale este calcularea raportului de șanse. Șansa se referă la o singură variabilă și reprezintă raportul dintre probabilitatea ca un anumit eveniment să aibă loc împărțită la probabilitatea ca acesta să nu aibă loc. De exemplu, dacă 15% votează cu un anumit partid, șansa este egală cu raportul 0,15/0,85. Tabelul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
7% 660 100% 1(Urban) 409 74,1% 143 25,9% 552 100% Total 959 79,1% 253 20,9% 1212 Sursa: Barometrul de opinie publică, iunie 1998 Raportul de șanse (sau șansa relativă) măsoară relația de asociere dintre două variabile. Să luăm un exemplu din baza de date BOP din iunie 1998. Din totalul de 1212 intervievați, 253 au declarat că au încrederea cea mai mare într-unul din partidele CDR, iar 959 în alte partide. Pentru acest tabel putem
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
asociere între încrederea în CDR și mediul de rezidență, în sensul că șansa ca cineva să aibă încredere în CDR este mai mare în mediul urban. Intensitatea acestei asocieri poate fi măsurată cu ajutorul raportului de șanse (sau șansei relative): Dacă variabilele ar fi fost independente, raportul șanselor condiționate ar fi fost egal cu 1. Iar dacă variabilele ar fi fost invers proporționale, R ar fi avut o valoare cuprinsă între 0 și 1 (în acest caz variabila mediu are valoarea 1
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
aibă încredere în CDR este mai mare în mediul urban. Intensitatea acestei asocieri poate fi măsurată cu ajutorul raportului de șanse (sau șansei relative): Dacă variabilele ar fi fost independente, raportul șanselor condiționate ar fi fost egal cu 1. Iar dacă variabilele ar fi fost invers proporționale, R ar fi avut o valoare cuprinsă între 0 și 1 (în acest caz variabila mediu are valoarea 1 pentru urban). Figura nr.7.5: Calcularea raportului de șanse Pentru a obține aceste valori în
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
sau șansei relative): Dacă variabilele ar fi fost independente, raportul șanselor condiționate ar fi fost egal cu 1. Iar dacă variabilele ar fi fost invers proporționale, R ar fi avut o valoare cuprinsă între 0 și 1 (în acest caz variabila mediu are valoarea 1 pentru urban). Figura nr.7.5: Calcularea raportului de șanse Pentru a obține aceste valori în SPSS, se selectează opțiunea ANALYZE/DESCRIPTIVE STATISTICS/CROSSTABS, se introduce variabila de pe linie și cea de pe coloană, iar din opțiunea
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
valoare cuprinsă între 0 și 1 (în acest caz variabila mediu are valoarea 1 pentru urban). Figura nr.7.5: Calcularea raportului de șanse Pentru a obține aceste valori în SPSS, se selectează opțiunea ANALYZE/DESCRIPTIVE STATISTICS/CROSSTABS, se introduce variabila de pe linie și cea de pe coloană, iar din opțiunea Statistics se selectează Risk. Rezultatul este prezentat în tabelul de mai jos. Pe lângă valoarea raportului de șanse este calculat și intervalul de încredere, adică limitele în care poate fi încadrată valoarea
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
în care poate fi încadrată valoarea raportului de șanse în populație (cu o probabilitate de 95%). Coeficientului de risc pentru mediul rural și urban calculat de programul SPSS este definit ca raport între procentele pe linie corespunzătoare fiecărei categorii a variabilei de pe coloană. Astfel, pentru cei care nu au încredere coeficientul de risc este egal cu 83,3 / 74,1 = 1,125. Pentru cei care au încredere riscul este egal cu 16,7 / 25,9 = 0,644. Risk Estimate Value 95
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
total de cazuri. Modul de calcul al coeficientului φ elimină erorile generate de faptul că valoarea 2 este influențată de mărimea eșantionului. φ este o măsură simetrică și este folosit de obicei pentru a descrie asocierea într-un tabel cu variabile dihotomice de tipul 2*2. Pentru tabele mai mari valoarea maximă a coeficientului este mai mare decât 1. Valoarea coeficientului φ poate fi calculată și ca diferența dintre distribuțiile condiționale (procente pe coloană/linie). Să luăm în continuare exemplul anterior
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
9% 100% Sursa: Barometrul de opinie publică iunie 1998 Observăm că procentul celor care au încredere în CDR este mai mic în mediu rural (16,7%) decât în mediul urban (25,9%) și decât pe total eșantion (20,9%). Dacă variabilele ar fi fost independente, aceste procente ar fi fost egale. Cu cât diferența observată este mai mare, cu atât asocierea este mai puternică. Diferența de procente în acest caz este de δ1 = 9,2% (25,9%-16,7%). În continuare
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
radical de ordinul 2 din produsul acestora. În acest caz φ este egal cu 0,113, iar nivelul de semnificație calculat de SPSS pentru această valoare este p = 0,000, ceea ce înseamnă că respingem ipoteza de nul a independenței dintre variabile. 7.1.5.3. Coeficientul V al lui Cramer O altă măsură bazată pe testul 2 este coeficientul lui Cramer, foarte des folosit deoarece are un interval de variație bine definit (luând valori între 0 si 1, unde 0 indică
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
exemplu, valoarea maximă pentru un tabel 2*2 este 0,707, iar pentru un tabel 3*3 este 0,816). 7.1.5.5. Coeficientul lambda (λ), Propus de Goodman și Kruskal, arată cât de eficient se pot prezice valorile variabilei dependente pe baza variabilei independente (este deci o măsură asimetrică). SPSS calculează trei valori lambda: două asimetrice, (fiecare din cele două variabile fiind considerate pe rând ca variabilă dependentă) și una simetrică (media celor două măsuri simetrice). Lambda se folosește
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
un tabel 2*2 este 0,707, iar pentru un tabel 3*3 este 0,816). 7.1.5.5. Coeficientul lambda (λ), Propus de Goodman și Kruskal, arată cât de eficient se pot prezice valorile variabilei dependente pe baza variabilei independente (este deci o măsură asimetrică). SPSS calculează trei valori lambda: două asimetrice, (fiecare din cele două variabile fiind considerate pe rând ca variabilă dependentă) și una simetrică (media celor două măsuri simetrice). Lambda se folosește pentru a măsura asocierea
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
5.5. Coeficientul lambda (λ), Propus de Goodman și Kruskal, arată cât de eficient se pot prezice valorile variabilei dependente pe baza variabilei independente (este deci o măsură asimetrică). SPSS calculează trei valori lambda: două asimetrice, (fiecare din cele două variabile fiind considerate pe rând ca variabilă dependentă) și una simetrică (media celor două măsuri simetrice). Lambda se folosește pentru a măsura asocierea între variabile nominale din trei perspective diferite. Prima măsurare: λ poate fi folosită ca o măsura simetrică a
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
de Goodman și Kruskal, arată cât de eficient se pot prezice valorile variabilei dependente pe baza variabilei independente (este deci o măsură asimetrică). SPSS calculează trei valori lambda: două asimetrice, (fiecare din cele două variabile fiind considerate pe rând ca variabilă dependentă) și una simetrică (media celor două măsuri simetrice). Lambda se folosește pentru a măsura asocierea între variabile nominale din trei perspective diferite. Prima măsurare: λ poate fi folosită ca o măsura simetrică a asocierei și în acest caz nici o
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]