453 matches
-
din celelalte grupe, dar nu din două grupe simultan). Grupările constituite pe baza uneia sau mai multor variabile dihotomice se numesc grupări simple, iar cele constituite pe baza mai multor variabile din care cel puțin una este mai mult decât dihotomică se numesc grupări multiple. Exemplu. În cazul unui studiu care urmărește relația dintre tipul școlii pe care o frecventează un eșantion de elevi și statutul profesional al familiilor acestora, se pot utiliza spații de atribute în trei dimensiuni dihotomice (vezi
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
decât dihotomică se numesc grupări multiple. Exemplu. În cazul unui studiu care urmărește relația dintre tipul școlii pe care o frecventează un eșantion de elevi și statutul profesional al familiilor acestora, se pot utiliza spații de atribute în trei dimensiuni dihotomice (vezi figura nr. 2.1) Figura nr. 2.1: Spațiul de atribute al statului socio-profesional al familiei-trei dimensiuni Statutul socio-profesional al familiei Cu studii superioare Fără studii superioare Mediul Mediul Urban Rural Urban Rural Liceu Tipul școlii Școala profesională Dacă
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
populația de bază. Determinarea volumului eșantionului implică existența unor informații prealabile asupra dispersiei și mediei caracteristicii de eșantionare. Cercetări anterioare sau pre-sondaje sunt necesare pentru a orienta alegerea valorilor. În cazul în care se urmărește o reprezentativitate în raport cu o caracteristică dihotomică, formula de calcul pentru volumul eșantionului este: p procentul din populația cadru care posedă o caracteristică q = 100-p Cantitatea pxq indică dispersia unei caracteristici calitative. pxq=maxim dacă p=q=50 Volumul eșantionului într-o situație de dispersie maximă, ignorând
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
putem spune că la nivelul întregii populații prețul pentru care oamenii ar cumpăra o sticlă de bere Ciucaș este undeva între 8,45 ron și 8, 60 ron. Exemplul 2. Estimarea unei proporții la nivelul populației În cazul unei variabile dihotomice x cu valori 0 și 1 (consumatori de bere, unde 0 înseamnă că nu persoanele intervievate nu consumă bere, iar valoarea 1 înseamnă că persoanele intervievate consumă bere) valoarea medie va fi egală cu proporția de apariție a valorii 1
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
8 2 10 3 3 8 5 4 12 2 5 15 1 6 5 6 7 8 5 8 9 4 9 2 9 10 4 7 5.2.2. Crearea unei variabile fictive (dummy) Variabilele fictive sunt variabile dihotomice care pot lua doar două valori, de obicei notate cu 1 si 0. Ele desemnează prezența (1) și absența (0) unui anumit atribut (de exemplu apartenența sau lipsa apartenenței la un grup). Comanda este următoarea: RECODE nume var veche (1=categ care desemneaza prezența atributului) (ELSE
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
2.3. Răspunsuri multiple În cazul în care există mai multe variante de răspuns pentru o singură întrebare, frecvența răspunsurilor poate fi obținută cu ajutorul opțiunii MULTIPLE RESPONSES din SPSS. Pentru fiecare variantă de răspuns se creează în prealabil o variabilă dihotomică (cu variante de răspuns Da/Nu). Apoi, din meniul principal se selectează ANALYZE/ MULTIPLE RESPONSES/ DEFINE VARIABLES SET, creându-se astfel variabila set corespunzătoare. Frecvențele pentru variabila creată (care atenție nu este salvată de SPSS în baza de date) se
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
mai multe caracteristici ale populației studiate. Tabelele se folosesc atunci când caracteristicile sunt măsurate la nivel nominal sau ordinal și au un număr redus de categorii ale variabilei, acest lucru facilitând citirea și interpretarea datelor. Un caz special îl reprezintă variabilele dihotomice care pot lua două valori, notate de obicei cu 1 și 0, unde 1 semnifică prezența atributului măsurat (A), iar 0 absența acestuia (non A). Pentru două variabile dihotomice un tabel de contingență (2*2) arată în felul următor: Tabelul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
facilitând citirea și interpretarea datelor. Un caz special îl reprezintă variabilele dihotomice care pot lua două valori, notate de obicei cu 1 și 0, unde 1 semnifică prezența atributului măsurat (A), iar 0 absența acestuia (non A). Pentru două variabile dihotomice un tabel de contingență (2*2) arată în felul următor: Tabelul nr. 7.1. Tabel de contingență procente din total răspunsuri VI1 (B) VI2 (nonB) Total VD1 (A) P11 P12 P1+=P11 + P12 VD2 (nonA) P21 P22 P2+=P21 + P22
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
și subiectul j pe variabila X se va menține și pe variabila Y și unei valori X îi va corespunde o singură valoare Y, respectiv unei valori Y îi va corespunde o singură valoare X. Pentru cazul a două variabile dihotomice, toți indivizii se vor situa pe diagonala tabelului, precum în exemplul de mai jos. Mai exact nu vom avea cazuri în care un subiect să aibă valoarea 0 pe prima variabilă și valoarea 1 pe cea de a doua variabilă
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
de a doua variabilă sau invers, toți cei cu atributul A având și atributul B. Nu vom avea nici un caz în care B crește de la 0 la 1, iar A rămâne 0. Tabelul nr. 7.8: Asociere perfectă pentru variabile dihotomice 0 (B) 1 (nonB) Total 0 (nonA) P11 0 P1+ 1 (A) 0 P22 P2+ Total P+1 P+2 100% În mod similar, în tabelul de mai jos observăm că la fiecare creștere a lui X, Y crește și
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
de cazuri. Modul de calcul al coeficientului φ elimină erorile generate de faptul că valoarea 2 este influențată de mărimea eșantionului. φ este o măsură simetrică și este folosit de obicei pentru a descrie asocierea într-un tabel cu variabile dihotomice de tipul 2*2. Pentru tabele mai mari valoarea maximă a coeficientului este mai mare decât 1. Valoarea coeficientului φ poate fi calculată și ca diferența dintre distribuțiile condiționale (procente pe coloană/linie). Să luăm în continuare exemplul anterior și
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
E1 este numărul de erori în cazul 1 și E2 numărul de erori în cazul 2. Lambda are valori intre 0 și 1. Să luăm următorul exemplu (din Barometrul de opinie publică, iunie 1998) în care TRUST este o variabilă dihotomică cu valoarea 1 pentru cei ce au încredere puțină și foarte puțină în maghiari și 2 pentru cei ce au încredere multă și foarte multă, iar variabila etnie desemnează etnia respondenților. Count etnie Total român maghiar rrom german alta TRUST
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
1 3 6 -3 (-)5 2 4 -2 (-)3 Suma rangurilor pozitive = 4; Suma rangurilor negative = 11 T = 4 7.8.3.3. Testul McNemar Acest test se aplică atunci când dorim să aflăm dacă variabila analizată care este de tip dihotomic diferă între două eșantioane dependente, de obicei obținute dintr-un studiu panel sau de tip înainte/după tratament. Pentru a calcula valoarea statisticii test se construiește următorul tabel de contingență: Tabelul nr. 7.16: Tabel de contingență studiu panel Înainte
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
7.8.4.2 Testul W a lui Kendall Reprezintă o normalizare a testului Friedman, luând valori între 0 și 1. 7.8.4.3 Testul Q a lui Cochran Este o extensie a testului McNemar (aplicabil în cazul variabilelor dihotomice) pentru mai mult de 2 eșantioane. Pentru o imagine de ansamblu asupra testelor, în figura nr. 7.21 este prezentată o schemă preluată după Foster (2001, 21). Figura nr. 7.21: Cum decidem ce test statistic folosim Capitolul 8 Analiza
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
la nivel metric sau să fie variabile fictive (dummy), discutate într-o secțiune anterioară. Regresia, fiind o metodă robustă, uneori se acceptă includerea unor variabile ordinale în model, însă în mod obligatoriu variabilele nominale trebuie transformate în variabile fictive (variabile dihotomice pentru care valoarea 1 indică prezența atributului, iar 0 absența lui). 5. Variabilele incluse în model trebuie să aibă o distribuție normală. Normalitatea distribuției se verifică cu teste și măsuri specifice calculate de SPSS (indicele de aplatizare și oblicitate). 6
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
De exemplu, 1 poate indica faptul că persoana este de sex masculin, iar 0 poate desemna o persoană de sex feminin. Variabilele care își asumă valori de 0 și 1 se numesc variabile fictive (variabile indicatoare, binare, categorice, calitative sau dihotomice). Variabilele fictive pot fi folosite în modele de regresie la fel de ușor ca și variabilele cantitative. De fapt, un model de regresie poate conține variabile explicatorii care sunt exclusiv fictive sau calitative. Asemenea modele sunt numite ANOVA. Ca exemplu, avem următorul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
reziduale. Graficele de regresie parțială permit vizualizarea relației dintre un predictor și dependentă, precum și identificarea cazurilor extreme. 8.2. Regresia logistică Regresia logistică este un alt tip de regresie cu aplicabilitate pentru cazurile în care variabila dependentă este de tip dihotomic (de exemplu, votul pentru un anumit partid, decizia de a cumpăra un automobil) și se poate presupune lipsa unor efecte de interacțiune între predictorii modelului. Predictorii pot fi măsurați la nivel de raport, interval, ordinal sau pot fi de tip
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
de exemplu, votul pentru un anumit partid, decizia de a cumpăra un automobil) și se poate presupune lipsa unor efecte de interacțiune între predictorii modelului. Predictorii pot fi măsurați la nivel de raport, interval, ordinal sau pot fi de tip dihotomic ca și variabila dependentă. Popularitatea regresiei logistice se datorează faptului că este o metodă robustă, care nu necesită ca variabila dependentă să fie cantitativă și să aibă o distribuție normală. Există cerințe care se aplică la fel ca și în
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
modelul ne-a îmbunătățit predicția doar cu 1,4% din cazuri. Metoda folosită aici este de fapt similară cu regresia liniară când pentru a evalua modelul foloseam ca punct de referință valoarea medie a lui y. În cazul unei variabile dihotomice valoarea medie este chiar probabilitatea de apariție a evenimentului, deci în exemplul de mai sus procentul celor care s-au declarat în favoarea pedepsei capitale. Gradul de îmbunătățire a predicției este dat de valoarea care este un raport: (nr. erorilor fără
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
CDR. Pentru a putea clasifica corect valorile 1 ale variabilei dependente ar fi trebuit ca această creștere să depășească pragul de 50% (cut value). Se poate observa deci că modelele de regresie logistică se aplică cu succes în cazul variabilelor dihotomice care au o distribuție binomială și probabilitățile pentru valorile 1 și 0 sunt aproape de valorile 50% ; -50%. Variables in the Equation B S.E. Wald df Sig. Exp(B) Lower Upper Lower Upper Lower Upper Step 1(a) dir 1,308
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
8.3.6. Modelarea log liniară Reprezentare log liniară a frecvențelor din celulele tabelului Logaritm din frecvență = efectul general + efectul de rând + efectul de coloană + efectul de interacțiune * Cum se operează această descompunere pentru un tabel 2*2 (2 variabile dihotomice): Se logaritmează frecvențele tabelului Se descompun în patru efecte specifice: 1. Efectul general (λ) este media frecvențelor logaritmate din toate celulele. Cu alte cuvinte, frecvențele din fiecare celulă depind de media frecvențelor din tabel. Acest efect este același pentru toate
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
egală cu logaritm din frecvența celulei respective. λRC11 + λRC12 + λRC21+ λRC22, Independența a două variabile este echivalentă cu efectul de interacțiune λRC = 0. log(fij) = Parametrii λ pentru un tabel 2*2 Exemplu: Să construim un model saturat pentru variabilele dihotomice vârstă și încredere interpersonală. Pentru acest model avem în total 9 parametri: 1 parametru constant, 2 parametri corespunzători efectului variabilei vârstă care diferă doar prin semn, 2 parametri pentru variabila încredere, 4 parametri corespunzători efectelor de interacțiune pentru fiecare celulă
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
folosirea procedurii Loglinear Model Selection, cu precizarea că în căsuța Options se poate cere afișarea estimărilor parametrilor lambda (λ). 8.3.7. Decompoziția unui model cu 3 variabile. Interacțiuni de ordinul 2 și 3 Să presupunem că avem trei variabile dihotomice, A (A1, A2), B (B1, B2) și C (C1, C2). Vor exista 4 tipuri de efecte: 1. efectul general (media frecvențelor logaritmate). Același pentru toate căsuțele. 2. efectele principale: efectele poziționării într-una din categoriile variabilei A (2 efecte, egale
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
ordin 2 (din care 3 diferiți) + 8 de ordin 3 (din care 1 diferit). Deci efectiv calculați vor fi 8 parametrii: cel constant, 3 principali, 3 de ordinul 2 și unul de ordinul 3. Exemplu: Model saturat pentru 3 variabile dihotomice: vârstă, gen și încredere în oameni. Rezultat SPSS: Primul parametrul exprimă efectul situării în prima categorie a variabilei încredere (0). Este pozitiv deoarece în eșantion sunt mai mulți cei care nu au încredere. Al doilea parametru calculat exprimă efectul situării
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
permite găsirea modelului celui mai potrivit. Se începe prin calcularea parametrilor pentru modelul saturat și apoi se elimină progresiv câte un efect de interacțiune până la pragul în care modelul nu mai prezice acceptabil datele observate. Exemplu: Model cu 3 variabile dihotomice rezidență (urban/rural), vârstă, încredere. Mai jos sunt testate ipotezele că toate efectele de ordin k și mai mare sunt 0, iar în continuare ipotezele că efectele de ordin k sunt 0. Primul test pentru k=3 ne arată că
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]