26,035 matches
-
plus despre B față de ceea ce știam de la început. În tabelul de independență variabilele sunt independente, așadar, conform condiției generale de independență statistică se verifică relația: Măsurăm distanța dintre tabelul nostru și cel de independență astfel: se citește hi pătrat și măsoară diferența dintre frecvențele empirice și frecvențele teoretice. Indicii de asociere iau valori între [0, 1] sau [-1, 1]. Pentru variabilele nominale/categoriale nu dăm semn indicatorului de asociere (nu există legătură între variabile, ele se pot așeza în tabel oricum
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
semn indicatorului de asociere (nu există legătură între variabile, ele se pot așeza în tabel oricum). Semnul are sens pentru variabilele ordinale. 7.1.5.1. Șansa și raportul de șanse O modalitate relativ simplă, dar foarte eficientă de a măsura asocierea dintre două variabile nominale este calcularea raportului de șanse. Șansa se referă la o singură variabilă și reprezintă raportul dintre probabilitatea ca un anumit eveniment să aibă loc împărțită la probabilitatea ca acesta să nu aibă loc. De exemplu
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Rural) 550 83,3% 110 16,7% 660 100% 1(Urban) 409 74,1% 143 25,9% 552 100% Total 959 79,1% 253 20,9% 1212 Sursa: Barometrul de opinie publică, iunie 1998 Raportul de șanse (sau șansa relativă) măsoară relația de asociere dintre două variabile. Să luăm un exemplu din baza de date BOP din iunie 1998. Din totalul de 1212 intervievați, 253 au declarat că au încrederea cea mai mare într-unul din partidele CDR, iar 959 în
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
încredere în CDR este: Observăm că există o anumită asociere între încrederea în CDR și mediul de rezidență, în sensul că șansa ca cineva să aibă încredere în CDR este mai mare în mediul urban. Intensitatea acestei asocieri poate fi măsurată cu ajutorul raportului de șanse (sau șansei relative): Dacă variabilele ar fi fost independente, raportul șanselor condiționate ar fi fost egal cu 1. Iar dacă variabilele ar fi fost invers proporționale, R ar fi avut o valoare cuprinsă între 0 și
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
baza variabilei independente (este deci o măsură asimetrică). SPSS calculează trei valori lambda: două asimetrice, (fiecare din cele două variabile fiind considerate pe rând ca variabilă dependentă) și una simetrică (media celor două măsuri simetrice). Lambda se folosește pentru a măsura asocierea între variabile nominale din trei perspective diferite. Prima măsurare: λ poate fi folosită ca o măsura simetrică a asocierei și în acest caz nici o variabilă nu este tratată ca variabilă independentă. Coeficientul reprezintă o asociere mutuală între două variabile
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
CELLS, de unde se bifează Adj. Standardized (din secțiunea Residuals). Interpretare: Se poate deduce că există o asociere pozitivă între persoanele de sex masculin și mulțumirea față de sănătate și persoanele de sex feminin și nemulțumirea față de sănătate 7.2. Analiza variabilelor măsurate la nivel de interval sau raport 7.2.1.Grafice realizate între variabile măsurate la nivel de interval sau raport Graficele realizate pe două variabile cantitative sunt cele de tip SCATTER/DOT din meniul CHART BUILDER. Am luat ca exemplu
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
există o asociere pozitivă între persoanele de sex masculin și mulțumirea față de sănătate și persoanele de sex feminin și nemulțumirea față de sănătate 7.2. Analiza variabilelor măsurate la nivel de interval sau raport 7.2.1.Grafice realizate între variabile măsurate la nivel de interval sau raport Graficele realizate pe două variabile cantitative sunt cele de tip SCATTER/DOT din meniul CHART BUILDER. Am luat ca exemplu două variabile cantitative din Barometrul de Opinie Publică octombrie 2007: vârsta și număr hectare
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Barometrul de Opinie Publică octombrie 2007: vârsta și număr hectare de pământ pe gospodărie. Interpretare: Se observă că persoanele care au peste 5 hectare de pământ au vârste de peste 40 de ani. 7.2.2.Coeficienți de asociere între variabile măsurate la nivel de interval sau raport Coeficientul r a lui Pearson se folosește pentru a testa relațiile dintre două variabile cantitative. , unde: xi, yi reprezintă valorile celor două variabile, , reprezintă mediile celor două variabile n reprezintă volumul eșantionului σx, σy
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
coeficient în SPSS se accesează meniul ANALYZE/DESCRIPTIVES/STATISTICS/CROSSTABS unde se apasă butonul Statistics și se bifează opțiunea Correlations. Pentru exemplificare, am ales din baza de date din Barometrul de Opinie Publică octombrie 2007 variabilele prop1da și vârsta, care măsoară numărul de hectare deținute de o persoană și respectiv vârsta persoanei. Symmetric Measures Value Asymp. Std. Errora Approx. Tb Approx. Sig. Interval by Interval Pearson's R ,083 ,034 2,313 ,021c Ordinal by Ordinal Spearman Correlation ,160 ,035 4
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
numărul de hectare deținute, dar aceasta are o intensitate destul de slabă. Întrucât coeficientul este pozitiv, interpretăm că odată cu creșterea vârstei, poate crește și numărul de hectare de pământ deținute. 7.3. Analiza unei variabile nominale/ordinale și a unei variabile măsurată la nivel interval/raport. 7.3.1. Grafice utilizate pentru o variabilă nominală/ordinală și una de interval/raport Dorim să obținem un grafic între variabila nominală d1 ("Credeți că lucrurile merg într-o direcție bună sau greșită?" cu variantele
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
al lui Pearsons. Pentru a testa asocierea între o variabilă nominală și una ordinală, vom utiliza unul din coeficienții de corelație specifici pentru variabilele ordinale. 7.4. Testarea ipotezelor Ipotezele permit măsurarea variabilelor. Orice concept al unui fenomen poate fi măsurat, dacă este integrat într-o definiție operațională adecvată. Toți termenii folosiți în ipoteze trebuie să aibă o definiție operațională. O ipoteză folositoare ar trebui sa aibă cel puțin patru caracteristici eseniale: ar trebui să fie compatibilă cu informațiile din domeniul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
are un volum n>50 de observații și se folosește aceeași opțiune din meniul EXPLORE, SPSS-ul va calcula automat testul Kolmogorov-Smirnov, numit și testul K-S Lilliefors, datorită corecției introdusă de Lilliefors. Acest test se aplică atunci când variabilele sunt măsurate la nivel de interval. Ipoteza de nul a testului este aceea că distribuția variabilei corespunde cu cea teoretică (ce poate fi normală sau un alt tip de distribuție specificat de cercetător). Statistica test este obținută prin compararea distribuțiilor observate cu
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
test) După cum am menționat deja, testul t pentru eșantioanele dependente este folosit cel mai des în cazul studiilor panel pentru măsurători repetate. Acest test poate fi folosit însă și atunci când vrem să comparăm distribuția, respectiv mediile, a două variabile cantitative măsurate pentru același eșantion. Să presupunem că am măsurat educația în ani a subiectului și a tatălui subiectului. Pentru a vedea dacă aceste două medii sunt egale selectăm opțiunea Paired samples t-test și perechea de variabile. Vom obține un tabel
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
eșantioanele dependente este folosit cel mai des în cazul studiilor panel pentru măsurători repetate. Acest test poate fi folosit însă și atunci când vrem să comparăm distribuția, respectiv mediile, a două variabile cantitative măsurate pentru același eșantion. Să presupunem că am măsurat educația în ani a subiectului și a tatălui subiectului. Pentru a vedea dacă aceste două medii sunt egale selectăm opțiunea Paired samples t-test și perechea de variabile. Vom obține un tabel asemănător cu cel analizat anterior (mai puțin testul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
condițiile pentru aplicarea testelor parametrice (distribuție normală, nivel de măsurare de raport sau interval, egalitatea dispersiilor grupurilor) sunt îndeplinite se recomandă folosirea acestora, deoarece sunt mai puternice comparativ cu cele neparametrice. În cazul testelor neparametrice se verifică dacă distribuția variabilei (măsurată la nivel ordinal sau de interval) în eșantioanele comparate provine din aceeași populație (este asemănătoare sau nu). Respingerea ipotezei de nul conduce la concluzia că eșantioanele diferă din punctul de vedere al variabilei studiate. Ipoteza nu se referă deci la
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
independente 7.8.1.1. Testul U propus de Mann-Whitney Testul este aplicabil variabilelor măsurate cel puțin la nivel ordinal. Modul de calcul este prezentat în următorul exemplu: Avem 2 eșantioane de volum na = nb = 4 pentru care s-a măsurat încrederea în biserică pe o scală de la 1 la 5. Pentru primul eșantion (A) măsurătorile au fost: 2, 3, 4, 2. Pentru cel de al doilea eșantion (B): 4, 3, 3, 5. 1) Se unesc cele două serii de date
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
pentru fiecare eșantion în parte. În final se aplică testul (Hi pătrat) pentru acest tabel. 7.8.3. Teste neparametrice pentru 2 eșantioane dependente 7.8.3.1. Testul Semnului (Sign Test) Testului semnului poate fi aplicat în cazul variabilelor măsurate la nivel cel puțin ordinal. Testul presupune calcularea diferențelor dintre două perechi, diferențe ce pot fi definite în două moduri: fie comparăm subiectul n din primul eșantion cu subiectul n din cel de al doilea eșantion, fie luăm în considerare
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
cealaltă scade, vorbim despre corelație negativă. De exemplu, există o corelație negativă între satisfacția la locul de munca și absenteismul cu cât oamenii sunt mai mulțumiți la locul de muncă, cu atât vor lipsi mai puțin. Când variabilele au fost măsurate pe o scală cu intervale, folosim coeficientul de corelație al lui Pearson, iar când datele sunt de natură ordinală folosim coeficientul de corelație al lui Spearman. Coeficientul de corelație (corel. Pearson) rxy = ryx reprezintă același lucru. Indiferent de tipul coeficientului
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
norul de puncte în așa fel încât distanța de la toate punctele din plan la dreapta respectivă să fie minimă. În acest fel se definește relația dintre cele două variabile. (Rotariu, 1999) y = a +bx x variabila independentă; y variabila dependentă; măsoară erorile în forma pătratică: x → y real → calculat Figura nr. 8.3: Reprezentarea grafică a relației dintre două variabile y3 ce corespunde lui x3 din ecuația dreaptă trebuie să fie cât mai aproape de y3 real din grafic; Se impun două
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
3 = r12 r13r23 Modelele de regresie liniară cu unul sau mai mulți predictori sunt foarte des folosite în științele sociale pentru explicarea fenomenelor și proceselor sociale. Cu ajutorul modelelor de regresie putem explica și prezice diferențele în valorile unei variabile cantitative măsurate la nivel global (cum ar fi rata migrației, a natalității etc.) sau individual (indici atitudinali sau date factuale cum ar fi venitul). Modelele de regresie se compun dintr-o variabilă dependentă (cea a cărei variație urmărim să o explicăm) și
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
cu beta abateri standard pe scala variabilei dependente, celelalte variabile fiind ținute sub control. 8.1.5.Coeficientul de determinație Așa cum am menționat, scopul construcției unui model de regresie este de a explica variația dependentei. În afară de coeficienții de regresie care măsoară impactul fiecărui predictor, avem nevoie și de o măsură globală a gradului în care variația dependentei este explicată de tot setul de predictori. Un astfel de indicator este R2 , calculat pe baza raportului dintre variația lui Y explicată de predictori
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
de regresie trebuie să fie specificat corect, adică să nu fie incluși predictori irelevanți sau să fie omiși cei relevanți; 2. Să existe o relație liniară între variabile și nu de altă natură, de exemplu exponențială; 3. Variabilele să fie măsurate fără erori (să fie satisfăcută cerința de validitate a măsurării); 4. Variabilele incluse în model să fie măsurate la nivel metric sau să fie variabile fictive (dummy), discutate într-o secțiune anterioară. Regresia, fiind o metodă robustă, uneori se acceptă
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
cei relevanți; 2. Să existe o relație liniară între variabile și nu de altă natură, de exemplu exponențială; 3. Variabilele să fie măsurate fără erori (să fie satisfăcută cerința de validitate a măsurării); 4. Variabilele incluse în model să fie măsurate la nivel metric sau să fie variabile fictive (dummy), discutate într-o secțiune anterioară. Regresia, fiind o metodă robustă, uneori se acceptă includerea unor variabile ordinale în model, însă în mod obligatoriu variabilele nominale trebuie transformate în variabile fictive (variabile
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
întâmpla să existe o corelație bivariată semnificativă între predictor și variabila dependentă și totuși predictorul să nu aibă o influență semnificativă în modelul de regresie multiplă. Aceasta se datorează faptului că în modelul final, impactul unui predictor asupra dependentei este măsurat ținând sub control ceilalți predictori. 4. Se verifică dacă există corelație între predictori și se selectează predictorii, astfel încât să fie independenți între ei. 5. Se construiește modelul de regresie și în continuare se verifică dacă sunt îndeplinite condițiile de aplicare
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
este o variabilă fictivă pentru care valoarea 1 îi desemnează pe cei ce s-au declarat maghiari, și 0 pe restul. CDR are valoarea 1 pentru cei care în 1998 își declarau intenția de a vota cu CDR, iar SUBSCOAL măsoară educația subiectului. Ipotezele formulate se referă, pe de o parte, la influența factorilor ecologici (de mediu), pe de altă parte, și la variabile individuale. Astfel, am presupus că încrederea va fi mai mare în localități mici și în zone multietnice
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]