26,035 matches
-
un lac, numărul celor care vând droguri în Baton Rouge). În alte cazuri, este posibil să dorim să folosim datele despre eșantion pentru a testa ipoteze despre populație. Deseori ipotezele testate sunt despre asocierea sau relația dintre mai multe variabile măsurate la fiecare individ din eșantion. Ancheta pe bază de eșantion este compusă din design-ul eșantionului (care indivizi din populație sunt observați sau intervievați și cum vor fi folosite datele pentru a face inferențe) și instrumentul cercetării (cum se fac
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
și E(X) = 1(0.27) + 2(0.73) = 1.73. Putem calcula în același mod varianțele pentru fiecare variabilă întâmplătoare astfel: Var(X) = 1.2 și Var(X) = (1-1.73) (0.27) + (2-1.73) (0.73) = 0.1971. Covarianța măsoară dependența lineară dintre două variabile întâmplătoare: Cov= Ar trebui să observați și să verificați că Cov(X,X) = Cov(X,X) și Cov(X,X) = Var(X). Dacă cele două variabile întâmplătoare sunt independente, atunci Cov(X,X) = 0. Reciproca
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
suma dublă leagă cele două covarianțe și le înmulțește cu 2 pentru că covarianța lui X cu X este aceeași cu covarianța lui X cu X 3.4. Estimarea parametrilor la nivelul populației De cele mai multe ori în științele sociale variabilele sunt măsurate la nivelul unui eșantion extras din populația studiată, din motive practice nefiind posibilă măsurarea lor în întreaga populație. Este esențial să distingem între distribuția variabilei la nivelul eșantionului denumită în continuare statistică și distribuția în populație denumită parametru. O dată măsurată
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
variabilelor (răspunsurile pe care subiecții le-au dat la aceste întrebări). De exemplu, dacă avem două variabile, sex (cu valorile "bărbat" sau "femeie") și vârsta (cu valori de la 18 până la 90) și trei subiecți pentru care aceste variabile au fost măsurate, baza de date va arăta în modul următor: Id (nrchest) Sex Vârsta 1 bărbat 18 2 femeie 20 3 femeie 55 Figura nr. 4.2: Exemplu de fișier de date Numele variabilelor este definit practic în fișierul Variable View, unde
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
tipuri cantitative este aceea că variabilele de interval au un punct zero arbitrar, iar cele de raport un punct zero real (de exemplu vârsta, anii de educație au un punct zero real, dar nu coeficientul de inteligență IQ care este măsurat la nivel de interval). 4.4.3. Etichete După ce am definit numele și tipul variabilei urmează definirea etichetelor. Etichetele sunt expresii verbale sau numerice care explicitează numele sau valorile variabilei. Să luăm drept exemplu următoarea întrebare: A1 Credeți că în
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
variabile În fereastra prezentată în figura nr. 4.13 vom selecta din stânga variabila care are deja definite etichetele (materi a), iar în dreapta vom selecta setul de variabile cărora trebuie să le definim aceleași etichete (de la materi b până la materi j). Toate aceste variabile măsoară situația materială a gospodăriei, unde subiecții erau întrebați în legătura cu posesia unor bunuri iar variantele de răspuns la întrebări sunt aceleași: 1-Familia mea are deja; 2-Da, aș dori; 3-Nu, nu aș dori. Prin urmare dorim ca toate variabilele să
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
permit definirea unor intervale. Astfel, în loc să enumerăm toate valorile pe care variabila vârsta de exemplu le poate lua, desemnăm doar limitele intervalului. LO desemnează valoarea minimă, HI valoarea maximă, iar THRU "de la, până la". Exemplul 3: Dorim să recodăm variabila vârstă (măsurată în ani) într-o nouă variabilă care are doar trei valori: 1 (pentru cei până la 34 de ani), 2 (pentru cei între 35-54 de ani), și 3 (pentru cei peste 54 de ani). Comanda este următoarea: Comanda este următoarea: RECODE
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
de date noua variabilă creată, sex codat, cu valori de 1 și 2. Etichetele vor fi definite automat: 1-feminin; 2-masculin. Figura nr. 5.4: Fereastra Automatic Recode-variabilă de tip string Exemplul 2: Avem o variabilă cantitativă, de interval, număr carți. Această variabilă măsoară numărul de cărți citite de studenți în timpul facultății. Aplicând comanda AUTOMATIC RECODE și opțiunea Highest value, scorurile variabilei vor fi modificate astfel încât cel mai mare scor va fi schimbat cu 1, al doilea cu 2, al treilea cu 3, etc.
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
capitolul următor) folosind ANALYZE/ MULTIPLE RESPONSES/ CROSSTABS. Exemplu 1: Există următoarea întrebare în chestionar "În ce fel de asociație sunteți membru?" (Barometrul de Opinie Publica iunie 1998) Pentru această întrebare în baza de date au fost create zece variabile, care măsurau apartenența la diverse asociații. Din aceste variabile s-a creat o variabilă nouă pe care am denumit-o asociat, care măsoară gradul de activism al persoanelor intervievate. Fiecare din cele 10 variabile avea ca variante de răspunsuri codul 1 "Da
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Barometrul de Opinie Publica iunie 1998) Pentru această întrebare în baza de date au fost create zece variabile, care măsurau apartenența la diverse asociații. Din aceste variabile s-a creat o variabilă nouă pe care am denumit-o asociat, care măsoară gradul de activism al persoanelor intervievate. Fiecare din cele 10 variabile avea ca variante de răspunsuri codul 1 "Da" (este membru în respectiva asociație) și codul 2 "Nu" (nu este membru în respectiva asociație). Pentru conturarea noii variabile s-a
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
și numere pentru a crea o nouă variabilă. Spre deosebire de comanda RECODE permite folosirea mai multor variabile pentru construcția noii variabile. Sintaxa comenzii este: COMPUTE nume var = expresie matematică. Să o ilustrăm cu un exemplu. Să presupunem că într-o cercetare s-au măsurat venitul pe gospodărie (ven) și numărul de membri pe gospodărie (nr mem) și se dorește aflarea venitului mediu pe gospodărie (venm). Comanda corespunzătoare este: COMPUTE venm=ven/nrmem. Prin această comandă se va construi o nouă variabilă egală cu raportul dintre
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
care intenționează să voteze sau nu. Să presupunem că dorim să facem prelucrări doar pe acele persoane care intenționează să voteze cu PRM. Vom apela la comanda SELECT CASES, la opțiunea IF și acolo vom selecta variabila "aleg" =3 (care măsoară intenția de vot cu un anumit partid, iar PRM are codul 3). După ce am scris această comanda la opțiunea IF, vom bifa Deleted la opțiunea Unselected Cases Are. Astfel toate persoanele care nu au votat cu PRM vor fi șterse
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
6.3. Indicatori de dispersie Indicatorii de dispersie reflectă gradul de inegalitate între indivizi. Se referă la reproducerea gradului de determinare, de variabilitate al unui fenomen. Indicatorii de dispersie reprezintă măsura în care indivizii se dispersează pe scala de valori; măsoară inegalitățile dintre indivizi (ex. veniturile indicatorul de dispersie relevă imediat inegalitățile existente. Putem vorbi de următorii indicatori: * Amplitudinea (A) A = xmax xmin diferența dintre cea mai mare și cea mai mică valoare. * Abaterea intercuartilă (I) Considerăm șirul populației definit între
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
8,35 69,7 25 14,65 10,35 107,1 În cazul de față vom folosi prima formulă deoarece nu avem o serie cu frecvențe, iar n este dat de numărul studenților care au achiziționat produse (20) * Abaterea standard Măsoară gradul de eterogenitate sau de dispersie față de medie. Cu cât are o valoare mai mare cu atât seria este mai eterogenă. Se notează cu sigma și este radical din dispersie sau atunci când se lucrează cu o serie de date cu
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Foarte scăzut Scăzut Sub medie Peste medie Bun Foarte bun Extraordinar Figura nr. 6.15. Curba distribuției normale Es eroarea standard a mediei 2% 13,5% 34%34% 13,5% 2% -3Es -2Es -1Es M 1Es 2Es 3Es Se pot măsura axele orizontale în abaterile standard ale mediei. Toate variabilele cuprinse între -3 deviații standard și +3 deviații standard se distribuie simetric în jurul mediei. Valorile caracteristice curbei normale dau proporția în care crește și descrește curba de la poziția axelor orizontale. Caracteristicile
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
SPSS se pot realiza frecvențele absolute, relative sau cumulate din meniul ANALYZE/DESCRIPTIVE STATISTICS/FREQUENCIES. Figura nr. 6.17: Opțiunea frequencies Pentru a ilustra un exemplu am luat variabila d2 din Barometrul de opinie publică din luna mai 2007, care măsoară gradul de mulțumire față de felul în care trăiesc persoanele. Valorile de NS și NR au fost declarate valori missing cu comanda MISSING VALUES. Această opțiune se poate bifa dând clic pe variabila analizată din fișierul VARIABLE VIEW. La Discrete missing
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
în meniul ELEMENTS/SHOW DATA LABELS. Pentru a schimba culorile barelor vom selecta barele din grafic iar în meniul principal se găsesc culorile. Culorile se vor schimba prin selectarea culorilor. Figura nr. 6.30: Editarea graficelor 6.8. Analiza datelor măsurate pe scală nominală Scala nominală este cea mai simplă în ierarhia scalelor după complexitatea lor ceea ce face posibil un număr restrâns de prelucrări statistice. În analiza univariată a variabilelor măsurate pe scală nominală, care presupune descrierea variabilelor utilizate, se pot
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Figura nr. 6.30: Editarea graficelor 6.8. Analiza datelor măsurate pe scală nominală Scala nominală este cea mai simplă în ierarhia scalelor după complexitatea lor ceea ce face posibil un număr restrâns de prelucrări statistice. În analiza univariată a variabilelor măsurate pe scală nominală, care presupune descrierea variabilelor utilizate, se pot utiliza graficele sau tabelele cu o variabilă. Graficele utilizate pot fi de tip "bare", "linii" sau "plăcintă" . Atât realizarea tabelelor cu o variabilă cât și realizarea graficelor au fost prezentate
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
sau procente valide (frecvențe relative, eliminându-se din total eșantion persoanele care au răspuns cu NS/NR). Deși SPSS-ul va afișa în tabel și frecvențele cumulate, interpretarea lor nu are sens la variabilele nominale. Dacă luăm variabila nominală care măsoară tipul de prieteni ai subiecților intervievați, vom avea în SPSS următorul tabel de frecvențe: Interpretare. Din total persoane intervievate 925 persoane au declarat că prietenii lor sunt reprezentați de rude, acest număr reprezentând 46,3% din total persoane intervievate și
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
frecvențe observate) Număr persoane care ar fi trebuit să fie în fiecare categorie (frecvențe așteptate) 1-Ursus 8 11 2-Ciucaș 20 11 3-Bergenbier 8 10 4-Stela Artois 7 10 5-Carlsberg 9 10 Total 52 persoane 52 persoane 6.9. Analiza datelor măsurate pe scală ordinală În analiza datelor măsurate la nivel ordinal se pot utiliza tabele de frecvențe și graficele de tip "bară", "linii" sau "plăcintă" ca și în cazul variabilelor nominale. Prezentarea sub formă de tabel a datelor ordinale conține în
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
trebuit să fie în fiecare categorie (frecvențe așteptate) 1-Ursus 8 11 2-Ciucaș 20 11 3-Bergenbier 8 10 4-Stela Artois 7 10 5-Carlsberg 9 10 Total 52 persoane 52 persoane 6.9. Analiza datelor măsurate pe scală ordinală În analiza datelor măsurate la nivel ordinal se pot utiliza tabele de frecvențe și graficele de tip "bară", "linii" sau "plăcintă" ca și în cazul variabilelor nominale. Prezentarea sub formă de tabel a datelor ordinale conține în plus, față de prezentarea datelor nominale, frecvențele cumulate
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
au răspuns cu codul 3, dar sunt și o parte din persoane care au răspuns cu acest cod și depășesc procentul de 50%. De aceea acest indicator poate fi folosit dar cu imprecizia și erorile aferente. 6.10. Analiza datelor măsurate pe scală de interval sau raport În analiza descriptivă a acestor variabile se folosesc indicatorii tendinței centrale (media, mediana și modul), mărimile multiple (cuartilele, decilele, centilele), indicatorii care măsoară gradul de împrăștiere a scorurilor față de medie (abaterea standard, varianța, coeficientul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
folosit dar cu imprecizia și erorile aferente. 6.10. Analiza datelor măsurate pe scală de interval sau raport În analiza descriptivă a acestor variabile se folosesc indicatorii tendinței centrale (media, mediana și modul), mărimile multiple (cuartilele, decilele, centilele), indicatorii care măsoară gradul de împrăștiere a scorurilor față de medie (abaterea standard, varianța, coeficientul de variație). Datorită faptului că aceste variabile pot lua orice valoare într-un anumit interval, nu se vor folosi tabele de frecvențe ci doar grafice de tip "histogramă" sau
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
declarat același lucru. 7.1.2 Tabele de contingență pentru variabile nominale și ordinale Tabelele de contingență reprezintă un mod de a clasifică indivizii simultan, în funcție de două sau mai multe caracteristici ale populației studiate. Tabelele se folosesc atunci când caracteristicile sunt măsurate la nivel nominal sau ordinal și au un număr redus de categorii ale variabilei, acest lucru facilitând citirea și interpretarea datelor. Un caz special îl reprezintă variabilele dihotomice care pot lua două valori, notate de obicei cu 1 și 0
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
relația: În acest caz, într-o clasă a lui A nu obținem nici o informație în plus despre B față de ceea ce știam de la început. În tabelul de independență variabilele sunt independente, așadar, conform condiției generale de independență statistică se verifică relația: Măsurăm distanța dintre tabelul nostru și cel de independență astfel: se citește hi pătrat și măsoară diferența dintre frecvențele empirice și frecvențele teoretice. Indicii de asociere iau valori între [0, 1] sau [-1, 1]. Pentru variabilele nominale/categoriale nu dăm semn
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]