14,506 matches
-
de a optzecea centilă a vârstei este: P80 = 35 + (80 : 38) × 22= 40,8 ani Interpretare: 80% dintre persoane au vârsta până în 40,8 ani restul peste 40,8 ani. Figura nr. 6.7: Opțiunea pentru centile Exemplu. Am luat variabila nrmem din Barometrul de Opinie Publica mai 2007. S-au calculat cuartilele iar rezultatele sunt prezentate în tabelul de mai jos. 25% dintre persoanele intervievate au declarat că familia lor este compusă din cel mult doi membri, 50% dintre persoanele
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
poate calcula ca raport dintre abaterea standard și medie. Este utilizat pentru verificarea omogenității unei serii: dacă ν este mai mic decât 35-40%, atunci seria este omogenă iar media sa este reprezentativă, este stabilă.20 Figura nr. 6.9: Distribuția variabilei salariu Prin creșterea mediei se mărește dispersia. Cu cât raportul de variație este mai mare, cu atât mai mare este diferențierea dintre subiecți. Dacă o serie este omogenă se poate utiliza media ca indicator al tendinței centrale. Dacă seria este
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
și ne poate induce în eroare. Amplitudinea intercuartilică este diferența dintre cuartila inferioară și cea superioară. Amplitudinea semi-intercuartilică este amplitudinea intercuartilică împărțită în 2. Pentru a face diferențe în funcție de sex am utilizat comanda SPLIT FILE. La această opțiune am introdus variabila sex după care am realizat un tabel cu cuartile și amplitudinea din meniul ANALYZE/DESCRIPTIVE STATISTICS/FREQUENCIES. După ce activăm în fereastra de dialog care apare, Statistics, vom marca Range pentru amplitudine și Quartiles pentru cuartile. Fereastra de dialog va arăta
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
062 Kurtosis 23,328 Std. Error of Kurtosis ,123 Interpretare Skewness= 4,051 este mai mare decât zero, prin urmare curba distribuției este alungită spre dreapta. Cele mai multe dintre persoane au venituri mici. Kurtosis=23,328 este pozitiv. Putem spune că variabila venit are o distribuție mult mai ascuțită decât distribuția normală. Cele mai multe persoane au veniturile doar din anumite categorii, în special până în 1500 ron. O distribuție a frecvențelor poate fi simetrică sau asimetrică (oblică). O distribuție este asimetrică când scorurile tind
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
capăt al scalei. Dacă distribuția este în general simetrică, media poate fi utilizată ca o măsură a tendinței centrale, dar, dacă ea este asimetrică, mediana ar trebui să fie folosită în locul mediei iar în unele cazuri modul. În acest caz, variabila venit nu are o distribuție normală și de aceea cel mai indicat ar fi să folosim mediana și modul. 6.4. Curba distribuției normale Curba distribuției normale este ilustrată în figura nr. 6.14 și figura nr. 6.15. Aceasta
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
asemănătoare modelului teoretic. În timp ce distribuțiile empirice normale sunt asemănătoare modelului teoretic, ca și formă, mediile și abaterile tip diferă în funcție de valorile variabilelor reprezentate de distribuție. Modelul se bazează pe presupuneri teoretice, că axa x este o scală infinită și o variabilă dată este localizată pe o anumită porțiune a axei. Diferențele în deviația standard influențează înclinația curbei. O deviație standard mică indică faptul că observațiile sunt dispuse mai mult în jurul mediei. O deviantă standard mare apare atunci când majoritatea observațiilor sunt la
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
persoane au declarat că au vârsta cuprinsă între 15-45 ani etc. În SPSS se pot realiza frecvențele absolute, relative sau cumulate din meniul ANALYZE/DESCRIPTIVE STATISTICS/FREQUENCIES. Figura nr. 6.17: Opțiunea frequencies Pentru a ilustra un exemplu am luat variabila d2 din Barometrul de opinie publică din luna mai 2007, care măsoară gradul de mulțumire față de felul în care trăiesc persoanele. Valorile de NS și NR au fost declarate valori missing cu comanda MISSING VALUES. Această opțiune se poate bifa
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
față variabila rel1 "Aveți relații / cunoștințe pe care vă puteți baza în caz de boala pentru consultație, tratament, intervenție chirurgicală" cu variantele de răspuns "Da" și "Nu"). Am introdus cea de a doua variabilă la Set colors, în acest exemplu variabila sex. În fereastra de dialog Element Properties, la secțiunea Statistics selectăm de la butonul Statistic funcția pe care dorim să i-o aplicăm variabilei. În exemplul de față am selectat procente (percentage), după care am bifat la Set Parameters: ce fel
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
contingență sunt independente sau nu: 1) Compararea frecvențelor așteptate, calculate cu formula (5) pe baza frecvențelor marginale, cu frecvențele observate. Dacă acestea coincid, înseamnă că variabilele sunt independente. 2) Compararea procentelor pe coloană. Să luăm drept exemplu distribuția celor două variabile i4 a și e1 04. i4 a * e1 04 Crosstabulation e1 04 Total da nu i4 a da Count 85 528 613 % within e1 04 41,9% 30,2% 31,4% nu Count 118 1223 1341 % within e1 04 58,1% 69,8% 68,6% Total Count 203
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
variabilele X și Y în ipoteza că cele două variabile sunt independente. Pentru ca cele două variabile să fie independente este necesar ca în interiorul tabelului să se păstreze una din distribuțiile marginale. În cazul de față, am considerat distribuția marginală a variabilei y comună și pentru fiecare categorie a variabilei x. Tabelul nr. 7.7: Tabel de contingență în ipoteza în care cele două variabile sunt independente Y=Yj\X=Xi 1 2 3 Total 0 4 (40%) 6 (40%) 10 (40
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
celor două măsuri simetrice). Lambda se folosește pentru a măsura asocierea între variabile nominale din trei perspective diferite. Prima măsurare: λ poate fi folosită ca o măsura simetrică a asocierei și în acest caz nici o variabilă nu este tratată ca variabilă independentă. Coeficientul reprezintă o asociere mutuală între două variabile. Măsurarea apare ca simetrică pentru că variabilele de pe coloane pot fi inversate cu cele de pe rânduri în tabelele contingente fără să afecteze valoarea lui λ. A doua măsurare: λr tratează variabila de pe
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
λ. A doua măsurare: λr tratează variabila de pe rândurile din tabel ca variabile dependente. Acest coeficient reprezintă o premăsurare în prezicerea variabilei dependente (care apare pe linie în tabel). A treia măsurare: λc tratează variabilele din tabel, de pe coloană ca variabilă dependenta și variabila de pe linie ca variabilă independentă. λc și λr reprezintă măsuri asimetrice pentru că un coeficient nu este neapărat egal cu altul. Coeficientul presupune prezicerea valorii variabilei dependente după două reguli: Regula 1: prezicem valoarea variabilei dependente după valoarea
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
măsurare: λr tratează variabila de pe rândurile din tabel ca variabile dependente. Acest coeficient reprezintă o premăsurare în prezicerea variabilei dependente (care apare pe linie în tabel). A treia măsurare: λc tratează variabilele din tabel, de pe coloană ca variabilă dependenta și variabila de pe linie ca variabilă independentă. λc și λr reprezintă măsuri asimetrice pentru că un coeficient nu este neapărat egal cu altul. Coeficientul presupune prezicerea valorii variabilei dependente după două reguli: Regula 1: prezicem valoarea variabilei dependente după valoarea modală (valoarea cu
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
din Barometrul de opinie publică, iunie 1998) în care TRUST este o variabilă dihotomică cu valoarea 1 pentru cei ce au încredere puțină și foarte puțină în maghiari și 2 pentru cei ce au încredere multă și foarte multă, iar variabila etnie desemnează etnia respondenților. Count etnie Total român maghiar rrom german alta TRUST 1,00 798 14 6 2 20 840 2,00 219 59 5 3 2 288 Total 1017 73 11 5 22 1128 Conform primei reguli, numărul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Linia orizontală din fiecare dreptunghi indică media. Dacă această linie se află la mijlocul dreptunghiului înseamnă că distribuția este normală. De asemenea, se poate compara înălțimea dreptunghiurilor pentru diferite categorii ale variabilei independente, pentru a vedea diferențele dintre grupuri. Exemplu: distribuțiile variabilei număr de cursuri la care a participat un student pentru persoane de sex masculin și persoane de sex feminin. Se observă că distribuția variabilei număr de cursuri este o distribuție normală în cazul studenților de la profil umanist. În cazul studenților
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
înălțimea dreptunghiurilor pentru diferite categorii ale variabilei independente, pentru a vedea diferențele dintre grupuri. Exemplu: distribuțiile variabilei număr de cursuri la care a participat un student pentru persoane de sex masculin și persoane de sex feminin. Se observă că distribuția variabilei număr de cursuri este o distribuție normală în cazul studenților de la profil umanist. În cazul studenților de la profil tehnic nu se poate vorbi de o distribuție normală a variabilei. Comanda Boxplot are două opțiuni: opțiunea 'factors levels together' permite compararea
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
TEST, iar în fereastra care se deschide vom selecta variabila ce urmează a fi testată (test variable) și cele două grupări pentru care se va calcula media (grouping variable, se indică cele 2 valori care reprezintă grupurile). În cazul nostru variabila test va fi ac3 a: "În general, cam în câte zile dintr-o lună (cu aproximație), utilizați e-mailul?", iar grupările vor fi constituite pe baza variabilei sex cu valori 1 pentru masculin și 2 pentru feminin. Variabilele sunt luate din Barometrul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
calcula media (grouping variable, se indică cele 2 valori care reprezintă grupurile). În cazul nostru variabila test va fi ac3 a: "În general, cam în câte zile dintr-o lună (cu aproximație), utilizați e-mailul?", iar grupările vor fi constituite pe baza variabilei sex cu valori 1 pentru masculin și 2 pentru feminin. Variabilele sunt luate din Barometrul de Opinie Publică, mai 2006. Rezultatul obținut este următorul: Group Statistics rsex N Mean Std. Deviation Std. Error Mean ac3 a masculin 260 10,72 13
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
posibile, putem utiliza comparația dintre media fiecărui sub-eșantion și media totală. Să presupunem, de exemplu, că vrem să aflăm cum diferă media variabilei discutate anterior în funcție de variabila varcat (vârsta pe categorii). Pentru aceasta se sortează și se împarte eșantionul în funcție de variabila vârstă, utilizând comanda SPLIT FILE, iar apoi se folosește testul t pentru un singur eșantion, unde ca valoare test se indică media pe țară calculată pe total eșantion. Vom obține astfel toate comparațiile dintre media pe fiecare categorie de vârstă
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
în cazul nostru 2) și se citește din tabel probabilitatea calculată, care va fi apoi comparată cu nivelul critic de 0,05 sau 0,01. Respingerea ipotezei nule ne indică faptul că eșantioanele diferă din punctul de vedere al distribuției variabilei test. Testul nu ia însă în calcul nici o informație despre magnitudinea acestor diferențe, acest procedeu nefiind de altfel indicat pentru variabile ordinale. 7.8.3.2. Testul Wilcoxon Testul Wilcoxon are o putere mai mare comparativ cu testul semnului, luând
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
nefiind de altfel indicat pentru variabile ordinale. 7.8.3.2. Testul Wilcoxon Testul Wilcoxon are o putere mai mare comparativ cu testul semnului, luând în considerare atât magnitudinea cât și semnul diferențelor. Din această cauză el este aplicabil numai variabilelor măsurate la nivel de interval. Ca și în cazul precedent, ipoteza de nul este aceea că distribuția variabilei în cele două eșantioane este aceeași (sau, în varianta testului calculată de SPSS, că cele două variabile comparate au aceeași distribuție). Modul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
tehnici de dependență și tehnici de independență. Tehnicile de dependență presupun existența unei variabile dependente sau a mai multor variabile dependente, care sunt explicate printr-un set de variabile independente. Tehnicile de dependență sunt folosite pentru a prezice valorile variabilei/variabilelor dependente în funcție de cele independente. Tehnicile de independență nu presupun o variabilă sau un set de variabile dependente, toate variabilele având același statut. Aceste tehnici sunt folosite pentru a identifica structura datelor prin: reducerea variabilelor în diferite dimensiuni; gruparea cazurilor/indivizilor
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
se calculează ca raportul dintre cov(x,y) și dispersia lui x. Valoarea coeficientului indică faptul ca o creștere de o unitate pe scara lui X este însoțită de o creșterea, în medie, cu b unități a lui Y, celelalte variabile fiind ținute sub control. Atenție, coeficienții de regresie nu se interpretează în sens cauzal, ei exprimă covariația dintre variabila dependentă și cea independentă, nefiind posibilă testarea unei relații cauzale. Coeficientul b reprezintă panta dreptei de regresie a lui Y funcție de
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
diferite se folosesc însă coeficienții nestandardizați. Regula de citire pentru coeficienții standardizați (beta) este următoarea: creșterea cu o abatere standard pe scala variabilei independente este însoțită în medie cu o creștere cu beta abateri standard pe scala variabilei dependente, celelalte variabile fiind ținute sub control. 8.1.5.Coeficientul de determinație Așa cum am menționat, scopul construcției unui model de regresie este de a explica variația dependentei. În afară de coeficienții de regresie care măsoară impactul fiecărui predictor, avem nevoie și de o măsură
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
asumă valori de 0 și 1 se numesc variabile fictive (variabile indicatoare, binare, categorice, calitative sau dihotomice). Variabilele fictive pot fi folosite în modele de regresie la fel de ușor ca și variabilele cantitative. De fapt, un model de regresie poate conține variabile explicatorii care sunt exclusiv fictive sau calitative. Asemenea modele sunt numite ANOVA. Ca exemplu, avem următorul model: Unde: = salariul anual al unui profesor universitar i = 1, dacă profesorul este de sex masculin = 0, dacă profesorul este de sex feminin Modelul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]