17,513 matches
-
fi o mărime evidențiată în mod direct (unul din scoruri) sau o valoare intermediară calculată așa cum am văzut mai sus. Întotdeauna când avem un număr de scoruri, căutăm un scor care să împartă distribuția în două părți egale. În cazul variabilelor ordinale spunem că găsim individul median. Media () sau media aritmetică se obține totalizând scorurile și împărțind suma obținută la numărul de scoruri. Într-o altă exprimare des utilizată media este valoarea care s-ar obține dacă suma valorilor tuturor indivizilor
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
dreapta. Boltirea (Kurtosis) ne arată cât este de ascuțită sau plată cocoașa 3 pentru curba normală b = 0 b > 0 cocoașă înaltă; leptocurtică; b < 0 platicurtică. Cu cât acești indicatori au valori mai depărtate de valoarea zero cu atât distribuția variabilei se abate mai mult la stânga sau la dreapta sau este mai plată sau mai ascuțită. Cu cât valorile acestor indicatori sunt mai apropiate de valoare zero cu atât distribuția variabilei este mai aproape de distribuția normală, fiind simetrică față de medie (media
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
au valori mai depărtate de valoarea zero cu atât distribuția variabilei se abate mai mult la stânga sau la dreapta sau este mai plată sau mai ascuțită. Cu cât valorile acestor indicatori sunt mai apropiate de valoare zero cu atât distribuția variabilei este mai aproape de distribuția normală, fiind simetrică față de medie (media=mediana=modul) O distribuție simetrică este atunci când observațiile din dreapta mediei sunt identice cu cele din stânga ei. Curba normală, o distribuție în formă de clopot, este simetrică dar nu toate distribuțiile
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
leptokurtică. Dacă observațiile sunt relativ departe de medie distribuția devine aproape plată și se numește platikurtică. O distribuție mesokurtică este una care are caracteristicile unei distribuții în formă de clopot a distribuției standard normale. Exemplu. Dacă dorim să analizăm distribuția variabilei venit 1 (venitul deținut de întreaga gospodărie) din Barometrul de opinie 2007, vom apela la acești doi indicatori prezentați mai sus. Vom folosi comanda ANALYZE/DESCRIPTIVE STATISTICS/FREQUENCIES/STATISTICS și vom bifa Skewness și Kurtosis după care vom utiliza comanda
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
FREQUENCIES/STATISTICS și vom bifa Skewness și Kurtosis după care vom utiliza comanda ANALYZE/DESCRIPTIVE STATISTICS/CHARTS și opțiunea With normal curve. Figura nr. 6.12: Opțiunea pentru Skewness și Kurtosis Figura nr. 6.13: Opțiunea pentru graficul distribuției unei variabile Rezultatele din fișierul Output sunt prezentate mai jos. Statistics În luna trecută (septembrie 2007), suma totală de bani obținută de către toți membrii gospodăriei dvs. incluzând salarii, dividende, chirii, vânzări etc., a fost cam de ...? N Valid 1570 Missing 430 Skewness
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
bun Extraordinar Figura nr. 6.15. Curba distribuției normale Es eroarea standard a mediei 2% 13,5% 34%34% 13,5% 2% -3Es -2Es -1Es M 1Es 2Es 3Es Se pot măsura axele orizontale în abaterile standard ale mediei. Toate variabilele cuprinse între -3 deviații standard și +3 deviații standard se distribuie simetric în jurul mediei. Valorile caracteristice curbei normale dau proporția în care crește și descrește curba de la poziția axelor orizontale. Caracteristicile distribuției normale Distribuția normală are următoarele caracteristici: este în
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
reflexie a jumătății stângi. Media, modul și mediana coincid, astfel încât punctul de echilibru (media), punctul de mijloc (mediana) și valoarea cea mai frecventă (modul) a distribuției sunt toate în același punct. Distribuția normală este continuă, încât teoretic vorbind, numărul valorilor variabilelor poate lua valori până la infinit pe axa Ox. Distribuția normală este asimptotică, adică linia curbei nu intersectează niciodată axa Ox. Nu se ajunge niciodată la frecvența 0. Suprafața de sub curbă este egală cu 1 și valoarea (frecvența) pentru orice observație
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
dedesubt, atunci se poate afirma că 95% din observații sunt mai puțin importante și 5% cu mult mai importante decât valoarea observată. Probabilitatea distribuției normale este un model teoretic la care s-a ajuns matematic. El este util pentru că multe variabile întâlnite în lumea empirică au distribuțiile frecvenței asemănătoare modelului teoretic. În timp ce distribuțiile empirice normale sunt asemănătoare modelului teoretic, ca și formă, mediile și abaterile tip diferă în funcție de valorile variabilelor reprezentate de distribuție. Modelul se bazează pe presupuneri teoretice, că axa
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
la care s-a ajuns matematic. El este util pentru că multe variabile întâlnite în lumea empirică au distribuțiile frecvenței asemănătoare modelului teoretic. În timp ce distribuțiile empirice normale sunt asemănătoare modelului teoretic, ca și formă, mediile și abaterile tip diferă în funcție de valorile variabilelor reprezentate de distribuție. Modelul se bazează pe presupuneri teoretice, că axa x este o scală infinită și o variabilă dată este localizată pe o anumită porțiune a axei. Diferențele în deviația standard influențează înclinația curbei. O deviație standard mică indică
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
teoretic. Importanța modelului teoretic este că aria curbei de deasupra și de dedesubtul oricărei observații din intervalul unei scale poate fi determinată și astfel putem afla probabilitatea observației. Pentru că distribuția empirică doar aproximează forma modelului teoretic, suprafața asociată cu valorile variabilelor empirice fluctuează de la o variabilă la alta. Din fericire pot fi evitate erorile de calcul prin transformarea valorii variabilelor empirice într-o scală standard. 6.5. Scorurile Z Când o serie de scoruri este transformată astfel încât media are valoarea 0
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
că aria curbei de deasupra și de dedesubtul oricărei observații din intervalul unei scale poate fi determinată și astfel putem afla probabilitatea observației. Pentru că distribuția empirică doar aproximează forma modelului teoretic, suprafața asociată cu valorile variabilelor empirice fluctuează de la o variabilă la alta. Din fericire pot fi evitate erorile de calcul prin transformarea valorii variabilelor empirice într-o scală standard. 6.5. Scorurile Z Când o serie de scoruri este transformată astfel încât media are valoarea 0 și deviația standard are valoarea
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
poate fi determinată și astfel putem afla probabilitatea observației. Pentru că distribuția empirică doar aproximează forma modelului teoretic, suprafața asociată cu valorile variabilelor empirice fluctuează de la o variabilă la alta. Din fericire pot fi evitate erorile de calcul prin transformarea valorii variabilelor empirice într-o scală standard. 6.5. Scorurile Z Când o serie de scoruri este transformată astfel încât media are valoarea 0 și deviația standard are valoarea 1, scorul este cunoscut ca scor Z. Avantajul scorului Z este că ne spune
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
numărul de indivizi statistici care populează fiecare clasă a caracteristicii. Tabelul nr. 6.7: Serie de date cu frecvențe Clase A1 A2 .... As Total Frecvențe K1 K2 .... Ks n Tabelul nr. 6.8: Serie de date cu frecvențe în cazul variabilelor discrete Nr. persoane din gospodărie 1 2 3 4 5 și peste Total Frecvențe (numărul gospodăriilor care au specificat numărul respectiv de membri din gospodărie) 35 60 20 15 20 150 Interpretare: 35 de persoane au declarat că gospodăria lor
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
de membri din gospodărie) 35 60 20 15 20 150 Interpretare: 35 de persoane au declarat că gospodăria lor este compusă dintr-un membru, 60 de persoane au declarat că gospodăria lor este compusă din două persoane etc. În cazul variabilelor continue, unde se atribuie orice valoare într-un interval anume, tabelul de frecvențe se prezintă astfel: Tabelul nr. 6.9: Serie de date cu frecvențe în cazul variabilelor continue Vârsta 18-29 30-39 40-49 50-59 60 și peste Total Frecvența 30
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
declarat că gospodăria lor este compusă din două persoane etc. În cazul variabilelor continue, unde se atribuie orice valoare într-un interval anume, tabelul de frecvențe se prezintă astfel: Tabelul nr. 6.9: Serie de date cu frecvențe în cazul variabilelor continue Vârsta 18-29 30-39 40-49 50-59 60 și peste Total Frecvența 30 25 20 35 40 150 Interpretare: 30 de persoane au declarat că au vârsta cuprinsă în intervalul 18-29 ani, 25 de persoane au declarat că au vârsta cuprinsă
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
de opinie publică din luna mai 2007, care măsoară gradul de mulțumire față de felul în care trăiesc persoanele. Valorile de NS și NR au fost declarate valori missing cu comanda MISSING VALUES. Această opțiune se poate bifa dând clic pe variabila analizată din fișierul VARIABLE VIEW. La Discrete missing values sau introdus cifrele 8 și 9 deoarece acesta valori reprezintă codurile pentru variantele de răspuns NS și NR. Figura nr. 6.18: Opțiunea missing values Rezultatele din fișierul Output sunt prezentate
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
fișier se poate deschide ulterior și să aplicăm toate comenzile sau o parte din comenzile salvate. Acest tip de fișier este foarte util atunci când avem de realizat același set de prelucrări pe mai multe baze de date care conțin aceleași variabile. Dacă avem o bază de date referitoare la intențiile de vot realizată pe zece localități dintr-un județ, vom face pe o bază de date toate prelucrările necesare după care se vor salva toate comenzile într-un fișier Syntax. Pentru
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
un fișier Syntax. Pentru a face prelucrări și pe celelalte nouă localități vom deschide fișierul Syntax și vom rula comenzile, salvând astfel foarte mult timp și efort depus în prelucrarea datelor. Exemplu. Dorim să realizăm un tabel cu frecvențe la variabila analizată mai sus (d2). Vom intra în meniul ANALYZE/DESCRIPTIVE STATISTICS/FREQUENCIES vom selecta variabila iar apoi vom bifa opțiunea PASTE. Figura nr. 6.22: Procedura frecvențelor obținută în Syntax Figura nr. 6.23: Procedura frecvențelor obținută în Syntax-formatul comenzii
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Syntax și vom rula comenzile, salvând astfel foarte mult timp și efort depus în prelucrarea datelor. Exemplu. Dorim să realizăm un tabel cu frecvențe la variabila analizată mai sus (d2). Vom intra în meniul ANALYZE/DESCRIPTIVE STATISTICS/FREQUENCIES vom selecta variabila iar apoi vom bifa opțiunea PASTE. Figura nr. 6.22: Procedura frecvențelor obținută în Syntax Figura nr. 6.23: Procedura frecvențelor obținută în Syntax-formatul comenzii 6.7. Reprezentarea grafică a datelor 6.7.1. Histogramele din meniul Frequencies Distribuția frecvențelor
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
7. Reprezentarea grafică a datelor 6.7.1. Histogramele din meniul Frequencies Distribuția frecvențelor arată de câte ori se repetă scorul într-un set de scoruri. Histogramele și graficele tip bară afișează grafic distribuirea frecvențelor scorurilor. O histogramă va fi folosită pentru variabilele continue, iar un grafic tip bară se pretează pentru o variabilă discontinuă. Într-un grafic tip bară, barele sunt separate pentru a indica faptul că ele reprezintă categorii diferite. În SPSS, orice categorie care este nulă (are o frecvență zero
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Frequencies Distribuția frecvențelor arată de câte ori se repetă scorul într-un set de scoruri. Histogramele și graficele tip bară afișează grafic distribuirea frecvențelor scorurilor. O histogramă va fi folosită pentru variabilele continue, iar un grafic tip bară se pretează pentru o variabilă discontinuă. Într-un grafic tip bară, barele sunt separate pentru a indica faptul că ele reprezintă categorii diferite. În SPSS, orice categorie care este nulă (are o frecvență zero) nu va fi prezentată într-un grafic tip bară. În SPSS
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
și With normal curve pentru a estima distribuția normală. Fereastra de dialog va arăta în modul următor: Figura nr. 6.24: Fereastra de dialog pentru grafice tip bară Pentru cazul de mai sus avem: Graficul ne arată o distribuție a variabilei mai ascuțită la valori ale variabilei până în valoarea de 2 ha. Cu alte cuvinte cele mai multe persoane au pământ până în 2 hectare. Dar pentru o identificare precisă a normalității distribuției variabilei se vor folosi testele de normalitate care vor fi prezentate
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
estima distribuția normală. Fereastra de dialog va arăta în modul următor: Figura nr. 6.24: Fereastra de dialog pentru grafice tip bară Pentru cazul de mai sus avem: Graficul ne arată o distribuție a variabilei mai ascuțită la valori ale variabilei până în valoarea de 2 ha. Cu alte cuvinte cele mai multe persoane au pământ până în 2 hectare. Dar pentru o identificare precisă a normalității distribuției variabilei se vor folosi testele de normalitate care vor fi prezentate la capitolul de teste. Reprezentarea grafică
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
de mai sus avem: Graficul ne arată o distribuție a variabilei mai ascuțită la valori ale variabilei până în valoarea de 2 ha. Cu alte cuvinte cele mai multe persoane au pământ până în 2 hectare. Dar pentru o identificare precisă a normalității distribuției variabilei se vor folosi testele de normalitate care vor fi prezentate la capitolul de teste. Reprezentarea grafică are rolul doar de vizualizare, pentru a înțelege mai bine tipul de distribuție. 6.7.2. Grafice tip bară din meniul Frequencies În SPSS
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
25: Fereastra de dialog pentru grafice tip bare Interpretare. 14,5% dintre persoanele care au răspuns la această întrebare au declarat că sunt deloc mulțumite de felul în care trăiesc. 6.7.3. Grafice din meniul Explore * Boxplots restrânge scorurile variabilei prin dispunerea pe mediană a procentelor de 25 și 75 ca fiind limitele cele mai scăzute și cele mai ridicate ale căsuțelor imediate medianei. Lungimea căsuței reprezintă poziția intercuartilică. Extremele sunt cele care depășesc trei căsuțe. Liniile sunt desenate de la
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]