1,863 matches
-
unele chestiuni vom insista mai mult asupra acestei problematici care dă mari bătăi de cap dacă nu este înțeleasă cum trebuie. O cuantilă este o mărime statistică ce denotă limitele unei fracțiuni (părți) din date. Cea mai simplă cuantilă este mediana. Mediana caracterizează limitele dintre cele două jumătăți egale ale unei serii de date. Putem spune că jumătate din date au valori mai mici decât mediana iar cealaltă jumătate au valori mai mari decât mediana. Dar mediana este o mărime simplă
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
chestiuni vom insista mai mult asupra acestei problematici care dă mari bătăi de cap dacă nu este înțeleasă cum trebuie. O cuantilă este o mărime statistică ce denotă limitele unei fracțiuni (părți) din date. Cea mai simplă cuantilă este mediana. Mediana caracterizează limitele dintre cele două jumătăți egale ale unei serii de date. Putem spune că jumătate din date au valori mai mici decât mediana iar cealaltă jumătate au valori mai mari decât mediana. Dar mediana este o mărime simplă și
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
mărime statistică ce denotă limitele unei fracțiuni (părți) din date. Cea mai simplă cuantilă este mediana. Mediana caracterizează limitele dintre cele două jumătăți egale ale unei serii de date. Putem spune că jumătate din date au valori mai mici decât mediana iar cealaltă jumătate au valori mai mari decât mediana. Dar mediana este o mărime simplă și noi vom avea în vedere mărimile multiple. Cele mai des folosite cuantile multiple sunt: * Cuartilele * Decilele * Centilele Cuartilele Sunt trei cuartile ce împart seria
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
date. Cea mai simplă cuantilă este mediana. Mediana caracterizează limitele dintre cele două jumătăți egale ale unei serii de date. Putem spune că jumătate din date au valori mai mici decât mediana iar cealaltă jumătate au valori mai mari decât mediana. Dar mediana este o mărime simplă și noi vom avea în vedere mărimile multiple. Cele mai des folosite cuantile multiple sunt: * Cuartilele * Decilele * Centilele Cuartilele Sunt trei cuartile ce împart seria de date în patru părți egale. * Cuartila inferioară este
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
mai simplă cuantilă este mediana. Mediana caracterizează limitele dintre cele două jumătăți egale ale unei serii de date. Putem spune că jumătate din date au valori mai mici decât mediana iar cealaltă jumătate au valori mai mari decât mediana. Dar mediana este o mărime simplă și noi vom avea în vedere mărimile multiple. Cele mai des folosite cuantile multiple sunt: * Cuartilele * Decilele * Centilele Cuartilele Sunt trei cuartile ce împart seria de date în patru părți egale. * Cuartila inferioară este prima cuartilă
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
cuantilei superioare va fi egală cu: 3×(7 +1) : 4 = 6 Reprezintă al șaselea număr din secvență. Aceasta înseamnă că 12 reprezintă valoarea cuartilei superioare. Interpretare: 75% dintre studenți au achiziționat produse cu valoarea până în 6 ron. Q2=Memediana Poziția medianei va fi egală cu: 2×(7 +1 ) :4 = 4 Acesta este al patrulea număr din serie. Rezultă că 8 este valoarea medianei. Interpretare: 50% dintre studenți au achiziționat produse cu valoarea până în 4 ron. Prin cunoașterea cuartilelor obținem o imagine
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
valoarea cuartilei superioare. Interpretare: 75% dintre studenți au achiziționat produse cu valoarea până în 6 ron. Q2=Memediana Poziția medianei va fi egală cu: 2×(7 +1 ) :4 = 4 Acesta este al patrulea număr din serie. Rezultă că 8 este valoarea medianei. Interpretare: 50% dintre studenți au achiziționat produse cu valoarea până în 4 ron. Prin cunoașterea cuartilelor obținem o imagine clară despre cum se distribuie datele seriei. Exemplul 2: Serie de date cu frecvențe. Vârsta angajaților unei companii este redată in următorul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
se mărește dispersia. Cu cât raportul de variație este mai mare, cu atât mai mare este diferențierea dintre subiecți. Dacă o serie este omogenă se poate utiliza media ca indicator al tendinței centrale. Dacă seria este eterogenă se va folosi mediana sau modul ca indicatori ai tendinței centrale. Exemplu: Serie de date cu frecvențe Pentru exemplificare, vom construi o situație ipotetică a numărului de vizite făcute la bibliotecă, într-un an universitar de subiecții din grupa de la tabelul nr. 6.5
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
oblic negativă, rezultatele din stânga mediei se extind departe spre stânga, oricum mult mai mult decât cele din dreapta. Dacă este oblic pozitivă rezultatele sunt majoritare pe partea dreaptă a curbei. Când o distribuție este oblică fie la dreapta, fie la stânga media, mediana și modul nu mai coincid. Oblicitatea afectează proporția suprafețelor de dinainte și de după medie astfel încât nu se mai conformează suprafețelor asociate cu unitățile abaterii tip și cu valorile Z ale distribuției standard normale. De exemplu, suprafața pentru o unitate de
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
simetrică sau asimetrică (oblică). O distribuție este asimetrică când scorurile tind să fie grupate la un capăt al scalei. Dacă distribuția este în general simetrică, media poate fi utilizată ca o măsură a tendinței centrale, dar, dacă ea este asimetrică, mediana ar trebui să fie folosită în locul mediei iar în unele cazuri modul. În acest caz, variabila venit nu are o distribuție normală și de aceea cel mai indicat ar fi să folosim mediana și modul. 6.4. Curba distribuției normale
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
tendinței centrale, dar, dacă ea este asimetrică, mediana ar trebui să fie folosită în locul mediei iar în unele cazuri modul. În acest caz, variabila venit nu are o distribuție normală și de aceea cel mai indicat ar fi să folosim mediana și modul. 6.4. Curba distribuției normale Curba distribuției normale este ilustrată în figura nr. 6.14 și figura nr. 6.15. Aceasta este fundamentală pentru analiza statistică. O curbă normală este simetrică având mijlocul egal cu media. Skeweness este
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
mare de a fi alese. De asemenea, cum ne îndepărtăm de centru frecvența observațiilor scade, scăzând și probabilitatea de a fi alese. Distribuția normală este simetrică, astfel încât jumătatea dreaptă a curbei este o reflexie a jumătății stângi. Media, modul și mediana coincid, astfel încât punctul de echilibru (media), punctul de mijloc (mediana) și valoarea cea mai frecventă (modul) a distribuției sunt toate în același punct. Distribuția normală este continuă, încât teoretic vorbind, numărul valorilor variabilelor poate lua valori până la infinit pe axa
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
de centru frecvența observațiilor scade, scăzând și probabilitatea de a fi alese. Distribuția normală este simetrică, astfel încât jumătatea dreaptă a curbei este o reflexie a jumătății stângi. Media, modul și mediana coincid, astfel încât punctul de echilibru (media), punctul de mijloc (mediana) și valoarea cea mai frecventă (modul) a distribuției sunt toate în același punct. Distribuția normală este continuă, încât teoretic vorbind, numărul valorilor variabilelor poate lua valori până la infinit pe axa Ox. Distribuția normală este asimptotică, adică linia curbei nu intersectează
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
pentru grafice tip bare Interpretare. 14,5% dintre persoanele care au răspuns la această întrebare au declarat că sunt deloc mulțumite de felul în care trăiesc. 6.7.3. Grafice din meniul Explore * Boxplots restrânge scorurile variabilei prin dispunerea pe mediană a procentelor de 25 și 75 ca fiind limitele cele mai scăzute și cele mai ridicate ale căsuțelor imediate medianei. Lungimea căsuței reprezintă poziția intercuartilică. Extremele sunt cele care depășesc trei căsuțe. Liniile sunt desenate de la marginea căsuței către valoarea
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
mulțumite de felul în care trăiesc. 6.7.3. Grafice din meniul Explore * Boxplots restrânge scorurile variabilei prin dispunerea pe mediană a procentelor de 25 și 75 ca fiind limitele cele mai scăzute și cele mai ridicate ale căsuțelor imediate medianei. Lungimea căsuței reprezintă poziția intercuartilică. Extremele sunt cele care depășesc trei căsuțe. Liniile sunt desenate de la marginea căsuței către valoarea cea mai mică și cea mai mare. * Boxplots ne permite să luăm un număr de decizii cu privire la distribuția scorurilor. Mediana
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
medianei. Lungimea căsuței reprezintă poziția intercuartilică. Extremele sunt cele care depășesc trei căsuțe. Liniile sunt desenate de la marginea căsuței către valoarea cea mai mică și cea mai mare. * Boxplots ne permite să luăm un număr de decizii cu privire la distribuția scorurilor. Mediana este indicatorul valorii centrale și lungimea căsuței indică variabilitatea scorurilor. Dacă mediana nu este în mijloc, distribuția scorurilor se abate de la distribuția normală. Mediana este reprezentată printr-o linie mai groasă. Se folosește comanda ANALYZE/DESCRIPTIVE STATISTICS/ FREQUENCIES /EXPLORE Figura
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
căsuțe. Liniile sunt desenate de la marginea căsuței către valoarea cea mai mică și cea mai mare. * Boxplots ne permite să luăm un număr de decizii cu privire la distribuția scorurilor. Mediana este indicatorul valorii centrale și lungimea căsuței indică variabilitatea scorurilor. Dacă mediana nu este în mijloc, distribuția scorurilor se abate de la distribuția normală. Mediana este reprezentată printr-o linie mai groasă. Se folosește comanda ANALYZE/DESCRIPTIVE STATISTICS/ FREQUENCIES /EXPLORE Figura nr. 6.26: Opțiunea Explore Pentru a putea identifica variabilele care urmează
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
și cea mai mare. * Boxplots ne permite să luăm un număr de decizii cu privire la distribuția scorurilor. Mediana este indicatorul valorii centrale și lungimea căsuței indică variabilitatea scorurilor. Dacă mediana nu este în mijloc, distribuția scorurilor se abate de la distribuția normală. Mediana este reprezentată printr-o linie mai groasă. Se folosește comanda ANALYZE/DESCRIPTIVE STATISTICS/ FREQUENCIES /EXPLORE Figura nr. 6.26: Opțiunea Explore Pentru a putea identifica variabilele care urmează a fi analizate trebuie să intrăm in Dependent List. Dacă datele formează
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
cazuri care trebuie analizate separat introducem variabilele în Factor List. Când procedura Explore a început, apare output-ul. Dacă vrem să-l edităm, dăm dublu clic pe el și se va deschide o fereastră Chart Editor. Interpretare. Linia groasă reprezintă mediana care nu se află la mijlocul cutiei, prin urmare variabila nu are o distribuție normală. 6.7.4. Grafice din meniul Graphs Pașii de bază în crearea unui grafic din meniul GRAPHS sunt foarte ușor de învățat. Pentru a crea un
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
mulțumiți, nu prea mulțumiți sau destul de mulțumiți. Și la acest tip de variabile se va folosi modul ca indicator al tendinței centrale și entropia sau indicele de variație calitativă. În plus unii autori folosesc ca indicator al tendinței centrale și mediana. Dar apar erori la interpretare deoarece este greu de identificat, rezultatul este imprecis. Cât de mulțumit sunteți de sănătate dvs.? N Valid 1998 Missing 2 Median 3 Mode 3 Modul are valoarea 3 iar acest lucru indică că răspunsul cel
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
categoria codată cu valoare 3, adică cele mai multe persoane au declarat că sunt destul de mulțumiți de starea lor de sănătate. Variabila avea următoarele coduri atașate variantelor de răspuns: 1.deloc mulțumit 2. nu prea mulțumit 3. destul de mulțumit 4. foarte mulțumit Mediana are valoarea de 3, ceea ce conform definiției medianei, indică faptul că jumătatea din persoane au răspuns până în codul 3 ( destul de mulțumiți) și jumătatea peste codul 3 (destul de mulțumiți și foarte mulțumiți). Așa cum am menționat este greu de identificat mediana în
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
au declarat că sunt destul de mulțumiți de starea lor de sănătate. Variabila avea următoarele coduri atașate variantelor de răspuns: 1.deloc mulțumit 2. nu prea mulțumit 3. destul de mulțumit 4. foarte mulțumit Mediana are valoarea de 3, ceea ce conform definiției medianei, indică faptul că jumătatea din persoane au răspuns până în codul 3 ( destul de mulțumiți) și jumătatea peste codul 3 (destul de mulțumiți și foarte mulțumiți). Așa cum am menționat este greu de identificat mediana în cazul variabilelor ordinale. Dacă ne uităm pe tabelul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
mulțumit Mediana are valoarea de 3, ceea ce conform definiției medianei, indică faptul că jumătatea din persoane au răspuns până în codul 3 ( destul de mulțumiți) și jumătatea peste codul 3 (destul de mulțumiți și foarte mulțumiți). Așa cum am menționat este greu de identificat mediana în cazul variabilelor ordinale. Dacă ne uităm pe tabelul de frecvențe vom observa că jumătate din persoane nu au răspuns până în codul 3 ci doar 42,4% dintre persoane au răspuns până în codul 3, restul până la 50% au răspuns cu
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
depășesc procentul de 50%. De aceea acest indicator poate fi folosit dar cu imprecizia și erorile aferente. 6.10. Analiza datelor măsurate pe scală de interval sau raport În analiza descriptivă a acestor variabile se folosesc indicatorii tendinței centrale (media, mediana și modul), mărimile multiple (cuartilele, decilele, centilele), indicatorii care măsoară gradul de împrăștiere a scorurilor față de medie (abaterea standard, varianța, coeficientul de variație). Datorită faptului că aceste variabile pot lua orice valoare într-un anumit interval, nu se vor folosi
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
N Valid 738 Missing 1262 Mean 2,1858 Median 1,5000 Mode 1,00 Percentiles 25 0,8000 50 1,5000 75 3,0000 Interpretare. Media = 2,18 ha; persoanele intervievate au în medie aproximativ 2,18 hectare de pământ. Mediana = 1,5 ha; jumătate din persoane au până într-un hectar și jumătate și jumătate din persoane au peste un hectar jumătate de pământ. Modul = 1; cele mai multe persoane au un hectar de pământ. Cuartila 1 (Q1) = 0,8 ha; 25
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]