51,240 matches
-
număr din serie. Rezultă că 8 este valoarea medianei. Interpretare: 50% dintre studenți au achiziționat produse cu valoarea până în 4 ron. Prin cunoașterea cuartilelor obținem o imagine clară despre cum se distribuie datele seriei. Exemplul 2: Serie de date cu frecvențe. Vârsta angajaților unei companii este redată in următorul tabel: Tabelul nr. 6.4: Distribuția angajaților unei companii în funcție de vârstă Vârsta Frecvența ki între 15 -25 30 între 25 -35 76 între 35 -45 38 între 45 -55 10 între 55
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Prin cunoașterea cuartilelor obținem o imagine clară despre cum se distribuie datele seriei. Exemplul 2: Serie de date cu frecvențe. Vârsta angajaților unei companii este redată in următorul tabel: Tabelul nr. 6.4: Distribuția angajaților unei companii în funcție de vârstă Vârsta Frecvența ki între 15 -25 30 între 25 -35 76 între 35 -45 38 între 45 -55 10 între 55 -65 5 TOTAL (n) 159 Avem un total de 159 de angajați și dacă îi înșiruim în funcție de vârstă, poziția cuantilei inferioare
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
6 13 Valoarea decilei a șasea D6 este 26 ron, deoarece este a treisprezecea valoare din serie. Interpretare: 60% dintre studenți au achiziționat produse până în 26 ron, deoarece valoarea a șasea este 26 ron. Exemplul 2: Seria de date cu frecvențe. Luăm aceeași serie de date din tabelul nr 7.7 și dorim să calculăm decila a patra, D4. Poziția va fi egală cu: 4× (159 +1) : 10 = 64. Itemul șaizeci și patru va reprezenta decila a patra. Aceasta va fi
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
și în acest fel sunt ignorate foarte multe numere. * Varianța Denumită și dispersie, se definește ca fiind pătratul mediu al abaterilor valorilor observate de la media lor și are următoarea formulă: sau atunci când se lucrează cu o serie de date cu frecvențe Varianța este un index matematic al gradului în care scorurile deviază de la medie (sau sunt în varianță cu ea). O varianță mică indică faptul că majoritatea scorurilor distribuției se așează destul de aproape de medie; dacă este mare, atunci scorurile sunt împrăștiate
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
este mare, atunci scorurile sunt împrăștiate mult. Deci, varianța este direct proporțională cu gradul de dispersie. Pentru a calcula varianța unei distribuții, media este scăzută din fiecare scor. Diferența se ridică la pătrat, apoi se împarte suma pătratelor la n = frecvența cu care apare o valoare = valorile seriei de date = media valorilor n = numărul persoanelor/ valorilor Tabelul nr. 6.5 Calcularea varianței Prețul cu care au fost achiziționate diverse produse de studenți xi Media prețurilor Diferența dintre fiecare preț și media
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
65 6,35 40,3 21 14,65 6,35 40,3 23 14,65 8,35 69,7 25 14,65 10,35 107,1 În cazul de față vom folosi prima formulă deoarece nu avem o serie cu frecvențe, iar n este dat de numărul studenților care au achiziționat produse (20) * Abaterea standard Măsoară gradul de eterogenitate sau de dispersie față de medie. Cu cât are o valoare mai mare cu atât seria este mai eterogenă. Se notează cu sigma
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
gradul de eterogenitate sau de dispersie față de medie. Cu cât are o valoare mai mare cu atât seria este mai eterogenă. Se notează cu sigma și este radical din dispersie sau atunci când se lucrează cu o serie de date cu frecvențe Figura nr. 6.8: Curbe de frecvențe Noțiunile de varianță si deviație standard sunt mai ușor de înțeles dacă sunt vizualizate. Figura nr. 6.8. conține două seturi de curbe de frecvență. Care dintre curbele din figură au deviație standard
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
medie. Cu cât are o valoare mai mare cu atât seria este mai eterogenă. Se notează cu sigma și este radical din dispersie sau atunci când se lucrează cu o serie de date cu frecvențe Figura nr. 6.8: Curbe de frecvențe Noțiunile de varianță si deviație standard sunt mai ușor de înțeles dacă sunt vizualizate. Figura nr. 6.8. conține două seturi de curbe de frecvență. Care dintre curbele din figură au deviație standard și varianță mai mare? Dintre curba A
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
se lucrează cu o serie de date cu frecvențe Figura nr. 6.8: Curbe de frecvențe Noțiunile de varianță si deviație standard sunt mai ușor de înțeles dacă sunt vizualizate. Figura nr. 6.8. conține două seturi de curbe de frecvență. Care dintre curbele din figură au deviație standard și varianță mai mare? Dintre curba A și B, distribuția valorilor din curba A este mai eterogenă, are o deviație standard mai mare de la medie. Dintre curba C și D, distribuția valorilor
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
mai mare este diferențierea dintre subiecți. Dacă o serie este omogenă se poate utiliza media ca indicator al tendinței centrale. Dacă seria este eterogenă se va folosi mediana sau modul ca indicatori ai tendinței centrale. Exemplu: Serie de date cu frecvențe Pentru exemplificare, vom construi o situație ipotetică a numărului de vizite făcute la bibliotecă, într-un an universitar de subiecții din grupa de la tabelul nr. 6.5, prezentând situația discriminat pe sexe. Tabelul nr. 6.6: Vizitarea bibliotecii de către studenți
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
dintre persoane au venituri mici. Kurtosis=23,328 este pozitiv. Putem spune că variabila venit are o distribuție mult mai ascuțită decât distribuția normală. Cele mai multe persoane au veniturile doar din anumite categorii, în special până în 1500 ron. O distribuție a frecvențelor poate fi simetrică sau asimetrică (oblică). O distribuție este asimetrică când scorurile tind să fie grupate la un capăt al scalei. Dacă distribuția este în general simetrică, media poate fi utilizată ca o măsură a tendinței centrale, dar, dacă ea
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
proporția în care crește și descrește curba de la poziția axelor orizontale. Caracteristicile distribuției normale Distribuția normală are următoarele caracteristici: este în formă de clopot, cu observațiile cele mai frecvente în punctul de mijloc, iar spre stânga și dreapta centrului distribuției frecvențele se diminuează în număr. Pentru că observațiile din centru sunt cele mai frecvente, au și probabilitatea cea mai mare de a fi alese. De asemenea, cum ne îndepărtăm de centru frecvența observațiilor scade, scăzând și probabilitatea de a fi alese. Distribuția
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
punctul de mijloc, iar spre stânga și dreapta centrului distribuției frecvențele se diminuează în număr. Pentru că observațiile din centru sunt cele mai frecvente, au și probabilitatea cea mai mare de a fi alese. De asemenea, cum ne îndepărtăm de centru frecvența observațiilor scade, scăzând și probabilitatea de a fi alese. Distribuția normală este simetrică, astfel încât jumătatea dreaptă a curbei este o reflexie a jumătății stângi. Media, modul și mediana coincid, astfel încât punctul de echilibru (media), punctul de mijloc (mediana) și valoarea
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
sunt toate în același punct. Distribuția normală este continuă, încât teoretic vorbind, numărul valorilor variabilelor poate lua valori până la infinit pe axa Ox. Distribuția normală este asimptotică, adică linia curbei nu intersectează niciodată axa Ox. Nu se ajunge niciodată la frecvența 0. Suprafața de sub curbă este egală cu 1 și valoarea (frecvența) pentru orice observație x împarte suprafața curbei în două părți; cele două parți sunt reprezentate ca proporții de 1.00 și suma lor este întotdeauna egală cu 1.00
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
vorbind, numărul valorilor variabilelor poate lua valori până la infinit pe axa Ox. Distribuția normală este asimptotică, adică linia curbei nu intersectează niciodată axa Ox. Nu se ajunge niciodată la frecvența 0. Suprafața de sub curbă este egală cu 1 și valoarea (frecvența) pentru orice observație x împarte suprafața curbei în două părți; cele două parți sunt reprezentate ca proporții de 1.00 și suma lor este întotdeauna egală cu 1.00. Cu cât știm mai bine proporțiile cu atât ne putem mai
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
din observații sunt mai puțin importante și 5% cu mult mai importante decât valoarea observată. Probabilitatea distribuției normale este un model teoretic la care s-a ajuns matematic. El este util pentru că multe variabile întâlnite în lumea empirică au distribuțiile frecvenței asemănătoare modelului teoretic. În timp ce distribuțiile empirice normale sunt asemănătoare modelului teoretic, ca și formă, mediile și abaterile tip diferă în funcție de valorile variabilelor reprezentate de distribuție. Modelul se bazează pe presupuneri teoretice, că axa x este o scală infinită și o
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
între limitele de 50 +/2 erori standard = 50 +/-3; i.e. între 47 și 53. Astfel, cu o probabilitate de 95% corespunzător intervalului de încredere putem spune că este 95% probabil că adevărata medie este între limitele specificate. 6.6. Distribuția frecvențelor Frecvența absolută reprezintă numărul de indivizi statistici care populează fiecare clasă a caracteristicii. Tabelul nr. 6.7: Serie de date cu frecvențe Clase A1 A2 .... As Total Frecvențe K1 K2 .... Ks n Tabelul nr. 6.8: Serie de date cu
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
limitele de 50 +/2 erori standard = 50 +/-3; i.e. între 47 și 53. Astfel, cu o probabilitate de 95% corespunzător intervalului de încredere putem spune că este 95% probabil că adevărata medie este între limitele specificate. 6.6. Distribuția frecvențelor Frecvența absolută reprezintă numărul de indivizi statistici care populează fiecare clasă a caracteristicii. Tabelul nr. 6.7: Serie de date cu frecvențe Clase A1 A2 .... As Total Frecvențe K1 K2 .... Ks n Tabelul nr. 6.8: Serie de date cu frecvențe
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
de încredere putem spune că este 95% probabil că adevărata medie este între limitele specificate. 6.6. Distribuția frecvențelor Frecvența absolută reprezintă numărul de indivizi statistici care populează fiecare clasă a caracteristicii. Tabelul nr. 6.7: Serie de date cu frecvențe Clase A1 A2 .... As Total Frecvențe K1 K2 .... Ks n Tabelul nr. 6.8: Serie de date cu frecvențe în cazul variabilelor discrete Nr. persoane din gospodărie 1 2 3 4 5 și peste Total Frecvențe (numărul gospodăriilor care au
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
95% probabil că adevărata medie este între limitele specificate. 6.6. Distribuția frecvențelor Frecvența absolută reprezintă numărul de indivizi statistici care populează fiecare clasă a caracteristicii. Tabelul nr. 6.7: Serie de date cu frecvențe Clase A1 A2 .... As Total Frecvențe K1 K2 .... Ks n Tabelul nr. 6.8: Serie de date cu frecvențe în cazul variabilelor discrete Nr. persoane din gospodărie 1 2 3 4 5 și peste Total Frecvențe (numărul gospodăriilor care au specificat numărul respectiv de membri din
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Frecvența absolută reprezintă numărul de indivizi statistici care populează fiecare clasă a caracteristicii. Tabelul nr. 6.7: Serie de date cu frecvențe Clase A1 A2 .... As Total Frecvențe K1 K2 .... Ks n Tabelul nr. 6.8: Serie de date cu frecvențe în cazul variabilelor discrete Nr. persoane din gospodărie 1 2 3 4 5 și peste Total Frecvențe (numărul gospodăriilor care au specificat numărul respectiv de membri din gospodărie) 35 60 20 15 20 150 Interpretare: 35 de persoane au declarat
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Serie de date cu frecvențe Clase A1 A2 .... As Total Frecvențe K1 K2 .... Ks n Tabelul nr. 6.8: Serie de date cu frecvențe în cazul variabilelor discrete Nr. persoane din gospodărie 1 2 3 4 5 și peste Total Frecvențe (numărul gospodăriilor care au specificat numărul respectiv de membri din gospodărie) 35 60 20 15 20 150 Interpretare: 35 de persoane au declarat că gospodăria lor este compusă dintr-un membru, 60 de persoane au declarat că gospodăria lor este
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
persoane au declarat că gospodăria lor este compusă dintr-un membru, 60 de persoane au declarat că gospodăria lor este compusă din două persoane etc. În cazul variabilelor continue, unde se atribuie orice valoare într-un interval anume, tabelul de frecvențe se prezintă astfel: Tabelul nr. 6.9: Serie de date cu frecvențe în cazul variabilelor continue Vârsta 18-29 30-39 40-49 50-59 60 și peste Total Frecvența 30 25 20 35 40 150 Interpretare: 30 de persoane au declarat că au
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
de persoane au declarat că gospodăria lor este compusă din două persoane etc. În cazul variabilelor continue, unde se atribuie orice valoare într-un interval anume, tabelul de frecvențe se prezintă astfel: Tabelul nr. 6.9: Serie de date cu frecvențe în cazul variabilelor continue Vârsta 18-29 30-39 40-49 50-59 60 și peste Total Frecvența 30 25 20 35 40 150 Interpretare: 30 de persoane au declarat că au vârsta cuprinsă în intervalul 18-29 ani, 25 de persoane au declarat că
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
cazul variabilelor continue, unde se atribuie orice valoare într-un interval anume, tabelul de frecvențe se prezintă astfel: Tabelul nr. 6.9: Serie de date cu frecvențe în cazul variabilelor continue Vârsta 18-29 30-39 40-49 50-59 60 și peste Total Frecvența 30 25 20 35 40 150 Interpretare: 30 de persoane au declarat că au vârsta cuprinsă în intervalul 18-29 ani, 25 de persoane au declarat că au vârsta cuprinsă în intervalul 30-39 ani etc. Frecvența relativă se obține raportând frecvența
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]