16,527 matches
-
putem dori să selectăm exemple de cazuri pentru analiză. Pentru a selecta 10% din exemple, folosim din meniu DATA/SELECT CASES. Selectăm din căsuța de dialog SELECT CASES/RANDOM SAMPLE OF CASES și tastăm Sample. Se va deschide o altă căsuță care ne va permite să specificăm un anumit procentaj din cazuri sau un număr exact de cazuri selectate la întâmplare din dosarul de date. Mai există o situație când utilizăm acest filtru combinat cu SORT CASES. Presupunem că avem eșantionul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
sunt redate frecvențele relative cumulate, raportate la total persoane care au răspuns la această întrebare. Exemplu: dintre persoanele care au răspuns la această întrebare 62,7% au declarat că sunt deloc mulțumiți și nu prea mulțumiți. Se adună primele două căsuțe din coloana Valid Percent. Editarea tabelelor în fișierul de rezultate Output Modificarea tabelelor rezultate în fișierul de rezultate se poate realiza prin clic dreapta pe tabel și bifarea opțiunii EDIT CONTENT/IN SEPARATE WINDOW. Se va deschide o nouă fereastră
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
sunt deloc mulțumite de felul în care trăiesc. 6.7.3. Grafice din meniul Explore * Boxplots restrânge scorurile variabilei prin dispunerea pe mediană a procentelor de 25 și 75 ca fiind limitele cele mai scăzute și cele mai ridicate ale căsuțelor imediate medianei. Lungimea căsuței reprezintă poziția intercuartilică. Extremele sunt cele care depășesc trei căsuțe. Liniile sunt desenate de la marginea căsuței către valoarea cea mai mică și cea mai mare. * Boxplots ne permite să luăm un număr de decizii cu privire la distribuția
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
felul în care trăiesc. 6.7.3. Grafice din meniul Explore * Boxplots restrânge scorurile variabilei prin dispunerea pe mediană a procentelor de 25 și 75 ca fiind limitele cele mai scăzute și cele mai ridicate ale căsuțelor imediate medianei. Lungimea căsuței reprezintă poziția intercuartilică. Extremele sunt cele care depășesc trei căsuțe. Liniile sunt desenate de la marginea căsuței către valoarea cea mai mică și cea mai mare. * Boxplots ne permite să luăm un număr de decizii cu privire la distribuția scorurilor. Mediana este indicatorul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Explore * Boxplots restrânge scorurile variabilei prin dispunerea pe mediană a procentelor de 25 și 75 ca fiind limitele cele mai scăzute și cele mai ridicate ale căsuțelor imediate medianei. Lungimea căsuței reprezintă poziția intercuartilică. Extremele sunt cele care depășesc trei căsuțe. Liniile sunt desenate de la marginea căsuței către valoarea cea mai mică și cea mai mare. * Boxplots ne permite să luăm un număr de decizii cu privire la distribuția scorurilor. Mediana este indicatorul valorii centrale și lungimea căsuței indică variabilitatea scorurilor. Dacă mediana
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
dispunerea pe mediană a procentelor de 25 și 75 ca fiind limitele cele mai scăzute și cele mai ridicate ale căsuțelor imediate medianei. Lungimea căsuței reprezintă poziția intercuartilică. Extremele sunt cele care depășesc trei căsuțe. Liniile sunt desenate de la marginea căsuței către valoarea cea mai mică și cea mai mare. * Boxplots ne permite să luăm un număr de decizii cu privire la distribuția scorurilor. Mediana este indicatorul valorii centrale și lungimea căsuței indică variabilitatea scorurilor. Dacă mediana nu este în mijloc, distribuția scorurilor
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
sunt cele care depășesc trei căsuțe. Liniile sunt desenate de la marginea căsuței către valoarea cea mai mică și cea mai mare. * Boxplots ne permite să luăm un număr de decizii cu privire la distribuția scorurilor. Mediana este indicatorul valorii centrale și lungimea căsuței indică variabilitatea scorurilor. Dacă mediana nu este în mijloc, distribuția scorurilor se abate de la distribuția normală. Mediana este reprezentată printr-o linie mai groasă. Se folosește comanda ANALYZE/DESCRIPTIVE STATISTICS/ FREQUENCIES /EXPLORE Figura nr. 6.26: Opțiunea Explore Pentru a
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
GRAPHS trebuie să avem deschis un fișier. Deschidem meniul GRAPHS și intrăm CHART BUILDER iar aici găsim prestabilite diferite tipuri de grafice. Meniul oferă: grafice cu bare, cu linii, puncte, plăcintă, histograme etc. Sistemul ne conduce printr-o serie de căsuțe de dialog în care putem specifica cum vrem să fie desenat graficul, titlul și legenda, scalele pentru axe. Figura nr. 6.27: meniul Graphs Figura nr. 6.28: Opțiunea Chart Builder Figura nr. 6.29: Opțiunea Chart Builder grafice plăcintă
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
P11+P21 P+2=P12+P22 100% P11 reprezintă procentul din totalul persoanelor care posedă caracteristicile A și B. P21 se referă la persoanele care nu posedă A, dar posedă B, etc. Suma tuturor procentelor este, bineînțeles, 100%. Pentru fiecare căsuță a tabelului , unde nij este frecvența corespunzătoare căsuței ij, aflată la intersecția liniei i și coloanei j, iar N numărul total de cazuri. De obicei, variabila independentă se află pe coloană, iar cea dependentă, care urmează a fi explicată, pe
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
reprezintă procentul din totalul persoanelor care posedă caracteristicile A și B. P21 se referă la persoanele care nu posedă A, dar posedă B, etc. Suma tuturor procentelor este, bineînțeles, 100%. Pentru fiecare căsuță a tabelului , unde nij este frecvența corespunzătoare căsuței ij, aflată la intersecția liniei i și coloanei j, iar N numărul total de cazuri. De obicei, variabila independentă se află pe coloană, iar cea dependentă, care urmează a fi explicată, pe linie. Distribuția indivizilor funcție de valorile variabilelor A și
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
pe coloană variabila e1 04 ("Ați mers la doctor pentru o problemă medicală pe care o aveați mai de mult?" cu variantele de răspuns 1 = Da și 2 = Nu). Variabilele au fost luate din Barometrul de Opinie Publică, ediția mai 2006. Căsuțele tabelului conțin: frecvențele observate, procentele din total, cele de pe linie și cele de pe coloană. Pentru a construi acest tabel: 1) Se selectează din meniu ANALYZE/DESCRIPTIVE STATISTICS/ CROSSTABS și se aleg variabila de pe linie și cea de pe coloană. În continuare
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
6,0% 62,6% 68,6% Total Count 203 1751 1954 % within i4 a 10,4% 89,6% 100,0% % within e1 04 100,0% 100,0% 100,0% % of Total 10,4% 89,6% 100,0% Interpretare: Primul număr din fiecare căsuță a tabelului reprezintă frecvența observată. Știm deci că din total eșantion (1954), 85 au mers la medic pentru o problemă medicală și au relații în sistemul sanitar, 528 nu au mers la medic pentru o problemă medicală dar au relații
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
relații. Din cele 1751 de persoane care nu au fost la medic 30,2% au relații în sistemul sanitar și 69,8% nu au. Al patrulea număr reprezintă procentul din total, care este ușor de citit, de exemplu pentru prima căsuță 4,4% este obținut prin împărțirea frecvenței observate (85) la total subiecți (1954) și înmulțirea cu 100 și se citește astfel: 4,4% din total respondenți la aceste două întrebări au cunoștințe în sistemul sanitar și au fost la medic
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
formulă pentru cazul unui tabel de contingență 2*2 (tabelul nr.7.1.), obținem: P11=P+1*P1+ (1) P21=P+1*P2+ (2) P12=P1+*P+2 (3) P22=P+2*P2+ (4) Aceasta înseamnă practic că probabilitatea din căsuța (1,1), aflată la intersecția dintre primul rând și prima coloană, este egală cu produsul probabilităților necondiționate de pe linia 1 și coloana 1. Probabilitatea necondiționată de pe linia 1, P1+ este probabilitatea ca A să aibă valoarea 1 indiferent de valoarea
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
1 și coloana 1. Probabilitatea necondiționată de pe linia 1, P1+ este probabilitatea ca A să aibă valoarea 1 indiferent de valoarea lui B, iar P+1 este probabilitatea ca B să aibă valoarea 1 indiferent de A. Frecvența așteptată din căsuța (1,1) în ipoteza independenței dintre cele două variabile va fi egală cu produsul frecvențelor marginale împărțit la volumul eșantionului: F11 = (F+1F1+) / N, unde N este volumul eșantionului. (5) Există două modalități foarte directe de a vedea dacă variabilele
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
celulei de referință înmulțită cu suma frecvențelor din toate celulele aflate sub ea și la dreapta ei (Sandu, 1992, 93); pentru a afla numărul perechilor discordante (D) se consideră celulele aflate sub celula de referință și la stânga acesteia. Astfel, pentru căsuța corespunzătoare lui X=1 și Y=1 (79 de cazuri), perechile concordante sunt toate cele care corespund lui X=2 sau 3 și Y= 2, 3 sau 4. La fel pentru următoarea pereche X=2 și Y=1, perechile concordante
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
X) este încrederea în poliție, perechile legate după X sunt toate acelea pentru care , dar . Dacă atunci când calculăm numărul perechilor concordante luam în considerare frecvențele situate la dreapta și mai jos de celula de referință, de data aceasta vom considera căsuțele situate chiar sub celula de referință. Deci = 79*(208 + 257 + 59) + 208*(257 + 59) + 257*59 + 41*(81 + 50 + 11) + 81*(50 + 11) + 50*11 + 53*(49+ 26+ 7) + 49*(26+7) + 26*7 = 138.210 = 57.362 / (153.880
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. 7.1.7. Testul 2 Valoarea testului 2 se calculează în modul următor: Frecvențele așteptate sunt calculate în ipoteza independenței între variabile, folosind formula (I) discutată anterior (pentru prima căsuță aceasta devine P11 = P+1 * P1+ sau F11 = F+1* F1+ / nr. total de subiecți). Se pornește, așadar, de la distribuția marginală și se calculează valorile așteptate pentru fiecare căsuță în parte, folosind formula de mai sus. Ipoteza de nul a
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
ipoteza independenței între variabile, folosind formula (I) discutată anterior (pentru prima căsuță aceasta devine P11 = P+1 * P1+ sau F11 = F+1* F1+ / nr. total de subiecți). Se pornește, așadar, de la distribuția marginală și se calculează valorile așteptate pentru fiecare căsuță în parte, folosind formula de mai sus. Ipoteza de nul a acestui test presupune inexistența unei relații de asociere dintre cele două variabile analizate. Ipoteza alternativă presupune existența unei relații de asociere dintre cele două variabile. Figura nr. 7.7
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Count 137,6 288,3 440,5 137,6 1004,0 Total Count 274 574 877 274 1999 Expected Count 274,0 574,0 877,0 274,0 1999,0 În acest tabel numărul 136,4 reprezintă frecvența așteptată pentru căsuța (1,1). Această frecvență se calculează drept produsul frecvențelor marginale de pe primul rând și prima coloană împărțit la numărul total de subiecți (274*995/1999), celelalte valori obținându-se în mod similar. Chi-Square Tests Value df Asymp. Sig. (2-sided) Pearson
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
concluzia la care ajungem este că respingem ipoteza de nul a independenței dintre variabile. Cu alte cuvinte, există o relație de asociere între cele două variabile. 7.1.8. Valoarea reziduală standardizată și ajustată Această măsură se calculează pentru fiecare căsuță a tabelului pe baza formulei de calcul a testului 2. Reziduul standardizat și ajustat are avantajul de a permite identificarea relațiilor de asociere, chiar dacă acestea nu caracterizează tabelul în ansamblu, ci numai două valori particulare ale variabilelor. Dacă pentru o
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
este constanta ecuației, iar b1, b2,... bn sunt coeficienții de regresie. Pentru a construi o ecuație de regresie în SPSS se selectează din meniul principal ANALYZE/REGRESSION/LINEAR, se selectează variabila dependentă din lista de variabile și se introduce în căsuța Dependent, iar variabilele independente se introduc în dreptul rubricii Independents. Celelalte opțiuni pentru realizarea ecuației de regresie disponibile prin selectarea butoanelor de jos (Statistics, Plots (grafice), Save, Options) vor fi discutate pe parcursul acestui capitol. Pentru a vizualiza graficele regresiei liniare dintre
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
031 ,236 164,951 1 ,000 ,048 a Variable(s) entered on step 1: dir, urban, z.transilvania 8.3. Analiza logliniară Analiza logliniară diferă de regresia logistică în următoarele două privințe: 1. valorile prezise sunt estimări ale frecvențelor din căsuțele tabelului de contingență, funcția folosită fiind logaritm natural din frecvențe și nu logaritm din șansă precum în cazul regresiei logistice. 2. nu există o singură variabilă dependentă, efectele de interacțiune fiind posibile între toate variabilele introduse în model. Analiza logliniară
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
parametri, SPSS-ul va calcula pe acei patru care în modul au valori diferite. Aceștia sunt parametrul constant, cei 2 coeficienți ai efectelor principale pentru gen și încredere iar ultimul interacțiunea dintre variabile care este aceeași în modul pentru fiecare căsuță a tabelului 2*2. Mod de calcul: Se pleacă de la tabelul de frecvențe: varsta categorii * incredere oameni Crosstabulation Count incredere oameni Total nu au incredere au incredere varsta categorii sub 40 ani 633 260 893 peste 40 ani 629 398 1027 Total 1262 658
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
λa0 = 5,561 (6,11 0,337 0,104) = 0,108 λi1 λa1 = 5,987 (6,11 0,337 + 0,104) = 0,108 Acest rezultat poate fi obținut în SPSS prin folosirea procedurii Loglinear Model Selection, cu precizarea că în căsuța Options se poate cere afișarea estimărilor parametrilor lambda (λ). 8.3.7. Decompoziția unui model cu 3 variabile. Interacțiuni de ordinul 2 și 3 Să presupunem că avem trei variabile dihotomice, A (A1, A2), B (B1, B2) și C (C1
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]