17,513 matches
-
ca variabila dependentă să fie cantitativă și să aibă o distribuție normală. Există cerințe care se aplică la fel ca și în cazul regresiei liniare, și anume: * Specificarea corectă a modelului de regresie, adică includerea tuturor variabilelor relevante pentru explicarea variabilei dependente și excluderea celor irelevante; * Lipsa unei relații de corelație între variabilele independente care conduce, ca și în cazul regresiei liniare, la efectul de multicoliniaritate; * Independența între termenii eroare (dependența poate apărea atunci când se lucrează cu eșantioane corelate în care
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Există cerințe care se aplică la fel ca și în cazul regresiei liniare, și anume: * Specificarea corectă a modelului de regresie, adică includerea tuturor variabilelor relevante pentru explicarea variabilei dependente și excluderea celor irelevante; * Lipsa unei relații de corelație între variabilele independente care conduce, ca și în cazul regresiei liniare, la efectul de multicoliniaritate; * Independența între termenii eroare (dependența poate apărea atunci când se lucrează cu eșantioane corelate în care aceiași subiecți sunt intervievați la momente diferite de timp). Regresia logistică nu
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
cazul regresiei liniare, la efectul de multicoliniaritate; * Independența între termenii eroare (dependența poate apărea atunci când se lucrează cu eșantioane corelate în care aceiași subiecți sunt intervievați la momente diferite de timp). Regresia logistică nu presupune existența unei relații liniare între variabila dependentă și cele independente, ipoteza testată fiind cea a unei relații exponențiale între variabila dependentă și predictori. Regresie liniară multiplă: y= a + b1x1 + b2x2 +...+bnxn Regresie logistică: se pornește de la o relație de forma y = abx care logaritmată exprimă o
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
atunci când se lucrează cu eșantioane corelate în care aceiași subiecți sunt intervievați la momente diferite de timp). Regresia logistică nu presupune existența unei relații liniare între variabila dependentă și cele independente, ipoteza testată fiind cea a unei relații exponențiale între variabila dependentă și predictori. Regresie liniară multiplă: y= a + b1x1 + b2x2 +...+bnxn Regresie logistică: se pornește de la o relație de forma y = abx care logaritmată exprimă o relație liniară între log y și x. Mai exact forma ecuației de regresie logistică
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
un raport de șanse, adică probabilitatea ca y să ia valoarea 1 împărțită la probabilitatea ca y să ia valoarea 0. Ecuația de regresie logistică este deci o relație liniară între: logaritm din raportul de șanse pentru evenimentul y și variabilele independente. 8.2.1. Interpretarea coeficienților regresiei logistice În regresia liniară coeficienții b aveau o interpretare directă a impactului asupra dependentei (modificarea cu o unitate a lui x conducea, în medie, la modificarea cu b unități a lui y, celelalte
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
logistic poate fi făcută în termeni de probabilități. Să luăm ca exemplu votul pentru un partid. Dacă probabilitatea ca cineva să voteze pentru partid este de 15%, raportul de șanse va fi de 15/85 = 0,176. Presupunând că, pentru variabila ani de școlarizare coeficientul b este de 0,4, înseamnă că exp b = e0,4 = 1,49. Ceea ce înseamnă că adăugând un an de școlarizare, vom obține un nou raport de șanse egal cu vechiul raport (0,176) multiplicat cu
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
deloc (independență). Limitele intervalului de încredere în care putem încadra coeficientul de regresie logistică cu o probabilitate de 95% sunt date de valoarea coeficientului (eroarea standard a coeficientului). Pentru a testa ipoteza că predictorul x are un impact semnificativ asupra variabilei dependente, se folosește statistica Wald calculată de SPSS. Ipoteza de nul fiind aceea că impactul în populația studiată este zero (nu există asociere între x și y). Se urmărește respingerea acestei ipoteze pentru un nivel de semnificație mai mic sau
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
este semnificativ (și invers). Acest lucru este posibil deoarece coeficientul logistic reflectă și relația non-liniară care nu este detectată de coeficientul liniar. În plus, într-un model de regresie multiplă impactul unui predictor este măsurat ținând sub control influența celorlalte variabile. Trebuie menționat că statistica Wald (= b2/SEb2, unde SEb2 este eroarea standard a coeficientului b) dă rezultate eronate atunci când valoarea foarte mare a lui b este asociată cu o eroare standard foarte mare și, prin urmare, valoarea statisticii Wald va
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
a acestei măsuri, care ia valori între 0 și 1 și se folosește în mod uzual pentru a estima cât de bun este modelul. Un alt indicator al modelului este tabelul de clasificare care conține pe linii valorile observate ale variabilei dependente, iar pe coloane valorile prezise. Din tabel putem afla câte cazuri au fost prezise corect și câte incorect pentru fiecare valoare a dependentei. Pentru a prezice valorile dependentei și a calcula coeficienții de regresie logistică se folosesc Maximum Likelihood
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
că modelul ne-a îmbunătățit predicția doar cu 1,4% din cazuri. Metoda folosită aici este de fapt similară cu regresia liniară când pentru a evalua modelul foloseam ca punct de referință valoarea medie a lui y. În cazul unei variabile dihotomice valoarea medie este chiar probabilitatea de apariție a evenimentului, deci în exemplul de mai sus procentul celor care s-au declarat în favoarea pedepsei capitale. Gradul de îmbunătățire a predicției este dat de valoarea care este un raport: (nr. erorilor
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
este >0,05 acceptăm ipoteza de nul, concluzionând că datele estimate de model se potrivesc cu cele observate. 8.2.3. Exemplu de fișier de rezultate SPSS comentat (Barometrul de opinie publică, iunie 1998). În acest model de regresie logistică variabila dependentă este intenția de vot pentru CDR, vot CDR (1 indică intenția de vot pentru CDR, 0 pentru alte partide, nonrăspunsurile au fost scoase din analiză). Predictorii sunt dir (consideră că direcția în care se îndreaptă lucrurile în țară este bună
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Analysis 933 77,0 Missing Cases 279 23,0 Total 1212 100,0 Unselected Cases 0 ,0 Total 1212 100,0 a If weight is in effect, see classification table for the total number of cases. Modul de codare al variabilei dependente CDR cu valori 0 și 1: Dependent Variable Encoding Original Value Internal Value ,00 0 1,00 1 Atenție însă la semnificația valorilor 1 și 0. Corect este ca variabila dependentă să ia valorile 1 (prezența atributului) și 0
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
the total number of cases. Modul de codare al variabilei dependente CDR cu valori 0 și 1: Dependent Variable Encoding Original Value Internal Value ,00 0 1,00 1 Atenție însă la semnificația valorilor 1 și 0. Corect este ca variabila dependentă să ia valorile 1 (prezența atributului) și 0 (absența lui). În caz contrar, SPSS-ul atribuie automat valorile 0 și 1 în funcție de ordinea crescătoare a valorilor inițiale. Astfel, dacă valorile inițiale sunt greșit introduse cu 1 (Da) și 2
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
în funcție de ordinea crescătoare a valorilor inițiale. Astfel, dacă valorile inițiale sunt greșit introduse cu 1 (Da) și 2 (Nu), SPSS-ul le va recoda cu 0, și respectiv 1, practic vechea valoare 2 (Nu) devenind 1. În acest caz semnificația variabilei dependente este complet schimbată. Classification Table(a,b) Observed Predicted vot CDR Percentage Correct ,00 1,00 ,00 Step 0 vot CDR ,00 832 0 100,0 1,00 101 0 ,0 Overall Percentage 89,2 a Constant is included in the
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
R Square sunt măsuri echivalente cu din regresia liniară, ultima având un interval de variație de la 0 la 1. Se observă că acești doi indicatori au valori mici și astfel predictorii incluși în model explică doar 4,6% din variația variabilei vot CDR (respectiv 9,2%). Mai jos avem și valoarea hi pătrat (Chi-square) asociată cu diferența -2LL dintre modelul inițial și modelul cu predictori. Cum p<0,05 respingem ipoteza de nul și acceptăm modelul cu predictori. Deși predictorii explică puțin
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
9,2%). Mai jos avem și valoarea hi pătrat (Chi-square) asociată cu diferența -2LL dintre modelul inițial și modelul cu predictori. Cum p<0,05 respingem ipoteza de nul și acceptăm modelul cu predictori. Deși predictorii explică puțin din variația variabilei vot CDR, totuși modelul cu predictori aduce o îmbunătățire. Omnibus Tests of Model Coefficients Chi-square df Sig. Step 1 Step 43,519 3 ,000 Block 43,519 3 ,000 Model 43,519 3 ,000 O măsura alternativă este testul lui Hosmer
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
0,19. Rezultă că P1(Y=1)=0,15 (0,19/1,19), deci vom obține o creștere de la 10,82% (101/933) la 15% a probabilității de a vota cu CDR. Pentru a putea clasifica corect valorile 1 ale variabilei dependente ar fi trebuit ca această creștere să depășească pragul de 50% (cut value). Se poate observa deci că modelele de regresie logistică se aplică cu succes în cazul variabilelor dihotomice care au o distribuție binomială și probabilitățile pentru valorile
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
cu CDR. Pentru a putea clasifica corect valorile 1 ale variabilei dependente ar fi trebuit ca această creștere să depășească pragul de 50% (cut value). Se poate observa deci că modelele de regresie logistică se aplică cu succes în cazul variabilelor dihotomice care au o distribuție binomială și probabilitățile pentru valorile 1 și 0 sunt aproape de valorile 50% ; -50%. Variables in the Equation B S.E. Wald df Sig. Exp(B) Lower Upper Lower Upper Lower Upper Step 1(a) dir 1
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
regresia logistică în următoarele două privințe: 1. valorile prezise sunt estimări ale frecvențelor din căsuțele tabelului de contingență, funcția folosită fiind logaritm natural din frecvențe și nu logaritm din șansă precum în cazul regresiei logistice. 2. nu există o singură variabilă dependentă, efectele de interacțiune fiind posibile între toate variabilele introduse în model. Analiza logliniară are drept scop găsirea modelelor explicative și descrierea mărimii și paternurilor de asociere dintre variabile, în condițiile în care influența altor variabile este ținută sub control
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
sunt estimări ale frecvențelor din căsuțele tabelului de contingență, funcția folosită fiind logaritm natural din frecvențe și nu logaritm din șansă precum în cazul regresiei logistice. 2. nu există o singură variabilă dependentă, efectele de interacțiune fiind posibile între toate variabilele introduse în model. Analiza logliniară are drept scop găsirea modelelor explicative și descrierea mărimii și paternurilor de asociere dintre variabile, în condițiile în care influența altor variabile este ținută sub control. Putem spune că analiza loglineară este: o metodă de
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
șansă precum în cazul regresiei logistice. 2. nu există o singură variabilă dependentă, efectele de interacțiune fiind posibile între toate variabilele introduse în model. Analiza logliniară are drept scop găsirea modelelor explicative și descrierea mărimii și paternurilor de asociere dintre variabile, în condițiile în care influența altor variabile este ținută sub control. Putem spune că analiza loglineară este: o metodă de analiză a datelor categoriale, o metodă multivariată, o metodă "fără" variabilă dependentă. În nici un caz nu este o regresie logistică
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
nu există o singură variabilă dependentă, efectele de interacțiune fiind posibile între toate variabilele introduse în model. Analiza logliniară are drept scop găsirea modelelor explicative și descrierea mărimii și paternurilor de asociere dintre variabile, în condițiile în care influența altor variabile este ținută sub control. Putem spune că analiza loglineară este: o metodă de analiză a datelor categoriale, o metodă multivariată, o metodă "fără" variabilă dependentă. În nici un caz nu este o regresie logistică sau o analiză de varianță. Totuși are
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
explicative și descrierea mărimii și paternurilor de asociere dintre variabile, în condițiile în care influența altor variabile este ținută sub control. Putem spune că analiza loglineară este: o metodă de analiză a datelor categoriale, o metodă multivariată, o metodă "fără" variabilă dependentă. În nici un caz nu este o regresie logistică sau o analiză de varianță. Totuși are o serie de asemănări cu regresia, pentru că face parte din aceeași categorie a modelelor multivariate, explicative, care încearcă să descrie relațiile dintre variabile. Cel
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
fără" variabilă dependentă. În nici un caz nu este o regresie logistică sau o analiză de varianță. Totuși are o serie de asemănări cu regresia, pentru că face parte din aceeași categorie a modelelor multivariate, explicative, care încearcă să descrie relațiile dintre variabile. Cel mai mult seamănă cu regresia logistică, în sensul în care variabila dependentă este categorială (la regresia logistică ea este binomială). Dar, în cazul analizei logliniare variabila dependentă este categorială și nu binomială, distribuția variabilei dependente este Poisson și nu
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
o analiză de varianță. Totuși are o serie de asemănări cu regresia, pentru că face parte din aceeași categorie a modelelor multivariate, explicative, care încearcă să descrie relațiile dintre variabile. Cel mai mult seamănă cu regresia logistică, în sensul în care variabila dependentă este categorială (la regresia logistică ea este binomială). Dar, în cazul analizei logliniare variabila dependentă este categorială și nu binomială, distribuția variabilei dependente este Poisson și nu binomială, variabila dependentă este legată de frecvența celulară și nu o funcție
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]