2,315 matches
-
că este o metodă robustă, care nu necesită ca variabila dependentă să fie cantitativă și să aibă o distribuție normală. Există cerințe care se aplică la fel ca și în cazul regresiei liniare, și anume: * Specificarea corectă a modelului de regresie, adică includerea tuturor variabilelor relevante pentru explicarea variabilei dependente și excluderea celor irelevante; * Lipsa unei relații de corelație între variabilele independente care conduce, ca și în cazul regresiei liniare, la efectul de multicoliniaritate; * Independența între termenii eroare (dependența poate apărea
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
și în cazul regresiei liniare, și anume: * Specificarea corectă a modelului de regresie, adică includerea tuturor variabilelor relevante pentru explicarea variabilei dependente și excluderea celor irelevante; * Lipsa unei relații de corelație între variabilele independente care conduce, ca și în cazul regresiei liniare, la efectul de multicoliniaritate; * Independența între termenii eroare (dependența poate apărea atunci când se lucrează cu eșantioane corelate în care aceiași subiecți sunt intervievați la momente diferite de timp). Regresia logistică nu presupune existența unei relații liniare între variabila dependentă
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
corelație între variabilele independente care conduce, ca și în cazul regresiei liniare, la efectul de multicoliniaritate; * Independența între termenii eroare (dependența poate apărea atunci când se lucrează cu eșantioane corelate în care aceiași subiecți sunt intervievați la momente diferite de timp). Regresia logistică nu presupune existența unei relații liniare între variabila dependentă și cele independente, ipoteza testată fiind cea a unei relații exponențiale între variabila dependentă și predictori. Regresie liniară multiplă: y= a + b1x1 + b2x2 +...+bnxn Regresie logistică: se pornește de la o
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
între variabila dependentă și predictori. Regresie liniară multiplă: y= a + b1x1 + b2x2 +...+bnxn Regresie logistică: se pornește de la o relație de forma y = abx care logaritmată exprimă o relație liniară între log y și x. Mai exact forma ecuației de regresie logistică este: (5) Raportul reprezintă un raport de șanse, adică probabilitatea ca y să ia valoarea 1 împărțită la probabilitatea ca y să ia valoarea 0. Ecuația de regresie logistică este deci o relație liniară între: logaritm din raportul de
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
liniară între log y și x. Mai exact forma ecuației de regresie logistică este: (5) Raportul reprezintă un raport de șanse, adică probabilitatea ca y să ia valoarea 1 împărțită la probabilitatea ca y să ia valoarea 0. Ecuația de regresie logistică este deci o relație liniară între: logaritm din raportul de șanse pentru evenimentul y și variabilele independente. 8.2.1. Interpretarea coeficienților regresiei logistice În regresia liniară coeficienții b aveau o interpretare directă a impactului asupra dependentei (modificarea cu
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
y să ia valoarea 1 împărțită la probabilitatea ca y să ia valoarea 0. Ecuația de regresie logistică este deci o relație liniară între: logaritm din raportul de șanse pentru evenimentul y și variabilele independente. 8.2.1. Interpretarea coeficienților regresiei logistice În regresia liniară coeficienții b aveau o interpretare directă a impactului asupra dependentei (modificarea cu o unitate a lui x conducea, în medie, la modificarea cu b unități a lui y, celelalte variabile fiind ținute sub control). În cazul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
valoarea 1 împărțită la probabilitatea ca y să ia valoarea 0. Ecuația de regresie logistică este deci o relație liniară între: logaritm din raportul de șanse pentru evenimentul y și variabilele independente. 8.2.1. Interpretarea coeficienților regresiei logistice În regresia liniară coeficienții b aveau o interpretare directă a impactului asupra dependentei (modificarea cu o unitate a lui x conducea, în medie, la modificarea cu b unități a lui y, celelalte variabile fiind ținute sub control). În cazul regresiei logistice, estimarea
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
logistice În regresia liniară coeficienții b aveau o interpretare directă a impactului asupra dependentei (modificarea cu o unitate a lui x conducea, în medie, la modificarea cu b unități a lui y, celelalte variabile fiind ținute sub control). În cazul regresiei logistice, estimarea impactului pe care modificarea lui x o are asupra lui y se face prin intermediul lui eb. Dacă ridicăm la puterea e ecuația (5) pentru un predictor x, obținem: = e a +bx = ea *(eb)x (6) Din ecuația (6
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
21. Putem, prin urmare, spune ca dacă se modifică cu o unitate numărul de ani de școlarizare, procentul celor care votează pentru partid crește în medie de la 15% la 21%, celelalte variabile fiind ținute sub control. Ca și în cazul regresiei liniare, modificarea cu o unitate a predictorului poate duce la scăderea sau creșterea lui y. La regresia liniară acest lucru era observabil prin semnul pozitiv sau negativ al coeficientului b. În cazul regresiei logistice comparăm valoarea lui exp b cu
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
procentul celor care votează pentru partid crește în medie de la 15% la 21%, celelalte variabile fiind ținute sub control. Ca și în cazul regresiei liniare, modificarea cu o unitate a predictorului poate duce la scăderea sau creșterea lui y. La regresia liniară acest lucru era observabil prin semnul pozitiv sau negativ al coeficientului b. În cazul regresiei logistice comparăm valoarea lui exp b cu 1. Astfel, dacă: * exp b>1, înseamnă că noul raport de șanse obținut ca urmare a creșterii
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
ținute sub control. Ca și în cazul regresiei liniare, modificarea cu o unitate a predictorului poate duce la scăderea sau creșterea lui y. La regresia liniară acest lucru era observabil prin semnul pozitiv sau negativ al coeficientului b. În cazul regresiei logistice comparăm valoarea lui exp b cu 1. Astfel, dacă: * exp b>1, înseamnă că noul raport de șanse obținut ca urmare a creșterii lui x cu o unitate va fi multiplicat cu un număr pozitiv mai mare ca 1
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
pozitiv) * 0<exp b<1, noul raport de șanse va scădea în urma multiplicării cu un număr subunitar (impact negativ) * exp b=1, raportul de șanse nu se modifică deloc (independență). Limitele intervalului de încredere în care putem încadra coeficientul de regresie logistică cu o probabilitate de 95% sunt date de valoarea coeficientului (eroarea standard a coeficientului). Pentru a testa ipoteza că predictorul x are un impact semnificativ asupra variabilei dependente, se folosește statistica Wald calculată de SPSS. Ipoteza de nul fiind
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
de nul fiind aceea că impactul în populația studiată este zero (nu există asociere între x și y). Se urmărește respingerea acestei ipoteze pentru un nivel de semnificație mai mic sau egal cu 0,05. În unele cazuri coeficientul de regresie logistică este semnificativ, chiar dacă coeficientul de corelație corespunzător nu este semnificativ (și invers). Acest lucru este posibil deoarece coeficientul logistic reflectă și relația non-liniară care nu este detectată de coeficientul liniar. În plus, într-un model de regresie multiplă impactul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
coeficientul de regresie logistică este semnificativ, chiar dacă coeficientul de corelație corespunzător nu este semnificativ (și invers). Acest lucru este posibil deoarece coeficientul logistic reflectă și relația non-liniară care nu este detectată de coeficientul liniar. În plus, într-un model de regresie multiplă impactul unui predictor este măsurat ținând sub control influența celorlalte variabile. Trebuie menționat că statistica Wald (= b2/SEb2, unde SEb2 este eroarea standard a coeficientului b) dă rezultate eronate atunci când valoarea foarte mare a lui b este asociată cu
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
este eroarea standard a coeficientului b) dă rezultate eronate atunci când valoarea foarte mare a lui b este asociată cu o eroare standard foarte mare și, prin urmare, valoarea statisticii Wald va fi mică. 8.2.2. Indicatori ai modelului de regresie logistică În afară de măsurile statistice prin care estimăm importanța coeficienților b, există diverse moduri prin care putem aprecia cât de bine prezice modelul de regresie logistică datele observate. Spre deosebire de modelul de regresie liniară unde valoarea R2 ne indică procentul din variația
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
și, prin urmare, valoarea statisticii Wald va fi mică. 8.2.2. Indicatori ai modelului de regresie logistică În afară de măsurile statistice prin care estimăm importanța coeficienților b, există diverse moduri prin care putem aprecia cât de bine prezice modelul de regresie logistică datele observate. Spre deosebire de modelul de regresie liniară unde valoarea R2 ne indică procentul din variația totală a dependentei explicat de predictori, în cazul regresiei logistice folosirea lui R2 este controversată. Există însă încercări de a propune măsuri similare care
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
fi mică. 8.2.2. Indicatori ai modelului de regresie logistică În afară de măsurile statistice prin care estimăm importanța coeficienților b, există diverse moduri prin care putem aprecia cât de bine prezice modelul de regresie logistică datele observate. Spre deosebire de modelul de regresie liniară unde valoarea R2 ne indică procentul din variația totală a dependentei explicat de predictori, în cazul regresiei logistice folosirea lui R2 este controversată. Există însă încercări de a propune măsuri similare care să măsoare cu cât se îmbunătățește predicția
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
coeficienților b, există diverse moduri prin care putem aprecia cât de bine prezice modelul de regresie logistică datele observate. Spre deosebire de modelul de regresie liniară unde valoarea R2 ne indică procentul din variația totală a dependentei explicat de predictori, în cazul regresiei logistice folosirea lui R2 este controversată. Există însă încercări de a propune măsuri similare care să măsoare cu cât se îmbunătățește predicția valorilor dependentei atunci când predictorii sunt incluși în model. O astfel de măsura calculată de SPSS este R2 a
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
pe linii valorile observate ale variabilei dependente, iar pe coloane valorile prezise. Din tabel putem afla câte cazuri au fost prezise corect și câte incorect pentru fiecare valoare a dependentei. Pentru a prezice valorile dependentei și a calcula coeficienții de regresie logistică se folosesc Maximum Likelihood Estimates (spre deosebire de metoda celor mai mici pătrate care este folosită în regresia liniară). Această metodă permite calcularea probabilității de apariție a lui y pentru fiecare combinație a valorilor predictorilor. Convențional, dacă probabilitatea estimată este >0
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
cazuri au fost prezise corect și câte incorect pentru fiecare valoare a dependentei. Pentru a prezice valorile dependentei și a calcula coeficienții de regresie logistică se folosesc Maximum Likelihood Estimates (spre deosebire de metoda celor mai mici pătrate care este folosită în regresia liniară). Această metodă permite calcularea probabilității de apariție a lui y pentru fiecare combinație a valorilor predictorilor. Convențional, dacă probabilitatea estimată este >0,5 atunci cazul respectiv se clasifică cu valoarea 1, iar dacă este <0,5 se clasifică cu
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
am fi prezis corect (326+7)/(326+7+75+13) din cazuri, adică un procent de 79,10%. Înseamnă deci că modelul ne-a îmbunătățit predicția doar cu 1,4% din cazuri. Metoda folosită aici este de fapt similară cu regresia liniară când pentru a evalua modelul foloseam ca punct de referință valoarea medie a lui y. În cazul unei variabile dihotomice valoarea medie este chiar probabilitatea de apariție a evenimentului, deci în exemplul de mai sus procentul celor care s-
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
făcute. Un alt mod de a vedea gradul de potrivire a datelor prezise cu cele observate este valoarea testului HI PĂTRAT PENTRU MODEL, calculată în fișierul de rezultate SPSS. În acest caz ipoteza de nul este aceea că toți coeficienții regresiei logistice estimați la nivelul populației din care a fost extras eșantionul sunt zero. Practic, hi pătrat este calculat pe baza diferenței dintre erorile pentru modelul cu toți predictorii și erorile pentru modelul fără nici un predictor (care presupune lipsa asocierii dintre
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
de semnificație este >0,05 acceptăm ipoteza de nul, concluzionând că datele estimate de model se potrivesc cu cele observate. 8.2.3. Exemplu de fișier de rezultate SPSS comentat (Barometrul de opinie publică, iunie 1998). În acest model de regresie logistică variabila dependentă este intenția de vot pentru CDR, vot CDR (1 indică intenția de vot pentru CDR, 0 pentru alte partide, nonrăspunsurile au fost scoase din analiză). Predictorii sunt dir (consideră că direcția în care se îndreaptă lucrurile în țară
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
0 Overall Percentage 89,2 a Constant is included in the model. b The cut value is ,500 Mai jos găsim valoarea inițială a lui hi pătrat calculată pentru modelul fără nici un predictor, bazat pe ipoteza că toți coeficienții de regresie au valoarea zero în populație. În SPSS această valoare se numește "initial log likelihood function -2 log likelihood". Această valoare este comparată ulterior cu cea pentru modelul care include toți predictorii. Model Summary Step -2 Log likelihood Cox & Snell R
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Cox & Snell R Square Nagelkerke R Square 1 596,234(a) ,046 ,092 a Estimation terminated at iteration number 5 because parameter estimates changed by less than ,001. Cox-Snell R Square și Nagelkerke R Square sunt măsuri echivalente cu din regresia liniară, ultima având un interval de variație de la 0 la 1. Se observă că acești doi indicatori au valori mici și astfel predictorii incluși în model explică doar 4,6% din variația variabilei vot CDR (respectiv 9,2%). Mai jos avem
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]