551 matches
-
în populația cercetată. Probabilitatea cu care putem încadra coeficientul în acest interval este de obicei de 95% sau 99%, în ultimul caz, bineînțeles, obținându-se un interval mai mare pentru coeficient. Dacă intervalul de încredere conține valoarea zero, atunci impactul predictorului asupra dependentei este nesemnificativ din punct de vedere statistic. Pentru a calcula în SPSS limitele intervalului de încredere selectăm opțiunea Confidence intervals din ANALYZE/REGRESSION/LINEAR STATISTICS. Testarea semnificației coeficientului de regresie se face cu ajutorul testului t, ipoteza de nul
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
standard pe scala variabilei dependente, celelalte variabile fiind ținute sub control. 8.1.5.Coeficientul de determinație Așa cum am menționat, scopul construcției unui model de regresie este de a explica variația dependentei. În afară de coeficienții de regresie care măsoară impactul fiecărui predictor, avem nevoie și de o măsură globală a gradului în care variația dependentei este explicată de tot setul de predictori. Un astfel de indicator este R2 , calculat pe baza raportului dintre variația lui Y explicată de predictori și variația totală
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
covarianța dintre x și y, iar sx, respectiv sy sunt dispersiile lui x și y. Din această ecuație reiese, de asemenea, că într-un model de regresie multiplă r este egal cu coeficientul de regresie standardizat beta, reflectând impactul unui predictor asupra dependentei atunci când ceilalți predictori sunt ținuți sub control. Pentru a calcula coeficientul de corelație parțială selectăm din meniul SPSS opțiunea ANALYZE/CORRELATE/PARTIAL și introducem variabila dependentă, cea independentă și setul de variabile pe care dorim să le ținem
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
model de regresie trebuie parcurși următorii pași: 1. Se alege variabila dependentă și, dacă este cazul, se construiește un indice pe baza întrebărilor din chestionar. Se verifică nivelul de măsurare și normalitatea distribuției. 2. Pe baza ipotezelor formulate, se aleg predictorii și în mod similar se construiesc indici, se transformă variabilele nominale în variabile fictive și se verifică normalitatea distribuției (dacă este cazul). 3. Se verifică dacă există o corelație bivariată semnificativă între variabila dependentă și fiecare predictor în parte și
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
formulate, se aleg predictorii și în mod similar se construiesc indici, se transformă variabilele nominale în variabile fictive și se verifică normalitatea distribuției (dacă este cazul). 3. Se verifică dacă există o corelație bivariată semnificativă între variabila dependentă și fiecare predictor în parte și se selectează predictorii pentru care corelația este semnificativă. Se poate întâmpla să existe o corelație bivariată semnificativă între predictor și variabila dependentă și totuși predictorul să nu aibă o influență semnificativă în modelul de regresie multiplă. Aceasta
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
mod similar se construiesc indici, se transformă variabilele nominale în variabile fictive și se verifică normalitatea distribuției (dacă este cazul). 3. Se verifică dacă există o corelație bivariată semnificativă între variabila dependentă și fiecare predictor în parte și se selectează predictorii pentru care corelația este semnificativă. Se poate întâmpla să existe o corelație bivariată semnificativă între predictor și variabila dependentă și totuși predictorul să nu aibă o influență semnificativă în modelul de regresie multiplă. Aceasta se datorează faptului că în modelul
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
distribuției (dacă este cazul). 3. Se verifică dacă există o corelație bivariată semnificativă între variabila dependentă și fiecare predictor în parte și se selectează predictorii pentru care corelația este semnificativă. Se poate întâmpla să existe o corelație bivariată semnificativă între predictor și variabila dependentă și totuși predictorul să nu aibă o influență semnificativă în modelul de regresie multiplă. Aceasta se datorează faptului că în modelul final, impactul unui predictor asupra dependentei este măsurat ținând sub control ceilalți predictori. 4. Se verifică
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
verifică dacă există o corelație bivariată semnificativă între variabila dependentă și fiecare predictor în parte și se selectează predictorii pentru care corelația este semnificativă. Se poate întâmpla să existe o corelație bivariată semnificativă între predictor și variabila dependentă și totuși predictorul să nu aibă o influență semnificativă în modelul de regresie multiplă. Aceasta se datorează faptului că în modelul final, impactul unui predictor asupra dependentei este măsurat ținând sub control ceilalți predictori. 4. Se verifică dacă există corelație între predictori și
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
este semnificativă. Se poate întâmpla să existe o corelație bivariată semnificativă între predictor și variabila dependentă și totuși predictorul să nu aibă o influență semnificativă în modelul de regresie multiplă. Aceasta se datorează faptului că în modelul final, impactul unui predictor asupra dependentei este măsurat ținând sub control ceilalți predictori. 4. Se verifică dacă există corelație între predictori și se selectează predictorii, astfel încât să fie independenți între ei. 5. Se construiește modelul de regresie și în continuare se verifică dacă sunt
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
aibă o influență semnificativă în modelul de regresie multiplă. Aceasta se datorează faptului că în modelul final, impactul unui predictor asupra dependentei este măsurat ținând sub control ceilalți predictori. 4. Se verifică dacă există corelație între predictori și se selectează predictorii, astfel încât să fie independenți între ei. 5. Se construiește modelul de regresie și în continuare se verifică dacă sunt îndeplinite condițiile de aplicare conform măsurilor discutate în secțiunea anterioară. Se analizează impactul valorilor extreme; pentru condiția de necoliniaritate se verifică
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
cei mai în vârstă (care au avut mai multe astfel de contacte), pentru cei care aparțin unei minorități (respectiv maghiarii singurii reprezentați în eșantion) și pentru cei care intenționează să voteze cu CDR. Intenția de vot cu CDR era un predictor bun în 1998 al suportului față de democrație și privatizare și a unei politici de integrare a minorităților în viața politică a țării. Alternativ, am luat în considerare înlocuirea variabilei CDR cu acordul față de privatizare, însă aceasta corela foarte puternic cu
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
fiind ținuți sub control. Restul coeficienților de regresie se citesc în mod similar. Se observă că ipotezele inițiale au fost confirmate. De asemenea, din tabel se pot citi și coeficienții beta care, fiind adimensionali, permit compararea predictorilor; aflăm astfel că predictorul cel mai important este transilvania. Ipoteza de nul pentru testul t este respinsă (Sig.<0,05) în cazul tuturor predictorilor, deci coeficienții B din populație sunt diferiți de 0. De altfel se observă că nici unul din intervalele de încredere nu
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
sunt diferiți de 0. De altfel se observă că nici unul din intervalele de încredere nu conține valoarea 0. Limitele acestui interval pentru o probabilitate de 0,95 sunt date de valoarea B 1,96* eroarea standard. De exemplu, în cazul predictorului transilvania limita inferioară este 24,8 1,96*3,5 = 17,94, cea superioară fiind 24,8 + 6,86 = 31,66. Corelația de ordin zero (zero order correlation) din tabel este corelația simplă, bivariată dintre predictor și dependentă. Corelația parțială
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
De exemplu, în cazul predictorului transilvania limita inferioară este 24,8 1,96*3,5 = 17,94, cea superioară fiind 24,8 + 6,86 = 31,66. Corelația de ordin zero (zero order correlation) din tabel este corelația simplă, bivariată dintre predictor și dependentă. Corelația parțială (partial correlation) este cea dintre predictor și variabilă atunci când ceilalți predictori sunt ținuți sub control. Al doilea tip de corelație parțială (part correlation) diferă de primul prin faptul că efectul variabilelor ținute sub control este îndepărtat
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
8 1,96*3,5 = 17,94, cea superioară fiind 24,8 + 6,86 = 31,66. Corelația de ordin zero (zero order correlation) din tabel este corelația simplă, bivariată dintre predictor și dependentă. Corelația parțială (partial correlation) este cea dintre predictor și variabilă atunci când ceilalți predictori sunt ținuți sub control. Al doilea tip de corelație parțială (part correlation) diferă de primul prin faptul că efectul variabilelor ținute sub control este îndepărtat doar pentru variabila independentă, nu și pentru cea dependentă. Se
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
Distribuția reziduurilor se abate ușor de la normalitate, așa cum am văzut mai sus, însă faptul că dispersia punctelor din grafic nu variază odată cu Y așteptat sugerează egalitatea dispersiilor claselor de valori reziduale. Graficele de regresie parțială permit vizualizarea relației dintre un predictor și dependentă, precum și identificarea cazurilor extreme. 8.2. Regresia logistică Regresia logistică este un alt tip de regresie cu aplicabilitate pentru cazurile în care variabila dependentă este de tip dihotomic (de exemplu, votul pentru un anumit partid, decizia de a
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
un alt tip de regresie cu aplicabilitate pentru cazurile în care variabila dependentă este de tip dihotomic (de exemplu, votul pentru un anumit partid, decizia de a cumpăra un automobil) și se poate presupune lipsa unor efecte de interacțiune între predictorii modelului. Predictorii pot fi măsurați la nivel de raport, interval, ordinal sau pot fi de tip dihotomic ca și variabila dependentă. Popularitatea regresiei logistice se datorează faptului că este o metodă robustă, care nu necesită ca variabila dependentă să fie
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
unități a lui y, celelalte variabile fiind ținute sub control). În cazul regresiei logistice, estimarea impactului pe care modificarea lui x o are asupra lui y se face prin intermediul lui eb. Dacă ridicăm la puterea e ecuația (5) pentru un predictor x, obținem: = e a +bx = ea *(eb)x (6) Din ecuația (6) reiese faptul că modificarea lui x cu 1 unitate conduce la multiplicarea raportului cu eb (notat în continuare cu exp b), celelalte variabile fiind ținute sub control. O
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
se modifică cu o unitate numărul de ani de școlarizare, procentul celor care votează pentru partid crește în medie de la 15% la 21%, celelalte variabile fiind ținute sub control. Ca și în cazul regresiei liniare, modificarea cu o unitate a predictorului poate duce la scăderea sau creșterea lui y. La regresia liniară acest lucru era observabil prin semnul pozitiv sau negativ al coeficientului b. În cazul regresiei logistice comparăm valoarea lui exp b cu 1. Astfel, dacă: * exp b>1, înseamnă
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
1, raportul de șanse nu se modifică deloc (independență). Limitele intervalului de încredere în care putem încadra coeficientul de regresie logistică cu o probabilitate de 95% sunt date de valoarea coeficientului (eroarea standard a coeficientului). Pentru a testa ipoteza că predictorul x are un impact semnificativ asupra variabilei dependente, se folosește statistica Wald calculată de SPSS. Ipoteza de nul fiind aceea că impactul în populația studiată este zero (nu există asociere între x și y). Se urmărește respingerea acestei ipoteze pentru
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
este semnificativ, chiar dacă coeficientul de corelație corespunzător nu este semnificativ (și invers). Acest lucru este posibil deoarece coeficientul logistic reflectă și relația non-liniară care nu este detectată de coeficientul liniar. În plus, într-un model de regresie multiplă impactul unui predictor este măsurat ținând sub control influența celorlalte variabile. Trebuie menționat că statistica Wald (= b2/SEb2, unde SEb2 este eroarea standard a coeficientului b) dă rezultate eronate atunci când valoarea foarte mare a lui b este asociată cu o eroare standard foarte
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
R2 ne indică procentul din variația totală a dependentei explicat de predictori, în cazul regresiei logistice folosirea lui R2 este controversată. Există însă încercări de a propune măsuri similare care să măsoare cu cât se îmbunătățește predicția valorilor dependentei atunci când predictorii sunt incluși în model. O astfel de măsura calculată de SPSS este R2 a lui Cox and Snell, care este însă dificil de interpretat din cauză că valoarea maximă este mai mică decât 1. R2 a lui Nagelkerke reprezintă o corecție a
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
SPSS. În acest caz ipoteza de nul este aceea că toți coeficienții regresiei logistice estimați la nivelul populației din care a fost extras eșantionul sunt zero. Practic, hi pătrat este calculat pe baza diferenței dintre erorile pentru modelul cu toți predictorii și erorile pentru modelul fără nici un predictor (care presupune lipsa asocierii dintre predictori și dependendentă). Acest test nu ne asigură deci că fiecare predictor în parte este semnificativ. Se urmărește ca nivelul de semnificație pentru valoarea hi pătrat a modelului
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
este aceea că toți coeficienții regresiei logistice estimați la nivelul populației din care a fost extras eșantionul sunt zero. Practic, hi pătrat este calculat pe baza diferenței dintre erorile pentru modelul cu toți predictorii și erorile pentru modelul fără nici un predictor (care presupune lipsa asocierii dintre predictori și dependendentă). Acest test nu ne asigură deci că fiecare predictor în parte este semnificativ. Se urmărește ca nivelul de semnificație pentru valoarea hi pătrat a modelului să fie <0,05 astfel încât să respingem
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]
-
sunt zero. Practic, hi pătrat este calculat pe baza diferenței dintre erorile pentru modelul cu toți predictorii și erorile pentru modelul fără nici un predictor (care presupune lipsa asocierii dintre predictori și dependendentă). Acest test nu ne asigură deci că fiecare predictor în parte este semnificativ. Se urmărește ca nivelul de semnificație pentru valoarea hi pătrat a modelului să fie <0,05 astfel încât să respingem ipoteza de nul, care spune că modelul nu îmbunătățește predicția valorilor dependentei. O metodă alternativă, preferabilă celei
by Claudiu Coman [Corola-publishinghouse/Science/1072_a_2580]