17,513 matches
-
veniturile anuale 2 = 1, dacă este absolvent de liceu = 0, dacă nu este absolvent de liceu 3 = 1, dacă este absolvent de facultate = 0, dacă nu este absolvent de facultate Regresia pe o variabilă cantitativă și două variabile calitative Tehnica variabilelor fictive poate fi ușor extinsă pentru a putea lucra cu mai mult de o variabilă calitativă. Întorcându-ne la regresia salariului profesorilor universitari, vom presupune că în relație cu vechimea și sexul, naționalitatea este, de asemenea, determinată pentru salariu; pentru
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
liceu 3 = 1, dacă este absolvent de facultate = 0, dacă nu este absolvent de facultate Regresia pe o variabilă cantitativă și două variabile calitative Tehnica variabilelor fictive poate fi ușor extinsă pentru a putea lucra cu mai mult de o variabilă calitativă. Întorcându-ne la regresia salariului profesorilor universitari, vom presupune că în relație cu vechimea și sexul, naționalitatea este, de asemenea, determinată pentru salariu; pentru a simplifica, vom atribui două categorii: român sau nu. Ca exemplu, avem următorul model: (4
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
feminin 3 = 1, dacă profesorul este roman 3 = 0, dacă profesorul nu este roman 8.1.8. Etape în construcția unui model de regresie În concluzie, pentru a construi un model de regresie trebuie parcurși următorii pași: 1. Se alege variabila dependentă și, dacă este cazul, se construiește un indice pe baza întrebărilor din chestionar. Se verifică nivelul de măsurare și normalitatea distribuției. 2. Pe baza ipotezelor formulate, se aleg predictorii și în mod similar se construiesc indici, se transformă variabilele
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
variabila dependentă și, dacă este cazul, se construiește un indice pe baza întrebărilor din chestionar. Se verifică nivelul de măsurare și normalitatea distribuției. 2. Pe baza ipotezelor formulate, se aleg predictorii și în mod similar se construiesc indici, se transformă variabilele nominale în variabile fictive și se verifică normalitatea distribuției (dacă este cazul). 3. Se verifică dacă există o corelație bivariată semnificativă între variabila dependentă și fiecare predictor în parte și se selectează predictorii pentru care corelația este semnificativă. Se poate
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
dacă este cazul, se construiește un indice pe baza întrebărilor din chestionar. Se verifică nivelul de măsurare și normalitatea distribuției. 2. Pe baza ipotezelor formulate, se aleg predictorii și în mod similar se construiesc indici, se transformă variabilele nominale în variabile fictive și se verifică normalitatea distribuției (dacă este cazul). 3. Se verifică dacă există o corelație bivariată semnificativă între variabila dependentă și fiecare predictor în parte și se selectează predictorii pentru care corelația este semnificativă. Se poate întâmpla să existe
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
2. Pe baza ipotezelor formulate, se aleg predictorii și în mod similar se construiesc indici, se transformă variabilele nominale în variabile fictive și se verifică normalitatea distribuției (dacă este cazul). 3. Se verifică dacă există o corelație bivariată semnificativă între variabila dependentă și fiecare predictor în parte și se selectează predictorii pentru care corelația este semnificativă. Se poate întâmpla să existe o corelație bivariată semnificativă între predictor și variabila dependentă și totuși predictorul să nu aibă o influență semnificativă în modelul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
este cazul). 3. Se verifică dacă există o corelație bivariată semnificativă între variabila dependentă și fiecare predictor în parte și se selectează predictorii pentru care corelația este semnificativă. Se poate întâmpla să existe o corelație bivariată semnificativă între predictor și variabila dependentă și totuși predictorul să nu aibă o influență semnificativă în modelul de regresie multiplă. Aceasta se datorează faptului că în modelul final, impactul unui predictor asupra dependentei este măsurat ținând sub control ceilalți predictori. 4. Se verifică dacă există
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
date folosită este Barometru de Opinie Publică din luna iunie 1998. Pentru aceasta am construit pe baza celor 4 întrebări din chestionar un indice de tip IOPD care are valori de la -100 la +100. Predictorii incluși în model sunt CRISANA, variabilă fictivă care are valoarea 1 pentru cei ce locuiesc în Crișana și 0 pentru restul țării, TRANS, tot o variabilă fictivă cu valoarea 1 pentru Transilvania. LOCORD indică mărimea localității, MAGHIAR este o variabilă fictivă pentru care valoarea 1 îi
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
din chestionar un indice de tip IOPD care are valori de la -100 la +100. Predictorii incluși în model sunt CRISANA, variabilă fictivă care are valoarea 1 pentru cei ce locuiesc în Crișana și 0 pentru restul țării, TRANS, tot o variabilă fictivă cu valoarea 1 pentru Transilvania. LOCORD indică mărimea localității, MAGHIAR este o variabilă fictivă pentru care valoarea 1 îi desemnează pe cei ce s-au declarat maghiari, și 0 pe restul. CDR are valoarea 1 pentru cei care în
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Predictorii incluși în model sunt CRISANA, variabilă fictivă care are valoarea 1 pentru cei ce locuiesc în Crișana și 0 pentru restul țării, TRANS, tot o variabilă fictivă cu valoarea 1 pentru Transilvania. LOCORD indică mărimea localității, MAGHIAR este o variabilă fictivă pentru care valoarea 1 îi desemnează pe cei ce s-au declarat maghiari, și 0 pe restul. CDR are valoarea 1 pentru cei care în 1998 își declarau intenția de a vota cu CDR, iar SUBSCOAL măsoară educația subiectului
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
valoarea 1 pentru cei care în 1998 își declarau intenția de a vota cu CDR, iar SUBSCOAL măsoară educația subiectului. Ipotezele formulate se referă, pe de o parte, la influența factorilor ecologici (de mediu), pe de altă parte, și la variabile individuale. Astfel, am presupus că încrederea va fi mai mare în localități mici și în zone multietnice, cum ar fi Crișana și Transilvania, acolo unde oamenii au contact mai direct cu membrii acestor minorități. De asemenea, încrederea se așteaptă să
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
să voteze cu CDR. Intenția de vot cu CDR era un predictor bun în 1998 al suportului față de democrație și privatizare și a unei politici de integrare a minorităților în viața politică a țării. Alternativ, am luat în considerare înlocuirea variabilei CDR cu acordul față de privatizare, însă aceasta corela foarte puternic cu educația subiectului și mărimea localității, așa că în modelul final a rămas variabila CDR. Fișierul de comandă folosit a fost următorul: count poz = et2 et3 et4 et5 (4,3). count
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
unei politici de integrare a minorităților în viața politică a țării. Alternativ, am luat în considerare înlocuirea variabilei CDR cu acordul față de privatizare, însă aceasta corela foarte puternic cu educația subiectului și mărimea localității, așa că în modelul final a rămas variabila CDR. Fișierul de comandă folosit a fost următorul: count poz = et2 et3 et4 et5 (4,3). count neg = et2 et3 et4 et5 (1,2). count neu= et2 et3 et4 et5 (9). compute IOPD =(poz-neg)*(4-neu)/16*100. recode provinc (2
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
ALL /SCATTERPLOT=(*ZRESID ,*ZPRED ) /RESIDUALS DURBIN HIST(ZRESID) NORM(ZRESID) /CASEWISE PLOT(ZRESID) OUTLIERS(3) . OUTPUT R2 reprezintă procentul din variația dependentei care este explicat de predictori. În acest caz modelul explică 13,5% din variație, restul datorându-se unor variabile care nu sunt incluse în model. R2 ajustat este valoarea lui R2 pentru care se elimină efectul numărului de predictori (cu cât sunt mai mulți predictori, cu atât R2 crește). Eroarea standard este de aproximativ 53,6 de unități, ceea ce
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
96*3,5 = 17,94, cea superioară fiind 24,8 + 6,86 = 31,66. Corelația de ordin zero (zero order correlation) din tabel este corelația simplă, bivariată dintre predictor și dependentă. Corelația parțială (partial correlation) este cea dintre predictor și variabilă atunci când ceilalți predictori sunt ținuți sub control. Al doilea tip de corelație parțială (part correlation) diferă de primul prin faptul că efectul variabilelor ținute sub control este îndepărtat doar pentru variabila independentă, nu și pentru cea dependentă. Se folosește atunci când
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
este corelația simplă, bivariată dintre predictor și dependentă. Corelația parțială (partial correlation) este cea dintre predictor și variabilă atunci când ceilalți predictori sunt ținuți sub control. Al doilea tip de corelație parțială (part correlation) diferă de primul prin faptul că efectul variabilelor ținute sub control este îndepărtat doar pentru variabila independentă, nu și pentru cea dependentă. Se folosește atunci când se presupune că variabila de control afectează variabila independentă, dar nu și pe cea dependentă (David Garson, An Online Textbook). Coefficientsa Model Unstandardized
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Corelația parțială (partial correlation) este cea dintre predictor și variabilă atunci când ceilalți predictori sunt ținuți sub control. Al doilea tip de corelație parțială (part correlation) diferă de primul prin faptul că efectul variabilelor ținute sub control este îndepărtat doar pentru variabila independentă, nu și pentru cea dependentă. Se folosește atunci când se presupune că variabila de control afectează variabila independentă, dar nu și pe cea dependentă (David Garson, An Online Textbook). Coefficientsa Model Unstandardized Coefficients Stan-dardi-zed Coeffi-cients t Sig. 95,0% Confidence
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
sunt ținuți sub control. Al doilea tip de corelație parțială (part correlation) diferă de primul prin faptul că efectul variabilelor ținute sub control este îndepărtat doar pentru variabila independentă, nu și pentru cea dependentă. Se folosește atunci când se presupune că variabila de control afectează variabila independentă, dar nu și pe cea dependentă (David Garson, An Online Textbook). Coefficientsa Model Unstandardized Coefficients Stan-dardi-zed Coeffi-cients t Sig. 95,0% Confidence Interval for B Correlations Collinearity Statistics B Std. Error Beta Lower Bound Upper
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
Al doilea tip de corelație parțială (part correlation) diferă de primul prin faptul că efectul variabilelor ținute sub control este îndepărtat doar pentru variabila independentă, nu și pentru cea dependentă. Se folosește atunci când se presupune că variabila de control afectează variabila independentă, dar nu și pe cea dependentă (David Garson, An Online Textbook). Coefficientsa Model Unstandardized Coefficients Stan-dardi-zed Coeffi-cients t Sig. 95,0% Confidence Interval for B Correlations Collinearity Statistics B Std. Error Beta Lower Bound Upper Bound Zero-order Partial Part
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
3,503 ,203 7,091 ,000 17,966 31,710 ,246 ,200 ,19 ,87 1,14 a. Dependent Variable: IOPD Ultimele două coloane din tabel conțin indicatori ai multicolinearității, adică ai gradului de corelație care există între predictori. Pentru o variabilă, toleranța este egală cu a regresiei variabilei respective funcție de ceilalți predictori. Valorile apropiate de 0 indică probleme cu multicolinearitatea, ceea ce nu este cazul în exemplul de față. VIF (variance inflation factor) este inversul toleranței și deci valorile mari (>4) vor
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
966 31,710 ,246 ,200 ,19 ,87 1,14 a. Dependent Variable: IOPD Ultimele două coloane din tabel conțin indicatori ai multicolinearității, adică ai gradului de corelație care există între predictori. Pentru o variabilă, toleranța este egală cu a regresiei variabilei respective funcție de ceilalți predictori. Valorile apropiate de 0 indică probleme cu multicolinearitatea, ceea ce nu este cazul în exemplul de față. VIF (variance inflation factor) este inversul toleranței și deci valorile mari (>4) vor indica probleme de acest gen. În tabelul
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
egalitatea dispersiilor claselor de valori reziduale. Graficele de regresie parțială permit vizualizarea relației dintre un predictor și dependentă, precum și identificarea cazurilor extreme. 8.2. Regresia logistică Regresia logistică este un alt tip de regresie cu aplicabilitate pentru cazurile în care variabila dependentă este de tip dihotomic (de exemplu, votul pentru un anumit partid, decizia de a cumpăra un automobil) și se poate presupune lipsa unor efecte de interacțiune între predictorii modelului. Predictorii pot fi măsurați la nivel de raport, interval, ordinal
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
pentru un anumit partid, decizia de a cumpăra un automobil) și se poate presupune lipsa unor efecte de interacțiune între predictorii modelului. Predictorii pot fi măsurați la nivel de raport, interval, ordinal sau pot fi de tip dihotomic ca și variabila dependentă. Popularitatea regresiei logistice se datorează faptului că este o metodă robustă, care nu necesită ca variabila dependentă să fie cantitativă și să aibă o distribuție normală. Există cerințe care se aplică la fel ca și în cazul regresiei liniare
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
de interacțiune între predictorii modelului. Predictorii pot fi măsurați la nivel de raport, interval, ordinal sau pot fi de tip dihotomic ca și variabila dependentă. Popularitatea regresiei logistice se datorează faptului că este o metodă robustă, care nu necesită ca variabila dependentă să fie cantitativă și să aibă o distribuție normală. Există cerințe care se aplică la fel ca și în cazul regresiei liniare, și anume: * Specificarea corectă a modelului de regresie, adică includerea tuturor variabilelor relevante pentru explicarea variabilei dependente
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]
-
robustă, care nu necesită ca variabila dependentă să fie cantitativă și să aibă o distribuție normală. Există cerințe care se aplică la fel ca și în cazul regresiei liniare, și anume: * Specificarea corectă a modelului de regresie, adică includerea tuturor variabilelor relevante pentru explicarea variabilei dependente și excluderea celor irelevante; * Lipsa unei relații de corelație între variabilele independente care conduce, ca și în cazul regresiei liniare, la efectul de multicoliniaritate; * Independența între termenii eroare (dependența poate apărea atunci când se lucrează cu
Statistică aplicată în științele sociale by Claudiu Coman () [Corola-publishinghouse/Science/1072_a_2580]