2,315 matches
-
se află în medie foarte aproape de dreaptă (vezi exemplul A de mai sus) și putem să ne imaginăm o dreaptă de regresie acolo unde punctele se afla în medie mult mai departe (vezi exemplu, B). Calcularea convențională a puterii de regresie este o măsură P.R.E., bazată pe o reducere proporțională a erorilor. Enunțul cauzal afirmă că valorile prevăzute în Y ca dependent de X furnizează o explicație mai bună pentru date decât valorile lui Y luat complet de sine stătător. Puterea
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
stătător dispare atunci când utilizăm în schimb Y luat cu X. Logica pare elementară. Tendința centrală univariată pentru Y de sine stătător, fără influențele cauzale, este Y. Tendința centrală pentru Y care covariază cu X, dependent de X, este dreapta de regresie Y. Pentru ca relația de cauzalitate să fie posibilă, variația lui Y luat cu X trebuie să fie mai mică decât Y luat de sine stătător. În absența acesteia, variabila dependentă ar fi explicată la fel, sau poate chiar mai bine
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
bine de una singură, iar variabila independentă nu ar avea nici un efect vizibil. Astfel, pentru observațiile din eșantion, suma distanței pătrate pe verticală de la valorile observate ale lui Y (adică Yi) la valorile corespunzătoare pentru Y din tendința centrală de regresie (adică ⎧i), trebuie să fie mai mică decât suma distanței pătrate de la Yi la valorile corespunzătoare pentru Y din tendința centrală univariată, (): Măsura puterii (numită R pătrat) ne arată gradul în care aceste lucru este adevărat. Există un volum total
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
total de variație care rămâne de explicat după ce descriem pe Y în funcție de tendința sa centrală univariată, media sa. O parte oarecare din acest spațiu rămâne și după ce descriem pe Y în funcție de tendința sa centrală bivariată dependentă de X, dreapta de regresie, iar o altă parte dispare. Reducerea proporțională a erorii va fi: R2 = șVariația totalăy - Restul de variațiexyț/Variația totalăy R2 = Sș(Yi - ⎧i)2 - S(Yi -)2ț/S(Yi -)2 Coeficientul, deoarece reprezintă un procentaj, poate lua valori de la 0
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
erorii va fi: R2 = șVariația totalăy - Restul de variațiexyț/Variația totalăy R2 = Sș(Yi - ⎧i)2 - S(Yi -)2ț/S(Yi -)2 Coeficientul, deoarece reprezintă un procentaj, poate lua valori de la 0 la 1. Coeficientul de putere reflectă contribuția ecuației regresiei bivariate la reducerea variației totale de la nivelul variabilei dependente. Cu cât observațiile respective sunt plasate mai aproape de dreapta de regresie, (măsurată vertical pe de-a lungul axei Y), cu atât este mai puternică regresia ca tendință centrală. În cazul unei
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
Yi -)2 Coeficientul, deoarece reprezintă un procentaj, poate lua valori de la 0 la 1. Coeficientul de putere reflectă contribuția ecuației regresiei bivariate la reducerea variației totale de la nivelul variabilei dependente. Cu cât observațiile respective sunt plasate mai aproape de dreapta de regresie, (măsurată vertical pe de-a lungul axei Y), cu atât este mai puternică regresia ca tendință centrală. În cazul unei puteri mai mari, rămâne o parte mai mică din volumul total din variația lui Y și dispare chiar mai mult
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
Coeficientul de putere reflectă contribuția ecuației regresiei bivariate la reducerea variației totale de la nivelul variabilei dependente. Cu cât observațiile respective sunt plasate mai aproape de dreapta de regresie, (măsurată vertical pe de-a lungul axei Y), cu atât este mai puternică regresia ca tendință centrală. În cazul unei puteri mai mari, rămâne o parte mai mică din volumul total din variația lui Y și dispare chiar mai mult din aceasta atunci când se introduce tendința centrală bivariată a lui X. Altfel spus, în
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
cu victimele de pe autostradă utilizat anterior R2 = 0,261 ceea ce înseamnă că sumele alocate pentru autostrăzi de la nivelul statelor sunt responsabile de aproximativ un sfert din variantă de victimele de la nivelul statelor, lăsând restul neexplicat. Nu este necesar ca o regresie eficientă să producă un R2 mare ca valoare. Totuși, un volum mare de variantă neexplicată ne sugerează că cercetătorul ar trebui să caute variabile în plus, într-un format cu regresii multiple, ca să-și continue analiza cauzală asupra variabilei dependente
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
statelor, lăsând restul neexplicat. Nu este necesar ca o regresie eficientă să producă un R2 mare ca valoare. Totuși, un volum mare de variantă neexplicată ne sugerează că cercetătorul ar trebui să caute variabile în plus, într-un format cu regresii multiple, ca să-și continue analiza cauzală asupra variabilei dependente. Astfel, statistica descriptivă bivariată care folosește regresia permite o examinare detaliată a datelor colectate, comparând valorile lui Yi (valorile reale observate ale variabilei dependente care apar odată cu fiecare valoare observată dată
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
ca valoare. Totuși, un volum mare de variantă neexplicată ne sugerează că cercetătorul ar trebui să caute variabile în plus, într-un format cu regresii multiple, ca să-și continue analiza cauzală asupra variabilei dependente. Astfel, statistica descriptivă bivariată care folosește regresia permite o examinare detaliată a datelor colectate, comparând valorile lui Yi (valorile reale observate ale variabilei dependente care apar odată cu fiecare valoare observată dată a variabilei independente, așa cum sunt înfățișate în graficul dispersat X- ⎧); Y (valorile prevăzute ale variabilei dependente
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
analize univariate a variabilei luată de sine stătător, așa cum se găsesc pe orizontala trasată la nivelul mediei sale aritmetice); și Y (valorile prevăzute ale variabilei dependente pe baza unor cauzalități bivariate cu variabila independentă, așa cum se găsesc pe dreapta de regresie Y = a + bX). Atunci când avem o ipoteză cauzală, în care Y este cauzat într-o oarecare măsură de X, regresia identifică drept tendință centrală tiparul relației de covariație direcțională din cadrul datelor observate. Pornind de la nivelul lui Y indicat de punctul
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
Y (valorile prevăzute ale variabilei dependente pe baza unor cauzalități bivariate cu variabila independentă, așa cum se găsesc pe dreapta de regresie Y = a + bX). Atunci când avem o ipoteză cauzală, în care Y este cauzat într-o oarecare măsură de X, regresia identifică drept tendință centrală tiparul relației de covariație direcțională din cadrul datelor observate. Pornind de la nivelul lui Y indicat de punctul de intersecție în care X este zero, valoarea calculată a lui Y crește (sau scade), pentru fiecare incrementare succesivă în
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
ale lui ⎧ (adică ⎧i) sunt sistematice pentru valorile luate de X. O parte din variația observată la Y (Yi-) este captată de dependența cauzală de X, dar nu neapărat toată. Variația reziduală (Yi-⎧i) este distribuită aleatoriu în jurul dreptei de regresie și reprezintă astfel o variație nesistematică la nivelul lui Y față de X. Când se estimează tendința centrală a dreptei de regresie pentru orice set de date bivariate, se poate evalua gradul de potrivire pentru oricare observație singulară identificată. Cu cât
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
de dependența cauzală de X, dar nu neapărat toată. Variația reziduală (Yi-⎧i) este distribuită aleatoriu în jurul dreptei de regresie și reprezintă astfel o variație nesistematică la nivelul lui Y față de X. Când se estimează tendința centrală a dreptei de regresie pentru orice set de date bivariate, se poate evalua gradul de potrivire pentru oricare observație singulară identificată. Cu cât este mai mare partea reziduală, cu atât mai diferit este acest caz față de aspectul general; cu cât este partea reziduală mai
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
astfel puterea explicativă a afirmației cauzale. Cu cât este mai mic volumul total al variației reziduale față de variația totală în Y luat de sine stătător, cu atât este mai puternică relația, altfel spus, cu atât mai mult tendința centrală de regresie servește drept indicator util pentru valorile observate din eșantion. În cazul unei puteri mai mari, o parte mai mare din variația de la nivelul lui Y poate fi considerată sistematică în relația sa cu X. Astfel, cu atât este X mai
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
X mai puternic în a furniza o explicație aparentă pentru comportamentul lui Y, și cu atât este mai mică nevoia de a se lua în considerare și alte variabile suplimentare care să contribuie la completarea explicației. Am observat că logica regresiei este exemplificată în fiecare zi de oameni obișnuiți care folosesc un limbaj obișnuit. De exemplu, nu de mult am auzit niște studenți vorbind despre doi dintre colegi. S-ar părea că John are un fel de fixație pentru Mary de
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
ne-am axat în principal pe folosirea statisticii descriptive, învățând cum să calculăm tendința centrală și gradul de împrăștiere din cadrul eșantionului. De exemplu, în cazul unei ipoteze cauzale bivariate am descris tendința centrală a datelor sub formă de dreaptă de regresie a pătratelor celor mai mici - adică panta și constanta specifice relației „Y covariază cu X, în funcție de X”. De asemenea, am prezentat puterea explicativă a tendinței centrale observate respective în forma R2 - proporția de variație totală din jurul mediei lui Y care
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
să admită că demonstrează ceva. Tendința centrală și variația calculate se referă doar la eșantionul de date colectate. Validitatea ipotezei cauzale și caracterizarea exactă a relației dintre variabile se referă însă la întreaga populație. Altfel spus, am calculat coeficienții de regresie pe baza supoziției teoretice conform căreia X și Y ar avea o conexiune cauzală direcțională; am acordat semnificație acestor coeficienți pe baza presupunerii teoretice a capacității de generalizare. Acum, ambele premise necesită justificări. Statistica inferențială constituie procesul prin care avem
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
observațiile dinmulțime pot prezenta o variație - în acest caz numai (n-1) pot varia, celelalte trebuie să rămână stabile pentru a se putea obține media specificată (grade de libertate = n - 1). În mod similar, să ne imaginăm o linie de regresie în care cunoaștem panta careexprimă covariația lui X și Y. Din nou, pot prezenta o variație liberă doar (n-1) dintreobservații, celelalte fiind fixe pentru a se putea obține b specificat (grade de libertate = n - 1). În general, gradele de
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
mărimea, tendința centrală și variația - au un efect major asupra inferențelor pe care le facem în scopul unei generalizări mai ample. Cea de-a doua ilustrare pentru semnificația testului t este pe o structură bivariată și cauzală, utilizând modelul de regresie liniară dezvoltat în Cursul 10. Ipoteza de testare este aceea că volumul de cheltuieli pentru autostrăzi, suportat de către statele din Statele Unite, calculat ca parte a produsului intern al statului respectiv, covariază sistematic cu numărul total de accidente mortale și determină
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
a + bX + e trebuie să fie negativă și mult diferită de zero. Dar nu avem date referitoare la statele respective decât pentru un singur an și, în consecință, orice inferență statistică trebuie să utilizeze distribuții t. Pentru evaluarea datelor de regresie, formula de calcul pentru t va fi: (bs - bp)/eroare standards, unde eroarea standard pentru eșantion se va calcula: Din nou, numărătorul este distanța la care se plasează tendința centrală a eșantionului față de tendința centrală a populației. Datorită faptului că
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
a pantei, se calculează pe baza variației totale a lui ⎧, (adică Yi - ⎧), pe care o ridicăm la pătrat pentru ca să nu avem un rezultat zero. Se împarte apoi cu numărul disponibil de grade de libertate (n-1 pentru tendința centrală de regresie bivariată, și astfel n-2 pentru partea sa reziduală) pentru a obține pătratul variației reziduale medii a lui ⎧. Acesta se împarte la suma variației lui X ridicată la pătrat (deoarece ipoteza consideră pe Y dependent de X) și apoi se
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
împarte la suma variației lui X ridicată la pătrat (deoarece ipoteza consideră pe Y dependent de X) și apoi se extrage rădăcina pătrată, pentru a se compensa ridicarea la pătrat precedentă. (Aceste date ne sunt furnizate de majoritatea programelor de regresie din computere.) Pentru exemplul nostru care folosea cheltuielile pentru autostrăzi, ecuația calculată a regresiei, așa cum am văzut în Cursul 10, este: Y = 1950,335 - 962,419X. Eroarea standard pentru coeficientul de pantă, conform computerului, este 233,813. Astfel, t se
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
dependent de X) și apoi se extrage rădăcina pătrată, pentru a se compensa ridicarea la pătrat precedentă. (Aceste date ne sunt furnizate de majoritatea programelor de regresie din computere.) Pentru exemplul nostru care folosea cheltuielile pentru autostrăzi, ecuația calculată a regresiei, așa cum am văzut în Cursul 10, este: Y = 1950,335 - 962,419X. Eroarea standard pentru coeficientul de pantă, conform computerului, este 233,813. Astfel, t se va calcula: (962,419 - 0)/233,813 = 4,116 Tendința centrală pentru datele eșantionului
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]
-
de accidente mare, numai în acele observații în care populația statului este numeroasă/numărul de accidente este mare. Controlul cvasi-experimental este realizat prin eliminarea statistică a impactului variabilei de control (X2) asupra lui X1 și Y. În acest scop, efectuăm regresia lui X2 la nivelul lui X1, identificând partea din variație care este explicată de către X2 (X12), și partea care rămâne neexplicată (u). În mod similar, efectuăm regresia lui X2 la nivelul lui Y, identificând partea din variație care este explicată
Strategia cercetării. Treisprezece cursuri despre elementele științelor sociale by Ronald F. King () [Corola-publishinghouse/Science/2240_a_3565]