150 matches
-
ț. Pentru orice observație (i), variația de la nivelul variabilei Y este (Yi - ), iar variația variabilei X este (Xi -). Covariația pentru observația i este rezultatul celor două scăderi. Covariația totală este pur și simplu suma scorurilor pentru toate observațiile din eșantion. Covariația poate fi interpretată într-un mod foarte simplu. Întrebarea care se pune este dacă atunci când observațiile pentru X sunt sub media pentru X, au și observațiile pentru Y tendința să fie sub media lui Y; dacă observațiile pentru X sunt
[Corola-publishinghouse/Science/2240_a_3565]
-
Dacă însă observațiile pentru X sunt sub (respectiv peste) media lui X, iar observațiile pentru Y tind să fie peste (respectiv sub) media lui Y, semnul va fi negativ. Cele două variabile covariază în opoziție una față de cealaltă. Mai mult, covariația calculată va fi mai mare față de zero (adică, vom avea o relație pozitivă cu o pantă mai abruptă) în măsura în care, atunci când X deviază mai mult de la media sa, Y deviază chiar mai mult de la media sa, în aceeași direcție. Covariația calculată
[Corola-publishinghouse/Science/2240_a_3565]
-
mult, covariația calculată va fi mai mare față de zero (adică, vom avea o relație pozitivă cu o pantă mai abruptă) în măsura în care, atunci când X deviază mai mult de la media sa, Y deviază chiar mai mult de la media sa, în aceeași direcție. Covariația calculată va fi mai mică în raport cu zero (adică, vom avea o relație negativă cu panta mai abruptă) în măsura în care, atunci când X deviază mai mult de la media sa, Y deviază chiar mai mult de la media sa, în direcție opusă. Numitorul comun pentru
[Corola-publishinghouse/Science/2240_a_3565]
-
uzuală de calculare a dreptei de regresie din datele observate se numește estimarea celor mai mici pătrate ordinale. Este extrem de important să facem distincția dintre regresie și corelație, un concept cu care aceasta este confundată adeseori. Corelația se bazează pe covariația lui X și Y, normate de variația lui X și a lui Y. Coeficientul pantei de regresie se bazează pe covariația lui X și Y, normată doar de variația lui X la pătrat. În esență, corelația examinează măsura în care
[Corola-publishinghouse/Science/2240_a_3565]
-
să facem distincția dintre regresie și corelație, un concept cu care aceasta este confundată adeseori. Corelația se bazează pe covariația lui X și Y, normate de variația lui X și a lui Y. Coeficientul pantei de regresie se bazează pe covariația lui X și Y, normată doar de variația lui X la pătrat. În esență, corelația examinează măsura în care fiecare dintre variabile se situează peste sau sub media sa, atunci când cealaltă este plasată cu un anume grad peste sau sub
[Corola-publishinghouse/Science/2240_a_3565]
-
pe tendința centrală. Mai mult, ca și în cazul mediei univariate, sunt posibile mai multe aranjamente de date care să producă aceeași tendință centrală. Puterea unei relații liniare bivariate ne arată cât este de dominantă tendința centrală asupra distribuției de covariație observată. Putem să ne imaginăm o dreaptă de regresie situată acolo unde punctele din graficul dispersat se află în medie foarte aproape de dreaptă (vezi exemplul A de mai sus) și putem să ne imaginăm o dreaptă de regresie acolo unde
[Corola-publishinghouse/Science/2240_a_3565]
-
pătrat și apoi însumat spre a se evita un rezultat zero) în jurul mediei lui Y pentru care vom căuta explicații. Există un volum total de variație (ridicat la pătrat și însumat) care rămâne după ce am prevăzut pe Y pe baza covariației sale cu X. Diferența dintre acestea două (ridicată la pătrat și însumată) constituie varianta eliminată și, prin urmare, explicată de introducerealuiX ca determinant al covariației. Apoi aceasta va fi exprimată ca procentaj al variației totale din jurul mediei lui Y. Pentru
[Corola-publishinghouse/Science/2240_a_3565]
-
variație (ridicat la pătrat și însumat) care rămâne după ce am prevăzut pe Y pe baza covariației sale cu X. Diferența dintre acestea două (ridicată la pătrat și însumată) constituie varianta eliminată și, prin urmare, explicată de introducerealuiX ca determinant al covariației. Apoi aceasta va fi exprimată ca procentaj al variației totale din jurul mediei lui Y. Pentru a facilita înțelegerea, să ne imaginăm că avem un spațiu total de variație care rămâne de explicat după ce descriem pe Y în funcție de tendința sa centrală
[Corola-publishinghouse/Science/2240_a_3565]
-
unor cauzalități bivariate cu variabila independentă, așa cum se găsesc pe dreapta de regresie Y = a + bX). Atunci când avem o ipoteză cauzală, în care Y este cauzat într-o oarecare măsură de X, regresia identifică drept tendință centrală tiparul relației de covariație direcțională din cadrul datelor observate. Pornind de la nivelul lui Y indicat de punctul de intersecție în care X este zero, valoarea calculată a lui Y crește (sau scade), pentru fiecare incrementare succesivă în X, într-un ritm constant reflectat de coeficientul
[Corola-publishinghouse/Science/2240_a_3565]
-
partea reziduală, cu atât mai diferit este acest caz față de aspectul general; cu cât este partea reziduală mai mică, cu atât acesta corespunde mai mult cu modelul tipic. Dacă explicația privind cauzalitatea este corectă, valorile prevăzute pentru Y, calculate din covariația lui Y dependentă de X trebuie să se dovedească în general a fi anticipatori superiori în comparație cu valorile prevăzute pentru Y calculate din tendința centrală proprie a lui Y, media sa. Instabilitatea sumei valorilor observate (Yi) în jurul lui ⎧ trebuie să fie
[Corola-publishinghouse/Science/2240_a_3565]
-
le pună în ordine ca să poată trage o concluzie solidă, una care să poată fi afirmată cu încredere maximă. Datele, prin ele însele, nu vorbesc într-un mod coerent. În conformitate cu ipoteza sa, cercetătorul își grupează și organizează datele pe baza covariației dintre X și Y. O anumită parte din variația observată la nivelul lui Y poate fi descrisă ca fiind sistematică în raport cu covariația sa direcțională cu X, în timp ce restul rămâne aleatoriu și astfel aparent neexplicat. Dar nu putem fi siguri că
[Corola-publishinghouse/Science/2240_a_3565]
-
însele, nu vorbesc într-un mod coerent. În conformitate cu ipoteza sa, cercetătorul își grupează și organizează datele pe baza covariației dintre X și Y. O anumită parte din variația observată la nivelul lui Y poate fi descrisă ca fiind sistematică în raport cu covariația sa direcțională cu X, în timp ce restul rămâne aleatoriu și astfel aparent neexplicat. Dar nu putem fi siguri că o astfel de relație observată pe un eșantion este adevărată cu privire la întreaga populație de cazuri existente sau potențiale din lumea întreagă. În calitate de
[Corola-publishinghouse/Science/2240_a_3565]
-
sumele cheltuite pentru asistența socială nu variază conform unui tipar sistematic în raport cu variațiile de la nivelul puterii mișcării sindicale. În general, în cazul ipotezelor cauzale de tipul Y covariază sistematic în funcție de X, ipoteza nulă afirmă că nu există nici un fel de covariație sistematică și direcțională care să lege cele două variabile. Ipoteza nulă constituie o premisă morală, esențială pentru testarea empirică. Dacă, pe baza constatărilor noastre din cercetare avem motive serioase să respingem ipoteza nulă, atunci este foarte posibil (chiar dacă totuși nu
[Corola-publishinghouse/Science/2240_a_3565]
-
respinși, ipoteza nulă afirmă că nu există diferențe între medii (media X1 - media X2 = 0). Logica este similară și pentru afirmațiile cauzale care se bazează pe X și Y. Folosind terminologia introdusă în Cursul 10, panta pentru ⎧ - tendința centrală pentru covariația lui X și Y în funcție de X - este b. Panta pentru ⎧ - tendința centrală pentru Y care variază independent de X - este zero, o linie orizontală egală cu valoarea medie pentru Y. Astfel, dacă afirmația de testat este aceea că un consum
[Corola-publishinghouse/Science/2240_a_3565]
-
în acest caz numai (n-1) pot varia, celelalte trebuie să rămână stabile pentru a se putea obține media specificată (grade de libertate = n - 1). În mod similar, să ne imaginăm o linie de regresie în care cunoaștem panta careexprimă covariația lui X și Y. Din nou, pot prezenta o variație liberă doar (n-1) dintreobservații, celelalte fiind fixe pentru a se putea obține b specificat (grade de libertate = n - 1). În general, gradele de libertate disponibile sunt egale cu numărul
[Corola-publishinghouse/Science/2240_a_3565]
-
selectează toate observațiile în căsuțe corespunzătoare într-un tabel de asociere, întrebarea care se pune este dacă tiparul care apare din date este suficient de diferit de unul care ar fi putut apărea dacă nu ar exista nici o relație de covariație în cadrul populației de bază. În Cursul 10, de exemplu, am discutat un proiect de cercetare imaginar care împărțea indivizii după două dimensiuni, dreptaci și stângaci, absolvenți de universitate și non-absolvenți. Am avut 100 de stângaci în eșantion și 68,0
[Corola-publishinghouse/Science/2240_a_3565]
-
aceștia au fost absolvenți de universitate; am avut 300 de dreptaci în eșantion și 42,3% dintre aceștia au fost absolvenți de universitate. Trebuie să analizăm dacă aceste cifre sunt suficiente pentru a putea respinge ipoteza nulă - afirmația că toată covariația observată este iluzorie și poate apărea cu ușurință în mod accidental dintr-o populație în care 50% din indivizi sunt absolvenți de universitate, atât din subpopulația de dreptaci, cât și din cea de stângaci. Testul hi pătrat (c2) se bazează
[Corola-publishinghouse/Science/2240_a_3565]
-
de orice influență cauzală directă din partea variabilei de control. Un cvasi-experiment care folosește variabile de control se bazează pe un „coeficient de pantă parțial” (b1) care rezultă din regresia acestor doi factori reziduali. Adică, b1 se calculează ca sumă a covariației lui u și v, împărțită la suma variației din u, ridicată la pătrat. b1 = S(u)(v)/S(u)2 = S(X1 - X12)(Y - XY2)/S(X1 - X12)2 Rezultatul pentru numărul de accidente mortale este interesant, deoarece acesta ne
[Corola-publishinghouse/Science/2240_a_3565]
-
a variației din jurul tendinței centrale. Nici o afirmație cauzală nu explică vreodată 100% din variația de la nivelul variabilei dependente. Limbajul științelor sociale se referă la măsura în care este redusă variația din jurul variabilei Y, considerată izolat, prin luarea în considerare a covariației cu X. Ba mai mult, științele sociale subliniază relevanța unor cauze multiple, parțiale, care acționează asupra lui X, insistând asupra complexității legăturilor dintre variabile și importanța factorilor de control. De asemenea, se consideră necesar ca o afirmație empirică să fie
[Corola-publishinghouse/Science/2240_a_3565]
-
a unui raționament corect cu privire la problemele lumii moderne și a înțelegerii datelor introduse în scopul susținerii afirmațiilor empirice. Pentru publicul din domeniul de specialitate, această testare este un ajutor inestimabil în cercetare, care ajută la stabilirea încrederii în tiparele de covariație observate în cadrul unor seturi mari de date. (Un fost profesor de-al meu și-a declarat odată refuzul de a învăța și aplica tehnicile de testare a semnificației, fiindcă aceasta îi părea ca și cum cineva ar deveni specialist redutabil în Goethe
[Corola-publishinghouse/Science/2240_a_3565]
-
selectare de cazuri în care toate sunt complet diferite. Raționamentul este clar. Diferențele nu pot produce elemente comune. Dacă toate variabilele aflate în competiție sunt distribuite aleatoriu față de variabila independentă, atunci efectele celorlalte variabile sunt controlate și orice tipar de covariație observat între variabila independentă și cea dependentă este, foarte probabil, neiluzoriu. De exemplu, să ne imaginăm o selecție de trei țări - Pakistan, Uruguay și Slovacia pentru care am putea emite ipoteza că toate au început în același timp campanii puternice
[Corola-publishinghouse/Science/2240_a_3565]
-
au început în același timp campanii puternice și eficiente împotriva corupției, folosind strategii similare. Ceilalți factori cauzali potențiali (cultura, istoria, instituțiile politice, religia, ratele de creștere economică etc.) sunt foarte diferiți la nivelul acestor țări. Nu există nici un tipar de covariație între nici una dintre variabilele de control și variabila independentă principală, totuși, acea variabilă independentă principală covariază evident cu variabila dependentă. Prin eliminare, se poate concluziona că strategia de campanie anti-corupție adoptată de către cele trei țări constituie foarte probabil o cauză
[Corola-publishinghouse/Science/2240_a_3565]
-
decât descoperirea unor cazuri absolut identice din punctul de vedere al variabilelor de control. Dar cu puține observații și, implicit, fără o statistică pentru calcularea tendinței centrale și a semnificației, este dificil să afirmăm cu convingere absența unui tipar de covariație la nivelul variabilelor independente potențiale. O selecție alternativă a observațiilor ar fi putut foarte bine produce un rezultat contrar. Specialiștii din științele sociale dezbat adesea avantajele abordărilor în sistemele „cel-mai-asemănător” și „cel-mai-diferit” din cercetarea comparativă. Din punctul meu de vedere
[Corola-publishinghouse/Science/2240_a_3565]
-
dintre cazuri. Diferența este într-o oarecare măsură mai ușor de găsit, dar aproape la fel de greu de stabilit ca și similitudinea. Inferența din metoda sistemului „cel-mai-diferit” este puțin mai ezitantă decât din sistemul „cel-mai-asemănător”, datorită cerințelor suplimentare de a nega covariația dintre variabilele de control și independență. Decizia privind care abordare comparativă să fie aplicată, „cea-mai-asemănătoare” sau „cea-mai-diferită”, trebuie să fie în funcție de disponibilitatea de date și ocazii de cercetare. De asemenea, este posibil să se combine abordările în cadrul aceluiași studiu, căutându
[Corola-publishinghouse/Science/2240_a_3565]
-
științelor sociale, punând accentul pe problemele din științele politice. Această serie acoperă o arie largă de teme: - legătura esențială dintre teorie, ipoteză și variabile, și rolul fiecăreia în cercetare; - afirmația cauzală compusă din variabile independente și dependente în relație de covariație direcțională plauzibilă neiluzorie; - ipoteza cauzală bivariată, concepută în funcție de direcție, pantă, intersecție și termen de eroare; - ipoteza cauzală multivariată, importanța variabilelor de control și legăturile unei traiectorii cauzale specificate; - modelul deductiv complet ca reprezentare abstractă a realității sociale și utilizarea sa
[Corola-publishinghouse/Science/2240_a_3565]