987 matches
-
aflăm cum se structurează opiniile cetățenilor cu privire la performanța guvernului, vom ancheta un eșantion de cetățeni (obiectele) asupra felului în care evaluează diferite aspecte ale activității guvernului (variabilele observabile). Fiind o analiză de corelație, variabilele care pot intra într-o analiză factorială trebuie să fie măsurate pe scale de intervale sau de rapoarte (variabile metrice). Este generală totuși asumpția că multe dintre variabilele ordinale (care măsoară opinii sau atitudini, de pildă) pot primi valori numerice fără a distorsiona proprietățile latente. Pentru a
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
2, 3 treptelor scalei ar răspunde pozitiv condițiilor de mai sus. Matricea de corelațietc "Matricea de corelație" Cel de-al doilea pas este cel de examinare a datelor și de calculare a matricei de covarianță/corelație. În realizarea unei analize factoriale cel mai adesea folosim ca punct de start matricea de corelație. Acest lucru rezolvă problemele care pot apărea din pricina scalelor de măsură diferite ale variabilelor și a varianțelor diferite pe care acestea le pot avea în populație (respectiv, în eșantionul
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
a datelor. Matricea de covarianță este recomandată atunci când dorim să facem comparații între grupuri: corelațiile, care sunt măsuri standardizate folosind standarde specifice grupului, vor face invariante valori care sunt diferite de la grup la grup. Una dintre asumpțiile critice ale analizei factoriale, de natură conceptuală, este aceea că între variabilele observate există suficientă corelație pentru a avea sens să realizăm o analiză factorială. Dacă între variabile nu există corelație substanțială, atunci nu are rost să căutăm factori comuni care să le determine
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
specifice grupului, vor face invariante valori care sunt diferite de la grup la grup. Una dintre asumpțiile critice ale analizei factoriale, de natură conceptuală, este aceea că între variabilele observate există suficientă corelație pentru a avea sens să realizăm o analiză factorială. Dacă între variabile nu există corelație substanțială, atunci nu are rost să căutăm factori comuni care să le determine. Există câteva modalități de a stabili dacă există suficientă corelație între variabilele observate pentru a analiza factorial datele: 1) Una este
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
să realizăm o analiză factorială. Dacă între variabile nu există corelație substanțială, atunci nu are rost să căutăm factori comuni care să le determine. Există câteva modalități de a stabili dacă există suficientă corelație între variabilele observate pentru a analiza factorial datele: 1) Una este aceea de a testa statistic prezența corelației între variabile. Acest lucru se face cu ajutorul testului de sfericitate Bartlett, care testează ipoteza că matricea de corelație este matricea-identitate (testează ipoteza că între fiecare două variabile observate nu
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
mare și nivelul de semnificație asociat mai mic, cu atât șansa ca matricea de corelație să fie matricea-identitate este mai mică, deci cu atât corelațiile observate sunt mai importante. Dacă însă ipoteza nu se poate respinge, atunci probabil că analiza factorială pentru datele respective nu-și are locul și rostul. Figura 8. Ipoteza testului de sfericitate Bartlett 2) Altă modalitate de a stabili dacă avem suficientă corelație între variabile pentru a căuta o structură latentă a datelor este aceea de a
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
fine, avem măsuri de adecvare a eșantionării 2. Cea mai folosită dintre acestea este cea a lui Kaiser-Meyer-Olkin (KMO), un indice care compară mărimea corelațiilor cu cea a coeficienților de corelație parțială. Valori mici ale acestui indice sugerează că analiza factorială nu este potrivită pentru date, în timp ce valori mari ale KMO indică existența unor factori comuni 1. unde a(Xi, Xj) este coeficientul de corelație parțială între Xi și Xj când toate celelalte variabile sunt controlate. Figura 9. Formula de calcul
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
unor factori comuni 1. unde a(Xi, Xj) este coeficientul de corelație parțială între Xi și Xj când toate celelalte variabile sunt controlate. Figura 9. Formula de calcul al indicelui KMO Extragerea factorilortc "Extragerea factorilor" Sistemul liniar presupus de analiza factorială (vezi prima secțiune) este astfel construit încât structura de covarianță poate fi identificată fără eroare, dacă sunt cunoscute saturațiile factoriale. Dar demersul invers, de identificare a structurii factoriale latente (a saturațiilor factoriale) din matricea de covarianță, ridică mai multe probleme
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
variabile sunt controlate. Figura 9. Formula de calcul al indicelui KMO Extragerea factorilortc "Extragerea factorilor" Sistemul liniar presupus de analiza factorială (vezi prima secțiune) este astfel construit încât structura de covarianță poate fi identificată fără eroare, dacă sunt cunoscute saturațiile factoriale. Dar demersul invers, de identificare a structurii factoriale latente (a saturațiilor factoriale) din matricea de covarianță, ridică mai multe probleme, așa cum am arătat în secțiunea anterioară. În plus, erorile de măsurare și eșantionare care intervin fac imposibil de identificat în
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
al indicelui KMO Extragerea factorilortc "Extragerea factorilor" Sistemul liniar presupus de analiza factorială (vezi prima secțiune) este astfel construit încât structura de covarianță poate fi identificată fără eroare, dacă sunt cunoscute saturațiile factoriale. Dar demersul invers, de identificare a structurii factoriale latente (a saturațiilor factoriale) din matricea de covarianță, ridică mai multe probleme, așa cum am arătat în secțiunea anterioară. În plus, erorile de măsurare și eșantionare care intervin fac imposibil de identificat în practică structura latentă. Ceea ce facem este ca, pe
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
factorilortc "Extragerea factorilor" Sistemul liniar presupus de analiza factorială (vezi prima secțiune) este astfel construit încât structura de covarianță poate fi identificată fără eroare, dacă sunt cunoscute saturațiile factoriale. Dar demersul invers, de identificare a structurii factoriale latente (a saturațiilor factoriale) din matricea de covarianță, ridică mai multe probleme, așa cum am arătat în secțiunea anterioară. În plus, erorile de măsurare și eșantionare care intervin fac imposibil de identificat în practică structura latentă. Ceea ce facem este ca, pe baza unor criterii practice
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
măsurare și eșantionare care intervin fac imposibil de identificat în practică structura latentă. Ceea ce facem este ca, pe baza unor criterii practice și statistice, să estimăm cât mai bine valorile respective. Cel de-al treilea pas în realizarea unei analize factoriale este cel de extragere a factorilor inițiali. Cel mai important lucru aici este stabilirea numărului minim de factori comuni care să producă în mod satisfăcător corelațiile dintre variabile. Dacă nu avem erori în date și presupunerea de cauzalitate a factorilor
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
criteriu este cel al adecvării modelului la date, determinând cât de bine factorii comuni respectivi pot produce matricea de corelații observate. Conform logicii statistice obișnuite, se vor extrage atâția factori până când discrepanța dintre corelațiile observate și corelațiile produse de modelul factorial va fi suficient de mică pentru a fi atribuită erorilor de eșantionare. Algoritmul de extragere pornește de la ipoteza unui factor comun unic. Acestui model cu un factor i se aplică testul discrepanței dintre matricea de corelații observate și cea produsă
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
fac o enumerare a acestora (alături de numele în românește voi da și numele în engleză consacrat al metodei): (a) metoda celor mai mici pătrate - the least squares method, (b) metoda probabilității maxime - the maximum likelihood method, (c) metoda de extragere factorială Alpha - Alpha factoring, (d) analiza imaginii - image factoring, (e) metoda factorilor principali - principal axis factoring, (f) metoda componentelor principale- principal component analysis. Una dintre diferențele conceptuale fundamentale între aceste metode, care distinge între analiza componentelor principale (f) și toate celelalte
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
descompusă astfel: varianța comună, adică totalul varianței variabilelor care se datorează factorilor comuni, varianța specifică, datorată factorilor unici, și eroarea introdusă de măsurare, eșantionare, culegerea datelor etc. În analiza componentelor principale se va descompune întreaga varianță a variabilelor. În analiza factorială propriu-zisă se va descompune doar varianța comună a variabilelor. În analiza componentelor principale, estimarea scorurilor factoriale se face pornind de la asumpția că factorii (componentele principale) explică întreaga varianță, atât cea comună, cât și cea specifică și eroarea. Acest lucru înseamnă
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
factorilor unici, și eroarea introdusă de măsurare, eșantionare, culegerea datelor etc. În analiza componentelor principale se va descompune întreaga varianță a variabilelor. În analiza factorială propriu-zisă se va descompune doar varianța comună a variabilelor. În analiza componentelor principale, estimarea scorurilor factoriale se face pornind de la asumpția că factorii (componentele principale) explică întreaga varianță, atât cea comună, cât și cea specifică și eroarea. Acest lucru înseamnă că, în matricea de corelații ajustate, pe diagonală se vor trece comunalități egale cu 1 (matricea
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
vor fi mai mici decât 1, căci comunalitatea unei variabile este partea din varianță datorată factorilor comuni. Pentru a o obține, din varianța totală, egală cu 1, se scad varianța datorată factorului de unicitate și eventualele erori. În cazul analizei factoriale propriu-zise, factorii vor da seama doar de varianța comună a variabilelor. În obținerea componentelor principale nu presupunem existența unor factori latenți. Componentele principale sunt funcții matematice de variabile observate. Ca și în cazul analizei factoriale propriu-zise, metoda este folosită pentru
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
eventualele erori. În cazul analizei factoriale propriu-zise, factorii vor da seama doar de varianța comună a variabilelor. În obținerea componentelor principale nu presupunem existența unor factori latenți. Componentele principale sunt funcții matematice de variabile observate. Ca și în cazul analizei factoriale propriu-zise, metoda este folosită pentru a obține o reducere a reprezentării, dar obiectivul ei nu este să explice covariația dintre variabile (un model cauzal), ci să explice cât mai mult din varianța datelor. Analiza factorială, în schimb, are ca scop
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
Ca și în cazul analizei factoriale propriu-zise, metoda este folosită pentru a obține o reducere a reprezentării, dar obiectivul ei nu este să explice covariația dintre variabile (un model cauzal), ci să explice cât mai mult din varianța datelor. Analiza factorială, în schimb, are ca scop principal explicarea corelației (covariației) dintre variabilele observate. Diferența dintre cele două abordări poate fi prezentată și astfel: analiza factorială propriuzisă reprezintă structura de covarianță în termenii unui model cauzal ipotetic, în timp ce analiza componentelor principale sumarizează
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
covariația dintre variabile (un model cauzal), ci să explice cât mai mult din varianța datelor. Analiza factorială, în schimb, are ca scop principal explicarea corelației (covariației) dintre variabilele observate. Diferența dintre cele două abordări poate fi prezentată și astfel: analiza factorială propriuzisă reprezintă structura de covarianță în termenii unui model cauzal ipotetic, în timp ce analiza componentelor principale sumarizează datele prin intermediul unei combinații liniare a datelor observate. Prima încearcă să explice covarianța, pe când cea de a doua explică varianța variabilelor. Voi începe prin
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
a prezenta ultimele două dintre metodele enumerate, și anume: (f) metoda componentelor principale (principal component analysis) și (e) metoda factorilor principali (principal axis factoring). Pentru a explica modul cum extragem componentele principale (principal component analysis), respectiv factorii în cazul analizei factoriale propriu-zise (principal axis factoring), vom apela la câteva elemente elementare de algebră matriceală. Într-o secțiune anterioară am arătat că, în cazul modelului factorial ortogonal general, corelația între oricare două variabile observate, r(Xi,Xj), atunci când factorii sunt ortogonali, va
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
Pentru a explica modul cum extragem componentele principale (principal component analysis), respectiv factorii în cazul analizei factoriale propriu-zise (principal axis factoring), vom apela la câteva elemente elementare de algebră matriceală. Într-o secțiune anterioară am arătat că, în cazul modelului factorial ortogonal general, corelația între oricare două variabile observate, r(Xi,Xj), atunci când factorii sunt ortogonali, va fi egală cu suma produselor dintre saturațiile corespunzătoare factorilor comuni: r(Xi,Xk) = bi1 bk1 + bi2 bk2 + bi3 bk3 + ... + bin bkn pentru i, k
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
comuni: r(Xi,Xk) = bi1 bk1 + bi2 bk2 + bi3 bk3 + ... + bin bkn pentru i, k = 1, ..., m Matriceal, acest lucru se poate scrie în felul următor: R = B BT = R1 unde B BT reprezintă matricea de corelații rezultată. În analiza factorială încercăm un demers invers, și anume să estimăm coeficienții bik, adică saturațiile factoriale pentru fiecare variabilă observată, având la dispoziție coeficienții de corelație r(Xi,Xk). Vom pune condiția ca matricea reziduală, adică diferența dintre matricea de corelație ajustată (R1
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
i, k = 1, ..., m Matriceal, acest lucru se poate scrie în felul următor: R = B BT = R1 unde B BT reprezintă matricea de corelații rezultată. În analiza factorială încercăm un demers invers, și anume să estimăm coeficienții bik, adică saturațiile factoriale pentru fiecare variabilă observată, având la dispoziție coeficienții de corelație r(Xi,Xk). Vom pune condiția ca matricea reziduală, adică diferența dintre matricea de corelație ajustată (R1) și matricea de corelații rezultată (B BT), să fie cât mai aproape de zero
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
r(Xi,Xk). Vom pune condiția ca matricea reziduală, adică diferența dintre matricea de corelație ajustată (R1) și matricea de corelații rezultată (B BT), să fie cât mai aproape de zero, adică diferențele dintre corelațiile observate și cele rezultate din modelul factorial să fie minimizate. Acest lucru se reduce, în formă matriceală, la următoarea ecuație: R1 V = λ V unde R1 este matricea de corelație ajustată, λ este o valoare proprie (eigenvalue) a matricei R, iar V este vectorul propriu asociat acesteia
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]