1,334 matches
-
bine tipul de grupare pe care dorim să-l obținem. Problema ponderii variabilelor apare și atunci când acestea au scale de măsură diferite. Cu cât acestea sunt mai diferite, cu atât mai disproporționată va fi ponderea lor în calculul măsurii de similaritate între obiecte. Astfel, valoarea variabilei „PIB per capita”, de ordinul zecilor de mii (măsurată în dolari), va influența în mod disproporționat valoarea calculată a măsurii de similaritate (a distanței) dintre două țări față de, să zicem, valoarea variabilei „speranța de viață
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
diferite, cu atât mai disproporționată va fi ponderea lor în calculul măsurii de similaritate între obiecte. Astfel, valoarea variabilei „PIB per capita”, de ordinul zecilor de mii (măsurată în dolari), va influența în mod disproporționat valoarea calculată a măsurii de similaritate (a distanței) dintre două țări față de, să zicem, valoarea variabilei „speranța de viață” (măsurată în ani), care este de ordinul zecilor. Pentru a le da aceeași pondere în calculul distanței, este recomandat ca variabilele să fie standardizate într-un fel
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
în ani), care este de ordinul zecilor. Pentru a le da aceeași pondere în calculul distanței, este recomandat ca variabilele să fie standardizate într-un fel sau altul, înainte de a porni algoritmul de grupare bazat pe aceste distanțe. Măsuri de similaritate a obiectelortc "Măsuri de similaritate a obiectelor" Analiza cluster produce grupuri de obiecte similare, în funcție de criterii stabilite. Dar cum estimăm similaritatea dintre obiecte? Cum construim o măsură a similarității acestora? Pentru a putea răspunde la aceste întrebări, trebuie să clarificăm
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
ordinul zecilor. Pentru a le da aceeași pondere în calculul distanței, este recomandat ca variabilele să fie standardizate într-un fel sau altul, înainte de a porni algoritmul de grupare bazat pe aceste distanțe. Măsuri de similaritate a obiectelortc "Măsuri de similaritate a obiectelor" Analiza cluster produce grupuri de obiecte similare, în funcție de criterii stabilite. Dar cum estimăm similaritatea dintre obiecte? Cum construim o măsură a similarității acestora? Pentru a putea răspunde la aceste întrebări, trebuie să clarificăm conceptul de similaritate în termenii
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
fie standardizate într-un fel sau altul, înainte de a porni algoritmul de grupare bazat pe aceste distanțe. Măsuri de similaritate a obiectelortc "Măsuri de similaritate a obiectelor" Analiza cluster produce grupuri de obiecte similare, în funcție de criterii stabilite. Dar cum estimăm similaritatea dintre obiecte? Cum construim o măsură a similarității acestora? Pentru a putea răspunde la aceste întrebări, trebuie să clarificăm conceptul de similaritate în termenii analizei sociologice și ai modalităților de operaționalizare a similarității. Două obiecte sunt similare dacă au măsuri
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
a porni algoritmul de grupare bazat pe aceste distanțe. Măsuri de similaritate a obiectelortc "Măsuri de similaritate a obiectelor" Analiza cluster produce grupuri de obiecte similare, în funcție de criterii stabilite. Dar cum estimăm similaritatea dintre obiecte? Cum construim o măsură a similarității acestora? Pentru a putea răspunde la aceste întrebări, trebuie să clarificăm conceptul de similaritate în termenii analizei sociologice și ai modalităților de operaționalizare a similarității. Două obiecte sunt similare dacă au măsuri apropiate pentru caracteristicile în funcție de care sunt comparate. Similaritatea
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
Măsuri de similaritate a obiectelor" Analiza cluster produce grupuri de obiecte similare, în funcție de criterii stabilite. Dar cum estimăm similaritatea dintre obiecte? Cum construim o măsură a similarității acestora? Pentru a putea răspunde la aceste întrebări, trebuie să clarificăm conceptul de similaritate în termenii analizei sociologice și ai modalităților de operaționalizare a similarității. Două obiecte sunt similare dacă au măsuri apropiate pentru caracteristicile în funcție de care sunt comparate. Similaritatea obiectelor este ușor de estimat atunci când le comparăm în funcție de un singur criteriu (de o
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
similare, în funcție de criterii stabilite. Dar cum estimăm similaritatea dintre obiecte? Cum construim o măsură a similarității acestora? Pentru a putea răspunde la aceste întrebări, trebuie să clarificăm conceptul de similaritate în termenii analizei sociologice și ai modalităților de operaționalizare a similarității. Două obiecte sunt similare dacă au măsuri apropiate pentru caracteristicile în funcție de care sunt comparate. Similaritatea obiectelor este ușor de estimat atunci când le comparăm în funcție de un singur criteriu (de o singură variabilă). În cazul caracteristicilor măsurate pe scale nominale, obiectele sunt
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
similarității acestora? Pentru a putea răspunde la aceste întrebări, trebuie să clarificăm conceptul de similaritate în termenii analizei sociologice și ai modalităților de operaționalizare a similarității. Două obiecte sunt similare dacă au măsuri apropiate pentru caracteristicile în funcție de care sunt comparate. Similaritatea obiectelor este ușor de estimat atunci când le comparăm în funcție de un singur criteriu (de o singură variabilă). În cazul caracteristicilor măsurate pe scale nominale, obiectele sunt similare dacă aparțin aceleiași categorii. În cazul caracteristicilor măsurate pe scale ordinale, obiectele sunt cu
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
dacă aparțin aceleiași categorii. În cazul caracteristicilor măsurate pe scale ordinale, obiectele sunt cu atât mai diferite (disimilare) cu cât se găsesc în categorii mai îndepărtate pe scală. În cazul caracteristicilor metrice (măsurate pe scale de intervale și de rapoarte), similaritatea sau disimilaritatea obiectelor sunt estimate în funcție de magnitudinea diferenței dintre valorile luate de obiecte pe aceste scale. Definirea unei măsuri de similaritate este o operație matematică relativ simplă în acest caz. Dar cum procedăm atunci când analiza ia în considerare mai multe
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
găsesc în categorii mai îndepărtate pe scală. În cazul caracteristicilor metrice (măsurate pe scale de intervale și de rapoarte), similaritatea sau disimilaritatea obiectelor sunt estimate în funcție de magnitudinea diferenței dintre valorile luate de obiecte pe aceste scale. Definirea unei măsuri de similaritate este o operație matematică relativ simplă în acest caz. Dar cum procedăm atunci când analiza ia în considerare mai multe caracteristici (mai multe variabile, mai multe criterii)? Răspunsul trebuie să țină cont de tipul de date cu care lucrăm (tipul de
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
Dar cum procedăm atunci când analiza ia în considerare mai multe caracteristici (mai multe variabile, mai multe criterii)? Răspunsul trebuie să țină cont de tipul de date cu care lucrăm (tipul de variabile în funcție de care sunt comparate obiectele). Estimările cantitative ale similarității au fost dominate de conceptul de metrică 1. Această abordare a similarității reprezintă cazurile ca puncte într-un spațiu de coordonate, astfel încât similaritățile sau disimilaritățile dintre puncte corespund distanțelor metrice dintre ele. Analitic, o metrică este definită prin patru proprietăți
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
multe variabile, mai multe criterii)? Răspunsul trebuie să țină cont de tipul de date cu care lucrăm (tipul de variabile în funcție de care sunt comparate obiectele). Estimările cantitative ale similarității au fost dominate de conceptul de metrică 1. Această abordare a similarității reprezintă cazurile ca puncte într-un spațiu de coordonate, astfel încât similaritățile sau disimilaritățile dintre puncte corespund distanțelor metrice dintre ele. Analitic, o metrică este definită prin patru proprietăți. Fiind date două puncte în spațiu, x și y, distanța dintre ele
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
tipul de date cu care lucrăm (tipul de variabile în funcție de care sunt comparate obiectele). Estimările cantitative ale similarității au fost dominate de conceptul de metrică 1. Această abordare a similarității reprezintă cazurile ca puncte într-un spațiu de coordonate, astfel încât similaritățile sau disimilaritățile dintre puncte corespund distanțelor metrice dintre ele. Analitic, o metrică este definită prin patru proprietăți. Fiind date două puncte în spațiu, x și y, distanța dintre ele d(x,y) este o metrică dacă îndeplinește următoarele condiții: (1
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
obiecte non-identice: dacă d(x,y) ≠ 0, atunci x ≠ 0 (dacă două obiecte sunt diferite, atunci distanța dintre ele este nenulă) (4) Indistincția între obiecte identice: pentru două obiecte identice x și z, d(x,z)=0 Majoritatea măsurilor de similaritate folosite în analiza cluster sunt metrice, îndeosebi pentru avantajele pe care le aduc proprietățile lor matematice. În cazul variabilelor cantitative (variabilele sunt măsurate pe scale de intervale și de rapoarte, în cazuri particulare sunt acceptate și cele măsurate pe scale
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
cluster sunt metrice, îndeosebi pentru avantajele pe care le aduc proprietățile lor matematice. În cazul variabilelor cantitative (variabilele sunt măsurate pe scale de intervale și de rapoarte, în cazuri particulare sunt acceptate și cele măsurate pe scale ordinale), măsurile de similaritate sunt de două tipuri: coeficienți de corelație și distanțe. În cazul variabilelor categoriale, măsurile de similaritate sunt date de coeficienți de asociere. Coeficienți de corelațietc "Coeficienți de corelație" Coeficientul de corelație este o măsură intuitivă a similarității dintre două obiecte
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
cantitative (variabilele sunt măsurate pe scale de intervale și de rapoarte, în cazuri particulare sunt acceptate și cele măsurate pe scale ordinale), măsurile de similaritate sunt de două tipuri: coeficienți de corelație și distanțe. În cazul variabilelor categoriale, măsurile de similaritate sunt date de coeficienți de asociere. Coeficienți de corelațietc "Coeficienți de corelație" Coeficientul de corelație este o măsură intuitivă a similarității dintre două obiecte. Corelația dintre două obiecte (și nu dintre două variabile, așa cum acest coeficient a fost introdus original
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
ordinale), măsurile de similaritate sunt de două tipuri: coeficienți de corelație și distanțe. În cazul variabilelor categoriale, măsurile de similaritate sunt date de coeficienți de asociere. Coeficienți de corelațietc "Coeficienți de corelație" Coeficientul de corelație este o măsură intuitivă a similarității dintre două obiecte. Corelația dintre două obiecte (și nu dintre două variabile, așa cum acest coeficient a fost introdus original) este o măsură a similarității dintre profilurile celor două obiecte după un număr de variabile. În loc să corelăm două variabile măsurate pentru
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
de asociere. Coeficienți de corelațietc "Coeficienți de corelație" Coeficientul de corelație este o măsură intuitivă a similarității dintre două obiecte. Corelația dintre două obiecte (și nu dintre două variabile, așa cum acest coeficient a fost introdus original) este o măsură a similarității dintre profilurile celor două obiecte după un număr de variabile. În loc să corelăm două variabile măsurate pentru un set de obiecte, corelăm două obiecte în funcție de valorile pe care le iau pentru un set de variabile. Coeficientul de corelație reprezintă similaritatea prin
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
a similarității dintre profilurile celor două obiecte după un număr de variabile. În loc să corelăm două variabile măsurate pentru un set de obiecte, corelăm două obiecte în funcție de valorile pe care le iau pentru un set de variabile. Coeficientul de corelație reprezintă similaritatea prin corespondența configurațiilor luate de două obiectepentru un set de variabile. Un coeficient de corelație egal cu 1 indică o similaritate perfectă. Similaritatea dintre obiecte scade o dată cu valoarea coeficientului, iar valoarea 0 pentru coeficientul de corelație reprezintă disimilaritate totală între
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
obiecte, corelăm două obiecte în funcție de valorile pe care le iau pentru un set de variabile. Coeficientul de corelație reprezintă similaritatea prin corespondența configurațiilor luate de două obiectepentru un set de variabile. Un coeficient de corelație egal cu 1 indică o similaritate perfectă. Similaritatea dintre obiecte scade o dată cu valoarea coeficientului, iar valoarea 0 pentru coeficientul de corelație reprezintă disimilaritate totală între obiecte (obiectele nu se aseamănă deloc, în nici o privință). Pentru a înțelege mai bine măsurile corelaționale de similaritate, voi apela la
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
două obiecte în funcție de valorile pe care le iau pentru un set de variabile. Coeficientul de corelație reprezintă similaritatea prin corespondența configurațiilor luate de două obiectepentru un set de variabile. Un coeficient de corelație egal cu 1 indică o similaritate perfectă. Similaritatea dintre obiecte scade o dată cu valoarea coeficientului, iar valoarea 0 pentru coeficientul de corelație reprezintă disimilaritate totală între obiecte (obiectele nu se aseamănă deloc, în nici o privință). Pentru a înțelege mai bine măsurile corelaționale de similaritate, voi apela la un grafic
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
1 indică o similaritate perfectă. Similaritatea dintre obiecte scade o dată cu valoarea coeficientului, iar valoarea 0 pentru coeficientul de corelație reprezintă disimilaritate totală între obiecte (obiectele nu se aseamănă deloc, în nici o privință). Pentru a înțelege mai bine măsurile corelaționale de similaritate, voi apela la un grafic. În figura de mai jos sunt reprezentate trei obiecte, 1, 2 și 3, în funcție de valorile pe care le iau pentru 5variabile, X1, X2, ..., X5. Obiectele 1 și 2 au configurații similare după cele 5 variabile
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
Obiect 1, Obiect 3) = -0,464 și nu este semnificativ diferită de zero la nivel 0,05 (nivelul de semnificație al coeficientului de corelație dintre obiectele 1 și 3 este 0,431). Figura 1. Coeficientul de corelație ca măsură de similaritate între două obiecte Obiectele 1 și 2 sunt perfect similare - ele au aceeași configurație în funcție de variabilele X1, ..., X5. Asemănarea dintre obiectele 1 și 3 este mult mai mică - configurațiile lor după variabilele X1, ..., X5 sunt diferite. Coeficientul de corelație este
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]
-
formă de standardizare a obiectelor după setul de variabile, ignoră magnitudinea valorilor luate de obiecte pentru variabile. Acest lucru este util în disciplinele care lucrează cu „profiluri”, cum sunt psihologia, sociologia sau antropologia 1. Una dintre limitările acestei măsuri de similaritate este aceea că adesea nu satisface condiția inegalității triunghiulare, fapt ce poate influența rezultatele algoritmului de grupare a obiectelor. Un alt neajuns al acestei măsuri este lipsa de înțeles statistic. În calculul coeficientului de corelație, valorile obiectelor pentru fiecare variabilă
Metode avansate în cercetarea socială. Analiza multivariată de interdependență by Irina Culic () [Corola-publishinghouse/Science/2075_a_3400]