1,321 matches
-
o varietate de proceduri folosite pentru obținerea unei clasificări. Cuvântul englezesc cluster (ciorchine, grup, mănunchi, fascicul, adunătură, aglomerare) a fost preluat ca atare în limba română, consacrând numele de „analiză cluster” pentru mulțimea metodelor de grupare a obiectelor pe baza similarității caracteristicilor lor. Tema la care răspunde analiza cluster este identificarea structurii unui set de date alcătuit dintr-o mulțime de obiecte și caracteristicile lor, prin definirea unor grupuri de obiecte, cât mai omogene intern și eterogene extern, în funcție de similaritatea lor
[Corola-publishinghouse/Science/2075_a_3400]
-
baza similarității caracteristicilor lor. Tema la care răspunde analiza cluster este identificarea structurii unui set de date alcătuit dintr-o mulțime de obiecte și caracteristicile lor, prin definirea unor grupuri de obiecte, cât mai omogene intern și eterogene extern, în funcție de similaritatea lor în raport cu anumite caracteristici. Metodele și procedurile de analiză cluster au primit o serie de alte denumiri, fiecare subliniind unul dintre aspectele sale: analizăQ (nume care arată că sunt investigate obiectele și relațiile dintre, și nu variabilele și relațiile dintre
[Corola-publishinghouse/Science/2075_a_3400]
-
de cercetător. Fiecare grup va putea fi descris prin oricare dintre obiectele componente. Astfel, ca și analiza factorială, analiza cluster are încă o utilitate, aceea de sumarizare a datelor în câteva categorii (clase) de obiecte, adunate împreună pe baza asemănării (similarității) dintre ele. Spre deosebire de analiza factorială, care investighează relațiile dintre variabile, analiza cluster se concentrează asupra relațiilor dintre obiecte. Dacă analiza factorială grupează variabile în factori latenți, aceștia explicând corelațiile dintre ele, analiza cluster grupează obiecte în clase de omogenitate. Analiza
[Corola-publishinghouse/Science/2075_a_3400]
-
de sănătate importante 1. Cei doi psihologi au folosit datele a 513 subiecți, obținute prin aplicarea unui test psihologic uzual, Minnesota Multiphasic Personality Inventory (MMPI). Subiecții au fost împărțiți în două subeșantioane. Cei din primul eșantion au fost grupați în funcție de similaritățile profilurilor lor MMPI în patru grupuri relativ omogene, pe care cercetătorii le-au numit în funcție de profilurile lor medii: (1) personalitate instabilă emoțional, (2) psihonevrotic cu anxietate/depresie, (3) personalitate psihopată, (4) alcoolic cu abuz de droguri și trăsături paranoide. Rezultatele
[Corola-publishinghouse/Science/2075_a_3400]
-
atitudinile lor, se pot identifica grupuri de piață clar diferențiate, alcătuite din indivizi care împărtășesc opinii și atitudini asemănătoare. În funcție de profilul acestor grupuri, editura poate estima segmentele (grupurile) de potențiali cumpărători. Această structură de piață, obținută prin gruparea indivizilor în funcție de similaritatea opiniilor și atitudinilor față de o anumită problematică, poate fi validată prin alte modalități de analiză, de exemplu prin studiul profilului educațional pentru fiecare segment (grup) sau al consumului lor cultural. Realizarea unei analize clustertc " Realizarea unei analize cluster" Aparatul matematic
[Corola-publishinghouse/Science/2075_a_3400]
-
grupare, dat de o regulă simplă de alăturare, în pași succesivi, a obiectelor (cazurilor) asemănătoare. Procedurile diferă între ele după mai multe elemente, cum sunt însușirile în funcție de care sunt comparate obiectele pentru a stabili intensitatea asemănării dintre ele, măsura de similaritate folosită, forma algoritmului de grupare, sau numărul de grupuri obținute. Toate acestea for fi discutate detaliat în cele ce urmează. Formularea problemei de cercetare și stabilirea scopului analizei clustertc " Formularea problemei de cercetare și stabilirea scopului analizei cluster" Forma particulară
[Corola-publishinghouse/Science/2075_a_3400]
-
de felul în care este formulată problema de cercetare. Indiferent dacă analiza are un caracter exploratoriu sau este realizată în scop confirmatoriu, clasificarea obținută va fi determinată de forma datelor, de alegerea criteriilor de grupare și de definiția măsurii de similaritate între obiecte. Pentru a ilustra întreaga cale a unei analize factoriale, voi folosi un exemplu. Una dintre problemele importante cu care se confruntă Europa de Vest și Uniunea Europeană este imigrația. Imigranții din diferite țări ale lumii aduc cu ei probleme ce afectează
[Corola-publishinghouse/Science/2075_a_3400]
-
bine tipul de grupare pe care dorim să-l obținem. Problema ponderii variabilelor apare și atunci când acestea au scale de măsură diferite. Cu cât acestea sunt mai diferite, cu atât mai disproporționată va fi ponderea lor în calculul măsurii de similaritate între obiecte. Astfel, valoarea variabilei „PIB per capita”, de ordinul zecilor de mii (măsurată în dolari), va influența în mod disproporționat valoarea calculată a măsurii de similaritate (a distanței) dintre două țări față de, să zicem, valoarea variabilei „speranța de viață
[Corola-publishinghouse/Science/2075_a_3400]
-
diferite, cu atât mai disproporționată va fi ponderea lor în calculul măsurii de similaritate între obiecte. Astfel, valoarea variabilei „PIB per capita”, de ordinul zecilor de mii (măsurată în dolari), va influența în mod disproporționat valoarea calculată a măsurii de similaritate (a distanței) dintre două țări față de, să zicem, valoarea variabilei „speranța de viață” (măsurată în ani), care este de ordinul zecilor. Pentru a le da aceeași pondere în calculul distanței, este recomandat ca variabilele să fie standardizate într-un fel
[Corola-publishinghouse/Science/2075_a_3400]
-
în ani), care este de ordinul zecilor. Pentru a le da aceeași pondere în calculul distanței, este recomandat ca variabilele să fie standardizate într-un fel sau altul, înainte de a porni algoritmul de grupare bazat pe aceste distanțe. Măsuri de similaritate a obiectelortc "Măsuri de similaritate a obiectelor" Analiza cluster produce grupuri de obiecte similare, în funcție de criterii stabilite. Dar cum estimăm similaritatea dintre obiecte? Cum construim o măsură a similarității acestora? Pentru a putea răspunde la aceste întrebări, trebuie să clarificăm
[Corola-publishinghouse/Science/2075_a_3400]
-
ordinul zecilor. Pentru a le da aceeași pondere în calculul distanței, este recomandat ca variabilele să fie standardizate într-un fel sau altul, înainte de a porni algoritmul de grupare bazat pe aceste distanțe. Măsuri de similaritate a obiectelortc "Măsuri de similaritate a obiectelor" Analiza cluster produce grupuri de obiecte similare, în funcție de criterii stabilite. Dar cum estimăm similaritatea dintre obiecte? Cum construim o măsură a similarității acestora? Pentru a putea răspunde la aceste întrebări, trebuie să clarificăm conceptul de similaritate în termenii
[Corola-publishinghouse/Science/2075_a_3400]
-
fie standardizate într-un fel sau altul, înainte de a porni algoritmul de grupare bazat pe aceste distanțe. Măsuri de similaritate a obiectelortc "Măsuri de similaritate a obiectelor" Analiza cluster produce grupuri de obiecte similare, în funcție de criterii stabilite. Dar cum estimăm similaritatea dintre obiecte? Cum construim o măsură a similarității acestora? Pentru a putea răspunde la aceste întrebări, trebuie să clarificăm conceptul de similaritate în termenii analizei sociologice și ai modalităților de operaționalizare a similarității. Două obiecte sunt similare dacă au măsuri
[Corola-publishinghouse/Science/2075_a_3400]
-
a porni algoritmul de grupare bazat pe aceste distanțe. Măsuri de similaritate a obiectelortc "Măsuri de similaritate a obiectelor" Analiza cluster produce grupuri de obiecte similare, în funcție de criterii stabilite. Dar cum estimăm similaritatea dintre obiecte? Cum construim o măsură a similarității acestora? Pentru a putea răspunde la aceste întrebări, trebuie să clarificăm conceptul de similaritate în termenii analizei sociologice și ai modalităților de operaționalizare a similarității. Două obiecte sunt similare dacă au măsuri apropiate pentru caracteristicile în funcție de care sunt comparate. Similaritatea
[Corola-publishinghouse/Science/2075_a_3400]
-
Măsuri de similaritate a obiectelor" Analiza cluster produce grupuri de obiecte similare, în funcție de criterii stabilite. Dar cum estimăm similaritatea dintre obiecte? Cum construim o măsură a similarității acestora? Pentru a putea răspunde la aceste întrebări, trebuie să clarificăm conceptul de similaritate în termenii analizei sociologice și ai modalităților de operaționalizare a similarității. Două obiecte sunt similare dacă au măsuri apropiate pentru caracteristicile în funcție de care sunt comparate. Similaritatea obiectelor este ușor de estimat atunci când le comparăm în funcție de un singur criteriu (de o
[Corola-publishinghouse/Science/2075_a_3400]
-
similare, în funcție de criterii stabilite. Dar cum estimăm similaritatea dintre obiecte? Cum construim o măsură a similarității acestora? Pentru a putea răspunde la aceste întrebări, trebuie să clarificăm conceptul de similaritate în termenii analizei sociologice și ai modalităților de operaționalizare a similarității. Două obiecte sunt similare dacă au măsuri apropiate pentru caracteristicile în funcție de care sunt comparate. Similaritatea obiectelor este ușor de estimat atunci când le comparăm în funcție de un singur criteriu (de o singură variabilă). În cazul caracteristicilor măsurate pe scale nominale, obiectele sunt
[Corola-publishinghouse/Science/2075_a_3400]
-
similarității acestora? Pentru a putea răspunde la aceste întrebări, trebuie să clarificăm conceptul de similaritate în termenii analizei sociologice și ai modalităților de operaționalizare a similarității. Două obiecte sunt similare dacă au măsuri apropiate pentru caracteristicile în funcție de care sunt comparate. Similaritatea obiectelor este ușor de estimat atunci când le comparăm în funcție de un singur criteriu (de o singură variabilă). În cazul caracteristicilor măsurate pe scale nominale, obiectele sunt similare dacă aparțin aceleiași categorii. În cazul caracteristicilor măsurate pe scale ordinale, obiectele sunt cu
[Corola-publishinghouse/Science/2075_a_3400]
-
dacă aparțin aceleiași categorii. În cazul caracteristicilor măsurate pe scale ordinale, obiectele sunt cu atât mai diferite (disimilare) cu cât se găsesc în categorii mai îndepărtate pe scală. În cazul caracteristicilor metrice (măsurate pe scale de intervale și de rapoarte), similaritatea sau disimilaritatea obiectelor sunt estimate în funcție de magnitudinea diferenței dintre valorile luate de obiecte pe aceste scale. Definirea unei măsuri de similaritate este o operație matematică relativ simplă în acest caz. Dar cum procedăm atunci când analiza ia în considerare mai multe
[Corola-publishinghouse/Science/2075_a_3400]
-
găsesc în categorii mai îndepărtate pe scală. În cazul caracteristicilor metrice (măsurate pe scale de intervale și de rapoarte), similaritatea sau disimilaritatea obiectelor sunt estimate în funcție de magnitudinea diferenței dintre valorile luate de obiecte pe aceste scale. Definirea unei măsuri de similaritate este o operație matematică relativ simplă în acest caz. Dar cum procedăm atunci când analiza ia în considerare mai multe caracteristici (mai multe variabile, mai multe criterii)? Răspunsul trebuie să țină cont de tipul de date cu care lucrăm (tipul de
[Corola-publishinghouse/Science/2075_a_3400]
-
Dar cum procedăm atunci când analiza ia în considerare mai multe caracteristici (mai multe variabile, mai multe criterii)? Răspunsul trebuie să țină cont de tipul de date cu care lucrăm (tipul de variabile în funcție de care sunt comparate obiectele). Estimările cantitative ale similarității au fost dominate de conceptul de metrică 1. Această abordare a similarității reprezintă cazurile ca puncte într-un spațiu de coordonate, astfel încât similaritățile sau disimilaritățile dintre puncte corespund distanțelor metrice dintre ele. Analitic, o metrică este definită prin patru proprietăți
[Corola-publishinghouse/Science/2075_a_3400]
-
multe variabile, mai multe criterii)? Răspunsul trebuie să țină cont de tipul de date cu care lucrăm (tipul de variabile în funcție de care sunt comparate obiectele). Estimările cantitative ale similarității au fost dominate de conceptul de metrică 1. Această abordare a similarității reprezintă cazurile ca puncte într-un spațiu de coordonate, astfel încât similaritățile sau disimilaritățile dintre puncte corespund distanțelor metrice dintre ele. Analitic, o metrică este definită prin patru proprietăți. Fiind date două puncte în spațiu, x și y, distanța dintre ele
[Corola-publishinghouse/Science/2075_a_3400]
-
tipul de date cu care lucrăm (tipul de variabile în funcție de care sunt comparate obiectele). Estimările cantitative ale similarității au fost dominate de conceptul de metrică 1. Această abordare a similarității reprezintă cazurile ca puncte într-un spațiu de coordonate, astfel încât similaritățile sau disimilaritățile dintre puncte corespund distanțelor metrice dintre ele. Analitic, o metrică este definită prin patru proprietăți. Fiind date două puncte în spațiu, x și y, distanța dintre ele d(x,y) este o metrică dacă îndeplinește următoarele condiții: (1
[Corola-publishinghouse/Science/2075_a_3400]
-
obiecte non-identice: dacă d(x,y) ≠ 0, atunci x ≠ 0 (dacă două obiecte sunt diferite, atunci distanța dintre ele este nenulă) (4) Indistincția între obiecte identice: pentru două obiecte identice x și z, d(x,z)=0 Majoritatea măsurilor de similaritate folosite în analiza cluster sunt metrice, îndeosebi pentru avantajele pe care le aduc proprietățile lor matematice. În cazul variabilelor cantitative (variabilele sunt măsurate pe scale de intervale și de rapoarte, în cazuri particulare sunt acceptate și cele măsurate pe scale
[Corola-publishinghouse/Science/2075_a_3400]
-
cluster sunt metrice, îndeosebi pentru avantajele pe care le aduc proprietățile lor matematice. În cazul variabilelor cantitative (variabilele sunt măsurate pe scale de intervale și de rapoarte, în cazuri particulare sunt acceptate și cele măsurate pe scale ordinale), măsurile de similaritate sunt de două tipuri: coeficienți de corelație și distanțe. În cazul variabilelor categoriale, măsurile de similaritate sunt date de coeficienți de asociere. Coeficienți de corelațietc "Coeficienți de corelație" Coeficientul de corelație este o măsură intuitivă a similarității dintre două obiecte
[Corola-publishinghouse/Science/2075_a_3400]
-
cantitative (variabilele sunt măsurate pe scale de intervale și de rapoarte, în cazuri particulare sunt acceptate și cele măsurate pe scale ordinale), măsurile de similaritate sunt de două tipuri: coeficienți de corelație și distanțe. În cazul variabilelor categoriale, măsurile de similaritate sunt date de coeficienți de asociere. Coeficienți de corelațietc "Coeficienți de corelație" Coeficientul de corelație este o măsură intuitivă a similarității dintre două obiecte. Corelația dintre două obiecte (și nu dintre două variabile, așa cum acest coeficient a fost introdus original
[Corola-publishinghouse/Science/2075_a_3400]
-
ordinale), măsurile de similaritate sunt de două tipuri: coeficienți de corelație și distanțe. În cazul variabilelor categoriale, măsurile de similaritate sunt date de coeficienți de asociere. Coeficienți de corelațietc "Coeficienți de corelație" Coeficientul de corelație este o măsură intuitivă a similarității dintre două obiecte. Corelația dintre două obiecte (și nu dintre două variabile, așa cum acest coeficient a fost introdus original) este o măsură a similarității dintre profilurile celor două obiecte după un număr de variabile. În loc să corelăm două variabile măsurate pentru
[Corola-publishinghouse/Science/2075_a_3400]