11 matches
-
aparține numai unui singur grup) și grupuri intersectate (când un element aparține la mai multe grupuri). Posibilitățile legăturii dintre grupuri sau indivizi sunt infinite: legături simple (față de vecinii săi), legături complete (față de punctul cel mai îndepărtat), legătura față de medie, față de centroid etc. Într-o grupare ierahică, agregarea datelor individuale se poate face succesiv, în concordanță cu gradele de afinitate. La nivelul grupelor elementare se agregă datele individuale, pe treapta succesivă urmează datele agregate pe grupe elementare, ș.a.m.d., până se
A M P E L O G R A F I E M E T O D E ? I M E T O D O L O G I I D E D E S C R I E R E ? I R E C U N O A ? T E R E A S O I U R I L O R D E V I ? ? D E V I E by Doina DAMIAN, Liliana ROTARU, Ancu?a NECHITA, Costic? SAVIN () [Corola-publishinghouse/Science/83089_a_84414]
-
această zonă. Pe cealaltă axă, se regăsesc celelalte variabile, cu o conotație negativă și mai apropiate de cocaină. Cea de-a doua funcție separă emoțiile pozitive de toate celelalte variabile. În legătură cu această a doua funcție, cocaina și hașișul obțin indici (centroide) ai aceluiași semn, raportîndu-se la emoțiile pozitive, în timp ce ecstasy se găsește la polul opus. Prima funcție exprimă o distincție clară între cocaină și hașiș. Se observă mai degrabă aspectele puternic negative ale celei dintîi și aspectele pozitive ale celei de-
by Jean-Marie Seca [Corola-publishinghouse/Science/1041_a_2549]
-
fiecare pas sunt unite acele două grupuri care îndeplinesc următoarea condiție: distanța medie dintre toate obiectele grupului rezultant este cea mai mică. Aceste două metode tind să combine grupuri cu varianțe mici și să producă grupuri cu varianțe apropiate. Metoda centroid definește distanța între două grupuri ca fiind distanța dintre centroizii lor. Centroidul unui grup este definit ca media valorilor luate de obiectele din grup pentru variabilele analizate. Centroidul unui grup se schimbă la fiecare creștere a grupului, fie că se
[Corola-publishinghouse/Science/2075_a_3400]
-
Fiecare obiect este alocat grupului cu centroidul cel mai apropiat. Se formează astfel un nou set de k grupuri, reactualizând calculele pentru tot setul de date. În continuare, se calculează centroizii acestor grupuri. Se repetă procedura- realocarea obiectelor în raport cu noii centroizi - până când nu se mai produc schimbări în componența grupurilor. Există mai multe variante ale acestui algoritm: (i) Se pornește nu de la o partiție oarecare, ci direct de la k puncte care să funcționeze ca niște „centri inițiali de cluster” (cluster seeds
[Corola-publishinghouse/Science/2075_a_3400]
-
sensibil diferite. În acest caz, este indicat să încheiem aglomerarea (combinarea) grupurilor la pasul respectiv, cu numărul de grupuri existente în momentul respectiv (pentru pasul p, vom avea N-p+1 grupuri). În cazul metodelor de partiționare iterativă, distanța dintre centroizi este un indicator al similarității grupurilor. Dacă aceasta este foarte mică pentru două grupuri, atunci putem considera unirea celor două grupuri într-unul singur. În orice caz, o strategie utilă în faza de selectare a numărului de grupuri este aceea
[Corola-publishinghouse/Science/2075_a_3400]
-
Cu alte cuvinte, categoriile cu mai puține observații vor tinde să fie reprezentate mai departe de originea axelor de coordonate, iar cele cu mai multe observații vor tinde să fie așezate aproape de centrul configurației. Centrul axelor de coordonate se numește centroid și este dat de profilul mediu (pe linii și pe coloane respectiv). Distanțele euclidiene dintre puncte aproximează distanțele hi pătrat. Punctele (categoriile) pot fi reprezentate perfect într-un spațiu cu n-1 dimensiuni. Problema de rezolvat este aceea de retrasare
[Corola-publishinghouse/Science/2075_a_3400]
-
o măsură a împrăștierii profilurilor categoriilor în jurul centroidului. (Varianța este o măsură a împrăștierii punctelor în jurul mediei.) Inerția totală se calculează în mod similar varianței și are următoarea formulă: Λ2= unde di reprezintă distanța hi pătrat dintre categoria i și centroid (dintre punctul i și centroid), iar ri este masa punctului i. Inerția totală este direct legată de valoarea lui hi pătrat, astfel: χ2=Λ2N unde N este numărul total de observații din tabelul de contingență. Categoriile cu masă mică influențează
[Corola-publishinghouse/Science/2075_a_3400]
-
categoriilor în jurul centroidului. (Varianța este o măsură a împrăștierii punctelor în jurul mediei.) Inerția totală se calculează în mod similar varianței și are următoarea formulă: Λ2= unde di reprezintă distanța hi pătrat dintre categoria i și centroid (dintre punctul i și centroid), iar ri este masa punctului i. Inerția totală este direct legată de valoarea lui hi pătrat, astfel: χ2=Λ2N unde N este numărul total de observații din tabelul de contingență. Categoriile cu masă mică influențează inerția numai dacă se găsesc
[Corola-publishinghouse/Science/2075_a_3400]
-
este masa punctului i. Inerția totală este direct legată de valoarea lui hi pătrat, astfel: χ2=Λ2N unde N este numărul total de observații din tabelul de contingență. Categoriile cu masă mică influențează inerția numai dacă se găsesc departe de centroid. Categoriile cu masă mare influențează inerția totală, chiar și atunci când sunt situate aproape de centroid. Analiza de corespondență, similar analizei factoriale care descompune varianța unui set de variabile intercorelate, descompune inerția totală a categoriilor. Numărul maxim de dimensiuni pentru soluția analizei
[Corola-publishinghouse/Science/2075_a_3400]
-
astfel: χ2=Λ2N unde N este numărul total de observații din tabelul de contingență. Categoriile cu masă mică influențează inerția numai dacă se găsesc departe de centroid. Categoriile cu masă mare influențează inerția totală, chiar și atunci când sunt situate aproape de centroid. Analiza de corespondență, similar analizei factoriale care descompune varianța unui set de variabile intercorelate, descompune inerția totală a categoriilor. Numărul maxim de dimensiuni pentru soluția analizei de corespondență este egal cu: număr de dimensiuni = min(m,n)-1. Prima dimensiune
[Corola-publishinghouse/Science/2075_a_3400]
-
din inerția unui punct este explicat de o dimensiune. Valoarea sa depinde de masa punctului. Aceste contribuții poartă numele de corelații pătrate (squared correlations), din cauza interpretării geometrice care le poate fi dată, și anume pătratul cosinusului unghiului format de linia centroid - punct și axele dimensiunilor. Așa cum am văzut, distanțele și coordonatele sunt calculate separat pentru fiecare variabilă. Soluția finală va include ambele seturi de puncte într-un spațiu comun. Acest lucru este posibil întrucât cele două seturi de puncte sunt interdependente
[Corola-publishinghouse/Science/2075_a_3400]