1,869 matches
-
de cetățeni (obiectele) asupra felului în care evaluează diferite aspecte ale activității guvernului (variabilele observabile). Fiind o analiză de corelație, variabilele care pot intra într-o analiză factorială trebuie să fie măsurate pe scale de intervale sau de rapoarte (variabile metrice). Este generală totuși asumpția că multe dintre variabilele ordinale (care măsoară opinii sau atitudini, de pildă) pot primi valori numerice fără a distorsiona proprietățile latente. Pentru a ne decide dacă putem accepta în analiză variabile ordinale, trebuie să stabilim (1
[Corola-publishinghouse/Science/2075_a_3400]
-
cazul caracteristicilor măsurate pe scale nominale, obiectele sunt similare dacă aparțin aceleiași categorii. În cazul caracteristicilor măsurate pe scale ordinale, obiectele sunt cu atât mai diferite (disimilare) cu cât se găsesc în categorii mai îndepărtate pe scală. În cazul caracteristicilor metrice (măsurate pe scale de intervale și de rapoarte), similaritatea sau disimilaritatea obiectelor sunt estimate în funcție de magnitudinea diferenței dintre valorile luate de obiecte pe aceste scale. Definirea unei măsuri de similaritate este o operație matematică relativ simplă în acest caz. Dar
[Corola-publishinghouse/Science/2075_a_3400]
-
de variabile în funcție de care sunt comparate obiectele). Estimările cantitative ale similarității au fost dominate de conceptul de metrică 1. Această abordare a similarității reprezintă cazurile ca puncte într-un spațiu de coordonate, astfel încât similaritățile sau disimilaritățile dintre puncte corespund distanțelor metrice dintre ele. Analitic, o metrică este definită prin patru proprietăți. Fiind date două puncte în spațiu, x și y, distanța dintre ele d(x,y) este o metrică dacă îndeplinește următoarele condiții: (1) Simetria: d(x,y)=d(y,x
[Corola-publishinghouse/Science/2075_a_3400]
-
0, atunci x ≠ 0 (dacă două obiecte sunt diferite, atunci distanța dintre ele este nenulă) (4) Indistincția între obiecte identice: pentru două obiecte identice x și z, d(x,z)=0 Majoritatea măsurilor de similaritate folosite în analiza cluster sunt metrice, îndeosebi pentru avantajele pe care le aduc proprietățile lor matematice. În cazul variabilelor cantitative (variabilele sunt măsurate pe scale de intervale și de rapoarte, în cazuri particulare sunt acceptate și cele măsurate pe scale ordinale), măsurile de similaritate sunt de
[Corola-publishinghouse/Science/2075_a_3400]
-
Mai departe, vom încerca să transformăm proximitățile dintre obiecte, δij, în distanțe în spațiul multidimensional subiectiv. Aceste distanțe, transformatele proximităților, vor reda proximitățile dintre obiecte. Pentru a transforma proximitățile în distanțe, căutăm o funcție de transformare f, care să folosească proprietățile metrice (numerice) ale proximităților. Proximitățile dintre obiecte δij vor fi transformate în distanțe f(δij) ce pot fi reprezentate în spațiul multidimensional subiectiv 1. Funcția de transformare poate fi definită ca funcție metrică, de exemplu de forma f(x)=a+bx
[Corola-publishinghouse/Science/2075_a_3400]
-
o funcție de transformare f, care să folosească proprietățile metrice (numerice) ale proximităților. Proximitățile dintre obiecte δij vor fi transformate în distanțe f(δij) ce pot fi reprezentate în spațiul multidimensional subiectiv 1. Funcția de transformare poate fi definită ca funcție metrică, de exemplu de forma f(x)=a+bx sau f(x)=bx sau f(x)=x. Acestea sunt principalele forme de funcții metrice (de intervale și de rapoarte) folosite de diferitele tipuri de scalare multidimensională. Specificarea funcției f, adică găsirea
[Corola-publishinghouse/Science/2075_a_3400]
-
ce pot fi reprezentate în spațiul multidimensional subiectiv 1. Funcția de transformare poate fi definită ca funcție metrică, de exemplu de forma f(x)=a+bx sau f(x)=bx sau f(x)=x. Acestea sunt principalele forme de funcții metrice (de intervale și de rapoarte) folosite de diferitele tipuri de scalare multidimensională. Specificarea funcției f, adică găsirea valorilor coeficienților a și b, se face printr-o metodă statistică des folosită, regresia liniară obținută prin metoda celor mai mici pătrate, pornind
[Corola-publishinghouse/Science/2075_a_3400]
-
configurației de punctetc "Obținerea configurației de puncte" Așa cum am arătat, matricea de proximități constituie punctul deplecare pentru obținerea configurației de puncte care redă cel mai bine relațiile percepute dintre obiecte. Indiferent de tipul scalei de măsură a proximităților, non-metrică sau metrică, soluția scalată produsă de pachetele statistice de programe va fi metrică. Acest lucru este posibil matematic și este avantajos din mai multe puncte de vedere. Soluțiile metrice dau o hartă perceptuală mai ușor de interpretat,care poate fi transformată pentru
[Corola-publishinghouse/Science/2075_a_3400]
-
de proximități constituie punctul deplecare pentru obținerea configurației de puncte care redă cel mai bine relațiile percepute dintre obiecte. Indiferent de tipul scalei de măsură a proximităților, non-metrică sau metrică, soluția scalată produsă de pachetele statistice de programe va fi metrică. Acest lucru este posibil matematic și este avantajos din mai multe puncte de vedere. Soluțiile metrice dau o hartă perceptuală mai ușor de interpretat,care poate fi transformată pentru a-i crește interpretabilitatea, prin rotire sau întindere/compresie 1. Distincția
[Corola-publishinghouse/Science/2075_a_3400]
-
percepute dintre obiecte. Indiferent de tipul scalei de măsură a proximităților, non-metrică sau metrică, soluția scalată produsă de pachetele statistice de programe va fi metrică. Acest lucru este posibil matematic și este avantajos din mai multe puncte de vedere. Soluțiile metrice dau o hartă perceptuală mai ușor de interpretat,care poate fi transformată pentru a-i crește interpretabilitatea, prin rotire sau întindere/compresie 1. Distincția conceptuală între metodele de scalare multidimensională non-metrice și metrice este dată de scala de măsură a
[Corola-publishinghouse/Science/2075_a_3400]
-
din mai multe puncte de vedere. Soluțiile metrice dau o hartă perceptuală mai ușor de interpretat,care poate fi transformată pentru a-i crește interpretabilitatea, prin rotire sau întindere/compresie 1. Distincția conceptuală între metodele de scalare multidimensională non-metrice și metrice este dată de scala de măsură a similarităților (proximităților). Metodele non-metrice sunt mai flexibile, în sensul că nu presupun nici o relație specifică între distanța calculată și măsura de similaritate. Dezavantajul lor este că pot produce soluții suboptimale sau degenerate. Soluțiile
[Corola-publishinghouse/Science/2075_a_3400]
-
măsura de similaritate. Dezavantajul lor este că pot produce soluții suboptimale sau degenerate. Soluțiile degenerate sunt reprezentări incorecte ale obiectelor, în care punctele sunt strânse într-un singur loc al diagramei sau se găsesc la capetele unei singure dimensiuni. Metodele metrice produc soluții a căror dimensionalitate reflectă cu mult mai multă acuratețe dimensionalitatea datelor de intrare (a proximităților). Aici merită să notăm că, indiferent de caracterul real metric sau non-metric al datelor, soluțiile obținute prin aplicarea unei metode non-metrice sau a
[Corola-publishinghouse/Science/2075_a_3400]
-
singur loc al diagramei sau se găsesc la capetele unei singure dimensiuni. Metodele metrice produc soluții a căror dimensionalitate reflectă cu mult mai multă acuratețe dimensionalitatea datelor de intrare (a proximităților). Aici merită să notăm că, indiferent de caracterul real metric sau non-metric al datelor, soluțiile obținute prin aplicarea unei metode non-metrice sau a uneia metrice sunt foarte asemănătoare. Mai sus am arătat pașii algoritmului prin care se obține configurația de puncte ce reflectă relațiile percepute dintre obiecte. Pentru obținerea soluției
[Corola-publishinghouse/Science/2075_a_3400]
-
proximitate (distanță) ordinală, de intervale sau de rapoarte. În meniul deschis prin apăsarea butonului Model, vor fi specificate atributele modelului ales (aici alegem între o analiză RMDS sau una WMDS). Nivelul de măsurare (Level of measurement) permite selectarea unui model metric sau non-metric) - evident, alegerea modelului depinde de nivelul de măsurare pentru proximități. La opțiunea de scalare Scaling model se va selecta varianta Individual differences Euclidian distances în cazul în care avem mai multe matrice de disimilaritate și dorim un model
[Corola-publishinghouse/Science/2075_a_3400]
-
Matricea va fi una pătrată simetrică, întrucât pe linii și pe coloane vom avea elementele aceleiași mulțimi (orașele), iar distanța dintre două orașe oarecare A și B este identică cu distanța dintre orașele B și A. Voi construi un model metric de scalare multidimensională simplă (CMDS), unde distanțele sunt măsurate pe o scală de rapoarte. Voi opta pentru o configurație finală de două dimensiuni (minimum și maximum) și voi cere programului să producă diagramele care dau seama de adecvarea modelului (goodness-of-fit
[Corola-publishinghouse/Science/2075_a_3400]
-
sunt scriitorii către care au fostinițiate relații (cei care au fost desemnați prieteni, respectiv cei care au fost menționați în contextul sprijinului la debut și publicare). Distanțele (proximitățile) sunt deci măsurate pe scală de intervale, producând un model de scalare metric. Am ales o reprezentare într-un spațiu bidimensional, urmând să evaluez adecvarea modelului rezultat. Iată rezultatele pentru prima bază de date de preferință, cea a prieteniilor dintre scriitori: Figura 6. Structurarea spațiului literar clujean în funcție de relațiile de prietenie Modelul este
[Corola-publishinghouse/Science/2075_a_3400]
-
întrucât este capabilă să reprezinte în același spațiu atât elementele aflate pe linii, cât și pe cele aflate pe coloane (de exemplu, obiectele și atributele lor). Spre deosebire de toate celelalte tehnici de interdependență, analiza de corespondență poate reprezenta într-un spațiu metric date non-metrice (variabile nominale) și relații non-liniare. Metoda este folosită aproape exclusiv pentru explorarea și descrierea datelor. Este adesea descrisă ca o metodă care nu are la bază un model (cum are, de exemplu, analiza factorială). De asemenea, în afară de cerința
[Corola-publishinghouse/Science/2075_a_3400]
-
naturii datelor. Totuși, atunci când alegem să facem oanaliză de corespondență, înseamnă că ne concentrăm asupra asocierii dintre variabile. Astfel, aceasta - existența unei asocieri între variabile - devine o condiție necesară realizării unei analize de corespondență. De asemenea, prin faptul că alegem metrica χ2 (hi pătrat) pentru a descrie distanțele în spațiul în care vom reprezenta categoriile variabilelor, impunem o altă condiție analizei 1. Avantajele principale ale acestei tehnici sunt următoarele 2. Primul este acela de a putea reprezenta într-un spațiu perceptual
[Corola-publishinghouse/Science/2075_a_3400]
-
condiție analizei 1. Avantajele principale ale acestei tehnici sunt următoarele 2. Primul este acela de a putea reprezenta într-un spațiu perceptual tabele de variabile cu mai multe categorii. Analiza de corespondență este singura tehnică prin care se produc hărți metrice pornind de la date măsurate pe cea mai puțin restrictivă scală de măsură (nominală). Al doilea avantaj este acela că, așa cum vom vedea în continuare, analiza de corespondență portretizează nu doar relațiile dintre variabile (rândurile și coloanele unui tabel de contingență
[Corola-publishinghouse/Science/2075_a_3400]
-
Logica analizei de corespondențătc "Logica analizei de corespondență" Analiza de corespondență realizează o descriere a datelor cuprinse într-un tabel de contingență, deslușind structura latentă a datelor prin reducerea dimensionalității lor și reprezentarea geometrică (vizuală) a categoriilor într-un spațiu metric. Analiza pornește de la un tabel de contingență, adică de la tabularea a două variabile nominale, una reprezentată pe linii, cealaltă pe coloane. Analitic, se prelucrează separat categoriile fiecăreia dintre variabile. În primul pas se calculează profilurile categoriilor primei variabile (frecvențele relative
[Corola-publishinghouse/Science/2075_a_3400]
-
și ne arată ponderea lor în totalul obiectelor din eșantion. Același lucru se face și pentru cea de-a doua variabilă. La al doilea pas se calculează distanțele dintre puncte, i.e. distanțele dintre categoriile variabilelor, reprezentate într-un același spațiu metric. În fine, la ultimul pas, se caută un spațiu multidimensional care să acomodeze cel mai bine punctele și distanțele dintre ele. În cele ce urmează voi da un exemplu prin care voi ilustra această secvență de pași1. Pentru a explica
[Corola-publishinghouse/Science/2075_a_3400]
-
analiza de corespondență este o metodă folosită în explorarea datelor, pentru deslușirea formei asocierii dintre două variabile nominale. Unul dintre rezultatele sale constă în „cuantificarea datelor calitative” din tabelul de contingență, prin reprezentarea categoriilor celor două variabile într-un spațiu metric. Singura condiție impusă datelor, inerentă naturii analizei, este aceea ca între categoriile de pe rânduri și de pe coloane să existe un grad oarecare de corespondență. Aceasta poate lua orice formă: similaritate, interacțiune, afinitate, confuzie, asociere. Formularea problemei de cercetaretc " Formularea problemei
[Corola-publishinghouse/Science/2075_a_3400]
-
de cercetaretc " Formularea problemei de cercetare" Ca în orice situație de cercetare, formularea problemei și stabilirea scopului analizei trebuie să fie foarte clare. Analiza de corespondență dezvăluie structura de corespondență dintre categoriile a două variabile, reprezentându-le într-un spațiu metric cu puține dimensiuni. Dată fiind lipsa constrângerilor și condițiilor de orice fel asupra datelor, avem o foarte mare libertate în ceea ce privește modul în care sunt construite variabilele. Analiza pornește de la un tabel de contingență, însă liniile și coloanele nu au semnificații
[Corola-publishinghouse/Science/2075_a_3400]
-
analiza de corespondență este aceea de a raporta rezultatele ei la rezultatele unei alte tehnici de interdependență, aplicate unui set de date care conține aceeași informație, colectată diferit, conform tehnicii respective. Convergența rezultatelor, în special dacă acestea constau în configurații metrice, va valida rezultatele: configurațiile respective sunt reprezentări ale aceluiași spațiu și ar trebui să fie similare. Rezultatele pot fi validate, ca în cazul altor metode de interdependență, prin divizarea eșantionului și repetarea analizei pentru subeșantioane sau prin folosirea mai multor
[Corola-publishinghouse/Science/2075_a_3400]
-
caracteristicile modelului de analiză. În primul rând, vom defini distanța dintre categorii pe care o vom folosi. Analiza de corespondență standard folosește distanțele hi pătrat - și recomand folosirea acesteia. În cazul în care folosim distanța euclidiană, care nu are proprietățile metrice ale distanței hi pătrat, va trebui definită o metodă de standardizare a datelor. Metoda de normalizare se referă la felul în care este distribuită inerția pentru scorurile de pe linii și de pe coloane și are de-a face cu formula de
[Corola-publishinghouse/Science/2075_a_3400]