2,835 matches
-
empirice Δ, care să exprime discrepanța dintre distanțele dij și transformatele proximitățile f(δij). Există mai multe variante de calcul pentru măsura de adecvare, toate asemănătoare ca logică de construcție: se raportează o măsură pătratică a diferențelor dintre distanțe și proximități (pătratică, pentru a evita anularea reciprocă a diferențelor de semne opuse) la un factor de scalare, pentru a standardiza măsura. Factorul de scalare poate fi, de exemplu, suma pătratelor distanțelor dij. Măsura calculată astfel poartă numele de f-stress. f-stress= Figura
[Corola-publishinghouse/Science/2075_a_3400]
-
deci o măsură de adecvare. În cele ce urmează, vom folosi f-stress. Pentru că dorim să obținem cea mai bună soluție, vom căuta să minimizăm discrepanțele dintre transformate și distanțele dintre puncte, pentru ca punctele să reflecte cât mai bine relațiile de proximitate dintre obiecte. Cu alte cuvinte, vom căuta să minimizăm măsura de adecvare f-stress, prin ameliorarea configurației de puncte. Pentru a face acest lucru vom selecta o nouă configurație de puncte, care să redea mai bine relațiile dintre obiecte, și se
[Corola-publishinghouse/Science/2075_a_3400]
-
reprezentare a obiectelor pe care le studiem, pentru care dimensiunile de evaluare sunt prea generale sau prea subiective pentru a putea fi măsurate pe scale convenționale 1. Colectarea datelor și formarea matricei de proximitățitc "Colectarea datelor și formarea matricei de proximități" Reprezentarea obiectelor sub forma unei hărți perceptuale se face pe baza evaluărilor subiective ale subiecților. Am arătat că acestea iau în general două forme: (1) date de similaritate, alcătuite din judecățile subiecților privind similaritatea sau disimilaritatea obiectelor, și (2) date
[Corola-publishinghouse/Science/2075_a_3400]
-
general două forme: (1) date de similaritate, alcătuite din judecățile subiecților privind similaritatea sau disimilaritatea obiectelor, și (2) date de preferințe, compuse din preferințele subiecților în raport cu mulțimea de obiecte. De asemenea, am arătat că ele pot fi de la bun început proximități (sau disimilarități) sau este nevoie să fie prelucrate pentru a putea fi interpretate ca proximități. Cum pot fi reprezentate judecățile despre obiecte într-o bază de date? Acest lucru depinde de forma lor, adică de modul în care li s-
[Corola-publishinghouse/Science/2075_a_3400]
-
obiectelor, și (2) date de preferințe, compuse din preferințele subiecților în raport cu mulțimea de obiecte. De asemenea, am arătat că ele pot fi de la bun început proximități (sau disimilarități) sau este nevoie să fie prelucrate pentru a putea fi interpretate ca proximități. Cum pot fi reprezentate judecățile despre obiecte într-o bază de date? Acest lucru depinde de forma lor, adică de modul în care li s-a cerut subiecților să facă evaluarea obiectelor. Totul se reduce deci la forma în care
[Corola-publishinghouse/Science/2075_a_3400]
-
trebuie să fie aceleași. Ele sunt, fiecare, un duplicat, o copie a celorlalte, între ele neexistând diferență sistematică. Distanțele se vor calcula similar scalării multidimensionale simple, singura diferență apărând în faptul că datele sunt constituite din mai multe matrice de proximități. Matricea de distanțe D este aceeași și se urmărește aproximarea tuturor matricelor de proximități cu matricea de distanțe D. În acest caz, ecuația fundamentală a scalării dimensionale poate fi exprimată sintetic astfel: Δk=fk(Δk)=D+E k=1, ..., m
[Corola-publishinghouse/Science/2075_a_3400]
-
ele neexistând diferență sistematică. Distanțele se vor calcula similar scalării multidimensionale simple, singura diferență apărând în faptul că datele sunt constituite din mai multe matrice de proximități. Matricea de distanțe D este aceeași și se urmărește aproximarea tuturor matricelor de proximități cu matricea de distanțe D. În acest caz, ecuația fundamentală a scalării dimensionale poate fi exprimată sintetic astfel: Δk=fk(Δk)=D+E k=1, ..., m, unde m este numărul de matrice de proximități. O altă dezvoltare a acestei metode
[Corola-publishinghouse/Science/2075_a_3400]
-
se urmărește aproximarea tuturor matricelor de proximități cu matricea de distanțe D. În acest caz, ecuația fundamentală a scalării dimensionale poate fi exprimată sintetic astfel: Δk=fk(Δk)=D+E k=1, ..., m, unde m este numărul de matrice de proximități. O altă dezvoltare a acestei metode este scalarea multidimensională ponderată sau Weighted Multidimensional Scaling (WMDS) în engleză. Această variantă folosește, de asemenea, mai multe matrice de disimilaritate, Δk, k=1, ..., m, dar se acceptă că ele pot fidiferite una față de
[Corola-publishinghouse/Science/2075_a_3400]
-
o modalitate de a introduce toată informația într-o bază de date. Analiza de scalare multidimensională pornește de la această bază de date, care, așa cum am arătat mai sus, poate fi alcătuită (1) dintr-o singură matrice de similarități, preferințe sau proximități sau (2) din mai multe matrice de similarități, câte una pentru fiecare subiect. În funcție de asumpțiile de la care pornim, vom specifica un model de scalare multidimensională simplu, RMDS sau WMDS. Un lucru esențial în scalarea multidimensională îl constituie alegerea obiectelor evaluate
[Corola-publishinghouse/Science/2075_a_3400]
-
măsuri de adecvare supraevaluate (indicatorii pentru adecvarea modelului au valori care ne indică un model foarte bun, când în realitate el poate fi sub-specificat, degenerat sau supradimensionat). Obținerea configurației de punctetc "Obținerea configurației de puncte" Așa cum am arătat, matricea de proximități constituie punctul deplecare pentru obținerea configurației de puncte care redă cel mai bine relațiile percepute dintre obiecte. Indiferent de tipul scalei de măsură a proximităților, non-metrică sau metrică, soluția scalată produsă de pachetele statistice de programe va fi metrică. Acest
[Corola-publishinghouse/Science/2075_a_3400]
-
sau supradimensionat). Obținerea configurației de punctetc "Obținerea configurației de puncte" Așa cum am arătat, matricea de proximități constituie punctul deplecare pentru obținerea configurației de puncte care redă cel mai bine relațiile percepute dintre obiecte. Indiferent de tipul scalei de măsură a proximităților, non-metrică sau metrică, soluția scalată produsă de pachetele statistice de programe va fi metrică. Acest lucru este posibil matematic și este avantajos din mai multe puncte de vedere. Soluțiile metrice dau o hartă perceptuală mai ușor de interpretat,care poate
[Corola-publishinghouse/Science/2075_a_3400]
-
o hartă perceptuală mai ușor de interpretat,care poate fi transformată pentru a-i crește interpretabilitatea, prin rotire sau întindere/compresie 1. Distincția conceptuală între metodele de scalare multidimensională non-metrice și metrice este dată de scala de măsură a similarităților (proximităților). Metodele non-metrice sunt mai flexibile, în sensul că nu presupun nici o relație specifică între distanța calculată și măsura de similaritate. Dezavantajul lor este că pot produce soluții suboptimale sau degenerate. Soluțiile degenerate sunt reprezentări incorecte ale obiectelor, în care punctele
[Corola-publishinghouse/Science/2075_a_3400]
-
incorecte ale obiectelor, în care punctele sunt strânse într-un singur loc al diagramei sau se găsesc la capetele unei singure dimensiuni. Metodele metrice produc soluții a căror dimensionalitate reflectă cu mult mai multă acuratețe dimensionalitatea datelor de intrare (a proximităților). Aici merită să notăm că, indiferent de caracterul real metric sau non-metric al datelor, soluțiile obținute prin aplicarea unei metode non-metrice sau a uneia metrice sunt foarte asemănătoare. Mai sus am arătat pașii algoritmului prin care se obține configurația de
[Corola-publishinghouse/Science/2075_a_3400]
-
puncte ce reflectă relațiile percepute dintre obiecte. Pentru obținerea soluției vom folosi un pachet de programe statistice pe calculator care realizează algoritmul în funcție de specificările date de cercetător: matricea inițială de date (similaritate sau preferințe), modalitatea de obținere a matricei de proximități, criteriul de oprire a algoritmului, dimensionalitatea modelului. Voi descrie acest lucru pentru SPSS 10.1 în secțiunea următoare. Decizia asupra dimensionalității modeluluitc "Decizia asupra dimensionalității modelului" Alegerea numărului de dimensiuni în care să fie reprezentate obiectele este importantă pentru acuratețea
[Corola-publishinghouse/Science/2075_a_3400]
-
bună dintre ele. Această evaluare va fi dublată de o evaluare în funcție de indicatori statistici: numărul de dimensiuni va fi stabilit în funcție de valorile măsurii de adecvare pentru modele de dimensionalități diferite. Măsura de adecvare, f-stress, indică proporția de varianță a transformatelor proximităților dintre obiecte care nu este explicată de model. Cu cât f-stress ia valori mai mici, cu atât modelul este mai bun. Interpretarea f-stress se face în termenii aceleiași logici folosite la interpretarea lui R2 în modelele de regresie: valoarea sa
[Corola-publishinghouse/Science/2075_a_3400]
-
cele mai puține dimensiuni. În afară de f-stress, în general programele statistice mai calculează alți câțiva indicatori de adecvare a modelului, care ne pot ghida în alegerea modelului cu cea mai bună dimensionalitate. Unul dintre aceștia este RSQ, corelația simplă pătratică între proximități și transformate. Cu cât aceasta este mai mare, cu atât modelul este mai bun. Un altul este stress, care are o formulă asemănătoare cu f-stress, dar folosește distanțe în loc de pătratul distanțelor. Analiza reziduurilor, adică a diferențelor dintre distanțele de pe hartă
[Corola-publishinghouse/Science/2075_a_3400]
-
cât aceasta este mai mare, cu atât modelul este mai bun. Un altul este stress, care are o formulă asemănătoare cu f-stress, dar folosește distanțe în loc de pătratul distanțelor. Analiza reziduurilor, adică a diferențelor dintre distanțele de pe hartă dij și transformatele proximităților f(dij), ne poate indica magnitudinea și natura erorilor. Dacă acestea sunt importante și au o formă sistematică, este nevoie să introducem o nouă dimensiune. Eventual, analiza reziduurilor ne poate indica semnificația noii dimensiuni. Interpretarea și evaluarea rezultatelortc "Interpretarea și
[Corola-publishinghouse/Science/2075_a_3400]
-
soluției. Dar, pe lângă acestea, cercetătorul poate apela la mijloace statistice pentru a confirma și clarifica interpretarea hărții perceptuale. Identificarea naturii dimensiunilor se poate face prin regresia multiliniară. Realizarea unei astfel de analize depinde de variabilele în funcție de care s-au calculat proximitățile. De exemplu, în situația în care acestea sunt itemii unui diferențiator semantic, se va face câte o regresie liniară pentru fiecare variabilă, folosind dimensiunile obținute în urma scalării multidimensionale ca variabile independente. În funcție de coeficienții standardizați de regresie, vom putea identifica acele
[Corola-publishinghouse/Science/2075_a_3400]
-
cele ce urmează voi descrie procedura Alscal din pachetul SPSS Base2. Procedura se accesează din meniul Analyze, Scale, Multidimensional Scaling (Alscal) și deschide o fereastră în care va fi specificat modelul dorit. În fereastra Variables vom selecta variabilele care reprezintă proximitățile dintre obiecte sau în funcție de care se vor calcula acestea. Dacă dorim să obținem câte o reprezentare diferită pentru fiecare subiect (adică un model RMDS sau WMDS), vom specifica în fereastra Individual Matrices for variabila care distinge între submatricele corespunzătoare fiecărui
[Corola-publishinghouse/Science/2075_a_3400]
-
diferită pentru fiecare subiect (adică un model RMDS sau WMDS), vom specifica în fereastra Individual Matrices for variabila care distinge între submatricele corespunzătoare fiecărui subiect. În secțiunea Distances vom specifica forma datelor din baza de date. Acestea pot fi direct proximități (distanțe) sau este nevoie să fie calculate. În primul caz, va trebui specificată forma lor. Dacă pe linii și pe coloane sunt reprezentate elementele aceleiași mulțimi (obiectele), atunci datele au forma rectangulară, simetrică (Shape square symmetric) sau asimetrică (Shape square
[Corola-publishinghouse/Science/2075_a_3400]
-
square asymmetric). Dacă pe linii și pe coloane sunt reprezentate elemente ce aparțin la două mulțimi diferite (obiecte și caracteristici/ranguri/evaluări), atunci datele au formă rectangulară (Shape rectangular) și trebuie specificat numărul de rânduri (rows). În cazul în care proximitățile trebuie calculate, modul de calcul se va specifica în fereastra care se deschide apăsând pe butonul Measure. În funcție de forma particulară a datelor și de logica introducerii lor în baza de date, vom calcula o măsură de proximitate (distanță) ordinală, de
[Corola-publishinghouse/Science/2075_a_3400]
-
cazul în care proximitățile trebuie calculate, modul de calcul se va specifica în fereastra care se deschide apăsând pe butonul Measure. În funcție de forma particulară a datelor și de logica introducerii lor în baza de date, vom calcula o măsură de proximitate (distanță) ordinală, de intervale sau de rapoarte. În meniul deschis prin apăsarea butonului Model, vor fi specificate atributele modelului ales (aici alegem între o analiză RMDS sau una WMDS). Nivelul de măsurare (Level of measurement) permite selectarea unui model metric
[Corola-publishinghouse/Science/2075_a_3400]
-
apăsarea butonului Model, vor fi specificate atributele modelului ales (aici alegem între o analiză RMDS sau una WMDS). Nivelul de măsurare (Level of measurement) permite selectarea unui model metric sau non-metric) - evident, alegerea modelului depinde de nivelul de măsurare pentru proximități. La opțiunea de scalare Scaling model se va selecta varianta Individual differences Euclidian distances în cazul în care avem mai multe matrice de disimilaritate și dorim un model WMDS. În toate celelalte cazuri se va alege Euclidian distance. Secțiunea Conditionality
[Corola-publishinghouse/Science/2075_a_3400]
-
Tot în acest meniu vom specifica numărul minim și numărul maxim de dimensiuni pe care dorim să îl aibă soluția. În meniul deschis prin apăsarea butonului Options putem cere afișarea reprezentării grafice a soluțiilor individuale sau comune, matricea de date (proximități) și caracteristicile modelului. Tot aici specificăm criteriul de convergență a algoritmului (valoarea minimă pentru s-stress și numărul maxim de iterații). Programul va produce și câteva diagrame care raportează transformatele proximităților (numite disparities în engleză) la distanțe, proximitățile la distanțe sau
[Corola-publishinghouse/Science/2075_a_3400]
-
reprezentării grafice a soluțiilor individuale sau comune, matricea de date (proximități) și caracteristicile modelului. Tot aici specificăm criteriul de convergență a algoritmului (valoarea minimă pentru s-stress și numărul maxim de iterații). Programul va produce și câteva diagrame care raportează transformatele proximităților (numite disparities în engleză) la distanțe, proximitățile la distanțe sau proximitățile la transformatele proximităților. Aceste diagrame sunt foarte utile în evaluarea modelului, pentru că ne indică numărul și magnitudinea erorilor modelului (diferențele dintre transformatele proximităților și distanțele reprezentării poziționării relative a
[Corola-publishinghouse/Science/2075_a_3400]