13,990 matches
-
atunci când însușirea are mai multe stări, iar obiecte diferite au stări diferite pentru însușirea respectivă. Putem înregistra aceste diferențe, aceste variații, și ele constituie conținutul fundamental al datelor. Prin măsurare atașăm sau atribuim numere (valori numerice) acestor stări. În funcție de tipul însușirii (mai sus am arătat că însușirile se disting în cel puțin două grupuri diferite, cele care prezintă un caracter de gradualitate și cele care nu o fac), proprietățile relațiilor dintre numerele atribuite diferă. Distingem patru tipuri importante de niveluri ale
[Corola-publishinghouse/Science/2075_a_3400]
-
iar obiecte diferite au stări diferite pentru însușirea respectivă. Putem înregistra aceste diferențe, aceste variații, și ele constituie conținutul fundamental al datelor. Prin măsurare atașăm sau atribuim numere (valori numerice) acestor stări. În funcție de tipul însușirii (mai sus am arătat că însușirile se disting în cel puțin două grupuri diferite, cele care prezintă un caracter de gradualitate și cele care nu o fac), proprietățile relațiilor dintre numerele atribuite diferă. Distingem patru tipuri importante de niveluri ale măsurării, în funcție de aceste proprietăți: nominal, ordinal
[Corola-publishinghouse/Science/2075_a_3400]
-
proprietăți: nominal, ordinal, de intervale și de rapoarte. Există multe modalități de prezentare a acestor patru niveluri de măsurare. Pentru a distinge între ele, voi înțelege prin atribuirea de numere prin măsurare o funcție, M, care transformă observațiile empirice (stările însușirii obiectelor) în valori numerice. Fie însușirea C, care are k stări diferite, S1, S2, ..., Sk. Valoarea M(S) este măsura stării S a însușirii C pentru un obiect. Acestea fiind spuse, în continuare este ușor să înțelegem cele patru niveluri
[Corola-publishinghouse/Science/2075_a_3400]
-
de rapoarte. Există multe modalități de prezentare a acestor patru niveluri de măsurare. Pentru a distinge între ele, voi înțelege prin atribuirea de numere prin măsurare o funcție, M, care transformă observațiile empirice (stările însușirii obiectelor) în valori numerice. Fie însușirea C, care are k stări diferite, S1, S2, ..., Sk. Valoarea M(S) este măsura stării S a însușirii C pentru un obiect. Acestea fiind spuse, în continuare este ușor să înțelegem cele patru niveluri de măsurare. Nivelul nominal conservă identitatea
[Corola-publishinghouse/Science/2075_a_3400]
-
voi înțelege prin atribuirea de numere prin măsurare o funcție, M, care transformă observațiile empirice (stările însușirii obiectelor) în valori numerice. Fie însușirea C, care are k stări diferite, S1, S2, ..., Sk. Valoarea M(S) este măsura stării S a însușirii C pentru un obiect. Acestea fiind spuse, în continuare este ușor să înțelegem cele patru niveluri de măsurare. Nivelul nominal conservă identitatea categoriilor - toate obiectele care aparțin aceleiași categorii primesc aceeași valoare numerică, iar cele care se găsesc în categorii
[Corola-publishinghouse/Science/2075_a_3400]
-
poate urma și alte strategii decât cea a simplității și a bunului-simț atunci când construiește o măsură pentru o variabilă. Începătorul este introdus încă din primele lecții în metodologia cercetării la strategiile de a formula întrebări pentru a „măsura” anumite caracteristici (însușiri, variabile) și știe că observațiile empirice vor depinde de felul în care au fost concepute. Dacă forma datelor depinde de forma chestionarului sau a altor instrumente de strângere a datelor, iar acest lucru are implicații semnificative asupra ipotezelor pe care
[Corola-publishinghouse/Science/2075_a_3400]
-
puțin două variabile. După cum am spus, dacă nu avem variație, nu avem ce arăta sau ce demonstra - lucrurile sunt date, nu variază, nu avem ce explica. Variabilitatea poate apărea din cel puțin două surse: (1) din proprietățile obiectelor, i.e. din însușirile pe care cercetătorul încearcă să le măsoare, și (2) din felul în care numerele sunt atribuite obiectelor, i.e. felul în care observațiile sunt traduse în numere reale 1. Atunci când folosim variabile măsurate la niveluri de intervale sau de rapoarte, restricțiile
[Corola-publishinghouse/Science/2075_a_3400]
-
asupra definiției, voi face câteva clarificări. Dimensionalitatea nu constă într-un set dat de dimensiuni cu realitate proprie. Dimensiunile sunt derivate contextual, din felul în care sunt analizate obiectele, în funcție de scopul cercetării și modelul teoretic folosit. Ele sunt asociate cu însușiri substanțiale ale obiectelor, relevante și importante pentru perspectiva din care sunt analizate. Identificarea dimensionalității unei mulțimi de obiecte are rolul de a simplifica și clarifica relațiile dintre obiecte, de a le da o reprezentare coerentă, care sporește înțelegerea. Analistul este
[Corola-publishinghouse/Science/2075_a_3400]
-
relevante și importante pentru perspectiva din care sunt analizate. Identificarea dimensionalității unei mulțimi de obiecte are rolul de a simplifica și clarifica relațiile dintre obiecte, de a le da o reprezentare coerentă, care sporește înțelegerea. Analistul este cel care stabilește însușirile obiectelor, relevante și importante pentru cercetarea sa, și construiește un model de dimensionalitate a datelor care să ușureze studiul mulțimii de obiecte, al variabilelor sau al fenomenelor. Există tehnici a căror finalitate este tocmai construcția unui model dimensional al datelor
[Corola-publishinghouse/Science/2075_a_3400]
-
că în caseta de intersecție dintre o linie (obiect) și o coloană (variabilă) va fi introdus un număr. Acest număr este fie măsura variabilei, în cazul variabilelor metrice (cele măsurate pe scale de intervale sau de rapoarte), fie „codul” stărilor însușirii (pentru variabile ordinale sau nominale). Pentru acestea din urmă, fiecare valoare numerică va primi descrierea stării respective- va primi o „etichetă”. Pe lângă întrebările care cer un răspuns sub formă de valoare numerică (de exemplu, vârsta, salariul sau numărul de persoane
[Corola-publishinghouse/Science/2075_a_3400]
-
în sensul lui Mosca etc.) și raporturile dintre acestea 6. Relația trebuie înțeleasă ca proprietate a conectării a cel puțin două unități de analiză (fie ele indivizi, organizații, evenimente sociale, preferințe, apartenență la o organizație etc.). Relațiile, spre deosebire de atribute (caracteristici, însușiri), care sunt intrinsece unității de analiză, sunt dependente de context și se transformă sau dispar atunci când una dintre părțile relevante este îndepărtată sau când contextul în care au apărut ori dezvoltat se schimbă. Dacă anul nașterii, genul, nivelul studiilor unui
[Corola-publishinghouse/Science/2075_a_3400]
-
implică condiții statistice substanțiale. Componenta principală a oricărei proceduri de analiză cluster este algoritmul de grupare, dat de o regulă simplă de alăturare, în pași succesivi, a obiectelor (cazurilor) asemănătoare. Procedurile diferă între ele după mai multe elemente, cum sunt însușirile în funcție de care sunt comparate obiectele pentru a stabili intensitatea asemănării dintre ele, măsura de similaritate folosită, forma algoritmului de grupare, sau numărul de grupuri obținute. Toate acestea for fi discutate detaliat în cele ce urmează. Formularea problemei de cercetare și
[Corola-publishinghouse/Science/2075_a_3400]
-
de asociere" Coeficienții de asociere sunt măsuri de similaritate folosite la compararea obiectelor ale căror caracteristici sunt măsurate pe scale non-metrice (nominale sau ordinale). În general, coeficienții de asociere stabilesc gradul de corespondență între obiecte, în funcție de prezența sau absența unor însușiri (variabile dihotomice). Această informație poate fi pusă sub forma unei matrice în care pe linii se găsesc obiectele, iar pe coloane însușirile. Faptul că obiectul i posedă însușirea j se marchează cu valoarea 1 în caseta aflată la intersecția dintre
[Corola-publishinghouse/Science/2075_a_3400]
-
sau ordinale). În general, coeficienții de asociere stabilesc gradul de corespondență între obiecte, în funcție de prezența sau absența unor însușiri (variabile dihotomice). Această informație poate fi pusă sub forma unei matrice în care pe linii se găsesc obiectele, iar pe coloane însușirile. Faptul că obiectul i posedă însușirea j se marchează cu valoarea 1 în caseta aflată la intersecția dintre linia i și coloana j. Absența însușirii se marchează prin valoarea 0. O posibilă măsură de asociere numără concordanțele între două obiecte
[Corola-publishinghouse/Science/2075_a_3400]
-
asociere stabilesc gradul de corespondență între obiecte, în funcție de prezența sau absența unor însușiri (variabile dihotomice). Această informație poate fi pusă sub forma unei matrice în care pe linii se găsesc obiectele, iar pe coloane însușirile. Faptul că obiectul i posedă însușirea j se marchează cu valoarea 1 în caseta aflată la intersecția dintre linia i și coloana j. Absența însușirii se marchează prin valoarea 0. O posibilă măsură de asociere numără concordanțele între două obiecte (potrivirile dintre valorile 1 și 0
[Corola-publishinghouse/Science/2075_a_3400]
-
pusă sub forma unei matrice în care pe linii se găsesc obiectele, iar pe coloane însușirile. Faptul că obiectul i posedă însușirea j se marchează cu valoarea 1 în caseta aflată la intersecția dintre linia i și coloana j. Absența însușirii se marchează prin valoarea 0. O posibilă măsură de asociere numără concordanțele între două obiecte (potrivirile dintre valorile 1 și 0 pe liniile ce desemnează obiectele), pe care le raportează la numărul posibil de concordanțe (egal cu numărul de însușiri
[Corola-publishinghouse/Science/2075_a_3400]
-
însușirii se marchează prin valoarea 0. O posibilă măsură de asociere numără concordanțele între două obiecte (potrivirile dintre valorile 1 și 0 pe liniile ce desemnează obiectele), pe care le raportează la numărul posibil de concordanțe (egal cu numărul de însușiri). Există peste 30 de măsuri de asociere folosite independent de cercetătorii din diferite discipline. Trei dintre ele sunt mai frecvent folosite: coeficientul de asociere simplă, coeficientul lui Jaccard, coeficientul lui Gower. Coeficientul de asociere simplă raportează numărul de corespondențe (prezențe
[Corola-publishinghouse/Science/2075_a_3400]
-
de măsuri de asociere folosite independent de cercetătorii din diferite discipline. Trei dintre ele sunt mai frecvent folosite: coeficientul de asociere simplă, coeficientul lui Jaccard, coeficientul lui Gower. Coeficientul de asociere simplă raportează numărul de corespondențe (prezențe și absențe ale însușirii deopotrivă) la numărul total de însușiri. Acesta ia valori între 0 și 1, unde 0 semnifică disimilaritate, iar 1 similaritate perfectă. Coeficientul lui Jaccard omite din calcul situațiile în care nici unul dintre cele două obiecte nu prezintă o însușire. Acest
[Corola-publishinghouse/Science/2075_a_3400]
-
de cercetătorii din diferite discipline. Trei dintre ele sunt mai frecvent folosite: coeficientul de asociere simplă, coeficientul lui Jaccard, coeficientul lui Gower. Coeficientul de asociere simplă raportează numărul de corespondențe (prezențe și absențe ale însușirii deopotrivă) la numărul total de însușiri. Acesta ia valori între 0 și 1, unde 0 semnifică disimilaritate, iar 1 similaritate perfectă. Coeficientul lui Jaccard omite din calcul situațiile în care nici unul dintre cele două obiecte nu prezintă o însușire. Acest coeficient se calculează raportând numărul de
[Corola-publishinghouse/Science/2075_a_3400]
-
ale însușirii deopotrivă) la numărul total de însușiri. Acesta ia valori între 0 și 1, unde 0 semnifică disimilaritate, iar 1 similaritate perfectă. Coeficientul lui Jaccard omite din calcul situațiile în care nici unul dintre cele două obiecte nu prezintă o însușire. Acest coeficient se calculează raportând numărul de însușiri care sunt prezente la ambele obiecte la numărul de însușiri care sunt prezente la cel puțin unul dintre obiecte. Se argumentează că, atunci când este folosit coeficientul de asociere simplă, obiectele pot părea
[Corola-publishinghouse/Science/2075_a_3400]
-
Acesta ia valori între 0 și 1, unde 0 semnifică disimilaritate, iar 1 similaritate perfectă. Coeficientul lui Jaccard omite din calcul situațiile în care nici unul dintre cele două obiecte nu prezintă o însușire. Acest coeficient se calculează raportând numărul de însușiri care sunt prezente la ambele obiecte la numărul de însușiri care sunt prezente la cel puțin unul dintre obiecte. Se argumentează că, atunci când este folosit coeficientul de asociere simplă, obiectele pot părea similare mai ales pentru că ambelor obiecte le lipsesc
[Corola-publishinghouse/Science/2075_a_3400]
-
disimilaritate, iar 1 similaritate perfectă. Coeficientul lui Jaccard omite din calcul situațiile în care nici unul dintre cele două obiecte nu prezintă o însușire. Acest coeficient se calculează raportând numărul de însușiri care sunt prezente la ambele obiecte la numărul de însușiri care sunt prezente la cel puțin unul dintre obiecte. Se argumentează că, atunci când este folosit coeficientul de asociere simplă, obiectele pot părea similare mai ales pentru că ambelor obiecte le lipsesc o serie de însușiri, și nu pentru că împărtășesc aceleași însușiri
[Corola-publishinghouse/Science/2075_a_3400]
-
la ambele obiecte la numărul de însușiri care sunt prezente la cel puțin unul dintre obiecte. Se argumentează că, atunci când este folosit coeficientul de asociere simplă, obiectele pot părea similare mai ales pentru că ambelor obiecte le lipsesc o serie de însușiri, și nu pentru că împărtășesc aceleași însușiri. Coeficientul lui Jaccard, în schimb, se concentrează doar asupra însușirilor pe care le au obiectele, și nu asupra celor care le lipsesc amândurora. Dacă această argumentație este întemeiată, sunt situații în care lipsa anumitor
[Corola-publishinghouse/Science/2075_a_3400]
-
însușiri care sunt prezente la cel puțin unul dintre obiecte. Se argumentează că, atunci când este folosit coeficientul de asociere simplă, obiectele pot părea similare mai ales pentru că ambelor obiecte le lipsesc o serie de însușiri, și nu pentru că împărtășesc aceleași însușiri. Coeficientul lui Jaccard, în schimb, se concentrează doar asupra însușirilor pe care le au obiectele, și nu asupra celor care le lipsesc amândurora. Dacă această argumentație este întemeiată, sunt situații în care lipsa anumitor însușiri este la fel de importantă în estimarea
[Corola-publishinghouse/Science/2075_a_3400]
-
Se argumentează că, atunci când este folosit coeficientul de asociere simplă, obiectele pot părea similare mai ales pentru că ambelor obiecte le lipsesc o serie de însușiri, și nu pentru că împărtășesc aceleași însușiri. Coeficientul lui Jaccard, în schimb, se concentrează doar asupra însușirilor pe care le au obiectele, și nu asupra celor care le lipsesc amândurora. Dacă această argumentație este întemeiată, sunt situații în care lipsa anumitor însușiri este la fel de importantă în estimarea similarității dintre două obiecte ca și prezența altor însușiri. Rămâne
[Corola-publishinghouse/Science/2075_a_3400]