2,434 matches
-
analiză cantitativă a inventarului lexical al unui corpus. Discourse Analysis Tool aduce îmbunătățiri substanțiale softului american. Astfel, în vreme ce LIWC se limitează la cuantificarea ocurențelor lexicale aferente diverselor clase semantice, DAT include un sistem automat de lematizare și adnotare morfo-lexicală a corpusului. Fiecare intrare a dicționarului, care stă la baza programului, cuprinde informații privind lema, partea de vorbire aferentă și clasa semantică ilustrată, favorizând realizarea, pe lângă investigațiile de ordin semantic, a unor analize de factură morfologică. Dicționarul aferent DAT însumează peste 6000
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
lexicale, am considerat imperioasă o redimensionare a dicționarului care se află în componența softului, menită să îmbunătățească rezultatele analizei. Adaptarea lexicului s-a realizat în trei etape: 1. într-o primă etapă, s-a operat lematizarea și adnotarea morfo-lexicală a corpusului publicistic eminescian (cuprinzând cele cinci volume din ediția Perpessicius), etapă în care au fost evidențiate unitățile lexicale cu părțile de vorbire și lemele specifice; 2. inventarul lexical obținut în urma lematizării a fost adnotat, prin indicarea clasei semantice aferente fiecărei unități
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
semantice încorporate programului DAT, au fost adnotate 30000 de unități lexicale aparținând vocabularului eminescian; 3. ulterior, cele 30000 de unități lexicale au fost inserate în dicționarul românesc al softului DAT, eliminându-se dubletele, prin confruntarea listelor de clase semantice. Procesarea corpusului publicistic s-a realizat inițial detaliat, pentru fiecare an de selecție a articolelor (1877, 1878, 1880), iar ulterior integral, pentru o acuratețe cât mai mare a analizei contrastive. Datele oferite de DAT la ieșire reprezintă procente privind ponderea cuvintelor aparținând
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
a articolelor (1877, 1878, 1880), iar ulterior integral, pentru o acuratețe cât mai mare a analizei contrastive. Datele oferite de DAT la ieșire reprezintă procente privind ponderea cuvintelor aparținând claselor semantice avute în vedere. Pentru fiecare clasă semantică ilustrată în corpus, programul stabilește procente de frecvență în text. Reprezentarea rezultatelor, sub forma unor grafice statistice, facilitează vizualizarea diferențelor, respectiv a liniilor de continuitate, înregistrate la nivelul discursului publicistic cultivat de cele patru publicații, oferind premisele analizei contrastive de ordin calitativ. În
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
la numărul total de cuvinte folosite în text). 6.2.2. Analiza contrastivă Analiza contrastivă a claselor semantice cu ajutorul programului DAT a avut ca obiect un număr de 63 de articole, selectate din Timpul, Pressa, Românul și România liberă. Procesarea corpusului a fost precedată de o serie de operații de pregătire a materialului supus analizei: a) scanarea/ fotografierea articolelor de ziar selectate; b) ocerizarea textelor 499; c) corectura prin confruntarea textelor ocerizate cu scan-urile aferente; Demersul analitic a avut în vedere
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
a dat dovadă de neprevedere în raporturile cu Imperiul Țarist. Nedreptatea pe care Rusia o face României, prin încheierea armistițiului cu Imperiul Otoman, în 23 ianuarie 1878, trezește indignarea și afirmațiile virulente ale presei conservatoare. Figura 8. Analiza contrastivă a corpusului din 1877 Articolele din decembrie 1877 prezintă starea armatei române la întoarcerea de pe frontul de luptă din Balcani, ilustrând în același timp viziunea principalelor grupări politice din țară: liberalii și conservatorii. Lectura articolelor relevă puncte de apropiere, în ce privește elogiul adus
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
procente pentru clasele social (34%) și emoțional negativ (12%). Deși susține doctrina liberală, gazeta este nemulțumită de ideile politice promovate de C.A. Rosetti și adoptă un discurs extrem de virulent la adresa politicii editoriale a Românului. Figura 9. Analiza contrastivă a corpusului din 1878 Corpusul publicistic aferent anului 1880 este alcătuit pe baza criteriului cronologic, cuprinzând editorialele celor patru publicații, din prima săptămână a lunii aprilie. Rezultatele procesării textelor cu ajutorul softului DAT relevă aceleași dominante sociale la nivel tematic și o ilustrare
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
social (34%) și emoțional negativ (12%). Deși susține doctrina liberală, gazeta este nemulțumită de ideile politice promovate de C.A. Rosetti și adoptă un discurs extrem de virulent la adresa politicii editoriale a Românului. Figura 9. Analiza contrastivă a corpusului din 1878 Corpusul publicistic aferent anului 1880 este alcătuit pe baza criteriului cronologic, cuprinzând editorialele celor patru publicații, din prima săptămână a lunii aprilie. Rezultatele procesării textelor cu ajutorul softului DAT relevă aceleași dominante sociale la nivel tematic și o ilustrare echilibrată a claselor
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
din prima săptămână a lunii aprilie. Rezultatele procesării textelor cu ajutorul softului DAT relevă aceleași dominante sociale la nivel tematic și o ilustrare echilibrată a claselor realizări și emoțional negativ, așa cum se observă în figura 10. Figura 10. Analiza contrastivă a corpusului din 1880 Remarcăm că diferențele privind procentele de frecvență a claselor semantice în articole sunt nesemnificative, fapt care indică un grad sporit de omogenitate a discursului publicistic în epocă. O noutate pentru 1880, reprezintă creșterea procentului care indică frecvența clasei
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
post și arestarea acestuia. Aspectele financiare ale afacerii sunt dezbătute pe larg, în editorialele de la începutul lui aprilie 1880, fapt evidențiat de altfel de rezultatele DAT. Figura 11 înregistrează graficul mediilor pe care îl înscrie frecvența claselor semantice, în întreg corpusul analizat. Remarcăm că discursul celor patru publicații supuse atenției (Pressa, România liberă, Românul și Timpul) este aproape identic în ce privește clasele semantice ilustrate la nivel lexical, fapt explicabil prin natura discursului publicistic care, dincolo de afinitățile ideologice ale redactorilor, este menit să
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
două de orientare liberală, rezultatele atestă că diferențele ideologice nu se reflectă la nivelul lexicului utilizat și că toate cele patru gazete cultivă un limbaj asemănător, din punct de vedere al claselor semantice valorificate. Figura 11. Media frecvențelor în întreg corpusul publicistic Procesarea corpusului publicistic cu ajutorul DAT a permis formularea unor concluzii, în ceea ce privește caracteristicile semantice și pragmatice ale limbajului politic cultivat de presa din epoca eminesciană: a) la nivel tematic, publicistica de factură politică din cea de-a doua jumătate a
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
liberală, rezultatele atestă că diferențele ideologice nu se reflectă la nivelul lexicului utilizat și că toate cele patru gazete cultivă un limbaj asemănător, din punct de vedere al claselor semantice valorificate. Figura 11. Media frecvențelor în întreg corpusul publicistic Procesarea corpusului publicistic cu ajutorul DAT a permis formularea unor concluzii, în ceea ce privește caracteristicile semantice și pragmatice ale limbajului politic cultivat de presa din epoca eminesciană: a) la nivel tematic, publicistica de factură politică din cea de-a doua jumătate a secolului al XIX
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
în funcție de competențele interpretative ale cititorului și provocându-l în același timp, prin amploarea problematicii abordate și prin deschiderile enciclopedice pe care le operează la nivelul conținuturilor, jurnalistul contribuie decisiv la procesul de modernizare și autonomizare a discursului publicistic românesc. Procesarea corpusului publicistic cu ajutorul DAT a evidențiat alinierea articolelor eminesciene la problematica publicațiilor din epocă. Procentajele privind ponderea diferitelor clase semantice în cele patru gazete supuse atenției nu au relevat diferențe semnificative, sugerând astfel, că semantica limbajului eminescian este caracteristică semanticii discursului
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
cu creația poetică, între cele două compartimente ale operei existând contaminări reciproce atât la nivelul expresiei verbale, cât și la cel tematic. Dincolo de limitele unui astfel de demers analitic, care se rezumă la cuantificarea inventarului lexical pe clase semantice, procesarea corpusului publicistic cu ajutorul DAT a permis nuanțarea judecăților radicale pe care exegeza le-a formulat de-a lungul timpului în legătură cu gândirea politică eminesciană. Naționalismul, antisemitismul, xenofobia, reacționarismul dobândesc o lectură particulară, în lumina problematicii epocii eminesciene și a specificului discursului publicistic
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
expresie pe care le operează scrisul jurnalistic. Fără să urmărim realizarea unor ierarhii valorice, între creația artistică și cea jurnalistică, fapt imposibil, de altfel, din cauza apartenenței la domenii distincte de cunoaștere, am propus în lucrarea noastră o abordare interdisciplinară a corpusului publicistic eminescian, cu instrumente puse la dispoziție de științele comunicării și lingvistica computațională. Perspectiva dominantă este cea semiotică, vizând analiza sintactică, semantică și pragmatică a limbajului politic cultivat de Mihai Eminescu în presa vremii, precum și descrierea parametrilor situației de comunicare
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
este cea semiotică, vizând analiza sintactică, semantică și pragmatică a limbajului politic cultivat de Mihai Eminescu în presa vremii, precum și descrierea parametrilor situației de comunicare pe care o ilustrează publicistica poetului. Analiza semiotică se sprijină pe date obținute în urma procesării corpusului cu instrumente informatice. Chiar dacă ponderea pe care o dețin cele două perspective de analiză, semiotică și informatică, este în mod necesar diferită, utilizarea unor tehnici ale lingvisticii computaționale a permis obiectivarea cercetării, prin raportarea limbajului eminescian la specificul discursului politic
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
lungul timpului, am delimitat patru etape în activitatea jurnalistului: (1) Perioada primelor articole, publicate în timpul studenției la Viena; (2) Colaborarea la Curierul de Iași; (3) Activitatea de la Timpul și (4) Etapa colaborării la România liberă și Fântâna Blanduziei 509. Cercetarea corpusului publicistic aferent celor patru perioade de activitate a evidențiat că problematica articolelor se caracterizează prin unitate și continuitate, în vreme ce, la nivelul expresiei, remarcăm o serie de modificări, de nuanțe, ținând de procesul de de modernizare și de rafinare a expresiei
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
limbii române într-o epocă în care lipsa unor norme unitare se face simțită în nesiguranța și oscilațiile înregistrate de discursul publicistic al vremii. Analiza vocabularului s-a sprijinit pe tehnici ale lingvisticii computaționale care ne-au permis procesarea întregului corpus publicistic, în vederea stabilirii unui inventar lexical specific scrisului jurnalistic eminescian. Analiza semantică a evidențiat polarizarea limbajului politic eminescian în jurul unor dihotomii semantice fundamentale, care conferă unitate și coerență scrisului jurnalistic. În acest sens, dialecticile trecut/ prezent, naționalism/ cosmopolitism, liberal/ conservator
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
a fenomenelor în discuție. Fiecare palier al demersului semiotic a impus reevaluarea celorlalte două, iar coroborarea datelor a contribuit la formarea unei viziuni integratoare asupra scrisului jurnalistic eminescian. Recursul permanent la litera articolelor a facilitat susținerea afirmațiilor cu exemple din corpusul publicistic și a permis formarea unei perspective diacronice asupra limbajului publicistic specific celor patru etape de activitate. Analiza contrastivă a limbajului politic cultivat de presa celei de-a doua jumătăți a secolului al XIX-lea se înscrie în demersul mai
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
În acest sens, pentru 1877, am avut în vedere articole care prezintă situația armatei române la întoarcerea din Războiul pentru Independență, iar pentru 1878, am ales texte care dezbat condițiile impuse României pentru recunoașterea independenței naționale, în urma Congresului de la Berlin. Corpusul aferent anului 1880 cuprinde editorialele celor patru publicații, din prima săptămână a lunii aprilie. Pentru a avea un echilibru sub raport ideologic, am ales spre analiză două publicații de orientare conservatoare (Timpul și România liberă) și două publicații de orientare
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
discursului cultivat de cele patru publicații și s-a realizat cu o variantă total refăcută a softului american LIWC2010, denumită Discourse Analysis Tool (DAT), și elaborată în cadrul Facultății de Informatică a Universității "Al.I. Cuza" din Iași. În esență, procesarea corpusului publicistic cu ajutorul DAT a facilitat generarea unor date statistice cu privire la dominantele semantice ale textelor, pe baza cărora am dezvoltat analize de ordin calitativ. Rezultatele cercetării au condus la concluzia că discursul cultivat de cele patru publicații nu înregistrează diferențe însemnate
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
a doua jumătate a secolului al XIX-lea, iar problematica articolelor este comună, fiind tributară referențialului evenimențial al epocii. Dincolo de limitele unui astfel de instrument de analiză care se rezumă la cuantificarea inventarului lexical pe clase semantice stabilite anterior, procesarea corpusului publicistic cu ajutorul DAT a oferit informații relevante privind direcțiile tematice ale publicațiilor și, implicit, concepțiile politice ale gazetarilor. O limită a programului a constituit-o eludarea aspectelor de ambiguitate semantică, care nu pot fi rezolvate fără raportare la contextul discursiv
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
Eminescu, am fost interesați de modalitățile de semnificare ale limbajului eminescian, de structura și funcționalitatea semiozei publicistice și de nuanțele pe care le imprimă semnificatului unul sau altul dintre parametrii situației de comunicare. Aplicarea modelului hexadic de analiză precum și procesarea corpusului cu instrumente aparținând informaticii au operat deschideri considerabile la nivelul interpretării demonstrând, dacă mai era nevoie, potențialul semnificativ al limbajului eminescian. Semn al uneia dintre cele mai precipitate epoci din istoria națională și al așezării jurnalistului în raport cu realitățile timpului, publicistica
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
Dijma dijmă 1 2 dijma dijmă 1 2 dijmă dijmă 6 2 dijmei dijmă 2 2 dinast dinast 3 2 dinaști dinast 2 2 DINASTIA dinastie 1 2 Dinastia dinastie 3 2 Anexa 3. Valori ale frecvenței claselor semantice în corpusul din 1877 Clase lexicale Pressa 1877 România liberă 1877 Românul 1877 Timpul 1877 Religie 0.308 0.459 1.271 1.794 Familie 0.154 1.606 0.565 0.000 Intuiție 0.616 0.229 0.282 0.448
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]
-
8.475 3.139 Emoțional negativ 8.783 4.358 8.051 14.350 Agrement 1.233 0.000 0.565 0.897 Auditiv 0.308 0.229 0.565 0.000 Anexa 4. Valori ale frecvenței claselor semantice în corpusul din 1878 Clase lexicale Pressa 1878 România liberă 1878 Românul 1878 Timpul 1878 Familie 0.127 1.701 1.276 1.276 Intuiție 0.127 0.340 0.580 0.580 Nerealizări 1.906 1.701 2.088 2.088
by MIHAELA MOCANU [Corola-publishinghouse/Science/979_a_2487]