7,662 matches
-
un tabel 2 × 2. Acesta este o altă reprezentare pentru același model de joc, cunoscut sub numele de formă „strategică” sau normală a jocului. În formă strategică, jocul este redus la jucători, la numărul de rezultate finale ale alegerilor și recompensa așteptată pentru fiecare jucător, pentru fiecare rezultat. Fazele care duc la matricea câștigurilor (pay off matrix), esențiale pentru o reprezentare extensivă, nu sunt dezvăluite în forma strategică a structurii jocului. Sunt prezentate doar opțiunile de bază și rezultatele lor. Forma
[Corola-publishinghouse/Science/2240_a_3565]
-
matricea strategică propriu-zisă, căci pot exista mai multe jocuri extensive, și nu doar unul, care să fie reprezentate de către aceeași formă strategică. Rezultatul jocului de mai sus reprezintă un echilibru într-un punct de criză. Altfel spus, rivalul obține o recompensă mai mare din provocare, indiferent de faptul că superputerea nu rezistă (3 față de -1), sau rezistă (-1 față de -3). Superputerea obține o recompensă mai mare dacă rezistă, indiferent de faptul că rivalul nu provoacă (5 față de 2) sau provoacă (-1
[Corola-publishinghouse/Science/2240_a_3565]
-
jocului de mai sus reprezintă un echilibru într-un punct de criză. Altfel spus, rivalul obține o recompensă mai mare din provocare, indiferent de faptul că superputerea nu rezistă (3 față de -1), sau rezistă (-1 față de -3). Superputerea obține o recompensă mai mare dacă rezistă, indiferent de faptul că rivalul nu provoacă (5 față de 2) sau provoacă (-1 față de -5). Jocul acesta s-ar putea numi „hărțuirea bătăușului” și este jucat adesea de către elevi în timpul pauzelor acolo unde există în mod
[Corola-publishinghouse/Science/2240_a_3565]
-
dacă nu, pierde moneda. Jocul în forma sa extensivă conține două puncte nodale, fiecare producând două ramuri și având patru rezultate finale posibile. Putem transforma cu ușurință acest joc în forma sa strategică, concentrându-ne asupra rezultatelor finale și asupra recompenselor lor. Convenția este de a preciza la început recompensele acordate jucătorului A, urmate de cele acordate jucătorului B. Trebuie să remarcăm o diferență majoră între ultimele două jocuri prezentate: provocare-răspuns și cap-pajură. În cel de-al doilea recompensele din cadrul fiecărei
[Corola-publishinghouse/Science/2240_a_3565]
-
conține două puncte nodale, fiecare producând două ramuri și având patru rezultate finale posibile. Putem transforma cu ușurință acest joc în forma sa strategică, concentrându-ne asupra rezultatelor finale și asupra recompenselor lor. Convenția este de a preciza la început recompensele acordate jucătorului A, urmate de cele acordate jucătorului B. Trebuie să remarcăm o diferență majoră între ultimele două jocuri prezentate: provocare-răspuns și cap-pajură. În cel de-al doilea recompensele din cadrul fiecărei căsuțe sunt simetrice. De fapt, în fiecare căsuță suma
[Corola-publishinghouse/Science/2240_a_3565]
-
și asupra recompenselor lor. Convenția este de a preciza la început recompensele acordate jucătorului A, urmate de cele acordate jucătorului B. Trebuie să remarcăm o diferență majoră între ultimele două jocuri prezentate: provocare-răspuns și cap-pajură. În cel de-al doilea recompensele din cadrul fiecărei căsuțe sunt simetrice. De fapt, în fiecare căsuță suma lor este zero. Acest lucru nu este adevărat în primul joc. Aceasta constituie o distincție majoră între aceste două tipuri de jocuri. În jocurile cu sumă zero, câștigul jucătorului
[Corola-publishinghouse/Science/2240_a_3565]
-
pierde partidul tău. (Jocurile cu sumă fixă, în care recompensa din matrice se însumează într-o constantă, pot fi transformate matematic în jocuri cu sumă zero și sunt analizate ca atare.) Prin contrast, în jocurile cu sumă diferită de zero, recompensele în unele căsuțe, sau chiar toate, sunt asimetrice la nivelul jucătorilor. De exemplu, mie poate să-mi pese mai tare de obținerea unui anumit premiu decât să-ți pese ție că-l pierzi; sau aș putea fi fericit ca tu
[Corola-publishinghouse/Science/2240_a_3565]
-
Pe de altă parte, cele două jocuri pe care le-am folosit mai sus ca exemple au o asemănare importantă. Ambele sunt jocuri de două persoane. În acestea există doar doi actori ale căror alegeri sunt relevante pentru rezultat, iar recompensa se împarte complet între acești doi jucători. Ne putem imagina cu ușurință jocuri jucate de trei, patru sau orice alt număr de jucători. Teoria jocurilor face distincție între jocurile de două și de n persoane. Jocurile de două persoane au
[Corola-publishinghouse/Science/2240_a_3565]
-
între acești doi jucători. Ne putem imagina cu ușurință jocuri jucate de trei, patru sau orice alt număr de jucători. Teoria jocurilor face distincție între jocurile de două și de n persoane. Jocurile de două persoane au o matrice de recompense care poate fi analizată ușor în formă strategică. Jocurile cu mai mult de doi jucători necesită adesea dimensiuni multiple pentru schema de recompense și astfel acestea sunt analizate de obicei folosindu-se o tehnică oarecum diferită. Se pot face mult
[Corola-publishinghouse/Science/2240_a_3565]
-
distincție între jocurile de două și de n persoane. Jocurile de două persoane au o matrice de recompense care poate fi analizată ușor în formă strategică. Jocurile cu mai mult de doi jucători necesită adesea dimensiuni multiple pentru schema de recompense și astfel acestea sunt analizate de obicei folosindu-se o tehnică oarecum diferită. Se pot face mult mai multe distincții în teoria jocurilor - de exemplu, între jocurile cooperante și ne-cooperante, în funcție de faptul că înțelegerile dintre jucători sunt obligatorii sau
[Corola-publishinghouse/Science/2240_a_3565]
-
Mă voi baza mult pe cartea lui Morrow în discuția ce urmează. III. Echilibrul în jocurile de două persoanetc "III. Echilibrul în jocurile de două persoane" Până acum, ne-am ocupat de raționalitatea individuală și de matricea de alegeri și recompense care le stă la dispoziție jucătorilor într-un joc de două persoane. Problema noastră este acum să hotărâm cum ar trebui să se comporte jucătorii raționali atunci când sunt confruntați cu astfel de alegeri. Am prezentat actorii și le-am formatat
[Corola-publishinghouse/Science/2240_a_3565]
-
astfel de alegeri. Am prezentat actorii și le-am formatat amplasamentele. În continuare, trebuie pus în mișcare cadrul. Dar care este logica ce guvernează selectarea unei strategii, a unui tipar de alegeri dintre opțiuni care să producă cea mai mare recompensă prevăzută? O strategie ideală este una care îi asigură întotdeauna jucătorului cea mai bună recompensă, indiferent de strategiilecelorlalți jucători; acest lucru se întâmplă însă foarte rar. O altă opțiune este alegerea unei strategii care să asigure o recompensă maximizantă, presupunând
[Corola-publishinghouse/Science/2240_a_3565]
-
în mișcare cadrul. Dar care este logica ce guvernează selectarea unei strategii, a unui tipar de alegeri dintre opțiuni care să producă cea mai mare recompensă prevăzută? O strategie ideală este una care îi asigură întotdeauna jucătorului cea mai bună recompensă, indiferent de strategiilecelorlalți jucători; acest lucru se întâmplă însă foarte rar. O altă opțiune este alegerea unei strategii care să asigure o recompensă maximizantă, presupunând că și celălalt jucător aplică o strategie maximizantă; dar nu este întotdeauna sigur că celălalt
[Corola-publishinghouse/Science/2240_a_3565]
-
mai mare recompensă prevăzută? O strategie ideală este una care îi asigură întotdeauna jucătorului cea mai bună recompensă, indiferent de strategiilecelorlalți jucători; acest lucru se întâmplă însă foarte rar. O altă opțiune este alegerea unei strategii care să asigure o recompensă maximizantă, presupunând că și celălalt jucător aplică o strategie maximizantă; dar nu este întotdeauna sigur că celălalt are doar o singură strategie de agest gen la dispoziție. Din această cauză, calculele pot deveni foarte complicate. Scopul analizei jocurilor este acela
[Corola-publishinghouse/Science/2240_a_3565]
-
joc. Această strategie se consideră că domină toate celelalte strategii. În mod formal pentru jucătorul A (PA), strategia S1 constituie strategie dominantă dacă, în cazul tuturor alegerilor făcute de ceilalți jucători, S1 îi asigură întotdeauna lui PA cea mai mare recompensă. Într-un joc de două persoane, se poate întâmpla uneori ca ambii jucători să aibă strategii dominante. În mod evident, un astfel de joc se află în echilibru, căci ambii jucători își vor aplica strategiile dominante. Acest rezultat se numește
[Corola-publishinghouse/Science/2240_a_3565]
-
ambii jucători își vor aplica strategiile dominante. Acest rezultat se numește „echilibrul de strategie dominantă”. Voi aduce două exemple, unul în formă cu suma zero și altul în formă cu suma non-zero. Să examinăm următoarele jocuri cu sumă zero. Rețineți: recompensa jucătorului A este întotdeauna trecută pe prima listă, iar cea a jucătorului B este cea de-a doua, în fiecare pereche de rezultate posibile! Jucătorul A își va selecta întotdeauna strategia S2. Dacă PB selectează s1, recompensa lui PA este
[Corola-publishinghouse/Science/2240_a_3565]
-
sumă zero. Rețineți: recompensa jucătorului A este întotdeauna trecută pe prima listă, iar cea a jucătorului B este cea de-a doua, în fiecare pereche de rezultate posibile! Jucătorul A își va selecta întotdeauna strategia S2. Dacă PB selectează s1, recompensa lui PA este atunci 4 (spre deosebire de 3, în cazul lui S1). Dacă PB va selecta s2, recompensa lui PA este 7 (spre deosebire de 5 în cazului lui S1). Astfel, strategia S2 o domină pe S1 în cazul jucătorului A. Tot astfel
[Corola-publishinghouse/Science/2240_a_3565]
-
este cea de-a doua, în fiecare pereche de rezultate posibile! Jucătorul A își va selecta întotdeauna strategia S2. Dacă PB selectează s1, recompensa lui PA este atunci 4 (spre deosebire de 3, în cazul lui S1). Dacă PB va selecta s2, recompensa lui PA este 7 (spre deosebire de 5 în cazului lui S1). Astfel, strategia S2 o domină pe S1 în cazul jucătorului A. Tot astfel, jucătorul B va selecta întotdeauna strategia s1. Dacă PA selectează S1, recompensa lui PB este -3 (spre deosebire de
[Corola-publishinghouse/Science/2240_a_3565]
-
Dacă PB va selecta s2, recompensa lui PA este 7 (spre deosebire de 5 în cazului lui S1). Astfel, strategia S2 o domină pe S1 în cazul jucătorului A. Tot astfel, jucătorul B va selecta întotdeauna strategia s1. Dacă PA selectează S1, recompensa lui PB este -3 (spre deosebire de -5, în cazul lui s2). Dacă PA selectează S2, recompensa lui PB este -4 (spre deosebire de -7, în cazul lui s2). Strategia s1 va domina, în consecință, strategia s2 pentru jucătorul B. În mod rațional, PA
[Corola-publishinghouse/Science/2240_a_3565]
-
S1). Astfel, strategia S2 o domină pe S1 în cazul jucătorului A. Tot astfel, jucătorul B va selecta întotdeauna strategia s1. Dacă PA selectează S1, recompensa lui PB este -3 (spre deosebire de -5, în cazul lui s2). Dacă PA selectează S2, recompensa lui PB este -4 (spre deosebire de -7, în cazul lui s2). Strategia s1 va domina, în consecință, strategia s2 pentru jucătorul B. În mod rațional, PA va aplica întotdeauna S2; PB va aplica întotdeauna s1. Opțiunea S2s1 constituie echilibrul de strategie
[Corola-publishinghouse/Science/2240_a_3565]
-
este -4 (spre deosebire de -7, în cazul lui s2). Strategia s1 va domina, în consecință, strategia s2 pentru jucătorul B. În mod rațional, PA va aplica întotdeauna S2; PB va aplica întotdeauna s1. Opțiunea S2s1 constituie echilibrul de strategie dominantă, iar recompensa prevăzută conform jocului rațional este (4, -4). Aceasta nu este recompensa maximă pentru PA sau PB din cadrul întregii matrice. Recompensele din jocurile de două persoane rezultă însă din alegerile combinate ale ambilor jucători. S2s1 reprezintă cea mai mare recompensă pe
[Corola-publishinghouse/Science/2240_a_3565]
-
mod rațional, PA va aplica întotdeauna S2; PB va aplica întotdeauna s1. Opțiunea S2s1 constituie echilibrul de strategie dominantă, iar recompensa prevăzută conform jocului rațional este (4, -4). Aceasta nu este recompensa maximă pentru PA sau PB din cadrul întregii matrice. Recompensele din jocurile de două persoane rezultă însă din alegerile combinate ale ambilor jucători. S2s1 reprezintă cea mai mare recompensă pe care o poate obține fiecare jucător pe baza presupunerii că fiecare jucător va alege în mod rațional. Cel de-al
[Corola-publishinghouse/Science/2240_a_3565]
-
iar recompensa prevăzută conform jocului rațional este (4, -4). Aceasta nu este recompensa maximă pentru PA sau PB din cadrul întregii matrice. Recompensele din jocurile de două persoane rezultă însă din alegerile combinate ale ambilor jucători. S2s1 reprezintă cea mai mare recompensă pe care o poate obține fiecare jucător pe baza presupunerii că fiecare jucător va alege în mod rațional. Cel de-al doilea exemplu este unul cu suma non-zero. Să examinăm următorul joc: Din nou, ambii jucători au o strategie dominantă
[Corola-publishinghouse/Science/2240_a_3565]
-
probe. Dacă amândoi colaborează cu poliția (S2s2), vor ajunge amândoi în închisoare pentru mult timp (-5, -5). În mod evident, ambii prizonieri preferă S1s1 lui S2s2. Totuși, fiecare își dă seama că mai există două opțiuni în fiecare matrice de recompense. Conform uneia dintre aceste opțiuni, partenerul va tăcea, dar eu voi colabora. Polițiștii promit că în acest caz vor opri ancheta, iar eu voi putea să plec în deplină libertate (astfel obținând 10 unități de utilitate). Partenerul va fi desigur
[Corola-publishinghouse/Science/2240_a_3565]
-
un rezultat de echilibru, chiar dacă este maximizant pentru opțiunile oferite nu trebuie să fie un rezultat ideal pentru un anumit jucător sau din punctul de vedere al utilității sociale nete a ambilor jucători. Pot exista opțiuni preferabile în matricea de recompense, dar se poate întâmpla ca interacțiunea strategiilor raționale individuale să nu fie în stare să le realizeze. Drept consecință, echilibrele din teoria jocurilor dominante pot avea câteodată rezultate care par contraintuitive. O dificultate mult mai mare rezultă din faptul că
[Corola-publishinghouse/Science/2240_a_3565]