7,662 matches
-
ceea ce alege jucătorul B. Același lucru este valabil și pentru jucătorul B. Spre a putea analiza astfel de jocuri, cercetătorii au dezvoltat conceptul „răspunsului cel mai bun”. Strategia „răspunsului cel mai bun” constă într-o mulțime de alegeri care produc recompense maximizante pentru fiecare dintre opțiunile aflate la dispoziția celuilalt individ din joc. Jucătorul A din exemplul de mai sus poate examina gama rezultatelor care se pot produce în urma opțiunilor aflate la dispoziția lui PB. Dacă PB alege s1 atunci PA
[Corola-publishinghouse/Science/2240_a_3565]
-
obținut premiul Oscar pentru cel mai bun film în 2002.) Noțiunea critică din definiția echilibrului Nash este „unilateral”. Dacă PB insistă să aplice s1, PA ar face o prostie să nu aplice S1. S2 i-ar oferi lui PB o recompensă mai scăzută (-1 față de 1). Desigur, PA va prefera ca PB să aplice s2. În acest caz PA ar aplica S2 (și ar obține 5 unități de utilitate față de 1). Totuși, schimbarea de la S1s1 la S2s2 nu poate fi efectuată
[Corola-publishinghouse/Science/2240_a_3565]
-
a aplica s1. PB face calculul în mod similar: dacă PA insistă să aplice S1, cel mai bun lucru este ca el să aplice s1. S1s1 este, astfel, în echilibru deoarece, odată implementată, această strategie produce pentru ambii jucători o recompensă de utilitate așteptată mai mare decât orice alt rezultat care poate fi obținut în urma modificării strategiei vreunui jucător în mod individual. În jocul de mai sus există doua echilibre Nash, S1s1 și S2s2. Primul este preferabil pentru PA, cel de-
[Corola-publishinghouse/Science/2240_a_3565]
-
care să rezolvăm toate jocurile simple de două persoane. Nu trebuie să existe în mod necesar o corespondență între cele mai bune răspunsuri, așa cum se cere în cazul soluțiilor echilibrului Nash discutate mai sus. Analizați, de exemplu, următoarele matrice de recompense, una cu sumă zero și cealaltă cu sumă non-zero. Dacă PA decide inițial să aplice S1, PB alege în mod strategic s2 (pentru o recompensă de -1 față de -3); când PB alege s2, PA își schimbă jocul strategic la S2
[Corola-publishinghouse/Science/2240_a_3565]
-
cere în cazul soluțiilor echilibrului Nash discutate mai sus. Analizați, de exemplu, următoarele matrice de recompense, una cu sumă zero și cealaltă cu sumă non-zero. Dacă PA decide inițial să aplice S1, PB alege în mod strategic s2 (pentru o recompensă de -1 față de -3); când PB alege s2, PA își schimbă jocul strategic la S2 (pentru o recompensă de 4 față de 1); dar când PA selectează S2, PB alege strategic s1 (pentru o recompensă de -2 față de -4); iar când
[Corola-publishinghouse/Science/2240_a_3565]
-
sumă zero și cealaltă cu sumă non-zero. Dacă PA decide inițial să aplice S1, PB alege în mod strategic s2 (pentru o recompensă de -1 față de -3); când PB alege s2, PA își schimbă jocul strategic la S2 (pentru o recompensă de 4 față de 1); dar când PA selectează S2, PB alege strategic s1 (pentru o recompensă de -2 față de -4); iar când PB aplică s1, PA alege strategic S1, (pentru o recompensă de 3 față de 2). Nu există nici o corespondență
[Corola-publishinghouse/Science/2240_a_3565]
-
în mod strategic s2 (pentru o recompensă de -1 față de -3); când PB alege s2, PA își schimbă jocul strategic la S2 (pentru o recompensă de 4 față de 1); dar când PA selectează S2, PB alege strategic s1 (pentru o recompensă de -2 față de -4); iar când PB aplică s1, PA alege strategic S1, (pentru o recompensă de 3 față de 2). Nu există nici o corespondență între cele mai bune răspunsuri. Mai degrabă jocul răspunsului cel mai bun produce un ciclu instabil
[Corola-publishinghouse/Science/2240_a_3565]
-
își schimbă jocul strategic la S2 (pentru o recompensă de 4 față de 1); dar când PA selectează S2, PB alege strategic s1 (pentru o recompensă de -2 față de -4); iar când PB aplică s1, PA alege strategic S1, (pentru o recompensă de 3 față de 2). Nu există nici o corespondență între cele mai bune răspunsuri. Mai degrabă jocul răspunsului cel mai bun produce un ciclu instabil între rezultatele posibile din matrice. Exemplul cu suma non-zero produce rezultate similare. Dacă PA începe cu
[Corola-publishinghouse/Science/2240_a_3565]
-
așteptate corespunzătoare opțiunilor oponentului său devin egale, astfel ca acesta să devină indiferent în raport cu aceste opțiuni. Orice altă combinație i-ar acorda unui oponent rațional șansa de a face mai multe selecții între strategiile care să-i ofere lui o recompensă mai mare și celuilalt jucător o recompensă mai mică. Astfel, strategia maximizantă este aceea care produce indiferența oponentului. Pentru un joc de două persoane cu doua opțiuni de felul celui pe care-l exemplificăm aici, formula de strategie mixtă a
[Corola-publishinghouse/Science/2240_a_3565]
-
astfel ca acesta să devină indiferent în raport cu aceste opțiuni. Orice altă combinație i-ar acorda unui oponent rațional șansa de a face mai multe selecții între strategiile care să-i ofere lui o recompensă mai mare și celuilalt jucător o recompensă mai mică. Astfel, strategia maximizantă este aceea care produce indiferența oponentului. Pentru un joc de două persoane cu doua opțiuni de felul celui pe care-l exemplificăm aici, formula de strategie mixtă a lui PA este: p(S1s1) + (1-p)(S2s1
[Corola-publishinghouse/Science/2240_a_3565]
-
așteptată pentru opțiunile lui PA este egală. Această combinație de strategii mixte - jucătorul A (S1 1/2 ; S2 1/2) și jucătorul B (s1 3/4; s2 1/4 ) - este perfect stabilă. Nici unul dintre jucători nu poate să-și îmbunătățească recompensele pe care le obține cu strategia sa mixtă dacă și-ar schimba comportamentul în mod unilateral. Fiecare furnizează cel mai bun răspuns la strategia celuilalt. Astfel, aceasta constituie de asemenea un echilibru Nash, chiar dacă într-o formă mult mai complicată
[Corola-publishinghouse/Science/2240_a_3565]
-
singur joc, o soluție mixtă nu-i va fi de prea mare ajutor. Deseori situația se complică și mai mult deoarece există incertitudine față de ce strategii vor adopta jucătorii: echilibrul Nash pur sau mixt? Să ne imaginăm următoarea matrice de recompense - o versiune a jocului cunoscut sub numele de „Lașul” (Chicken) Povestea asociată în mod obișnuit cu acest joc este aceea că doi șoferi foarte tineri conduc frontal unul spre altul pe un drum foarte îngust. Dacă se dau la o
[Corola-publishinghouse/Science/2240_a_3565]
-
Dar jocul acesta mai are și un echilibru de strategie mixtă. Ambii parteneri vor aplica fiecare dintre strategii jumătate din timp, și fiecare va avea astfel o utilitate așteptată de (2) 1/2. În cadrul opțiunilor de strategie mixtă toate aceste recompense posibile - inclusiv accidentul dezastruos - au șansa de apariție de 1/4. Totuși, combinația strategiilor - jucătorul A (S1 aleasă 1/2; S2 aleasă 1/2) și jucătorul B (s1 aleasă 1/2; s2 aleasă 1/2) - reprezintă punctele de cel mai
[Corola-publishinghouse/Science/2240_a_3565]
-
față de strategia ce va fi aplicată, iar acest lucru complică mult încercarea unei previziuni pentru științele sociale. (Din nou, se cere să notăm un paradox aparent, acela că un rezultat de non-echilibru S1s1 - ambii se dau deoparte - poate avea o recompensă individuală și socială netă mai mare decât unele din rezultatele de echilibru.) Un număr mare din recentele lucrări de cercetare din teoria jocurilor se ocupă de problema ridicată de faptul că există prea multe soluții, cu prea multe rezultate așteptate
[Corola-publishinghouse/Science/2240_a_3565]
-
extensivă a modelului de joc. O strategie de echilibru perfect acceptă faptul că ar putea exista mai multe soluții posibile pentru un joc, dar subliniază faptul că odată ce jocul ia o anumită direcție, anumite opțiuni (chiar și unele cu o recompensă mai mare) care se află pe o altă traiectorie, devin inaccesibile. Maximalizarea strategică se aplică astfel numai între acele opțiuni care sunt accesibile într-o anumită fază de joc. Se pot examina consecințele jocului secvențial, în care actorii decid mișcările
[Corola-publishinghouse/Science/2240_a_3565]
-
joc. Se pot examina consecințele jocului secvențial, în care actorii decid mișcările complexe pas cu pas și nu își formulează întreaga strategie de la început. Echilibrul se obține, astfel, pe secvențe. Se pot examina jocurile repetitive (așa-numitele „super-jocuri”), în care recompensele sunt o sumă a unor serii de repetări de jocuri. Jucătorii trag concluzii din consecințele acțiunilor lor trecute și își pot ajusta jocul individual sau în comun, în încercarea de a maximiza rezultatele finale. Mai pot fi examinate jocurile suprapuse
[Corola-publishinghouse/Science/2240_a_3565]
-
dezvoltă discuția cu o scurtă introducere în jocurile de n persoane. Apoi sunt prezentate aplicațiile și limitările teoriei alegerilor în cazul unui fenomen social comun, negocierea între interese aflate în opoziție, care încearcă să construiască coaliții viabile și să aloce recompense. Subiectul nostru îl constituie însumarea preferințelor actorilor în situații în care avem de-a face cu participanți strategici independenți. Mesajul acestuia este acela că însumarea preferințelor în diferite forme - inclusiv regula majorității democratice - este adesea o problemă complicată, întrucât permite
[Corola-publishinghouse/Science/2240_a_3565]
-
de n persoane cu sumă zero produce un tipar de rezultate ciclice. Orice diviziune a unităților de utilitate este posibilă, dar nici una nu este vreodată stabilă. (Anumite jocuri cu sumă non-zero produc și ele acest rezultat, în funcție de configurația specifică a recompenselor.) Limbajul folosit în analiza jocurilor de n persoane este diferit față de cel folosit pentru jocurile de două persoane. Coaliția (v) este un grup de doi sau mai mulți jucători separați, formată astfel ca puterea grupului să fie egală sau să
[Corola-publishinghouse/Science/2240_a_3565]
-
Coaliția (v) este un grup de doi sau mai mulți jucători separați, formată astfel ca puterea grupului să fie egală sau să întreacă puterea jucătorilor luați individual. O coaliție câștigătoare este o coaliție care are putere suficientă să dicteze rezultatele recompenselor pentru întreaga populație de jucători. În exemplul de mai sus, se pot constitui coaliții câștigătoare între jucătorul 1 și 2 (v12), jucătorul 2 și 3 (v23), jucătorul 1 și 3 (v13), sau între jucătorii 1, 2 și 3 (v123). Ultima
[Corola-publishinghouse/Science/2240_a_3565]
-
v12), jucătorul 2 și 3 (v23), jucătorul 1 și 3 (v13), sau între jucătorii 1, 2 și 3 (v123). Ultima dintre acestea se numește „coaliția mare” deoarece este compusă din toți jucătorii. Atribuirea este numele dat oricărei diviziuni posibile de recompense între jucători și coalițiile lor. Nu toate atribuirile posibile vor fi obținute în mod rațional în cadrul unui joc, nu toate atribuirile realizabile sunt stabile. În exemplul de mai sus orice rezultat al unei coaliții de două persoane este o atribuire
[Corola-publishinghouse/Science/2240_a_3565]
-
câștigătoare plauzibile la care se poate afilia un jucător și al schimbării marginale din rezultatul coaliției în cazul când jucătorul se afiliază sau părăsește o coaliție câștigătoare. Valoarea Shapley reflectă în mod corect puterea teoretică a fiecărui jucător și alocă recompense în mod „echitabil” direct proporțional cu puterea respectivă. Totuși, aceasta se calculează în totalitate cu ajutorul structurii formale a jocului, și nu cu cel al jocului strategic din cadrul acelei structuri. Nu există nici un motiv să se creadă că competitorii prezenți vor
[Corola-publishinghouse/Science/2240_a_3565]
-
a) acesta este formatul general de alegeri și strategii cu care se confruntă jucătorii într-o situație comună S, și b) acesta este modul în care ar trebui să se desfășoare jocul, să se stabilească rezultatele și să se aloce recompensele în cadrul formatului general propriu lui S. Trebuie considerate importante rezultatele cu privire la (a), chiar dacă cele privind pe (b) nu sunt deocamdată posibile. În plus, un cercetător cu imaginație poate uneori să încerce să umple golurile. Cu toate că este posibil să nu reușim
[Corola-publishinghouse/Science/2240_a_3565]
-
lor, cu sacrificiul creșterii economice a țărilor care sunt dependente din punct de vedere al energiei. Similară este și situația unui birocrat corupt care își folosește poziția sa oficială ca să blocheze contractele de construcție în cazul în care nu primește recompense în bani lichizi. În mod echivalent, există și situația inversă, cea a sistemului monopsonist relativ, caracterizat de un număr mic de cumpărători de bunuri oferite de mulți furnizori. Cu ajutorul controlului asupra cantității cerute, un jucător oarecare poate crea amenințarea unui
[Corola-publishinghouse/Science/2240_a_3565]
-
mod similar, teoria negocierilor are tendința să sublinieze importanța răbdării. În negocieri, timpul este o variabilă importantă. O persoană înfometată va fi gata să accepte aproape orice, dar o persoană înstărită va putea amâna, cu costuri mult mai mici, obținerea recompensei. Un guvern care este sub presiunea de a plăti un împrumut trebuie să facă repede compromisuri; un guvern solid din punct de vedere financiar se poate folosi de amânări ca să obțină aranjamente mai bune. Toate celelalte rămânând neschimbate, cei puternici
[Corola-publishinghouse/Science/2240_a_3565]
-
în 291, 289 și 20. Să ne imaginăm, de exemplu, că grupul A și C se vor alia. Ca individ, aș prefera, desigur, să fiu membru al grupului C. Acesta are putere egală cu celelalte grupuri, dar își va distribui recompensele între un număr mult mai mic de membri. Unii jucători vor părăsi grupul A pentru C în mod rațional. Pe de altă parte, există anumite condiții în care este mai avantajos să fii membru al grupului A - dacă aceasta ar
[Corola-publishinghouse/Science/2240_a_3565]