Come si può prendere la migliore decisione quando più giocatori sono in ballo? E' una domanda che ha una lunga storia... ora la affronteremo come fece Sherlock Holmes, in uno dei romanzi di Conan Doyle. Holmes ha visto che il suo nemico, Moriarty, è saltato sul treno proprio nel momento in cui questo lasciava la stazione a Londra. Per fortuna, Moriarty non può cambiare carrozza. L'unica fermata prevista, prima di arrivare a Dover, è Canterbury. Qui giunti, Moriarty rimane in attesa di vedere se Holmes scende dal treno, ma può controllare solo un lato, quindi se Holmes scende dall'altro lato è salvo. Questo porta Holmes ad avere una probabilità del 50% di salvarsi. Invece, se giungessero entrambi a Dover Holmes sarebbe spacciato. Naturalmente, se Holmes riesce a scendere ad una stazione diversa da quella in cui scende Moriarty allora è salvo. In definitiva, possiamo scrivere questa tabella, che rappresenta la probabilità di salvarsi di Holmes a seconda di dove lui e Moriarty decidano di scendere:
Sia x la probabilità che Holmes scenda a Dover; y la probabilità che Moriarty scenda a Dover. Allora la vincita media di Holmes (ossia, la sua probabilità di sopravvivere) è pari a x + y/2 - (3/2)xy. La scelta ottimale per Holmes si ottiene quando x = 1/3: in tal caso, qualunque sia y, le sue probabilità di salvezza sono pari a 1/3. Viceversa, per Moriarty la strategia vincente risulta essere quella di scendere a Dover con probabilità y = 2/3. Queste due strategie sono dette maxmin, ossia garantiscono al giocatore il migliore risultato nel caso peggiore.
Se Sherlock Holmes segue questa strategia, lanciando una moneta con parità 1/3, allora anche se il suo avversario conosce la sua strategia non può agire in modo da diminuire le sue probabilità di successo. Lo stesso accade con Moriarty: la sua strategia ottimale risulta essere quella di lanciare una moneta con parità 2/3 e agire di conseguenza.
Quali sono le idee che stanno alla base di una strategia maxmin, ossia di una strategia che massimizza il peggior risultato? Sostanzialmente, che gli altri giocatori giochino in maniera perfetta, conoscendo tutte le informazioni, e che giochino "contro", ossia che il loro interesse sia opposto al nostro. Questo tipo di strategia, sviluppato da John von Neumann, si applica ai giochi a somma zero.
Sei un pollo?
L'esistenza di una strategia ottimale anche in giochi non a somma zero, in cui ossia i giocatori hanno interessi in competizione ma non completamente opposti, è un geniale contributo di John Nash nel 1950. Nash dimostra che, sotto certe condizioni, esiste sempre una situazione di equilibrio, che si ottiene quando ciascun individuo che partecipa a un dato gioco sceglie la sua mossa strategica in modo da massimizzare il suo payoff, sotto la congettura che il comportamento dei rivali non varierà a motivo della sua scelta (vuol dire che anche conoscendo la mossa dell'avversario, il giocatore non farebbe una mossa diversa da quella che ha deciso).
Consideriamo il "gioco del pollo", reso popolare nel 1954 dal film Gioventù bruciata, con James Dean. Due ragazzi (Jim e Buzz) si lanciano in una gara, uno in faccia all'altro, su una strada stretta; il primo che sterza paga all'altro 100 dollari (e inoltre perde la faccia con la sua banda, che lo tratterà da pollo, appunto). Questo non è un gioco a somma nulla, in quanto entrambi i giocatori hanno interesse a evitare lo scontro, che costerebbe, a ognuno, diciamo 1000 dollari: il prezzo del dottore. I valori del gioco, dal punto di vista di Jim, sono:
Sterzando, Jim massimizza il suo peggiore guadagno; lo stesso per Buzz: dobbiamo quindi supporre che entrambi sterzeranno? No, ovviamente. Se indichiamo con x e y le probabilità con cui Jim e Buzz, rispettivamente, accelerano, si ottiene che la vincita attesa di Jim è -1000xy+100x-100y, per cui la strategia ottimale per entrambi è di accelerare con probabilità 1/10 e di ritirarsi con probabilità 9/10.
Uno dei principali problemi del concetto di strategia di equilibrio di Nash è che è instabile. Finché sono sicuro di giocare contro un avversario razionale non mi conviene cambiare strategia. Ma se so che Buzz è uno psicopatico che sicuramente non sterza, allora conviene (da un punto di vista di payoff) ritirarsi. In generale, non ci sono ragioni di seguire unilateralmente la strategia di Nash.


Nessun commento:
Posta un commento