Your SlideShare is downloading. ×
Introdução teoria dos jogos
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Saving this for later?

Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime - even offline.

Text the download link to your phone

Standard text messaging rates apply

Introdução teoria dos jogos

628
views

Published on

Published in: Education

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
628
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
9
Comments
0
Likes
1
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Uma Introdução a Teoria dos Jogos Brígida Alexandre Sartini, Gilmar Garbugio, Humberto José Bortolossi Polyane Alves Santos e Larissa Santana Barreto II Bienal da SBM Universidade Federal da Bahia 25 a 29 de outubro de 2004
  • 2. ´ Sumario 1 Descri¸˜o informal da teoria dos jogos ca 1 1.1 Introdu¸˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . ca 1 1.2 Hist´ria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o 2 1.3 O que ´ um jogo? . . . . . . . . . . . . . . . . . . . . . . . . e 4 1.4 Solu¸˜es de um jogo . . . . . . . . . . . . . . . . . . . . . . co 8 1.5 Estrat´gias mistas . . . . . . . . . . . . . . . . . . . . . . . . e 12 1.6 Solu¸˜es em estrat´gias mistas . . . . . . . . . . . . . . . . . co e 15 1.7 Existˆncia de solu¸˜es . . . . . . . . . . . . . . . . . . . . . e co 23 2 O teorema minimax de von Neumann 24 2.1 Jogos de soma constante com dois jogadores . . . . . . . . . 24 2.2 Equil´ ıbrio de Nash em estrat´gias puras . . . . . . . . . . . . e 26 2.3 Equil´ ıbrio de Nash em estrat´gias mistas . . . . . . . . . . . e 29 2.4 O teorema minimax de von Neumann . . . . . . . . . . . . . 31 3 O teorema de equil´ ıbrio de Nash 38 4 A forma extensa de um jogo 49 4.1 Representa¸˜o de um jogo via alfabetos e arvores . . . . . . ca ´ 49 4.2 Convers˜o entre as formas normal e extensa . . . . . . . . . a 58 Bibliografia 61
  • 3. Cap´ ıtulo 1 Descri¸˜o informal da teoria dos jogos ca 1.1 Introdu¸˜o ca A teoria dos jogos ´ uma teoria matem´tica criada para se modelar e a fenˆmenos que podem ser observados quando dois ou mais “agentes de deo cis˜o” interagem entre si. Ela fornece a linguagem para a descri¸˜o de procesa ca sos de decis˜o conscientes e objetivos envolvendo mais do que um indiv´ a ıduo. A teoria dos jogos ´ usada para se estudar assuntos tais como elei¸˜es, e co leil˜es, balan¸a de poder, evolu¸˜o gen´tica, etc. Ela ´ tamb´m uma teoria o c ca e e e matem´tica pura, que pode e tem sido estudada como tal, sem a necessidade a de relacion´-la com problemas comportamentais ou jogos per se. a Algumas pessoas acreditam que a teoria dos jogos formar´ em algum dia a o alicerce de um conhecimento t´cnico estrito de como decis˜es s˜o feitas e de e o a como a economia funciona. O desenvolvimento da teoria ainda n˜o atingiu a este patamar e, hoje, a teoria dos jogos ´ mais estudada em seus aspectos e matem´ticos puros e, em aplica¸˜es, ela ´ usada como uma ferramenta ou a co e alegoria que auxiliam no entendimento de sistemas mais complicados. Neste texto trataremos da Teoria Econˆmica dos Jogos, que n˜o deve ser o a confundida com a Teoria Combinat´ria dos Jogos [4, 11, 5, 2, 6, 7], iniciada o por Sprague [20] e Grundy na d´cada de 30. Enquanto que a primeira tem e motiva¸˜es predominante econˆmicas e procura estabelecer m´todos para co o e se maximizar o ganho (payoff ), a segunda se concentra nos aspectos combinat´rios de jogos de mesa (por exemplo, ser o jogador a fazer o ultimo o ´
  • 4. 2 II Bienal da Sociedade Brasileira de Matem´tica a movimento em um jogo de nim [1]) e n˜o permite “elementos imprevis´ a ıveis” como o lan¸amento de um dado ou o baralhamento de cartas. c 1.2 Hist´ria o Registros antigos sobre teoria dos jogos remontam ao s´culo XVIII. Em e correspondˆncia dirigida a Nicolas Bernoulli, James Waldegrave analisa um e jogo de cartas chamado “le Her ” e fornece uma solu¸˜o que ´ um equil´ ca e ıbrio de estrat´gia mista (conceito que nos familiarizaremos posteriormente). Cone tudo, Waldegrave n˜o estendeu sua abordagem para uma teoria geral. No a in´ do s´culo XIX, temos o famoso trabalho de Augustin Cournot sobre ıcio e duop´lio [3]. Em 1913, Ernst Zermelo publicou o primeiro teorema mao tem´tico da teoria dos jogos [21], o teorema afirma que o jogo de xadrez ´ a e estritamente determinado, isto ´, em cada est´gio do jogo pelo menos um dos e a jogadores tem uma estrat´gia em m˜o que lhe dar´ a vit´ria ou conduzir´ e a a o a o jogo ao empate. Outro grande matem´tico que se interessou em jogos foi a Emile Borel, que reinventou as solu¸˜es minimax e publicou quatro artigos co sobre jogos estrat´gicos. Ele achava que a guerra e a economia podiam ser e estudadas de uma maneira semelhante. Figura 1.1: Ernst Zermelo. Em seu in´ ıcio, a teoria dos jogos chamou pouca aten¸˜o. O grande maca tem´tico John von Neumann mudou esta situa¸˜o. Em 1928, ele demonstrou a ca que todo jogo finito de soma zero com duas pessoas possui uma solu¸˜o em ca
  • 5. Descri¸˜o informal da teoria dos jogos ca estrat´gias mistas [18]. A demonstra¸˜o original usava topologia e an´lise e ca a Figura 1.2: John von Neumann. funcional e era muito complicada de se acompanhar. Em 1937, ele forneceu uma nova demonstra¸˜o baseada no teorema do ponto fixo de Brouwer. ca John von Neumann, que trabalhava em muitas areas da ciˆncia, mostrou in´ e teresse em economia e, junto com o economista Oscar Morgenstern, publicou o cl´ssico “The Theory of Games and Economic Behaviour ” [19] em 1944 e, a com isto, a teoria dos jogos invadiu a economia e a matem´tica aplicada. a Figura 1.3: Oscar Morgenstern. Em 1950, o matem´tico John Forbes Nash J´nior publicou quatro artigos a u importantes para a teoria dos jogos n˜o-cooperativos e para a teoria de bara ganha. Em “Equilibrium Points in n-Person Games” [14] e “Non-cooperative 3
  • 6. 4 II Bienal da Sociedade Brasileira de Matem´tica a Games” [16], Nash provou a existˆncia de um equil´ e ıbrio de estrat´gias mistas e para jogos n˜o-cooperativos, denominado equil´brio de Nash, e sugeriu uma a ı abordagem de estudo de jogos cooperativos a partir de sua redu¸˜o para a ca forma n˜o-cooperativa. Nos artigos “The Bargaining Problem” [15] e “Twoa Person Cooperative Games” [17], ele criou a teoria de barganha e provou a existˆncia de solu¸˜o para o problema da barganha de Nash. e ca Figura 1.4: John Forbes Nash. Em 1994, John Forbes Nash Jr. (Universidade de Princeton), John Harsanyi Universidade de Berkeley, California) e Reinhard Selten (Universidade de Bonn, Alemanha) receberam o prˆmio Nobel por suas contribui¸˜es para e co a Teoria dos Jogos. 1.3 O que ´ um jogo? e A teoria dos jogos pode ser definida como a teoria dos modelos matem´ticos que estuda a escolha de decis˜es ´timas sob condi¸˜es de conflito. a o o co O elemento b´sico em um jogo ´ o conjunto de jogadores que dele particia e pam. Cada jogador tem um conjunto de estrat´gias. Quando cada jogador e escolhe sua estrat´gia, temos ent˜o uma situa¸˜o ou perfil no espa¸o de todas e a ca c as situa¸˜es (perfis) poss´ co ıveis. Cada jogador tem interesse ou preferˆncias e para cada situa¸˜o no jogo. Em termos matem´ticos, cada jogador tem uma ca a
  • 7. Descri¸˜o informal da teoria dos jogos ca Figura 1.5: John Harsanyi. Figura 1.6: Reinhart Selten. 5
  • 8. 6 II Bienal da Sociedade Brasileira de Matem´tica a fun¸˜o utilidade que atribui um n´mero real (o ganho ou payoff do jogador) ca u a cada situa¸˜o do jogo. ca Mais especificamente, um jogo tem os seguintes elementos b´sicos: existe a um conjunto finito de jogadores, representado por G = {g1 , g2 , . . . , gn }. Cada jogador gi ∈ G possui um conjunto finito Si = {si1 , si2 , . . . , simi } de op¸˜es, denominadas estrat´gias puras do jogador gi (mi ≥ 2). Um veco e e e tor s = (s1j1 , s2j2 , . . . , snjn ), onde siji ´ uma estrat´gia pura para o jogador e e gi ∈ G, ´ denominado um perfil de estrat´gia pura. O conjunto de todos os perfis de estrat´gia pura formam, portanto, o produto cartesiano e n Si = S1 × S 2 × · · · × S n , S= i=1 denominado espa¸o de estrat´gia pura do jogo. Para jogador gi ∈ G, existe c e uma fun¸˜o utilidade ca ui : S → R s → ui (s) e que associa o ganho (payoff) ui (s) do jogador gi a cada perfil de estrat´gia pura s ∈ S. Exemplo 1.1 (O dilema do prisioneiro) Possivelmente o exemplo mais conhecido na teoria dos jogos ´ o dilema do prisioneiro. Ele foi formulado por e Albert W. Tucker em 1950, em um semin´rio para psic´logos na Universidade a o de Stanford, para ilustrar a dificuldade de se analisar certos tipos de jogos. A situa¸˜o ´ a seguinte: dois ladr˜es, Al e Bob, s˜o capturados e acusados ca e o a de um mesmo crime. Presos em selas separadas e sem poderem se comunicar entre si, o delegado de plant˜o faz seguinte proposta: cada um pode escolher a entre confessar ou negar o crime. Se nenhum deles confessar, ambos ser˜o a submetidos a uma pena de 1 ano. Se os dois confessarem, ent˜o ambos ter˜o a a pena de 5 anos. Mas se um confessar e o outro negar, ent˜o o que confessou a ser´ libertado e o outro ser´ condenado a 10 anos de pris˜o. Neste contexto, a a a temos G = {Al, Bob}, SAl = {confessar, negar}, SBob = {confessar, negar}, S = {(confessar, confessar), (confessar, negar), (negar, confessar), (negar, negar)}. As duas fun¸˜es utilidade co
  • 9. Descri¸˜o informal da teoria dos jogos ca uAl : S → R 7 e uBob : S → R s˜o dadas por a uAl (confessar, confessar) = −5, uAl (negar, confessar) = −10, uAl (confessar, negar) = 0, uAl (negar, negar) = −1, (que representam os ganhos (payoffs) de Al) e uBob (confessar, confessar) = −5, uBob (negar, confessar) = 0, uBob (confessar, negar) = −10, uBob (negar, negar) = −1 ´ (que representam os ganhos (payoffs) de Bob). E uma pr´tica se represena tar os payoffs dos jogadores atrav´s de uma matriz, denominada matriz de e payoffs. Bob confessar confessar (−5, −5) (0, −10) negar Al negar (−10, 0) (−1, −1) Nesta matriz, os n´meros de cada c´lula representam, respectivamente, os u e payoffs de Al e Bob para as escolhas de Al e Bob correspondentes a c´lula. e Exemplo 1.2 (A batalha dos sexos) Um homem e a sua mulher desejam sair para passear. O homem prefere assistir a um jogo de futebol enquanto que sua mulher prefere ir ao cinema. Se eles forem juntos para o futebol, ent˜o o homem tem satisfa¸˜o maior do que a mulher. Por outro a ca lado, se eles forem juntos ao cinema, ent˜o a mulher tem satisfa¸˜o maior a ca do que o homem. Finalmente, se eles sa´ ırem sozinhos, ent˜o ambos ficam a igualmente insatisfeitos. Esta situa¸˜o tamb´m pode ser modelada como um ca e jogo estrat´gico. Temos: e G = {homem, mulher}, Shomem = {futebol, cinema}, Smulher = {futebol, cinema}, S = {(futebol, futebol), (futebol, cinema), (cinema, futebol), (cinema, cinema)}. a As duas fun¸˜es utilidade uhomem : S → R e umulher : S → R s˜o descritas co pela seguinte matriz de payoffs:
  • 10. 8 II Bienal da Sociedade Brasileira de Matem´tica a Mulher futebol 1.4 futebol (10, 5) (0, 0) cinema Homem cinema (0, 0) (5, 10) Solu¸˜es de um jogo co Uma solu¸˜o de um jogo ´ uma prescri¸˜o ou previs˜o sobre o resultado ca e ca a do jogo. Existem v´rios conceitos diferentes de solu¸˜o. Nesta se¸˜o, invesa ca ca tigaremos os dois conceitos mais comuns: dominˆncia e equil´brio de Nash. a ı Considere o dilema do prisioneiro. Como encontrar uma solu¸˜o para o ca dilema de Bob e Al, isto ´, que estrat´gias s˜o plaus´ e e a ıveis se os dois prisioneiros 1 querem minimizar o tempo de cadeia? Se analisarmos o jogo do ponto de vista de Al, ele pode raciocinar da seguinte maneira: “Duas coisas podem acontecer: Bob pode confessar ou Bob pode negar. Se Bob confessar, ent˜o ´ melhor para mim confessar tamb´m. a e e Se Bob n˜o confessar, ent˜o eu fico livre se eu confessar. Em a a qualquer um dos casos, ´ melhor para mim confessar. Ent˜o, eu e a confessarei.” Se analisarmos agora o jogo do ponto de vista de Bob, podemos aplicar a mesma linha de racioc´ ınio e concluir que Bob tamb´m ir´ confessar. Assim, e a ambos confessar˜o e ficar˜o presos por 5 anos. a a Em termos da teoria dos jogos, dizemos que os dois jogadores possuem uma estrat´gia dominante, isto ´, todas menos uma estrat´gia ´ estritamente e e e e dominada, que o jogo ´ resol´vel por dominˆncia estrita iterada e que o e u a jogo termina em uma solu¸˜o que ´ um equil´brio de estrat´gia dominante, ca e ı e conceitos que definiremos a seguir. 1 No exemplo 1.1, os payoffs foram definidos como n´meros ≤ 0. Desta maneira, minimizar o tempo de u cadeia ´ equivalente a maximizar o payoff. e
  • 11. Descri¸˜o informal da teoria dos jogos ca 9 Dominˆncia a Freq¨entemente, iremos discutir perfis de estrat´gia na qual apenas a u e a e estrat´gia de um unico jogador gi ∈ G ir´ variar, enquanto que as estrat´gias e ´ de seus oponentes permanecer˜o fixas. Denote por a s−i = (s1j1 , . . . , s(i−1)ji−1 , s(i+1)ji+1 , . . . , snjn ) ∈ S−i = S1 × · · · × Si−1 × Si+1 × · · · × Sn uma escolha de estrat´gia para todos os jogadores, menos o jogador gi . Desta e maneira, um perfil de estrat´gia pode ser convenientemente denotado por e s = (siji , s−i ) = (s1j1 , . . . , s(i−1)ji−1 , siji , s(i+1)ji+1 , . . . , snjn ). ´ Defini¸˜o 1.1 (Estrategia Pura Estritamente Dominada) ca Uma estrat´gia pura sik ∈ Si do jogador gi ∈ G ´ estritamente doe e minada pela estrat´gia sik ∈ Si se e ui (sik , s−i ) > ui (sik , s−i ), para todo s−i ∈ S−i . A estrat´gia sik ∈ Si ´ fracamente dominada pela e e estrat´gia sik ∈ Si se ui (sik , s−i ) ≥ ui (sik , s−i ), para todo s−i ∈ S−i . e Dominˆncia estrita iterada nada mais ´ do um processo onde se eliminam a e as estrat´gias que s˜o estritamente dominadas. e a Exemplo 1.3 Considere o jogo determinado pela matriz de payoffs abaixo. g2 s21 s22 s23 s24 s11 (5, 2) (2, 6) (1, 4) (0, 4) g1 s12 (0, 0) (3, 2) (2, 1) (1, 1) s13 (7, 0) (2, 2) (1, 1) (5, 1) s14 (9, 5) (1, 3) (0, 2) (4, 8)
  • 12. 10 II Bienal da Sociedade Brasileira de Matem´tica a Neste jogo, para o jogador g2 , a estrat´gia s21 ´ estritamente dominada pela e e estrat´gia s24 , assim, a primeira coluna da matriz pode ser eliminada. e s22 g2 s23 s24 s11 (2, 6) (1, 4) (0, 4) g1 s12 (3, 2) (2, 1) (1, 1) s13 (2, 2) (1, 1) (5, 1) s14 (1, 3) (0, 2) (4, 8) Agora, nesta matriz reduzida, para o jogador g1 , as estrat´gias s11 e s14 s˜o e a estritamente dominadas pelas estrat´gias s12 e s13 , respectivamente. Pore tanto, as linhas 1 e 4 podem ser eliminadas. Al´m disso, a estrat´gia s23 do e e e e jogador g2 ´ estritamente dominada pelas estrat´gia s22 . Assim, a coluna 2 tamb´m pode ser eliminada. Obtemos ent˜o uma matriz reduzida 2 × 2. e a g2 s22 s12 (3, 2) (1, 1) s13 g1 s24 (2, 2) (5, 1) Finalmente, a estrat´gia s24 do jogador g2 ´ estritamente dominada pela e e e estrat´gia s22 e, na matriz 2 × 1 resultante, a estrat´gia s13 do jogador g1 e ´ estritamente dominada pela estrat´gia s12 . Vemos ent˜o que o resultado e e a e do jogo ´ (3, 2), isto ´, o jogador g1 escolhe a estrat´gia s12 e o jogador g2 e e escolhe a estrat´gia s22 . e No exemplo acima, a t´cnica de dominˆncia estrita iterada forneceu um e a unico perfil de estrat´gia como solu¸˜o do jogo, no caso, o perfil ´ e ca (s12 , s22 ).
  • 13. Descri¸˜o informal da teoria dos jogos ca 11 Contudo, pode acontecer da t´cnica fornecer v´rios perfis ou, at´ mesmo, e a e fornecer todo o espa¸o de estrat´gia, como ´ o caso da batalha dos sexos, c e e onde n˜o existem estrat´gias estritamente dominadas. a e Solu¸˜o estrat´gica ou equil´ ca e ıbrio de Nash Uma solu¸ao estrat´gica ou equil´brio de Nash de um jogo ´ um ponto c˜ e ı e onde cada jogador n˜o tem incentivo de mudar sua estrat´gia se os demais a e jogadores n˜o o fizerem. a Defini¸˜o 1.2 (Equil´ ca ıbrio de Nash) Dizemos que um perfil de estrat´gia e s∗ = (s∗ , . . . , s∗ , s∗ , s∗ , . . . , s∗ ) ∈ S 1 n (i−1) i (i+1) ´ um equil´brio de Nash se e ı ui (s∗ , s∗ ) ≥ ui (siji , s∗ ) i −i −i para todo i = 1, . . . , n e para todo ji = 1, . . . , mi , com mi ≥ 2. Exemplo 1.4 (a) No dilema do prisioneiro (exemplo 1.1), o perfil de estrat´gia (confessar, e confessar) ´ um equil´ e ıbrio de Nash. De fato: se um prisioneiro confessar e o outro n˜o, aquele que n˜o confessou fica preso na cadeia 10 anos, ao a a inv´s de 5 anos, se tivesse confessado. Al´m desse perfil, n˜o existem e e a outros equil´ ıbrios de Nash. (b) Na batalha dos sexos (exemplo 1.2), os perfis de estrat´gia (futebol, e futebol) e (cinema, cinema) s˜o os unicos equil´ a ´ ıbrios de Nash do jogo. (c) No exemplo 1.3, o unico equil´ ´ ıbrio de Nash do jogo ´ o perfil de ese trat´gia (s12 , s22 ). e (d) Existem jogos que n˜o possuem equil´ a ıbrios de Nash em estrat´gias puras. e Este ´ o caso do jogo de combinar moedas (matching pennies). Nesse e jogo, dois jogadores exibem, ao mesmo tempo, a moeda que cada um esconde em sua m˜o. Se ambas as moedas apresentam cara ou coroa, a o segundo jogador d´ sua moeda para o primeiro. Se uma das moedas a
  • 14. 12 II Bienal da Sociedade Brasileira de Matem´tica a apresenta cara, enquanto a outra apresenta coroa, ´ a vez do primeiro e jogador dar sua moeda pra o segundo. Esse jogo se encontra representado por sua matriz de payoffs dada abaixo. g2 s21 g1 s22 s11 (+1, −1) (−1, +1) s12 (−1, +1) (+1, −1) 1.5 Estrat´gias mistas e Como vimos no jogo de combinar de moedas do exemplo 1.4 (d) acima, existem jogos que n˜o possuem equil´ a ıbrios de Nash em estrat´gias puras. e Uma alternativa para estes casos ´ a de considerar o jogo do ponto de vista e probabil´ ıstico, isto ´, ao inv´s de escolher um perfil de estrat´gia pura, o e e e jogador deve escolher uma distribui¸˜o de probabilidade sobre suas estrat´gias ca e puras. e ca Uma estrat´gia mista pi para o jogador gi ∈ G ´ uma distribui¸˜o de e e e probabilidades sobre o conjunto Si de estrat´gias puras do jogador, isto ´, e pi ´ um elemento do conjunto ∆ mi = (x1 , . . . , xmi ) ∈ R mi mi | x1 ≥ 0, . . . , xmi ≥ 0 e xk = 1 . k=1 a Assim, se pi = (pi1 , pi2 , . . . , pimi ), ent˜o mi pi1 ≥ 0, pi2 ≥ 0, ..., pimi ≥ 0 e pik = 1. k=1 Note que cada ∆mi ´ um conjunto compacto e convexo. Nas figuras 1.7 e e 1.8 temos os desenhos de ∆2 e ∆3 , respectivamente. Os pontos extremos e (v´rtices) de ∆mi , isto ´, os pontos da forma e e1 = (1, 0, . . . , 0, 0), e2 = (0, 1, . . . , 0, 0), ..., emi = (0, 0, . . . , 0, 1)
  • 15. Descri¸˜o informal da teoria dos jogos ca 13 d˜o, respectivamente, probabilidade 1 as estrat´gias puras si1 , si2 , . . . , simi . a ` e Desta maneira, podemos considerar a distribui¸˜o de probabilidade ek como ca a estrat´gia mista que representa a estrat´gia pura sik do jogador gi . e e x2 1 0 1 x1 Figura 1.7: ∆2 = {(x1 , x2 ) ∈ R2 | x1 ≥ 0, x2 ≥ 0 e x1 + x2 = 1}. O espa¸o de todos os perfis de estrat´gia mista ´ o produto cartesiano c e e ∆ = ∆m1 × ∆m2 × · · · × ∆mn , denominado espa¸o de estrat´gia mista. Um vetor p ∈ ∆ ´ denominado c e e um perfil de estrat´gia mista. Como no caso de estrat´gias puras, usaremos e e e a nota¸˜o p−i para representar as estrat´gias de todos os jogadores, com ca exce¸˜o do jogador gi . ca Como o produto cartesiano de conjuntos compactos e convexos ´ compacto e e convexo, vemos que ∆ ´ compacto e convexo. e Cada perfil de estrat´gia mista p = (p1 , . . . , pn ) ∈ ∆ determina um payoff e esperado, uma m´dia dos payoffs ponderada pelas distribui¸˜es de probabie co lidades p1 , . . . , pn . Mais precisamente, se p = (p1 , p2 , . . . , pn ) = (p11 , p12 , . . . , p1m1 ; p21 , p22 , . . . , p2m2 ; . . . ; pn1 , pn2 , . . . , pnmn ), p1 ent˜o a p2 pn
  • 16. 14 II Bienal da Sociedade Brasileira de Matem´tica a x3 1 0 1 x2 1 x1 Figura 1.8: ∆3 = {(x1 , x2 , x3 ) ∈ R3 | x1 ≥ 0, x2 ≥ 0, x3 ≥ 0 e x1 + x2 + x3 = 1}. m1 mn m2 n ··· ui (p) = j1 =1 j2 =1 pkjk ui (s1j1 , s2j2 , . . . , snjn ) . jn =1 k=1 ca Assim, no item (d) do exemplo 1.4, se g1 escolhe a distribui¸˜o de probaca bilidade p1 = (1/4, 3/4) e g2 escolhe a distribui¸˜o de probabilidade p2 = (1/3, 2/3), ent˜o os payoffs esperados associados ao perfil de estrat´gia mista a e a p = (p1 , p2 ) = (1/4, 3/4; 1/3, 2/3) s˜o dados por 2 2 2 u1 (p) = pkjk u1 (s1j1 , s2j2 ) j1 =1 j2 =1 k=1 = p11 p21 u1 (s11 , s21 ) + p22 u1 (s11 , s22 ) + p12 p21 u1 (s12 , s21 ) + p22 u1 (s12 , s22 ) = 1 4 2 3 1 (+1) + (−1) + 3 3 4 2 1 (−1) + (+1) 3 3 = + 1 6
  • 17. Descri¸˜o informal da teoria dos jogos ca 15 e, analogamente, 2 2 2 u2 (p) = pkjk u2 (s1j1 , s2j2 ) j1 =1 j2 =1 k=1 = p11 p21 u2 (s11 , s21 ) + p22 u2 (s11 , s22 ) + = p12 p21 u2 (s12 , s21 ) + p22 u2 (s12 , s22 ) = 1.6 1 2 3 (−1) + (+1) + 3 3 4 1 4 1 2 (+1) + (−1) 3 3 1 = − . 6 Solu¸oes em estrat´gias mistas c˜ e Todos os crit´rios b´sicos para solu¸˜es de jogos em estrat´gias puras e a co e podem ser estendidos para estrat´gias mistas. e Dominˆncia estrita iterada a (0) ˆ Defini¸˜o 1.3 (Dominancia estrita iterada) Sejam Si ca (0) ∆mi = ∆mi . Defina, recursivamente, (n) Si (n−1) = {s ∈ Si = Si e | p ∈ ∆(n−1) tal que mi (n−1) ∀s−i ∈ S−1 , ui (p, s−i ) > ui (s, s−i )} e ∆(n) = {p = (p1 , . . . , pmi ) ∈ ∆mi | mi (n) ∀k = 1, . . . , mi , pk > 0 somente se sik ∈ Si }, onde, por abuso de nota¸˜o, ui (p, s−i ) representa o payoff esperado ca e quando o jogador gi escolhe a estrat´gia mista p e os demais jogadores escolhem as estrat´gias mistas correspondentes as estrat´gias puras e e ca dadas por s−i . A interse¸˜o
  • 18. 16 II Bienal da Sociedade Brasileira de Matem´tica a Si∞ ∞ = n=0 (n) Si ´ o conjunto de estrat´gias puras e e e ∆∞i = {p ∈ ∆mi | m (∞) p ∈ ∆mi tal que ∀s−i ∈ S−i , ui (p , s−i ) > ui (p, si )} ´ o conjunto de todas as estrat´gias mistas do jogador gi que sobrevie e veram a t´cnica de dominˆncia estrita iterada. e a Equil´ ıbrio de Nash Defini¸˜o 1.4 (Equil´ ca ıbrio de Nash) Dizemos que um perfil de estrat´gia mista e p∗ = (p∗ , p∗ , . . . , p∗ ) ∈ ∆ = ∆m1 × ∆m2 × · · · × ∆mn 1 2 n ´ um equil´brio de Nash se e ı ui (p∗ , p∗ ) ≥ ui (p, p∗ ) i −i −i para todo p ∈ ∆mi , isto ´, nenhum jogador sente motiva¸˜o de trocar e ca sua estrat´gia mista se os demais jogadores n˜o o fizerem. e a Exemplo 1.5 (a) No dilema do prisioneiro (exemplo 1.1), o perfil de estrat´gia mista e p∗ = (p∗ , p∗ ) = (1, 0; 1, 0) 1 2 ´ um equil´ e ıbrio de Nash, pois u1 (p, p∗ ) = u1 (p, 1 − p; 1, 0) = 5p − 10 ≤ −5 = u1 (1, 0; 1, 0) = u1 (p∗ , p∗ ) 2 1 2 para todo p = (p, 1 − p) ∈ ∆2 e u2 (p∗ , q) = u2 (1, 0; q, 1 − q) = 5q − 10 ≤ −5 = u2 (1, 0; 1, 0) = u2 (p∗ , p∗ ) 1 1 2
  • 19. Descri¸˜o informal da teoria dos jogos ca 17 para todo q = (q, 1−q) ∈ ∆2 . Observe que este equil´ ıbrio corresponde ao ∗ equil´ ıbrio em estrat´gias puras s = (confessar, confessar). Mostraremos e mais adiante que este ´ o unico equil´ e ´ ıbrio de Nash em estrat´gias mistas e do jogo. (b) Na batalha dos sexos (exemplo 1.2), os equil´ ıbrios de Nash em estrat´gias e mistas s˜o a (1, 0; 1, 0) e (0, 1; 0, 1), correspondentes aos equil´ ıbrios de Nash em estrat´gias puras (futebol, e futebol) e (cinema, cinema), respectivamente, ´ o ponto e (2/3, 1/3; 1/3, 2/3). Mostraremos mais adiante que estes s˜o os unicos equil´ a ´ ıbrios de Nash em estrat´gias mistas do jogo. e (c) No exemplo 1.3, o unico equil´ ´ ıbrio de Nash em estrat´gia mista ´ o ponto e e (0, 1, 0, 0; 0, 1, 0, 0) e que corresponde ao equil´ ıbrio de Nash (s12 , s22 ) em estrat´gias puras. (d) No jogo de combinar de moedas do exemplo 1.4 (d), o unico equil´ ´ ıbrio de Nash em estrat´gias mistas ´ o ponto e e (1/2, 1/2; 1/2, 1/2). Exemplo 1.6 O chefe de uma empresa de computa¸˜o desconfia que seu ca operador de computadores est´ usando o tempo de servi¸o para “bater papo” a c na internet. Se o operador trabalha corretamente, ele gasta g em esfor¸o e c produz um lucro bruto de v unidades. O chefe, por sua vez, pode fiscalizar ou n˜o o trabalho do operador. Fiscalizar custa h unidades para a empresa. a Se o operador for pego “batendo papo” na internet, ele perde o seu sal´rio a de w unidades. Para limitar o n´mero de casos a considerar, vamos assumir u que v > w > g > h > 0. Os dois jogadores escolhem suas estrat´gias e simultaneamente.
  • 20. 18 II Bienal da Sociedade Brasileira de Matem´tica a empregado n˜o trabalhar a fiscalizar (−h, 0) (v − w − h, w − g) n˜o fiscalizar a chefe trabalhar (−w, w) (v − w, w − g) Observe que este jogo n˜o possui equil´ a ıbrio de Nash em estrat´gias puras e, e como ele deve se repetir em cada dia util de trabalho, n˜o ´ sensato escolher ´ a e sempre a mesma estrat´gia pura para todos os dias. A solu¸˜o, neste caso, ´ e ca e escolher entre as estrat´gias puras a cada dia seguindo uma distribui¸˜o de e ca probabilidades. De fato, se v = 5, w = 4, g = 3 e h = 2, ent˜o o ponto a (3/4, 1/4; 1/2, 1/2) ´ um equil´ e ıbrio de Nash em estrat´gias mistas. Isto significa que o chefe e deve escolher sua estrat´gia de acordo com um gerador de n´meros aleat´rios e u o com distribui¸˜o de probabilidade (3/4, 1/4) e o operador deve escolher sua ca estrat´gia de acordo com um gerador de n´meros aleat´rios com distribui¸˜o e u o ca de probabilidade (1/2, 1/2). Isto pode ser feito, por exemplo, com as duas “rodas da fortuna” da figura 1.9. Fiscalizar Trabalhar Não fiscalizar chefe Não trabalhar empregado Figura 1.9: Distribui¸˜es de probabilidade que constituem um equil´ co ıbrio de Nash para o jogo do exemplo 1.6. ´ Exemplo 1.7 (A tragedia dos comuns) Considere uma vila, onde cada um dos n fazendeiros tem a op¸˜o de manter ou n˜o sua ovelha no pasto. A ca a
  • 21. Descri¸˜o informal da teoria dos jogos ca 19 utilidade do leite e da l˜ de uma ovelha pastando ´ igual a 1, por outro lado, a e esta ovelha no pasto contribui com um dano ambiental (compartilhado por todos os fazendeiros) de 5 unidades. Cada fazendeiro tem duas estrat´gias: manter ou n˜o manter sua ovelha e a no pasto. Defina xi = 1, 0, se o i-´simo fazendeiro mant´m sua ovelha no pasto, e e se o i-´simo fazendeiro n˜o mant´m sua ovelha no pasto. e a e Em termos destas vari´veis, ´ f´cil de ver que a utilidade ui do i-´simo a e a e fazendeiro ´ dada por e ui (x1 , . . . , xn ) = xi − 5 · (x1 + · · · + xn ) . n Se n > 5, manter todas as ovelhas no pasto, isto ´, tomar x1 = · · · = e e ´ ıbrio de Nash do jogo. De fato: se todas as ovelhas xn = 1, ´ o unico equil´ est˜o no pasto e um fazendeiro resolve tirar sua ovelha, ele deixa de ganhar 1 a (proveniente da utilidade da l˜ e do leite) e deixa de perder 5/n < 1 (proa veniente do dano ambiental), isto ´, ele acaba ganhando menos do que se e tivesse mantido sua ovelha no pasto. Assim, todos terminar˜o mantendo a sua ovelha e a utilidade final de cada fazendeiro ser´ igual −4, com preju´ a ızo ambiental m´ximo. A figura 1.10 lista todos os perfis de estrat´gia pura, a e com as respectivas utilidades, para o caso n = 6. Para amenizar esta situa¸˜o, a teoria dos jogos sugere a cobran¸a de ca c um imposto por danos ambientais. Se o i-´simo fazendeiro deve pagar um e imposto de t unidades por manter sua ovelha no pasto, ent˜o sua utilidade a final ser´ dada por a ui (x1 , . . . , xn ) = xi − txi − 5 · (x1 + · · · + xn ) . n Se t = 5, ent˜o x1 = . . . = xn = 0 ´ o unico equil´ a e ´ ıbrio de Nash, isto ´, todos e os fazendeiros v˜o preferir retirar suas ovelhas do pasto (figura 1.11). a O caso n = 6 e t = 1/6 ´ interessante: todos os 64 perfis de estrat´gia s˜o e e a equil´ ıbrios de Nash (figura 1.12).
  • 22. 20 II Bienal da Sociedade Brasileira de Matem´tica a perfil u1 u2 u3 u4 u5 u6 (0, 0, 0, 0, 0, 0) (0, 0, 0, 0, 0, 1) (0, 0, 0, 0, 1, 0) (0, 0, 0, 0, 1, 1) (0, 0, 0, 1, 0, 0) (0, 0, 0, 1, 0, 1) (0, 0, 0, 1, 1, 0) (0, 0, 0, 1, 1, 1) (0, 0, 1, 0, 0, 0) (0, 0, 1, 0, 0, 1) (0, 0, 1, 0, 1, 0) (0, 0, 1, 0, 1, 1) (0, 0, 1, 1, 0, 0) (0, 0, 1, 1, 0, 1) (0, 0, 1, 1, 1, 0) (0, 0, 1, 1, 1, 1) (0, 1, 0, 0, 0, 0) (0, 1, 0, 0, 0, 1) (0, 1, 0, 0, 1, 0) (0, 1, 0, 0, 1, 1) (0, 1, 0, 1, 0, 0) (0, 1, 0, 1, 0, 1) (0, 1, 0, 1, 1, 0) (0, 1, 0, 1, 1, 1) (0, 1, 1, 0, 0, 0) (0, 1, 1, 0, 0, 1) (0, 1, 1, 0, 1, 0) (0, 1, 1, 0, 1, 1) (0, 1, 1, 1, 0, 0) (0, 1, 1, 1, 0, 1) (0, 1, 1, 1, 1, 0) (0, 1, 1, 1, 1, 1) (1, 0, 0, 0, 0, 0) (1, 0, 0, 0, 0, 1) (1, 0, 0, 0, 1, 0) (1, 0, 0, 0, 1, 1) (1, 0, 0, 1, 0, 0) (1, 0, 0, 1, 0, 1) (1, 0, 0, 1, 1, 0) (1, 0, 0, 1, 1, 1) (1, 0, 1, 0, 0, 0) (1, 0, 1, 0, 0, 1) (1, 0, 1, 0, 1, 0) (1, 0, 1, 0, 1, 1) (1, 0, 1, 1, 0, 0) (1, 0, 1, 1, 0, 1) (1, 0, 1, 1, 1, 0) (1, 0, 1, 1, 1, 1) (1, 1, 0, 0, 0, 0) (1, 1, 0, 0, 0, 1) (1, 1, 0, 0, 1, 0) (1, 1, 0, 0, 1, 1) (1, 1, 0, 1, 0, 0) (1, 1, 0, 1, 0, 1) (1, 1, 0, 1, 1, 0) (1, 1, 0, 1, 1, 1) (1, 1, 1, 0, 0, 0) (1, 1, 1, 0, 0, 1) (1, 1, 1, 0, 1, 0) (1, 1, 1, 0, 1, 1) (1, 1, 1, 1, 0, 0) (1, 1, 1, 1, 0, 1) (1, 1, 1, 1, 1, 0) (1, 1, 1, 1, 1, 1) 0 −5/6 −5/6 −5/3 −5/6 −5/3 −5/3 −5/2 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/3 −5/2 −5/2 −10/3 −5/2 −10/3 −10/3 −25/6 1/6 −2/3 −2/3 −3/2 −2/3 −3/2 −3/2 −7/3 −2/3 −3/2 −3/2 −7/3 −3/2 −7/3 −7/3 −19/6 −2/3 −3/2 −3/2 −7/3 −3/2 −7/3 −7/3 −19/6 −3/2 −7/3 −7/3 −19/6 −7/3 −19/6 −19/6 −4 0 −5/6 −5/6 −5/3 −5/6 −5/3 −5/3 −5/2 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 1/6 −2/3 −2/3 −3/2 −2/3 −3/2 −3/2 −7/3 −2/3 −3/2 −3/2 −7/3 −3/2 −7/3 −7/3 −19/6 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/3 −5/2 −5/2 −10/3 −5/2 −10/3 −10/3 −25/6 −2/3 −3/2 −3/2 −7/3 −3/2 −7/3 −7/3 −19/6 −3/2 −7/3 −7/3 −19/6 −7/3 −19/6 −19/6 −4 0 −5/6 −5/6 −5/3 −5/6 −5/3 −5/3 −5/2 1/6 −2/3 −2/3 −3/2 −2/3 −3/2 −3/2 −7/3 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −2/3 −3/2 −3/2 −7/3 −3/2 −7/3 −7/3 −19/6 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −2/3 −3/2 −3/2 −7/3 −3/2 −7/3 −7/3 −19/6 −5/3 −5/2 −5/2 −10/3 −5/2 −10/3 −10/3 −25/6 −3/2 −7/3 −7/3 −19/6 −7/3 −19/6 −19/6 −4 0 −5/6 −5/6 −5/3 1/6 −2/3 −2/3 −3/2 −5/6 −5/3 −5/3 −5/2 −2/3 −3/2 −3/2 −7/3 −5/6 −5/3 −5/3 −5/2 −2/3 −3/2 −3/2 −7/3 −5/3 −5/2 −5/2 −10/3 −3/2 −7/3 −7/3 −19/6 −5/6 −5/3 −5/3 −5/2 −2/3 −3/2 −3/2 −7/3 −5/3 −5/2 −5/2 −10/3 −3/2 −7/3 −7/3 −19/6 −5/3 −5/2 −5/2 −10/3 −3/2 −7/3 −7/3 −19/6 −5/2 −10/3 −10/3 −25/6 −7/3 −19/6 −19/6 −4 0 −5/6 1/6 −2/3 −5/6 −5/3 −2/3 −3/2 −5/6 −5/3 −2/3 −3/2 −5/3 −5/2 −3/2 −7/3 −5/6 −5/3 −2/3 −3/2 −5/3 −5/2 −3/2 −7/3 −5/3 −5/2 −3/2 −7/3 −5/2 −10/3 −7/3 −19/6 −5/6 −5/3 −2/3 −3/2 −5/3 −5/2 −3/2 −7/3 −5/3 −5/2 −3/2 −7/3 −5/2 −10/3 −7/3 −19/6 −5/3 −5/2 −3/2 −7/3 −5/2 −10/3 −7/3 −19/6 −5/2 −10/3 −7/3 −19/6 −10/3 −25/6 −19/6 −4 0 1/6 −5/6 −2/3 −5/6 −2/3 −5/3 −3/2 −5/6 −2/3 −5/3 −3/2 −5/3 −3/2 −5/2 −7/3 −5/6 −2/3 −5/3 −3/2 −5/3 −3/2 −5/2 −7/3 −5/3 −3/2 −5/2 −7/3 −5/2 −7/3 −10/3 −19/6 −5/6 −2/3 −5/3 −3/2 −5/3 −3/2 −5/2 −7/3 −5/3 −3/2 −5/2 −7/3 −5/2 −7/3 −10/3 −19/6 −5/3 −3/2 −5/2 −7/3 −5/2 −7/3 −10/3 −19/6 −5/2 −7/3 −10/3 −19/6 −10/3 −19/6 −25/6 −4 Figura 1.10: A trag´dia dos comuns com n = 6 e imposto t = 0. e
  • 23. Descri¸˜o informal da teoria dos jogos ca 21 perfil u1 u2 u3 u4 u5 u6 (0, 0, 0, 0, 0, 0) (0, 0, 0, 0, 0, 1) (0, 0, 0, 0, 1, 0) (0, 0, 0, 0, 1, 1) (0, 0, 0, 1, 0, 0) (0, 0, 0, 1, 0, 1) (0, 0, 0, 1, 1, 0) (0, 0, 0, 1, 1, 1) (0, 0, 1, 0, 0, 0) (0, 0, 1, 0, 0, 1) (0, 0, 1, 0, 1, 0) (0, 0, 1, 0, 1, 1) (0, 0, 1, 1, 0, 0) (0, 0, 1, 1, 0, 1) (0, 0, 1, 1, 1, 0) (0, 0, 1, 1, 1, 1) (0, 1, 0, 0, 0, 0) (0, 1, 0, 0, 0, 1) (0, 1, 0, 0, 1, 0) (0, 1, 0, 0, 1, 1) (0, 1, 0, 1, 0, 0) (0, 1, 0, 1, 0, 1) (0, 1, 0, 1, 1, 0) (0, 1, 0, 1, 1, 1) (0, 1, 1, 0, 0, 0) (0, 1, 1, 0, 0, 1) (0, 1, 1, 0, 1, 0) (0, 1, 1, 0, 1, 1) (0, 1, 1, 1, 0, 0) (0, 1, 1, 1, 0, 1) (0, 1, 1, 1, 1, 0) (0, 1, 1, 1, 1, 1) (1, 0, 0, 0, 0, 0) (1, 0, 0, 0, 0, 1) (1, 0, 0, 0, 1, 0) (1, 0, 0, 0, 1, 1) (1, 0, 0, 1, 0, 0) (1, 0, 0, 1, 0, 1) (1, 0, 0, 1, 1, 0) (1, 0, 0, 1, 1, 1) (1, 0, 1, 0, 0, 0) (1, 0, 1, 0, 0, 1) (1, 0, 1, 0, 1, 0) (1, 0, 1, 0, 1, 1) (1, 0, 1, 1, 0, 0) (1, 0, 1, 1, 0, 1) (1, 0, 1, 1, 1, 0) (1, 0, 1, 1, 1, 1) (1, 1, 0, 0, 0, 0) (1, 1, 0, 0, 0, 1) (1, 1, 0, 0, 1, 0) (1, 1, 0, 0, 1, 1) (1, 1, 0, 1, 0, 0) (1, 1, 0, 1, 0, 1) (1, 1, 0, 1, 1, 0) (1, 1, 0, 1, 1, 1) (1, 1, 1, 0, 0, 0) (1, 1, 1, 0, 0, 1) (1, 1, 1, 0, 1, 0) (1, 1, 1, 0, 1, 1) (1, 1, 1, 1, 0, 0) (1, 1, 1, 1, 0, 1) (1, 1, 1, 1, 1, 0) (1, 1, 1, 1, 1, 1) 0 −5/6 −5/6 −5/3 −5/6 −5/3 −5/3 −5/2 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/3 −5/2 −5/2 −10/3 −5/2 −10/3 −10/3 −25/6 −29/6 −17/3 −17/3 −13/2 −17/3 −13/2 −13/2 −22/3 −17/3 −13/2 −13/2 −22/3 −13/2 −22/3 −22/3 −49/6 −17/3 −13/2 −13/2 −22/3 −13/2 −22/3 −22/3 −49/6 −13/2 −22/3 −22/3 −49/6 −22/3 −49/6 −49/6 −9 0 −5/6 −5/6 −5/3 −5/6 −5/3 −5/3 −5/2 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −29/6 −17/3 −17/3 −13/2 −17/3 −13/2 −13/2 −22/3 −17/3 −13/2 −13/2 −22/3 −13/2 −22/3 −22/3 −49/6 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/3 −5/2 −5/2 −10/3 −5/2 −10/3 −10/3 −25/6 −17/3 −13/2 −13/2 −22/3 −13/2 −22/3 −22/3 −49/6 −13/2 −22/3 −22/3 −49/6 −22/3 −49/6 −49/6 −9 0 −5/6 −5/6 −5/3 −5/6 −5/3 −5/3 −5/2 −29/6 −17/3 −17/3 −13/2 −17/3 −13/2 −13/2 −22/3 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −17/3 −13/2 −13/2 −22/3 −13/2 −22/3 −22/3 −49/6 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −17/3 −13/2 −13/2 −22/3 −13/2 −22/3 −22/3 −49/6 −5/3 −5/2 −5/2 −10/3 −5/2 −10/3 −10/3 −25/6 −13/2 −22/3 −22/3 −49/6 −22/3 −49/6 −49/6 −9 0 −5/6 −5/6 −5/3 −29/6 −17/3 −17/3 −13/2 −5/6 −5/3 −5/3 −5/2 −17/3 −13/2 −13/2 −22/3 −5/6 −5/3 −5/3 −5/2 −17/3 −13/2 −13/2 −22/3 −5/3 −5/2 −5/2 −10/3 −13/2 −22/3 −22/3 −49/6 −5/6 −5/3 −5/3 −5/2 −17/3 −13/2 −13/2 −22/3 −5/3 −5/2 −5/2 −10/3 −13/2 −22/3 −22/3 −49/6 −5/3 −5/2 −5/2 −10/3 −13/2 −22/3 −22/3 −49/6 −5/2 −10/3 −10/3 −25/6 −22/3 −49/6 −49/6 −9 0 −5/6 −29/6 −17/3 −5/6 −5/3 −17/3 −13/2 −5/6 −5/3 −17/3 −13/2 −5/3 −5/2 −13/2 −22/3 −5/6 −5/3 −17/3 −13/2 −5/3 −5/2 −13/2 −22/3 −5/3 −5/2 −13/2 −22/3 −5/2 −10/3 −22/3 −49/6 −5/6 −5/3 −17/3 −13/2 −5/3 −5/2 −13/2 −22/3 −5/3 −5/2 −13/2 −22/3 −5/2 −10/3 −22/3 −49/6 −5/3 −5/2 −13/2 −22/3 −5/2 −10/3 −22/3 −49/6 −5/2 −10/3 −22/3 −49/6 −10/3 −25/6 −49/6 −9 0 −29/6 −5/6 −17/3 −5/6 −17/3 −5/3 −13/2 −5/6 −17/3 −5/3 −13/2 −5/3 −13/2 −5/2 −22/3 −5/6 −17/3 −5/3 −13/2 −5/3 −13/2 −5/2 −22/3 −5/3 −13/2 −5/2 −22/3 −5/2 −22/3 −10/3 −49/6 −5/6 −17/3 −5/3 −13/2 −5/3 −13/2 −5/2 −22/3 −5/3 −13/2 −5/2 −22/3 −5/2 −22/3 −10/3 −49/6 −5/3 −13/2 −5/2 −22/3 −5/2 −22/3 −10/3 −49/6 −5/2 −22/3 −10/3 −49/6 −10/3 −49/6 −25/6 −9 Figura 1.11: A trag´dia dos comuns com n = 6 e imposto t = 5. e
  • 24. 22 II Bienal da Sociedade Brasileira de Matem´tica a perfil u1 u2 u3 u4 u5 u6 (0, 0, 0, 0, 0, 0) (0, 0, 0, 0, 0, 1) (0, 0, 0, 0, 1, 0) (0, 0, 0, 0, 1, 1) (0, 0, 0, 1, 0, 0) (0, 0, 0, 1, 0, 1) (0, 0, 0, 1, 1, 0) (0, 0, 0, 1, 1, 1) (0, 0, 1, 0, 0, 0) (0, 0, 1, 0, 0, 1) (0, 0, 1, 0, 1, 0) (0, 0, 1, 0, 1, 1) (0, 0, 1, 1, 0, 0) (0, 0, 1, 1, 0, 1) (0, 0, 1, 1, 1, 0) (0, 0, 1, 1, 1, 1) (0, 1, 0, 0, 0, 0) (0, 1, 0, 0, 0, 1) (0, 1, 0, 0, 1, 0) (0, 1, 0, 0, 1, 1) (0, 1, 0, 1, 0, 0) (0, 1, 0, 1, 0, 1) (0, 1, 0, 1, 1, 0) (0, 1, 0, 1, 1, 1) (0, 1, 1, 0, 0, 0) (0, 1, 1, 0, 0, 1) (0, 1, 1, 0, 1, 0) (0, 1, 1, 0, 1, 1) (0, 1, 1, 1, 0, 0) (0, 1, 1, 1, 0, 1) (0, 1, 1, 1, 1, 0) (0, 1, 1, 1, 1, 1) (1, 0, 0, 0, 0, 0) (1, 0, 0, 0, 0, 1) (1, 0, 0, 0, 1, 0) (1, 0, 0, 0, 1, 1) (1, 0, 0, 1, 0, 0) (1, 0, 0, 1, 0, 1) (1, 0, 0, 1, 1, 0) (1, 0, 0, 1, 1, 1) (1, 0, 1, 0, 0, 0) (1, 0, 1, 0, 0, 1) (1, 0, 1, 0, 1, 0) (1, 0, 1, 0, 1, 1) (1, 0, 1, 1, 0, 0) (1, 0, 1, 1, 0, 1) (1, 0, 1, 1, 1, 0) (1, 0, 1, 1, 1, 1) (1, 1, 0, 0, 0, 0) (1, 1, 0, 0, 0, 1) (1, 1, 0, 0, 1, 0) (1, 1, 0, 0, 1, 1) (1, 1, 0, 1, 0, 0) (1, 1, 0, 1, 0, 1) (1, 1, 0, 1, 1, 0) (1, 1, 0, 1, 1, 1) (1, 1, 1, 0, 0, 0) (1, 1, 1, 0, 0, 1) (1, 1, 1, 0, 1, 0) (1, 1, 1, 0, 1, 1) (1, 1, 1, 1, 0, 0) (1, 1, 1, 1, 0, 1) (1, 1, 1, 1, 1, 0) (1, 1, 1, 1, 1, 1) 0 −5/6 −5/6 −5/3 −5/6 −5/3 −5/3 −5/2 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/3 −5/2 −5/2 −10/3 −5/2 −10/3 −10/3 −25/6 0 −5/6 −5/6 −5/3 −5/6 −5/3 −5/3 −5/2 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/3 −5/2 −5/2 −10/3 −5/2 −10/3 −10/3 −25/6 0 −5/6 −5/6 −5/3 −5/6 −5/3 −5/3 −5/2 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 0 −5/6 −5/6 −5/3 −5/6 −5/3 −5/3 −5/2 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/3 −5/2 −5/2 −10/3 −5/2 −10/3 −10/3 −25/6 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/3 −5/2 −5/2 −10/3 −5/2 −10/3 −10/3 −25/6 0 −5/6 −5/6 −5/3 −5/6 −5/3 −5/3 −5/2 0 −5/6 −5/6 −5/3 −5/6 −5/3 −5/3 −5/2 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/3 −5/2 −5/2 −10/3 −5/2 −10/3 −10/3 −25/6 −5/3 −5/2 −5/2 −10/3 −5/2 −10/3 −10/3 −25/6 0 −5/6 −5/6 −5/3 0 −5/6 −5/6 −5/3 −5/6 −5/3 −5/3 −5/2 −5/6 −5/3 −5/3 −5/2 −5/6 −5/3 −5/3 −5/2 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/3 −5/2 −5/2 −10/3 −5/6 −5/3 −5/3 −5/2 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/3 −5/2 −5/2 −10/3 −5/3 −5/2 −5/2 −10/3 −5/3 −5/2 −5/2 −10/3 −5/2 −10/3 −10/3 −25/6 −5/2 −10/3 −10/3 −25/6 0 −5/6 0 −5/6 −5/6 −5/3 −5/6 −5/3 −5/6 −5/3 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/6 −5/3 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/2 −10/3 −5/6 −5/3 −5/6 −5/3 −5/3 −5/2 −5/3 −5/2 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/2 −10/3 −5/3 −5/2 −5/3 −5/2 −5/2 −10/3 −5/2 −10/3 −5/2 −10/3 −5/2 −10/3 −10/3 −25/6 −10/3 −25/6 0 0 −5/6 −5/6 −5/6 −5/6 −5/3 −5/3 −5/6 −5/6 −5/3 −5/3 −5/3 −5/3 −5/2 −5/2 −5/6 −5/6 −5/3 −5/3 −5/3 −5/3 −5/2 −5/2 −5/3 −5/3 −5/2 −5/2 −5/2 −5/2 −10/3 −10/3 −5/6 −5/6 −5/3 −5/3 −5/3 −5/3 −5/2 −5/2 −5/3 −5/3 −5/2 −5/2 −5/2 −5/2 −10/3 −10/3 −5/3 −5/3 −5/2 −5/2 −5/2 −5/2 −10/3 −10/3 −5/2 −5/2 −10/3 −10/3 −10/3 −10/3 −25/6 −25/6 Figura 1.12: A trag´dia dos comuns com n = 6 e imposto t = 1/6. e
  • 25. Descri¸˜o informal da teoria dos jogos ca 1.7 23 Existˆncia de solu¸˜es e co Como vimos no jogo de combinar moedas no item (d) do exemplo 1.4, existem jogos que n˜o possuem equil´ a ıbrios de Nash em estrat´gias puras e, e at´ agora, todos os jogos apresentados em nossos exemplos possuem pelo e menos um equil´ ıbrio de Nash em estrat´gias mistas. Uma pergunta natural e ´ se a existˆncia de equil´ e e ıbrios de Nash em estrat´gias mistas ´ um resultado e e geral ou n˜o. A resposta ´ sim! Nos dois cap´ a e ıtulos seguintes apresentaremos dois teoremas de existˆncia: o teorema minimax de von Neumann para jogos e de soma zero com dois jogadores e o teorema de equil´ ıbrios de Nash para jogos gerais.
  • 26. Cap´ ıtulo 2 O teorema minimax de von Neumann 2.1 Jogos de soma constante com dois jogadores Defini¸˜o 2.1 (Jogos de soma constante com dois jogadoca res) Um jogo de soma constante com dois jogadores ´ um jogo com e dois jogadores, comumente denominados jogador linha e jogador coluna, com estrat´gias e Sjogador linha = {1, 2, . . . , m} e Sjogador coluna = {1, 2, . . . , n} e matriz de payoff 1 jogador coluna 2 ··· n 1 (a11 , b11 ) (a12 , b12 ) ··· (a1n , b1n ) jogador 2 linha . . . (a21 , b21 ) (a22 , b22 ) ··· (a2n , b2n ) . . . . . . ... . . . m (am1 , bm1 ) (am2 , bm2 ) ··· (amn , bmn )
  • 27. O teorema minimax de von Neumann 25 satisfazendo aij + bij = c = constante, para todo i = 1, . . . , m e j = 1, . . . , n. No caso particular em que a constante c ´ zero, dizemos que e o jogo tem soma zero. Em termos de estrat´gias mistas, se p = (p1 , . . . , pm ) ∈ ∆m ´ uma dise e tribui¸˜o de probabilidades para as estrat´gias puras do jogador linha e ca e e ca q = (q1 , . . . , qn ) ∈ ∆n ´ uma distribui¸˜o de probabilidades para as estrat´gias puras do jogador coluna, ent˜o o payoff esperado para o jogador e a linha ´ e ⎤⎡ ⎤ ⎡ q1 a11 a12 · · · a1n m n ⎥⎢ q ⎥ ⎢ a ⎢ 21 a22 · · · a2n ⎥ ⎢ 2 ⎥ pi qj aij = p1 p2 · · · pm ⎢ . ul (p, q) = . ... . ⎥ ⎢ . ⎥ , . . ⎦⎣ . ⎦ ⎣ . . . . . i=1 j=1 am1 am2 · · · amn qn isto ´, e ⎡ ⎢ ⎢ com A = ⎢ ⎣ ul (p, q) = pT Aq, a11 a12 a21 a22 . . . . . . am1 am2 Analogamente, o payoff esperado para o jogador ⎡ b11 ⎢ b ⎢ 21 com B = ⎢ . uc (p, q) = pT Bq, ⎣ . . bm1 Uma vez que o ⎡ a11 ⎢ a ⎢ 21 A+B = ⎢ . ⎣ . . am1 isto ´, e ⎢ ⎢ A+B =C =⎢ ⎣ c c . . . c c c . . . c ··· ··· ... ··· c c . . . c ⎤ ⎡ ⎢ ⎥ ⎢ ⎥ ⎥ = c⎢ ⎣ ⎦ 1 1 . . . 1 · · · a1n · · · a2n ⎥ ⎥ ... . ⎥ . . ⎦ . · · · amn coluna ´ dado por e ⎤ b12 · · · b1n b22 · · · b2n ⎥ ⎥ . ... . ⎥ . . . ⎦ . . bm2 · · · bmn jogo tem soma constante, vemos que ⎤ ⎡ b11 b12 · · · b1n a12 · · · a1n ⎥ ⎢ b a22 · · · a2n ⎥ ⎢ 21 b22 · · · b2n . . . . . ⎥+⎢ . . ... . . . ⎦ ⎣ . . . . . . . . am2 · · · amn bm1 bm2 · · · bmn ⎡ ⎤ 1 1 . . . 1 ··· ··· ... ··· ⎡ ⎤ ⎥ ⎢ ⎥ ⎢ ⎥=⎢ ⎦ ⎣ 1 1 . . . 1 c c . . . c c c . . . c ⎤ ⎥ ⎥ ⎥=c 1, ⎦ ··· ··· ... ··· c c . . . c ⎤ ⎥ ⎥ ⎥, ⎦
  • 28. 26 II Bienal da Sociedade Brasileira de Matem´tica a onde 1 denota a matriz m × n formada com 1 em todas as suas entradas. Sendo assim, ´ f´cil de ver que e a uc (p, q) = pT Bq = pT (c 1 − A)q = cpT 1 q − pT Aq = c − ul (p, q) a onde, na ultima igualdade, usamos que pT 1 q = 1, pois p e q s˜o distri´ bui¸˜es de probabilidades e, por isto, co m n pi = 1 i=1 e qj = 1. j=1 Em particular, vale a seguinte propriedade importante: ul (p∗ , q∗ ) ≥ ul (p, q∗ ) 2.2 se, e somente se, uc (p∗ , q∗ ) ≤ uc (p, q∗ ). (2.1) Equil´ ıbrio de Nash em estrat´gias puras e Defini¸˜o 2.2 (Ponto de sela) Dizemos que um elemento aij de ca uma matriz A ´ um ponto de sela da matriz A se ele for simultaneae mente um m´ ınimo em sua linha e um m´ximo em sua coluna, isto ´, a e se e aij ≤ ail para todo l = 1, . . . , n aij ≥ akj para todo k = 1, . . . , m. Teorema 2.1 O elemento aij ´ um ponto de sela da matriz A se, e e somente se, o par (i, j) ´ um equil´ e ıbrio de Nash em estrat´gias puras e para o jogo. Demonstra¸˜o: ca e a (⇒) Seja aij um ponto de sela da matriz A. Como aij ´ m´ximo em sua coluna, vale que ul (i, j) = aij ≥ akj = ul (k, j)
  • 29. O teorema minimax de von Neumann 27 para todo k = 1, . . . , m, isto ´, o jogador linha n˜o pode aumentar o seu e a payoff se o jogador coluna mantiver a escolha da coluna j. Por outro lado, e ınimo em sua linha, vale que como aij ´ m´ uc (i, j) = bij = c − aij ≥ c − ail = bil = uc (i, l) para todo l = 1, . . . , n, isto ´, o jogador coluna n˜o pode aumentar o seu e a payoff se o jogador linha mantiver a escolha da linha i. Isto mostra que o perfil de estrat´gia pura (i, j) ´ um equil´ e e ıbrio de Nash do jogo. (⇐) Seja (i, j) ´ um equil´ e ıbrio de Nash do jogo. A partir das considera¸˜es co e a ınimo em sua linha acima, ´ f´cil de ver que aij ´ m´ximo em sua coluna e m´ e a e e que, portanto, aij ´ um ponto de sela da matriz A. Teorema 2.2 Se aij e ars s˜o dois pontos de sela da matriz A, ent˜o a a e a ais e arj tamb´m s˜o pontos de sela da matriz A e aij = ars = ais = arj . Demonstra¸ao: Considere a matriz c˜ ⎡ . . . . . . ⎢ ··· a ··· a ··· ij is ⎢ ⎢ . ... . . . A=⎢ . . ⎢ ⎣ · · · arj · · · ars · · · . . . . . . ⎤ ⎥ ⎥ ⎥ ⎥. ⎥ ⎦ Como aij e ars s˜o pontos de sela, sabemos que eles s˜o m´ a a ınimos em suas respectivas linhas e m´ximos em suas respectivas colunas. Assim, a aij ≤ ais ≤ ars e aij ≥ arj ≥ ars , e, portanto, aij = ais = arj = ars . Observe que ais ´ m´ e ınimo em sua linha, pois aij = ais ´ m´ e ınimo da mesma e a e a linha e que ais ´ m´ximo em sua coluna, pois ars = ais ´ m´ximo da mesma e ınimo em sua linha, pois ars = arj ´ m´ e ınimo coluna. Analogamente, arj ´ m´
  • 30. 28 II Bienal da Sociedade Brasileira de Matem´tica a da mesma linha e arj ´ m´ximo em sua coluna, pois arj = aij ´ m´ximo da e a e a e a mesma coluna. Conclu´ ımos ent˜o que ais e arj tamb´m s˜o pontos de sela a da matriz A. O payoff m´ ınimo do jogador linha, se ele escolher a linha k, ´ dado por e ak = min akl . 1≤l≤n Analogamente, o payoff m´ ınimo do jogador coluna, se ele escolher a coluna l, ´ dado por c − al , onde e al = max akl . 1≤k≤m Defina vl (A) = max ak = max min akl 1≤k≤m 1≤k≤m 1≤l≤n e vc (A) = min al = min max akl . 1≤l≤n 1≤l≤n 1≤k≤m Teorema 2.3 Para toda matriz A, tem-se vc (A) ≥ vl (A). Demonstra¸ao: Temos que para todo k = 1, . . . , m e j = 1, . . . , n, c˜ akj ≥ min akl . 1≤l≤n Assim, max akj ≥ max min akl = vl (A), 1≤k≤m 1≤k≤m 1≤l≤n para todo j = 1, . . . , n. Conseq¨entemente, u vc (A) = min max akj ≥ max min akl = vl (A). 1≤j≤n 1≤k≤m 1≤k≤m 1≤l≤n O pr´ximo teorema caracteriza a existˆncia de pontos de sela e, portanto, o e a existˆncia de equil´ e ıbrios de Nash em estrat´gias puras, em termos das e fun¸˜es vl e vc . co Teorema 2.4 Uma matriz A tem um ponto de sela se, e somente se, vl (A) = vc (A).
  • 31. O teorema minimax de von Neumann 29 Demonstra¸˜o: ca (⇒) Se aij ´ um ponto de sela da matriz A, ent˜o aij = min1≤l≤n ail = e a e ai . Como vl (A) = max1≤k≤m ak , ´ claro que vl (A) ≥ ai = aij . Por outro lado, aij = max1≤k≤m akj = aj . Como vc (A) = min1≤l≤n al , segue-se que ımos que vc (A) ≤ aj = aij . Combinando estas duas desigualdades, conclu´ vc (A) ≤ aij ≤ vl (A). Mas, pelo teorema anterior, vc (A) ≥ vl (A) e, sendo assim, vc (A) = vl (A). (⇐) Como vl (A) = max1≤r≤m ar , existe uma linha i tal que vl (A) = ai . Como, por sua vez, ai = min1≤s≤n ais , existe uma coluna l tal que ai = ail . Assim, vl (A) = ai = ail . Analogamente, como vc (A) = min1≤s≤n as , existe uma coluna j tal que vc (A) = aj . Como, por sua vez, aj = max1≤r≤m arj , existe uma linha k tal que aj = akj . Assim, vc (A) = aj = akj . Uma vez que, por hip´tese, vl (A) = vc (A), temos que o ail = ai = vl (A) = vc (A) = aj = akj . Afirmamos que aij ´ um ponto de sela da matriz A. Com efeito, aij ≤ aj = e e e ınimo de sua linha. Por ai ≤ ais , para todo s = 1, . . . , n, isto ´, aij ´ o m´ e e outro lado, aij ≥ ai = aj ≥ arj , para todo r = 1, . . . , m, isto ´, aij ´ o e m´ximo de sua coluna. Portanto, aij ´ um ponto de sela da matriz A. a Corol´rio 2.1 Um jogo de dois jogadores com soma constante defia nido pela matriz de payoffs A do jogador linha tem um equil´ ıbrio de Nash em estrat´gias puras se, e somente se, e vl (A) = vc (A). 2.3 Equil´ ıbrio de Nash em estrat´gias mistas e Defina vl (A) = max min pT Aq p∈∆m q∈∆n e vc (A) = min max pT Aq. q∈∆n p∈∆m
  • 32. 30 II Bienal da Sociedade Brasileira de Matem´tica a Teorema 2.5 Para toda matriz A, tem-se vc (A) ≥ vl (A). Demonstra¸ao: Temos que para todo p ∈ ∆m , c˜ pT Aq ≥ min pT Ay. y∈∆n Assim, max pT Aq ≥ max min pT Ay = vl (A). p∈∆m p∈∆m y∈∆n Conseq¨entemente, u vc (A) = min max pT Aq ≥ max min pT Ay = vl (A). q∈∆n p∈∆m p∈∆m y∈∆n O pr´ximo teorema caracteriza a existˆncia de equil´ o e ıbrios de Nash em estrat´gias mistas em termos das fun¸˜es vl e vc . e co Teorema 2.6 Um perfil de estrat´gia mista (p∗ , q∗ ) ´ um equil´ e e ıbrio de Nash de um jogo de dois jogadores com soma constante definido pela matriz de payoffs A do jogador linha se, e somente se, vl (A) = vc (A) = p∗T Aq∗ . Demonstra¸ao: c˜ (⇒) Se (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash, ent˜o a p∗T Aq∗ = ul (p∗ , q∗ ) ≥ ul (p, q∗ ) = pT Aq∗ , para todo p ∈ ∆m . Em particular, p∗T Aq∗ = max pT Aq∗ ≥ min max pT Ay = vc (A). p∈∆m y∈∆n p∈∆m Vale tamb´m que e p∗T Aq∗ = c − uc (p∗ , q∗ ) ≤ c − uc (p∗ , q) = p∗T Aq, para todo q ∈ ∆n . Em particular,
  • 33. O teorema minimax de von Neumann 31 p∗T Aq∗ = min p∗T Aq ≤ max min xT Aq = vl (A). q∈∆n x∈∆m q∈∆n Desta maneira, vl (A) ≥ vc (A). Como, pelo teorema anterior, vl (A) ≤ vc (A), conclu´ ımos que vl (A) = vc (A). (⇐) Como vl (A) = maxp∈∆m minq∈∆n pT Aq, existe p∗ ∈ ∆m tal que vl (A) = min p∗T Aq. q∈∆n Analogamente, como vc (A) = minq∈∆n maxp∈∆m pT Aq, existe q∗ ∈ ∆m tal vc (A) = max pT Aq∗ . p∈∆m Uma vez que, por hip´tese, vl (A) = vc (A), temos que o min p∗T Aq = vl (A) = vc (A) = max pT Aq∗ . q∈∆n p∈∆m Afirmamos que (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash do jogo. Com efeito, ul (p∗ , q∗ ) = p∗T Aq∗ ≥ min p∗T Aq = q∈∆n max pT Aq∗ ≥ xT Aq∗ = ul (x, q∗ ), p∈∆m para todo x ∈ ∆m . Por outro lado, uc (p∗ , q∗ ) = c − p∗T Aq∗ ≥ c − max pT Aq∗ = p∈∆m c − min p∗T Aq ≥ c − p∗T Ay = uc (p∗ , y), q∈∆n para todo y ∈ ∆n . Desta maneira, (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash do jogo. 2.4 O teorema minimax de von Neumann O pr´ximo teorema estabelece que, para jogos de dois jogadores com soma o zero, vl (A) = vc (A) sempre. Sendo assim, pelo teorema 2.6, segue-se que, para esta classe de jogos, sempre existe pelo menos um equil´ ıbrio de Nash em estrat´gias mistas. e
  • 34. 32 II Bienal da Sociedade Brasileira de Matem´tica a Teorema 2.7 (minimax de von Neumann) Para todo jogo de soma zero com dois jogadores, representado pela matriz de payoffs A do jogador linha, sempre existe um perfil de estrat´gia mista (p∗ , q∗ ) ∈ e ∆m × ∆n satisfazendo vl (A) = max min pT Aq = p∗T Aq∗ = min max pT Aq = vc (A). p∈∆m q∈∆n q∈∆n p∈∆m Em particular, (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash do jogo. Daremos uma demonstra¸˜o deste teorema minimax de von Neumann ca usando o teorema de dualidade da teoria de programa¸˜o linear. Lembramos ca que um problema de programa¸˜o linear ´ um problema de otimiza¸˜o com ca e ca fun¸˜o objetivo e restri¸˜es lineares: ca co (problema primal) maximizar bT y sujeito a Ay ≤ c, y ≥ 0, onde as desigualdades devem ser interpretadas componente a componente. A cada problema de programa¸˜o linear (problema primal) podemos associar ca um outro problema de otimiza¸˜o (problema dual): ca (problema dual) minimizar cT x sujeito a xT A ≥ bT , x ≥ 0. Teorema 2.8 (da dualidade em programacao linear) ¸˜ (a) O problema primal possui uma solu¸˜o se, e somente se, o problema ca dual possui uma solu¸˜o. ca (b) Se y∗ ´ solu¸˜o do problema primal e x∗ ´ solu¸˜o do problema e ca e ca T ∗ dual, ent˜o cT x∗ = b y . a
  • 35. O teorema minimax de von Neumann 33 Uma demonstra¸˜o do teorema de dualidade pode ser encontrada em [12]. ca Demonstra¸ao do teorema minimax: sem perda de generalidade, podemos c˜ assumir que todas as entradas da matriz de payoffs A do jogador linha s˜o a positivas. Caso contr´rio, basta substituir A por A = A + D e B = −A a por B = −D+B, onde D = d 1 , com d > max1≤i≤m max1≤j≤n |aij |. Observe que A + B = 0 (isto ´, o jogo definido pelas matrizes A e B tem soma zero) e ∗ ∗ e ıbrio de Nash para o jogo definido pela matriz A e que (p , q ) ´ um equil´ se, e somente se, (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash para o jogo definido pela matriz A. Sejam c = (1, 1, . . . , 1)T e b = (1, 1, . . . , 1)T . Considere os problemas de programa¸˜o linear: ca (problema primal) (problema dual) T minimizar cT x sujeito a xT A ≥ bT , x ≥ 0. maximizar b y sujeito a Ay ≤ c, y ≥ 0, Passo 1: o problema dual possui uma solu¸˜o. ca Como A > 0, o conjunto admiss´ X = {x ∈ Rm | xT A ≥ bT e x ≥ 0} ıvel ca ´ n˜o vazio. Por outro lado, como c = (1, 1, . . . , 1)T , a fun¸˜o objetivo do e a t problema ´ escrita como x = (x1 , x2 , . . . , xm ) → c x = x1 + x2 + · · · + xm . e Assim, o problema dual consiste em encontrar o ponto do conjunto X mais pr´ximo da origem segundo a norma da soma || · ||1 , um problema que certao mente possui uma solu¸˜o pois, se p ∈ X, ent˜o podemos “compactificar” o ca a conjunto admiss´ incluindo a restri¸˜o ||x||1 ≤ ||p||1 e, com isso, podemos ıvel ca usar o teorema de Weierstrass para garantir a existˆncia de um m´ e ınimo. Passo 2: constru¸˜o do equil´ ca ıbrio de Nash. Dado que o problema dual possui uma solu¸˜o, pelo teorema de dualidade, ca e ca o problema primal tamb´m possui. Mais ainda: se x∗ ´ solu¸˜o do problema e ∗ e ca a dual e y ´ solu¸˜o do problema primal, ent˜o cT x∗ = bT y∗ . e a e ıvel) e defina Seja θ = cT x∗ = bT y∗ (que ´ > 0 pois (0, 0, . . . , 0) n˜o ´ admiss´ x∗ p = θ ∗ e y∗ q = . θ ∗
  • 36. 34 II Bienal da Sociedade Brasileira de Matem´tica a Afirmamos que (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash do jogo. Com efeito: clara∗ ∗ ∗ a a mente p ∈ ∆m e q ∈ ∆n , pois p ≥ 0 (j´ que x∗ ≥ 0 e θ > 0), q∗ ≥ 0 (j´ ∗ que y ≥ 0 e θ > 0), m m pi = i=1 i=1 cT x∗ θ x∗ i = = =1 θ θ θ m e n qj = j=1 j=1 ∗ yj bT y∗ θ = = = 1. θ θ θ Agora, como x∗T A ≥ bT , temos que para todo q ∈ ∆n , x∗T Aq ≥ bT q = n ∗ ∗ ∗T ∗T ∗ j=1 qj = 1. Mas x = p /θ. Desta maneira, p Aq ≥ θ = p Aq , para u todo q ∈ ∆n . Conseq¨entemente, uc (p∗ , q∗ ) = −p∗T Aq∗ ≥ −p∗T Aq = uc (p∗ , q) para todo q ∈ ∆n . Mostramos ent˜o que o jogador coluna n˜o pode aumentar a a ∗ o seu payoff esperado trocando q por q, se o jogador linha mantiver a escolha p∗ . Analogamente, como Ay ≤ c, temos que para todo p ∈ ∆m , pT Ay∗ ≤ pT c = m pi = 1. Mas y∗ = q∗ /θ. Desta maneira, p∗ Aq∗ ≤ θ = i=1 u p∗T Aq∗ , para todo p ∈ ∆m . Conseq¨entemente, ul (p∗ , q∗ ) = p∗T Aq∗ ≥ pT Aq∗ = ul (p, q∗ ), para todo p ∈ ∆m . Mostramos ent˜o que o jogador linha n˜o pode aumentar a a ∗ o seu payoff esperado trocando p por p, e o jogador coluna mantiver a ımos, portanto, que (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash do escolha q∗ . Conclu´ jogo. Al´m de estabelecer a existˆncia de equil´ e e ıbrios de Nash, a demonstra¸˜o ca que demos sugere uma maneira de calcul´-los: resolvendo-se dois problemas a de programa¸˜o linear. ca Exemplo 2.1 O governo deseja vacinar seus cidad˜os contra um certo v´ a ırus da gripe. Este v´ ırus possui dois sorotipos, sendo que ´ desconhecida a proe por¸˜o na qual os dois sorotipos ocorrem na popula¸˜o do v´ ca ca ırus. Foram desenvolvidas duas vacinas onde a efic´cia da vacina 1 ´ de 85% contra o a e sorotipo 1 e de 70% contra o sorotipo 2. A efic´cia da vacina 2 ´ de 60% a e contra o sorotipo 1 e de 90% contra o sorotipo 2. Qual pol´tica de vacina¸˜o ı ca deveria ser tomada pelo governo? Esta situa¸˜o pode ser modelada como um jogo de soma zero com dois ca jogadores, onde o jogador linha L (o governo) deseja fazer a compensa¸˜o ca
  • 37. O teorema minimax de von Neumann 35 (a fra¸˜o dos cidad˜os resistentes ao v´ ca a ırus) o maior poss´ ıvel e o jogador coluna C (o v´ ırus) deseja fazer a compensa¸˜o a menor poss´ ca ıvel. A matriz de payoffs ´ a seguinte: e v´ ırus sorotipo 1 vacina 1 (85/100, −85/100) (70/100, −70/100) vacina 2 governo sorotipo 2 (60/100, −60/100) (90/100, −90/100) Para encontrar um equil´ ıbrio de Nash, devemos resolver os seguintes problemas de programa¸˜o linear ca (problema primal) maximizar sujeito a y1 + y2 85/100 70/100 y1 y2 60/100 90/100 y1 y2 ≥ 1 , 1 0 , 0 ≥ 1 1 , ≥ 0 0 ≤ (problema dual) minimizar sujeito a isto ´, e x1 x2 x1 + x2 85/100 70/100 60/100 90/100 x1 x2 ,
  • 38. 36 II Bienal da Sociedade Brasileira de Matem´tica a (problema primal) maximizar y1 + y2 sujeito a 17y1 + 14y2 = 20, 6y1 + 9y2 = 10, y1 ≥ 0, y2 ≥ 0, (problema dual) maximizar x1 + x2 sujeito a 7x1 + 12x2 = 20, 7x1 + 9x2 = 10, x1 ≥ 0, x2 ≥ 0. A solu¸˜o do problema dual ´ x∗ = (20/23, 10/23) (figura 2.1) e a solu¸˜o ca e ca ∗ do problema primal ´ y = (40/69, 50/69), com e ∗ ∗ θ = x∗ + x ∗ = y 1 + y 2 = 1 2 30 . 23 x2 30/23 10/23 0 20/23 30/23 Figura 2.1: Solu¸˜o do problema dual. ca x1
  • 39. O teorema minimax de von Neumann 37 y1 30/23 50/69 0 40/69 y1 30/23 Figura 2.2: Solu¸˜o do problema primal. ca Desta maneira, o unico equil´ ´ ıbrio de Nash para o problema ´ dado pelo e ∗ ∗ ponto (p , q ), onde p∗ = x∗ = θ 2 1 , 3 3 e q∗ = y∗ = θ 4 5 , . 9 9
  • 40. Cap´ ıtulo 3 O teorema de equil´ ıbrio de Nash O teorema minimax de von Neumann demonstra a existˆncia de um e equil´ ıbrio de Nash para uma classe muito restrita de jogos, a saber, a classe dos jogos de soma zero com apenas dois jogadores. De fato, o resultado ´ gee ral: todo jogo definido por matrizes de payoffs possui um equil´ ıbrio de Nash em estrat´gias mistas. A demonstra¸˜o que apresentaremos aqui ´ devida a e ca e John Nash e ela faz uso do teorema do ponto fixo de Brouwer [10]. Teorema 3.1 (do ponto fixo de Brouwer) Se ∆ ´ um subcone junto compacto e convexo de um espa¸o euclidiano de dimens˜o finita c a e F : ∆ → ∆ ´ uma fun¸˜o cont´ e ca ınua, ent˜o F possui um ponto fixo a ∗ em ∆, isto ´, existe p ∈ ∆ tal que e F(p∗ ) = p∗ . Com as nota¸˜es das se¸˜es 1.3 e 1.4, estabeleceremos uma seq¨ˆncia de co co ue teoremas que fornecem caracteriza¸˜es alternativas para um equil´ co ıbrio de Nash. Teorema 3.2 Para cada i = 1, . . . , n e j = 1, . . . , mi , defina as fun¸˜es co zij : ∆ → R p → zij (p) = ui (sij , p−i ) − ui (pi , p−i )
  • 41. O teorema de equil´ ıbrio de Nash 39 (isto ´, zij mede o ganho ou perda do jogador gi quando ele troca a e e distribui¸˜o de probabilidade pi pela estrat´gia pura sij ). Temos que ca ∗ p ´ um equil´ e ıbrio de Nash se, e somente se, zij (p∗ ) ≤ 0 para cada i = 1, . . . , n e j = 1, . . . , mi . Demonstra¸ao: c˜ (⇒) Se p∗ = (p∗ , p∗ ) ´ um equil´ ıbrio de Nash, ent˜o ui (p∗ , p∗ ) ≥ a i −i e i −i ∗ u ui (sij , p−i ) para cada i = 1, . . . , n e j = 1, . . . , mi . Conseq¨entemente, zij (p∗ ) = ui (sij , p∗ ) − ui (p∗ , p∗ ) ≤ 0 −i i −i para cada i = 1, . . . , n e j = 1, . . . , mi . (⇐) Se zij (p∗ ) = ui (sij , p∗ ) − ui (p∗ , p∗ ) ≤ 0 −i i −i para cada i = 1, . . . , n e j = 1, . . . , mi , ent˜o a ui (sij , p∗ ) = ui (ej , p∗ ) ≤ ui (p∗ , p∗ ) −i −i i −i para cada i = 1, . . . , n e j = 1, . . . , mi , onde ej ´ o vetor em Rmi que tem 1 e na j-´sima coordenada e zero nas demais. Devemos mostrar que para todo e pi = (pi1 , . . . , pimi ) ∈ ∆mi ui (pi , p∗ ) ≤ ui (p∗ , p∗ ). −i i −i Mas, por x → ui (x, p∗ ) ser um funcional linear, temos que i ui (pi , p∗ ) −i mi pik · = ui k=1 mi pik · ek , p∗ −i mi = pik · ui (ek , p∗ ) ≤ −i k=1 ui (p∗ , p∗ ) i −i = ui (p∗ , p∗ ) i −i k=1 onde, na ultima igualdade, usamos o fato de que ´ pi ∈ ∆mi . mi · pik = ui (p∗ , p∗ ) , i −i k=1 mi k=1 pik = 1, dado que
  • 42. 40 II Bienal da Sociedade Brasileira de Matem´tica a Teorema 3.3 Para cada i = 1, . . . , n e j = 1, . . . , mi , defina as fun¸˜es co gij : ∆ → R . p → gij (p) = max{0, zij (p)} Temos que p ´ um equil´ e ıbrio de Nash se, e somente se, gij (p) = 0 para cada i = 1, . . . , n e j = 1, . . . , mi . Demonstra¸ao: A prova segue imediatamente do teorema anterior. c˜ Teorema 3.4 Defina a aplica¸˜o ca F : ∆ = ∆m1 × ∆m2 × · · · × ∆mn → ∆ = ∆m1 × ∆m2 × · · · × ∆mn , p = (p1 , p2 , . . . , pn ) → F(p) = (y1 (p), y2 (p), . . . , yn (p)) onde yi (p) = (yi1 (p), yi2 (p), . . . , yimi (p)), pi = (pi1 , pi2 , . . . , pimi ) e yij (p) = pij + gij (p) . mi 1+ gik (p) k=1 e ıbrio de Nash se, e somente se, Temos que p∗ ´ um equil´ F(p∗ ) = p∗ , e ca isto ´, se, e somente se, p∗ ´ um ponto fixo da aplica¸˜o F. e Demonstra¸˜o: observe que, de fato, F(∆) ⊆ ∆ pois claramente yij ≥ 0 e ca ⎞ ⎛ mi mi mi ⎟ ⎜ ⎜ pik + gik (p) ⎟ ⎟= ⎜ yik (p) = mi ⎟ ⎜ ⎠ k=1 k=1 ⎝ 1+ gik (p) mi mi k=1 isto ´, cada yi (p) ∈ ∆mi . e pik + k=1 mi 1+ gik (p) k=1 1+ gik (p) k=1 gik (p) k=1 mi = 1+ = 1, gik (p) k=1
  • 43. O teorema de equil´ ıbrio de Nash 41 (⇒) Se p∗ ´ um equil´ e ıbrio de Nash, ent˜o gij (p∗ ) = 0 para cada i = a 1, . . . , n e j = 1, . . . , mi . Desta maneira, yij (p∗ ) = p∗ para cada i = 1, . . . , n ij e e j = 1, . . . , mi , isto ´, yi (p∗ ) = p∗ para cada i = 1, . . . , n ou, ainda, F(p∗ ) = i ∗ p. (⇐) Suponha que p∗ = (p∗ , p∗ , . . . , p∗ ) ∈ ∆ = ∆m1 × · · · × ∆mn seja um 1 2 n ponto fixo da aplica¸˜o F : ∆ → ∆, isto ´, suponha que ca e p∗ ij = p∗ + gij (p∗ ) ij mi 1+ gik (p∗ ) k=1 a para todo j = 1, . . . , mi e i = 1, . . . , n. Segue-se ent˜o que p∗ ij mi · gik (p∗ ) = gij (p∗ ), k=1 para todo j = 1, . . . , mi e i = 1, . . . , n. Afirmamos que α = mi gik (p∗ ) = k=1 0, de modo que gik (p∗ ) = 0 para todo k = 1, . . . , mi e i = 1, . . . , n. De fato: se, por absurdo, α > 0, vemos a partir da rela¸˜o acima que ca gij (p∗ ) > 0 p∗ > 0. ij se, e somente se, Sem perda de generalidade, suponha que p∗ > 0, p∗ > 0, . . . , p∗ > 0 e i1 i2 il ∗ ∗ ∗ pi(l+1) = pi(l+2) = · · · = pimi = 0. Observe que p∗ i mi = p∗ e k , ik k=1 e e o onde ei ´ o i-´simo vetor da base canˆnica de Rmi . Dado que gik (p∗ ) > 0 para todo k = 1, . . . , l, temos que ui (ei , p∗ ) > ui (p∗ , p∗ ), −i i −i para todo k = 1, . . . , l. Desta maneira, ui (p∗ , p∗ ) i −i mi = ui p∗ ek , p∗ ik −i k=1 mi = p∗ ik · ui (ek , p∗ ) −i k=1 l = p∗ · ui (ek , p∗ ) ik −i k=1 > l k=1 p∗ ik · ui (p∗ , p∗ ) i −i = ui (p∗ , p∗ ) i −i l · k=1 p∗ = ui (p∗ , p∗ ) , ik i −i
  • 44. 42 II Bienal da Sociedade Brasileira de Matem´tica a um absurdo. Isto demonstra que gij (p∗ ) = 0 para todo j = 1, . . . , mi e e ıbrio de Nash em estrat´gias mistas. e j = 1, . . . , m e, assim, p∗ ´ um equil´ Teorema 3.5 (do equil´ ıbrio de Nash) Todo jogo definido por matrizes de payoffs possui um equil´ ıbrio de Nash. Demonstra¸˜o: A aplica¸˜o F : ∆ → ∆ definida no teorema anterior ´ ca ca e cont´ ınua e ∆ ´ um conjunto compacto e convexo. Pelo teorema do ponto e e fixo de Brouwer, F possui um ponto fixo p∗ . Pelo teorema anterior, p∗ ´ um equil´ ıbrio de Nash. O teorema 3.3 sugere uma maneira de se calcular os equil´ ıbrios de Nash de um jogo. Eles s˜o solu¸˜es do seguinte problema de otimiza¸˜o n˜o-linear: a co ca a n mi (gij (p))2 minimizar i=1 j=1 sujeito a p ∈ ∆. Com efeito: a soma de quadrados ´ zero se, e somente se, cada parcela ´ e e igual a zero. Exemplo 3.1 Para o dilema do prisioneiro (exemplo 1.1, p´gina 6), a (p, q) = (p, 1 − p; q, 1 − q) ∈ ∆2 × ∆2 ´ um equil´ e ıbrio de Nash se, e somente se, (p, q) ´ solu¸˜o do seguinte problema e ca de otimiza¸˜o ca minimizar G(p, q) = (max {0, − (−1 + p) (4 q + 1)})2 + (max {0, −p (4 q + 1)})2 + (max {0, − (4 p + 1) (−1 + q)})2 + (max {0, −q (4 p + 1)})2 sujeito a 0 ≤ p ≤ 1, 0 ≤ q ≤ 1.
  • 45. O teorema de equil´ ıbrio de Nash 43 Como vemos pela figura 3.1, que mostra o gr´fico e o mapa de contorno a de G, o ponto (p∗ , q∗ ) = (1, 0; 1, 0) ´ o unico equil´ e ´ ıbrio de Nash do jogo. Exemplo 3.2 Para a batalha dos sexos (exemplo 1.2, p´gina 7), a (p, q) = (p, 1 − p; q, 1 − q) ∈ ∆2 × ∆2 ´ um equil´ e ıbrio de Nash se, e somente se, (p, q) ´ solu¸˜o do seguinte problema e ca de otimiza¸˜o ca minimizar G(p, q) = (max {0, −5 (−1 + p) (3 q − 1)})2 + (max {0, −5 p (3 q − 1)})2 + (max {0, −5 (3 p − 2) (−1 + q)))2 + (max {0, −5 q (3 p − 2)})2 sujeito a 0 ≤ p ≤ 1, 0 ≤ q ≤ 1. Como vemos pela figura 3.2, que mostra o gr´fico e o mapa de contorno a de G, os pontos (p∗ , q∗ ) = (1, 0; 1, 0), (p∗ , q∗ ) = (0, 1; 0, 1) e (p∗ , q∗ ) = (2/3, 1/3; 1/3, 2/3) s˜o os unicos equil´ a ´ ıbrios de Nash do jogo. Exemplo 3.3 Para o jogo do item (d) do exemplo 1.4 da p´gina 11, a (p, q) = (p, 1 − p; q, 1 − q) ∈ ∆2 × ∆2 ´ um equil´ e ıbrio de Nash se, e somente se, (p, q) ´ solu¸˜o do seguinte problema e ca de otimiza¸˜o ca minimizar G(p, q) = (max {0, −2 (−1 + p) (2 q − 1)})2 + (max {0, −2 p (2 q − 1)})2 + (max {0, 2 (2 p − 1) (−1 + q)})2 + (max {0, 2 (2 p − 1) q})2 sujeito a 0 ≤ p ≤ 1, 0 ≤ q ≤ 1.
  • 46. 44 II Bienal da Sociedade Brasileira de Matem´tica a Como vemos pela figura 3.3, que mostra o gr´fico e o mapa de contorno a de G, o ponto (p∗ , q∗ ) = (1/2, 1/2; 1/2, 1/2) ´ o unico equil´ e ´ ıbrio de Nash do jogo. Exemplo 3.4 Para o jogo do exemplo 1.6 da p´gina 17, a (p, q) = (p, 1 − p; q, 1 − q) ∈ ∆2 × ∆2 ´ um equil´ e ıbrio de Nash se, e somente se, (p, q) ´ solu¸˜o do seguinte problema e ca de otimiza¸˜o ca minimizar G(p, q) = (max {0, −2 (−1 + p) (2 q − 1)})2 + (max {0, −2 p (2 q − 1)})2 + (max {0, (−3 + 4 p) (−1 + q)})2 + (max {0, q (−3 + 4 p)})2 sujeito a 0 ≤ p ≤ 1, 0 ≤ q ≤ 1. Como vemos pela figura 3.4, que mostra o gr´fico e o mapa de contorno a de G, o ponto (p∗ , q∗ ) = (3/4, 1/4; 1/2, 1/2) ´ o unico equil´ e ´ ıbrio de Nash do jogo.
  • 47. O teorema de equil´ ıbrio de Nash 45 25 20 15 10 5 1 0.5 q 0 0 0.2 0.4 0.6 p 0.8 1 0 p 0 0.2 0.4 0.6 0.8 1 1 0.8 0.6 q 0.4 0.2 0 Figura 3.1: Encontrando os equil´ ıbrios de Nash para o dilema do prisioneiro via um problema de otimiza¸˜o. ca
  • 48. 46 II Bienal da Sociedade Brasileira de Matem´tica a 3 2.5 2 1.5 1 1 0.8 0.6 0.4 q 0.2 0.5 0 0 0.2 0.4 0.6 p 0.8 1 0 p 0 0.2 0.4 0.6 0.8 1 1 0.8 0.6 q 0.4 0.2 0 Figura 3.2: Encontrando os equil´ ıbrios de Nash para a batalha dos sexos via um problema de otimiza¸˜o. ca
  • 49. O teorema de equil´ ıbrio de Nash 47 4 3 2 1 1 0.8 0.6 q 0.4 0.2 0 0 0.2 0.4 0.4 0.2 0.6 1 0.8 p p 0 0.6 0.8 1 1 0.8 0.6 q 0.4 0.2 0 Figura 3.3: Encontrando os equil´ ıbrios de Nash do jogo do item (d) do exemplo 1.4 via um problema de otimiza¸˜o. ca
  • 50. 48 II Bienal da Sociedade Brasileira de Matem´tica a 8 6 4 2 1 0.8 0.6 q 0.4 0.2 0 0 0.2 0.4 0.4 0.2 0.6 1 0.8 p p 0 0.6 0.8 1 1 0.8 0.6 q 0.4 0.2 0 Figura 3.4: Encontrando os equil´ ıbrios de Nash do jogo do exemplo 1.6 via um problema de otimiza¸˜o. ca
  • 51. Cap´ ıtulo 4 A forma extensa de um jogo Como vimos, a forma normal ´ usada em situa¸˜es onde os jogadores ese co colhem sua estrat´gia simultaneamente ou o fazem sem conhecer a estrat´gia e e dos outros jogadores. Existem outras situa¸˜es (como por exemplo nos mundo dos neg´cios ou co o na pol´ ıtica e em alguns jogos de cartas) em que os jogadores tomam suas decis˜es de forma seq¨encial, depois de observar a a¸˜o que um outro jogador o u ca realizou. A forma extensa tem uma estrutura mais adequada para analisar jogos desta natureza, especificando assim quem se move, quando, com qual informa¸˜o e o payoff ou ganho de cada jogador. Ela cont´m toda informa¸˜o ca e ca sobre um jogo. Existem v´rias formas de se representar um jogo da forma extensa, toa das elas tentando formalizar a id´ia de ´rvore. Entre elas: (1) rela¸˜es de e a co ordem (algo mais familiar a um matem´tico), (2) teoria de grafos [9] e (3) a alfabetos [8] (mais familiar a um cientista da computa¸˜o). Usaremos aqui ca a abordagem de alfabetos e palavras. 4.1 Representa¸˜o de um jogo via alfabetos e ´rvores ca a Um jogo na forma extensa consiste de um conjunto de jogadores N = {0, 1, 2, . . . , n}, um conjunto das a¸˜es poss´ co ıveis de cada jogador e os ganhos de cada um.
  • 52. 50 II Bienal da Sociedade Brasileira de Matem´tica a Defini¸˜o 4.1 Chamamos de alfabeto a um conjunto de letras ca Σ = {a1 , a2 , . . . , ak }. Denotamos por Σ∗ ao conjunto de palavras que podem ser formadas pelos elementos do alfabeto Σ. Uma ´rvore sobre Σ ´ um conjunto a e ∗ ∗ o T ⊆ Σ de n´s (palavras) ω ∈ Σ tal que, se ω = ω a ∈ T para algum a ∈ Σ, ent˜o ω ∈ T . a Exemplo 4.1 No jogo descrito na figura 4.1 existem quatro jogadores, um deles denominado “Natureza”. (1,-1,1) RRS Jogador 3 RR RRR (1,2,0) RRL (3,1) Jogador 2 (0,1,-1) (2,1) RL Jogador 1 R Jogador 1 RLR (2,0,0) RLL (1,2) (1,1) (1,2,3) LRR L (0,0,0) LRL (1,2) LR (2,1) (1,1,1) 1/3 LL (0,2,3) LLS Natureza (0,1) LLR LLL 1/6 (0,2,0) 1/2 (2,0,0) Figura 4.1: Um jogo descrito por uma arvore. ´ Representaremos este jogo usando o alfabeto Σ = {L, R, S}. O conjunto
  • 53. A forma extensa de um jogo 51 de palavras correspondente a este alfabeto ´: e Σ∗ = { , L, R, S, LL, LR, LS, RL, RR, RS, SL, SS, SR, LLL, LLR, . . .}, onde representa a “palavra vazia”, isto ´, a palavra sem letra alguma. A e ´rvore que representa este jogo ´ o conjunto: a e T = { , L, R, LL, LR, RL, RR, LLL, LLR, LLS, LRL, LRR, RLL, RLR, RRL, RRR, RRS}. Note que a forma extensa traz v´rias informa¸˜es sobre o jogo, como a vez a co que cada jogador joga, os movimentos dispon´ ıveis para cada um, os payoffs de cada um, etc. Para codificar estas informa¸˜es, precisaremos de mais co defini¸˜es. co Defini¸˜o 4.2 Dado um n´ ω ∈ T , definimos o conjunto dos n´s-filhos ca o o de ω, denotado por ch(ω), como sendo o conjunto ch(ω) = {ω ∈ T | ω = ωa, para algum a ∈ Σ} Exemplo 4.2 No jogo do exemplo 4.1, os n´s-filhos de cada n´ da arvore T o o ´ s˜o como se segue: a ch( ) = {L, R}, ch(L) = {LL, LR}, ch(R) = {RL, RR}, ch(LL) = {LLL, LLR, LLS}, ch(LR) = {LRL, RLR}, ch(RL) = {RLL, RLR}, ch(RR) = {RRL, RRR, RRS}. Defini¸˜o 4.3 Dado um n´ ω ∈ T , os movimentos (ou a¸˜es) disca o co pon´ ıveis para ω s˜o os elementos do conjunto a Act(ω) = {a ∈ Σ | ωa ∈ T }.
  • 54. 52 II Bienal da Sociedade Brasileira de Matem´tica a Exemplo 4.3 No jogo do exemplo 4.1, os movimentos de cada n´ da arvore T o ´ s˜o como se segue: a Act( ) = {L, R}, Act(L) = {L, R}, Act(R) = {L, R}, Act(LL) = {L, R, S}, Act(LR) = {L, R}, Act(RL) = {L, R}, Act(RR) = {L, R, S}. Defini¸˜o 4.4 Um n´-folha ou n´ terminal ω ∈ T ´ um n´ tal que ca o o e o ch(ω) = ∅. Denotaremos o conjunto de n´s folhas por o e o LT = {ω ∈ T | ω ´ n´ folha}. Exemplo 4.4 O conjunto dos n´s-folhas LT da arvore T do exemplo 4.1 ´: o ´ e LT = {LLL, LLR, LLS, LRL, LRR, RLL, RLR, RRL, RRR, RRS}. Existem n´s que n˜o s˜o controlados por nenhum jogador. Em um n´ o a a o deste tipo, nenhum dos jogadores toma decis˜es. O movimento a partir o deste n´ ´ definido por probabilidades, pela “sorte”. Ele representa, por o e exemplo, a situa¸˜o em um jogo na qual se joga um dado ou uma moeda ca para decidir que movimento fazer ou qual jogador ir´ jogar. Este fator a “sorte” ´ representado no jogo pelo jogador natureza. Usaremos a conven¸˜o e ca de que N = 0 ´ o jogador natureza. Para cada n´ do jogador natureza, e o ca ω ∈ Pl0 , define-se uma distribui¸˜o de probabilidade qω : Act(ω) → R sobre suas a¸˜es, isto ´, define-se uma fun¸˜o qω de Act(ω) em R que satisfaz as co e ca condi¸˜es co e qω (a) = 1. qω (a) ≥ 0 a∈Act(ω) Exemplo 4.5 No exemplo 4.1, se o jogador 1 escolhe L e o jogador 2 escolhe L, o pr´ximo a “jogar” ´ o jogador “natureza”. Neste n´, a distribui¸˜o de o e o ca probabilidades das jogadas poss´ ıveis ´ dada por: e qLL : Act(LL) L R S → → → → R qLL (L) = 1/2 . qLL (R) = 1/6 qLL (S) = 1/3
  • 55. A forma extensa de um jogo 53 Defini¸˜o 4.5 Denote por pl : T − LT → N ∪ {0} a fun¸˜o que associa ca ca a a cada n´ ω ∈ T − LT o jogador pl(ω) cujo movimento est´ em ω. o Assim, Pli = pl−1 (i) representa o conjunto de todos os n´s onde o jogador i faz seu movio mento. Exemplo 4.6 No exemplo 4.1, pl( ) = 1, pl(L) = 2, pl(R) = 2, pl(LL) = 0, pl(LR) = 1, pl(RL) = 1, pl(RR) = 3 e, tamb´m, e Pl1 = pl−1 (1) = { , LR, RL}, Pl3 = pl−1 (3) = {RR}, Pl2 = pl−1 (2) = {L, R}, Pl0 = pl−1 (0) = {LL}. Defini¸˜o 4.6 Uma trajet´ria (finita ou infinita) π em T ´ uma ca o e o a seq¨ˆncia π = ω0 ω1 ω2 · · · de n´s ωi ∈ T onde, se ωi+1 ∈ T , ent˜o ue o e e ωi+1 = ωi a, para algum a ∈ Σ. A trajet´ria ´ completa (ou ´ uma o o a o jogada) se ω0 = (n´ inicial) e se todo n´ n˜o-folha na trajet´ria π tem um n´-filho em π. Denotaremos o conjunto de todas as jogadas o de T por ψT . e Exemplo 4.7 No exemplo 4.1, o conjunto ψT ´ ψT = {π1 , π2 , π3 , π4 , π5 , π6 , π7 , π8 , π9 , π10 }, onde as trajet´rias s˜o: o a π1 π3 π5 π7 π9 = = = = = ( , L, LL, LLL), ( , L, LL, LLS), ( , L, LR, LRR), ( , R, RL, RLR), ( , R, RR, RRR), π2 π4 π6 π8 π10 = = = = = ( , L, LL, LLR), ( , L, LR, LRL), ( , R, RL, RLL), ( , R, RR, RRL), ( , R, RR, RRS).
  • 56. 54 II Bienal da Sociedade Brasileira de Matem´tica a Defini¸˜o 4.7 Um conjunto informa¸˜o de um jogador i ´ um conca ca e junto de n´s tal que estes n´s pertencem a um mesmo jogador i e os o o movimentos dispon´ ıveis s˜o os mesmos para cada n´ pertencente ao a o conjunto. Para cada jogador i, representaremos por infoi : Pli → N a fun¸˜o que associa a cada n´ ω ∈ Pli um ´ ca o ındice infoi (ω) para um conjunto de informa¸˜es do jogador i. Assim, co Infoi,j = info−1 (j) ´ o conjunto de n´s do j-´simo conjunto-informa¸˜o para o jogador i. e o e ca Logo, para quaisquer i,j e n´s ω, ω ∈ Infoi,j , Act(ω) = Act(ω ), ou o seja, o conjunto de poss´ ıveis a¸˜es de todos os n´s do mesmo conjuntoco o informa¸˜o ´ o mesmo. ca e Exemplo 4.8 No exemplo 4.1, info1 : Pl1 → → LR → RL → N, 1 2 2 info2 : Pl2 → N, L → 1 R → 2 info3 : Pl3 → N. RR → 1 Assim, os conjuntos Infoi,j formados pelos n´s do j-´simo conjunto-informao e c˜o do jogador i s˜o: ¸a a Info1,1 = { }, Info1,2 = {LR, RL}, Info2,1 = {L, R}, Info3,1 = {RR}. Defini¸˜o 4.8 Uma fun¸ao utilidade para o jogador i ´ uma fun¸˜o ca c˜ e ca real ui : ΨT → R definida no conjunto ΨT das jogadas completas. O valor de ui em cada jogada de ΨT determina o payoff do jogador i para esta jogada.
  • 57. A forma extensa de um jogo 55 Exemplo 4.9 As fun¸˜es utilidades de cada jogador do exemplo 4.1 s˜o: co a u1 : ΨT π1 π2 π3 π4 π5 π6 π7 π8 π9 π10 → → → → → → → → → → → R, 2 0 0 1 0 1 2 0 1 1 u2 : ΨT π1 π2 π3 π4 π5 π6 π7 π8 π9 π10 → → → → → → → → → → → R, 0 2 2 1 0 2 0 1 2 −1 u3 : ΨT π1 π2 π3 π4 π5 π6 π7 π8 π9 π10 → → → → → → → → → → → R, 0 0 3 1 0 3 0 −1 0 1 a a onde π1 , π2 , . . . , π10 s˜o as jogadas descritas no exemplo 4.7 na p´gina 50. Defini¸˜o 4.9 Uma estrat´gia pura sik , para um jogador i em um ca e o jogo G na forma extensa ´ uma fun¸˜o sik : Pli → Σ, que a cada n´ e ca ω do jogador i associa um movimento de modo que sik (ω) ∈ Act(ω) a ca e tal que se ω, ω ∈ Infoi,j , ent˜o sik (ω) = sik (ω ). Assim, a fun¸˜o e e e sik representa a k-´sima estrat´gia do jogador i, onde k varia de 1 at´ m e |Σ |, com m = | Pli |. Denotaremos por Si o conjunto das estrat´gias puras para o jogador i. Exemplo 4.10 Para o jogador 1 do exemplo 4.1 temos que Pl1 = { , LR, RL}. Considerando todas as combina¸˜es poss´ co ıveis de movimentos para este jogador, temos 8 fun¸˜es candidatas (descritas como conjuntos de pares ordenaco dos): s11 = {( , L), (LR, L), (RL, L)}, s13 = {( , L), (LR, R), (RL, L)}, s15 = {( , R), (LR, L), (LR, L)}, s17 = {( , R), (LR, R), (RL, L)}, s12 s14 s16 s18 = {( = {( = {( = {( , L), (LR, L), (RL, R)}, , L), (LR, R), (RL, R)}, , R), (LR, L), (RL, R)}, , R), (LR, R), (RL, R)}.
  • 58. 56 II Bienal da Sociedade Brasileira de Matem´tica a Como a defini¸˜o de estrat´gia pura imp˜e que si (ω) = si (ω ) sempre que ω, ca e o co a ω ∈ Infoi,j , as fun¸˜es s12 , s13 , s15 , s16 e s17 s˜o descartadas. Desta maneira, e e o conjunto S1 das estrat´gias puras para o jogador 1 ´ S1 = {s11 , s14 , s15 , s18 }. Da mesma maneira, para o jogador 2, temos que Pl2 = {L, R} e S2 = {s21 , s24 }, onde s21 = {(L, L), (R, L)} e s24 = {(L, R), (R, R)}. Para o jogador 3, temos que Pl3 = {RR} e S3 = {s31 , s34 , s33 }, onde s31 = {(RR, L)}, s32 = {(RR, R)} e s33 = {(RR, S)}. Obtivemos, assim, 4 · 2 · 3 = 24 perfis de estrat´gias puras ao todo: e s1 s3 s5 s7 s9 s11 s13 s15 s17 s19 s21 s23 = = = = = = = = = = = = (s11 , s21 , s31 ), (s11 , s21 , s33 ), (s11 , s24 , s32 ), (s14 , s21 , s31 ), (s14 , s21 , s33 ), (s14 , s24 , s32 ), (s15 , s21 , s31 ), (s15 , s21 , s33 ), (s13 , s24 , s32 ), (s18 , s21 , s31 ), (s18 , s21 , s33 ), (s18 , s24 , s32 ), s2 s4 s6 s8 s10 s12 s14 s16 s18 s20 s22 s24 = = = = = = = = = = = = (s11 , s21 , s32 ), (s11 , s24 , s31 ), (s11 , s24 , s33 ), (s14 , s21 , s32 ), (s14 , s24 , s31 ), (s14 , s24 , s33 ), (s15 , s21 , s32 ), (s15 , s24 , s31 ), (s15 , s24 , s33 ), (s18 , s21 , s32 ), (s18 , s24 , s31 ), (s18 , s24 , s33 ). Considere agora um vetor que representa um perfil de estrat´gias puras e s = (s1 , s2 , . . . , sn ) ∈ S1 × S2 × · · · × Sn . Se n˜o houver n´ pertencente ao jogador natureza (isto ´, se Pl0 = ∅), ent˜o a o e a s determina unicamente uma jogada πs do jogo e os jogadores movem de acordo com suas estrat´gias seguindo o algoritmo: e
  • 59. A forma extensa de um jogo 57 –Tome um perfil de estrat´gias puras s = (s1 , s2 , . . . , sn ). e –Fa¸a j = 0 e ω0 := c a e o c –Enquanto ωj n˜o ´ n´ terminal, fa¸a: a Se ωj ∈ Pli ,ent˜o ωj+1 := ωj si (ωj ) j := j + 1 ; –πs = ω0 ω1 · · · –O caminho π encontrado tem que ser igual ao escolhido. Se houver n´ do jogador natureza, ent˜o s ∈ S determina uma distribui¸˜o de o a ca probabilidade sobre as jogadas π do jogo. Para jogos da forma extensa finitos, isto ´, jogos onde a arvore T ´ finita, ´ poss´ calcular explicitamente a e ´ e e ıvel e probabilidade ps (π) de cada jogada π usando as probabilidades qω (a) atrav´s do seguinte algoritmo: –Tome um perfil s ∈ S1 × S2 × . . . × Sn . –Tome uma jogada π = ω0 · · · ωm de T . –Verifique se π ´ compat´ com o perfil s, usando o algoritmo acima. e ıvel –Se π n˜o for compat´ com o perfil s, ent˜o ps (π) = 0. a ıvel a –Se π ´ compat´ com o perfil s, ent˜o: e ıvel a –Se π n˜o tem n´ do jogador natureza, ent˜o ps (π) = 1. a o a –Se π tem n´ do jogador natureza, ent˜o ps (π) = r qωjk (ajk ). o a k=1 Exemplo 4.11 O leitor n˜o ter´ dificuldade de verificar que, atrav´s deste a a e algoritmo, aplicado ao jogo do exemplo 4.1, s4 , s5 , s6 determinam a jogada π4 , s10 , s11 , s12 determinam a jogada π5 , s13 , s14 , s15 determinam a jogada π6 , s19 , s20 , s21 determinam a jogada π7 , s16 , s22 determinam a jogada π8 , s17 , s23 determinam a jogada π9 e s18 , s24 determinam a jogada π10 . Observacoes. ¸˜ a o a e e 1. Se o caminho πk n˜o possui n´ natureza, ent˜o o perfil de estrat´gia que ´ compat´ com ele, determina unicamente a jogada πk , ou seja, um perfil ıvel determina uma s´ jogada. o
  • 60. 58 II Bienal da Sociedade Brasileira de Matem´tica a 2. Se o caminho πk possui n´s natureza, ent˜o o perfil de estrat´gia determina o a e a ıveis com uma distribui¸˜o de probabilidade sobre os πk s que s˜o compat´ ca ele, ou seja, um perfil pode determinar mais de uma jogada. 3. No exemplo 4.1, s1 , s2 , s3 , s7 , s8 , s9 determinam uma distribui¸˜o de proca babilidade sobre π1 , π2 e π3 . Defini¸˜o 4.10 Para um jogo na forma extensa, dado um perfil puro ca s = (s1 , s2 , . . . , sn ) ∈ S1 × S2 × · · · × Sn , podemos definir o payoff esperado para o jogador i sob s como sendo o n´mero u ps (π) ∗ ui (π). hi (s) = π∈ΨT Exemplo 4.12 No jogo do exemplo 4.1, ps1 (π) ∗ u1 (π) = h1 (s1 ) = π∈ΨT 1 1 1 · 2 + · 0 + · 0 + 0 · 1 + 0 · 0 + ··· + 0 · 0 = 1 2 6 3 e ps3 (π) ∗ u1 (π) = 1. h1 (s3 ) = π∈ΨT 4.2 Convers˜o entre as formas normal e extensa a Todo jogo estrat´gico finito Γ pode ser convertido em um jogo na forma e extensa GΓ . Por exemplo, o jogo Pedra-Papel-Tesoura com dois jogadores, que ´ um jogo onde os jogadores escolhem suas estrat´gias simultaneamente, e e tem a seguinte matriz de payoffs:
  • 61. A forma extensa de um jogo 59 Pedra Tesoura Pedra ( 0, 0) (−1, 1) ( 1, −1) Papel ( 1, −1) ( 0, 0) (−1, 1) Tesoura J1 J2 Papel (−1, 1) ( 1, −1) ( 0, 0) Neste jogo, o segundo jogador n˜o sabe a estrat´gia do primeiro e vicea e versa, portanto o conjunto de informa¸˜es do segundo jogador possui trˆs co e n´s. A forma extensa deste jogo ´ a ´rvore da figura 4.2. o e a (0,0) Te J2 Pp (-1,1) (2,1) Pd (1,-1) Te (1,-1) Te J1 Pp Pp (0,0) (2,1) (1,1) Pd (-1,1) Pd (-1,1) Te Pp (1,-1) (2,1) Pd (0,0) Figura 4.2: O jogo Pedra (Pd)-Papel (Pp)-Tesoura (Te). Reciprocamente, todo jogo da forma extensa G pode ser visto como um jogo da forma estrat´gica ΓG . Geralmente, o jogo na forma normal ΓG fica e muito maior do que na forma extensa. Para se ter uma id´ia, se o jogador i e a u e possuir m n´s na arvore, isto ´, se |P li | = m, ent˜o o n´mero de estrat´gias o ´ e
  • 62. 60 II Bienal da Sociedade Brasileira de Matem´tica a puras para um jogador i ´, no pior caso, |Σ|m . Note que se o jogo da forma e extensa G ´ finito, ou seja, se a arvore ´ finita, ent˜o o jogo na forma normal e ´ e a ´ tamb´m finito. Realizamos a convers˜o da forma extensa G para a normal e e a ΓG da seguinte forma: e a co (1) Em ΓG , as estrat´gias para o jogador i s˜o as aplica¸˜es si ∈ Si . (2) Em ΓG , definimos o payoff ui (s) := hi (s), para todo perfil de estrat´gia pura s. e Vejamos como fica, na forma normal, o jogo na forma extensa do exemplo 4.1. Se o jogador 3 escolhe a estrat´gia s31 , temos a matriz: e j1 s11 s15 s18 s21 j2 s14 ( 1, 1, 1) ( 1, 1, 1) ( 1, 2, 3) ( 2, 0, 0) s24 ( 1, 1, 1) ( 0, 0, 0) ( 0, 1, −1) ( 0, 1, −1) Se o jogador 3 escolhe a estrat´gia s32 , temos a matriz: e j1 s11 s15 s18 s21 j2 s14 ( 1, 1, 1) ( 1, 1, 1) ( 1, 2, 3) ( 2, 0, 0) s24 ( 1, 1, 1) ( 0, 0, 0) ( 1, 2, 0) ( 1, 2, 0) Se o jogador 3 escolhe a estrat´gia s33 , temos a matriz: e j1 s11 s15 s18 s21 j2 s14 ( 1, 1, 1) ( 1, 1, 1) ( 1, 2, 3) ( 2, 0, 0) s24 ( 1, 1, 1) ( 0, 0, 0) ( 1, −1, 1) ( 1, −1, 1)
  • 63. Bibliografia [1] C. Bouton, Nim, a Game with a Complete Mathematical Solution. Annals of Mathematics, pp. 35-39, 1902. [2] E. R. Berlekamp, J. H. Conway e R. K. Guy, Winning Ways for Your Mathematical Plays, Vol. 2. Academic Press, New York, 1984. [3] A. A. Cournot, Recherches sur les Principes Math´matiques de la e Th´orie des Richesses, 1838. Traduzido por N. T. Bacon em Researches e into the Mathematical Principles of the Theory of Wealth, McMillan, New York, 1927. [4] J. Conway, All Games Brigth and Beautiful. The American Mathematical Monthly, pp. 417–434, 1977. [5] J. Conway, A Gamut of Game and Theories. Mathematics Magazine, pp. 5–12, 1978. [6] J. Conway e R. Guy, The Book of Numbers. Springer-Verlag, New York, 1996. [7] J. Conway, On Numbers and Games, Second Edition. A. K. Peters, Natick, 2000. [8] K. Etessami, Algorithmic Game Theory and Aplications. Lecture Notes, School of Informatics, The University of Edinburgh, Scotland, UK, 2004. [9] S. Hart, Games in Extensive and Strategic Forms. Cap´ ıtulo 2 em Handbook of Game Theory, vol. 1, R. J. Aumann e S. Hart (editores), Elsevier Science Publishers, 1992. [10] C. H. H¨nig, Aplica¸oes da Topologia ` An´lise. IMPA, CNPq, Rio de o c˜ a a Janeiro, 1986.
  • 64. 62 II Bienal da Sociedade Brasileira de Matem´tica a [11] D. Knuth, Surreal Numbers. Addison Wesley, 1974. [12] D. G. Luenberger, Linear and Nonlinear Programming, Second Edition. Addision-Wesley Publishing Company, 1989. [13] J. F. Nash Jr., Equilibrium Points in n-person Games. Proceedings of the National Academy of Sciences of the United States of America, pp. 48–49, 1950. [14] J. F. Nash Jr., Non-Cooperative Games. PhD. Thesis. Princeton University Press, 1950. [15] J. F. Nash Jr., The Bargaining Problem. Econometrica, pp. 155–162, 1950. [16] J. F. Nash Jr., Non-Cooperative Games. Annals of Mathematics, pp. 286–295, 1951. [17] J. F. Nash Jr., Two-person Cooperative Games. Econometrica, pp. 128– 140, 1953. [18] J. von Neumann. Zur Theorie der Gesellschaftsspiele. Mathematische Annalen, vol. 100, pp. 295-320. Traduzido por S. Bargmann: On the Theory of Games of Stategy em Contributions to the Theory of Games, vol. 4, pp. 13-42, A. W. Tucker e R. D. Luce (editores), Princeton University Press, 1959. [19] J. von Neumann e O. Morgenstern, Theory of Games and Economic Behavior. Princeton University Press, 1944. ¨ [20] R. Sprague, Uber Mathematische Kampfspiele. Tohoku Mathematical Journal, pp. 438-441, 1935-1936. ¨ [21] E. Zermelo, Uber eine Anwendung der Mengdenlehre auf die theories des Schachspiels. Atas do D´cimo Quinto Congresso Internacional de e Matem´ticos, vol. 2, pp. 501–504, 1913. a