• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Introdução a teoria dos jogos
 

Introdução a teoria dos jogos

on

  • 1,354 views

 

Statistics

Views

Total Views
1,354
Views on SlideShare
1,354
Embed Views
0

Actions

Likes
0
Downloads
42
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Introdução a teoria dos jogos Introdução a teoria dos jogos Document Transcript

    • Uma Introdução a Teoria dos JogosBrígida Alexandre Sartini, Gilmar Garbugio, Humberto José Bortolossi Polyane Alves Santos e Larissa Santana Barreto II Bienal da SBM Universidade Federal da Bahia 25 a 29 de outubro de 2004
    • ´ Sumario1 Descri¸˜o informal da teoria dos jogos ca 1 1.1 Introdu¸˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . ca 1 1.2 Hist´ria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o 2 1.3 O que ´ um jogo? . . . . . . . . . . . . . . . . . . . . . . . . e 4 1.4 Solu¸˜es de um jogo . . . . . . . . . . . . . . . . . . . . . . co 8 1.5 Estrat´gias mistas . . . . . . . . . . . . . . . . . . . . . . . . e 12 1.6 Solu¸˜es em estrat´gias mistas . . . . . . . . . . . . . . . . . co e 15 1.7 Existˆncia de solu¸˜es . . . . . . . . . . . . . . . . . . . . . e co 232 O teorema minimax de von Neumann 24 2.1 Jogos de soma constante com dois jogadores . . . . . . . . . 24 2.2 Equil´ ıbrio de Nash em estrat´gias puras . . . . . . . . . . . . e 26 2.3 Equil´ ıbrio de Nash em estrat´gias mistas . . . . . . . . . . . e 29 2.4 O teorema minimax de von Neumann . . . . . . . . . . . . . 313 O teorema de equil´ ıbrio de Nash 384 A forma extensa de um jogo 49 4.1 Representa¸˜o de um jogo via alfabetos e arvores . . . . . . ca ´ 49 4.2 Convers˜o entre as formas normal e extensa . . . . . . . . . a 58Bibliografia 61
    • Cap´ ıtulo 1Descri¸˜o informal da teoria dos jogos ca1.1 Introdu¸˜o ca A teoria dos jogos ´ uma teoria matem´tica criada para se modelar e afenˆmenos que podem ser observados quando dois ou mais “agentes de de- ocis˜o” interagem entre si. Ela fornece a linguagem para a descri¸˜o de proces- a casos de decis˜o conscientes e objetivos envolvendo mais do que um indiv´ a ıduo. A teoria dos jogos ´ usada para se estudar assuntos tais como elei¸˜es, e coleil˜es, balan¸a de poder, evolu¸˜o gen´tica, etc. Ela ´ tamb´m uma teoria o c ca e e ematem´tica pura, que pode e tem sido estudada como tal, sem a necessidade ade relacion´-la com problemas comportamentais ou jogos per se. a Algumas pessoas acreditam que a teoria dos jogos formar´ em algum dia ao alicerce de um conhecimento t´cnico estrito de como decis˜es s˜o feitas e de e o acomo a economia funciona. O desenvolvimento da teoria ainda n˜o atingiu aeste patamar e, hoje, a teoria dos jogos ´ mais estudada em seus aspectos ematem´ticos puros e, em aplica¸˜es, ela ´ usada como uma ferramenta ou a co ealegoria que auxiliam no entendimento de sistemas mais complicados. Neste texto trataremos da Teoria Econˆmica dos Jogos, que n˜o deve ser o aconfundida com a Teoria Combinat´ria dos Jogos [4, 11, 5, 2, 6, 7], iniciada opor Sprague [20] e Grundy na d´cada de 30. Enquanto que a primeira tem emotiva¸˜es predominante econˆmicas e procura estabelecer m´todos para co o ese maximizar o ganho (payoff ), a segunda se concentra nos aspectos com-binat´rios de jogos de mesa (por exemplo, ser o jogador a fazer o ultimo o ´
    • 2 II Bienal da Sociedade Brasileira de Matem´tica a movimento em um jogo de nim [1]) e n˜o permite “elementos imprevis´ a ıveis” como o lan¸amento de um dado ou o baralhamento de cartas. c 1.2 Hist´ria o Registros antigos sobre teoria dos jogos remontam ao s´culo XVIII. Em e correspondˆncia dirigida a Nicolas Bernoulli, James Waldegrave analisa um e jogo de cartas chamado “le Her ” e fornece uma solu¸˜o que ´ um equil´ ca e ıbrio de estrat´gia mista (conceito que nos familiarizaremos posteriormente). Con- e tudo, Waldegrave n˜o estendeu sua abordagem para uma teoria geral. No a in´ do s´culo XIX, temos o famoso trabalho de Augustin Cournot sobre ıcio e duop´lio [3]. Em 1913, Ernst Zermelo publicou o primeiro teorema ma- o tem´tico da teoria dos jogos [21], o teorema afirma que o jogo de xadrez ´ a e estritamente determinado, isto ´, em cada est´gio do jogo pelo menos um dos e a jogadores tem uma estrat´gia em m˜o que lhe dar´ a vit´ria ou conduzir´ e a a o a o jogo ao empate. Outro grande matem´tico que se interessou em jogos foi a Emile Borel, que reinventou as solu¸˜es minimax e publicou quatro artigos co sobre jogos estrat´gicos. Ele achava que a guerra e a economia podiam ser e estudadas de uma maneira semelhante. Figura 1.1: Ernst Zermelo. Em seu in´ıcio, a teoria dos jogos chamou pouca aten¸˜o. O grande ma- ca tem´tico John von Neumann mudou esta situa¸˜o. Em 1928, ele demonstrou a ca que todo jogo finito de soma zero com duas pessoas possui uma solu¸ao em c˜
    • Descri¸˜o informal da teoria dos jogos ca 3estrat´gias mistas [18]. A demonstra¸˜o original usava topologia e an´lise e ca a Figura 1.2: John von Neumann.funcional e era muito complicada de se acompanhar. Em 1937, ele forne-ceu uma nova demonstra¸˜o baseada no teorema do ponto fixo de Brouwer. caJohn von Neumann, que trabalhava em muitas areas da ciˆncia, mostrou in- ´ eteresse em economia e, junto com o economista Oscar Morgenstern, publicouo cl´ssico “The Theory of Games and Economic Behaviour ” [19] em 1944 e, acom isto, a teoria dos jogos invadiu a economia e a matem´tica aplicada. a Figura 1.3: Oscar Morgenstern. Em 1950, o matem´tico John Forbes Nash J´nior publicou quatro artigos a uimportantes para a teoria dos jogos n˜o-cooperativos e para a teoria de bar- aganha. Em “Equilibrium Points in n-Person Games” [14] e “Non-cooperative
    • 4 II Bienal da Sociedade Brasileira de Matem´tica a Games” [16], Nash provou a existˆncia de um equil´ e ıbrio de estrat´gias mistas e para jogos n˜o-cooperativos, denominado equil´brio de Nash, e sugeriu uma a ı abordagem de estudo de jogos cooperativos a partir de sua redu¸ao para a c˜ forma n˜o-cooperativa. Nos artigos “The Bargaining Problem” [15] e “Two- a Person Cooperative Games” [17], ele criou a teoria de barganha e provou a existˆncia de solu¸˜o para o problema da barganha de Nash. e ca Figura 1.4: John Forbes Nash. Em 1994, John Forbes Nash Jr. (Universidade de Princeton), John Har- sanyi Universidade de Berkeley, California) e Reinhard Selten (Universidade de Bonn, Alemanha) receberam o prˆmio Nobel por suas contribui¸˜es para e co a Teoria dos Jogos. 1.3 O que ´ um jogo? e A teoria dos jogos pode ser definida como a teoria dos modelos ma- tem´ticos que estuda a escolha de decis˜es ´timas sob condi¸oes de conflito. a o o c˜ O elemento b´sico em um jogo ´ o conjunto de jogadores que dele partici- a e pam. Cada jogador tem um conjunto de estrat´gias. Quando cada jogador e escolhe sua estrat´gia, temos ent˜o uma situa¸˜o ou perfil no espa¸o de todas e a ca c as situa¸˜es (perfis) poss´ co ıveis. Cada jogador tem interesse ou preferˆncias e para cada situa¸˜o no jogo. Em termos matem´ticos, cada jogador tem uma ca a
    • Descri¸˜o informal da teoria dos jogos ca 5 Figura 1.5: John Harsanyi. Figura 1.6: Reinhart Selten.
    • 6 II Bienal da Sociedade Brasileira de Matem´tica a fun¸˜o utilidade que atribui um n´mero real (o ganho ou payoff do jogador) ca u a cada situa¸˜o do jogo. ca Mais especificamente, um jogo tem os seguintes elementos b´sicos: existe a um conjunto finito de jogadores, representado por G = {g1 , g2 , . . . , gn }. Cada jogador gi ∈ G possui um conjunto finito Si = {si1 , si2 , . . . , simi } de op¸˜es, denominadas estrat´gias puras do jogador gi (mi ≥ 2). Um ve- co e tor s = (s1j1 , s2j2 , . . . , snjn ), onde siji ´ uma estrat´gia pura para o jogador e e gi ∈ G, ´ denominado um perfil de estrat´gia pura. O conjunto de todos os e e perfis de estrat´gia pura formam, portanto, o produto cartesiano e n S= Si = S1 × S 2 × · · · × S n , i=1 denominado espa¸o de estrat´gia pura do jogo. Para jogador gi ∈ G, existe c e uma fun¸˜o utilidade ca ui : S → R s → ui (s) que associa o ganho (payoff) ui (s) do jogador gi a cada perfil de estrat´gia e pura s ∈ S. Exemplo 1.1 (O dilema do prisioneiro) Possivelmente o exemplo mais conhecido na teoria dos jogos ´ o dilema do prisioneiro. Ele foi formulado por e Albert W. Tucker em 1950, em um semin´rio para psic´logos na Universidade a o de Stanford, para ilustrar a dificuldade de se analisar certos tipos de jogos. A situa¸˜o ´ a seguinte: dois ladr˜es, Al e Bob, s˜o capturados e acusados ca e o a de um mesmo crime. Presos em selas separadas e sem poderem se comunicar entre si, o delegado de plant˜o faz seguinte proposta: cada um pode escolher a entre confessar ou negar o crime. Se nenhum deles confessar, ambos ser˜o a submetidos a uma pena de 1 ano. Se os dois confessarem, ent˜o ambos ter˜o a a pena de 5 anos. Mas se um confessar e o outro negar, ent˜o o que confessou a ser´ libertado e o outro ser´ condenado a 10 anos de pris˜o. Neste contexto, a a a temos G = {Al, Bob}, SAl = {confessar, negar}, SBob = {confessar, negar}, S = {(confessar, confessar), (confessar, negar), (negar, confessar), (negar, negar)}. As duas fun¸˜es utilidade co
    • Descri¸˜o informal da teoria dos jogos ca 7 uAl : S → R e uBob : S → Rs˜o dadas por a uAl (confessar, confessar) = −5, uAl (confessar, negar) = 0, uAl (negar, confessar) = −10, uAl (negar, negar) = −1,(que representam os ganhos (payoffs) de Al) e uBob (confessar, confessar) = −5, uBob (confessar, negar) = −10, uBob (negar, confessar) = 0, uBob (negar, negar) = −1 ´(que representam os ganhos (payoffs) de Bob). E uma pr´tica se represen- atar os payoffs dos jogadores atrav´s de uma matriz, denominada matriz de epayoffs. Bob confessar negar confessar (−5, −5) (0, −10) Al negar (−10, 0) (−1, −1)Nesta matriz, os n´meros de cada c´lula representam, respectivamente, os u epayoffs de Al e Bob para as escolhas de Al e Bob correspondentes a c´lula. eExemplo 1.2 (A batalha dos sexos) Um homem e a sua mulher de-sejam sair para passear. O homem prefere assistir a um jogo de futebolenquanto que sua mulher prefere ir ao cinema. Se eles forem juntos para ofutebol, ent˜o o homem tem satisfa¸˜o maior do que a mulher. Por outro a calado, se eles forem juntos ao cinema, ent˜o a mulher tem satisfa¸˜o maior a cado que o homem. Finalmente, se eles sa´ ırem sozinhos, ent˜o ambos ficam aigualmente insatisfeitos. Esta situa¸˜o tamb´m pode ser modelada como um ca ejogo estrat´gico. Temos: eG = {homem, mulher}, Shomem = {futebol, cinema}, Smulher = {futebol, cinema}, S = {(futebol, futebol), (futebol, cinema), (cinema, futebol), (cinema, cinema)}.As duas fun¸˜es utilidade uhomem : S → R e umulher : S → R s˜o descritas co apela seguinte matriz de payoffs:
    • 8 II Bienal da Sociedade Brasileira de Matem´tica a Mulher futebol cinema futebol (10, 5) (0, 0) Homem cinema (0, 0) (5, 10) 1.4 Solu¸˜es de um jogo co Uma solu¸˜o de um jogo ´ uma prescri¸˜o ou previs˜o sobre o resultado ca e ca a do jogo. Existem v´rios conceitos diferentes de solu¸˜o. Nesta se¸˜o, inves- a ca ca tigaremos os dois conceitos mais comuns: dominˆncia e equil´brio de Nash. a ı Considere o dilema do prisioneiro. Como encontrar uma solu¸˜o para oca dilema de Bob e Al, isto ´, que estrat´gias s˜o plaus´ e e a ıveis se os dois prisioneiros 1 querem minimizar o tempo de cadeia? Se analisarmos o jogo do ponto de vista de Al, ele pode raciocinar da seguinte maneira: “Duas coisas podem acontecer: Bob pode confessar ou Bob pode ne- gar. Se Bob confessar, ent˜o ´ melhor para mim confessar tamb´m. a e e Se Bob n˜o confessar, ent˜o eu fico livre se eu confessar. Em a a qualquer um dos casos, ´ melhor para mim confessar. Ent˜o, eu e a confessarei.” Se analisarmos agora o jogo do ponto de vista de Bob, podemos aplicar a mesma linha de racioc´ ınio e concluir que Bob tamb´m ir´ confessar. Assim, e a ambos confessar˜o e ficar˜o presos por 5 anos. a a Em termos da teoria dos jogos, dizemos que os dois jogadores possuem uma estrat´gia dominante, isto ´, todas menos uma estrat´gia ´ estritamente e e e e dominada, que o jogo ´ resol´vel por dominˆncia estrita iterada e que o e u a jogo termina em uma solu¸˜o que ´ um equil´brio de estrat´gia dominante, ca e ı e conceitos que definiremos a seguir. 1 No exemplo 1.1, os payoffs foram definidos como n´meros ≤ 0. Desta maneira, minimizar o tempo de u cadeia ´ equivalente a maximizar o payoff. e
    • Descri¸˜o informal da teoria dos jogos ca 9Dominˆncia a Freq¨entemente, iremos discutir perfis de estrat´gia na qual apenas a u eestrat´gia de um unico jogador gi ∈ G ir´ variar, enquanto que as estrat´gias e ´ a ede seus oponentes permanecer˜o fixas. Denote por a s−i = (s1j1 , . . . , s(i−1)ji−1 , s(i+1)ji+1 , . . . , snjn ) ∈ S−i = S1 × · · · × Si−1 × Si+1 × · · · × Snuma escolha de estrat´gia para todos os jogadores, menos o jogador gi . Desta emaneira, um perfil de estrat´gia pode ser convenientemente denotado por e s = (siji , s−i ) = (s1j1 , . . . , s(i−1)ji−1 , siji , s(i+1)ji+1 , . . . , snjn ). ´ Defini¸˜o 1.1 (Estrategia Pura Estritamente Dominada) ca Uma estrat´gia pura sik ∈ Si do jogador gi ∈ G ´ estritamente do- e e minada pela estrat´gia sik′ ∈ Si se e ui (sik′ , s−i ) > ui (sik , s−i ), para todo s−i ∈ S−i . A estrat´gia sik ∈ Si ´ fracamente dominada pela e e estrat´gia sik′ ∈ Si se ui (sik′ , s−i ) ≥ ui (sik , s−i ), para todo s−i ∈ S−i . e Dominˆncia estrita iterada nada mais ´ do um processo onde se eliminam a eas estrat´gias que s˜o estritamente dominadas. e aExemplo 1.3 Considere o jogo determinado pela matriz de payoffs abaixo. g2 s21 s22 s23 s24 s11 (5, 2) (2, 6) (1, 4) (0, 4) g1 s12 (0, 0) (3, 2) (2, 1) (1, 1) s13 (7, 0) (2, 2) (1, 1) (5, 1) s14 (9, 5) (1, 3) (0, 2) (4, 8)
    • 10 II Bienal da Sociedade Brasileira de Matem´tica a Neste jogo, para o jogador g2 , a estrat´gia s21 ´ estritamente dominada pela e e estrat´gia s24 , assim, a primeira coluna da matriz pode ser eliminada. e g2 s22 s23 s24 s11 (2, 6) (1, 4) (0, 4) g1 s12 (3, 2) (2, 1) (1, 1) s13 (2, 2) (1, 1) (5, 1) s14 (1, 3) (0, 2) (4, 8) Agora, nesta matriz reduzida, para o jogador g1 , as estrat´gias s11 e s14 s˜o e a estritamente dominadas pelas estrat´gias s12 e s13 , respectivamente. Por- e tanto, as linhas 1 e 4 podem ser eliminadas. Al´m disso, a estrat´gia s23 do e e jogador g2 ´ estritamente dominada pelas estrat´gia s22 . Assim, a coluna 2 e e tamb´m pode ser eliminada. Obtemos ent˜o uma matriz reduzida 2 × 2. e a g2 s22 s24 s12 (3, 2) (1, 1) g1 s13 (2, 2) (5, 1) Finalmente, a estrat´gia s24 do jogador g2 ´ estritamente dominada pela e e estrat´gia s22 e, na matriz 2 × 1 resultante, a estrat´gia s13 do jogador g1 e e ´ estritamente dominada pela estrat´gia s12 . Vemos ent˜o que o resultado e e a do jogo ´ (3, 2), isto ´, o jogador g1 escolhe a estrat´gia s12 e o jogador g2 e e e escolhe a estrat´gia s22 . e No exemplo acima, a t´cnica de dominˆncia estrita iterada forneceu um e a unico perfil de estrat´gia como solu¸˜o do jogo, no caso, o perfil ´ e ca (s12 , s22 ).
    • Descri¸˜o informal da teoria dos jogos ca 11Contudo, pode acontecer da t´cnica fornecer v´rios perfis ou, at´ mesmo, e a efornecer todo o espa¸o de estrat´gia, como ´ o caso da batalha dos sexos, c e eonde n˜o existem estrat´gias estritamente dominadas. a eSolu¸˜o estrat´gica ou equil´ ca e ıbrio de Nash Uma solu¸˜o estrat´gica ou equil´brio de Nash de um jogo ´ um ponto ca e ı eonde cada jogador n˜o tem incentivo de mudar sua estrat´gia se os demais a ejogadores n˜o o fizerem. a Defini¸˜o 1.2 (Equil´ ca ıbrio de Nash) Dizemos que um perfil de es- trat´gia e s∗ = (s∗ , . . . , s∗ , s∗ , s∗ , . . . , s∗ ) ∈ S 1 (i−1) i (i+1) n ´ um equil´brio de Nash se e ı ui (s∗ , s∗ ) ≥ ui (siji , s∗ ) i −i −i para todo i = 1, . . . , n e para todo ji = 1, . . . , mi , com mi ≥ 2.Exemplo 1.4(a) No dilema do prisioneiro (exemplo 1.1), o perfil de estrat´gia (confessar, e confessar) ´ um equil´ e ıbrio de Nash. De fato: se um prisioneiro confessar e o outro n˜o, aquele que n˜o confessou fica preso na cadeia 10 anos, ao a a inv´s de 5 anos, se tivesse confessado. Al´m desse perfil, n˜o existem e e a outros equil´ıbrios de Nash.(b) Na batalha dos sexos (exemplo 1.2), os perfis de estrat´gia (futebol, e futebol) e (cinema, cinema) s˜o os unicos equil´ a ´ ıbrios de Nash do jogo.(c) No exemplo 1.3, o unico equil´ ´ ıbrio de Nash do jogo ´ o perfil de es- e trat´gia (s12 , s22 ). e(d) Existem jogos que n˜o possuem equil´ a ıbrios de Nash em estrat´gias puras. e Este ´ o caso do jogo de combinar moedas (matching pennies). Nesse e jogo, dois jogadores exibem, ao mesmo tempo, a moeda que cada um esconde em sua m˜o. Se ambas as moedas apresentam cara ou coroa, a o segundo jogador d´ sua moeda para o primeiro. Se uma das moedas a
    • 12 II Bienal da Sociedade Brasileira de Matem´tica a apresenta cara, enquanto a outra apresenta coroa, ´ a vez do primeiro e jogador dar sua moeda pra o segundo. Esse jogo se encontra representado por sua matriz de payoffs dada abaixo. g2 s21 s22 s11 (+1, −1) (−1, +1) g1 s12 (−1, +1) (+1, −1) 1.5 Estrat´gias mistas e Como vimos no jogo de combinar de moedas do exemplo 1.4 (d) acima, existem jogos que n˜o possuem equil´ a ıbrios de Nash em estrat´gias puras. e Uma alternativa para estes casos ´ a de considerar o jogo do ponto de vista e probabil´ ıstico, isto ´, ao inv´s de escolher um perfil de estrat´gia pura, o e e e jogador deve escolher uma distribui¸˜o de probabilidade sobre suas estrat´gias ca e puras. Uma estrat´gia mista pi para o jogador gi ∈ G ´ uma distribui¸˜o de e e ca probabilidades sobre o conjunto Si de estrat´gias puras do jogador, isto ´, e e pi ´ um elemento do conjunto e mi mi ∆ mi = (x1 , . . . , xmi ) ∈ R | x1 ≥ 0, . . . , xmi ≥ 0 e xk = 1 . k=1 Assim, se pi = (pi1 , pi2 , . . . , pimi ), ent˜o a mi pi1 ≥ 0, pi2 ≥ 0, ..., pimi ≥ 0 e pik = 1. k=1 Note que cada ∆mi ´ um conjunto compacto e convexo. Nas figuras 1.7 e e 1.8 temos os desenhos de ∆2 e ∆3 , respectivamente. Os pontos extremos (v´rtices) de ∆mi , isto ´, os pontos da forma e e e1 = (1, 0, . . . , 0, 0), e2 = (0, 1, . . . , 0, 0), ..., emi = (0, 0, . . . , 0, 1)
    • Descri¸˜o informal da teoria dos jogos ca 13d˜o, respectivamente, probabilidade 1 as estrat´gias puras si1 , si2 , . . . , simi . a ` eDesta maneira, podemos considerar a distribui¸˜o de probabilidade ek como caa estrat´gia mista que representa a estrat´gia pura sik do jogador gi . e e x2 1 0 1 x1 Figura 1.7: ∆2 = {(x1 , x2 ) ∈ R2 | x1 ≥ 0, x2 ≥ 0 e x1 + x2 = 1}. O espa¸o de todos os perfis de estrat´gia mista ´ o produto cartesiano c e e ∆ = ∆m1 × ∆m2 × · · · × ∆mn ,denominado espa¸o de estrat´gia mista. Um vetor p ∈ ∆ ´ denominado c e eum perfil de estrat´gia mista. Como no caso de estrat´gias puras, usaremos e ea nota¸˜o p−i para representar as estrat´gias de todos os jogadores, com ca eexce¸˜o do jogador gi . ca Como o produto cartesiano de conjuntos compactos e convexos ´ compacto ee convexo, vemos que ∆ ´ compacto e convexo. e Cada perfil de estrat´gia mista p = (p1 , . . . , pn ) ∈ ∆ determina um payoff eesperado, uma m´dia dos payoffs ponderada pelas distribui¸˜es de probabi- e colidades p1 , . . . , pn . Mais precisamente, se p = (p1 , p2 , . . . , pn ) = (p11 , p12 , . . . , p1m1 ; p21 , p22 , . . . , p2m2 ; . . . ; pn1 , pn2 , . . . , pnmn ), p1 p2 pnent˜o a
    • 14 II Bienal da Sociedade Brasileira de Matem´tica a x3 1 0 1 x2 1 x1 Figura 1.8: ∆3 = {(x1 , x2 , x3 ) ∈ R3 | x1 ≥ 0, x2 ≥ 0, x3 ≥ 0 e x1 + x2 + x3 = 1}. m1 m2 mn n ui (p) = ··· pkjk ui (s1j1 , s2j2 , . . . , snjn ) . j1 =1 j2 =1 jn =1 k=1 Assim, no item (d) do exemplo 1.4, se g1 escolhe a distribui¸˜o de proba- ca bilidade p1 = (1/4, 3/4) e g2 escolhe a distribui¸˜o de probabilidade p2 = ca (1/3, 2/3), ent˜o os payoffs esperados associados ao perfil de estrat´gia mista a e p = (p1 , p2 ) = (1/4, 3/4; 1/3, 2/3) s˜o dados por a 2 2 2 u1 (p) = pkjk u1 (s1j1 , s2j2 ) j1 =1 j2 =1 k=1 = p11 p21 u1 (s11 , s21 ) + p22 u1 (s11 , s22 ) + p12 p21 u1 (s12 , s21 ) + p22 u1 (s12 , s22 ) 1 1 2 3 1 2 1 = (+1) + (−1) + (−1) + (+1) = + 4 3 3 4 3 3 6
    • Descri¸˜o informal da teoria dos jogos ca 15e, analogamente, 2 2 2 u2 (p) = pkjk u2 (s1j1 , s2j2 ) j1 =1 j2 =1 k=1 = p11 p21 u2 (s11 , s21 ) + p22 u2 (s11 , s22 ) + = p12 p21 u2 (s12 , s21 ) + p22 u2 (s12 , s22 ) 1 1 2 3 1 2 1 = (−1) + (+1) + (+1) + (−1) = − . 4 3 3 4 3 3 61.6 Solu¸˜es em estrat´gias mistas co e Todos os crit´rios b´sicos para solu¸˜es de jogos em estrat´gias puras e a co epodem ser estendidos para estrat´gias mistas. eDominˆncia estrita iterada a (0) ca ˆ Defini¸˜o 1.3 (Dominancia estrita iterada) Sejam Si = Si e (0) ∆mi = ∆mi . Defina, recursivamente, (n) (n−1) (n−1) Si = {s ∈ Si | ∄p ∈ ∆mi tal que (n−1) ∀s−i ∈ S−1 , ui (p, s−i ) > ui (s, s−i )} e ∆(n) = {p = (p1 , . . . , pmi ) ∈ ∆mi | mi (n) ∀k = 1, . . . , mi , pk > 0 somente se sik ∈ Si }, onde, por abuso de nota¸˜o, ui (p, s−i ) representa o payoff esperado ca quando o jogador gi escolhe a estrat´gia mista p e os demais jogadores e escolhem as estrat´gias mistas correspondentes as estrat´gias puras e e dadas por s−i . A interse¸˜o ca
    • 16 II Bienal da Sociedade Brasileira de Matem´tica a ∞ (n) Si∞ = Si n=0 ´ o conjunto de estrat´gias puras e e e ∆∞i = {p ∈ ∆mi | m (∞) ∄p′ ∈ ∆mi tal que ∀s−i ∈ S−i , ui (p′ , s−i ) > ui (p, si )} ´ o conjunto de todas as estrat´gias mistas do jogador gi que sobrevi- e e veram a t´cnica de dominˆncia estrita iterada. e a Equil´ ıbrio de Nash Defini¸˜o 1.4 (Equil´ ca ıbrio de Nash) Dizemos que um perfil de es- trat´gia mista e p∗ = (p∗ , p∗ , . . . , p∗ ) ∈ ∆ = ∆m1 × ∆m2 × · · · × ∆mn 1 2 n ´ um equil´brio de Nash se e ı ui (p∗ , p∗ ) ≥ ui (p, p∗ ) i −i −i para todo p ∈ ∆mi , isto ´, nenhum jogador sente motiva¸˜o de trocar e ca sua estrat´gia mista se os demais jogadores n˜o o fizerem. e a Exemplo 1.5 (a) No dilema do prisioneiro (exemplo 1.1), o perfil de estrat´gia mista e p∗ = (p∗ , p∗ ) = (1, 0; 1, 0) 1 2 ´ um equil´ e ıbrio de Nash, pois u1 (p, p∗ ) = u1 (p, 1 − p; 1, 0) = 5p − 10 ≤ −5 = u1 (1, 0; 1, 0) = u1 (p∗ , p∗ ) 2 1 2 para todo p = (p, 1 − p) ∈ ∆2 e u2 (p∗ , q) = u2 (1, 0; q, 1 − q) = 5q − 10 ≤ −5 = u2 (1, 0; 1, 0) = u2 (p∗ , p∗ ) 1 1 2
    • Descri¸˜o informal da teoria dos jogos ca 17 para todo q = (q, 1−q) ∈ ∆2 . Observe que este equil´ ıbrio corresponde ao ∗ equil´ ıbrio em estrat´gias puras s = (confessar, confessar). Mostraremos e mais adiante que este ´ o unico equil´ e ´ ıbrio de Nash em estrat´gias mistas e do jogo.(b) Na batalha dos sexos (exemplo 1.2), os equil´ ıbrios de Nash em estrat´gias e mistas s˜o a (1, 0; 1, 0) e (0, 1; 0, 1), correspondentes aos equil´ ıbrios de Nash em estrat´gias puras (futebol, e futebol) e (cinema, cinema), respectivamente, ´ o ponto e (2/3, 1/3; 1/3, 2/3). Mostraremos mais adiante que estes s˜o os unicos equil´ a ´ ıbrios de Nash em estrat´gias mistas do jogo. e(c) No exemplo 1.3, o unico equil´ ´ ıbrio de Nash em estrat´gia mista ´ o ponto e e (0, 1, 0, 0; 0, 1, 0, 0) ıbrio de Nash (s12 , s22 ) em estrat´gias puras. que corresponde ao equil´ e(d) No jogo de combinar de moedas do exemplo 1.4 (d), o unico equil´ ´ ıbrio de Nash em estrat´gias mistas ´ o ponto e e (1/2, 1/2; 1/2, 1/2).Exemplo 1.6 O chefe de uma empresa de computa¸˜o desconfia que seu caoperador de computadores est´ usando o tempo de servi¸o para “bater papo” a cna internet. Se o operador trabalha corretamente, ele gasta g em esfor¸o e cproduz um lucro bruto de v unidades. O chefe, por sua vez, pode fiscalizarou n˜o o trabalho do operador. Fiscalizar custa h unidades para a empresa. aSe o operador for pego “batendo papo” na internet, ele perde o seu sal´rio ade w unidades. Para limitar o n´mero de casos a considerar, vamos assumir uque v > w > g > h > 0. Os dois jogadores escolhem suas estrat´gias esimultaneamente.
    • 18 II Bienal da Sociedade Brasileira de Matem´tica a empregado n˜o trabalhar a trabalhar fiscalizar (−h, 0) (v − w − h, w − g) chefe n˜o fiscalizar a (−w, w) (v − w, w − g) Observe que este jogo n˜o possui equil´ a ıbrio de Nash em estrat´gias puras e, e como ele deve se repetir em cada dia util de trabalho, n˜o ´ sensato escolher ´ a e sempre a mesma estrat´gia pura para todos os dias. A solu¸˜o, neste caso, ´ e ca e escolher entre as estrat´gias puras a cada dia seguindo uma distribui¸˜o de e ca probabilidades. De fato, se v = 5, w = 4, g = 3 e h = 2, ent˜o o ponto a (3/4, 1/4; 1/2, 1/2) ´ um equil´ e ıbrio de Nash em estrat´gias mistas. Isto significa que o chefe e deve escolher sua estrat´gia de acordo com um gerador de n´meros aleat´rios e u o com distribui¸˜o de probabilidade (3/4, 1/4) e o operador deve escolher sua ca estrat´gia de acordo com um gerador de n´meros aleat´rios com distribui¸˜o e u o ca de probabilidade (1/2, 1/2). Isto pode ser feito, por exemplo, com as duas “rodas da fortuna” da figura 1.9. Fiscalizar Trabalhar Não fiscalizar Não trabalhar chefe empregado Figura 1.9: Distribui¸˜es de probabilidade que constituem um equil´ co ıbrio de Nash para o jogo do exemplo 1.6. ´ Exemplo 1.7 (A tragedia dos comuns) Considere uma vila, onde cada um dos n fazendeiros tem a op¸˜o de manter ou n˜o sua ovelha no pasto. A ca a
    • Descri¸˜o informal da teoria dos jogos ca 19utilidade do leite e da l˜ de uma ovelha pastando ´ igual a 1, por outro lado, a eesta ovelha no pasto contribui com um dano ambiental (compartilhado portodos os fazendeiros) de 5 unidades. Cada fazendeiro tem duas estrat´gias: manter ou n˜o manter sua ovelha e ano pasto. Defina 1, se o i-´simo fazendeiro mant´m sua ovelha no pasto, e e xi = 0, se o i-´simo fazendeiro n˜o mant´m sua ovelha no pasto. e a eEm termos destas vari´veis, ´ f´cil de ver que a utilidade ui do i-´simo a e a efazendeiro ´ dada por e (x1 + · · · + xn ) ui (x1 , . . . , xn ) = xi − 5 · . n Se n > 5, manter todas as ovelhas no pasto, isto ´, tomar x1 = · · · = exn = 1, ´ o unico equil´ e ´ ıbrio de Nash do jogo. De fato: se todas as ovelhasest˜o no pasto e um fazendeiro resolve tirar sua ovelha, ele deixa de ganhar 1 a(proveniente da utilidade da l˜ e do leite) e deixa de perder 5/n < 1 (pro- aveniente do dano ambiental), isto ´, ele acaba ganhando menos do que se etivesse mantido sua ovelha no pasto. Assim, todos terminar˜o mantendo asua ovelha e a utilidade final de cada fazendeiro ser´ igual −4, com preju´ a ızoambiental m´ximo. A figura 1.10 lista todos os perfis de estrat´gia pura, a ecom as respectivas utilidades, para o caso n = 6. Para amenizar esta situa¸˜o, a teoria dos jogos sugere a cobran¸a de ca cum imposto por danos ambientais. Se o i-´simo fazendeiro deve pagar um eimposto de t unidades por manter sua ovelha no pasto, ent˜o sua utilidade afinal ser´ dada por a (x1 + · · · + xn ) ui (x1 , . . . , xn ) = xi − txi − 5 · . nSe t = 5, ent˜o x1 = . . . = xn = 0 ´ o unico equil´ a e ´ ıbrio de Nash, isto ´, todos eos fazendeiros v˜o preferir retirar suas ovelhas do pasto (figura 1.11). a O caso n = 6 e t = 1/6 ´ interessante: todos os 64 perfis de estrat´gia s˜o e e aequil´ ıbrios de Nash (figura 1.12).
    • 20 II Bienal da Sociedade Brasileira de Matem´tica a perfil u1 u2 u3 u4 u5 u6 (0, 0, 0, 0, 0, 0) 0 0 0 0 0 0 (0, 0, 0, 0, 0, 1) −5/6 −5/6 −5/6 −5/6 −5/6 1/6 (0, 0, 0, 0, 1, 0) −5/6 −5/6 −5/6 −5/6 1/6 −5/6 (0, 0, 0, 0, 1, 1) −5/3 −5/3 −5/3 −5/3 −2/3 −2/3 (0, 0, 0, 1, 0, 0) −5/6 −5/6 −5/6 1/6 −5/6 −5/6 (0, 0, 0, 1, 0, 1) −5/3 −5/3 −5/3 −2/3 −5/3 −2/3 (0, 0, 0, 1, 1, 0) −5/3 −5/3 −5/3 −2/3 −2/3 −5/3 (0, 0, 0, 1, 1, 1) −5/2 −5/2 −5/2 −3/2 −3/2 −3/2 (0, 0, 1, 0, 0, 0) −5/6 −5/6 1/6 −5/6 −5/6 −5/6 (0, 0, 1, 0, 0, 1) −5/3 −5/3 −2/3 −5/3 −5/3 −2/3 (0, 0, 1, 0, 1, 0) −5/3 −5/3 −2/3 −5/3 −2/3 −5/3 (0, 0, 1, 0, 1, 1) −5/2 −5/2 −3/2 −5/2 −3/2 −3/2 (0, 0, 1, 1, 0, 0) −5/3 −5/3 −2/3 −2/3 −5/3 −5/3 (0, 0, 1, 1, 0, 1) −5/2 −5/2 −3/2 −3/2 −5/2 −3/2 (0, 0, 1, 1, 1, 0) −5/2 −5/2 −3/2 −3/2 −3/2 −5/2 (0, 0, 1, 1, 1, 1) −10/3 −10/3 −7/3 −7/3 −7/3 −7/3 (0, 1, 0, 0, 0, 0) −5/6 1/6 −5/6 −5/6 −5/6 −5/6 (0, 1, 0, 0, 0, 1) −5/3 −2/3 −5/3 −5/3 −5/3 −2/3 (0, 1, 0, 0, 1, 0) −5/3 −2/3 −5/3 −5/3 −2/3 −5/3 (0, 1, 0, 0, 1, 1) −5/2 −3/2 −5/2 −5/2 −3/2 −3/2 (0, 1, 0, 1, 0, 0) −5/3 −2/3 −5/3 −2/3 −5/3 −5/3 (0, 1, 0, 1, 0, 1) −5/2 −3/2 −5/2 −3/2 −5/2 −3/2 (0, 1, 0, 1, 1, 0) −5/2 −3/2 −5/2 −3/2 −3/2 −5/2 (0, 1, 0, 1, 1, 1) −10/3 −7/3 −10/3 −7/3 −7/3 −7/3 (0, 1, 1, 0, 0, 0) −5/3 −2/3 −2/3 −5/3 −5/3 −5/3 (0, 1, 1, 0, 0, 1) −5/2 −3/2 −3/2 −5/2 −5/2 −3/2 (0, 1, 1, 0, 1, 0) −5/2 −3/2 −3/2 −5/2 −3/2 −5/2 (0, 1, 1, 0, 1, 1) −10/3 −7/3 −7/3 −10/3 −7/3 −7/3 (0, 1, 1, 1, 0, 0) −5/2 −3/2 −3/2 −3/2 −5/2 −5/2 (0, 1, 1, 1, 0, 1) −10/3 −7/3 −7/3 −7/3 −10/3 −7/3 (0, 1, 1, 1, 1, 0) −10/3 −7/3 −7/3 −7/3 −7/3 −10/3 (0, 1, 1, 1, 1, 1) −25/6 −19/6 −19/6 −19/6 −19/6 −19/6 (1, 0, 0, 0, 0, 0) 1/6 −5/6 −5/6 −5/6 −5/6 −5/6 (1, 0, 0, 0, 0, 1) −2/3 −5/3 −5/3 −5/3 −5/3 −2/3 (1, 0, 0, 0, 1, 0) −2/3 −5/3 −5/3 −5/3 −2/3 −5/3 (1, 0, 0, 0, 1, 1) −3/2 −5/2 −5/2 −5/2 −3/2 −3/2 (1, 0, 0, 1, 0, 0) −2/3 −5/3 −5/3 −2/3 −5/3 −5/3 (1, 0, 0, 1, 0, 1) −3/2 −5/2 −5/2 −3/2 −5/2 −3/2 (1, 0, 0, 1, 1, 0) −3/2 −5/2 −5/2 −3/2 −3/2 −5/2 (1, 0, 0, 1, 1, 1) −7/3 −10/3 −10/3 −7/3 −7/3 −7/3 (1, 0, 1, 0, 0, 0) −2/3 −5/3 −2/3 −5/3 −5/3 −5/3 (1, 0, 1, 0, 0, 1) −3/2 −5/2 −3/2 −5/2 −5/2 −3/2 (1, 0, 1, 0, 1, 0) −3/2 −5/2 −3/2 −5/2 −3/2 −5/2 (1, 0, 1, 0, 1, 1) −7/3 −10/3 −7/3 −10/3 −7/3 −7/3 (1, 0, 1, 1, 0, 0) −3/2 −5/2 −3/2 −3/2 −5/2 −5/2 (1, 0, 1, 1, 0, 1) −7/3 −10/3 −7/3 −7/3 −10/3 −7/3 (1, 0, 1, 1, 1, 0) −7/3 −10/3 −7/3 −7/3 −7/3 −10/3 (1, 0, 1, 1, 1, 1) −19/6 −25/6 −19/6 −19/6 −19/6 −19/6 (1, 1, 0, 0, 0, 0) −2/3 −2/3 −5/3 −5/3 −5/3 −5/3 (1, 1, 0, 0, 0, 1) −3/2 −3/2 −5/2 −5/2 −5/2 −3/2 (1, 1, 0, 0, 1, 0) −3/2 −3/2 −5/2 −5/2 −3/2 −5/2 (1, 1, 0, 0, 1, 1) −7/3 −7/3 −10/3 −10/3 −7/3 −7/3 (1, 1, 0, 1, 0, 0) −3/2 −3/2 −5/2 −3/2 −5/2 −5/2 (1, 1, 0, 1, 0, 1) −7/3 −7/3 −10/3 −7/3 −10/3 −7/3 (1, 1, 0, 1, 1, 0) −7/3 −7/3 −10/3 −7/3 −7/3 −10/3 (1, 1, 0, 1, 1, 1) −19/6 −19/6 −25/6 −19/6 −19/6 −19/6 (1, 1, 1, 0, 0, 0) −3/2 −3/2 −3/2 −5/2 −5/2 −5/2 (1, 1, 1, 0, 0, 1) −7/3 −7/3 −7/3 −10/3 −10/3 −7/3 (1, 1, 1, 0, 1, 0) −7/3 −7/3 −7/3 −10/3 −7/3 −10/3 (1, 1, 1, 0, 1, 1) −19/6 −19/6 −19/6 −25/6 −19/6 −19/6 (1, 1, 1, 1, 0, 0) −7/3 −7/3 −7/3 −7/3 −10/3 −10/3 (1, 1, 1, 1, 0, 1) −19/6 −19/6 −19/6 −19/6 −25/6 −19/6 (1, 1, 1, 1, 1, 0) −19/6 −19/6 −19/6 −19/6 −19/6 −25/6 (1, 1, 1, 1, 1, 1) −4 −4 −4 −4 −4 −4 Figura 1.10: A trag´dia dos comuns com n = 6 e imposto t = 0. e
    • Descri¸˜o informal da teoria dos jogos ca 21 perfil u1 u2 u3 u4 u5 u6 (0, 0, 0, 0, 0, 0) 0 0 0 0 0 0 (0, 0, 0, 0, 0, 1) −5/6 −5/6 −5/6 −5/6 −5/6 −29/6 (0, 0, 0, 0, 1, 0) −5/6 −5/6 −5/6 −5/6 −29/6 −5/6 (0, 0, 0, 0, 1, 1) −5/3 −5/3 −5/3 −5/3 −17/3 −17/3 (0, 0, 0, 1, 0, 0) −5/6 −5/6 −5/6 −29/6 −5/6 −5/6 (0, 0, 0, 1, 0, 1) −5/3 −5/3 −5/3 −17/3 −5/3 −17/3 (0, 0, 0, 1, 1, 0) −5/3 −5/3 −5/3 −17/3 −17/3 −5/3 (0, 0, 0, 1, 1, 1) −5/2 −5/2 −5/2 −13/2 −13/2 −13/2 (0, 0, 1, 0, 0, 0) −5/6 −5/6 −29/6 −5/6 −5/6 −5/6 (0, 0, 1, 0, 0, 1) −5/3 −5/3 −17/3 −5/3 −5/3 −17/3 (0, 0, 1, 0, 1, 0) −5/3 −5/3 −17/3 −5/3 −17/3 −5/3 (0, 0, 1, 0, 1, 1) −5/2 −5/2 −13/2 −5/2 −13/2 −13/2 (0, 0, 1, 1, 0, 0) −5/3 −5/3 −17/3 −17/3 −5/3 −5/3 (0, 0, 1, 1, 0, 1) −5/2 −5/2 −13/2 −13/2 −5/2 −13/2 (0, 0, 1, 1, 1, 0) −5/2 −5/2 −13/2 −13/2 −13/2 −5/2 (0, 0, 1, 1, 1, 1) −10/3 −10/3 −22/3 −22/3 −22/3 −22/3 (0, 1, 0, 0, 0, 0) −5/6 −29/6 −5/6 −5/6 −5/6 −5/6 (0, 1, 0, 0, 0, 1) −5/3 −17/3 −5/3 −5/3 −5/3 −17/3 (0, 1, 0, 0, 1, 0) −5/3 −17/3 −5/3 −5/3 −17/3 −5/3 (0, 1, 0, 0, 1, 1) −5/2 −13/2 −5/2 −5/2 −13/2 −13/2 (0, 1, 0, 1, 0, 0) −5/3 −17/3 −5/3 −17/3 −5/3 −5/3 (0, 1, 0, 1, 0, 1) −5/2 −13/2 −5/2 −13/2 −5/2 −13/2 (0, 1, 0, 1, 1, 0) −5/2 −13/2 −5/2 −13/2 −13/2 −5/2 (0, 1, 0, 1, 1, 1) −10/3 −22/3 −10/3 −22/3 −22/3 −22/3 (0, 1, 1, 0, 0, 0) −5/3 −17/3 −17/3 −5/3 −5/3 −5/3 (0, 1, 1, 0, 0, 1) −5/2 −13/2 −13/2 −5/2 −5/2 −13/2 (0, 1, 1, 0, 1, 0) −5/2 −13/2 −13/2 −5/2 −13/2 −5/2 (0, 1, 1, 0, 1, 1) −10/3 −22/3 −22/3 −10/3 −22/3 −22/3 (0, 1, 1, 1, 0, 0) −5/2 −13/2 −13/2 −13/2 −5/2 −5/2 (0, 1, 1, 1, 0, 1) −10/3 −22/3 −22/3 −22/3 −10/3 −22/3 (0, 1, 1, 1, 1, 0) −10/3 −22/3 −22/3 −22/3 −22/3 −10/3 (0, 1, 1, 1, 1, 1) −25/6 −49/6 −49/6 −49/6 −49/6 −49/6 (1, 0, 0, 0, 0, 0) −29/6 −5/6 −5/6 −5/6 −5/6 −5/6 (1, 0, 0, 0, 0, 1) −17/3 −5/3 −5/3 −5/3 −5/3 −17/3 (1, 0, 0, 0, 1, 0) −17/3 −5/3 −5/3 −5/3 −17/3 −5/3 (1, 0, 0, 0, 1, 1) −13/2 −5/2 −5/2 −5/2 −13/2 −13/2 (1, 0, 0, 1, 0, 0) −17/3 −5/3 −5/3 −17/3 −5/3 −5/3 (1, 0, 0, 1, 0, 1) −13/2 −5/2 −5/2 −13/2 −5/2 −13/2 (1, 0, 0, 1, 1, 0) −13/2 −5/2 −5/2 −13/2 −13/2 −5/2 (1, 0, 0, 1, 1, 1) −22/3 −10/3 −10/3 −22/3 −22/3 −22/3 (1, 0, 1, 0, 0, 0) −17/3 −5/3 −17/3 −5/3 −5/3 −5/3 (1, 0, 1, 0, 0, 1) −13/2 −5/2 −13/2 −5/2 −5/2 −13/2 (1, 0, 1, 0, 1, 0) −13/2 −5/2 −13/2 −5/2 −13/2 −5/2 (1, 0, 1, 0, 1, 1) −22/3 −10/3 −22/3 −10/3 −22/3 −22/3 (1, 0, 1, 1, 0, 0) −13/2 −5/2 −13/2 −13/2 −5/2 −5/2 (1, 0, 1, 1, 0, 1) −22/3 −10/3 −22/3 −22/3 −10/3 −22/3 (1, 0, 1, 1, 1, 0) −22/3 −10/3 −22/3 −22/3 −22/3 −10/3 (1, 0, 1, 1, 1, 1) −49/6 −25/6 −49/6 −49/6 −49/6 −49/6 (1, 1, 0, 0, 0, 0) −17/3 −17/3 −5/3 −5/3 −5/3 −5/3 (1, 1, 0, 0, 0, 1) −13/2 −13/2 −5/2 −5/2 −5/2 −13/2 (1, 1, 0, 0, 1, 0) −13/2 −13/2 −5/2 −5/2 −13/2 −5/2 (1, 1, 0, 0, 1, 1) −22/3 −22/3 −10/3 −10/3 −22/3 −22/3 (1, 1, 0, 1, 0, 0) −13/2 −13/2 −5/2 −13/2 −5/2 −5/2 (1, 1, 0, 1, 0, 1) −22/3 −22/3 −10/3 −22/3 −10/3 −22/3 (1, 1, 0, 1, 1, 0) −22/3 −22/3 −10/3 −22/3 −22/3 −10/3 (1, 1, 0, 1, 1, 1) −49/6 −49/6 −25/6 −49/6 −49/6 −49/6 (1, 1, 1, 0, 0, 0) −13/2 −13/2 −13/2 −5/2 −5/2 −5/2 (1, 1, 1, 0, 0, 1) −22/3 −22/3 −22/3 −10/3 −10/3 −22/3 (1, 1, 1, 0, 1, 0) −22/3 −22/3 −22/3 −10/3 −22/3 −10/3 (1, 1, 1, 0, 1, 1) −49/6 −49/6 −49/6 −25/6 −49/6 −49/6 (1, 1, 1, 1, 0, 0) −22/3 −22/3 −22/3 −22/3 −10/3 −10/3 (1, 1, 1, 1, 0, 1) −49/6 −49/6 −49/6 −49/6 −25/6 −49/6 (1, 1, 1, 1, 1, 0) −49/6 −49/6 −49/6 −49/6 −49/6 −25/6 (1, 1, 1, 1, 1, 1) −9 −9 −9 −9 −9 −9 Figura 1.11: A trag´dia dos comuns com n = 6 e imposto t = 5. e
    • 22 II Bienal da Sociedade Brasileira de Matem´tica a perfil u1 u2 u3 u4 u5 u6 (0, 0, 0, 0, 0, 0) 0 0 0 0 0 0 (0, 0, 0, 0, 0, 1) −5/6 −5/6 −5/6 −5/6 −5/6 0 (0, 0, 0, 0, 1, 0) −5/6 −5/6 −5/6 −5/6 0 −5/6 (0, 0, 0, 0, 1, 1) −5/3 −5/3 −5/3 −5/3 −5/6 −5/6 (0, 0, 0, 1, 0, 0) −5/6 −5/6 −5/6 0 −5/6 −5/6 (0, 0, 0, 1, 0, 1) −5/3 −5/3 −5/3 −5/6 −5/3 −5/6 (0, 0, 0, 1, 1, 0) −5/3 −5/3 −5/3 −5/6 −5/6 −5/3 (0, 0, 0, 1, 1, 1) −5/2 −5/2 −5/2 −5/3 −5/3 −5/3 (0, 0, 1, 0, 0, 0) −5/6 −5/6 0 −5/6 −5/6 −5/6 (0, 0, 1, 0, 0, 1) −5/3 −5/3 −5/6 −5/3 −5/3 −5/6 (0, 0, 1, 0, 1, 0) −5/3 −5/3 −5/6 −5/3 −5/6 −5/3 (0, 0, 1, 0, 1, 1) −5/2 −5/2 −5/3 −5/2 −5/3 −5/3 (0, 0, 1, 1, 0, 0) −5/3 −5/3 −5/6 −5/6 −5/3 −5/3 (0, 0, 1, 1, 0, 1) −5/2 −5/2 −5/3 −5/3 −5/2 −5/3 (0, 0, 1, 1, 1, 0) −5/2 −5/2 −5/3 −5/3 −5/3 −5/2 (0, 0, 1, 1, 1, 1) −10/3 −10/3 −5/2 −5/2 −5/2 −5/2 (0, 1, 0, 0, 0, 0) −5/6 0 −5/6 −5/6 −5/6 −5/6 (0, 1, 0, 0, 0, 1) −5/3 −5/6 −5/3 −5/3 −5/3 −5/6 (0, 1, 0, 0, 1, 0) −5/3 −5/6 −5/3 −5/3 −5/6 −5/3 (0, 1, 0, 0, 1, 1) −5/2 −5/3 −5/2 −5/2 −5/3 −5/3 (0, 1, 0, 1, 0, 0) −5/3 −5/6 −5/3 −5/6 −5/3 −5/3 (0, 1, 0, 1, 0, 1) −5/2 −5/3 −5/2 −5/3 −5/2 −5/3 (0, 1, 0, 1, 1, 0) −5/2 −5/3 −5/2 −5/3 −5/3 −5/2 (0, 1, 0, 1, 1, 1) −10/3 −5/2 −10/3 −5/2 −5/2 −5/2 (0, 1, 1, 0, 0, 0) −5/3 −5/6 −5/6 −5/3 −5/3 −5/3 (0, 1, 1, 0, 0, 1) −5/2 −5/3 −5/3 −5/2 −5/2 −5/3 (0, 1, 1, 0, 1, 0) −5/2 −5/3 −5/3 −5/2 −5/3 −5/2 (0, 1, 1, 0, 1, 1) −10/3 −5/2 −5/2 −10/3 −5/2 −5/2 (0, 1, 1, 1, 0, 0) −5/2 −5/3 −5/3 −5/3 −5/2 −5/2 (0, 1, 1, 1, 0, 1) −10/3 −5/2 −5/2 −5/2 −10/3 −5/2 (0, 1, 1, 1, 1, 0) −10/3 −5/2 −5/2 −5/2 −5/2 −10/3 (0, 1, 1, 1, 1, 1) −25/6 −10/3 −10/3 −10/3 −10/3 −10/3 (1, 0, 0, 0, 0, 0) 0 −5/6 −5/6 −5/6 −5/6 −5/6 (1, 0, 0, 0, 0, 1) −5/6 −5/3 −5/3 −5/3 −5/3 −5/6 (1, 0, 0, 0, 1, 0) −5/6 −5/3 −5/3 −5/3 −5/6 −5/3 (1, 0, 0, 0, 1, 1) −5/3 −5/2 −5/2 −5/2 −5/3 −5/3 (1, 0, 0, 1, 0, 0) −5/6 −5/3 −5/3 −5/6 −5/3 −5/3 (1, 0, 0, 1, 0, 1) −5/3 −5/2 −5/2 −5/3 −5/2 −5/3 (1, 0, 0, 1, 1, 0) −5/3 −5/2 −5/2 −5/3 −5/3 −5/2 (1, 0, 0, 1, 1, 1) −5/2 −10/3 −10/3 −5/2 −5/2 −5/2 (1, 0, 1, 0, 0, 0) −5/6 −5/3 −5/6 −5/3 −5/3 −5/3 (1, 0, 1, 0, 0, 1) −5/3 −5/2 −5/3 −5/2 −5/2 −5/3 (1, 0, 1, 0, 1, 0) −5/3 −5/2 −5/3 −5/2 −5/3 −5/2 (1, 0, 1, 0, 1, 1) −5/2 −10/3 −5/2 −10/3 −5/2 −5/2 (1, 0, 1, 1, 0, 0) −5/3 −5/2 −5/3 −5/3 −5/2 −5/2 (1, 0, 1, 1, 0, 1) −5/2 −10/3 −5/2 −5/2 −10/3 −5/2 (1, 0, 1, 1, 1, 0) −5/2 −10/3 −5/2 −5/2 −5/2 −10/3 (1, 0, 1, 1, 1, 1) −10/3 −25/6 −10/3 −10/3 −10/3 −10/3 (1, 1, 0, 0, 0, 0) −5/6 −5/6 −5/3 −5/3 −5/3 −5/3 (1, 1, 0, 0, 0, 1) −5/3 −5/3 −5/2 −5/2 −5/2 −5/3 (1, 1, 0, 0, 1, 0) −5/3 −5/3 −5/2 −5/2 −5/3 −5/2 (1, 1, 0, 0, 1, 1) −5/2 −5/2 −10/3 −10/3 −5/2 −5/2 (1, 1, 0, 1, 0, 0) −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 (1, 1, 0, 1, 0, 1) −5/2 −5/2 −10/3 −5/2 −10/3 −5/2 (1, 1, 0, 1, 1, 0) −5/2 −5/2 −10/3 −5/2 −5/2 −10/3 (1, 1, 0, 1, 1, 1) −10/3 −10/3 −25/6 −10/3 −10/3 −10/3 (1, 1, 1, 0, 0, 0) −5/3 −5/3 −5/3 −5/2 −5/2 −5/2 (1, 1, 1, 0, 0, 1) −5/2 −5/2 −5/2 −10/3 −10/3 −5/2 (1, 1, 1, 0, 1, 0) −5/2 −5/2 −5/2 −10/3 −5/2 −10/3 (1, 1, 1, 0, 1, 1) −10/3 −10/3 −10/3 −25/6 −10/3 −10/3 (1, 1, 1, 1, 0, 0) −5/2 −5/2 −5/2 −5/2 −10/3 −10/3 (1, 1, 1, 1, 0, 1) −10/3 −10/3 −10/3 −10/3 −25/6 −10/3 (1, 1, 1, 1, 1, 0) −10/3 −10/3 −10/3 −10/3 −10/3 −25/6 (1, 1, 1, 1, 1, 1) −25/6 −25/6 −25/6 −25/6 −25/6 −25/6 Figura 1.12: A trag´dia dos comuns com n = 6 e imposto t = 1/6. e
    • Descri¸˜o informal da teoria dos jogos ca 231.7 Existˆncia de solu¸˜es e co Como vimos no jogo de combinar moedas no item (d) do exemplo 1.4,existem jogos que n˜o possuem equil´ a ıbrios de Nash em estrat´gias puras e, eat´ agora, todos os jogos apresentados em nossos exemplos possuem pelo emenos um equil´ ıbrio de Nash em estrat´gias mistas. Uma pergunta natural e´ se a existˆncia de equil´e e ıbrios de Nash em estrat´gias mistas ´ um resultado e egeral ou n˜o. A resposta ´ sim! Nos dois cap´ a e ıtulos seguintes apresentaremosdois teoremas de existˆncia: o teorema minimax de von Neumann para jogos ede soma zero com dois jogadores e o teorema de equil´ ıbrios de Nash parajogos gerais.
    • Cap´ ıtulo 2O teorema minimax de von Neumann2.1 Jogos de soma constante com dois jogadores Defini¸˜o 2.1 (Jogos de soma constante com dois jogado- ca res) Um jogo de soma constante com dois jogadores ´ um jogo com e dois jogadores, comumente denominados jogador linha e jogador co- luna, com estrat´gias e Sjogador linha = {1, 2, . . . , m} e Sjogador coluna = {1, 2, . . . , n} e matriz de payoff jogador coluna 1 2 ··· n 1 (a11 , b11 ) (a12 , b12 ) ··· (a1n , b1n ) jogador 2 (a21 , b21 ) (a22 , b22 ) ··· (a2n , b2n ) linha . . . . . . ... . . . . . . m (am1 , bm1 ) (am2 , bm2 ) ··· (amn , bmn )
    • O teorema minimax de von Neumann 25 satisfazendo aij + bij = c = constante, para todo i = 1, . . . , m e j = 1, . . . , n. No caso particular em que a constante c ´ zero, dizemos que e o jogo tem soma zero.Em termos de estrat´gias mistas, se p = (p1 , . . . , pm ) ∈ ∆m ´ uma dis- e etribui¸˜o de probabilidades para as estrat´gias puras do jogador linha e ca eq = (q1 , . . . , qn ) ∈ ∆n ´ uma distribui¸˜o de probabilidades para as es- e catrat´gias puras do jogador coluna, ent˜o o payoff esperado para o jogador e alinha ´e    a11 a12 · · · a1n q1 m n  a  q   21 a22 · · · a2n   2 ul (p, q) = pi qj aij = p1 p2 · · · pm  . . ... .   .  , i=1 j=1  .. . . .  .  . . am1 am2 · · · amn qnisto ´, e   a11 a12 · · · a1n  a21 a22 · · · a2n    ul (p, q) = pT Aq, com A =  . . . . ... .  . .   . . . am1 am2 · · · amnAnalogamente, o payoff esperado para o jogador coluna ´ dado por e   b11 b12 · · · b1n  b b22 · · · b2n   21  uc (p, q) = pT Bq, com B =  . . ... .  .  . . . . .  . bm1 bm2 · · · bmnUma vez que o jogo tem soma constante, vemos que       a11 a12 · · · a1n b11 b12 · · · b1n c c ··· c  a   b a22 · · · a2n   21 b22 · · · b2n   c c ··· c   21   A+B =  . . . . . . + . . ... . = . . ... . ,  . . . . .   . . . . . . .   . . . . . .  am1 am2 · · · amn bm1 bm2 · · · bmn c c ··· cisto ´, e     c c ··· c 1 1 ··· 1  c c ··· c   1 1 ··· 1      A+B =C = . . . . ... . .  = c . . . . ... . . =c 1,  . . .   . . .  c c ··· c 1 1 ··· 1
    • 26 II Bienal da Sociedade Brasileira de Matem´tica a onde 1 denota a matriz m × n formada com 1 em todas as suas entradas. Sendo assim, ´ f´cil de ver que e a uc (p, q) = pT Bq = pT (c 1 − A)q = cpT 1 q − pT Aq = c − ul (p, q) onde, na ultima igualdade, usamos que pT 1 q = 1, pois p e q s˜o distri- ´ a bui¸˜es de probabilidades e, por isto, co m n pi = 1 e qj = 1. i=1 j=1 Em particular, vale a seguinte propriedade importante: ul (p∗ , q∗ ) ≥ ul (p, q∗ ) se, e somente se, uc (p∗ , q∗ ) ≤ uc (p, q∗ ). (2.1) 2.2 Equil´ ıbrio de Nash em estrat´gias puras e Defini¸˜o 2.2 (Ponto de sela) Dizemos que um elemento aij de ca uma matriz A ´ um ponto de sela da matriz A se ele for simultanea- e mente um m´ınimo em sua linha e um m´ximo em sua coluna, isto ´, a e se aij ≤ ail para todo l = 1, . . . , n e aij ≥ akj para todo k = 1, . . . , m. Teorema 2.1 O elemento aij ´ um ponto de sela da matriz A se, e e somente se, o par (i, j) ´ um equil´ e ıbrio de Nash em estrat´gias puras e para o jogo. Demonstra¸˜o: ca (⇒) Seja aij um ponto de sela da matriz A. Como aij ´ m´ximo em sua e a coluna, vale que ul (i, j) = aij ≥ akj = ul (k, j)
    • O teorema minimax de von Neumann 27para todo k = 1, . . . , m, isto ´, o jogador linha n˜o pode aumentar o seu e apayoff se o jogador coluna mantiver a escolha da coluna j. Por outro lado,como aij ´ m´ e ınimo em sua linha, vale que uc (i, j) = bij = c − aij ≥ c − ail = bil = uc (i, l)para todo l = 1, . . . , n, isto ´, o jogador coluna n˜o pode aumentar o seu e apayoff se o jogador linha mantiver a escolha da linha i. Isto mostra que operfil de estrat´gia pura (i, j) ´ um equil´ e e ıbrio de Nash do jogo. (⇐) Seja (i, j) ´ um equil´ e ıbrio de Nash do jogo. A partir das considera¸˜es coacima, ´ f´cil de ver que aij ´ m´ximo em sua coluna e m´ e a e a ınimo em sua linhae que, portanto, aij ´ um ponto de sela da matriz A. e Teorema 2.2 Se aij e ars s˜o dois pontos de sela da matriz A, ent˜o a a ais e arj tamb´m s˜o pontos de sela da matriz A e e a aij = ars = ais = arj .Demonstra¸˜o: Considere a matriz ca  . .  . . . .  ··· a ··· a ···   ij is   . ... . . .  A= . . .    · · · arj · · · ars · · ·  . . . . . .Como aij e ars s˜o pontos de sela, sabemos que eles s˜o m´ a a ınimos em suasrespectivas linhas e m´ximos em suas respectivas colunas. Assim, a aij ≤ ais ≤ ars e aij ≥ arj ≥ ars ,e, portanto, aij = ais = arj = ars .Observe que ais ´ m´ e ınimo em sua linha, pois aij = ais ´ m´ e ınimo da mesmalinha e que ais ´ m´ximo em sua coluna, pois ars = ais ´ m´ximo da mesma e a e acoluna. Analogamente, arj ´ m´ e ınimo em sua linha, pois ars = arj ´ m´ e ınimo
    • 28 II Bienal da Sociedade Brasileira de Matem´tica a da mesma linha e arj ´ m´ximo em sua coluna, pois arj = aij ´ m´ximo da e a e a mesma coluna. Conclu´ ımos ent˜o que ais e arj tamb´m s˜o pontos de sela a e a da matriz A. O payoff m´ ınimo do jogador linha, se ele escolher a linha k, ´ dado por e ak = min akl . 1≤l≤n Analogamente, o payoff m´ ınimo do jogador coluna, se ele escolher a coluna l, ´ dado por c − al , onde e al = max akl . 1≤k≤m Defina vl (A) = max ak = max min akl e vc (A) = min al = min max akl . 1≤k≤m 1≤k≤m 1≤l≤n 1≤l≤n 1≤l≤n 1≤k≤m Teorema 2.3 Para toda matriz A, tem-se vc (A) ≥ vl (A). Demonstra¸˜o: Temos que para todo k = 1, . . . , m e j = 1, . . . , n, ca akj ≥ min akl . 1≤l≤n Assim, max akj ≥ max min akl = vl (A), 1≤k≤m 1≤k≤m 1≤l≤n para todo j = 1, . . . , n. Conseq¨entemente, u vc (A) = min max akj ≥ max min akl = vl (A). 1≤j≤n 1≤k≤m 1≤k≤m 1≤l≤n O pr´ximo teorema caracteriza a existˆncia de pontos de sela e, portanto, o e a existˆncia de equil´ e ıbrios de Nash em estrat´gias puras, em termos das e fun¸˜es vl e vc . co Teorema 2.4 Uma matriz A tem um ponto de sela se, e somente se, vl (A) = vc (A).
    • O teorema minimax de von Neumann 29Demonstra¸˜o: ca (⇒) Se aij ´ um ponto de sela da matriz A, ent˜o aij = min1≤l≤n ail = e aai . Como vl (A) = max1≤k≤m ak , ´ claro que vl (A) ≥ ai = aij . Por outro elado, aij = max1≤k≤m akj = aj . Como vc (A) = min1≤l≤n al , segue-se quevc (A) ≤ aj = aij . Combinando estas duas desigualdades, conclu´ ımos quevc (A) ≤ aij ≤ vl (A). Mas, pelo teorema anterior, vc (A) ≥ vl (A) e, sendoassim, vc (A) = vl (A). (⇐) Como vl (A) = max1≤r≤m ar , existe uma linha i tal que vl (A) = ai .Como, por sua vez, ai = min1≤s≤n ais , existe uma coluna l tal que ai = ail .Assim, vl (A) = ai = ail . Analogamente, como vc (A) = min1≤s≤n as , existeuma coluna j tal que vc (A) = aj . Como, por sua vez, aj = max1≤r≤m arj ,existe uma linha k tal que aj = akj . Assim, vc (A) = aj = akj . Uma vez que,por hip´tese, vl (A) = vc (A), temos que o ail = ai = vl (A) = vc (A) = aj = akj .Afirmamos que aij ´ um ponto de sela da matriz A. Com efeito, aij ≤ aj = eai ≤ ais , para todo s = 1, . . . , n, isto ´, aij ´ o m´ e e ınimo de sua linha. Poroutro lado, aij ≥ ai = aj ≥ arj , para todo r = 1, . . . , m, isto ´, aij ´ o e em´ximo de sua coluna. Portanto, aij ´ um ponto de sela da matriz A. a e Corol´rio 2.1 Um jogo de dois jogadores com soma constante defi- a nido pela matriz de payoffs A do jogador linha tem um equil´ ıbrio de Nash em estrat´gias puras se, e somente se, e vl (A) = vc (A).2.3 Equil´ ıbrio de Nash em estrat´gias mistas e Defina vl (A) = max min pT Aq e vc (A) = min max pT Aq. p∈∆m q∈∆n q∈∆n p∈∆m
    • 30 II Bienal da Sociedade Brasileira de Matem´tica a Teorema 2.5 Para toda matriz A, tem-se vc (A) ≥ vl (A). Demonstra¸˜o: Temos que para todo p ∈ ∆m , ca pT Aq ≥ min pT Ay. y∈∆n Assim, max pT Aq ≥ max min pT Ay = vl (A). p∈∆m p∈∆m y∈∆n Conseq¨entemente, u vc (A) = min max pT Aq ≥ max min pT Ay = vl (A). q∈∆n p∈∆m p∈∆m y∈∆n O pr´ximo teorema caracteriza a existˆncia de equil´ o e ıbrios de Nash em estrat´gias mistas em termos das fun¸˜es vl e vc . e co Teorema 2.6 Um perfil de estrat´gia mista (p∗ , q∗ ) ´ um equil´ e e ıbrio de Nash de um jogo de dois jogadores com soma constante definido pela matriz de payoffs A do jogador linha se, e somente se, vl (A) = vc (A) = p∗T Aq∗ . Demonstra¸˜o: ca (⇒) Se (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash, ent˜o a p∗T Aq∗ = ul (p∗ , q∗ ) ≥ ul (p, q∗ ) = pT Aq∗ , para todo p ∈ ∆m . Em particular, p∗T Aq∗ = max pT Aq∗ ≥ min max pT Ay = vc (A). p∈∆m y∈∆n p∈∆m Vale tamb´m que e p∗T Aq∗ = c − uc (p∗ , q∗ ) ≤ c − uc (p∗ , q) = p∗T Aq, para todo q ∈ ∆n . Em particular,
    • O teorema minimax de von Neumann 31 p∗T Aq∗ = min p∗T Aq ≤ max min xT Aq = vl (A). q∈∆n x∈∆m q∈∆nDesta maneira, vl (A) ≥ vc (A). Como, pelo teorema anterior, vl (A) ≤ vc (A),conclu´ ımos que vl (A) = vc (A). (⇐) Como vl (A) = maxp∈∆m minq∈∆n pT Aq, existe p∗ ∈ ∆m tal que vl (A) = min p∗T Aq. q∈∆nAnalogamente, como vc (A) = minq∈∆n maxp∈∆m pT Aq, existe q∗ ∈ ∆m tal vc (A) = max pT Aq∗ . p∈∆mUma vez que, por hip´tese, vl (A) = vc (A), temos que o min p∗T Aq = vl (A) = vc (A) = max pT Aq∗ . q∈∆n p∈∆mAfirmamos que (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash do jogo. Com efeito, ul (p∗ , q∗ ) = p∗T Aq∗ ≥ min p∗T Aq = q∈∆n max pT Aq∗ ≥ xT Aq∗ = ul (x, q∗ ), p∈∆mpara todo x ∈ ∆m . Por outro lado, uc (p∗ , q∗ ) = c − p∗T Aq∗ ≥ c − max pT Aq∗ = p∈∆m c − min p∗T Aq ≥ c − p∗T Ay = uc (p∗ , y), q∈∆npara todo y ∈ ∆n . Desta maneira, (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash do jogo.2.4 O teorema minimax de von Neumann O pr´ximo teorema estabelece que, para jogos de dois jogadores com soma ozero, vl (A) = vc (A) sempre. Sendo assim, pelo teorema 2.6, segue-se que,para esta classe de jogos, sempre existe pelo menos um equil´ ıbrio de Nashem estrat´gias mistas. e
    • 32 II Bienal da Sociedade Brasileira de Matem´tica a Teorema 2.7 (minimax de von Neumann) Para todo jogo de soma zero com dois jogadores, representado pela matriz de payoffs A do jogador linha, sempre existe um perfil de estrat´gia mista (p∗ , q∗ ) ∈ e ∆m × ∆n satisfazendo vl (A) = max min pT Aq = p∗T Aq∗ = min max pT Aq = vc (A). p∈∆m q∈∆n q∈∆n p∈∆m Em particular, (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash do jogo. Daremos uma demonstra¸˜o deste teorema minimax de von Neumann ca usando o teorema de dualidade da teoria de programa¸˜o linear. Lembramos ca que um problema de programa¸˜o linear ´ um problema de otimiza¸˜o com ca e ca fun¸˜o objetivo e restri¸˜es lineares: ca co (problema primal) maximizar bT y sujeito a Ay ≤ c, y ≥ 0, onde as desigualdades devem ser interpretadas componente a componente. A cada problema de programa¸˜o linear (problema primal) podemos associar ca um outro problema de otimiza¸˜o (problema dual): ca (problema dual) minimizar cT x sujeito a xT A ≥ bT , x ≥ 0. ¸˜ Teorema 2.8 (da dualidade em programacao linear) (a) O problema primal possui uma solu¸˜o se, e somente se, o problema ca dual possui uma solu¸˜o. ca (b) Se y∗ ´ solu¸˜o do problema primal e x∗ ´ solu¸˜o do problema e ca e ca T ∗ T ∗ dual, ent˜o c x = b y . a
    • O teorema minimax de von Neumann 33Uma demonstra¸˜o do teorema de dualidade pode ser encontrada em [12]. ca Demonstra¸˜o do teorema minimax: sem perda de generalidade, podemos caassumir que todas as entradas da matriz de payoffs A do jogador linha s˜o apositivas. Caso contr´rio, basta substituir A por A = A + D e B = −A apor B = −D+B, onde D = d 1 , com d > max1≤i≤m max1≤j≤n |aij |. Observeque A + B = 0 (isto ´, o jogo definido pelas matrizes A e B tem soma zero) e ∗ ∗e que (p , q ) ´ um equil´ e ıbrio de Nash para o jogo definido pela matriz Ase, e somente se, (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash para o jogo definido pelamatriz A. Sejam c = (1, 1, . . . , 1)T e b = (1, 1, . . . , 1)T . Considere os problemas deprograma¸˜o linear: ca (problema primal) (problema dual) T maximizar b y minimizar cT x sujeito a Ay ≤ c, sujeito a xT A ≥ bT , y ≥ 0, x ≥ 0. Passo 1: o problema dual possui uma solu¸˜o. ca Como A > 0, o conjunto admiss´ X = {x ∈ Rm | xT A ≥ bT e x ≥ 0} ıvel´ n˜o vazio. Por outro lado, como c = (1, 1, . . . , 1)T , a fun¸˜o objetivo doe a ca tproblema ´ escrita como x = (x1 , x2 , . . . , xm ) → c x = x1 + x2 + · · · + xm . eAssim, o problema dual consiste em encontrar o ponto do conjunto X maispr´ximo da origem segundo a norma da soma || · ||1 , um problema que certa- omente possui uma solu¸˜o pois, se p ∈ X, ent˜o podemos “compactificar” o ca aconjunto admiss´ incluindo a restri¸˜o ||x||1 ≤ ||p||1 e, com isso, podemos ıvel causar o teorema de Weierstrass para garantir a existˆncia de um m´ e ınimo. Passo 2: constru¸˜o do equil´ ca ıbrio de Nash. Dado que o problema dual possui uma solu¸˜o, pelo teorema de dualidade, cao problema primal tamb´m possui. Mais ainda: se x∗ ´ solu¸˜o do problema e e ca ∗dual e y ´ solu¸˜o do problema primal, ent˜o e ca a cT x∗ = bT y∗ .Seja θ = cT x∗ = bT y∗ (que ´ > 0 pois (0, 0, . . . , 0) n˜o ´ admiss´ e a e ıvel) e defina ∗ x∗ y∗∗ p = e q = . θ θ
    • 34 II Bienal da Sociedade Brasileira de Matem´tica a Afirmamos que (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash do jogo. Com efeito: clara- mente p ∈ ∆m e q ∈ ∆n , pois p ≥ 0 (j´ que x∗ ≥ 0 e θ > 0), q∗ ≥ 0 (j´ ∗ ∗ ∗ a a ∗ que y ≥ 0 e θ > 0), m m m n ∗ x∗ i cT x∗ θ yj bT y∗ θ pi = = = =1 e qj = = = = 1. i=1 i=1 θ θ θ j=1 j=1 θ θ θ Agora, como x∗T A ≥ bT , temos que para todo q ∈ ∆n , x∗T Aq ≥ bT q = n ∗ ∗ ∗T ∗T ∗ j=1 qj = 1. Mas x = p /θ. Desta maneira, p Aq ≥ θ = p Aq , para todo q ∈ ∆n . Conseq¨entemente, u uc (p∗ , q∗ ) = −p∗T Aq∗ ≥ −p∗T Aq = uc (p∗ , q) para todo q ∈ ∆n . Mostramos ent˜o que o jogador coluna n˜o pode aumentar a a ∗ o seu payoff esperado trocando q por q, se o jogador linha mantiver a escolha p∗ . Analogamente, como Ay ≤ c, temos que para todo p ∈ ∆m , pT Ay∗ ≤ pT c = m pi = 1. Mas y∗ = q∗ /θ. Desta maneira, p∗ Aq∗ ≤ θ = i=1 p∗T Aq∗ , para todo p ∈ ∆m . Conseq¨entemente, u ul (p∗ , q∗ ) = p∗T Aq∗ ≥ pT Aq∗ = ul (p, q∗ ), para todo p ∈ ∆m . Mostramos ent˜o que o jogador linha n˜o pode aumentar a a ∗ o seu payoff esperado trocando p por p, e o jogador coluna mantiver a escolha q∗ . Conclu´ ımos, portanto, que (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash do jogo. Al´m de estabelecer a existˆncia de equil´ e e ıbrios de Nash, a demonstra¸˜o ca que demos sugere uma maneira de calcul´-los: resolvendo-se dois problemas a de programa¸˜o linear. ca Exemplo 2.1 O governo deseja vacinar seus cidad˜os contra um certo v´ a ırus da gripe. Este v´ırus possui dois sorotipos, sendo que ´ desconhecida a pro- e por¸˜o na qual os dois sorotipos ocorrem na popula¸˜o do v´ ca ca ırus. Foram desenvolvidas duas vacinas onde a efic´cia da vacina 1 ´ de 85% contra o a e sorotipo 1 e de 70% contra o sorotipo 2. A efic´cia da vacina 2 ´ de 60% a e contra o sorotipo 1 e de 90% contra o sorotipo 2. Qual pol´tica de vacina¸˜o ı ca deveria ser tomada pelo governo? Esta situa¸˜o pode ser modelada como um jogo de soma zero com dois ca jogadores, onde o jogador linha L (o governo) deseja fazer a compensa¸˜o ca
    • O teorema minimax de von Neumann 35(a fra¸˜o dos cidad˜os resistentes ao v´ ca a ırus) o maior poss´ ıvel e o jogadorcoluna C (o v´ırus) deseja fazer a compensa¸˜o a menor poss´ ca ıvel. A matrizde payoffs ´ a seguinte: e v´ ırus sorotipo 1 sorotipo 2 vacina 1 (85/100, −85/100) (70/100, −70/100) governo vacina 2 (60/100, −60/100) (90/100, −90/100)Para encontrar um equil´ ıbrio de Nash, devemos resolver os seguintes proble-mas de programa¸˜o linear ca (problema primal) maximizar y1 + y2 85/100 70/100 y1 1 sujeito a ≤ , 60/100 90/100 y2 1 y1 0 ≥ , y2 0 (problema dual) minimizar x1 + x2 85/100 70/100 sujeito a x1 x 2 ≥ 1 1 , 60/100 90/100 x1 0 ≥ , x2 0isto ´, e
    • 36 II Bienal da Sociedade Brasileira de Matem´tica a (problema primal) maximizar y1 + y2 sujeito a 17y1 + 14y2 = 20, 6y1 + 9y2 = 10, y1 ≥ 0, y2 ≥ 0, (problema dual) maximizar x1 + x2 sujeito a 7x1 + 12x2 = 20, 7x1 + 9x2 = 10, x1 ≥ 0, x2 ≥ 0. A solu¸˜o do problema dual ´ x∗ = (20/23, 10/23) (figura 2.1) e a solu¸˜o ca e ca ∗ do problema primal ´ y = (40/69, 50/69), com e 30 θ = x∗ + x ∗ = y 1 + y 2 = 1 2 ∗ ∗ . 23 x2 30/23 10/23 0 20/23 30/23 x1 Figura 2.1: Solu¸˜o do problema dual. ca
    • O teorema minimax de von Neumann 37 y1 30/23 50/69 0 40/69 30/23 y1 Figura 2.2: Solu¸˜o do problema primal. ca Desta maneira, o unico equil´ ´ ıbrio de Nash para o problema ´ dado pelo e ∗ ∗ponto (p , q ), onde x∗ 2 1 y∗ 4 5 p∗ = = , e q∗ = = , . θ 3 3 θ 9 9
    • Cap´ ıtulo 3O teorema de equil´ ıbrio de Nash O teorema minimax de von Neumann demonstra a existˆncia de um eequil´ıbrio de Nash para uma classe muito restrita de jogos, a saber, a classedos jogos de soma zero com apenas dois jogadores. De fato, o resultado ´ ge- eral: todo jogo definido por matrizes de payoffs possui um equil´ ıbrio de Nashem estrat´gias mistas. A demonstra¸˜o que apresentaremos aqui ´ devida a e ca eJohn Nash e ela faz uso do teorema do ponto fixo de Brouwer [10]. Teorema 3.1 (do ponto fixo de Brouwer) Se ∆ ´ um subcon- e junto compacto e convexo de um espa¸o euclidiano de dimens˜o finita c a e F : ∆ → ∆ ´ uma fun¸˜o cont´ e ca ınua, ent˜o F possui um ponto fixo a ∗ em ∆, isto ´, existe p ∈ ∆ tal que e F(p∗ ) = p∗ . Com as nota¸˜es das se¸˜es 1.3 e 1.4, estabeleceremos uma seq¨ˆncia de co co ueteoremas que fornecem caracteriza¸˜es alternativas para um equil´ co ıbrio deNash. Teorema 3.2 Para cada i = 1, . . . , n e j = 1, . . . , mi , defina as fun¸˜es co zij : ∆ → R p → zij (p) = ui (sij , p−i ) − ui (pi , p−i )
    • O teorema de equil´ ıbrio de Nash 39 (isto ´, zij mede o ganho ou perda do jogador gi quando ele troca a e distribui¸˜o de probabilidade pi pela estrat´gia pura sij ). Temos que ca e ∗ p ´ um equil´ e ıbrio de Nash se, e somente se, zij (p∗ ) ≤ 0 para cada i = 1, . . . , n e j = 1, . . . , mi .Demonstra¸˜o: ca (⇒) Se p∗ = (p∗ , p∗ ) ´ um equil´ i −i e ıbrio de Nash, ent˜o ui (p∗ , p∗ ) ≥ a i −i ∗ui (sij , p−i ) para cada i = 1, . . . , n e j = 1, . . . , mi . Conseq¨entemente, u zij (p∗ ) = ui (sij , p∗ ) − ui (p∗ , p∗ ) ≤ 0 −i i −ipara cada i = 1, . . . , n e j = 1, . . . , mi . (⇐) Se zij (p∗ ) = ui (sij , p∗ ) − ui (p∗ , p∗ ) ≤ 0 −i i −ipara cada i = 1, . . . , n e j = 1, . . . , mi , ent˜o a ui (sij , p∗ ) = ui (ej , p∗ ) ≤ ui (p∗ , p∗ ) −i −i i −ipara cada i = 1, . . . , n e j = 1, . . . , mi , onde ej ´ o vetor em Rmi que tem 1 ena j-´sima coordenada e zero nas demais. Devemos mostrar que para todo epi = (pi1 , . . . , pimi ) ∈ ∆mi ui (pi , p∗ ) ≤ ui (p∗ , p∗ ). −i i −iMas, por x → ui (x, p∗ ) ser um funcional linear, temos que i mi mi ui (pi , p∗ ) −i = ui pik · ek , p∗ −i = pik · ui (ek , p∗ ) ≤ −i k=1 k=1 mi mi pik · ui (p∗ , p∗ ) i −i = ui (p∗ , p∗ ) i −i · pik = ui (p∗ , p∗ ) , i −i k=1 k=1 mionde, na ultima igualdade, usamos o fato de que ´ k=1 pik = 1, dado quepi ∈ ∆mi .
    • 40 II Bienal da Sociedade Brasileira de Matem´tica a Teorema 3.3 Para cada i = 1, . . . , n e j = 1, . . . , mi , defina as fun¸˜es co gij : ∆ → R . p → gij (p) = max{0, zij (p)} Temos que p ´ um equil´ e ıbrio de Nash se, e somente se, gij (p) = 0 para cada i = 1, . . . , n e j = 1, . . . , mi . Demonstra¸˜o: A prova segue imediatamente do teorema anterior. ca Teorema 3.4 Defina a aplica¸˜o ca F : ∆ = ∆m1 × ∆m2 × · · · × ∆mn → ∆ = ∆m1 × ∆m2 × · · · × ∆mn , p = (p1 , p2 , . . . , pn ) → F(p) = (y1 (p), y2 (p), . . . , yn (p)) onde yi (p) = (yi1 (p), yi2 (p), . . . , yimi (p)), pi = (pi1 , pi2 , . . . , pimi ) e pij + gij (p) yij (p) = mi . 1+ gik (p) k=1 Temos que p∗ ´ um equil´ e ıbrio de Nash se, e somente se, F(p∗ ) = p∗ , isto ´, se, e somente se, p∗ ´ um ponto fixo da aplica¸˜o F. e e ca Demonstra¸˜o: observe que, de fato, F(∆) ⊆ ∆ pois claramente yij ≥ 0 e ca   mi mi mi mi  mi  pik + gik (p) 1+ gik (p)  pik + gik (p)  k=1 k=1 k=1 yik (p) =  = = = 1,  mi  mi mi k=1 k=1   1+ gik (p) 1+ gik (p) 1+ gik (p) k=1 k=1 k=1 isto ´, cada yi (p) ∈ ∆mi . e
    • O teorema de equil´ ıbrio de Nash 41 (⇒) Se p∗ ´ um equil´ e ıbrio de Nash, ent˜o gij (p∗ ) = 0 para cada i = a1, . . . , n e j = 1, . . . , mi . Desta maneira, yij (p∗ ) = p∗ para cada i = 1, . . . , n ije j = 1, . . . , mi , isto ´, yi (p∗ ) = p∗ para cada i = 1, . . . , n ou, ainda, F(p∗ ) = e i ∗p. (⇐) Suponha que p∗ = (p∗ , p∗ , . . . , p∗ ) ∈ ∆ = ∆m1 × · · · × ∆mn seja um 1 2 nponto fixo da aplica¸˜o F : ∆ → ∆, isto ´, suponha que ca e p∗ + gij (p∗ ) ij p∗ ij = mi 1+ gik (p∗ ) k=1para todo j = 1, . . . , mi e i = 1, . . . , n. Segue-se ent˜o que a mi p∗ ij · gik (p∗ ) = gij (p∗ ), k=1para todo j = 1, . . . , mi e i = 1, . . . , n. Afirmamos que α = mi gik (p∗ ) = k=10, de modo que gik (p∗ ) = 0 para todo k = 1, . . . , mi e i = 1, . . . , n. De fato:se, por absurdo, α > 0, vemos a partir da rela¸˜o acima que ca gij (p∗ ) > 0 se, e somente se, p∗ > 0. ijSem perda de generalidade, suponha que p∗ > 0, p∗ > 0, . . . , p∗ > 0 e i1 i2 il ∗ ∗ ∗pi(l+1) = pi(l+2) = · · · = pimi = 0. Observe que mi p∗ i = p∗ e k , ik k=1onde ei ´ o i-´simo vetor da base canˆnica de Rmi . Dado que gik (p∗ ) > 0 e e opara todo k = 1, . . . , l, temos que ui (ei , p∗ ) > ui (p∗ , p∗ ), −i i −ipara todo k = 1, . . . , l. Desta maneira, mi mi lui (p∗ , p∗ ) i −i = ui p∗ ek , p∗ ik −i = p∗ ik · ui (ek , p∗ ) −i = p∗ · ui (ek , p∗ ) ik −i k=1 k=1 k=1 > l l p∗ ik · ui (p∗ , p∗ ) i −i = ui (p∗ , p∗ ) i −i · p∗ = ui (p∗ , p∗ ) , ik i −i k=1 k=1
    • 42 II Bienal da Sociedade Brasileira de Matem´tica a um absurdo. Isto demonstra que gij (p∗ ) = 0 para todo j = 1, . . . , mi e j = 1, . . . , m e, assim, p∗ ´ um equil´ e ıbrio de Nash em estrat´gias mistas. e Teorema 3.5 (do equil´ ıbrio de Nash) Todo jogo definido por ma- trizes de payoffs possui um equil´ ıbrio de Nash. Demonstra¸˜o: A aplica¸˜o F : ∆ → ∆ definida no teorema anterior ´ ca ca e cont´ ınua e ∆ ´ um conjunto compacto e convexo. Pelo teorema do ponto e fixo de Brouwer, F possui um ponto fixo p∗ . Pelo teorema anterior, p∗ ´ um e equil´ ıbrio de Nash. O teorema 3.3 sugere uma maneira de se calcular os equil´ ıbrios de Nash de um jogo. Eles s˜o solu¸˜es do seguinte problema de otimiza¸ao n˜o-linear: a co c˜ a n mi minimizar (gij (p))2 i=1 j=1 sujeito a p ∈ ∆. Com efeito: a soma de quadrados ´ zero se, e somente se, cada parcela ´ e e igual a zero. Exemplo 3.1 Para o dilema do prisioneiro (exemplo 1.1, p´gina 6), a (p, q) = (p, 1 − p; q, 1 − q) ∈ ∆2 × ∆2 ´ um equil´ e ıbrio de Nash se, e somente se, (p, q) ´ solu¸˜o do seguinte problema e ca de otimiza¸˜o ca minimizar G(p, q) = (max {0, − (−1 + p) (4 q + 1)})2 + (max {0, −p (4 q + 1)})2 + (max {0, − (4 p + 1) (−1 + q)})2 + (max {0, −q (4 p + 1)})2 sujeito a 0 ≤ p ≤ 1, 0 ≤ q ≤ 1.
    • O teorema de equil´ ıbrio de Nash 43Como vemos pela figura 3.1, que mostra o gr´fico e o mapa de contorno ade G, o ponto (p∗ , q∗ ) = (1, 0; 1, 0)´ o unico equil´e ´ ıbrio de Nash do jogo.Exemplo 3.2 Para a batalha dos sexos (exemplo 1.2, p´gina 7), a (p, q) = (p, 1 − p; q, 1 − q) ∈ ∆2 × ∆2´ um equil´e ıbrio de Nash se, e somente se, (p, q) ´ solu¸˜o do seguinte problema e cade otimiza¸˜o ca minimizar G(p, q) = (max {0, −5 (−1 + p) (3 q − 1)})2 + (max {0, −5 p (3 q − 1)})2 + (max {0, −5 (3 p − 2) (−1 + q)))2 + (max {0, −5 q (3 p − 2)})2 sujeito a 0 ≤ p ≤ 1, 0 ≤ q ≤ 1.Como vemos pela figura 3.2, que mostra o gr´fico e o mapa de contorno ade G, os pontos(p∗ , q∗ ) = (1, 0; 1, 0), (p∗ , q∗ ) = (0, 1; 0, 1) e (p∗ , q∗ ) = (2/3, 1/3; 1/3, 2/3)s˜o os unicos equil´ a ´ ıbrios de Nash do jogo.Exemplo 3.3 Para o jogo do item (d) do exemplo 1.4 da p´gina 11, a (p, q) = (p, 1 − p; q, 1 − q) ∈ ∆2 × ∆2´ um equil´e ıbrio de Nash se, e somente se, (p, q) ´ solu¸˜o do seguinte problema e cade otimiza¸˜o ca minimizar G(p, q) = (max {0, −2 (−1 + p) (2 q − 1)})2 + (max {0, −2 p (2 q − 1)})2 + (max {0, 2 (2 p − 1) (−1 + q)})2 + (max {0, 2 (2 p − 1) q})2 sujeito a 0 ≤ p ≤ 1, 0 ≤ q ≤ 1.
    • 44 II Bienal da Sociedade Brasileira de Matem´tica a Como vemos pela figura 3.3, que mostra o gr´fico e o mapa de contorno a de G, o ponto (p∗ , q∗ ) = (1/2, 1/2; 1/2, 1/2) ´ o unico equil´ e ´ ıbrio de Nash do jogo. Exemplo 3.4 Para o jogo do exemplo 1.6 da p´gina 17, a (p, q) = (p, 1 − p; q, 1 − q) ∈ ∆2 × ∆2 ´ um equil´ e ıbrio de Nash se, e somente se, (p, q) ´ solu¸˜o do seguinte problema e ca de otimiza¸˜o ca minimizar G(p, q) = (max {0, −2 (−1 + p) (2 q − 1)})2 + (max {0, −2 p (2 q − 1)})2 + (max {0, (−3 + 4 p) (−1 + q)})2 + (max {0, q (−3 + 4 p)})2 sujeito a 0 ≤ p ≤ 1, 0 ≤ q ≤ 1. Como vemos pela figura 3.4, que mostra o gr´fico e o mapa de contorno a de G, o ponto (p∗ , q∗ ) = (3/4, 1/4; 1/2, 1/2) ´ o unico equil´ e ´ ıbrio de Nash do jogo.
    • O teorema de equil´ ıbrio de Nash 45 25 20 15 10 5 1 0.5 q 0 0 0.2 0.4 0.6 0 0.8 1 p p 0 0.2 0.4 0.6 0.8 1 1 0.8 0.6 q 0.4 0.2 0 Figura 3.1: Encontrando os equil´ ıbrios de Nash para o dilema do prisioneiro via um problema de otimiza¸˜o. ca
    • 46 II Bienal da Sociedade Brasileira de Matem´tica a 3 2.5 2 1.5 1 1 0.5 0.8 0.6 0.4 q 0 0.2 0 0.2 0.4 0.6 0 0.8 1 p p 0 0.2 0.4 0.6 0.8 1 1 0.8 0.6 q 0.4 0.2 0 Figura 3.2: Encontrando os equil´ ıbrios de Nash para a batalha dos sexos via um problema de otimiza¸˜o. ca
    • O teorema de equil´ ıbrio de Nash 47 4 3 2 1 1 0.8 0.6 q 0.4 0.2 0.8 1 0 0.4 0.6 0 0.2 p p 0 0.2 0.4 0.6 0.8 1 1 0.8 0.6 q 0.4 0.2 0 Figura 3.3: Encontrando os equil´ ıbrios de Nash do jogo do item (d) do exem- plo 1.4 via um problema de otimiza¸˜o. ca
    • 48 II Bienal da Sociedade Brasileira de Matem´tica a 8 6 4 2 1 0.8 0.6 q 0.4 0.2 0.8 1 0 0.4 0.6 0 0.2 p p 0 0.2 0.4 0.6 0.8 1 1 0.8 0.6 q 0.4 0.2 0 Figura 3.4: Encontrando os equil´ ıbrios de Nash do jogo do exemplo 1.6 via um problema de otimiza¸˜o. ca
    • Cap´ ıtulo 4A forma extensa de um jogo Como vimos, a forma normal ´ usada em situa¸˜es onde os jogadores es- e cocolhem sua estrat´gia simultaneamente ou o fazem sem conhecer a estrat´gia e edos outros jogadores. Existem outras situa¸˜es (como por exemplo nos mundo dos neg´cios ou co ona pol´ ıtica e em alguns jogos de cartas) em que os jogadores tomam suasdecis˜es de forma seq¨encial, depois de observar a a¸˜o que um outro jogador o u carealizou. A forma extensa tem uma estrutura mais adequada para analisarjogos desta natureza, especificando assim quem se move, quando, com qualinforma¸˜o e o payoff ou ganho de cada jogador. Ela cont´m toda informa¸˜o ca e casobre um jogo. Existem v´rias formas de se representar um jogo da forma extensa, to- adas elas tentando formalizar a id´ia de ´rvore. Entre elas: (1) rela¸˜es de e a coordem (algo mais familiar a um matem´tico), (2) teoria de grafos [9] e (3) aalfabetos [8] (mais familiar a um cientista da computa¸˜o). Usaremos aqui caa abordagem de alfabetos e palavras.4.1 Representa¸˜o de um jogo via alfabetos e ´rvores ca a Um jogo na forma extensa consiste de um conjunto de jogadores N = {0, 1, 2, . . . , n},um conjunto das a¸˜es poss´ co ıveis de cada jogador e os ganhos de cada um.
    • 50 II Bienal da Sociedade Brasileira de Matem´tica a Defini¸˜o 4.1 Chamamos de alfabeto a um conjunto de letras ca Σ = {a1 , a2 , . . . , ak }. Denotamos por Σ∗ ao conjunto de palavras que podem ser formadas pelos elementos do alfabeto Σ. Uma ´rvore sobre Σ ´ um conjunto a e ∗ ∗ ′ T ⊆ Σ de n´s (palavras) ω ∈ Σ tal que, se ω = ω a ∈ T para algum o a ∈ Σ, ent˜o ω ′ ∈ T . a Exemplo 4.1 No jogo descrito na figura 4.1 existem quatro jogadores, um deles denominado “Natureza”. (1,-1,1) RRS Jogador 3 RRR (1,2,0) RR (3,1) RRL Jogador 2 (0,1,-1) (2,1) RL R Jogador 1 RLR (2,0,0) Jogador 1 RLL (1,2) (1,2,3) (1,1) LRR (0,0,0) L LRL LR (1,2) (1,1,1) (2,1) LL 1/3 (0,2,3) LLS Natureza 1/6 LLR (0,2,0) (0,1) LLL 1/2 (2,0,0) Figura 4.1: Um jogo descrito por uma arvore. ´ Representaremos este jogo usando o alfabeto Σ = {L, R, S}. O conjunto
    • A forma extensa de um jogo 51de palavras correspondente a este alfabeto ´: e Σ∗ = {ǫ, L, R, S, LL, LR, LS, RL, RR, RS, SL, SS, SR, LLL, LLR, . . .},onde ǫ representa a “palavra vazia”, isto ´, a palavra sem letra alguma. A e´rvore que representa este jogo ´ o conjunto:a e T = {ǫ, L, R, LL, LR, RL, RR, LLL, LLR, LLS, LRL, LRR, RLL, RLR, RRL, RRR, RRS}. Note que a forma extensa traz v´rias informa¸˜es sobre o jogo, como a vez a coque cada jogador joga, os movimentos dispon´ ıveis para cada um, os payoffsde cada um, etc. Para codificar estas informa¸˜es, precisaremos de mais codefini¸˜es. co Defini¸˜o 4.2 Dado um n´ ω ∈ T , definimos o conjunto dos n´s-filhos ca o o de ω, denotado por ch(ω), como sendo o conjunto ch(ω) = {ω ′ ∈ T | ω ′ = ωa, para algum a ∈ Σ}Exemplo 4.2 No jogo do exemplo 4.1, os n´s-filhos de cada n´ da arvore T o o ´s˜o como se segue: a ch(ǫ) = {L, R}, ch(L) = {LL, LR}, ch(R) = {RL, RR}, ch(LL) = {LLL, LLR, LLS}, ch(LR) = {LRL, RLR}, ch(RL) = {RLL, RLR}, ch(RR) = {RRL, RRR, RRS}. Defini¸˜o 4.3 Dado um n´ ω ∈ T , os movimentos (ou a¸˜es) dis- ca o co pon´ ıveis para ω s˜o os elementos do conjunto a Act(ω) = {a ∈ Σ | ωa ∈ T }.
    • 52 II Bienal da Sociedade Brasileira de Matem´tica a Exemplo 4.3 No jogo do exemplo 4.1, os movimentos de cada n´ da arvore T o ´ s˜o como se segue: a Act(ǫ) = {L, R}, Act(L) = {L, R}, Act(R) = {L, R}, Act(LL) = {L, R, S}, Act(LR) = {L, R}, Act(RL) = {L, R}, Act(RR) = {L, R, S}. Defini¸˜o 4.4 Um n´-folha ou n´ terminal ω ∈ T ´ um n´ tal que ca o o e o ch(ω) = ∅. Denotaremos o conjunto de n´s folhas por o LT = {ω ∈ T | ω ´ n´ folha}. e o Exemplo 4.4 O conjunto dos n´s-folhas LT da ´rvore T do exemplo 4.1 ´: o a e LT = {LLL, LLR, LLS, LRL, LRR, RLL, RLR, RRL, RRR, RRS}. Existem n´s que n˜o s˜o controlados por nenhum jogador. Em um n´ o a a o deste tipo, nenhum dos jogadores toma decis˜es. O movimento a partir o deste n´ ´ definido por probabilidades, pela “sorte”. Ele representa, por o e exemplo, a situa¸˜o em um jogo na qual se joga um dado ou uma moeda ca para decidir que movimento fazer ou qual jogador ir´ jogar. Este fator a “sorte” ´ representado no jogo pelo jogador natureza. Usaremos a conven¸˜o e ca de que N = 0 ´ o jogador natureza. Para cada n´ do jogador natureza, e o ω ∈ Pl0 , define-se uma distribui¸˜o de probabilidade qω : Act(ω) → R sobre ca suas a¸˜es, isto ´, define-se uma fun¸˜o qω de Act(ω) em R que satisfaz as co e ca condi¸˜es co qω (a) ≥ 0 e qω (a) = 1. a∈Act(ω) Exemplo 4.5 No exemplo 4.1, se o jogador 1 escolhe L e o jogador 2 escolhe L, o pr´ximo a “jogar” ´ o jogador “natureza”. Neste n´, a distribui¸˜o de o e o ca probabilidades das jogadas poss´ ıveis ´ dada por: e qLL : Act(LL) → R L → qLL (L) = 1/2 . R → qLL (R) = 1/6 S → qLL (S) = 1/3
    • A forma extensa de um jogo 53 Defini¸˜o 4.5 Denote por pl : T − LT → N ∪ {0} a fun¸˜o que associa ca ca a cada n´ ω ∈ T − LT o jogador pl(ω) cujo movimento est´ em ω. o a Assim, Pli = pl−1 (i) representa o conjunto de todos os n´s onde o jogador i faz seu movi- o mento.Exemplo 4.6 No exemplo 4.1, pl(ǫ) = 1, pl(L) = 2, pl(R) = 2, pl(LL) = 0, pl(LR) = 1, pl(RL) = 1, pl(RR) = 3e, tamb´m, e Pl1 = pl−1 (1) = {ǫ, LR, RL}, Pl2 = pl−1 (2) = {L, R}, Pl3 = pl−1 (3) = {RR}, Pl0 = pl−1 (0) = {LL}. Defini¸˜o 4.6 Uma trajet´ria (finita ou infinita) π em T ´ uma ca o e seq¨ˆncia π = ω0 ω1 ω2 · · · de n´s ωi ∈ T onde, se ωi+1 ∈ T , ent˜o ue o a ωi+1 = ωi a, para algum a ∈ Σ. A trajet´ria ´ completa (ou ´ uma o e e jogada) se ω0 = ǫ (n´ inicial) e se todo n´ n˜o-folha na trajet´ria π o o a o tem um n´-filho em π. Denotaremos o conjunto de todas as jogadas o de T por ψT .Exemplo 4.7 No exemplo 4.1, o conjunto ψT ´ e ψT = {π1 , π2 , π3 , π4 , π5 , π6 , π7 , π8 , π9 , π10 },onde as trajet´rias s˜o: o a π1 = (ǫ, L, LL, LLL), π2 = (ǫ, L, LL, LLR), π3 = (ǫ, L, LL, LLS), π4 = (ǫ, L, LR, LRL), π5 = (ǫ, L, LR, LRR), π6 = (ǫ, R, RL, RLL), π7 = (ǫ, R, RL, RLR), π8 = (ǫ, R, RR, RRL), π9 = (ǫ, R, RR, RRR), π10 = (ǫ, R, RR, RRS).
    • 54 II Bienal da Sociedade Brasileira de Matem´tica a Defini¸˜o 4.7 Um conjunto informa¸˜o de um jogador i ´ um con- ca ca e junto de n´s tal que estes n´s pertencem a um mesmo jogador i e os o o movimentos dispon´ ıveis s˜o os mesmos para cada n´ pertencente ao a o conjunto. Para cada jogador i, representaremos por infoi : Pli → N a fun¸˜o que associa a cada n´ ω ∈ Pli um ´ ca o ındice infoi (ω) para um conjunto de informa¸˜es do jogador i. Assim, co Infoi,j = info−1 (j) ´ o conjunto de n´s do j-´simo conjunto-informa¸˜o para o jogador i. e o e ca Logo, para quaisquer i,j e n´s ω, ω ∈ Infoi,j , Act(ω) = Act(ω ′ ), ou o ′ seja, o conjunto de poss´ ıveis a¸˜es de todos os n´s do mesmo conjunto- co o informa¸˜o ´ o mesmo. ca e Exemplo 4.8 No exemplo 4.1, info1 : Pl1 → N, info2 : Pl2 → N, info3 : Pl3 → N. ǫ → 1 L → 1 RR → 1 LR → 2 R → 2 RL → 2 Assim, os conjuntos Infoi,j formados pelos n´s do j-´simo conjunto-informa- o e c˜o do jogador i s˜o: ¸a a Info1,1 = {ǫ}, Info1,2 = {LR, RL}, Info2,1 = {L, R}, Info3,1 = {RR}. Defini¸˜o 4.8 Uma fun¸˜o utilidade para o jogador i ´ uma fun¸˜o ca ca e ca real ui : ΨT → R definida no conjunto ΨT das jogadas completas. O valor de ui em cada jogada de ΨT determina o payoff do jogador i para esta jogada.
    • A forma extensa de um jogo 55Exemplo 4.9 As fun¸˜es utilidades de cada jogador do exemplo 4.1 s˜o: co a u1 : ΨT → R, u2 : ΨT → R, u3 : ΨT → R, π1 → 2 π1 → 0 π1 → 0 π2 → 0 π2 → 2 π2 → 0 π3 → 0 π3 → 2 π3 → 3 π4 → 1 π4 → 1 π4 → 1 π5 → 0 π5 → 0 π5 → 0 π6 → 1 π6 → 2 π6 → 3 π7 → 2 π7 → 0 π7 → 0 π8 → 0 π8 → 1 π8 → −1 π9 → 1 π9 → 2 π9 → 0 π10 → 1 π10 → −1 π10 → 1onde π1 , π2 , . . . , π10 s˜o as jogadas descritas no exemplo 4.7 na p´gina 50. a a Defini¸˜o 4.9 Uma estrat´gia pura sik , para um jogador i em um ca e jogo G na forma extensa ´ uma fun¸˜o sik : Pli → Σ, que a cada n´ e ca o ω do jogador i associa um movimento de modo que sik (ω) ∈ Act(ω) e tal que se ω, ω ′ ∈ Infoi,j , ent˜o sik (ω) = sik (ω ′ ). Assim, a fun¸˜o a ca sik representa a k-´sima estrat´gia do jogador i, onde k varia de 1 at´ e e e m |Σ |, com m = | Pli |. Denotaremos por Si o conjunto das estrat´gias e puras para o jogador i.Exemplo 4.10 Para o jogador 1 do exemplo 4.1 temos que Pl1 = {ǫ, LR, RL}.Considerando todas as combina¸˜es poss´ co ıveis de movimentos para este joga-dor, temos 8 fun¸˜es candidatas (descritas como conjuntos de pares ordena- codos): s11 = {(ǫ, L), (LR, L), (RL, L)}, s12 = {(ǫ, L), (LR, L), (RL, R)}, s13 = {(ǫ, L), (LR, R), (RL, L)}, s14 = {(ǫ, L), (LR, R), (RL, R)}, s15 = {(ǫ, R), (LR, L), (LR, L)}, s16 = {(ǫ, R), (LR, L), (RL, R)}, s17 = {(ǫ, R), (LR, R), (RL, L)}, s18 = {(ǫ, R), (LR, R), (RL, R)}.
    • 56 II Bienal da Sociedade Brasileira de Matem´tica a Como a defini¸˜o de estrat´gia pura imp˜e que si (ω) = si (ω ′ ) sempre que ω, ca e o ′ ω ∈ Infoi,j , as fun¸˜es s12 , s13 , s15 , s16 e s17 s˜o descartadas. Desta maneira, co a o conjunto S1 das estrat´gias puras para o jogador 1 ´ e e S1 = {s11 , s14 , s15 , s18 }. Da mesma maneira, para o jogador 2, temos que Pl2 = {L, R} e S2 = {s21 , s24 }, onde s21 = {(L, L), (R, L)} e s24 = {(L, R), (R, R)}. Para o jogador 3, temos que Pl3 = {RR} e S3 = {s31 , s34 , s33 }, onde s31 = {(RR, L)}, s32 = {(RR, R)} e s33 = {(RR, S)}. Obtivemos, assim, 4 · 2 · 3 = 24 perfis de estrat´gias puras ao todo: e s1 = (s11 , s21 , s31 ), s2 = (s11 , s21 , s32 ), s3 = (s11 , s21 , s33 ), s4 = (s11 , s24 , s31 ), s5 = (s11 , s24 , s32 ), s6 = (s11 , s24 , s33 ), s7 = (s14 , s21 , s31 ), s8 = (s14 , s21 , s32 ), s9 = (s14 , s21 , s33 ), s10 = (s14 , s24 , s31 ), s11 = (s14 , s24 , s32 ), s12 = (s14 , s24 , s33 ), s13 = (s15 , s21 , s31 ), s14 = (s15 , s21 , s32 ), s15 = (s15 , s21 , s33 ), s16 = (s15 , s24 , s31 ), s17 = (s13 , s24 , s32 ), s18 = (s15 , s24 , s33 ), s19 = (s18 , s21 , s31 ), s20 = (s18 , s21 , s32 ), s21 = (s18 , s21 , s33 ), s22 = (s18 , s24 , s31 ), s23 = (s18 , s24 , s32 ), s24 = (s18 , s24 , s33 ). Considere agora um vetor que representa um perfil de estrat´gias puras e s = (s1 , s2 , . . . , sn ) ∈ S1 × S2 × · · · × Sn . Se n˜o houver n´ pertencente ao jogador natureza (isto ´, se Pl0 = ∅), ent˜o a o e a s determina unicamente uma jogada πs do jogo e os jogadores movem de acordo com suas estrat´gias seguindo o algoritmo: e
    • A forma extensa de um jogo 57 –Tome um perfil de estrat´gias puras s = (s1 , s2 , . . . , sn ). e –Fa¸a j = 0 e ω0 := ǫ c –Enquanto ωj n˜o ´ n´ terminal, fa¸a: a e o c Se ωj ∈ Pli ,ent˜o ωj+1 := ωj si (ωj ) a j := j + 1 ; –πs = ω0 ω1 · · · –O caminho π encontrado tem que ser igual ao escolhido.Se houver n´ do jogador natureza, ent˜o s ∈ S determina uma distribui¸˜o de o a caprobabilidade sobre as jogadas π do jogo. Para jogos da forma extensa finitos,isto ´, jogos onde a arvore T ´ finita, ´ poss´ e ´ e e ıvel calcular explicitamente aprobabilidade ps (π) de cada jogada π usando as probabilidades qω (a) atrav´s edo seguinte algoritmo: –Tome um perfil s ∈ S1 × S2 × . . . × Sn . –Tome uma jogada π = ω0 · · · ωm de T . –Verifique se π ´ compat´ com o perfil s, usando o algoritmo acima. e ıvel –Se π n˜o for compat´ com o perfil s, ent˜o ps (π) = 0. a ıvel a –Se π ´ compat´ com o perfil s, ent˜o: e ıvel a –Se π n˜o tem n´ do jogador natureza, ent˜o ps (π) = 1. a o a –Se π tem n´ do jogador natureza, ent˜o ps (π) = r qωjk (ajk ). o a k=1Exemplo 4.11 O leitor n˜o ter´ dificuldade de verificar que, atrav´s deste a a ealgoritmo, aplicado ao jogo do exemplo 4.1, s4 , s5 , s6 determinam a jogadaπ4 , s10 , s11 , s12 determinam a jogada π5 , s13 , s14 , s15 determinam a jogada π6 ,s19 , s20 , s21 determinam a jogada π7 , s16 , s22 determinam a jogada π8 , s17 , s23determinam a jogada π9 e s18 , s24 determinam a jogada π10 . ¸˜Observacoes.1. Se o caminho πk n˜o possui n´ natureza, ent˜o o perfil de estrat´gia que ´ a o a e e compat´ com ele, determina unicamente a jogada πk , ou seja, um perfil ıvel determina uma s´ jogada. o
    • 58 II Bienal da Sociedade Brasileira de Matem´tica a 2. Se o caminho πk possui n´s natureza, ent˜o o perfil de estrat´gia determina o a e uma distribui¸˜o de probabilidade sobre os πk′ s que s˜o compat´ ca a ıveis com ele, ou seja, um perfil pode determinar mais de uma jogada. 3. No exemplo 4.1, s1 , s2 , s3 , s7 , s8 , s9 determinam uma distribui¸˜o de pro- ca babilidade sobre π1 , π2 e π3 . Defini¸˜o 4.10 Para um jogo na forma extensa, dado um perfil puro ca s = (s1 , s2 , . . . , sn ) ∈ S1 × S2 × · · · × Sn , podemos definir o payoff esperado para o jogador i sob s como sendo o n´mero u hi (s) = ps (π) ∗ ui (π). π∈ΨT Exemplo 4.12 No jogo do exemplo 4.1, h1 (s1 ) = ps1 (π) ∗ u1 (π) = π∈ΨT 1 1 1 · 2 + · 0 + · 0 + 0 · 1 + 0 · 0 + ··· + 0 · 0 = 1 2 6 3 e h1 (s3 ) = ps3 (π) ∗ u1 (π) = 1. π∈ΨT 4.2 Convers˜o entre as formas normal e extensa a Todo jogo estrat´gico finito Γ pode ser convertido em um jogo na forma e extensa GΓ . Por exemplo, o jogo Pedra-Papel-Tesoura com dois jogadores, que ´ um jogo onde os jogadores escolhem suas estrat´gias simultaneamente, e e tem a seguinte matriz de payoffs:
    • A forma extensa de um jogo 59 J2 Pedra Papel Tesoura Pedra ( 0, 0) (−1, 1) ( 1, −1) Papel ( 1, −1) ( 0, 0) (−1, 1) J1 Tesoura (−1, 1) ( 1, −1) ( 0, 0) Neste jogo, o segundo jogador n˜o sabe a estrat´gia do primeiro e vice- a eversa, portanto o conjunto de informa¸˜es do segundo jogador possui trˆs co en´s. A forma extensa deste jogo ´ a ´rvore da figura 4.2. o e a (0,0) Te J2 Pp (-1,1) (2,1) Pd Te (1,-1) (1,-1) Te J1 Pp Pp (0,0) (1,1) (2,1) Pd (-1,1) Pd (-1,1) Te Pp (1,-1) (2,1) Pd (0,0) Figura 4.2: O jogo Pedra (Pd)-Papel (Pp)-Tesoura (Te). Reciprocamente, todo jogo da forma extensa G pode ser visto como umjogo da forma estrat´gica ΓG . Geralmente, o jogo na forma normal ΓG fica emuito maior do que na forma extensa. Para se ter uma id´ia, se o jogador i epossuir m n´s na ´rvore, isto ´, se |P li | = m, ent˜o o n´mero de estrat´gias o a e a u e
    • 60 II Bienal da Sociedade Brasileira de Matem´tica a puras para um jogador i ´, no pior caso, |Σ|m . Note que se o jogo da forma e extensa G ´ finito, ou seja, se a ´rvore ´ finita, ent˜o o jogo na forma normal e a e a ´ tamb´m finito. Realizamos a convers˜o da forma extensa G para a normal e e a ΓG da seguinte forma: (1) Em ΓG , as estrat´gias para o jogador i s˜o as aplica¸˜es si ∈ Si . e a co (2) Em ΓG , definimos o payoff ui (s) := hi (s), para todo perfil de es- trat´gia pura s. e Vejamos como fica, na forma normal, o jogo na forma extensa do exemplo 4.1. Se o jogador 3 escolhe a estrat´gia s31 , temos a matriz: e j1 s11 s14 s15 s18 s21 ( 1, 1, 1) ( 1, 1, 1) ( 1, 2, 3) ( 2, 0, 0) j2 s24 ( 1, 1, 1) ( 0, 0, 0) ( 0, 1, −1) ( 0, 1, −1) Se o jogador 3 escolhe a estrat´gia s32 , temos a matriz: e j1 s11 s14 s15 s18 s21 ( 1, 1, 1) ( 1, 1, 1) ( 1, 2, 3) ( 2, 0, 0) j2 s24 ( 1, 1, 1) ( 0, 0, 0) ( 1, 2, 0) ( 1, 2, 0) Se o jogador 3 escolhe a estrat´gia s33 , temos a matriz: e j1 s11 s14 s15 s18 s21 ( 1, 1, 1) ( 1, 1, 1) ( 1, 2, 3) ( 2, 0, 0) j2 s24 ( 1, 1, 1) ( 0, 0, 0) ( 1, −1, 1) ( 1, −1, 1)
    • Bibliografia [1] C. Bouton, Nim, a Game with a Complete Mathematical Solution. An- nals of Mathematics, pp. 35-39, 1902. [2] E. R. Berlekamp, J. H. Conway e R. K. Guy, Winning Ways for Your Mathematical Plays, Vol. 2. Academic Press, New York, 1984. [3] A. A. Cournot, Recherches sur les Principes Math´matiques de la e Th´orie des Richesses, 1838. Traduzido por N. T. Bacon em Researches e into the Mathematical Principles of the Theory of Wealth, McMillan, New York, 1927. [4] J. Conway, All Games Brigth and Beautiful. The American Mathema- tical Monthly, pp. 417–434, 1977. [5] J. Conway, A Gamut of Game and Theories. Mathematics Magazine, pp. 5–12, 1978. [6] J. Conway e R. Guy, The Book of Numbers. Springer-Verlag, New York, 1996. [7] J. Conway, On Numbers and Games, Second Edition. A. K. Peters, Natick, 2000. [8] K. Etessami, Algorithmic Game Theory and Aplications. Lecture Notes, School of Informatics, The University of Edinburgh, Scotland, UK, 2004. [9] S. Hart, Games in Extensive and Strategic Forms. Cap´ ıtulo 2 em Hand- book of Game Theory, vol. 1, R. J. Aumann e S. Hart (editores), Else- vier Science Publishers, 1992.[10] C. H. H¨nig, Aplica¸˜es da Topologia ` An´lise. IMPA, CNPq, Rio de o co a a Janeiro, 1986.
    • 62 II Bienal da Sociedade Brasileira de Matem´tica a [11] D. Knuth, Surreal Numbers. Addison Wesley, 1974. [12] D. G. Luenberger, Linear and Nonlinear Programming, Second Edi- tion. Addision-Wesley Publishing Company, 1989. [13] J. F. Nash Jr., Equilibrium Points in n-person Games. Proceedings of the National Academy of Sciences of the United States of America, pp. 48–49, 1950. [14] J. F. Nash Jr., Non-Cooperative Games. PhD. Thesis. Princeton Uni- versity Press, 1950. [15] J. F. Nash Jr., The Bargaining Problem. Econometrica, pp. 155–162, 1950. [16] J. F. Nash Jr., Non-Cooperative Games. Annals of Mathematics, pp. 286–295, 1951. [17] J. F. Nash Jr., Two-person Cooperative Games. Econometrica, pp. 128– 140, 1953. [18] J. von Neumann. Zur Theorie der Gesellschaftsspiele. Mathematische Annalen, vol. 100, pp. 295-320. Traduzido por S. Bargmann: On the Theory of Games of Stategy em Contributions to the Theory of Games, vol. 4, pp. 13-42, A. W. Tucker e R. D. Luce (editores), Princeton University Press, 1959. [19] J. von Neumann e O. Morgenstern, Theory of Games and Economic Behavior. Princeton University Press, 1944. ¨ [20] R. Sprague, Uber Mathematische Kampfspiele. Tohoku Mathematical Journal, pp. 438-441, 1935-1936. ¨ [21] E. Zermelo, Uber eine Anwendung der Mengdenlehre auf die theories des Schachspiels. Atas do D´cimo Quinto Congresso Internacional de e Matem´ticos, vol. 2, pp. 501–504, 1913. a