Teoria dos jogos

4,342 views

Published on

Published in: Education
0 Comments
10 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
4,342
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
0
Comments
0
Likes
10
Embeds 0
No embeds

No notes for slide

Teoria dos jogos

  1. 1. Teoria dos Jogos fAlvaro Augusto de Almeida Pag. 1 16/08/12
  2. 2. Tudo está em Jogo!• A Teoria dos Jogos é um ramo da Matemática Aplicada que usa modelos para estudar as interações entre agentes (jogadores) em estruturas formais de incentivo (jogos). Alvaro Augusto de Almeida Pag. 2 16/08/12
  3. 3. Os Jogos• Os jogos em questão podem ser de várias formas: – Relações interpessoais. – Relações econômicas. – Estratégias militares, de caça e de negociação. – Comportamento animal (etologia). Alvaro Augusto de Almeida Pag. 3 16/08/12
  4. 4. Jogos Mais Interessantes• No contexto da Teoria dos Jogos, os jogos mais interessantes são aqueles que induzem a raciocínios do tipo: “o que será que ele está pensando sobre o que eu estou pensando que ele está pensando?” Alvaro Augusto de Almeida Pag. 4 16/08/12
  5. 5. Jogos de Soma Zero• John von Neumann e Oskar Morgenstern, 1944.• Jogos de “Soma Zero”: o ganho de um jogador é igual à perda do outro.• Ex.: xadrez, pôquer. Alvaro Augusto de Almeida Pag. 5 16/08/12
  6. 6. Jogos de Soma Não Zero• John Nash, 1950.• Jogos de “Soma Não Zero”: os ganhos dos jogadores são não nulos.• Equilíbrio de Nash. Alvaro Augusto de Almeida Pag. 6 16/08/12
  7. 7. Dilema do Prisioneiro • Protótipo para jogos de soma não zero. • Cada jogador tenta maximizar os seus resultados, sem conhecimento das escolhas do outro jogador.Alvaro Augusto de Almeida Pag. 7 16/08/12
  8. 8. Estrutura do Dilema do Prisioneiro• Dois ladrões cometem um crime em conjunto e são capturados.• A polícia interroga cada um deles separadamente e oferece as seguintes opções: – Se ficarem calados (cooperação), ambos são condenados a um ano de cadeia; – Se ambos confessarem (falta de cooperação), ambos são condenados a dois anos; – Se apenas um confessar (traição), aquele que confessou ganha liberdade (“delação premiada”), e o outro é condenado a cinco anos . Alvaro Augusto de Almeida Pag. 8 16/08/12
  9. 9. Matriz de Pay-Offs Valério Confessa Não confessa (não coopera) (coopera) (não coopera) 2 anos 5 anos Confessa 2 anos Liberdade Delúbio Não confessa (coopera) Liberdade 1 ano 5 anos 1 anoAlvaro Augusto de Almeida Pag. 9 16/08/12
  10. 10. A Melhor Estratégia para Ambos Valério Confessa Não confessa (não coopera) (coopera) (não coopera) 2 anos 5 anos Confessa 2 anos Liberdade Delúbio Não confessa (coopera) Liberdade 1 ano 5 anos 1 anoAlvaro Augusto de Almeida Pag. 10 16/08/12
  11. 11. A Melhor Estratégia?• A Estratégia anterior depende de absoluta confiança entre os dois ladrões. Mas, se eles são ladrões...• Assim, rapidamente Valério perceberá que pode trair Delúbio e sair em liberdade. Alvaro Augusto de Almeida Pag. 11 16/08/12
  12. 12. A Melhor Estratégia para Valério Valério Confessa Não confessa (não coopera) (coopera) (não coopera) 2 anos 5 anos Confessa 2 anos Liberdade Delúbio Não confessa (coopera) Liberdade 1 ano 5 anos 1 anoAlvaro Augusto de Almeida Pag. 12 16/08/12
  13. 13. Problemas• O problema é que Valério não sabe o que Delúbio fará.• Ocorre que Delúbio também chegou à conclusão que é melhor trair Valério e sair em liberdade... Alvaro Augusto de Almeida Pag. 13 16/08/12
  14. 14. A Melhor Estratégia para Delúbio Valério Confessa Não confessa (não coopera) (coopera) (não coopera) 2 anos 5 anos Confessa 2 anos Liberdade Delúbio Não confessa (coopera) Liberdade 1 ano 5 anos 1 anoAlvaro Augusto de Almeida Pag. 14 16/08/12
  15. 15. A Melhor Estratégia com Restrições• Como Valério não sabe o que Delúbio fará, e vice-versa, a informação é restrita.• A “melhor” solução, que levará ao equilíbrio de Nash, ocorre quando ambos os jogadores tentam maximizar seus resultados, traindo o companheiro. Alvaro Augusto de Almeida Pag. 15 16/08/12
  16. 16. O Equilíbrio de Nash Valério Confessa Não confessa (não coopera) (coopera) (não coopera) 2 anos 5 anos Confessa 2 anos Liberdade Delúbio Não confessa (coopera) Liberdade 1 ano 5 anos 1 anoAlvaro Augusto de Almeida Pag. 16 16/08/12
  17. 17. Dilema do Prisioneiro com Repetição• As coisas mudam quando o jogo é repetido, como acontece na vida real.• Quando os jogadores voltarem a se encontrar, saberão que não podem confiar um no outro.• Qual a melhor estratégia, então? Alvaro Augusto de Almeida Pag. 17 16/08/12
  18. 18. Os Torneios de Axelrod• Robert Axelrod é professor de Ciência Política na Universidade de Michigan.• Em 1984, ele organizou um torneio cibernético onde os parcipantes deveriam apresentar estratégias para o Dilema do Prisioneiro Iterado. Alvaro Augusto de Almeida Pag. 18 16/08/12
  19. 19. Tit for Tat• A estratégia vencedora foi a Tit for Tat, nome que deriva da expressão Tip for Tap, que significa “retaliação equivalente”.• Tit for Tat inicia cooperando, e depois imita a atuação do adversário: – Se o adversário cooperou, Tit for Tat coopera; – Se o adversário traiu, Tit for Tat trai. Alvaro Augusto de Almeida Pag. 19 16/08/12
  20. 20. Características de Tit for Tat• Tit for Tat é transparente: após algumas jogadas, qualquer adversário percebe qual é a estratégia;• Tit for Tat não guarda rancor;• Tit for Tat é rápida na retaliação;• Tit for Tat implica no estabelecimento de uma reputação. Alvaro Augusto de Almeida Pag. 20 16/08/12
  21. 21. O Papel da “Banca”• Todo jogo de soma não zero pode ser transformado em um jogo de soma zero, bastando adicionar-se um jogador extra, que assume o ganho ou prejuizo: a “banca”.• No caso do Dilema do Prisioneiro, por exemplo, os prisioneiros perdem, mas alguém ganha. Quem? Alvaro Augusto de Almeida Pag. 21 16/08/12
  22. 22. Jogos com Mútiplos Participantes• Quando mais de um participante faz parte do jogo, o Dilema do Prisioneiro evolui para a Tragédia dos Comums. Alvaro Augusto de Almeida Pag. 22 16/08/12
  23. 23. A Tragédia dos Comuns• Na Inglaterra medieval, não havia propriedade privada, no sentido atual deste termo.• Havia somente as propriedades dos reis e nobres, onde a caça e o pasto eram proibidos, e os terrenos baldios (“commons”), de uso comum.• A Tragédia dos Comuns surge quando os camponeses, que levavam as vaquinhas para pastar, tentavam maximizar os resultados individuais, em detrimento do bem comum. Alvaro Augusto de Almeida Pag. 23 16/08/12
  24. 24. Exemplos de Tragédia dos Comuns• Jantar ou almoço comunitário, com equipartição das despesas (rateio).• Crescimento populacional descontrolado.• Consumo de combustível fóssil.• Pesca em águas internacionais.• Envio de e-mails não solicitados (spam).• Conta de Resultados a Compensar (CRC). Alvaro Augusto de Almeida Pag. 24 16/08/12
  25. 25. Solução para a Tragédia dos Comuns• Quando for possível, privatize o pasto.• Quando não for possível, cobre multas.• Quando nada disso der certo, chore! Alvaro Augusto de Almeida Pag. 25 16/08/12
  26. 26. O Dilema do Lobo• Variação interessante da Tragédia dos Comuns.• Várias pessoas são convidadas a ficar 15 minutos dentro de uma cabine individual, dentro da qual há um botão que aciona uma campainha.• Se ninguém apertar o botão, cada participante ganha R$ 1.000.• Se alguém apertar o botão, aquele que apertou ganha R$ 100, e os outros não ganham nada.• Qual o resultado do experimento? Alvaro Augusto de Almeida Pag. 26 16/08/12
  27. 27. O Dilema do Lobo de Verdade • Lobos caçam em grupos, usando uma estratégia coletiva e dividindo a caça de acordo com uma hierarquia rígida. • De vez em quando, um lobo acaba pensando ser o único responsável pela caça e tenta apropriar-se integralmente dela.Alvaro Augusto de Almeida Pag. 27 16/08/12
  28. 28. Solução para o Dilema do Lobo • Puna o lobo • Expulse-o da matilha!Alvaro Augusto de Almeida Pag. 28 16/08/12
  29. 29. O Leilão da Nota de US$ 1,00• O leilão da nota de US$ 1,00 foi proposto por Martin Schubik, que usou estudantes universitários como cobaia.• Leilão clássico: – Uma nota de US$ 1,00 é posta em leilão. – Qual será o lance máximo ofertado por ela? Alvaro Augusto de Almeida Pag. 29 16/08/12
  30. 30. Leilão Modificado• A nota de US$ 1,00 é posta em leilão.• O maior lance paga e leva a nota, mas...• O segundo maior lance paga, mas não leva.• Coalisões são proibidas.• Qual o resultado? Alvaro Augusto de Almeida Pag. 30 16/08/12
  31. 31. Sunk Costs• Quando não há mais esperanças de ter lucro, as pessoas tentam minimizar o prejuízo.• Os custos incorridos nessa situação são denominados Sunk Costs (Custos Afundados).• Quando ainda há esperanças de recuperar os custos, os economistas falam em Stranded Costs (Custos Encalhados). Alvaro Augusto de Almeida Pag. 31 16/08/12
  32. 32. Conclusões“É melhor ser um chacal vivo do que um leão morto, mas é ainda melhor ser um leão vivo!” Robert Heinlein Alvaro Augusto de Almeida Pag. 32 16/08/12
  33. 33. FIM!Alvaro Augusto de Almeida Pag. 33 16/08/12

×