Introduccion a la teoria de juegos

1,018 views
823 views

Published on

Una introducción a la teoría de juegos, el dilema del prisionero , los juegos de dos personas con suma cero, y una aplicación de la programación lineal para hallar la estrategia óptima.

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,018
On SlideShare
0
From Embeds
0
Number of Embeds
6
Actions
Shares
0
Downloads
53
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Introduccion a la teoria de juegos

  1. 1. TEORÍA DE JUEGOS
  2. 2. INTRODUCCIÓN La teoría de juegos es una herramienta matemática orientada a predecir cual será el resultado más probable o el resultado más cierto de una disputa entre dos individuos, grupos, firmas o cualquier combinación de ellas. Fue diseñada y elaborada en un trabajo realizado por John Von Neumann y Oskar Morgenstern a comienzos de la década de 1940, llamado “Theory of Games and Economic Behaviour”.
  3. 3. DEFINICIONES Juego: Un juego es un proceso en el que dos o más personas toman decisiones y acciones, la estructura de las cuales está inscrita en un conjunto de reglas. Matriz de pagos o Payoff : Es la importancia que le asignamos al resultado del juego. La matriz de pagos no es más que una forma de resumir los pagos esperados de los jugadores en forma matricial, donde los elementos de la matriz pueden tener cualquier tipo de unidades siempre que representen con exactitud la utilidad de un jugador para el resultado correspondiente. Racionalidad: Un jugador es racional si busca maximizar su utilidad. Reglas: Las reglas definen el conjunto de instrucciones de como hacer algo. En un juego los jugadores parten del conocimientos de una serie de reglas que les permita desarrollar el juego. Las reglas definen la terminación del juego, la cantidad que cada jugador paga o recibe y el objetivo de cada jugador.
  4. 4. DEFINICIONES Estrategia: Se trata de una posible acción de un jugador. -Estrategia pura: Es aquella decisión que se toma con certeza, es decir, con probabilidad del 100%. -Estrategia mixta: Es una combinación de decisiones tomada de acuerdo a una serie de probabilidades. Juego de dos personas con suma cero: cuando la suma de la matriz Payoff de los jugadores igual a cero, un jugador gana lo que el otro pierde. En este juego participan dos o más jugadores. Los jugadores pueden ser representados por una o más personas. Juego de dos personas con suma constante: Es aquel que, para cualquier selección de estrategias de ambos jugadores, la recompensa de ambos jugadores se suma para dar un valor, k, constante.
  5. 5. OBJETIVO DE LA TEORÍA DE JUEGOS El objetivo de la teoría de juegos es determinar la mejor estrategia para un jugador dado, bajo la consideración de que el oponente es racional, inteligente y está bien informado.
  6. 6. ESTRATEGIA MAXIMIN Adoptar una estrategia maximin es adoptar aquella estrategia en la que se maximiza la ganancia mínima que puede obtenerse. Por ejemplo, el siguiente juego es de suma cero. Cada jugador dispone de tres estrategias posibles a las que designaremos como A,B y C. Los pagos consisten en la distribución de 10 monedas que se repartirán según las estrategias elegidas por ambos jugadores y se muestran en la matriz de pagos. La segunda matriz muestra todos los posibles resultados. De todos esos posibles resultados mínimos, el que prefiero es el máximo de los mínimos.
  7. 7. ESTRATEGIA MINIMAX Es un método de decisión para minimizar la pérdida máxima esperada en juegos con adversarios y con información perfecta. El funcionamiento de minimax puede resumirse como elegir el mejor movimiento para ti mismo suponiendo que tu contrincante escogerá el peor para ti. Máximo 9 6 8
  8. 8. EL DILEMA DEL PRISIONERO Es un modelo de conflictos muy frecuentes en la sociedad que ha sido profundamente estudiado por la teoría de juegos. Dos delincuentes son detenidos y encerrados en celdas de aislamiento diferentes de forma que no pueden comunicarse entre ellos. El alguacil sospecha que han participado en el robo de un banco, cuya pena es de 10 años de cárcel, pero no tienen pruebas. Solo tienen pruebas para culparlos de un delito menor, es decir, tendencia ilícita de armas, cuyo castigo es de dos años de cárcel. Promete a cada uno de ellos que reducirá su condena a la mitad si proporciona información para culpar al otro del robo del banco. Las alternativas para cada prisionero pueden representarse en forma de matriz de pagos (Payoff). La estrategia “lealtad” consiste en permanecer en silencio y no proporcionar pruebas para acusar al compañero. Llamaremos “traición” a la estrategia alternativa.
  9. 9. EL DILEMA DEL PRISIONERO Los pagos a la izquierda o a la derecha de la barra indican los años de cárcel al que es condenado el preso X o el preso Y, respectivamente según las estrategias que hayan elegido cada uno de ellos.
  10. 10. EL DILEMA DEL PRISIONERO La aplicación de la estrategia maximín conduce en este juego a un resultado subóptimo. Al no conocer la decisión del otro preso, la estrategia más segura es traicionar. Si ambos traicionan, el resultado para ambos es peor que si ambos hubieran elegido la lealtad. Este resultado es un PUNTO DE EQUILIBRIO DE NASH. El punto de equilibrio de Nash es una situación en la que ninguno de los jugadores siente la tentación de cambiar de estrategia ya que cualquier cambio implicaría una disminución en sus pagos.
  11. 11. El duopolio en la Teoría de Juegos Supongamos que dos empresas, Hipermercados Xauen y Almacenes Yuste, constituyen un duopolio local en el sector de los grandes almacenes. Cuando llega la época de las tradicionales rebajas de enero, ambas empresas acostumbran a realizar inversiones en publicidad tan altas que suelen implicar la pérdida de todo el beneficio. Este año se han puesto de acuerdo y han decidido no hacer publicidad por lo que cada una, si cumple el acuerdo, puede obtener unos beneficios en la temporada de 50 millones. Sin embargo una de ellas puede preparar en secreto su campaña publicitaria y lanzarla en el último momento con lo que conseguiría atraer a todos los consumidores. Sus beneficios en ese caso serían de 75 millones mientras que la empresa competidora perdería 25 millones.
  12. 12. El duopolio en la Teoría de Juegos Cada almacén tiene que elegir entre dos estrategias: respetar el acuerdo ¿Cooperar¿ o hacer publicidad ¿Traicionar¿. Los beneficios o pérdidas mostrados a la izquierda de cada casilla son los que obtiene Xauen cuando elige la estrategia mostrada a la izquierda y Yuste la mostrada arriba.
  13. 13. El duopolio en la Teoría de Juegos Veamos cuál debe ser la decisión a adoptar por esos almacenes. El director de la división de estrategia de Xauen pensará: "Si Yuste no hace publicidad, a nosotros lo que más nos conviene es traicionar el acuerdo, pero si ellos son los primeros en traicionar, a nosotros también nos convendrá hacerlo. Sea cual sea la estrategia adoptada por nuestros competidores, lo que más nos conviene es traicionarles".
  14. 14. EJEMPLO DE UN JUEGO DE DOS PERSONAS Y SUMA CERO Considere la matriz de pagos para el siguiente juego. Se trata de un juego donde compiten dos políticos en la campaña por un lugar en el senado. Están en los dos últimos días de campaña. Quieren pasar estos dos días en dos ciudades: Cali y Bogotá. Los dos jugadores son los dos políticos: Estrategia 1 = pasar un día en cada ciudad. Estrategia 2 = pasar los dos días en Cali. Estrategia 3 = pasar los dos días en Bogotá.
  15. 15. VARIACIÓN 1 DEL JUEGO: Para la siguiente matriz de pagos, se usa el concepto de estrategia dominada, para eliminar una serie de estrategias inferiores hasta que quede solo una para elegir. Las unidades de los pagos están dadas en miles de votos. 1 2 3 1 1 2 4 Político1 2 1 0 5 3 0 1 -1 Político2 Estrategia Para el jugador 1, la estrategia 3 está dominada por la estrategia 1, ya que tiene pagos más altos (1>0, 2>1, 4>1) independientemente de lo que haga el jugador 2.
  16. 16. VARIACIÓN 1 DEL JUEGO: El jugador 2 es también racional, por tanto, él también puede eliminar estrategias dominadas. Al final obtenemos la siguiente matriz de pagos: 1 2 Político1 1 1 2 Político2 Estrategia Ahora la estrategia 2 del jugador 2 está dominada por la estrategia 1 por lo que debe eliminarse. En consecuencia ambos jugadores deberán elegir su estrategia 1. Con esta solución el jugador 1 recibirá mil votos por parte del jugador 2.
  17. 17. VARIACIÓN 2 DEL JUEGO: Supongamos que se tiene la matriz de pagos siguiente para el mismo juego: Mínimo 1 2 3 1 0 -2 2 -2 Político1 2 5 4 -3 -3 3 2 3 -4 -4 5 4 2 Político2 Estrategia Máximo Valor minimax Valor maximin El resultado es que no hay punto de silla. Esto es una solución inestable. Cuando un juego no tiene punto de silla, la teoría de juegos aconseja a cada jugador asignar una distribución de probabilidades sobre su conjunto de estrategias.
  18. 18. VARIACIÓN 2 DEL JUEGO: Considere que después de que el jugador 1 elimina la estrategia 3, sus estrategias mixtas son (X1, X2) y X2 = 1–X1. La estrategia 3 es dominada. Ahora tenemos la tabla: Y1 Y2 Y3 X1 0 -2 2 Político1 1-X1 5 4 -3 Político2 Probabilidad Ahora lo resolveremos usando programación lineal. Las variables son X1 y X2. El modelo que obtenemos, (tomando como el valor del juego v) , es el siguiente:
  19. 19. VARIACIÓN 2 DEL JUEGO: Maximizar 𝑉, Sujeto a: 5𝑋2 − 𝑉 ≥ 0 −2𝑋1 + 4𝑋2 − 𝑉 ≥ 0 2𝑋1 − 3𝑋2 − 𝑉 ≥ 0 𝑋1 + 𝑋2 = 1 𝑋1 ≥ 0, 𝑋2 ≥ 0, 𝑉 ≥ 0 La aplicación del algoritmo de Dantzig o método simplex a este problema da como resultado 𝑋1= 7 11 , 𝑋2 = 4 11 y 𝑉 = 2 11 . Como solución óptima. La estrategia mixta óptima del jugador 1 es 𝑋1= 7 11 , 𝑋2 = 4 11. Y1 Y2 Y3 X1 0 -2 2 Político1 1-X1 5 4 -3 Político2 Probabilidad
  20. 20. GRACIAS…!!!

×