busquedas con adversarios

INGENIERIA INFORMATICA Y SISTEMAS INTELIGENCIA ARTIFICIAL BUSQUEDAS CON ADVERSARIOS Sesión 5

Árboles y búsqueda con adversario ,[object Object]

Un juego se define formalmente como una clase de problemas de búsquedas con los componentes siguientes:

El estado inicial: ,[object Object]

Una función sucesor: ,[object Object]

Un test Terminal: ,[object Object]

Una función de utilidad: ,[object Object],[object Object]

Un árbol (parcial) de búsqueda para el juego de tres en raya.

Búsqueda entre adversarios ,[object Object],[object Object],[object Object],[object Object]

Representación del juego ,[object Object],[object Object],[object Object],[object Object]

Búsqueda entre adversarios ,[object Object],[object Object],[object Object],[object Object],[object Object]

Búsqueda entre adversarios ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Algoritmo minimax (1) ,[object Object],[object Object],[object Object],[object Object]

Algoritmo minimax (2) ,[object Object],[object Object],A B

Ejemplo 3 en raya e: estado x profundidad  entero e = número de filas, columnas y diagonales completas disponibles para max - número de filas, columnas y diagonales completas disponibles para min max juega con X y desea maximizar e min juega con  y desea minimizar e valores altos: buena posición para el que tiene que mover (profundidad par o impar) Controlar las simetrías X X X0 X 0 X 0 X 0 X 0 X 0 X X 0 0 X X 0 X 0 X 0 X 0 6-5=1 5-5=0 6-5=1 5-5=0 4-5=-1 5-4=1 6-4=2 5-6=-1 6-6=0 6-6=0 5-6=-1 4-6=-2 Min= -1 Min= 1 Min= -2 Max = 1 La mejor jugada de max es pues tras lo cual min podría jugar X 0 X

0 X X 0 X 0 X X 0 X X X 0 0 X X 0 X 0 X 0 X 0 X 0 X 0 X 0 X 0 X 0 0 X 4-2=2 3-2=1 4-2=2 2-2=0 4-2=2 3-2=1 Min=0 0 X X 0 0 X X 0 0 X 0 X 0 0 X X 4-2=2 4-2=2 5-2=3 3-2=1 4-2=2 4-2=2 Min=0 Min=1 Min=0 Max = 1 La mejor jugada de max es pues tras lo cual min podría jugar 0 X X 0 0 X X …………… ... …………… ... 0 X X 0 0 X X 0 0 X X

0 0 X X 0 0 X X X X 0 0 X X 0 0 X X X 0 0 X X X 0 0 X X X X 0 0 0 X X X 0 0 X X 0 X 0 0 X X 0 X 0 0 X 0 X 2-1=1 3-1=2 2-1=1 3-1=2 Min=1 Min= -  Min= -  Min= -  Min= -  Max=1 La mejor jugada de max es pues X 0 0 X X

Poda alfa-beta ,[object Object],[object Object],[object Object]

A B C D a1 a2 a3 b1 b2 b3 c1 c2 c3 d1 d2 d3 3 12 8 2 4 6 14 5 2 3 3 2 2 MAX MIN El mejor movimiento de MAX en la raíz es a1, porque conduce al sucesor con el valor minimax mas alto, y la mejor respuesta de MIN es b1, por que conduce al sucesor con el valor minimax mas bajo.

A B C D 3 [-  , +  ] [-  , 3] (a) (a) La primera hoja debajo de B tiene el valor 3. De ahí B, que es un nodo MIN, tiene un valor de cómo máximo 3.

A B C D 3 [-  , +  ] [-  , 3] (b) (b) La segunda hoja debajo de B tiene el valor 12; MIN evitara este movimiento, entonces el valor de B es todavía como máximo 3. 12

A B C D 3 [3, +  ] [3, 3] (c) (c) La tercera hoja debajo de B tiene el valor 8; hemos visto a todos los sucesores de B, entonces el valor de B es exactamente 3. Ahora, podemos deducir que el valor de la raíz es al menos 3., por que MAX tiene una opción digna de 3 en la raíz. 12 8

A B C D 3 [3, +  ] [3, 3] (d) (d) La primera hoja debajo de C tiene el valor 2. De ahí, C que es un nodo MIN, tiene un valor de cómo máximo 2. Pero sabemos que B vale 3, entonces MAX nunca elegiría C. Por lo tanto, no hay ninguna razón en mirar a los otros sucesores de C. Este es un ejemplo de la poda Alfa-Beta. 12 8 [-  , 2] 2

A B C D 3 [3, 14] [3, 3] (e) (e) La primera hoja debajo de D tiene el valor 14,entonces D vale como máximo 14. Este todavía es mas alto que la mejor alternativa de MAX (es decir, 3), entonces tenemos que seguir explorando a los sucesores de D. Note también que ahora tenemos límites sobre todos los sucesores de la raíz, entonces el valor de la raíz es como máximo 14. 12 8 [-  , 2] [-  , 14] 2 14

A B C D 3 [3, 3] [3, 3] (f) (f) El segundo sucesor de D vale 5, así que otra vez tenemos que seguir explorando. El tercer sucesor vale 2, así que ahora D vale exactamente 2. La decisión de MAX en la raíz es moverse a B, dando un valor de 3. 12 8 [-  , 2] [2,2] 2 14 5 2

Poda alfa-beta ,[object Object],[object Object],[object Object],[object Object]

MAX V i {   } Si V i >  modificar  Si V i   poda  Retornar  {   } Si V i <  modificar  Si V i   poda  Retornar  MIN V i Las cotas  y  se transmiten de padres a hijos de 1 en 1 y en el orden de visita de los nodos.  es la cota inferior de un nodo max.  es la cota superior de un nodo min.

busquedas con adversarios

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a busquedas con adversarios

Similar a busquedas con adversarios (20)

Último

Último (10)

busquedas con adversarios