Your SlideShare is downloading. ×
0
BÚSQUEDA ENTRE ADVERSARIOS
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 1
INTELIGENCIA ARTIFICIAL -
UNIDAD 6:
JUEGOS
En el Capítulo 2 se introdujo la
diferencia entre entornos multi-agente
cooperativos y competitivos.
Los entornos...
JUEGOS
Implican entornos deterministas,
totalmente observables en los
cuales hay dos agentes cuyas
acciones deben alterna...
JUEGOS
Por ejemplo: Ajedrez
Ganador (+1)
Perdedor (-1)
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 4
JUEGOS
Son interesantes porque son
demasiado difíciles para resolverlos.
Requieren la capacidad de tomar una
decisión cu...
DECISIONES ÓPTIMAS EN JUEGOS
Consideraremos juegos con dos
jugadores: MAX y MIN
MAX mueve primero, luego por turno
hasta...
DECISIONES ÓPTIMAS EN JUEGOS
El juego puede definirse como una clase de
problemas de búsqueda:
Estado inicial
Función su...
PARTE DEL ÁRBOL DEL TIC TAC
TOE
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 8
Desde el estado inicial, MAX tiene
nueve m...
PARTE DEL ÁRBOL DEL TIC TAC
TOE
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 9
El juego alterna entre la colocación de un...
PARTE DEL ÁRBOL DEL TIC TAC
TOE
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 10
El juego alterna entre la colocación de u...
PARTE DEL ÁRBOL DEL TIC TAC
TOE
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 11
PARTE DEL ÁRBOL DEL TIC TAC
TOE
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 12
PARTE DEL ÁRBOL DEL TIC TAC
TOE
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 13
El número sobre cada nodo
hoja indica el ...
En un problema de búsqueda normal, la
solución óptima sería una secuencia de movi-
mientos que conducen a un estado objet...
Incluso un juego simple como tíc-tac-toe es
demasiado complejo para dibujar el árbol de
juegos entero,
por tanto cambiem...
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 16
ESTRATEGIAS ÓPTIMAS
Los movimientos posibles para max, en el nodo
raíz, s...
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 17
VALOR MINIMAX
• Considerando un árbol de juegos, la estrategia óptima
pue...
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 18
VALOR MINIMAX
VALOR-MINIMAX(n) =
Utilidad(n) Si n es un estado
terminal
M...
 Los nodos terminales se etiquetan por sus valores de utilidad.
 El primer nodo de min, etiquetado B, tiene tres sucesor...
 El nodo raíz es un nodo MAX; sus sucesores tienen valores
minimax de 3, 2 y 2; entonces tiene un valor minimax de 3.
 P...
PODA ALFA-BETA
 El problema de la búsqueda minimax es que el número de
estados que tiene que examinar es exponencial en e...
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 22
A[-∞ ; +∞ ]
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 23
A[-∞ ; +∞ ]
B[-∞ ; +∞ ]
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 24
A[-∞ ; +∞ ]
B[-∞ ; +∞ ]
3
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 25
A[-∞ ; +∞ ]
B[-∞ ; +3 ]
3
La primera hoja debajo de
B tien...
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 26
A[-∞ ; +∞ ]
B[-∞ ; +3 ]
3 12
La segunda hoja debajo de
B t...
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 27
A[-∞ ; +∞ ]
B[-∞ ; +3 ]
3 12 8
La tercera hoja debajo de
B...
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 28
A[- ∞; +∞ ]
B[+3 ; +3 ]
3 12 8
La tercera hoja debajo de
B...
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 29
A[+3; +∞ ]
B[+3 ; +3 ]
3 12 8
Podemos deducir que el
valor...
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 30
A[+3; +∞ ]
B[+3 ; +3 ]
3 12 8
C[- ∞; +∞ ]
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 31
A[+3; +∞ ]
B[+3 ; +3 ]
3 12 8
C
2
[- ∞; +∞ ]
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 32
A[+3; +∞ ]
B[+3 ; +3 ]
3 12 8
C
2
[- ∞; +2 ]
La primera ho...
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 33
A[+3; +∞ ]
B[+3 ; +3 ]
3 12 8
C
2
[- ∞; +2 ]
Como sabemos ...
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 34
A[+3; +∞ ]
B[+3 ; +3 ]
3 12 8
C
2
[- ∞; +2 ]
Esto es un ej...
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 35
A[+3; +∞ ]
B[+3 ; +3 ]
3 12 8
C
2
[- ∞; +2 ] [- ∞; + ∞] D
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 36
A[+3; +∞ ]
B[+3 ; +3 ]
3 12 8
C
2
[- ∞; +2 ] [- ∞; + ∞] D
...
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 37
A[+3; +∞ ]
B[+3 ; +3 ]
3 12 8
C
2
[- ∞; +2 ] [- ∞; +14] D
...
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 38
A[+3; +∞ ]
B[+3 ; +3 ]
3 12 8
C
2
[- ∞; +2 ] [- ∞; +14] D
...
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 39
A[+3; +∞ ]
B[+3 ; +3 ]
3 12 8
C
2
[- ∞; +2 ] [- ∞; +5] D
1...
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 40
A[+3; +∞ ]
B[+3 ; +3 ]
3 12 8
C
2
[- ∞; +2 ] [- ∞; +5] D
1...
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 41
A[+3; +∞ ]
B[+3 ; +3 ]
3 12 8
C
2
[- ∞; +2 ] [- ∞; +2] D
1...
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 42
A[+3; +∞ ]
B[+3 ; +3 ]
3 12 8
C
2
[- ∞; +2 ] [+2 ; +2] D
1...
PODA ALFA-BETA
08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 43
A[+3; +3 ]
B[+3 ; +3 ]
3 12 8
C
2
[- ∞; +2 ] [+2 ; +2] D
1...
La poda alfa-beta consigue su nombre de los dos
parámetros que describen los límites sobre los valores
hacia atrás que apa...
La búsqueda alfa-beta actualiza el valor de
𝛼 𝑦 𝛽 según se va recorriendo el árbol y poda
las ramas restantes en un nodo ...
EJERCICIO
Aplicar la estrategia minimax con poda alfa-beta sobre el siguiente
árbol de juego. Mostrar el árbol resultante ...
BIBLIOGRAFÍA
 INTELIGENCIA ARTIFICIAL: UN ENFOQUE MODERNO.
 STUART RUSSELL Y PETER NORVIG.
 PEARSON EDUCATION
 2da Edi...
Upcoming SlideShare
Loading in...5
×

Busqueda Entre Adversarios

148

Published on

Material auxiliar para la materia IA de la FCT UNC@

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
148
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
5
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Transcript of "Busqueda Entre Adversarios"

  1. 1. BÚSQUEDA ENTRE ADVERSARIOS 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 1 INTELIGENCIA ARTIFICIAL - UNIDAD 6:
  2. 2. JUEGOS En el Capítulo 2 se introdujo la diferencia entre entornos multi-agente cooperativos y competitivos. Los entornos competitivos, en los cuales los objetivos del agente están en conflicto, dan ocasión a problemas de búsqueda entre adversarios a menudo conocidos como juegos. 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 2
  3. 3. JUEGOS Implican entornos deterministas, totalmente observables en los cuales hay dos agentes cuyas acciones deben alternar y en los que los valores utilidad, al final de juego, son siempre iguales y opuestos (suma cero). 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 3
  4. 4. JUEGOS Por ejemplo: Ajedrez Ganador (+1) Perdedor (-1) 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 4
  5. 5. JUEGOS Son interesantes porque son demasiado difíciles para resolverlos. Requieren la capacidad de tomar una decisión cuando no se puede calcular la decisión óptima. Castigan la ineficiencia con severidad. 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 5
  6. 6. DECISIONES ÓPTIMAS EN JUEGOS Consideraremos juegos con dos jugadores: MAX y MIN MAX mueve primero, luego por turno hasta que el juego se termina. Al final del juego se conceden puntos al ganador y penalizaciones al perdedor. 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 6
  7. 7. DECISIONES ÓPTIMAS EN JUEGOS El juego puede definirse como una clase de problemas de búsqueda: Estado inicial Función sucesor Test terminal Función utilidad El estado inicial y los movimientos para cada lado definen el árbol de juegos 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 7
  8. 8. PARTE DEL ÁRBOL DEL TIC TAC TOE 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 8 Desde el estado inicial, MAX tiene nueve movimientos posibles.
  9. 9. PARTE DEL ÁRBOL DEL TIC TAC TOE 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 9 El juego alterna entre la colocación de una X para MAX y la colocación de un O para min, hasta que alcancemos nodos hoja correspondientes a estados terminales
  10. 10. PARTE DEL ÁRBOL DEL TIC TAC TOE 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 10 El juego alterna entre la colocación de una X para MAX y la colocación de un O para min, hasta que alcancemos nodos hoja correspondientes a estados terminales, de modo que un jugador tenga tres en raya o todos los cuadrados estén llenos.
  11. 11. PARTE DEL ÁRBOL DEL TIC TAC TOE 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 11
  12. 12. PARTE DEL ÁRBOL DEL TIC TAC TOE 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 12
  13. 13. PARTE DEL ÁRBOL DEL TIC TAC TOE 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 13 El número sobre cada nodo hoja indica el valor de utilidad del estado terminal desde el punto de vista de MAX ; se supone que los valores altos son buenos para MAX y malos para min (por eso los nombres de los jugadores).
  14. 14. En un problema de búsqueda normal, la solución óptima sería una secuencia de movi- mientos que conducen a un estado objetivo (un estado terminal que es ganador). En un juego, por otra parte, min tiene algo que decir sobre ello. MAX por lo tanto debe encontrar una estrategia contingente que especifica el movimiento de MAX en cada movimiento. 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 14 ESTRATEGIAS ÓPTIMAS
  15. 15. Incluso un juego simple como tíc-tac-toe es demasiado complejo para dibujar el árbol de juegos entero, por tanto cambiemos al juego trivial de la Figura: 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 15 ESTRATEGIAS ÓPTIMAS Nodos MAX : Nodos min : Nodos terminales: valor utilidad para MAX
  16. 16. 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 16 ESTRATEGIAS ÓPTIMAS Los movimientos posibles para max, en el nodo raíz, se etiquetan por a1 a2, y a3. Las respuestas posibles a a1 para min, son b1 b2, b3, etc. Este juego particular finaliza después de un movimiento para MAX y min.
  17. 17. 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 17 VALOR MINIMAX • Considerando un árbol de juegos, la estrategia óptima puede determinarse examinando el valor minimax de cada nodo, que escribimos como el VALOR- MINIMAX(n). • El valor minimax de un nodo es la utilidad (para MAX) de estar en el estado correspondiente, asumiendo que ambos jugadores juegan óptimamente desde allí al final del juego. • El valor minimax de un estado terminal es solamente su utilidad. • MAX preferirá moverse a un estado de valor máximo, mientras que MIN prefiere un estado de valor mínimo.
  18. 18. 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 18 VALOR MINIMAX VALOR-MINIMAX(n) = Utilidad(n) Si n es un estado terminal Max s ∈ Sucesores(n ) VALOR- MINIMAX(s) SI n es un estado MAX Min s ∈ Sucesores(n ) VALOR- MINIMAX(s) SI n es un estado MIN
  19. 19.  Los nodos terminales se etiquetan por sus valores de utilidad.  El primer nodo de min, etiquetado B, tiene tres sucesores con valores 3, 12 y 8 , entonces su valor minimax es 3  Del mismo modo, los otros dos nodos de min tienen un valor minimax de 2. 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 19 VALOR MINIMAX
  20. 20.  El nodo raíz es un nodo MAX; sus sucesores tienen valores minimax de 3, 2 y 2; entonces tiene un valor minimax de 3.  Podemos identificar también la decisión minimax en la raíz: la acción a1 es la opción óptima para MAX porque conduce al sucesor con el valor minimax más alto. 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 20 DECISIÓN MINIMAX
  21. 21. PODA ALFA-BETA  El problema de la búsqueda minimax es que el número de estados que tiene que examinar es exponencial en el número de movimientos.  Lamentablemente no podemos eliminar el exponente, pero podemos dividirlo, con eficacia, en la mitad.  podemos tomar “prestada” la idea de podar del Capítulo 4 a fin de eliminar partes grandes del árbol.  Cuando lo aplicamos a un árbol minimax estándar, devuelve el mismo movimiento que devolvería minimax, ya que podar las ramas no puede influir, posiblemente, en la decisión final 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 21
  22. 22. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 22 A[-∞ ; +∞ ]
  23. 23. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 23 A[-∞ ; +∞ ] B[-∞ ; +∞ ]
  24. 24. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 24 A[-∞ ; +∞ ] B[-∞ ; +∞ ] 3
  25. 25. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 25 A[-∞ ; +∞ ] B[-∞ ; +3 ] 3 La primera hoja debajo de B tiene el valor 3, entonces B que es un nodo MIN, tiene como valor máximo 3
  26. 26. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 26 A[-∞ ; +∞ ] B[-∞ ; +3 ] 3 12 La segunda hoja debajo de B tiene un valor 12; MIN evita este movimiento, por tanto el valor de B es todavía como máximo 3
  27. 27. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 27 A[-∞ ; +∞ ] B[-∞ ; +3 ] 3 12 8 La tercera hoja debajo de B tiene un valor 8; …
  28. 28. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 28 A[- ∞; +∞ ] B[+3 ; +3 ] 3 12 8 La tercera hoja debajo de B tiene un valor 8; hemos visitado todos los sucesores de B, por tanto el valor de B es exactamente 3
  29. 29. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 29 A[+3; +∞ ] B[+3 ; +3 ] 3 12 8 Podemos deducir que el valor de la raíz es al menos 3 hasta ahora
  30. 30. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 30 A[+3; +∞ ] B[+3 ; +3 ] 3 12 8 C[- ∞; +∞ ]
  31. 31. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 31 A[+3; +∞ ] B[+3 ; +3 ] 3 12 8 C 2 [- ∞; +∞ ]
  32. 32. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 32 A[+3; +∞ ] B[+3 ; +3 ] 3 12 8 C 2 [- ∞; +2 ] La primera hoja debajo de C tiene el valor 2, entonces C que es un nodo MIN tiene como máximo valor 2
  33. 33. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 33 A[+3; +∞ ] B[+3 ; +3 ] 3 12 8 C 2 [- ∞; +2 ] Como sabemos que B vale 3, MAX nunca elegiría C, por tanto no hay razón para mirar los otros sucesores de C
  34. 34. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 34 A[+3; +∞ ] B[+3 ; +3 ] 3 12 8 C 2 [- ∞; +2 ] Esto es un ejemplo de poda alfa-beta
  35. 35. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 35 A[+3; +∞ ] B[+3 ; +3 ] 3 12 8 C 2 [- ∞; +2 ] [- ∞; + ∞] D
  36. 36. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 36 A[+3; +∞ ] B[+3 ; +3 ] 3 12 8 C 2 [- ∞; +2 ] [- ∞; + ∞] D 14
  37. 37. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 37 A[+3; +∞ ] B[+3 ; +3 ] 3 12 8 C 2 [- ∞; +2 ] [- ∞; +14] D 14 La primera hoja de D vale 14, entonces D vale como máximo 14. Como es mayor que 3 hay que seguir explorando
  38. 38. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 38 A[+3; +∞ ] B[+3 ; +3 ] 3 12 8 C 2 [- ∞; +2 ] [- ∞; +14] D 14 5
  39. 39. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 39 A[+3; +∞ ] B[+3 ; +3 ] 3 12 8 C 2 [- ∞; +2 ] [- ∞; +5] D 14 5 La segunda hoja debajo de D vale 5, D como máximo valdrá 5 pues es un nodo MIN. Como 5 podría ser el valor de D hay que seguir explorando
  40. 40. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 40 A[+3; +∞ ] B[+3 ; +3 ] 3 12 8 C 2 [- ∞; +2 ] [- ∞; +5] D 14 5 2
  41. 41. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 41 A[+3; +∞ ] B[+3 ; +3 ] 3 12 8 C 2 [- ∞; +2 ] [- ∞; +2] D 14 5 2
  42. 42. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 42 A[+3; +∞ ] B[+3 ; +3 ] 3 12 8 C 2 [- ∞; +2 ] [+2 ; +2] D 14 5 2 El tercer y ultimo sucesor de D vale 2, D vale exactamente 2.
  43. 43. PODA ALFA-BETA 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 43 A[+3; +3 ] B[+3 ; +3 ] 3 12 8 C 2 [- ∞; +2 ] [+2 ; +2] D 14 5 2 La decisión de MAX entonces es moverse a B dando un valor de 3
  44. 44. La poda alfa-beta consigue su nombre de los dos parámetros que describen los límites sobre los valores hacia atrás que aparecen a lo largo del camino: α = el valor de la mejor opción (es decir, valor más alto) que hemos encontrado hasta ahora en cualquier punto elegido a lo largo del camino para MAX β = el valor de la mejor opción (es decir, valor más bajo) que hemos encontrado hasta ahora en cualquier punto elegido a lo largo del camino para MIN. 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 44 PODA ALFA-BETA
  45. 45. La búsqueda alfa-beta actualiza el valor de 𝛼 𝑦 𝛽 según se va recorriendo el árbol y poda las ramas restantes en un nodo tan pronto como el valor del nodo actual es peor que el actual valor 𝛼 𝑜 𝛽 para MAX o MIN, respectivamente. La eficacia de la poda alfa-beta es muy dependiente del orden en el que se examinan los sucesores. 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 45 PODA ALFA-BETA
  46. 46. EJERCICIO Aplicar la estrategia minimax con poda alfa-beta sobre el siguiente árbol de juego. Mostrar el árbol resultante y los nodos podados. Considera los dos casos:  i) los nodos son generados de izquierda a derecha;  ii) los nodos son generados de derecha a izquierda. 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 46 2 3 7 2 1 8 5 1 2 4 3 6
  47. 47. BIBLIOGRAFÍA  INTELIGENCIA ARTIFICIAL: UN ENFOQUE MODERNO.  STUART RUSSELL Y PETER NORVIG.  PEARSON EDUCATION  2da Edición, 2004.  1240 páginas  Capitulo 6, Paginas 181 a 215  http://dis.um.es/~ginesgm/files/doc/ejerc7-2.pdf 08/05/2014FCT - UNCA ING. HÉCTOR ESTIGARRIBIA 47
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×