Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Robocup: IA en
          sistemas multiagente
         y fútbol de simulación
          I Jornadas de Robótica RobotUS
   ...
Robocup: IA en
          sistemas multiagente
         y fútbol de simulación
          I Jornadas de Robótica RobotUS
   ...
Agentes inteligentes
•   Es una metáfora computacional propia de la
    Inteligencia Artificial
    •   Se basa en la tradi...
Agentes inteligentes
•   Es una metáfora computacional propia de la
    Inteligencia Artificial
    •   Se basa en la tradi...
Definición de agente
              (Russell-Norvig)
•   Dada una sucesión de percepciones, un
    agente racional ideal
   ...
Definición de agente
              (Russell-Norvig)
•   Dada una sucesión de percepciones, un
    agente racional ideal



...
Esqueleto de agente
Esqueleto de agente




              ¿Dónde está el
              razonamiento?
Características de los agentes
         racionales
•   Flexibilidad: las propiedades fundamentales son:
    •   Reactivida...
Características de los agentes
         racionales
•   Flexibilidad: las propiedades fundamentales son:
    •   Reactivida...
Proactividad versus
            reactividad
    Reactividad:         Proactividad:

+ rapidez          -rapidez
(poca dedu...
Proactividad versus
       reactividad
    Reactividad:         Proactividad:

+ rapidez          -rapidez
(poca deducción...
¿Dónde está la IA
            clásica?
•   IA clásica: Racionalidad calculable
•   IA para SMA:
    • Racionalidad emergen...
¿Dónde está la IA
            clásica?
•   IA clásica: Racionalidad calculable
•   IA para SMA:
    • Racionalidad emergen...
Reactividad y
 emergencia
•   La computación es la ejecución de reglas del tipo:

        •   Situación → Reacción

•   Los datos provienen de los m...
Agentes reactivos
        Principios de la reactividad

•   La computación es la ejecución de reglas del tipo:

        • ...
Emergencia
•   Test de sorpresa: Requerimientos para la emergencia
    •   Diseño: se describe el sistema especificando las...
Emergencia
•   Test de sorpresa: Requerimientos para la emergencia
    •   Diseño: se describe el sistema especificando las...
Tres tipos de emergencia
         sintética
Tres tipos de emergencia
         sintética
ROBOCUP
ROBOCUP

    “By the year 2050, develop a team of fully
autonomous humanoid robots that can win against
    the human worl...
Competiciones

• RoboCup Rescue
• RoboCupJunior
• RoboCup@Home
• RoboCupSoccer
Historia hasta 2009
Venue                                                  Number of      Number of
                      ...
Robocup Rescue                 Robocup Junior
•   Rescue Simulation League
                               •   Soccer chall...
Robocup Rescue                 Robocup Junior
•   Rescue Simulation League
                               •   Soccer chall...
Robocup Soccer
Robocup Soccer

• Humanoid League
• Four Legged League
• Middle Size League
• Small Size League
• Simulation League
Humanoid league
Humanoid league
Four legged league
Middle size league
Simulation League
• 2D
• 3D
2D Simulation League
Arquitectura
Arquitectura
Servidor


            UDP/IP
                      Equipo B
Equipo A
Monitor
 Monitor


Classic Classic         RCSSmonitor
                  Rcssmonitor
Logs
 Logs




        rcsslogplayer
Clientes
ROBOCUP 2D COMO AGENTE

          PERCEPCIONES




ENTORNO                  CEREBRO



           ACCIONES
Percepciones

• Sensor aural
• Sensor de visión
• Sensor corporal
Percepciones

• Sensor aural
• Sensor de visión
• Sensor corporal
Sensor aural
Sensor aural




   (hear Time Sender "Message")
Sensor aural (II)

• Entorno aural
Sensor aural (II)
                  Só
• Entorno aural      lo
                          do
                       de  sm
...
Sensor de visión




 (see ObjName Distance Direction
DistChng DirChng BodyDir HeadDir)
Sensor de visión
  (distancias)
Sensor de visión
  (distancias)
Sensor corporal

     (sense body Time
              (view mode ViewQuality ViewWidth)
              (stamina Stamina Eort...
Sensor corporal
Sensor corporal

• Física:
 • Stamina
 • Esfuerzo realizado
 • Velocidad (no direccional, cuantitativa)
Acciones
•   Catch
•   Dash
•   Kick
•   Move
•   Say
•   Turn
•   TurnNeck
Acciones
•   Catch
•   Dash
•   Kick
•   Move
•   Say
•   Turn
•   TurnNeck
“Catch” (parar)
“Dash” (correr)
“Kick” (chutar)
“Move”
(teletransportar)
“Turn” y “TurnNeck”
(girar, girar el cuello)
“Say” (hablar)
“Say” (hablar)
Entorno:
modelo del mundo
Simulación del entorno
• Intervalo de ejecución
 • Ciclos de acción
 • Ciclos de percepción
Simulación del entorno
• Intervalo de ejecución
 • Ciclos de acción
 • Ciclos de percepción
Objetos
Campo
Otros agentes
Entrenador vs Preparador
 •   Distinción entre el entrenador y el preparador.


     •   El preparador puede ejercer más c...
Entrenador vs Preparador
 •   Distinción entre el entrenador y el preparador.


     •   El preparador puede ejercer más c...
El preparador
El preparador
• Controla el modo de juego
• Envía mensajes
• Mueve a los jugadores y a la pelota a
  cualquier posición y ...
El entrenador
El entrenador
• Puede comunicarse con los jugadores.
  (restringida)


• Puede obtener información libre de ruidos

• Pued...
Reglas de juego


• Árbitro automático
• Árbitro humano
Árbitro automático
•   Kick-Off
•   Goal
•   Out of Field
•   Player Clearance
•   Play-Mode Control
•   Off-side
•   Back...
Árbitro automático
•   Kick-Off
•   Goal
•   Out of Field
•   Player Clearance
•   Play-Mode Control
•   Off-side
•   Back...
Árbitro humano
•   Rodear el balón
•   Bloquear la portería
•   No poner el balón en juego
•   Bloquear el movimiento de o...
Árbitro humano
•   Rodear el balón
•   Bloquear la portería
•   No poner el balón en juego
•   Bloquear el movimiento de o...
Cerebro
Características como
      Sistema multiagente
• Ejemplo de problema PTS (sincronización
  periódica de equipos)
• Algunas...
Soluciones (I)
Soluciones (I)
Soluciones (II)
• Roles (flexibles o rígidos)
 • Combinación de comportamientos
    externos e internos
• Formaciones (diná...
Limitaciones

• Limitaciones:
 • Percepciones con ruido
 • Acciones
 • Objetivos individuales vs. globales
Equipo US-UHU
Historia
Historia
•   Equipo: Dari2 - 2005
    •   Mejora sustancial del equipo UVA-TRILEARN
    •   Ricardo Alfonso Venzala y Davi...
Idea
Idea
COMPONENTE
    T-R

             Reorganización de
             EQUIPO DARI2


             Estructura básica
       ...
Sucesiones teleoreactivas
•   N. Nilsson
•   Situaciones mediante índices
•   Sistemas basados en reglas
Sucesiones teleoreactivas
•   N. Nilsson
•   Situaciones mediante índices
•   Sistemas basados en reglas
Regresión
Adecuación de la
   regresión
Adecuación de la
   regresión
Nuestro equipo: Sucesiones T-T
truncadas con comportamiento
• Cambiar acciones por comportamientos
• Truncar la sucesión c...
Comportamientos
Comportamientos
            ¿Macros?
¿Es subsunción?
¿Es subsunción?
                          o en
                    ba sad
             ción
          sun las
        ub r...
Ejemplo: esquema del
      central
Ejemplo: esquema del
      central
Mejoras funcionales
Mejoras funcionales
Ejemplos de partidos
Resultados (I)
Resultados (II)
El desafío: aprendizaje
El desafío: aprendizaje
Aprendizaje (I)
•   Off-line: Para tareas fijas
    •   Intercepción de balones
    •   Evaluación de pases
    •   Usando:...
Aprendizaje (II)
• Online:
 • Aprendiendo durante el juego
 • Ventaja: aprendo a ganar al contrincante
    actual
 • Desve...
Otros desafíos
• Propagación de errores
• Combinar capas subsunción/aprendizaje
• Controlar la emergencia
Otros desafíos
• Propagación de errores
• Combinar capas subsunción/aprendizaje
• Controlar la emergencia
Lineas actuales de
       trabajo

• Migrando a JAVA el equipo 2006
• Superar al equipo del 2006
• Diseñar nuevas estrateg...
Objetivo final
Objetivo final

Preparar un equipo competitivo US-UHU
           para participar en
          la ROBOCUP 2012
¿Te apuntas?
•   Joaquín Borrego Díaz
    •   Dpto. de Ciencias de la Computación e Inteligencia Artificial.
    •   Univer...
¿Te apuntas?
•   Joaquín Borrego Díaz
    •   Dpto. de Ciencias de la Computación e Inteligencia Artificial.
    •   Univer...
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Upcoming SlideShare
Loading in …5
×

Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación

2,811 views

Published on

charla que dimos Gonzalo y yo en las I jornadas de Robótica organizadas por la ESIBOT http://robotus.esibot.net/

Published in: Travel, Technology

Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación

  1. 1. Robocup: IA en sistemas multiagente y fútbol de simulación I Jornadas de Robótica RobotUS Mayo 2010 • Joaquín Borrego Díaz • Gonzalo A. Aranda Corral • Dpto. de Ciencias de la Computación e IA. • Dpto. Tecnologías de la Información • Universidad de Sevilla. • Universidad de Huelva. • jborrego@us.es • gonzalo.aranda@dti.uhu.es
  2. 2. Robocup: IA en sistemas multiagente y fútbol de simulación I Jornadas de Robótica RobotUS Mayo 2010 • Joaquín Borrego Díaz • Gonzalo A. Aranda Corral • Dpto. de Ciencias de la Computación e IA. • Dpto. Tecnologías de la Información • Universidad de Sevilla. • Universidad de Huelva. • jborrego@us.es • gonzalo.aranda@dti.uhu.es
  3. 3. Agentes inteligentes • Es una metáfora computacional propia de la Inteligencia Artificial • Se basa en la tradición de la epistemología aplicada • Agente Inteligente: entidad computacional con autonomía; • Reactividad • Proactividad • Sociabilidad
  4. 4. Agentes inteligentes • Es una metáfora computacional propia de la Inteligencia Artificial • Se basa en la tradición de la epistemología aplicada • Agente Inteligente: entidad computacional con autonomía; • Reactividad • Proactividad • Sociabilidad
  5. 5. Definición de agente (Russell-Norvig) • Dada una sucesión de percepciones, un agente racional ideal • debe realizar una acción que maximice la medida de éxito • a partir de la base de evidencias que obtiene de dicha sucesión de percepciones, y • junto con el conocimiento que posee
  6. 6. Definición de agente (Russell-Norvig) • Dada una sucesión de percepciones, un agente racional ideal (sólo No • debe realizar una acción que es u lo que d dice maximice la medida de éxito na b • uena a partir de la base de evidencias que obtiene de dicha sucesión de defin ebe percepciones, y ición hace • junto con el conocimiento que posee r)
  7. 7. Esqueleto de agente
  8. 8. Esqueleto de agente ¿Dónde está el razonamiento?
  9. 9. Características de los agentes racionales • Flexibilidad: las propiedades fundamentales son: • Reactividad: capacidad para responder a los cambios del entorno • Pro-actividad: capacidad de exhibir un comportamiento dirigido a cumplir sus objetivos • Sociabilidad: capacidad para comunicarse y colaborar con otros agentes • Son las exigencias mínimas • No se especifica el grado de flexibilidad de cada una • Situación ideal: combinar módulos reactivos y racionales • Es posible eludir alguna de éstas, para aplicaciones concretas
  10. 10. Características de los agentes racionales • Flexibilidad: las propiedades fundamentales son: • Reactividad: capacidad para responder a los cambios del entorno • Pro-actividad: capacidad de exhibir un comportamiento dirigido a cumplir sus objetivos • Sociabilidad: capacidad para comunicarse y colaborar con otros agentes • Son las exigencias mínimas • No se especifica el grado de flexibilidad de cada una • Situación ideal: combinar módulos reactivos y racionales • Es posible eludir alguna de éstas, para aplicaciones concretas
  11. 11. Proactividad versus reactividad Reactividad: Proactividad: + rapidez -rapidez (poca deducción) (deducir: planificar) -control del SMA + control individuos Inteligencia + Inteligencia Emergente implementada
  12. 12. Proactividad versus reactividad Reactividad: Proactividad: + rapidez -rapidez (poca deducción) (deducir: planificar) -control del SMA + control individuos Inteligencia + Inteligencia Emergente implementada
  13. 13. ¿Dónde está la IA clásica? • IA clásica: Racionalidad calculable • IA para SMA: • Racionalidad emergente • Racionalidad mixta • Ejemplo: Agentes y entorno: • IA clásica: poco dinamismo en el entorno • Ag. Inteligentes: dinamismo, no determinismo
  14. 14. ¿Dónde está la IA clásica? • IA clásica: Racionalidad calculable • IA para SMA: • Racionalidad emergente • Racionalidad mixta • Ejemplo: Agentes y entorno: • IA clásica: poco dinamismo en el entorno • Ag. Inteligentes: dinamismo, no determinismo
  15. 15. Reactividad y emergencia
  16. 16. • La computación es la ejecución de reglas del tipo: • Situación → Reacción • Los datos provienen de los módulos de percepción • El agente no mantiene, en principio, una representación mental • Se ahorra deliberación (razonamiento automático) • La percepción es clave: • Se caracteriza mediante índices elegidos por el programador • Los índices son extraídos del entorno
  17. 17. Agentes reactivos Principios de la reactividad • La computación es la ejecución de reglas del tipo: • Situación → Reacción • Los datos provienen de los módulos de percepción • El agente no mantiene, en principio, una representación mental • Se ahorra deliberación (razonamiento automático) • La percepción es clave: • Se caracteriza mediante índices elegidos por el programador • Los índices son extraídos del entorno
  18. 18. Emergencia • Test de sorpresa: Requerimientos para la emergencia • Diseño: se describe el sistema especificando las interacciones locales entre los agentes, con un lenguaje L • Observación: El observador describe el comportamiento global de la ejecución usando un lenguaje L’ • Sorpresa: Los lenguajes L y L’ son distintos, y el vínculo causal entre las interacciones elementales programadas en L y las observaciones descritas en L’ no son obvias
  19. 19. Emergencia • Test de sorpresa: Requerimientos para la emergencia • Diseño: se describe el sistema especificando las Int interacciones locales entre los agentes, con un lenguaje L elig describe el • Observación:em enc El observador erg ia comportamiento global de la ejecución usando un lenguaje L’ ent • Sorpresa: Los lenguajes L y L’ eson distintos, y el vínculo causal entre las interacciones elementales programadas en L y las observaciones descritas en L’ no son obvias
  20. 20. Tres tipos de emergencia sintética
  21. 21. Tres tipos de emergencia sintética
  22. 22. ROBOCUP
  23. 23. ROBOCUP “By the year 2050, develop a team of fully autonomous humanoid robots that can win against the human world soccer champion team.”
  24. 24. Competiciones • RoboCup Rescue • RoboCupJunior • RoboCup@Home • RoboCupSoccer
  25. 25. Historia hasta 2009 Venue Number of Number of Participants Countries RoboCup 2009 Graz Austria 407 43 RoboCup 2008 Shuzhou China 373 35 RoboCup 2007 Atlanta (Georgia Tech) - USA 321 39 RoboCup 2006 Bremen - Germany 440 35 RoboCup 2005 Osaka - Japan 419 35 RoboCup 2004 Lisbon - Portugal 345 37 RoboCup 2003 Padova - Italy 238 35 RoboCup 2002 Fukuoka/Busan - Japan/Korea 188 29 RoboCup 2001 Seattle – USA 141 22 RoboCup 2000 Melbourne - Australia 110 19 RoboCup 1999 Stockholm - Sweden 85 23 RoboCup 1998 Paris - France 63 19 RoboCup 1997 Nagoya - Japan - First official RoboCup 38 11 competition Pre-RoboCup-96 event - Osaka - Japan 8
  26. 26. Robocup Rescue Robocup Junior • Rescue Simulation League • Soccer challenge • Real Rescue Robot League • Dance challenge • Rescue challenge • General
  27. 27. Robocup Rescue Robocup Junior • Rescue Simulation League • Soccer challenge • Real Rescue Robot League • Dance challenge • Rescue challenge • General
  28. 28. Robocup Soccer
  29. 29. Robocup Soccer • Humanoid League • Four Legged League • Middle Size League • Small Size League • Simulation League
  30. 30. Humanoid league
  31. 31. Humanoid league
  32. 32. Four legged league
  33. 33. Middle size league
  34. 34. Simulation League • 2D • 3D
  35. 35. 2D Simulation League
  36. 36. Arquitectura
  37. 37. Arquitectura
  38. 38. Servidor UDP/IP Equipo B Equipo A
  39. 39. Monitor Monitor Classic Classic RCSSmonitor Rcssmonitor
  40. 40. Logs Logs rcsslogplayer
  41. 41. Clientes
  42. 42. ROBOCUP 2D COMO AGENTE PERCEPCIONES ENTORNO CEREBRO ACCIONES
  43. 43. Percepciones • Sensor aural • Sensor de visión • Sensor corporal
  44. 44. Percepciones • Sensor aural • Sensor de visión • Sensor corporal
  45. 45. Sensor aural
  46. 46. Sensor aural (hear Time Sender "Message")
  47. 47. Sensor aural (II) • Entorno aural
  48. 48. Sensor aural (II) Só • Entorno aural lo do de sm (a l e cto ti ns s d po aje e h say s/c ab icl la) o
  49. 49. Sensor de visión (see ObjName Distance Direction DistChng DirChng BodyDir HeadDir)
  50. 50. Sensor de visión (distancias)
  51. 51. Sensor de visión (distancias)
  52. 52. Sensor corporal (sense body Time (view mode ViewQuality ViewWidth) (stamina Stamina Eort) (speed AmountOfSpeed DirectionOfSpeed) (head angle HeadDirection) (kick KickCount) (dash DashCount) (turn TurnCount) (say SayCount) (turn neck TurnNeckCount) (catch CatchCount) (move MoveCount) (change view ChangeViewCount))
  53. 53. Sensor corporal
  54. 54. Sensor corporal • Física: • Stamina • Esfuerzo realizado • Velocidad (no direccional, cuantitativa)
  55. 55. Acciones • Catch • Dash • Kick • Move • Say • Turn • TurnNeck
  56. 56. Acciones • Catch • Dash • Kick • Move • Say • Turn • TurnNeck
  57. 57. “Catch” (parar)
  58. 58. “Dash” (correr)
  59. 59. “Kick” (chutar)
  60. 60. “Move” (teletransportar)
  61. 61. “Turn” y “TurnNeck” (girar, girar el cuello)
  62. 62. “Say” (hablar)
  63. 63. “Say” (hablar)
  64. 64. Entorno: modelo del mundo
  65. 65. Simulación del entorno • Intervalo de ejecución • Ciclos de acción • Ciclos de percepción
  66. 66. Simulación del entorno • Intervalo de ejecución • Ciclos de acción • Ciclos de percepción
  67. 67. Objetos
  68. 68. Campo
  69. 69. Otros agentes
  70. 70. Entrenador vs Preparador • Distinción entre el entrenador y el preparador. • El preparador puede ejercer más control sobre el juego y se puede usar solamente en la fase de desarrollo. • El entrenador se usa on-line y proporciona consejos e información a los jugadores.
  71. 71. Entrenador vs Preparador • Distinción entre el entrenador y el preparador. • El preparador puede ejercer más control sobre el juego y se puede usar solamente en la fase de desarrollo. • El entrenador se usa on-line y proporciona consejos e información a los jugadores.
  72. 72. El preparador
  73. 73. El preparador • Controla el modo de juego • Envía mensajes • Mueve a los jugadores y a la pelota a cualquier posición y con la velocidad que desee. • Puede obtener información libre de ruido de los objetos móviles.
  74. 74. El entrenador
  75. 75. El entrenador • Puede comunicarse con los jugadores. (restringida) • Puede obtener información libre de ruidos • Puede organizar estrategias
  76. 76. Reglas de juego • Árbitro automático • Árbitro humano
  77. 77. Árbitro automático • Kick-Off • Goal • Out of Field • Player Clearance • Play-Mode Control • Off-side • Backpasses • Free Kick Faults • Half-Time and Time-Up
  78. 78. Árbitro automático • Kick-Off • Goal • Out of Field • Player Clearance • Play-Mode Control • Off-side • Backpasses • Free Kick Faults • Half-Time and Time-Up
  79. 79. Árbitro humano • Rodear el balón • Bloquear la portería • No poner el balón en juego • Bloquear el movimiento de otros jugadores • Abusar del uso del portero • Inundar la red con mensajes • Comportamiento inapropiados...
  80. 80. Árbitro humano • Rodear el balón • Bloquear la portería • No poner el balón en juego • Bloquear el movimiento de otros jugadores • Abusar del uso del portero • Inundar la red con mensajes • Comportamiento inapropiados...
  81. 81. Cerebro
  82. 82. Características como Sistema multiagente • Ejemplo de problema PTS (sincronización periódica de equipos) • Algunas soluciones iniciales: • Acuerdos a puerta cerrada: • (principio, medio, paradas) • Protocolo de comunicación
  83. 83. Soluciones (I)
  84. 84. Soluciones (I)
  85. 85. Soluciones (II) • Roles (flexibles o rígidos) • Combinación de comportamientos externos e internos • Formaciones (dinámicas o a puerta cerrada) • Movimientos preplanificados
  86. 86. Limitaciones • Limitaciones: • Percepciones con ruido • Acciones • Objetivos individuales vs. globales
  87. 87. Equipo US-UHU
  88. 88. Historia
  89. 89. Historia • Equipo: Dari2 - 2005 • Mejora sustancial del equipo UVA-TRILEARN • Ricardo Alfonso Venzala y David Ballesteros • Equipo: US - 2006 • Mejora del Dari2 • Carlos Villar y Sergio Santos • Framework DECANO - 2007-2008 • Arquitectura basada en Agentes (Java) • Pablo Fernández y Álvaro Guerra • Equipo: DECANO 2010 - 2009-2010 • Mejora de Equipo 2006, basada en DECANO • José Ángel Torres y Jesús Serrano
  90. 90. Idea
  91. 91. Idea COMPONENTE T-R Reorganización de EQUIPO DARI2 Estructura básica UVATRILEARN MEJORAS FUNCIONALES
  92. 92. Sucesiones teleoreactivas • N. Nilsson • Situaciones mediante índices • Sistemas basados en reglas
  93. 93. Sucesiones teleoreactivas • N. Nilsson • Situaciones mediante índices • Sistemas basados en reglas
  94. 94. Regresión
  95. 95. Adecuación de la regresión
  96. 96. Adecuación de la regresión
  97. 97. Nuestro equipo: Sucesiones T-T truncadas con comportamiento • Cambiar acciones por comportamientos • Truncar la sucesión cuando el objetivo está muy lejano • Dos categorías de estados: • Papel activo (categoría A) • Papel pasivo/posicional (categoría B) • Teorema: siempre existe un jugador en A
  98. 98. Comportamientos
  99. 99. Comportamientos ¿Macros?
  100. 100. ¿Es subsunción?
  101. 101. ¿Es subsunción? o en ba sad ción sun las ub reg unas Es
  102. 102. Ejemplo: esquema del central
  103. 103. Ejemplo: esquema del central
  104. 104. Mejoras funcionales
  105. 105. Mejoras funcionales
  106. 106. Ejemplos de partidos
  107. 107. Resultados (I)
  108. 108. Resultados (II)
  109. 109. El desafío: aprendizaje
  110. 110. El desafío: aprendizaje
  111. 111. Aprendizaje (I) • Off-line: Para tareas fijas • Intercepción de balones • Evaluación de pases • Usando: redes neuronales, árboles de decisión… • Ventaja: conocimiento transmisible (no todo es aconsejable) • Desventaja: • ¡No se aprende durante el juego!
  112. 112. Aprendizaje (II) • Online: • Aprendiendo durante el juego • Ventaja: aprendo a ganar al contrincante actual • Desventaja: poco tiempo de aprendizaje • Exploración versus explotación
  113. 113. Otros desafíos • Propagación de errores • Combinar capas subsunción/aprendizaje • Controlar la emergencia
  114. 114. Otros desafíos • Propagación de errores • Combinar capas subsunción/aprendizaje • Controlar la emergencia
  115. 115. Lineas actuales de trabajo • Migrando a JAVA el equipo 2006 • Superar al equipo del 2006 • Diseñar nuevas estrategias para el SMA
  116. 116. Objetivo final
  117. 117. Objetivo final Preparar un equipo competitivo US-UHU para participar en la ROBOCUP 2012
  118. 118. ¿Te apuntas? • Joaquín Borrego Díaz • Dpto. de Ciencias de la Computación e Inteligencia Artificial. • Universidad de Sevilla. • jborrego@us.es • Gonzalo A. Aranda Corral • Dpto. Tecnologías de la Información • Universidad de Huelva. • gonzalo.aranda@dti.uhu.es
  119. 119. ¿Te apuntas? • Joaquín Borrego Díaz • Dpto. de Ciencias de la Computación e Inteligencia Artificial. • Universidad de Sevilla. • jborrego@us.es • Gonzalo A. Aranda Corral • Dpto. Tecnologías de la Información • Universidad de Huelva. • gonzalo.aranda@dti.uhu.es

×