Robocup: IA en
          sistemas multiagente
         y fútbol de simulación
          I Jornadas de Robótica RobotUS
   ...
Robocup: IA en
          sistemas multiagente
         y fútbol de simulación
          I Jornadas de Robótica RobotUS
   ...
Agentes inteligentes
•   Es una metáfora computacional propia de la
    Inteligencia Artificial
    •   Se basa en la tradi...
Agentes inteligentes
•   Es una metáfora computacional propia de la
    Inteligencia Artificial
    •   Se basa en la tradi...
Definición de agente
              (Russell-Norvig)
•   Dada una sucesión de percepciones, un
    agente racional ideal
   ...
Definición de agente
              (Russell-Norvig)
•   Dada una sucesión de percepciones, un
    agente racional ideal



...
Esqueleto de agente
Esqueleto de agente




              ¿Dónde está el
              razonamiento?
Características de los agentes
         racionales
•   Flexibilidad: las propiedades fundamentales son:
    •   Reactivida...
Características de los agentes
         racionales
•   Flexibilidad: las propiedades fundamentales son:
    •   Reactivida...
Proactividad versus
            reactividad
    Reactividad:         Proactividad:

+ rapidez          -rapidez
(poca dedu...
Proactividad versus
       reactividad
    Reactividad:         Proactividad:

+ rapidez          -rapidez
(poca deducción...
¿Dónde está la IA
            clásica?
•   IA clásica: Racionalidad calculable
•   IA para SMA:
    • Racionalidad emergen...
¿Dónde está la IA
            clásica?
•   IA clásica: Racionalidad calculable
•   IA para SMA:
    • Racionalidad emergen...
Reactividad y
 emergencia
•   La computación es la ejecución de reglas del tipo:

        •   Situación → Reacción

•   Los datos provienen de los m...
Agentes reactivos
        Principios de la reactividad

•   La computación es la ejecución de reglas del tipo:

        • ...
Emergencia
•   Test de sorpresa: Requerimientos para la emergencia
    •   Diseño: se describe el sistema especificando las...
Emergencia
•   Test de sorpresa: Requerimientos para la emergencia
    •   Diseño: se describe el sistema especificando las...
Tres tipos de emergencia
         sintética
Tres tipos de emergencia
         sintética
ROBOCUP
ROBOCUP

    “By the year 2050, develop a team of fully
autonomous humanoid robots that can win against
    the human worl...
Competiciones

• RoboCup Rescue
• RoboCupJunior
• RoboCup@Home
• RoboCupSoccer
Historia hasta 2009
Venue                                                  Number of      Number of
                      ...
Robocup Rescue                 Robocup Junior
•   Rescue Simulation League
                               •   Soccer chall...
Robocup Rescue                 Robocup Junior
•   Rescue Simulation League
                               •   Soccer chall...
Robocup Soccer
Robocup Soccer

• Humanoid League
• Four Legged League
• Middle Size League
• Small Size League
• Simulation League
Humanoid league
Humanoid league
Four legged league
Middle size league
Simulation League
• 2D
• 3D
2D Simulation League
Arquitectura
Arquitectura
Servidor


            UDP/IP
                      Equipo B
Equipo A
Monitor
 Monitor


Classic Classic         RCSSmonitor
                  Rcssmonitor
Logs
 Logs




        rcsslogplayer
Clientes
ROBOCUP 2D COMO AGENTE

          PERCEPCIONES




ENTORNO                  CEREBRO



           ACCIONES
Percepciones

• Sensor aural
• Sensor de visión
• Sensor corporal
Percepciones

• Sensor aural
• Sensor de visión
• Sensor corporal
Sensor aural
Sensor aural




   (hear Time Sender "Message")
Sensor aural (II)

• Entorno aural
Sensor aural (II)
                  Só
• Entorno aural      lo
                          do
                       de  sm
...
Sensor de visión




 (see ObjName Distance Direction
DistChng DirChng BodyDir HeadDir)
Sensor de visión
  (distancias)
Sensor de visión
  (distancias)
Sensor corporal

     (sense body Time
              (view mode ViewQuality ViewWidth)
              (stamina Stamina Eort...
Sensor corporal
Sensor corporal

• Física:
 • Stamina
 • Esfuerzo realizado
 • Velocidad (no direccional, cuantitativa)
Acciones
•   Catch
•   Dash
•   Kick
•   Move
•   Say
•   Turn
•   TurnNeck
Acciones
•   Catch
•   Dash
•   Kick
•   Move
•   Say
•   Turn
•   TurnNeck
“Catch” (parar)
“Dash” (correr)
“Kick” (chutar)
“Move”
(teletransportar)
“Turn” y “TurnNeck”
(girar, girar el cuello)
“Say” (hablar)
“Say” (hablar)
Entorno:
modelo del mundo
Simulación del entorno
• Intervalo de ejecución
 • Ciclos de acción
 • Ciclos de percepción
Simulación del entorno
• Intervalo de ejecución
 • Ciclos de acción
 • Ciclos de percepción
Objetos
Campo
Otros agentes
Entrenador vs Preparador
 •   Distinción entre el entrenador y el preparador.


     •   El preparador puede ejercer más c...
Entrenador vs Preparador
 •   Distinción entre el entrenador y el preparador.


     •   El preparador puede ejercer más c...
El preparador
El preparador
• Controla el modo de juego
• Envía mensajes
• Mueve a los jugadores y a la pelota a
  cualquier posición y ...
El entrenador
El entrenador
• Puede comunicarse con los jugadores.
  (restringida)


• Puede obtener información libre de ruidos

• Pued...
Reglas de juego


• Árbitro automático
• Árbitro humano
Árbitro automático
•   Kick-Off
•   Goal
•   Out of Field
•   Player Clearance
•   Play-Mode Control
•   Off-side
•   Back...
Árbitro automático
•   Kick-Off
•   Goal
•   Out of Field
•   Player Clearance
•   Play-Mode Control
•   Off-side
•   Back...
Árbitro humano
•   Rodear el balón
•   Bloquear la portería
•   No poner el balón en juego
•   Bloquear el movimiento de o...
Árbitro humano
•   Rodear el balón
•   Bloquear la portería
•   No poner el balón en juego
•   Bloquear el movimiento de o...
Cerebro
Características como
      Sistema multiagente
• Ejemplo de problema PTS (sincronización
  periódica de equipos)
• Algunas...
Soluciones (I)
Soluciones (I)
Soluciones (II)
• Roles (flexibles o rígidos)
 • Combinación de comportamientos
    externos e internos
• Formaciones (diná...
Limitaciones

• Limitaciones:
 • Percepciones con ruido
 • Acciones
 • Objetivos individuales vs. globales
Equipo US-UHU
Historia
Historia
•   Equipo: Dari2 - 2005
    •   Mejora sustancial del equipo UVA-TRILEARN
    •   Ricardo Alfonso Venzala y Davi...
Idea
Idea
COMPONENTE
    T-R

             Reorganización de
             EQUIPO DARI2


             Estructura básica
       ...
Sucesiones teleoreactivas
•   N. Nilsson
•   Situaciones mediante índices
•   Sistemas basados en reglas
Sucesiones teleoreactivas
•   N. Nilsson
•   Situaciones mediante índices
•   Sistemas basados en reglas
Regresión
Adecuación de la
   regresión
Adecuación de la
   regresión
Nuestro equipo: Sucesiones T-T
truncadas con comportamiento
• Cambiar acciones por comportamientos
• Truncar la sucesión c...
Comportamientos
Comportamientos
            ¿Macros?
¿Es subsunción?
¿Es subsunción?
                          o en
                    ba sad
             ción
          sun las
        ub r...
Ejemplo: esquema del
      central
Ejemplo: esquema del
      central
Mejoras funcionales
Mejoras funcionales
Ejemplos de partidos
Resultados (I)
Resultados (II)
El desafío: aprendizaje
El desafío: aprendizaje
Aprendizaje (I)
•   Off-line: Para tareas fijas
    •   Intercepción de balones
    •   Evaluación de pases
    •   Usando:...
Aprendizaje (II)
• Online:
 • Aprendiendo durante el juego
 • Ventaja: aprendo a ganar al contrincante
    actual
 • Desve...
Otros desafíos
• Propagación de errores
• Combinar capas subsunción/aprendizaje
• Controlar la emergencia
Otros desafíos
• Propagación de errores
• Combinar capas subsunción/aprendizaje
• Controlar la emergencia
Lineas actuales de
       trabajo

• Migrando a JAVA el equipo 2006
• Superar al equipo del 2006
• Diseñar nuevas estrateg...
Objetivo final
Objetivo final

Preparar un equipo competitivo US-UHU
           para participar en
          la ROBOCUP 2012
¿Te apuntas?
•   Joaquín Borrego Díaz
    •   Dpto. de Ciencias de la Computación e Inteligencia Artificial.
    •   Univer...
¿Te apuntas?
•   Joaquín Borrego Díaz
    •   Dpto. de Ciencias de la Computación e Inteligencia Artificial.
    •   Univer...
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
Upcoming SlideShare
Loading in …5
×

Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación

2,337
-1

Published on

charla que dimos Gonzalo y yo en las I jornadas de Robótica organizadas por la ESIBOT http://robotus.esibot.net/

Published in: Travel, Technology
1 Comment
2 Likes
Statistics
Notes
No Downloads
Views
Total Views
2,337
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
97
Comments
1
Likes
2
Embeds 0
No embeds

No notes for slide




























































































































  • Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación

    1. 1. Robocup: IA en sistemas multiagente y fútbol de simulación I Jornadas de Robótica RobotUS Mayo 2010 • Joaquín Borrego Díaz • Gonzalo A. Aranda Corral • Dpto. de Ciencias de la Computación e IA. • Dpto. Tecnologías de la Información • Universidad de Sevilla. • Universidad de Huelva. • jborrego@us.es • gonzalo.aranda@dti.uhu.es
    2. 2. Robocup: IA en sistemas multiagente y fútbol de simulación I Jornadas de Robótica RobotUS Mayo 2010 • Joaquín Borrego Díaz • Gonzalo A. Aranda Corral • Dpto. de Ciencias de la Computación e IA. • Dpto. Tecnologías de la Información • Universidad de Sevilla. • Universidad de Huelva. • jborrego@us.es • gonzalo.aranda@dti.uhu.es
    3. 3. Agentes inteligentes • Es una metáfora computacional propia de la Inteligencia Artificial • Se basa en la tradición de la epistemología aplicada • Agente Inteligente: entidad computacional con autonomía; • Reactividad • Proactividad • Sociabilidad
    4. 4. Agentes inteligentes • Es una metáfora computacional propia de la Inteligencia Artificial • Se basa en la tradición de la epistemología aplicada • Agente Inteligente: entidad computacional con autonomía; • Reactividad • Proactividad • Sociabilidad
    5. 5. Definición de agente (Russell-Norvig) • Dada una sucesión de percepciones, un agente racional ideal • debe realizar una acción que maximice la medida de éxito • a partir de la base de evidencias que obtiene de dicha sucesión de percepciones, y • junto con el conocimiento que posee
    6. 6. Definición de agente (Russell-Norvig) • Dada una sucesión de percepciones, un agente racional ideal (sólo No • debe realizar una acción que es u lo que d dice maximice la medida de éxito na b • uena a partir de la base de evidencias que obtiene de dicha sucesión de defin ebe percepciones, y ición hace • junto con el conocimiento que posee r)
    7. 7. Esqueleto de agente
    8. 8. Esqueleto de agente ¿Dónde está el razonamiento?
    9. 9. Características de los agentes racionales • Flexibilidad: las propiedades fundamentales son: • Reactividad: capacidad para responder a los cambios del entorno • Pro-actividad: capacidad de exhibir un comportamiento dirigido a cumplir sus objetivos • Sociabilidad: capacidad para comunicarse y colaborar con otros agentes • Son las exigencias mínimas • No se especifica el grado de flexibilidad de cada una • Situación ideal: combinar módulos reactivos y racionales • Es posible eludir alguna de éstas, para aplicaciones concretas
    10. 10. Características de los agentes racionales • Flexibilidad: las propiedades fundamentales son: • Reactividad: capacidad para responder a los cambios del entorno • Pro-actividad: capacidad de exhibir un comportamiento dirigido a cumplir sus objetivos • Sociabilidad: capacidad para comunicarse y colaborar con otros agentes • Son las exigencias mínimas • No se especifica el grado de flexibilidad de cada una • Situación ideal: combinar módulos reactivos y racionales • Es posible eludir alguna de éstas, para aplicaciones concretas
    11. 11. Proactividad versus reactividad Reactividad: Proactividad: + rapidez -rapidez (poca deducción) (deducir: planificar) -control del SMA + control individuos Inteligencia + Inteligencia Emergente implementada
    12. 12. Proactividad versus reactividad Reactividad: Proactividad: + rapidez -rapidez (poca deducción) (deducir: planificar) -control del SMA + control individuos Inteligencia + Inteligencia Emergente implementada
    13. 13. ¿Dónde está la IA clásica? • IA clásica: Racionalidad calculable • IA para SMA: • Racionalidad emergente • Racionalidad mixta • Ejemplo: Agentes y entorno: • IA clásica: poco dinamismo en el entorno • Ag. Inteligentes: dinamismo, no determinismo
    14. 14. ¿Dónde está la IA clásica? • IA clásica: Racionalidad calculable • IA para SMA: • Racionalidad emergente • Racionalidad mixta • Ejemplo: Agentes y entorno: • IA clásica: poco dinamismo en el entorno • Ag. Inteligentes: dinamismo, no determinismo
    15. 15. Reactividad y emergencia
    16. 16. • La computación es la ejecución de reglas del tipo: • Situación → Reacción • Los datos provienen de los módulos de percepción • El agente no mantiene, en principio, una representación mental • Se ahorra deliberación (razonamiento automático) • La percepción es clave: • Se caracteriza mediante índices elegidos por el programador • Los índices son extraídos del entorno
    17. 17. Agentes reactivos Principios de la reactividad • La computación es la ejecución de reglas del tipo: • Situación → Reacción • Los datos provienen de los módulos de percepción • El agente no mantiene, en principio, una representación mental • Se ahorra deliberación (razonamiento automático) • La percepción es clave: • Se caracteriza mediante índices elegidos por el programador • Los índices son extraídos del entorno
    18. 18. Emergencia • Test de sorpresa: Requerimientos para la emergencia • Diseño: se describe el sistema especificando las interacciones locales entre los agentes, con un lenguaje L • Observación: El observador describe el comportamiento global de la ejecución usando un lenguaje L’ • Sorpresa: Los lenguajes L y L’ son distintos, y el vínculo causal entre las interacciones elementales programadas en L y las observaciones descritas en L’ no son obvias
    19. 19. Emergencia • Test de sorpresa: Requerimientos para la emergencia • Diseño: se describe el sistema especificando las Int interacciones locales entre los agentes, con un lenguaje L elig describe el • Observación:em enc El observador erg ia comportamiento global de la ejecución usando un lenguaje L’ ent • Sorpresa: Los lenguajes L y L’ eson distintos, y el vínculo causal entre las interacciones elementales programadas en L y las observaciones descritas en L’ no son obvias
    20. 20. Tres tipos de emergencia sintética
    21. 21. Tres tipos de emergencia sintética
    22. 22. ROBOCUP
    23. 23. ROBOCUP “By the year 2050, develop a team of fully autonomous humanoid robots that can win against the human world soccer champion team.”
    24. 24. Competiciones • RoboCup Rescue • RoboCupJunior • RoboCup@Home • RoboCupSoccer
    25. 25. Historia hasta 2009 Venue Number of Number of Participants Countries RoboCup 2009 Graz Austria 407 43 RoboCup 2008 Shuzhou China 373 35 RoboCup 2007 Atlanta (Georgia Tech) - USA 321 39 RoboCup 2006 Bremen - Germany 440 35 RoboCup 2005 Osaka - Japan 419 35 RoboCup 2004 Lisbon - Portugal 345 37 RoboCup 2003 Padova - Italy 238 35 RoboCup 2002 Fukuoka/Busan - Japan/Korea 188 29 RoboCup 2001 Seattle – USA 141 22 RoboCup 2000 Melbourne - Australia 110 19 RoboCup 1999 Stockholm - Sweden 85 23 RoboCup 1998 Paris - France 63 19 RoboCup 1997 Nagoya - Japan - First official RoboCup 38 11 competition Pre-RoboCup-96 event - Osaka - Japan 8
    26. 26. Robocup Rescue Robocup Junior • Rescue Simulation League • Soccer challenge • Real Rescue Robot League • Dance challenge • Rescue challenge • General
    27. 27. Robocup Rescue Robocup Junior • Rescue Simulation League • Soccer challenge • Real Rescue Robot League • Dance challenge • Rescue challenge • General
    28. 28. Robocup Soccer
    29. 29. Robocup Soccer • Humanoid League • Four Legged League • Middle Size League • Small Size League • Simulation League
    30. 30. Humanoid league
    31. 31. Humanoid league
    32. 32. Four legged league
    33. 33. Middle size league
    34. 34. Simulation League • 2D • 3D
    35. 35. 2D Simulation League
    36. 36. Arquitectura
    37. 37. Arquitectura
    38. 38. Servidor UDP/IP Equipo B Equipo A
    39. 39. Monitor Monitor Classic Classic RCSSmonitor Rcssmonitor
    40. 40. Logs Logs rcsslogplayer
    41. 41. Clientes
    42. 42. ROBOCUP 2D COMO AGENTE PERCEPCIONES ENTORNO CEREBRO ACCIONES
    43. 43. Percepciones • Sensor aural • Sensor de visión • Sensor corporal
    44. 44. Percepciones • Sensor aural • Sensor de visión • Sensor corporal
    45. 45. Sensor aural
    46. 46. Sensor aural (hear Time Sender "Message")
    47. 47. Sensor aural (II) • Entorno aural
    48. 48. Sensor aural (II) Só • Entorno aural lo do de sm (a l e cto ti ns s d po aje e h say s/c ab icl la) o
    49. 49. Sensor de visión (see ObjName Distance Direction DistChng DirChng BodyDir HeadDir)
    50. 50. Sensor de visión (distancias)
    51. 51. Sensor de visión (distancias)
    52. 52. Sensor corporal (sense body Time (view mode ViewQuality ViewWidth) (stamina Stamina Eort) (speed AmountOfSpeed DirectionOfSpeed) (head angle HeadDirection) (kick KickCount) (dash DashCount) (turn TurnCount) (say SayCount) (turn neck TurnNeckCount) (catch CatchCount) (move MoveCount) (change view ChangeViewCount))
    53. 53. Sensor corporal
    54. 54. Sensor corporal • Física: • Stamina • Esfuerzo realizado • Velocidad (no direccional, cuantitativa)
    55. 55. Acciones • Catch • Dash • Kick • Move • Say • Turn • TurnNeck
    56. 56. Acciones • Catch • Dash • Kick • Move • Say • Turn • TurnNeck
    57. 57. “Catch” (parar)
    58. 58. “Dash” (correr)
    59. 59. “Kick” (chutar)
    60. 60. “Move” (teletransportar)
    61. 61. “Turn” y “TurnNeck” (girar, girar el cuello)
    62. 62. “Say” (hablar)
    63. 63. “Say” (hablar)
    64. 64. Entorno: modelo del mundo
    65. 65. Simulación del entorno • Intervalo de ejecución • Ciclos de acción • Ciclos de percepción
    66. 66. Simulación del entorno • Intervalo de ejecución • Ciclos de acción • Ciclos de percepción
    67. 67. Objetos
    68. 68. Campo
    69. 69. Otros agentes
    70. 70. Entrenador vs Preparador • Distinción entre el entrenador y el preparador. • El preparador puede ejercer más control sobre el juego y se puede usar solamente en la fase de desarrollo. • El entrenador se usa on-line y proporciona consejos e información a los jugadores.
    71. 71. Entrenador vs Preparador • Distinción entre el entrenador y el preparador. • El preparador puede ejercer más control sobre el juego y se puede usar solamente en la fase de desarrollo. • El entrenador se usa on-line y proporciona consejos e información a los jugadores.
    72. 72. El preparador
    73. 73. El preparador • Controla el modo de juego • Envía mensajes • Mueve a los jugadores y a la pelota a cualquier posición y con la velocidad que desee. • Puede obtener información libre de ruido de los objetos móviles.
    74. 74. El entrenador
    75. 75. El entrenador • Puede comunicarse con los jugadores. (restringida) • Puede obtener información libre de ruidos • Puede organizar estrategias
    76. 76. Reglas de juego • Árbitro automático • Árbitro humano
    77. 77. Árbitro automático • Kick-Off • Goal • Out of Field • Player Clearance • Play-Mode Control • Off-side • Backpasses • Free Kick Faults • Half-Time and Time-Up
    78. 78. Árbitro automático • Kick-Off • Goal • Out of Field • Player Clearance • Play-Mode Control • Off-side • Backpasses • Free Kick Faults • Half-Time and Time-Up
    79. 79. Árbitro humano • Rodear el balón • Bloquear la portería • No poner el balón en juego • Bloquear el movimiento de otros jugadores • Abusar del uso del portero • Inundar la red con mensajes • Comportamiento inapropiados...
    80. 80. Árbitro humano • Rodear el balón • Bloquear la portería • No poner el balón en juego • Bloquear el movimiento de otros jugadores • Abusar del uso del portero • Inundar la red con mensajes • Comportamiento inapropiados...
    81. 81. Cerebro
    82. 82. Características como Sistema multiagente • Ejemplo de problema PTS (sincronización periódica de equipos) • Algunas soluciones iniciales: • Acuerdos a puerta cerrada: • (principio, medio, paradas) • Protocolo de comunicación
    83. 83. Soluciones (I)
    84. 84. Soluciones (I)
    85. 85. Soluciones (II) • Roles (flexibles o rígidos) • Combinación de comportamientos externos e internos • Formaciones (dinámicas o a puerta cerrada) • Movimientos preplanificados
    86. 86. Limitaciones • Limitaciones: • Percepciones con ruido • Acciones • Objetivos individuales vs. globales
    87. 87. Equipo US-UHU
    88. 88. Historia
    89. 89. Historia • Equipo: Dari2 - 2005 • Mejora sustancial del equipo UVA-TRILEARN • Ricardo Alfonso Venzala y David Ballesteros • Equipo: US - 2006 • Mejora del Dari2 • Carlos Villar y Sergio Santos • Framework DECANO - 2007-2008 • Arquitectura basada en Agentes (Java) • Pablo Fernández y Álvaro Guerra • Equipo: DECANO 2010 - 2009-2010 • Mejora de Equipo 2006, basada en DECANO • José Ángel Torres y Jesús Serrano
    90. 90. Idea
    91. 91. Idea COMPONENTE T-R Reorganización de EQUIPO DARI2 Estructura básica UVATRILEARN MEJORAS FUNCIONALES
    92. 92. Sucesiones teleoreactivas • N. Nilsson • Situaciones mediante índices • Sistemas basados en reglas
    93. 93. Sucesiones teleoreactivas • N. Nilsson • Situaciones mediante índices • Sistemas basados en reglas
    94. 94. Regresión
    95. 95. Adecuación de la regresión
    96. 96. Adecuación de la regresión
    97. 97. Nuestro equipo: Sucesiones T-T truncadas con comportamiento • Cambiar acciones por comportamientos • Truncar la sucesión cuando el objetivo está muy lejano • Dos categorías de estados: • Papel activo (categoría A) • Papel pasivo/posicional (categoría B) • Teorema: siempre existe un jugador en A
    98. 98. Comportamientos
    99. 99. Comportamientos ¿Macros?
    100. 100. ¿Es subsunción?
    101. 101. ¿Es subsunción? o en ba sad ción sun las ub reg unas Es
    102. 102. Ejemplo: esquema del central
    103. 103. Ejemplo: esquema del central
    104. 104. Mejoras funcionales
    105. 105. Mejoras funcionales
    106. 106. Ejemplos de partidos
    107. 107. Resultados (I)
    108. 108. Resultados (II)
    109. 109. El desafío: aprendizaje
    110. 110. El desafío: aprendizaje
    111. 111. Aprendizaje (I) • Off-line: Para tareas fijas • Intercepción de balones • Evaluación de pases • Usando: redes neuronales, árboles de decisión… • Ventaja: conocimiento transmisible (no todo es aconsejable) • Desventaja: • ¡No se aprende durante el juego!
    112. 112. Aprendizaje (II) • Online: • Aprendiendo durante el juego • Ventaja: aprendo a ganar al contrincante actual • Desventaja: poco tiempo de aprendizaje • Exploración versus explotación
    113. 113. Otros desafíos • Propagación de errores • Combinar capas subsunción/aprendizaje • Controlar la emergencia
    114. 114. Otros desafíos • Propagación de errores • Combinar capas subsunción/aprendizaje • Controlar la emergencia
    115. 115. Lineas actuales de trabajo • Migrando a JAVA el equipo 2006 • Superar al equipo del 2006 • Diseñar nuevas estrategias para el SMA
    116. 116. Objetivo final
    117. 117. Objetivo final Preparar un equipo competitivo US-UHU para participar en la ROBOCUP 2012
    118. 118. ¿Te apuntas? • Joaquín Borrego Díaz • Dpto. de Ciencias de la Computación e Inteligencia Artificial. • Universidad de Sevilla. • jborrego@us.es • Gonzalo A. Aranda Corral • Dpto. Tecnologías de la Información • Universidad de Huelva. • gonzalo.aranda@dti.uhu.es
    119. 119. ¿Te apuntas? • Joaquín Borrego Díaz • Dpto. de Ciencias de la Computación e Inteligencia Artificial. • Universidad de Sevilla. • jborrego@us.es • Gonzalo A. Aranda Corral • Dpto. Tecnologías de la Información • Universidad de Huelva. • gonzalo.aranda@dti.uhu.es
    1. A particular slide catching your eye?

      Clipping is a handy way to collect important slides you want to go back to later.

    ×