• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
 

Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación

on

  • 2,738 views

charla que dimos Gonzalo y yo en las I jornadas de Robótica organizadas por la ESIBOT http://robotus.esibot.net/

charla que dimos Gonzalo y yo en las I jornadas de Robótica organizadas por la ESIBOT http://robotus.esibot.net/

Statistics

Views

Total Views
2,738
Views on SlideShare
2,721
Embed Views
17

Actions

Likes
2
Downloads
83
Comments
1

1 Embed 17

http://www.slideshare.net 17

Accessibility

Categories

Upload Details

Uploaded via as Apple Keynote

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel

11 of 1 previous next

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />

Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación Presentation Transcript

  • Robocup: IA en sistemas multiagente y fútbol de simulación I Jornadas de Robótica RobotUS Mayo 2010 • Joaquín Borrego Díaz • Gonzalo A. Aranda Corral • Dpto. de Ciencias de la Computación e IA. • Dpto. Tecnologías de la Información • Universidad de Sevilla. • Universidad de Huelva. • jborrego@us.es • gonzalo.aranda@dti.uhu.es
  • Robocup: IA en sistemas multiagente y fútbol de simulación I Jornadas de Robótica RobotUS Mayo 2010 • Joaquín Borrego Díaz • Gonzalo A. Aranda Corral • Dpto. de Ciencias de la Computación e IA. • Dpto. Tecnologías de la Información • Universidad de Sevilla. • Universidad de Huelva. • jborrego@us.es • gonzalo.aranda@dti.uhu.es
  • Agentes inteligentes • Es una metáfora computacional propia de la Inteligencia Artificial • Se basa en la tradición de la epistemología aplicada • Agente Inteligente: entidad computacional con autonomía; • Reactividad • Proactividad • Sociabilidad
  • Agentes inteligentes • Es una metáfora computacional propia de la Inteligencia Artificial • Se basa en la tradición de la epistemología aplicada • Agente Inteligente: entidad computacional con autonomía; • Reactividad • Proactividad • Sociabilidad
  • Definición de agente (Russell-Norvig) • Dada una sucesión de percepciones, un agente racional ideal • debe realizar una acción que maximice la medida de éxito • a partir de la base de evidencias que obtiene de dicha sucesión de percepciones, y • junto con el conocimiento que posee
  • Definición de agente (Russell-Norvig) • Dada una sucesión de percepciones, un agente racional ideal (sólo No • debe realizar una acción que es u lo que d dice maximice la medida de éxito na b • uena a partir de la base de evidencias que obtiene de dicha sucesión de defin ebe percepciones, y ición hace • junto con el conocimiento que posee r)
  • Esqueleto de agente
  • Esqueleto de agente ¿Dónde está el razonamiento?
  • Características de los agentes racionales • Flexibilidad: las propiedades fundamentales son: • Reactividad: capacidad para responder a los cambios del entorno • Pro-actividad: capacidad de exhibir un comportamiento dirigido a cumplir sus objetivos • Sociabilidad: capacidad para comunicarse y colaborar con otros agentes • Son las exigencias mínimas • No se especifica el grado de flexibilidad de cada una • Situación ideal: combinar módulos reactivos y racionales • Es posible eludir alguna de éstas, para aplicaciones concretas
  • Características de los agentes racionales • Flexibilidad: las propiedades fundamentales son: • Reactividad: capacidad para responder a los cambios del entorno • Pro-actividad: capacidad de exhibir un comportamiento dirigido a cumplir sus objetivos • Sociabilidad: capacidad para comunicarse y colaborar con otros agentes • Son las exigencias mínimas • No se especifica el grado de flexibilidad de cada una • Situación ideal: combinar módulos reactivos y racionales • Es posible eludir alguna de éstas, para aplicaciones concretas
  • Proactividad versus reactividad Reactividad: Proactividad: + rapidez -rapidez (poca deducción) (deducir: planificar) -control del SMA + control individuos Inteligencia + Inteligencia Emergente implementada
  • Proactividad versus reactividad Reactividad: Proactividad: + rapidez -rapidez (poca deducción) (deducir: planificar) -control del SMA + control individuos Inteligencia + Inteligencia Emergente implementada
  • ¿Dónde está la IA clásica? • IA clásica: Racionalidad calculable • IA para SMA: • Racionalidad emergente • Racionalidad mixta • Ejemplo: Agentes y entorno: • IA clásica: poco dinamismo en el entorno • Ag. Inteligentes: dinamismo, no determinismo
  • ¿Dónde está la IA clásica? • IA clásica: Racionalidad calculable • IA para SMA: • Racionalidad emergente • Racionalidad mixta • Ejemplo: Agentes y entorno: • IA clásica: poco dinamismo en el entorno • Ag. Inteligentes: dinamismo, no determinismo
  • Reactividad y emergencia
  • • La computación es la ejecución de reglas del tipo: • Situación → Reacción • Los datos provienen de los módulos de percepción • El agente no mantiene, en principio, una representación mental • Se ahorra deliberación (razonamiento automático) • La percepción es clave: • Se caracteriza mediante índices elegidos por el programador • Los índices son extraídos del entorno
  • Agentes reactivos Principios de la reactividad • La computación es la ejecución de reglas del tipo: • Situación → Reacción • Los datos provienen de los módulos de percepción • El agente no mantiene, en principio, una representación mental • Se ahorra deliberación (razonamiento automático) • La percepción es clave: • Se caracteriza mediante índices elegidos por el programador • Los índices son extraídos del entorno
  • Emergencia • Test de sorpresa: Requerimientos para la emergencia • Diseño: se describe el sistema especificando las interacciones locales entre los agentes, con un lenguaje L • Observación: El observador describe el comportamiento global de la ejecución usando un lenguaje L’ • Sorpresa: Los lenguajes L y L’ son distintos, y el vínculo causal entre las interacciones elementales programadas en L y las observaciones descritas en L’ no son obvias
  • Emergencia • Test de sorpresa: Requerimientos para la emergencia • Diseño: se describe el sistema especificando las Int interacciones locales entre los agentes, con un lenguaje L elig describe el • Observación:em enc El observador erg ia comportamiento global de la ejecución usando un lenguaje L’ ent • Sorpresa: Los lenguajes L y L’ eson distintos, y el vínculo causal entre las interacciones elementales programadas en L y las observaciones descritas en L’ no son obvias
  • Tres tipos de emergencia sintética
  • Tres tipos de emergencia sintética
  • ROBOCUP
  • ROBOCUP “By the year 2050, develop a team of fully autonomous humanoid robots that can win against the human world soccer champion team.”
  • Competiciones • RoboCup Rescue • RoboCupJunior • RoboCup@Home • RoboCupSoccer
  • Historia hasta 2009 Venue Number of Number of Participants Countries RoboCup 2009 Graz Austria 407 43 RoboCup 2008 Shuzhou China 373 35 RoboCup 2007 Atlanta (Georgia Tech) - USA 321 39 RoboCup 2006 Bremen - Germany 440 35 RoboCup 2005 Osaka - Japan 419 35 RoboCup 2004 Lisbon - Portugal 345 37 RoboCup 2003 Padova - Italy 238 35 RoboCup 2002 Fukuoka/Busan - Japan/Korea 188 29 RoboCup 2001 Seattle – USA 141 22 RoboCup 2000 Melbourne - Australia 110 19 RoboCup 1999 Stockholm - Sweden 85 23 RoboCup 1998 Paris - France 63 19 RoboCup 1997 Nagoya - Japan - First official RoboCup 38 11 competition Pre-RoboCup-96 event - Osaka - Japan 8
  • Robocup Rescue Robocup Junior • Rescue Simulation League • Soccer challenge • Real Rescue Robot League • Dance challenge • Rescue challenge • General
  • Robocup Rescue Robocup Junior • Rescue Simulation League • Soccer challenge • Real Rescue Robot League • Dance challenge • Rescue challenge • General
  • Robocup Soccer
  • Robocup Soccer • Humanoid League • Four Legged League • Middle Size League • Small Size League • Simulation League
  • Humanoid league
  • Humanoid league
  • Four legged league
  • Middle size league
  • Simulation League • 2D • 3D
  • 2D Simulation League
  • Arquitectura
  • Arquitectura
  • Servidor UDP/IP Equipo B Equipo A
  • Monitor Monitor Classic Classic RCSSmonitor Rcssmonitor
  • Logs Logs rcsslogplayer
  • Clientes
  • ROBOCUP 2D COMO AGENTE PERCEPCIONES ENTORNO CEREBRO ACCIONES
  • Percepciones • Sensor aural • Sensor de visión • Sensor corporal
  • Percepciones • Sensor aural • Sensor de visión • Sensor corporal
  • Sensor aural
  • Sensor aural (hear Time Sender "Message")
  • Sensor aural (II) • Entorno aural
  • Sensor aural (II) Só • Entorno aural lo do de sm (a l e cto ti ns s d po aje e h say s/c ab icl la) o
  • Sensor de visión (see ObjName Distance Direction DistChng DirChng BodyDir HeadDir)
  • Sensor de visión (distancias)
  • Sensor de visión (distancias)
  • Sensor corporal (sense body Time (view mode ViewQuality ViewWidth) (stamina Stamina Eort) (speed AmountOfSpeed DirectionOfSpeed) (head angle HeadDirection) (kick KickCount) (dash DashCount) (turn TurnCount) (say SayCount) (turn neck TurnNeckCount) (catch CatchCount) (move MoveCount) (change view ChangeViewCount))
  • Sensor corporal
  • Sensor corporal • Física: • Stamina • Esfuerzo realizado • Velocidad (no direccional, cuantitativa)
  • Acciones • Catch • Dash • Kick • Move • Say • Turn • TurnNeck
  • Acciones • Catch • Dash • Kick • Move • Say • Turn • TurnNeck
  • “Catch” (parar)
  • “Dash” (correr)
  • “Kick” (chutar)
  • “Move” (teletransportar)
  • “Turn” y “TurnNeck” (girar, girar el cuello)
  • “Say” (hablar)
  • “Say” (hablar)
  • Entorno: modelo del mundo
  • Simulación del entorno • Intervalo de ejecución • Ciclos de acción • Ciclos de percepción
  • Simulación del entorno • Intervalo de ejecución • Ciclos de acción • Ciclos de percepción
  • Objetos
  • Campo
  • Otros agentes
  • Entrenador vs Preparador • Distinción entre el entrenador y el preparador. • El preparador puede ejercer más control sobre el juego y se puede usar solamente en la fase de desarrollo. • El entrenador se usa on-line y proporciona consejos e información a los jugadores.
  • Entrenador vs Preparador • Distinción entre el entrenador y el preparador. • El preparador puede ejercer más control sobre el juego y se puede usar solamente en la fase de desarrollo. • El entrenador se usa on-line y proporciona consejos e información a los jugadores.
  • El preparador
  • El preparador • Controla el modo de juego • Envía mensajes • Mueve a los jugadores y a la pelota a cualquier posición y con la velocidad que desee. • Puede obtener información libre de ruido de los objetos móviles.
  • El entrenador
  • El entrenador • Puede comunicarse con los jugadores. (restringida) • Puede obtener información libre de ruidos • Puede organizar estrategias
  • Reglas de juego • Árbitro automático • Árbitro humano
  • Árbitro automático • Kick-Off • Goal • Out of Field • Player Clearance • Play-Mode Control • Off-side • Backpasses • Free Kick Faults • Half-Time and Time-Up
  • Árbitro automático • Kick-Off • Goal • Out of Field • Player Clearance • Play-Mode Control • Off-side • Backpasses • Free Kick Faults • Half-Time and Time-Up
  • Árbitro humano • Rodear el balón • Bloquear la portería • No poner el balón en juego • Bloquear el movimiento de otros jugadores • Abusar del uso del portero • Inundar la red con mensajes • Comportamiento inapropiados...
  • Árbitro humano • Rodear el balón • Bloquear la portería • No poner el balón en juego • Bloquear el movimiento de otros jugadores • Abusar del uso del portero • Inundar la red con mensajes • Comportamiento inapropiados...
  • Cerebro
  • Características como Sistema multiagente • Ejemplo de problema PTS (sincronización periódica de equipos) • Algunas soluciones iniciales: • Acuerdos a puerta cerrada: • (principio, medio, paradas) • Protocolo de comunicación
  • Soluciones (I)
  • Soluciones (I)
  • Soluciones (II) • Roles (flexibles o rígidos) • Combinación de comportamientos externos e internos • Formaciones (dinámicas o a puerta cerrada) • Movimientos preplanificados
  • Limitaciones • Limitaciones: • Percepciones con ruido • Acciones • Objetivos individuales vs. globales
  • Equipo US-UHU
  • Historia
  • Historia • Equipo: Dari2 - 2005 • Mejora sustancial del equipo UVA-TRILEARN • Ricardo Alfonso Venzala y David Ballesteros • Equipo: US - 2006 • Mejora del Dari2 • Carlos Villar y Sergio Santos • Framework DECANO - 2007-2008 • Arquitectura basada en Agentes (Java) • Pablo Fernández y Álvaro Guerra • Equipo: DECANO 2010 - 2009-2010 • Mejora de Equipo 2006, basada en DECANO • José Ángel Torres y Jesús Serrano
  • Idea
  • Idea COMPONENTE T-R Reorganización de EQUIPO DARI2 Estructura básica UVATRILEARN MEJORAS FUNCIONALES
  • Sucesiones teleoreactivas • N. Nilsson • Situaciones mediante índices • Sistemas basados en reglas
  • Sucesiones teleoreactivas • N. Nilsson • Situaciones mediante índices • Sistemas basados en reglas
  • Regresión
  • Adecuación de la regresión
  • Adecuación de la regresión
  • Nuestro equipo: Sucesiones T-T truncadas con comportamiento • Cambiar acciones por comportamientos • Truncar la sucesión cuando el objetivo está muy lejano • Dos categorías de estados: • Papel activo (categoría A) • Papel pasivo/posicional (categoría B) • Teorema: siempre existe un jugador en A
  • Comportamientos
  • Comportamientos ¿Macros?
  • ¿Es subsunción?
  • ¿Es subsunción? o en ba sad ción sun las ub reg unas Es
  • Ejemplo: esquema del central
  • Ejemplo: esquema del central
  • Mejoras funcionales
  • Mejoras funcionales
  • Ejemplos de partidos
  • Resultados (I)
  • Resultados (II)
  • El desafío: aprendizaje
  • El desafío: aprendizaje
  • Aprendizaje (I) • Off-line: Para tareas fijas • Intercepción de balones • Evaluación de pases • Usando: redes neuronales, árboles de decisión… • Ventaja: conocimiento transmisible (no todo es aconsejable) • Desventaja: • ¡No se aprende durante el juego!
  • Aprendizaje (II) • Online: • Aprendiendo durante el juego • Ventaja: aprendo a ganar al contrincante actual • Desventaja: poco tiempo de aprendizaje • Exploración versus explotación
  • Otros desafíos • Propagación de errores • Combinar capas subsunción/aprendizaje • Controlar la emergencia
  • Otros desafíos • Propagación de errores • Combinar capas subsunción/aprendizaje • Controlar la emergencia
  • Lineas actuales de trabajo • Migrando a JAVA el equipo 2006 • Superar al equipo del 2006 • Diseñar nuevas estrategias para el SMA
  • Objetivo final
  • Objetivo final Preparar un equipo competitivo US-UHU para participar en la ROBOCUP 2012
  • ¿Te apuntas? • Joaquín Borrego Díaz • Dpto. de Ciencias de la Computación e Inteligencia Artificial. • Universidad de Sevilla. • jborrego@us.es • Gonzalo A. Aranda Corral • Dpto. Tecnologías de la Información • Universidad de Huelva. • gonzalo.aranda@dti.uhu.es
  • ¿Te apuntas? • Joaquín Borrego Díaz • Dpto. de Ciencias de la Computación e Inteligencia Artificial. • Universidad de Sevilla. • jborrego@us.es • Gonzalo A. Aranda Corral • Dpto. Tecnologías de la Información • Universidad de Huelva. • gonzalo.aranda@dti.uhu.es