Your SlideShare is downloading. ×
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
2011 sma-slides-02
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

2011 sma-slides-02

130

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
130
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Agentes y Sistemas Multi-Agentes Arquitecturas y Programas Agente Dr. Alejandro Guerra-Hern´ndez a Departamento de Inteligencia Artificial Facultad de F´ısica e Inteligencia Artificial Universidad Veracruzana aguerra@uv.mx http://www.uv.mx/aguerra Maestr´ en Inteligencia Artificial 2011 ıa
  • 2. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasArquitectura abstracta (Wooldridge, 2002) El ambiente puede caracterizarse por medio de un conjunto finito de estados discretos posibles, definido como: E = {e, e , . . . } La aptitud de un agente, se define como el conjunto finito de acciones que ´ste puede ejecutar: e Ac = {α, α , . . . } Una corrida de un agente en un ambiente se define como una secuencia finita de estados y acciones intercalados: 0 α1 2 3α α α αu−1 r = e0 −→ e1 −→ e2 −→ e3 −→ · · · −→ eu
  • 3. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasCorridas Sea R el conjunto de todas las posibles secuencias finitas sobre E y Ac. Definimos R Ac como el subconjunto de las corridas que terminan en una acci´n o y R E como el subconjunto de las corridas que terminan en un estado del ambiente. Para modelar el efecto de una acci´n en el ambiente, usamos o una funci´n de transici´n (Fagin et al., 1995): o o τ : R Ac → ℘(E ) Si τ (r ) = ∅ para todo r ∈ R Ac , se dice que el sistema ha terminado su corrida.
  • 4. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasAmbiente y Agentes Un ambiente se define como una tripleta Env = E , e0 , τ donde E es el conjunto de los posibles estados del ambiente, e0 ∈ E es un estado inicial y τ es la funci´n de transici´n de o o estados. Los agentes se modelan como funciones que mapean corridas que terminan en un estado del ambiente, a acciones: Ag : R E → Ac
  • 5. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasSistema Agente Un sistema agente es una tupla conformada por un agente y un ambiente. El conjunto de posibles corridas del agente Ag en el ambiente Env se denota como R(Ag , Env ) Una secuencia de la forma: (e0 , α0 , e1 , α1 , e2 , . . . ) representa una corrida del agente Ag en el ambiente Env si y s´lo si o Env = E , e0 , τ ; α0 = Ag (e0 ); y para u > 0: eu ∈ τ ((e0 , α0 , . . . , αu−1 )) y αu = Ag ((e0 , α0 , . . . , eu ))
  • 6. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasPrograma de agente Puesto que nuestra tarea es implementar programas de agente, podemos usar la formalizaci´n propuesta para definir o un programa de agente que acepte percepciones de su ambiente y regrese acciones sobre ´ste. e Agente basado en mapeo ideal 1: function Agente-Mapeo-Ideal(p) p es una percepci´n. o 2: percepciones ← percepciones ∪ p 3: acci o n ← busca(percepciones, mapeo) ´ mapeo predefinido. 4: return acci o n ´ 5: end function
  • 7. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasPrograma de ambiente Un programa b´sico de ambiente ilustra la relaci´n entre ´ste a o e y los agentes situados en ´l. e Ambiente 1: procedure Ambiente(e, τ, ags, fin) e Estado incial del ambiente. 2: repeat 3: for all ag ∈ ags do ags Conjunto de agentes. 4: p(ag ) ← percibir (ag , e) 5: end for 6: for all ag ∈ ags do 7: acci o n(ag ) ← ag (p(ag )) ´ 8: end for 9: e ← τ ( ag ∈ags acci o n(ag )) ´ τ Funci´n de transici´n. o o 10: until fin(e) fin Predicado de fin de corrida. 11: end procedure
  • 8. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasPercepci´n y acci´n o o Sea Per un conjunto no vac´ de percepciones, la funci´n ıo o percibir/2 se define como el mapeo del conjunto de estados del ambiente E al conjunto de percepciones posibles Per : percibir : E → Per La funci´n acci´n/1 se define entonces como el mapeo entre o o conjuntos de percepciones y el conjunto de acciones posibles del agente: acci o n : Per → Ac ´ Un agente puede definirse ahora como la tupla: Ag = percibir , acci o n ´
  • 9. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasPropiedades de la percepci´n o Sean e ∈ E y e ∈ E , tal que e = e pero percibir (e) = percibir (e ). Desde el punto de vista del agente, e y e son indistinguibles. Dados dos estados del ambiente e, e ∈ E , percibir (e) = percibir (e ) ser´ denotado como e ∼ e . a El ambiente es accesible para el agente, si y s´lo si |E | = | ∼ | o y entonces se dice que el agente es omnisciente. Si | ∼ | = 1 entonces se dice que el agente no tiene capacidad de percepci´n, es decir, el ambiente es percibido por el agente o como si tuviera un estado unico. ´
  • 10. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasAgentes reactivos Los agentes reactivos, o reflex, seleccionan sus acciones basados en su percepci´n actual del ambiente, ignorando el o resto de su historia perceptual. Agente percepción acción sensado actuación Ambiente
  • 11. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasAgentes reactivos Basados en reglas percepci´n - acci´n. o o Programa de agente reactivo 1: function Agente-Reactivo(e) 2: estado ← percibir (e) 3: regla ← selecci o nAcci o n(estado, reglas) ´ ´ reglas predefinidas. 4: acci o n ← acci o nRegla(regla) ´ ´ 5: return acci o n ´ 6: end function
  • 12. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasLimitaciones de los agentes reactivos Aunque hay otras maneras de implementar agentes reactivos (arquitectura subsumida, redes de comportamiento, etc.), todos comparten una limitaci´n formal: producen un o comportamiento racional, s´lo si la decisi´n correcta puede o o obtenerse a partir de la percepci´n actual del agente. o Esto es, su comportamiento es correcto si, y s´lo si, el o ambiente es observable o efectivamente observable.
  • 13. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasEstado interno La forma m´s eficiente de enfrentar un ambiente inaccesible a es llevando un registro de lo percibido, de forma que el agente tenga acceso mediante este registro, a lo que en cierto momento ya no puede percibir. Sea I el conjunto de estados internos posibles de un agente. Redefinimos la funci´n acci´n para mapear estados internos a o o acciones posibles: acci o n : I → Ac ´ Una nueva funci´n siguiente/2, mapea estados internos y o percepciones a estados internos. Se usa para actualizar el estado interno del agente: siguiente : I × Per → I
  • 14. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasAgentes con estado interno Un agente con estado interno interactua con su ambiente como se muestra. Ambiente actuación sensado Agente percepción acción Siguiente Estado
  • 15. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasPrograma de agente con estado El programa de un agente con estado es muy parecido al de un agente reactivo: Programa de agente con estado 1: function Agente-Con-Estado(e) e∈E 2: p ← percibir (e) 3: estado ← siguiente(estado, p) 4: regla ← selecci o nAcci o n(estado, reglas) ´ ´ reglas predefinidas. 5: acci o n ← Acci o nRegla(regla) ´ ´ 6: return acci o n ´ 7: end function
  • 16. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasEnfoque IA tradicional El comportamiento racional puede obtenerse a partir de una representaci´n simb´lica del ambiente y el comportamiento o o deseado. El agente manipular´ sint´cticamente esta representaci´n para a a o actuar. Llevada al extremo, esta aproximaci´n nos lleva a formular el o estado de un agente como un conjunto f´rmulas l´gicas y la o o selecci´n de acci´n como demostraci´n de teoremas o o o o deducci´n l´gica. o o
  • 17. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasAgentes e inferencia Sea L el conjunto de f´rmulas bien formadas en la l´gica de o o primer orden cl´sica. a El conjunto de bases de conocimiento en L se define como D = ℘(L), es decir, el conjunto de conjuntos de fbf en L. Los elementos de D se denotan ∆, ∆1 , . . . El estado interno del agente es siempre un miembro de D. El proceso de decisi´n del agente especifica mediante un o conjunto de reglas de inferencia ρ. Escribimos ∆ ρ ψ si la fbf ψ puede ser validada en ∆. Definimos la funci´n siguiente/2 del agente como: o siguiente : D × Per → D
  • 18. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasSelecci´n de acci´n como inferencia o o La inferencia se usa para computar la selecci´n de acci´n de o o los agentes l´gicos: o Selecci´n de acci´n para agente l´gico o o o 1: function Seleccion-Accion(∆ : D, Ac) ´ ´ Ac Acciones. 2: for all a ∈ Ac do 3: if ∆ ρ ejecuta(a) then ρ predefinida. 4: return a 5: end if 6: end for 7: for all a ∈ Ac do 8: if ∆ ρ ¬ejecuta(a) then 9: return a 10: end if 11: end for 12: return null 13: end function
  • 19. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasMetas Las metas describen situaciones deseables para un agente, y se definen como cuerpos de conocimiento. Esta concepci´n de las metas est´ relacionada con el concepto o a de espacio de estados de un problema compuesto por un estado inicial del ambiente, e0 ∈ E ; por un conjunto de operadores o acciones que el agente puede ejecutar para cambiar de estado; y un espacio de estados deseables. Impl´ıcita en la arquitectura del agente, est´ su “intenci´n” de a o ejecutar las acciones que el “cree” le garantizan satisfacer cualquiera de sus metas. Esto se conoce en filosof´ como ıa silogismo pr´ctico. a
  • 20. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasLas metas de un agente Especificaci´n basada en predicados: o Ψ : R → {0, 1} Una corrida r ∈ R satisface la especificaci´n ssi Ψ(r ) = 1. o Un ambiente de tareas se define entonces como el par Env , Ψ . Dado un ambiente de tareas, la siguiente expresi´n: o RΨ (Ag , Env ) = {r |r ∈ R(Ag , Env ) ∧ Ψ(r )} denota el conjunto de todas las corridas del agente Ag en el ambiente Env que satisfacen la tarea especificada por Ψ.
  • 21. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasMetas y ´xito e Podemos expresar que un agente Ag tiene ´xito en el e ambiente de tareas Env , Ψ de dos maneras diferentes: ∀r ∈ R(Ag , Env ) tenemos que Ψ(r ), lo que puede verse como una especificaci´n pesimista de ´xito, puesto que el agente o e tiene ´xito unicamente si todas sus corridas satisfacen Ψ; e ´ ∃r ∈ R(Ag , Env ) tal que Ψ(r ), lo cual es una versi´n optimista o de la definici´n de ´xito, puesto que especifica que el agente o e tiene ´xito si al menos una de sus corridas safisface Ψ. e
  • 22. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasUtilidad Una utilidad es un valor num´rico que denota la bondad de un e estado del ambiente. Impl´ ıcitamente, un agente tiene la “intenci´n” de alcanzar o aquellos estados que maximizan su utilidad a largo t´rmino. e La especificaci´n de una tarea en este enfoque corresponde o simplemente a una funci´n utilidad u : E → la cual asocia o valores reales a cada estado del ambiente. Por ejemplo, la utilidad para una corrida r de un agente filtro de spam, puede definirse como: SpamFiltrado(r ) u(r ) = SpamRecibido(r )
  • 23. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasAgentes ´ptimos o Si la funci´n de utilidad u tiene alg´n l´ o u ımite superior, por ej., ∃k k ∈ tal que ∀r ∈ R.u(r ) ≤ k, entonces es posible hablar de agentes que maximizan la utilidad esperada. Definamos P(r |Ag , Env ), es evidente que: P(r |Ag , Env ) = 1 r ∈R(Ag ,Env ) Entonces el agente ´ptimo Agopt entre el conjunto de agentes o posibles AG en el ambiente Env est´ definido como: a Agopt = arg m´x a u(r )P(r |Ag , Env ) Ag ∈AG r ∈R(Ag ,Env )
  • 24. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasRacionalidad acotada Los agentes enfrentan limitaciones temporales y tienen capacidades limitadas de deliberaci´n, por lo que propone el o estudio de una racionalidad acotada. Stuart Russell et al., introducen el concepto de agente ´ptimo o acotado, donde AGm representa el conjunto de agentes que pueden ser implementados en una m´quina m. a Esta conceptualizaci´n de agente racional nos dice las o propiedades del agente deseable Agopt , pero no nos dice c´mo o implementar tal agente.
  • 25. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad ReferenciasReferencias Fagin, R., Halpern, J. Y., Moses, Y., & Vardi, M. Y. (1995). Reasoning about Knowledge. Cambridge, MA., USA: MIT Press. Wooldridge, M. (2002). An Introduction to MultiAgent Systems. West Sussex, England: John Wiley & Sons, LTD.

×