Your SlideShare is downloading. ×
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Ec.pdf
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Ec.pdf

2,320

Published on

Ec

Ec

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
2,320
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
9
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Ingenier´ del Conocimiento ıa Departamento de Computaci´n o Curso 2002-2003 Alumna: Laura M. Castro Souto Profesoras: Amparo Alonso Betanzos Bertha Guijarro Berdi˜as n
  • 2. ´Indice general1. La Ingenier´ del Conocimiento ıa 1 1.1. El conocimiento y su contexto . . . . . . . . . . . . . . . . . . . . . . . 1 1.2. La ingenier´ del conocimiento . . . . . . . . . . . . . . . . . . . . . . . ıa 2 1.3. Los sistemas basados en el conocimiento . . . . . . . . . . . . . . . . . 32. Metodolog´ para la construcci´n de SSBBC ıas o 5 2.1. Diferencias entre la IS y la IC . . . . . . . . . . . . . . . . . . . . . . . 5 2.2. Metodolog´ adaptadas de la IS . . . . . . . . ıas . . . . . . . . . . . . . . 7 2.2.1. Metodolog´ de prototipado r´pido . . ıa a . . . . . . . . . . . . . . 7 2.2.2. Metodolog´ de desarrollo incremental ıas . . . . . . . . . . . . . . 8 2.2.3. Metodolog´ en cascada . . . . . . . . ıas . . . . . . . . . . . . . . 8 2.2.4. Metodolog´ en espiral . . . . . . . . . ıas . . . . . . . . . . . . . . 8 2.3. Metodolog´ CommonKADS . . . . . . . . . . ıa . . . . . . . . . . . . . . 10 2.3.1. Nivel de Contexto: ¿Por qu´? . . . . . e . . . . . . . . . . . . . . 10 2.3.2. Nivel de Concepto: ¿Qu´? . . . . . . . e . . . . . . . . . . . . . . 12 2.3.3. Nivel de Implementaci´n: ¿C´mo? . . . o o . . . . . . . . . . . . . . 123. Modelado del contexto en CommonKADS 13 3.1. El Proceso de Modelado del Contexto . . . . . . . . . . . . . . . . . . . 14 3.1.1. El modelo de Organizaci´n . . . . . o . . . . . . . . . . . . . . . . 15 3.1.2. El modelo de las Tareas . . . . . . . . . . . . . . . . . . . . . . 16 3.1.3. El modelo de los Agentes . . . . . . . . . . . . . . . . . . . . . . 164. Descripci´n conceptual del conocimiento en CommonKADS o 17 4.1. El modelo del Conocimiento . . . . . . . . . . . . . . . . . . . . . . . . 17 4.1.1. Conocimiento del dominio . . . . . . . . . . . . . . . . . . . . . 20 4.1.2. Conocimiento inferencial . . . . . . . . . . . . . . . . . . . . . . 23 4.1.3. Conocimiento de la tarea . . . . . . . . . . . . . . . . . . . . . . 26 4.1.4. ¿Inferencia o Tarea? . . . . . . . . . . . . . . . . . . . . . . . . 28 4.1.5. Modelo de Datos (IS) vs. Modelo de Conocimiento (IC) . . . . . 28 4.2. Plantillas de modelos de Conocimiento. Elementos reutilizables . . . . . 29 4.2.1. Tipos de Tareas . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 4.3. Construcci´n de los modelos de Conocimiento . . . . . . . . . . o . . . . 30 4.3.1. Identificaci´n del Conocimiento . . . . . . . . . . . . . . o . . . . 31 4.3.2. Especificaci´n del Conocimiento . . . . . . . . . . . . . . o . . . . 31 i
  • 3. ii 4.3.3. Refinado del Conocimiento . . . . . . . . . . . . . . . . . . . . . 33 4.3.4. Documentaci´n del modelo de Conocimiento o . . . . . . . . . . . 34 4.4. El modelo de Comunicaci´n . . . . . . . . . . . . . o . . . . . . . . . . . 34 4.4.1. Plan de Comunicaci´n . . . . . . . . . . . . o . . . . . . . . . . . 36 4.4.2. Transaciones agente-agente . . . . . . . . . . . . . . . . . . . . . 36 4.4.3. Patrones transaccionales . . . . . . . . . . . . . . . . . . . . . . 38 4.4.4. T´cnicas de validaci´n . . . . . . . . . . . . e o . . . . . . . . . . . 395. El modelo de Dise˜ o en CommonKADS n 41 5.1. Principio de Conservaci´n de la Estructura . . . . . . . . . . . . . . . . o 42 5.2. El modelo de Dise˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . n 42 5.2.1. Dise˜o de la arquitectura del sistema . . . . . . . . . . . . . . . n 43 5.2.2. Identificaci´n de la plataforma de implementaci´n . . . . . . . . o o 45 5.2.3. Especificaci´n de los componentes de la arquitectura . . . . . . o 46 5.2.4. Especificaci´n de la aplicaci´n en el contexto de la arquitectura o o 48 5.3. Dise˜o de prototipos . . . . . . . . . . . . . . . . . . . . . . . . . . . . n 48 5.3.1. Prototipado de subsistemas de razonamiento . . . . . . . . . . . 48 5.3.2. Prototipado de interfaces de usuario . . . . . . . . . . . . . . . . 49 5.4. SBCs distribuidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 496. T´cnicas para la adquisici´n del conocimiento e o 51 6.1. Escenarios de adquisici´n del conocimiento . . . . . . . . . . o . . . . . . 51 6.2. Las entrevistas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 6.2.1. Entrevistas m´ltiples . . . . . . . . . . . . . . . . . . u . . . . . . 58 6.3. El an´lisis de protocolos . . . . . . . . . . . . . . . . . . . . a . . . . . . 59 6.4. Cuestionarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 6.5. An´lisis del movimiento de ojos . . . . . . . . . . . . . . . . a . . . . . . 61 6.6. M´todo de observaci´n directa . . . . . . . . . . . . . . . . . e o . . . . . . 62 6.7. Extracci´n de curvas cerradas . . . . . . . . . . . . . . . . . o . . . . . . 62 6.8. Las t´cnicas de escalamiento psicol´gico . . . . . . . . . . . e o . . . . . . 62 6.8.1. Escalamiento multidimensional (EDM ) . . . . . . . . . . . . . . 63 6.8.2. An´lisis de clusters (Clustering) . . . . . . . . . . . . a . . . . . . 65 6.8.3. Redes ponderadas (Pathfinder ) . . . . . . . . . . . . . . . . . . 68 6.9. La teor´ de constructos personalizados: el Emparrillado . . ıa . . . . . . 69 6.9.1. Identificaci´n de elementos Ei . . . . . . . . . . . . . o . . . . . . 70 6.9.2. Identificaci´n de caracter´ o ısticas cj . . . . . . . . . . . . . . . . . 71 6.9.3. Dise˜o de la parrilla . . . . . . . . . . . . . . . . . . n . . . . . . 71 6.9.4. Formalizaci´n . . . . . . . . . . . . . . . . . . . . . . o . . . . . . 72 6.9.5. An´lisis y estudio de los resultados obtenidos . . . . a . . . . . . 74 6.10. T´cnicas especiales de adquisici´n de conocimiento en grupo e o . . . . . . 77 6.10.1. Tormenta de ideas (Brainstorming) . . . . . . . . . . . . . . . . 77 6.10.2. T´cnica nominal de grupo . . . . . . . . . . . . . . . e . . . . . . 77 6.10.3. M´todo Delphi . . . . . . . . . . . . . . . . . . . . . e . . . . . . 77Laura Castro
  • 4. iii7. Evaluaci´n de los sistemas basados en conocimiento o 79 7.1. Verificaci´n y validaci´n . . . . . . . . . . . . . . . . . . . . . . . . . . o o 82 7.1.1. Sistemas de verificaci´n autom´tica . . . . . . . . . . . . . . . . o a 82 7.1.2. Validaci´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o 84Ap´ndices e 86A. Ampliaciones 87 A.1. Figuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87Bibliograf´ ıa 93 Ingenier´ del Conocimiento ıa
  • 5. Cap´ ıtulo 1La Ingenier´ del Conocimiento ıa En este primer tema estableceremos algunos conceptos b´sicos relacionados con la aasignatura que nos ocupa.1.1. El conocimiento y su contexto ¿Qu´ es el conocimiento? Es dif´ de concretar, pero podemos sin embargo distin- e ıcilguir claramente que no es lo mismo que un dato ni tampoco es el mismo concepto queel de informaci´n. o Podemos decir que: Dato Conjunto de se˜ales, s´ n ımbolos, signos, que llegan a nuestros sentidos, sin que tengan que tener significado propio. Informaci´n Datos que se agrupan y adquieren un significado que no va o impl´ ıcito en ellos, sino que se aprende a manejar. Conocimiento Conjunto de datos e informaci´n que adem´s tiene senti- o a do del prop´sito (sirve para algo) y capacidad de generar nuevo o conocimiento e informaci´n (e incluso acciones). o Caracter´ ıstica Ejemplo Datos Sin interpretar ...-... Informaci´n o A˜ade significado n S.O.S. Conocimiento Prop´sito y capacidad o Alerta, emergencia, de generaci´n o comenzar un rescate Cuadro 1.1: Diferencias entre dato, informaci´n y conocimiento o La definici´n de lo que es conocimiento se hace m´s dif´ a´n si consideramos o a ıcil uque puede depender del contexto. Obviamente, un f´ ısico y un ajedrecista no tendr´n la amisma concepci´n de lo que es conocimiento referente a sus respectivas actividades. o 1
  • 6. 2 Apuntes – 1. La Ingenier´ del Conocimiento ıa En el caso de la Ingenier´ del Conocimiento1 , esta situaci´n se agrava, puesto que ıa osu aplicaci´n se realiza en dominios muy concretos y diferentes (lo “normal” es distinto oen cada caso, por ejemplo, para diversos pacientes en un hospital). A veces se define el conocimiento como “informaci´n sobre la informaci´n”, puesto o oque hay que tener cierta informaci´n sobre la informaci´n que se va a manejar para o opoder usarla adecuadamente. La representaci´n expl´ o ıcita del conocimiento es clave para distinguir entre sistemassoftware cl´sicos y sistemas software basados en conocimiento. a Como ya hemos estudiado con anterioridad (ver [2]), se pueden establecer categor´ ıasen el conocimiento barajado, en relaci´n al origen y procedencia del mismo con respecto oal experto de quien lo extraemos: Conocimiento p´ blico, que puede obtenerse directamente a partir u de fuentes t´ ıpicas (manuales, libros), com´nmente aceptado y univer- u salmente reconocido. Conocimiento semip´ blico, expl´ u ıcito pero no universalmente reco- nocido ni com´nmente aceptado, utilizado casi de forma exclusiva por u los especialistas del ´rea concreta. a Conocimiento privado, no expl´ ıcito, no universalmente reconocido ni com´nmente aceptado, de marcado car´cter heur´ u a ıstico, end´geno o de cada uno, fruto de la propia experiencia. Un sistema de conocimiento pretende familiarizarse con el conocimiento p´blico, uimplementar el semip´blico y extraer el privado. u1.2. La ingenier´ del conocimiento ıa Denominamos ingenier´a del conocimiento al conjunto de conocimientos y t´cnicas ı eque permiten aplicar el saber cient´ ıfico a la utilizaci´n del conocimiento, entendiendo o“conocimiento” como inteligencia o raz´n natural. o Partiendo de la siguiente definici´n de ingenier´ del software 2 (IEEE-99): o ıa La IS es la aplicaci´n de una aproximaci´n sistem´tica, disciplinada y cuan- o o a tificable, al desarrollo, funcionamiento y mantenimiento del software (apli- caciones) podemos adaptarla a la IC y decir, asimismo, que la IC es la aplicaci´n de una oaproximaci´n sistem´tica, disciplinada y cuantificable, al desarrollo, funcionamiento y o amantenimiento del conocimiento (en aplicaciones, software). 1 En adelante, IC. 2 En adelante, IS.Laura Castro
  • 7. 1.3. Los sistemas basados en el conocimiento 3 Es por ello que muchas de las metodolog´ utilizadas en el campo de la IS se han ıasadaptado a la IC, y que tambi´n muchos de los problemas que aparecen en una se ereproducen en la otra tambi´n. La mayor´ de ellos, como veremos en el tema corres- e ıapondiente, se deben con frecuencia a la especificaci´n d´bil de requisitos, a la presencia o ede entradas inconsistentes, etc. que dan lugar a dise˜os no limpios. n Resumiendo, podemos definir la ingenier´a del conocimiento como el conjunto de ıprincipios, m´todos, t´cnicas y herramientas que permiten la construcci´n de sistemas e e ocomputacionales inteligentes.1.3. Los sistemas basados en el conocimiento Entendemos por sistema basado en conocimiento 3 un sistema computerizado (soft-ware) que utiliza y representa expl´ ıcitamente conocimiento sobre un dominio con-creto para realizar una tarea que requerir´ un experto (de ser realizada por un hu- ıamano), es decir, que es capaz de exportar ese conocimiento a trav´s de los mecanismos eapropiados de razonamiento para proporcionar un comportamiento de alto nivel en laresoluci´n de problemas en ese dominio (Guida & Tasso). o Las dos caracter´ ısticas clave, tal y como se ha se˜alado, son: n la representaci´n expl´ o ıcita del conocimiento, algo que diferencia a los SBC de los sistemas software que se construyen en IS un dominio concreto, algo que los particulariza y diferencia de los sistemas de IA A partir de la IA, surgieron una serie de ramas: la rob´tica, los sistemas conexionis- otas, los sistemas expertos,. . . Estos ultimos fueron uno de los logros m´s importantes, ´ aporque fueron los primeros en enfrentarse a problemas reales utilizando conocimientoespec´ıfico de peque˜os dominios. No obstante, en los a˜os 60 se produjo un retroceso n nen su desarrollo debido al aumento de la complejidad de los problemas que se pretend´ ıaabordar. A˜os m´s tarde, surgir´ la IC. n a ıa Los beneficios m´s importantes que aportan los SBCs son: a Mayor rapidez en la toma de decisiones Mayor calidad en la toma de decisiones Mayor productividad El desarrollo de un SBC es caro para la empresa: se necesita contratar al menosun ingeniero de conocimiento, se va a consumir tiempo del experto. . . Si todo ello secompensa es por estas ventajas competitivas que acabamos de mencionar. 3 A partir de ahora, SBC. Ingenier´ del Conocimiento ıa
  • 8. 4 Apuntes – 1. La Ingenier´ del Conocimiento ıa Hay varios conceptos que ayudan a distinguir los SBC de software m´s convencional ay tambi´n de programas de inteligencia artificial: e √ La naturaleza m´s bien heur´ a ıstica del conocimiento que contienen (IA, a˜os 50-60). n √ La naturaleza altamente espec´ ıfica del conocimiento (Dendral, 1970). √ La separaci´n del conocimiento de c´mo se usa —control— (General o o Problem Solver de McCarthy, 1963; Mycin, 1976). BASE de CONOCIMIENTOS Memoria Activa −Declarativos MOTOR DE −Operativos o de Accion INFERENCIAS −Metaconocimiento explicaciones hechos y datos y consejos especificos INTERFAZ DE COMUNICACION, EXPLICACION Y ADQUISICION DE CONOCIMIENTO SUBSISTEMA SUBSISTEMA DE SUBSISTEMA DE ADQUISICION DE USUARIO EXPLICACION DE CONOCIMIENTO Ingeniero de Usuario Conocimiento Figura 1.1: Esquema de un SBC.Laura Castro
  • 9. Cap´ ıtulo 2Metodolog´ para la construcci´n ıas ode SSBBC El ingeniero de conocimiento debe: √ elicitar √ estructurar √ formalizar √ operacionalizar toda la informaci´n y el conocimiento que est´n relacionados con el dominio. Esta o e ´no es una tarea trivial, porque el conocimiento no es algo que se pueda observar, lainformaci´n procede a menudo de diversas fuentes, se presenta en diferentes formatos, opuede incluso ser a veces contradictoria. Es necesario organizar de alguna manera eltrabajo a realizar. Adem´s, el conocimiento no es s´lo algo dif´ de extraer, sino tambi´n un recurso a o ıcil ecaro; por ello en los ultimos tiempos ha surgido la idea de reutilizaci´n del conocimiento. ´ o2.1. Diferencias entre la IS y la IC Los ingenieros de conocimiento y los ingenieros de software estuvieron enfrentadosdurante mucho tiempo, hasta que se dieron cuenta de no hab´ motivo para la con- ıafrontaci´n, pues la IS no incluye a los sistemas de IC, ´sta desarrolla su software en o eproblemas mal estructurados o mal definidos que no son tratables en IS. En IS el cliente pide lo que quiere; en IC se hacen modelos computacionales deun ´mbito concreto, se hace un an´lisis exhaustivo de la organizaci´n donde vamos a a a oaplicar nuestro modelo. Las especificaciones de requisitos en IS son completas antes de empezar; en IC estoes casi imposible. En IC es muy importante la adquisici´n del conocimiento, que adem´s es continua, o aes el cuello de botella de todos los sistemas; en IS se adquiere todo lo que se necesitapara funcionar. 5
  • 10. 6 Apuntes – 2. Metodolog´ para la construcci´n de SSBBC ıas o PROBLEMAPROBLEMA DOMINIO DE APLICACION ANALISIS DEL PROBLEMA Y DEL DOMINIO METODOS DE SOLUCION CONOCIMIENTO DEL DOMINIO E S P ECI F I CACIONES MODELADO DE DISEÑO DE LA CONOCIMIENTO ARQUITECTURA (o desarrollo del sistema vacio) DISEÑO MODULAR ADQUISICION DE CONOCIMIENTO CONSTRUCCION BC CODIFICACION Y COMPROBACION DE PROTOTIPO CADA MODULO COMPROBACION Y EVALUACION ENSAMBLADO DE MODULOS Y COMPROBACION DEL SISTEMA GLOBAL CONSTRUCCION DEL SISTEMA META SISTEMA SOFTWARE SISTEMA BASADO TRADICIONAL EN CONOCIMIENTO Figura 2.1: IS vs. IC.Laura Castro
  • 11. 2.2. Metodolog´ adaptadas de la IS ıas 7 En IC no se trabaja con lenguajes, sino con herramientas, ya que se ha conseguidoque el control, el manejo del conocimiento sea gen´rico (i.e. motores de inferencias). e2.2. Metodolog´ adaptadas de la IS ıas En esta secci´n revisaremos superficialmente algunas de las metodolog´ que la IC o ıasha “heredado” de la IS.2.2.1. Metodolog´ de prototipado r´pido ıa a Esta metodolog´ consiste en adquirir conocimientos y codificar hasta considerar ıaque tenemos un modelo lo suficientemente bueno. Tras una serie de entrevistas con los clientes, usuarios y/o expertos, se intenta versi el dominio puede: ◦ tener una parte “central” de la que puedan colgarse las dem´s poste- a riormente ◦ tener varias partes que se puedan tratar inicialmente por separado y comenzar con una de ellas Si el contexto es favorable, se desarrolla un prototipo r´pido para mostrar al experto, aque se ir´ refinando y ampliando. a Las ventajas de esta metodolog´ residen en que la rapidez en el desarrollo de ıauna primera versi´n del sistema motiva al experto (pronto se ve algo operativo), y oadem´s ayuda a centrar el desarrollo del conocimiento adem´s de no requerir demasiada a aexperiencia. No obstante, desde el punto de vista de la IC son m´s importantes las adesventajas que se presentan: dificulta la recogida de requisitos se sustituye el estudio de especificaciones y el dise˜o por la codificaci´n n o r´pida, lo que origina debilidades a el crecimiento incontrolado complica la BC las interacciones no contempladas entre distintas partes o m´dulos del o sistema son fuente de muchos problemas, el modelo crece distorsionado el c´digo resulta generalmente muy poco y mal estructurado o no se produce un an´lisis completo de requisitos a no hay una buena documentaci´n (o ´sta es nula) o e el mantenimiento es pr´cticamente imposible a Esta metodolog´ descuida todo lo que no tiene que ver directamente con el core ıadel conocimiento (desarrollo de una IU, comunicaci´n con otro software,. . . ), con todo olo que ello conlleva. Ingenier´ del Conocimiento ıa
  • 12. 8 Apuntes – 2. Metodolog´ para la construcci´n de SSBBC ıas o2.2.2. Metodolog´ de desarrollo incremental ıas Ante el desbordamiento de la metodolog´ de prototipado r´pido, se volvi´ la vista a ıa a ola IS y una de las primeras metodolog´ que se adopt´ fue la de desarrollo incremental. ıas o Analisis formalizar objetivos Especificaciones formalizar objetivos Ajustes del diseño Diseño prototipos codificacion inicial Implementacion Prototipo inicial Prueba (V&V) Evaluacion Mantenimiento Diseño inicial Figura 2.2: Esquema de la metodolog´ de desarrollo incremental. ıa Aunque por incremental es m´s ordenada (manteniendo a la par algunas de las aventajas del prototipado r´pido, como la pronta obtenci´n de un sistema y una buena a ocomunicaci´n con los expertos), esta metodolog´ gira, no obstante, en torno a la imple- o ıamentaci´n y aunque logr´ organizar un poco m´s los sistemas, no centraba tampoco la o o aatenci´n en la captura de requisitos y especificaciones, que ser´ m´s adecuado para un o ıa asistema basado en conocimiento, a la par que no dejaba lugar para una etapa ulteriorde mantenimiento preceptivo.2.2.3. Metodolog´ en cascada ıas Tambi´n adaptada de la IS, esta metodolog´ trata de ajustar el alcance de la itera- e ıaci´n de desarrollo, que resultaba problem´tico en el caso anterior (ver figura 2.3, p´gina o a a11). A pesar de conseguir reducir los errores al analizar m´s el modelo, el mantenimiento asigue siendo demasiado complejo para un sistema basado en conocimiento.2.2.4. Metodolog´ en espiral ıas De los modelos planos se pas´ al modelo en espiral, que aporta un interesante oan´lisis de riesgos, adem´s e plantear las iteraciones como capas en lugar de como a abloques cerrados. Si bien en IS no se utiliza demasiado porque resulta muy pesado, en IC iba a resolverm´ltiples cuestiones: los prototipos sucesivos se van refinando y ampliando, se pueden ua˜adir especificaciones en cada vuelta hasta llegar a concretar finalmente el elemento nLaura Castro
  • 13. 2.2. Metodolog´ adaptadas de la IS ıas 9de test. Permite situar el mantenimiento en un nivel adecuado gracias al mencionadoan´lisis de riesgos. Cada fase ayuda a completar la anterior, en lugar de s´lo sumar, a oque era m´s el enfoque de metodolog´ anteriores, sin que se alteren los fundamentos a ıasanteriores. Fue, pues, uno de los modelos que mejor funcion´, aunque no es demasiado bueno al odesarrollar SBC m´s grandes. No obstante, a´n quedaban dos cuestiones por solucionar: a u ∗ la adquisici´n del conocimiento segu´ siendo el cuello de botella o ıa ∗ la capacidad de explicaci´n no estaba realmente presente, ya que co- o nocimiento y motivos iban juntos, indivisiblemente Debido a esto, los propios SBC no ten´ conciencia de sus l´ ıan ımites. Se necesitabauna metodolog´ que estructurase el conocimiento de una forma m´s adecuada, al ıa afin y al cabo, la verdadera diferencia entre IS e IC es el tratamiento, el manejo delconocimiento. Todas las metodolog´ empleadas hasta el momento lo encuadraban ıasen un lugar o en otro, trat´ndolo sin darle un nivel espec´ a ıfico como es imperativo.Como consecuencia de estos problemas, los SBC eran por a˜adidura muy dif´ n ıciles demantener, con fases de validaci´n muy extensas. o Fue primero Newell el que dio la voz de alarma indicando la necesidad de tratarel conocimiento como algo especial, reflexionando sobre lo que hay que representar yc´mo se quiere hacerlo, y posteriormente McDermott con su teor´ sobre las “Tareas o ıagen´ricas” seg´n la que la adquisici´n del conocimiento sigue siempre unos pasos repe- e u otitivos, los que impulsar´ el desarrollo de metodolog´ propias de la IC (con ra´ ıan ıas ıces,claro est´, en las que acabamos de ver). De entre ellas, estudiaremos la metodolog´ a ıaCommonKADS.Newell. El nivel de conocimiento El mayor problema detectado hasta el momento es la no-diferenciaci´n de lo que oes conocimiento de la representaci´n del mismo. La soluci´n pasa por a˜adir el Nivel o o nde Conocimiento, que est´ por encima del nivel simb´lico. En este nivel el sistema se a ocomporta como un agente que tiene tres vistas: componentes ≡ objetivos acciones cuerpo (conocimientos sobre objetos y acciones) El medio sobre el que act´a es el conocimiento: el agente toma el conocimiento, lo uprocesa y realiza acciones para conseguir objetivos. Esto permiti´ tambi´n abordar las o eprimeras ideas sobre reutilizaci´n del conocimiento: abstraer las tareas gen´ricas para o evolver a utilizarlas en sistemas similares. Una metodolog´ que usa el nivel de conocimiento es KLIC (KBS Life Cycle). ıa Ingenier´ del Conocimiento ıa
  • 14. 10 Apuntes – 2. Metodolog´ para la construcci´n de SSBBC ıas oMcDermott. M´todos de limitaci´n de roles e o Los estudios de McDermott constituyeron los primeros intentos para reutilizar elm´todo de resoluci´n de problemas. e o Todos los sistemas ten´ un motor de inferencias separado del conocimiento hasta ıanese momento. McDermott pens´ que el problema de reutilizar el motor era que parte odel conocimiento de control deb´ ir codificado en la base de conocimiento. As´ a la ıa ı,vez que se met´ conocimiento declarativo nuevo se iba deteriorando el anterior. ıa Para evitarlo, McDermott propuso estudiar los m´todos de resoluci´n de problemas, e odiferenci´ndolos de la base de conocimientos. Como conclusi´n, extrajo que hay familias a ode tareas que se pueden resolver por m´todos cuyo conocimiento de control es abstracto ey se puede aplicar a distintas instanciaciones de esa tarea. Adem´s, permite definir aen qu´ orden hay que adquirir el conocimiento y tambi´n c´mo se implementa (al e e oordenarlo, disminu´ ımos la entrop´ y es m´s f´cil implementarlo). ıa a a2.3. Metodolog´ CommonKADS ıa La metodolog´ CommonKADS (Knowledge Analysis and Documentation Sys- ıatem) es una variaci´n de la metodolog´ en espiral de la IC, desarrollada en Europa o ıaen torno a 1983. Surge de su predecesora, KADS, al serle a˜adido un lenguaje de mo- ndelado conceptual (CML, Conceptual Modell Language), muy parecido a UML, y quefacilita el dise˜o del sistema. n La metodolog´ CommonKADS es, pues, una metodolog´ estructurada que cubre ıa ıala gesti´n del proyecto, el an´lisis de la organizaci´n, la ingenier´ del conocimiento y o a o ıadel software. Plasma tres de las ideas m´s utilizadas en IS e IC (modelado, reutilizaci´n a oy gesti´n del riesgo) y, siendo la unica que utiliza Orientaci´n a Objetos, se organiza o ´ otal y como se puede observar en la figura 2.4 (p´gina 11). a Esta divisi´n en niveles y modelos permite su desarrollo sin que unos sean inter- odependientes de otros, es decir, permite un gran nivel de desacoplamiento. El conoci-miento se encuentra as´ perfectamente estructurado y documentado, pues cada modelo ıposee una serie de plantillas asociadas.2.3.1. Nivel de Contexto: ¿Por qu´? e Los modelos de este nivel analizan los beneficios, el impacto, la utilidad que tendr´ el aSBC que se pretende construir, su viabilidad, etc. Modelo de Organizaci´n Estudia qu´ ´reas de la organizaci´n son m´s o ea o a susceptibles de sacar provecho de un SBC. Es un estudio profundo de la organizaci´n, del impacto y posibles resultados de la implantaci´n o o del SBC, espectativas, predisposici´n,. . . o Modelo de Tareas Ubicadas las tareas m´s importantes, es el momento a de intentar descomponer el/los sistemas en “primitivas” con el fin deLaura Castro
  • 15. 2.3. Metodolog´ CommonKADS ıa 11Analisis del sistema Especificaciones de requisitos Diseño Codificacion Prueba Mantenimiento Figura 2.3: Esquema de la metodolog´ en cascada. ıa Modelo de la Modelo de Modelo deContexto Organizacion Tareas Agentes Modelo de Modelo deConcepto Conocimiento Comunicacion requisitos requisitos sobre funcionalidades interacciones Modelo deImplementacion Diseño Figura 2.4: Niveles de la metodolog´ CommonKADS. ıa Ingenier´ del Conocimiento ıa
  • 16. 12 Apuntes – 2. Metodolog´ para la construcci´n de SSBBC ıas o poder abordarlas m´s f´cilmente, identificar sus entradas y salidas, a a criterios de rendimiento, pre y postcondiciones,. . . Modelo de Agentes Los agentes son los ejecutores de las tareas de la organizaci´n (ya sean personas f´ o ısicas, sistemas de informaci´n, etc.). o Se analiza en este modelo qu´ normas se les aplican, plantillas, funcio- e nes,. . .2.3.2. Nivel de Concepto: ¿Qu´? e Los modelos de este nivel conforman una descripci´n conceptual del conocimiento. o Modelo de Conocimiento Explica en detalle qu´ tipos de conocimiento e e informaci´n tenemos involucrados (naturaleza y estructura). Da una o visi´n de la estructura del conocimiento independiente de la imple- o mentaci´n. o Modelo de Comunicaci´n Disecciona c´mo es la comunicaci´n entre agen- o o o tes involucrados (conceptualmente).2.3.3. Nivel de Implementaci´n: ¿C´mo? o o Este nivel se centra en la manera de llevar a cabo, de realizar de manera concreta, elsistema: mecanismos computacionales, arquitectura, representaci´n del conocimiento om´s adecuada, etc. a Modelo de Dise˜ o Usando fundamentalmente el Modelo de Conocimien- n to y el Modelo de Comunicaci´n, se intentan obtener los requisitos y o restricciones pr´cticas del sistema. aLaura Castro
  • 17. Cap´ ıtulo 3An´lisis de viabilidad e impacto: amodelado del contexto enCommonKADS El conocimiento siempre funciona dentro de una organizaci´n. En este cap´ o ıtulo,entre otras cosas, veremos: √ Por qu´ es necesario modelar el contexto e √ El papel de los modelos: Organizaci´n, Tareas y Agentes o √ Pasos y t´cnicas en el an´lisis del conocimiento orientado a las empre- e a sas y las instituciones √ Casos de ejemploRazones del modelado del contexto A menudo es dif´ identificar el uso rentable de tecnolog´ basadas ıcil ıas en conocimiento. El laboratorio es diferente del “mundo real”. La aceptabilidad de los usuarios es muy importante. Un sistema s´lo puede funcionar de forma adecuada si est´ propia- o a mente integrado a largo plazo en la organizaci´n en la que trabaja. o Un SBC act´a como un agente que coopera con otros, humanos o no, u y lleva a cabo una fracci´n de las tareas de la organizaci´n. o o Un SBC es una herramienta de apoyo dentro del proceso general de la organizaci´n, al igual que cualquier sistema de informaci´n, en general. o o Muchas de estas cuestiones no se ten´ en cuenta en metodolog´ anteriores, lo ıan ıasque supone un gran avance. 13
  • 18. 14 Apuntes – 3. Modelado del contexto en CommonKADS Las metas del modelado del contexto son: Identificar qu´ cuestiones suponen problemas y cu´les no. e a Decidir soluciones y su viabilidad. Mejorar las tareas y el conocimiento relativo a ´stas. e Planificar la necesidad de cambios en la organizaci´n. o El papel de los SBC se rige por una serie de directrices: ◦ Normalmente los SBCs encajan mejor en proyectos de mejora de la organizaci´n, m´s que en la visi´n tradicional de automatizar las tareas o a o del experto. ◦ Las tareas son normalmente demasiado complejas y el proyecto se suele convertir en un fracaso, a ra´ de expectativas poco realistas. ız ◦ Es mejor usar los SBCs como herramientas de mejora de procesos. ◦ El papel t´ ıpico de los SBCs es el de un asistente interactivo inteligente, a diferencia de la mayor´ de los sistemas autom´ticos, que son pasivos. ıa a3.1. El Proceso de Modelado del Contexto Los pasos a seguir son: 1. Llevar a cabo un estudio de alcance y viabilidad. Herramienta: Modelo de Organizaci´n (OM). o 2. Llevar a cabo un estudio de impacto y mejora (para enfocar/am- pliar/refinar el modelo de la organizaci´n). Herramienta: Modelos de o Tareas y de Agentes (TM, AM). Cada estudio consta de una parte de an´lisis y una parte de decisi´n constructiva: a o 1. Estudio del alcance y viabilidad: a) An´lisis.- Se trata de identificar las ´reas problema/oportunidades a a y buscar soluciones potenciales, ubic´ndolos en una perspectiva a m´s amplia en la organizaci´n. a o b) S´ ıntesis.- Se trata de estudiar la viabilidad econ´mica, t´cnica y o e del proyecto, elegir el ´rea (o ´reas) m´s comprometedora y la a a a soluci´n meta. o 2. Estudio de impacto y mejoras (para cada ´rea elegida en el paso an- a terior): a) An´lisis.- Se estudian las interrelaciones entre la tarea, los agentes a involucrados y el uso de conocimiento para un sistema con ´xito, e intentando ver qu´ mejoras se pueden lograr. eLaura Castro
  • 19. 3.1. El Proceso de Modelado del Contexto 15 b) Dise˜o.- Se decide acerca de los cambios en las tareas y las medidas n de la organizaci´n para asegurar su aceptaci´n y la integraci´n de o o o una soluci´n basada en SBC. o Como ya hemos visto en el cap´ ıtulo anterior, el nivel contextual aglutina tres mo-delos: Estudio de alcance y viabilidad • Modelo de la Organizaci´n (OM) para describir y analizar la or- o ganizaci´n en sentido amplio o Estudio de impacto y mejoras • Modelo de Tareas (TM) y Modelo de Agentes (AM), m´s centrados a y detallados, enfocan las partes relevantes • TM: tareas y conocimiento relativo a ellas directamente relacio- nado con el problema a resolver con el SBC • AM: agentes involucrados en las tareas del TM Para simplificar este trabajo se dispone de formularios u hojas de trabajo que ayu-dan en el proceso de modelado: 5 formularios para el OM 2 formularios para el TM 1 formulario para el AM 1 formulario resumen Estas hojas de trabajo funcionan como “checklist” y como archivo de informaci´n, odebiendo ser utilizados de forma flexible.3.1.1. El modelo de Organizaci´n o Veremos ahora c´mo analizar una organizaci´n intensiva en conocimiento: o o ∗ Describir aspectos de la organizaci´n o — carpeta de oportunidades/problemas — contexto de negocio, metas, estrategia — organizaci´n interna o √ estructura √ procesos √ personas (plantilla, roles funcionales,. . . ) √ potencial y cultura √ recursos (conocimiento, sistema de soporte, equipos,. . . ) ∗ Hacer este trabajo para la organizaci´n presente y la futura o ∗ Comparar y tomar las primeras decisiones de qu´ hacer e Ingenier´ del Conocimiento ıa
  • 20. 16 Apuntes – 3. Modelado del contexto en CommonKADS Modelo de Organizacion OM−5 OM−1 OM−2 OM−3 OM−4 Problemas/Oportunidades Descripcion del area elegida Contexto general Estructura Procesos Decomposicion detallada Personal Cultura y potencial Recursos Soluciones potenciales Descripcion a traves de Conocimiento activos de conocimiento Figura 3.1: Modelo de la Organizaci´n. o Se remite a los ap´ndices para detalle de las plantillas correspondientes a cada paso edel an´lisis del Modelo de Organizaci´n. a o Hasta aqu´ es el an´lisis de los aspectos est´ticos de la organizaci´n, los que no se ı, a a osupone que vayan a cambiar.3.1.2. El modelo de las Tareas El modelo de Tareas describe, utilizando tambi´n una serie de plantillas que se eadjuntan en los ap´ndices, las tareas que se determinan componen los procesos de la eorganizaci´n y que fueron esbozadas en algunos apartados referentes al modelo de la oOrganizaci´n. o3.1.3. El modelo de los Agentes Por su parte, el modelo de Agentes detalla el papel, relevancia, conocimiento yotras caracter´ısticas relativas a los agentes que llevan a cabo o participan en las tareasidentificadas en el modelo de Tareas. De nuevo, remitimos a los ap´ndices para estudio ede las plantillas asociadas.Laura Castro
  • 21. Cap´ ıtulo 4Descripci´n conceptual del oconocimiento en CommonKADS Como hemos visto, CommonKADS organiza la aproximaci´n a un SBC de la si- oguiente forma: Modelo de la Modelo de Modelo de Organizacion Tareas Agentes Modelo de Modelo de Conocimiento Comunicacion Modelo de Diseño En este cap´ ıtulo nos centraremos en el modelado del Conocimiento.4.1. El modelo del Conocimiento Los modelos de Conocimiento son una herramienta especializada para especificartareas en dominios intensivos de/en conocimiento. Un modelo de conocimiento especifica los requisitos de conocimiento y razonamien-to del sistema futuro. No incluye aspectos de comunicaci´n con los usuarios ni con ootros agentes software, ni tampoco contiene t´rminos espec´ e ıficos de implementaci´n. o 17
  • 22. 18 Apuntes – 4. Descripci´n conceptual del conocimiento en CommonKADS o Su estructura es similar a la de los modelos de an´lisis tradicional en ingenier´ del a ıasoftware, siendo un aspecto importante para la reutilizaci´n del software. o Requisitos y especificaciones MODELO de interaccion COMUNICACIONMODELO de ORGANIZACION TAREA MODELOMODELO de TAREAS INTENSIVA DISEÑOMODELO de AGENTES en CONOCIMIENTO MODELO Tarea seleccionada en estudio de viabilidad CONOCIMIENTO Requisitos y especificaciones y desarrollada en modelos de tareas y agentes de razonamiento El t´rmino conocimiento ya ha sido comentado con anterioridad: lo hab´ e ıamos de-finido como “informaci´n sobre la informaci´n”. Un ejemplo de ello podr´ ser, por o o ıaejemplo, en las jerarqu´ superclase-subclase de tipos de objetos, un link entre dos ıasclases, que proporciona informaci´n sobre la relaci´n entre ambas. o o El conocimiento se puede utilizar para inferir nueva informaci´n, de suerte que no ohay realmente una frontera definida entre informaci´n y conocimiento. o En un SBC, el conocimiento est´ presente como tal en la base de conocimientos. aNormalmente, se prefiere tener varias bases de conocimiento, cada una aglutinandoreglas de un tipo determinado, de manera que sea posible su reutilizaci´n y tambi´n o esu correcci´n de forma m´s sencilla. o a Dentro del modelo del conocimiento, distinguiremos varias categor´ de conoci- ıasmiento: Conocimiento de la Tarea ¿Qu´ y c´mo? e o Es un conocimiento orientado a la meta y que realiza una descompo- sici´n funcional. o Conocimiento Inferencial Encarna los pasos b´sicos del razonamiento que se pueden hacer en el a dominio (en el contexto de un problema) y que se aplican mediante las tareas. Conocimiento del Dominio Aglutina el conocimiento y la informaci´n relevantes del dominio es- o t´tico, equivaliendo de alg´n modo al modelo de datos o de objetos en a u IS.Laura Castro
  • 23. 4.1. El modelo del Conocimiento 19Conocimiento de la Tarea: DIAGNOSIS (tarea)Conocimiento Inferencial: HIPOTETIZAR VERIFICAR (inferencia) (inferencia)Conocimiento del Dominio: SINTOMA ENFERMEDAD PRUEBA (tipo) (tipo) (tipo) Modelo de Conocimiento Conocimiento Conocimiento Conocimiento del Dominio Inferencial de la Tarea Figura 4.1: Categor´ en el modelo del Conocimiento. ıas Ingenier´ del Conocimiento ıa
  • 24. 20 Apuntes – 4. Descripci´n conceptual del conocimiento en CommonKADS o4.1.1. Conocimiento del dominio El conocimiento del dominio describe la informaci´n est´tica m´s importante y los o a aobjetos de conocimiento en un determinado dominio. Tiene dos partes principales: Esquema del Dominio Describe la estructura est´tica de la informaci´n/conocimiento a trav´s a o e de definiciones tipo, siendo comparable al modelo de datos/objetos en IS. Queda definido a trav´s de los constructos del dominio. e Base de Conocimientos Contiene instancias de los tipos que se especifica en el esquema del dominio (es decir, conjuntos de instancias de conocimiento), siendo comparable al contenido de una base de datos. Modelo de Conocimiento Conocimiento Conocimiento Conocimiento del Dominio Inferencial de la Tarea Esquema Base de del Dominio Conocimientos CONSTRUCTOS Tipos de Conceptos Relaciones Regla Figura 4.2: Constructos del modelo del Conocimiento.Constructos en el esquema del dominio La mayor´ son similares a los de O.O. (especialmente los diagramas de clases): ıaLaura Castro
  • 25. 4.1. El modelo del Conocimiento 21 Conceptos Describen un conjunto de objetos o instancias del dominio que comparten caracter´ ısticas similares (como los objetos en O.O. pero sin operaciones ni m´todos). e Relaciones Como las asociaciones en O.O. Atributos Valores primitivos. Caracter´ ısticas de los conceptos. Tipos de reglas Introducen expresiones (no hay equivalente en IS). Se incluyen, adem´s, otros para cubrir aspectos espec´ a ıficos del modelado SBC.Conceptos y Atributos Como hemos dicho, un concepto describe un conjunto de objetos o instancias. Lascaracter´ ısticas de los constructos se definen mediante atributos, que pueden tener unvalor (at´mico) que se define a trav´s de un tipo de valor (definici´n de los valores o e opermitidos). Los conceptos son el punto de comienzo para el modelado del conocimiento.Relaciones ´ Las relaciones entre conceptos pueden definirse con el constructo relacion o re- ´ ´lacion binaria (e incluso relacion n-aria) a trav´s de las especificaciones de eargumentos. La cardinalidad se define para cada argumento y su valor por defecto es 1. Es posibleespecificar un rol para cada argumento. La propia relaci´n puede tener atributos. o coche pertenencia persona NO DIRECCIONAL 0+ 0−1 coche propiedad−de persona DIRECCIONAL coche persona REIFICACION (si la relacion tiene atributos propiedad o participa en otras relaciones) fecha−adquisicion Figura 4.3: Relaciones en el modelo del Conocimiento.El modelado de las reglas Las reglas son una forma natural y com´n de representar el conocimiento simb´lico. u oAhora bien, ¿c´mo representamos dependencias entre conceptos en un modelo de datos otradicional? Ingenier´ del Conocimiento ıa
  • 26. 22 Apuntes – 4. Descripci´n conceptual del conocimiento en CommonKADS o Para modelar la construcci´n de las reglas se usa el constructo tipo de regla: o Es similar a una relaci´n, donde antecedente y consecuente no son o instancias de conceptos sino expresiones de esas instancias. Se modela una relaci´n entre expresiones acerca de los valores de los o atributos. Se modelan un conjunto de reglas de estructura similar. Las relaciones no son estrictamente l´gicas, es necesario especificar un o s´ ´ ımbolo de conexion entre antecedente y consecuente.Estructura de tipo de regla La estructura es sencilla: <antecedente> <s´mbolo-de-conexi´n> <consecuente> ı o Su uso flexible permite la representaci´n de cualquier tipo de dependencia (tipos om´ltiples para antecedente y consecuente). u ESTADO causa ESTADO INVISIBLE dependencia estado ESTADO tiene−manifestacion ESTADO INVISIBLE OBSERVABLE manifestacion regla TIPO−de−REGLA regla−manifestacion DESCRIPCION "..." ANTECEDENTE estado−invisible CONSECUENTE estado−observable SIMBOLO tiene−manifestacion END−TIPO−de−REGLA Figura 4.4: Ejemplos de representaci´n de Tipos de Regla. oLaura Castro
  • 27. 4.1. El modelo del Conocimiento 23Base de Conocimientos Es una partici´n conceptual de la BC que contiene instancias de los tipos de cono- ocimiento definidos en el esquema del dominio. Las instancias de los tipos de reglas contienen reglas. Su estructura tiene dos partes: ◦ el slot usa: <tipos-usados>de <esquema> ◦ el slot expresiones: <instancias> Las instancias pueden representarse formalmente, o bien semiformalmente con els´ ımbolo de conexi´n separando antecedente y consecuente. o BASE−CONOCIMIENTOS USA ... de ... ... de ... EXPRESIONES /* dependientes−estado */ ... /* manifestacion−regla */ ... END−BASE−CONOCIMIENTOS Figura 4.5: Ejemplo de representaci´n de Base de Conocimientos. o4.1.2. Conocimiento inferencial El conocimiento inferencial describe el nivel inferior de descomposici´n funcional. oDescribe c´mo las estructuras est´ticas del conocimiento del dominio se pueden usar o apara realizar el proceso de razonamiento, permitiendo la reutilizaci´n del conocimiento. o Sus elementos principales se aprecian en la figura 4.6 y son: Inferencias Relacionadas con el razonamiento, son las unidades b´sicas a de procesado de informaci´n. o Funciones de Transferencia Relativas a la comunicaci´n con otros agen- o tes (a un nivel muy b´sico, esta cuesti´n se trata realmente en el Mo- a o delo de Comunicaci´n). o Roles de Conocimiento Relacionados indirectamente con el conocimien- to del dominio. Una inferencia usa el conocimiento de alguna base de conocimiento para derivarnueva informaci´n. o Los roles din´micos son las entradas y salidas en tiempo de ejecuci´n de las infe- a orencias. Ingenier´ del Conocimiento ıa
  • 28. 24 Apuntes – 4. Descripci´n conceptual del conocimiento en CommonKADS o Modelo de Conocimiento Conocimiento Conocimiento Conocimiento del Dominio Inferencial de la Tarea Roles de Funciones de Inferencias Conocimiento Transferencia Figura 4.6: Elementos del Conocimiento Inferencial. explicar ENTRADA SALIDA INFERENCIA (rol dinamico) (rol dinamico) queja hipotesis Modelo Causal (rol estatico) Figura 4.7: Ejemplo de Inferencia.Laura Castro
  • 29. 4.1. El modelo del Conocimiento 25Inferencias Las inferencias quedan completamente descritas a trav´s de una especificaci´n de- e oclarativa de propiedades de su E/S. Los procesos internos de la inferencia son una cajanegra.Rol de Conocimiento Proporcionan un nombre funcional para elementos dato/conocimiento. Dicho nom-bre captura el rol del elemento en el proceso de razonamiento, realizando un mapeadoexpl´ ıcito a los tipos del dominio. Los roles din´micos son variantes E/S, mientras que los est´ticos son entradas in- a avariantes (una base de datos). INFERENCIA explicar ROL−CONOCIMIENTO nombre ROLES TIPO dinamico ENTRADA ... MAPEADO−DOMINIO visible−estado SALIDA ... END−ROL−CONOCIMIENTO ESTATICOS ... ESPECIFICACION "..." END_INFERENCIAFunciones de Transferencia Las funciones de transferencia transfieren un item de informaci´n entre el agente de orazonamiento del m´dulo de conocimiento y otro agente del mundo externo (usuario, ootro sistema,. . . ). Desde el punto de vista del modelo de conocimiento es una caja negra: s´lo interesa osu nombre y su E/S. La especificaci´n detallada de las funciones de transferencia es oparte de otro modelo, el de Comunicaci´n. o Iniciativa Iniciativa sistema externa Informaci´n externa o obtener recibir Informaci´n interna o presentar proporcionar Cuadro 4.1: Nombres est´ndar de las Funciones de Transferencia. aEstructura Inferencial La combinaci´n de los diferentes conjuntos de inferencias especifica la capacidad oinferencial b´sica del sistema en desarrollo. El conjunto de inferencias se puede presen- atar gr´ficamente en una estructura inferencial, que hace ´nfasis en los aspectos a edin´micos del flujo de datos (roles est´ticos opcionales). a a Ingenier´ del Conocimiento ıa
  • 30. 26 Apuntes – 4. Descripci´n conceptual del conocimiento en CommonKADS o rol conocimiento queja dinamico funcion de rol estatico transferencia modelo explicar obtener hecho real causal hecho hipotesis predecir comparar esperado modelo resultado manifestacion Figura 4.8: Ejemplo de Mapa Inferencial.Uso de las Estructuras Inferenciales Las estructuras inferenciales son representaciones abstractas de los posibles pasosdel proceso de razonamiento, y, como tales, son un veh´ıculo importante de comunicaci´n odurante el proceso de desarrollo, a pesar de que a menudo puedan ser provisionales. Suele ser util realizar anotaciones con ejemplos espec´ ´ ıficos del dominio. Las estructuras inferenciales definen las capacidades inferenciales del sistema, elvocabulario y las dependencias de control, pero no el control en s´ (del que se ocupa el ıconocimiento).Reutilizaci´n de inferencias o El estado ideal ser´ disponer de un conjunto est´ndar de inferencias. Con ese obje- ıa ativo, se recomienda el uso de nombres lo m´s est´ndar posibles con el fin de favorecer a ala reutilizaci´n. o4.1.3. Conocimiento de la tarea El conocimiento de la tarea describe metas (por ejemplo, asesorar la suscripci´n ode una hipoteca, dise˜ar un ascensor,. . . ) y las estrategias que se pueden utilizar para nrealizar dichas metas. Esta descripci´n sigue un esquema jer´rquico. o a Tal y como se puede observar en la figura 4.9, distinguiremos, dentro del conoci-miento de la tarea, la propia Tarea y por otra parte lo que llamaremos el M´todo de la eTarea.Tarea La Tarea define la meta del razonamiento en forma de pares (entrada, salida), conel fin de especificar qu´ es necesario saber. e La diferencia principal con las funciones tradicionales es que los datos manipuladospor la tarea se describen tambi´n independientemente del dominio. eLaura Castro
  • 31. 4.1. El modelo del Conocimiento 27 Modelo de Conocimiento Conocimiento Conocimiento Conocimiento del Dominio Inferencial de la Tarea Metodo de Tarea la Tarea Figura 4.9: Elementos del Conocimiento de la Tarea. El hecho de que la descripci´n deba ser independiente del dominio tiene como ob- ojetivo la reutilizaci´n de las tareas. o Una tarea se describe por medio de tres slots: META Descripci´n textual informal. o SPEC Describe de manera textual e informal la relaci´n entre la entrada o y la salida de la tarea. ROLES Los roles de E/S se especifican en forma de roles funcionales, como en las inferencias,pero con algunas diferencias: no hay roles est´ticos a no hay mapeado de los roles en t´rminos espec´ e ıficos del dominio; los roles de las tares est´n linkados a los roles inferenciales a cada tarea tiene un m´todo asociado eM´todo de la Tarea e El M´todo de la Tarea describe c´mo se realiza una tarea mediante su descompo- e osici´n en subfunciones. Las subfunciones pueden ser otra tarea, inferencias o funciones ode transferencia. La parte central del m´todo de la tarea se denomina estructura de control y describe eel orden de las subfunciones, capturando la estrategia de razonamiento. Los elementos de la estructura de control son: Ingenier´ del Conocimiento ıa
  • 32. 28 Apuntes – 4. Descripci´n conceptual del conocimiento en CommonKADS o explicar predecir obtener comparar Figura 4.10: Ejemplo de esquema de un posible M´todo de la Tarea. e ◦ llamadas a procedimientos (tareas, inferencias, funciones de transfe- rencia) ◦ operaciones de roles (asignaci´n, suma/resta,. . . ) o ◦ primitivas de control (repetir,. . . ) ◦ condiciones expresiones l´gicas sobre roles o condiciones especiales: tiene soluci´n y nueva soluci´n o o4.1.4. ¿Inferencia o Tarea? Si el comportamiento interno de una funci´n1 es importante para explicar el com- oportamiento del sistema como un todo, entonces es necesario definir esta funci´n como ouna tarea. Durante el desarrollo del modelo, es usual manejar estructuras inferenciales provi-sionales.4.1.5. Modelo de Datos (IS) vs. Modelo de Conocimiento (IC) Los Modelos de Datos contienen “datos sobre datos”, ya que en Ingenier´ delıaSoftware lo importante son los datos. Sin embargo, la Ingenier´ del Conocimiento se ıacentra en el conocimiento, hace ´nfasis en el control interno y desarrolla funciones eque se describen independientemente del modelo de datos, lo que favorece una mayorreutilizaci´n posterior. o 1 Donde por funci´n podemos entender tanto “tarea” como “inferencia”. oLaura Castro
  • 33. 4.2. Plantillas de modelos de Conocimiento. Elementos reutilizables 294.2. Plantillas de modelos de Conocimiento. Elementos reutilizables En lo que llevamos visto hasta el momento, destacan una serie de puntos clave enlo que a reutilizaci´n se refiere: o √ Los modelos de conocimiento pueden ser parcialmente reutilizados en aplicaciones nuevas. √ La gu´ principal para la reutilizaci´n es el tipo de tarea. ıa o √ Existe un cat´logo de plantillas de tareas intensivas en conoci- a miento (como los patrones en O.O.). Los fundamentos de la reusabilidad pasan por no reinventar la rueda cada vez quenos enfrentamos a un problema, conseguir la m´xima eficiencia coste/tiempo, disminuir ala complejidad y asegurar la calidad. Una plantilla es una combinaci´n de elementos del modelo reutilizables: o Estructura inferencial (provisional) Estructura de control t´ ıpica Esquema del dominio t´ ıpico desde el punto de vista de la tarea Todo ello es espec´ıfico para el tipo de tarea que describe cada plantilla en par-ticular. Gracias a estas plantillas este m´todo de modelado soporta el modelado del econocimiento “top-down”.4.2.1. Tipos de Tareas El rango de tipos de tareas est´ limitado. Esto es una ventaja de la IC en compa- araci´n con los antiguos SSEE. o En el trasfondo de esto se encuentran la ciencia cognitiva y la psicolog´ ıa. La estructura de la descripci´n en la plantilla es la siguiente: o 1. Caracterizaci´n general. o 2. M´todo por defecto. e 3. Variaciones t´ ıpicas (cambios/ajustes frecuentes). 4. Esquema t´ ıpico del conocimiento del dominio (asunciones sobre las estructuras del dominio). Ingenier´ del Conocimiento ıa
  • 34. 30 Apuntes – 4. Descripci´n conceptual del conocimiento en CommonKADS o Tareas Anal´ ıticas Tareas Sint´ticas e Sistemaa Preexiste (aunque no es conocido). No existe a´n. u Entrada Datos acerca del sistema. Requisitos del sistema que se construir´. a Salida Alguna caracter´ ıstica del sistema. Descripci´n del sistema construido. o Tipos clasificacion´ ˜ diseno asesoramiento modelado diagnostico planificacion ´ monitorizacion ´ asignacion´ prediccion´ scheduling a Entendemos por sistema un t´rmino abstracto que designa el objeto sobre el que se aplica la etarea. En diagn´stico t´cnico, por ejemplo ser´ el artefacto o aparato que est´ siendo diagnosticado. o e ıa a Cuadro 4.2: Tareas Anal´ ıticas vs. Tareas Sint´ticas. e4.3. Construcci´n de los modelos de Conocimiento o La metodolog´ CommonKADS enfoca el modelo del conocimiento como un produc- ıato. Esto hace que se forme un cuello de botella por falta de experiencia en el modeladodel conocimiento. La soluci´n, como es f´cil de preveer, pasa por modelar, a su vez, el proceso. o a No obstante, el modelado es una actividad constructiva para la que no existe unasoluci´n correcta ni un camino ´ptimo. As´ pues, lo que se hace es proporcionar una o o ıgu´ que funciona bien en la pr´ctica. ıa a El modelado del conocimiento es una forma especializada de especificaci´n de re- oquisitos en el que se usan, por tanto, principios generales de la IS. ESTADOS Identificacion del Familiarizacion con el dominio, lista Conocimiento potencial de componentes reutilizables Especificacion del Escoger plantilla de tareas, construir conceptualizacion Conocimiento inicial, especificacion completa del modelo del dominio Refinado del Validacion del modelo del conocimiento, Conocimiento refinado de las bases de conocimiento Figura 4.11: Gu´ para el modelado del Conocimiento. ıaLaura Castro
  • 35. 4.3. Construcci´n de los modelos de Conocimiento o 314.3.1. Identificaci´n del Conocimiento oMETA Estudiar los items de conocimiento, prepararlos para su especificaci´n. oENTRADA Tarea intensiva en conocimiento, principales items de conocimiento iden- tificados, clasificaci´n de la tarea de la aplicaci´n. o oACTIVIDADES Explorar fuentes de informaci´n y estudiar la naturaleza de la ta- o rea. Los factores m´s importantes con respecto a las fuentes de informaci´n a o son su naturaleza (¿son claras? ¿tienen base te´rica?) y su diversidad o (¿son conflictivas? ¿con qu´ factor de riesgo?). e Las t´cnicas para su exploraci´n son las tradicionales: marcado de tex- e o tos, entrevistas, etc. El problema principal reside en encontrar un ba- lance entre aprender sobre el dominio y convertirse en un experto. Algunas gu´ ıas: Hablar con la gente que trata a los expertos pero que no son ex- pertos Evitar sumergirse en teor´ complicadas y detalladas ıas Construir unos cuantos escenarios t´ ıpicos No pasar demasiado tiempo en esta actividad Una vez acometidas estas actividades, puede realizarse una valoraci´n de resulta- o dos, tanto tangibles (listado de fuentes, res´menes de textos, glosario, descripci´n u o de escenarios), como intangibles (la propia comprensi´n). o La presencia de una lista de componentes tiene como objetivo allanar el camino en el manejo de componentes reutilizables en dos dimensiones: ◦ Dimensi´n de la Tarea (elegida del tipo asignado en el TM, construir una o lista de plantillas) ◦ Dimensi´n del Dominio (tipo de dominio, buscar descripci´n est´ndar) o o a4.3.2. Especificaci´n del Conocimiento oMETA Completar la especificaci´n del conocimiento excepto para los contenidos de o los modelos del dominio (que necesitan s´lo contener instancias). oACTIVIDADES Elegir una plantilla de la tarea Como l´ ınea base de actuaci´n, no debemos o olvidar que existe una fuerte preferencia por un modelo de conocimiento basado en aplicaciones ya existentes (por razones de eficacia y calidad ase- gurada). Los criterios de selecci´n son las caracter´ o ısticas de la tarea de la aplicaci´n (naturaleza de las entradas y salidas del sistema, restricciones del o contexto. . . ). Algunas gu´ para la selecci´n de plantillas: ıas o Ingenier´ del Conocimiento ıa
  • 36. 32 Apuntes – 4. Descripci´n conceptual del conocimiento en CommonKADS o Preferir las que se usan con m´s frecuencia (por evidencia emp´ a ırica). Construir una estructura inferencial anotada con ejemplos y un esquema del dominio. Si no se ajusta a ninguna plantilla, cuestionar la intensidad en conoci- miento de la tarea. Construir una conceptualizaci´n inicial del dominio Ha de construirse un o esquema del dominio inicial, que tendr´ dos partes: a Conceptualizaci´n espec´ o ıfica del dominio (que no es probable que cam- bie). Conceptualizaci´n de m´todos espec´ o e ıficos (s´lo necesaria para resolver o ciertos problemas —excepciones a la norma, no demasiado relevantes en este punto—). Como “salida” de este paso obtendremos un esquema que debe cubrir al menos las conceptualizaciones espec´ ıficas del dominio. Algunas gu´ sobre c´mo actuar: ıas o ◦ Utilizar en lo posible el modelo de datos existente (usar al menos la misma terminolog´ en los constructos b´sicos; har´ las cooperaciones ıa a a e intercambios futuros m´s sencillos). a ◦ Limitar el uso del lenguaje de modelo de conocimiento a conceptos, subtipos y relaciones (concentrarse en los “datos”, de manera similar a cuando se construye un modelo de clases inicial). ◦ Si no existe modelo de datos disponible, usar t´cnicas est´ndar de IS e a para encontrar conceptos y relaciones. Especificar las tres categor´ del conocimiento Por ultimo, se termina la ıas ´ especificaci´n completa del dominio, pudiendo enfrentarse de dos maneras: o 1. Ruta Middle-Out. Es la aproximaci´n preferida, empieza con el conoci- o miento inferencial. Como precondici´n, la plantilla de la tarea ha de ser o una buena aproximaci´n de la estructura inferencial. o 2. Ruta Middle-In. Comienza en paralelo con la descomposici´n de la tarea o y el modelado del dominio, por lo que consume m´s tiempo. Es necesario a si la plantilla de la tarea es de grano “demasiado grueso”. La estructura inferencial est´ suficientemente detallada si lo est´ la expli- a a caci´n que proporciona, o tambi´n si es f´cil encontrar para cada inferencia o e a un tipo de conocimiento del dominio que act´e tal y como se espera. u Algunas gu´ para especificar el conocimiento de la tarea: ıas ◦ Empezar con la estructura de control. ◦ No incluir detalles de la memoria de trabajo. ◦ Elegir nombres de roles aclarativos (Modelar es nombrar ). ◦ No incluir roles de conocimiento est´tico. aLaura Castro
  • 37. 4.3. Construcci´n de los modelos de Conocimiento o 33 ◦ En aplicaciones de tiempo real, considerar usar una representaci´n al- o ternativa al pseudoc´digo (UML). o Algunas gu´ para especificar el conocimiento inferencial : ıas ◦ Comenzar con la representaci´n gr´fica. o a ◦ Elegir los nombres de rol cuidadosamente (car´cter din´mico, hip´tesis, a a o datos iniciales,. . . ). ◦ Usar un conjunto lo m´s est´ndar posible de inferencias. a a Algunas gu´ para especificar el conocimiento del dominio: ıas ◦ Usar como roles est´ticos los tipos del dominio (no tienen que tener la a representaci´n correcta, esta ser´ una tarea del dise˜o). o a n4.3.3. Refinado del Conocimiento El refinado del Conocimiento pasa por: 1. Validaci´n del modelo de Conocimiento. o 2. Rellenar las Bases de Conocimiento.Validaci´n del modelo de Conocimiento o La validaci´n debe ser interna (verificaci´n, ¿es el modelo adecuado?) y externa o o(validaci´n contra los requisitos del usuario, ¿es correcto el modelo?). o Existen diferentes t´cnicas de validaci´n: e o Interna: • Rutas estructuradas (probar escenarios t´ ıpicos) • Herramientas software Externa: • Suele ser m´s dif´ y/o amplia a ıcil • T´cnica principal: simulaci´n (prototipos, simulaci´n basada en e o o papel) En cuanto al mantenimiento, seg´n el punto de vista de CommonKADS, no es ualgo diferente del desarrollo del modelo, pues es algo c´ ıclico. El modelo es como unrepositorio de informaci´n; debemos especificar requisitos para obtener herramientas ode soporte potentes.Rellenar las Bases de Conocimiento El esquema contiene dos tipos de dominios: tipos de informaci´n parte de un caso oy tipos de informaci´n parte de un modelo de conocimiento. o La meta es determinar todas las instancias de cada tipo. Las instancias s´lo se ne- ocesitan para un escenario. Algunas gu´ para el rellenado de las bases de conocimiento: ıas Ingenier´ del Conocimiento ıa
  • 38. 34 Apuntes – 4. Descripci´n conceptual del conocimiento en CommonKADS o ◦ Rellenar las bases de conocimiento es una forma de validar el esquema construido. ◦ Normalmente no es posible definir una base de conocimientos correcta y completa en un primer ciclo. ◦ Las bases de conocimiento necesitan mantenimiento (el conocimiento cambia con el tiempo). ◦ T´cnicas: incorporar facilidades de edici´n para las bases de cono- e o cimiento, trazas, entrevistas estructuradas, aprendizaje autom´tico, a mapeado de otras bases de conocimiento.4.3.4. Documentaci´n del modelo de Conocimiento o Una vez construido el modelo, se redacta un documento KM-1 (ver ap´ndices), que econtendr´: a Especificaci´n del modelo de conocimiento. o Listado de fuentes de informaci´n. o Listado de los componentes reusables del modelo. Escenarios t´ ıpicos del problema que resuelve la aplicaci´n. o Resultados de validaci´n de la simulaci´n. o o Material de elicitaci´n. o4.4. El modelo de Comunicaci´n o El papel del modelo de Comunicaci´n es especificar los procesos de transferencia ode informaci´n/conocimiento. Es, en cierto modo, un control de nivel superior sobre ola ejecuci´n de la tarea (m´ltiples tareas intensivas en conocimiento). Tareas de comu- o unicaci´n adicionales, pueden, adem´s, a˜adir facilidades de explicaci´n al sistema. Un o a n oejemplo es la interaci´n b´sica sistema-usuario. o a Requisitos y especificaciones MODELO de interaccion COMUNICACION MODELO de TAREAS TAREA MODELO MODELO de AGENTES INTENSIVA DISEÑO en CONOCIMIENTO MODELO Detallada en modelos de tareas y agentes CONOCIMIENTO Requisitos y especificaciones de razonamiento Figura 4.12: Relaci´n del modelo de Comunicaci´n con otros modelos. o oLaura Castro
  • 39. 4.4. El modelo de Comunicaci´n o 35 Las “entradas” al modelo de Comunicaci´n son: o Modelo de Tareas Lista de tareas hoja llevadas a cabo por los agentes considerados. Modelo de Conocimiento Funciones de transferencia. Modelo de Agentes Descripci´n de agentes relevantes, capacidades, res- o ponsabilidades y restricciones. Cada vez m´s, los sistemas de informaci´n son informaci´n + sistema de comuni- a o ocaci´n: o √ Aplicaciones distribuidas (telem´tica). a √ Organismos virtuales. √ Sistemas multiagente inteligentes. √ Manejo de flujos de trabajo. √ Ingenier´ concurrente. ıa √ Manejo e integraci´n de la cadena de negocio. o El modelado de la informaci´n debe cubrir: o An´lisis de la organizaci´n. a o An´lisis de las tareas. a An´lisis de actores/agentes (sistemas y humanos). a Normalmente, varios actores cooperan en un proceso de negocio o tarea. El modelode Comunicaci´n se centra en modelar el di´logo entre agentes afront´ndolo mediante o a auna aproximaci´n semiformal estructurada. o Tarea Agente Plan de Comunicacion Transaccion Especificaciones sobre el intercambio de Informacion Estructura de la Tarea Figura 4.13: Estructura del modelo de Comunicaci´n. o Ingenier´ del Conocimiento ıa
  • 40. 36 Apuntes – 4. Descripci´n conceptual del conocimiento en CommonKADS o La aproximaci´n por capas al modelado de las comunicaciones consta de tres niveles: o Plan de Comunicaciones general.- Gobierna el di´logo completo entre a dos agentes. Transacciones individuales.- Son las que unen dos tareas hoja llevadas a cabo por dos agentes diferentes. Especificaci´n del intercambio de informaci´n.- Detalla la estructu- o o ra de las transacciones. Como se puede ver, pues, las transacciones son el componente clave del modelode Comunicaci´n. Describen qu´ objetos de informaci´n se intercambian, indicando los o e oagentes y tareas implicados. Son el bloque de construcci´n para el di´logo completo o aentre un par de agentes, y tienen una estructura interna. Haciendo abuso de lenguaje, suele llamarse transacci´n incluso a lo que se inter- ocambia entre dos tareas llevadas a cabo por diferentes agentes. A un nivel superior, est´ el plan de comunicaci´n, que gobierna el di´logo com- a o apleto entre los agentes, siendo la especificaci´n concreta del modelo de Comunicaci´n. o o4.4.1. Plan de Comunicaci´n o Generalmente es m´s f´cil comenzar por el plan de comunicaci´n global. El plan de a a ocomunicaci´n describe completamente el di´logo de alto nivel, siendo sus transacciones o at´ ıpicas: entrada de datos, contestaci´n de preguntas, presentaci´n de resultados, etc. o oActividades Para cada agente se confeccionar´ una lista de todas las tareas en las que participa, ay para cada tarea se identificar´ el conjunto de transacciones agente-agente asociadas. a El resultado se combina en un diagrama de di´logo (DD, ver figura 4.14) que repre- asenta las transacciones entre cada par de agentes que se comunican. Se dibuja, pues, unDD para cada combinaci´n de dos agentes que intercambian informaci´n, especificando o ode esta manera el control sobre las transacciones. Como alternativa a la notaci´n del DD, se puede utilizar tambi´n pseudoc´digo o e ocon primitivas de control especiales: enviar, recibir, llevar a cabo, esperar,procesar, repetir,. . .4.4.2. Transaciones agente-agente El nivel de especificaci´n medio del modelo de Comunicaci´n est´ encarnado en la o o aespecificaci´n de las transacciones individuales, estructuradas en un n´mero de com- o uponentes. T´cnicas simples de formulario son utiles aqu´ (ver formulario CM-1 en ap´ndices). e ´ ı eLaura Castro
  • 41. 4.4. El modelo de Comunicaci´n o 37 Agente A Agente B (por ejemplo, usuario) (por ejemplo, sistema) Tarea A1 transaccion 1 Tarea B1 Tarea A2 Tarea B2 . transaccion 2 . . . . . . . Tarea Ax . Tarea By Dialogo (las tareas hoja de los agentes son clave para la construccion del DD) Figura 4.14: Estructura general de un Diagrama de Di´logo. a Las transacciones suelen agruparse tras un unico plan de comunicaci´n, salvo en ´ osistemas multiagente. Identificador y Agentes Nombre Plan de comunicacion Transaccion Objetivo informacion Restricciones Especificacion intercambio informacion Figura 4.15: Esquema de la estructura de una transacci´n (CM-1). o Tareas Delegaci´n Tareas Adopci´n Tareas Intercambio o o Request Propose Ask Require Offer Reply Order Agree Report Reject td Reject ta Inform Cuadro 4.3: Tipos de comunicaci´n. o Ingenier´ del Conocimiento ıa
  • 42. 38 Apuntes – 4. Descripci´n conceptual del conocimiento en CommonKADS o Las transacciones tienen, en general, una primera parte informativa y una segundaparte de “solicitud de acci´n” (usualmente un mensaje de delegaci´n de tarea). Las o otransacciones no s´lo admiten, pues, un contenido, sino tambi´n una relaci´n preten- o e odida entre dos agentes. Ambos aspectos deben especificarse expl´ ıcitamente. Los lenguajes de comunicaci´n de agentes (ACL) est´n inspirados a menudo por la o ateor´ del acto del habla, que hace distinciones entre el contenido y el efecto pretendido. ıa4.4.3. Patrones transaccionales Ya por ultimo, nos centraremos en el nivel de detalle del modelo de Comunicaci´n, ´ oque consiste en la especificaci´n detallada del mensaje: o Su contenido, expresado mediante una declaraci´n proposicional (locuci´n). o o Su intenci´n2 , expresada mediante un mensaje escrito (ilocuci´n). o o Los tipos predefinidos son los ya indicados en la tabla 4.3 (solicitar, exigir,ordenar, rechazar; proponer, ofrecer, acordar, rechazar; preguntar,responder, informar y enviar informe). Cuadro 4.4: Sem´ntica de algunos tipos de comunicaci´n. a o request/propose Negociaci´n para colaborar o require/offer Compromiso condicional order/agree Efectuar un acuerdo reject Negarse a efectuar la petici´n o ask/reply Preguntar sobre informaci´n y recibir respuesta o report Informe como consecuencia de un acuerdo previo inform Acci´n informativa independiente o Por supuesto, no s´lo es posible enviar mensajes simples, tambi´n se pueden formar o ecadenas naturales de tipos de mensajes. El resumen de la especificaci´n de los intercambios de informaci´n se aglutina en el o oformulario CM-2, que s´lo suele ser necesario para patrones de comunicaci´n complejos o o(es un detalle del CM-1). Su estructura es la siguiente: ◦ Identificador y nombre de la transacci´n. o ◦ Agentes involucrados (emisor, receptor). ◦ Items de informaci´n; se componen a su vez de: o – rol (objeto central + item soporte3 ) 2 Intenci´n = prop´sito + cometido. o o 3 Textos explicativos de material del dominio, trazados de razonamiento, explicaciones porqu´/co- emo.Laura Castro
  • 43. 4.4. El modelo de Comunicaci´n o 39 – forma sint´ctica (cadenas de datos, diagramas, etc.) a – medio (ventana pop-up, interfaz de l´ınea de comandos, interven- ci´n humana. . . ) o ◦ Especificaci´n del mensaje. o ◦ Control del mensaje (es un refinado del control especificado en el plan de comunicaci´n, que usar´ la misma notaci´n: diagramas de estado o o a o pseudoc´digo). o4.4.4. T´cnicas de validaci´n e o Para validar el modelo de Comunicaci´n suelen emplearse walkthroughs en el plan ode comunicaci´n, para verificar la adecuaci´n de la estructura de las transacciones, la o ocompletitud de la lista de items de informaci´n y la necesidad de ayuda o explicaci´n. o o Existen t´cnicas m´s formales, como la t´cnica Mago de Oz, que se basa en la e a emisma idea que el test de Turing. No obstante, su uso es caro pues es una t´cnicaeexperimental para validar la interacci´n que requiere de la construcci´n de un software o omaqueta.Gu´ de Nielsen para la usabilidad ıa Presentar diagramas simples y naturales. Hablar el lenguaje del usuario. Minimizar la carga de memoria del usuario. Mantener la consistencia de la terminolog´ ıa. Proporcionar informaci´n sobre lo que est´ pasando (retroalimenta- o a ci´n). o Mostrar salidas claramente marcadas desde los estados no deseados. Ofrecer atajos al usuario experto.Gu´ para pesar el modelo de Comunicaci´n ıas o Entradas clave: → Tareas hoja del TM. → Funciones de transferencia del KM. Tener en cuenta las capacidades de los agentes (AM). La formulaci´n sint´ctica del medio es algo entre el CM y el DM (se o a aborda en el CM si existen razones conceptuales para ello). Decidir sobre la informaci´n de soporte (no en DM). o Ingenier´ del Conocimiento ıa
  • 44. 40 Apuntes – 4. Descripci´n conceptual del conocimiento en CommonKADS oActividades del modelo de Comunicaci´n o Identificar los objetos de informaci´n centrales para ser intercambiados o entre agentes. Identificar las transacciones asociadas. Dibujar los DD importantes. Combinar esto en un plan de comunicaciones completo. Especificar las transacciones individuales (CM-1 y CM-2). Validar y pesar el modelo.Laura Castro
  • 45. Cap´ ıtulo 5Del an´lisis a la implementaci´n: el a omodelo de Dise˜ o en nCommonKADS El Dise˜o del sistema recibe como entradas: n √ El modelo de Conocimiento (requisitos para la resoluci´n de proble- o mas) √ El modelo de Comunicaci´n (reglas de interacci´n) o o √ Otros modelos (requisitos “no funcionales”) Y obtendr´ como salidas la especificaci´n de una arquitectura software y el dise˜o a o nde la aplicaci´n dentro de dicha arquitectura. o Dominio Aplicacion Sistema Software Modelos de Analisis expertos Modelo Conocimiento arquitectura software libros Modelo Comunicacion diseño algoritmos protocolos Modelo Tareas Modelo Diseño diseño TDAs casos plataforma hardware estrategias Modelo Agentes razonamiento lenguaje implementacion Modelo Organizacion tiempo respuesta requerido problemas y oportunidades Figura 5.1: Del an´lisis al dise˜o en CommonKADS. a n 41
  • 46. 42 Apuntes – 5. El modelo de Dise˜o en CommonKADS n Entendemos por arquitectura del sistema la descripci´n del software en t´rminos de o edescomposici´n en subsistemas, seleci´n del r´gimen(es) de control y descomposici´n o o e ode los subsistemas en m´dulos software. o Especificar esta arquitectura es el punto central el proceso de dise˜o, y se parte de nuna serie de arquitecturas de referencia para sistemas basados en CommonKADS.5.1. Principio de Conservaci´n de la Estructura o El principio de Conservaci´n de la Estructura es el principio central del dise˜o o nmoderno: “Debe preservarse el contenido y la estructura del modelo de an´lisis durante a el dise˜o.” n Seg´n esta filosof´ dise˜ar es “a˜adir detalles espec´ u ıa, n n ıficos de implementaci´n a los oresultados del an´lisis”, preservando la informaci´n como noci´n clave. a o o Esto est´ directamente relacionado con los criterios de calidad del dise˜o en general: a n √ Minimizar el acoplamiento. √ Maximizar la cohesi´n. o √ Transparencia. √ Mantenimiento. A estos criterios generales, cuando hablamos de dise˜o de SBCs, se a˜aden los n nsiguientes: √ Reusabilidad de elementos de dise˜o/c´digo resultante. n o √ Mantenimiento y adaptabilidad (el desarrollo en un solo paso es nor- malmente poco realista, especialmente para sistemas intensivos en co- nocimiento). √ Potencia explicativa. √ Adquisici´n de conocimiento/facilidad para el refinado (el conocimien- o to cambia con el tiempo).5.2. El modelo de Dise˜ o n En la construcci´n del modelo de Dise˜ o se seguir´n los siguientes pasos: o n aLaura Castro
  • 47. 5.2. El modelo de Dise˜o n 43 Paso 1 Paso 2 Paso 3 Paso 4 Detalle de la Diseño de la Especificacion de la especificacion Detalle del diseño Arquitectura Plataforma hw/sw de la Arquitectura de la Aplicacion Arquitecturas de Lista de entornos Checklist de Mapeado referencia de disponibles decisiones predefinido a CommonKADS arquitecturales arquitectura Conocimiento de soporte al Diseño en CommonKADS Figura 5.2: Pasos en la construcci´n del modelo de Dise˜o. o n5.2.1. Dise˜ o de la arquitectura del sistema n El primer paso en la construcci´n del modelo de Dise˜o es, pues, la especificaci´n o n ode la arquitectura global. El principio que se sigue es separar la funcionalidad de aspectos de la interfaz, paralo que, como ya se ha mencionado, se descompone el sistema en subsistemas, se defi-ne un r´gimen de control global y se descomponen los subsistemas en m´dulos software. e o La arquitectura global seguir´ el modelo MVC (Model View Controller ), que fue adesarrollado para el dise˜o O.O. en lenguaje Smalltalk-80 pero que ha sido adoptado nmayoritariamente en el dise˜o de software. Este modelo distingue entre los objetos de nuna aplicaci´n y su visualizaci´n y define una unidad de control central con r´gimen o o edirigido por eventos. El sistema construido siguiendo esta filosof´ tendr´ tres subsis- ıa atemas principales, indicados en la figura 5.3.Subsistema Modelo de Aplicacion El modelo de la aplicaci´n contiene los datos y funciones de la aplicaci´n, esto es, o olos objetos del modelo de conocimiento. Los datos est´n presentes en forma de bases de conocimiento y datos din´micos a amanipulados durante el razonamiento (por ejemplo, roles din´micos), mientras que las afunciones est´n representadas por las tares, inferencias y funciones de transferencia. aSubsistema Vistas Este subsistema se encarga de la visualizaci´n de los datos y funciones de la apli- ocaci´n, haciendo posible la visualizaci´n de la informaci´n est´tica y din´mica a los o o o a aagentes externos, como el usuario o bien otro sistema software. Ingenier´ del Conocimiento ıa
  • 48. 44 Apuntes – 5. El modelo de Dise˜o en CommonKADS n entrada Controlador vistas Vistas usuario controlador maneja entradas proporcionan salida desde agentes externos a agentes externos sensores y funciones internas (IU, query a BD) invocacion informe de de funciones resultados Modelo Aplicacion funciones de razonamiento (tareas, inferencias) esquema(s) del dominio bases de datos/conocimiento Figura 5.3: Esquema del Model View Controller. Es posible tener visualizaciones m´ltiples, agregar la visualizaci´n de m´ltiples ob- u o ujetos de la aplicaci´n, etc. o La inclusi´n de este subsistema requiere actualizaci´n arquitectural o bien meca- o onismos de integraci´n, como pueden ser una tabla de mapeos o protocolos de mensajes opara notificaci´n de cambios en el estado de los objetos. oSubsistema Controlador Es la unidad central de control y comandos. Suele estar dirigido por eventos, pro-porcionando handlers para eventos tanto externos como internos. Permite la activaci´n de las funciones de la aplicaci´n y decide qu´ hacer cuando o o ellegan los resultados. Puede definir sus propias vistas de control para proporcionarinformaci´n sobre el proceso (por ejemplo, al usuario experto). Suele tener un reloj ointerno y una agenda, pudiendo tener un comportamiento tipo daemon. Algunos otros aspectos importantes de la arquitectura MVC, adem´s de haber sido adesarrollada en el contexto de la O.O. (de hecho, es una descomposici´n funcional de o“objetos”), pasan por darnos cuenta de que su uso no est´ necesariamente restringido aa una aproximaci´n al dise˜o/implementaci´n O.O., aunque el paradigma de paso de o n omensajes debe ajustarse bien a los entes de la arquitectura. A la hora de descomponer el modelo de la aplicaci´n en subsistemas debemos tener oen cuenta que se debe permitir el dise˜o preservando la estructura, as´ como permitir n ıla integraci´n con otras aproximaciones de la IS. oLaura Castro
  • 49. 5.2. El modelo de Dise˜o n 45 Las opciones son dos: una descomposici´n funcional o bien una descomposici´n O.O. o oLa opci´n escogida por CommonKADS es la segunda, ya que se ajusta bien al car´cter o adeclarativo de las especificaciones de los objetos en el modelo de conocimiento (puedeverse una tarea como un objeto) y adem´s simplifica el mapeado con implementaciones aO.O. en muchas herramientas. Este primer paso en la construcci´n del modelo de Dise˜o queda reflejado en el o nmodelo DM-1 (ver ap´ndices). e5.2.2. Identificaci´n de la plataforma de implementaci´n o o El segundo paso en la construcci´n del modelo de Dise˜o es la identificaci´n de la o n oplataforma de implementaci´n. o Los requisitos espec´ ıficos del cliente suelen restringir esta selecci´n, lo que es una oraz´n para colocarla en un paso temprano dentro del proceso. Hoy en d´ la selecci´n o ıa, odel software es mucho m´s importante que la del hardware, aunque puede no serlo en ael caso de aplicaciones en tiempo real. En caso de que la selecci´n fuese m´s o menos libre, deber´ o a ıamos considerar pos-ponerla hasta que se finalizase el tercer paso (especificaci´n de los componentes de la oarquitectura). Algunos criterios para la selecci´n de la plataforma de implementaci´n pueden ser: o o Existencia de librer´ de clases de objetos “vista” (puede ser necesario ıas construir muchos uno mismo en caso contrario). Formalismo en la representaci´n del conocimiento (preferentemente o una representaci´n declarativa). o Existencia de interfaces est´ndar con otro software (ODBC, COR- a BA,. . . suelen ser necesarias a menudo). Facilidades para la escritura del lenguaje (un “tecleado d´bil” normal- e mente implica m´s trabajo en el mapeado del modelo de an´lisis). a a Facilidades de control/protocolos (soporte de paso de mensajes, posi- bilidad de multi-threading). Soporte de CommonKADS (extensi´n de plataformas dedicadas — o por ejemplo, librer´ de objetos—, links con herramientas CASE que ıas soporten CommonKADS). Este segundo paso en la construcci´n del modelo de Dise˜o queda reflejado en el o nmodelo DM-2 (ver ap´ndices). e Ingenier´ del Conocimiento ıa
  • 50. 46 Apuntes – 5. El modelo de Dise˜o en CommonKADS n5.2.3. Especificaci´n de los componentes de la arquitectura o El tercer paso en la construcci´n del modelo de Dise˜o es la especificaci´n de los o n ocomponentes arquitecturales. Esta especificaci´n consiste en definir los componentes de la arquitectura en m´s o adetalle. En particular, se definen las interfaces entre los subsistemas y/o m´dulos de olos sistemas, especificando sus componentes. Se realiza as´ un dise˜o general de las utilidades de la arquitectura. Algunas plata- ı nformas incorporan una arquitectura CommonKADS en las que las decisiones han sidopredefinidas; esto tiene como ventaja que este paso se hace m´s r´pido y f´cil, pero por a a acontra destruye la capacidad creativa.Utilidades del Controlador El controlador realiza un control dirigido por eventos con un componente centralde control. Puede verse como una implementaci´n del modelo de comunicaci´n. o o Las declaraciones t´ ıpicas son: ∗ Activaci´n y finalizaci´n de funciones de la aplicaci´n. o o o ∗ Decisi´n sobre la posibilidad de que el usuario realice interrupciones o para informarse del trazado/contexto. ∗ Posibilidad de abortar funciones. ∗ Manejo de funciones de transferencia/transacciones. ∗ Necesidad o no de procesado concurrente.Utilidades del Modelo de Aplicaci´n o ∗ Tarea: para los objetos necesitamos definir dos operaciones: ◦ Un m´todo de inicializaci´n, para iniciar los valores de la tarea. e o ◦ Un m´todo de ejecuci´n, que invoque al m´todo de la tarea. e o e ∗ M´todo de la Tarea: e ◦ Elementos del lenguaje de control (constructos de control). ◦ Declaratividad del lenguaje de control (por ejemplo, en O.O., la implementaci´n natural es una operaci´n execute, pero destruye o o la naturaleza declarativa; es necesario “objetificar” la estructura de control). ∗ Inferencias: ◦ Tres operaciones principales: execute, more solutions y has- solution. ◦ Enlaces a los m´todos de inferencia. e ∗ M´todos de Inferencia: eLaura Castro
  • 51. 5.2. El modelo de Dise˜o n 47 ◦ Librer´ de m´todos. ıa e ◦ Permitir relaciones muchos-a-muchos entre m´todos e inferencias. e ∗ Funciones de transferencia: ◦ Implementaci´n v´ patrones de paso de mensajes. o ıa ∗ Roles din´micos: a ◦ Tipos de datos permitidos: elemento, conjunto, lista,. . . ◦ Operaciones de acceso/actualizaci´n, selecci´n, eliminaci´n, a˜adir, o o o n etc. ∗ Roles est´ticos: a ◦ Funciones de acceso/consulta. ∗ Modelo del dominio (bases de conocimiento): ◦ Formato representacional. ◦ Funciones de acceso/consulta. ◦ Funciones de modificaci´n/an´lisis. o a ∗ Constructos del dominio: ◦ Simplemente inspeccionar.Utilidades de las Vistas ∗ Visualizaciones gr´ficas est´ndar. a a ∗ Generaci´n de formatos externos (por ejemplo, consultas SQL). o ∗ Utilidades arquitecturales de actualizaci´n de vistas: o ◦ Tablas de mapeado. ◦ Protocolos de mensajes.Interfaces de Usuario ∗ Interfaz con el usuario normal: ◦ Considerar utilidades especiales (por ejemplo, generaci´n de len- o guaje natural). ◦ Uso de visualizaciones espec´ ıficas del dominio (depende del dise˜o n de la aplicaci´n). o ∗ Interfaz con usuarios expertos: ◦ Interfaz de trazados. ◦ Interfaz de edici´n/refinado para bases de conocimiento. o Este tercer paso en la construcci´n del modelo de Dise˜o queda reflejado en el o nmodelo DM-3 (ver ap´ndices). e Ingenier´ del Conocimiento ıa
  • 52. 48 Apuntes – 5. El modelo de Dise˜o en CommonKADS n5.2.4. Especificaci´n de la aplicaci´n en el contexto o o de la arquitectura El ultimo paso en la construcci´n del modelo de Dise˜o es la especificaci´n del ´ o n odise˜o en el contexto de la arquitectura. Esta tarea se divide en dos: n 1. Mapear la informaci´n de an´lisis en la arquitectura.- Se necesitan o a construir o disponer de herramientas de mapeo (por ejemplo, un API). La extensi´n del mapeo depende de las decisiones que est´n ya cons- o a truidas en la arquitectura. 2. A˜adir detalles de dise˜o.- Debe hacerse el dise˜o de la aplicaci´n para n n n o el controlador: ◦ Su entrada principal es el Modelo de Comunicaci´n.o ◦ A menudo es necesario el procedimiento natural. ◦ Como m´ ınimo es necesario un procedimiento de bootstraping. ◦ Otras funciones: manejo de requisitos de explicaci´n o control de usuario sobre el proceso de razonamiento interrupci´n del razonamiento/control estrat´gico o e permitir escenarios what-if (simulaci´n) o La especificaci´n de la aplicaci´n en el contexto de la arquitectura queda reflejado o oen el formulario DM-4 (ver ap´ndices). e5.3. Dise˜ o de prototipos n El “prototipado r´pido” tiene una mala reputaci´n porque este t´rmino ha sido a o eempleado para referirse a implementaciones r´pidas y poco cuidadas imposibles de amantener y escalar. No obstante, hoy en d´ est´ considerada como una buena t´cnica ıa a epara comprobar el grado de comprensi´n que se tiene sobre aquello que se desea llegar oa contruir.5.3.1. Prototipado de subsistemas de razonamiento ¿Cu´ndo puede ser necesario construir un prototipo del subsistema de razonamien- ato? Cuando contemos con elementos recientemente construidos en el mo- delo de conocimiento (plantillas nuevas). Cuando sospechemos de agujeros en el conocimiento del dominio. En general, para validar y verificar el modelo del dominio: • validar (¿es el sistema adecuado?)Laura Castro
  • 53. 5.4. SBCs distribuidos 49 • verificar (¿es adecuado el sistema?) Adem´s la plataforma de implementaci´n debe soportar el prototipado, su cons- a otrucci´n debe ser cuesti´n de d´ o o ıas.5.3.2. Prototipado de interfaces de usuario La construcci´n de un prototipo de interfaz con el usuario nos brinda la oportunidad ode comprobar la interfaz sin necesidad de desarrollar toda su funcionalidad. Puede sernecesario si el formato de vistas es complejo e incluso para poder construir una interfazexterna m´s completa. a5.4. SBCs distribuidos Hay varios campos en los que potencialmente ser´ interesante usar una arquitectura ıadistribuida a la hora de construir un SBC: Servicios de razonamiento El modelo de aplicaci´n funciona como un servicio. No es necesaria o una interfaz de usuario. Servidores basados en conocimiento/ontol´gicos o Unifican la terminolog´ SSEE. Un ejemplo ser´ el GRASP, un servi- ıa ıa dor para piezas de arte. Servicio de m´todos e Un sistema distribuido en forma de un conjunto de m´todos. e Y, por supuesto, combinaciones de los mencionados. Ingenier´ del Conocimiento ıa
  • 54. Cap´ ıtulo 6T´cnicas para la adquisici´n del e oconocimiento Llamamos adquisici´n del conocimiento al proceso de recoger los datos e infor- omaci´n que necesitamos para construir nuestro SBC. o Para ello se utilizan una serie de t´cnicas que pueden ser manuales, usualmente m´s e af´ciles de usar por parte del ingeniero de conocimiento y m´s f´ciles de aceptar por a a ael experto aunque m´s costosas en tiempo, semiautom´ticas e incluso completamente a aautom´ticas. a El problema es que la adquisici´n del conocimiento no es una actividad inmediata. oLos propios expertos no son conscientes de su conocimiento y su forma de actuar, queles resulta complicado verbalizar, pues muchas veces es pragm´tico. Para paliar esto en amayor o menor medida es util elegir, dentro de lo posible, varios expertos, que pueden ´ser de distintos tipos: Experto te´rico o acad´mico: posee conocimientos m´s encaminados a o e a la parte docente, m´s formales. Suele ser capaz de explicar racional- a mente pero est´ poco relacionado en la pr´ctica. a a Experto pr´ctico: resuelve los problemas d´ a d´ aporta una visi´n a ıa ıa, o m´s “real” (escenarios). Da soluciones, es un experto t´cnico, aplica a e algo porque funciona, sin quiz´s tener una explicaci´n formal. a o Pese a todo, nunca debemos olvidar que existe un componente personal muy im-portante, que no se puede evitar.6.1. Escenarios de adquisici´n del conocimiento o Hay cuatro escenarios t´ ıpicos de adquisici´n del conocimiento: o 51
  • 55. 52 Apuntes – 6. T´cnicas para la adquisici´n del conocimiento e o SISTEMA EXPERTO Motor Inferencias INGENIERO EXPERTO (conocimento general CONOCIMIENTO solucionador de problemas) Base Conocimientos (conocimientos del dominio) Figura 6.1: Primer escenario de adquisici´n del conocimiento. o El escenario 1 (figura 6.1) es el m´s t´ a ıpico. SISTEMA EXPERTO Motor Inferencias PROGRAMA EDITOR EXPERTO INTELIGENTE (conocimento general solucionador de problemas) Base Conocimientos (conocimientos del dominio) Figura 6.2: Segundo escenario de adquisici´n del conocimiento. o El escenario 2 (figura 6.2) surge de la mente de McCarthy (1968) y su “Advice Ta-ker”, aunque su mejor trabajo fue teiresias (1976). Consiste en que el experto hablacon el programa en lugar de con el ingeniero de conocimiento (¡que es, obviamente, elque ha construido el programa!), ayudando de este modo a que se implique y favore-ciendo la depuraci´n. Por supuesto, lo extremadamente complejo es la construcci´n del o omencionado sistema/programa interlocutor. El programa de inducci´n —por ejemplo, una red de neuronas— (escenario 3, figura o6.3) intenta extraer alg´n tipo de conocimiento, generalizaciones fundamentalmente, ua partir de los datos. Este conocimiento se traducir´ posteriormente al “mundo” del aSBC (paso que, por cierto, puede ser no trivial ni directo). La ventaja es que ya esuna t´cnica autom´tica (salvo en la introducci´n de los datos). El problema, que la e a oconstrucci´n de estos programas de inducci´n que generalicen algo util no es f´cil. o o ´ aLaura Castro
  • 56. 6.1. Escenarios de adquisici´n del conocimiento o 53 SISTEMA EXPERTO Motor Inferencias PROGRAMA DATOS DE INDUCCION (conocimento general solucionador de problemas) Base Conocimientos (conocimientos del dominio) Figura 6.3: Tercer escenario de adquisici´n del conocimiento. o SISTEMA EXPERTO PROGRAMA Motor Inferencias LIBROS DE COMPRENSION (conocimento general TEXTO DE TEXTO solucionador de problemas) Base Conocimientos (conocimientos del dominio) Figura 6.4: Cuarto escenario de adquisici´n del conocimiento. o El programa de comprensi´n de texto (escenario 4, figura 6.4) deber´ comprender o ıadiagramas, esquemas, y poseer un “criterio”. La interpretaci´n del lenguaje natural, oaunque sea referido a un campo espec´ ıfico, es algo muy complicado. El conocimiento, por su parte, tambi´n puede ser de muchos tipos (lo iremos vien- edo). Ingenier´ del Conocimiento ıa
  • 57. 54 Apuntes – 6. T´cnicas para la adquisici´n del conocimiento e o DIRECTIVOS EXPERTOS USUARIOS Identificacion Descripcion tareas Hechos y relaciones conocidos Aprobacion proyecto Identificacion ejecuciones exito Consejos Respuestas y soluciones Plantea problemas y cuestiones INGENIERO CONOCIMIENTO Selecciona buen dominio y tarea Aprende sobre la tarea de directivos, expertos y usuarios Conoce como construir SSBBCC Conoce las ventajas e inconvenientes de las herramientas conocimiento estructurado en forma de conceptos y formalizado INGENIERO CONOCIMIENTO Analiza necesidades de representacion y estrategias de control Regla del pulgar, heuristicas y reglas del dominio Elige la herramienta Construye los distintos prototipos La integra y la mantieneLaura Castro
  • 58. 6.1. Escenarios de adquisici´n del conocimiento o 55Dec´logo del Ingeniero de Conocimientoa a Facultades de Comunicaci´n o Utilizaci´n efectiva del lenguaje (oral y escrito). o Capacidad de representaci´n esquem´tica. o a Capacidad de interpretaci´n.o Trato agradable. Inteligencia Capacidad de aprendizaje. Apertura de mente y flexibilidad. Tacto y Diplomacia Reflexi´n y tacto. o Energ´ y Paciencia ıa Valoraci´n del trabajo en equipo. o Capacidad de decisi´n, discusi´n, cr´ o o ıtica y estimulaci´n. o Persistencia L´gica o Claridad de pensamiento, capacidad de orden. Versatilidad e Inventiva Potencia anal´ ıtica. Imaginaci´n. o Autoconfianza Conocimiento del Dominio de Aplicaci´n o Conocimiento acerca de la Programaci´n del Sistema o a El problema es que estas todas estas cualidades no suele reunirlas una sola per-sona, de modo que es necesario la creaci´n de grupos interprofesionales. o Cuadro 6.1: Dec´logo del Ingeniero de Conocimiento. a Ingenier´ del Conocimiento ıa
  • 59. 56 Apuntes – 6. T´cnicas para la adquisici´n del conocimiento e o Tipo Conocimiento Actividad T´cnica e declarativo B´squeda de heur´ u ısticas Entrevistas no estructuradas generales procesal B´squeda de rutinas u Entrevistas estructuradas y procedimientos ´ semantico B´squeda de conceptos u Observaci´n directa o y vocabulario An´lisis de Tareas a Heur´ısticas y Procedimientos Emparrillado de toma de decisiones Clasificaciones Trazado del proceso de razonamiento ´ episodico B´squeda de heur´ u ısticas Simulaciones anal´gicas de soluci´n o o Trazado del proceso de de problemas razonamiento (An´lisis de a protocolos) Cuadro 6.2: M´todos de Adquisici´n del Conocimiento. e o La t´cnica a utilizar para la adquisici´n del conocimiento depende no s´lo del tipo e o ode conocimiento a adquirir, sino tambi´n del dominio, circunstancias particulares, etc. e6.2. Las entrevistas Las entrevistas son un m´todo sencillo, manual, de adquisici´n del conocimiento e oque puede ser utilizado por cualquier persona, en cualquier dominio, con cualquier tipode experto y con cualquier tipo de conocimiento. Las primeras entrevistas suelen recibir el nombre de entrevistas de despliegue y sufinalidad es interaccionar con el experto, conocerse mutuamente, etc. Normalmente hayque vencer una mala predisposici´n, explicar lo que se pretende hacer, lo que se espera odel experto,. . . y por tanto su duraci´n no deber´ ser muy extensa. o ıa A continuaci´n aparecen las sesiones de adquisici´n que son de dos tipos: o o No estructuradas (sesiones de car´cter general). a Estructuradas (sesiones de car´cter espec´ a ıfico). Tras la toma de contacto, las entrevistas no estructuradas (no se esperan respues-tas cerradas a las preguntas que se plantean) sirven para familiarizarse con el dominioconcreto. Hay que saber conducirlas para evitar divagaciones y an´cdotas del experto. eMuchos de los datos que se adquieran aqu´ no ser´n directamente trasladables al SBC, ı apero nos ayudar´n a hacernos una idea sobre posibles estructuras inferenciales, etc. a Se har´ por ultimo una entrevista estructurada para cada parte del sistema identi- a ´ficado, donde s´ ya se necesitan respuestas concretas. Suelen tener un gui´n con puntos ı osimilares a:Laura Castro
  • 60. 6.2. Las entrevistas 571. T´cnicas de an´lisis basadas en tareas familiares. e a a) Observaci´n directa. o b) Resoluci´n de casos destacados o dif´ o ıciles.2. T´cnicas basadas en entrevistas. e a) No estructuradas. b) Estructuradas. c) An´lisis de casos hist´ricos destacados y dif´ a o ıciles.3. T´cnicas de an´lisis basadas en tareas especiales. e a a) T´cnicas psicol´gicas para estudiar resoluci´n de problemas. e o o 1) An´lisis de protocolos. a 2) An´lisis de toma de decisiones. a 3) Brainstorming. b) T´cnicas psicol´gicas para estudiar aprendizaje y memoria. e o 1) Resoluci´n de tareas con informaci´n limitada. o o 2) Resoluci´n de tareas con procedimientos limitados. o c) T´cnicas que enjuician caracter´ e ısticas de los conceptos. 1) Clasificaciones. 2) Emparrillado. 3) Escalonadas. 4) Escalamiento psicol´gico. oCuadro 6.3: Clasificaci´n de los M´todos de Adquisici´n de Conocimiento. o e o Ingenier´ del Conocimiento ıa
  • 61. 58 Apuntes – 6. T´cnicas para la adquisici´n del conocimiento e o √ Descripci´n general de la tarea. o √ Descripci´n de variables involucradas/influyentes. o √ Reglas generales que ligan a las variables: Plantilla 1: ¿Por qu´? Convierte afirmaciones en reglas. e Plantilla 2: ¿C´mo? Genera reglas de menor nivel. o Plantilla 3: ¿Cu´ndo? Extrae generalidad de las reglas, generando a otras. Plantilla 4: ¿Qu´ alternativas hay? Extrae generalidad de las reglas, e generando otras. Plantilla 5: ¿Qu´ pasar´ si? Genera m´s reglas, con condiciones e ıa a diferentes. Plantilla 6: ¿Algo m´s? Genera m´s reglas auxiliares o no contem- a a pladas. Es clave tener en cuenta los aspectos no verbales del experto y distinguir sus opinio-nes personales (sobre todo acerca de la propia ingenier´ de conocimiento e inteligencia ıaartificial) de la informaci´n objetiva. oRecomendaciones Las entrevistas deben ser peri´dicas, hacerse a las mismas horas/d´ preferible- o ıas,mente por la ma˜ana temprano. Es recomendable usar el lugar de trabajo del experto ncomo lugar de reuni´n, sobre todo al principio, tanto por comodidad como porque otenga sus materiales a mano para consultar. Resulta muy conveniente ir ense˜ando al experto los progresos que se van haciendo. nPor ello, hay que “digerir” el resultado de una entrevista (realizando un informe pararepasarlo con ´l en la siguiente sesi´n) antes de concertar otra. e o6.2.1. Entrevistas m´ ltiples uUn ingeniero de conocimiento y m´ ltiples expertos u Se da cuando los expertos trabajan en grupo o hay varios tipos de expertos. Si ´stos eson compatibles, esta clase de entrevistas puede proporcionar muy buenos resultados,por el contraste de opiniones y puntos de vista, lo que asegura un mejor refinamiento ym´s y mejor conocimiento, de m´s alto nivel, aunque si la adquisici´n de conocimiento a a oes de car´cter general (no estructuradas), no resulta demasiado util hacer esto con a ´muchos expertos. El problema se presenta si los expertos son incompatibles entre s´ en ese caso se ı;debe prescindir siempre de los conflictos y dividir las entrevistas. El problema puedepresentarse tambi´n si es el ingeniero de conocimiento el que no es capaz de controlar elas sesiones (los expertos se centran en un tema, discuten de sus cosas,. . . ) o no sepuede concentrar (es muy pesado).Laura Castro
  • 62. 6.3. El an´lisis de protocolos a 59M´ ltiples ingenieros de conocimiento y un experto u Nunca deber´ hacerse una entrevista con un solo experto y m´s de tres ingenieros ıa ade conocimiento (no apabullar). Este tipo de entrevistas resulta util cuando en el equipo ´de trabajo contamos con ingenieros senior/junior. La ventaja que tiene la participaci´n de varios ingenieros es que se pueden evitar osesgos introducidos por ellos mismos, cada uno puede aportar cosas, y no se producenvac´ entre la adquisici´n y la implementaci´n del conocimiento. ıos o o La desventaja suele ser que el experto es reticente, pues estas sesiones son m´s apesadas para ´l, aunque siempre pueden hacerse m´s cortas. Lo que como sea debe e aevitarse son las discusiones entre los propios ingenieros (¡mala imagen!).M´ ltiples ingenieros de conocimiento y m´ ltiples expertos u u El principal inconveniente de estas entrevistas es que consumen much´ ısimo tiempo,aunque tambi´n aglutina las ventajas de las vistas anteriormente. e Es necesario nombrar un moderador que controle la sesi´n. Es una de las opciones om´s usadas. a En general, la t´cnica de entrevistas para adquirir conocimiento es cara en tiempo, een cualquiera de sus variantes. Es una t´cnica introspectiva (el experto tiene que epensar en lo que sabe y verbalizarlo) y requiere un esfuerzo adicional por parte delingeniero de conocimiento (que debe hacerse con el vocabulario, confeccionar informes,etc). Visto por el lado bueno, es una t´cnica muy general, como hemos dicho, que se epuede utilizar en muchos campos y en distintas etapas del desarrollo, sin requerir paraello un entrenamiento especial. Es clave tener en cuenta los aspectos no verbales del experto y distinguir sus opinio-nes personales (sobre todo acerca de la propia ingenier´ de conocimiento e inteligencia ıaartificial) de la informaci´n objetiva. o6.3. El an´lisis de protocolos a El an´lisis de protocolos es otra t´cnica de adquisici´n del conocimiento que re- a e oquiere algo m´s de conocimiento por parte del ingeniero de conocimiento, pero tampoco aun nivel excesivo. Consiste en grabar, bien s´lo audio o combinado con v´ o ıdeo, al experto mientrasresuelve una tarea, un problema concreto del dominio, motivo por el cual no goza dedemasiada aceptaci´n. Sin embargo, al poder acceder a la grabaci´n cualquier ingeniero o ode conocimiento, se obvian algunos otros problemas de las entrevistas. Debe quedarle claro al experto que no tiene que explicar lo que va haciendo, sinosimplemente verbalizar los pasos que est´ siguiendo. Pese a ello, el m´todo sigue siendo a eintrospectivo. Ingenier´ del Conocimiento ıa
  • 63. 60 Apuntes – 6. T´cnicas para la adquisici´n del conocimiento e o Es recomendable usar siempre m´s de una t´cnica de adquisici´n del conocimiento, a e oy tanto las entrevistas como el an´lisis de protocolos son combinables con cualquier aotra. El an´lisis de protocolos pasa por cuatro fases: a 1. Obtenci´n del protocolo.- Se dan las instrucciones al experto: verbali- o zar lo que dice en su cabeza durante la resoluci´n del caso, sin intentar o explicarlo. Se pueden tomar notas. 2. Transcripci´n y segmentaci´n.- Escuchar/ver y transcribir lo grabado, o o separ´ndolo en frases que tengan sentido (desde el punto de vista del a conocimiento). No todo el mundo hace las segmentaciones igual, ni una misma persona segmentar´ igual una transcripci´n la primera ıa o que sucesivas veces. 3. Codificaci´n.- Se identifican objetos, valores, operadores y relaciones. o Se obtienen las reglas expl´ ıcitas en el texto (reglas inferenciales senci- llas). 4. Interpretaci´n.- Se obtienen las reglas impl´ o ıcitas (cosas que no nos dice directamente), se puede analizar la forma de razonar (progresivo, regresivo,. . . ). El problema es que un protocolo solo no nos sirve, hay que probar muchos casos.Por esto y por su inherente dificultad, suele usarse exclusivamente en casos puntuales. Existen variantes: An´lisis del Recuerdo a Si el experto no es capaz de hablarnos mientras resuelve el problema, puede permit´ ırsele verbalizar el proceso al finalizarlo. An´lisis de las dos Fases a Consiste en comparar resultados con el propio experto en la fase de codificaci´n. o An´lisis del Registro a A˜ade una entrevista al final del proceso. n An´lisis de Casos Dif´ a ıciles En vez de cualquier caso, se resuelven casos concretos de dificultad espec´ ıfica.Ventajas El flujo de informaci´n es unidireccional (en entrevistas era bidireccional), del o experto al ingeniero de conocimiento, por lo que se minimizan las interacciones. El protocolo puede ser analizado por tantos ingenieros de conocimiento como sea necesario.Laura Castro
  • 64. 6.4. Cuestionarios 61 Permite adquirir conocimiento que es dif´ de adquirir mediante entrevistas ıcil (aspectos relacionados con la estrategia de razonamiento que usa el experto, algo inconsciente que aqu´ queda reflejado). ı El experto es el reactivo limitante.Inconvenientes Se pueden introducir sesgos (igual que en las entrevistas) inconscientes. Es una t´cnica muy costosa en tiempo (el experto debe aprender a hacer el an´lisis e a de protocolos —que no razone sino que act´e—), y es muy larga y pesada para el u ingeniero de conocimiento (sobre todo si no tiene experiencia), que debe realizar la transcripci´n, segmentaci´n, etc. o o Es una t´cnica introspectiva. e6.4. Cuestionarios Los cuestionarios son una t´cnica m´s o menos sencilla que consiste en presentar e aal experto una serie de fichas u hojas con preguntas concretas (de ah´ su utilidad). ıVentajas Flujo unidireccional. El experto puede contestar el cuestionario cuando desee y donde decida (suelen aceptarla con agrado gracias a esto), por lo que no hay problemas referentes a concierto de reuniones, horarios, etc. Consume menos tiempo que las otras t´cnicas vistas hasta ahora. e Es util para describir objetos, jerarqu´ certidumbres, relaciones del dominio,. . . ´ ıas,Inconvenientes Su elaboraci´n no es sencilla. o Es una t´cnica introspectiva. e6.5. An´lisis del movimiento de ojos a El an´lisis del movimientode ojos es una t´cnica de adquisici´n del conocimien- a e oto que s´lo se puede usar en los campos en que sea necesario un reconocimiento visual odel problema por parte del experto (existe un aparato —Eye Mark Recorder — queregistra la direcci´n, posici´n y duraci´n de la mirada). o o o Ingenier´ del Conocimiento ıa
  • 65. 62 Apuntes – 6. T´cnicas para la adquisici´n del conocimiento e o Los datos que se obtienen no tienen por qu´ ser directamente trasladables al siste- ema/dominio, aunque s´ pueden dar informaci´n sobre el comportamiento del experto, ı osiendo as´ un buen punto de partida. Puede ser clave para descubrir la diferencia entre ılo que se hace y lo que hay que hacer (que suele ser lo que el experto comunica). Es una t´cnica no introspectiva, cuyo principal inconveniente es su carest´ e ıa.6.6. M´todo de observaci´n directa e o Esta t´cnica de adquisici´n del conocimiento es siempre recomendable. La obser- e ovaci´n directa consiste en acudir al lugar de trabajo del experto y observar all´ su o ıcomportamiento. Su inter´s reside en que se ve lo que realmente pasa, eliminando las interpretacio- enes subjetivas sobre el trabajo del experto. Es un m´todo no introspectivo, aunque esiempre se pueden hacer preguntas y, por supuesto, tomar notas. Puede ser interesanteconcertar una entrevista despu´s para aclarar dudas. e Su objetivo fundamental es captar conocimiento procesal, siendo util para refinar el ´sistema (no en conocimiento, pero s´ a lo mejor en aspectos relacionados con la interfaz, ıpor ejemplo). Su principal inconveniente, la gran cantidad de tiempo del ingeniero deconocimiento que consume, aunque no afecta en absoluto al experto.6.7. Extracci´n de curvas cerradas o Esta t´cnica suele usarse en campos en los que el conocimiento visual es impor- etante, siendo especialmente interesante cuando existen relaciones espaciales entre loselementos del dominio, que se desean extraer. Consiste en confeccionar cartulinas con representaciones de los objetos del dominio(hasta un m´ximo, por ejemplo, 50) y pedir al experto que relacione, rode´ndolos, a aencerr´ndolos en un c´ a ırculo, aqu´llos que seg´n su criterio formen patrones, aparezcan e uligados, tengan caracter´ ısticas similares, etc. Esta fase puede repetirse cuantas veces sedesee, aplicando distintos criterios. Es obvio que el conocimiento obtenido por medio de la extracci´n de curvas ocerradas puede no ser directamente trasladable al sistema experto, pero sin duda,ayuda en el proceso de establecimiento de relaciones entre los conceptos del dominioy/o para obtener clasificaciones. Es una t´cnica bastante f´cil de utilizar para el ingeniero de conocimiento, aunque e arequiere conocer con relativa profundidad el campo en que trabajamos y puede aparecerel problema de que el criterio de clasificaci´n sea dif´ de explicitar por parte del o ıcilexperto.6.8. Las t´cnicas de escalamiento psicol´gico e o Las t´cnicas de escalamiento psicol´gico son una serie de m´todos semiau- e o etom´ticos de adquisici´n de conocimiento que constituyen el conjunto de los m´s usados a o aLaura Castro
  • 66. 6.8. Las t´cnicas de escalamiento psicol´gico e o 63en IC. Todas ellas tienen el mismo formato de datos a la entrada, una matriz triangularsuperior : E1 E2 E3 . . . En E1 0 d12 d13 . . . d1n E2 0 d23 . . . d2n . . .. . . . . . En−1 0 d(n−1)n En 0 donde dij son juicios de distancia que representan c´mo se parecen/diferencian olos elementos i y j del dominio. Las salidas de los tres m´todos de escalamiento psicol´gico que veremos son distin- e otas, pero siempre est´n igual formateadas (la misma entrada y datos producen siempre ala misma salida), y hay una relaci´n constante entre ellas. o No obstante, la aplicaci´n de estas t´cnicas no es sencilla, pues la parte manual, o eencargada de adquirir los elementos del dominio (del experto, mediante entrevistas)es muy importante: el conjunto de elementos debe ser completo y consistente, o de locontrario el conocimiento que se obtenga ser´ incompleto, incorrecto y/o inconsistente, aya que las distancias est´n condicionadas por el contexto de propios elementos. En el aotro extremo, elegir demasiados se enfrentar´ con la negativa y/o imposibilidad del aexperto de calcular todas las distancias. n(n − 1) Una vez que se tienen los elementos del dominio, hay que obtener las dis- 2tancias (si n es el n´mero de elementos a manejar). Para ello existen t´cnicas auxiliares u epara suplir el hecho de tener que mostrar al experto la tabla directamente: √ Clasificaciones: consisten en dibujar fichas que representen los elemen- tos del dominio y pedir al experto que haga grupos disjuntos con ellos, repitiendo el proceso en varias ocasiones utilizando distintos criterios. La distancia entre dos elementos ser´ entonces el inverso del n´mero a u de veces que esos dos elementos se clasificaron juntos. √ Emparrillado: es un m´todo matem´tico semiautom´tico para calcular e a a las distancias que veremos en m´s profundidad. a6.8.1. Escalamiento multidimensional (EDM ) Existen programas estad´ısticos que contienen herramientas para llevar a cabo unescalamiento multidimensional sobre un conjunto de datos. El EDM intenta colocar loselementos de la matriz en un espacio de la menor dimensionalidad posible, reduciendoal m´ximo la dimensionalidad de la matriz. a El problema que tiene es que a veces no es f´cil interpretar los resultados, y si la asalida tiene m´s de 3 dimensiones no se puede representar. a Ingenier´ del Conocimiento ıa
  • 67. 64 Apuntes – 6. T´cnicas para la adquisici´n del conocimiento e o Coruna Lugo Santiago Orense P ontevedra V igo Coruna 0 90 60 170 130 150 Lugo 0 120 110 190 210 Santiago 0 120 70 90 Orense 0 100 100 P ontevedra 0 20 V igo 0 Latitud Longitud Coruna 75 −20 Lugo 40 60 Santiago 20 −20 Orense −60 80 P ontevedra −55 −20 V igo −75 −20 Coruña Lugo Santiago Orense Pontevedra Vigo Cuadro 6.4: Ejemplo de aplicaci´n de EDM. oLaura Castro
  • 68. 6.8. Las t´cnicas de escalamiento psicol´gico e o 65 Adem´s, existen infinitas salidas, porque el m´todo s´lo fija el origen de coordenadas a e oy no la ubicaci´n de los elementos (hay, por tanto, infinitas orientaciones, infinitas orotaciones de los ejes), lo que genera la dificultad en la interpretaci´n. o No obstante, ayuda a descompilar conocimiento de los expertos, aunque tambi´n epuede no ser directamente trasladable al sistema experto.6.8.2. An´lisis de clusters (Clustering ) a El clustering consiste en agrupar los elementos que est´n m´s cerca entre s´ En a a ı.este caso, se buscan los dos elementos m´s pr´ximos, se agrupan formando un nuevo a oelemento, se eliminan de filas y columnas, se a˜ade el nuevo elemento a la matriz y nse recalculan las distancias con respecto al resto de elementos, repitiendo el procesohasta que s´lo queden dos elementos en la matriz, o bien hasta que en n´mero de clases o ugeneradas sea adecuado en nuestro dominio. El resultado final ser´ un dendrograma ao ´rbol jer´rquico (ver figura 6.5). a a La cuesti´n m´s delicada en este caso es la forma de recalcular las distancias: o a¿c´mo lo hacemos? ¿escogiendo el m´ximo? ¿el m´ o a ınimo? ¿una media? La decisi´n de- opender´ de lo que sea m´s conveniente en el contexto en que estemos trabajando. Esta a at´cnica tambi´n se incorpora en muchos paquetes estad´ e e ısticos. Adem´s, como se puede aobservar, una vez obtenida la matriz de elementos con sus distancias, ninguna de last´cnicas de escalamiento es introspectiva. e Ingenier´ del Conocimiento ıa
  • 69. 66 Apuntes – 6. T´cnicas para la adquisici´n del conocimiento e o E1 E2 E3 E4 E5 E6 E7 E1 10 10 7 6 13 8 E2 4 7 8 2 8 E3 9 12 3 8 E4 5 5 5 E5 6 6 E6 9 E7 E1 E3 E4 E5 E7 (E2 , E6 ) E1 10 7 6 8 10 E3 9 12 8 3 E4 5 5 5 E5 6 6 E7 8 (E2 , E6 ) E1 E4 E5 E7 ((E2 , E6 ), E3 ) E1 7 6 8 10 E4 5 5 5 E5 6 6 E7 8 ((E2 , E6 ), E3 ) E1 (E4 , E5 ) E7 ((E2 , E6 ), E3 ) E1 6 8 10 (E4 , E5 ) 5 5 E7 8 ((E2 , E6 ), E3 ) E1 ((E4 , E5 ), E7 ) ((E2 , E6 ), E3 ) E1 6 10 ((E4 , E5 ), E7 ) 5 ((E2 , E6 ), E3 ) E1 (((E4 , E5 ), E7 ), ((E2 , E6 ), E3 )) E1 6 (((E4 , E5 ), E7 ), ((E2 , E6 ), E3 )) Cuadro 6.5: Ejemplo de clustering (I).Laura Castro
  • 70. 6.8. Las t´cnicas de escalamiento psicol´gico e o 67 7 6 5 4 3 2 1 E1 E4 E5 E7 E2 E6 E3Figura 6.5: Ejemplo de clustering (y II): dendrograma. Ingenier´ del Conocimiento ıa
  • 71. 68 Apuntes – 6. T´cnicas para la adquisici´n del conocimiento e o El clustering permite elicitar muy r´pido conocimiento muy jerarquizado en la amente del experto. Es util tambi´n para validaci´n, para construcci´n de interfaces ´ e o ohombre-m´quina (comparaci´n de opiniones sobre la importancia de diferentes aspec- a otos), para comprobar el nivel de nuestro sistema frente a los expertos, e incluso paraverificar si las respuestas de un grupo de expertos est´n al mismo nivel. a6.8.3. Redes ponderadas (Pathfinder ) Esta ultima es la menos usada de las tres t´cnicas de escalamiento psicol´gico que ´ e ovamos a ver. Su salida, como su propio nombre indica, es una red ponderada en la quelos nodos son los elementos del dominio y los arcos que los unen aparecen ponderadospor un peso que es la distancia que los separa. S´lo existir´ un arco entre dos nodos si o ala distancia entre ellos a trav´s de cualquier camino es mayor que el valor especificado eentre ambos en la matriz de entrada: E1 E2 E3 E1 4 5 E2 13 E3 4 E2 E1 5 E3 E1 E2 E3 E1 4 5 E2 6 E3 4 E2 E1 5 6 E3 Cuadro 6.6: Ejemplo de redes ponderadas. El pathfinder es muy util si la representaci´n del conocimiento en nuestro sistema ´ outiliza alg´n tipo de red (por ejemplo, una red sem´ntica), ya que la traducci´n de u a oconocimiento del dominio es entonces mucho m´s directa. aLaura Castro
  • 72. 6.9. La teor´ de constructos personalizados: el Emparrillado ıa 69 En general, las ventajas del escalamiento psicol´gico son que proporciona conteni- odo y a veces incluso arquitectura a nuestra base de conocimientos. Permiten compararconocimientos, opiniones y criterios de varios expertos sobre un mismo conjunto de ele-mentos, adem´s de proporcionar un m´todo riguroso para combinar conocimiento que a eprocede de distintos expertos o incluso del cliente. No son t´cnicas demasiado intros- epectivas (salvando la etapa de determinaci´n de elementos y distancias entre ellos), y oest´n libres de cualquier interpretaci´n que pudiese ser incluida por parte del ingeniero a ode conocimiento. La salida es est´ndar y tiene un formato riguroso, lo que hace que adiferentes ingenieros de conocimiento con distintos expertos deban obtener los mismosresultados, algo que es un buen paso hacia la reutilizaci´n (adem´s de permitir la auto- o amatizaci´n). Por ultimo, son utiles no s´lo en adquisici´n sino tambi´n en validaci´n o ´ ´ o o e oy construcci´n de interfaces de usuario. o En cuanto a los inconvenientes, cada t´cnica tiene los suyos. En general, los eelementos y las distancias poseen un proceso de obtenci´n no trivial. Como hemos ovisto, los EDM no son f´ciles de interpretar y si su salida es gr´fica no es sencilla de a aetiquetar. En clustering puede no ser directo decidir qu´ criterio (m´ximo, m´ e a ınimo,media) escoger para el rec´lculo de distancias, al igual que en redes sem´nticas. a a Si se usa una herramienta, debemos familiarizarnos con ella; hay que tener unabase matem´tico-estad´ a ıstica para poder saber si es correcto lo que hacemos y saberinterpretarlo. Por ultimo, si no existe una estructura de ligaz´n fuerte entre elementos, ´ oo no hay estas relaciones, estas t´cnicas son in´tiles. e u6.9. La teor´ de constructos personalizados: ıa el Emparrillado La siguiente t´cnica que veremos, denominada t´cnica de constructos perso- e enalizados o emparrillado (repertory grid), no es propiamente una t´cnica de ad- equisici´n de conocimiento, sino m´s bien un m´todo auxiliar de clasificaci´n. En la o a e opr´ctica se usan herramientas que la implementan, que interrogan al usuario sobre los aelementos del dominio, sus relaciones, etc. con el fin de estructurar el conocimiento delexperto de una determinada manera (es pues, un m´todo semiautom´tico). Nosotros e aestudiaremos su funcionamiento interno. El emparrillado fue desarrollado inicialmente por George Kelly, un psic´logo cl´ o ınicoque defend´ que cada persona organiza sus conocimientos de una manera distinta ıay adem´s cambiante con el tiempo, y reflejaba las opiniones de las personas sobre alas cosas en forma de constructos personalizados. Su modelo cognitivo utilizadopara razonar con dichos constructos ser´ m´s tarde aplicado por Shaw y Griness a ıa ala IC (SS.EE. Planet, 1982), siendo as´ una de las primeras t´cnicas de aproximaci´n ı e oautom´tica para tratar el problema de la adquisici´n del conocimiento. a o Al estar basada en un modelo del pensamiento humano, esta es una t´cnica muy epotente que sirve para tener estructurado y accesible el conocimiento de una persona.Incluye un di´logo inicial con el experto, una sesi´n de valoraci´n y un an´lisis de los a o o aresultados (es decir, de los grupos, los conceptos y las dimensiones). Ingenier´ del Conocimiento ıa
  • 73. 70 Apuntes – 6. T´cnicas para la adquisici´n del conocimiento e o Se utilizan dos vertientes: t´cnicas binarias, que permiten clasificaci´n simple, y e omultivaluadas, que proporcionan una clasificaci´n m´s rica, al ser continua, dando op- o aci´n a la inclusi´n de nociones de incertidumbre e incluso conjuntos difusos. o o Este m´todo posibilita la obtenci´n de informaci´n que el experto no es consciente e o oque conoce (no es introspectiva, por tanto, salvo en su etapa inicial, aunque puedeconsiderarse que es intrusiva, pues desvela al experto eso que no es consciente quesab´ Por otra parte, matem´ticamente, la parrilla es una aplicaci´n de los elementos ıa). a odel dominio en un conjunto de caracter´ ısticas. Como podemos intuir, la primera fase,de obtenci´n de elementos y caracter´ o ısticas (constructos: [ci , ci ]) es el momento m´s ¯ apeliagudo, aunque posteriormente existen f´rmulas y ecuaciones que ayudan a eliminar oredundancias e informaciones poco significativas (juicios de umbrales, etc). Una parrilla es una matriz donde las columnas son los elementos del dominio ylas filas representan los constructos, que son caracter´ ısticas en las que deseamos cla-sificar. Dichos constructos son bipolares, representando una oposici´n de conceptos, osirvi´ndonos la matriz para ver c´mo piensa el experto, c´mo se organiza. e o o Ei cj vij ... cj ¯ donde Ei son los elementos del dominio identificados por el experto cj , cj ¯ son, respectivamente, caracter´ ısticas y su contrapartida en el dominio (su opuesto l´gico) o y vij son los valores que se corresponden por la relaci´n entre o unos y otros. Cuadro 6.7: Esquema de una parrilla. El emparrillado consta de cinco fases diferenciadas: 1. Identificaci´n de elementos (Ei ). o 2. Identificaci´n de caracter´ o ısticas (cj ). 3. Dise˜o de la parrilla. n 4. Formalizaci´n de la parrilla. o 5. Interpretaci´n de resultados. o6.9.1. Identificaci´n de elementos Ei o Como ya vimos en escalamiento psicol´gico, los elementos del dominio se obtienen omediante entrevista con el experto y debe lograrse un conjunto completo, consistentey representativo. Las sesiones pueden ser m´s o menos h´biles, pero los elementos a aLaura Castro
  • 74. 6.9. La teor´ de constructos personalizados: el Emparrillado ıa 71obtenidos deben ser homog´neos, representativos y tener en cuenta que no es util e ´manejar parrillas demasiado amplias, aunque se pueden manejar varias, lo que tambi´n eplantea la cuesti´n de c´mo “segmentar” los elementos (normalmente, se agrupar´n en o o auna misma parrilla los m´s homog´neos a su vez entre s´ a e ı).6.9.2. Identificaci´n de caracter´ o ısticas cj Las caracter´ısticas se obtienen de la misma manera que los elementos. Deben po-der expresarse como un par de conceptos antag´nicos, con el fin de poder manejar oun segmento clasificatorio. No tienen por qu´ ser uno el polo negativo del otro, pero es´ su negaci´n l´gica en el contexto del dominio. Si el experto no fuese luego capaz de ı o oclasificar utilizando los conceptos establecidos ser´ indicativo de que ´stos est´n mal ıa e aelegidos, no son los que ´l usa, le estar´ e ıamos obligando a clasificar seg´n otros c´nones, u ade manera que habr´ que replante´rselos. ıa a Para llevar a cabo la selecci´n de caracter´ o ısticas se usa normalmente el m´todo de las etr´ ıadas , que consiste en tomar los elementos del dominio de tres en tres y presentarlosal experto, con la propuesta de que enuncie una caracter´ ıstica que diferencia a dosde ellos del tercero. Se ha estudiado que cognitivamente este sistema de elecci´n es omucho m´s eficaz, pues el hecho de que se muestren tres elementos evita sesgos que se aproducir´ con dos y ayuda a elaborar los constructos por oposici´n y no por negaci´n. ıan o o No obstante, tambi´n se puede utilizar extracci´n de curvas cerradas, que ya vimos, e oe incluso simplemente entrevistas. Siempre es mejor la t´cnica de las tr´ e ıadas, pero sepuede simultarear con alguna de ´stas (o con ambas) para contrastar, pues siempre ealguna puede funcionar mejor que otra con seg´n qu´ expertos. u e6.9.3. Dise˜ o de la parrilla n Una vez obtenidos elementos del dominio y caracter´ ısticas (constructos), hay quedar valor a la parrilla. Hay varias formas de construirla, que citamos a continuaci´n de omenos a m´s usada: a Dicot´mica o Se clasifica cada Ei dependiendo de si “tiene” o no cj (asignaci´n o binaria). Clasificatoria Se clasifican los n Ei en un intervalo 1..n de forma que vij ∈ [1, n] repre- senta el orden del elemento con respecto al constructo (su proximidad al constructo). Se obtiene de esta manera una escala de clasificaci´n o o vector clasificador. Evaluativa Se elige una escala que se adapte a los elementos y se les clasifica seg´n u ella, pudiendo repetirse valores. Representa c´mo ve el experto al ele- o mento dentro de ese constructo, no siendo en este caso una escalaci´n o de elementos. Ingenier´ del Conocimiento ıa
  • 75. 72 Apuntes – 6. T´cnicas para la adquisici´n del conocimiento e o Estos distintos m´todos de dise˜o de la parrilla no son excluyentes, de hecho, los e nresultados deber´ ser compatibles independientemente de qu´ forma de construcci´n ıan e ous´semos. En general, siempre es preferible una aproximaci´n por rangos a una bina- a oria, ya que hay t´cnicas de aplicabilidad posterior que no son compatibles con datos ebipolares.6.9.4. Formalizaci´n o Una vez dise˜ada la parrilla, tenemos una matriz en la que las filas nos muestran nc´mo var´ una caracter´ o ıa ıstica de un elemento a otro, y las columnas c´mo se compor- otan los elementos en el dominio (seg´n las caracter´ u ısticas seleccionadas). Es decir, latabla indica la participaci´n de un elemento en una caracter´ o ıstica: por columnas, laparticipaci´n de un elemento en todas las caracter´ o ısticas, y por filas, la participaci´n ode todos los elementos en una determinada caracter´ ıstica (constructo): E1 ... Ei c1 v11 ... vi1 . . . . ... . . cj v1j ... vij La parrilla ha de explorarse en dos sentidos, horizontal y vertical, para obtenerdos ´rboles jer´rquicos, uno de elementos y otro de caracter´ a a ısticas, y ver c´mo est´n o arelacionados. Esta fase puede automatizarse completamente.Clasificaci´n de elementos o Analizando la matriz por columnas (elementos), calculamos distancias entre ele-mentos para obtener un ´rbol: a E1 E2 E3 . . . E8 c1 2 3 c2 2 2 c3 4 5 c4 5 4 c5 5 5 ... c6 4 4 c7 2 2 c8 4 2 c9 1 1 asumiendo un rango [1.,5], hay varias formas de calcular las distancias, pero la quese suele usar es la suma de diferencias en valor absoluto de los valores de los elementospara cada caracter´ ıstica:Laura Castro
  • 76. 6.9. La teor´ de constructos personalizados: el Emparrillado ıa 73 d(E1 , E2 ) = d(E2 , E1 ) = 1 + 0 + 1 + 1 + 0 + 0 + 0 + 2 + 0 = 5 De esta manera se obtiene una matriz triangular superior de distancias entre ele-mentos, y para construir el ´rbol (dendrograma) se siguen los pasos que ya vimos en aescalamiento psicol´gico: se buscan los dos elementos m´s pr´ximos, se eliminan de la o a otabla, se agrupan, se recalculan distancias,. . . ).Clasificaci´n de caracter´ o ısticas Para las caracter´ ısticas tambi´n se va a obtener un ´rbol clasificatorio, pero en esta e aocasi´n, como manejamos dos polos, tendremos que calcular dos distancias: o E1 E2 E3 E4 E5 E6 E7 E8 Manejable 2 3 5 2 5 3 3 2 No manejable Deportivo 2 2 2 1 5 2 3 1 No deportivo ¯ Deportivo 4 4 4 5 ¯ 1 4 3 5 N odeportivo . . . ... La regla de c´lculo es la misma: a d1 (ci , cj ) = 0 + 1 + 3 + 1 + 0 + 1 + 0 + 1 = 7 d2 (ci , cj ) = d1 (ci , cj ) ¯ d2 (ci , cj ) = 2 + 1 + 1 + 3 + 4 + 1 + 0 + 3 = 15 donde cj se calcula a partir de cj . Si se aplic´ una construcci´n dicot´mica al ¯ o o oelaborar la parrilla, simplemente se cambian los “polos” (se otorgan los valores com-plementarios); si fue clasificatoria, se invierte el orden, y si fue evaluativa, se siguemisma din´mica que en el siguiente ejemplo: a cj 1 2 3 4 5 cj ¯ 5 4 3 2 1 Una vez calculadas las dos distancias para cada par de caracter´ ısticas por elemento,tendremos una matriz construida de la siguiente forma: E1 E2 ... En .. c1 . d1 (ci , cj ) c1 ¯ c2 c2 ¯ . . .. . d1 (ci , cj ) = d2 (ci , cj ) ¯ . .. ci . ci ¯ Ingenier´ del Conocimiento ıa
  • 77. 74 Apuntes – 6. T´cnicas para la adquisici´n del conocimiento e o donde la submatriz superior son las distancias “directas” (d1 ) y la submatriz infe-rior, las distancias “inversas” (d2 ). El paso a una matriz triangular superior se consigue eligiendo la distancia m´ ınimade las dos (d1 , d2 ), y a partir de ah´ para obtener el dendrograma el proceso es el que ıya conocemos.6.9.5. An´lisis y estudio de los resultados obtenidos a Fundamentalmente, debemos analizar los ´rboles de elementos y caracter´ a ısticas.Estudiando el primero de ellos, los problemas posibles que podemos encontrar son: √ Dos elementos est´n muy juntos en el ´rbol y el experto afirma que a a no deber´ ıan. → Debemos comprobar que los valores de la parrilla son correctos y que los c´lculos est´n bien hechos. a a → Falta una caracter´ıstica diferenciadora en la parrilla. √ Dos elementos est´n muy separados en el ´rbol y el experto afirma a a que no deber´ ıan. → Debemos comprobar que los valores de la parrilla son correctos y que los c´lculos est´n bien hechos. a a → Falta una caracter´ıstica conciliadora en la parrilla. √ Dos caracter´ ısticas (constructos) aparecen muy ligadas y no deber´ ıan, seg´n el experto. u → Debemos comprobar que los valores de la parrilla son correctos y que los c´lculos est´n bien hechos. a a → Falta un elemento diferenciador (que participa de una y no de la otra) en la parrilla. Por su parte, en el ´rbol de caracter´ a ısticas se estudian tambi´n las caracter´ e ısticaspor pares, empezando por las m´s pr´ximas, buscando relaciones entre ellas. El objetivo a oes afinar el polo. Paralelas Son caracter´ ısticas (A, B) y (X, Y ) que se comportan: A → X B → Y como por ejemplo (F amiliar, Coupe) y (Habitable, N oHabitable), ya que F amiliar → Habitable Coupe → N oHabitableLaura Castro
  • 78. 6.9. La teor´ de constructos personalizados: el Emparrillado ıa 75 sin embargo Habitable F amiliar N oHabitable Coupe En estos casos, de acuerdo con el experto, se pueden resumir ambas caracter´ ısticas en una que mantenga este comportamiento.Rec´ ıprocas Son caracter´ ısticas (A, B) y (X, Y ) que se comportan: A ↔ X B ↔ Y como se da por ejemplo en el caso de (GranCilindrada, P ocaCilindrada) y (P otente, P ocoP otente), pues GranCilindrada ↔ P otente P ocaCilindrada ↔ P ocoP otente En estos casos las caracter´ ısticas son t´ ıpicamente redundantes, puede eliminarse una de ellas o resumir ambas en una nueva.Ortogonales Son caracter´ ısticas (A, B) y (X, Y ) que se comportan: A → X A Y A → X o B Y B → X B Y como por ejemplo (Deportivo, N oDeportivo) y (N ervioso, P esado), ya que Deportivo → N ervioso Deportivo P esado N oDeportivo N ervioso N oDeportivo P esado En este caso o bien uno de los polos implica relaci´n, o bien ambos im- o plican una, el caso es que alg´n polo queda “suelto” (permite eliminar u uno de los polos).Ambiguas Son caracter´ ısticas (A, B) y (X, Y ) que se comportan: A → X A → X A → Y B → X o B → X B → Y B → Y Ingenier´ del Conocimiento ıa
  • 79. 76 Apuntes – 6. T´cnicas para la adquisici´n del conocimiento e o como por ejemplo (Seguro, Ligero) y (Deportivo, N oDeportivo), ya que Deportivo → Seguro Deportivo → Ligero N oDeportivo → Seguro N oDeporitvo → Ligero No queda muy clara la relaci´n entre las caracter´ o ısticas (alguno de los polos no est´ bien definido), se puede estudiar si es posible cambiar a alguna de ellas. Tambi´n se suelen construir ´rboles de por qu´ y c´mo, que sirven para obtener e a e osubconjuntos y superconjuntos de caracter´ ısticas. Deportivo BuenaVelocidad Rapido Potente Nervioso BuenFreno (a) Ejemplo de ´rbol por qu´. a e Viajero (Familiar) Confortable Seguro Silencioso Habitable BuenaSuspension Frenos Carroceria Repris (b) Ejemplo de ´rbol c´mo. a o El emparrillado es, por tanto, como ya hemos dicho, util en clasificaci´n o para ´ ocatalogar expertos. Ayuda tambi´n en ´mbitos de incertidumbre, o a la validaci´n. e a o Sus problemas residen en que los datos aportados por el experto son subjetivos, per-sonales (surgir´n distintas parrillas con diferentes expertos; el grado de distanciamiento aentre ellos marca su nivel de similitud).Laura Castro
  • 80. 6.10. T´cnicas especiales de adquisici´n de conocimiento en grupo e o 776.10. T´cnicas especiales de e adquisici´n de conocimiento en grupo o Para cerrar este cap´ ıtulo hablaremos de una serie de t´cnicas especiales a usar cuan- edo queremos trabajar con un grupo de expertos al mismo tiempo. Sus ventajas e inconvenientes ya fueron mencionados cuando hablamos de las en-trevistas m´ltiples (p´gina 58): el precio de obtener una bases de conocimiento m´s u a acompletas y tener la seguridad de que se han tratado todos los aspectos relevantes deldominio/problema es la introspecci´n y el esfuerzo general por ambas partes. o Las t´cnicas de adquisici´n de conocimiento en grupo m´s destacables son: e o a 1. Tormenta de ideas (brainstorming). 2. T´cnica nominal de grupo. e 3. M´todo Delphi. e 4. Entrevistas. 5. Emparrillado. 6. Escalamiento psicol´gico. o6.10.1. Tormenta de ideas (Brainstorming ) En adquisici´n del conocimiento, para aplicar esta popular t´cnica, basada en la o eopini´n sajona de que la cantidad mejora la calidad, intentaremos tener varios tipos ode expertos e ingenieros de conocimiento, que expondr´n sus ideas (con una breve aexplicaci´n) sin ning´n tipo de cr´ o u ıtica. Suele ser favorable la presencia de un moderadory su utilidad es manifiesta en dominios en los que se requiere inventiva. Una vez recopiladas las ideas, se llevan a cabo una serie de cribas. Las primeras sesuelen basar en la aplicabilidad inmediata de la soluci´n propuesta, el ajuste con res- opecto a restricciones existentes (de tiempo, de coste,. . . ), la compatibilidad con otrosaspectos del problema (que no supongan conflictos con otros elementos ya implemen-tados/implantados, etc). Reducida la lista, en ultimo caso se puede elegir la definitiva ´por votaci´n. o6.10.2. T´cnica nominal de grupo e Esta t´cnica es exactamente igual que la anterior, pero en ella las ideas se exponen epor escrito. Es mejor cuando hay gente t´ ımida en el grupo, o que no acepta cr´ ıticas,aplicable fundamentalmente cuando se trata con poca gente.6.10.3. M´todo Delphi e El m´todo Delphi tambi´n es un m´todo por escrito, basado en cuestionarios con- e e efeccionados por los ingenieros de conocimiento sobre aspectos del problema que sepresentan a distintos tipos de expertos. Ingenier´ del Conocimiento ıa
  • 81. 78 Apuntes – 6. T´cnicas para la adquisici´n del conocimiento e o Los expertos responder´n el cuestionario de forma an´nima, y tambi´n a un cues- a o etionario sobre los cuestionarios (¿son las preguntas relevantes? ¿importantes? ¿sobran?¿faltan? ¿cu´les?). Esto ayuda a refinarlos, acometiendo una segunda vuelta acom- apa˜ada de los resultados de la anterior (media y varianza —primer y tercer cuartil—). nSe repite iterativamente (aunque con dos vueltas suele ser suficiente) hasta obtener unarespuesta m´s o menos homog´nea —acuerdo—. Si existen dispersiones importantes, a ehabr´ que pasar a algo no an´nimo para identificar el problema, aunque no suele ser ıa onecesario.Laura Castro
  • 82. Cap´ ıtulo 7Evaluaci´n de los sistemas basados oen conocimiento La evaluaci´n de los Sistemas Basados en Conocimiento consta de 4 aspectos que opodemos estudiar: Verificaci´n o Trata de estudiar la correcci´n formal de nuestro sistema, algo que o puede hacerse tanto durante el desarrollo como al final del mismo. De los cuatro aspectos, es el unico criterio est´tico. La mayor´ de ´ a ıa las herramientas, como por ejemplo Nexpert incluyen correcci´n de o sintaxis. Validaci´n o Se trata de ver si el sistema es correcto, si contempla todos los casos, si el modelo computable es v´lido. Para poder realizarse, el sistema a debe estar funcionando, por tanto. No es suficiente realizar validaci´no por m´dulos, es imprescindible una prueba global integrada. o Usabilidad Usabilidad y Utilidad son conceptos relativamente recientes, influencia de la ingenier´ del software. El primero representa la satisfacci´n que ıa o tiene el usuario con el sistema, la interfaz, el tipo de respuestas, su redacci´n, adecuaci´n a su nivel, etc. Es, pues, un criterio din´mico o o a (el sistema debe estar funcionando). Utilidad Por ultimo, la utilidad es un criterio tambi´n din´mico que intenta ´ e a analizar el cambio/mejoras que se producen en el entorno/empresa en que se introduce el sistema, ver si satisface las expectativas. Se repasan las propuestas realizadas con el modelo de organizaci´n/contextual o (motivos que impulsaron al desarrollo del sistema) y se comprueba si se han cumplido. 79
  • 83. 80 ¿VALOR DE UN CRITERIO?Laura Castro Correccion Validez Usabilidad Utilidad Criterios Inspeccionar y Revisar Comparar Uso del sistema por el modelo formal Hacer resolver el sistema con parte del usuario Realizacion del trabajo o computable al sistema un caso los requisitos segun un escenario rutinario con el nuevo en busca del error de prueba establecidos al inicio y expresion de su tandem: usuario + sintactico establecido de la construccion opinion software e o Opinion del usuario Comparacion con la situacion anterior Tecnicas de Valoracion sobre el criterio a la instalacion del software se no se no fue fue capaz el sistema el sistema La nueva La nueva o encontraron encontraron capaz de tratar no cumple cumple los ¿V minimo? situacion situacion no errores errores de tratar el caso los requisitos es mejor es mejor el caso requisitos Posibles Valores corregir seguir con la ampliar la respuesta la respuesta reformar seguir con la reformar seguir el proyecto el proyecto Figura 7.1: T´cnicas de valoraci´n para SS.EE. la sintaxis construccion los no fue exacta fue exacta el sistema construccion el sistema con la ha sido un no ha sido conocimientos o la construccion exito un exito interface ajustar los seguir conocimientos con la Apuntes – 7. Evaluaci´n de los sistemas basados en conocimiento construccion Actuacion tras la evaluacion
  • 84. PLANO DE LA REALIDAD PRACTICA REAL ORGANIZACION Sw+Usuario UTILIDAD Utilidad: Usabilidad: Validacion: Verificacion: REALIDAD o CONTROLADA Casos USUARIO de Requisitos Prueba Sw USABILIDAD Amplia el entorno al usuario. VALIDACION VALIDACION (Completitud (Correspondencia) Aspectos mas internos del sistema. y Exactitud) Valora el sistema en el mundo exterior. Modelo Modelo Modelo Conceptual Formal Computable Aspectos del contexto en un entorno "controlado". ıa o VERIFICACIONFigura 7.2: Relaci´n entre los distintos tipos de evaluaci´n. (Redundancia, Incompletitud, Inconsistencia) PLANO DE LA CONSTRUCCION Ingenier´ del Conocimiento 81
  • 85. 82 Apuntes – 7. Evaluaci´n de los sistemas basados en conocimiento o7.1. Verificaci´n y validaci´n o o7.1.1. Sistemas de verificaci´n autom´tica o a Todos las pruebas de verificaci´n de software est´ndares que existen en ingenier´ o a ıadel softwae son aplicables a los SBC y SSEE, aunque son necesarias algunas a mayores.Existen, como hemos mencionado, herramientas que proporcionan verificaci´n simple ode estructuras, principalmente sint´ctica. La mayor´ de los sistemas de verificaci´n a ıa oautom´tica son para sistemas basados en reglas y suelen controlar: a Inconsistencias.- Pueden aparecer por propio error o al trabajar varios ingenieros sobre una misma base de conocimientos. Base Conocimientos + Base Hechos ⇒ P ∧ ¬P atributo(a, x) ∧ atributo(a, y) ⇒ C Redundancias.- Pueden ser o no determinantes (puede haber que elimi- narlas o ser correctas/necesarias en nuestro sistema), reduciendo sobre todo la eficiencia. Ri ) α ⇒ β Ri ) α ⇒ β Rj ) β ⇒ γ Rj ) α ⇒ β Rk ) γ ⇒ θ Rr ) α ⇒ θ Subsunci´n.- Si las conclusiones de dos reglas son iguales y las premisas o de las condiciones son una un subconjunto de la regla se dice que hay subsunci´n. Es decir, una regla est´ subsumida en otra si ambas tienen o a la misma conclusi´n y las premisas de una son un subconjunto de las o premisas de la otra (que es m´s general). Igual que en el caso anterior, a pueden querer eliminarse o no, dependiendo del caso. Cadenas circulares.- Son situaciones del tipo: α ∧ η0 ⇒ β1 η0 ∧ β1 ⇒ β2 ... ηn−1 ∧ βn ⇒ α Reglas no disparables.- Si las premisas que tiene una regla nunca son una conclusi´n de otra ni son hechos iniciales, la regla en cuesti´n nun- o o ca se activar´. Con frecuencia es un error debido a que se escribi´ mal a o esa regla o por falta de conocimiento (m´s reglas). a Conclusiones no alcanzables.- Si la conclusi´n de una regla no es parte o de un antecedente de otra regla (por ejemplo, en encadenamiento re- gresivo) nunca se llegar´ a ella. Igual que en el caso anterior (de hecho, a se pueden considerar un tipo especial de reglas no disparables), o bien est´ mal escrita, o bien falta conocimiento. aLaura Castro
  • 86. 7.1. Verificaci´n y validaci´n o o 83 Completitud.- Si la base de conocimientos no est´ completa puede dar- a se la situaci´n en que no hayamos alcanzado ninguna conclusi´n y o o tampoco quede ninguna regla por ejecutar.Hay cuatro tipos principales de sistemas de verificaci´n autom´tica: o a √ Sistemas de verificaci´n tabular: se basan en la colocaci´n de las reglas o o en tablas, agrup´ndolas por las conclusiones (en una misma fila, la a primera columna contiene una conclusi´n ci y la segunda, las reglas o que concluyen algo sobre ci ), para comprobar posteriormente, dos a dos, la estructura de dichas reglas, pudiendo as´ detectar redundancias ı e incluso inconsistencias (si adem´s de ci tienen en cuenta la negaci´n a o de ci ). √ Sistemas de propagaci´n de restricciones: toman un conjunto de he- o chos iniciales e intermedios lo m´s completo posible y lo propagan a por el sistema a trav´z de sus restricciones, comprobando el resultado e (analizando si hay redundancias, etc). √ Sistemas de verificaci´n basados en redes de Petri: combierten la base o de conocimientos de reglas en una red de Petri , en la que hip´tesis y o conclusiones son nodos y las transiciones representan reglas. Estas re- A R1 G B Figura 7.3: Ejemplo de red de Petri. des sirven para comprobar la accesibilidad de las conclusiones, ya que son expresables en forma de sistemas de ecuaciones lineales. Adem´s, a una vez se dispone del sistema de ecuaciones, si se introduce una in- consistencia y el sistema tiene soluci´n, significa que el sistema tiene o inconsistencias (est´ mal); por el contrario, si no la tiene, es que el a sistema es correcto. El peor inconveniente de este tipo de sistemas de verificaci´n es que o su complejidad es exponencial, aunque a pesar de ello son de los m´s a empleados. √ Sistemas de verificaci´n basados en grafos dirigidos: a partir de la o base de reglas construyen un grafo dirigido en el que los nodos son los hechos (iniciales, intermedios y conclusiones) y las reglas los arcos, de forma que existir´ un arco si y s´lo si existe una regla que ligue ambos a o hechos/nodos. A partir del grafo se calculan las matrices de adyacencia y de la traza de la matriz se analiza si ´sta indica la existencia de caminos que no e se deber´ dar, se pueden detectar redundancias, circularidad, etc. ıa Ingenier´ del Conocimiento ıa
  • 87. 84 Apuntes – 7. Evaluaci´n de los sistemas basados en conocimiento o7.1.2. Validaci´n o En el proceso de validaci´n es deseable que se involucre un amplio perfil de co- olaboradores, no s´lo los ingenieros de conocimiento desarrolladores del sistema, sino otambi´n los expertos y uno o varios de los usuarios finales, cuya opini´n tambi´n es e o eimportante, casi tanto como la de los propios expertos si son ellos quienes lo van a usar. Como ya se ha mencionado, no s´lo hay que validar el resultado final (que, en el opeor de los casos, puede ser esp´reo), sino si cada paso, paso intermedio, consejo, etc. uque da el sistema lo hace de forma correcta. Tambi´n es clave que la forma de razona- emiento sea la correcta, es decir, que el camino que sigue el sistema para llegar a unaconclusi´n sea el mismo que utiliza el experto (a no ser que est´ justificado, por ejemplo, o eporque la forma proceder actual sea incorrecta), pues lo hace m´s usable. Asimismo es aimportante respetar el tipo de lenguaje que se usa, las expresiones, e incluso cuestionescomo que si el usuario no entiende algo que le comunica el sistema (por ejemplo, unapregunta), que ´ste pueda rehacer el mensaje de otra manera. Y, por supuesto, evitar emensajes de error alarmantes, facilitar la recuperaci´n de sesiones y asegurar los pasos oque se dan mediante ventanas de confirmaci´n. o Hay que ser cuidadosos en c´mo se realiza la validaci´n: debe comunicarse al per- o osonal involucrado cu´nto se estima que va a durar (intervalo temporal realista), la ametodolog´ y pasos que se deber´n seguir, as´ como las expectativas del proceso, evi- ıa a ıtando en la medida de lo posible que se convierta en una tarea tediosa.Referencias est´ndar de los SBC a El problema de la validaci´n es que hay que hacerla con respecto a una referencia. oTanto SBC como SSEE no se dedican a cosas cuyo resultado se conozca siempre per-fectamente si es correcto o no, es decir, la necesaria referencia est´ndar (tambi´n a ellamada en ocasiones regla de Oro) puede no existir, o bien existir una referencia perono ser completamente est´ndar, como sucede si la referencia es el experto o un grupo ade expertos, que pueden no estar de acuerdo y ¿c´mo se sabe qui´n tiene raz´n? La o e ocompensaci´n que tiene disponer de varios expertos (que deber´ ser siempre de un o ıanmismo “nivel”) es que se puede clasificar el sistema con respecto al tipo de expertosal que se ajusta, siendo, obviamente, preferible que no se ajuste s´lo a aqu´l que m´s o e aayud´ al desarrollo del mismo. o En caso de definir un est´ndar, debe ser realista, no se puede pretender que el sis- atema vaya m´s all´ de unos determinados niveles. a a Para eliminar sesgos y desviaciones suelen ser utiles los estudios ciegos, en los ´que los expertos dan su opini´n sobre respuestas del propio sistema y otros colegas, sin oidentificar de qui´n provienen, ante un problema. Sea como fuere, en toda validaci´n e oes necesario efectuar m´s de una iteraci´n. a o Puede suceder que haya en el sistema/contexto/problema variables m´s importan- ates que otras, que necesitamos con m´s urgencia que funcionen bien, lo que puede aestablecernos una secuencia de validaci´n por prioridades, hacia el ajuste fino. oLaura Castro
  • 88. 7.1. Verificaci´n y validaci´n o o 85 Otro aspecto clave es mantener los problemas relacionados con la usabilidad almargen de los problemas identificados en la validaci´n, esto es, relativos a las bases de oconocimiento.M´todos de validaci´n e o Existen dos grandes tipos de m´todos de validaci´n: e o M´todos cualitativos e ◦ Validaci´n retrospectiva (contra casos hist´ricos). o o ◦ Validaci´n prospectiva (contra casos del d´ a d´ o ıa ıa). ◦ Test de Turing (validaciones an´nimas en varias iteraciones). o ◦ Validaci´n de subsistemas semiindependientes. o M´todos cuantitativos (fundamentalmente m´todos estad´ e e ısticos) ◦ Tanto por ciento de acuerdo. ◦ ´ Indice kappa. Ingenier´ del Conocimiento ıa
  • 89. Ap´ndice A eAmpliaciones En este ap´ndice se reproducen algunas de las figuras que intercalan el texto de los ecap´ ıtulos de estos apuntes, en un mayor nivel de detalle.A.1. Figuras Detalle de la figura 1.1 (p´gina 4): a 87
  • 90. 88 Apuntes – A. Ampliaciones BASE DE CONOCIMIENTOS DECLARATIVOS − Conocimientos del dominio − Objetos y relaciones MOTOR DE INFERENCIAS − Definiciones del vocabulario − Hechos disyuntivos y/o inciertos − Encadenamiento adelante/atras − Situaciones tipicas: estadisticas y − Unificacion, equiparacion descripciones de la dinamica del − Propagacion de restricciones comportamiento − Gestion de prioridades − Suposiciones − Agenda − Hipotesis − Pizarra − Restricciones − Razonamiento hipotetico − Taxonomias − Resolucion − Induccion OPERATIVOS o DE ACCION − Demonios − Meta−control − Procesos de solucion − Gestion de incertidumbre − Reglas operativas − Calculos matematicos − Heuristicas − Ejemplos de soluciones METACONOCIMIENTOS − Semantica situacional − Razonamiento de sentido comun − Metarreglas − Aprendizaje − Tareas genericas de solucion de problemas Explicacion y Hechos y datos − Clasificacon y construccion de hipotesis especificos y planes de solucion de problemas consejos pre−compilados INTERFAZ DE COMUNICACION, EXPLICACION Y ADQUISICION DE CONOCIMIENTO SUBSISTEMA DE USUARIO SUBSISTEMA DE EXPLICACION SUBSISTEMA DE ADQUISICION DEL CONOCIMIENTO − Menus − ¿Como? − Graficos − ¿Por que? − Procesado de palabras − ¿Que sucede si...? − Entrada en linea − Ayuda − Herramientas de depuracion de la BC − Librerias de casos y ejemplos − Animacion − Control de la inferencia Usuario Ingenieria del Conocimiento Figura A.1: Esquema detallado de un SBC.Laura Castro
  • 91. ´Indice de cuadros 1.1. Diferencias entre dato, informaci´n y conocimiento . . . . . . . . . . . o 1 4.1. Nombres est´ndar de las Funciones de Transferencia. a . . . . . . . . . . 25 4.2. Tareas Anal´ ıticas vs. Tareas Sint´ticas. . . . . . . . . e . . . . . . . . . . 30 4.3. Tipos de comunicaci´n. . . . . . . . . . . . . . . . . . o . . . . . . . . . . 37 4.4. Sem´ntica de algunos tipos de comunicaci´n. . . . . . a o . . . . . . . . . . 38 6.1. Dec´logo del Ingeniero de Conocimiento. . . . a . . . . . . . . . . . . . . 55 6.2. M´todos de Adquisici´n del Conocimiento. . . e o . . . . . . . . . . . . . . 56 6.3. Clasificaci´n de los M´todos de Adquisici´n de o e o Conocimiento. . . . . . 57 6.4. Ejemplo de aplicaci´n de EDM. . . . . . . . . o . . . . . . . . . . . . . . 64 6.5. Ejemplo de clustering (I). . . . . . . . . . . . . . . . . . . . . . . . . . 66 6.6. Ejemplo de redes ponderadas. . . . . . . . . . . . . . . . . . . . . . . . 68 6.7. Esquema de una parrilla. . . . . . . . . . . . . . . . . . . . . . . . . . . 70 89
  • 92. ´Indice de figuras 1.1. Esquema de un SBC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2.1. IS vs. IC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.2. Esquema de la metodolog´ de desarrollo incremental. ıa . . . . . . . . . . 8 2.3. Esquema de la metodolog´ en cascada. . . . . . . . . ıa . . . . . . . . . . 11 2.4. Niveles de la metodolog´ CommonKADS. . . . . . . ıa . . . . . . . . . . 11 3.1. Modelo de la Organizaci´n. . . . . . . . . . . . . . . . . . . . . . . . . o 16 4.1. Categor´ en el modelo del Conocimiento. . . . . . . . . ıas . . . . . . . . 19 4.2. Constructos del modelo del Conocimiento. . . . . . . . . . . . . . . . . 20 4.3. Relaciones en el modelo del Conocimiento. . . . . . . . . . . . . . . . . 21 4.4. Ejemplos de representaci´n de Tipos de Regla. . . . . . . o . . . . . . . . 22 4.5. Ejemplo de representaci´n de Base de Conocimientos. . . o . . . . . . . . 23 4.6. Elementos del Conocimiento Inferencial. . . . . . . . . . . . . . . . . . 24 4.7. Ejemplo de Inferencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 4.8. Ejemplo de Mapa Inferencial. . . . . . . . . . . . . . . . . . . . . . . . 26 4.9. Elementos del Conocimiento de la Tarea. . . . . . . . . . . . . . . . . . 27 4.10. Ejemplo de esquema de un posible M´todo de la Tarea. . e . . . . . . . . 28 4.11. Gu´ para el modelado del Conocimiento. . . . . . . . . . ıa . . . . . . . . 30 4.12. Relaci´n del modelo de Comunicaci´n con otros modelos. o o . . . . . . . . 34 4.13. Estructura del modelo de Comunicaci´n. . . . . . . . . . o . . . . . . . . 35 4.14. Estructura general de un Diagrama de Di´logo. . . . . . a . . . . . . . . 37 4.15. Esquema de la estructura de una transacci´n (CM-1). . . o . . . . . . . . 37 5.1. Del an´lisis al dise˜o en CommonKADS. . . . . . . . . . . . . . . . . . a n 41 5.2. Pasos en la construcci´n del modelo de Dise˜o. . . . . . . . . . . . . . . o n 43 5.3. Esquema del Model View Controller. . . . . . . . . . . . . . . . . . . . 44 6.1. Primer escenario de adquisici´n del conocimiento. . o . . . . . . . . . . . 52 6.2. Segundo escenario de adquisici´n del conocimiento. o . . . . . . . . . . . 52 6.3. Tercer escenario de adquisici´n del conocimiento. . o . . . . . . . . . . . 53 6.4. Cuarto escenario de adquisici´n del conocimiento. . o . . . . . . . . . . . 53 6.5. Ejemplo de clustering (y II): dendrograma. . . . . . . . . . . . . . . . . 67 7.1. T´cnicas de valoraci´n para SS.EE. . . . . . . . . . . . . . . . . . . . . e o 80 7.2. Relaci´n entre los distintos tipos de evaluaci´n. . . . . . . . . . . . . . o o 81 91
  • 93. 92 Apuntes – A. Ampliaciones 7.3. Ejemplo de red de Petri. . . . . . . . . . . . . . . . . . . . . . . . . . . 83 A.1. Esquema detallado de un SBC. . . . . . . . . . . . . . . . . . . . . . . 88Laura Castro
  • 94. Bibliograf´ ıa[1] Alonso Betanzos, Amparo. Apuntes de clase.[2] Vicente Moret, Amparo Alonso, et al. Fundamentos de Inteligencia Artificial. Ser- vicio de Publicaciones de la Universidad de La Coru˜a, 2000. n 93
  • 95. ´Indice alfab´tico econocimiento, 1 de adquisici´n, 56 o adquisici´n, 51 o de despliegue, 56 an´lisis de protocolos, 59 a estructuradas, 56 brainstorming, 77 no estructuradas, 56 clustering, 65 experto constructos personalizados, 69 acad´mico, 51 e cuestionarios, 61 pr´ctico, 51 a curvas cerradas, 62 te´rico, 51 o entrevistas, 56 escalamiento multidimensional, 63 informaci´n, 1 o escalamiento psicol´gico, 62 o metodolog´ıa escenarios, 51 CommonKADS, 10 m´todo delphi, 77 e desarrollo incremental, 8 movimiento de ojos, 61 en cascada, 8 observaci´n directa, 62 o en espiral, 8 redes ponderadas, 68 prototipado r´pido, 7 a t´cnica nominal, 77 e modelo t´cnicas especiales, 77 e de agentes, 12, 16 categor´ 18 ıas, de comunicaci´n, 12, 34 o de la tarea, 26 de conocimiento, 12, 17 del dominio, 20 construcci´n, 30 o especificaci´n, 31 o documentaci´n, 34 o identificaci´n, 31 o plantillas, 29 inferencial, 23 validaci´n, 33 o ingenier´ del, 2 ıa de dise˜o, 12, 41 n p´blico, 2 u de organizaci´n, 10, 15 o privado, 2 de tareas, 12, 16 refinamiento, 33 semip´blico, 2 u nivel sistema basado en, 3 de concepto, 12constructos, 20 de contexto, 13 de implementaci´n, 12 odato, 1 nivel de contexto, 10dendrograma, 65 pathfinder, 68EDM, 63 Petriemparrillado, 69 red de, 83entrevistas plan de comunicaci´n, 36 o 94
  • 96. referencia est´ndar, 84 areglas cadenas circulares, 82 completitud, 83 conclusiones no alcanzables, 82 inconsistencia, 82 no disparables, 82 redundancia, 82 subsunci´n, 82 oSBC, 3 evaluaci´n, 79 osoftware ingenier´ del, 2 ıatr´ ıadas, 71transacci´n, 36 ousabilidad, 79utilidad, 79validaci´n, 79, 84 overificaci´n, 79 o 95

×