Monografia ontologias - Primera Aproximación

3,284 views
3,172 views

Published on

0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
3,284
On SlideShare
0
From Embeds
0
Number of Embeds
649
Actions
Shares
0
Downloads
97
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Monografia ontologias - Primera Aproximación

  1. 1. Monografía: Ontologías,Primera AproximaciónProyecto: Repositorio Ontológico para Investigadores Novelesbasado en Semánticas Web y Objetos de AprendizajeEntidad Ejecutora: Universidad Nacional del Chaco AustralDirectora: DURAN Elena Beatriz Ferreiro deInvestigadora: ZACHMAN Patricia PaolaEstudiantes: NUÑEZ Juan Francisco, UMAÑO Marcos René Año 2012
  2. 2. Ontologías, Primera Aproximación Universidad Nacional del Chaco AustralResumen La enorme revolución y avance que supuso el uso generalizado de Internet impulsóel intercambio de información personal, académica y comercial. La Web está a punto desufrir un nuevo cambio: la información que aparece en Internet va a poder interpretarse porlos ordenadores sin necesidad de intervención humana, es la denominada Web Semántica.Para que esto ocurra, es necesario que la información de las páginas web se codifiquemediante ontologías. Las ontologías representarán el conocimiento de Internet, definiendoformalmente los conceptos de los diferentes dominios y sus relaciones, con capacidad pararealizar deducciones con este conocimiento.Introducción La ingeniería del conocimiento, y en particular el procesamiento de ontologías, sonunos de los problemas en los que más se está centrando la atención en la informática actual.La razón principal es la emergencia de un nuevo conjunto de aplicaciones en las que lasontologías juegan un papel fundamental, la mayoría de las cuales se encuentran en doscampos: la última generación de sistemas para la Web (Web 2.0, Web Semántica) y lanecesidad de integración de aplicaciones empresariales cada vez más distribuidas. La Web surge como una manera de compartir información, en forma de documentosestáticos, entre una comunidad científica muy específica [Ber90]. Sin embargo, desde sugénesis hasta la actualidad no ha dejado de ofrecer nuevas posibilidades y usos no previstosinicialmente, pudiendo considerarse sus repercusiones técnicas y sociales como unaauténtica revolución a finales del siglo XX y comienzos del XXI. Su éxito provino de su conectividad total gracias a su facilidad de acceso, sudescentralización, su compatibilidad y las facilidades que otorga para que se compartaconocimiento y recursos. Por contrapartida, a medida que fue creciendo, también poseelimitaciones: crecimiento caótico de los recursos, falta de orden y de organización, altocosto y dificultad en su mantenimiento (enlaces perdidos, páginas inexistentes o muertas,…), crecimiento de la Web Oculta o Web Profunda (Hidden Web o Deep Web)1,buscadores eficientes pero limitados, y algo muy importante, la dificultad delprocesamiento automático. Ante esto, surge la necesidad de que los contenidos de la Web no estén pensadossolamente para que los lea un ser humano, sino para que también sea interpretado por algún 1 Se trata básicamente de herramientas de búsqueda especializada en sitios poco frecuentados por los buscadores más tradicionales. Entre estas fuentes pueden destacarse directorios sectoriales, bases de datos accesibles en línea (a menudo denominadas Deep Web) o páginas de difícil acceso. Según algunas estimaciones, la Web Oculta puede ser en torno a 500 veces la Web Visible. Por ello el saber acceder al resto de los recursos puede ser una importante ventaja competitiva en términos de acceso a la información. La clave es, por tanto, disponer de las herramientas adecuadas, así la verdadera cara oculta de la Web Oculta está en la conversión que cada cual puede hacer de esa información en un verdadero conocimiento. 2
  3. 3. Ontologías, Primera Aproximación Universidad Nacional del Chaco Australsistema informático de forma significativa. Por ello surge el concepto de Web Semántica. La Web Semántica trata de dotar de una estructura semántica a los contenidossignificativos de la Web, creando un entorno en el que aplicaciones de software naveguenlas páginas realizando complejas tareas para los usuarios. No es una nueva Web segregada de la actual. Es una extensión de la actual en la quela información se ofrece con un significado bien definido, permitiendo a ordenadores ypersonas trabajar de forma cooperativa. La idea que existe detrás de la Web Semántica es tener datos en la Web definidos yenlazados de manera que puedan ser usados de forma más efectiva para un descubrimiento,una automatización, una integración y una reutilización entre diferentes aplicaciones. Paraello la Web debe evolucionar, ofreciendo una plataforma accesible que permita que losdatos se compartan y se procesen por herramientas automatizadas o personas. El reto, es ofrecer el lenguaje que exprese tanto datos como reglas para razonarsobre los datos, y además permita que las reglas sobre cualquier sistema de representacióndel conocimiento sean exportadas a la Web, aportando un importante grado de flexibilidady frescura a los sistemas de representación de conocimiento centralizados tradicionales, quese vuelven sumamente agobiantes, crecen rápidamente de tamaño y se vuelveninmanejables. Diferentes sistemas web pueden utilizar diferentes identificadores para un mismoconcepto. Así, un programa que quiera comparar o combinar información entre dichossistemas tiene que conocer qué términos significan lo mismo. Idealmente, el programadebería tener una forma de descubrir los significados comunes de cualquier base de datosque encuentre. Una solución a este problema es incluir un nuevo elemento a la WebSemántica, colecciones de información denominadas ontologías. Una ontología es unaherramienta conceptual que define un vocabulario común para quien necesita compartirinformación dentro de un determinado dominio. Esto incluye definiciones de los conceptosbásicos del dominio, así como sus relaciones, que tienen que ser interpretables pormáquinas [Noy00]. Una ontología no es más que una especificación de lo que existe en un dominio,convirtiéndose éstas en una pieza fundamental de las tecnologías orientadas a la WebSemántica. Sin embargo, es un término que ha recibido diferentes acepciones einterpretaciones en distintas disciplinas, aunque este efecto también se ha dado dentro de lamisma área de conocimiento, como por ejemplo en la inteligencia artificial. Esta aparición de nuevas aplicaciones ha motivado que el concepto informático deontología, desarrollado durante las últimas tres décadas por una comunidad relativamentepequeña de investigadores, haya ganado repentinamente mucha visibilidad, lo que ha 3
  4. 4. Ontologías, Primera Aproximación Universidad Nacional del Chaco Australcausado no pocas fricciones al formarse equipos multidisciplinares, cuyos miembros noinformáticos poseen un bagaje investigador en el que ontología tiene connotaciones muydiferentes. El objetivo de este trabajo es dar una visión general de la tradición derepresentación del conocimiento, que ha dado lugar al concepto actual de ontología eninformática. Definiremos qué es una ontología, cómo se puede diseñar, cómo se puedeespecificar y relacionarlas con la Web Semántica. A partir de esta base, introduciremos los principios en los que se basan los sistemasactuales de representación en los que se basan los sistemas actuales de representacióninformática de ontologías, y representaremos como ejemplo el sistema de Protégé, que tienecomo gran ventaja el hecho de soportar simultáneamente múltiplos paradigmas derepresentación del conocimiento.El Intercambio de Conocimientos en la Web Semántica En los últimos años, muchos investigadores están diseñando modelos paratransformar la red desde un espacio de información a un espacio de conocimientos.Recientemente, Tim Berners-Lee, uno de los inventores de la Web, defiende el desarrollode la Web con conocimientos [Ber99], y organizaciones como SematicWeb2 se encargan deestandarizar lenguajes y herramientas para hacer efectiva la web semántica. Pero, ¿qué sepuede hacer en la web semántica? La idea es que los datos puedan ser utilizados y “comprendidos” por losordenadores sin necesidad de supervisión humana, de forma que los agentes web puedanser diseñados para tratar la información situada en las páginas web de manerasemiautomática.Se trata de convertir la información en conocimiento, referenciando datos dentro de laspáginas web a metadatos con un esquema común consensuado sobre algún dominio. Losmetadatos no sólo especificarán el esquema de datos que debe aparecer en cada instancia,sino que además podrán tener información adicional de cómo hacer deducciones con ellos,es decir, axiomas que podrán aplicarse en los diferentes dominios que trate el conocimientoalmacenado. Con ello, se mejorará la búsqueda de información y se potenciará el desarrollo deaplicaciones de comercio electrónico, ya que las anotaciones de información seguirán unesquema común, y los buscadores web compartirán con las anotaciones web los mismosesquemas. Empresas que traten con clientes y proveedores, podrán intercambiar sus datosde productos siguiendo estos esquemas comunes consensuados. 2 www.semanticweb.org 4
  5. 5. Ontologías, Primera Aproximación Universidad Nacional del Chaco Austral Los agentes web no sólo encontrarán la información de forma precisa, si no quepodrán realizar inferencias automáticamente buscando información relacionada con la quese encuentra situada en las páginas, y con los requerimientos de la consulta indicada por elusuario. Frente a la semántica implícita, el crecimiento caótico de recursos, y la ausencia deuna organización clara de la web actual, la web semántica aboga por clasificar, dotar deestructura y anotar los recursos con semántica explícita procesable por máquinas. Lafigura1 a continuación ilustra esta propuesta. Actualmente la web se asemeja a un grafoformado por nodos del mismo tipo, y arcos (hiperenlaces) igualmente indiferenciados. Porejemplo, no se hace distinción entre la página personal de un profesor y el portal de unatienda on-line, como tampoco se distinguen explícitamente los enlaces a las asignaturas queimparte un profesor de los enlaces a sus publicaciones. Por el contrario en la web semánticacada nodo (recurso) tiene un tipo (profesor, tienda, pintor, libro), y los arcos representanrelaciones explícitamente diferenciadas (pintor – obra, profesor – departamento, libro –editorial). La web semántica mantiene los principios que han hecho un éxito de la web actual,como son los principios de descentralización, compartición, compatibilidad, máximafacilidad de acceso y contribución, o la apertura al crecimiento y uso no previstos deantemano. En este contexto un problema clave es alcanzar un entendimiento entre las partesque han de intervenir en la construcción y explotación de la web: usuarios, desarrolladores 5
  6. 6. Ontologías, Primera Aproximación Universidad Nacional del Chaco Australy programas de muy diverso perfil. La web semántica rescata la noción de ontología delcampo de la Inteligencia Artificial como vehículo para cumplir este objetivo.Las Ontologías como Soporte de la Web Semántica Para que esto pueda llevarse a cabo, se necesita que el conocimiento de la web estérepresentado de forma que sea legible por los ordenadores, esté consensuado, y seareutilizable. Las ontologías proporcionan la vía para representar este conocimiento. Acontinuación definiremos el concepto de ontología por diferentes autores. Definición de Ontología En la práctica informática, el término de ontología ha adoptado connotacionespeculiares, alejadas de su sentido filosófico original. A partir de principios de la década de1990 han proliferado las definiciones de ontología en la literatura informática. GómezPérez y otros (2005) proporcionan una discusión completa; a continuación discutiremos lasmás relevantes, entre las que destaca la dada por Gruber [Grub05], que es más citada: A conceptualization is an abstract, simplified view of the world that we wish torepresent for some purpose. Every knowledge base, knowledge-based system, or knowledgelevel agen is committed to some conceptualization, explicitly or implicitly. An ontology is an explicit specification of a conceptualization. The term is borrowedfrom philosophy, where an Ontology is a systematic account of Existence. For AI sistems,what “exists” is that which can be represented. La definición está basada en el concepto de conceptualización propuesto anteriormentepor Genesereth y Nilsson (1987)[Gen92], y que en esencia se refiere al conjunto deconceptos y relaciones entre conceptos que son relevantes en un dominio o una aplicación. La definición de Gruber fue clarificada por [Borst97]: “An ontology is a formalspecification of a shared conceptualization”. Se pone el énfasis en dos ideas clave: - Una ontología debe ser especificada usando un lenguaje formal, que pueda ser procesado por ordenadores y no sólo por personas. - La ontología es conocimiento compartido, fruto del consenso dentro de un grupo. La relación entre ontologías, lenguajes formales y programas informáticos es explicadapor Sowa [Sowa00] en su introducción a los sistemas basados en conocimiento: Knowledge representation is a multidisciplinary subject that applies theories andtechniques from three other fields: Logic provides the formal structure and rules of 6
  7. 7. Ontologías, Primera Aproximación Universidad Nacional del Chaco Australinterference. Ontology defines the kinds of things that exist in the application thatdistinguish knowledge representation from pure philosophy. Without logic, a knowledge representation is vague, with no criteria for determiningwhether statements are redundant or contradictory. Without ontology, the terms andsimbols are ill-defined, confused, and confusing. And whithout computable models, thelogic and ontology cannot be implemented in computer programs. Knowledgerepresentation is the application of logic and ontology to the task of constructingcomputable models for some domain. En última instancia, el concepto de una ontología en informática es el deherramienta (un artefacto ingenieril, en palabras de Guarino [Gua94]) útil para unpropósito, un dominio o una aplicación concreta. Como veremos, esta visión pragmática hasido crucial en el desarrollo de las diversas adaptaciones del concepto de ontología a losusos informáticos. Características y tipos de ontologías Las ontologías pueden ser consideradas como repositorios de información ligada ahechos particulares, a través de la cual se da una interpretación particular a los datos. Elconocimiento de una ontología puede ser verdadero, codificado en una ontología, ódeducido, que significa que se deriva por alguna forma de razonamiento.  Características representativas de las ontologíasAlgunas de las características más representativas de las ontologías se mencionan másadelante: • Ontologías múltiples: El propósito de una ontología es hacer explícito algúnpunto de vista, por lo tanto, a veces será conveniente combinar dos o más ontologías.Cada ontología va a introducir conceptualizaciones específicas. • Distintos niveles de abstracción de las ontologías: Estos niveles degeneralización o abstracción nos dan una topología de ontologías. La idea es caracterizaruna red de ontologías con el uso de multiplicidad y abstracción. Puesto que no podemosaspirar a tener una descripción completa del mundo, se puede pensar en una estrategia deconstrucción gradual de abajo hacia arriba. • Multiplicidad de la representación: Un concepto puede ser representado demuchas formas, por lo que pueden coexistir múltiples representaciones de un mismoconcepto. • Mapeo de ontologías: Establecer relaciones entre los elementos de una o másontologías, para establecer conexiones, especializaciones, generalizaciones, etc. 7
  8. 8. Ontologías, Primera Aproximación Universidad Nacional del Chaco Austral Propiedades que deben cumplir las ontologíasAlgunas propiedades que deben cumplir las ontologías: • Claridad: Para comunicar el significado intencionado de los términosdefinidos. • Coherencia: Para sancionar inferencias que son consistentes con lasdefiniciones. • Extensibilidad: Para anticipar el uso de vocabulario compartido. • Sesgo de codificación mínimo (Minimal encoding bias): Debe deespecificar al nivel de conocimiento sin depender de una codificación particular a nivel desímbolo. • Mínimo compromiso ontológico: Debe de hacer la menor cantidad de"pretensiones acerca del mundo modelado. Clasificación en cuanto al ámbito de conocimientoExisten 4 tipos de ontologías en función de su alcance y posibilidad de aplicación: • Ontología de la aplicación: usadas por la aplicación. Por ejemplo,ontología de procesos de producción, de diagnóstico de fallas, de diseño intermedio debarcos, etc. • Ontología del dominio: específicas para un tipo de artefacto,generalizaciones sobre tareas específicas en algún dominio concreto del conocimiento. Porejemplo, ontología del proceso de producción. • Ontologías técnicas básicas: describen características generales deartefactos. Por ejemplo: componentes, procesos y funciones. • Ontologías genéricas: describe la categoría de más alto nivel, describiendoconceptos generales (como tiempo, espacio, objeto, etc.). Otras posibles clasificaciones de las ontologías son: en función de su punto de vista,por ejemplo: físico, de comportamiento, funcional, estructural, topológico, etc. 8
  9. 9. Ontologías, Primera Aproximación Universidad Nacional del Chaco Austral Según el grado o nivel de abstracción y razonamiento lógico que permitan, porejemplo: ontologías descriptivas, que incluyen taxonomías de conceptos, relaciones entreconceptos pero no permiten inferencias lógicas y ontologías lógicas. Las que permiten inferencias lógicas mediante la utilización de una serie decomponentes como la inclusión de axiomas, etc.Diseño de Ontologías Las ontologías pueden ser utilizadas como herramienta en la ciencia computacional,su mayor uso se ve más explícito en el campo de la Inteligencia Artificial y disciplinas talescomo la robótica e ingeniería del conocimiento. Las técnicas de programación orientadas a objetos están siendo más comunes,debido a que su representación en términos de clases, atributos de las clases, objetos y lajerarquía de la herencia de clases, ha influido a un número de lenguajes y esquemas que seutilizan para la representación de conocimiento digital. Ontología es la teoría de objetos en términos de criterios, que nos permitendistinguir entre diferentes tipos de objetos y sus relaciones, dependencias y propiedades. Elementos básicos de una ontología La ontología define modelos base que tendrán la definición semántica representandoa una clase de objetos en la ontología. En la ontología se definen un conjunto de términosrepresentativos llamados conceptos. Las ontologías dependientes de dominio proveenconceptos en un dominio específico, que se enfoca en el conocimiento en un área limitada;las ontologías genéricas proveen conceptos en un dominio en específico, enfocado alconocimiento de un área limitada. En una ontología, los conceptos son las unidades fundamentales para laespecificación. Proveen una base para la descripción de información. Cada concepto consta de 3componentes básicos: términos, atributos, relaciones. Los términos son los nombresutilizados para referirse a y un concepto específico que puede incluir un conjunto desinónimos que especifican los mismos conceptos. Los atributos son las características de unconcepto y describen el concepto a más detalle. Las relaciones se utilizan para representarcorrespondencias entre diferentes conceptos y para proveer una estructura general a laontología. 9
  10. 10. Ontologías, Primera Aproximación Universidad Nacional del Chaco Austral Cada concepto define una clase que es una representación para una agrupaciónconceptual de términos similares. Por ejemplo, una computadora podría ser representadacomo una clase, que tiene muchas subclases como son computadoras personales,mainframes, Workstation, etc. Las ontologías están formadas de los siguientes componentes que servirán pararepresentar el conocimiento de algún dominio en específico. Existen diferentes formalismos de representación de conocimientos para formalizar(e implementar) ontologías y cada uno de ellos tiene distintos componentes que pueden serutilizados en estas tareas de formalización e implementación, sin embargo, dichosformalismos comparten un conjunto mínimo de componentes, a saber:  Clases o Conceptos, que representan conceptos tomados en su sentido más amplio. En el dominio de los viajes, por ejemplo, los conceptos que tenemos son: lugares (ciudades, pueblos, etc.), alojamiento (hoteles, campings, etc.) y medios de transportes (aviones, trenes, coches, transbordadores, motos, barcos). En la ontología, las clases están normalmente organizadas en taxonomías por medio de las cuales se pueden aplicar los mecanismos de herencia. Podemos representar, por ejemplo, una taxonomía de lugares de diversión (teatro, cine, sala de conciertos, etc.) Por otro lado, las metaclases también se pueden definir en el paradigma KR basado en marcos. Metaclases son clases cuyas instancias también son clases y permiten hacer una gradación del significado ya que establecen diferentes capas de clases en la ontología en la que están definidas.  Relaciones o Funciones, que representan un tipo de asociación entre los conceptos del dominio y se definen formalmente como cualquier subconjunto de un producto de n conjuntos, es decir: R ⊂ C1 x C2 x…xCn . Las ontologías normalmente contienen relaciones binarias, cuyo primer argumento es conocido como dominio o la relación, mientras que el segundo es conocido como rango. Las relaciones binarias muchas veces se utilizan para expresar atributos de conceptos, conocidos como ranuras (slots) y estos atributos se distinguen de las relaciones porque su rango es un tipo de datos como, por ejemplo, cadena de caracteres, número, etc., mientras que el rango de las relaciones es un concepto.  Axiomas, Según Gruber, [Grub93] sirven para modelizar afirmaciones que son siempre ciertas. En ontologías se utilizan generalmente para representar conocimiento que no se puede definir formalmente a través de otros componentes, además sirven para verificar la consistencia de la ontología misma o la consistencia de los conocimientos almacenados en una base de conocimientos, porque son muy útiles para inferir conocimientos nuevos. Un axioma en el dominio de los viajes 10
  11. 11. Ontologías, Primera Aproximación Universidad Nacional del Chaco Austral sería: no es posible viajar de América a Europa en tren.  Instancias, que se utilizan para representar elementos o individuos en una ontología. Las ontologías se pueden ver como un conjunto de conceptos-definiciones, estosconceptos pueden ser ordenados en jerarquías de taxonomías y tener propiedades asociadas. En un sentido de manejo de conocimiento, las ontologías aportando una herramientapara la representación de la semántica de la información y automatización del proceso derecuperación; son el vehículo para la representación e intercambio del conocimiento endiferentes niveles de granularidad de diferentes dominios. La ontología codifica la estructura relacional de conceptos, utilizada para describiraspectos del mundo. En el proceso de creación de una ontología, se hace uso deconocimiento previo almacenado en una ontología para la indexación y solución aproblemas de búsquedas. La anotación basada en ontologías es relativamente nueva, peroque ha mostrado ser de gran utilidad. Las ontologías se pueden formalizar, además de con formalismos y lenguajescreados específicamente para representar conocimientos a través de enfoques del campo dela ingeniería del software, tales como Unified Modeling Language (UML) [Runbaugh yotros, 1999] o los Diagramas de Entidad Relación (ER) [Chen, 1976], para luegotransformar sus modelos conceptuales en ontologías formales que se puedan representar enlenguajes de ontologías. Pasos para la creación de una ontología Al crear una ontología, se hace explícita la categorización de elementos y relacionesque intervienen en un modelo de conocimiento. Por un lado el modelo de conocimiento sepuede editar y gestionar, por otro lado, se puede transmitir de manera que un sistema“entienda” la conceptualización que se ha utilizado en otro. Este hecho se ha citadofundamental, al convertir el proceso de creación de escenarios educativos en una labor deingeniería más que en una labor artesana, además de proporcionar un conocimiento deldominio reusable y mantenible. La utilidad de una ontología se puede medir en la capacidad de permitir a lossistemas, hacer referencias a otros componentes de conocimiento definidos, siempre queambos compartan la misma conceptualización. Una ontología compartida solo necesitadescribir un vocabulario común para hablar sobre un dominio. A continuación se citan algunos de los pasos para la creación de una ontología: 11
  12. 12. Ontologías, Primera Aproximación Universidad Nacional del Chaco Austral 1. Definir el dominio y alcance de la ontología. Esto es definir el dominio quecubrirá la ontología, definir el uso la aplicación final de dicha ontología, definir a qué tipode preguntas responderá la ontología, recolectar la información necesaria, etc. 2. Considerar el rehuso de ontologías, en caso de poder aplicarse se recolectantérminos y características de ontologías comunes ya existentes. 3. Enumerar términos importantes en la ontología. Definir una lista de los términosque se quieren almacenar en la ontología, así como de sus propiedades y las relaciones queexisten entre ellos. 4. Definir las clases y la jerarquía de clases. Esto es definir la estructura conceptualdel dominio, siguiendo el método top-down, primero se crean las clases para los conceptosgenerales en el dominio y su especialización subsiguiente. 5. Definir las propiedades de las clases. Las clases por sí solas no proveensuficiente información para responder a las peticiones, una vez definidas las clases se debendefinir la estructura interna de los conceptos. 6. Creación de instancias. Creación de instancias de clases individuales en lajerarquía. Las ontologías generalmente se usan para:  Anotar términos.  Realizar búsquedas basadas en vistas.  Dar semántica a las relaciones.  La ontología ayuda al usuario a formular consultas de forma correcta.  Compartir el entendimiento común de la estructura de información entre personas o agentes de software.  Permitir la reutilización de conocimiento de un dominio.  Explicitar suposiciones de un dominio.  Separar el conocimiento del dominio del conocimiento operacional.  Analizar el conocimiento de un dominio, entre otras. Relaciones que se presentan en una ontología La ontología, como se ha mencionado anteriormente define un conjunto de clases,relaciones, funciones y constantes para un determinado dominio, además introduce axiomaspara restringir la interpretación de estos elementos. Las relaciones que se establecen entrelos elementos del dominio son aquellas que clasifican las entidades del dominio en base arelaciones como: “es-un”, “instancia-de” y “parte-de”. 12
  13. 13. Ontologías, Primera Aproximación Universidad Nacional del Chaco Austral La relación “instancia-de”, es una membresia entre conceptos. “Parte-de” muestrarelaciones de composición. La relación “es-un”, muestra la propiedad de inclusión,utilizada en las ontologías para encontrar la similitud a la hora de la comparación. Cuandoun concepto tiene una relación “es-un” hacia otro concepto, significa que el segundoconcepto es más general que el primer concepto. Una ontología no sólo sirve para hacer anotaciones y precisar la recuperación de lainformación, también ayuda al usuario a especificar información correcta y necesaria paragenerar consultas correspondientemente. La mayor dificultad que podrían presentar lasontologías es el trabajo extra que se necesita, para su creación y anotación detallada. Pero acambio se obtiene una mejor recuperación de información, que es en sí el objetivo denuestro proyecto de investigación.Cómo Alcanzar la Web Semántica Para poder explotar la web semántica, se necesitan lenguajes de marcado apropiadosque representen el conocimiento de las ontologías. Actualmente, mediante OWL (Ontologic Web Language) o RDF-RDF Schema sepueden representar algunas facetas sobre conceptos de un dominio y permite, medianterelaciones taxonómicas, crear una jerarquía de conceptos. Pero se necesitan lenguajes demarcado (basados en RDF) con mayor expresividad y capacidad de razonamiento pararepresentar los conocimientos que contienen las ontologías [Cor00]. De esta forma, existenya disponibles herramientas como Protégé3, OntoEdit4 , o WebOnto5 para realizaranotaciones en páginas web con lenguajes de marcado propios. El lenguaje con gran capacidad expresiva que está emergiendo como un estándarpara realizar anotaciones de ontologías en web es DAML6 , aunque en este momento notiene sus formatos totalmente definidos. Por otro lado, se necesitan agentes y aplicaciones web que exploten esteconocimiento anotado en las páginas web. Estos agentes de conocimientos web seráncapaces de interpretar los esquemas ontológicos y axiomas de diferentes dominios,mantendrán la consistencia de las instancias que se inserten en las páginas web siguiendolos esquemas ontológicos definidos, realizarán una búsqueda con inferencias utilizando losaxiomas situados en los esquemas, y podrán realizar ligaduras de los árboles taxonómicosde varias ontologías. Para potenciar el uso de ontologías en la web, se necesitan aplicaciones específicasde búsqueda de ontologías, como (Onto)Agent7 [Arp00], que indiquen a los usuarios las 3 http://protege.semanticweb.org 4 http://ontoserver.aifb.unikarlsruhe.de/ontoedit/ 5 13 http://kmi.open.ac.uk/projects/webonto/ 6 http://www.daml.org
  14. 14. Ontologías, Primera Aproximación Universidad Nacional del Chaco Australontologías existentes y sus características para poder utilizarlas en su sistemaDe la Web Actual a la Web Semántica Llegados a este punto una pregunta importante a responder es cómo encaja la websemántica con la actual, es decir a) cómo accederá el usuario a la web semántica, y sobretodo, b) cómo hacer la transición de la web actual a la web semántica. Para que la websemántica pueda realizarse es importante que guarde, al menos al principio, unacompatibilidad con la tecnología actual. Es deseable por ejemplo mantener HTML (u otroslenguajes compatibles con los navegadores actuales) como vehículo de comunicación conel usuario. La asociación entre las instancias de la web semántica y el código HTML sepuede establecer de distintas maneras (ver figura 2). Una consiste en conservar losdocumentos actuales, y crear las instancias asociadas anotando su correspondencia con losdocumentos (imagen izquierda en la figura 2). Esta posibilidad es la más viable cuando separte de un gran volumen de material antiguo. Otra es generar dinámicamente páginas weba partir de las ontologías y sus instancias (imagen derecha). Esta última opción puede resultar factible cuando los documentos antiguos ya seestaban generando automáticamente a partir, por ejemplo, de una base de datos. La transición de la web actual a la web semántica puede implicar un coste altísimosi tenemos en cuenta el volumen de contenidos que ya forman parte de la web. Crear ypoblar ontologías supone un esfuerzo extra que puede resultar tedioso cuando se agregannuevos contenidos, pero directamente prohibitivo por lo que respecta a integrar los miles degigabytes de contenidos antiguos. Las estrategias más viables combinan una pequeña partede trabajo manual con la automatización del resto del proceso. Las técnicas para laautomatización incluyen, entre otras, el mapeo de la estructura de bases de datos aontologías, el aprovechamiento, previa conversión, de los metadatos y estándares de 7 http://delicias.dia.fi.upm.es/OntoAgent 14
  15. 15. Ontologías, Primera Aproximación Universidad Nacional del Chaco Australclasificación presentes en la web (y fuera de ella), y la extracción automática de metadatosa partir de texto y recursos multimedia. Otra dificultad importante a la hora de realizar la web semántica en la práctica es lade consensuar ontologías en una comunidad por poco amplia que sea. Converger a unarepresentación común es una labor más compleja de lo que puede parecer, ya quetípicamente cada parte del sistema conlleva peculiaridades necesarias, y un punto de vistapropio que a menudo necesitan incidir en la propia ontología. La representación del mundono es neutra respecto al uso que se le va a dar: tanto un dietista como un biólogo tienenconocimiento sobre las plantas, pero su representación de esa materia es muy distinta, yprobablemente no sería adecuado imponer la misma representación para ambasperspectivas. Las vías para salvar esta dificultad consisten en compartir ontologías para lasáreas comunes en que puede tener lugar una interacción o intercambio de información entrelas partes, y establecer formas de compatibilidad con las ontologías locales, medianteextensión y especialización de las ontologías genéricas, o por mapeo y exportación entreontologías.Lenguaje OWL El Lenguaje de Ontología Web OWL está diseñado para ser usado por aplicacionesque procesan el contenido de la información en lugar de presentar esta información a loshumanos. OWL puede usarse para representar explícitamente el significado de términos enun vocabulario y las relaciones entre estos términos. A este conjunto de términos yrelaciones se le llama ontología. OWL tiene más facilidades para expresar los significadosy la semántica que XML, RDF, y RDF-S, y así OWL va más allá que estos lenguajes en sucapacidad para representar el contenido para ser usado por las máquinas intérpretes en laWeb. OWL es una revisión del Lenguaje de Ontología DAML + OIL incorporandolecciones aprendidas del diseño y aplicación del mismo. El lenguaje OWL está descrito en un conjunto de documentos, cada uno con unpropósito y destinado a un público diferente, revisado por miembros del W3C y otras partesinteresadas, y confirmado como una Recomendación W3C (World Wide Web Consortium).Los documentos existentes son los siguientes: • Introducción OWL da una simple introducción a OWL proporcionando una listade características del lenguaje con una breve descripción. • Guía OWL demuestra el uso del Lenguaje OWL proporcionando ampliosejemplos. También proporciona un glosario de los términos usados en el documento. • Referencia OWL da una sistemática y compacta (pero todavía informal)descripción de todo el modelado primitivo de OWL. 15
  16. 16. Ontologías, Primera Aproximación Universidad Nacional del Chaco Austral • Semántica y Sintaxis Abstracta de OWL es el documento final y formal con ladefinición de la normativa del lenguaje. • Casos de Prueba del Lenguaje de Ontología Web OWL es un documento quecontiene un amplio conjunto de casos de prueba del lenguaje. • Requisitos y Casos de Uso de OWL es un documento que contiene un conjuntode casos de uso para el lenguaje de ontología Web y especifica un conjunto de requisitospara OWL.¿Por qué OWL? La Web Semántica es una visión del futuro de la Web en la cual la información estádada explícitamente como significado, haciendo más fácil para las máquinas procesar eintegrar automáticamente la información disponible en la Web. La Web Semántica seconstruirá sobre las capacidades de XML para definir esquemas etiquetados de RDF para larepresentación de datos. El primer nivel requerido encima de RDF para la Web Semántica es un lenguaje deontología que pueda describir formalmente el significado o la terminología usada endocumentos Web. Si las máquinas van a realizar tareas de razonamiento en estosdocumentos, el lenguaje debe ir encima de la semántica básica de RDF Schema. OWL ha sido diseñado como un Lenguaje de Ontología Web para satisfacer estanecesidad. OWL es parte de las numerosas recomendaciones de W3C relativas a la WebSemántica. • XML proporciona una firme sintaxis para documentos estructurados, pero noimpone construcciones semánticas en el significado de estos documentos. • XML Schema es un lenguaje para restringir la estructura de los documentos XMLy también extiende XML con tipos de datos. • RDF es un modelo de datos para objetos (“recursos”) y relaciones entre ellos.Proporciona una semántica simple para el modelo de datos, y estos modelos de datospueden ser representados en una sintaxis XML. • RDF Schema es un vocabulario para describir propiedades y clases de recursosRDF, con una semántica para la generalización de jerarquías de tales propiedades y clases. OWL añade más vocabulario para describir propiedades y clases, por ejemplo,relaciones entre clases, cardinalidad, equivalencias, características de propiedades… 16
  17. 17. Ontologías, Primera Aproximación Universidad Nacional del Chaco AustralLos tres sublenguajes de OWL OWL proporciona tres sublenguajes diseñados para usarse por comunidadesespecíficas de programadores y usuarios. Los tres sublenguajes son OWL Lite, OWL DL yOWL Full. Cada uno de estos sublenguajes es una extensión de su predecesor: • OWL Lite soporta una jerarquía de clasificación y construcciones simples. Porejemplo, soporta cardinalidad, pero sólo permite valores de 0 ó 1. Sería más simpleproporcionar herramientas que soporten OWL Lite en vez de expresiones más complejas, yOWL Lite proporciona una rápida migración a otras taxonomías. OWL Lite también tieneuna complejidad formal menor que OWL DL. • OWL DL soporta a los usuarios que quieren la máxima expresividad mientrasconservan las conclusiones computacionales (todas las conclusiones son guardadas para sercomputables) y la capacidad de decidir (todas las operaciones finalizarán en tiempo finito).OWL DL incluye todo lo que el lenguaje OWL construye, pero puede usarse sólo bajociertas restricciones (por ejemplo, mientras que una clase puede ser una subclase de muchasclases, una clase no puede ser una instancia de otra clase). OWL DL se llama así debido asu correspondencia con descripciones lógicas. • OWL Full soporta a los usuarios que quieren la máxima expresividad y la libertadsintáctica de RDF sin garantías computacionales. Por ejemplo, en OWL Full una clasepuede ser tratada simultáneamente como una colección de individuos. OWL permiteontologías que aumenten el significado del vocabulario predefinido (RDF o OWL). Esimprobable que algún software de razonamiento sea capaz de soportar completamenterazonamiento para cada característica de OWL Full. Los desarrolladores de ontologías deberían considerar qué sublenguaje es mejorpara sus necesidades. La elección entre OWL Lite y OWL DL depende de la extensión queel usuario requiere, usando OWL DL para construcciones más complejas. La elección entreOWL DL y OWL Full principalmente depende de la extensión que el usuario requieremodelando las facilidades de RDF Schema (por ejemplo, definiendo clases de clases, oatacando a propiedades de clases). OWL Full puede ser visto como una extensión de RDF, mientras que OWL Lite yOWL DL pueden ser vistos como extensiones de una vista restringida de RDF. Cada documento OWL (Lite, DL, Full) es un documento RDF y cada documentoRDF es un documento OWL Full, pero sólo algunos documentos RDF pueden serdocumentos OWL Lite o OWL DL legales. Debido a esto, hay que tener cuidado cuando sequiera migrar un documento RDF a OWL. Cuando la expresividad de OWL DL o OWLLite es apropiada, hay que tomar algunas precauciones para asegurar que el documentoRDF original cumpla con obligaciones adicionales impuestas por OWL DL y OWL Lite. 17
  18. 18. Ontologías, Primera Aproximación Universidad Nacional del Chaco AustralProtégé 2000 Protégé 2000 es una herramienta de software usada para desarrollar Sistemas deBases de Conocimiento, tanto por expertos en un determinado dominio como poringenieros de conocimiento. Las aplicaciones desarrolladas con Protégé 2000 se usan pararesolver problemas y tomar decisiones en un dominio particular. En versiones iniciales de Protégé, al igual que en sistemas de bases de datosclásicos, se definen, de forma separada, las clases de información (schema), y sealmacenan las instancias de las clases. En Protégé 2000 se facilita el trabajo porque permitetrabajar simultáneamente con clases e instancias. Así, una instancia se podría usar para ladefinición de una clase, y una clase puede ser almacenada como una instancia. Igualmente,las propiedades, las cuales al principio sólo podían usarse dentro de las clases, ahora seelevan al mismo nivel que éstas. Con este nuevo modelo de conocimiento, también sefacilita el manejo del Conector para Abrir la Base de Conocimiento (OKBC) para acceder abases de conocimientos almacenadas en sistemas de representación de conocimiento. Porúltimo, las aplicaciones que están encima de estos componentes son también ejecutadasdentro del entorno integrado Protégé 2000. La principal ventaja de Protégé 2000 es que los sistemas de conocimientos son muycaros de construir y mantener. Por ejemplo, se espera que el desarrollo de sistemas de basesde conocimiento sea un esfuerzo de equipo, incluyendo desarrolladores y expertos en eldominio, que pueden tener menos familiaridad con el software computacional. Protégé2000 está diseñado para guiar a desarrolladores y expertos en el dominio durante el procesode desarrollo del sistema. Protégé 2000 está diseñado para permitir a los desarrolladoresreutilizar dominios de ontologías y métodos de resolución de problemas. Variasaplicaciones pueden usar la misma ontología de dominio para resolver distintos problemas,y el mismo método de resolución de problemas puede ser usado con diferentes ontologías.OWL PluginEl OWL Plugin es una extensión de Protégé que soporta el Lenguaje de Ontología Web(OWL).OWL Plugin permite cargar y salvar ontologías OWL y RDF, editar y visualizar clasesOWL y sus propiedades, definir características lógicas de clases como expresiones OWL,ejecutar razonadores tales como clasificadores lógicos de descripciones, y editar individuosOWL para Web Semántica. 18
  19. 19. Ontologías, Primera Aproximación Universidad Nacional del Chaco AustralLa arquitectura flexible de Protégé hace fácil configurar y extender la herramienta. Protégétiene una API Java de libre distribución para el desarrollo de componentes de la interfaz deusuario o servicios arbitrarios de Web Semántica.El OWL Plugin tiene la siguiente arquitectura:Creando Ontologías con Protégé 2000 Introducción En este apartado vamos a ver de forma resumida cómo crear una ontología en elPlugin OWL de Protégé 2000. Vamos a ver cómo se crean las clases, las propiedades y lasinstancias, y vamos a analizar el espacio de nombrado y la importación de ontologías. Creando Jerarquía de Clases Arrancamos Protégé 2000, y nos aparece el siguiente cuadro: 19
  20. 20. Ontologías, Primera Aproximación Universidad Nacional del Chaco Austral Debemos elegir un formato para el proyecto. Como nuestro proyecto será un fichero OWL, seleccionamos OWL Files, y pulsamos New. Nos aparece entonces lo siguiente: Todas las clases que creemos serán subclases de Thing, es decir. Thing es la superclase de todas las clases. Para crear clases se puede hacer de varias formas: 1) Situamos el ratón sobre owl:Thing y pulsamos el botón derecho. Nos aparece una lista y pulsamos sobre Create Subclass. 20
  21. 21. Ontologías, Primera Aproximación Universidad Nacional del Chaco Austral 2) Otra forma es pulsando el botón de Create Subclass Si hacemos esto, bien por el camino 1) o 2), nos aparece lo siguiente: Y en Name debemos escribir el nombre que queremos que tenga nuestra clase: 21
  22. 22. Ontologías, Primera Aproximación Universidad Nacional del Chaco Austral Así podemos ir creando toda la jerarquía de clases y subclases. Dos clases son disjuntas cuando un individuo no puede ser instancia de las dos clases a la vez. Para especificar que dos clases son disjuntas hay que seleccionar la clase, irse al cuadro de clases disjuntas y añadir las clases que son disjuntas a la clase seleccionada. El cuadro de clases disjuntas es: Creando Propiedades Las propiedades OWL establecen relaciones entre dos individuos. Hay dos tiposprincipales de propiedades: ObjectProperties y DatatypesProperties. Los ObjectPropertiesenlazan a un individuo con otro individuo. Los DatatypeProperty enlazan a un individuocon un tipo de datos XML Schema o un literal RDF. OWL también tiene un tercer tipo depropiedad, AnnotationProperties. Las AnnotationProperties pueden ser usadas para añadirinformación (metadatos, datos sobre datos) a clases, individuos y propiedades object odatatype. Las propiedades pueden crearse usando la tabla de propiedades siguientes: 22
  23. 23. Ontologías, Primera Aproximación Universidad Nacional del Chaco Austral O bien el recuadro siguiente:Si queremos crear un DatatypeProperty, pulsamos sobre el botón de DatatypeProperty, y nos sale lo siguiente. En Name escribimos el nombre que queremos que tenga nuestra Propiedad. 23
  24. 24. Ontologías, Primera Aproximación Universidad Nacional del Chaco Austral Y en Rango seleccionamos el tipo de datos que tendrán los valores de la propiedad. Esos tipos son los siguientes: Si queremos crear un ObjectProperty, pulsamos sobre el botón de ObjectProperty, y nos sale lo siguiente: 24
  25. 25. Ontologías, Primera Aproximación Universidad Nacional del Chaco Austral En Name escribimos el nombre que queremos que tenga nuestra Propiedad. Y en Rango seleccionamos lasclases que formarán parte del rango. Para especificar que una propiedad es la inversa de otra se usa el cuadro siguiente: Una propiedad funcional para un individuo dado significa que ese individuo sólo se relaciona con un único individuo (o ninguno) vía esa propiedad. Para indicar que una propiedad es funcional hay que pulsar el recuadro siguiente:Una propiedad es inversa de funcional cuando la propiedad inversa es funcional. Para indicar hay que pulsar el recuadro de Inverse Functional. Una propiedad es transitiva si cumple que para un individuo A que se relaciona con una propiedad transitiva a un individuo B, y B se relaciona por esa misma propiedad a unindividuo C, entonces A se relaciona por esa propiedad a un individuo C. Para indicar que una propiedad es transitiva hay que pulsar el recuadro siguiente: 25
  26. 26. Ontologías, Primera Aproximación Universidad Nacional del Chaco AustralUna propiedad es simétrica si cumple que para dos individuos A y B, si se relaciona con B por una propiedadsimétrica entonces B también se relaciona con A a través de esa propiedad. Para indicar que una propiedad es simétrica hay que pulsar el siguiente recuadro: A las propiedades se les pueden poner restricciones. Las restricciones se usan para restringir el número de individuos que pertenecen a una clase. Las restricciones en OWL pueden tener tres categorías: restricciones cuantificadoras, restricciones de cardinalidad y restricciones hasValue. Para crear una restricción hay que pulsar create restriction (botón que pone R) en el siguiente cuadro: Si pulsamos el botón R (create restiction) nos sale: 26
  27. 27. Ontologías, Primera Aproximación Universidad Nacional del Chaco Austral | Para crear una restricción habría que seleccionar el tipo. Se pueden crear restricciones de 6 tipos: allValuesFrom, someValuesFrom, hasValue, cardinality, minCardinality y maxCardinality. Además, habríaque seleccionar la propiedad a la que queremos aplicar la restricción, y el valor necesario en función del tipo de restricción. Por ejemplo, si es una restricción de cardinalidad habría que indicar un valor entero no negativo, si es una restricción hasValue habría que indicar una instancia, y si es una restricción allValuesFrom habría que indicar una clase. Creando Instancias OWL permite definir individuos y verificar propiedades sobre ellos. Los individuostambién pueden usarse en descripciones de clases. Para crear individuos en Protégé 2000 seusa la tabla de instancias. Señalamos la clase en la cual queremos crear la instancia, ypulsamos create instance. Nos aparece lo siguiente.En Name escribimos el nombre que queremos que tenga nuestra instancia. 27
  28. 28. Ontologías, Primera Aproximación Universidad Nacional del Chaco Austral 28
  29. 29. Ontologías, Primera Aproximación Universidad Nacional del Chaco AustralBibliografía[Arp00] Arpirez J., Gómez-Pérez A., Lozano Tello A. and Pinto S. “Reference Ontology and (Onto)Agent:The Ontology Yellow Pages”, Knowledge and Information Systems, An International Journal,SpringerVerlag, 2 (2000) 4, 387-412. Mar. 2000.[Ber99] Berners-Lee, T.: Weaving the Web: The Original Design and Ultimate Desiny of the World WideWeb by its Inventor. HarperCollins Publishers, New York, 1999.[Borst97] Borst, P. (1997) Construction of Engineering Ontologies for Knowledge Sharing and Reuse.Ph.D. Dissertation. Tweente University.[Gen92] Genesereth, M.R. y Fikes, R.E: “Knowledge Interchange Format. Vesion 3.0. Reference Manual”.Informe técnico Logic-92-1, Computer Scince Department. Standford University, California, 1992.Disponible en http://meta2.standford.edu/kif/Hypertext/kif-manual.html.[Grub05] Thomas Gruber (2005). Ontology of Folksonomy: A Mash-up of Apples and Oranges. Int’lJournal on Semantic Web & Information Systems, 3(2), 2007. Originally published in 2005, this is a rebuttalto a popular anti-ontology blog, with a constructive call to action.[Grub93] T. R. Gruber. A Translation Approach to Portable Ontology Specifications. KnowledgeAcquisition, 5(2), pp. 199-220, 1993.[Gua94] Guarino, N., Carrara, M., Giaretta, P. (1994). Formalizing Ontological Commitment. InProceedings of National Conference on Artificial Intelligence (AAAI-94):560-567. Seattle, MorganKaufmann.[Noy00] Noy, N.F; Fergerson, R.W y Musen, M.A.: “The Knowledge model of Protégé2000: Combininginteropelability and flexibility”. En: R.Dieng y O. Corby (Eds.), Procceedigns of the 12th InternationalConference in Knowledge Engineering and Knowledge Management (EKAW’00) (LEcture Notes inArtificial Inteligence LNAI 1937), pp. 17-32. Spinger-Verlag, Berlin, Germany, Juan-Les-Pins, France, 2000.[Sowa00] Sowa, J. F. (2000) Knowledge Representation: Logical, Philosophical, and ComputationalFoundations. Pacific Grove, CA: Brooks Cole Publishing Co.GUERRERO BOTE, Vicente; LOZANO TELLO, Adolfo."Vínculos entre las Ontologías y laBiblioteconomía y Documentación" en La Representación y la Organización del Conocimiento en susdistintas perspectivas: su influencia en la Recuperación de la Información : Actas del IV Congreso ISKO-España EOCONSID’99 22-24 de abril de 1999 Granada. Granada: ISKO; Universidad de Granada. Facultadde Biblioteconomía y Documentación, 1999, p. 25-31.Enlaces RecomendadosIvan Herman, (2007), Web Ontologic Languaje (OWL). Visitado el día 29-08-2012,http://www.w3.org/2004/OWL/The Protégé Ontology Editor and Knowledge Acquisition System. Visitado el día 29-08-2012,http://protege.stanford.edu/Análisis de PROTÉGÉ –2000. Visitado el día 30-08-2012, http://personales.upv.es/ccarrasc/doc/2001-2002/Protege2000/PROTEGE.htm 29

×