4888865-151130<br />INTEGRANTES:<br />CAMPOS LÓPEZ ELIZABETH<br />HERRERA NIETO MAYRA YAZMÍN<br />RIVERA MÉNDEZ SANDRA<br ...
Metadatos
Metadatos
Metadatos
Metadatos
Metadatos
Metadatos
Metadatos
Metadatos
Metadatos
Metadatos
Metadatos
Metadatos
Metadatos
Metadatos
Metadatos
Metadatos
Metadatos
Metadatos
Metadatos
Upcoming SlideShare
Loading in …5
×

Metadatos

2,080 views
1,977 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
2,080
On SlideShare
0
From Embeds
0
Number of Embeds
6
Actions
Shares
0
Downloads
26
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Metadatos

  1. 1. 4888865-151130<br />INTEGRANTES:<br />CAMPOS LÓPEZ ELIZABETH<br />HERRERA NIETO MAYRA YAZMÍN<br />RIVERA MÉNDEZ SANDRA<br />TORRES RIVERA Ma. ANGÉLICA <br />PEÑALOSA VENSES RAFAEL.<br />MATERIA:<br />SOLUCIONES INTEGRALES EN LAS ORGANIZACIONES<br />PROFESOR:<br />DR. CARLOS A. TORRES GASTELÚ<br />TRABAJO DE INVESTIGACIÓN DE METADATOS, WEB SEMÁNTICA, ONTOLOGIAS, XML Y SUS ESTÁNDARES.<br />ÍNDICE.<br /> <br /> PÁG.<br />INTRODUCCIÓN……………………………………………………………………………………………………………………………..………….3<br /> QUE SON LOS METADATOS…………………………………………………………………………………………………………….............4<br />CLASIFICACIÓN DE LOS METADATOS………………………………………………………………………………………..………………...5<br />FORMATOS Y STANDARES DE LOS METADATOS…………………………………………………………………..………………………6<br />WEB SEMÁNTICA…………………………………………………………………………………………………………….………………………….7<br />COMPONENTES DE LA WEB SEMANTICA…………………………………………………………………….…………………………….. 8<br />BARRERAS DE LA WEB SEMÁNTICA…………………………………………………………………………………………………………… 11<br />ONTOLOGIAS……………………………………………………………………………………………………………………………………………….13<br />CLASIFICACIÓN DE LAS ONTOLOGIAS……………………………………………………………………………………………………….... 13<br />XML Y SUS STANDARES…………………………………………………………………………………………….…………………………………15<br />ESTRUCTUURA DE UN DOCUMENTO XML………………………………………………………………..………………………………….16<br />LENGUAJES CREADOS USANDO XML………………………………………………………………………………………………………….. 19<br />FUENTES………………..…………………………………………………………………………………………………………………………………. 20<br />INTRODUCCIÓN.<br />Este trabajo esta enfocado a ampliar un poco más el panorama de el capitulo 8 presentado y explicado previamente ,se definen y explican conceptos utilizados en la arquitectura de integración de información.<br />Los metadatos son datos altamente estructurados que describen información, describen el contenido, la calidad, la condición y otras características de los datos. Es "Información sobre información" o "datos sobre los datos". Algunos ejemplos de información que se puede describir usando metadatos son: impresa, audiovisual, geoespacial etc.<br />La Web semántica (del inglés semantic web) es la "Web de los datos". Se basa en la idea de añadir metadatos semánticos y ontológicos a la World Wide Web. Esas informaciones adicionales que describen el contenido, el significado y la relación de los datos se deben proporcionar de manera formal, para que así sea posible evaluarlas automáticamente por máquinas de procesamiento. El objetivo es mejorar Internet ampliando la interoperabilidad entre los sistemas informáticos usando "agentes inteligentes". Agentes inteligentes son programas en las computadoras que buscan información sin operadores humanos.<br />“Una Ontología es una especificación formal y explícita de una conceptualización<br />compartida”: El término “conceptualización” implica que toda ontología desarrolla un modelo abstracto<br />del dominio o fenómeno del mundo que representa. Dicho modelo abstracto se basa esencialmente en el empleo de conceptos, atributos, valores y relaciones. Con “especificación explícita” se quiere expresar que una ontología supone la descripción y representación de un dominio concreto mediante conceptos, atributos, valores, relaciones, funciones, etc., definidas explícitamente. Las máquinas no pueden dar nada por supuesto o por obvio, y todo conocimiento -por básico que parezca, mientras sea necesario- debe ser explícitamente representado.<br />XML, siglas en inglés de eXtensible Markup Language ('lenguaje de marcas extensible'), es un metalenguaje extensible de etiquetas desarrollado por el World Wide Web Consortium (W3C). Es una simplificación y adaptación del SGML y permite definir la gramática de lenguajes específicos (de la misma manera que HTML es a su vez un lenguaje definido por SGML). Por lo tanto XML no es realmente un lenguaje en particular, sino una manera de definir lenguajes para diferentes necesidades[cita requerida]. Algunos de estos lenguajes que usan XML para su definición son XHTML, SVG, MathML.<br />XML proviene de un lenguaje inventado por IBM en los años setenta, llamado GML (Generalized Markup Language), que surgió por la necesidad que tenía la empresa de almacenar grandes cantidades de información. Este lenguaje gustó a la ISO, por lo que en 1986 trabajaron para normalizarlo, creando SGML (Standard Generalized Markup Language), capaz de adaptarse a un gran abanico de problemas. A partir de él se han creado otros sistemas para almacenar información.<br />¿QUÉ SON LOS METADATOS?<br />un grupo de metadatos se refiere a un grupo de datos, llamado recurso. El concepto de metadatos es análogo al uso de índices para localizar objetos en vez de datos. Por ejemplo, en una biblioteca se usan fichas que especifican autores, títulos, casas editoriales y lugares para buscar libros. Así, los metadatos ayudan a ubicar datos.<br />Para varios campos de la informática, como la recuperación de información o la web semántica, los metadatos en etiquetas son un enfoque importante para construir un puente sobre el intervalo semántico.<br />Distinción entre datos y metadatos<br />La mayoría de las veces no es posible diferenciar entre datos y metadatos. Por ejemplo, un poema es un grupo de datos, pero también puede ser un grupo de metadatos si está adjuntado a una canción que lo usa como texto. Muchas veces, los datos son tanto "datos" como "metadatos". Por ejemplo, el título de un texto es parte del texto como a la vez es un dato referente al texto (dato como metadato).<br />Metadatos sobre metadatos<br />Debido a que los metadatos son datos en sí mismos, es posible crear metadatos sobre metadatos. Aunque, a primera vista, parece absurdo, los metadatos sobre metadatos pueden ser muy útiles. Por ejemplo, fusionando dos imágenes y sus metadatos distintos puede ser muy importante deducir cuál es el origen de cada grupo de metadatos, registrando ello en metadatos sobre los metadatos.<br />Objetivos<br />El uso de los metadatos mencionado más frecuentemente es la refinación de consultas a buscadores. Usando informaciones adicionales los resultados son más precisos, y el usuario se ahorra filtraciones manuales complementarias.<br />El intervalo semántico plantea el problema de que el usuario y el ordenador no se entiendan porque este último no comprenda el significado de los datos. Es posible que los metadatos posibiliten la comunicación declarando cómo están relacionados los datos. Por eso la representación del conocimiento usa metadatos para categorizar informaciones. La misma idea facilita la inteligencia artificial al deducir conclusiones automáticamente.<br />Los metadatos facilitan el flujo de trabajo convirtiendo datos automáticamente de un formato a otro. Para eso es necesario que los metadatos describan contenido y estructura de los datos.<br />Algunos metadatos hacen posible una compresión de datos más eficaz. Por ejemplo, si en un vídeo el software sabe distinguir el primer plano del fondo puede usar algoritmos de compresión diferentes y así mejorar la cuota de compresión.<br />Otra idea de aplicación es la presentación variable de datos. Si hay metadatos señalando los detalles más importantes, un programa puede seleccionar la forma de presentación más adecuada. Por ejemplo, si un teléfono móvil sabe dónde está localizada una persona en una imagen, tiene la posibilidad de reducirlo a las dimensiones de su pantalla. Del mismo modo un navegador puede decidir presentar un diagrama a su usuario ciego en forma táctil o leída.<br />Clasificación<br />Los metadatos se clasifican usando tres criterios:<br />•Contenido. Subdividir metadatos por su contenido es lo más común. Se puede separar los metadatos que describen el recurso mismo de los que describen el contenido del recurso. Es posible subdividir estos dos grupos más veces, por ejemplo para separar los metadatos que describen el sentido del contenido de los que describen la estructura del contenido o los que describen el recurso mismo de los que describen el ciclo vital del recurso.<br />•Variabilidad. Según la variabilidad se puede distinguir metadatos mutables e inmutables. Los inmutables no cambian, no importa qué parte del recurso se vea, por ejemplo el nombre de un fichero. Los mutables difieren de parte a parte, por ejemplo el contenido de un vídeo.[12]<br />•Función. Los datos pueden ser parte de una de las tres capas de funciones: subsimbólicos, simbólicos o lógicos. Los datos subsimbólicos no contienen información sobre su significado. Los simbólicos describen datos subsimbólicos, es decir añaden sentido. Los datos lógicos describen cómo los datos simbólicos pueden ser usados para deducir conclusiones lógicas, es decir añaden comprensión<br />Codificación<br />Los primeros y más simples formatos de los metadatos usaron texto no cifrado o la codificación binaria para almacenar metadatos en ficheros.<br />Hoy, es común codificar metadatos usando XML. Así, son legibles tanto por seres humanos como por computadoras. Además este lenguaje tiene muchas características a su favor, por ejemplo es muy simple integrarlo en la World Wide Web. Pero también hay inconvenientes: los datos necesitan más espacio de memoria que en formato binario y no está claro cómo convertir la estructura de árbol en una corriente de datos. Por eso, muchos estándares incluyen utilidades para convertir XML en codificación binaria y viceversa, de forma que se únen las ventajas de los dos.<br /> Vocabularios controlados y ontologías<br />Para garantizar la uniformidad y la compatibilidad de los metadatos, muchos sugieren el uso de un vocabulario controlado fijando los términos de un campo. Por ejemplo, en caso de sinónimos o interlenguaje hay que acordarse qué palabras se usan para evitar que el buscador localice «español» pero no «española».<br />Una ontología además define las relaciones de los términos del vocabulario para que la computadora puede evaluarlas automáticamente. Así es posible presentar una página web sobre «Vincent Van Gogh» aunque el usuario tecleó «pintores neerlandeses»; usando una ontología adecuada el buscador comprende que Van Gogh fue un pintor neerlandés.<br />Un concepto muy similar a las ontologías son las folksonomías. Las ontologías son definidas por expertos del campo que ordenan los términos, pero las folksonomías son definidas por los mismos usuarios.<br />Algunos expertos critican fuertemente el uso de metadatos. Sus argumentos más sustanciosos son:<br />Los metadatos son costosos y necesitan demasiado tiempo. Las empresas no van a producir metadatos porque no hay demanda y los usuarios privados no van a invertir tanto tiempo.<br />Los metadatos son demasiado complicados. La gente no acepta los estándares porque no los comprende y no quiere aprenderlos.<br />Los metadatos dependen del punto de vista y del contexto. No hay dos personas que añadan los mismos metadatos. Además, los mismos datos pueden ser interpretados de manera totalmente diferente, dependiendo del contexto.<br />Los metadatos son ilimitados. Es posible adherir más y más metadatos útiles y no hay fin.<br />Los metadatos son superfluos. Ya hay buscadores potentes para textos, y en el futuro la técnica query by example («búsqueda basada en un ejemplo») va a mejorarse, tanto para localizar imágenes como para música y vídeo.<br />Algunos estándares de metadatos están disponibles pero no se aplican: los críticos lo consideran una prueba de las carencias del concepto de metadatos. Hay que notar que este efecto también puede ser causado por insuficiente compatibilidad de los formatos o por la enorme diversidad que amedrenta a las empresas. Fuera de eso hay formatos de metadatos muy populares.<br />Formatos y estándares<br />Hay dos grupos que impulsan el desarrollo de formatos de metadatos: la técnica multimedia y la web semántica. El destino de la técnica multimedia es describir un singular recurso de multimedia, el de la web semántica la descripción de recursos de cada tipo y además el encadenamiento de los conocimientos. Los formatos más populares y grandes son:<br />ID3 <br />MPEG-7<br />MPEG-21<br />TV-Anytime<br />Dublin Core<br />LOM<br />Marco de descripción de recursos (RDF)<br />RDF Schema<br />OWL<br />NewsML<br />SportsML<br />WEB SEMANTICA.<br />La Web semántica (del inglés semantic web) es la "Web de los datos". Se basa en la idea de añadir metadatos semánticos y ontológicos a la World Wide Web. Esas informaciones adicionales que describen el contenido, el significado y la relación de los datos se deben proporcionar de manera formal, para que así sea posible evaluarlas automáticamente por máquinas de procesamiento. El objetivo es mejorar Internet ampliando la interoperabilidad entre los sistemas informáticos usando "agentes inteligentes". Agentes inteligentes son programas en las computadoras que buscan información sin operadores humanos.<br />La Web Semántica es una web extendida, la misma está dotada de un mayor significado. Se desarrolla con lenguajes universales que permitirán a los usuarios encontrar respuestas a sus preguntas de una forma más rápida y sencilla gracias a la mejor estructuración de la información. La misma permitirá a los usuarios delegar tareas a las herramientas de la Web Semánticas, las cuales podrán ser capaces de procesar la información. El término de Web Semántica es algo desconocido para muchos usuarios, varias personas afirman que es la sucesora de la Web actual. Sabemos que la comprensión del concepto de la misma puede resultar ser algo confuso.<br />La Web Semántica es una extensión de la World Wide Web en la que los contenidos de la Web pueden ser expresado mucho mas que en un lenguaje natural, y también en un formato que pueda ser entendido, interpretado y usado por diferentes software, permitiéndoles buscar, compartir e integrar información más fácil.<br />¿Cómo surge la Web Semántica?<br />La Web Semántica fue creada por Tim Berners-Lee, inventor de la WWW, URIs, HTTP y HTML. Existe un equipo en el World Wide Web Consortium (W3C) los cuales se dedican a mejorar, extender y estandarizar el sistema y muchos lenguajes, publicaciones y herramientas han sido ya desarrollados. <br />¿Cuál es su definición?<br />Es una Web que contiene mucha información donde podemos relacionar diferentes recursos. Con la misma podemos solucionar problemas habituales como son los de realizar búsquedas en Internet.<br />Los buscadores nos arrojan resultados gracias a palabras claves, están nos muestra informaciones que no se relacionan con lo que deseamos encontrar, y que podamos relacionar recursos en la Web; supongamos que contamos con un artículo publicado, podemos preguntar cuáles artículos ha publicado ese autor mediante las relaciones que existen.<br />¿Cuál es la visión?<br />La visión de la Web Semántica es ampliar los principios de la Web desde los documentos a los datos. La misma permitirá satisfacer mayor potencial a las Web, permitiendo que los datos sean compartidos con eficiencia por grandes comunidades, y sea procesada automáticamente por las herramientas y manualmente.<br />¿Cuál es su objetivo?<br />El objetivo es crear un medio universal que permita el intercambio de datos y brindar un mayor significado a la misma para que puedan ser interpretadas por las máquinas.<br />Metadatos:<br />Son informaciones sobre recursos. Los metadatos significan dato sobre datos. Estos permiten describir, identificar y localizar contenidos en documentos de la Web. <br />Estos metadatos deben contener información estructurada para que los ordenadores la entiendan y contener patrones iguales. Es decir, los metadatos son datos altamente estructurados que describen información, describen el contenido, la calidad, la condición y otras características de los datos.<br />Metadatos en XHTML:<br />Title (Titulo del recurso)<br />Autor (El autor)<br />Keywords (Las palabras claves)<br />¿Cómo obtener la información?<br />Mediante RDF podemos extraer la información de la base de datos para crear un formato más comprensible para las máquinas. Con esta información podemos realizar deducciones lógicas, combinar información, generar información nueva a partir de una ya existente, realizar consultas complejas en buscadores.<br />Principales Componentes:<br />Entre los principales componentes de la Web Semántica podemos encontrar XML, XML Schema, RDF, RDF Schema y OWL. La descripción de OWL en inglés “Ontology Web Language” describe las funciones y relaciones de cada componente de la Web Semántica:<br />XML: Provee una sintaxis elemental para las estructuras de contenidos dentro de documentos.<br />XML Schema: Es un lenguaje para proporcionar y restringir la estructura y el contenido de los elementos contenidos dentro de documentos XML.<br />RDF: Es un lenguaje simple para expresar modelos de los datos, que refieren a los objetos “recursos” y a sus relaciones. Un modelo de RDF-based se puede representar en sintaxis de XML.<br />RDF Schema: Es un vocabulario para describir propiedades y clases de recursos RDF-based, con semántica para generalizar-jerarquías de las propiedades y clases.<br />OWL: Es un mecanismo para desarrollar temas o vocabularios específicos en los que podamos asociar esos recursos.<br />755015255270Capas de la Web Semántica<br />Unicode:<br />Es un estándar cuyo objetivo es proporcionar el medio por el cual un texto en cualquier forma e idioma pueda ser codificado para el uso informático. El mismo nos permite mostrar información en cualquier idioma y con la certeza de que no aparezcan símbolos extraños.<br />URI: <br />Son cadenas que permiten acceder a cualquier recurso de la Web. En la Web Semántica las URIs son las encargadas de identificar objetos. Todos los objetos puedenser identificados mediante una URI. Si dos objetos cuentan con la misma URI pueden existir colisiones. El grupo de trabajo del W3C está intentando resolver este problema.<br />XML+NS+xmlschema:<br />Esta es la capa más tecnica de la Web Semántica. En ella se encuentran agrupadas las diferentes tecnologías que posibilitan la comunicación entre agentes. <br />El XML (Extensible Markup Language) nos ofrece un formato común para el intercambio de documentos, Namespaces (NS) proporciona un método para cualificar elementos y atributos de nombres usados en documentos XML asociandolos con espacios de nombre identificados por referencias URIs. XML Schema es un lenguaje que permite describir la estructura y restringir el contenido de documentos XML.<br />RDF+rdfschema: <br />Está basada en la capa anterior, define el lenguaje universal con el que podemos expresar diferentes ideas en la Web Semántica. RDF es un lenguaje que define un modelo de datos para describir recursos mediante tripetas sujeto-predicado-objeto. <br />Los dos primeros serán URIs y el tercero puede ser URI o un valor literal. RDF Schema es un vocabulario RDF que nos permite describir recursos mediante una orientación a objetos. Esta capa no sólo ofrece una descripción de los datos, sino también cierta información semántica.<br />Ontology (Ontologías): <br />Nos permite clasificar la información. Esta capa permite extender la funcionalidad de la Web Semántica agregando nuevas clases y propiedades para describir los recursos.<br />Logic (Lógica):<br />Además de ontologías se precisan reglas de inferencia.<br />Proof (Pruebas):<br />Se intercambiarán “pruebas” escritas en el lenguaje unificador de la Web Semántica. Este lenguaje posibilita las inferencias lógicas realizadas a través del uso de reglas de inferencia.<br />Trust (Confianza): <br />Hasta que no se haya comprobado de forma exhaustiva las fuentes de información, los agentes deberían ser muy escétipcos acerca de lo que leen en la Web Semántica.<br />Digital Signature (Firma digital):<br />Utilizada por los ordenadores y agentes para verificar que la información ha sido ofrecida por una fuente de confianza.<br />¿Qué es OWL?<br />OWL en inglés “Ontology Web Language” es un lenguaje para publicar y compartir datos usando ontologías en la Web. La misma tiene como objetivo facilitar un modelo de marcado construido sobre RDF y codificado en XML.<br />¿Qué son las URI?<br />Las URI (Uniform Resource Identifier / Identificador Uniforme de Recursos) no son más que cadenas de caracteres usadas para identificar o nombrar un recurso, pueden ser: documentos, páginas, dirección de correo electrónico, entre otros. <br />El propósito principal de esta identificación es permitir la interacción con las representaciones del recurso sobre una red, típicamente el World Wide Web, usando protocolos específicos. URIs se define en los esquemas definiendo una sintaxis específica y protocolos asociados.<br />Para que la Web Semántica funcionara se necesitaba de un lenguaje estándar para escribir los contenidos, a este lenguaje se le llamó RDF. Mediante el mismo podemos definir sentencias en el formato de triple.<br />¿Qué es RDF?<br />Por sus siglas en ingles RDF es un Marco de Descripción de Recursos, este es un framework para metadados en la World Wide Web, creado por W3C “World Wide Web Consortium”.<br />Este modelo se basa en la idea de convertir las declaraciones de los recursos en expresiones con la forma sujeto-predicado-objeto (conocidas en términos RDF como tripletes).<br />El sujeto es el recurso, es decir, es lo que se está describiendo. El predicado es la propiedad o relación que se desea establecer acerca del recurso. Por último, el objeto es el valor de la propiedad o el otro recurso con el que se establece la relación. <br />La combinación de RDF con otras herramientas como RDF Schema y OWL permite añadir significado a las páginas, y es una de las tecnologías esenciales de la Web semántica.<br />Sujeto: Es el recurso al cual nos estamos refiriendo.<br />Predicado: Es el recurso que indica lo que estamos definiendo.<br />Objeto: Puede ser un recurso que puede considerarse el valor definido.<br />Barreras<br />El desarrollo y difusión masivos de la web semántica tiene algunas dificultades que no ha podido superar todavía: una de ellas es tecnológica y la otra está relacionada con la falta de interés de los propietarios de las páginas web.<br />Las tecnologías para expresar la información en el formato que requiere una web semántica existen hace años. Quizás la componente más especializada sea OWL, que existe como estándar del W3C desde 2004. El componente tecnológico que falta es el que permita convertir de forma automática el abundante contenido de texto de las páginas web en marcas OWL. En 2009 la web semántica requiere que los creadores de las páginas web traduzcan "a mano" su contenido en marcas OWL, para que pueda ser interpretado por agentes semánticos. Afortunadamente muchas páginas (aunque no representen un porcentaje elevado de todas las páginas del mundo) tienen información formateada en su base de datos, y pueden realizar esta conversión de manera automática. Por ejemplo, un sitio con miles de fichas de películas, que incluyen datos como título, director, fecha de estreno, tiene estos datos prolijamente ordenados y clasificados en una base de datos, lo que les permite elaborar un traductor de "ficha de película" a OWL, que sirva para todas las fichas, sin necesidad de tener que realizar la traducción a mano para cada una.<br />La otra barrera que se opone pasivamente a la web semántica es el modelo de negocio de gran cantidad de páginas web, que obtienen ingresos de la publicidad. Estos ingresos son posibles únicamente si sus páginas son visitadas por una persona, y se pierden si los datos quedan disponibles para que los interprete un proceso automático. El siguiente ejemplo arbitrario y parcial ilustra este concepto: para un trabajo de investigación para la escuela sobre la vida de un prócer, un sistema semántico realiza la investigación y presenta en pantalla el resultado: fecha de nacimiento y defunción, batallas en las que participó, hechos destacados, frases célebres, y todo esto sin necesidad de acceder a ninguna página web específica, y por lo tanto sin consumir la publicidad de los sitios que pusieron a disposición esa información.<br />La visión no debe encerrarse en estos términos. Es muy probable que, de surgir una web semántica masiva, el modelo de negocios se adapte. Sin embargo, mientras no haya indicios de que esto vaya a suceder de manera inevitable e inminente, no es lógico suponer que los sitios web basados en publicidad apoyen su desarrollo poniendo su información en el formato necesario.<br />Componentes de la Web Semántica<br />Los principales componentes de la Web Semántica son los metalenguajes y los estándares de representación XML, XML Schema, RDF, RDF Schema y OWL. La OWL Web Ontology Language Overview describe la función y relación de cada uno de estos componentes de la Web Semántica:<br />• XML aporta la sintaxis superficial para los documentos estructurados, pero sin dotarles de ninguna restricción sobre el significado.<br />• XML Schema es un lenguaje para definir la estructura de los documentos XML.<br />• RDF es un modelo de datos para los recursos y las relaciones que se puedan establecer entre ellos. Aporta una semántica básica para este modelo de datos que puede representarse mediante XML.<br />• RDF Schema es un vocabulario para describir las propiedades y las clases de los recursos RDF, con una semántica para establecer jerarquías de generalización entre dichas propiedades y clases.<br />• OWL añade más vocabulario para describir propiedades y clases: tales como relaciones entre clases (p.ej. disyunción), cardinalidad (por ejemplo "únicamente uno"), igualdad, tipologías de propiedades más complejas, caracterización de propiedades (por ejemplo simetría) o clases enumeradas.<br />ONTOLOGIAS.<br />Aunque existen muy diversas definiciones del concepto de ontología, una de las más<br />ampliamente aceptadas es la siguiente de Thomas Gruber:<br />“Una Ontología es una especificación formal y explícita de una conceptualización<br />compartida”: El término “conceptualización” implica que toda ontología desarrolla un modelo abstracto<br />del dominio o fenómeno del mundo que representa. Dicho modelo abstracto se basa esencialmente en el empleo de conceptos, atributos, valores y relaciones. Con “especificación explícita” se quiere expresar que una ontología supone la descripción y representación de un dominio concreto mediante conceptos, atributos, valores, relaciones, funciones, etc., definidas explícitamente. Las máquinas no pueden dar nada por supuesto o por obvio, y todo conocimiento -por básico que parezca, mientras sea necesario- debe ser explícitamente representado.<br />El término “formal” alude al hecho de que cualquier representación (concepto, atributo, valor, etc.) ha de ser expresada en una ontología mediante un formalismo siempre idéntico, de manera que pueda ser reutilizada y leída por cualquier máquina independientemente del lugar o de la plataforma o idioma del sistema que lo emplee. Quizá el término más restrictivo e importante de los que figuran en la definición sea el de “compartida”. En efecto, una ontología lo es cuando dicha conceptualización y su representación formal y explícita ha sido favorablemente acogida por todos los usuarios de la misma. Ello permite por una parte distinguir claramente las ontologías de las bases de datos (en las que también puede hablarse de conceptualización y especificación formal y explícita mediante conceptos, atributos y valores, pero en la que el creador no tiene que lograr el consenso de nadie). Sin embargo, al mismo tiempo plantea una gran dificultad, pues en la práctica es imposible o casi imposible conseguir el consenso de todos los involucrados en un dominio específico (piénsese, por ejemplo, en una ontología sobre sanidad: ¿quién pone de acuerdo a médicos, pacientes, profesores, alumnos, gestores, etc., en la terminología, valores y relaciones en el dominio de la medicina?). De ahí que, en la práctica, se considere imposible desarrollar una ontología de carácter genérico o global, y sin embargo, se desarrollen ontologías en ámbitos mucho más restringidos, porque alcanzar aquí el consenso es factible (un banco para desarrollar servicios online para sus clientes, una empresa que desea una ontología sobre el conocimiento generado internamente por ella, etc.). Cuanto más genérico es el ámbito, en mayor medida el proceso hasta alcanzar el consenso se produce mediante una guerra de estándares inicial (varios organismos lanzan sus ontologías, esperando que cada una de ellas alcance el consenso de los demás), de las que surgen con el tiempo 2 ó 3 estándares de facto por área o sector, normalizándose finalmente hasta alcanzar una variante con el consenso de todos.<br />Sin ser exhaustivos, podemos clasificar las ontologías, según el dominio y propósito que<br />cubren, en los siguientes apartados:<br />• Ontologías de nivel superior: Permiten modelar los niveles altos de una realidad, ofreciendo<br />conceptos genéricos para la clasificación de términos. Ejemplos de ontologías de estas<br />características son CyC, WordNet, SUMO, etc.<br />• Ontologías generales: Algunos conceptos como el tiempo, el espacio, eventos, etc., pueden<br />reutilizarse a través de diferentes dominios.<br />• Ontologías de dominio: Ontologías de dominios específicos o para aplicaciones concretas<br />modelan las particularidades de las realidades de acuerdo a los propósitos de explotación<br />impuestos.<br />terminología básica empleada en ontología<br />En este apartado abordamos los principales conceptos que se manejan necesariamente al desarrollar una ontología. Todos ellos constituyen partes sustanciales en cualquier ontología, tanto en lo relativo a la estructura como al conjunto de datos.<br />• Clase (Concepto): Descripción formal de una entidad del universo o dominio que se quiere representar. Constituye la pieza básica de estructuración del conocimiento. La decisión sobre qué considerar una clase del dominio no es fácil. Tal decisión debe ser tomada de acuerdo a los objetivos de la ontología (extraídos de las sesiones con los expertos, preguntas relevantes y de estándares existentes en el dominio). Una clase puede tener subclases que representan conceptos que son más específicos que dicha clase.<br />• Clase abstracta: Clase que no permite que existan instancias de ella. Se usa para agrupar conceptos, introducir cierto orden en la jerarquía, pero suelen ser demasiado generales para admitir instancias.<br />• Instancia: Representan objetos concretos del dominio, pertenecientes a una clase. La colección<br />de instancias constituye la base de hechos (también denominada base de datos o base de conocimiento) del modelo.<br />• Instancia indirecta: Cuando una clase es instancia indirecta de otra, quiere decir que es instancia de alguna de sus clases derivadas. En contraposición a instancia directa, donde no existen clases intermedias.<br />• Propiedad (Atributo, Slot): Característica que permite describir más detalladamente la clase y sus instancias. Establece que la clase o concepto posee una propiedad que se concretará mediante un valor. Los valores de las propiedades o atributos pueden ser tipos básicos como cadenas de caracteres o números, pero también pueden ser otras clases o instancias (vid. Relación).<br />• Faceta (Restricción sobre las propiedades): Es alguna propiedad de la propiedad. Por ejemplo, la cardinalidad, si la propiedad es obligatoria o no, etc.<br />• Relación: Interacción o enlace entre los conceptos o clases del dominio que se modeliza. Algunas relaciones semánticas básicas son: subclase de, parte de, parte exhaustiva de, conectado a, es un, etc. Suelen configurar la taxonomía del dominio.Las relaciones más simples se modelizan mediante una propiedad de una clase cuyo valor es una instancia de otro concepto. Por ejemplo, dadas las clases AUTOR y OBRA, podemos definir la relación CREACIÓN como una propiedad (de cardinalidad múltiple) de la clase AUTOR cuyos valores sean instancias de la clase OBRA. Si las relaciones son más complejas (deben tener a su vez propiedades o deben organizarse en jerarquías, por ejemplo) se suelen definir mediante clases (conceptos) que las representen.<br />• Axioma: Regla que se añade a la ontología y que permite describir el comportamiento de los conceptos o clases. Se establecen a partir de valores específicos de las propiedades. Por ejemplo: “Para todo A que cumpla la condición C, entonces A es B”. Permiten dejar constancia de que ciertos valores de propiedades introducidos son coherentes con las restricciones de la ontología, o bien inferir posteriormente valores de atributos que no se han introducido explícitamente.De esta forma, a través de los axiomas es posible inferir conocimiento no codificado explícitamente en la ontología.<br />• Anotación: Es el proceso de relleno de instancias a partir de texto libre. Existen dos maneras de anotar texto: la más usual es la inclusión de etiquetas semánticas dentro del texto que se está procesando. Esto implica que el formato del texto debe ser editable y procesable. En el caso de no disponer de este formato, la segunda manera consiste en rellenar las instancias directamente en el modelo, dejando el texto original sin modificar.<br />• Herencia: Propiedad de la relación 'es_un' que permite que las clases relacionadas (heredadas) cuenten con los atributos de la clase con la cual se relacionan (clase padre).<br />• Herencia múltiple: Se da cuando una clase dada hereda o cuenta con las propiedades de dos clases padre con las que establece dos relaciones del tipo 'es_un'.<br />• Derivación: Organización de las clases de la ontología en un árbol de jerarquía mediante sucesivas relaciones 'es_un' (también llamadas kind_of, is_a, o herencias) con la propiedad de herencia. Esta organización permite el encadenamiento sucesivo de herencias desde las clases de nivel superior a las clases situadas en niveles inferiores, llamadas clases derivadas.<br />XML Y SUS ESTÁNDARES.<br />XML, siglas en inglés de eXtensible Markup Language ('lenguaje de marcas extensible'), es un metalenguaje extensible de etiquetas desarrollado por el World Wide Web Consortium (W3C). Es una simplificación y adaptación del SGML y permite definir la gramática de lenguajes específicos (de la misma manera que HTML es a su vez un lenguaje definido por SGML). Por lo tanto XML no es realmente un lenguaje en particular, sino una manera de definir lenguajes para diferentes necesidades[cita requerida]. Algunos de estos lenguajes que usan XML para su definición son XHTML, SVG, MathML.<br />XML no ha nacido sólo para su aplicación en Internet, sino que se propone como un estándar para el intercambio de información estructurada entre diferentes plataformas. Se puede usar en bases de datos, editores de texto, hojas de cálculo y casi cualquier cosa imaginable.<br />XML es una tecnología sencilla que tiene a su alrededor otras que la complementan y la hacen mucho más grande y con unas posibilidades mucho mayores. Tiene un papel muy importante en la actualidad ya que permite la compatibilidad entre sistemas para compartir la información de una manera segura, fiable y fácil.<br />XML proviene de un lenguaje inventado por IBM en los años setenta, llamado GML (Generalized Markup Language), que surgió por la necesidad que tenía la empresa de almacenar grandes cantidades de información. Este lenguaje gustó a la ISO, por lo que en 1986 trabajaron para normalizarlo, creando SGML (Standard Generalized Markup Language), capaz de adaptarse a un gran abanico de problemas. A partir de él se han creado otros sistemas para almacenar información.<br />En el año 1989 Tim Berners Lee creó la web, y junto con ella el lenguaje HTML. Este lenguaje se definió en el marco de SGML y fue de lejos la aplicación más conocida de este estándar. Los navegadores web sin embargo siempre han puesto pocas exigencias al código HTML que interpretan y así las páginas web son caóticas y no cumplen con la sintaxis. Estas páginas web dependen fuertemente de una forma específica de lidiar con los errores y las ambigüedades, lo que hace a las páginas más frágiles y a los navegadores más complejos.<br />Otra limitación del HTML es que cada documento pertenece a un vocabulario fijo, establecido por el DTD. No se pueden combinar elementos de diferentes vocabularios. Asimismo es imposible para un intérprete (por ejemplo un navegador) analizar el documento sin tener conocimiento de su gramática (del DTD). Por ejemplo, el navegador sabe que antes de una etiqueta <div> debe haberse cerrado cualquier <p> previamente abierto. Los navegadores resolvieron esto incluyendo lógica ad hoc para el HTML, en vez de incluir un analizador genérico. Ambas opciones, de todos modos, son muy complejas para los navegadores.<br />Se buscó entonces definir un subconjunto del SGML que permita:<br />•Mezclar elementos de diferentes lenguajes. Es decir que los lenguajes sean extensibles.<br />•La creación de analizadores simples, sin ninguna lógica especial para cada lenguaje.<br />•Empezar de cero y hacer hincapié en que no se acepte nunca un documento con errores de sintaxis.<br />Para hacer esto XML deja de lado muchas características de SGML que estaban pensadas para facilitar la escritura manual de documentos. XML en cambio está orientado a hacer las cosas más sencillas para los programas automáticos que necesiten interpretar el documento.<br />Ventajas del XML.<br />Es extensible: Después de diseñado y puesto en producción, es posible extender XML con la adición de nuevas etiquetas, de modo que se pueda continuar utilizando sin complicación alguna.<br />El analizador es un componente estándar, no es necesario crear un analizador específico para cada versión de lenguaje XML. Esto posibilita el empleo de cualquiera de los analizadores disponibles. De esta manera se evitan bugs y se acelera el desarrollo de aplicaciones.<br />Si un tercero decide usar un documento creado en XML, es sencillo entender su estructura y procesarla. Mejora la compatibilidad entre aplicaciones. Podemos comunicar aplicaciones de distintas plataformas, sin que importe el origen de los datos, es decir, podríamos tener una aplicación en Linux con una base de datos Postgres y comunicarla con otra aplicación en Windows y Base de Datos MS-SQL Server.<br />Transformamos datos en información, pues se le añade un significado concreto y los asociamos a un contexto, con lo cual tenemos flexibilidad para estructurar documentos.<br /> Estructura de un documento XML<br />La tecnología XML busca dar solución al problema de expresar información estructurada de la manera más abstracta y reutilizable posible. Que la información sea estructurada quiere decir que se compone de partes bien definidas, y que esas partes se componen a su vez de otras partes. Entonces se tiene un árbol de trozos de información. Ejemplos son un tema musical, que se compone de compases, que están formados a su vez por notas. Estas partes se llaman elementos, y se las señala mediante etiquetas.<br />Una etiqueta consiste en una marca hecha en el documento, que señala una porción de éste como un elemento. Un pedazo de información con un sentido claro y definido. Las etiquetas tienen la forma <nombre>, donde nombre es el nombre del elemento que se está señalando.<br />Partes de un documento XML<br />Un documento XML está formado por el prólogo y por el cuerpo del documento así como texto de etiquetas que contiene una gran variedad de efectos positivos o negativos en la referencia opcional a la que se refiere el documento, hay que tener mucho cuidado de esa parte de la gramática léxica para que se componga de manera uniforme.<br />Prólogo: Aunque no es obligatorio, los documentos XML pueden empezar con unas líneas que describen la versión XML, el tipo de documento y otras cosas.<br />El prólogo de un documento XML contiene:<br />Una declaración XML. Es la sentencia que declara al documento como un documento XML.<br />Una declaración de tipo de documento. Enlaza el documento con su DTD (definición de tipo de documento), o el DTD puede estar incluido en la propia declaración o ambas cosas al mismo tiempo.<br />Uno o más comentarios e instrucciones de procesamiento.<br />Cuerpo: A diferencia del prólogo, el cuerpo no es opcional en un documento XML, el cuerpo debe contener un y solo un elemento raíz, característica indispensable también para que el documento esté bien formado. Sin embargo es necesaria la adquisición de datos para su buen funcionamiento.<br />Elementos: Los elementos XML pueden tener contenido (más elementos, caracteres o ambos), o bien ser elementos vacíos.<br />Atributos: Los elementos pueden tener atributos, que son una manera de incorporar características o propiedades a los elementos de un documento. Deben ir entre comillas.<br />Por ejemplo, un elemento «estudiante» puede tener un atributo «Mario» y un atributo «tipo», con valores «come croquetas» y «taleno» respectivamente.<br /><Estudiante Mario="come croquetas" tipo="taleno">Esto es un día que Mario va paseando…</Estudiante><br />Entidades predefinidas: Entidades para representar caracteres especiales para que, de esta forma, no sean interpretados como marcado en el procesador XML.<br />Ejemplo: entidad predefinida: & carácter: &.<br />Secciones CDATA<br />Artículo principal: Anexo:Etiquetas HTML/XHTML<br />Es una construcción en XML para especificar datos utilizando cualquier carácter sin que se interprete como marcado XML. No confundir con 2(#PCDATA) que es para los elementos. Permite que caracteres especiales no rompan la estructura. Ejemplo:<br /><![CDATA[ contenido especial: áéíóúñ&]] ><br />Comentarios: Comentarios a modo informativo para el programador que han de ser ignorados por el procesador. Los comentarios en XML tienen el siguiente formato:<br /> <!--- Esto es un comentario ---><br /> <!-- Otro comentario --><br />Validez: Que un documento esté «bien formado» solamente se refiere a su estructura sintáctica básica, es decir, que se componga de elementos, atributos y comentarios como XML especifica que se escriban. Ahora bien, cada aplicación de XML, es decir, cada lenguaje definido con esta tecnología, necesitará especificar cuál es exactamente la relación que debe verificarse entre los distintos elementos presentes en el documento.<br />Esta relación entre elementos se especifica en un documento externo o definición (expresada como DTD —Document Type Definition, 'Definición de Tipo de Documento'— o como XSchema). Crear una definición equivale a crear un nuevo lenguaje de marcado, para una aplicación específica.<br />Document Type Definition: La Document Type Definition o DTD (en español "definición de tipo de documento") define los tipos de elementos, atributos y entidades permitidas, y puede expresar algunas limitaciones para combinarlos. Los documentos XML que se ajustan a su DTD son denominados válidos.<br />Declaraciones tipo elemento: Los elementos deben ajustarse a un tipo de documento declarado en una DTD para que el documento sea considerado como válido.<br />Modelos de contenido<br />Un modelo de contenido es un patrón que establece los subelementos aceptados, y el orden en que se aceptan.<br />Declaraciones de lista de atributos<br />Los atributos se usan para añadir información adicional a los elementos de un documento.<br />Tipos de atributos<br />Atributos CDATA y NMTOKEN<br />Atributos enumerados y notaciones<br />Atributos ID e IDREF<br /> Declaración de entidades<br />XML hace referencia a objetos que no deben ser analizados sintácticamente según las reglas XML, mediante el uso de entidades. Las entidades pueden ser:<br />Internas o externas<br />Analizadas o no analizadas<br />Generales o parametrizadas<br />Espacios de nombres<br />Los espacios de nombres XML permiten separar semánticamente los elementos que forman un documento XML.<br />XML Schemas (XSD)<br />Un Schema es algo similar a un DTD. Define qué elementos puede contener un documento XML, cómo están organizados y qué atributos y de qué tipo pueden tener sus elementos.<br />Ventajas de los Schemas frente a los DTD<br />Usan sintaxis de XML, al contrario que los DTD.<br />Permiten especificar los tipos de datos.<br />Son extensibles<br />Lenguajes creados usando XML<br />Extensible Stylesheet Language (XSL)<br />El Lenguaje de Hoja de Estilo Extensible (eXtensible Stylesheet Language, XSL) es una familia de lenguajes que permiten describir como los archivos codificados en xml serán formateados (para mostrarlos) o transformados. Hay tres lenguajes en esta familia: XSL Transformations (XSLT), XSL Formatting Objects (XSL-FO)y XML Path Language.<br />Lenguaje de enlace XML (XLINK)<br />XLink es una aplicación XML que intenta superar las limitaciones que tienen los enlaces de hipertexto en HTML. XLink 1.1 es ya una recomendación W3C.<br />Otras tecnologías<br />Hojas de estilo <br />XSL-FO<br />XSLT<br />XLink<br />XPointer<br />XSL<br />hojas de estilo en cascada (CSS)<br />XLT (XML representation of Lexicons and Terminologies)<br />Programación <br />JDOM<br />SAX<br />STAX<br />VTD-XML<br />Consulta de datos <br />XQuery<br />Xpath<br />Seguridad <br />Xades (XML Advanced Electronic Signatures)<br />Hay quien opina que XML es demasiado pesado para algunas aplicaciones y difícil de editar con un editor de texto simple. Por ello merece la pena mencionar algunas alternativas más ligeras y simples. Los lenguajes de marcas ligeros:<br />Simple Outline XML: es un XML simplificado que se puede convertir sin problemas en XML completo.<br />YAML y OGDL. Estos dos son ficheros de solo texto que no están emparentados con XML como el SOX, antes comentado.<br />BBCode. Éste tiene un uso muy restringido para dar formato nada más.<br />También hay por lo menos un lenguaje basado en XML en formato binario, llamado EBML.<br />FUENTES:<br />http://es.wikipedia.org/wiki/Metadatos<br />http://sistemasavanzadosderecuperaciondeinformacion.iespana.es.<br />http://es.wikipedia.org/wiki/Web-semantica<br />http://www.maestrosdelweb.com/editorial/web-semantica-y-sus-principales-caracteristicas.<br />http://www.lsi.upc.edu/~bejar/ia/transpas/teoria/3-RC3-Ontologias.pdf<br />http://es.wikipedia.org/wiki/Ontolog%C3%ADa_%28inform%C3%A1tica%29<br />http://www.maestrosdelweb.com/editorial/web-xml-y-sus-principales-standares<br />

×