La Web Semantica

  • 3,180 views
Uploaded on

 

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
3,180
On Slideshare
0
From Embeds
0
Number of Embeds
2

Actions

Shares
Downloads
77
Comments
0
Likes
3

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide
  • Comparar y combinar documentos con distinta estructura

Transcript

  • 1. Tema 15: La Web Semántica Rafael Pedraza Jiménez Departamento de Comunicación Universitat Pompeu Fabra [email_address]
  • 2. Contenido
    • Problemas de la Web actual.
    • La Web semántica.
    • Tecnologías de la Web semántica:
      • Lenguajes de descripción
      • Ontologías
      • Agentes de usuario
    • Web actual vs. Web semántica.
    • Problemas de la Web semántica.
    • La Ingeniería de ontologías
    • Problemas de la Ingeniería de ontologías
    • Resumen y conclusiones
  • 3. Problemas de la Web actual
    • La Web es un sistema descentralizado y heterogéneo .
    • En la Web se produce un proceso de recuperación de la información con adversario .
    • La Web carece de un modelo bien definido para la representación de la información . El método de marcado de la información, html, combina elementos de contenido con otros de presentación.
    • ¿Cómo podemos solucionarlos? …
  • 4. La Web Semántica
    • 2001: Tim Berners-Lee enuncia la Web Semántica .
    • “ El contenido de la Web será expresado de manera que los ordenadores puedan entenderlo ”
    • Para ello:
    • La información tiene que estar marcada .
    • Son necesarias herramientas que permitan interpretar, comparar y fusionar datos e informaciones .
      • Estas herramientas son las Ontologías .
  • 5. Tecnologías de la Web Semántica
    • Desarrollo de lenguajes de etiquetas con carga semántica  XML
      • Marcado : descripciones de las páginas y sitios web compatibles e interoperables para los sistemas informáticos  RDF , Dublin Core
      • Interpretar, comparar y/o fusionar datos : lenguajes lógicos que puedan ser interpretados por un ordenador  RDFS , SKOS Core , OWL
  • 6. XML
    • Permite definir tipos de documentos y los conjuntos de etiquetas necesarias para codificarlos.
    • Es un meta-lenguaje para la definición de estructuras textuales.
  • 7. XML
    • <?xml version=“1.0” encoding=”ISO-8859-1” standalone=”no” ?>
    • <!DOCTYPE COLECCION_FOTOGRAFIAS SYSTEM “coleccionFotografias.dtd”>
    • <!-- Documento XML definido para una colección de fotografías -->
    • <COLECCION_FOTOGRAFIAS creador=”Pedro Guzmán”>
    • <FOTOGRAFIA identificador= “_001” formato=“png” tamanoBytes=“21272”>
    • <AUTOR>Saúl Blanco</AUTOR>
    • <TITULO>A mil años luz</TITULO>
    • <FECHA>23-07-2006</FECHA>
    • <DESCRIPCION>Cabeza de una estatua…</DESCRIPCION>
    • <FUENTE nombre=“Bluethinking” uri=“ http :// www.bluethinking.com / evam ” otrasFotos=”_015, _137” />
    • </FOTOGRAFIA>
    • <FOTOGRAFIA id=”_002” formato=”jpg” tamanoBytes=”1374”>
    • ...
    • </FOTOGRAFIA>
    • <FOTOGRAFIA id=”_003” formato=”tiff” tamanoBytes=”54312”>
    • ...
    • </FOTOGRAFIA>
    • </COLECCION_FOTOGRAFIAS>
  • 8. RDF
    • Es el sistema que permite utilizar metadatos para describir recursos .
    • Su objetivo es expresar el significado de las estructuras descritas mediante lenguajes XML , y facilitar así la interoperabilidad entre diferentes modelos de metadatos.
    • Todo sistema RDF parte de tres entidades lógicas:
      • Recursos
      • Propiedades
      • Valores
  • 9. RDF abreviado
    • <rdf:RDF xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#”
    • xmlns:dc=”http://purl.org/dc/elements/1.0”>
    • <rdf:Description about=”http://www.technobserver.com” dc:title=” Technobserver: Observatorio de las tecnologías para la gestión de la información”>
    • </rdf:RDF>
  • 10. RDF Schema (RDFS)
    • <?xml version=&quot;1.0&quot;?>
    • <rdf:RDF xmlns:rdf= &quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot; xmlns:rdfs=&quot;http://www.w3.org/2000/01/rdf-schema#&quot;
    • xml:base= &quot;http://www.animals.fake/animals#&quot;>
    • < rdf:Description rdf:ID=&quot;animal&quot; >
    • <rdf:type rdf:resource=&quot;http://www.w3.org/2000/01/rdf-schema#Class&quot;/>
    • </rdf:Description>
    • < rdf:Description rdf:ID=&quot;horse&quot; >
    • <rdf:type rdf:resource=&quot;http://www.w3.org/2000/01/rdf-schema#Class&quot;/>
    • < rdfs:subClassOf rdf:resource=&quot;#animal&quot; />
    • </rdf:Description>
    • </rdf:RDF>
  • 11. Dublin Core
    • Es una norma internacional , que establece un conjunto de metadatos para la descripción de recursos.
    • Aparece en 1995 , en un momento en el que el volumen de recursos disponibles en la Web no dejaba de crecer.
    • Su principal característica es su sencillez.
    • Actualmente Dublin Core (DC) establece dos posibles usos de sus elementos, posibilitando descripciones tanto mediante el “ Simple Dublin Core ” como del “ Qualified Dublin Core ”.
  • 12. Dublin Core: elementos
    • Contributor
    • Coverage
    • Creator
    • Date
    • Description
    • Format
    • Identifier
    • Language
    • Publisher
    • Relation
    • Rights
    • Source
    • Subject
    • Title
    • Type
  • 13. Dublin Core y RDF
    • <?xml version=&quot;1.0&quot;?><!DOCTYPE rdf:RDF PUBLIC &quot;-//DUBLIN CORE//DCMES DTD 2002/07/31//EN&quot; &quot;http://dublincore.org/documents/2002/07/31/dcmes-xml/dcmes-xml-dtd.dtd&quot;>
    • <rdf:RDF xmlns:rdf=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot;
    • xmlns:dc =&quot;http://purl.org/dc/elements/1.1/&quot;>
    • <rdf:Description rdf:about=&quot;http://dublincore.org/&quot; >
    • < dc:title >Dublin Core Metadata Initiative - Home Page< /dc:title >
    • < dc:description >The Dublin Core Metadata Initiative Web site.< /dc:description >
    • < dc:date >2001-01-16< /dc:date >
    • < dc:format >text/html< /dc:format >
    • < dc:language >en< /dc:language >
    • < dc:contributor >The Dublin Core Metadata Initiative< /dc:contributor >
    • < dc:title xml:lang=&quot;fr&quot; >L'Initiative de métadonnées du Dublin Core< /dc:title >
    • < dc:title xml:lang=&quot;de&quot; >der Dublin-Core Metadata-Diskussionen< /dc:title >
    • </rdf:Description>
    • </rdf:RDF>
  • 14. Dublin Core y XHTML
    • <html>
    • <head>
    • <title>…</title>
    • <meta name=” dc.title ” content=”Blog de la Biblioteca Universitaria”>
    • <meta name=” dc.creator ” content=”Tapia Flores, Héctor”>
    • <meta name=” dc.subject ” content=”004.Ch383 1972″ (ejemplo de un DEWEY)
    • <meta name=” dc.description ” content=”Pagina de un blog preparada para …”>
    • <meta name=” dc.publisher ” content=”Biblioteca Universidad Arturo Prat”>
    • <meta name=” dc.contributor ” content=”Unidad de Medios Digitales”>
    • <meta name=” dc.date ” content=”2007-07-04″>
    • <meta name=” dc.type ” content=”text”>
    • <meta name=” dc.format ” content=”jpg”>
    • <meta name=” dc.identifier ” content=”84-999-8888-1 (ISBN)“>
    • <meta name=” dc.source ” content=”Colección de artículos …″>
    • <meta name=” dc.language ” scheme=“RFC1766″ content=“es”>
    • <meta name=” dc.relation ” content=”http://bibliopress.wordpress.com”>
    • <meta name=” dc.coverage ” content=”2007-07-04″>
    • <meta name=” dc.rights ” content=”http://www.ejemplo.cl/derechos_autor.html”>
    • </head>
  • 15. SKOS Core
    • SKOS Core (SKOS, 2004) es publicado y mantenido por el W3C Semantic Web Best Practices and Deployment Working Group.
    • Es un lenguaje formal, sencillo y extensible que permite expresar la estructura básica y el contenido de diferentes esquemas de conceptos .
    • Es más secillo que OWL, aunque con una capacidad semántica más limitada.
  • 16. SKOS Core
    • <rdf:RDF
    • xmlns:rdf=”http://www.w3c.org/1999/02/22-rdf-syntax-ns#”
    • xmlns:skos=”http://www.w3c.org/2004/02/core#”
    • xml:base=”http://www.ukat.org.uk/thesaurus/concept/”>
      • <skos:Concept rdf:about=”1750”>
      • <skos:prefLabel>Economic cooperation</skos:prefLabel>
      • <skos:altLabel>Economic co-operation</skos:altLabel>
      • <skos:scopeNote>Includes cooperative measures in banking, trade, industry, etc. between and among countries.</skos:scopeNote>
      • <skos:broader rdf:resource=”4382” />
      • <skos:narrower rdf:resource=”2108” />
      • <skos:narrower rdf:resource=”9505” />
      • <skos:narrower rdf:resource=”15053” />
      • <skos:narrower rdf:resource=”18987” />
      • <skos:related rdf:resource=”3250” />
      • </skos:Concept>
    • </rdf:RDF>
  • 17. OWL
    • Es el lenguaje que permite combinar y comparar documentos con distinta estructura .
    • A estos lenguajes o herramientas se les denomina ontologías , y básicamente incluyen las definiciones de los conceptos, denominadas “clases”, de un dominio y las relaciones entre ellos.
    • Owl utiliza rdf para representar y codificar las ontologías. Por tanto, owl es una extensión de rdf que añade elementos.
  • 18. OWL
    • <?xml version=”1.0”?>
    • <rdf:RDF
    • xmlns:rdf=”http://www.w3c.org/1999/02/22-rdf-syntax-ns#”
    • xmlns:rdfs=”http://www.w3.org/2000/01/rdf-schema#”
    • xmlns:owl=”http://www.w3.org/2002/07/owl#”>
    • < owl:Ontology rdf:about=”http://www.unbuenrestaurante.com/menu”>
    • <rdfs:label>Menú</rdfs:label>
    • <rdfs:comment>Esta ontología describe algunos conceptos básicos para representar el menú de un restaurante </rdfs:comment>
    • < /owl:Ontology >
    • < owl:Class rdf:ID=”PastelDeChocolate”>
    • <rdfs:label>Pastel de chocolate</rdfs:label>
    • < /owl:Class >
    • </rdf:RDF>
  • 19. Agentes inteligentes de usuario
    • La Web semántica no alcanzará su máximo potencial hasta que se desarrollen agentes inteligentes capaces de buscar contenido en esta nueva Web , procesando la información e intercambiándola con otros programas . Será la eficacia de estos programas la que permita incrementar masivamente el contenido Web realmente procesable de forma automática.
  • 20. La Web actual
  • 21. La Web Semántica
  • 22. Funcionamiento de la Web Semántica ... ... Recurso : UN Datos : Iraq, Economía , ... Recurso : OMS Datos : Iraq , Demografía , ... Países Kuwait Iraq Economía Demografía Ontología
  • 23. Ejemplo real de Ontología <?xml version=”1.0” ?> <rdf:RDF xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#”> … <owl:Class rdf:ID=”Perifericos”> <rdf:comment> Los periféricos de ordenador están conectados a la CPU pero no forman parte de ella. </rdf:comment> </owl:Class> <owl:Class rdf:ID=”Entrada”> <rdf:comment> Los periféricos de entrada son una subclase de periféricos de ordenador. </rdf:comment> <rdfs:subClassOf rdf:resource=”#Perifericos” /> </owl:Class> <owl:Class rdf:ID=”Teclados”> <rdf:comment> Los teclados son una subclase de los periféricos de entrada. </rdf:comment> <rdf:subClassOf rdf:resource=”#Entrada” /> <rdf:subClassOf rdf:resource=”#Perifericos” /> </owl:Class> … </rdf:RDF> Periférico Entrada Teclado
  • 24. Problemática de la Web semántica
    • Elevado coste de su desarrollo:
      • Tiempo
      • Dinero
    • Ontologías dependientes de un dominio .
    • Ontologías dependientes de objetivos .
    • ¿Solución?
    • Ingeniería de Ontologías .
  • 25. La Ingeniería de Ontologías 1. Se selecciona un corpus de documentos de un dominio … 2. Se aplican técnicas de procesamiento lingüístico Fotografía Banco imagen Cine Film Diario Prensa Noticia Guión Cine … 3. Se utilizan algoritmos de clasificación Documentación Audiovisual Fotografía Cine Prensa Films Guiones
  • 26. Problemas de la ingeniería de ontologías
    • Elevado coste computacional
    • Errores lógicos (categoría inadecuadas, etc.)
  • 27. Resumen y Conclusiones
    • Tecnologías básicas de la Web semántica:
      • Lenguajes para estructurar los contenidos: estos lenguajes se crearán utilizando XML.
      • Herramienta para extraer el significado de la estructura de esas informaciones: de esta tarea se encargará RDF (también DC, XHTML, etc.).
      • Lenguajes que permitan comparar y/o combinar informaciones con distinta estructura: OWL.
      • Herramientas que permitan la recuperación eficaz de dichas informaciones: Agentes inteligentes.
  • 28. Conclusiones
    • En algún momento del futuro (pero no a corto plazo), la Web estará poblada por un determinado número de ontologías que permitirán a los ordenadores realizar inferencias sobre la información publicada.
    • Los agentes de usuario (los navegadores del futuro) serán capaces de realizar razonamientos fiables sobre tales ontologías.
    • No obstante:
      • el coste requerido en tiempo y dinero para la generación de la infraestructura propia de la web semántica,
      • la ausencia de alicientes que animen a los usuarios a adoptar las recomendaciones del W3C ,
      • y el desinterés de parte de los agentes técnico-comerciales más importantes de la web actual (como por ejemplo los proveedores de servicios de búsqueda y los fabricantes de navegadores),
    • hacen augurar que incluso la fecha del 2020 que algunas veces se ha apuntado para este escenario resulte optimista.
    • En cualquier caso, las tecnologías de la Web semántica ofrecen hoy por hoy importantes soluciones
  • 29. Bibliografía
    • LeeBerners-Lee, T., Hendler, J., and Lassila, O. (2001). The Semantic Web. Scientific American, vol. 284, nº 5, May 2001, pp. 34-43.
    • Rafael Pedraza-Jiménez, Lluís Codina, Cristòfol Rovira (2007). “Web semántica y ontologías en el procesamiento de la información documental”. El Profesional de la Información, Noviembre-Diciembre 2007, vol.16, nº 6, pp. 569-578.