Your SlideShare is downloading. ×
0
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
aporte de internet
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

aporte de internet

873

Published on

web semantica

web semantica

Published in: Education
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
873
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
12
Comments
0
Likes
1
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid Proceso de buscar en grandes volúmenes de datos automáticamente, a través de patrones, utilizando herramientas como clasificaciones, explotación de reglas de asociación, clustering, etc.
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid Proceso de buscar en grandes volúmenes de datos automáticamente, a través de patrones, utilizando herramientas como clasificaciones, explotación de reglas de asociación, clustering, etc.
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid Data Mining utiliza el análisis y la interpretación de los datos en bases de datos estructuradas para facilitar la toma de decisiones.
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid http://iadlc.nul.nagoya-u.ac.jp/archives/IADLC2005/Ee-Peng.pdf Web mining refers to the discovery of knowledge from Web data that include Web pages, media objects on the Web, Web links, Web log data, and other data generated by the usage of Web data. Kosala and Blockeel classified Web mining into: (a) Web content mining , (b) Web structure mining and (c) Web usage mining [3]. Web content mining refers to mining knowledge from Web pages and other Web objects. Web structure mining refers to mining knowledge about link structure connecting Web pages and other Web objects. Web usage mining refers to the mining of usage patterns of Web pages found among users accessing a Website. Among the three, Web content mining is perhaps studied most extensively due to the prior work in text mining. The traditional topics covered by Web content mining include: · Web page classification : This involves the classification of Web pages under some pre-defined categories that may be organised in a tree or other structures. · Web clustering : This involves the grouping of Web pages based on the similarities among them. Each resultant group should have similar Web pages while Web pages from different resultant groups should be dissimilar. · Web extraction : This involves extracting HTML elements, term phrases, or tuples from Web pages that represent some required concept instances, e.g., person names, location names, book records, etc..
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid http://iadlc.nul.nagoya-u.ac.jp/archives/IADLC2005/Ee-Peng.pdf Web mining refers to the discovery of knowledge from Web data that include Web pages, media objects on the Web, Web links, Web log data, and other data generated by the usage of Web data. Kosala and Blockeel classified Web mining into: (a) Web content mining , (b) Web structure mining and (c) Web usage mining [3]. Web content mining refers to mining knowledge from Web pages and other Web objects. Web structure mining refers to mining knowledge about link structure connecting Web pages and other Web objects. Web usage mining refers to the mining of usage patterns of Web pages found among users accessing a Website. Among the three, Web content mining is perhaps studied most extensively due to the prior work in text mining. The traditional topics covered by Web content mining include: · Web page classification : This involves the classification of Web pages under some pre-defined categories that may be organised in a tree or other structures. · Web clustering : This involves the grouping of Web pages based on the similarities among them. Each resultant group should have similar Web pages while Web pages from different resultant groups should be dissimilar. · Web extraction : This involves extracting HTML elements, term phrases, or tuples from Web pages that represent some required concept instances, e.g., person names, location names, book records, etc..
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Curso Especializado: Metadatos para los Sistemas de Información Digital 22 Mayo 2008 - SEDIC Eva Méndez. Universidad Carlos III de Madrid
  • Curso Especializado: Metadatos para los Sistemas de Información Digital 22 Mayo 2008 - SEDIC Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Introducción a la Web Semántica (Curso en Buenos Aires. SIU) Octubre 2009 Eva Méndez. Universidad Carlos III de Madrid
  • Transcript

    • 1. Introducción a la Web Semántica: vocabularios, tecnologías y estándares Universidad Carlos III de Madrid Dpto. Biblioteconomía y Documentación
    • 2. Esta presentación es vuestra en: <ul><li>http://www.bib.uc3m.es/~mendez/SW-ARGENTINA </li></ul><ul><li>Presentaciones </li></ul><ul><li>Recursos </li></ul><ul><li>Programa </li></ul><ul><li>Bibliografía </li></ul>
    • 3. PRESENTACIONES
    • 4. Sobre mi … <ul><li>Dra. en Documentación. Profesora de la Universidad Carlos III de Madrid (desde 1997) </li></ul><ul><li>Miembro del Comité Asesor de la DCMI y co-chair de la DC Social Tagging Community </li></ul><ul><li>European Research Scholar en el Centro de Investigación de Metadatos. UNC (Chapel Hill, USA 2005-06) </li></ul><ul><li>Experto independiente para la CE en los programas eContentPlus, CIP-PSP y del ICT-Digital Libraries (7FP) </li></ul><ul><li>Directora del Máster Oficial en Bibliotecas y Servicios de información digital (semipresencial 2009-2010): http://www.uc3m.es/bibliotecasdigitales </li></ul>
    • 5. Sobre vosotros… <ul><li>¿Cuántos de vosotros sois bibliotecarios? ¿archiveros?¿documentalistas? ¿desarrolladores? </li></ul><ul><li>¿Qué sabéis de la Web Semántica?¿Qué sabéis de la Web? </li></ul><ul><li>¿Cuántos estáis involucrados en alguna iniciativa de biblioteca o xxxx digital? </li></ul><ul><li>Si es así…¿En cuál? </li></ul><ul><li>¿Qué esperáis aprender aquí? </li></ul>
    • 6. De qué vamos a hablar <ul><li>El problema de la representación y recuperación de información en la WWW </li></ul><ul><li>La representación y recuperación del conocimiento: del data mining a las ontologías </li></ul><ul><li>Concepto y características de la Web Semántica </li></ul><ul><li>Estándares y lenguajes de representación del contenido: </li></ul><ul><ul><li>Vocabularios de base léxica: WordNet, SKOS </li></ul></ul><ul><ul><li>Vocabularios de base lógica: Ontologías y Topic Maps </li></ul></ul><ul><ul><li>Tipificación de NKOS (Network Knowledge Organization Systems/Services) para la Web Semántica y sus estándares </li></ul></ul><ul><li>Proyectos y áreas de aplicación de las tecnologías de la Web Semántica </li></ul><ul><li>Web 2.0 y la Web Semántica: Web 3.0… Web Social Semántica (Social Semantic Web) </li></ul><ul><li>Linked data, Open data… y de “la nube”. </li></ul><ul><li>Bibliotecas digitales semánticas </li></ul>
    • 7. Contenidos / Programa <ul><li>Introducción: La Web evoluciona. Conceptos, estándares y usos de la Web Semántica. </li></ul><ul><ul><li>La evolución de la Web: diferenciación entre Web 2.0, Web Semántica (SW),etc. </li></ul></ul><ul><ul><li>Web Semántica, Servicios Web y la Recuperación de información en la WWW. </li></ul></ul><ul><ul><li>Estándares para la Web y estándares para la Web Semántica: RDF/XML </li></ul></ul><ul><ul><li>Conceptos clave en la SW: metadatos, ontologías, agentes, etc. </li></ul></ul><ul><li>Ejemplos y casos de uso de la Web Semántica. </li></ul><ul><ul><li>Buscadores semánticos </li></ul></ul><ul><ul><li>Búsqueda de ontologías, vocabularios y reutilización de ontologías </li></ul></ul><ul><ul><li>Algunas aplicaciones para trabajar con la Web Semántica: Creación de ontologías y tesauros SKOSificados (Protégé, ThManager), creación de perfiles FOAF, etc. </li></ul></ul><ul><li>Estándares y Tecnologías para la Representación del Conocimiento en la Web Semántica. </li></ul><ul><ul><li>RDF y Metadatos: DCMI-DCAM </li></ul></ul><ul><ul><li>RDF y Tesauros: SKOS </li></ul></ul><ul><ul><li>RDF y Ontologías: OWL </li></ul></ul><ul><ul><li>RDF y Redes sociales: FOAF </li></ul></ul><ul><ul><li>Microformatos: Web Semántica en minúsculas </li></ul></ul><ul><li>Discusión sobre el futuro de la Web Semántica, Web 3.0, interoperabilidad y Bibliotecas Digitales Semánticas. </li></ul>
    • 8. Mi posición en el tema… Greenberg & Mendez (2007): Knitting the Semantic Web = Tejiendo la Web Semántica <ul><li>Weaving= como tejen las arañas (ants, buscadores) </li></ul><ul><li>Knitting= como tejen las personas (los bibliotecarios) </li></ul>Berners Lee (1999): Weaving the Web = Tejiendo la Web
    • 9. La Web necesita bibliotecari@s, la SW + The Internet is the World’s largest library. It is just that the books are on the floor (John Allen Paulos)
    • 10. La Web necesita bibliotecari@s, la SW + Lo que Internet necesita es un/a bibliotecario/a anticuado/a. Encontrar lo que queremos en la Web debería de ser igual de fácil que encontrar un libro en una biblioteca. Así será, si Eugenia [pongan aquí su nombre] consigue lo que quiere. Está trabajando para crear un estándar para etiquetar y catalogar información online –que incluye todos los 2.7 billones de páginas web… algo así como un sistema de información Decimal Dewey virtual, si lo preferís. Así, podrás gastar menos tiempo en buscar, y más tiempo en utilizar la información que necesitas. Shhhhh… Estás en Internet.
    • 11. ACTUALIZACIONES (Desde julio)
    • 12. Todo evoluciona… <ul><li>… incluso en 4 meses </li></ul><ul><li>… por supuesto: la Web </li></ul><ul><li>… y por supuesto: la Web Semántica </li></ul><ul><li>Infodemiología: Google Flu Trends (leer artículo en Nature ): http://www.google.org/flutrends </li></ul>
    • 13. La Web evoluciona… <ul><li>Nuevo Website para NeOn Toolkit (7 Agosto 2009): </li></ul><ul><li>http://neon-toolkit.org/wiki/New_Website </li></ul><ul><li>SKOS Reference : Recomendación del W3C el 18 Agosto 2009 </li></ul><ul><li>Las bibliotecas buscan “gente interesada en la Web semántica”. Oferta de trabajo Europeana (Oct2009) </li></ul><ul><li>Nueva Biblioteca Digital Semántica (Oct2009): http://bami.cilea.it/ </li></ul><ul><li>International Semantic Web Conference </li></ul><ul><li>(ISWC 2009): Washington DC 25-29 Oct 2009 </li></ul><ul><li>Nuevo libro sobre SW </li></ul>… incluso en 4 meses
    • 14. La Web evoluciona… http://www.w3.org
    • 15. <ul><li>1. Introducción: La Web evoluciona. Conceptos, estándares y usos de la Web Semántica: </li></ul><ul><li>La evolución de la Web: diferenciación entre Web 2.0, Web Semántica (SW) </li></ul><ul><li>Web Semántica, Servicios Web y la Recuperación de información en la WWW. </li></ul><ul><li>Estándares para la Web y estándares para la Web Semántica: RDF/XML </li></ul><ul><li>Conceptos clave en la SW: metadatos, ontologías, agentes, etc. </li></ul>
    • 16. Introducción y contexto: la representación/ recuperación de conocimiento en la Web. Tendencias Universidad Carlos III de Madrid Dpto. Biblioteconomía y Documentación
    • 17. Introducción y contexto <ul><li>WEB: Gran cantidad de información (de alta calidad e información científica y/o profesional + información informal, sitios personales, Weblogs, Wikis, etc.) </li></ul><ul><li>¿Cómo dotar a esa información de fiabilidad y consistencia en la recuperación? </li></ul><ul><li>Además de la información nacida en la Web (born digital)  tendencia al acceso, disponibilidad en línea del patrimonio cultural / científico (EU, España, WDL, etc.) </li></ul><ul><li>Lo que no está en la Web… no existe </li></ul><ul><li>Lo que no se encuentra, integra… no vale </li></ul>Ver video
    • 18. Exceso de información en la Web URI, HTML, HTTP Es t á tic a WWW 500 millones de usuarios Más de 3 billones de páginas
    • 19. La WWW y el documento-e: Universo de información Web Fuente: Stuart Weibel, Makx Dekkers ( DCMI ) Datos científicos Páginas Web Empresa Internet Biblioteca eGobierno Comercio Cualquiera ...
    • 20. Web de documentos / Web de Datos Web de datos Web de documentos
    • 21. Contexto: patrimonio cultural y científico <ul><li>Conocimiento científico y cultural en formatos tradicionales: </li></ul><ul><ul><li>Libros / Revistas </li></ul></ul><ul><ul><li>Bibliotecas / Catálogos </li></ul></ul><ul><ul><li>Identificación unívoca y uniforme: ISBN, ISSN, NIPO, etc. </li></ul></ul><ul><ul><li>Integración </li></ul></ul><ul><li>Conocimiento científico y cultural en formatos digitales: </li></ul><ul><ul><li>e-books/ e-Journals / Weblogs / portales / homepages... </li></ul></ul><ul><ul><li>Bibliotecas digitales, colecciones virtuales, portales bibliográficos... </li></ul></ul><ul><ul><li>Identificación inestable (URIs) – estabilizada (PURL, DOI, etc.) </li></ul></ul><ul><ul><li>Distribución / dispersión </li></ul></ul>
    • 22. El problema de la representación y recuperación de información en Internet <ul><li>Problema común: organización, gestión y recuperación de información: </li></ul><ul><ul><li>Publicación de contenidos </li></ul></ul><ul><ul><li>Acceso a la información y cambio (mutabilidad) de la información </li></ul></ul><ul><ul><li>Integración de recursos distribuidos </li></ul></ul><ul><ul><li>Categorización y valoración de contenidos </li></ul></ul><ul><ul><li>Confianza o fiabilidad de los contenidos. </li></ul></ul><ul><li>Solución tradicional (Google, etc.): aunque han mejorado mucho… no suficientes para recuperar conocimiento </li></ul>
    • 23. <ul><li>Ambigüedad en el significado de las cadenas de búsqueda </li></ul><ul><li>Multitud de resultados sin orden lógico (Google) </li></ul><ul><li>Imposible trasladar la relevancia subjetiva del usuario (incapacidad de entender el significado que el usuario tiene en mente) </li></ul><ul><li>No garantía de fiabilidad </li></ul><ul><li>Falta ayuda para la formulación de las búsquedas </li></ul>El problema de la representación y recuperación de información en Internet
    • 24. Representación/Recuperación de Información: Data mining <ul><li>Recuperar conocimiento no es lo mismo que recuperar información </li></ul><ul><li>Recuperar conocimiento implica tradicionalmente el procesamiento semántico de grandes cantidades de datos: Data mining </li></ul><ul><li>El data mining (minería de datos, explotación de datos, KDD) es un tema complejo (informática + técnicas computacionales estadísticas, IR + ML+l reconocimiento de patrones (Fayyard, etc.). </li></ul>
    • 25. Representación/Recuperación de Información: Data mining <ul><li>Data mining  extracción de conocimiento de grandes cantidades de información estructurada </li></ul><ul><li>Text mining  extracción de información de calidad a partir de textos o información no estructurada. </li></ul>
    • 26. “ Buscar” vs.“Recuperar (descubrir)” Data Mining Text Mining Data Retrieval Information Retrieval Búsqueda (objetivo) Descubrimiento (oportunista) Datos Estructurados Datos sin Estructurar (texto)
    • 27. Recuperación de datos <ul><li>Buscar registros dentro de una base de datos estructurada. </li></ul>Tipo de base de datos Estructurada Modo de búsqueda Marcado por un objetivo de búsqueda Unidad mínima Registro de datos Ejemplo de necesidad de información “ Buscar un restaurante japonés en Valencia que tengan comida vegetariana” Ejemplo de sentencia de búsqueda “ SELECT * FROM restaurants WHERE city = Valencia AND type = japanese AND has_veg = true”
    • 28. Recuperación de información <ul><li>Encontrar información relevante en fuentes de información sin estructurar (normalmente texto) </li></ul>Tipo de base de datos Sin estructurar Modo de búsqueda Dirigido a un objetivo / oportunista (serendipity) Unidad mínima Documento Ejemplo de necesidad de información “ Buscar un restaurante japonés en Valencia que tengan comida vegetariana” Ejemplos de sentencia de búsquda <ul><li>“ Restaurante japonés” Valencia </li></ul><ul><li>Valencia->Restaurantes->Japonés </li></ul>
    • 29. <ul><li>Descubrir nuevo *conocimiento* a partir de textos e información sin estructurar </li></ul>Recuperar conocimiento (text mining) Tipo de base de datos Sin estructurar Modo de búsqueda Oportunista Unidad mínima Características del lenguaje o conceptos Ejemplo de necesidad de información “ Encuentra tipos de comida envenenada, normalmente asociada a restaurantes japoneses” Ejemplo de sentencia de búsqueda Clasifica enfermedades asociadas con “restaurantes japoneses”
    • 30. Recuperar conocimiento (data mining) <ul><li>Descubrir nuevo *conocimiento* a través del análisis de datos </li></ul>Tipo de base de datos Estructurada / semiestructurada Modo de búsqueda Oportunista Unidad mínima Números y dimensiones Ejemplo de necesidad de información “ Muestre la tendencia a través del tiempo de visitas a restaurantes japoneses en Valencia” Ejemplo de sentencia de búsqueda “ SELECT SUM(visits) FROM restaurants WHERE city = Valencia AND type = japanese ORDER BY date”
    • 31. Del análisis de contenido Web a la minería de Contenido Web <ul><li>Análisis de contenido de la Web (indización y resumen: tagging) </li></ul><ul><li>Minería de contenido Web implica: </li></ul><ul><ul><li>Clasificación Web (categorías predefinidas donde se clasifican las páginas Web: inicios de Yahoo ) </li></ul></ul><ul><ul><li>Clustering Web (agrupación de páginas web basadas en sus similaridades) </li></ul></ul><ul><ul><li>Extracción Web (implica la extracción de elementos HTML, frases o tuplas de las páginas web que representan instancias de los conceptos buscados). </li></ul></ul>
    • 32. Data mining, Web mining, Web semántica <ul><li>Aplicar técnicas de data mining para extraer conocimiento de la información Web resulta muy difícil ya que la información está desestructurada </li></ul><ul><li>Algunas técnicas del Web mining (text mining de la Web) ayudan a extraer información “de calidad” de la Web ( clustering que realiza CiteSeer ) </li></ul><ul><li>Semantic Web mining= Data mining + Semantic Web </li></ul><ul><ul><li>Los resultados de la minería de la Web se mejorarán a través de una Web más estructurada basada en estructuras semánticas que permitan extraer/inferir conocimiento (Web semántica) </li></ul></ul><ul><ul><li>Las técnicas de minería web pueden ayudar a la construcción de la Web Semántica. </li></ul></ul>
    • 33. La evolución de la Web. Diferenciación entre Web 2.0, Web Semántica (SW): Web 3.0 y linked data Universidad Carlos III de Madrid Dpto. Biblioteconomía y Documentación
    • 34. La Web en el FUTURO (2001) <ul><li>Continuará la mezcla de calidades informativas: </li></ul><ul><ul><li>Se mantendrán sitios personales </li></ul></ul><ul><ul><li>Escaparates comerciales con un propósito real </li></ul></ul><ul><li>Los ordenadores utilizarán información estructurada de forma mucho más eficaz. </li></ul><ul><li>Se necesita la integración de datos para permitir el procesamiento automático </li></ul><ul><li>SW (Web Semántica)... </li></ul><ul><ul><li>“ ...is an extension of the current Web in which information is given well-defined meaning, better enabling computers and people to work in cooperation” </li></ul></ul><ul><ul><ul><ul><li>Tim Berners-Lee, James Hendler, Ora Lassila. The Semantic Web. Scientific American (Mayo 2001) </li></ul></ul></ul></ul>
    • 35. La Web en el FUTURO (2005)
    • 36. La Web del FUTURO (2007): Web x.0 Fuente: a través de IRSweb (Javier Martínez Méndez): http://irsweb.blogspot.com/2007/03/cronologa-de-la-web.html
    • 37. La Web del futuro/presente: Web 3.0? ¡¡No es tan fácil!!
    • 38. Web 2.0: Visión típica
    • 39. Web 1.0 vs. 2.0: Comparación típica <ul><li>DoubleClick </li></ul><ul><li>Ofoto (Kodakgallery), Altavista </li></ul><ul><li>Akamai (business online) </li></ul><ul><li>mp3.com </li></ul><ul><li>Britannica Online </li></ul><ul><li>Personal websites </li></ul><ul><li>Evite </li></ul><ul><li>Domain name speculation </li></ul><ul><li>Page views </li></ul><ul><li>Screen scraping </li></ul><ul><li>Publishing </li></ul><ul><li>CMS </li></ul><ul><li>Directories (taxonomy) </li></ul><ul><li>Stickiness </li></ul><ul><li>Google AdSense </li></ul><ul><li>Flickr , Corbis </li></ul><ul><li>BitTorrent (cooperative distribution) </li></ul><ul><li>Napster , eMule , etc. </li></ul><ul><li>Wikipedia </li></ul><ul><li>Blogging </li></ul><ul><li>Eventful and EVDB </li></ul><ul><li>Search engine optimization </li></ul><ul><li>Cost per click </li></ul><ul><li>Web services </li></ul><ul><li>Participation </li></ul><ul><li>Wikis </li></ul><ul><li>Tagging (&quot;folksonomy&quot;) </li></ul><ul><li>Syndication </li></ul>Web 1.0 Web 2.0 Fuente: Adaptado de O’Reilly
    • 40. Web 1.0 <ul><li>La Web como un portal de información </li></ul><ul><li>Exclusividad de la información </li></ul><ul><li>Seccionar la WWW en directorios útiles </li></ul><ul><li>Cada uno tenía su pequeño rincón en el ciberspacio </li></ul><ul><li>Carece de: </li></ul><ul><ul><li>Contexto </li></ul></ul><ul><ul><li>Interacción </li></ul></ul><ul><ul><li>Escalabilidad </li></ul></ul>Web 1.0
    • 41. Web 2.0 <ul><li>La Web como plataforma </li></ul><ul><li>Centrada en el poder de compartir (crear y validar) </li></ul><ul><li>El poder de un sistema de organización más libre (tagging) </li></ul><ul><li>Estableciendo conexiones para la integración futura (RSS) </li></ul><ul><li>Carece de: </li></ul><ul><ul><li>Personalización </li></ul></ul><ul><ul><li>Portabilidad verdadera </li></ul></ul><ul><ul><li>Interoperabilidad </li></ul></ul>Web 2.0
    • 42. ¿Web 3.0? <ul><li>Web Semántica </li></ul><ul><li>Web de datos </li></ul><ul><li>Personalizable </li></ul><ul><li>Ubicua </li></ul><ul><li>Móvil </li></ul>
    • 43. Web 2.0: Racionalización típica http://upload.wikimedia.org/wikipedia/commons/1/16/Web20mindmapLARG.jpg
    • 44. ¿Qué/cómo se recupera información en la Web 2.0? <ul><li>La Web 2.0 necesita motores de búsqueda más específicos para encontrar: amigos, un buen lugar de vacaciones o fotos de otra gente en tu bar favorito … etc. </li></ul><ul><ul><li>Technorati, el más famoso buscador de weblogs: http://technorati.com/ </li></ul></ul><ul><ul><li>Vídeos y podcast http://podzinger.com/ </li></ul></ul><ul><ul><li>Noticias sindicadas: http://agregax.es/ </li></ul></ul><ul><ul><li>Especializados ($): </li></ul></ul><ul><ul><ul><li>Viajes: http://www.trabber.com/es/ </li></ul></ul></ul><ul><ul><ul><li>Compras: http://es.shoomo.com/ </li></ul></ul></ul><ul><ul><ul><li>Compras (libros /Amazon): http://pricenoia.com/ </li></ul></ul></ul>
    • 45. Panorama de la descripción en la Web 2.0 No se asusten… volveremos sobre esto
    • 46. Ejemplo de codificación de metadatos en una sede Web (DCMI) Metadatos descriptivos embebidos (HTML) Metadatos para la sindicación de noticias (RSS) Metadatos descriptivos (RDF vinculado link rel)
    • 47. Ejemplo de codificación de metadatos RSS en una sede Web (DCMI) http://dublincore.org/news.rss Metadatos para la sindicación de noticias (RSS)
    • 48. Tim Berners-Lee, 2001: SW “ La Web Semántica (SW) no es una Web separada sino una extensión de la actual, en la cual la información se da con un significado bien definido, permitiendo que los ordenadores y las personas puedan trabajar juntos, en cooperación”.
    • 49. Tim O’Reilly, 2006: Web 2.0 “ El principio central que subyace a los gigantes nacidos en la Era de la Web 1.0, que han sobrevivido en la Era Web 2.0, parecen haber adoptado el poder de la Web para que han adopdato el poder de la web para explotar la inteligencia colectiva&quot; Traducción al español del artículo de O’Reilly: Qué es la Web 2.0: http://sociedaddelainformacion.telefonica.es/jsp/articulos/detalle.jsp?elem=2146
    • 50. Web 2.0 es La Web Social (Hinchcliffe) <ul><li>Algunos datos: </li></ul><ul><li>Más de un billón de personas conectadas a Internet </li></ul><ul><li>100 millones de sitios Web </li></ul><ul><li>Alrededor de 1/3 de adultos en USA han contribuido al contenido público de Internet (18% mayores de 65) </li></ul>Fuente: http://web2.wsj2.com/ “ La Web 2.0 tiene mucho más que ver con el cambio que se produce en las personas y en la sociedad que con la tecnología”
    • 51. Tim Berners-Lee: noviembre 2006 “ La Web no va de lo que podemos hacer con los ordenadores. Son personas, y sí, vale, están conectadas por computadores… Pero la informática, entendida como el estudio de lo que pasa en un ordenador, no te dice qué pasa en la Web.” Fuente: New York Times November 2, 2006
    • 52. Pero… ¿qué es inteligencia colectiva? <ul><li>¿Colecciones inteligentes? </li></ul><ul><ul><li>Bookmarking (marcadores) colectivos, búsqueda colectiva, etc. </li></ul></ul><ul><li>“ Base de datos de intenciones” (intenciones de búsqueda  actos voluntarios de query ) </li></ul><ul><ul><li>Verbos (acciones colectivas): clicking, rating, tagging, buying </li></ul></ul><ul><li>Lo que todos sabemos pero no nos atrevimos a decir en público antes </li></ul><ul><ul><li>Listas de discusión… y más Web 2.0: blogs, wikis, etc. </li></ul></ul>
    • 53. Tim Berners-Lee: Febrero 2009 <ul><li>On the next Web (TED): </li></ul><ul><li>Datos enlazados </li></ul><ul><li>http://www.w3.org/DesignIssues/LinkedData.html </li></ul>
    • 54. La Web del FUTURO (2009) De islas semánticas a datos enlazados
    • 55. La Web del FUTURO (2009): Linked data Fuente: http://linkeddata.org (marzo 2009)
    • 56. La Web del FUTURO (2009): Linked data <ul><li>Linked Data (datos enlazados) implica utilizar la Web para conectar datos relacionados que no han sido previamente enlazados o bien, utilizar la Web para disminuir las barreras entre los datos que ya están enlazados utilizando otros métodos. </li></ul><ul><li>“ Término utilizado para describir las prácticas recomendadas para exponer, compartir y conectar piezas de datos, información y conocimiento en la Web Semántica, utilizando URIs y RDF “ (Wikipedia) </li></ul><ul><li>Conectar datos distribuidos en la Web </li></ul>
    • 57. Datos enlazados: Principios <ul><li>Utilizar URIs para identificar los recursos publicados en la Web </li></ul><ul><li>Aprovechar el HTTP de la URI para que la gente pueda localizar y consultar (es decir, desreferenciar) estos recursos. </li></ul><ul><li>Proporcionar información útil acerca del recurso cuando la URI haya sido desreferenciada. </li></ul><ul><li>Incluir enlaces a otras URIs relacionadas con los datos contenidos en el recurso, de forma que se potencie la RI en la Web. </li></ul>
    • 58. Social Web + SW = Web 3.0 Linked Data Tags (Social Web/Web 2.0) Linked Data (Semantic Web) Fuente: Social Semantic Web Syposium (Marzo 2009)
    • 59. Pero… qué es la Web Semántica: Concepto y características de la Web Semántica Universidad Carlos III de Madrid Dpto. Biblioteconomía y Documentación
    • 60. Orígenes de la Web Semántica <ul><li>Idea original de la Web ( Tim B. Lee , 1989). </li></ul><ul><li>Berners-Lee: Metadata Architecture (1997); Semantic Web Roadmap (1998): Weaving the Web (1999). </li></ul><ul><li>Definición formal (2001): </li></ul><ul><ul><li>La Web Semántica es una extensión de la Web actual en la que la información se presenta con un significado bien definido, permitiendo a los ordenadores y a las personas trabajar conjuntamente. </li></ul></ul>
    • 61. Dificultades para entender la SW <ul><li>Web semántica = ¿Web + Semántica? </li></ul><ul><li>Biblioteca digital= ¿Biblioteca + Digital? </li></ul><ul><li>Sociedad de la Información= ¿Sociedad + Información? </li></ul>Las 3 frases sincategoremáticas de la información del siglo XXI
    • 62. ¿Web + Semántica? <ul><li>Semántica  implica significado concreto, o unidades que pueden componerse para generar un significado más específico para un discurso más amplio. </li></ul><ul><li>Web  medio universal para los datos, que puede albergar contenido que puede expresarse en un formato leído y utilizado por agentes de software (máquinas) para buscar, compartir y integrar información de forma más fácil. </li></ul><ul><li>Web Semántica  </li></ul><ul><ul><li>Visión de esa integración de la información. La habilidad de las máquinas de registrar cómo los datos se relacionan con el mundo real, y un cambio de la necesidad de acceder a una serie de bases de datos a través de una serie de búsquedas, a la traducción del contenido a información legible por máquina, a la que pueda accederse a través de una base de datos interminable </li></ul></ul>
    • 63. Dificultades para entender la SW <ul><li>Intangibilidad del concepto (Cognitivismo, Inteligencia Artificial, Documentación). </li></ul><ul><li>El entusiasmo y la proyección de sus principales instigadores (Tim Berners-Lee y James Hendler) </li></ul><ul><li>Un conjunto interminable de siglas, acrónimos y conceptos: </li></ul><ul><ul><li>RDF, XML, DCMI, SVG, DALM, OIL, OWL, SOAP, WSDL, SKOS, etc. </li></ul></ul><ul><ul><li>Metadatos, ontologías, lógica, inferencia, etc. </li></ul></ul><ul><li>La propia Web 2.0… (¿microformatos?) </li></ul><ul><li>La constante evolución </li></ul>
    • 64. ¿Qué es la Web Semántica?
    • 65. ¿Qué es la Web Semántica? <ul><li>La SW es “muchas cosas” para “mucha gente” </li></ul><ul><li>Conjunto de tecnologías para la organización, representación y recuperación del conocimiento digital que añaden semántica interpretable por las máquinas </li></ul><ul><li>Objetivos: </li></ul><ul><ul><li>Proporcionar un acceso inteligente a la información heterogénea y distribuida en la WWW, posibilitando a los agentes de software mediar entre las necesidades de los usuarios y los recursos de información disponibles </li></ul></ul><ul><ul><li>Creación de una Web de datos con significado (información + conocimiento), de tal forma que un programa de ordenador pueda aprender tanto acerca de lo que quieren decir los datos, como acerca de la información necesaria para procesarlos </li></ul></ul><ul><li>Procesamiento global e interoperable de la información Web (marcado semántico XML + estructuras de metadatos) </li></ul>
    • 66. ¿Qué es la Web Semántica? <ul><li>La Web es un conjunto de recursos y enlaces </li></ul><ul><ul><li>Estos recursos y enlaces están identificados por URIs </li></ul></ul><ul><ul><ul><li>Los recursos pueden tipificarse </li></ul></ul></ul><ul><ul><ul><ul><li>Para un usuario, esto convierte a la web en algo más interesante </li></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Las máquinas, por su parte tienen que ser capaces de procesar información legible por máquina, permitiendo trabajar personas y máquinas e intercambiar el conocimiento de una forma más eficaz. </li></ul></ul></ul></ul></ul>&quot;The bane of my existence is doing things that I know the computer could do for me.&quot; (Dan Connolly) Explicación gradual:

    ×