La representación de los contenidos digitales: de los tesauros automáticos a las folksonomías   <ul><ul><ul><ul><ul><li>Jo...
La mayoría de los sistemas de representación se generó antes de que existiera el ciberespacio <ul><li>La nueva matriz cult...
Obstáculos para explotar las potencialidades de lo digital <ul><li>1. Multiplicidad de sistemas simbólicos </li></ul><ul><...
Obstáculos para explotar las potencialidades de lo digital <ul><li>2. Dificultades informáticas para alcanzar el significa...
Las Ciencias Naturales  (siglos XVI - XX)  alcanzaron un sistema de coordenadas y unidades de medida universales <ul><li>D...
Marco  positivista  de representación de la Información Lenguaje normalizado  para garantizar una comunicación inequívoca ...
Marco  postmoderno  de representación de la Información Léxico más cercano al  lenguaje natural Cada documento contiene un...
Bases epistemológicas de la representación de la información <ul><li>Aristóteles  ( Retórica ) consideró a los predicament...
La recuperación terminológica de la información: evolución <ul><li>1. El acceso a la información por materias, antecedente...
<ul><li>Dentro de cada campo semántico, los descriptores mantienen las relaciones ya propuestas por Aristóteles:  género ,...
Tesauros. Red conceptual <ul><li>Un mismo concepto puede ser  genérico  por su relación con las ideas a las que se extiend...
Tesauros. Red conceptual <ul><li>El movimiento de Port-Royal planteó los conceptos lógicos de: </li></ul><ul><li>Definició...
Tesauros. Red conceptual <ul><li>Ramón Llull ( Logica nova ) propuso las diez reglas generales de cuestionar que subyacen ...
Sintaxis del tesauro <ul><li>Determinada por su macroestructura global y por la consiguiente superestructura, que establec...
Uso de tesauros :  ventajas y desventajas <ul><li>Desventajas </li></ul><ul><li>Sin mecanismos para compartir información ...
<ul><li>Los  tesauros  proporcionan las  respuestas a las preguntas de los usuarios .  </li></ul><ul><li>El  Qué  sigue si...
Años 90 <ul><li>Internet y su enlace hipertextual de documentos obligó a diferenciar la representación de los contenidos: ...
Taxonomías y lenguajes documentales <ul><li>Las taxonomías están presentes en los </li></ul><ul><li>Esquemas de clasificac...
Taxonomías <ul><ul><li>Red semántica de conceptos interrelacionados para cubrir las necesidades empresariales y la forma c...
Términos y  Taxonomías <ul><li>Cobertura </li></ul><ul><li>Basada en el contexto de aplicación </li></ul><ul><li>Fácil de ...
<ul><li>Ideas combinadas. </li></ul><ul><li>Términos relacionados conceptualmente. </li></ul><ul><li>Contigüidad. </li></u...
<ul><li>Tesauro Conceptual,   red semántica en la que cada nodo contiene un único concepto que puede llevar asociados una ...
<ul><li>a) Listan todas las palabras “no vacías” existentes en las bases de datos </li></ul><ul><li>b) consideran los térm...
<ul><li>Funcionamiento.  Ante una demanda, establecen enlaces entre el usuario y las bases terminológicas, mezclando en la...
Uso de ontologías <ul><li>Para mejorar la precisión de las recuperaciones aprovechan el diseño de ontologías por áreas del...
<ul><li>La elaboración de los  tesauros conceptuales  no está muy lejos de los resultados que se obtienen en los programas...
<ul><li>Coincidencia con el procesamiento seguido por los programas más avanzados de indización automática </li></ul><ul><...
Obtención e integración de relaciones <ul><li>Obtención de asociaciones temáticas entre componentes (clusterización - clas...
<ul><li>Otra de las propuestas de  mejora de los tesauros es la  inclusión de verbos  que complementen a los tesauros está...
<ul><li>Ventajas   que aporta el uso de descriptores verbales: </li></ul><ul><li>Posibilidad de indizar imágenes de video ...
<ul><li>R elacionar conceptos mediante verbos en labores de recuperación plantea posibilidades semánticas diferentes a las...
Mapas conceptuales <ul><li>Técnica para representar el conocimiento en gráficas cognitivas -> redes de conceptos que se co...
Rasgos de los mapas conceptuales <ul><li>Técnica desarrollada por Joseph Novak en los años 60 para ayudar a enseñar y apre...
Ejemplo:  Mapa Conceptual Se habla de la Tiene lugar en Se celebran congresos como y del  Futuro de Internet CALSI2007 Val...
Justificación <ul><li>El crecimiento de la Web y de las Bases Datos a texto completo </li></ul><ul><li>Necesidad de navega...
Asociaciones en los Mapas Conceptuales <ul><li>Las asociaciones entre conceptos no están normalizadas, pero suelen referir...
Definición: Topic Map <ul><li>Un topic map es un documento, o un conjunto de documentos SGML o XML interrelacionados en un...
ELEMENTOS DEL TOPIC MAP <ul><ul><li>Topic p.e. <SISOFT> </li></ul></ul><ul><ul><li>Topic type  p.e. <jornadas científicas>...
Ejemplo: Topic Map Tener lugar JOTRI Jornadas científicas Localización  www.fiv.upv.es/jotri Documentación/informática www...
Comparación TESAUROS ISO 2788:1986 TOPIC MAPS ISO 13250:2000 MAPA CONCEPTUAL Sin norma Control de vocabulario  a priori. C...
Comparación TESAUROS TOPIC MAPS M. CONCEPTUAL Las relaciones no son  descriptores Una relación puede ser un  topic (verbos...
Folksonomías <ul><li>Práctica de indización cooperativa que asigna palabras-clave para organizar la información en categor...
<ul><li>No es esencial construir una jerarquía. Si lo es poder emplear etiquetas semánticas para efectuar la indización.  ...
<ul><li>Del.icio.us   social bookmarks </li></ul><ul><li>G estor social de sitios web favoritos (bookmarks) permite: </li>...
Folksonomías frente a tesauros   Los  vocabularios controlados  no son aplicables ni económicamente extensibles a la mayor...
¿Para qué sirven las folksonomías? Las folksonomías funcionan porque son eficaces para los usuarios a la hora de ordenar s...
¿Para qué sirven las folksonomías? Abandonar las taxonomías por las listas de palabras-clave no es nuevo Se benefician del...
Debilidades de las folksonomías La folksonomía  carece  de lenguaje controlado, pues no tiene jerarquías ni otro tipo de a...
Debilidades de las folksonomías Falta de consistencia debida a la ausencia de control de sinónimos. Como ejemplo, a la hor...
Upcoming SlideShare
Loading in …5
×

La representación de los contenidos digitales: de los tesauros automáticos a las folksonomías

4,741 views

Published on

La representación de los contenidos digitales: de los tesauros automáticos a las folksonomías

  1. 1. La representación de los contenidos digitales: de los tesauros automáticos a las folksonomías <ul><ul><ul><ul><ul><li>José A. Moreiro González </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Universidad Carlos III de Madrid </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>[email_address] </li></ul></ul></ul></ul></ul>Valencia, CALSI, 2007
  2. 2. La mayoría de los sistemas de representación se generó antes de que existiera el ciberespacio <ul><li>La nueva matriz cultural sigue inacabada </li></ul><ul><li>Los documentalistas del siglo XXI se enfrentan al problema de inventar, adaptar y mejorar la nueva generación de sistemas simbólicos </li></ul>
  3. 3. Obstáculos para explotar las potencialidades de lo digital <ul><li>1. Multiplicidad de sistemas simbólicos </li></ul><ul><li>Inadaptación de los sistemas de identificación, heredados de la era de la imprenta </li></ul><ul><li>Multiplicidad e incompatibilidad de taxonomías, tesauros, terminologías, ontologías y sistemas de clasificación </li></ul>
  4. 4. Obstáculos para explotar las potencialidades de lo digital <ul><li>2. Dificultades informáticas para alcanzar el significado de los documentos </li></ul><ul><li>Basan sus investigaciones en cadenas de caracteres, no en conceptos. Así, al buscar la palabra “gato”, es tratada como la sucesión de caracteres “g, a, t, o” y no como un concepto . </li></ul>
  5. 5. Las Ciencias Naturales (siglos XVI - XX) alcanzaron un sistema de coordenadas y unidades de medida universales <ul><li>Desde entonces, la comunidad científica usa un conjunto de instrumentos simbólicos y conceptuales independientes de las lenguas naturales: </li></ul><ul><li>altamente formalizado </li></ul><ul><li>lógicamente coherente </li></ul><ul><li>ampliamente compartido </li></ul>
  6. 6. Marco positivista de representación de la Información Lenguaje normalizado para garantizar una comunicación inequívoca Léxico como si sólo fuese una nomenclatura o taxonomía El sustantivo como forma de representación privilegiada Búsqueda del modelo de las ciencias más formalizadas , sin las imperfecciones de los discursos de las ciencias humanas Búsqueda prioritaria de la precisión, objetividad y claridad del lenguaje Tecnología cuyas reglas debe observar el usuario Función pedagógica de la Documentación Documento como soporte del conocimiento Preponderancia de las relaciones jerárquicas (taxonomías) Formas apriorísticas de representación: categorías universales
  7. 7. Marco postmoderno de representación de la Información Léxico más cercano al lenguaje natural Cada documento contiene un modelo léxico Utilización de toda la riqueza expresiva del lenguaje El lenguaje considerado a partir de su función comunicativa Relativización por el contexto o situación del discurso Sistemas de información como instrumentos del proceso de mediación El usuario como sujeto de la interpretación Preponderancia de las relaciones asociativas Categorías funcionales
  8. 8. Bases epistemológicas de la representación de la información <ul><li>Aristóteles ( Retórica ) consideró a los predicamentos como los conceptos más generales a los que alude la expresión del pensamiento </li></ul><ul><li>Leibniz ( De Synthesi et Analysi universali ) los redujo a solo cinco categorías </li></ul><ul><li>Kant ( Crítica de la razón pura ) limitó aún más las categorías de los conceptos puros del entendimiento: Cantidad, Cualidad, Relación y Modalidad </li></ul>
  9. 9. La recuperación terminológica de la información: evolución <ul><li>1. El acceso a la información por materias, antecedente de los lenguajes documentales. Estados Unidos, 1876. La Clasificación decimal de Dewey y Rules for a Dictionary Catalog de Cuter </li></ul><ul><li>2. La Fontaine y Otlet. Instituto Internacional de Bibliografía . RBU -> CDU -> permitir la cooperación bibliográfica internacional. CDU : sistema de representación codificado. Taxonomía (positivista) y Asociación (de transición) </li></ul><ul><li>3. Segunda Guerra Mundial. Acumulación de información. Vannevar Bush avanzó la recuperación mediante combinaciones lógicas: sustitución de los sistemas jerárquicos por la asociación de conceptos </li></ul>
  10. 10. <ul><li>Dentro de cada campo semántico, los descriptores mantienen las relaciones ya propuestas por Aristóteles: género , subtipo y diferencia . En estas relaciones interconceptuales está la causa del orden jerárquico (facetas en que se clasifica y desarrollo de estas). </li></ul>Tesauro: Lista asociada de descriptores formada con las posibilidades de representación de los conceptos generales de los documentos de un dominio concreto.
  11. 11. Tesauros. Red conceptual <ul><li>Un mismo concepto puede ser genérico por su relación con las ideas a las que se extiende, y especie por su subordinación a otra más general: </li></ul><ul><li>Con un género supremo: Top Term o Macrodescriptor. </li></ul><ul><li>Con géneros y especies subordinados (intermediarios): Middle Term (Submacrodescriptor). </li></ul><ul><li>Y específicos de diferente nivel: </li></ul><ul><ul><li>Especie especialísima: Genéricos. </li></ul></ul><ul><ul><li>Individuos: Específicos. </li></ul></ul>
  12. 12. Tesauros. Red conceptual <ul><li>El movimiento de Port-Royal planteó los conceptos lógicos de: </li></ul><ul><li>Definición , para explicar la quididad de la cosa (En los tesauros, la Scope note concreta el significado de algunos descriptores). </li></ul><ul><li>División que clarificaba una definición por la diferencia de una especie con otras (asociaciones entre términos de la misma categoría). </li></ul>
  13. 13. Tesauros. Red conceptual <ul><li>Ramón Llull ( Logica nova ) propuso las diez reglas generales de cuestionar que subyacen a cualquier hecho comunicativo (Decámetro hermenéutico). En ellas están ya las razones de asociar términos: </li></ul><ul><li>Utrum -> si es o no </li></ul><ul><li>Quid -> qué es </li></ul><ul><li>De quo -> de qué es </li></ul><ul><li>Quare -> por qué es </li></ul><ul><li>Quomodo -> de qué manera </li></ul><ul><li>Ubi -> dónde es </li></ul><ul><li>Quando -> cuándo es </li></ul><ul><li>Quantum -> cuánto es </li></ul><ul><li>Cum quo -> con quién es </li></ul><ul><li>Quale -> cuál es </li></ul>
  14. 14. Sintaxis del tesauro <ul><li>Determinada por su macroestructura global y por la consiguiente superestructura, que establecen las normas de : </li></ul><ul><ul><li>Ordenación (parte clasificatoria) </li></ul></ul><ul><ul><li>Subordinación (parte jerárquica) </li></ul></ul><ul><ul><li>Asociación (completa la parte alfabética), refleja la concepción postmoderna del lenguaje </li></ul></ul><ul><li>La macroestructura cumple una doble función : </li></ul><ul><ul><li>Fracciona el corpus de términos, </li></ul></ul><ul><ul><li>Guía hacia la situación exacta de los términos dentro de la superestructura. </li></ul></ul>
  15. 15. Uso de tesauros : ventajas y desventajas <ul><li>Desventajas </li></ul><ul><li>Sin mecanismos para compartir información en la Web (hasta la aparición de SKOS). Están pensados para dominios re s tringidos. </li></ul><ul><li>Adición de relaciones complicada. </li></ul><ul><li>Reglas de nombrado según el estándar, de automatización complicada. </li></ul><ul><li>Es un vocabulario, sin relación directa con los objetos. </li></ul><ul><li>Creación por consenso previo de creadores, no de usuarios. </li></ul><ul><li>Coste elevado en la creación, mantenimiento y funcionamiento, evitables sólo con la automatización. </li></ul><ul><li>Ventajas </li></ul><ul><li>Sencillos de crear y gestionar </li></ul><ul><li>Algunos muy probados </li></ul><ul><li>Son legibles </li></ul><ul><li>Grado de coherencia generalmente alto </li></ul><ul><li>Eficacia probada </li></ul><ul><li>Abundancia de tesauros </li></ul><ul><li>Buen punto de partida para crear ontologías </li></ul>
  16. 16. <ul><li>Los tesauros proporcionan las respuestas a las preguntas de los usuarios . </li></ul><ul><li>El Qué sigue siendo actual </li></ul><ul><li>El Cómo supone adaptarse a las nuevas necesidades </li></ul>
  17. 17. Años 90 <ul><li>Internet y su enlace hipertextual de documentos obligó a diferenciar la representación de los contenidos: </li></ul><ul><ul><li>Tesauros conceptuales </li></ul></ul><ul><ul><li>Tesauros de verbos </li></ul></ul><ul><ul><li>Mapas de conceptos </li></ul></ul><ul><ul><li>Topic maps </li></ul></ul><ul><li>La dinamización del tesauro con nuevas relaciones, en número mayor e identificadas, para mejorar la representación y aumentar la precisión y eficacia </li></ul><ul><li>Navegación, representación gráfica, con grafos explícitos de conexiones de la información </li></ul>
  18. 18. Taxonomías y lenguajes documentales <ul><li>Las taxonomías están presentes en los </li></ul><ul><li>Esquemas de clasificación, Tesauros, Modelos conceptuales y Ontologías </li></ul><ul><ul><li>En la actualidad, las taxonomías se aplican en el mundo empresarial e institucional </li></ul></ul><ul><ul><li>Organizan y gestionan los recursos digitales que alojan en sus servidores Web </li></ul></ul><ul><ul><li>Buscando categorizarlos y la navegación por ellos </li></ul></ul>
  19. 19. Taxonomías <ul><ul><li>Red semántica de conceptos interrelacionados para cubrir las necesidades empresariales y la forma con que los trabajadores se relacionan con la información </li></ul></ul><ul><ul><li>Cada organización tiene unos procesos que conectan la experiencia y características del personal propio </li></ul></ul><ul><ul><li>Permite a los usuarios clasificar las materias dentro de jerarquías </li></ul></ul><ul><ul><li>Términos autorizados, definiciones que usa una organización para clasificar sus contenidos </li></ul></ul><ul><ul><li>La taxonomía organiza no sólo los contenidos propios de una organización, sino también servicios, productos y recursos humanos </li></ul></ul>
  20. 20. Términos y Taxonomías <ul><li>Cobertura </li></ul><ul><li>Basada en el contexto de aplicación </li></ul><ul><li>Fácil de modificar </li></ul><ul><li>Estructura </li></ul><ul><li>Depende del contexto de aplicación </li></ul><ul><li>Dinámica </li></ul><ul><li>Términos </li></ul><ul><li>Categorías representadas por entradas etiquetadas orientadas hacia el usuario </li></ul>
  21. 21. <ul><li>Ideas combinadas. </li></ul><ul><li>Términos relacionados conceptualmente. </li></ul><ul><li>Contigüidad. </li></ul><ul><li>Relaciones asociativas por definición. </li></ul><ul><li>Relaciones asociativas trasladadas por significado. </li></ul><ul><li>Relaciones asociativas con idéntica jerarquía. </li></ul><ul><li>Cuestiones de finalidad. </li></ul><ul><li>Relaciones asociativas sin especificar. </li></ul><ul><li>Cada uno de estos subtipos ofrece subdivisiones. Lo que ha multiplicado el número de relaciones asociativas presentes en un tesauro. </li></ul>En los procesos automatizados s e aprecia un incremento pragmático de las relaciones, en especial las de asociación (Tudhope, Alani y Jones):
  22. 22. <ul><li>Tesauro Conceptual, red semántica en la que cada nodo contiene un único concepto que puede llevar asociados una serie de descriptores, identificados según las típicas relaciones de los tesauros: </li></ul><ul><li>. preferenciales, </li></ul><ul><li>. jerárquicas o </li></ul><ul><li>. asociativas. </li></ul>
  23. 23. <ul><li>a) Listan todas las palabras “no vacías” existentes en las bases de datos </li></ul><ul><li>b) consideran los términos coloquiales, también las variaciones y truncamientos de los términos reconocidos </li></ul><ul><li>c) aportan notas definitorias que aclaren las posibles dudas de uso </li></ul><ul><li>d) razonan las equivalencias existentes entre términos </li></ul><ul><li>e) contienen numerosas relaciones asociativas entre descriptores, e incluso con los no descriptores </li></ul>Rasgos novedosos respecto a los tesauros convencionales
  24. 24. <ul><li>Funcionamiento. Ante una demanda, establecen enlaces entre el usuario y las bases terminológicas, mezclando en la recuperación el lenguaje controlado y diccionarios lingüísticos. Manejan: </li></ul><ul><li>a) analizadores morfológicos y sintácticos, con marcos semánticos, para evitar la indeterminación de las palabras y de sus relaciones. </li></ul><ul><li>b) bancos de datos terminológicos, con los conceptos resultantes del análisis de originales de un dominio. </li></ul><ul><li>c) procedimientos de Inteligencia Artificial que permiten búsquedas automatizadas en diferentes bases de conocimientos multilingües. </li></ul>
  25. 25. Uso de ontologías <ul><li>Para mejorar la precisión de las recuperaciones aprovechan el diseño de ontologías por áreas del conocimiento desde las que se autogeneran tesauros conceptuales que: </li></ul><ul><ul><li>distinguen los sinónimos, </li></ul></ul><ul><ul><li>suprimen los homónimos e </li></ul></ul><ul><ul><li>inducen a relaciones asociativas entre los descriptores. </li></ul></ul><ul><li>Una ontología para una base de conocimientos debe abarcar: </li></ul><ul><ul><li>los diferentes tipos de documentos, </li></ul></ul><ul><ul><li>las descripciones conceptuales, </li></ul></ul><ul><ul><li>las relaciones entre dichos documentos (citas), y </li></ul></ul><ul><ul><li>las de estos con los diferentes problemas científicos; además de índices, descripciones bibliográficas, tesauros, códigos clasificatorios, formalizaciones de validez, información terminológica, etc. </li></ul></ul>
  26. 26. <ul><li>La elaboración de los tesauros conceptuales no está muy lejos de los resultados que se obtienen en los programas de indización automatizada. </li></ul><ul><li>Son similares la extracción y la normalización de vocabulario. </li></ul><ul><li>Si después se representan los términos mediante algún tipo de relación, como las infográficas, estamos cerca de formalizar un lenguaje combinatorio </li></ul>
  27. 27. <ul><li>Coincidencia con el procesamiento seguido por los programas más avanzados de indización automática </li></ul><ul><li>Análisis léxico textual </li></ul><ul><ul><li>Procesos de filtrado para eliminar previamente los términos vacíos: algoritmos IDF y N-grams . </li></ul></ul><ul><ul><li>Lematización de los términos flexionados mediante algoritmos de stemming (número de n-grams grupos de letras). </li></ul></ul><ul><ul><li>Tratamiento de palabras compuestas. </li></ul></ul><ul><ul><li>Mediante redes neuronales, se crean bases de conocimientos terminológicas con las que se establecen búsquedas automatizadas en Internet. </li></ul></ul>
  28. 28. Obtención e integración de relaciones <ul><li>Obtención de asociaciones temáticas entre componentes (clusterización - clases de descriptores con características comunes): clasificadores Cienciométricos : Co-wording; Estadísticos : Max-min, K-vecinos, K-vecinos incremental, Isodata; Neuronales : Kohonen, Art-1, Art-2. </li></ul><ul><li>C onstrucción de la representación del dominio: cálculo del centroide (descriptor más general del cluster). </li></ul><ul><li>Proceso de generación de relaciones semánticas para dos descriptores dados. </li></ul>
  29. 29. <ul><li>Otra de las propuestas de mejora de los tesauros es la inclusión de verbos que complementen a los tesauros estáticos tradicionales de sustantivos (Levin). </li></ul><ul><li>Está causado por la necesidad de mejorar la precisión cuando se trata, por ejemplo, de reutilizar software o de recuperar imágenes en movimiento. </li></ul>
  30. 30. <ul><li>Ventajas que aporta el uso de descriptores verbales: </li></ul><ul><li>Posibilidad de indizar imágenes de video mediante gerundios </li></ul><ul><li>Identificar mediante verbos asociaciones funcionales mucho más adaptables a dominios concretos </li></ul><ul><li>Posibilidad de mostrar la relación existente entre dos conceptos usando las posibilidades innumerables del lenguaje natural (categorías verbales a modo de relaciones facetables) </li></ul><ul><li>Desambiguación conceptual </li></ul>
  31. 31. <ul><li>R elacionar conceptos mediante verbos en labores de recuperación plantea posibilidades semánticas diferentes a las de los tesauros tradicionales: </li></ul><ul><li>* Se pueden mostrar los agentes que interaccionan con el sistema y cómo lo hacen (casos de uso). </li></ul><ul><li>* También permite mostrar los diagramas de secuencia y actividad. </li></ul><ul><li>La integración verbal procede del área pedagógica: los mapas conceptuales ( concept maps ). </li></ul><ul><li>Antecedente: la base de datos de referencia léxica WordNet , con relaciones de equivalencia y de jerarquía entre diferentes categorías gramaticales, para desambiguar conceptos, en especial mediante el uso de verbos </li></ul>
  32. 32. Mapas conceptuales <ul><li>Técnica para representar el conocimiento en gráficas cognitivas -> redes de conceptos que se componen : </li></ul><ul><ul><li>de nodos (puntos / vértices) que representan conceptos y </li></ul></ul><ul><ul><li>de enlaces ( arcs : arcos / edges : extremos, satélites) que representan las relaciones entre los conceptos </li></ul></ul>
  33. 33. Rasgos de los mapas conceptuales <ul><li>Técnica desarrollada por Joseph Novak en los años 60 para ayudar a enseñar y aprender en las clases. </li></ul><ul><li>Se basó en que el conocimiento se representa por frases simples con estructura: </li></ul><ul><ul><li>Sujeto - verbo – predicado; </li></ul></ul><ul><ul><li>Como una asociación: concepto -> relación -> concepto. </li></ul></ul><ul><li>Estas relaciones pueden representarse mediante grafos en los que las ideas o los conceptos se sitúan en los nodos, y las relaciones en los enlaces. </li></ul><ul><li>De forma que un documento o dominio del conocimiento puede representarse por un conjunto de conceptos interrelacionados y dispuestos como un grafo. </li></ul>
  34. 34. Ejemplo: Mapa Conceptual Se habla de la Tiene lugar en Se celebran congresos como y del Futuro de Internet CALSI2007 Valencia Web semántica Sociedad de la información
  35. 35. Justificación <ul><li>El crecimiento de la Web y de las Bases Datos a texto completo </li></ul><ul><li>Necesidad de navegar de modo hipertextual mediante estructuras cognitivas </li></ul><ul><li>Problemas asociados a la búsqueda de la información: s obrecarga informativa y desorientación </li></ul>
  36. 36. Asociaciones en los Mapas Conceptuales <ul><li>Las asociaciones entre conceptos no están normalizadas, pero suelen referirse a: </li></ul><ul><li>Conjunto - Miembro del conjunto; </li></ul><ul><li>Todo - Parte; </li></ul><ul><li>Relaciones específicas (x influencia y, está cerca de, lleva a, etc.); </li></ul><ul><li>Relaciones físicas (sobre, debajo, cerca...); </li></ul><ul><li>Relaciones temporales (antes, después); </li></ul><ul><li>Relaciones lógicas (causa, efecto); </li></ul><ul><li>Relaciones jerárquicas. </li></ul>
  37. 37. Definición: Topic Map <ul><li>Un topic map es un documento, o un conjunto de documentos SGML o XML interrelacionados en un espacio multidimensional en el que las localizaciones son topic. </li></ul><ul><li>ISO/IEC 13250: 2000. SGML-Topic Maps </li></ul>
  38. 38. ELEMENTOS DEL TOPIC MAP <ul><ul><li>Topic p.e. <SISOFT> </li></ul></ul><ul><ul><li>Topic type p.e. <jornadas científicas> </li></ul></ul><ul><ul><li>Association <tiene lugar en> </li></ul></ul><ul><ul><li>Association type <tener lugar en> (localización) </li></ul></ul><ul><ul><li>Scope (ámbito en el que una relación tiene sentido) theme <Sociedad del conocimiento> </li></ul></ul><ul><ul><li>Topic occurrence (http:// www.sisoftw.com) </li></ul></ul><ul><ul><li>Occurrence type (p.e. Página web) </li></ul></ul>
  39. 39. Ejemplo: Topic Map Tener lugar JOTRI Jornadas científicas Localización www.fiv.upv.es/jotri Documentación/informática www.fiv.upv.es Web page TOPIC TOPIC TYPE ASSOCIATION TYPE SCOPE OCURRENCE TYPE PUBLIC SUBJECT TOPIC OCURRENCE ASSOCIATION
  40. 40. Comparación TESAUROS ISO 2788:1986 TOPIC MAPS ISO 13250:2000 MAPA CONCEPTUAL Sin norma Control de vocabulario a priori. Control de vocabulario ad hoc Control de vocabulario ad hoc Relaciones entre descriptores Relaciones usualmente mediante verbos Relaciones mediante verbo+ preposiciones/ sustantivos/ conector lógico Tipología de relaciones: jerarquía, equivalencia y asociación Tipología de relaciones: número potencialmente infinito No existe tipología de relaciones universal
  41. 41. Comparación TESAUROS TOPIC MAPS M. CONCEPTUAL Las relaciones no son descriptores Una relación puede ser un topic (verbos como topic ) Una relación no puede ser un nodo Trabaja con términos normalizados a priori Las variaciones ortográficas son normalizadas a posteriori Trabaja con términos no normalizados Los descriptores son definidos a priori Los topics se define mediante sus occurrences y associations Los nodos se definen subjetivamente
  42. 42. Folksonomías <ul><li>Práctica de indización cooperativa que asigna palabras-clave para organizar la información en categorías de manera espontánea y libre </li></ul><ul><li>Arquitectura de información social y cooperativa, en la que cada usuario escoge lo que más se ajusta a su entendimiento </li></ul><ul><li>Thomas Vander Wal propuso el neologismo. </li></ul><ul><li>Folk + sonomy = gente + taxonomía, clasificación cooperativa </li></ul>
  43. 43. <ul><li>No es esencial construir una jerarquía. Si lo es poder emplear etiquetas semánticas para efectuar la indización. </li></ul><ul><li>Una folksonomía tiene que cumplir estas condiciones: </li></ul><ul><li>que sea explícita </li></ul><ul><li>que pueda agregarse </li></ul><ul><li>que suponga ventajas para los usuarios (ésta es la razón de agregar etiquetas) </li></ul><ul><li>que sea relevante para los propósitos e intereses de un sitio web. </li></ul>
  44. 44. <ul><li>Del.icio.us social bookmarks </li></ul><ul><li>G estor social de sitios web favoritos (bookmarks) permite: </li></ul><ul><li>- añadir a los favoritos las páginas deseadas, </li></ul><ul><li>clasificar mediante palabras-clave, </li></ul><ul><li>e intercambiar esta información con otros usuarios </li></ul><ul><li>Limitación: no deja introducir espacios entre palabras, con lo que la folksonomía se conforma solo con unitérminos </li></ul><ul><li>Flickr , http://www.flickr.com/ </li></ul><ul><li>Sitio web sobre fotografía donde usuarios de cualquier lugar pueden compartir fotos poniéndolas en disposición de consulta mediante la asignación de palabras-clave. El propio usuario clasifica cada fotografía de acuerdo con lo que le sugiere </li></ul>
  45. 45. Folksonomías frente a tesauros Los vocabularios controlados no son aplicables ni económicamente extensibles a la mayoría de los casos donde pueden usarse metadatos. Su construcción, mantenimiento y aplicación resultan demasiado costosos tanto en tiempo de desarrollo como en tiempo necesario para que el usuario aprenda el esquema de clasificación Mantener una taxonomía se ha hecho muy difícil. De manera que las folksonomías son una solución cuando la clasificación tradicional no es viable
  46. 46. ¿Para qué sirven las folksonomías? Las folksonomías funcionan porque son eficaces para los usuarios a la hora de ordenar su información Son unos sistemas simples y emergentes, que se alejan de la manera tradicional de clasificar desde arriba hacia abajo. Su ventaja proviene de la capacidad de emparejar las necesidades verdaderas de los usuarios y la lengua, no de buscar su precisión
  47. 47. ¿Para qué sirven las folksonomías? Abandonar las taxonomías por las listas de palabras-clave no es nuevo Se benefician del vocabulario personal y de la contribución social para ayudar a encontrar en la web y controlar los objetos que son interesantes L as folksonomías incluyen cada una de las palabras propuestas, sin dejar ninguna fuera. No hay una autoridad central que imponga su visión: cada voz tiene su lugar
  48. 48. Debilidades de las folksonomías La folksonomía carece de lenguaje controlado, pues no tiene jerarquías ni otro tipo de asociaciones más allá de los posibles clusters de recursos que se puedan formar según las clasificaciones o palabras-clave de los usuarios Por ello, la ambigüedad es muy alta. Para un usuario, un término tiene un significado o puede expresar una realidad completamente distinta a la de otro usuario No hay guías de uso, ni restricciones a cómo etiquetar los contenidos
  49. 49. Debilidades de las folksonomías Falta de consistencia debida a la ausencia de control de sinónimos. Como ejemplo, a la hora de denominar un ordenador Macintosh, puedan emplearse las etiquetas “mac”, “apple”, “macintosh” Cierta imprecisión derivada de que se utilizan etiquetas solo con unitérminos Empleo indistinto de singulares y plurales Y, por supuesto, cuanto se deriva de la ausencia de jerarquía y de los propios tipos de contenidos analizados (bookmarks, fotos)

×