• Save
Defensa ACoAR
Upcoming SlideShare
Loading in...5
×
 

Like this? Share it with your network

Share

Defensa ACoAR

on

  • 1,221 views

Presentación realizada en la defensa de mi tesis doctoral.

Presentación realizada en la defensa de mi tesis doctoral.

Statistics

Views

Total Views
1,221
Views on SlideShare
896
Embed Views
325

Actions

Likes
2
Downloads
0
Comments
1

2 Embeds 325

http://www.eslomas.com 308
http://eslomas.hydra 17

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Defensa ACoAR Presentation Transcript

  • 1. Un Método Incremental para la Clasificación Automática y Semántica de Recursos en Sistema de Etiquetado Colaborativo Directores: Jesús Villadangos y Alberto Córdoba Francisco Echarte Ayerra Defensa de Tesis Doctoral – 3 de mayo de 2011
  • 2. Agenda 1 2 3 4 5 Introducción Hipótesis y objetivos principales Método automático de clasificación Conclusiones y líneas futuras Publicaciones
  • 3. Web 2.0 y redes sociales
    • Los usuarios toman un papel más relevante en la generación de información
    • Aumento exponencial de la información
    • Nuevas necesidades de clasificación
  • 4. Etiquetado Torre Eiffel Vacaciones Paris
  • 5. Amplia utilización
  • 6.
    • Variaciones sintácticas: eiffel vs eifel
    • Sinónimos: photography vs photo
    • Polisemia: apple fruta vs apple ordenador
    • Especificidad: animal vs cat
    • Tipos de etiquetas: descriptivas vs personales
    Limitaciones Dificultad en la representación de la información y en su recuperación
  • 7. Naturaleza de las folcsonomías
    • Análisis de co-ocurrencias
    • Representaciones vectoriales
    • Medidas de similaridad
    • Estabilización de las distribuciones de anotaciones
    • Información semántica obtenida a partir de las etiquetas
  • 8. Naturaleza de las folcsonomías Análisis de co-ocurrencias y representaciones vectoriales Cattuto, C., Benz, D., Hotho, A., y Stumme, G. (2008). Semantic grounding of tag relatedness in social bookmarking systems. r 1 r 2 r 3 r 4 r 1 r 2 r 3 r 4 Usuario 1 Usuario 2 Usuario 3 0 2 3 0 2   2 0 1 0 1   3 1 0 0 1   0 0 0 0 2   2 1 1 2 0 Etiqueta- Etiqueta 1 3 0 0   1 1 0 0   0 3 0 0   0 0 2 1   1 1 1 1 Etiqueta- Recurso 2 1 1   1 1 0   1 1 1   1 1 1   1 1 2 Etiqueta– Usuario Usuario 1 Usuario 2 Usuario 3
  • 9. Naturaleza de las folcsonomías Coseno de similaridad r 1 r 2 r 3 r 4 1 3 0 0   1 1 0 0   0 3 0 0   0 0 2 1   1 1 1 1 Etiqueta- Recurso
  • 10. Naturaleza de las folcsonomías
    • Al aumentar el número de anotaciones de un recurso un número reducido de las etiquetas concentra la mayor parte de las anotaciones
    Estabilización en las distribuciones de anotaciones Golder, S. A. y Huberman, B. A. (2006). Usage patterns of collaborative tagging systems. Halpin, H., Robu, V., y Shepherd, H. (2007). The complex dynamics of collaborative tagging. Robu, V., Halpin, H., y Shepherd, H. (2009). Emergence of consensus and shared vocabularies in collaborative tagging systems
  • 11. Naturaleza de las folcsonomías
    • A partir de las anotaciones realizadas por los usuarios es posible obtener información semántica sobre los recursos y etiquetas
    Información semántica Robu, V., Halpin, H., y Shepherd, H. (2009). Emergence of consensus and shared vocabularies in collaborative tagging systems. Zhang, L., Wu, X., y Yu, Y. (2006). Emergent semantics from folksonomies: A quantitative study. Cattuto, C., Benz, D., Hotho, A., y Stumme, G. (2008). Semantic grounding of tag relatedness in social bookmarking systems. Al-Khalifa, H. S. y Davis, H. C. (2007). Exploring the value of folksonomies for creating semantic metadata.
  • 12.
    • Una gran cantidad de usuarios para una gran cantidad de recursos
    FOLCS ONOMÍAS De etiquetas a conocimiento colectivo Peters, I. (2009). Folksonomies : indexing and retrieval in Web 2.0.
  • 13. Principales aproximaciones Ranking de resultados Enriquecimiento semántico Navegación y búsquedas Variaciones sintácticas Agrupación de etiquetas Nubes de etiquetas Sugerencias y expansión de consultas Basado en análisis estadístico Basado en alineamiento con fuentes externas
  • 14. Limitaciones y Oportunidades
      • No se tiene en cuenta la evolución de la folcsonomía
      • Alto coste computacional
      • Aplicabilidad únicamente a determinados tipos de folcsonomías
      • Centrados principalmente en etiquetas
  • 15. Agenda 1 2 3 4 5 Introducción Hipótesis y objetivos principales Método automático de clasificación Conclusiones y líneas futuras Publicaciones 
  • 16. Hipótesis y objetivos
    • Objetivos
      • Obtener mejoras en la representación y recuperación de información en folcsonomías manteniendo la sencillez de la clasificación basada en etiquetas
      • Creación y evolución de la clasificación
      • Aplicabilidad a diferentes tipos de folcsonomías
    Es posible clasificar de forma automática los recursos de una folcsonomía en un conjunto de categorías o conceptos de clasificación, utilizando la información semántica obtenida a partir de las anotaciones que relacionan a los usuarios, las etiquetas y los recursos.
  • 17. Objetivos e hipótesis Recursos Etiquetas Arte y Cultura Blogs y Web 2.0 Informática ACoAR Cocina
  • 18. Posicionamiento Objetivos en comparación con otras propuestas Abbasi, R., Staab, S., y Cimiano, P. (2007). Organizing resources on tagging systems using t-org. Yin, Z., Li, R., Mei, Q., y Han, J. (2009). Exploring social tagging graph for web object classification. Clasificación automática Recursos Recursos Etiquetas Centrado en Técnica incremental Sin intervención manual usuario Independencia fuentes externas Categorías evolución Categorías automáticas Categorías predefinidas Análisis Co-ocurrencias ACoAR TagModel T-Org
  • 19. Agenda 1 2 3 4 5 Introducción Hipótesis y objetivos principales Método automático de clasificación Conclusiones y líneas futuras Publicaciones  
  • 20. Extensión de la folcsonomía Clasificador Diccionarios Creación y evolución del modelo Prototipo de navegación 3 Método automático de clasificación
  • 21. Folcsonomía <U,R,T,A> Usuarios Recursos Etiquetas Anotaciones
  • 22. Model ACoAR <U,R,T,A, D,C,Z,V,S > Etiquetas Diccionario Clasifícación Similaridades Vectores Conceptos Anotaciones Recursos Usuarios
  • 23. Diccionario 21 1 6 1 10 4 36 27 11 2 1 0 4 4 0 0 0 0 0 0 r 8 70 19 3 3 15 0 5 4 Opensource t 20 13 5 2 0 0 0 4 1 ror t 19 30 1 4 12 2 3 1 1 ajax t 18 51 0 41 0 0 4 4 1 ruby t 17 24 0 7 0 7 0 0 0 database t 16 1 3 1 2 0 6 0 0 0 mysql t 15 63 13 0 13 0 0 0 1 python t 14 173 18 29 21 75 3 0 0 programming t 13 58 0 3 24 18 1 1 0 java t 12 73 21 0 7 0 6 33 4 architecture t 11 13 0 2 0 0 9 1 0 history t 10 101 0 4 0 0 15 81 1 picasso t 9 43 1 0 0 4 11 23 0 warhol t 8 124 0 0 0 0 75 41 4 musuem t 7 136 0 0 0 1 37 98 0 art t 6 17 5 0 0 0 3 2 7 blogging t 5 47 7 5 0 3 0 1 31 socialweb t 4 46 0 4 9 2 5 0 26 twitter t 3 18 0 3 0 0 0 4 11 blogs t 2 85 21 1 6 4 3 3 47 blog t 1 r 7 r 6 r 5 r 4 r 3 r 2 r 1  
  • 24. Conceptos de clasificación <U,R,T,A,D, C ,Z,V,S> Etiquetas Diccionario Clasifícación Similaridades Vectores Conceptos Anotaciones Recursos Usuarios Blogs y Web 2.0 Arte y Cultura Informática
  • 25. Recursos Pendientes Convergidos Clasificados <U, R ,T,A,D,C,Z,V,S> Etiquetas Diccionario Clasifícación Similaridades Vectores Conceptos Anotaciones Recursos Usuarios
  • 26. Clasificación Blogs y Web 2.0 r 1 r 2 r 3 r 4 r 5 r 6 r 7 r 8 Clasificados Convergidos Pendientes <U,R,T,A,D,C, Z ,V,S> Etiquetas Diccionario Clasifícación Similaridades Vectores Conceptos Anotaciones Recursos Usuarios Arte y Cultura Informática
  • 27. Vectores de representación <U,R,T,A,D,C,Z, V ,S> Etiquetas Diccionario Clasifícación Similaridades Vectores Conceptos Anotaciones Recursos Usuarios 0 5 opensource t 20 0 4 ror t 19 3 1 ajax t 18 4 4 ruby t 17 0 0 database t 16 0 0 mysql t 15 0 0 python t 14 3 0 programming t 13 1 1 java t 12 6 33 architecture t 11 9 1 history t 10 15 81 picasso t 9 11 23 warhol t 8 75 41 musuem t 7 37 98 art t6 3 2 blogging t5 0 1 socialweb t 4 5 0 twitter t 3 0 4 blogs t 2 3 3 blog t 1 r 3 r 2   ,0 ,0 ,0 ,0 ,0 ,0 ,0 ,0 ,0 ,8 ,4 ,4 ,0 ,135 ,37 ,98 ,0 ,116 ,75 ,41 ,0 ,34 ,11 ,23 ,0 ,96 ,15 ,81 ,0 ,39 ,6 ,33 ,0 ,2 ,1 ,1 ,0 ,3 ,3 ,0 ,0 ,4 ,3 ,1 ,0 ,1 ,0 ,1 ,0) ,0 (1 V(t 1 ) = ,5) ,5 (6 V( Arte y Cultura ) = ,0) ,5 (3 V(r 3 ) = + ,5) ,0 (3 V(r 2 ) =
  • 28. Similaridades S RR S CC S CD S CR <U,R,T,A,D,C,Z,V, S > Etiquetas Diccionario Clasifícación Similaridades Vectores Conceptos Anotaciones Recursos Usuarios vs vs vs vs Medida de similaridad Diccionario Conceptos Recursos Conceptos Recursos Conceptos Conceptos Recursos Conceptos Diccionario Recursos
  • 29. Extensión de la folcsonomía Clasificador Diccionarios Creación y evolución del modelo Prototipo de navegación 3 Método automático de clasificación
  • 30. Clasificador r 5 Blogs y Web 2.0 Arte y Cultura Informática
  • 31. Concepto candidato
    • El concepto con la mayor similaridad con el recurso
      • Medida utilizada: coseno de similaridad
    S CR r 5 Blogs y Web 2.0 Arte y Cultura Informática 0, 7233 0, 0668 0, 2283
  • 32. Modos de clasificación
    • Similaridad: basado en la similaridad con el concepto candidato
      • Umbral de 0,6  r 5 se clasifica en “Informática”
      • Umbral de 0,8  r 5 permanece como convergido
    • Delta: basado en la diferencia entre los dos conceptos más similares
      • Umbral de 0,1  r 5 se clasifica en “Informática”
      • Umbral de 0,5  r 5 permanece como convergido
    • Clasificación trivial
      • r 5 se clasifica en “Informática”
    S CR (“Informática”, r 5 ) – S CR (“Blogs y Web 2.0”, r 5 ) = 0, 7233 - 0, 2283 = 0,495 S CR r 5 Informática 0, 7233
  • 33. Validación del clasificador
    • Se necesita
      • Un sistema de clasificación con un conjunto de recursos clasificados
      • Una folksonomía que incluya los recursos del sistema de clasificación y etiquetas asignadas a ellos
    • Se utiliza
      • Sistema de clasificación: DMOZ 1
        • Un conjunto de páginas web clasificadas en una ontología
      • Folksonomía: Delicious 2
        • Una folcsonomía con recursos de tipo páginas web
    [1] DMOZ, The Open Directory Project, http://www.dmoz.org [2] Delicious, http://www.delicious.com
  • 34. Experimento
    • Conjunto de datos
      • 6.805 recursos clasificados en 22 categorías
      • 122.945 etiquetas
      • 4.493.351 anotaciones
    • Evaluaciones
      • R, T, A, C
      • Diferentes conjuntos entrenamiento (R classified )
      • Varios criterios de convergencia
      • Diccionario (#anotaciones ≥ 50)
      • Modo de clasificación trivial
    • Medición de resultados
      • Precision, recall, F1-Score
      • Micro y macro averaging F1
    154 Systems/Handhelds/Palm_OS 233 Systems/Apple/Macintosh 589 Software/Shareware/Windows 238 Software/Operating_Systems/Microsoft_Windows 238 Software/Operating_Systems/Mac_OS 792 Software/Operating_Systems/Linux 278 Software/Internet/Site_Management 694 Software/Internet/Clients 177 Software/Graphics/Image_Editing 85 Software/Business/E-Commerce 169 Programming/Languages/Ruby 602 Programming/Languages/PHP 221 Programming/Languages/Perl 214 Programming/Languages/JavaScript 963 Programming/Languages/Java 167 Programming/Component_Frameworks/NET 373 Internet/Web_Design_and_Development/Hosting 232 Internet/Web_Design_and_Development/Authoring 175 Internet/On_the_Web/Online_Communities 92 Internet/E-mail/Spam 34 Hardware/Systems/IBM 85 Data_Formats/Markup_Languages/HTML Recursos Categoría
  • 35. Resultados Conjuntos de entrenamiento Micro-averaging F1
  • 36.
    • Conjunto de entrenamiento ts 25% y criterio de convergencia de 25 anotaciones
    Resultados conceptos de clasificación
  • 37.
    • Conjunto de entrenamiento ts 25% y criterio de convergencia de 25 anotaciones
    Resultados conceptos de clasificación
  • 38. Modos de clasificación
    • Conjunto de entrenamiento ts 25% y criterio de convergencia de 25 anotaciones
    Valor del umbral Valor del umbral
  • 39. Resultados comparativa clasificación Con TagModel
    • Criterio de convergencia de 25 anotaciones
    Conjuntos de entrenamiento Micro-averaging F1 Minutos Yin, Z., Li, R., Mei, Q., y Han, J. (2009). Exploring social tagging graph for web object classification.
  • 40. Extensión de la folcsonomía Clasificador Diccionarios Creación y evolución del modelo Prototipo de navegación 3 Método automático de clasificación
  • 41. Análisis de diccionarios
    • ¿Cómo afecta la reducción del número de etiquetas del diccionario al clasificador?
    • ¿Y al rendimiento?
  • 42. Resultados
    • Diccionarios: 25, 100, 500, 1.000, 2.500, 5.000, 10.000, Todas
    • Criterio de convergencia: 25 anotaciones
    Conjuntos de entrenamiento Micro-averaging F1
  • 43. Resultados rendimiento Minutos Tamaños de diccionario
    • Diccionarios: 25, 100, 500, 1.000, 2.500, 5.000, 10.000, Todas
    • Criterio de convergencia: 25 anotaciones
    0,74%
  • 44. Extensión de la folcsonomía Clasificador Diccionarios Creación y evolución del modelo Prototipo de navegación 3 Método automático de clasificación
  • 45. Creación y Evolución t 0 t i-1 t i Tagging Creación Evolución <U,R,T,A> Usuarios Recursos Etiquetas Anotaciones <U,R,T,A,D,C,Z,V,S> Etiquetas Diccionario Clasifícación Similaridades Vectores Conceptos Anotaciones Recursos Usuarios <U,R,T,A> Usuarios Recursos Etiquetas Anotaciones <U,R,T,A,D,C,Z,V,S> Etiquetas Diccionario Clasifícación Similaridades Vectores Conceptos Anotaciones Recursos Usuarios <U,R,T,A> Usuarios Recursos Etiquetas Anotaciones
  • 46. Componentes Diccionario: DictionaryStrategy Creación y Evolución Convergencia: ConvergenceCriterion Similaridad: SimilarityMeasure Clasificador: Classifier Clustering: ClusteringStrategy Unión/división: MergingSplitingStrategy Nombrado: NamingStrategy Similaridades: SimilaritiesStrategy Recálculo: RecalculationConditionCriterion
  • 47. Creación
  • 48. Evolución
  • 49. Validación
    • Datos de del.icio.us entre el 15 y 30 de Septiembre de 2009
      • |U| = 1.293.351, |R| = 15.201, |T| = 709.657 , |A| = 44.437.191
    • Se ha creado 10 datasets d 0 a d 9
      • ds 0 para la creación del modelo (hasta 31-dic-2008)
      • ds 1 a ds 9 para la evolución del modelo (enero … septiembre de 2009)
    709.657 15.201 1.293.351 44.437.191 22.935 194 35.049 2.093.583 ds 9 686.722 15.007 1.258.302 42.343.608 26.332 368 36.438 2.617.998 ds 8 660.390 14.639 1.221.864 39.725.610 24.951 345 34.137 2.437.317 ds 7 635.439 14.294 1.187.727 37.288.293 24.460 348 33.959 2.304.614 ds 6 610.979 13.946 1.153.768 34.983.679 24.919 391 33.078 2.230.512 ds 5 586.060 13.555 1.120.690 32.753.167 24.187 336 34.603 2.153.461 ds 4 561.873 13.219 1.086.087 30.599.706 26.101 407 40.672 2.179.539 ds 3 535.772 12.812 1.045.415 28.420.167 23.066 353 37.240 1.811.331 ds 2 512.706 12.459 1.008.175 26.608.836 23.581 342 35.480 1.704.682 ds 1 489.125 12.117 972.695 24.904.154 489.125 12.117 972.695 24.904.154 ds 0 Etiquetas Recursos Usuarios Anotaciones Etiquetas Recursos Usuarios Anotaciones Acumulados Nuevos elementos
  • 50. Implementación de los componentes          Mensualmente Se almacenan mayores a 0,25 Entre recursos si pertenecen al mismo concepto Etiquetas más relevantes Levenshtein para evitar variaciones sintácticas Unión si similaridad mayor a 0.75 K-means distribuido Modo delta con threshold=0.1 Se reintenta cada 50 anotaciones Coseno de similaridad 100 anotaciones Etiquetas con un mínimo de 1.000 anotaciones Condición de recálculo Cálculo de similaridades Asignación de nombres Unión o división de clusters Clustering Clasificador Medida de similaridad Criterio de convergencia Diccionario
  • 51. Entorno de ejecución MySQL Memcache Gearman K-means Similaridades Evolución
  • 52. Evolución etiquetas y diccionario Número de etiquetas en la folcsonomía Número de etiquetas en el diccionario Ratio etiquetas diccionario / folcsonomía
  • 53. Evolución de los recursos Estado de los recursos tras cada recálculo Número de recursos
  • 54. Evolución de los conceptos Finance & Money ds 9 Psychology ds 8 Rss ds 7 Design & Logo ds 6 Generator & Fun & Tools ds 5 ds 4 Posters & Design & Art Usability & Design & Webdesign Origami Conceptos creados ds 3 ds 2 ds 1 Origami Art & Design Howto & Diy 13 Howto & Diy 82 189 Art & Design 70 16 190 1 69 188 Business & Finance & Money Finance & Money Business 110 115 215 118 119 6
  • 55. Conceptos creados Templates & Webdesign Politics Jobs & Career Flash & Animation & Fun Storage & Tools & Backup Php Javascript Firefox Wordpress Software & Windows & Tools Photoshop Java Finance & Money Windows Shopping Photos & Photography & Images Iphone Fashion Wiki Seo & Tools Photography Humor & Funny Environment & Green & Sustainability Webdesign & Design Security Origami & Paper & Papercraft Html & Webdesign & Web Education & Resources Web2.0 & Social & Socialnetworking Search Opensource & Software Howto & Diy Django & Python Wallpaper Science News Health Design & Logo Video Ruby & Rails Music Hardware & Electronics Design Usability & Webdesign & Design Rss Mobile Google Css Ubuntu & Linux Reference & Research Math Git & Database & Mysql Cocoa & Programming & Mac Twitter Python Mac & Software & Osx Generator & Tools & Fun Cms Tv & Video Psychology Linux & Unix & Reference Games Business Travel Programming Linux Food & Recipes & Cooking Books Torrent & Bittorrent Programming & .net & Development Latex & Wow Fonts & Typography & Design Blog Tools & Web2.0 Productivity & Gtd & Lifehacks Language & English & Writing Flex Audio Testing & Tools Posters & Design & Art Jquery Flash Art
  • 56. Coste computacional Creación Evolución Minutos 15,48 Cálculo de las medidas de similaridad 0,01 Asignación de nombre a los CCs 0,53 Creación de los vectores VC 61,62 Asignación de recursos a Rclassified 0,98 Unión de conceptos similares 192,21 Clustering k-means (k = 76) 0,08 Comprobar convergencia de los recursos 22,83 Creación representaciones vectoriales 1,1 Creación del diccionario Tarea 166,56 34,41 0,01 1,28 128,48 2,38 37,34 2.093.583 ds 9 120,08 34,08 0,01 1,13 82,63 2,23 32,65 2.617.998 ds 8 110,83 31,44 0,01 1,13 76,07 2,18 41,84 2.437.317 ds 7 74,08 26,42 0,01 0,98 44,57 2,1 41,12 2.304.614 ds 6 81,11 24,29 0,01 0,93 53,83 2,05 40,36 2.230.512 ds 5 50,73 23,05 0,01 0,85 24,57 2,25 43,12 2.153.461 ds 4 68,03 20,29 0,01 0,63 44,92 2,18 41,98 2.179.539 ds 3 40,09 17,28 0,03 0,58 20,42 1,78 31,24 1.811.331 ds 2 61,86 17,07 0,01 0,58 42,73 1,47 28,23 1.704.682 ds 1 Total Similarities Naming Merging Clustering Dictionary Minutos #Taggings Recálculo (minutos) Procesado Taggings
      • 965,74 taggings por segundo
      • 40,24 taggings por proceso y segundo
  • 57. Extensión de la folcsonomía Clasificador Diccionarios Creación y evolución del modelo Prototipo de navegación 3 Método automático de clasificación
  • 58. Nube de etiquetas y conceptos
  • 59. Concepto de clasificación
  • 60. Información relacionada con los recursos
  • 61. Validación
    • ¿Qué queremos saber?
      • ¿Son útiles las nuevas opciones?
      • ¿Se localiza la información más fácil?
      • ¿Se obtiene más información relevante?
    • Dos vías
      • Tareas de búsqueda y cuestionario
        • Obtener información de los frameworks php: Zend, PEAR, PRADO y Zoop.
        • Obtener información de Hibernate que es un sistema de gestión de la persistencia de bases de datos implementado en Java.
        • Obtener información de mono, un Framework .NET de libre distribución
        • Obtener información para IRC o Chat en Mac OS X
      • Monitorización de la navegación
    • Febrero de 2010
    • 89 alumnos de diferentes cursos de Ingeniería Informática de la Universidad Pública de Navarra
    • 13 trabajadores del sector de las tecnologías de la información
  • 62. Resultados encuestas
    • ACoAR permite obtener la información de forma más fácil (63,73%)
    • Menor número de clics con ACoAR (67,65%)
    • Más información con ACoAR (81,37%)
    • Útil el filtrado de tags (95,10%)
    • Útil acceder a los conceptos desde las tags (96,08%)
  • 63. Resultados monitorización navegación
    • Sin ACoAR
      • Una etiqueta y paginación
    • Con ACoAR
      • Conceptos y filtrado de etiquetas
      • Recursos relacionados
      • Menos clics e información más relevante
  • 64. Agenda 1 2 3 4 5 Introducción Hipótesis y objetivos principales Método automático de clasificación Conclusiones y líneas futuras Publicaciones   
  • 65. Conclusiones
    • Método de clasificación de recursos
      • Extensión de la folcsonomía
      • Clasificador con varios modos de funcionamiento
      • Creación y evolución de la clasificación
    • Mejoras en la representación y recuperación de información
    • Soporte a la creación, evolución y poblamiento de ontologías
  • 66. Líneas futuras
    • Análisis de otros tipos de folcsonomías y componentes
      • Maximizar la información semántica proporcionada por los diccionarios
      • Aplicabilidad de otras técnicas de clustering
    • Inclusión en el modelo de la información de los usuarios
    • Implementación de un sistema real
      • Red social de cocina: www.kukers.com
        • Folcsonomía “ facetada ”
      • Aplicación a imagen médica digital
        • Alineamiento con SNOMED CT
  • 67. Agenda 1 2 3 4 5 Introducción Hipótesis y objetivos principales Método automático de clasificación Conclusiones y líneas futuras Publicaciones    
  • 68. Social Web Evolution : Integrating Semantic Applications and Web 2.0 Technologies eHealth : Ubiquitous Health and Medical Informatics: Advancements in Web 2.0, Health 2.0 and Medicine 2.0 SAAKM-KCAP : Workshop on Semantic Authoring, Annotation and Knowledge Markup (SAAKM 2007) at KCAP ’07 WSKS : World Summit on the Knowledge Society WASET : World Academy of Science, Engineering and Technology IEEE Latina: Latin America Transactions, IEEE SAC : Symposium on Applied Computing ICWE : International Conference on Web Engineering ITA : International Conference on Internet Techonologies K-CAP : Conference on Knowledge Capture SDOW : Social Data on the Web Workshop (SDoW’09) at ISWC’10 SEMAPRO : Conference on Advances in Semantic Processing 2007 2008 2009 2010 2011 K-CAP WASET Diciembre Noviembre SEMAPRO SDOW (ISWC) Octubre ITA WSKS SAAKM (K-CAP) Septiembre Agosto Julio K-CAP ICWE Junio Mayo Abril Marzo Febrero Enero eHealth SAC IEEE Latina SAC Social Web Evolution
  • 69. Social Web Evolution : Integrating Semantic Applications and Web 2.0 Technologies eHealth : Ubiquitous Health and Medical Informatics: Advancements in Web 2.0, Health 2.0 and Medicine 2.0 SAAKM-KCAP : Workshop on Semantic Authoring, Annotation and Knowledge Markup (SAAKM 2007) at KCAP ’07 WSKS : World Summit on the Knowledge Society WASET : World Academy of Science, Engineering and Technology IEEE Latina: Latin America Transactions, IEEE SAC : Symposium on Applied Computing ICWE : International Conference on Web Engineering ITA : International Conference on Internet Techonologies K-CAP : Conference on Knowledge Capture SDOW : Social Data on the Web Workshop (SDoW’09) at ISWC’10 SEMAPRO : Conference on Advances in Semantic Processing 2007 2008 2009 2010 2011 K-CAP WASET Diciembre Noviembre SEMAPRO SDOW (ISWC) Octubre ITA WSKS SAAKM (K-CAP) Septiembre Agosto Julio K-CAP ICWE Junio Mayo Abril Marzo Febrero Enero eHealth SAC IEEE Latina SAC Social Web Evolution
  • 70. Social Web Evolution : Integrating Semantic Applications and Web 2.0 Technologies eHealth : Ubiquitous Health and Medical Informatics: Advancements in Web 2.0, Health 2.0 and Medicine 2.0 SAAKM-KCAP : Workshop on Semantic Authoring, Annotation and Knowledge Markup (SAAKM 2007) at KCAP ’07 WSKS : World Summit on the Knowledge Society WASET : World Academy of Science, Engineering and Technology IEEE Latina: Latin America Transactions, IEEE SAC : Symposium on Applied Computing ICWE : International Conference on Web Engineering ITA : International Conference on Internet Techonologies K-CAP : Conference on Knowledge Capture SDOW : Social Data on the Web Workshop (SDoW’09) at ISWC’10 SEMAPRO : Conference on Advances in Semantic Processing 2007 2008 2009 2010 2011 K-CAP WASET Diciembre Noviembre SEMAPRO SDOW (ISWC) Octubre ITA WSKS SAAKM (K-CAP) Septiembre Agosto Julio K-CAP ICWE Junio Mayo Abril Marzo Febrero Enero eHealth SAC IEEE Latina SAC Social Web Evolution
  • 71. Social Web Evolution : Integrating Semantic Applications and Web 2.0 Technologies eHealth : Ubiquitous Health and Medical Informatics: Advancements in Web 2.0, Health 2.0 and Medicine 2.0 SAAKM-KCAP : Workshop on Semantic Authoring, Annotation and Knowledge Markup (SAAKM 2007) at KCAP ’07 WSKS : World Summit on the Knowledge Society WASET : World Academy of Science, Engineering and Technology IEEE Latina: Latin America Transactions, IEEE SAC : Symposium on Applied Computing ICWE : International Conference on Web Engineering ITA : International Conference on Internet Techonologies K-CAP : Conference on Knowledge Capture SDOW : Social Data on the Web Workshop (SDoW’09) at ISWC’10 SEMAPRO : Conference on Advances in Semantic Processing 2007 2008 2009 2010 2011 K-CAP WASET Diciembre Noviembre SEMAPRO SDOW (ISWC) Octubre ITA WSKS SAAKM (K-CAP) Septiembre Agosto Julio K-CAP ICWE Junio Mayo Abril Marzo Febrero Enero eHealth SAC IEEE Latina SAC Social Web Evolution
  • 72.
    • 2011
      • Echarte, F., Astrain, J.J., Córdoba, A., Villadangos, J.J. y Labat, A. (2011). A Self-Adapting Method for Knowledge Management in Collaborative and Social Tagging Systems . En K-CAP’11: Proceedings of the Fifth international Conference on Knowledge Capture. (Pendiente de publicación)
      • Echarte, F., Astrain, J.J., Córdoba, A., Villadangos, J.J. y Labat, A. (2011). A Method for the Classification of Folksonomy Resources . En SAC’11: Proceedings of the 2011 ACM symposium on Applied Computing, New York, NY, USA. ACM.
    • 2010
      • Astrain, J.J., Córdoba, A., Echarte, F. y Villadangos, J. (2010). An Algorithm for the Improvement of Tag-based Social Interest Discovery . En SEMAPRO’10: Proceedings of The Fourth International Conference on Advances in Semantic Processing, pages 49—54, Florencia, Italia.
      • Echarte, F., Astrain, J.J., Córdoba, A. y Villadangos, J. (2010). A Semantic Model to Address Health Questions to Professionals in Healthcare Social Networks . Ubiquitous Health and Medical Informatics: Advancements in Web 2.0, Health 2.0 and Medicine 2.0, Eds. Sabah Mohammed y Jinan Fiaidhi, IGI-Global.
      • Astrain, J.J., Echarte, F., Córdoba, A., Villadangos, J. (2010). Clustering Method for Social Network Annotations . IEEE Latin America Transactions, 8(1): 88—93.
    • 2009
      • Echarte, F., Astrain, J.J., Córdoba, A. y Villadangos, J. (2009). Folksonomy Resources as a Data Source for the Social Data in Semantic Web . En Proceedings of the Second Social Data on the Web Workshop (SDoW’09) at ISWC’10, volumen 250, Washington DC, USA. CEUR Workshop Proceedings.
      • Echarte, F., Astrain, J. J., Córdoba, A., Villadangos, J. y Labat, A. (2009). ACoAR: a method for the automatic classification of annotated resources . En K-CAP’09: Proceedings of the Fifth international Conference on Knowledge Capture, páginas 181—182, New York, NY USA. ACM.
      • Echarte, F., Astrain, J.J., Córdoba, A. y Villadangos, J. (2009). Pattern Matching Techniques to Improve Folksonomies Quality Grouping Synstactic Variations of Tags . En ITA’09: Proceedings of the Third International Conference on Internet Techonologies & Applications, Wrexham, North Wales, UK.
      • Astrain, J. J., Echarte, F., Córdoba, A., y Villadangos, J. (2009). A Tag Clustering Method to Deal with Syntactic Variations on Collaborative Social Networks . En ICWE’09: Proceedings of the 9th international Conference on Web Engineering, páginas 434—441, Berlin, Heidelberg. Springer-Verlag.
      • Echarte, F., Astrain, J. J., Córdoba, A., y Villadangos, J. (2009). Improving folksonomies quality by syntactic tag variations grouping . En SAC’09: Proceedings of the 2009 ACM Symposium on Applied Computing, páginas 1226—1230, New York, NY, ACM.
      • Echarte, F., Astrain, J.J., Córdoba, A. y Villadangos, J. (2009). Pattern Matching Techniques to Identify Syntactic Variations of Tags in Folksonomies . Social Web Evolution: Integrating Semantic Applications and Web 2.0 Technologies, páginas 138—149, Eds. Miltiadis Lytras y Patricia Ordoñez de Pablos, IGI-Global
    • 2008
      • Echarte, F., Astrain, J.J., Córdoba, A., y Villadangos, J. (2008). Self-adaptation of Ontologies to Folksonomies in Semantic Web . En ICSWE’08: Proceedings of World Academy of Science, Engineering and Technology, páginas 335—341, Heidelberg, Germany.
      • Echarte, F., Astrain, J.J., Córdoba, A., y Villadangos, J. (2008). Pattern Matching Techniques to Identify Syntactic Variations of Tags in Folksonomies . En WSKS’08: Proceedings of the 1st World Summit on the Knowledge Society, páginas 557–564, Berlin, Heidelberg. Springer-Verlag.
    • 2007
      • Echarte, F., Astrain, J.J., Córdoba, A., y Villadangos, J. (2007). Ontology of Folksonomy: A New Modeling Method . En Proceedings of Workshop on Semantic Authoring, Annotation and Knowledge Markup (SAAKM 2007) at KCAP ’07, volumen 289, Whistler, British Columbia, Canada. CEUR Workshop Proceedings.
    Publicaciones
  • 73.
    • Journal of Information Science
      • An incremental method for the automatic classification of annotated resources in folksonomies
    • Information Sciences
      • Folksonomies: a Survey
    Trabajos en curso
  • 74. Un Método Incremental para la Clasificación Automática y Semántica de Recursos en Sistema de Etiquetado Colaborativo Directores: Jesús Villadangos y Alberto Córdoba Francisco Echarte Ayerra Defensa de Tesis Doctoral – 3 de mayo de 2011