Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Incremental Methods for Context-Based Web Retrieval Carlos M. Lorenzetti – Fernando M. Sagui Ana G. Maguitman – Guillermo ...
Problemas: ambigüedad Windows styles?
Una solución: CONTEXTO <ul><li>Proponemos: </li></ul><ul><ul><li>identificar términos específicos </li></ul></ul><ul><ul><...
Una solución: CONTEXTO Lista de palabras Consulta? Más información? Contexto Artículos Diario Otros
Importancia de los términos <ul><li>Método tradicional: TF-IDF </li></ul><ul><ul><li>emplea la forma más simple </li></ul>...
Importancia de los términos <ul><li>Método Propuesto: Incremental </li></ul><ul><ul><li>Descriptores </li></ul></ul><ul><u...
Descriptores y Discriminadores Java Lenguaje Applets Código Tópico: Máquina Virtual de Java NetBeans Computadoras JVM Ruby...
Descriptores y Discriminadores Java Lenguaje Applets Código Tópico: Máquina Virtual de Java NetBeans Computadoras JVM Ruby...
Descriptores y Discriminadores Java Lenguaje Applets Código Tópico: Máquina Virtual de Java NetBeans Computadoras JVM Ruby...
Descriptores y Discriminadores Poder discriminante de un término de un documento Poder descriptivo de un término de un doc...
Descriptores y Discriminadores Similaridad entre documentos K 1 K 3 K 2 d 2 d 1  Similaridad por coseno
Descriptores y Discriminadores Poder discriminante de un término en el tópico de un documento Poder descriptivo de un térm...
Framework
Framework Se encarga de la comunicación con la Web
Framework Estima la importancia del contenido que recibe
Framework Refina la representación que tiene del contexto del usuario
Framework
Web Interaction Module <ul><li>Feed-based </li></ul><ul><ul><li>RSSs = resúmenes XML de sitios web </li></ul></ul><ul><ul>...
Web Interaction Module <ul><li>Query-based </li></ul><ul><ul><li>Información previamente indexada </li></ul></ul><ul><ul><...
Evaluación <ul><li>Query–Based </li></ul><ul><li>Generar la Q(0) usando los términos con TFs más altos </li></ul><ul><li>i...
Evaluación Contexto campaign 0.38 oil 0.31 public 0.31 chevron 0.23 truth 0.23 . . . . . .
<ul><li>Consultas generadas </li></ul><ul><li>Método base </li></ul><ul><ul><li>campaign oil public chevron truth </li></u...
Evaluación <ul><li>Contexto </li></ul><ul><li>5 páginas de DMOZ </li></ul><ul><li>Tópico: Recreación </li></ul><ul><li>3 D...
Trabajo a Futuro
Upcoming SlideShare
Loading in …5
×

Incremental Methods for Context-Based Web Retrieval

524 views

Published on

Intelligent search depends on effective methods for identifying the information needs of a user and making relevant information resources available when needed. Reflecting user context has long been recognized as a key aspect to realizing the potential of intelligent Web search. This paper proposes a theoretical basis for better understanding the role of context in Web retrieval. It addresses the problem of identifying context-specific terms, finding relevant information sources, and automatically formulating and refining queries. We describe ongoing research on the use of incremental methods to retrieve relevant content through two main approaches. The first, feed-based, periodically checks for new relevant items in specific websites by accessing RSS feeds. The second, query-based, incrementally formulates queries, which are submitted to search interfaces (e.g., major search engines or individual search forms). We discuss the technical challenges imposed by these approaches, outline our system architecture, and present preliminary evaluations of the proposed techniques.

Published in: Technology
  • Be the first to comment

  • Be the first to like this

Incremental Methods for Context-Based Web Retrieval

  1. 1. Incremental Methods for Context-Based Web Retrieval Carlos M. Lorenzetti – Fernando M. Sagui Ana G. Maguitman – Guillermo R. Simari Carlos I. Chesñevar
  2. 2. Problemas: ambigüedad Windows styles?
  3. 3. Una solución: CONTEXTO <ul><li>Proponemos: </li></ul><ul><ul><li>identificar términos específicos </li></ul></ul><ul><ul><li>encontrar fuentes relevantes </li></ul></ul><ul><ul><li>generar automáticamente consultas </li></ul></ul>
  4. 4. Una solución: CONTEXTO Lista de palabras Consulta? Más información? Contexto Artículos Diario Otros
  5. 5. Importancia de los términos <ul><li>Método tradicional: TF-IDF </li></ul><ul><ul><li>emplea la forma más simple </li></ul></ul>Cuenta las apariciones de un término en el documento Penaliza a aquella palabras que son muy comunes
  6. 6. Importancia de los términos <ul><li>Método Propuesto: Incremental </li></ul><ul><ul><li>Descriptores </li></ul></ul><ul><ul><ul><li>Términos que aparecen muchas veces en documentos de un mismo tópico: ¿Sobre qué trata este tema? </li></ul></ul></ul><ul><ul><li>Discriminadores </li></ul></ul><ul><ul><ul><li>Términos que solo aparecen en documentos de un mismo tópico: ¿Qué palabras utilizo para encontrar información similar? </li></ul></ul></ul>
  7. 7. Descriptores y Discriminadores Java Lenguaje Applets Código Tópico: Máquina Virtual de Java NetBeans Computadoras JVM Ruby Programación JDK Virtual Máquina
  8. 8. Descriptores y Discriminadores Java Lenguaje Applets Código Tópico: Máquina Virtual de Java NetBeans Computadoras JVM Ruby Programación JDK Virtual Máquina Buenos descriptores
  9. 9. Descriptores y Discriminadores Java Lenguaje Applets Código Tópico: Máquina Virtual de Java NetBeans Computadoras JVM Ruby Programación JDK Virtual Máquina Buenos discriminadores
  10. 10. Descriptores y Discriminadores Poder discriminante de un término de un documento Poder descriptivo de un término de un documento Cantidad de ocurrencias del término k en el documento i
  11. 11. Descriptores y Discriminadores Similaridad entre documentos K 1 K 3 K 2 d 2 d 1  Similaridad por coseno
  12. 12. Descriptores y Discriminadores Poder discriminante de un término en el tópico de un documento Poder descriptivo de un término en el tópico de un documento
  13. 13. Framework
  14. 14. Framework Se encarga de la comunicación con la Web
  15. 15. Framework Estima la importancia del contenido que recibe
  16. 16. Framework Refina la representación que tiene del contexto del usuario
  17. 17. Framework
  18. 18. Web Interaction Module <ul><li>Feed-based </li></ul><ul><ul><li>RSSs = resúmenes XML de sitios web </li></ul></ul><ul><ul><li>Tienen abudantes metadatos </li></ul></ul><ul><ul><ul><li>fecha </li></ul></ul></ul><ul><ul><ul><li>autor </li></ul></ul></ul><ul><li>descripción </li></ul><ul><li>lenguaje </li></ul>
  19. 19. Web Interaction Module <ul><li>Query-based </li></ul><ul><ul><li>Información previamente indexada </li></ul></ul><ul><ul><li>Hay que generar la consulta </li></ul></ul>
  20. 20. Evaluación <ul><li>Query–Based </li></ul><ul><li>Generar la Q(0) usando los términos con TFs más altos </li></ul><ul><li>i  0 </li></ul><ul><li>Enviar la Q(i) al motor de búsqueda </li></ul><ul><li>Obtener las respuestas y convertirlas a repres. vectorial </li></ul><ul><li>Generar una lista ordenada de descriptores, L  </li></ul><ul><li>Generar una lista ordenada de discriminadores, L  </li></ul><ul><li>i  i + 1 </li></ul><ul><li>Q(i)  una combinación de L  y L  </li></ul><ul><li>ir al paso 3 </li></ul>
  21. 21. Evaluación Contexto campaign 0.38 oil 0.31 public 0.31 chevron 0.23 truth 0.23 . . . . . .
  22. 22. <ul><li>Consultas generadas </li></ul><ul><li>Método base </li></ul><ul><ul><li>campaign oil public chevron truth </li></ul></ul><ul><ul><li>oil chevron campaign click dependence </li></ul></ul><ul><ul><li>oil campaign chevron dependence reduce </li></ul></ul><ul><li>Método incremental </li></ul><ul><ul><li>campaing oil public chevron truth </li></ul></ul><ul><ul><li>oil campaign confidence crash future </li></ul></ul><ul><ul><li>oil harsh leg2capital chevron look </li></ul></ul>Evaluación
  23. 23. Evaluación <ul><li>Contexto </li></ul><ul><li>5 páginas de DMOZ </li></ul><ul><li>Tópico: Recreación </li></ul><ul><li>3 Discriminadores </li></ul><ul><li>2 Descriptores </li></ul>RESULTADOS Promedios obtenidos en cada iteración
  24. 24. Trabajo a Futuro

×