Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Webmedia2007 V4

710 views

Published on

Apresentação Webmedia

Published in: Technology
  • Be the first to comment

  • Be the first to like this

Webmedia2007 V4

  1. 1. Sistema de Recomendação de Artigos Científicos a Partir de um Texto Exemplo Christiano Avila S tanley Loh Frederico Fonseca
  2. 2. Sumário <ul><li>Introdução </li></ul><ul><li>SisRecAC </li></ul><ul><li>Experimentos </li></ul><ul><li>Resultados </li></ul><ul><li>Considerações Finais / Conclusões </li></ul><ul><li>Apoio </li></ul>
  3. 3. Introdução <ul><li>Segundo Spink et al.[19]: </li></ul><ul><ul><li>52% das consultas submetidas aos mecanismos de buscas são reformuladas </li></ul></ul><ul><ul><ul><li>32,5% das consultas modificadas sofreram alterações nos termos submetidos, mas não no número total de termos </li></ul></ul></ul><ul><ul><ul><li>41,6% incluíram termos novos </li></ul></ul></ul><ul><ul><ul><li>25,9% eram relativas a consultas modificadas pela exclusão de termos. </li></ul></ul></ul><ul><li>Pesquisa da iProspect concluiu que 82% dos usuários de mecanismos de busca refazem consultas não bem sucedidas acrescentando mais palavras. </li></ul>
  4. 4. Introdução <ul><li>Silverstein et al. [17], Lau & Horvitz [10], Spink et al. [19], Teevan et al. [20] constatam que usuários utilizam entre 2 e 3 termos em média </li></ul><ul><li>Entretanto, Kraft et al. [8], concluíram que o número ideal de palavras a serem submetidas para busca nos mecanismos deve ficar entre 5 e 9. </li></ul>
  5. 5. Introdução <ul><li>Belkin et al. [2] e o Estado Anômalo de Conhecimento (ASK - Anomalous State of Knowledge). </li></ul><ul><li>Problema para especificar precisamente os termos </li></ul><ul><li>Os mecanismos de busca tradicionais exigem que o usuário tenha algum conhecimento </li></ul><ul><li>Contradição pedir ao usuário para formular o que precisa se é isto justamente o que falta. </li></ul><ul><li>“ Método” de tentativa e erro que toma tempo e pode gerar frustração com o mecanismo de busca. </li></ul>
  6. 6. Introdução <ul><li>Motivação </li></ul><ul><ul><li>dificuldade para determinar as palavras-chave. </li></ul></ul><ul><ul><li>Aplicações na área de apoio ao ensino </li></ul></ul>
  7. 7. SisRecAC <ul><li>Sistema de recomendação de artigos científicos (SisRecAC) </li></ul><ul><li>Baseado no paradigma de “ query by example ” </li></ul><ul><li>É um sistema de metabusca </li></ul>
  8. 8. SisRecAC Partida a frio (Cold start), pouca possibilidade de surpresa (serendipity ) Ter o documento de exemplo ASK Problemas Movielens, Grupolens, diversos sistemas de e-commerce SisRecAC Google, Yahoo, outros Exemplos O sistema constrói um perfil dos usuários (filtragem colaborativa, baseado em conteúdo) O usuário informa um exemplo do que precisa O usuário deve saber informar corretamente as palavras-chave Descrição Paradigma 2 Query by exemplo Paradigma 1
  9. 9. SisRecAC <ul><li>Faz upload de um </li></ul><ul><li>Documento (.pdf, .txt) </li></ul>2) Escolhe um método usuário 3) Extrai palavras-chave do Documento 5)Links para Artigos científicos 4) Submete Palavras-chave 6) Recebe as recomendações 7) Faz a avaliação
  10. 10. SisRecAC
  11. 11. Tags Upload
  12. 12. Upload Recomendação 1 Recomendação 2 Recomendação 3
  13. 13. SisRecAC <ul><li>Métodos </li></ul><ul><ul><li>Identificar ou extrair de características do documento </li></ul></ul><ul><ul><li>Submeter consulta ao mecanismo de busca. </li></ul></ul><ul><ul><li>Comparar diferentes métodos de extração de palavras-chave de textos. </li></ul></ul><ul><ul><li>Utilizar título e “ tags ” informadas pelos usuários. </li></ul></ul>
  14. 14. SisRecAC <ul><li>Expressões </li></ul><ul><ul><li>Método 1 – uma expressão </li></ul></ul><ul><ul><li>Método 2 – 2 expressões </li></ul></ul><ul><ul><li>Método 3 - 3 expressões </li></ul></ul>
  15. 15. SisRecAC <ul><li>Palavras com maior freqüência </li></ul><ul><ul><li>Método 4 - 4 palavras de maior freqüência no documento. </li></ul></ul><ul><ul><li>Métodos 5, 6, 7, 8 e 9 – idem, porém 5, 6, 7, 8 e 9 palavras. </li></ul></ul>
  16. 16. SisRecAC <ul><li>Outros métodos </li></ul><ul><ul><li>Método 10 - título do documento </li></ul></ul><ul><ul><li>Método 11 – tags </li></ul></ul>
  17. 17. Experimentos <ul><li>Seleção do Método </li></ul><ul><ul><li>Escolhido em função da quantidade de avaliações realizadas </li></ul></ul>
  18. 18. Experimentos <ul><li>Os usuários do SisRecAc são convidados a avaliar as recomendações do sistema. </li></ul><ul><li>Podem informar se consideram a recomendação: </li></ul><ul><ul><li>Totalmente relevante </li></ul></ul><ul><ul><li>Parcialmente relevante </li></ul></ul><ul><ul><li>Irrelevante </li></ul></ul>
  19. 19. Upload Recomendação 1 Recomendação 2 Recomendação 3 Avaliação
  20. 20. Resultados <ul><li>Gráfico </li></ul>Expressões Termos simples Título Tags
  21. 21. Conclusões <ul><li>Este projeto confirma Kraft et al. [8] que descobriu que o número ideal de termos em uma consulta deve estar entre 5 e 9 </li></ul><ul><li>Demonstra que sistemas de recomendação baseados no paradigma de “ query by example ” são uma alternativa viável pois o uso de exemplos minimiza o esforço do usuário para selecionar palavras-chave para representar sua intenção de busca. </li></ul><ul><li>O sistema apresentado nesse artigo mostra que técnicas automáticas podem alcançar boa precisão quando recomenda documentos baseados em um exemplo. </li></ul><ul><li>O algoritmo que extrai as palavras-chave dos documentos é relativamente simples e com baixo custo computacional se comparado a outros algoritmos com fins semelhantes. </li></ul><ul><li>O sistema apresenta um excelente potencial de utilização na área acadêmica, onde manuais, artigos, apostilas e conteúdos programáticos poderiam ser utilizados como texto base para recomendação. </li></ul>
  22. 22. Trabalhos futuros <ul><li>Descoberta de conhecimento em “folksonomias” </li></ul><ul><li>Uso de tags com expansão baseada em folksonomias </li></ul><ul><li>Ampliar os recursos do SisRecAc (agentes, convites, uso de perfil, …) </li></ul><ul><li>Integração com o Sistema de Apoio da UCPEL (conteúdos programáticos, uploads de professores, …) </li></ul>
  23. 23. Apoio <ul><li>Este trabalho é parcialmente apoiado pela FAPERGS (Fundação de Amparo à Pesquisa do Estado do Rio Grande do Sul). </li></ul>
  24. 24. Sistema de Recomendação de Artigos Científicos a Partir de um Texto Exemplo Christiano Avila – chris AT direto2.ucpel.tche.br S tanley Loh - loh AT ucpel.tche.br Frederico Fonseca - frederico12345 AT gmail.com
  25. 28. Experimentos <ul><li>Total de usuários:32 </li></ul><ul><li>Total de documentos:179 </li></ul><ul><li>Total de avaliações:929 </li></ul>

×