Sistema de Recomendação de Artigos Científicos a Partir de um Texto Exemplo   Christiano Avila S tanley Loh Frederico Fons...
Sumário <ul><li>Introdução </li></ul><ul><li>SisRecAC </li></ul><ul><li>Experimentos </li></ul><ul><li>Resultados </li></u...
Introdução <ul><li>Segundo Spink et al.[19]: </li></ul><ul><ul><li>52% das consultas submetidas aos mecanismos de buscas s...
Introdução <ul><li>Silverstein et al. [17],  Lau & Horvitz [10], Spink et al. [19], Teevan et al. [20] constatam que usuár...
Introdução <ul><li>Belkin et al. [2] e o Estado Anômalo de Conhecimento (ASK - Anomalous State of Knowledge).  </li></ul><...
Introdução <ul><li>Motivação  </li></ul><ul><ul><li>dificuldade para determinar as palavras-chave. </li></ul></ul><ul><ul>...
SisRecAC <ul><li>Sistema de recomendação de artigos científicos (SisRecAC) </li></ul><ul><li>Baseado no paradigma de “ que...
SisRecAC Partida a frio (Cold start), pouca possibilidade de surpresa (serendipity ) Ter o documento de exemplo ASK Proble...
SisRecAC <ul><li>Faz upload de um  </li></ul><ul><li>Documento (.pdf, .txt) </li></ul>2)  Escolhe um método usuário 3)  Ex...
SisRecAC
Tags Upload
Upload Recomendação 1 Recomendação   2 Recomendação   3
SisRecAC <ul><li>Métodos </li></ul><ul><ul><li>Identificar ou extrair de características do documento  </li></ul></ul><ul>...
SisRecAC <ul><li>Expressões </li></ul><ul><ul><li>Método 1  – uma expressão </li></ul></ul><ul><ul><li>Método 2  – 2 expre...
SisRecAC <ul><li>Palavras com maior freqüência </li></ul><ul><ul><li>Método 4  - 4 palavras de maior freqüência no documen...
SisRecAC <ul><li>Outros métodos </li></ul><ul><ul><li>Método   10   - título do documento </li></ul></ul><ul><ul><li>Métod...
Experimentos <ul><li>Seleção do Método </li></ul><ul><ul><li>Escolhido em função da quantidade de avaliações realizadas </...
Experimentos  <ul><li>Os usuários do SisRecAc são convidados a avaliar as recomendações do sistema. </li></ul><ul><li>Pode...
Upload Recomendação   1 Recomendação   2 Recomendação   3 Avaliação
Resultados <ul><li>Gráfico </li></ul>Expressões Termos simples Título Tags
Conclusões <ul><li>Este projeto confirma  Kraft et al.  [8]  que descobriu que o número ideal de termos em uma consulta de...
Trabalhos futuros <ul><li>Descoberta de conhecimento em “folksonomias” </li></ul><ul><li>Uso de tags com expansão baseada ...
Apoio <ul><li>Este trabalho é parcialmente apoiado pela FAPERGS (Fundação de Amparo à Pesquisa do Estado do Rio Grande do ...
Sistema de Recomendação de Artigos Científicos a Partir de um Texto Exemplo   Christiano Avila – chris AT direto2.ucpel.tc...
 
 
 
Experimentos  <ul><li>Total de usuários:32 </li></ul><ul><li>Total de documentos:179 </li></ul><ul><li>Total de avaliações...
Upcoming SlideShare
Loading in …5
×

Webmedia2007 V4

631 views
555 views

Published on

Apresentação Webmedia

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
631
On SlideShare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
26
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Webmedia2007 V4

  1. 1. Sistema de Recomendação de Artigos Científicos a Partir de um Texto Exemplo Christiano Avila S tanley Loh Frederico Fonseca
  2. 2. Sumário <ul><li>Introdução </li></ul><ul><li>SisRecAC </li></ul><ul><li>Experimentos </li></ul><ul><li>Resultados </li></ul><ul><li>Considerações Finais / Conclusões </li></ul><ul><li>Apoio </li></ul>
  3. 3. Introdução <ul><li>Segundo Spink et al.[19]: </li></ul><ul><ul><li>52% das consultas submetidas aos mecanismos de buscas são reformuladas </li></ul></ul><ul><ul><ul><li>32,5% das consultas modificadas sofreram alterações nos termos submetidos, mas não no número total de termos </li></ul></ul></ul><ul><ul><ul><li>41,6% incluíram termos novos </li></ul></ul></ul><ul><ul><ul><li>25,9% eram relativas a consultas modificadas pela exclusão de termos. </li></ul></ul></ul><ul><li>Pesquisa da iProspect concluiu que 82% dos usuários de mecanismos de busca refazem consultas não bem sucedidas acrescentando mais palavras. </li></ul>
  4. 4. Introdução <ul><li>Silverstein et al. [17], Lau & Horvitz [10], Spink et al. [19], Teevan et al. [20] constatam que usuários utilizam entre 2 e 3 termos em média </li></ul><ul><li>Entretanto, Kraft et al. [8], concluíram que o número ideal de palavras a serem submetidas para busca nos mecanismos deve ficar entre 5 e 9. </li></ul>
  5. 5. Introdução <ul><li>Belkin et al. [2] e o Estado Anômalo de Conhecimento (ASK - Anomalous State of Knowledge). </li></ul><ul><li>Problema para especificar precisamente os termos </li></ul><ul><li>Os mecanismos de busca tradicionais exigem que o usuário tenha algum conhecimento </li></ul><ul><li>Contradição pedir ao usuário para formular o que precisa se é isto justamente o que falta. </li></ul><ul><li>“ Método” de tentativa e erro que toma tempo e pode gerar frustração com o mecanismo de busca. </li></ul>
  6. 6. Introdução <ul><li>Motivação </li></ul><ul><ul><li>dificuldade para determinar as palavras-chave. </li></ul></ul><ul><ul><li>Aplicações na área de apoio ao ensino </li></ul></ul>
  7. 7. SisRecAC <ul><li>Sistema de recomendação de artigos científicos (SisRecAC) </li></ul><ul><li>Baseado no paradigma de “ query by example ” </li></ul><ul><li>É um sistema de metabusca </li></ul>
  8. 8. SisRecAC Partida a frio (Cold start), pouca possibilidade de surpresa (serendipity ) Ter o documento de exemplo ASK Problemas Movielens, Grupolens, diversos sistemas de e-commerce SisRecAC Google, Yahoo, outros Exemplos O sistema constrói um perfil dos usuários (filtragem colaborativa, baseado em conteúdo) O usuário informa um exemplo do que precisa O usuário deve saber informar corretamente as palavras-chave Descrição Paradigma 2 Query by exemplo Paradigma 1
  9. 9. SisRecAC <ul><li>Faz upload de um </li></ul><ul><li>Documento (.pdf, .txt) </li></ul>2) Escolhe um método usuário 3) Extrai palavras-chave do Documento 5)Links para Artigos científicos 4) Submete Palavras-chave 6) Recebe as recomendações 7) Faz a avaliação
  10. 10. SisRecAC
  11. 11. Tags Upload
  12. 12. Upload Recomendação 1 Recomendação 2 Recomendação 3
  13. 13. SisRecAC <ul><li>Métodos </li></ul><ul><ul><li>Identificar ou extrair de características do documento </li></ul></ul><ul><ul><li>Submeter consulta ao mecanismo de busca. </li></ul></ul><ul><ul><li>Comparar diferentes métodos de extração de palavras-chave de textos. </li></ul></ul><ul><ul><li>Utilizar título e “ tags ” informadas pelos usuários. </li></ul></ul>
  14. 14. SisRecAC <ul><li>Expressões </li></ul><ul><ul><li>Método 1 – uma expressão </li></ul></ul><ul><ul><li>Método 2 – 2 expressões </li></ul></ul><ul><ul><li>Método 3 - 3 expressões </li></ul></ul>
  15. 15. SisRecAC <ul><li>Palavras com maior freqüência </li></ul><ul><ul><li>Método 4 - 4 palavras de maior freqüência no documento. </li></ul></ul><ul><ul><li>Métodos 5, 6, 7, 8 e 9 – idem, porém 5, 6, 7, 8 e 9 palavras. </li></ul></ul>
  16. 16. SisRecAC <ul><li>Outros métodos </li></ul><ul><ul><li>Método 10 - título do documento </li></ul></ul><ul><ul><li>Método 11 – tags </li></ul></ul>
  17. 17. Experimentos <ul><li>Seleção do Método </li></ul><ul><ul><li>Escolhido em função da quantidade de avaliações realizadas </li></ul></ul>
  18. 18. Experimentos <ul><li>Os usuários do SisRecAc são convidados a avaliar as recomendações do sistema. </li></ul><ul><li>Podem informar se consideram a recomendação: </li></ul><ul><ul><li>Totalmente relevante </li></ul></ul><ul><ul><li>Parcialmente relevante </li></ul></ul><ul><ul><li>Irrelevante </li></ul></ul>
  19. 19. Upload Recomendação 1 Recomendação 2 Recomendação 3 Avaliação
  20. 20. Resultados <ul><li>Gráfico </li></ul>Expressões Termos simples Título Tags
  21. 21. Conclusões <ul><li>Este projeto confirma Kraft et al. [8] que descobriu que o número ideal de termos em uma consulta deve estar entre 5 e 9 </li></ul><ul><li>Demonstra que sistemas de recomendação baseados no paradigma de “ query by example ” são uma alternativa viável pois o uso de exemplos minimiza o esforço do usuário para selecionar palavras-chave para representar sua intenção de busca. </li></ul><ul><li>O sistema apresentado nesse artigo mostra que técnicas automáticas podem alcançar boa precisão quando recomenda documentos baseados em um exemplo. </li></ul><ul><li>O algoritmo que extrai as palavras-chave dos documentos é relativamente simples e com baixo custo computacional se comparado a outros algoritmos com fins semelhantes. </li></ul><ul><li>O sistema apresenta um excelente potencial de utilização na área acadêmica, onde manuais, artigos, apostilas e conteúdos programáticos poderiam ser utilizados como texto base para recomendação. </li></ul>
  22. 22. Trabalhos futuros <ul><li>Descoberta de conhecimento em “folksonomias” </li></ul><ul><li>Uso de tags com expansão baseada em folksonomias </li></ul><ul><li>Ampliar os recursos do SisRecAc (agentes, convites, uso de perfil, …) </li></ul><ul><li>Integração com o Sistema de Apoio da UCPEL (conteúdos programáticos, uploads de professores, …) </li></ul>
  23. 23. Apoio <ul><li>Este trabalho é parcialmente apoiado pela FAPERGS (Fundação de Amparo à Pesquisa do Estado do Rio Grande do Sul). </li></ul>
  24. 24. Sistema de Recomendação de Artigos Científicos a Partir de um Texto Exemplo Christiano Avila – chris AT direto2.ucpel.tche.br S tanley Loh - loh AT ucpel.tche.br Frederico Fonseca - frederico12345 AT gmail.com
  25. 28. Experimentos <ul><li>Total de usuários:32 </li></ul><ul><li>Total de documentos:179 </li></ul><ul><li>Total de avaliações:929 </li></ul>

×