Tag Suggestion using Multiple Sources of Knowledge

877 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
877
On SlideShare
0
From Embeds
0
Number of Embeds
142
Actions
Shares
0
Downloads
10
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • - CONTEXTO DAS SOLUÇÕES DE SUGESTÃO DE TAGS- ORGANIZAÇÃO DE PÁGINAS
  • TAGS NUM DOS SITES MAIS POPULARES DA WEB DESCRIÇÃO E ORGANIZAÇÃO SERIA MAIS DIFÍCIL SEM TAGS
  • - N HÁ CLASSIFICAÇÃO HIERÁRQUICA, DITA MTO RÍGIDA P CLASSIFICAR DADOS NA WEB- AGREGADORES -> SISTEMAS DE COMPARTILHAMENTO DE RECURSOS (URLS NO DELICIOUS, VIDEOS NO YOUTUBE)
  • POPULAR TAGSRAILS ( SEE MORE ) RUBY, PROGRAMAÇÃO
  • FOLK + TAXONOMY
  • PALAVRAS LIGADAS = BINDED WORDS
  • // Coffee não é uma boa tag pra descrever essa página
  • [FIM] PROCESSO “GENÉRICO”... EXEMPLO – SUGESTÃO NO DELICIOUS. . .
  • PARA UM RECURSO – JÁ Q VÁRIOS USUÁRIOS PODEM ENVIAR A MESMA URL
  • DESAMBIGUAÇÃO – JAVA (ÚNICA TAG EM PÁGS SOBRE LING E CAFÉ)- ATÉ AQUI == O QUE E PORQUÊ DE SUGESTÃO. MAS COMO?
  • TREINAMENTO = DATASET DELICIOUS (PÁGS,TAGS)
  • AM – MAIS USADA E COM BONS RESULTADOS EM SUGESTÃOMÁQUINA VETOR SUPORTE – USADA COM SUCESSO EM DIVERSAS APLICAÇÕES, ESPECIALMENTE EM TAREFAS ENVOLVENDO TEXTO
  • NÃO É SISTEMA, É SOLUÇÃO!!!!
  • // total number of 15 features
  • // Delicious is not a goodexample of inboundanchor
  • -- VERMELHO – TERMOS RELEVANTES NA PÁGINA ALVO-- EX: QTAS VEZES UM TERMO APARECEU COMO RELACIONADO NAS VÁRIAS CONSULTAS
  • CLASSIFICADOR SVM (MAS A SOLUÇÃO É INDEPENDENTE DE MÉTODO)
  • PRECISÃO: DOS TERMOS CLASSIFICADOS COMO TAGS, QTAS DECISÕES FORAM CORRETASCOBERTURA: DE TODAS AS TAGS, QTAS FORAM CORRETAMENTE CLASSIFICADAS?
  • N DÁ PRA DESCREVER TODAS AS FEATURES, ALGUMAS SÃO ÓBVIAS PELO NOMEPRECISÃO TITLE - RECALL IDF
  • !!!!!!EXPERIMENTO INBOUND N CONVERGIU!!!!!INBOUND INBOUNDINBOUND
  • RESULTADOS QUE MAIS “GANHAM” COM A REMOÇÃO DE UM ATRIBUTO, A DIFERENÇA É MÍNIMAHÁ REDUDÂNCIA NA INFORMAÇÃO QUE OS ATRIBUTOS CARREGAM
  • TODAS AS FEATURES SÃO IMPORTANTES, INFLUI DIRETAMENTE NA PERDA DE F-1
  • VOLTAR AO SLIDE 30!!! FREQUENCY OF OCCURRENCE DOMINA AS OUTRAS FEATURES
  • NÃO FOI FEITO EXPERIMENTO PARA WORDNET E INBOUND (REDUDANTE COM O ANTERIOR)
  • RECALL CONDIZENTE COM A ANÁLISE FONTES X TAGS
  • ==CLASSIFICADOR INBOUND “ATRAPALHA” A DECISÃO DOS OUTROS
  • DATASET USADO EM 2008B
  • COVERAGE – Similar A COBERTURANOVELTY - tags marked as goodbutnotassigned
  • Precision1 – QUASE TODAS AS TAGS FORAM CONSIDERADAS BOAS POR PELO MENOS 1 USUARIOPrecision3 - User-agreement is difficultCoverage - Usersand ANTaReS use differentvocabularies. Lots of synonyms (pageand site) andbindedwords (user: “webpage”, antares: “web”, “page”)Novelty:2/10 tags werenotthought of byuser, notobvious
  • ×