Aula 4
Upcoming SlideShare
Loading in...5
×

Like this? Share it with your network

Share
Uploaded on

Componente do processo de RI (4/6) : a verbalização da necessidade de informação em uma seqüência de expressões de busca...

Componente do processo de RI (4/6) : a verbalização da necessidade de informação em uma seqüência de expressões de busca
Componente do processo de RI (5/6): a seqüência dos itens apresentados como um resultado da estratégia de busca
Componente do processo de RI (6/6): a medida em que os registros recuperados satisfazem a necessidade de informação do usuário (avaliação da relevância)

More in: Business , Technology
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
2,035
On Slideshare
2,035
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
29
Comments
0
Likes
1

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Aula 4
    Disciplina: Recuperação da Informação
    Letícia Strehl
    9 abr. 2009
  • 2. Conteúdos da Aula 4
    Componente do processo de RI (4/6) : a verbalização da necessidade de informação em uma seqüência de expressões de busca
    Componente do processo de RI (5/6): a seqüência dos itens apresentados como um resultado da estratégia de busca
    Componente do processo de RI (6/6): a medida em que os registros recuperados satisfazem a necessidade de informação do usuário (avaliação da relevância)
  • 3. Componente do processo de RI (4/6)
    A verbalização da necessidade de informação em uma seqüência de expressões de busca
  • 4. Aspectos principais dos pedidos dos usuários
    Aspecto semântico: é o tópico de um pedido, apresenta o assunto que é a preocupação do usuário.
    Exemplo: “A influência dos hábitos alimentares nos fatores de risco cardiovasculares em idosos.”.
    Aspecto pragmático: diz respeito ao propósito do pedido do usuário, a finalidade para a qual a informação recuperada será utilizada.
    Exemplo: imagina-se que o usuário poderá precisar de uma busca exaustiva por todos os documentos relevantes; ou somente de uns poucos trabalhos altamente relevantes; ou ainda deseja recuperar apenas os documentos publicados recentemente.
    A entrevista de referência precisará esclarecer os dois aspectos.
    FIDEL, R. Searchers selection of search keys. 1, The selection routine. Journal of the American Society for Information Science, v. 42, n. 7, p. 490-500, Aug. 1991. Link
  • 5. Quando o pedido torna-se objeto de estratégia e tática de busca: definições
    Estratégia de busca (como o ato da busca): um plano para a busca como um todo
    Estratégia de busca (como um área de estudo): o estudo da teoria, dos princípios e da prática de formular e usar táticas de busca
    Tática da busca: o movimento feito para melhorar uma busca
  • 6. Tipos de busca em um SRI
    Busca por um item conhecido
    Busca por uma informação específica
    Busca por uma informação geral
    Busca exploratória pela base de dados
    MEADOW, Charles T., Boyce, Bert , Kraft, Donald . Text Information Retrieval Systems. 2nd ed. San Diego: Academic Press, 2000.
  • 7. Informações Essenciais para definição dos Elementos da Busca
    Informações sobre:
    a base de dados
    os procedimentos de busca
    o conhecimento anterior do pesquisador
  • 8. A etapas de elaboração de expressões de busca
    Análise dos conceitos
    Eleição dos termos de busca
    Seleção dos recursos de busca
  • 9. Análise dos conceitos
    Definir os conceitos mais relevantes para o tema a ser pesquisado.
    Pergunta para auxiliar o usuário:
    Qual seria o título do artigo perfeito?
    SALVADOR OLIVÁN, J. A.; ANGÓS ULLATE, J. M. Técnicas de recuperación de información: aplicación con Dialog. 1ª. ed. Gijón: Trea, 2000. (Biblioteconomía y administración cultural, 37).
  • 10. Exemplo de busca para a análise dos conceitos
    Busca por informações sobre: “A influência dos hábitos alimentares nos fatores de risco cardiovasculares em idosos.”
    SALVADOR OLIVÁN, J. A.; ANGÓS ULLATE, J. M. Técnicas de recuperación de información: aplicación con Dialog. 1ª. ed. Gijón: Trea, 2000. (Biblioteconomía y administración cultural, 37).
  • 11. Uma solução caseira para identificar os conceitos
    Física da matéria condensada experimental. Quais são:
    os materiais estudados?
    as propriedades e os fenômenos observados?
    as técnicas de análise empregadas?
    LANCASTER, F. W. Indexação e resumos: teoria e prática. 2.ed. Brasília: Briquet de Lemos, 2004. O Apêndice 2 apresenta algo semelhante.
  • 12. Exemplo de um registro do INSPEC
    Materiais
    Propriedades e fenômenos
    Técnicas de análise
  • 13. Eleição dos termos de busca
    Objetivo: ampliar os conceitos com um maior número de termos possíveis, visando a recuperação de tudo que há sobre o tema.
    Fontes:
    o próprio usuário, através de seu conhecimento ou de artigos e livros que ele tenha como referência
    os tesauros e vocabulários controlados das bases de dados
    os dicionários técnicos, de sinônimos, manuais, etc.
    SALVADOR OLIVÁN, J. A.; ANGÓS ULLATE, J. M. Técnicas de recuperación de información: aplicación con Dialog. 1ª. ed. Gijón: Trea, 2000. (Biblioteconomía y administración cultural, 37).
  • 14. Exemplo de busca para a eleição dos termos
    Termos:
    SALVADOR OLIVÁN, J. A.; ANGÓS ULLATE, J. M. Técnicas de recuperación de información: aplicación con Dialog. 1ª. ed. Gijón: Trea, 2000. (Biblioteconomía y administración cultural, 37).
  • 15. A rotina de seleção dos termos
    FIDEL, R. Searchers selection of search keys. 1, The selection routine. Journal of the American Society for Information Science, v. 42, n. 7, p. 490-500, Aug. 1991. Link
  • 16. Seleção dos recursos de busca: Definição
    Recursos desenvolvidos com a finalidade de atender a um ambiente baseado em texto, onde o usuário não sabe de antemão quais são os documentos cobertos pela base de dados ou desconhece os termos a partir dos quais os registros podem ser recuperados.
    ROWLEY, J. A biblioteca eletrônica. Brasília: Briquet de Lemos, 2002.
  • 17. Recursos de busca usuais (1)
    ROWLEY, J. A biblioteca eletrônica. Brasília: Briquet de Lemos, 2002.
  • 18. Recursos de busca usuais (2)
    ROWLEY, J. A biblioteca eletrônica. Brasília: Briquet de Lemos, 2002.
  • 19. Componente do processo de RI (5/6)
    A seqüência dos itens apresentados como um resultado da estratégia de busca
  • 20. A seqüência dos itens apresentados como um resultado da estratégia de busca
    !
    104 mil
  • 21. Componente do processo de RI (6/6)
    A medida em que os registros recuperados satisfazem a necessidade de informação do usuário
  • 22. Uso da informação
    O indivíduo seleciona mensagens entre um grupo de mensagens que recebe ou acompanha. Ele faz a escolha quando percebe uma relação significativa entre o conteúdo da mensagem e o problema que tem em mãos.
    Determinada pelo conhecimento e rede de referências do indivíduo, assim como conteúdo e forma da mensagem
    CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2
  • 23. Relevância da informação
    A principal tentativa de medir o produto da RI é o conceito de relevância.
    A relevância pode ser definida tendo como parâmetros duas perspectivas distintas:
    Do sistema: relacionamento entre os registros recuperados e o pedido
    Do usuário: valor ou utilidade do registro para o usuário
    MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
  • 24. Relacionamento X Valor
    Exemplo:
    Como resultado de uma busca é recuperado um documento já conhecido pelo usuário e que está altamente relacionado com o assunto que motivou a pesquisa. Em termos de relacionamento, o documento satisfaz completamente o critério de relevância. Em termos de utilidade para o usuário, o valor é nulo, considerando que o documento não é capaz de fornecer nova informação.
    MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
  • 25. A relevância sob duas perspectivas:o sistema (1)
    A informação pode ser representada objetivamente, possibilitando a comparação entre a representação e a questão proposta
    Computa-se o número de correspondências entre os termos da pesquisa do usuário e os termos do documento, de modo a medir o grau de proximidade com o tema de pesquisa.
    CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2
  • 26. A relevância sob duas perspectivas:o sistema (2)
    LANCASTER, F. Wilfrid. Indexação e resumos : teoria e prática. Brasília: Briquet de Lemos, 1993.
  • 27. A relevância sob duas perspectivas:o usuário
    A relevância é produto de uma relação construída pelo usuário entre a informação e a pesquisa. Deste modo, é:
    Subjetiva, dependente do julgamento humano;
    Cognitiva, dependente do conhecimento e da percepção do indivíduo;
    Situacional, relacionada com os problemas particulares de informação do usuário;
    Multidimensional, influenciada por variados fatores;
    Dinâmica, sujeita a constantes mudanças ao longo do tempo;
    Mensurável, pode ser observada num dado momento.
    CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2
  • 28. A medida da relevância (1)
    A relevância, seja qual for sua definição, é considerada a o principal parâmetro para avaliação da RI.
    Basicamente, três medidas compostas são utilizadas para analisá-la:
    Precisão
    Revocação
    Eficácia (menos utilizada)
    MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
  • 29. A medida da relevância (2)
    MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
  • 30. Precisão
    Capacidade de evitar documentos irrelevantes
    Onde:
    P= precisão
    a=documentos relevante recuperados
    b=documentos não relevantes recuperados
    LANCASTER, F. Wilfrid. Indexação e resumos : teoria e prática. Brasília: Briquet de Lemos, 1993.
    MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
  • 31. Revocação
    Capacidade de recuperar documentos relevantes
    Onde:
    R= revocação
    a=documentos relevante recuperados
    c=documentos relevantes não recuperados
    LANCASTER, F. Wilfrid. Indexação e resumos : teoria e prática. Brasília: Briquet de Lemos, 1993.
    MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
  • 32. Eficácia
    Capacidade de recuperar itens relevantes e ignorar os irrelevantes
    Onde:
    E= eficácia
    P=Precisão
    R=Revocação
    Uma das possíveis fórmulas para o cálculo
    MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
  • 33. Classes de uso da informação (Taylor)
    CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2
  • 34. O cuidado com a “supersimplificação”
    Risco, ver SEMPRE o usuário como alguém que quer:
    extrair informações específicas num curto espaço de tempo, OU, ao contrário
    investir esforço para buscar e explorar informação
    A verdade é que as pessoas oscilam continuamente entre extrair e explorar
    - O uso da informação é um processo confuso, desordenado, sujeitos aos caprichos humanos, como qualquer outra atividade -
    CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2
  • 35. Fim