Representação de Imagens e Fotografias

  • 1,491 views
Uploaded on

 

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
1,491
On Slideshare
0
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
0
Comments
0
Likes
3

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Representação e Recuperação de Imagens Fotografias Universidade Federal do Rio de Janeiro Curso de Biblioteconomia e Gestão de Unidades de Informação Disciplina Análise da Informação Beatriz Louven Clarissa Machado Hugo Bauer Igor Rodrigues Jéssica Galvão Leonardo Kalil Praia Vermelha 2009
  • 2. Introdução
    • A fotografia surgiu no século XIX como conseqüência ao fascínio que as imagens produzidas pela câmera escura provocavam nas pessoas. A câmera escura, é um compartimento com um orifício por onde os raios luminosos entravam no interior da caixa sobre uma superfície branca e oposta a esse orifício. A partir daí os mais diversos “aparelhos fotográficos” começaram a surgir, grandes e pequenos, dos mais simples aos mais complexos, ate chegar ao que conhecemos hoje como câmeras digitais, gerando as fotos digitais.
    • No início a fotografia era, quase que exclusivamente, usada para retratos, mas aos poucos junto com sua popularização, compactação e modernidade ela ganhou espaço e passava a retratar não só o circulo familiar, mas também passaram a retratar a sociedade, suas realizações, ações e paisagens. Passando a ter um caráter não só de registro, mas também documental e informativo, onde captava os momentos e acontecimentos da sociedade.
    • O desafio em indexar imagens fica por conta desse caráter que a fotografia atingiu ao longo dos anos. Ao analisar uma imagem para indexá-la é preciso perceber que uma mesma imagem pode estar em variados contextos. Diferente do que acontece com as palavras que determinam o conjunto de referencias que podem ser seguidas, sinônimos e expressões relacionadas, na fotografia é ao contrario, as várias referências e elementos dessa imagem é que determinam seu sentido.
    •  
  • 3. Digital x Físico Estudo de caso
    • Em 2001, Bill Gates comprou a mais prestigiada coleção de fotografias históricas dos Estados Unidos, o Bettmann Archive
    • Foi necessário 19 caminhões para levar as 11 milhões de fotos e negativos de valor inestimável para uma caverna de calcário, na Pennsylvania, a quase 70m da superfície.
    • O local é administrado pela Iron Mountain, com as mais modernas formas de conservação possíveis, como:
    • Salas com a temperatura sendo reduzidas lentamente a -20°C;
    • Desumidificadores do tamanho de armários;
    • Guardas no interior e exterior da caverna;
    • entre outros...
  • 4. The Bettmann Archive
    • Fotos do interior e exterior da caverna
  • 5. Análise de Caso
    • A forma de organização é dada em um catálogo de fichas que contêm informações sobre cada um dos 11 milhões de objetos, com entradas em ordem alfabética do assunto para facilitar a pesquisa. Se quiser ver toda as fotos de soldados, basta buscar pelo tema. A ficha cadastral da um código que aponta para o local físico.
    • Algumas das coleções mais antigas chegaram com catálogos registrados a mão, com uma linha por foto, organizadas por ordem de chegada da foto. Para encontrar uma foto em uma coletânea, é preciso percorrer linha por linha das paginas amareladas dos registros na esperança de encontrar descrição compatível com sua busca. São bem menos eficientes que o catálogo de fichas.
    • Essas organização funciona, mas há suas limitações. Nem todas as informações sobre os objetos foram registradas.
  • 6. Catálogo do Bettmann Archive
  • 7. Análise de Caso
    • Exemplo:
    • Uma foto de um soldado de Massachusetts comendo em campo em plena Guerra Civil:
    • Pode ser incluída na categoria: “Guerra Civil”, “Soldado”, “Armas”, “Uniformes”, “Jantar”, e “ao ar livre”
    • Teriam que enviar alguém para percorrer pilhas de fichas para fazerem a pesquisa de fotos propriamente ditas. Mas se todos os dados estivessem registrados, inchariam o catálogo de tal forma que se tornaria inutilizável. Uma pesquisa dessa seriam necessários 11 MESES de busca INTERRUPTA.
  • 8. Fotografia do Bettmann Archive
    • Home of the Champions
  • 9. Análise de Caso
    • A controladora do Bettmann Archive, a Corbis, detêm 4 milhões de imagens digitais, uma coletânea menor que a do Bettmann, mas sujeita aos mesmos problemas. Como as imagens da Corbis são totalmente eletrônicas, ela organiza as fotos sem se importar com as restrições que limitam os curadores do Bettmann.
    • Na Corbis é possível encontrar a famigerada foto do soldado ao digitar “soldado”, “guerra civil”, “refeição” no campo de pesquisa, ou ao percorrer a lista de categorias e subcategorias. Você pode encontrar o que procura em segundos.
  • 10. Análise de Caso
    • Quando uma nova imagem chega a coleção, um dos catalogadores usa um software especial para percorrer os 61 mil de “termos preferidos” na lista de tópicos que melhor descrevem o conteúdo da imagem, geralmente anexando de 10 a 30 termos a cada um deles. O sistema incorpora cerca de 33 mil sinônimos (pesquisa com a palavra chave “praia” apresenta imagens rotuladas como “litoral”) e mais de 500 mil permutas de nomes de pessoas, filmes, ilustrações, lugares, etc.
  • 11. Site da Corbis
    • http://pro.corbis.com/
  • 12. Busca no site
    • Palavras chaves: “soldier”, “civil war”, “food”
  • 13. Fotografia obtida com sucesso
    • Tempo de busca: 10 segundos
  • 14. Conclusão
    • Bettmann Archive (Iron Mountain)
    • Localização lenta, manual e cara;
    • Manutenção cara, e difícil preservação do acervo;
    • Arquivos sobre luz brilhante.
    • Corbis
    • Diminui sensivelmente a carga do trabalho de pesquisa de fotos para usuários;
    • Imagens não se deterioram, manutenção física intensamente menor;
    • Catalogadores da Corbis trabalham da semi-escuridão (luz própria dos monitores).
  • 15. Representação de Imagens Indexação
    • Desenvolver um método de indexação para imagens requer a identificação das características que podem ser usadas para descrever uma imagem e que satisfaçam as necessidades dos usuários. Para a representação das imagens, a literatura da área apresenta atualmente duas técnicas de indexação: a indexação baseada nos conceitos da imagem, e a indexação baseada no conteúdo da imagem.
    • Linguagem Natural
    • Linguagem Controlada- Tesauros e sistemas classificatórios
    • Consistência do acervo
  • 16. Indexação por conceito
    • Níveis para Análise da Imagem
    • Nível pré-iconográfico: descrição dos objetos e das ações que estão representados na imagem, baseada em conhecimento que permite reconhecer esses objetos e ações.
    • Nível iconográfico: envolve uma interpretação dos objetos e ações presentes
    • na imagem, e é baseada no conhecimento adquirido da familiaridade com os hábitos e tradições culturais.
    • Nível iconológico: implica o esclarecimento do significado intrínseco do
    • conteúdo da imagem, ou os seus valores simbólicos.
    • Obs: Semântico
  • 17. Indexação por conceito
    • Distinção entre DE QUE é uma imagem e DO QUE ela trata. (LANCASTER, 2004)
    • Método de indexação de imagens :
    • De que
    • Refere-se a coisas concretas. Exemplo: a imagem mostra um
    • homem e uma mulher.
    • Do que
    • Refere-se a abstrações.
    • Exemplo: A imagem mostra romance, felicidade, amor e união.
    • Quem, onde, como, quando e o que.
    • A leitura do que se vê
    • A leitura do que se interpreta
    • Influência do referencial pessoal do documentalista
  • 18. Indexação por conteúdo
    • Nível
    • 1: que compreende a indexação e recuperação pelos atributos primários
    • como a cor, forma, textura e posição espacial dos elementos da imagem.
    • Nível
    • 2: compreendendo a indexação e recuperação pelos atributos derivados
    • (ou lógicos) da imagem, como a identidade dos objetos mostrados.
    • Nível
    • 3: que compreende a indexação e recuperação pelos atributos abstratos,
    • como os significados das cenas representadas
    • Obs: Características
  • 19. Indexação por conteúdo
    • Aplicada somente em imagens digitalizadas
    • Utilizada apenas em áreas altamente especializadas
    • Atributos de recuperação de imagens por conteúdo
    • Cor
    • Estrutura
    • Forma
    • Texto
  • 20. QBIC- Query by image Content
    • Sistema desenvolvido pela IBM que proporciona a recuperação de imagens por qualquer combinação de cor, textura ou forma, como também a opção de indexação e recuperação por palavras-chave .
    • O sistema extrai e armazena os atributos de cada imagem acrescentada
    • ao banco de dados; e a consulta pode ser formulada pela seleção, em uma
    • paleta, dos atributos desejados ou especificando um exemplo de imagem, ou
    • fornecendo um esboço da forma.
    • Outros sistemas comerciais com funcionalidades similares são o Virage e o Excalibur. Suas aplicações mais conhecidas são a utilização como buscadores, respectivamente no AltaVista’s Photo Finder e no Yahoo! Image Surfer, possibilitando a recuperação por conteúdo de imagens na WorldWideWeb.
  • 21. Banco de Imagens da UFRJ
    • O Banco de Imagens da Coordenadoria de Comunicação da Universidade Federal do Rio de Janeiro (CoodCOM/UFRJ) reúne uma amostra do acervo de imagens da instituição.
    • São mais de 50 mil fotos, em papel e arquivos digitais.
    • Todas as imagens exibidas no Banco Imagem UFRJ estão no formato JPEG e possuem uma marca d'água como garantia de direito patrimonial.
    • O banco de Dados não possui uma busca avançada de imagens. Busca simples por palavras-chave.
    • A site não é atualizado com frequencia.
    • Disponível em: http://www.imagem.ufrj.br/
  • 22.  
  • 23.  
  • 24.  
  • 25.  
  • 26. Considerações Finais
    • Para que a representação documentária de imagens seja feita da melhor maneira possível, ou seja de modo que seja de fácil recuperação, é importante reconhecer que indexar imagens é diferente de indexar documentos textuais.
    • Além da preocupação com a necessidade dos usuários e as prováveis estratégias de busca adotada por eles, indexar imagens também trás a preocupação em entender contextos, estar atento aos detalhes e as informação subjetivas e implícitas em cada imagem.
    • A tendência é que essas imagens sejam indexadas pelo uso combinado de conceito e conteúdo, porque dessa forma a indexação seria mais “completa” já que, são atribuídos termos ao mesmo tempo em que também são atribuídas características da imagem como cor e forma.
    • A maior preocupação em relação a recuperação dessas imagens vai além da rapidez e eficiência, entra também na aera de informática, onde é preciso desenvolver um sistema que vá alem da análise das imagens pelas características que ela possui, elevando sua análise ao nível semântico onde detecte objetos, pessoas, sentimentos, ações, emoções, etc. Também é necessária a padronização para essa indexação e gerenciamento de imagens, pois só assim poderemos ter grandes bases de recuperação de imagens integradas, facilitando as buscas e disseminando a informação imagética.
  • 27. Referências
    • WEINBERG, David. A nova desordem digital . Rio de Janeiro: Elsevier, 2007.
    • http://infocultura.info/rabci/sites/default/files/Estorniolo-Imagem.pdf Acesso em: 04 de maio de 2009.
    • http://techcs.blogspot.com/2007/06/recuperao-de-imagens-baseada-em-contedo.html Acesso em: 03 de maio de 2009.
    • http://www.inf.ufrgs.br/~clesio/cmp151/cmp15120021/artigo_luisrenato.pdf Acesso em: 03 de maio de 2009.
    • http://www.imagem.ufrj.br/index.php Acesso em: 03 de maio de 2009.
    • http://pro.corbis.com Acesso em: 30 de abril de 2009.