Your SlideShare is downloading. ×
Metadados
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Saving this for later?

Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime - even offline.

Text the download link to your phone

Standard text messaging rates apply

Metadados

2,207
views

Published on

Slides utilizados para formação na área de Metadados

Slides utilizados para formação na área de Metadados

Published in: Education

1 Comment
5 Likes
Statistics
Notes
No Downloads
Views
Total Views
2,207
On Slideshare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
1
Comments
1
Likes
5
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. BIBLIOTECAS DIGITAIS METADADOS FORMAÇÃO BAD 2008 – Paulo Leitão
  • 2. 1. Metadados: conceitos básicos
    • Dados sobre dados / informação sobre informação
    • Informação legível por máquina
    • Objecto: um recurso identificado por um URI (Uniform Resource Identifier)
    • Afirmações sobre um recurso: “declarações” e ligações
  • 3. 1. Metadados: conceitos básicos
    • Metadados como linguagens:
      • Vocabulário
      • Semântica
      • Sintaxe
  • 4. 1. Metadados: conceitos básicos
    • Diversos níveis de complexidade descritiva
    • Âmbito diversificado: linguagens generalistas / linguagens específicas
  • 5. 2. Metadados: objectivos
    • Descrição e Recuperação da informação  Metadados descritivos
    • Acesso e preservação  Metadados técnicos
    • Administração do recurso  Metadados administrativos
  • 6. 3. Classificação de metadados
    • Método de criação : metadados gerados automaticamente VS metadados gerados manualmente
    • Criadores : especializados VS não especializados
  • 7. 3. Classificação de metadados
    • Controlo semântico : metadados controlados VS metadados não controlados
    • Forma de armazenamento : metadados embebidos no próprio documento VS metadados separados do documento
  • 8. 3. Classificação de metadados
    • Nível de estruturação : metadados não estruturados VS metadados altamente estruturados
    • Nível de descrição : metadados para a descrição de conjuntos VS metadados para a descrição de recursos individuais
  • 9. 3. Classificação de metadados
    • Fonte e momento de criação : metadados internos VS metadados externos
  • 10. 4. Metadados VS Descrição Bibliográfica
    • Objectos nascidos digitais
    • Objectos do universo analógico
    • Minimalismo VS Maximalismo
  • 11. 4. Metadados VS Descrição Bibliográfica
    • 3 Abordagens :
      • “ On their one – uniquely”
      • Instead of/in the place of a “traditional” bibliographic record
      • In addition to an “traditional” bibliographic record (complementary)
      • (segundo Guidance on…)
  • 12. 4. Metadados VS Descrição Bibliográfica
    • Contexto: “ O contexto de utilização é tudo, e só quando falamos de contextos de utilização é que podemos falar de metadados de forma informada e com sentido.” Lynch
  • 13. 5. Linguagens de metadados
      • 5.1. Linguagens generalistas: Dublin Core
      • Linguagem mais utilizada
      • ISO 15836:2003
      • Conceitos básicos: Recurso, Propriedade, Atributo  Elemento
  • 14. 5. Linguagens de metadados
      • Elementos e Qualificadores
      • Esquemas de codificação próprios
      • Todos os elementos são repetíveis
      • (- www.dublincore.org
      • - DCMI metadata terms - http://www.dublincore.org/documents/dcmi-terms/ )
  • 15. 5. Linguagens de metadados
      • Não existem elementos obrigatórios
      • Regra de 1:1
      • (- www.dublincore.org
      • - DCMI metadata terms - http://www.dublincore.org/documents/dcmi-terms/ )
  • 16. 5. Linguagens de metadados (DC) Elemento Qualificador Esquema de codificação Contribuinte Cobertura
    • Espaço
    • Tempo
    • DCMI Box
    • ISO3166
    • DCMI point
    • DCMI period
    • TGN
    Criador Data
    • Disponibilidade
    • Data de criação
    • Data de aceitação
    • Data do copyright
    • Data de submissão do recurso
    • Data de publicação
    • Data de alteração
    • Data de validade
    - DCMI period
  • 17. 5. Linguagens de metadados (DC) Elemento Qualificador Esquema de codificação Descrição
    • Resumo
    • Tabela de conteúdos
    Formato
    • Extensão
    • Media (físico)
    - IMT (Internet media type) Identificador - Citação bibliográfica - URI Língua
    • ISO639-2
    • RFC1766
    • RFC 3066
    Editor
  • 18. 5. Linguagens de metadados (DC) Elemento Qualificador Esquema de codificação Relação
    • Está conforme com
    • Tem formato
    • Tem parte
    • Tem versão
    • É formato de
    • É parte de
    • É referenciado por…
    • É substituído por…
    • É requerido por…
    • É versão de…
    • Referências
    • Substitui
    • Requer
    - URI
  • 19. 5. Linguagens de metadados (DC) Elemento Qualificador Esquema de codificação Direitos
    • Direitos de Acesso
    • Licenciamento
    Fonte - URI Título - Título alternativo Tipo de recurso - DCMI Type vocabulary Assunto
    • DDC
    • LCC
    • LCSH
    • MESH
    • NLM
    • CDU
  • 20. 5. Linguagens de metadados (DC) 5.2. Exemplos de descrições em DC (www.humbul.ac.uk) Main Title : Biblioteca nacional digital  Web Address (URL): http://bnd.bn.pt/   Alternative Title : Digital national library  
  • 21. 5. Linguagens de metadados (DC) Description : This is the website of the digital National Library of Portugal, which makes available online a good selection of classic texts in Portuguese. Original works, created by theBiblioteca Nacional, and converted into digital form are categorised as 'authors and personalities' and 'other themes‘. The former includes vast documentation related to, amongst others,Almeida Garrett, Eça de Queirós, Vitorino Nemésio, and Pedro Nunes. This documentation comprises biographies, electronic versions of works, chronologies, and other curiosities. 'Other themes' features individual web pages devoted to, for example, journeys of Portuguese explorers, the new Lusitania (a cartography of Brazil), and 'the Science of Design' which presents the Library's collection of codices…
  • 22. 5. Linguagens de metadados (DC) Language : Portuguese Intended Audience : Further Education Undergraduate Postgraduate/Faculty Responsibility : Author : Biblioteca Nacional Digital Publisher : Biblioteca Nacional Digital Copyright : http://bnd.bn.pt/direito-autor.html
  • 23. 5. Linguagens de metadados (DC) Type of Resource : Collection Primary source Secondary source Research-related Text Document Image Is Part of : Biblioteca Nacional. http://www.biblioteca-nacional.pt/ Humbul Subjects : Portuguese Studies       
  • 24. 5. Linguagens de metadados (DC)   Catalogued By : Dr Shoshannah Holdom on 2004-05-26 Record Last Modified :2004-05-26 Cite this record : http://www.humbul.ac.uk/output/full2.php?id=12207
  • 25. 5. Linguagens de metadados
    • 5.3. Exercícios práticos:
    • Descreva os seguintes documentos utilizando Dublin Core:
    • http://www.ifla.org/documents/libraries/cataloging/tilb1.htm
    • http://www.dlib.org/dlib/may07/weig/05weig.html
    • http://www.loc.gov/standards/sru/
    • http://www.artafrica.info/
  • 26. 5. Linguagens de metadados 5.4. Uma proposta de nível mínimo: Assunto Data Condições de utilização Editor Nome atribuído ao recurso Língua Identificador Tipo Autor/Criador Versão IFLA – Guidance on the structure, content, and application of metadata records for digital resources and collections.
  • 27. 5. Linguagens de metadados 5.5. Linguagens específicas 5.5.1. LOM: Standard for Information technology – Education and Training Systems – Learning objects and metadata This standard will specify the syntax and semantics of Learning Object Metadata, defined as the attributes required to fully/adequately describe a Learning Object. Learning Objects are defined here as any entity, digital or non-digital, which can be used, re-used or referenced during technology supported learning.
  • 28. 5. Linguagens de metadados Examples of technology supported learning include computer-based training systems , interactive learning environments, intelligent computer-aided instruction systems, distance learning systems , and collaborative learning environments. Examples of Learning Objects include multimedia content ,instructional content, learning objectives, instructional software and software tools, and persons, organizations, or events referenced during technology supported learning.
  • 29. 5. Linguagens de metadados The Learning Object Metadata standards will focus on the minimal set of attributes needed to allow these Learning Objects to be managed, located, and evaluated. The standards will accommodate the ability for locally extending the basic fields and entity types, and the fields can have a status of obligatory (must be present) or optional (maybe absent).
  • 30. 5. Linguagens de metadados Relevant attributes of Learning Objects to be described include type of object , author , owner , terms of distribution , and format . Where applicable, Learning Object Metadata may also include pedagogical attributes such as: teaching or interaction style , grade level , mastery level , and prerequisites . It is possible for any given Learning Object to have more than one set of Learning Object Metadata. (IEEE - http://ltsc.ieee.org/wg12/)
  • 31. 5. Linguagens de metadados 5.5.2. Gateway to Educational Materials (GEM) Application profiles for GEM 2.0 including GEM (in general), Gateway Lite and Gateway Full - http://64.119.44.148/about/documentation/ApplicationProfiles-9-8-04/
  • 32. 5. Linguagens de metadados 5.5.3. ONIX Onix for Books: product information message: overview and data elements: release 2.1., version 0.3, January 2006 http://www.editeur.org/onixfiles2.1/prodinf%202.1rev3.html 5.5.4. Content Standard for digital geospatial metadata (Federal Geographic Data Committee) - http://www.fgdc.gov/metadata/csdgm/
  • 33. 5. Linguagens de metadados 5.5.5. VRA core categories , (Visual Resources Association Core Categories) The VRA Core Categories, Version 3.0 (actualmente versão 4.0) consist of a single element set that can be applied as many times as necessary to create records to describe works of visual culture as well as the images that document them. http://www.vraweb.org/projects/vracore4/index.html Exemplos: http://gort.ucsd.edu/escowles/vracore4/
  • 34. 5. Linguagens de metadados 5.6. Metadados Técnicos METS (Metadata Encoding and Transmission Standard) – Library of Congress “ Sem metadados estruturais, os ficheiros com imagens ou texto que compõem a obra digital serão de pouca utilidade, e sem metadados técnicos sobre o processo de digitalização, os investigadores poderão ter dúvidas sobre a exactidão da reflexão do original que a versão digital oferece.
  • 35. 5. Linguagens de metadados Por questões de gestão interna, a biblioteca deve ter acesso a metadados técnicos apropriados para lhe permitir refrescar e migrar os dados, garantindo a durabilidade de recursos valiosos.” METS: introdução e tutorial (http://www.loc.gov/standards/mets/METSOverview.v2_port.html)
  • 36. 5. Linguagens de metadados
    • 5.6.1. Estrutura de METS
    • Cabeçalho METS
    • Metadados descritivos
    • Metadados administrativos
    • - Mapa estrutural
    • - Ligações estruturais
    • - Comportamento
  • 37. 5. Linguagens de metadados - Cabeçalho METS metsHdr CREATEDATE =&quot;2003-07-04T15:00:00&quot; RECORDSTATUS =&quot;Complete&quot;> <agent ROLE=&quot;CREATOR&quot; TYPE=&quot;INDIVIDUAL&quot;> <name>Jerome McDonough</name> </agent> <agent ROLE=&quot;ARCHIVIST&quot; TYPE=&quot;INDIVIDUAL&quot;> <name>Ann Butler</name> </agent> </metsHdr>
  • 38. 5. Linguagens de metadados b) Metadados Descritivos <dmdSec ID=&quot;dmd001&quot;> <mdRef LOCTYPE=&quot;URN&quot; MIMETYPE=&quot;application/xml&quot; MDTYPE=&quot;EAD&quot; LABEL=&quot;Berol Collection Finding Aid&quot;>urn:x-nyu:fales1735</mdRef> </dmdSec>
  • 39. 5. Linguagens de metadados c) Metadados administrativos / técnicos <techMD ID=&quot;AMD001&quot;> <mdWrap MIMETYPE=&quot;text/xml&quot; MDTYPE=&quot;NISOIMG&quot; LABEL=&quot;NISO Img. Data&quot;> <xmlData> <niso: MIMEtype >image/tiff</niso:MIMEtype> <niso:Compression>LZW</niso:Compression> <niso: PhotometricInterpretation >8</niso:PhotometricInterpretation> <niso:Orientation>1</niso:Orientation> <niso:ScanningAgency>NYU Press</niso:ScanningAgency> </xmlData> </mdWrap> </techMD>
  • 40. 5. Linguagens de metadados d) Secção de ficheiros </fileGrp> <fileGrp ID=&quot;VERS2&quot;> <file ID=&quot;FILE002&quot; MIMETYPE=&quot;audio/wav&quot; SIZE=&quot;64232836&quot; CREATED=&quot;2001-05-17&quot; GROUPID=&quot;AUDIO1&quot;> <FLocat LOCTYPE=&quot;URL&quot;>http://dlib.nyu.edu/tamwag/beame.wav</FLocat> </file>
  • 41. 5. Linguagens de metadados e) Mapa Estrutural <structMap TYPE=&quot;logical&quot;> <div ID=&quot;div1&quot; LABEL=&quot;Oral History: Mayor Abraham Beame&quot; TYPE=&quot;história falada&quot;> <div ID=&quot;div1.1&quot; LABEL=&quot;Interviewer Introduction&quot; ORDER=&quot;1&quot;> <fptr FILEID=&quot;FILE001&quot;> <area FILEID=&quot;FILE001&quot; BEGIN=&quot;INTVWBG&quot; END=&quot;INTVWND&quot; BETYPE=&quot;IDREF&quot; />
  • 42. 5. Linguagens de metadados f) Ligações estruturais <div ID=&quot;P1&quot; TYPE=&quot;page&quot; LABEL=&quot;Page 1&quot;> <fptr FILEID=&quot;HTMLF1&quot;/> <div ID=&quot;IMG1&quot; TYPE=&quot;image&quot; LABEL=&quot;Imagem com hiperligação para a página 2&quot;> <fptr FILEID=&quot;JPGF1&quot;/> </div> <div ID=&quot;P2&quot; TYPE=&quot;page&quot; LABEL=&quot;Page 2&quot;> <fptr FILEID=&quot;HTMLF2&quot;/> </div>
  • 43. 5. Linguagens de metadados g) Comportamento <METS:behavior ID=&quot;DISS1.1&quot; STRUCTID=&quot;S1.1&quot; BTYPE=&quot;uva-bdef:stdImage&quot; CREATED=&quot;2002-05-25T08:32:00&quot; LABEL=&quot;UVA Std Image Disseminator&quot; GROUPID=&quot;DISS1&quot; ADMID=&quot;AUDREC1&quot;> <METS:interfaceDef LABEL=&quot;UVA Standard Image Behavior Definition&quot; LOCTYPE=&quot;URN&quot; xlink:href=&quot;uva-bdef:stdImage&quot;/> <METS:mechanism LABEL=&quot;A NEW AND IMPROVED Image Mechanism&quot; LOCTYPE=&quot;URN&quot; xlink:href=&quot;uva-bmech:BETTER-imageMech&quot;/> </METS:behavior>
  • 44. 5.2. Metadados técnicos a partir do formato TIFF – tagged image file format Etiqueta Designação Conteúdo 256 ImageWidth (N.º de pixels na horizontal) 257 ImageLenght (N.º de pixels na vertical) 258 BitsPerSample 1 (p&b) 8 (escala cinza) 16 (negativos) 24 (cor) 259 Compression 1 (sem compressão) 262 PhotometricInterpretation 0 (p/p&b, whiteIsZero, default) 1 (black is zero) 2 (cor, default para RGB) 266 FillOrder 1 (default) 2 269 DocumentName Cota e código de barras, quando houver, separados por vírgula 270 ImageDescription [a definir para cada colecção] 271 Make (fabricante do equipamento de captura) 272 Model (modelo do equipamento de captura) 273 StripOffsets (o byte offset de cada strip) 277 SamplesPerPixel 1 (default para p&b e escala cinza) 3 (default para RGB) 278 RowsPerStrip (N.º de linhas por strip) 279 StripByteCount Não preenche, não há compressão 282 Xresolution (N.º de pixels/unidade de resolução na horizontal) 283 Yresolution (N.º de pixels/unidade de resolução na vertical) 296 ResolutionUnit 2 (polegadas) 305 Software (programa de captura usado) 306 DateTime (data e hora de captura, formato YYYY:MM:DD HH:MM:SS) 315 Artist [a definir para cada colecção] 316 HostComputer (computador e sistema operativo em que se digitaliza) 33432 Copyright FCG Biblioteca de Arte
  • 45. 5.2. Metadados técnicos a partir do formato TIFF – tagged image file format Visualização de etiquetas TIFF numa imagem digitalizada - exemplo
  • 46. 5. Linguagens de metadados 5.3. Perfis aplicacionais 5.3.1. Espaços normativos e perfis aplicacionais Conceito de Espaço Normativo 5.3.2. Perfis aplicacionais “ Application profiles consist of data elements drawn from one or more namespace schemas combined together by implementors and optimised for a particular local application”
  • 47. 5. Linguagens de metadados
    • Exemplos:
    • Library application profile (DC) - http://www.dublincore.org/documents/2002/09/24/library-application-profile/
    • Elementos retirados do “name space” DC:
    • Título - Data
    • Criador - Tipo
    • Contribuinte - Formato
    • Editor - Identificador
    • Assunto - Fonte
    • Descrição - Língua
    • Relação - Cobertura
    • Direitos - Audiência
  • 48. 5. Linguagens de metadados
    • Elementos retirados do “name space” MODS (Metadata Object Description Schema – Library of Congress):
    • Edição
    • Localização
  • 49. 5. Linguagens de metadados 5.4. Mapeamentos entre linguagens Exemplo 1: Acesso URN à PORBASE http://urn.porbase.org/acesso.urn Exemplo 2: Dublin Core to UNIMARC – www.ukoln.ac.uk/metadata/interoperability/dc_unimarc.htm
  • 50. 6. Formatos XML  RDF RDF= RESOURCE DESCRIPTION FRAMEWORK Especificação de XML para formatar metadados.
  • 51. RDF: uma sintaxe para metadados
    • Proporciona uma sintaxe para descrever recursos
    • Utiliza XML
    • Facilita pesquisa, indexação e troca de informação
    • Adaptável a várias semânticas, através da possibilidade de utilizar diversos “NAME SPACES”
    • Linguagem sem preocupação com a visualização da informação
  • 52. RDF: definição
    • Objecto da descrição: o recurso
    • RECURSO = qualquer objecto com um URI
    • O recurso tem determinadas características
    • PROPRIEDADE = qualquer atributo do recurso. Ex: “título”
    • A propriedade do recurso tem um valor
    • Ex: título – “International collaboration on internet subject gateways”
  • 53. RDF: exemplo
    • Considere-se:
    • Debra Hiom é a autora da página http://www.desire.org/results/discovery/ com o título Revised methods and tools for resource description and indexing
    • “ EM RDF”:
    • Recurso: http://www.desire.org/results/discovery/
    • Propriedade: Autor, Título
    • Valor: Debra Hiom, Revised methods and tools for resource description and indexing
  • 54. RDF: escrita
    • Inicia-se pelo elemento RAIZ = indicação da sintaxe em uso
    • < rdf:RDF
    • xmlns:rdf=“http://www.w3.org/19990222-rdf-syntax-ns#”>
    • </ rdf:RDF >
    • 1º elemento da descrição = identifica-se, através de URI, qual o recurso a descrever
    • < rdf:RDF
    • xmlns:rdf=“http://www.w3.org/19990222-rdf-syntax-ns#”>
    • <rdf:Description about=“http://www.desire.org/results/discovery/”>
    • </rdf:description>
    • </rdf:RDF>
  • 55. RDF e Dublin Core
    • <?xml version=&quot;1.0&quot;?>
    • <rdf:RDF xmlns:rdf=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot;
    • xmlns:dc =&quot;http://purl.org/dc/elements/1.1 /&quot;>
    • <rdf:Description about=&quot;http://www.desire.org/results/discovery/>
    • < dc:title >Revised methods and tools for resource description and indexing</dc:title>
    • < dc:creator >Debra Hiom</dc:creator>
    • </rdf:Description>
    • </rdf:RDF>
  • 56. RDF e conjuntos de afirmações ordenadas sobre um recurso
    • Contentores:
    • - BAG (saco)
    • . Propriedades do recurso sem qualquer critério de ordenação
    • - SEQUENCE (sequência)
    • . Propriedades do recurso às quais se quer atribuir uma ordenação sequencial
    • - ALTERNATIVE (alternativa)
    • . Propriedades alternativas do recurso
  • 57. RDF: Exemplo
    • Automated and manual approaches to the provision of thesauri and subject vocabularies / Rosemary Russel, Michael Day
    • http://www.ukoln.ac.uk/metadata/hrt/interfaces
    • <rdf:RDF
    • xmlns:rdf=“http://www.w3.org/19990222-rdf-syntax-ns”
    • xmlns:dc= http://dublincore.org ”>
    • <rdf:Description about=“ http://www.ukoln.ac.uk/metadata/hrt/interfaces ”>
    • <dc:TITLE> Automated and manual approaches to the provision of thesauri and subject vocabularies
    • </dc:TITLE>
  • 58. RDF: Exemplo
    • <dc:CREATOR>
    • <rdf:SEQUENCE>
    • <rdf:li>Rosemary Russel</rdf:li>
    • <rdf:li>Michael Day</rdf:li>
    • </rdf:SEQUENCE>
    • </dc:CREATOR>
    • <dc:SUBJECT>
    • <rdf:BAG> <rdf:li>Indexação</rdf:li>
    • <rdf:li>Tesauros</rdf:li>
    • <rdf:li>Interface </rdf:li>
    • <rdf:li>Software</rdf:li>
  • 59. RDF: Exemplo
    • <rdf:li>Z39.50</rdf:li>
    • </rdf:bag>
    • </dc:SUBJECT>
    • <dc:DATE>2001</dc:DATE>
    • <dc:LANGUAGE>Inglês</dc:LANGUAGE>
    • </rdf:Description>
    • </rdf:RDF>
  • 60. RDF: Exemplo
    • Descreva, utilizando RDF, os recursos que já descreveu com Dublin Core.
    • Verifique a sua descrição em:
    • www.w3.org/RDF/Validator
  • 61. 7. Geração automática de metadados
    • “ Metadata extraction”
    • “ Metadata harvesting”
    • “ Fully-automatic metadata generation”
  • 62. 7. Geração automática de metadados
    • “ Semi-automatic metadata generation”
    • Editor de DC: DC-dot (http://www.ukoln.ac.uk/metadata/dcdot)
  • 63. 8. Seleccionar um esquema de metadados Discussão do texto: “Selecting a metadata schema or schemas”, in Guidance on……
  • 64. 8. Seleccionar um esquema de metadados Discussão do texto: “Selecting a metadata schema or schemas”, in Guidance on……
  • 65. 9. Partilhar e disponibilizar Metadados
    • O Problema
    • There is a growing need to make resources, not only descriptive metadata, harvestable in an interoperable manner. There are two major use cases that motivate this need:
    • I Preservation : The need to periodically transfer digital content from a data repository to one or more trusted digital repositories charged with storing and preserving safety copies of the content. The trusted digital repositories need a mechanism to automatically synchronize with the originating data repository.
  • 66. 9. Partilhar e disponibilizar Metadados
    • II Discovery : The need to use content itself in the creation of services . Examples include search engines that make full-text from multiple data repositories searchable, and citation indexing systems that extract references from the full-text content. Another scenario is the provision of thumbnail versions of high quality images from cultural heritage collections to external services that build browsing interfaces that include the thumbnail’s”
    • In “Resource harvesting with the OAI-PMH Framework” (disponível em: http://www.dlib.org/dlib/december04/vandesompel/12vandesompel.html )
    Paulo Leitão
  • 67. 9. Partilhar e disponibilizar Metadados
    • b) Uma solução possível: OAI-PMH (Open Archives Initiative and Protocol for Metadata Harvesting)
    • A mechanism for harvesting
    • Data providers make metadata available for harvesting
    • Service Providers harvest metadata
    • Metadata can be centrally collected or “aggregated”
    • That’s all it is: a way to bring metadata together in one place!
    • (Philip Hunter)
  • 68. 9. Partilhar e disponibilizar Metadados