Datos y metadatos, Francisca Hernández Carrascal

2,586 views

Published on

Digibis, Digital Libraries, Digitalization, Data, Metadata, OAI, Technology

Published in: Technology, Education, Business
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
2,586
On SlideShare
0
From Embeds
0
Number of Embeds
15
Actions
Shares
0
Downloads
61
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Datos y metadatos, Francisca Hernández Carrascal

  1. 1. Datos y metadatos Francisca Hernández [email_address]
  2. 2. Datos y metadatos <ul><li>Representación fidedigna del objeto original </li></ul><ul><li>Representación fidedigna de la copia digital </li></ul><ul><ul><li>Garantizar la vida del objeto digital </li></ul></ul><ul><ul><li>Descripción de los procesos realizados </li></ul></ul><ul><li>Derechos de propiedad, acceso y uso </li></ul><ul><li>Garantizar las funcionalidades de un sistema de información </li></ul><ul><li>Transmisión de datos y metadatos </li></ul><ul><li>Integración de datos y metadatos en un repositorio </li></ul>
  3. 3. Representación del objeto original <ul><li>Descripciones bibliográficas </li></ul><ul><ul><li>Marc 21 (ISO 2709) – MARC XML – MarcXchange (ISO 25577:2008) </li></ul></ul><ul><ul><li>Dublin Core sin cualificar </li></ul></ul><ul><ul><li>Dublin Core extendido </li></ul></ul><ul><ul><li>Metadata Object Description Schema (MODS) </li></ul></ul><ul><li>Funcionalidades </li></ul><ul><ul><li>Presentación del objeto </li></ul></ul><ul><ul><li>Gestión y mantenimiento de colecciones digitales </li></ul></ul><ul><ul><li>Búsqueda y recuperación (SRU) </li></ul></ul><ul><ul><li>Recolección de metadatos (OAI-PMH) </li></ul></ul>
  4. 4. Conversiones MARC 21 ISO 2709 MarcXchange MODS Dublin Core RDF Estructuras de metadatos OAI_DC MODS Schema Variantes de expresión XML oai_marc MARC XML
  5. 6. <ul><li>< metadata > </li></ul><ul><li>< oai_marc:oai_marc xmlns:oai_marc =&quot; http://www.openarchives.org/OAI/1.1/oai_marc &quot; xmlns:xsi =&quot; http://www.w3.org/2001/XMLSchema-instance &quot; xsi:schemaLocation =&quot; http://www.openarchives.org/OAI/1.1/oai_marc http://www.openarchives.org/OAI/1.1/oai_marc.xsd &quot; status =&quot; 0 &quot; type =&quot; n &quot; level =&quot; t &quot; ctlType =&quot; m &quot; encLvl =&quot; 0 &quot; catForm =&quot; 2 &quot; lrRqrd =&quot; b &quot;> </li></ul><ul><li>< oai_marc:fixfield id =&quot; 1 &quot;> &quot;BVPB20070010280&quot; </ oai_marc:fixfield > </li></ul><ul><li>< oai_marc:fixfield id =&quot; 3 &quot;> &quot;BVPB&quot; </ oai_marc:fixfield > </li></ul><ul><li>< oai_marc:fixfield id =&quot; 5 &quot;> &quot;20081021115525.0&quot; </ oai_marc:fixfield > </li></ul><ul><li>< oai_marc:fixfield id =&quot; 8 &quot;> &quot;061031q17011800esp |||||||lat d&quot; </ oai_marc:fixfield > </li></ul><ul><li>< oai_marc:varfield id =&quot; 35 &quot; i1 =&quot;&quot; i2 =&quot;&quot;> </li></ul><ul><li>< oai_marc:subfield label =&quot; a &quot;> CCPB000789586-0 </ oai_marc:subfield > </li></ul><ul><li></ oai_marc:varfield > </li></ul><ul><li>< oai_marc:varfield id =&quot; 40 &quot; i1 =&quot;&quot; i2 =&quot;&quot;> </li></ul><ul><li>< oai_marc:subfield label =&quot; a &quot;> CCPB </ oai_marc:subfield > </li></ul><ul><li>< oai_marc:subfield label =&quot; b &quot;> spa </ oai_marc:subfield > </li></ul><ul><li>< oai_marc:subfield label =&quot; c &quot;> CCPB </ oai_marc:subfield > </li></ul><ul><li></ oai_marc:varfield > </li></ul><ul><li>< oai_marc:varfield id =&quot; 100 &quot; i1 =&quot; 0 &quot; i2 =&quot;&quot;> </li></ul><ul><li>< oai_marc:subfield label =&quot; 0 &quot;> BVPB20070030684 </ oai_marc:subfield > </li></ul><ul><li>< oai_marc:subfield label =&quot; a &quot;> Ramon Llull </ oai_marc:subfield > </li></ul>
  6. 7. <ul><li><?xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot;?> < collection xmlns =&quot; http://www.loc.gov/MARC21/slim &quot;> </li></ul><ul><li>< record > </li></ul><ul><li>< leader > 00000ntm a22000002b 4500 </ leader > </li></ul><ul><li>< controlfield tag =&quot; 001 &quot;> BVPB20070010280 </ controlfield > </li></ul><ul><li>< controlfield tag =&quot; 003 &quot;> BVPB </ controlfield > </li></ul><ul><li>< controlfield tag =&quot; 005 &quot;> 20081021115525.0 </ controlfield > </li></ul><ul><li>< controlfield tag =&quot; 008 &quot;> 061031q17011800esp |||||||lat d </ controlfield > </li></ul><ul><li>< datafield tag =&quot; 035 &quot; ind1 =&quot; &quot; ind2 =&quot; &quot;> </li></ul><ul><li>< subfield code =&quot; a &quot;> CCPB000789586-0 </ subfield > </li></ul><ul><li></ datafield > </li></ul><ul><li>< datafield tag =&quot; 040 &quot; ind1 =&quot; &quot; ind2 =&quot; &quot;> </li></ul><ul><li>< subfield code =&quot; a &quot;> CCPB </ subfield > </li></ul><ul><li>< subfield code =&quot; b &quot;> spa </ subfield > </li></ul><ul><li>< subfield code =&quot; c &quot;> CCPB </ subfield > </li></ul><ul><li></ datafield > </li></ul><ul><li>< datafield tag =&quot; 100 &quot; ind1 =&quot; 0 &quot; ind2 =&quot; &quot;> </li></ul><ul><li>< subfield code =&quot; a &quot;> Ramon Llull </ subfield > </li></ul><ul><li>< subfield code =&quot; c &quot;> Beato </ subfield > </li></ul><ul><li>< subfield code =&quot; d &quot;> ca. 1232-1315 </ subfield > </li></ul><ul><li></ datafield > </li></ul>
  7. 8. <ul><li>< metadata > </li></ul><ul><li>< oai_dc:dc xmlns:oai_dc =&quot; http://www.openarchives.org/OAI/2.0/oai_dc/ &quot; xmlns:xsi =&quot; http://www.w3.org/2001/XMLSchema-instance &quot; xsi:schemaLocation =&quot; http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd &quot;> </li></ul><ul><li>< dc:type xmlns:dc =&quot; http://purl.org/dc/elements/1.1/ &quot;> Book </ dc:type > </li></ul><ul><li>< dc:language xmlns:dc =&quot; http://purl.org/dc/elements/1.1/ &quot;> lat </ dc:language > </li></ul><ul><li>< dc:title xmlns:dc =&quot; http://purl.org/dc/elements/1.1/ &quot;> Dialecta seu logica nova [Manuscrito] ; De venatione medii inter subjectum et praedicatum ; De conversione subjecti et praedicati per medium </ dc:title > </li></ul><ul><li>< dc:creator xmlns:dc =&quot; http://purl.org/dc/elements/1.1/ &quot;> Ramon Llull, Beato (ca. 1232-1315) </ dc:creator > </li></ul><ul><li>< dc:date xmlns:dc =&quot; http://purl.org/dc/elements/1.1/ &quot;> [S. XVIII] </ dc:date > </li></ul><ul><li>< dc:date xmlns:dc =&quot; http://purl.org/dc/elements/1.1/ &quot;> 1701 </ dc:date > </li></ul><ul><li>< dc:creator xmlns:dc =&quot; http://purl.org/dc/elements/1.1/ &quot;> Ramon Llull </ dc:creator > </li></ul><ul><li>< dc:identifier xmlns:dc =&quot; http://purl.org/dc/elements/1.1/ &quot;> http://bvpb.mcu.es/es/consulta/registro.cmd?id=397871 </ dc:identifier > </li></ul><ul><li>< dc:identifier xmlns:dc =&quot; http://purl.org/dc/elements/1.1/ &quot;> http://bvpb.mcu.es/es/catalogo_imagenes/grupo.cmd?path=11000987 </ dc:identifier > </li></ul><ul><li>< dc:format xmlns:dc =&quot; http://purl.org/dc/elements/1.1/ &quot;> image/jpeg </ dc:format > </li></ul><ul><li></ oai_dc:dc > </li></ul><ul><li></ metadata > </li></ul>
  8. 9. <ul><li><?xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot;?> </li></ul><ul><li>< rdf:RDF xmlns:rdf =&quot; http://www.w3.org/1999/02/22-rdf-syntax-ns# &quot; xmlns:dc =&quot; http://purl.org/dc/elements/1.1/ &quot;> </li></ul><ul><li>< rdf:Description > </li></ul><ul><li>< dc:title > Boletín Oficial de la provincia de Orense Recurso electrónico </ dc:title > </li></ul><ul><li>< dc:type > text </ dc:type > </li></ul><ul><li>< dc:publisher > [S.l. s.n.] </ dc:publisher > </li></ul><ul><li>< dc:date > 1834- </ dc:date > </li></ul><ul><li>< dc:language > spa </ dc:language > </li></ul><ul><li>< dc:description > Título tomado de la cabecera </ dc:description > </li></ul><ul><li>< dc:description > Errores de numeración </ dc:description > </li></ul><ul><li>< dc:description > Con el inicio de cada año comienza la numeración </ dc:description > </li></ul><ul><li>< dc:description > Algunos n. con suplementos </ dc:description > </li></ul><ul><li>< dc:description > Copia digital </ dc:description > </li></ul><ul><li>< dc:description > Índice anual, n. 1 (1838) de las leyes, decretos, reales órdenes y demás superiores determinaciones insertas en el Boletín Oficial de Orense desde 1 de Enero hasta fín de Noviembre del año de 1838 </ dc:description > </li></ul><ul><li>< dc:description > Índice anual general de los decretos, órdenes y demás disposiciones superiores publicadas en los Boletines en los n. 1 de los meses de Enero, Febrero, Marzo y Abril de los años 1841, 1842, 1843, 1844, 1845 </ dc:description > </li></ul><ul><li>< dc:description > Índice anual, n. 1 (1879) </ dc:description > </li></ul><ul><li></ rdf:RDF > </li></ul>
  9. 10. Representación fidedigna de la copia <ul><li>Características técnicas de la copia </li></ul><ul><ul><li>Garantizar la vida del objeto digital </li></ul></ul><ul><ul><li>Descripción de los procesos realizados </li></ul></ul><ul><ul><li>Derechos de propiedad, acceso y uso </li></ul></ul><ul><ul><li>Transmisión de datos y metadatos </li></ul></ul><ul><li>MIX (Metadata for Still Images in XML) </li></ul><ul><li>textMD Technical Metadata for Text </li></ul>
  10. 11. Metadata for Still Images in XML <ul><li>MIX expresa </li></ul><ul><ul><li>Tamaño del fichero </li></ul></ul><ul><ul><li>Formato y versión del mismo (TIFF 6.0, JPEG 2000) </li></ul></ul><ul><ul><li>Orden de bytes </li></ul></ul><ul><ul><li>Compresión (CCITT, LZW, JPEG 2000 lossless) </li></ul></ul><ul><ul><li>Ratio de compresión </li></ul></ul><ul><ul><li>Fijeza (Algoritmo, Algoritmo original) </li></ul></ul><ul><ul><li>Características de la imagen (altura, anchura, color, perfil de color, etc.) </li></ul></ul><ul><ul><li>http://www.loc.gov/standards/mix/ </li></ul></ul>
  11. 12. textMD: Metadatos técnicos para textos <ul><li>textMD expresa </li></ul><ul><ul><li>Aspectos técnicos de la generación de un texto, p.e., software y hardware utilizado en la obtención de OCR, procesador de texto </li></ul></ul><ul><ul><li>Juego de caracteres </li></ul></ul><ul><ul><li>Idioma </li></ul></ul><ul><ul><li>Tipos y tamaños </li></ul></ul><ul><ul><li>Lenguaje de marcado </li></ul></ul><ul><ul><li>Software para impresión y/o visualización </li></ul></ul><ul><ul><li>http://www.loc.gov/standards/textMD/ </li></ul></ul>
  12. 13. METSRights: Derechos de propiedad, acceso y uso <ul><li>METSRights expresa </li></ul><ul><ul><li>Derechos asociados a una copia digital o a sus componentes </li></ul></ul><ul><ul><li>Identificación del propietario de los derechos </li></ul></ul><ul><ul><li>Circunstancias asociadas a permisos y restricciones (p.e., acceso a grupos determinados) </li></ul></ul><ul><ul><li>Categorías de derechos (dominio público, copyright, licencia, contrato, etc.) </li></ul></ul><ul><ul><li>Permisos (localizar, mostrar, copiar, duplicar, modificar, imprimir) </li></ul></ul>
  13. 14. El ciclo de vida de un objeto digital <ul><li>Registro de cambios producidos en un objeto digital a lo largo de su ciclo de vida </li></ul><ul><ul><li>Digitalización </li></ul></ul><ul><ul><li>Retoque y mejora de imágenes </li></ul></ul><ul><ul><li>Reconocimiento óptico de caracteres </li></ul></ul><ul><ul><li>Validación </li></ul></ul><ul><ul><ul><li>JHOVE - JSTOR/Harvard Object Validation Environment </li></ul></ul></ul><ul><ul><ul><li>http://hul.harvard.edu/jhove/ </li></ul></ul></ul><ul><ul><li>Conversión (migración) de un formato a otro </li></ul></ul><ul><ul><li>Agente que realiza el proceso </li></ul></ul><ul><ul><li>Fecha en la que se realiza el proceso </li></ul></ul><ul><ul><li>Software y hardware utilizado </li></ul></ul>
  14. 15. <ul><li>< premis:event > </li></ul><ul><li>< premis:eventIdentifier > </li></ul><ul><li>< premis:eventIdentifierType > NULREPOS </ premis:eventIdentifierType > </li></ul><ul><li>< premis:eventIdentifierValue > inu-event-00006 </ premis:eventIdentifierValue > </li></ul><ul><li></ premis:eventIdentifier > </li></ul><ul><li>< premis:eventType > conversion-to-jpeg2000 </ premis:eventType > </li></ul><ul><li>< premis:eventDateTime > 2006-04-04 </ premis:eventDateTime > </li></ul><ul><li>< premis:eventDetail > Migrate TIFF to JPEG2000 </ premis:eventDetail > </li></ul><ul><li>< premis:linkingAgentIdentifier > </li></ul><ul><li>< premis:linkingAgentIdentifierType > lcnaf </ premis:linkingAgentIdentifierType > </li></ul><ul><li>< premis:linkingAgentIdentifierValue > Northwestern University, University Library, Digital Library Systems Development </ premis:linkingAgentIdentifierValue > </li></ul><ul><li></ premis:linkingAgentIdentifier > </li></ul><ul><li>< premis:linkingObjectIdentifier > </li></ul><ul><li>< premis:linkingObjectIdentifierType > NULREPOS </ premis:linkingObjectIdentifierType > </li></ul><ul><li>< premis:linkingObjectIdentifierValue > inu-afmp-g8850_1729_a5_FG7 </ premis:linkingObjectIdentifierValue > </li></ul><ul><li></ premis:linkingObjectIdentifier > </li></ul><ul><li></ premis:event > </li></ul>
  15. 16. Transmisión de datos y metadatos <ul><ul><li>Metadatos descriptivos </li></ul></ul><ul><ul><li>Metadatos administrativos </li></ul></ul><ul><ul><ul><li>Metadatos técnicos (MIX, textMD) </li></ul></ul></ul><ul><ul><ul><li>Metadatos de propiedad intelectual (METSRights) </li></ul></ul></ul><ul><ul><ul><li>Metadatos de procedencia de un objeto digital </li></ul></ul></ul><ul><ul><li>Relación de ficheros (una copia, varias versiones…) </li></ul></ul><ul><ul><li>Estructura de los ficheros </li></ul></ul><ul><ul><li>Comportamientos </li></ul></ul><ul><li>Metadata Encoding & Transmission Standard (METS) </li></ul><ul><li>Preservation Metadata Implementation Strategies (PREMIS) </li></ul>
  16. 17. Metadatos descriptivos Metadatos Administrativos Relación de ficheros Comportamiento MARC 21 DC MODS MIX, textMD METSRights METS Extensiones METS PREMIS DIGIPROV Objetos Eventos Agentes Derechos PREMIS
  17. 18. Distintas formas de expresar los mismos datos <ul><ul><li>PREMIS <event> </li></ul></ul><ul><ul><li>METS <digiprov> </li></ul></ul><ul><ul><li>PREMIS </li></ul></ul><ul><ul><li>METS </li></ul></ul><ul><ul><li>PREMIS encapsulados en METS </li></ul></ul><ul><ul><li>Metadatos técnicos encapsulados en PREMIS </li></ul></ul><ul><ul><li>Perfiles de METS </li></ul></ul><ul><ul><li>http://www.loc.gov/standards/mets/mets-profiles.html </li></ul></ul>
  18. 20. METS
  19. 21. Datos y metadatos <ul><li>Representación fidedigna del objeto original </li></ul><ul><li>Representación fidedigna de la copia </li></ul><ul><li>Garantizar la vida del objeto digital </li></ul><ul><li>Descripción de los procesos realizados </li></ul><ul><li>Derechos de propiedad, acceso y uso </li></ul><ul><li>Transmisión de datos y metadatos </li></ul><ul><li>Integración de datos y metadatos en un repositorio </li></ul><ul><li>Garantizar las funcionalidades de un sistema de información </li></ul>

×