1. METS in der Praxis
Eine kritische Betrachtung
Carsten M. Schulze
Themenphase Digitalisierung – Themenblock Metadaten
16.06.2010
K:ABLMitarbeiter SBBBRef-Ausbildung - Themenphase
DigitalisierungMetadaten_CS.ppt
2. 16.06.2010Carsten M. Schulze S. 2
<inhalt>
Interoperabilität von Metadaten
Wie beschreibe ich meine digitalen Objekte?
Langzeit... Verfügbarkeit .... Archivierung...
Open Archival Information System
Rolle von METS im OAIS
METS in der Praxis
METS-Profile
Interoperabilität von METS
Quellen
</inhalt>
3. 16.06.2010Carsten M. Schulze S. 3
Interoperabilität von Metadaten
Verstehen wir unsere
Metadaten?
Sind unser
Metadaten
eindeutig?
Können Dritte
unsere Metadaten
verstehen?
Können Dritte
unsere Metadaten
nachnutzen?
4. 16.06.2010Carsten M. Schulze S. 4
Interoperabilität von Metadaten
Dublin Core Metadata Terms?
Dublin Core Application Profile (DCAP)?
5. 16.06.2010Carsten M. Schulze S. 5
Interoperabilität von Metadaten
Das Singapore Framework für Dublin-Core-
Anwendungsprofile
nennt Rahmenbedingungen um Metadatenanwendungen möglichst
interoperabel zu gestalten und so zu dokumentieren, dass sie
nachnutzbar sind.
definiert Komponenten, die erforderlich sind, um ein
Anwendungsprofil zu dokumentieren
es beschreibt, wie sich diese dokumentarischen Standards
gegenüber Standard-Domain-Modellen und den Semantic-Web-
Standards verhalten.
Das Singapore Framework ist die Grundlage für die Beurteilung
von Anwendungsprofilen in Hinblick auf Vollständigkeit der
Dokumentation und auf Übereinstimmung mit den Prinzipien der
Web-Architektur.
6. 16.06.2010Carsten M. Schulze S. 6
Interoperabilität von Metadaten
DC Singapore Framework
theoretisch geeignet für die Beschreibung von digitalen Objekten
Vorteile
standardisiert
Interoperabilität sehr hoch
Nachteile
großer Dokumentationsaufwand
benötigt Vokabulare für Strukturbeschreibungen
wenig oder keine Implementierung in digitalen Bibliotheken
Hürde insgesamt zu hoch
7. 16.06.2010Carsten M. Schulze S. 7
Wie beschreibe ich meine digitalen Objekte?
MPEG-21 Multimedia Framework
Digital Item Declaration Language (DIDL)
Kombination von Ressource, Metadaten und Struktur
Rechte, Nutzung, Kontexte etc.
8. 16.06.2010Carsten M. Schulze S. 8
Wie beschreibe ich meine digitalen Objekte?
Zeitungstitel deskriptive Metadaten in DIDL
9. 16.06.2010Carsten M. Schulze S. 9
Wie beschreibe ich meine digitalen Objekte?
Zeitungsartikel deskriptive Metadaten in DIDL
11. 16.06.2010Carsten M. Schulze S. 11
Wie beschreibe ich meine digitalen Objekte?
MPEG-21 Multimedia Framework
ganz klar eine Alternative
neuer Standard
kaum Implementierungen aber im Kommen!
Problem
METS hat sich schon durchgesetzt???
Wer möchte mitten im Rennen die Pferde wechseln?
Aber
Warum nicht beides!!!
Im Hintergrund steht immer die Frage: Was benötigt meine
Zielgruppe / Community?
- Bsp. TEI vs. METS/ALTO
12. 16.06.2010Carsten M. Schulze S. 12
Wie beschreibe ich meine digitalen Objekte?
Metadata Encoding and Tramsmission Schema (METS)
“[...] management of digital objects within a repository and the
exchange of such objects between repositories (or between
repositories and their users).”1
Grundlage zur Entwicklung von Werkzeugen um
- Metadatenmanagement zu erlauben
- Interoperabilität zu erhöhen
Probleme die METS lösen will
Digitale Objekte sollen für eine sehr lange Zeit verfügbar bleiben
Austausch zwischen Repositorien (Institutionen) ist ein Aspekt von
Langzeitverfügbarkeit
„Management of digital objects“ ist ein Aspekt von
Langzeitarchivierung
1
METS Primer
13. 16.06.2010Carsten M. Schulze S. 13
Langzeit... Verfügbarkeit .... Archivierung...
Langzeitverfügbarkeit und –archivierung ist das eigentliche
Thema
Wie schaffen wir es unsere digitalen Objekte auch noch in
150 Jahren nutzen zu können?
Hintergrund: Formatswechsel, Softwarewechsel,
Hardwarewechsel, Naturkatastrophen, menschliches „Eingreifen“
Ansatz: OAIS-Modell
Bevor wir uns an diese scheinbar unlösbare Aufgabe machen,
müssen wir erst mal die selbe Sprache sprechen
14. 16.06.2010Carsten M. Schulze S. 14
Open Archival Information System
Open Archival Information System (OAIS)
oberste Ebene:
16. 16.06.2010Carsten M. Schulze S. 16
Rolle von METS im OAIS
METS als Submission Information Package (SIP)
Entweder muss Repository flexibel genug sein, um den Import zu
gewährleisten
oder METS muss an den Repository-Geschmack angepasst werden.
Bsp. Fedora hat ein Fedora-METS-Profil für den Ingest
17. 16.06.2010Carsten M. Schulze S. 17
Rolle von METS im OAIS
METS als Archival Information Package (AIP)
Repository muss Metadatenmanagement auf METS-Basis erlauben
Bsp. Greenstone Digital Library Software
18. 16.06.2010Carsten M. Schulze S. 18
Rolle von METS im OAIS
METS als Dissemination Information Package (DIP)
Was für ein METS wird ausgegeben? (Zielgruppe / Community)
sinnvoll in Verbindung mit OAI-PMH zur Automatisierung des
Austauschs
19. 16.06.2010Carsten M. Schulze S. 19
Rolle von METS im OAIS
Zusammenfassung
METS als SIP bedingt geeignet
- eigene Ingest-Formate meist sinnvoller
METS als AIP wird kaum Anwendung finden
- Repository-Software braucht „interne“ Daten zum Management der
Objekte, daher wird eher eigenes Management-Format zum Einsatz
kommen
METS als DIP sollte unter anderen genutzt werden
- wichtig ist die Dokumentation des METS-Profils
Nicht zu vergessen:
METS ist nur ein Framework für eine beliebige Menge von
Metadatenformaten (DC, MODS, LMER, PREMIS, MARC, textMD,
MIX etc.)
Diese unterliegen ihren eigenen Eigenschaften im OAIS-Modell
21. 16.06.2010Carsten M. Schulze S. 21
Bedeutung von METS-Profilen
METS-Profile
Definition von SOLL, MUSS und KANN
Definition von Metadatenformten, die zum Einsatz kommen
(sollen, müssen, dürfen)
geben Beispiele
treffen von Konventionen
sind für den Menschen gedacht
METS-Profile erlauben:
einheitliche Objektbeschreibung
einfacher Austausch zwischen Repositorien
Validierung von METS-Dokumenten
Erstellung von Werkzeugen, die ein breiteres Anwendungsgebiet
haben
Austausch von Lösungen und Use Cases
genaue Vorgaben an Dritte (z.B. Auftragnehmer)
22. 16.06.2010Carsten M. Schulze S. 22
METS-Profil registrieren
Um einen zentralen
Einstiegspunkt für Profile zu
haben, hat die LOC ein
METS-Profile-Registry
eingerichtet
wird leider zu wenig genutzt
Bsp.: SBB Zeitungen
METS-Profil – Exchange
http://zefys.staatsbibliothek
-
berlin.de/fileadmin/mets/SB
B_Zeitungen_METS-
Profil_Exchange_draft.xml
23. 16.06.2010Carsten M. Schulze S. 23
Interoperabilität von METS
Verstehen wir unsere
Metadaten?
Sind unser
Metadaten
eindeutig?
Können Dritte
unsere Metadaten
verstehen?
Können Dritte
unsere Metadaten
nachnutzen?
24. 16.06.2010Carsten M. Schulze S. 24
Quellen
Interoperability Levels for Dublin Core Metadata
http://dublincore.org/documents/interoperability-levels/
The Singapore Framework for Dublin Core Application
Profiles
http://dublincore.org/documents/singapore-framework/
MPEG-21 Multimedia Framework
http://mpeg.chiariglione.org/standards/mpeg-21/mpeg-21.htm
Digital Item Declaration Language (DIDL)
http://xml.coverpages.org/mpeg21-didl.html
Beschreibung des Projekts Historische Kranten (NL)
http://kranten.kb.nl/about/Productie_content
METS PRIMER
http://www.loc.gov/standards/mets/METSPrimerRevised.pdf
25. 16.06.2010Carsten M. Schulze S. 25
Quellen
Reference Model for an Open Archival Information
System (OAIS)
http://public.ccsds.org/publications/archive/650x0b1.pdf
Greenstone Digital Library Software
http://www.greenstone.org/
METS Profile Registry
http://www.loc.gov/standards/mets/mets-registered-profiles.html
ASSESSMENT OF UKDA AND TNA COMPLIANCE WITH
OAIS AND METS STANDARDS
http://www.jisc.ac.uk/media/documents/programmes/preservatio
n/oaismets.pdf
Editor's Notes
LEVEL 1:
Wissen wir was unsere Metadaten ausdrücken?
Welche Metadaten benutzen wir?
Wie sind diese definiert?
LEVEL 2:
Metadaten dürfen nicht mehrdeutig sein.
Sie sollten in RDF umgesetzt werden können.
LEVEL 3:
Beinhaltet Level 1 und 2 UND es gibt Möglichkeiten die Metadaten zu validieren (verstehen).
LEVEL 4:
Beinhaltet LEVEL 1-3 UND man nutzt die gleichen Vokabulare und Modelle um die Welt zu beschreiben.
Ähnlich wie intern in einem System, nur das dort nichts ausgetauscht werden muss.
Dublin Core Metadata Terms?
völlig unzureichend
keine Strukturinformationen
einfach nur ein Vokabular -&gt; ABER wie wird es serialisiert? XML? RDF?
Dublin Core Application Profile (DCAP)?
Beschreibung aller Ebenen von Interoperabilität für unsere Metadaten
Von Anwendungsfällen
über Vokabulre und Definitionen
zur Semantik und Syntax
WICHTIG: NICHT NUR DC-VOKABULARE
Interoperabilität ist toll,
ABER EHRLICH unsere Ansprüche sind sehr viel niedriger!!!!!!
Digital Item Declaration Language (DIDL):
ähnlich dem METS-Schema
besonders geeignet für digital born Materialien
sehr viel mehr auf Austausch und Nutzung bezogen
viele Ansätze zur Steigerung der Interoperabilität
Beispiel des Projekts Historische Kranten (NL)
deskriptiver Metadaten-Teil einer Zeitung
deskriptiver Metadaten-Teil eines Artikels
Einteilung der Zonen / segmentierung der Digitalisate / Kooedinaten für die Artikel
schwierig zu sagen, auf welchen Standard man setzen soll.
Was braucht die Community?
Bsp. TEI vs. METS/ALTO
TEI angeblich von Community (Wissenschaftler) verlangt
MANAGEMENT und EXCHANGE
WICHTIG: Entwicklung von Werkzeugen (Tools), die mit einem gemeinsamen Standard arbeiten
Interoperabilität durch Nutzung derselben Tools
-&gt; Sehr pragmatischer Ansatz????
METS im Bibliotheksumfeld entstanden
Auftrag von Bibliotheken BEWAHREN (auch) -&gt; daher LZA und LZV im Vordergrund
oberste Ebene des OAIS-Modells
1. PRODUCER
2. CONSUMER
3. Dazwischen (Repository / Institution etc.) &lt;- Repository nicht gleich Software
es wird hereingezoomt
METS als Submission Information Package
Ingest: Prozess der Einspielung in das Repository
METS als Archival Information Package
wird abgelegt (Storage)
Preservation Planing wird durch Data-Management umgesetzt
eigentliche LZA
Alle Informationen von Transformationen, Zugriffsmödglichkeiten etc. müssen im AIP gespeichert werden.
METS als Dissemination Information Package
Welche Informationen sind für den Transfer nötig?
Was benötigt der Consumer?
Flexibilität von METS ist hier ein großer Vorteil.
Producer, Repository und Consumer in der Praxis
Goobi -&gt; Producer (SIP) und Repository (DIP)
Kopal -&gt; Daten- und Metadatenmanagement, LZA Tool, -&gt; Repository (AIP)
Zentrales Verzeichnis Digitaler Drucke -&gt; Consumer und Repository
Europeana -&gt; konsumiert auch METS (local), aber keine Digitalisate
DFG-Viewer -&gt; Consumer
Normative Vorgaben, wie das Dokument auszusehen hat
ähnlich dem Singapore Framework
erhöht allerdings auch die Hürde
LOC gibt Dokumentationsstandard (Syntax) vor
Wie sieht es aus?
Wo stehen wir mit METS?
Sind unsere Metadaten wirklich eindeutig?
Versteht jeder was Kategorie 5170 ist? (Wenn PICA eingebunden)