Die ZBW ist Mitglied der Leibniz-GemeinschaftAuf Du und Du mit Dublin Core & Co. –Berufsfeld Metadaten-Management im Konte...
Seite 2Auf Du und Du mit Dublin Core & Co. – Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft1. Was s...
1. Was sind Metadaten?Seite 3
Was sind Metadaten?Definitionen über Definitionen• „… are (structured) data about data.“Miller, Eric: An introduction to t...
Metadata “is machine understandable information aboutweb resources or other things.“ (Tim Berners-Lee)Web-Ressourcen:Seite 5
Andere Dinge:Bücher und Zeitschriften etc.:Museums-Objekte:Bilder:Tonträger:Personen:Metadata “is machine understandable i...
Karteikarte im ZettelkatalogMetadaten – getrennt vom Objekt Metadaten – im Objekt enthaltenCIP (Cataloging inPublication)D...
Metadata „are (structured) data about data“ (Eric Miller)Metadaten sind „Daten über Daten“Daten - Buch „Daten über Daten“M...
Metadata „are (structured) data about data“ (Eric Miller)Metadatenformate(maschinen-lesbar)Bezeichner eines Merkmals(Mensc...
PPN:Titel:Verfasser:Sonst. Personen:Erschienen:Umfang:Anmerkung:ISBN:Schlagwörter:Mehr zum Thema:Zeng, Marcia LeiVerfasser...
Metadata is „[…] to aid in their identification, discovery,assessment, and management of the described entities“AUFGABEN v...
Metadata is „[…] to aid in their identification, discovery,assessment, and management of the described entities“TYPEN von ...
• Formale Beschreibung einer Ressource• Strukturierte „Daten über Daten“• Ein Metadatensatz besteht aus Metadaten-Elemente...
2. MetadatenstandardsSeite 14
MetadatenstandardsStandards?"The nice thing about standards is that you have so many tochoose from. Furthermore, if you do...
Metadatenstandards„A content metadata standard is defined as an open specification that itemizes a setof elements and thei...
Aufbau eines Metadaten-Standards amBeispiel Dublin CoreDublin Core Metadata Initiative (DCMI)Zunächst für die Beschreibung...
Dublin Core Metadata Element SetDublin Core Simple: 15 Elemente: titel Titel creator Verfasser oder Urheber contributor...
Dublin Core - MetadatenelementeElement (property): Merkmal / Eigenschaft einer Ressource, wie Titel,Autor etc.„An Element ...
Dublin Core Element Set - ÜbungDC element valuetitlecreatorcontributorpublishersubjectdatecoverageDC element valuedescript...
Dublin Core Element Set - Übung: LösungSprache: rumänisch, englischDC element valuetitle Intelectuali Români implicati înd...
Dublin Core Metadata Terms15 Elemente bieten wenig Differenzierung. Was tun? Dublin Core Metadata TermsElement Refinement...
Encoding SchemesWeitere semantische und syntaktische Differenzierung bieten Encoding SchemesWie, in welcher Form wird das ...
Vocabulary Encoding SchemesVocabulary Encoding Scheme (VES):Beschreibt, dass der Wert eine Bezeichnung aus einem kontrolli...
Vocabulary Encoding Schemes:Klassifikationen – Thesauri – Schlagwörter und mehrKlassifikationenDDC Dewey Decimal Classific...
Syntax Encoding SchemesSyntax Encoding Scheme (SES):Gibt an, wie die Zeichenketten, die bei der Beschreibung eines Objekts...
Syntax Encoding SchemesNormen und weitere StandardsISO 8601 Data elements and interchange formats - Information interchang...
Syntax and Vocabulary Encoding SchemesRFC 3066: Vorläufer der ISO-639ISO 639 Sprachen (Sprachcodes):ISO 639-1 (Alpha-2 Cod...
Metadaten-Standards und -Schemas definieren zulässige Elemente und ihreBedeutung (Semantik), sowie ihre Form (Syntax):• Sa...
Zusammenfassung: Aufbau von Dublin Core• Dublin Core Metadata Element Set = 15 Elemente (Dublin Core Simple)• Dublin Core ...
Prinzipien von Dublin CoreOne-to-One-Principle - Das 1:1-Prinzip:Jede Beschreibung (decription) steht für ein und nur ein ...
Prinzipien von Dublin Core1. Simplicity: Einfachheit der Beschreibung2. Semantic interoperability: Semantische Interoperab...
Metadatenformatebibliographisch / deskriptivMetadatenstandard ist nicht gleich MetadatenformatDublin Core Metadatenstandar...
Exkurs XML Extensible Markup Language = erweiterbare Auszeichnungs-Sprache Beispiele für Auszeichnungssprachen: HTML (Hy...
Unterschiede zwischen HTML und XMLUnterschied zu HTML Tags sind nicht festgelegt. Sie werden fürspezielle Anwendung defin...
XML - Eigenschaften• Trennt strikt zwischen Daten und Verarbeitung der Daten: Welche Software fürdie Verarbeitung verwende...
XML - Eigenschaften• Flexibel: da „tags“ (Bezeichner) in XML nicht festgelegt sind, kann jeder Betreibersein eigenes Forma...
Metadatenstandards in XMLMetadata Object and Description Schema• Originärer XML-Standard• Entwickelt als Kompromiss zwisch...
Machine-Readable Cataloging - MARC21Internationales Austausch- undSpeicherformat• für bibliographische Nachweisein Bibliot...
650 = SachschlagwortIndikator 1 = undefiniertIndikator 2 = Quelle des Vokabular wird spezifiziert in Unterfeld 2Unterfeld ...
Project of Integrated Catalogue Automation - PICAPICA+: Datenbank-FormatPICA3: Katalogisierungssichtu.a. GBV, SWD, HEBIS, ...
Pica3 - Pica+Katalogisierungssicht Pica3Datenbanksicht PICA+Seite 42
43Pica3 - Pica+Steuerzeichenin Pica3 sindUnterfelder (subfields)in Pica+SubfieldEine individuelle Informationseinheit inei...
Beispiele für MetadatenstandardsMetadatenstandards1.für bibliographische Ressourcen: z.B. Pica+, MODS, DC2.für den Datenta...
Seeing Standards: A Visualization of the MetadataUniverse (Jenn Riley)http://www.dlib.indiana.edu/~jenlrile/metadatamap/se...
DOKUMENTATION eines Metadaten-Standards• „Uses and Features“• „Usage Guidelines“• „Implementation Guidelines“• „Schemas an...
• Metadatenstandards sorgen für die Konsistenz der Metadaten und verbesserndamit Nutzung und Austausch• Ein Metadatenstand...
• Metadatenstandard ist nicht gleich Metadatenformat: ein Standard (z.B. DublinCore) kann in verschiedenen Formaten auftre...
3. Application ProfileSeite 49
PPNTitelVerfasser Sonst. Beteil.PersonUmfangISBNSchlagwörterFussnotenVerwandte RessourcenURLMetadaten-Standard einer „Comm...
Metadaten-Dokumentation für individuelle Anwendungen:Application Profiles“In DCMI usage, an application profile is a decla...
AP - Grundsätzliche ÜberlegungenWelchen Zweck hat die Anwendung?• Verwaltung von Daten für den“Hausgebrauch”?• Organisatio...
Praxis – Kriterien für die FormatauswahlErst prüfen• Gibt es für meine Anwendungbereits einen Standard?• Welcher Standard ...
Praxis – Kriterien für die Auswahl des/der Standard(s)– “Use elements and qualifiers to meet the needs of your local conte...
dcterms.creatorApplication Profile - Namensräume DCMI namespace: "a collection of DCMI terms URIs“ (DCMI term URI: "TheUR...
Application Profile - Namensräume Namensräume: können für spezifische Anwendungen definiert werden Die Deklaration von N...
Application-Profile - Singapore Framework„...a framework for designing metadata applications for maximum interoperabilitya...
Application Profiles - Singapore Frameworkhttp://www.dublincore.org/documents/singapore-framework/http://www.kim-forum.org...
Zusammenfassung: Application Profile• Metadatenschemas, bzw. -profile bestehen aus Elementen aus einem odermehreren Metada...
Application Profile„The main goal of application profiles is to increase the"semantic interoperability" of the resulting m...
InteroperabilitätInteroperabilität ist die Fähigkeit unterschiedlicher Informationssystememiteinander zu kommunizieren und...
62InteroperabilitätStrukturelle Interoperabilität• gegeben, wenn unterschiedlichenMetadatenschemas ein gemeinsa-mes Datenm...
Interoperabilität - Übung001@ $026$aU001A $00206:04-03-09001B $00206:10-03-09$t10:42:23.000001D $00206:04-03-09001U $0utf8...
Interoperabilität - Lösung001@ $026$aU001A $00206:04-03-09001B $00206:10-03-09$t10:42:23.000001D $00206:04-03-09001U $0utf...
4. MappingSeite 65
Was bedeutet „Mapping“?Aufgabe: Integration heterogener Metadaten in einem System: EconBizDublin Core (XML)PICA 3Titel=400...
• „Übersetzen“ der Elemente und Regeln von einem Standard (Schema /Format) in einen anderen• Mapping: die sich entsprechen...
Seite 68Crosswalk“A table that maps the relationships and equivalenciesbetween two or more metadata schemes. Crosswalksor ...
CrosswalkA crosswalk ist "a mapping of the elements,semantics, and syntax from one metadata schemeto those of another„.(ht...
Einige Problemfelder beim Mappen:• Mapping zwischen zwei unterschiedlich mächtigen Standards / Schemas:fehlende Felder im ...
Mapping in der PraxisIn welcher Beziehung stehen die zu mappenden Elemente zueinander?Grad der strukturellen Übereinstimmu...
Mapping in der Praxis="is the same as„Semantik des Quell- und des Zielformats stimmen überein. Einfaches Element-to-Eleme...
<Quell-Element ist „Unterbegriff“ des ZielelementsSemantik des Quellelements ist enger gefasst, als die des möglichen Ziel...
Mapping in der Praxis>Quell-Element ist „Oberbegriff“ von Ziel-ElementSemantik des Quellelements ist breiter gefasst, als ...
Mapping in der PraxisQuellformat: MIX<Compression><CompressionScheme>1</CompressionScheme><CompressionLevel>10</Compressio...
Mapping in der Praxis1:nQuell-Element muss auf zwei oder mehrere Ziel-Elemente verteilt werden /Nur Teil eines Quellelemen...
n:1 Mehrere Quell-Elemente entsprechen Ziel-ElementNur zwei oder mehr verschiedene Informationen gemeinsam ergeben die Zie...
Mapping in der PraxisWiederholbarkeitQuell-Element ist wiederholbar, Ziel-Element nichtAlle Werte des Quell-Elements in Z...
Mapping in der PraxisVerpflichtungQuell-Element ist Pflichtfeld, Ziel-Element nicht Kein ProblemQuell-Element ist nicht v...
Mapping in der PraxisProbleme mit den Daten:1. Missing data: Werte sind nicht vorhanden2. Incorrect data: Werte entspreche...
Zusammenfassung: Mapping und Crosswalks• Beim Mappen wird semantische, syntaktische und strukturelleInteroperabilität herg...
Mapping - ÜbungSeite 82Quelle: MODS-Schema:Element language mitencoding schemeSoll nach PICA (GBV) gemapptwerden!Aus der G...
Mapping - LösungSeite 83Antwort:Ja, ein Mapping ist möglich: die Semantik der Felder in den beidenSchemas stimmen überein....
Zusammenfassung: Mapping und CrosswalksSeite 84“A crosswalk is a specification for mapping onemetadata standard to another...
5. SchnittstellenSeite 85
SchnittstellenSoftwareschnittstellen / softwareseitige Datenschnittstellen :• definieren, wie Kommandos und Daten zwischen...
87Linkresolver• System zur Verfügbarkeitsanzeige wissenschaftlicher Publikationen.• HTTP-basierter Service• Metadaten der ...
openURL„The OpenURL is a protocol for interoperability between an information resourceand a service component that offers ...
openURLStandard für die Übermittlung von bibliographischen Metadaten(Context-Sensitive Linking)http://openurlgw.hbz-nrw.de...
OAI-PMH - OAI Protocol for Metadata HarvestingOpen Archives Initiative (OAI):• Initiative von Betreibern von Dokumentenser...
OAI-PMH - OAI Protocol for Metadata HarvestingOAI-Anfrage an EconStorhttp://www.econstor.eu/dspace-oai/request?verb=GetRec...
92OAI-PMH - OAI Protocol for Metadata Harvestinghttp://www.econstor.eu/dspace-oai/request?verb=GetRecord&metadataPrefix=oa...
93OAI-PMH - OAI Protocol for Metadata Harvesting6 verbs um ein Repository abzufragen:• GetRecord: individuellen Datensatz ...
OAI-ExplorerSchnittstelle umRepositoriesinteraktiv auf ihreÜbereinstimmungmit dem OAI-PMH zu testen.http://re.cs.uct.ac.za...
Schnittstellen fürLiteraturverwaltungSeite 95
COinS (ContextObjects in Spans)• Methode zur Einbindung von bibliographischen Metadaten in HTML-Seiten• Basiert auf OpenUR...
Zusammenfassung: SchnittstellenSeite 97• Schnittstellen definieren, wie Kommandos und Daten zwischen verschiedenenProzesse...
6. Metadaten für das Semantic WebSeite 98
Metadaten für das Semantic WebProblem heutiger Suchmaschinen1. Unpassende Suchergebnisse Suchanfrage ist mehrdeutig(Homon...
100Mikroformate: semantische Annotation• Formate zur »Feinstrukturierung« von Webseiten.• (X)HTML-Dokumente menschen- und ...
• Microdata erweiterte Microformats und überwindet deren Schwächen (z.B. unflexibel)• Ausdruckstärkere semantische Annotat...
Microdata: Schema.orgSeite 102Google Structured Data Testing Tool: http://www.google.com/webmasters/tools/richsnippets
Semantic WebTim Berners Lee (1998): Semantic Web Roadmap:“The web was designed as an information space, with the goalthat ...
Semantic WebErweiterung des World Wide Web:Seite 104„Im Web werden immer mehr veröffentlichte Daten in RDF (s.u.) vorliege...
 formale Sprache für die Bereitstellung von Metadaten im WWW Umgesetzt werden diese Beschreibungen nach dem RDF-Modell e...
Ressource - URI - RepräsentationSeite 106Repräsentation: Webseite überSt. Michaelishttp://dbpedia.org/resource/St._Michael...
Ressource - URI - RepräsentationSeite 107« Ceci nest pas une pipe »  « Das ist keine Pfeife »René Magritte: La trahison d...
Bedeutung für Beschreibung von Bibliotheksressourcen: verschiedeneMetadatenstandards können in RDF integriert werden„The R...
1. Übersetzen Sie die Information „Harry Potter wird bei Carlsen verlegt“ in RDFund ordnen Sie die Bestandteile Subjekt, P...
1. Übersetzen Sie die Information „Harry Potter wird bei Carlsen verlegt“ in RDFund ordnen Sie die Bestandteile Subjekt, P...
Meta-Modell: RDF-SchemaSeite 111http://d-nb.info/gnd/4099309-7 dc:creator „Marx, Karl“dc:BibliographicResourcedc:Agentdc:c...
112SKOS – Simple KnowledgeOrganisation System• formale Sprache zur Kodierung vonWissensorganisationssystemen wieOntologien...
Web of Linked DataRDF + Sprache zur Auszeichnung der Beziehungen (z.B. SKOS) +URIs für Entitäten = Web of DataCool URIs do...
114Daten für das Semantic Web veröffentlichen:Linked (Open) DataGrundsätze von Linked Data1. Verwende URIs als Name für Ob...
Web of Linked DataSeite 115200720092011
Linked Data in BibliothekenSeite 116Warum?• Sichtbarkeit im Webmaximieren• Bestände leichter auffindbarmachen• Nachnutzbar...
Linked Data in BibliothekenBereitstellen und Nutzen von kontrollierten Vokabularen undOntologien in RDF• DBPedia:• Projekt...
Linked Data in BibliothekenBereitstellen von Tools• Culturegraph: Plattform für Dienste und Projekte rund um die ThemenDat...
119Metadata Registries• Identifikation existierender Elemente verschiedener Schemas und Application Profiles• Zur Nachnutz...
Metadata RegistriesCross-Domianhttp://metadataregistry.org/Domian-specifichttp://dcmi.kc.tsukuba.ac.jp/dcregistry/Seite 120
Linked Data AnwendungenSeite 121
Zusammenfassung: Semantic Web• Semantic Web: das „verstehende Web“: Informationen werden auf der Ebeneihrer Bedeutung mite...
7. Metadaten-Management in der ZBWSeite 123
• Unterstützung beim Aufbau und Pflege derInformationssysteme des Informationszentrums• Koordination der Datenlieferungen•...
• Mitarbeit in Abteilungs-übergreifende Teams der ZBW• Mitarbeit in Drittmittel-Projekten• Enge Zusammenarbeit mit der Abt...
Aufgaben des Metadaten-ManagementsMetadatenstandards und Mapping• Expertise bzgl. Metadaten-Standards und Regelwerken• Era...
Koordination von DatenlieferungenWeitere Aufgaben des Metadaten-Managements• Bereitstellung /Auswertung vonTestdaten undDo...
Qualitätsmanagement und WeiteresWeitere Aufgaben des Metadaten-Managements• Mitarbeit System-Entwicklung: Funktionen, die ...
Anforderungen an Metadaten-Managerinnen und -ManagerbibliothekarischeMetadatenstandardsRegelwerke undFrameworksVokabulare ...
• Analytisches Denken• Spaß daran, sich ständig mit neuenAufgaben (Standards, Technologien)zu beschäftigen und weiterzubil...
8. Berufsfeld Metadaten-Management im Kontext derBibliothek der ZukunftSeite 131
ILOVEMETADATA• Querschnittsaufgabe• Kooperationen und Projekte• Hoch-spezialisierter Arbeitsbereich• Wissenschaftliche Bib...
Seite 133Ausbildungsinhalte (2011/2012),untersucht v. A. SchafrickBibliothek der ZukunftMetadatenstandards4144212110011110...
Seite 134„Metadaten-Management? Chancen?“Bibliothek der ZukunftStellenanzeigen für Bibliothekarinnen und -Bibliothekare (D...
Automatisierung• Automatische Indexierung und Klassifizierung• Automatische Strukturerkennung von elektronischen Dokumente...
Seite 136„Wer geht denn in die Bibliothek? Ist doch alles im Internet“Bibliothek der ZukunftSeite 136„Zur Bibliothek“, bmg...
Buchlose Bibliothek wächst und gedeihtBibliothek der ZukunftSeite 137
What is our role?Bibliothek der Zukunfthttp://thinklinks.files.wordpress.com/2013/03/beyondthepdf2_day1_hires.jpgMetadaten...
What is our role?Bibliothek der Zukunfthttp://thinklinks.files.wordpress.com/2013/03/beyondthepdf2_day1_hires.jpgForschung...
What is our role?Bibliothek der Zukunfthttp://thinklinks.files.wordpress.com/2013/03/beyondthepdf2_day1_hires.jpgInformati...
What is our role?Bibliothek der ZukunftSeite 141
Auf Du und Du mit Dublin Core & Co.k.jeude@zbw.eu„Metadata is a love note to the future”, Cea.,https://secure.flickr.com/p...
Seite 143LiteraturSeite 143Berners-Lee, Tim: Design Issues. Architectural and philosophical points, 6. Januar 1997http://w...
LiteraturNational Information Standards Organization (U.S.). (2004): Understanding metadata. Bethesda, MD: NISOPress. (htt...
WebressourcenK.I.M. Kompetenzzentrum Interoperable Metadaten: http://www.kim-forum.org/BlogsMetadata Matters: Bloggerin: D...
WebressourcenFortbildungK.I.M. Kompetenzzentrum Interoperable Metadaten: http://www.kim-forum.org/Hyperlinked Library MOOC...
Metadatenstandards• Dublin Core: www.dublincore.org• Pica3/Pica+: (Katalogisierungsrichtlinie des Gemeinsamen Bibliotheksv...
Upcoming SlideShare
Loading in …5
×

Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

2,041 views
1,956 views

Published on

1. Was sind Metadaten? Welche Typen gibt es? Wo sind sie zu finden? Welche Aufgaben haben sie?
2. Bestandteile und den Aufbau von Metadatenstandards. Beispiele für Metadatenstandards Ausflug zu XML.
3. Unterschied zwischen Metadaten-Standards und Metadaten-Schemas. Application Profiles
4. Mappings und Crosswalk. Typische Mappingprobleme
5. Austausch von Metadaten: Schnittstellen.
6. Metadaten im Semantic Web
7. Metadaten-Management in der ZBW
8. Thesen zur Zukunft der Bibliothek und welche Rolle das Berufsfeld Metadaten-Management dort spielen kann

Erweiterter Foliensatz einer Fortbildung für Studierenden / BibliothekarInnen an der UB Graz, April 2013

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
2,041
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
20
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

  1. 1. Die ZBW ist Mitglied der Leibniz-GemeinschaftAuf Du und Du mit Dublin Core & Co. –Berufsfeld Metadaten-Management im Kontext der Bibliothekder ZukunftKirsten Jeude12.04.2013Metadaten-Management im Leibniz-Informationszentrum Wirtschaft„metadata“ Shira Golding, https://secure.flickr.com/photos/boojee/3743753784/in/photostream
  2. 2. Seite 2Auf Du und Du mit Dublin Core & Co. – Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft1. Was sind Metadaten?2. Metadatenstandards (inkl. Exkurs XML)3. Application Profiles und Interoperabilität4. Mapping5. Schnittstellen6. Metadaten im Semantic Web7. Metadaten-Management in der ZBW8. Berufsfeld Metadaten-Management im Kontext der Bibliothek derZukunftGliederung
  3. 3. 1. Was sind Metadaten?Seite 3
  4. 4. Was sind Metadaten?Definitionen über Definitionen• „… are (structured) data about data.“Miller, Eric: An introduction to the resource description framework. In: D-Lib Magazine, (May) 1998; Foulonneau, Muriel; Riley Jenn(2008): Metadata for Digital Resources; u.v.m.• „Unter Metadaten ("Daten über Daten") versteht man strukturierte Daten, mit deren Hilfe eineInformationsressource beschrieben und dadurch besser auffindbar gemacht wird.“SUB Göttingen Metadata Server• „… structured, encoded data that describe characteristics of information-bearing entities toaid in their identification, discovery, assessment, and management of the described entities“American Library Association´s Committee on Cataloguing• „… is any type of formal description of a resource, regardless of format“Mitchell, Nicole: Metadata Basics (The Southeastern Librarian, Fall 2006)• „…is cataloging done by men“Delsey, Tom, National Library of Canada• „… is machine understandable information about web resources or other things.“Berners-Lee, Tim: Design Issues. Architectural and philosophical points, 6. Januar 1997.• „An item of metadata is a relationship that someone claims to exist between two entities.“Foulonneau, Muriel; Riley Jenn (2008): Metadata for Digital Resources• „I like to think of metadata as data which removes from a user (human or machine) the needto have full advance knowledge of the existence or characteristics of things of potentialinterest in the environment“Lorcan Dempsey, zit. in: Foulonneau, Muriel; Riley Jenn (2008): Metadata for Digital ResourcesSeite 4
  5. 5. Metadata “is machine understandable information aboutweb resources or other things.“ (Tim Berners-Lee)Web-Ressourcen:Seite 5
  6. 6. Andere Dinge:Bücher und Zeitschriften etc.:Museums-Objekte:Bilder:Tonträger:Personen:Metadata “is machine understandable information aboutweb resources or other things.“(Tim Berners-Lee)Seite 6
  7. 7. Karteikarte im ZettelkatalogMetadaten – getrennt vom Objekt Metadaten – im Objekt enthaltenCIP (Cataloging inPublication)Datensatz in bibliographischer DatenbankHeader einer HTML-Seite mit MetadatenMetadata „is any type of formal description of a resource,regardless of format“ (Nicole Mitchell)Metadaten inForm von COinS(Mikroformat) inHTML-SeiteSeite 7
  8. 8. Metadata „are (structured) data about data“ (Eric Miller)Metadaten sind „Daten über Daten“Daten - Buch „Daten über Daten“Metadata / Marcia Lei Zeng and Jian QinZeng, Marcia Lei *1956-*Qin, Jian *1956-*London : Facet, 2008xvii, 365 p. : ill. ; 23cmIncludes bibliographical references and index1-85604-655-9, 978-1-85604-655-8 (pbk)MetadatenSTRUKTURIERTEMetadaten-SchemaTitelVerfasserSonstige beteil. PersonErschienen:UmfangAnmerkungISBNSchlagwörterSeite 8
  9. 9. Metadata „are (structured) data about data“ (Eric Miller)Metadatenformate(maschinen-lesbar)Bezeichner eines Merkmals(Menschen-lesbar)4000 Suchen mithilfe semantischer Metadaten (PICA3)021A $a Suchen mithilfe semantischer Metadaten (PICA+)331Suchen mithilfe semantischer Metadaten (MAB)245 00 $a Suchen mithilfe semantischer Metadaten (MARC21)<titleInfo><title>Suchen mithilfe semantischer Metadaten</title></titleInfo>(MODS)Grundsätzlich und pragmatischSeite 9
  10. 10. PPN:Titel:Verfasser:Sonst. Personen:Erschienen:Umfang:Anmerkung:ISBN:Schlagwörter:Mehr zum Thema:Zeng, Marcia LeiVerfasser:Metadaten-ElementMetadatensatzfolgt Regeln (z.B. Nachname Komma Leerzeichen Vorname)Element-Wert571230652Metadata / Marcia Lei Zeng and Jian QinZeng, Marcia Lei *1956-*Qin, Jian *1956-*London : Facet, c2008xvii, 365 p. : ill. ; 23cmIncludes bibliographical references and index1-85604-655-9, 978-1-85604-655-8 (pbk) : £39.95*Metadaten / *MetadataDewey-Dezimalklassifikation: 025.3Metadata „are (structured) data about data“Seite 10
  11. 11. Metadata is „[…] to aid in their identification, discovery,assessment, and management of the described entities“AUFGABEN von Metadaten (FRBR User Tasks)1. Verlässliches FINDEN ermöglichen: Recherche nach vom Benutzerfestgelegten Kriterien.2. IDENTIFIZIEREN: Unterscheiden, was verschieden ist, z.B. Unterscheidungvon zwei Texten oder Aufnahmen, die mit demselben Titel veröffentlichtwurden.3. AUSWÄHLEN: Zusammenführen, was zusammengehört, denBenutzerbedürfnissen entsprechend : z.B. Auswahl eines Texts in einerSprache, die der Benutzer versteht4. Zu Gewähltem ZUGANG ERHALTEN: z.B. Bestellung für eine PublikationabgebenFRBR: Functional Requirements for Bibliographic RecordsSeite 11
  12. 12. Metadata is „[…] to aid in their identification, discovery,assessment, and management of the described entities“TYPEN von MetadatenDeskriptive Metadaten : Beschreiben eine Ressource zum Zweck der Entdeckung,der Identifikation, der Auswahl und des ZugangsStrukturelle Metadaten: Beschreiben die interne Organisation einer Ressource.Beschreiben, wie miteinander verbundene Objekte miteinander in Beziehungstehen, z.B. wie Seiten geordnet werden müssen, damit ein Kapitel entsteht.Administrative Metadaten: „meta-metadata“; Informationen, die helfen eineRessource zu verwalten:Technische Metadaten: Enthalten Informationen über Format und DateitypMetadaten für das Rechtemanagement: Enthalten Informationen, die für dieBerechtigung des Zugriffs und Informationen über das geistige Eigentum dienenHerkunfts-Metadaten (Provenienz-Metadaten): Metadaten über die Herkunft derRessource: Feststellung der Vertrauenswürdigkeit; Bewahrung der NutzbarkeitSeite 12
  13. 13. • Formale Beschreibung einer Ressource• Strukturierte „Daten über Daten“• Ein Metadatensatz besteht aus Metadaten-Elementen und den dazugehörigenWerten• Für eine Vielzahl an Dingen (Texte, Bilder, Objekte, Personen, etc.)• Getrennt vom beschriebenen Objekt oder enthalten im Objekt• menschen-lesbar, maschinen-lesbar (und maschinen-interpretierbar)• Aufgaben von Metadaten sind die Unterstützung beim Finden, Identifizieren,Auswählen einer Ressource, sowie Zugang zu ihr erhalten• Es gibt verschiedene Typen von Metadaten: deskriptive, administrative,technische Metadaten, Struktur- und Provenienz-Metadaten, Metadaten für dasRechtemanagementSeite 13Zusammenfassung: Was sind Metadaten?
  14. 14. 2. MetadatenstandardsSeite 14
  15. 15. MetadatenstandardsStandards?"The nice thing about standards is that you have so many tochoose from. Furthermore, if you do not like any of them, youcan just wait for next years model."Quelle: Andrew Tanenbaum, Computer Networks, 2nd edn., p. 254Ein Metadatenstandard• sorgt für: Konsistenz der Metadaten• verbessert: Metadatennutzung• erlaubt: Austausch von Metadaten und die Verlinkung vonObjekten anwendungsübergreifendSeite 15
  16. 16. Metadatenstandards„A content metadata standard is defined as an open specification that itemizes a setof elements and their meanings. Each element is tagged with an identifier (e.g.,"Title", "Author") that distinguishes the element from other elements within thestandard. In addition, each element has a set of constraints or rules specifying theallowable content of the element and its relationship to other elements within thestandard.“ (http://www.niso.org/publications/white_papers/crosswalk/ )"A metadata schema provides a formal structure designed to identify the knowledgestructure of a given discipline and to link that structure to the information of thediscipline through the creation of an information system that will assist theidentification, discovery, and use of information within that discipline" . AmericanLibrary Association Committee on Cataloging: Description and Access (CC:DA) Task Force onMetadataSeite 16
  17. 17. Aufbau eines Metadaten-Standards amBeispiel Dublin CoreDublin Core Metadata Initiative (DCMI)Zunächst für die Beschreibung vonWebressourcen15 Kern-Elemente (“Core”): Title, Creator,Subject, Description, Publisher,Contributor, Date, Type, Format, Identifier,Source, Language, Relation, Coverage,and RightsAlle optional und wiederholbarReihenfolge der Elemente beliebighttp://dublincore.org/documents/dces/Title ”Metadata Demystified”Creator ”Brand, Amy”Creator ”Daly, Frank”Creator ”Meyers, Barbara”Subject ”metadata”Description ”Presents an overview ofmetadata conventions in publishing.”Publisher ”NISO Press”Publisher ”The Sheridan Press”Date ”2003-07"Type ”Text”Format ”application/pdf”Identifier ”http://www.niso.org/standards/resources/Metadata_Demystified.pdf”Language ”en”Seite 17
  18. 18. Dublin Core Metadata Element SetDublin Core Simple: 15 Elemente: titel Titel creator Verfasser oder Urheber contributor Mitarbeiter publisher Verlag subject Thema des Inhalts (Sacherschließung) date Datum coverage Abdeckung description Beschreibung language Sprache type Art, Gattung format Format identifier Eindeutige Identifizierung relation Beziehung source Quelle rights RechteSeite 18
  19. 19. Dublin Core - MetadatenelementeElement (property): Merkmal / Eigenschaft einer Ressource, wie Titel,Autor etc.„An Element is a property of a resource. As intended here, "properties" areattributes of resources – characteristics that a resource may "have", suchas a Title, Publisher, or Subject.“ (DCMI Glossary)Seite 19
  20. 20. Dublin Core Element Set - ÜbungDC element valuetitlecreatorcontributorpublishersubjectdatecoverageDC element valuedescriptionlanguagetypeformatidentifierrelationrightsSprache: rumänisch, englischSeite 20
  21. 21. Dublin Core Element Set - Übung: LösungSprache: rumänisch, englischDC element valuetitle Intelectuali Români implicati îndezvoltarea civilizatiei economicetitle Romanian intellectuals inolved inthe development of the economiccivilizationcreator Saizu, Ioancontributor -----publisher Ed. Acad. Romanesubject Wirtschaftsgeschichtesubject Rumäniendate 2003coverage RumänienDC element valuedescription --------------language rumänischlanguage englischtype Buch / Bookformat 308 S.identifier 973-270983-9relation ---------------rights ---------------Seite 21
  22. 22. Dublin Core Metadata Terms15 Elemente bieten wenig Differenzierung. Was tun? Dublin Core Metadata TermsElement Refinement: Verfeinerung der Bedeutung eines ElementsDie Refinements können als Unterbegriff des Elements verstanden werden.Beispiel: Element „Description“ mit den Refinements „Abstract“ oder „Table ofContents“55 Terms: http://dublincore.org/documents/dcmi-terms/dc.descriptionKann jegliche Art von Beschreibung enthaltendcterms.abstractHier sind nur Abstracts zulässigdcterms.tableOfContentsHier sind nur Inhaltsverzeichnisse zulässigSeite 22
  23. 23. Encoding SchemesWeitere semantische und syntaktische Differenzierung bieten Encoding SchemesWie, in welcher Form wird das Element beschrieben?Kodierungs-Schema, kontextabhängige Informationen oder Parsing-Regeln (Syntax-Analyse-Regeln), die dazu beitragen, den Wert eines Elements zu interpretieren.Semantics is about meaning; syntax is about formWeibel, S. et.al. (2002)Semantik: Semantik (von Altgriechisch σημαίνειν sēmaínein ‚bezeichnen‘, ‚zum Zeichen gehörig‘),auch Bedeutungslehre, nennt man die Theorie oder Wissenschaft von der Bedeutung der Zeichen.Zeichen können in diesem Fall Wörter, Phrasen oder Symbole sein. Die Semantik beschäftigt sichtypischerweise mit den Beziehungen zwischen Zeichen und Bedeutungen dieser Zeichen.[http://de.wikipedia.org/wiki/Semantik]Syntax: die rein formalen Beziehungen zwischen (sprachlichen) Zeichen, z.B.Datumsangabe: soll in der Syntax YYYY-MM-DD erfolgen.Seite 23
  24. 24. Vocabulary Encoding SchemesVocabulary Encoding Scheme (VES):Beschreibt, dass der Wert eine Bezeichnung aus einem kontrolliertenWortschatz ist, z.B. Wert = Klasse (Notation) aus der DDC, Deskriptor ausdem Standard Thesaurus Wirtschaft (STW), etc.Bsp. Element „subject“ mit dem Encoding Scheme „DDC“<dcterms:subject xsi:type „dcterms:DDC“>330</dcterms:subject>Achtung! Jetztkommt ein Thema,und zudem stammtder Wert aus derDDCSeite 24
  25. 25. Vocabulary Encoding Schemes:Klassifikationen – Thesauri – Schlagwörter und mehrKlassifikationenDDC Dewey Decimal ClassificationUDC Universelle DezimalklassifikationBK BasisklassifikationLCC Library of Congress ClassificationRVK Regensburger VerbundklassifikationJEL: Klassifikation des Journal of Economic LiteratureThesauriSTW Standard Thesaurus WirtschaftTGN Getty Thesaurus of Geographic NamesTheSoz Theaurus SozialwissenschaftenIBLK Europäischer Thesaurus InternationaleBeziehungen und LänderkundeMeSH Medical Subject HeadingsAGROVOC Agrarwissenschaften, Forstwirtschaft,Fischerei, Nahrungsmittel und verwandter GebieteINFODATA Thesaurus InformationswissenschaftNormdateien (authority files)GND Gemeinsame Normdatei (Personen,Körperschaften , Schlagwörter)LCSH Library of Congress SubjectHeadingsRameau Normdatei der BnFVIAF Virtual International Authority FileSonstiges kontrolliertes VokabularIMT Internet Media Type (auch MIME-Type ) klassifiziert den Dateitypz.B. für DC-Element „format“DCMIType VocabularyRessourcentypez.B. für DC-Element „type“Seite 25
  26. 26. Syntax Encoding SchemesSyntax Encoding Scheme (SES):Gibt an, wie die Zeichenketten, die bei der Beschreibung eines Objektsverwendet werden, aufgebaut sein müssen und regelt damit die syntaktischeStruktur der Beschreibung, z.B. „JJJJ-MM-TT" als Standardausdruck einesDatums.Bsp. Element „Date“ mit Encoding Scheme „JJJJ-MM-TT“<dcterms:date xsi:type dcterms:W3CDTF>2007-12-04</dcterms:date>Achtung! Jetztkommt ein Datumund außerdem hates das Format JJJJ-MM-TTSeite 26
  27. 27. Syntax Encoding SchemesNormen und weitere StandardsISO 8601 Data elements and interchange formats - Information interchange -Representation of dates and timesW3C-DTF „defines a profile of ISO 8601, the International Standard for therepresentation of dates and times „DCMI Period Encoding Scheme (Zeiträume): „for identifying a single time interval using its limits „DCMI BOX Encoding Scheme (geographische Räume): „method for identifying a region of spaceusing its geographic limits and representing that information as a value string.“DCMI Point Encoding Scheme (geographischer Punkt): „a mechanism for indicating a point inspace using its geographic coordinates and representing that information as avalue string. „URIs (Uniform Resource Identifier)URL Uniform Resource LocatorURN Uniform Resource NameHandle HandleDOI Digital Objekt IdentifierPURL Persistent Uniform Resource LocatorWeitere IdentifierISBN International Standard Book Number:ISBN 978-3-7657-2781-8ISSN International Standard Serial Number:ISSN 4177-0815BICI Book Item and Component IdentifierSICI Serial Item and Contribution Identifier(ANSI/NISO standard Z39.56).ISMN International Standard Music Number Seite 27
  28. 28. Syntax and Vocabulary Encoding SchemesRFC 3066: Vorläufer der ISO-639ISO 639 Sprachen (Sprachcodes):ISO 639-1 (Alpha-2 Code)ISO 639-2 (Alpha-3 Code)ISO 639-3 (Alpha-3 Code for comprehensive coverage oflanguages)Semantisch im Hinblick auf das enthaltene Vokabular.Syntaktisch im Hinblick auf die Kodierung in bestimmter Anzahl Zeichen automatisch prüfbar (Plausibilitätsprüfung).http://upload.wikimedia.org/wikipedia/commons/thumb/9/95/ISO_639_Schematische_Darstellung.svg/700px-ISO_639_Schematische_Darstellung.svg.pngSeite 28
  29. 29. Metadaten-Standards und -Schemas definieren zulässige Elemente und ihreBedeutung (Semantik), sowie ihre Form (Syntax):• Sachliche Definition des Inhalts (content rules). Diese besagen, wie die Wertefür das Datenelement ausgewählt und repräsentiert werden.• Regeln über die Form des Feldinhalts (representation rules): z.B. Regelnüber die Groß- und Kleinschreibung• Regeln über die Syntax des Inhalts, also wie der Inhalt codiert werden muss:z.B. ein Datum muss immer in der Form YYYY-MM-TT eingegeben werden(syntax encoding scheme)• Regeln über die zulässig Inhalte (content values), z.B. der Inhalt des Feldesmuss aus einem kontrollierten Vokabular, wie z.B. dem STW, der DDC, derUDC, der BK, etc. stammen (vocabulary encoding scheme)• Angaben zur Wiederholbarkeit und Verpflichtung eines Elements• Angaben wie verschiedene Elemente miteinander in Beziehung stehenZusammenfassung: Aufbau eines MetadatenstandardsSeite 29
  30. 30. Zusammenfassung: Aufbau von Dublin Core• Dublin Core Metadata Element Set = 15 Elemente (Dublin Core Simple)• Dublin Core Metadata Terms (Dublin Core Qualified)• Element Refinements = 55 Elemente• Encodings Schemes und Refinements sind „Qualifier“• Dublin Core Qualifier: http://dublincore.org/documents/usageguide/qualifiers.shtml• Dublin Core auf Deutsch: KIM - Kompetenzzentrum Interoperable MetadatenSeite 30
  31. 31. Prinzipien von Dublin CoreOne-to-One-Principle - Das 1:1-Prinzip:Jede Beschreibung (decription) steht für ein und nur ein Objekt (Ressource), z.B.eine Beschreibung für einen gedruckten Text, eine weitere für die elektronischeAusgabe.Dumb-Down-Principle – Prinzip der Vereinfachung:Die Bedeutung eines Elements kann verfeinert, aber nicht erweitert werden.Beispiel: Element „description“ mit den refinements „ToC“ oder „Abstract“ (dumbdown der Eigenschaft und des Wertes)Appropriate Values – Angemessene / entsprechende Inhalte:„Best Practice“ : menschen- und maschinelesbar.Seite 31
  32. 32. Prinzipien von Dublin Core1. Simplicity: Einfachheit der Beschreibung2. Semantic interoperability: Semantische Interoperabilität3. International consensus: Internationale Übereinkunft über Standard4. Interdisziplinary: Interdisziplinär einsetzbar5. Extensibility: Erweiterbarkeit, keine Beschränkung auf DC-Elemente6. Modularity: Modular, im Baukasten-Prinzip verwendbar7. Modifiability: Jedes Element kann durch die Angabe eines Attributs verändert werden8. Optionality: keine Pflichtfelder9. Repeatability: Alle Elemente können mehrmals in einem Datensatz auftreten10. Independency: Unabhängigkeit von einer spezifischen SyntaxSeite 32
  33. 33. Metadatenformatebibliographisch / deskriptivMetadatenstandard ist nicht gleich MetadatenformatDublin Core Metadatenstandard• als .txt-Datei• als .html- oder .xhtml-Datei• als .xml-Datei• als .rdf-StatementsSyntax Guidelines für die korrekte Konstruktion von DC-Datensätzen in dieseFormate: http://dublincore.org/specifications/Grundsätzlich:• Metadatenstandards als Text-Standard entwickeltund nachträglich weitere Repräsentationen• Originäre XML-Standards• Proprietäre Formate, z.B. .mrc für MARC Metadatenformat, z.B. DC-DS-XMLSeite 33
  34. 34. Exkurs XML Extensible Markup Language = erweiterbare Auszeichnungs-Sprache Beispiele für Auszeichnungssprachen: HTML (Hypertext MarkupLanguage), SGML (Standard Generalized Markup Language),XML Standard zur Erstellung von maschinen- undmenschenlesbaren Dokumenten Der Standard wurde vom World Wide Web Consortium (W3C)definiert Befehle in Form von semantischen tags:<titel> </titel>, <date> </date>, <creator></creator><befehl>Information</befehl>Seite 34
  35. 35. Unterschiede zwischen HTML und XMLUnterschied zu HTML Tags sind nicht festgelegt. Sie werden fürspezielle Anwendung definiert:Datenbank 1: <autor>Marx, Karl<autor/>Datenbank 2: <verfasser>Marx, Karl<verfasser/> HTML „Kann man sehen“ = Auszeichnung derStrukturierung von Inhalten XML transportiert Semantik = logischeAuszeichnung der InhalteGemeinsamkeiten Auszeichnungssprachen Stammen von SGML ab Befehle in Form von tags Textformat (im Sinne vonNicht-binär)<h1>Metadaten für Einsteiger</h1>Jetzt kommteineÜberschrift:20 pt., fettEndeÜberschrift:Absatz-schriftartHTML<titel>Metadaten für Einsteiger</titel>Hier kommtder Titel derRessourceHier endetder Titel derRessourceXMLPräsentationBedeutungSeite 35
  36. 36. XML - Eigenschaften• Trennt strikt zwischen Daten und Verarbeitung der Daten: Welche Software fürdie Verarbeitung verwendet wird, ist nicht festgelegt.• XML = Textformat: erleichtert es Menschen die enthaltene Information zu verstehenund macht unabhängig von bestimmten technischen Implementierungen• Für hoch-strukturierte Daten (aus relationalen Datenbanken) und semi-strukturierte Daten (von Menschen verfasste Texte)• Einfach: leichter zu erlernen und leichter zu implementieren als Vorfahren (SGML).csv vs. .xmlSeite 36
  37. 37. XML - Eigenschaften• Flexibel: da „tags“ (Bezeichner) in XML nicht festgelegt sind, kann jeder Betreibersein eigenes Format entsprechende seiner Bedürfnisse erstellen.• Flexible vs. Interoperabel: DB1: <verfasser>, DB2: <autor>, aber identischeSemantik• Metadatenformate ausgedrückt in XML:100 1 $aSchultz, Theodore Paul,$0(DE-601)060006277.245 10 $aChanging world prices, womenswages, and the fertility transition:$bSweden, 1860 - 1910 /$cT. PaulSchultz.MARC21MARC21 in XMLSeite 37
  38. 38. Metadatenstandards in XMLMetadata Object and Description Schema• Originärer XML-Standard• Entwickelt als Kompromiss zwischen dem komplexen MARC21 und demeinfachen Dublin Core• Für elektronische Ressourcen• Entwickelt vom Network Development and MARC Standards Office der LoC• Bildet Teile der MARC21-Elemente ab, bei Standard-KonvertierungInformationsverlustSeite 38
  39. 39. Machine-Readable Cataloging - MARC21Internationales Austausch- undSpeicherformat• für bibliographische Nachweisein Bibliothekskatalogen• Entwickelt von der LoC• ANSI/NISO Z39.2• Viele Dialekte1000 Elemente mit Unterfeldernund Indikatoren• ca. 60 am häufigstenverwendete• Fixed Fields (00X)Kat.-Regelwerk: AARC2Format: .mrc / .marcTools: Marc-Editor „MarcEdit“xxxxxnaa a22yyyyy c 4500001 592906469003 DE-601005 20090728100724.0008 090304s2008 000 0 eng d016 7 $a7153508$2DE-600040 $aGBVCP$bger$erakwb041 0 $aeng100 1 $aMerkl, Christian$0(DE-601)533312205$0(DE-588)133059545245 10$aEscaping the unemployment trap :$bthe case ofEast Germany /$cChristian Merkl; Dennis J. Snower300 $bgraph. Darst.650 7$81.1x$aLangzeitarbeitslosigkeit$0(DE-601)091374367$0(DE-STW)18124-6$2stw650 7$81.2x$aArbeitsproduktivität$0(DE-601)091347742$0(DE-STW)10440-1$2stw[…]700 1 $aSnower, Dennis J.$eAuthor$4aut$0(DE-601)366752960$0(DE-588)124825109773 08$iIn: $tJournal of comparativeeconomics$dAmsterdam : Elsevier$gVol. 36, No. 4 (2008),p. 542-556$q36:4<542-556$w(DE-601)130445541$x0147-5967773 08$iIn:900 $aGBV$bZBW Kiel <206>952 $d36$j2008$e4$c12$h542-556954 $a26$b923675930$c01$x0206http://www.loc.gov/marc/Seite 39
  40. 40. 650 = SachschlagwortIndikator 1 = undefiniertIndikator 2 = Quelle des Vokabular wird spezifiziert in Unterfeld 2Unterfeld a = DeskriptorUnterfeld 0 = Identifier der Ressource in der Datenbank „DE-601“ (GBV)Unterfeld 2 = Deskriptor stammt aus dem STWUnterfelder und IndikatorenSeite 40
  41. 41. Project of Integrated Catalogue Automation - PICAPICA+: Datenbank-FormatPICA3: Katalogisierungssichtu.a. GBV, SWD, HEBIS, DNBfür bibliographische Nachweise inBibliothekskatalogenca. 1300 Informationseinheiten:Elemente mit UnterfeldernVerschiedene Satztypen, diemiteinander verknüpft sind(Hierarchische Datensätze)Kat.-Regelwerk: RAK (D)001@ $026$aU001A $00206:04-03-09001B $00206:10-03-09$t10:42:23.000001D $00206:04-03-09001U $0utf8001X $00002@ $0Asu003@ $0592906469010@ $aeng011@ $a2008021A $aEscaping the unemployment trap$dthe case ofEast Germany$hChristian Merkl; Dennis J. Snower027D/00 $aJournal of comparativeeconomics$pAmsterdam$nElsevier$00147-5967$z7153508028A $dChristian$aMerkl$9533312205$8Christian@Merkl ;PND-ID: 133059545028B/01 $dDennis J.$aSnower$9366752960$8DennisJ.@Snower ; PND-ID: 124825109031A $d36$j2008$e4$c12$h542-556034M $agraph. Darst.039B $cIn$9130445541$8Journal of comparativeeconomics. - Amsterdam : Elsevier$x200800000360004458039B $cIn$7!562253327!045D/00 $9091374367$8Langzeitarbeitslosigkeit045D/00 $9091347742$8Arbeitsproduktivität045D/00 $9091384966$8Qualifikation045D/49 $b49101B $004-03-09$t09:15:56.000Seite 41
  42. 42. Pica3 - Pica+Katalogisierungssicht Pica3Datenbanksicht PICA+Seite 42
  43. 43. 43Pica3 - Pica+Steuerzeichenin Pica3 sindUnterfelder (subfields)in Pica+SubfieldEine individuelle Informationseinheit ineiner strukturierten Datei.Eine Untergliederung eines Feldes.Beispiel: ein Feld für Titelangaben hatmehrere Unterfelder: HST, Zusatz,VerfasserangabeSeite 43
  44. 44. Beispiele für MetadatenstandardsMetadatenstandards1.für bibliographische Ressourcen: z.B. Pica+, MODS, DC2.für den Datentausch: z.B. MAB 2, MARC21, ONIX3.für Multimedia-Objekte: z.B. MIX (Bilder), MPEG-7/21 (Video)4.für digitale Sammlungen: z.B. METS (Wrapper)5.für sozialwiss. Forschungsdaten: z.B. DDI, SDMX6.für Archive (Findbücher): z.B. EAD7.für die Langzeitarchivierung: z.B. PREMIS8.für die Strukturauszeichnung von Dokumenten: z.B. TEI9.für Museumsobjekte: z.B. LIDOSeite 44
  45. 45. Seeing Standards: A Visualization of the MetadataUniverse (Jenn Riley)http://www.dlib.indiana.edu/~jenlrile/metadatamap/seeingstandards.pdf Seite 45
  46. 46. DOKUMENTATION eines Metadaten-Standards• „Uses and Features“• „Usage Guidelines“• „Implementation Guidelines“• „Schemas and Outline“• „Data Dictionary“• “Specification”• Encoding Guidelines• Code Lists• Beispiel-Datensätze• Tutorials• Mailinglisten und Foren• Einsatzgebiet und –möglichkeiten• Anwendungsregelwerk• Aufzählung und genaue Definitionder Elemente• Kodierungs-Regeln• Kodierungs-Listen• Beispiel-Datensätze• Anleitungen mit Übungen• Mailinglisten und ForenMetadatenstandards kennenlernen100 1 $aMerkl,Christian$0(DE-601)533312205$0(DE-588)133059545Seite 46
  47. 47. • Metadatenstandards sorgen für die Konsistenz der Metadaten und verbesserndamit Nutzung und Austausch• Ein Metadatenstandard ist aufgebaut aus Metadaten-Elementen (Eigenschaft /Merkmal einer Ressource; property)• Metadatenelemente werden definiert hinsichtlich ihrer Bedeutung (Semantik)und hinsichtlich der Form (Syntax)• Es gibt Vocabulary Encoding Schemes (Klassifikationen, Thesauri,kontrolliertes Vokabular, Normdateien, Schlagwortlisten)• und Syntax Encoding Schemes (Normen, URIs, weitere Identifier) zurgenaueren Definition von Metadatenelementen• Zur Definition eines Elements gehört auch eine Aussage über dieWiederholbarkeit und Verpflichtung eines Elements, sowie darüber, wieeinzelne Elemente miteinander in Beziehung stehen.Seite 47Zusammenfassung: Metadatenstandards
  48. 48. • Metadatenstandard ist nicht gleich Metadatenformat: ein Standard (z.B. DublinCore) kann in verschiedenen Formaten auftreten: z.B. DC-HTML, DC-XML,DC-RDF• XML eignet sich, weil es menschenlesbar und gleichzeigt maschinelesbar ist,weil es gut für hoch-strukturierte Daten einsetzbar ist und weil es flexibel ist, dadie Tags nicht festgelegt sind.• Einige Standards weisen spezielle strukturelle Besonderheiten auf: Subfields,Indikatoren, externe und interne Sichten.• Es gibt eine Vielzahl von Standards je nach Einsatzzweck und/oder Typ derRessource• Wenn man Standards kennenlernen möchte, bedient man sich der Standard-DokumentationenSeite 48Zusammenfassung: Metadatenstandards
  49. 49. 3. Application ProfileSeite 49
  50. 50. PPNTitelVerfasser Sonst. Beteil.PersonUmfangISBNSchlagwörterFussnotenVerwandte RessourcenURLMetadaten-Standard einer „Community“ / Domain,z.B. PICA, Dublin Core, DDI etc.DOITongeschlechtEpocheBildformatAnzahl PixelPrimärkörperschaftFormatURNKompressionHandleRegieMetadatenstandard und MetadatenschemaMetadatenformat/-Schema einerbestimmtenAnwendung, z.B.Repository fürPublikationenMetadaten-Elementeeiner realenInformations-einheitTitel:Verfasser:Sonst. Personen:Körperschaft:Erschienen:Umfang:Anmerkung:ISBN:Schlagwörter:URL:Seite 50
  51. 51. Metadaten-Dokumentation für individuelle Anwendungen:Application Profiles“In DCMI usage, an application profile is a declaration of the metadata terms an organization,information resource, application, or user community uses in its metadata. In a broader sense, itincludes the set of metadata elements, policies, and guidelines defined for a particular application orimplementation. […] An application profile is not considered complete without documentation thatdefines the policies and best practices appropriate to the application.” (DCMI Glossary)Application Profile (AP): Metadaten-Profil, -schema einer bestimmten Anwendung,das Elemente aus einem oder mehreren Standards enthältFestlegung der• Elemente• Unterfelder/Refinements• Encoding Schemes• Wiederholbarkeit• PflichtfelderDokumentation der• Struktur• Richtlinien• Best Practicehttp://www.dlib.org/dlib/june06/chan/06chan.htmlSeite 51
  52. 52. AP - Grundsätzliche ÜberlegungenWelchen Zweck hat die Anwendung?• Verwaltung von Daten für den“Hausgebrauch”?• Organisations-übergreifenderDatenaustausch?• Integration der Daten inWebdienste?• …Welche Funktionen soll dieAnwendung unterstützten?• Erweiterte Suche?• Browsing?• Facetten?• …Was für Objekte werden beschrieben?• Text, Personen, Filme …?• …Welche Beziehungen gibt es zwischenden Objekten?• Ist Urheber von …• Ist Teil von …• …Was brauche ich, um meine Ziele undAnforderungen umzusetzen?• Welche Metadatenterme?• Was für Encoding Schemas?• Was für Einschränkungen?Seite 52
  53. 53. Praxis – Kriterien für die FormatauswahlErst prüfen• Gibt es für meine Anwendungbereits einen Standard?• Welcher Standard wird in meinerCommunity genutzt?• Welcher Standard passt zu meinerAnwendung / in meinem Kontext?• Welcher Standard entspricht amehesten meinen Anforderungen?– “Use elements and qualifiers to meet the needs of your local context, but ...– remember that your metadata may be interpreted by machines and people, so ...– consider whether the values you use will aid discovery outside your local context.“Greenberg, J. “Dublin Core History and Basics”, Tutorial ASIST DC 2008 (http://dc2008.de/wpcontent/uploads/2008/09/tutorial-1.pdf)Seite 53Metadata Madness wheel, Musebrarian, http://www.flickr.com/photos/musebrarian/3289649684/
  54. 54. Praxis – Kriterien für die Auswahl des/der Standard(s)– “Use elements and qualifiers to meet the needs of your local context, but ...– remember that your metadata may be interpreted by machines and people, so ...– consider whether the values you use will aid discovery outside your local context.“Greenberg, J. “Dublin Core History and Basics”, Tutorial ASIST DC 2008 (http://dc2008.de/wpcontent/uploads/2008/09/tutorial-1.pdf)Daran denken• Auswahlkriterien: Anforderungen und Nachnutzbarkeit der Anwendung• Dokumentation ist wichtig• Verletze niemals die semantischen Grenzen eines StandardsJa! zur semantischen VerfeinerungNein! zur semantischen ErweiterungSeite 54
  55. 55. dcterms.creatorApplication Profile - Namensräume DCMI namespace: "a collection of DCMI terms URIs“ (DCMI term URI: "TheURI that identifies a term..“)„The purpose of an application profile is to adapt or combine existing schemas intoa package that is tailored to the functional requirements of a particular application,while retaining interoperability with the original base schemas.“ Weibel, S. et.al. (2002)55dc.creatorSeite 55
  56. 56. Application Profile - Namensräume Namensräume: können für spezifische Anwendungen definiert werden Die Deklaration von Namensräumen erlaubt Designern von Metadaten-Schemas denKontext, in dem ein bestimmtes Element verwendet wird, genau zu benennen undsichert zu, dass dieses Element im Namensraum eindeutig ist.dcdc.titeldc.creatordc.subjectdc.descriptiondctermsdcterms.dateIssueddcterms.abstractdcterms.coveragedcterms.spatialvascodavap.placeOfPublicationvap.editionvap.thematicvap.ddcmeinAPdc.titeldc.creatordc.Subjectdcterms.dateIssueddcterms.abstractdcterms.coveragevap.placeOfPublicationvap.editionvap.thematicvap.ddcNamensräumeNamespace Policy for the Dublin Core Metadata Initiative (DCMI)http://www.dublincore.org/documents/dcmi-namespace/Seite 56
  57. 57. Application-Profile - Singapore Framework„...a framework for designing metadata applications for maximum interoperabilityand for documenting such applications for maximum reusability.“(http://dublincore.org/architecturewiki/SingaporeFramework/)• Das Singapore Framework für Dublin-Core-Anwendungsprofile nennt dieRahmenbedingungen um Metadatenanwendungen möglichst interoperabel zugestalten und so zu dokumentieren, dass sie nachnutzbar sind.• Es definiert die Komponenten, die erforderlich und hilfreich sind, um einAnwendungsprofil (Application Profile) zu dokumentieren.• Das Singapore Framework ist die Grundlage für die Beurteilung vonAnwendungsprofilen in Hinblick auf Vollständigkeit der Dokumentation und aufÜbereinstimmung mit den Prinzipien der Web-Architektur.Seite 57
  58. 58. Application Profiles - Singapore Frameworkhttp://www.dublincore.org/documents/singapore-framework/http://www.kim-forum.org/Subsites/kim/SharedDocs/Downloads/DE/Uebersetzungen/singaporeFramework.pdf?__blob=publicationFile (deutsch)• Funktionale Anforderungen(verpflichtend)• Domain-Modell(verpflichtend)• Beschreibungssatz-Profil(verpflichtend)• Nutzungsrichtlinien(fakultativ)• Richtlinien für diesyntaktische Kodierung(fakultativ)Seite 58
  59. 59. Zusammenfassung: Application Profile• Metadatenschemas, bzw. -profile bestehen aus Elementen aus einem odermehreren Metadatenstandards• Ein Applikation Profile ist die Festlegung der einsetzbaren Elemente und derenBedingungen (Encoding Schemes, Wiederholbarkeit, Verpflichtung, etc.) sowieder zu nutzenden Richtlinien.• Grundsätzliche Überlegungen: Zweck der Anwendung, Funktionen derAnwendung, beschriebene Objekte und Beziehungen zwischen Ihnen.• Man sollte eingeführte Standards nachnutzen und kann auch mehrereStandards kombinieren.• Um Elemente aus verschiedenen Standards eindeutig benennen zu könnenwerden Namenräume (namespaces) verwendet.• Eine Handreichung zur Erstellung optimaler Application Profiles bietet dasSingapore Framework der DCMI.Seite 59
  60. 60. Application Profile„The main goal of application profiles is to increase the"semantic interoperability" of the resulting metadatainstances within a community of practice, by goingbeyond the universal consensus of a single standard,without compromising the basic interoperability thatthe standard enables across the boundaries of thesecommunities.“[Special section on semantic interoperability in global information systems,ACM SIGMOD Record, Vol. 28, No. 1, March 1999.]Seite 60
  61. 61. InteroperabilitätInteroperabilität ist die Fähigkeit unterschiedlicher Informationssystememiteinander zu kommunizieren und so Metadaten möglichst effizient und sinnvollund mit einem minimalen Verlust an Information auszutauschen. systemübergreifender Austausch von Metadaten unter möglichst geringemAufwand.Problem:Austausch oder Integration von Daten, die inverschiedenen Standards vorliegenSeite 61
  62. 62. 62InteroperabilitätStrukturelle Interoperabilität• gegeben, wenn unterschiedlichenMetadatenschemas ein gemeinsa-mes Datenmodell zugrunde liegt(z. B. DCMI Abstract Model, FRBR).Syntaktische Interoperabilität• gegeben, wenn unterschiedlicheMetadaten-Schemas in einergemeinsamen Kodierungssyntax(z. B. XML, RDF) wiedergegebenwerden.Semantische Interoperabilität• gegeben, wenn unterschiedlicheMetadatenschemas eingemeinsames Vokabular(Metadatenstandard) verwendenSeite 62
  63. 63. Interoperabilität - Übung001@ $026$aU001A $00206:04-03-09001B $00206:10-03-09$t10:42:23.000001D $00206:04-03-09001U $0utf8001X $00002@ $0Asu003@ $0592906469010@ $aeng011@ $a2008021A $aEscaping the unemployment trap$dthe case ofEast Germany$hChristian Merkl; Dennis J. Snower027D/00 $aJournal of comparativeeconomics$pAmsterdam$nElsevier$00147-5967$z7153508028A $dChristian$aMerkl$9533312205$8Christian@Merkl; PND-ID: 133059545028B/01 $dDennis J.$aSnower$9366752960$8DennisJ.@Snower ; PND-ID: 124825109031A $d36$j2008$e4$c12$h542-556034M $agraph. Darst.039B $cIn$9130445541$8Journal of comparativeeconomics. - Amsterdam :Elsevier$x200800000360004458039B $cIn$7!562253327!045D/00 $9091374367$8Langzeitarbeitslosigkeit045D/49 $b49101B $004-03-09$t09:15:56.000Pica+MODSSeite 63Frage: Sind diese beiden Metadatenschemas in irgendeiner Hinsichtinteroperabel?
  64. 64. Interoperabilität - Lösung001@ $026$aU001A $00206:04-03-09001B $00206:10-03-09$t10:42:23.000001D $00206:04-03-09001U $0utf8001X $00002@ $0Asu003@ $0592906469010@ $aeng011@ $a2008021A $aEscaping the unemployment trap$dthe case ofEast Germany$hChristian Merkl; Dennis J. Snower027D/00 $aJournal of comparativeeconomics$pAmsterdam$nElsevier$00147-5967$z7153508028A $dChristian$aMerkl$9533312205$8Christian@Merkl; PND-ID: 133059545028B/01 $dDennis J.$aSnower$9366752960$8DennisJ.@Snower ; PND-ID: 124825109031A $d36$j2008$e4$c12$h542-556034M $agraph. Darst.039B $cIn$9130445541$8Journal of comparativeeconomics. - Amsterdam :Elsevier$x200800000360004458039B $cIn$7!562253327!045D/00 $9091374367$8Langzeitarbeitslosigkeit045D/49 $b49101B $004-03-09$t09:15:56.000Pica+ (text)MODS (xml)Seite 64Frage: Sind diese beiden Metadatenschemas in irgendeiner Hinsichtinteroperabel?
  65. 65. 4. MappingSeite 65
  66. 66. Was bedeutet „Mapping“?Aufgabe: Integration heterogener Metadaten in einem System: EconBizDublin Core (XML)PICA 3Titel=4000Titel=<title>• Metadaten verschiedenerProvenienz, die in verschiedenenFormaten vorliegen• Mittels Suchmaschine-Technologieunter einer Oberfläche durchsuchen• Verfeinerung per Drill-DownSeite 66
  67. 67. • „Übersetzen“ der Elemente und Regeln von einem Standard (Schema /Format) in einen anderen• Mapping: die sich entsprechenden Bestandteile zweier unterschiedlicherMetadaten-Standards oder -schemata miteinander in Beziehung setzen samtRegeln• Metadata "mapping" refers to a formal identification of equivalent or nearlyequivalent metadata elements or groups of metadata elements from differentmetadata schemas, carried out in order to facilitate semantic interoperability(Getty Glossary)Element DB2 – MAB (Ziel) DB1 – PICA (Quelle) AnmerkungenBezeichner Syntax Bezeichner Syntax Anweisung für TransformationVerfasser 100 Nachname, Vorname 3000 Vorname@NachnameQuell-Wert vor Klammeraffen in Zielformat mitKomma Leerzeichen hinter Quell-Wert nachKlammeraffen schreiben, […][…]Seite 67Was bedeutet „Mapping“?
  68. 68. Seite 68Crosswalk“A table that maps the relationships and equivalenciesbetween two or more metadata schemes. Crosswalksor metadata mapping support the ability of searchengines to search effectively across heterogeneousdatabases”. http://dublincore.org/documents/usageguide/glossary.shtml#C
  69. 69. CrosswalkA crosswalk ist "a mapping of the elements,semantics, and syntax from one metadata schemeto those of another„.(http://www.niso.org/publications/press/UnderstandingMetadata.pdf ).Crosswalks sind laterale Mappings, d.h. sie sindEinbahnstrassen von einem Schema in das andere.Seite 69
  70. 70. Einige Problemfelder beim Mappen:• Mapping zwischen zwei unterschiedlich mächtigen Standards / Schemas:fehlende Felder im Zielformat / mehr als ein Feld im Zielformat• Unterschiedliche Eigenschaften: Einige Felder können als obligatorisch(Pflichtfeld) und andere als optional deklariert werden. Das wiederholteVorkommen eines Elements kann zulässig sein oder nicht (Wiederholfähigkeit).• Unterschiedliche Syntax der Felder (unterschiedliche syntax encodingschemes): (z.B. A: „Vorname“, „Nachname“ und B: „Name“ (Nachname,Vorname) und C: „Vorname@Nachname“)• Verschiedene terminologische Vokabulare (unterschiedliche vocabularyencoding schemes): Werden unterschiedliche Vokabulare (z.B. Klassifikationen)verwendet müssen, diese ebenfalls „übersetzt“ werden (Cross-Konkordanz).Mapping in der Praxis - ProblemfelderSeite 70
  71. 71. Mapping in der PraxisIn welcher Beziehung stehen die zu mappenden Elemente zueinander?Grad der strukturellen Übereinstimmung:• 1:1 one-to-one• 1:n one-to-many• n:1 many-to-one• 1:0 one-to-noneGrad der semantischen Übereinstimmung:• = äquivalent• > Oberbegriff• < Unterbegriff• ≈Seite 71
  72. 72. Mapping in der Praxis="is the same as„Semantik des Quell- und des Zielformats stimmen überein. Einfaches Element-to-Element-Mapping (Aber: Encoding Scheme beachten!)<dcterms:abstract> DC-Definition: A summary of the resource<mods:abstract> MODS-Def.: a summary of the content of the resourceQuelle ZielSeite 72<dc:language>Deutsch</dc:language> <mods:languageTerm type= "code" authority="iso639-2b">ger</mods:languageTerm>
  73. 73. <Quell-Element ist „Unterbegriff“ des ZielelementsSemantik des Quellelements ist enger gefasst, als die des möglichen Zielelements.Quelle Ziel<mods:relatedItem type=„isReferencedBy></relatedItem><dc:relation></dc:relation> DC-Definition: A related resource.MODS-Definition: Citations or referencesto published bibliographic descriptions,reviews, abstracts, or indexes of thecontent of the resourceMapping in der PraxisSeite 73
  74. 74. Mapping in der Praxis>Quell-Element ist „Oberbegriff“ von Ziel-ElementSemantik des Quellelements ist breiter gefasst, als die des Zielelements.<dc:subject> DC-Def.: „The topic of the resource.“ (nicht eingeschränkt;Geographika, Sachschlagwörter, Zeitschlagwörter etc.)<mods:subject> MODS-Def: "topic" is used as the tag for any topical subjects<mods:topic> that are not appropriate in the <geographic>, <temporal>,<titleInfo>, or <name> subelements nicht zulässig!Quelle ZielSeite 74
  75. 75. Mapping in der PraxisQuellformat: MIX<Compression><CompressionScheme>1</CompressionScheme><CompressionLevel>10</CompressionLevel></Compression>Zielformat: Dublin Core:?nicht möglichInformationsverlust!http://commons.wikimedia.org/wiki/File:Rotten_apple.jpgSeite 751:0Im Zielstandard gibt es kein Feld, das mit der Semantik des Quellelementsübereinstimmt.
  76. 76. Mapping in der Praxis1:nQuell-Element muss auf zwei oder mehrere Ziel-Elemente verteilt werden /Nur Teil eines Quellelements kann auf Ziel-Element gemappt werden<gils:ContactName> The name of the person acting as contact for theinformation resource.<name type="personal"><namePart type="given"></namePart><namePart type="family"></namePart></name>Transformationsregel angeben: anhand Syntax derWerte nach möglichen Trennzeichen (Steuerzeichen)suchenhttp://commons.wikimedia.org/wiki/File:Apfelteiler_fcm.jpgSeite 76
  77. 77. n:1 Mehrere Quell-Elemente entsprechen Ziel-ElementNur zwei oder mehr verschiedene Informationen gemeinsam ergeben die ZielsemantikMapping in der Praxis<part><detail type="volume"><number>24</number> Band</detail><detail type="issue"> Heft<number>2</number></detail><extent unit="page"> Seitenangabe<start>23</start><end>45</end></extent></part><dc:bibliographicCitation> Definition: A bibliographic reference for the resource.Comment: Recommended practice is to include sufficient bibliographicdetail to identify the resource as unambiguously as possible.Seite 77 Regel mit welchen Steuerzeichen dieeinzelnen Werte im Ziel-Element zusammen-gesetzt werden sollenhttp://commons.wikimedia.org/wiki/File:Fruit_salad_%281%29.jpg
  78. 78. Mapping in der PraxisWiederholbarkeitQuell-Element ist wiederholbar, Ziel-Element nichtAlle Werte des Quell-Elements in Ziel-Element mappen. Dabei Trennzeichen alsRegel angebenSeite 78Quell-Element ist nicht wiederholbar, Ziel-Element ist wiederholbar Trennzeichen im Quell-Elements als Steuerzeichen für Zerlegung desFeldwerts nutzendc:subject: Begriff1dc:subject: Begriff2dc:subject: Begriff3<ex:theme> Begriff1 ; Begriff2 ; Begriff3</ex:theme>Regel: alle Begriffe aus dc:subject in <ex:theme>mit Leerzeichen Semikolon Leerzeichen getrennt<ex:theme> Begriff1 ; Begriff2 ; Begriff3</ex:theme> dc:subject: Begriff1dc:subject: Begriff2dc:subject: Begriff3Regel: Trenne die Begriffe in <ex:theme> anhandSteuerzeichen (Leerzeichen Semikolon Leerzeichen)
  79. 79. Mapping in der PraxisVerpflichtungQuell-Element ist Pflichtfeld, Ziel-Element nicht Kein ProblemQuell-Element ist nicht verpflichtend; Zielelement ist Pflichtfeld Versuchen passende Werte aus einer Kombination von Quell-Elementen zu generieren. Wenn nicht möglich , Mapping nichtmöglich.Seite 79
  80. 80. Mapping in der PraxisProbleme mit den Daten:1. Missing data: Werte sind nicht vorhanden2. Incorrect data: Werte entsprechen nicht den Konventionen3. Confusing data: unzulässige / fehlende Trennzeichen, eingebettete HTML-Tags4. Insufficient data: fehlende Angabe welches kontrollierte Vokabular, Format etc.verwendet wird.IterativerProzessDaten-analyseMappingKonver-tierungKontrolleSeite 80
  81. 81. Zusammenfassung: Mapping und Crosswalks• Beim Mappen wird semantische, syntaktische und strukturelleInteroperabilität hergestellt.• Voraussetzung für ein korrektes Mapping ist die klare und präzise Definitionder Elemente in den jeweiligen Standards.• Das Mapping sollte das Erstellen von Transformationsregeln ermöglichen,mit denen sich die Daten aus dem einen Schema möglichst vollständig in dasandere Schema überführen lassen.• Eigentliches Konvertieren der Daten mittels programmiertem Script• Mapping ist der erste Schritt zur Integration heterogener Daten in einemSystemSeite 81
  82. 82. Mapping - ÜbungSeite 82Quelle: MODS-Schema:Element language mitencoding schemeSoll nach PICA (GBV) gemapptwerden!Aus der GBV-Katalogisierungsrichtlinie:<language><languageTerm type="code" authority="iso639-1">de</languageTerm></language>Die Kategorie 1500 enthält Angaben zur Sprache desvorliegenden Textes in codierter Form. Die Codierungenerfolgen nach ISO 639-2, vgl. Anhang 2. Bei Neuaufnahmenim System ist die Angabe der Sprachbezeichnung verbindlich.Fragen:Was muss man beim Mapping beachten? Ist ein Mapping möglich?
  83. 83. Mapping - LösungSeite 83Antwort:Ja, ein Mapping ist möglich: die Semantik der Felder in den beidenSchemas stimmen überein.Aber: das Vokabular muss „übersetzt“ werden. Anhand einerKonkordanz zwischen ISO 639-1 und ISO 639-2 müssen die Wertekonvertiert werden.de  ger
  84. 84. Zusammenfassung: Mapping und CrosswalksSeite 84“A crosswalk is a specification for mapping onemetadata standard to another. Crosswalks providethe ability to make the contents of elementsdefined in one metadata standard available tocommunities using related metadata standards.Unfortunately, the specification of a crosswalk is a difficult and error-prone taskrequiring in-depth knowledge and specialized expertise in the associated metadatastandards. Obtaining the expertise to develop a crosswalk is particularlyproblematic because the metadata standards themselves are often developedindependently, and specified differently using specialized terminology, methodsand processes. Furthermore, maintaining the crosswalk as the metadata standardschange becomes even more problematic due to the need to sustain a historicalperspective and ongoing expertise in the associated standards.”http://www.niso.org/publications/white_papers/crosswalk/
  85. 85. 5. SchnittstellenSeite 85
  86. 86. SchnittstellenSoftwareschnittstellen / softwareseitige Datenschnittstellen :• definieren, wie Kommandos und Daten zwischen verschiedenen Prozessen undKomponenten ausgetauscht werden• Z39.50:• Netzwerkprotokoll, das• im Bibliothekswesen Standard zur Abfrage von bibliographischenInformationssystemen• Mit dem Zusammenführen der Daten hat die Bedeutung der Abfrage vonverteilten Informationssystemen mit Z39.50 abgenommen• SRU:• Nachfolger von Z39.50• HTTP-basierte Protokoll Search/Retrieve via URL (SRU/SRW),• Techniken basieren auf etablierten Internet-Standards wie URI und XMLSeite 86
  87. 87. 87Linkresolver• System zur Verfügbarkeitsanzeige wissenschaftlicher Publikationen.• HTTP-basierter Service• Metadaten der Quelle (Source) + gespeicherte Informationen über lokale Beständeund Lizenzen• Links auf "passende" Dienste wie elektronische Volltexte, Dokumentenlieferdienste,den lokalen OPAC und den BuchhandelLink-Resolverhttp://www3.interscience.wiley.com/resolve/openurl?genre=article&issn=0022-2380&volume=30&issue=6&spage=1017OpenURLSeite 87
  88. 88. openURL„The OpenURL is a protocol for interoperability between an information resourceand a service component that offers localized services in an open linkingenvironment. It is in effect an actionable URL that transports metadata or keys toaccess metadata for the object for which the OpenURL is provided. „(http://www.oclc.org/research/projects/openurl/default.htm)• Standard ANSI/NISO Z39.88• ANSI/NISO Z39.88 - The OpenURL Framework for Context-Sensitive Services• Pflege und Entwicklung OCLC• Key-Encoded Value Guidelines:http://epub.mimas.ac.uk/openurl/KEV_Guidelines-200706.htmlSeite 88
  89. 89. openURLStandard für die Übermittlung von bibliographischen Metadaten(Context-Sensitive Linking)http://openurlgw.hbz-nrw.de/gw?aulast=Clark&aufirst=Timothy&au=Wright%2C+Mike&atitle=So%2C+Farewell+Then+.+.+.+Reflections+on+Editing+the+Journal+of+Management+Studies&jtitle=Journal+of+management+studies+%3A+JMS&stitle=J.+Manage.+Stud.+(GB)&date=2009&volume=46&issue=1&pages=1-9&issn=00222380&coden=JMASB2&genre=articleSeite 89
  90. 90. OAI-PMH - OAI Protocol for Metadata HarvestingOpen Archives Initiative (OAI):• Initiative von Betreibern von Dokumentenservern, um die abgelegtenelektronischen Publikationen besser auffindbar und nutzbar zu machen• OAI Protocol for Metadata Harvesting (OAI-PMH) zum Einsammeln(Harversting) und Weiterverarbeiten von Metadaten• Metadaten werden von Data Providern bereitgestellt• Geharvestete Datensätze werden von Service Providern aufbereitet undbereitgestellt• kleinster gemeinsamer Nenner: Dublin-Core-Datenmodell• Erweiterung mit zusätzlichen Standards (z.B. MODS, MARC mittels MARCXML)empfohlen• http://www.openarchives.org/pmh/Seite 90
  91. 91. OAI-PMH - OAI Protocol for Metadata HarvestingOAI-Anfrage an EconStorhttp://www.econstor.eu/dspace-oai/request?verb=GetRecord&metadataPrefix=didl&identifier=oai:econstor.eu:10419/41393Seite 91
  92. 92. 92OAI-PMH - OAI Protocol for Metadata Harvestinghttp://www.econstor.eu/dspace-oai/request?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:econstor.eu:10419/41393Seite 92
  93. 93. 93OAI-PMH - OAI Protocol for Metadata Harvesting6 verbs um ein Repository abzufragen:• GetRecord: individuellen Datensatz abfragen• Identify: Information über Repositoryabfragen• ListRecords: um Datensätze zu harvesten• ListIdentifiers: Abkürzung vonListRecords: man bekommt nur header;nicht Datensätze• ListMetadataFormats: die zur Verfügungstehen Metadatenformate abfragen• ListSets: Kollektionen eines RepositorysabfragenSeite 93
  94. 94. OAI-ExplorerSchnittstelle umRepositoriesinteraktiv auf ihreÜbereinstimmungmit dem OAI-PMH zu testen.http://re.cs.uct.ac.za/Seite 94
  95. 95. Schnittstellen fürLiteraturverwaltungSeite 95
  96. 96. COinS (ContextObjects in Spans)• Methode zur Einbindung von bibliographischen Metadaten in HTML-Seiten• Basiert auf OpenURL• Browser-Plugins / weitere Programme können aus den „unsichtbaren“ COinS imQuelltext einer Webseite• OpenURL-Links für einen Linkresolver erzeugen• Metadaten auslesen (Literaturverwaltung)• Prinzip: MikroformatSchnittstellen für LiteraturverwaltungSeite 96
  97. 97. Zusammenfassung: SchnittstellenSeite 97• Schnittstellen definieren, wie Kommandos und Daten zwischen verschiedenenProzessen und Komponenten ausgetauscht werden• Ein Linkresolver ist eine "Allround-Schnittstelle" zur Anzeige von Verfügbarkeits-informationen.• OpenURL nutzt für jedes Dokument einen abstrakten Namen, der durch einenMechanismus zu einer URL aufgelöst wird (Actionable URL)• Key-Encoded-Values: einem Schlüssel (Element) wird ein Wert zugeordnet• OAI-PMH: OAI Protocol for Metadata Harvesting: Schnittstelle zum Harvestenvon Metadaten von Dokumentenservern• Dublin-Core-Datenmodell• häufig zusätzliche Standards• Metadaten für die Literaturverwaltung:• RIS, BibTeX, EndNote, Mikroformat COinS
  98. 98. 6. Metadaten für das Semantic WebSeite 98
  99. 99. Metadaten für das Semantic WebProblem heutiger Suchmaschinen1. Unpassende Suchergebnisse Suchanfrage ist mehrdeutig(Homonymie / Polysemie)2. Fehlende Suchergebnisse Synonyme werden bei Suche nichtberücksichtigtz.B. Suche nach „Zukunftsforschung“ findet nicht„Futorologie“, „future studies“Ursache• Mangel an expliziter SemantikSeite 99
  100. 100. 100Mikroformate: semantische Annotation• Formate zur »Feinstrukturierung« von Webseiten.• (X)HTML-Dokumente menschen- und maschinenlesbar mit Infos ergänzt• Mikroformate nutzen vorhandene XHTML-Attribute• Informationen lassen sich aus einer Website extrahieren und anderenProgrammen zugänglich machen• Domain-spezifische Vokabulare: Termine, Kontaktinformationen, sozialeBeziehungen.• http://microformats.org/Seite 100BEGIN:VCALENDARVERSION:2.0PRODID:http://www.example.com/calendarapplication/METHOD:PUBLISHBEGIN:VEVENTUID:461092315540@example.comORGANIZER;CN="Alice Balder, ExampleInc.":MAILTO:alice@example.comLOCATION:SomewhereSUMMARY:Eine KurzinfoDESCRIPTION:Beschreibung des TerminesCLASS:PUBLICDTSTART:20060910T220000ZDTEND:20060919T215900ZDTSTAMP:20060812T125900ZEND:VEVENTEND:VCALENDAR
  101. 101. • Microdata erweiterte Microformats und überwindet deren Schwächen (z.B. unflexibel)• Ausdruckstärkere semantische Annotation von Webseiten• Specification: http://www.w3.org/TR/microdata/• Attributerweiterung für HTML5: itemprop, itemref, itemtype,itemscope, ..Microdata: Schema.orgSeite 101• 2011: Initiative derSuchmaschinenbetreiberGoogle, Bing, Yahoo,Yandex: schema.org• “create and support acommon set of schemasfor structured datamarkup on web pages.”• Nutzen für FachportalEconBiz: VerbesserteVerbreitung der Meta-daten
  102. 102. Microdata: Schema.orgSeite 102Google Structured Data Testing Tool: http://www.google.com/webmasters/tools/richsnippets
  103. 103. Semantic WebTim Berners Lee (1998): Semantic Web Roadmap:“The web was designed as an information space, with the goalthat it should be useful not only for human-human communication,but also that machines would be able to participate and help.”http://www.w3.org/DesignIssues/Semantic.html Nur möglich, wenn die Information von Maschinen gelesen undinterpretiert werden kannHeute:• Versuch die Bedeutung einer Information zu extrahieren• FehleranfälligSemantic Web:• Web Content in natürlicher Sprache wird explizit mitsemantischen Metadaten ausgezeichnet• Semantische Metadaten kodieren die Bedeutung des Inhalts inmaschinen-interpretierbarer ArtSeite 103Tim Berners-Lee at Campus Party Brasil, 2009,http://commons.wikimedia.org/wiki/File%3ATim_Berners-Lee_CP.jpg
  104. 104. Semantic WebErweiterung des World Wide Web:Seite 104„Im Web werden immer mehr veröffentlichte Daten in RDF (s.u.) vorliegen, d.h. siefolgen denselben Standards und können daher frei miteinander kombiniert undverlinkt werden. So entsteht das Semantic Web als eine verteilte Datenbank, diekomplexe Abfragen und Schlussfolgerungen über dezentral vorliegende Datenermöglicht.“Linked Data und die BibliotheksweltAdrian Pohl (Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen)http://www.hbz-nrw.de/dokumentencenter/produkte/lod/aktuell/pohl_2011_linked-data_ODOK.pdf
  105. 105.  formale Sprache für die Bereitstellung von Metadaten im WWW Umgesetzt werden diese Beschreibungen nach dem RDF-Modell entweder alsGraph oder nach der RDF-Syntax als XML. Eine Ressource (z.B. eine Monographie) wird durch eine bestimmte Eigenschaft(property) bzw. Relation beschrieben. Diese Eigenschaft kann einen bestimmtenWert annehmen.Das Kapital „Marx, Karl“hatAutorRessource Eigenschaft WertRDF - Resource Description FrameworkSubjekt Prädikat Objekthttp://d-nb.info/gnd/4099309-7 dc.creator „Marx, Karl“http://d-nb.info/gnd/4099309-7 dc.creator http://d-nb.info/gnd/118578537 Subjekt muss URI (Uniform Resource Identifier) sein, Objekt kann eine weitereURI oder ein String (Zeichenkette) seinSeite 105Tripel
  106. 106. Ressource - URI - RepräsentationSeite 106Repräsentation: Webseite überSt. Michaelishttp://dbpedia.org/resource/St._Michaelis_Church,_HamburgURI: Identifier für St. MichaelisRessource: St. Michaelishttp://commons.wikimedia.org/wiki/File:Michel_-_Noord.jpg• Uniform Resource Identifier (URI): Zeichenfolge, die zur Identifizierung einerabstrakten oder physischen Ressource dient• eindeutiger dauerhafter Identifikator einer Ressource
  107. 107. Ressource - URI - RepräsentationSeite 107« Ceci nest pas une pipe »  « Das ist keine Pfeife »René Magritte: La trahison des images, 1928–29Richtig! Das ist ein Bild einer Pfeife = Repräsentation
  108. 108. Bedeutung für Beschreibung von Bibliotheksressourcen: verschiedeneMetadatenstandards können in RDF integriert werden„The Resource Description Framework (RDF) of the World Wide Web Consortium (W3C) is anothermodel that "provides a mechanism for integrating multiple metadata schemes" [NISO, 2004] for thedescription of Web resources. It is a data model that provides a framework within which independentcommunities can develop vocabularies that suit their specific needs and share vocabularies withother communities. It utilizes the XML namespace to effectively allow RDF statements to reference aparticular RDF vocabulary or schema. „Zeng, M.L.; Chang, L.M. , http://www.dlib.org/dlib/june06/zeng/06zeng.htmlBeispiel DC-RDF:Die Ressource‚http://ilrt.bristol.ac.uk/people/cmdjb/‘hat den Titel ‚Dave Beckett´sHomepage‘ und hat den Autor‚Dave Beckett‘, hat Herausgeber‚ILRT; University of Bristol‘ und hatdas Erstellungsdatum ‚31.7.2002‘RDF - Resource Description FrameworkSeite 108
  109. 109. 1. Übersetzen Sie die Information „Harry Potter wird bei Carlsen verlegt“ in RDFund ordnen Sie die Bestandteile Subjekt, Prädikat und Objekt zu:RDF - Resource Description Framework - ÜbungSeite 109Subjekt Prädikat ObjektHarry Potter wird verlegt bei Carlsen2. Übersetzen Sie die Informationen in RDF und visualisieren Sie die Tripel(URI = Ellipse, Relation = Pfeil, Quadrat = Literal, „einfacher Text“)dc:datedc:creatordc:titledc:identifierdc:contibutorEigenschaftenID: http://d-nb.info/990563480Titel: Metadata for semantic andsocial applicationsVerfasser: Greenberg, Jane(http://d-nb.info/gnd/136971857)Jahr: 2008
  110. 110. 1. Übersetzen Sie die Information „Harry Potter wird bei Carlsen verlegt“ in RDFund ordnen Sie die Bestandteile Subjekt, Prädikat und Objekt zu:RDF - Resource Description Framework - LösungSeite 110Subjekt Prädikat ObjektHarry Potter wird verlegt bei Carlsenhttp://d-nb.info/990563480http://d-nb.info/990563480http://d-nb.info/990563480http://d-nb.info/gnd/136971857“Metadata for semantic andsocial applications”Greenberg, JaneID: http://d-nb.info/990563480Titel: Metadata for semantic andsocial applicationsVerfasser: Greenberg, Jane(http://d-nb.info/gnd/136971857)Jahr: 2008dc:datedc:creatordc:titlehttp://d-nb.info/990563480 „2008“dc:creator2. Übersetzen Sie die Informationen in RDF und visualisieren Sie die Tripel(URI = Ellipse, Relation = Pfeil, Quadrat = Literal, „einfacher Text“)
  111. 111. Meta-Modell: RDF-SchemaSeite 111http://d-nb.info/gnd/4099309-7 dc:creator „Marx, Karl“dc:BibliographicResourcedc:Agentdc:creatorrdfs:class rdfs:classrdfs:propertyrdfs:classrdf:typerdf:typerdf:typerdf:typerdf:typerdfs:subClassOfrdfs:subClassOfrdfs:subClassOfdomain rangeRDFSRDF
  112. 112. 112SKOS – Simple KnowledgeOrganisation System• formale Sprache zur Kodierung vonWissensorganisationssystemen wieOntologien, Thesauri, Klassifikationen,Taxonomien, andere Arten von kontrolliertemVokabular• baut auf dem Resource DescriptionFramework (RDF) und RDF-Schema auf• skos:broader (Oberbegriffe)• skos:narrower (Unterbergiffe)• skos:related (verwandte Begriffe)• …Seite 112
  113. 113. Web of Linked DataRDF + Sprache zur Auszeichnung der Beziehungen (z.B. SKOS) +URIs für Entitäten = Web of DataCool URIs dont changeWhat makes a cool URI?A cool URI is one which does not change.What sorts of URI change?URIs dont change: people change them.http://www.w3.org/Provider/Style/URISeite 113Semantic Web Stackhttp://commons.wikimedia.org/wiki/File:Semantic_Web_Stack.png
  114. 114. 114Daten für das Semantic Web veröffentlichen:Linked (Open) DataGrundsätze von Linked Data1. Verwende URIs als Name für Objekte.2. Verwende http-URIs, so dass andere den Namen nachschlagen können.3. Wenn jemand einen Namen nachschlägt, stelle hilfreiche Informationen zurVerfügung und benutze Standards (RDF, SPARQL).4. Stelle Links zu anderen URIs bereit, so das man Weiteres entdecken kann.On the WebMachine-readable dataNon-proprietary formatRDF standardsLinked RDFLinked Open Data (LOD) ist Linked Data, welcheunter einer offenen Lizenz veröffentlicht wird, dieeine freie Nachnutzung nicht behindert.5 Stars of Linked Open Data:Seite 114
  115. 115. Web of Linked DataSeite 115200720092011
  116. 116. Linked Data in BibliothekenSeite 116Warum?• Sichtbarkeit im Webmaximieren• Bestände leichter auffindbarmachen• Nachnutzbarkeitsicherstellen: insbesonderedurch nichtbibliothekarischeDomänen• Bibliographische Nachweisedurch die Verknüpfung mitanderen Informationenanreichern• RecherchemöglichkeitenoptimierenEconStor goes LOD
  117. 117. Linked Data in BibliothekenBereitstellen und Nutzen von kontrollierten Vokabularen undOntologien in RDF• DBPedia:• Projekt der Universität Leipzig, FU Berlin und OpenLink Software• strukturierte Informationen aus Wikipedia extrahieren und in RDF bereitstellen• Dreh- und Angelpunkt der Linked Data Cloud• http://dbpedia.org/• Standard Thesaurus Wirtschaft: http://zbw.eu/beta/econ-ws/about• Gemeinsame Normdatei der Deutschen Nationalbibliothek:http://www.dnb.de/DE/Service/DigitaleDienste/LinkedData/linkeddata_node.html• ….Bereitstellen und Nutzen von Titeldaten in RDF• hbz: http://lobid.org/about• B3Kat (BSB, KOBV): http://lod.b3kat.de/doc• …Seite 117
  118. 118. Linked Data in BibliothekenBereitstellen von Tools• Culturegraph: Plattform für Dienste und Projekte rund um die ThemenDatenvernetzung, Persistent Identifier und Linked Open Data für kulturelleEntitäten• http://www.culturegraph.org/Internationalisierung der bibliothekarischen Regelwerke• Resource Description and Access (RDA)• Umsetzung geplant in D für 2015• Format-unabhängig• Entwicklung ausgerichtet auf Nutzung im Semantic Web• FRBR- und RDA-VokabularSeite 118
  119. 119. 119Metadata Registries• Identifikation existierender Elemente verschiedener Schemas und Application Profiles• Zur Nachnutzung und Konsultation bereitstellen• Ermöglichen automatische Anfragen von Anwendungen, die die URIs, die einemSchema enthalten sind, auflösen können.“The presence of a metadata registry application promotes the wider adoption,standardization and interoperability of metadata by facilitating its discovery, and reuse,across diverse disciplines and communities of practice" [Dublin Core Metadata Registry].http://rdvocab.info/Seite 119
  120. 120. Metadata RegistriesCross-Domianhttp://metadataregistry.org/Domian-specifichttp://dcmi.kc.tsukuba.ac.jp/dcregistry/Seite 120
  121. 121. Linked Data AnwendungenSeite 121
  122. 122. Zusammenfassung: Semantic Web• Semantic Web: das „verstehende Web“: Informationen werden auf der Ebeneihrer Bedeutung miteinander verknüpft.• Voraussetzung:• Maschinen-Interpretierbarkeit der Information  RDF• Eindeutigkeit eines Konzepts (einer Person, einer Körperschaft, einesThemas)  URI: Zeichenfolge, die zur dauerhaften Identifizierung einerabstrakten oder physischen Ressource dient• Vokabular zu Modellierung einer Ontologie: RDFS, OWL, SKOS• RDF + Sprache zur Auszeichnung der Beziehungen (z.B. SKOS) + URIs fürEntitäten = Web of Data• Bibliotheken nutzen und veröffentlichen Linked Open Data• Recherche über Daten verschiedener Domänen• Verbessert Nachnutzbarkeit• Microformats und Microdata: „Semantic Web light“Seite 122
  123. 123. 7. Metadaten-Management in der ZBWSeite 123
  124. 124. • Unterstützung beim Aufbau und Pflege derInformationssysteme des Informationszentrums• Koordination der Datenlieferungen• Hilfestellung in allen Fragen zu Metadaten-Formaten und StandardsMetadaten-Management in der ZBWQuerschnittsaufgabeMetadaten-ManagementSeite 124
  125. 125. • Mitarbeit in Abteilungs-übergreifende Teams der ZBW• Mitarbeit in Drittmittel-Projekten• Enge Zusammenarbeit mit der Abteilung „Innovative Informations-systeme & Publikationstechnologien“• Mitarbeit in Kooperation und (internationalen) ArbeitgruppenMetadaten-Management in der ZBWMetadaten-ManagementSeite 125
  126. 126. Aufgaben des Metadaten-ManagementsMetadatenstandards und Mapping• Expertise bzgl. Metadaten-Standards und Regelwerken• Erarbeiten von CrosswalksEntwicklung und Weiterentwicklung von MetadatenformatenNeue Systeme:• Auswahl geeigneter Metadatenstandards gemäß der Anforderungenan das System, Ggf. Kombination mehrerer Standards• Entwicklung eines interoperablen Schemas• Erstellung von Application Profiles (Dokumentation)Bestehende Systeme, Z.B. EconStor, da|ra:• Kontinuierliche Weiterentwicklung angepasst an sich wandelndeAnforderungenSeite 126
  127. 127. Koordination von DatenlieferungenWeitere Aufgaben des Metadaten-Managements• Bereitstellung /Auswertung vonTestdaten undDokumentationen• Dokumentation voneingehend undausgehendenDatenlieferungen• Ansprechpartnerinfür alle Fragenbzgl.Metadatenformat,Katalogisierungund BereitstellungSeite 127
  128. 128. Qualitätsmanagement und WeiteresWeitere Aufgaben des Metadaten-Managements• Mitarbeit System-Entwicklung: Funktionen, die auf Metadaten aufbauen, z.B.„Ähnliche Titel“, Merkliste, Exporte in Literaturverwaltungsprogramme• Weitere Fragestellungen:• Heterogene Sacherschließung in EconBiz• Dublettenproblematik: Wie erkennen wir Dubletten?• Qualitätsmanagement:• Erstellen von Statistiken• Datenanalysen: z. B. Prüfung einzelner Kategorien auf zulässige Inhalte• Datenanalysen: z.B. Stand der Normierung: hohe Bedeutung für dasZusammenführen von Beständen mit gleichen Merkmalen undZukunftsfähigkeit der MetadatenSeite 128
  129. 129. Anforderungen an Metadaten-Managerinnen und -ManagerbibliothekarischeMetadatenstandardsRegelwerke undFrameworksVokabulare undNormenNormdateienRAK-WBSeite 129
  130. 130. • Analytisches Denken• Spaß daran, sich ständig mit neuenAufgaben (Standards, Technologien)zu beschäftigen und weiterzubildenMethodenBest PracticesAuszeichnungs-sprachenTechnologienHochspezialisierter Arbeitsbereich im BibliothekswesenAnforderungen an Metadaten-Managerinnen und -ManagerSeite 130
  131. 131. 8. Berufsfeld Metadaten-Management im Kontext derBibliothek der ZukunftSeite 131
  132. 132. ILOVEMETADATA• Querschnittsaufgabe• Kooperationen und Projekte• Hoch-spezialisierter Arbeitsbereich• Wissenschaftliche Bibliotheken: Zentrale Fachbibliotheken, Universitäts-bibliotheken, Nationalbibliotheken, Verbundzentrale• One-Person-Librarians„Metadaten-Management? Wer muss das wissen?“Bibliothek der ZukunftSeite 132lVerweisung vom zweiten Bestandteil deszusammengesetzten Namens(§ 319)Ist nach den Regeln ein zusammengesetzter Name inder Ordnungsgruppe des Familiennamensanzusetzen, so wird vom zweiten und von allenweiteren Hauptbestandteilen des zusammengesetztenNamens verwiesen.Die bei der Verweisung übergangenen Teile deszusammengesetzten Namens werden an das Endeder Ordnungsgruppe der Vornamen gestellt (319,1).lRAK
  133. 133. Seite 133Ausbildungsinhalte (2011/2012),untersucht v. A. SchafrickBibliothek der ZukunftMetadatenstandards41442121100111103100011110000 1 2 3 4 5 6 7Nicht spezifizierte bibliothekarischeMetadatenformatePICA +PICA3MAB2MABMABxmlMarc21ISBDDCTEIVRAISAD GEADNicht spezifizierte archivarischeMetadatenformateWahlpflichtmodulPflichtmodulAuswertung der Inhalte aus den jeweils aktuellstenöffentlich zugänglichen Modulhandbüchern dergrundständigen Studiengänge in Deutschland imBereich Bibliothekswesen mit dem BildungszielBachelor of Arts (7 Hochschulen). Ergänzt umInhalte aus den Vorlesungsverzeichnissen WS2011/2012 und SS 2012.31343712112121201010000 1 2 3 4 5 6 7ForschungsdatenmanagementSemantic Web (Linked Data,Vokabulare, semantischePersistent Identifer(Systembeispiele, Aufgaben)Digitale Langzeitarchivierung(Archivierungsformate, ...)Normierte Datenübergabe und -integration in verteilten SystemenDatenmodellierung/DatenmodelleAktuelle Entwicklungen beiStandards zum DatenaustauchKommunikationsprotokolle (OAHPMH, Z39.50)Crosskonkordanzen, TerminologieMappingMetdata-CrosswalksUnterschiede Austauschformat,Internformat …WahlpflichtmodulPflichtmodulSeite 133„Woher soll ich das wissen?“
  134. 134. Seite 134„Metadaten-Management? Chancen?“Bibliothek der ZukunftStellenanzeigen für Bibliothekarinnen und -Bibliothekare (Dipl. und B.A.)in Bibliotheken des spezialisierten und hochspezialisierten imdeutschsprachigen Bereich vom 01.11.2011-30.04.2012 aus inetbib undBibliojobsSeite 134
  135. 135. Automatisierung• Automatische Indexierung und Klassifizierung• Automatische Strukturerkennung von elektronischen Dokumenten• Automatische Formalerschließung von elektronischen Dokumenten• Schließen von Lücken bei Formal- und Sacherschließung• Ergebnisse reichen derzeit nicht an intellektuelle Ergebnisse heran• Semi-automatische Verfahren• „Automatische Verfahren funktionieren nicht automatisch“ Entwickeln und Betreuen von automatischen Verfahren„In der Bibliothek arbeiten bald nur noch Informatiker“Bibliothek der ZukunftSeite 135
  136. 136. Seite 136„Wer geht denn in die Bibliothek? Ist doch alles im Internet“Bibliothek der ZukunftSeite 136„Zur Bibliothek“, bmgnrs,http://www.flickr.com/photos/gigl/4807897633/http://www.wer-weiss-was.de/theme199/article7098730.html
  137. 137. Buchlose Bibliothek wächst und gedeihtBibliothek der ZukunftSeite 137
  138. 138. What is our role?Bibliothek der Zukunfthttp://thinklinks.files.wordpress.com/2013/03/beyondthepdf2_day1_hires.jpgMetadaten:• (semi-)automatisch erstellteMetadaten• Metadaten für das Semantic Web• RDF, RDFS• OWL• SKOS• Ontologien statt Schlagwortlisten• ModellierungSeite 138
  139. 139. What is our role?Bibliothek der Zukunfthttp://thinklinks.files.wordpress.com/2013/03/beyondthepdf2_day1_hires.jpgForschungsdaten:• Mitarbeit bei der Entwicklung vonForschungsumgebungen• Entwicklung vonPublikationsplattformen• Unterstützung / Beratung derForscher• Langzeitarchivierung, Dokumentationund Verbreitung• ganz praktisch: z.B. Normierung vonEntitäten• Data Librarian: unterstützt beiRecherche nach FD und bei derErstellung von MetadatenSeite 139
  140. 140. What is our role?Bibliothek der Zukunfthttp://thinklinks.files.wordpress.com/2013/03/beyondthepdf2_day1_hires.jpgInformationssysteme:• Integration von Metadaten ausverschiedenen Domänen:Bibliotheken, Museen, Archive, …,Internet• Erleichterte Verfügbarkeit fürelektronische Dokumente(Rechtemanagement)• Dienst dort bereitstellen, wo dieNutzer sind: von Facebook bisForschungsumgebungSeite 140
  141. 141. What is our role?Bibliothek der ZukunftSeite 141
  142. 142. Auf Du und Du mit Dublin Core & Co.k.jeude@zbw.eu„Metadata is a love note to the future”, Cea.,https://secure.flickr.com/photos/centralasian/8071729256/in/photostream/ Seite 142
  143. 143. Seite 143LiteraturSeite 143Berners-Lee, Tim: Design Issues. Architectural and philosophical points, 6. Januar 1997http://www.w3.org/DesignIssues/Brand, A., Daly, F., Meyers, B., & National Information Standards Organization (U.S.)(2003):Metadatademystified: A guide for publishers. Bethesda, Md: NISO Press.(www.niso.org/standards/resources/Metadata_Demystified.pdf )Caplan, Priscilla: Metadata Fundamentals for All Librarians. Chicago, 2003, ALA EditionsDublin Core Metadata Initiative: DCMI Glossary. http://dublincore.org/documents/usageguide/glossary.shtmlFoulonneau, Muriel; Riley, Jenn (2008): Metadata for digital resources: implementation, systems design andinteroperability. Oxford: Chandos.Greenberg, J. (2008): Dublin Core History and Basics. Tutorial ASIST DC 2008 http://dc2008.de/wp-content/uploads/2008/09/tutorial-1.pdfHarper, Corey (2010): Dublin Core Metadata Initiative: Beyond the Element Set – NISO InformationStandards Quarterly, v.22, no. 1, Winter 2010. http://www.niso.org/publications/isq/2010/v22no1Hillman, D. I., & Westbrooks, E. L. (2004). Metadata in Practice. Chicago: ALA Editions.In Baca, M., & Getty Research Institute. (2008). Introduction to metadata. Los Angeles (Calif.: Getty ResearchInstitute.Miller, Eric (1998): An introduction to the resource description framework. In: D-Lib Magazine, Volume 4 Issue5, May 1998. http://www.dlib.org/dlib/may98/miller/05miller.htmlMitchell, Nicole: Metadata Basics (2066): In: The Southeastern Librarian, Vol. 54: Iss. 3, Article 6 .http://digitalcommons.kennesaw.edu/seln/vol54/iss3/6/
  144. 144. LiteraturNational Information Standards Organization (U.S.). (2004): Understanding metadata. Bethesda, MD: NISOPress. (http://www.niso.org/publications/press/UnderstandingMetadata.pdf )Pohl, Adrian (2011): Linked Data und die Bibliothekswelt. Hochschulbibliothekszentrum des LandesNordrhein-Westfalen). http://www.hbz-nrw.de/dokumentencenter/produkte/lod/aktuell/pohl_2011_linked-data_ODOK.pdfRiley, Jenn (2008-2010): Seeing Standards: A Visualization of the Metadata Universe.http://www.dlib.indiana.edu/~jenlrile/metadatamapSöllner, Konstanze (2008):„Academic Librarian of the Future“-Woher kommen die Spezialisten für die neuenAufgaben in den Bibliotheken?. 102. Deutscher Bibliothekartag <Leipzig, 2013> http://nbn-resolving.de/urn:nbn:de:0290-opus-14644St. Pierre, Margaret; LaPlant, William P. (1998): Issues in Crosswalking Content Metadata Standards.(NISOWhite Papers). Bethesda, MD: NISO. http://www.niso.org/publications/white_papers/crosswalk/Weibel, S. et.al. (2002): Metadata Principles and Practicalities. In: D-Lib-Magazin, Vol. 8, No. 4, April 2002Zeng, M.L.; Chang, L.M. (2006): Metadata Interoperability and Standardization – A Study of Methodology PartI: Achieving Interoperability at the Schema Level. In: D-Lib-Magazin, Vol. 12, No. 6, June 2006.http://www.dlib.org/dlib/june06/chan/06chan.htmlZeng, M.L.; Chang, L.M. (2006): Metadata Interoperability and Standardization – A Study of Methodology PartII: Achieving Interoperability at the Record and Repository Levels. In: D-Lib-Magazin, Vol. 12, No. 6, June2006. http://www.dlib.org/dlib/june06/zeng/06zeng.htmlZeng, Marcia Lei, Jian Qin (2008): Metadata. New York: Neal-Schuman Publishers.Seite 144
  145. 145. WebressourcenK.I.M. Kompetenzzentrum Interoperable Metadaten: http://www.kim-forum.org/BlogsMetadata Matters: Bloggerin: Diane Hillmann: http://managemetadata.com/blog/Coyles InFormation: Bloggerin: Karen Coyle: http://kcoyle.blogspot.de/Managing Metadata: Bloggerin: Laura Smart: http://library.caltech.edu/laura/Metadata Discussion Group (Indiana University Libraries):https://blogs.libraries.iub.edu/metadata/FachjournaleJournal of library metadata. 2008. New York, NY: Haworth Press.http://www.informaworld.com/smpp/title~db=all~content=t792306902 .D-Lib-Magazin (frei): http://www.dlib.org/Seite 145
  146. 146. WebressourcenFortbildungK.I.M. Kompetenzzentrum Interoperable Metadaten: http://www.kim-forum.org/Hyperlinked Library MOOC: http://slisweb.sjsu.edu/about-slis/news/detail/free-online-course-extends-learning-individuals-across-globeOpenHPI: (Hasso-Plattner-Institut für Informatik) https://openhpi.de/ToolsDublin Core Tools zur Erstellung / Bearbeitung: http://www.dublincore.org/tools/Marc-Tools, wie z.B. MarcEdit: http://www.loc.gov/marc/marctools.htmlNotepad++: Freier Text-Editor für große Dateien. Suchen und Ersetzen mitregulären Ausdrücken möglichFirefox-AddOns: Dublin Core Viewer, Operator (Mikroformaterkennung)Chrome-AddOn: Schema Explorer (Mikrodata), OpenLink Data ExplorerSeite 146
  147. 147. Metadatenstandards• Dublin Core: www.dublincore.org• Pica3/Pica+: (Katalogisierungsrichtlinie des Gemeinsamen Bibliotheksverbunds):http://www.gbv.de/vgm/info/mitglieder/02Verbund/01Erschliessung/02Richtlinien/01KatRicht/inhalt.shtml• MARC21: http://www.loc.gov/marc/• MODS: http://www.loc.gov/standards/mods/• METS: http://www.loc.gov/standards/mets/• Library of Congress Standards: http://www.loc.gov/standards/• ONIX: http://www.editeur.org/83/Overview/• TEI: http://www.tei-c.org/index.xml• DDI: http://www.ddialliance.org/• BibTeX: http://www.bibtex.org/• RIS: http://www.refman.com/support/risformat_intro.asp• COinS (KEV): http://epub.mimas.ac.uk/openurl/KEV_Guidelines-200706.htmlSeite 147

×