Sisyphus und die Metadaten

DXC Technology
DXC TechnologyText at DXC Technology
30. Juni 2017
Sisyphus und die Metadaten
Wie könnten Erfassung und Pflege von Metadaten
einfach und effizient gestaltet werden?
4. Online-Workshop Open (Government) Data
Moderation: Dominic Petrak, Sebastian Goerke
30. Juni 2017 2
Agenda
1. Wie erfasst man Metadaten heute?
2. Was macht es oft so schwierig?
3. Wie könnte das einfacher gehen?
30. Juni 2017 3
Wie erfasst man Metadaten heute?
Metadatenerfassung
heute
Über klassische
Softwarelösungen
diverser Anbieter
(z.B. Geo-Bereich)
Häufig nicht
standard-
konform
Hoher
Anpassungs-
aufwand
Nur für größere
Institutionen
machbar
Alternative:
Gemeinsame
Infrastruktur
Standardi-
sierung
Generische Open
Data-Portale
Aufwändige
Pflege
Erfassung
manuell über
Web-Form
Automatisches
Sammeln
Massen-
verarbeitung
Daten müssen
maschinen-
lesbar vorliegen
Aus externen
Katalogen
Verlinkung /
Kontextbildung
Kritisch
30. Juni 2017 4
Was macht es oft so schwierig?
• Umfangreiche Beschreibungsvokabularien
• Sehr langer Lebenszyklus
• Verschiedene Metadaten-Schemata
• Frage nach passender Lizenz
• Metadaten-Pflege (Koordination und Umsetzung)
• Schwankende Datenqualität
30. Juni 2017 5
Wie könnte das einfacher gehen?
• Automatisierung
• Automatisierte Ableitung von Metadateninhalten gem. vorgegebener
Regelwerke und Werkzeuge (ETL Mechanismen)
• Einsatz von Deep Learning Mechanismen
Mittels Deep Learning
Mechanismen werden
Metadaten zu Datensätzen
erhoben
Ableitung verschiedener
Metadatenformate mittels
Deep Learning Mechanik
Überprüfung der Ergebnisse
anhand vorhandener
Metadaten zu Datensätzen
(insbesondere im
Geodatenbereich
umfangreiche
Datengrundlage)
Diskussion
6
Vielen Dank.
1 of 7

Recommended

1. intranda Goobi Tag: Vom Tool zum Trend by
1. intranda Goobi Tag: Vom Tool zum Trend1. intranda Goobi Tag: Vom Tool zum Trend
1. intranda Goobi Tag: Vom Tool zum Trendintranda GmbH
2K views22 slides
Von der Sammlung gedruckter Statistiken zum Datenrepository by
Von der Sammlung gedruckter Statistiken zum DatenrepositoryVon der Sammlung gedruckter Statistiken zum Datenrepository
Von der Sammlung gedruckter Statistiken zum DatenrepositoryZBW - Leibniz-Informationszentrum Wirtschaft
716 views25 slides
Normdatendienste der VZG und ihre Anwendungsmöglichkeiten by
Normdatendienste der VZG und ihre AnwendungsmöglichkeitenNormdatendienste der VZG und ihre Anwendungsmöglichkeiten
Normdatendienste der VZG und ihre Anwendungsmöglichkeitenintranda GmbH
1.7K views27 slides
Telecom BSS by
Telecom BSSTelecom BSS
Telecom BSSMukesh Binani
56.7K views53 slides
Herausforderungen im Datenmanagement von Metadaten by
Herausforderungen im Datenmanagement von MetadatenHerausforderungen im Datenmanagement von Metadaten
Herausforderungen im Datenmanagement von MetadatenETH-Bibliothek
507 views20 slides
Social Media Mining für Journalisten - Das Content Evaluation System (CES) by... by
Social Media Mining für Journalisten - Das Content Evaluation System (CES) by...Social Media Mining für Journalisten - Das Content Evaluation System (CES) by...
Social Media Mining für Journalisten - Das Content Evaluation System (CES) by...nextmedia_haw
2K views18 slides

More Related Content

Similar to Sisyphus und die Metadaten

Quantität vor Qualität? Big Data im Kontext von Social Media Daten by
Quantität vor Qualität? Big Data im Kontext von Social Media DatenQuantität vor Qualität? Big Data im Kontext von Social Media Daten
Quantität vor Qualität? Big Data im Kontext von Social Media DatenKatrin Weller
1.5K views22 slides
Vortrag "Enterprise 2.0 – Gegenwart und Zukunft Vorschlag einer Forschungsage... by
Vortrag "Enterprise 2.0 – Gegenwart und ZukunftVorschlag einer Forschungsage...Vortrag "Enterprise 2.0 – Gegenwart und ZukunftVorschlag einer Forschungsage...
Vortrag "Enterprise 2.0 – Gegenwart und Zukunft Vorschlag einer Forschungsage...Forschungsgruppe Kooperationssysteme
1K views16 slides
Big Data und Business Intelligence by
Big Data und Business IntelligenceBig Data und Business Intelligence
Big Data und Business Intelligencesaracus consulting GmbH
462 views10 slides
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data... by
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...Axel Bruns
2.8K views42 slides
Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven by
Internet-Suchmaschinen: Aktueller Stand und EntwicklungsperspektivenInternet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Internet-Suchmaschinen: Aktueller Stand und EntwicklungsperspektivenDirk Lewandowski
871 views49 slides
Information Broker 2.0 - Recherche im Sozialen Web by
Information Broker 2.0 - Recherche im Sozialen WebInformation Broker 2.0 - Recherche im Sozialen Web
Information Broker 2.0 - Recherche im Sozialen WebUniversity St. Gallen
2.2K views63 slides

Similar to Sisyphus und die Metadaten(20)

Quantität vor Qualität? Big Data im Kontext von Social Media Daten by Katrin Weller
Quantität vor Qualität? Big Data im Kontext von Social Media DatenQuantität vor Qualität? Big Data im Kontext von Social Media Daten
Quantität vor Qualität? Big Data im Kontext von Social Media Daten
Katrin Weller1.5K views
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data... by Axel Bruns
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...
Axel Bruns2.8K views
Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven by Dirk Lewandowski
Internet-Suchmaschinen: Aktueller Stand und EntwicklungsperspektivenInternet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Dirk Lewandowski871 views
Gestaltungsmaßnahmen zur Förderung kollaborativer Wiki-Arbeit in der Hochschu... by Christian Kummer
Gestaltungsmaßnahmen zur Förderung kollaborativer Wiki-Arbeit in der Hochschu...Gestaltungsmaßnahmen zur Förderung kollaborativer Wiki-Arbeit in der Hochschu...
Gestaltungsmaßnahmen zur Förderung kollaborativer Wiki-Arbeit in der Hochschu...
Christian Kummer426 views
Die Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen by Dirk Lewandowski
Die Macht der Suchmaschinen und ihr Einfluss auf unsere EntscheidungenDie Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Die Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Dirk Lewandowski2.3K views
Wenn Maschinen Menschen bewerten: To-dos für Teilhabe by Konrad Lischka
Wenn Maschinen Menschen bewerten: To-dos für TeilhabeWenn Maschinen Menschen bewerten: To-dos für Teilhabe
Wenn Maschinen Menschen bewerten: To-dos für Teilhabe
Konrad Lischka96 views
Open Data Privacy by tknobloch
Open Data PrivacyOpen Data Privacy
Open Data Privacy
tknobloch60 views
Zielsetzung, Entwicklung und Herausforderungen des “Kerndatensatz Forschung” by Dr. Mathias Riechert
Zielsetzung, Entwicklung und Herausforderungen des “Kerndatensatz Forschung”Zielsetzung, Entwicklung und Herausforderungen des “Kerndatensatz Forschung”
Zielsetzung, Entwicklung und Herausforderungen des “Kerndatensatz Forschung”
Die Macht der Daten - CeBIT 2017 by Detlev Sandel
Die Macht der Daten - CeBIT 2017Die Macht der Daten - CeBIT 2017
Die Macht der Daten - CeBIT 2017
Detlev Sandel323 views
B2B Marketing Whitepaper - Informationsverhalten von Entscheidungsträgern 201... by dieleutefürkommunikation AG
B2B Marketing Whitepaper - Informationsverhalten von Entscheidungsträgern 201...B2B Marketing Whitepaper - Informationsverhalten von Entscheidungsträgern 201...
B2B Marketing Whitepaper - Informationsverhalten von Entscheidungsträgern 201...
LSWT2011: CONTENTUS: Technologien und Konzepte für multimediale Bibliotheken ... by acosta-consult
LSWT2011: CONTENTUS: Technologien und Konzepte für multimediale Bibliotheken ...LSWT2011: CONTENTUS: Technologien und Konzepte für multimediale Bibliotheken ...
LSWT2011: CONTENTUS: Technologien und Konzepte für multimediale Bibliotheken ...
acosta-consult596 views
Höher, schneller, weiter? Datenmanagement mit Augenmaß! by CESSDA Training
Höher, schneller, weiter? Datenmanagement mit Augenmaß!Höher, schneller, weiter? Datenmanagement mit Augenmaß!
Höher, schneller, weiter? Datenmanagement mit Augenmaß!
CESSDA Training944 views
Open (Government) Data | Chancen - Risiken - Nutzen by Oliver Bildesheim
Open (Government) Data | Chancen - Risiken - NutzenOpen (Government) Data | Chancen - Risiken - Nutzen
Open (Government) Data | Chancen - Risiken - Nutzen
Oliver Bildesheim328 views

Sisyphus und die Metadaten

  • 1. 30. Juni 2017 Sisyphus und die Metadaten Wie könnten Erfassung und Pflege von Metadaten einfach und effizient gestaltet werden? 4. Online-Workshop Open (Government) Data Moderation: Dominic Petrak, Sebastian Goerke
  • 2. 30. Juni 2017 2 Agenda 1. Wie erfasst man Metadaten heute? 2. Was macht es oft so schwierig? 3. Wie könnte das einfacher gehen?
  • 3. 30. Juni 2017 3 Wie erfasst man Metadaten heute? Metadatenerfassung heute Über klassische Softwarelösungen diverser Anbieter (z.B. Geo-Bereich) Häufig nicht standard- konform Hoher Anpassungs- aufwand Nur für größere Institutionen machbar Alternative: Gemeinsame Infrastruktur Standardi- sierung Generische Open Data-Portale Aufwändige Pflege Erfassung manuell über Web-Form Automatisches Sammeln Massen- verarbeitung Daten müssen maschinen- lesbar vorliegen Aus externen Katalogen Verlinkung / Kontextbildung Kritisch
  • 4. 30. Juni 2017 4 Was macht es oft so schwierig? • Umfangreiche Beschreibungsvokabularien • Sehr langer Lebenszyklus • Verschiedene Metadaten-Schemata • Frage nach passender Lizenz • Metadaten-Pflege (Koordination und Umsetzung) • Schwankende Datenqualität
  • 5. 30. Juni 2017 5 Wie könnte das einfacher gehen? • Automatisierung • Automatisierte Ableitung von Metadateninhalten gem. vorgegebener Regelwerke und Werkzeuge (ETL Mechanismen) • Einsatz von Deep Learning Mechanismen Mittels Deep Learning Mechanismen werden Metadaten zu Datensätzen erhoben Ableitung verschiedener Metadatenformate mittels Deep Learning Mechanik Überprüfung der Ergebnisse anhand vorhandener Metadaten zu Datensätzen (insbesondere im Geodatenbereich umfangreiche Datengrundlage)