CUbRIK and History of Europe

372 views

Published on

CUbRIK presented during the Poster session of the Workshop „Mehr Personen – Mehr Daten – Mehr Repositorien“ ("More poeple - more data - more repositories") - 4-6 March in Berlin, at Brandenburg Academy of Sciences

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
372
On SlideShare
0
From Embeds
0
Number of Embeds
27
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • Joseph Bech, Johan Beyen, Walter Hallstein, Paul Henri Spaak und [???]
  • CUbRIK and History of Europe

    1. 1. Von zweifelhaften Informationen zuneuen ZusammenhängenZum Aufbau eines Personendatenrepositoriums imKontext der europäischen IntegrationL. Wieneke, F. Clavert, N. Carboni
    2. 2. Inhalt• Hintergrund CUbRIK• Anforderungen an ein Repositorium für Identitäten• Praktische Umsetzung• Ausblick und Erfahrungen 3
    3. 3. CUbRIK29/09/2011 – Title 4
    4. 4. CUbRIK 36 month large-scale integrating project started in October 2011 partially funded by the European Commission’s 7th Framework ICT Programme for Research and Technological Developmentwww.cubrikproject.eu 5
    5. 5. CUbRIK: Human Computation 6
    6. 6. CUbRIK: Entwicklungsprozess History of Europe 7
    7. 7. CUbRIK: Social Graph• Gemeinsames Auftreten von Personen in einem Dokument (Bild) schafft Verbindung• Aufbau mit bestehendem Material• Kontinuierliche Erweiterung• Angereichert mit Ort, Zeit, Organisationen und Biographien• Technische und analytische Funktion• Identitäten als Fixpunkte des SG 8
    8. 8. CUbRIK: Social Graph• Time based roles (e.g. • VIAF president of EU parliament • DBPedia between XX and YY) Person • WorldCat Person • Entitypedia B• Membership of interest groups A • GND• DateTime, Place (Location)• Controlled Keywords• Events (e.g. Treaty of Rome …) 9
    9. 9. CUbRIK HoE Repositorium29/09/2011 – Title 10
    10. 10. Anforderungen an ein Repositorium für Identitäten• Leicht-gewichtig• Erweiterbar• Modellierung von o Unsicherheit (1967?, [Paris?]) o Mehrdeutigkeit o Zuverlässigkeit (Vermutung/Fakt jeweils mit Argumentation) o Provenienz o Mehrsprachigkeit• Raum und Zeit (hierarchisches Raum-Modell) 11
    11. 11. Medien, Personen, Organisationen 12
    12. 12. Praktische Umsetzung 29/09/2011 – Title 13
    13. 13. Erschließung der Personennamen• Ist-Situation – ca. 1800 Personen in 6500 Bildern – Schwach strukturierte Daten – Inkohärente Verwendung von Namen • Francisco Fernández Ordoñez • Francisco Fernández Ordóñez • Francisco Fernandez Ordonez • Francisco Fernandez Ordoñez – Keine eindeutige Referenzierung (PID) 14
    14. 14. Personennamen Workflow Clement Attlee, Harry Truman, Joseph Staline Clement Attlee, Harry Truman, Joseph Staline 1. Extraktion von 1. Extraktion von Personennamen aus Personennamen aus OpenCalais Python Script OpenCalais Python Script Beschriftung Beschriftung Clement Attlee Clement Attlee Harry Truman Harry Truman Joseph Staline Joseph Staline Anker Jørgensen Anker Jørgensen Google2. Säuberung der Daten 2. Säuberung der Daten Anker Jørgensen Anker Jørgensen Refine Anker Jorgensen Anker Jorgensen 3. Verbindung und 3. Verbindung und Verifizierung Philippe Maystadt Google Philippe Maystadtn Verifizierung Philippe Maystadt Philippe Maystadtn (Reconciliation) Refine (Reconciliation) 15
    15. 15. Ausblick & Diskussion 29/09/2011 – Title 16
    16. 16. Ausblick• Umsetzung der bestehenden Daten in den Social Graph• Entwicklung eines Toolsets zur Annotation, automatischen Erkennung und manuellen Korrektur von Informationen, Verbindung mit Crowdsourcing Verfahren• Entwicklung von Tools zur Visualisierung und Erkundung des Social Graph 17
    17. 17. Diskussion• Wie können wir Quellen und Argumentationen für Annotationen abbilden?• PID für Personen, wo ist der Stein von Rosetta? 19
    18. 18. Thank you for listening29/09/2011 – Title 20
    19. 19. 29/09/2011 – Titre 21
    20. 20. Beispiele Refine: Clustering 22
    21. 21. Beispiele Refine: Reconciliation & Matching 23
    22. 22. Beispiele Refine: Reconciliation & Matching 24

    ×