3. Herausforderung Impresso-Projekt
Digital Humanities Laboratory (DHLAB) at the Swiss Federal Institute of Technology in Lausanne
Institute of Computational Linguistics, Universität Zürich
Luxembourg Centre for Contemporary and Digital History
Associate Partners:
Swiss National Library, Bibliothèque nationale de Luxembourg, Le Temps, NZZ, Schweizerisches
Wirtschaftsarchiv (SWA), Staatsarchiv Wallis
Titel Vortrag, Autor, DD.MM.YY Universität Basel 3
6. Wie sind wir vorgegangen?
• Erster Kontakt mit Intranda
• Installation neue Goobi-Version
• Wir waren schon am Scannen
• Vorgangsvorlagen anpassen
• Bugfixing (Vergrösserungsfeature)
• experimentell produktiv innerhalb von drei Wochen
Titel Vortrag, Autor, DD.MM.YY Universität Basel 6
8. Anfangen und trainieren
Allgemeines Trainingsset
5 Bände korrigiert
Erstes Modell mit Basler Titeln
Zweites Modell mit Basler Titeln
Dann kommt schon wieder die nächste Zeitschrift/Zeitung
Titel Vortrag, Autor, DD.MM.YY Universität Basel 8
10. Fazit aus Sicht UB Basel
• Das Tool ist äusserst hilfreich und effizient.
• Wir können Sachen machen, für die wir sonst die zeitlichen Ressourcen nicht
hätten.
• Das User Interface ist das Beste an der ganzen Sache: im Prinzip wäre das
eine Katalogisierungsaufgabe, aber es konnte dank der Usability von einer
studentischen Hilfskraft gemacht werden.
• Die Ausgabenerschliessung ging in einem Rutsch mit der regulären
Qualitätskontrolle.
• Eine reguläre QK vorneweg hat auch ihre Vorteile: wenn was nicht stimmt,
muss es nicht wieder «hoch» geschickt werden
• wünschenswert: schnellere Anzeige (schnellere NAS Verbindung oder IIIF)
Titel Vortrag, Autor, DD.MM.YY Universität Basel 10
11. Kennzahlen zum Neuronalen Netz
● Gesamtanzahl Bilder im Trainingsset: 35243
● Anzahl Bilder Klasse “title”: 17288
● Anzahl Bilder Klasse “other”: 17955
● Bilder benutzt zum Nachtrainieren des 1. Modells: 1713
● Bilder benutzt zum Nachtrainieren des 2. Modells: 2677
11
12. Pläne für den weiteren Ausbau
● Kleines Widget zur Abfrage des Wochentags
● Granularere Auswahl der Ausgabenregeln (mehrere Ausgaben pro Tag)
● Nachladen der weiteren Ausgaben beim scrollen
● Thumbnail-Liste als CSS-Grid umsetzen
12