Het gebruik van AI bij het catalogiseren van boeken in KBR

•Download as PPTX, PDF•

0 likes•57 views

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Education

Het begin
• 2017 Launch event van project INSIGHT (Federaal
Wetenschapsbeleid) BRAIN-project
̶ Benoit Seguin
̶ Machine Learning bij digitalisatie prenten
• Besef dat technologie in staat is om afbeeldingen te
interpreteren, zaken er in te herkennen.
5

Intussen
6
Tekstherkenning
Mobiele
fotografie
Gebruiksvriendelijke AI
– Machine Learning
Automatische
onderwerpsontsluiting Entiteiten extractie

Retrocatalografieproject
• KBR, nationale Bibliotheek van België
• 5 miljoen boeken, waarvan ongeveer 3 miljoen in de
online catalogus
• Project: hiaat opvullen
• Idee: scan/foto van titelpagina, en we extraheren al de
informatie uit de titelpagina (auteur, titel, uitgever,
auteur, jaar, plaats).
7

Retrocatalografieproject
• Talrijke tools op de markt
̶ Detectie van gegevens uit facturen
̶ ‘Custom model’: tests gaven vertrouwen in methode voor
titelpagina’s
• Maar voor KBR belangrijk
̶ Gebruiksvriendelijke tool voor menselijke validatie
̶ Harmonieuze ICT-infrastructuur (ingebed in bestaande omgeving)
8

13
Auteur – Titel - Uitgever Auteur – Titel – 2 Uitgevers Titel - Auteur

Linked Data
Databanken
Artificiële Intelligentie

16
Titel, auteur, uitgever, jaar
ISBN, uitgever, jaar, wettelijk
depotnummer, medewerkers,
originele titel, edititie, copyright,
ISNI(?)
Achterflaptekst

HTTP Queries
• Gedetecteerde metadata gebruiken voor
verrijkingszoekopdrachten
̶ ISBN  externe databanken (KBR, BNF, DNB)
̶ Auteur  ISNI
̶ Titel en auteur  VIAF Work-identifier
17

Onderwerpsontsluiting
• Technologie: Annif (Finland), taggen van teksten
̶ Eigen model:
• Model trainen met vooraf vastgelegde termen en voorbeeldteksten per term
(Annif, Microsoft model)
• Kan op basis van eenvoudige excel
̶ Of ChatGPT
• Nadeel: geen grip op de gebruikte termen
• Voordeel: veel sterker
18

Onderwerpsontsluiting
• Hierarchisch systeem
̶ Model 1 : Eerst algemene classificatie, vb ‘Geschiedenis’
̶ Model 2 : Specifieke termen met betrekking tot geschiedenis
• Testfase
20

Impact
• Snelle herkenning, en dit in vele talen en scripts
(Arabisch, Cyrillisch, enz)
• Taken catalograaf zal veranderen:
̶ Onderhouden Linked Data (ISNI, VIAF, enz) cruciaal voor correcte
automatisatie.
̶ Output monitoren, bijstellen, bijtrainen
̶ Meer ‘high-level’-taken
24

Similar to Het gebruik van AI bij het catalogiseren van boeken in KBR

Introductie 24/11/14

meemoo, Vlaams instituut voor het archief

LIBISnet Gebruikersdag 01062017 - Nieuws vanuit LIBIS

LIBIS

Walther Hasselo - Regionaal Archief Leiden

KVANdagen

Beleidsdag Netwerk Oorlogsbronnen | 10 april 2018

Netwerk Oorlogsbronnen

Marco de Niet

Edwin Mijnsbergen

Presentatie 20091216

Edwin Mijnsbergen

Relancevoorstellen - partnerevent voorjaar 2021

meemoo, Vlaams instituut voor het archief

Archiefdagen 2019 Presentatie Stadsarchief Amsterdam

Marc Holtman

BIB-IN-TOUCH Informatie aan Zee 2013

Bibliotheek De Krook

BIB-in-TOUCH

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

De Nieuwe Antwerpenaar

CrossLang / CrossCheck / CrossCast

Collegagroep digitale collectieregistratie

MicheLemmens

Lennertholvoet danny d'hondt_ppt

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Digitaal mobiel-genetwerkt - workshop

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Bert Lemmens: Het VKC Ecosysteem

PACKED vzw

Bert Lemmens - VKC ecosysteem

PACKED

Data-interoperabiliteit in de praktijk

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Partnerdag Lukas-Art in Flanders : ‘Blauwdruk gedistribueerd beeldbeheer’ doo...

Lukas -Art in Flanders

Big Data en Open Data

Bart Hanssens

LIBIS gebruikersdag - Teneo Update

LIBIS

Similar to Het gebruik van AI bij het catalogiseren van boeken in KBR (20)

Introductie 24/11/14

LIBISnet Gebruikersdag 01062017 - Nieuws vanuit LIBIS

Walther Hasselo - Regionaal Archief Leiden

Beleidsdag Netwerk Oorlogsbronnen | 10 april 2018

Marco de Niet

Presentatie 20091216

Relancevoorstellen - partnerevent voorjaar 2021

Archiefdagen 2019 Presentatie Stadsarchief Amsterdam

BIB-IN-TOUCH Informatie aan Zee 2013

BIB-in-TOUCH

De Nieuwe Antwerpenaar

Collegagroep digitale collectieregistratie

Lennertholvoet danny d'hondt_ppt

Digitaal mobiel-genetwerkt - workshop

Bert Lemmens: Het VKC Ecosysteem

Bert Lemmens - VKC ecosysteem

Data-interoperabiliteit in de praktijk

Partnerdag Lukas-Art in Flanders : ‘Blauwdruk gedistribueerd beeldbeheer’ doo...

Big Data en Open Data

LIBIS gebruikersdag - Teneo Update

More from Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Presentatie AHD studiedag Leeszaalmedewerkers -

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

ChatGPT, chatboxes en het einde van de databases

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Connecting libraries to EU resources

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Ben je klaar voor innovatie?

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Hoe maak ik mijn project impactvol?

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Connecteren faciliteren in hoger onderwijs, welke rol heeft de bibliotheek?

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Netwerken bij Informatie aan Zee

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Islamtisch (religieus) erfgoed. Waar liggen de uitdagingen en kansen?

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Waarderen van archieven

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Okapi2-Vlaanderen een hulp richting data driven management

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Van experiment naar structurele oplossing: gezichtsherkenning in functie van ...

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Droomhuis of luchtkasteel: De verbouwing van de Nederlandse informatiehuishou...

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Participative Registration of Intangible Cultural Heritage on immaterieelerfg...

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Een MaakBib voor iedereen in elke bib

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

De bib als derde plek? Ja, selvølgelig

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

ZB Bibliotheek van Zeeland maakt het verschil

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Hybriditeit als uitgangspunt: de vernieuwde leeszaal van het ModeMuseum Antwe...

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

De bib is mens- en buurtversterkend

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Van registratie naar valorisatie: collectieregistratie in de diepte als katal...

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

De samenleving gewaardeerd

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

More from Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD) (20)

Presentatie AHD studiedag Leeszaalmedewerkers -

ChatGPT, chatboxes en het einde van de databases

Connecting libraries to EU resources

Ben je klaar voor innovatie?

Hoe maak ik mijn project impactvol?

Connecteren faciliteren in hoger onderwijs, welke rol heeft de bibliotheek?

Netwerken bij Informatie aan Zee

Islamtisch (religieus) erfgoed. Waar liggen de uitdagingen en kansen?

Waarderen van archieven

Okapi2-Vlaanderen een hulp richting data driven management

Van experiment naar structurele oplossing: gezichtsherkenning in functie van ...

Droomhuis of luchtkasteel: De verbouwing van de Nederlandse informatiehuishou...

Participative Registration of Intangible Cultural Heritage on immaterieelerfg...

Een MaakBib voor iedereen in elke bib

De bib als derde plek? Ja, selvølgelig

ZB Bibliotheek van Zeeland maakt het verschil

Hybriditeit als uitgangspunt: de vernieuwde leeszaal van het ModeMuseum Antwe...

De bib is mens- en buurtversterkend

Van registratie naar valorisatie: collectieregistratie in de diepte als katal...

De samenleving gewaardeerd

Het gebruik van AI bij het catalogiseren van boeken in KBR

5. Het begin • 2017 Launch event van project INSIGHT (Federaal Wetenschapsbeleid) BRAIN-project ̶ Benoit Seguin ̶ Machine Learning bij digitalisatie prenten • Besef dat technologie in staat is om afbeeldingen te interpreteren, zaken er in te herkennen. 5

6. Intussen 6 Tekstherkenning Mobiele fotografie Gebruiksvriendelijke AI – Machine Learning Automatische onderwerpsontsluiting Entiteiten extractie

7. Retrocatalografieproject • KBR, nationale Bibliotheek van België • 5 miljoen boeken, waarvan ongeveer 3 miljoen in de online catalogus • Project: hiaat opvullen • Idee: scan/foto van titelpagina, en we extraheren al de informatie uit de titelpagina (auteur, titel, uitgever, auteur, jaar, plaats). 7

8. Retrocatalografieproject • Talrijke tools op de markt ̶ Detectie van gegevens uit facturen ̶ ‘Custom model’: tests gaven vertrouwen in methode voor titelpagina’s • Maar voor KBR belangrijk ̶ Gebruiksvriendelijke tool voor menselijke validatie ̶ Harmonieuze ICT-infrastructuur (ingebed in bestaande omgeving) 8

10. 10

11. 11

12. In Batch (via sharepoint) 12

13. 13 Auteur – Titel - Uitgever Auteur – Titel – 2 Uitgevers Titel - Auteur

14. Linked Data Databanken Artificiële Intelligentie

15. 15

16. 16 Titel, auteur, uitgever, jaar ISBN, uitgever, jaar, wettelijk depotnummer, medewerkers, originele titel, edititie, copyright, ISNI(?) Achterflaptekst

17. HTTP Queries • Gedetecteerde metadata gebruiken voor verrijkingszoekopdrachten ̶ ISBN  externe databanken (KBR, BNF, DNB) ̶ Auteur  ISNI ̶ Titel en auteur  VIAF Work-identifier 17

18. Onderwerpsontsluiting • Technologie: Annif (Finland), taggen van teksten ̶ Eigen model: • Model trainen met vooraf vastgelegde termen en voorbeeldteksten per term (Annif, Microsoft model) • Kan op basis van eenvoudige excel ̶ Of ChatGPT • Nadeel: geen grip op de gebruikte termen • Voordeel: veel sterker 18

19. Trainingset 19

20. Onderwerpsontsluiting • Hierarchisch systeem ̶ Model 1 : Eerst algemene classificatie, vb ‘Geschiedenis’ ̶ Model 2 : Specifieke termen met betrekking tot geschiedenis • Testfase 20

21. 21

22. 22

23. 23

24. Impact • Snelle herkenning, en dit in vele talen en scripts (Arabisch, Cyrillisch, enz) • Taken catalograaf zal veranderen: ̶ Onderhouden Linked Data (ISNI, VIAF, enz) cruciaal voor correcte automatisatie. ̶ Output monitoren, bijstellen, bijtrainen ̶ Meer ‘high-level’-taken 24

Editor's Notes

Het moest een ssyteem zijn die snel kon worden ontwikkeld , dat kwalitatief was en goede resultaten, en dus dus meteen resultaten gaf voor onze organisaties. Na wat zoeken kwamen we uit bij Windows power platform, een ecosysteem binnen microsoft waar je low code apps kan maken, Dit had het grote voordeel dat Power platform volledig geintegreerd is binnen de Microsoft 365 omgeving, waar we in KBR sinds kort naar zijn overgeschakeld.
TOEKOMST: deze manier van werken leerde ons dat zowel papieren document als electronische (pdfs) kunnen omgezet worden naar een machine-leesbaar document, dat, via automatische zoekopdrachten kan gematcht worden met andere databanken, verrijkt op basis van deze gegevens, of verrijkt met Linked open data. En dat geldt niet enkel voor boeken. In KBR kan dezelfde manier van werken ook gebruikt worden voor andere type documenten (Brieven vb, oude drukken). De data-extractie via AI helpt om ons einddoel, geconnecteerde linked records te maken, De toekomst voor ons is automatisering, standaardiseering (weg met menselijke varianten), en automatische verrijking, linken met andere thesauri (in bibliotheekwereld belangrijk)

Het gebruik van AI bij het catalogiseren van boeken in KBR

Recommended

Recommended

More Related Content

Similar to Het gebruik van AI bij het catalogiseren van boeken in KBR

Similar to Het gebruik van AI bij het catalogiseren van boeken in KBR (20)

More from Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

More from Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD) (20)

Het gebruik van AI bij het catalogiseren van boeken in KBR

Editor's Notes