SlideShare a Scribd company logo
1 of 38
Bibliotekarie ↔︎ maskin
AGI
Chilanga Cement / Flickr
Automatisering av arbetarklassens jobb —> grunden för ett modernt samhälle
Befarad automatisering av medelklassens jobb —> mänsklighetens undergång
… och kulturkrönikor
AGI
AGI
KB-labb: AI och biblioteket
KB som samhällsminne
• Anrika lokaler på Humlegården
• Stora, välordnade samlingar
• Används för traditionella
undersökningar inom humsam
forskning
KB-labb däremot…
• Vanligt kontorslokal på Karlavägen
• ”Stökig” miljö med hårdvara och
kablar överallt
• Nytt, laborativt arbetssätt för ett
bibliotekssammanhang
Varför har KB ett datalabb?
1) Forskningsinfrastruktur
• Tillgängliggör samlingarna i
strukturerad, kvantitativ form
istället för enskilda objekt
• Tillgång till KB:s data i labbmiljö
• Möjliggör storskalig forskning av
KB:s digitala samlingar
2) Metodutveckling på biblioteket
• KB hanterar och beskriver
mycket data som pliktmottagare
• AI som hjälpmedel för att
effektivisera detta arbete
• Exemplet ”bildsök” och AI-
genererat metadata och sök
3) Samlingsbaserade AI-modeller
• Använder samlingarna för att
skapa AI-modeller på svenska
• Bredd och djup i KB:s data
möjliggör säkra och kvalitativa
modeller
• ”KB-BERT”, vår version av
Googles språkmodell, släpptes
våren 2020.
• … och många fler
Exempel #0 - Zero-shot klassificering
Exempel #1 - Ljudmodeller / tal till text
Produktivt samspel
• KB:s digitala samlingar som grund för
nya AI verktyg
• AI verktyg tillåter nya sätt att söka i
och utforska samlingarna
• Exemplet: tal-till-text för att komma åt
ljudmaterial utan metadata
Sökbart mha ljudmodeller
Exempel #2 - Vektorsök / “Strindbot”
Vektorsök
Vektorsök
Vektorsök
qqqqqqqqqqq
Exempel #3 - Automatiserat skapande av
ämnessystem
Maskinell klassificering
• I någon mening ett löst problem givet bra
data
• Initiala försök gav blandade resultat
• Genuin förvirring i systemet vilket är svårt för
maskinen att hantera
• Jäv / bias ett stort problem
Dewey
2xx - Religion
220-289: kristendom
29x: andra religioner
8xx - Litteratur
Tänk om det är vi som är problemet …
Maskinellt skapat ämnessystem
Bibliotekarien som maskin
eller
maskinen som bibliotekarie
Gör något med AI

More Related Content

Featured

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by HubspotMarius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 

Featured (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

Bibliotekarie-maskin (Chals 2023)

Editor's Notes

  1. Vi börjar med en bild som ni säkert känner igen. Här är KB, Sveriges nationalbibliotek. Satt i den fina omgivningen på Humlegården, är KB ett monument till vissa 1800-talets ideer om insamling av det nationella kulturarvet. Det är fina, anrika lokaler med rika, historiska samlingar. Än idag besöks det oftast av forskare inom humaniora som vill använda sig av materialet.
  2. Här har vi en annan bild, denna gang en vanlig kontorslokal. Här sitter vi på KB-labb, på Karlavägen där biblioteket har sina audiovisuella samlingar. Med den här bilden har vi kommit långt ifrån den ordning och reda och de fina läsesalar som finns på Humlegården. Här ser vi kartonger för hårddiskar på golvet och kablar lite överallt. Kontrasten mellan dessa två bilder säger något om KB-labb, att det är ett nytt sätt att jobba i ett bibliotekssammanhang.
  3. Ett annat sätt att prata om denna kontrast är att fråga varför KB har ett datalabb? Varför har en tillsynes traditionell kulturarvsinstitution börjat syssla med AI utveckling och data science? Och vad är det vi gör på labbet? Det är lite svar till dessa frågor som kommer att visas upp i denna presentation
  4. Labbet etablerades för snart 4 år sedan för att göra framförallt två saker. Den första var för att vara en forskningsinfrastruktur för storskalig digital forskning inom humaniora och samhällsvetenskap. Labbet skulle möjliggöra storskalig analys genom att tillgängliggöra samlingar i strukturerad, kvantitativ form.
  5. Den andra sak som labbet skulle göra var för att stödja metodutveckling och innovation inom AI på biblioteket. Som nationalbibliotek hanterar, organiserar och beskriver KB väldigt mycket data. Tanken var att AI skulle kunna användas som hjälpmedel för att göra detta mer sökbart.
  6. Arbetet med dessa första två punkter ledde snabbt fram till en tredje uppgift för labbet: att använda KB:s samlingar för att skapa Open Access AI-modeller. Vi tog fram vår första BERT-modell för 3 år sedan och det har haft stora konsekvenser för hur vi jobbar. Det öppnade för många nya samarbeten och att träna nya AI-modeller har nu blivit ett prioriterat område för oss.
  7. Genom pliktleverans så sitter KB på enorma mängder radio och tv material från 1900-talet. Men det som gjort det svårt hittills att ta sig an detta forskningsmässigt är brist på metadata: i många fall är det enda info vi har det som stod i tv-tabeller om vad som skulle sändas, vi vet inget om själva innehållet. Det betyder att en forskare inte kan söka i materialet, mer än att själv sitter och lyssna eller titta på varje avsnitt. Nya utvecklingar inom tal-till-text teknologi kan ändra detta radikalt. Med hjälp av de akustiska modeller vi har tränat på KB-labb kan ljudfilmer omvandlas till text transkriptioner, vilket i sin tur möjliggör fritextsökning. Så om vi tittar på den här bilden kan se information för P3 den 1e mars 1986, att det planerade innehållet var nyheter och lugn musik, vilket är vad en forskare i nuläget skulle få veta om filen.
  8. Om vi använder AI för att göra materialet sökbart efter innehåll får vi fram en helt annan bild, dock. Det som visas här är sökträffar efter termen ”Olof Palme” på radiosändningar från denna period. Som vi kan se så var det andra saker som inträffade denna kväll än just lugn musik. Det är alltså en teknik som öppnar för ny forskning. Vi har haft ett projekt på labbet som använt detta för att analysera tv-programmet ”Anslagstavlan” på skala samt ett annat projekt som kommer att använda detta för att utforska ”terror” i audiovisuellt material. Så det är på gång.