Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja
1. “Europeana Newspapers”
- novo mesto susreta korisnika digitalnih sadržaja -
Nataša Dakić, Aleksandra Trtovac
Univerzitetska biblioteka
“Svetozar Markovic”, Beograd
Deveti međunarodni susreti bibliotekara slavista Sarajevo, april, 14.–17. 2013
2. 2
Projekat “Europeana Newspapers”
Zašto novine?
• relevantan izvor informacija za sve građane
• visoko relevantan izvor informacija za istraživače
Stanje novina u bibliotekama između raja i pakla
• solidni kompletni originali, izuzetne kopije na
mikrofilmovima
• krti, lomljivi originali, nekompletni brojevi, suplementi
3. 3
Projekat “Europeana Newspapers”
• Projekat traje od februara 2012. do januara 2015.
• Finansiran je od strane Evropske komisije u okviru petog
poziva Programa podrške razvoju politike informaciono-
komunikacionih tehnologija (CIP ICT-PSP Best Practice
Network 5thCall)
• Koordinator projekta je Državna biblioteka u Berlinu
(Staatsbibliothek zu Berlin)
4. 4
Partneri u projektu
• 17 partnera iz 12 zemalja:
• Nacionalne biblioteke
• Univerzitetske biblioteke
• LIBER i CSS
5. 5
Partneri u projektu
• Državna biblioteka u Berlinu
• Nacionalna biblioteka Estonije
• Univerzitet u Helsinkiju
• Nacionalna biblioteka Francuske
• Nacionalna biblioteka Letonije
• Univerzitet u Beogradu
• Biblioteka dr Fridrih Tesman
• Univerzitet u Salfordu
• CCS Content Conversion
Specialists GmbH
• Nacionalna biblioteka Holandije
• Austrijska nacionalna biblioteka
• Univerzitet u Hamburgu
• Nacionalna biblioteka Poljske
• Nacionalna biblioteka Turske
• Univerzitet u Insbruku
• Britanska biblioteka
• The European Library (TEL)
• LIBER fondacija
6. Pridruženi partneri u projektu
• Nacionalna biblioteka Češke
• Nacionalna i univerzitetska biblioteka, Ljubljana, Slovenija
• Nacionalna i univerzitetska biblioteka Islanda
• Nacionalna i univerzitetska biblioteka, Zagreb, Hrvatska
• Nacionalna biblioteka „Sveti Ćirilo i Metodije“, Bugarska
• Centralna univerzitetska biblioteka Lucian Blaga, Rumunija
• Nacionalna biblioteka Velsa
• Nacionalna biblioteka Portugala
• Nacionalna biblioteka Španije
• Nacionalna biblioteka Belgije
• Nacionalna biblioteka Luksemburga
7. 7
Ciljevi projekta “Europeana Newspapers”
• Europeana će postati najveći
provajder panevropskih novinskih
kolekcija
• Istražiti stanje novinskih zbirki u
evropskim bibliotekama
• Obezbediti kvalitetne kopije i
doneti preporuke za dalji rad što se
tiče digitalizacije, prečišćavanja
teksta, metapodataka...
• Poboljšati pristup zbirkama novina
u Evropi
8. 8
Ciljevi projekta “Europeana Newspapers”
• Tokom projekta Evropskoj
biblioteci (TEL – The European
Library) i Europeani će biti
dostavljeno oko 18 miliona
digitalizovanih strana novina od
kojih su mnoge u punom tekstu
9. 9
Agregacija i prečišćavanje teksta
•Korišćenje metoda za optičko prepoznavanje teksta (OCR -
Optical Character Recognition) je predviđeno za 10 miliona
strana
•Segmentacija članaka (OLR - Optical Layout Recognition)
je predviđena za 2 miliona strana
•Prepoznavanje imenovanih entiteta (NER - Named Entity
Recognition) obezbeđuje Nacionalna biblioteka Holandije
za sve materijale na nemačkom, engleskom i holandskom
jeziku
11. Metapodaci
•Razvoj i unapređenje standarda za opis tehničkih
metapodataka za optičko prepoznavanje teksta -
METS/ALTO
•Dalji razvoj Evropskog modela za metapodatke (EDM -
European Data Model) i usaglašavanje sa METS/ALTO
standardom
•Transformacija lokalnih metapodataka u EDM model
12. Pristup do punog teksta
• Složena pretraga sadržaja punog teksta preko:
• Ključnih reči
• Imenovanih entiteta
• Zbirki novina
• Datuma, godine...
• Pregledanje svake pojedinačne stranice
• Povezivanje sa relevantnim bibliotečkim izvorom
13. Univerzitetska biblioteka “Svetozar Marković” kao partner
u projektu
•Preko 400.000 digitalizovanih strana listova i novina na
srpskom jeziku, izdatih pre 1945. godine.
•Neki od naslova su Nova iskra, Podunavka, Srbadija,
Beogradske opštinske novine, Zora, Balkanski rat u slici i
reči, Ilustrovana ratna kronika, Pastir, Sion, Težak,
Peštansko-budimski skoroteča, Zemunski glasnik, Srđ,
Branič, Zvezda, Starmali, Starmladi, Stražilovo, Šumadinka
16. Kriterijumi za izbor građe
• Naslovi koje nije digitalizovala
Narodna biblioteka Srbije
• Očuvanost novina
• Tehnička ograničenja
17. Dosadašnji rezultati projekta
•ustanovljeni su određeni radni tokovi i tehnički procesi
• preciziran je obim i broj digitalizovanih novina koje su
predviđene za obradu naprednim tehnologijama
•izvršena je procena kvaliteta ovih materijala
•definisani su mogući modeli metapodataka koji će se koristiti
prilikom agregacije kao i načini prikaza digitalizovanih
sadržaja
•urađena je i specifikacija zahteva za optičko prepoznavanje
karaktera (OCR)
18. Dosadašnji rezultati projekta
• Anketa
• Sprovedena je anketa koja je imala za cilj identifikaciju i analizu svih
novinskih kolekcija koje su digitalizovale nacionalne, akademske i
javne biblioteke u Evropi do 2012. godine. U anketi je učestvovalo 47
institucija
• Rezultati:
• Pristup digitalizovanim novinama je skoro uvek besplatan u 85%
slučajeva
• 36% biblioteka nije koristilo nijednu vrstu optičkog prepoznavanja
karaktera (OCR) na digitalizovanom novinskom sadržaju
19. Planovi za naredni period
• U toku svoje druge godine projekat
će nastaviti da razvija postojeća
iskustva i da objavljuje rezultate u
cilju promocije projekta i
obezbeđivanja vidljivosti što veće
količine materijala na portalu
Europeana.
• U tom cilju planirano je održavanje
nekoliko info dana i radionica.
20. Informativni dani
•Nacionalna biblioteka Turske biće domaćin prvog info dana
3. maja 2013 u Ankari. Na ovom skupu na nacionalnom
nivou projektni partneri i turski govornici po pozivu će udružiti
snage da pokažu najnovija dostignuća u projektu vezana
prevashodno za prečišćavanja teksta u digitalizovanim
starim turskim novinama.
21. Radionice
•Prva radionica će imati za temu obradu digitalizovanih
novinskih materijala
•Druga radionica će specifikovati probleme vezane za
agregaciju i prikaz objekata
•Treća, završna radionica će se baviti evropskim novinskim
kolekcijama, kao i digitalnom agendom za Evropu
22. Radionice
•Prva radionica će se održati u Beogradu, u Univerzitetskoj
biblioteci “Svetozar Marković”, 13. i 14. juna 2013.
•Planirano je da se kroz prezentacije i demonstracije uživo
učesnici radionica upoznaju sa radom na OCRu, i NERu,
instrumentima za evaluaciju korišćenih tehnika, procenom
kvaliteta obrađenih sadržaja, kao i da razmene iskustva i
moguća rešenja na ovom polju delovanja.
•Budući da je proj učesnika radionice limitiran molimo
zainteresovane da se registruju na sledećoj adresi:
http://eurnews.eventbrite.com/
23. 23
Zaključak
• Budući da se novine nisu analitički obrađivale u bibliotekama, osim u
izuzetnim slučajevima, ovakav novi pristup pretraživavanju i
pronalaženju informacija umnogome će doprineti osvetljavanju
sadržaja novinskih kolekcija.
• Korisnici najrazličitijih interesovanja moći će da pronađu relevantne
informacije bilo da su one iz domena zabave, sporta ili svakodnevnog
života.
• Ova digitalna kolekcija će, nadamo se, postati i baza za naučno-
istraživački rad, proučavanje istorijskih i političkih prilika kao i kulturne
istorije određene regije.