SlideShare a Scribd company logo
Projekt Europeana Newspapers
Evropská online brána k digitálním novinovým sbírkám



        Aleš Pekárek, Asociace evropských vědeckých
        knihoven (LIBER)
        13. Konference „Archívy, knihovny a muzea v
        digitálním světě, Praha, 28.11.2012
Obsah

•   Cíle a záměry projektu
•   Partnerské instituce
•   Oblasti projektových aktivit
•   Komunikace a diseminace projektu
•   Přidružení partneři projektu




                                       2
Proč zrovna noviny?


 „Noviny jsou bazarem dějin“ (Die Zeitungen sind der Sekundenzeiger der
  Geschichte)

Arthur Schopenhauer

 „Noviny jsou jedním z nejpopulárnějších materiálů v naší knihovně, protože
 přímo přetékají informacemi a mají co říci širokému spektru našich
 návštěvníků. V rámci projektu dodáme do Europeany 2 milliony našich plně
 digitalizovaných stránek, čímž je zpřístupníme mnohem většímu okruhu
 uživatelů a v mnohem širším kontextu než doposud.“

Lily Knibbeler,
Ředitelka Marketingu a Služeb Královské (Národní) knihovny Nizozemí

                 V novinách si zkrátka každý něco najde!


                                                                              3
Cíle & Záměry

1) Výběr, Rafinace („refinement“) a Agregace obsahu
• Učinit z Europeany největšího poskytovatele pan-evropské digitální sbírky
    novin
• Dodání více než 18 million novinových stránek do Europeany, mnoho z
    nich společně s vyextrahovaným fulltextem (OCR, OLR, NER)
2) Analýza existujících digitálních novinových sbírek
• Celoevropský průzkum
3) Kvalita & Doporučení nejlepší praxe
• Vytvoření optimalizovaného workflow a infrastruktur pro agregaci dat
• Doporučení nejlepších praxí pro pročištění, workflow, metadata a evaluačních
    nástrojů v oblasti digitalizace novinových sbírek
4) Prezentace obsahu a fulltextové vyhledávání
• Vylepšený přístup k novinovým sbírkám v rámci Europeany (Content
    Browser)



                                                                                 4
Projektové konsorcium & Stakeholdeři

• 17 partnerů z 12 zemí
    • Národní knihovny – obsahoví a techničtí partneři
    • Univerzitní knihovny – převážně techničtí partneři
    • Malý a střední podnik (CCS – Content Conversion Specialists)

• Externí partneři a stakeholdeři:
    • Zapojení knihoven vně projektového konsorcia

• Celkový rámec:
    • Financováno jako Best Practice Network v programu ICT-PSP
      Evropské komise
    • Trvání projektu: Únor 2012 – Leden 2015

                                                                     5
Partneři projektu Europeana Newspapers


                                    NLE                        NLF
                   LIBER
       TEL
                              SUB HH
                                                         NLL
                                        CCS
USAL
                                                   NLP

       BL                         SBB
                      KB                  ONB

                                                                 NLT
                           UIBK
             BnF

                                              UB
                             LFT
Partneři projektu

1. Staatsbibliothek zu Berlin    9. University of Salford
(koordinátor projektu)           10. CCS Content Conversion
2. National Library of the       Specialists GmbH
Netherlands                      11. Stichting LIBER
3. National Library of Estonia   12. National Library of Latvia
4. Österreichische               13. National Library of Turkey
Nationalbibliothek               14. University Library of Belgrade
5. National Library of Finland   15. University of Innsbruck
6. Staats- und                   16. Landesbibliothek Dr.
Universitätsbibliothek Hamburg   Friedrich Tessmann
7. Bibliothèque nationale de     17. The British Library
France
8. National Library of Poland
Struktura projektových aktivit (+ koordinátoři)

• Work Package 1: Koordinace a řízení projektu
  • Berlin State Library (SBB)
• Work Package 2: Výběr a rafinace digitalizovaných novin
  • National Library of the Netherlands (KB)
• Work Package 3: Evaluace a hodnocení kvality výběru
  • University of Salford (USAL)
• Work Package 4: Agregace a příprava novin pro Europeanu
  • The European Library (TEL)
• Work Package 5: Doporučení „Best Practice“ v oblasti novinových
 metadat
  • University of Innsbruck (UIBK)
• Work Package 6: Diseminace a zužitkování projektu
  • Association of European Research Libraries (LIBER)
WP 1: Koordinace a řízení projektu

• Administrace projektu
  • Řízení všech finančních a organizačních záležitostí
• Finanční kontrola
• Projektová komunikace
  • Sharepoint
• Zajištění kvality projektu
  • monitoring, evaluace a reporting výsledků
• Risk managament
  • Předcházení konfliktů v rámci konsorcia 
WP 2: Rafinace digitalizovaných novin

• Analýza obsahu a výběr vhodných souborů z digitálních
 novinových sbírek k “zušlechtění” (rafinaci)

• Definice požadavků na minimální kvalitu digitalizovaných
 novin

• Koordinace zušlechťování vybraného novinového obsahu –
 novin poskytnutých partnerskými institucemi

• Doporučení nejlepších praxí v oblasti rafinace digitálních
 novinových sbírek
WP2: Rafinace – OCR and OLR

• 8 millionů stránek bude do Europeany
  naagregováno „tak jak jsou”
==================================
• 10 millionů zrafinovaných stránek:            CCS: Automatické rozpoznávání a
  OCR (UIBK, Rakousko)                          segmentace novinových
Z toho:                                         sloupků a článků
2 milliony:
  OCR/OLR (segmentace článků)
  (CCS, Německo)

 UIBK obohatí vyextrahovaný obsah
 strukturálními informacemi z její „Platformy
 porozumění dokumentům“,
 CCS pak informacemi o sloupcích, článcích;
 zoning; segmentace článků a jejich úrovní
 CCS zároveň poskytuje knihovnám
 technologii pro manuální korekci výsledných         UIBK: Detekce titulků a poznámek;
 strukturálních informací                            Automatické generování obsahu
WP 2: Rafinace – Rozpoznávání jmenných entit

• KB dodala systém rozpoznávání jmenných entit (NER) (pro holandštinu,
 angličtinu a němčinu)
WP 3: Evaluace a hodnocení kvality

• Vytvoření uživatelských scénářů se vzorovými profily, datovými
 sadami, „ground truth“ a nástroji hodnocení kvality výstupů

• Přehled faktorů využitelnosti, limitů a reálného potenciálu
 existujících vstupních materiálů

• Identifikace kritických míst procesu společně s návrhem řešení

• Evaluace jednotlivých aktivit procesu

• Doporučení nejlepších praxí pro podobné post-digitalizační
 pojekty
WP 4: Agregace a příprava pro Europeanu

• Identifikace a analýza veřejných i soukromých zdigitalizovaných
  novinových sbírek napříč Evropou
• Vytvoření reálného časového rámce agregace novinového obsahu
• Vytvoření celoevropského registru digitalizovaných novinových
  sbírek
• Doporučení, jak napasovat existující novinová metadata na EDM
  (standard Europeany)
• Agregace novinových metadat partnerů projektu
• Vytvoření fulltextového indexu novinového obsahu
• Vývoj a spuštění prohlížeče obsahu (full-text + metadata +
  originálni skeny či náhledy
WP 4: Agregace obsahu

• Agregace 18 millionů digitalizovaných
  novinových stránek do služby Europeana
  prostřednictvím Evropské knihovny
  (jednotný portál evropských národních
  knihoven)
                                              www.europeana.eu
• Transformace vstupních metadat na bázi
  EDM

• Distribuce dat do Europeany (po jejich
  finální transformaci v rámci TEL)

                                           www.theeuropeanlibrary.org


                                                                 15
WP 4: Prezentace & Přístup k plným textům

Funkce obsahového browseru:
• Fulltextové vyhledávání, např.
  •   podle klíčového slova,
  •   podle jmenných entit
  •   podle novinových sbírek
  •   podle data vydání novin...
• Prohlížení naskenovaných
  novinových stránek
• Propojení s příbuzným obsahem
  nenovinového typu (fotky, hudba,
  pohlednice...)
WP 5: Doporučení nejlepších praxí v oblasti metadat


• Analýza novinových metadatových formátů používaných
 v evropských zemích

• Propojení existujících metadatových modelů se
 standardem METS/ALTO a vydání doporučení
 nejlepších praxí

  • Použitelnost doporučení bude testováno v rámci
    specifického evaluačního cyklu
WP 6: Komunikace a diseminace projektu

• Cíle
     • Vytvoření celoevropské publicity
     • Větší používanost Europeany
     • Zajištění informovanosti cílových skupin
•   Úkoly
     1. Komunikace v mediích
     2. Workshopy a účast na konferencích
         • Tři hlavní diseminační workshopy
           (rafinace, agregace, závěrečný)
         • Národní informační dny (minimálně 10)
         • Rozšíření sítě o další partnery
     3. Zužitkování výsledků projektu


                                                   18
Hlavní komunikační kanály projektu

WWW: http://www.europeana-newspapers.eu/
Twitter: @eurnews
Facebook: https://www.facebook.com/EuropeanaNewspapers
Newsletter: http://bit.ly/TsoMpY (najdete na webové stránce projektu)
Slideshare: http://www.slideshare.net/Europeana_Newspapers




                                                                        19
Přidružení partneři projektu

• Rozšíření sítě o tzv. Přidružené partnery projektu (nefinancované,
  nepřímé benefity z partnerství)
   • Možnost poskytnutí metadat digitálních novinových sbírek do Europeany v
     rámci procesů projektu  rapidní nárust návštěvníků
   • Využití a přístup k výsledkům projektu (doporučení, dokumentace, SW
     nástroje, metodika workflow)

   • Hlavně pro držitele obsahu

   • Většina identifikována v rámci průzkumu (40 vyplněných dotazníků, 35
     potenciálních přidružených partnerů – o metodě výběru se stále diskutuje)

   • Za ČR zájem projevila NK ČR a MZK (i ostatní instituce s digitálními
     novinovými sbírkami jsou vítány)


                                                                                 20
Děkuji za pozornost

  pekarek.ales@gmail.com
www.europeana-newspapers.eu
    www.libereurope.eu

More Related Content

What's hot

Portál Europeana, evropské projekty CARARE a LoCloud – inspirace pro informač...
Portál Europeana, evropské projekty CARARE a LoCloud – inspirace pro informač...Portál Europeana, evropské projekty CARARE a LoCloud – inspirace pro informač...
Portál Europeana, evropské projekty CARARE a LoCloud – inspirace pro informač...
locloud
 
Adolf Knoll - Digitální knihovna Manuscriptorium
Adolf Knoll - Digitální knihovna ManuscriptoriumAdolf Knoll - Digitální knihovna Manuscriptorium
Adolf Knoll - Digitální knihovna ManuscriptoriumKISK FF MU
 
Vít Richter: Koncepce rozvoje knihoven ČR 2017-2020
Vít Richter: Koncepce rozvoje knihoven ČR 2017-2020Vít Richter: Koncepce rozvoje knihoven ČR 2017-2020
Vít Richter: Koncepce rozvoje knihoven ČR 2017-2020
ÚISK FF UK
 
Informační zdroje pro germanistiku
Informační zdroje pro germanistiku Informační zdroje pro germanistiku
Informační zdroje pro germanistiku
Ústřední knihovna FF MU
 
Preparatory Study for the Strategy of Digitisation of the Cultural Content in...
Preparatory Study for the Strategy of Digitisation of the Cultural Content in...Preparatory Study for the Strategy of Digitisation of the Cultural Content in...
Preparatory Study for the Strategy of Digitisation of the Cultural Content in...
EuropeanaLocal Project
 

What's hot (7)

M. Lhoták
M. LhotákM. Lhoták
M. Lhoták
 
Portál Europeana, evropské projekty CARARE a LoCloud – inspirace pro informač...
Portál Europeana, evropské projekty CARARE a LoCloud – inspirace pro informač...Portál Europeana, evropské projekty CARARE a LoCloud – inspirace pro informač...
Portál Europeana, evropské projekty CARARE a LoCloud – inspirace pro informač...
 
Adolf Knoll - Digitální knihovna Manuscriptorium
Adolf Knoll - Digitální knihovna ManuscriptoriumAdolf Knoll - Digitální knihovna Manuscriptorium
Adolf Knoll - Digitální knihovna Manuscriptorium
 
Vít Richter: Koncepce rozvoje knihoven ČR 2017-2020
Vít Richter: Koncepce rozvoje knihoven ČR 2017-2020Vít Richter: Koncepce rozvoje knihoven ČR 2017-2020
Vít Richter: Koncepce rozvoje knihoven ČR 2017-2020
 
Seminar KK II.
Seminar KK II.Seminar KK II.
Seminar KK II.
 
Informační zdroje pro germanistiku
Informační zdroje pro germanistiku Informační zdroje pro germanistiku
Informační zdroje pro germanistiku
 
Preparatory Study for the Strategy of Digitisation of the Cultural Content in...
Preparatory Study for the Strategy of Digitisation of the Cultural Content in...Preparatory Study for the Strategy of Digitisation of the Cultural Content in...
Preparatory Study for the Strategy of Digitisation of the Cultural Content in...
 

Viewers also liked

The Europeana Newspapers Project at IMPACT Final Event
The Europeana Newspapers Project at IMPACT Final EventThe Europeana Newspapers Project at IMPACT Final Event
The Europeana Newspapers Project at IMPACT Final Event
Europeana Newspapers
 
ENP Belgrade Workshop Project Overview
ENP Belgrade Workshop Project OverviewENP Belgrade Workshop Project Overview
ENP Belgrade Workshop Project Overview
Europeana Newspapers
 
Europeana Newspapers German infoday - Digitale Zeitungsarchive als Quellen (d...
Europeana Newspapers German infoday - Digitale Zeitungsarchive als Quellen (d...Europeana Newspapers German infoday - Digitale Zeitungsarchive als Quellen (d...
Europeana Newspapers German infoday - Digitale Zeitungsarchive als Quellen (d...
Europeana Newspapers
 
EurnewsLDN_Satu_Kangas
EurnewsLDN_Satu_KangasEurnewsLDN_Satu_Kangas
EurnewsLDN_Satu_Kangas
Europeana Newspapers
 
The Europeana Newspapers Presentation - Cyberspace 2012
The Europeana Newspapers Presentation - Cyberspace 2012The Europeana Newspapers Presentation - Cyberspace 2012
The Europeana Newspapers Presentation - Cyberspace 2012
Europeana Newspapers
 

Viewers also liked (6)

The Europeana Newspapers Project at IMPACT Final Event
The Europeana Newspapers Project at IMPACT Final EventThe Europeana Newspapers Project at IMPACT Final Event
The Europeana Newspapers Project at IMPACT Final Event
 
ENP Belgrade Workshop Project Overview
ENP Belgrade Workshop Project OverviewENP Belgrade Workshop Project Overview
ENP Belgrade Workshop Project Overview
 
Europeana Newspapers German infoday - Digitale Zeitungsarchive als Quellen (d...
Europeana Newspapers German infoday - Digitale Zeitungsarchive als Quellen (d...Europeana Newspapers German infoday - Digitale Zeitungsarchive als Quellen (d...
Europeana Newspapers German infoday - Digitale Zeitungsarchive als Quellen (d...
 
EurnewsLDN_Satu_Kangas
EurnewsLDN_Satu_KangasEurnewsLDN_Satu_Kangas
EurnewsLDN_Satu_Kangas
 
Enp lft infoday_neudecker
Enp lft infoday_neudeckerEnp lft infoday_neudecker
Enp lft infoday_neudecker
 
The Europeana Newspapers Presentation - Cyberspace 2012
The Europeana Newspapers Presentation - Cyberspace 2012The Europeana Newspapers Presentation - Cyberspace 2012
The Europeana Newspapers Presentation - Cyberspace 2012
 

Similar to Europeana Newspapers - evropská brána k digitálním novinovým sbírkám

Sharing Knowledge - Open Access Repositories in the V4 Countries
Sharing Knowledge - Open Access Repositories in the V4 CountriesSharing Knowledge - Open Access Repositories in the V4 Countries
Sharing Knowledge - Open Access Repositories in the V4 Countries
Tereza Simandlová
 
Digitalni knihovna AV ČR
Digitalni knihovna AV ČRDigitalni knihovna AV ČR
Digitalni knihovna AV ČR
Ivana Šlapáková
 
Knihovny.cz v Bloku expertů KISK 2017
Knihovny.cz v Bloku expertů KISK 2017 Knihovny.cz v Bloku expertů KISK 2017
Knihovny.cz v Bloku expertů KISK 2017
Knihovny.cz
 
Knihovny.cz v Bloku expertů 2017
Knihovny.cz v Bloku expertů 2017Knihovny.cz v Bloku expertů 2017
Knihovny.cz v Bloku expertů 2017
Centrální portál knihoven
 
Ceska digitalni knihovna
Ceska digitalni knihovnaCeska digitalni knihovna
Ceska digitalni knihovnamartinlhotak
 
Klára Rösslerová: Henrietta D. Avramová (1919-2006) a její přínos pro obor kn...
Klára Rösslerová: Henrietta D. Avramová (1919-2006) a její přínos pro obor kn...Klára Rösslerová: Henrietta D. Avramová (1919-2006) a její přínos pro obor kn...
Klára Rösslerová: Henrietta D. Avramová (1919-2006) a její přínos pro obor kn...
ÚISK FF UK
 
Vít Richter: Benchmarking knihoven
Vít Richter: Benchmarking knihovenVít Richter: Benchmarking knihoven
Vít Richter: Benchmarking knihoven
ÚISK FF UK
 
Clanky.knihovna.cz
Clanky.knihovna.czClanky.knihovna.cz
Clanky.knihovna.czKISK FF MU
 
Martin Svoboda: Budoucnost knihoven a jak koncipovat knihovny pro budoucnost
Martin Svoboda: Budoucnost knihoven a jak koncipovat knihovny pro budoucnost Martin Svoboda: Budoucnost knihoven a jak koncipovat knihovny pro budoucnost
Martin Svoboda: Budoucnost knihoven a jak koncipovat knihovny pro budoucnost
ÚISK FF UK
 
Elektronické publikování a vědecká komunikace
Elektronické publikování a vědecká komunikaceElektronické publikování a vědecká komunikace
Elektronické publikování a vědecká komunikace
lindask
 
Redakční systémy pro odborná periodika
Redakční systémy pro odborná periodikaRedakční systémy pro odborná periodika
Redakční systémy pro odborná periodika
KarolinumPress
 
Jan Mach: Akademické výsledky na veřejnosti - hrozba či příležitost?
Jan Mach: Akademické výsledky na veřejnosti - hrozba či příležitost? Jan Mach: Akademické výsledky na veřejnosti - hrozba či příležitost?
Jan Mach: Akademické výsledky na veřejnosti - hrozba či příležitost?
ÚISK FF UK
 
Centrální portál knihoven
Centrální portál knihovenCentrální portál knihoven
Centrální portál knihoven
MoravskaZemskaKnihovna
 
Webarchiv CZ
Webarchiv CZWebarchiv CZ
Open Access - OA Week v KJP 2012 (22. 10. 2012 v KJP)
Open Access - OA Week v KJP 2012 (22. 10. 2012 v KJP)Open Access - OA Week v KJP 2012 (22. 10. 2012 v KJP)
Open Access - OA Week v KJP 2012 (22. 10. 2012 v KJP)
e-zdroje FFUK
 
Záležitosti elektronického publikování a současné metody vědecké komunikace
Záležitosti elektronického publikování a současné metody vědecké komunikaceZáležitosti elektronického publikování a současné metody vědecké komunikace
Záležitosti elektronického publikování a současné metody vědecké komunikace
lindask
 
OpenAIRE & OpenAIREplus: Od pilotního projektu v 7. RP k evropskému portálu o...
OpenAIRE & OpenAIREplus: Od pilotního projektu v 7. RP k evropskému portálu o...OpenAIRE & OpenAIREplus: Od pilotního projektu v 7. RP k evropskému portálu o...
OpenAIRE & OpenAIREplus: Od pilotního projektu v 7. RP k evropskému portálu o...Daniela Tkačíková
 

Similar to Europeana Newspapers - evropská brána k digitálním novinovým sbírkám (20)

Sharing Knowledge - Open Access Repositories in the V4 Countries
Sharing Knowledge - Open Access Repositories in the V4 CountriesSharing Knowledge - Open Access Repositories in the V4 Countries
Sharing Knowledge - Open Access Repositories in the V4 Countries
 
Digitalni knihovna AV ČR
Digitalni knihovna AV ČRDigitalni knihovna AV ČR
Digitalni knihovna AV ČR
 
Knihovny.cz v Bloku expertů KISK 2017
Knihovny.cz v Bloku expertů KISK 2017 Knihovny.cz v Bloku expertů KISK 2017
Knihovny.cz v Bloku expertů KISK 2017
 
Knihovny.cz v Bloku expertů 2017
Knihovny.cz v Bloku expertů 2017Knihovny.cz v Bloku expertů 2017
Knihovny.cz v Bloku expertů 2017
 
Ceska digitalni knihovna
Ceska digitalni knihovnaCeska digitalni knihovna
Ceska digitalni knihovna
 
Klára Rösslerová: Henrietta D. Avramová (1919-2006) a její přínos pro obor kn...
Klára Rösslerová: Henrietta D. Avramová (1919-2006) a její přínos pro obor kn...Klára Rösslerová: Henrietta D. Avramová (1919-2006) a její přínos pro obor kn...
Klára Rösslerová: Henrietta D. Avramová (1919-2006) a její přínos pro obor kn...
 
Vít Richter: Benchmarking knihoven
Vít Richter: Benchmarking knihovenVít Richter: Benchmarking knihoven
Vít Richter: Benchmarking knihoven
 
Clanky.knihovna.cz
Clanky.knihovna.czClanky.knihovna.cz
Clanky.knihovna.cz
 
Martin Svoboda: Budoucnost knihoven a jak koncipovat knihovny pro budoucnost
Martin Svoboda: Budoucnost knihoven a jak koncipovat knihovny pro budoucnost Martin Svoboda: Budoucnost knihoven a jak koncipovat knihovny pro budoucnost
Martin Svoboda: Budoucnost knihoven a jak koncipovat knihovny pro budoucnost
 
Slezska digitalni knihovna
Slezska digitalni knihovnaSlezska digitalni knihovna
Slezska digitalni knihovna
 
Elektronické publikování a vědecká komunikace
Elektronické publikování a vědecká komunikaceElektronické publikování a vědecká komunikace
Elektronické publikování a vědecká komunikace
 
Redakční systémy pro odborná periodika
Redakční systémy pro odborná periodikaRedakční systémy pro odborná periodika
Redakční systémy pro odborná periodika
 
Jan Mach: Akademické výsledky na veřejnosti - hrozba či příležitost?
Jan Mach: Akademické výsledky na veřejnosti - hrozba či příležitost? Jan Mach: Akademické výsledky na veřejnosti - hrozba či příležitost?
Jan Mach: Akademické výsledky na veřejnosti - hrozba či příležitost?
 
Centrální portál knihoven
Centrální portál knihovenCentrální portál knihoven
Centrální portál knihoven
 
Webarchiv CZ
Webarchiv CZWebarchiv CZ
Webarchiv CZ
 
Centralab workshop
Centralab workshopCentralab workshop
Centralab workshop
 
Prezentace zcu 2-1
Prezentace zcu 2-1Prezentace zcu 2-1
Prezentace zcu 2-1
 
Open Access - OA Week v KJP 2012 (22. 10. 2012 v KJP)
Open Access - OA Week v KJP 2012 (22. 10. 2012 v KJP)Open Access - OA Week v KJP 2012 (22. 10. 2012 v KJP)
Open Access - OA Week v KJP 2012 (22. 10. 2012 v KJP)
 
Záležitosti elektronického publikování a současné metody vědecké komunikace
Záležitosti elektronického publikování a současné metody vědecké komunikaceZáležitosti elektronického publikování a současné metody vědecké komunikace
Záležitosti elektronického publikování a současné metody vědecké komunikace
 
OpenAIRE & OpenAIREplus: Od pilotního projektu v 7. RP k evropskému portálu o...
OpenAIRE & OpenAIREplus: Od pilotního projektu v 7. RP k evropskému portálu o...OpenAIRE & OpenAIREplus: Od pilotního projektu v 7. RP k evropskému portálu o...
OpenAIRE & OpenAIREplus: Od pilotního projektu v 7. RP k evropskému portálu o...
 

More from Europeana Newspapers

Presentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in ParisPresentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in Paris
Europeana Newspapers
 
Presentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information DayPresentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information Day
Europeana Newspapers
 
Presentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information DayPresentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information Day
Europeana Newspapers
 
Presentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information DayPresentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information Day
Europeana Newspapers
 
Présentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayPrésentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information Day
Europeana Newspapers
 
Presentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information DayPresentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information Day
Europeana Newspapers
 
Presentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information DayPresentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information Day
Europeana Newspapers
 
IFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza AtanassovaIFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza Atanassova
Europeana Newspapers
 
Europeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne KoutsEuropeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers
 
Europeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel VeimannEuropeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers
 
Europeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista KiisaEuropeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers
 
Europeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista AruEuropeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers
 
Europeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred PussEuropeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers
 
Europeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday Neudecker
Europeana Newspapers
 
Europeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday ThompsonEuropeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday Thompson
Europeana Newspapers
 
Europeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday RossiEuropeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday Rossi
Europeana Newspapers
 
Europeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday MuehlbergerEuropeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers
 
Europeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday MessinaEuropeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday Messina
Europeana Newspapers
 
Europeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday MarchettiEuropeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday Marchetti
Europeana Newspapers
 
Europeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday KempfEuropeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday Kempf
Europeana Newspapers
 

More from Europeana Newspapers (20)

Presentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in ParisPresentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in Paris
 
Presentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information DayPresentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information Day
 
Presentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information DayPresentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information Day
 
Presentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information DayPresentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information Day
 
Présentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayPrésentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information Day
 
Presentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information DayPresentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information Day
 
Presentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information DayPresentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information Day
 
IFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza AtanassovaIFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza Atanassova
 
Europeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne KoutsEuropeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne Kouts
 
Europeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel VeimannEuropeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel Veimann
 
Europeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista KiisaEuropeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista Kiisa
 
Europeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista AruEuropeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista Aru
 
Europeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred PussEuropeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred Puss
 
Europeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday Neudecker
 
Europeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday ThompsonEuropeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday Thompson
 
Europeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday RossiEuropeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday Rossi
 
Europeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday MuehlbergerEuropeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday Muehlberger
 
Europeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday MessinaEuropeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday Messina
 
Europeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday MarchettiEuropeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday Marchetti
 
Europeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday KempfEuropeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday Kempf
 

Europeana Newspapers - evropská brána k digitálním novinovým sbírkám

  • 1. Projekt Europeana Newspapers Evropská online brána k digitálním novinovým sbírkám Aleš Pekárek, Asociace evropských vědeckých knihoven (LIBER) 13. Konference „Archívy, knihovny a muzea v digitálním světě, Praha, 28.11.2012
  • 2. Obsah • Cíle a záměry projektu • Partnerské instituce • Oblasti projektových aktivit • Komunikace a diseminace projektu • Přidružení partneři projektu 2
  • 3. Proč zrovna noviny? „Noviny jsou bazarem dějin“ (Die Zeitungen sind der Sekundenzeiger der Geschichte) Arthur Schopenhauer „Noviny jsou jedním z nejpopulárnějších materiálů v naší knihovně, protože přímo přetékají informacemi a mají co říci širokému spektru našich návštěvníků. V rámci projektu dodáme do Europeany 2 milliony našich plně digitalizovaných stránek, čímž je zpřístupníme mnohem většímu okruhu uživatelů a v mnohem širším kontextu než doposud.“ Lily Knibbeler, Ředitelka Marketingu a Služeb Královské (Národní) knihovny Nizozemí V novinách si zkrátka každý něco najde! 3
  • 4. Cíle & Záměry 1) Výběr, Rafinace („refinement“) a Agregace obsahu • Učinit z Europeany největšího poskytovatele pan-evropské digitální sbírky novin • Dodání více než 18 million novinových stránek do Europeany, mnoho z nich společně s vyextrahovaným fulltextem (OCR, OLR, NER) 2) Analýza existujících digitálních novinových sbírek • Celoevropský průzkum 3) Kvalita & Doporučení nejlepší praxe • Vytvoření optimalizovaného workflow a infrastruktur pro agregaci dat • Doporučení nejlepších praxí pro pročištění, workflow, metadata a evaluačních nástrojů v oblasti digitalizace novinových sbírek 4) Prezentace obsahu a fulltextové vyhledávání • Vylepšený přístup k novinovým sbírkám v rámci Europeany (Content Browser) 4
  • 5. Projektové konsorcium & Stakeholdeři • 17 partnerů z 12 zemí • Národní knihovny – obsahoví a techničtí partneři • Univerzitní knihovny – převážně techničtí partneři • Malý a střední podnik (CCS – Content Conversion Specialists) • Externí partneři a stakeholdeři: • Zapojení knihoven vně projektového konsorcia • Celkový rámec: • Financováno jako Best Practice Network v programu ICT-PSP Evropské komise • Trvání projektu: Únor 2012 – Leden 2015 5
  • 6. Partneři projektu Europeana Newspapers NLE NLF LIBER TEL SUB HH NLL CCS USAL NLP BL SBB KB ONB NLT UIBK BnF UB LFT
  • 7. Partneři projektu 1. Staatsbibliothek zu Berlin 9. University of Salford (koordinátor projektu) 10. CCS Content Conversion 2. National Library of the Specialists GmbH Netherlands 11. Stichting LIBER 3. National Library of Estonia 12. National Library of Latvia 4. Österreichische 13. National Library of Turkey Nationalbibliothek 14. University Library of Belgrade 5. National Library of Finland 15. University of Innsbruck 6. Staats- und 16. Landesbibliothek Dr. Universitätsbibliothek Hamburg Friedrich Tessmann 7. Bibliothèque nationale de 17. The British Library France 8. National Library of Poland
  • 8. Struktura projektových aktivit (+ koordinátoři) • Work Package 1: Koordinace a řízení projektu • Berlin State Library (SBB) • Work Package 2: Výběr a rafinace digitalizovaných novin • National Library of the Netherlands (KB) • Work Package 3: Evaluace a hodnocení kvality výběru • University of Salford (USAL) • Work Package 4: Agregace a příprava novin pro Europeanu • The European Library (TEL) • Work Package 5: Doporučení „Best Practice“ v oblasti novinových metadat • University of Innsbruck (UIBK) • Work Package 6: Diseminace a zužitkování projektu • Association of European Research Libraries (LIBER)
  • 9. WP 1: Koordinace a řízení projektu • Administrace projektu • Řízení všech finančních a organizačních záležitostí • Finanční kontrola • Projektová komunikace • Sharepoint • Zajištění kvality projektu • monitoring, evaluace a reporting výsledků • Risk managament • Předcházení konfliktů v rámci konsorcia 
  • 10. WP 2: Rafinace digitalizovaných novin • Analýza obsahu a výběr vhodných souborů z digitálních novinových sbírek k “zušlechtění” (rafinaci) • Definice požadavků na minimální kvalitu digitalizovaných novin • Koordinace zušlechťování vybraného novinového obsahu – novin poskytnutých partnerskými institucemi • Doporučení nejlepších praxí v oblasti rafinace digitálních novinových sbírek
  • 11. WP2: Rafinace – OCR and OLR • 8 millionů stránek bude do Europeany naagregováno „tak jak jsou” ================================== • 10 millionů zrafinovaných stránek: CCS: Automatické rozpoznávání a OCR (UIBK, Rakousko) segmentace novinových Z toho: sloupků a článků 2 milliony: OCR/OLR (segmentace článků) (CCS, Německo) UIBK obohatí vyextrahovaný obsah strukturálními informacemi z její „Platformy porozumění dokumentům“, CCS pak informacemi o sloupcích, článcích; zoning; segmentace článků a jejich úrovní CCS zároveň poskytuje knihovnám technologii pro manuální korekci výsledných UIBK: Detekce titulků a poznámek; strukturálních informací Automatické generování obsahu
  • 12. WP 2: Rafinace – Rozpoznávání jmenných entit • KB dodala systém rozpoznávání jmenných entit (NER) (pro holandštinu, angličtinu a němčinu)
  • 13. WP 3: Evaluace a hodnocení kvality • Vytvoření uživatelských scénářů se vzorovými profily, datovými sadami, „ground truth“ a nástroji hodnocení kvality výstupů • Přehled faktorů využitelnosti, limitů a reálného potenciálu existujících vstupních materiálů • Identifikace kritických míst procesu společně s návrhem řešení • Evaluace jednotlivých aktivit procesu • Doporučení nejlepších praxí pro podobné post-digitalizační pojekty
  • 14. WP 4: Agregace a příprava pro Europeanu • Identifikace a analýza veřejných i soukromých zdigitalizovaných novinových sbírek napříč Evropou • Vytvoření reálného časového rámce agregace novinového obsahu • Vytvoření celoevropského registru digitalizovaných novinových sbírek • Doporučení, jak napasovat existující novinová metadata na EDM (standard Europeany) • Agregace novinových metadat partnerů projektu • Vytvoření fulltextového indexu novinového obsahu • Vývoj a spuštění prohlížeče obsahu (full-text + metadata + originálni skeny či náhledy
  • 15. WP 4: Agregace obsahu • Agregace 18 millionů digitalizovaných novinových stránek do služby Europeana prostřednictvím Evropské knihovny (jednotný portál evropských národních knihoven) www.europeana.eu • Transformace vstupních metadat na bázi EDM • Distribuce dat do Europeany (po jejich finální transformaci v rámci TEL) www.theeuropeanlibrary.org 15
  • 16. WP 4: Prezentace & Přístup k plným textům Funkce obsahového browseru: • Fulltextové vyhledávání, např. • podle klíčového slova, • podle jmenných entit • podle novinových sbírek • podle data vydání novin... • Prohlížení naskenovaných novinových stránek • Propojení s příbuzným obsahem nenovinového typu (fotky, hudba, pohlednice...)
  • 17. WP 5: Doporučení nejlepších praxí v oblasti metadat • Analýza novinových metadatových formátů používaných v evropských zemích • Propojení existujících metadatových modelů se standardem METS/ALTO a vydání doporučení nejlepších praxí • Použitelnost doporučení bude testováno v rámci specifického evaluačního cyklu
  • 18. WP 6: Komunikace a diseminace projektu • Cíle • Vytvoření celoevropské publicity • Větší používanost Europeany • Zajištění informovanosti cílových skupin • Úkoly 1. Komunikace v mediích 2. Workshopy a účast na konferencích • Tři hlavní diseminační workshopy (rafinace, agregace, závěrečný) • Národní informační dny (minimálně 10) • Rozšíření sítě o další partnery 3. Zužitkování výsledků projektu 18
  • 19. Hlavní komunikační kanály projektu WWW: http://www.europeana-newspapers.eu/ Twitter: @eurnews Facebook: https://www.facebook.com/EuropeanaNewspapers Newsletter: http://bit.ly/TsoMpY (najdete na webové stránce projektu) Slideshare: http://www.slideshare.net/Europeana_Newspapers 19
  • 20. Přidružení partneři projektu • Rozšíření sítě o tzv. Přidružené partnery projektu (nefinancované, nepřímé benefity z partnerství) • Možnost poskytnutí metadat digitálních novinových sbírek do Europeany v rámci procesů projektu  rapidní nárust návštěvníků • Využití a přístup k výsledkům projektu (doporučení, dokumentace, SW nástroje, metodika workflow) • Hlavně pro držitele obsahu • Většina identifikována v rámci průzkumu (40 vyplněných dotazníků, 35 potenciálních přidružených partnerů – o metodě výběru se stále diskutuje) • Za ČR zájem projevila NK ČR a MZK (i ostatní instituce s digitálními novinovými sbírkami jsou vítány) 20
  • 21. Děkuji za pozornost pekarek.ales@gmail.com www.europeana-newspapers.eu www.libereurope.eu