TELplus és EDLnet úton az EurópaiDigitális Könyvtár felé - Múzeumok az EUROPEANA-ban
1. TELplus és EDLnet
úton az Európai
Digitális Könyvtár felé
Horváth Ádám
Országos Széchényi Könyvtár
Múzeumok az EUROPEANA-ban -
ATHENA projekt
Budapest, 2009. május 22.
2. TELPlus - 2 Horváth Ádám - OSZK
Tartalom
• TELPlus
• EDLNet
3. TELPlus - 3 Horváth Ádám - OSZK
TELPlus
• Fő cél
– A The European Library átalakulhasson egy
Európai Digitális Könyvtárrá
– Résztvevők
• 26 nemzeti könyvtár
• Honlap
http://www.theeuropeanlibrary.org/telplus/
4. TELPlus - 4 Horváth Ádám - OSZK
TELPlus
• Eszköz
– Optikai karakterfelismeréssel kereshetővé
tenni a digitalizált könyveket
– A leíró adatokat OAI kompatibilissé tenni
– Új keresőmotor kiválasztása
– Web szolgáltatások integrálása a TEL
keresőfelületébe
– TEL személyre szabása
– Bulgária és Románia csatlakoztatása a TEL-
hez
5. TELPlus - 5 Horváth Ádám - OSZK
TELPlus
• Karakterfelismerés
– 50 millió oldal felismertetés
– Leíró adatok és a szövegek begyűjtése
• TEL Application Profile
– http://www.theeuropeanlibrary.org/handbook/Metada
ta/tel_ap.html
• <tel:fullText>
• <tel:structuralMetadata>
– Leíró adatok és a szövegek indexelése
• Lucene
6. TELPlus - 6 Horváth Ádám - OSZK
TELPlus
• OAI-PMH kompatibilitás
– Repox OAI-PMH szerver
• Input formátum: ISO2709, MARCXML,
MarcXchange; bármi
• Input karakterkészlet: sokféle köztük a MARC8
• Belső formátum: MarcXchange/ normalizált
UTF-8, vagy bármi.
• Kimenet: TEL Application Profile, bármi (XLST
megadható)
• Tud aratni is
7. TELPlus - 7 Horváth Ádám - OSZK
TELPlus
• Az elérhetőség növelése (1/3)
– Használhatóbb indexelés és keresés
• Nevek, kulcsszavak, helyek felismerése
• Egyértelműsítés (London)
• „Facet” navigálás
• Keresési javaslat
• „Fuzzy” és fonetikus keresés
• Hasonló dokumentumok megmutatása
• Többnyelvű keresés
9. TELPlus - 9 Horváth Ádám - OSZK
TELPlus
• Az elérhetőség növelése (3/3)
– FRBR keresés és böngészés megvalósítása
• Egy szűkebb mintán: Biblia, Nobel díjasok
• Szemantikus megoldás
10. TELPlus - 10 Horváth Ádám - OSZK
TELPlus
• Web szolgáltatások
– Szolgáltatások felkutatás
– Szolgáltatásokat leíró séma
– Szolgáltatás regiszter készítése
– Szolgáltatások integrálása a TEL portálba
– Új szolgáltatások készítése
• Képek annotálása
• Zoom szolgáltatás
• Időgép a Google térképek szolgáltatásán
• SKOS rekordok készítése tezaurusz rekordokból és név
besorolási adatokból: OSZK kész
• Szövegelemző (nevek kiemelése, csak angolra)
• Szövegkiemelő (keresőszót)
• XSLT transzformáció
11. TELPlus - 11 Horváth Ádám - OSZK
TELPlus
• Személyre szabás
– A felhasználó viselkedésének megértése
– Igények felmérése
– Személyre szabott keresés
– Személyre szabott értesítések
– Annotálás
12. TELPlus - 12 Horváth Ádám - OSZK
TELPlus
• OSZK részvétel
– Karakterfelismerés
• 200 000 oldal: készül
– OAI-PMH
• A teljes katalógus arathatóvá tétele: készül
• Az teljes-szöveges dokumentumok arathatóvá
tétele: készül
– Webszolgáltatások
• Tezaurusz használata a keresés gazdagítására
– SKOS SRU kereséssel: kész
13. TELPlus - 13 Horváth Ádám - OSZK
EDLNet
• Cél
– Európai Digitális Könyvtár megteremtése a
könyvtárak, múzeumok és levéltárak
együttműködésével
• Honlap
http://www.theeuropeanlibrary.org/por
tal/organisation/cooperation/archive/ed
lproject/index.php
14. TELPlus - 14 Horváth Ádám - OSZK
EDLNet
• Eredmények
– Folyamatos támogatás: Holland Nemzeti
Könyvtár, Német kormány, EU
– Közel 5 millió objektum
– Kb. 200 közreműködő intézmény
– Objektum modell kész
– Irányítási modell van
– Működő prototípus
– Javasolt gazdasági modell van
– Elkezdődött a tényleges szervezet
felépítése
15. TELPlus - 15 Horváth Ádám - OSZK
EDLNet -> Europeana V.1.0
• Feladatok (1/2)
– Beadás automatizálása
– Az adatok fejlesztése
– Jogkezelés megoldása (beleértve a szabad
dokumentumok megtartását)
– Az objektum modell megvalósítása
– Felhasználó által létrehozott tartalom
kezelése
– Többnyelvű keresés fejlesztése
16. TELPlus - 16 Horváth Ádám - OSZK
EDLNet - > Europeana V.1.0
• Feladatok (2/2)
– Márka létrehozása
– A márka eladása
– Egyetértés az irányításról
– További pályázatok
– Europeana Open Source feljelesztői
közösség létrehozása
– Új kapcsolatok építése
– Hosszútávú önfenntartó működés
biztosítása
17. TELPlus - 17 Horváth Ádám - OSZK
Europeana V.1.0
• Elosztott fejlesztés
18. TELPlus - 18 Horváth Ádám - OSZK
EDLNet
• Elosztott fejlesztés
19. TELPlus - 19 Horváth Ádám - OSZK
The Big Post-It
experiment [2/4]
20. TELPlus - 20 Horváth Ádám - OSZK
Europeana körüli projektek
– Europeana V.1.0
– EuropeanaConnect
• Nagyon sok fejlesztés ennek keretében valósul
meg
– EuropeanaLocal
• Magyar részvétel
– Athena
• Magyar részvétel
21. TELPlus - 21 Horváth Ádám - OSZK
Europeana V.1.0
• Adatmodell
– http://dev.europeana.eu/
functional specification
22. TELPlus - 22 Horváth Ádám - OSZK
EDLNet
• Adatmodell
23. TELPlus - 23 Horváth Ádám - OSZK
• Szurrogátum modell
24. TELPlus - 24 Horváth Ádám - OSZK
EDLNet
• Adatmodell
25. TELPlus - 25 Horváth Ádám - OSZK
Europeana V.1.0
• Konkretizálás alapjai lehetnek
– DELOS Reference Model:
http://www.delos.info/ReferenceModel
– MPEG 21 DIDL:
http://xml.coverpages.org/MPEG21-WG-11-
N3971-200103.pdf
– PRISM, Publishing Requirements Industry
Standard Metadata,
http://www.prismstan dard.org/
– OAI-Data: ORE
http://www.openarchives.org/ore/0.1/datamodel
– CIDOC CRM / FRBRoo
http://cidoc.ics.forth.gr/docs/frbr_oo/frbr_docs/FR
BR_oo_V0.9.pdf
26. TELPlus - 26 Horváth Ádám - OSZK
Europeana V.1.0
• Az Europeana prototípus így
konkretizált:
– Europeana Semantic Elements
• http://dev.europeana.eu/
specification for metadata elements
27. TELPlus - 27 Horváth Ádám - OSZK
Europeana V.1.0
• Europeana Semantic Elements (1/2)
– DC title; alternative
– DC creator
– DC subject
– DC description tableOfContents
– DC publisher
– DC contributor
– DC date created; issued
– DC type
– DC format extent; medium
– DC identifier
– DC source
– DC language
– DC relation; isVersionOf; hasVersion; isReplacedBy;
– replaces; isRequiredBy; requires;
– isPartOf; hasPart; isReferencedBy;
– references; isFormatOf; hasFormat;
– conformsTo
– DC coverage; spatial; temporal
– DC rights
– DCterms provenance
28. TELPlus - 28 Horváth Ádám - OSZK
Europeana V.1.0
• Europeana Semantic Elements (1/2)
– Europeana isShownBy; isShownAt
– Europeana userTag
– Europeana unstored
– Europeana object
– Europeana language
– Europeana provider
– Europeana type
– Europeana uri
– Europeana year
– Europeana hasObject
– Europeana country
29. TELPlus - 29 Horváth Ádám - OSZK
Europeana V.1.0
• Fejlesztés módszere
– OpenSource és kód megosztás az
EuropenaLabs keretein belül
– Fejlesztési környezet a gyors prototípus
készítéshez
– Nagy mennyiségű, jó minőségű adatok
– Homokozó a teszteléshez
• Hatékonyság
• Skálázhatóság