Az előadás bemutatja a két, európai uniós támogatásból megvalósult portált, rövid fejlődéstörténetüket, az elmúlt évek fejlesztéseinek eredményeit, s a tudományos kutatás számára kifejlesztett szolgáltatásaikat, különös tekintettel arra, hogy hogyan teszik könnyen hozzáférhetővé és mélységeiben is kutathatóvá ezt a hatalmas, soknyelvű, rendkívül heterogén adathalmazt a nyílt hozzáférésű adatok összekapcsolása révén.
A MAMA-tól az Europeana-ig. Útkereső stratégiák a múzeumi digitalizációban
Hozzáférés és újrahasznosítás. A TEL és az Europeana a tudományos kutatás szolgálatában
1. Hozzáférés és újrahasznosítás
A TEL és az Europeana
a tudományos kutatás
szolgálatában
Kovácsné Koreny Ágnes
Fővárosi Szabó Ervin Könyvtár
2. Kutatók a virtuális térben
10 évnyi kutatás a virtuális kutatók információ-keresési és olvasási szokásairól
Centre for Comparative and International Business Research (CIBER), UK
Virtuális környezetben rendkívül aktívak, de a munka nagy részét robotokkal
végeztetik.
Mit szeretnének?
Közvetlen hozzáférést.
Még több digitalizálást és a digitális anyagok elérését, hozzáférhetőségét - lehetőleg mindent digitálisan.
Drót nélküli hozzáférést.
Mobil eszközöket, s rajtuk a tartalmat.
3. Szeretnek ugrálni, minél többet, innen oda
A több ezer elérhető oldalból egyet vagy kettőt néznek meg.
40%-uk nem megy vissza többé egy egyszer már használt oldalhoz.
Hogy miért ugrálnak? Mert…
… keresőmotort használnak, ami (túl) sok (nem releváns) találatot és
rengeteg linket ajánl fel, amelyek között élvezet ugrálni.
… gyenge a keresési kompetenciájuk (Google - max. 2,2 szvas keresőkifejezés).
… kevés az idejük.
4. Másképp olvasnak
A horizontális felváltotta a vertikálisat
Gyorsan olvasnak - keresik a kulcsszavakat a szövegben
Cím, heading, összefoglaló (abstract) és a linkek fontossága.
Olvasás helyett „rápillantás”
Néhány percet töltenek a kereséssel, illetve egy oldalon - 15 perc már sok.
Cikkre 3-4 percet szánnak - a rövidebb cikkeknek nagyobb esélyük van arra, hogy valaki elolvassa őket.
Ha mégis hosszú, csak az összefoglalást olvassák el. Vagy letöltik, s elteszik maguknak máskorra.
5. Gyors információ – információs falatkák
Kis adagokban, mindent, gyorsan.
A hátsó/oldalsó bejáratokon jönnek be (linkek).
Nem használják a szépen kialakított, rájuk szabott keresőfelületeket.
Mi alapján választanak?
Megnézik az első találatot (ált. egy Wikipedia szócikk).
Vagy megkérdezik a témában egy barátjukat, ismerősüket a Facebook-on, Twitteren.
Ma fontosabb, ha valamit sokat ajánlanak, mint egy peer reviewed cikk.
http://ciber-research.eu/download/20120627-Tartu_CIBER.pdf
6. TEL vs. Europeana
Kezdete
Indulása
Üzemeltetője
Tartalma
Főbb adatok
„A” könyvtári aggregátor Közgyűjtemények digitális tára
1997 GABRIEL – közös portál létrehozása Európa
nemzeti könyvtárai számára
2005 március
CENL, LIBER, CERL
48 nemzeti könyvtár és a vezető európai
szakkönyvtárak bibliográfiai rekordjai és
digitális objektumai
több mint 25.866.737 digitális objektum és
157.878.956 bibliográfiai rekord
2005 EP-kezdeményezés az Europeana
létrehozására
2008 november
Europeana Foundation
vezető európai könyvtárak, múzeumok,
levéltárak és archívumok digitális forrásai
39.276.880 digitális objektum
23.213.500 kép, 15.129.531 szöveg, 507.463 hang, 408.553
videó, 17.833 3D
7. „A” könyvtári aggregátor Közgyűjtemények digitális tára
A közös cél:
Lehetővé tenni a felhasználók számára az információkeresést és a
tudáshoz való hozzáférést Európa valamennyi nyelvén – közvetlenül, a
portálokon keresztül és közvetetten, az adatokra épített különböző
alkalmazások révén.
8. „A” könyvtári aggregátor Közgyűjtemények digitális tára
A közös kihívás:
a rendkívül heterogén adatok integrációja.
A megoldás:
saját fejlesztésű infrastruktúra és munkafolyamat az adatbevitelre, az indexálásra, az
adatnormalizációra és az adatok közzétételére.
European Data Model (EDM):
a szemantikus web elveit, megoldásait kihasználva képes a legkülönbözőbb adatok nyílt
környezetben való integrálására és újrahasznosítására.
9. Hogyan lehet
a kor követelményeinek és a felhasználók elvárásainak
megfelelő,
homogén tárgyszó alapú hozzáférést,
soknyelvű keresést, illetve
a leírt források közötti szemantikai kapcsolatokra is
építő
szolgáltatásokat biztosítani?
10. Knowledge Organisation Systems
(KOS)
Tudásszervezési rendszerek
a dokumentumok és fogalmak összerendezését, rendszerré szervezését végzik; plusz „tartalommal”
gazdagítják az objektumokat
soknyelvű szótárak, tezauruszok, authority listák, névterek, osztályozási rendszerek, ontológiák,
taxonómiák
Kiválasztási szempontok
technikailag elérhető (Linked Data-n keresztül vagy dedikált repozitóriumban)
jól dokumentált, jól rendezett
open access
soknyelvű
11. Kiindulási alap
• A TEL óriási mennyiségű
besorolási adattal
rendelkezik az általa
aggregált bibliográfiai
adatoknak köszönhetően.
Kihívás
• Sokféle rendszer, sokféle
nyelv, sokféle gyakorlat.
• A könyvtárak többsége
helyi, nyelvfüggő
rendszereket használtnak
a szerzőségi adatok és a
tartalom leírására.
• Szerzőségi adatok
konszolidációja
Megoldás
• Nemzetközi és nyelv-
független rendszerek
használata
• Virtual International Authority
File (VIAF)
• International Standard Name
Identifier (ISNI)
• Common European Research
Classification Scheme
használata
• LCSH, RAMEAU, SWD
Eredmény
• Tárgyszó- és névadat
normalizáció minden
bibliográfiai adatra
• 2012-végére 120.000
linket sikerült bekötni a
francia, brit, német és
svájci nemzeti
könyvtárakból származó
tárgyszavak közé
• Mára a nyelveket átszövő
Adatkonszolidáció
12.
13. Adatgazdagítás az Europeana-ban
GeoNames
• a világhálón szabadon
hozzáférhető földrajzi n
évtér
• több mint 8 millió
földrajzi név
• alkalmazás: 7M
objektum esetében
• DublinCore mezők:
DBpedia
• a Wikipédia adatait
tartalmazza rendezett,
strukturált formában
• jelenleg több, mint 4,58
millió bejegyzés 125
nyelven
• alkalmazás: 144K objektum
esetében
GEMET
• GEneral Multilingual En
vironmental Thesaurus
• általános, többnyelvű
környezetvédelmi
tezaurusz
• alkalmazás: 9,1M
objektum esetében
• DublinCore: subject,
type
SemiumTime
• alkalmazás: 10,2M
objektum esetében
• DublinCore mezők:
date, coverage, year
WHERE WHO WHAT WHEN
18. 1) Portál
egyszerű tárgyszavas keresés és böngészés
találatok elemzése, szűkítése idő, hely és tárgy szerint
2) Open Search API regisztrált felhasználóknak
a) The European Library Open Search API
A TEL portálon elérhető, a nemzeti és szakkönyvtárak
gyűjteményeit leíró adatokhoz való hozzáférés.
b) The European Library Open Dataset
Hozzáférés több mint 82 millió bibliográfiai rekordhoz
Creative Commons CC0 1.0 licensz alapján.
c) RLUK - Research Libraries UK database
Közel 20 millió bibliográfiai rekord 34 UK könyvtárból
3) Linked Open Data
Szolgáltatások kutatóknak
19. Szolgáltatások kutatóknak
Portál
Europeana Research
projekt és portál a kutatás szolgáltában
APIk
REST-API – az adatok dinamikus visszakereséséért
OIA-PMH – adatok aratása
Linked Open Data
20 millió objektum letölthető RDF-ben
Speciális kutatások, fejlesztések
Hogyan lehet az Europeana Newspapers projekt teljes
szövegeit és képeit újrafelhasználásra elérhetővé tenni?
Az Europeana Newspapers-re alapuló full-text API
kifejlesztése
További gyűjteményrészek kiemelése a kutatók számára
Kutatói elvárások, igények és szükségletek folyamatos
feltérképezése
Tartalomfejlesztési stratégia kidolgozása a kutatói
igények alapján
Ösztöndíjprogram kidolgozása kutatók számára
…