Hozzáférés és újrahasznosítás. A TEL és az Europeana a tudományos kutatás szolgálatában

Hozzáférés és újrahasznosítás
A TEL és az Europeana
a tudományos kutatás
szolgálatában
Kovácsné Koreny Ágnes
Fővárosi Szabó Ervin Könyvtár

Kutatók a virtuális térben
 10 évnyi kutatás a virtuális kutatók információ-keresési és olvasási szokásairól
 Centre for Comparative and International Business Research (CIBER), UK
 Virtuális környezetben rendkívül aktívak, de a munka nagy részét robotokkal
végeztetik.
 Mit szeretnének?
 Közvetlen hozzáférést.
 Még több digitalizálást és a digitális anyagok elérését, hozzáférhetőségét - lehetőleg mindent digitálisan.
 Drót nélküli hozzáférést.
 Mobil eszközöket, s rajtuk a tartalmat.

 Szeretnek ugrálni, minél többet, innen oda
 A több ezer elérhető oldalból egyet vagy kettőt néznek meg.
 40%-uk nem megy vissza többé egy egyszer már használt oldalhoz.
 Hogy miért ugrálnak? Mert…
 … keresőmotort használnak, ami (túl) sok (nem releváns) találatot és
rengeteg linket ajánl fel, amelyek között élvezet ugrálni.
 … gyenge a keresési kompetenciájuk (Google - max. 2,2 szvas keresőkifejezés).
 … kevés az idejük.

 Másképp olvasnak
 A horizontális felváltotta a vertikálisat
 Gyorsan olvasnak - keresik a kulcsszavakat a szövegben
 Cím, heading, összefoglaló (abstract) és a linkek fontossága.
 Olvasás helyett „rápillantás”
 Néhány percet töltenek a kereséssel, illetve egy oldalon - 15 perc már sok.
 Cikkre 3-4 percet szánnak - a rövidebb cikkeknek nagyobb esélyük van arra, hogy valaki elolvassa őket.
 Ha mégis hosszú, csak az összefoglalást olvassák el. Vagy letöltik, s elteszik maguknak máskorra.

 Gyors információ – információs falatkák
 Kis adagokban, mindent, gyorsan.
 A hátsó/oldalsó bejáratokon jönnek be (linkek).
 Nem használják a szépen kialakított, rájuk szabott keresőfelületeket.
 Mi alapján választanak?
 Megnézik az első találatot (ált. egy Wikipedia szócikk).
 Vagy megkérdezik a témában egy barátjukat, ismerősüket a Facebook-on, Twitteren.
 Ma fontosabb, ha valamit sokat ajánlanak, mint egy peer reviewed cikk.
http://ciber-research.eu/download/20120627-Tartu_CIBER.pdf

TEL vs. Europeana
Kezdete
Indulása
Üzemeltetője
Tartalma
Főbb adatok
„A” könyvtári aggregátor Közgyűjtemények digitális tára
1997 GABRIEL – közös portál létrehozása Európa
nemzeti könyvtárai számára
2005 március
CENL, LIBER, CERL
48 nemzeti könyvtár és a vezető európai
szakkönyvtárak bibliográfiai rekordjai és
digitális objektumai
több mint 25.866.737 digitális objektum és
157.878.956 bibliográfiai rekord
2005 EP-kezdeményezés az Europeana
létrehozására
2008 november
Europeana Foundation
vezető európai könyvtárak, múzeumok,
levéltárak és archívumok digitális forrásai
39.276.880 digitális objektum
23.213.500 kép, 15.129.531 szöveg, 507.463 hang, 408.553
videó, 17.833 3D

A közös cél:
Lehetővé tenni a felhasználók számára az információkeresést és a
tudáshoz való hozzáférést Európa valamennyi nyelvén – közvetlenül, a
portálokon keresztül és közvetetten, az adatokra épített különböző
alkalmazások révén.

A közös kihívás:
a rendkívül heterogén adatok integrációja.
A megoldás:
saját fejlesztésű infrastruktúra és munkafolyamat az adatbevitelre, az indexálásra, az
adatnormalizációra és az adatok közzétételére.
European Data Model (EDM):
a szemantikus web elveit, megoldásait kihasználva képes a legkülönbözőbb adatok nyílt
környezetben való integrálására és újrahasznosítására.

Hogyan lehet
a kor követelményeinek és a felhasználók elvárásainak
megfelelő,
homogén tárgyszó alapú hozzáférést,
soknyelvű keresést, illetve
a leírt források közötti szemantikai kapcsolatokra is
építő
szolgáltatásokat biztosítani?

Knowledge Organisation Systems
(KOS)
Tudásszervezési rendszerek
 a dokumentumok és fogalmak összerendezését, rendszerré szervezését végzik; plusz „tartalommal”
gazdagítják az objektumokat
 soknyelvű szótárak, tezauruszok, authority listák, névterek, osztályozási rendszerek, ontológiák,
taxonómiák
Kiválasztási szempontok
 technikailag elérhető (Linked Data-n keresztül vagy dedikált repozitóriumban)
 jól dokumentált, jól rendezett
 open access
 soknyelvű

Kiindulási alap
• A TEL óriási mennyiségű
besorolási adattal
rendelkezik az általa
aggregált bibliográfiai
adatoknak köszönhetően.
Kihívás
• Sokféle rendszer, sokféle
nyelv, sokféle gyakorlat.
• A könyvtárak többsége
helyi, nyelvfüggő
rendszereket használtnak
a szerzőségi adatok és a
tartalom leírására.
• Szerzőségi adatok
konszolidációja
Megoldás
• Nemzetközi és nyelv-
független rendszerek
használata
• Virtual International Authority
File (VIAF)
• International Standard Name
Identifier (ISNI)
• Common European Research
Classification Scheme
használata
• LCSH, RAMEAU, SWD
Eredmény
• Tárgyszó- és névadat
normalizáció minden
bibliográfiai adatra
• 2012-végére 120.000
linket sikerült bekötni a
francia, brit, német és
svájci nemzeti
könyvtárakból származó
tárgyszavak közé
• Mára a nyelveket átszövő
Adatkonszolidáció

Adatgazdagítás az Europeana-ban
GeoNames
• a világhálón szabadon
hozzáférhető földrajzi n
évtér
• több mint 8 millió
földrajzi név
• alkalmazás: 7M
objektum esetében
• DublinCore mezők:
DBpedia
• a Wikipédia adatait
tartalmazza rendezett,
strukturált formában
• jelenleg több, mint 4,58
millió bejegyzés 125
nyelven
• alkalmazás: 144K objektum
esetében
GEMET
• GEneral Multilingual En
vironmental Thesaurus
• általános, többnyelvű
környezetvédelmi
tezaurusz
• alkalmazás: 9,1M
objektum esetében
• DublinCore: subject,
type
SemiumTime
• alkalmazás: 10,2M
objektum esetében
• DublinCore mezők:
date, coverage, year
WHERE WHO WHAT WHEN

1) Portál
egyszerű tárgyszavas keresés és böngészés
találatok elemzése, szűkítése idő, hely és tárgy szerint
2) Open Search API regisztrált felhasználóknak
a) The European Library Open Search API
A TEL portálon elérhető, a nemzeti és szakkönyvtárak
gyűjteményeit leíró adatokhoz való hozzáférés.
b) The European Library Open Dataset
Hozzáférés több mint 82 millió bibliográfiai rekordhoz
Creative Commons CC0 1.0 licensz alapján.
c) RLUK - Research Libraries UK database
Közel 20 millió bibliográfiai rekord 34 UK könyvtárból
3) Linked Open Data
Szolgáltatások kutatóknak

Szolgáltatások kutatóknak
Portál
Europeana Research
 projekt és portál a kutatás szolgáltában
APIk
 REST-API – az adatok dinamikus visszakereséséért
 OIA-PMH – adatok aratása
Linked Open Data
 20 millió objektum letölthető RDF-ben
Speciális kutatások, fejlesztések
 Hogyan lehet az Europeana Newspapers projekt teljes
szövegeit és képeit újrafelhasználásra elérhetővé tenni?
 Az Europeana Newspapers-re alapuló full-text API
kifejlesztése
 További gyűjteményrészek kiemelése a kutatók számára
 Kutatói elvárások, igények és szükségletek folyamatos
feltérképezése
 Tartalomfejlesztési stratégia kidolgozása a kutatói
igények alapján
 Ösztöndíjprogram kidolgozása kutatók számára
 …

Köszönöm a figyelmet!
Kovácsné Koreny Ágnes
Fővárosi Szabó Ervin Könyvtár

Hozzáférés és újrahasznosítás. A TEL és az Europeana a tudományos kutatás szolgálatában

Recommended

Recommended

More Related Content

What's hot

What's hot (7)

Viewers also liked

Viewers also liked (11)

Similar to Hozzáférés és újrahasznosítás. A TEL és az Europeana a tudományos kutatás szolgálatában

Similar to Hozzáférés és újrahasznosítás. A TEL és az Europeana a tudományos kutatás szolgálatában (20)

Hozzáférés és újrahasznosítás. A TEL és az Europeana a tudományos kutatás szolgálatában