1. Czy OPAC ulegną destrukcji?
Linked Data w pracy bibliotekarza
Dr hab. Marek Nahotko,
Uniwersytet Jagielloński
Spotkanie użytkowników Nukat,
Warszawa 5.12.2014
2. Cechy środowiska informacyjnego
Biblioteki utraciły dawny monopol na tworzenie
katalogów – zbiorów metadanych;
Każdy może stworzyć własny katalog; kiedyś ze
względu na mały zasięg nie miało to znaczenia,
teraz może on być dostępny na cały świat;
Wiele serwisów korzysta z pracy bibliotekarzy,
budując konkurencyjne narzędzia;
Dane biblioteczne zamknięte są w „silosach”, z
możliwością wejścia tylko przez OPAC i bez
połączeń ze światem zewnętrznym;
Jak funkcjonować w tak skomplikowanej sytuacji?
2
3. Teoria tekstu Gerarda Genette
3
Obok tekstu autorskiego istnieją także teksty go
otaczające (parateksty), zarówno w obrębie książki
(peritekst), jak i poza nią (epitekst);
Może to być: tytuł, podtytuł, pseudonim, wstęp,
dedykacje, uwagi, epilog, również korespondencja
autora, dzienniki, wywiady, ilustracje, preteksty…
Ich zadaniem jest mediacja tekstu do użytkownika,
wskazują na kierunki interpretacji tekstu;
Paratekst to również tekst, należący do różnych
gatunków;
Bibliotekarz posługuje się tekstem i peritekstem (czasem
również epitekstem) dla stworzenia epitekstu (tekstu
gatunku opisu bibliograficznego);
Katalog(i) można traktować jako gatunek paratekstu.
4. Opis bibliograficzny w teorii tekstu
4
Katalogowanie, jako tworzenie reprezentacji tekstu, jest
typizowanym działaniem retorycznym, wykonywanym w
powtarzalnych sytuacjach (definicja gatunku tekstu);
Katalogujący tworzy odrębnego rodzaju
stwierdzenia/wypowiedzi/teksty: reprezentacje
dokumentów; staje się więc autorem odpowiedzialnym za
treść tych reprezentacji;
W ten sposób biblioteki, katalogi i bibliografie mogą być
traktowane jako gatunki komunikacyjne, służące
wspomaganiu publikowania i dokumentowania;
Katalogowanie i wyszukiwanie, jako część organizacji
informacji, są aktywnościami równie złożonymi jak
tworzenie i odbiór tekstów dokumentów; niezbędna
wiedza gatunkowa w obu przypadkach jest taka sama.
5. Teksty i parateksty a technologie Sieci
5
Technologia Teksty Gatunki
tekstów
Gatunki
biblioteczne
Innowacja
Web 1.0 zamknięte tradycyjne OPAC mała
Web 2.0 otwarte nowe (np. blogi) OPAC 2.0,
SOPAC
większa
Web 3.0, SW kodowana
semantyka
automatyzacja? LOD,
Discovery?
destrukcyjna?
6. Współdziałanie (interoperability)
Oznacza uzgadnianie wiedzy gatunkowej twórców (i
odbiorców) tekstu metadanych;
Zdolność dwóch lub więcej systemów lub ich części
pracujących na różnym sprzęcie i oprogramowaniu, o
różnych strukturach danych i interfejsach, do wymiany
danych [głównie tekstów] z minimalną utratą treści i
funkcjonalności (NISO);
Współdziałanie metadanych jest częścią znacznie
większego problemu współdziałania systemów;
K. Subieta: dziedzina badawcza i praktyczna zajmująca
się umożliwieniem współpracy niezależnie zbudowanych
(heterogenicznych) systemów, szczególnie w sieciach
komputerowych.
6
7. Poziomy współdziałania systemów
Manso-Callejo i in.:
Techniczne: bity i bajty, pliki, przetwarzanie,
protokoły;
Syntaktyczne: wspólne formaty, struktury, języki;
Semantyczne: wspólne słowniki terminów;
Pragmatyczne: metody i procedury;
Dynamiczne: nadzór transferu danych;
Konceptualne: modelowanie systemu i danych;
Organizacyjne: cele biznesowe, polityka dostępu,
procesy, wzorce postępowania.
7
8. Poziomy uzgadniania wiedzy gatunkowej
(współdziałania metadanych) (Weibel)
Semantyka tekstu opisu:
Uzgodnione znaczenie elementów metadanych.
Struktura (czyli pragmatyka):
Rekordy, powtarzalność danych, konstrukcja nazw,
zasady i przepisy tworzenia wartości elementów (np. dat),
słowniki… czyli parateksty tekstu opisu bibliograficznego,
Czytelna dla człowieka, przetwarzalna dla maszyny.
Syntaktyka:
Reguły gramatyczne dla zapisu semantyki i pragmatyki
oraz ich kodowania, przesyłania i rozkodowywania.
8
11. Nowa innowacyjna technologia
współdziałania – Linked (Open) Data (LOD)
11
Konieczność zmian w dwóch obszarach:
Treści: otwarte dane,
Systemy: linkowanie danych, tworzące Semantyczny
Web
Cele bibliotek związane z LOD:
Udostępnienie własnych danych jako LOD dla innych,
Pobieranie i wykorzystanie LOD z innych zasobów dla
wzbogacenia własnych danych,
Stosowanie LOD w celu stworzenia całkowicie nowej,
niezależnej od dotychczasowych dostawców,
Infrastruktury Webowej jako podstawy katalogowania (cel
BIBFRAME).
12. Linked Data
Technologia ta dotyczy wszystkich gatunków
paratekstu, tworzonego w bibliotekach;
Słowniki udostępniane w Web w formie czytelnej dla
komputerów;
Dwa rodzaje słowników (składniki):
Semantyka metadanych: słowniki będące wykazami
elementów metadanych (pól i podpól rekordu),
Pragmatyka metadanych: słowniki kontrolowane,
zawierające wartości metadanych.
12
14. Technologie Linked Data
14
Dane łączone odnośnikami URI (trójki RDF):
SPARQL – język zapytań, standard służący
wyszukiwaniu danych kodowanych jako trójki RDF:
skomplikowany i trudny w użyciu.
16. Istota zmian
16
W LOD semantyka metadanych oddzielona jest od
ich syntaktyki, dzięki czemu zmiana struktur nie
powoduje zmiany znaczenia;
Zarówno elementy semantyki jak i pragmatyki
kodowane są przy pomocy tej samej syntaktyki
(XML/RDF) i są czytelne maszynowo;
Dzięki temu struktury danych (MARC, DC…) i inne
słowniki (jiw, khw) stają się ontologiami
umieszczonymi w chmurze danych.
20. Korzyści
20
Nowe perspektywy dla rozproszonego
współkatalogowania: ujednolicenie wiedzy
gatunkowej;
Ujednolicenie wiedzy (globalny standard)
pozwalające na:
Wzrost możliwości wyszukiwawczych,
Optymalizację wykorzystania istniejących danych,
Wzrost współdziałania,
Elastyczny model danych,
Łatwiejszą integrację danych bibliotecznych w serwisach
społecznościowych,
Lepsze wykorzystanie danych bibliotecznych przez
wyszukiwarki.
23. Efekt - innowacja destrukcyjna?
23
Koncepcja Claytona Christensena, ekonomisty (2008):
niszczące innowacje
Innowacja: połączenie nowej technologii i bardziej
efektywnego modelu ekonomicznego;
W wyniku innowacji produkt staje się prostszy i
bardziej dostępny;
Niszczący wpływ na istniejący rynek.
Koncepcja Fostera i Kaplana (2003): twórcza
destrukcja
Do rozpowszechnienia innowacji potrzebne zmiany:
kultury i instytucji społeczeństwa, firm i czynników
wpływających na proces produkcji.