Komunikacja z trudnym... bibliotekarzem, czyli o komunikacji w bibliotece ina...
Wykorzystanie programów firmy Google przy tworzeniu Jagiellońskiej Biblioteki Cyfrowej - Leszek Szafrański
1. Leszek Szafrański
Biblioteka Jagiellońska
l.szafranski@uj.edu.pl
Wykorzystanie programów firmy Google przy tworzeniu
Jagiellońskiej Biblioteki Cyfrowej
Abstrakt
W artykule omówiono rodzaje formatów stosowanych w Jagiellońskiej Bibliotece Cyfrowej do prezentowania
dokumentów w Internecie. Przedstawiono również na podstawie zebranych danych formaty prezencyjne dostępne w
polskich bibliotekach cyfrowych oraz omówiono szczegółowo format text/html. Opisano również programy Picasa i
Google Maps Image Cutter, które wykorzystano w projekcie Jagiellońska Biblioteka Cyfrowa. W artykule na
wybranych przykładach została opisana praca z tymi programami przy tworzeniu kolekcji cyfrowych udostępnianych
na stronach Jagiellońskiej Biblioteki Cyfrowej.
Wprowadzenie
Jagiellońska Biblioteka Cyfrowa (JBC) została uruchomiona 19 lipca 2010 r. W pierwszym
okresie istnienia, działała w wersji pilotażowej. JBC jest wynikiem projektu współfinansowanego
przez Unię Europejską ze środków Europejskiego Funduszu Rozwoju Regionalnego w ramach
Programu Operacyjnego Infrastruktura i Środowisko na lata 2007–2013. W ciągu pierwszego roku
działalności biblioteki cyfrowej zostało opublikowanych prawie 60 tysięcy dokumentów
bibliotecznych, na które składają się: czasopisma, dokumenty życia społecznego, książki,
2. muzykalia, rękopisy, starodruki, zbiory ikonograficzne, zbiory kartograficzne1. JBC należy do
Federacji Bibliotek Cyfrowych (FBC). Pod względem ilości publikacji plasuje się obecnie na
trzecim miejscu wśród polskich bibliotek cyfrowych zrzeszonych w FBC.
W momencie powstawania Jagiellońskiej Biblioteki Cyfrowej (JBC) pojawił się też problem
sposobu prezentowania dokumentów bibliotecznych na stronach internetowych. Do udostępniania
czasopism, dokumentów życia społecznego, książek, muzykaliów, rękopisów oraz starodruków
został użyty format DjVu. Do dokumentów nowych, czyli publikowanych pod koniec XX w.
i w XXI w. użyty został format PDF. Natomiast do publikowania zbiorów ikonograficznych,
zbiorów kartograficznych zostały użyte formaty DjVu, text/html.
Do konwersji na poszczególne formaty w JBC zostały użyte w przeważającej większości
programy bezpłatne, dostępne za darmo w Internecie m. in.: użytych zostało kilka programów do
ręcznego tworzenia stron internetowych (edytory tekstowe), program Zoomify Express, oraz pakiet
programów firmy Google: Google Picasa i Google Maps Image Cutter. Jedynym programem
komercyjnym używanym w JBC jest Document Express Enterprise za pomocą, którego
konwertowane są dokumenty do formatu DjVu.
Formaty w bibliotekach cyfrowych
Rysunek 1 przedstawia rodzaje formatów stosowanych w dokumentach cyfrowych
publikowanych w polskich bibliotekach cyfrowych w układzie procentowym (dane dotyczą
wszystkich publikacji).
formaty dokumentów w bibliotekach cyfrowych
90
80
liczba dokumentów w %
70
60
50 liczba dokumentów
40 w %
30
20
10
0
image/x.djvu pdf text/html pozostałe
rodzaje form atów
Rysunek 1. Rodzaje formatów w bibliotekach cyfrowych. Źródło: opracowanie własne na podstawie FBC. Tryb
1 Jagiellońska Biblioteka Cyfrowa obchodzi pierwsze urodziny. Kraków, 2011. Tryb dostępu:
http://149.156.73.3/dlibra/dlibra/news?news=full#5695b481-da21-4451-a528-cbd067b0008a [19.07.2011]
3. dostępu: http://fbc.pionier.net.pl/owoc/attr-stats [19.07.2011].
Zgromadzone dane wskazują, że w polskich bibliotekach cyfrowych najpopularniejszym formatem
jest DjVu (78%) stworzony przez naukowców amerykańskiego koncernu AT&T. Główną zaletą
formatu jest metoda kompresji obrazu bez widocznych strat jego jakości. Polega ona na
rozdzieleniu obrazów na odrębne warstwy i poddaniu ich odrębnej optymalizacji i kompresji.
Kolejnymi pod względem popularności formatami w bibliotekach cyfrowych są PDF (9%) służący
do prezentacji, przenoszenia i drukowania treści tekstowo-graficznych, stworzony przez firmę
Adobe Systems oraz text/html (9%)2. Pozostałe formaty - m.in.: powerpoint, jpeg, msword, video/x-
flv, tiff, gif, audio/mpeg, rtf, występują tylko w 4% opublikowanych dokumentów.
Formaty dostępne w bibliotekach cyfrowych są istotnym elementem funkcjonalności
z punktu widzenia użytkowników. Ważne jest, aby pliki z dokumentami otwierały się szybko na
komputerach czytelników, aby format był powszechny i w miarę możliwości nie wymagał ściągania
aplikacji lub nakładek. Powolne otwieranie stron internetowych z dokumentami oraz konieczność
instalacji dodatkowego oprogramowania do ich przeglądania należą do głównych czynników
zniechęcających potencjalnych użytkowników3. Według badań Agnieszki Lewandowskiej i Marcina
Werli, 15,7% użytkowników rezygnuje z korzystania z biblioteki cyfrowej po napotkaniu informacji
o potrzebie zainstalowania wtyczki lub plugin'u. Natomiast po napotkania bariery w postaci
formatu, który nie jest powszechnie znany i nie otwiera się automatycznie w przeglądarce,
rezygnuje 12,6% użytkowników4.
Tak wysoki odsetek traconych użytkowników wymaga znalezienia rozwiązań, które
pozwalają na wyeliminowanie wspomnianych problemów. Szczególnie problem ten dotyczy
dokumentów graficznych i kartograficznych, które mają duże rozmiary pliku wyjściowego, dużą
rozdzielczość i zawierają bardzo dużo szczegółów. Do prezentacji tego typu dokumentów można
użyć formatu text/html. Przy pomocy edytora HTML można opisać strukturę informacji zawartych
wewnątrz strony internetowej, nadając znaczenie poszczególnym fragmentom tekstu oraz osadzić
w tekście dokumentu obiekty plikowe5. Zaletą tego formatu jest to, że wyświetla się bez problemu
w każdej przeglądarce internetowej. Wadą natomiast jest fakt, że strony w języku HTML mogą
wyświetlać się odmiennie na różnych przeglądarkach. W celu uniknięcia tego typu problemów
2 W. M. Kolasa: Formaty hybrydowe w bibliotekach cyfrowych : kontekst i praktyka. Kraków, 2008. Tryb dostępu:
http://mbc.malopolska.pl/dlibra/docmetadata?id=13394&dirds=1&tab=1 [18.07.2011]
3 E. Skubała, A. Kazan: Analiza zasobu polskich bibliotek cyfrowych w kontekście ich wykorzystania w dydaktyce.
Wrocław, 2009. Tryb dostępu: http://www.nowyebib.info/publikacje/matkonf/mat20/skubala_kazan.php
[18.07.2011]
4 A. Lewandowska, M. Werla: Jak czytelnik porusza sie po bibliotece cyfrowej? Analiza wzorców zachowań. VI
warsztaty „Biblioteki cyfrowe” 2009. Tryb dostępu:
http://dl.psnc.pl/biblioteka/dlibra/publication?id=264&from=&dirids=6&tab=1&lp=1&QI= [19.07.2011]
5 B. Danowski: ABC tworzenia stron WWW. Gliwice, 2006. s. 7-8
4. powinno się używać języka XHTML, który jest rekomendowany przez W3C (World Wide Web
Consortium)6. XHTML jest udoskonaloną wersją języka zbudowaną na bazie języka HTML. Strony
stworzone przy jego pomocy wyświetlają się poprawnie i identycznie w każdej przeglądarce7.
W bibliotekach cyfrowych format text/html, co wskazuje rysunek 1, jest używany tylko
w ograniczonym zakresie. Na 59 przebadanych przez autora artykułu bibliotek, które używają
systemu dLibra tylko w 23 znajdują się dokumenty w formacie text/html, przy czym średnia liczba
opublikowanych dokumentów w tym formacie wynosi 94.
Czynniki wpływające na funkcjonalność opublikowanych w JBC dokumentów
Funkcjonalność traktuje się obecnie jako dyscyplinę polegającą na stosowaniu zasad
naukowej obserwacji, pomiaru i projektowania podczas tworzenia i modyfikowania stron
internetowych w celu zwiększenia użyteczności, dostępności i wygody użytkowania8.
Funkcjonalność w kartografii dotyczy zarówno tradycyjnych, drukowanych map jak
i komputerowych wizualizacji kartograficznych. O funkcjonalności mapy drukowanej w głównej
mierze decyduje czytelność treści, pomocna w interpretacji legenda, wygodny podział sekcyjny
i sposób składania arkusza9. Czynniki te nie mają prawie żadnego przełożenia na funkcjonalność
dokumentu kartograficznego opublikowanego w wersji cyfrowej. W takim przypadku
najważniejszy jest bowiem format wyświetlania, szybkość ładowania treści mapy na stronie
internetowej, interaktywność oraz przyjazny dla użytkownika interfejs. Równie ważne jest, to aby
prezentacje kartograficzne posiadały tytuł i opis.
Kluczowe znaczenie dla funkcjonalności map ma ich jakość wizualna. Bardzo trudne jest
osiągnięcie zadowalającej jakości przy skanowaniu i obróbce graficznej XVII – XIX w.
dokumentów kartograficznych o bardzo dużych rozmiarach. Skany wyjściowe w formacie TIFF
zajmują średnio objętość około 250 MB. Sprawia to duże trudności przy obróbce graficznej plików
w powszechnie dostępnych programach. Również uzyskanie dobrej rozdzielczości przy dużych
powiększeniach nie jest łatwe do osiągnięcia po konwersji do formatów prezencyjnych. Nawet po
konwersji do formatu DjVu (format charakteryzuje się małą objętością pliku wyjściowego)
pojedynczy skan może nadal wolno otwierać się na stronie WWW. W bibliotekach cyfrowych
bardzo często prezentowane mapy nie są czytelne co praktycznie dyskwalifikuje taką publikację.
6 W3C Recommendation. XHTML™ 1.0 The Extensible HyperText Markup Language (Second Edition). 2002. Tryb
dostępu: http://www.w3.org/TR/xhtml1 [18.07.2011]
7 J. Cowell: Wprowadzenie do XHTML : tworzenie dynamicznych stron www z wykorzystaniem XHTML i JavaScript.
Warszawa, 2003. s.
8 M. Pearrow: Funkcjonalność stron internetowych. Gliwice, 2002. s. 13
9 P. J. Kowalski: Problem funkcjonalności prezentacji kartograficznych w internetowych serwisach informacyjnych.
Tryb dostępu: zk.gik.pw.edu.pl/PIK/Kartonet/Utylinet.pdf [17.07.2011]
5. W plikach graficznych najważniejsza jest możliwość znacznego powiększenia obrazu
i łatwa nawigacja po nim. Dlatego stosowanie odpowiednich programów ma kluczowe znaczenie
przy prezentowaniu publikacji w Internecie.
Zasady publikacji materiałów kartograficznych i graficznych w JBC
W JBC do prezentacji dokumentów kartograficznych i grafiki zostały zastosowane dwa
formaty generowane przy pomocy programów: Google Maps Image Cutter, Picasa, Zoomify
i Document Express Enterprise. W artykule autor skupił się głównie na dwóch programach, które
przydatne są do prezentowania plików graficznych w JBC.
Google Maps Image Cutter to bardzo proste narzędzie do prezentowania grafiki rastrowej na
stronach internetowych. Jest to program opracowany przez The Centre for Advanced Spatial
Analysis is a (CASA) jako projekt badawczy University College London10. Na rysunku 2
przedstawiona jest mapa utworzona przy pomocy programu Google Maps Image Cutter. Praca
z aplikacją nie sprawia trudności nawet mało zaawansowanemu użytkownikowi. Wystarczy tylko
wczytać przygotowany plik do programu bez potrzeby obniżania rozdzielczości. Program generuje
prostą stronę WWW z osadzonym w niej obrazem, który dzieli na kilka tysięcy mniejszych
obrazków. Następnie wystarczy już tylko opublikować stronę WWW w Internecie. Zaletą Google
Maps jest to, że pliki opublikowane przy pomocy tego programu bardzo szybko wyświetlają się na
stronie WWW (cały obraz podzielony jest na mniejsze obrazki ładujące się niezależnie od siebie).
Na podobnych zasadach działa oprogramowanie Zoomify. Różnica polega na tym, że Zoomify w
wersji darmowej generuje tylko plik z rozdzielonym obrazem, a stronę internetową trzeba samemu
sobie utworzyć. Podobne efekty dla skanów o bardzo dużych rozdzielczościach są trudne do
osiągnięcia za pomocą innych programów, które w przeważającej większości, aby wyświetlić plik
muszą załadować go w całości (im większy plik tym dłuższy czas oczekiwania na jego otwarcie na
stronie internetowej).
10 The GMap Image Cutter. Tryb dostępu: http://www.casa.ucl.ac.uk/software/googlemapimagecutter.asp
[17.07.2011]
6. Rysunek 2. Mapa utworzona za pomocą programu Google Maps Image Cutter. Źródło: opracowanie własne. Tryb
dostępu: http://149.156.73.3/dlibra/dlibra/doccontent?id=423&dirids=1 [19.07.2011]
W JBC Google Maps Image Cutter znalazł zastosowanie przy prezentacji dokumentów
kartograficznych, które ze względu na szczegółowość i duże rozmiary muszą być skanowane
w bardzo dużych rozdzielczościach przez co też otrzymywany plik wyjściowy w formacie TIFF po
skanowaniu ma bardzo duży rozmiar. Wadą programu jest potrzeba okresowego generowania
specjalnego klucza API na stronie internetowej Google Maps API Family
(http://code.google.com/intl/pl/apis/maps/signup.html), gdyż kod wymaga uaktualnienia. Zaletami
w ten sposób stworzonej strony internetowej jest interfejs znany użytkownikom na całym świecie,
szybkie ładowanie strony w przeglądarce.
Programem używanym w JBC do prezentacji plików graficznych oraz tworzenia galerii
i wystaw internetowych jest między innymi bardzo popularny Google Picasa. To narzędzie ma
wiele przydatnych funkcji. W programie tym można w prosty sposób edytować zdjęcia czy skany,
poprawiać ich jasność i nasycenie kolorów, przycinać je i obracać. Są dostępne również filtry takie
jak sepia czy barwienie. Dla potrzeb JBC najbardziej przydatną funkcją Picasa jest możliwość
automatycznego eksportu wielu plików jako jednej strony HTML. Przy pomocy szablonów
dostępnych w programie można w prosty sposób wygenerować pokaz grafik lub galerię internetową
i opublikować ją w sieci. Istnieje możliwość wgrania do programu własnych szablonów oraz
dodawania tekstów i podpisów pod publikowanymi zdjęciami. W tym przypadku potrzebna jest
podstawowa znajomość budowy programów oraz tworzenia i edycji stron internetowych. Rysunek
3 przedstawia galerię internetową utworzoną przez autora artykułu w Google Picasa i zamieszczoną
na stronach JBC.
7. Rysunek 3. Galeria internetowa utworzona za pomocą programu Google Picasa. Źródło: opracowanie własne. Tryb
dostępu: http://jbc.bj.uj.edu.pl/dlibra/Content/421/index.html [19.07.2011]
Podsumowanie
W Jagiellońskiej Bibliotece Cyfrowej w dalszym ciągu udoskonalane są różne metody
edycji, przetwarzania i prezentacji obiektów cyfrowych ponieważ technika komputerowej edycji
obrazu zmienia się bardzo szybko. Nie można skupiać się na jednym lub kilku programach
ponieważ użytkownicy w tym względzie są bardzo zróżnicowani. W przyszłości prezentowanie
obrazów na stronach internetowych prawdopodobnie będzie odbywać się w technice 3D, gdzie
użytkownik przy pomocy specjalnego oprzyrządowania (wirtualne: rękawice, hełmy, całe
kombinezony) będzie poruszał się po cyfrowym świecie powiązanym z przeglądaną treścią
tematyczną. W kontekście obserwacji rynku gier komputerowych wydaje się to całkiem bliską
perspektywą.
Bibliografia
1. Cowell J.: Wprowadzenie do XHTML : tworzenie dynamicznych stron www z
wykorzystaniem XHTML i JavaScript. Warszawa, 2003. s.
2. Danowski B.: ABC tworzenia stron WWW. Gliwice, 2006. s. 7-8
3. Jagiellońska Biblioteka Cyfrowa obchodzi pierwsze urodziny. Kraków, 2011. Tryb dostępu:
http://149.156.73.3/dlibra/dlibra/news?news=full#5695b481-da21-4451-a528-
8. cbd067b0008a [19.07.2011]
4. Kolasa W. M.: Formaty hybrydowe w bibliotekach cyfrowych : kontekst i praktyka.
Kraków, 2008. Tryb dostępu: http://mbc.malopolska.pl/dlibra/docmetadata?id=13394&dird
s=1&tab=1 [18.07.2011]
5. Kowalski P. J.: Problem funkcjonalności prezentacji kartograficznych w internetowych
serwisach informacyjnych. Tryb dostępu: zk.gik.pw.edu.pl/PIK/Kartonet/Utylinet.pdf
[17.07.2011]
6. Lewandowska A., Werla M.: Jak czytelnik porusza sie po bibliotece cyfrowej? Analiza
wzorców zachowań. VI warsztaty „Biblioteki cyfrowe” 2009. Tryb dostępu:
http://dl.psnc.pl/biblioteka/dlibra/publication?id=264&from=&dirids=6&tab=1&lp=1&QI=
[19.07.2011]
7. Pearrow M.: Funkcjonalność stron internetowych. Gliwice, 2002. s. 13
8. Skubała E., Kazan A.: Analiza zasobu polskich bibliotek cyfrowych w kontekście ich
wykorzystania w dydaktyce. Wrocław, 2009. Tryb dostępu: http://www.nowyebib
.info/publikacje/matkonf/mat20/skubala_kazan.php [18.07.2011]
9. The GMap Image Cutter. Tryb dostępu: http://www.casa.ucl.ac.uk/software/googlemap
imagecutter.asp [17.07.2011]
10. W3C Recommendation. XHTML™ 1.0 The Extensible HyperText Markup Language
(Second Edition). 2002. Tryb dostępu: http://www.w3.org/TR/xhtml1 [18.07.2011]