SlideShare a Scribd company logo
Filozofski fakultet Sveučilišta u Zagrebu
Odsjek za informacijske i komunikacijske znanosti
Ak. god. 2013./2014.
Ksenija Lončarić
Analiza modela troškova digitalnog očuvanja
i mogućnost standardizacije
Završni rad
Mentor: dr. sc. Hrvoje Stančić, izv. prof.
Zagreb, rujan 2014.
2
Sadržaj
UVOD.........................................................................................................................................3
1. Standardizacija .......................................................................................................................4
2. Testbed Cost Model for Digital Preservation (T-CMDP) ......................................................5
2.1. Model troškova................................................................................................................7
2.1.1. Aktivnosti čuvanja zapisa.........................................................................................8
2.1.2. Razvoj pristupa očuvanja .........................................................................................8
2.1.3. Aktivnosti digitalnog očuvanja.................................................................................9
3. LIFE3 Costing Model (LIFE3)..............................................................................................11
* Neobavezni elementi za projekte s digitalizacijom...........................................................12
3.1. Analiza predloženog modela .........................................................................................12
3.2. LIFE3 alat.......................................................................................................................13
4. Keeping Research Data Safe (KRDS)..................................................................................14
4.1. KRDS model aktivnosti.................................................................................................15
4.2. Nositelji troškova...........................................................................................................16
4.3. Predložak resursa...........................................................................................................16
4.4. KRDS analiza koristi.....................................................................................................16
5. Cost Model for Digital Preservation.....................................................................................17
5.1. Metode...........................................................................................................................17
5.1.2. Primjena faktora troškova u CMDP-u....................................................................19
6. Usporedba modela ................................................................................................................21
7. Zaključak ..............................................................................................................................23
LITERATURA .........................................................................................................................24
3
UVOD
Danas živimo u dobu informacija. One su nam svima na dohvat ruke, imamo
mogućnost dijeljenja informacija, komuniciranja na daljinu, nismo više limitirani prostorom
niti vremenom. Prema teoriji Manuela Castellsa, dio smo umreženog društva (engl. networked
society) koje je nastalo tokom '70.-ih godina prošloga stoljeća međudjelovanjem triju procesa;
pojave društvenih pokreta, restrukturiranja kapitalizma, i kao najvažnije, razvoja
informacijske tehnologije. Takvo društvo je shvaćeno kao globalno, organizirano i povezano
u komunikacijskim i medijskim mrežama. Kao jednu vrstu takvih mreža spominje
informacijske mreže koje zbog svoje fleksibilnosti, izdržljivosti te proširenosti djeluju kao
temelj budućem poslovanju, ekonomiji i drugim praksama. Takvi virtualni svjetovi i sfere
zahtijevaju određena znanja, sposobnosti te standarde kako bi omogućili što efikasniju
upotrebu informacija.
Postojanje arhiva, muzeja, knjižnica i drugih institucija koje se bave prikupljanjem i
čuvanjem građe i gradiva dokazuje nam koliki je zapravo značaj pohrane informacija i zašto
mi danas, kao suvremenici moderne tehnologije, smo dužni pronaći najbolje moguće načine
očuvanja. Prvenstveno, treba uzeti u obzir da nam nisu sve informacije bitne, da nije potrebno
težiti očuvanju cjelokupnog stvaralaštva nekog stvaratelja, kako je za struku od najveće
važnosti određivanje vrijednosti onoga čime se rukuje i da li ona nadilazi kriterije potrebitosti.
U takvim slučajevima je najvažnije poznavati vlastito područje, stvoriti pravila, provjerene
procedure i prakse kako bi se mogla omogućiti pohrana te kako bi se to „pohranjeno“ moglo
jednoga dana uspješno koristiti. Dugoročno očuvanje i da li je ono moguće, česti je problem
spomenutih institucija zbog brzog napretka tehnologije, velikih troškova održavanja sustava i
komplikacija koje iz toga prolaze.
Ovaj rad će se baviti digitalnim očuvanjem i mogućnostima standardizacije kroz
analizu modela izračuna troškova i koristi napravljenih u svrhu stvaranja ekonomski
najisplativijeg rješenja dugoročnog očuvanja. Kroz te modele uvidjet ćemo raznolikost
prijedloga te ulogu i iskoristivost svakog od njih te može li uopće postojati standardizirani
model za institucije različitih karaktera. U radu će biti analizirani modeli T-CMDP, LIFE3,
KRDS i CMDP kao dio skupine modela troškova digitalnog očuvanja zbog primijećenih
sličnosti i razlika koje će kasnije biti obrađene u tekstu.
4
1. Standardizacija
Prema Hrvatskom zavodu za norme, standardizacija ili normizacija je „djelatnost
uspostavljanja odredaba za opću i opetovanu uporabu koje se odnose na postojeće ili moguće
probleme radi postizanja najboljeg stupnja uređenosti u danome kontekstu.“1 Iako je ova
definicija dosta opširna, poslužit će kao polazište shvaćanja uloge standardizacije u
digitalnom očuvanju. Kako bi se ostvarili optimalni rezultati, i za stvaratelja i za klijenta,
potrebno je uvijek slijediti određena pravila. Pritom norme služe kao upute, sljednice,
prijedlozi za dugoročno i kratkoročno postizanje najoptimalnijih rezultata. Svaki standard to
ima za cilj i njihova izrada pospješuje poslovanje i upravljanje mnogim korisnicima.
Modeli kojima će se ovaj rad baviti bit će shvaćeni kao smjernice za izračun troškova
neke organizacije ili institucije sa ciljem pronalaska najisplativijeg načina izračuna. Budući da
je očito da svaka organizacija ima vlastite karakteristike, obilježja, zahtjeve i potrebe, logično
bi bilo zaključiti kako svaka mora imati osmišljeni vlastiti model. Međutim, da li je uopće to
potrebno i da li se isplati? Svaka od njih ima zajedničke točke neke koje se mogu predstaviti
kao faktori koji utječu na izračun troškova. Samim time je stvoren i temelj za traženje
zajedničkih karakteristika koje bi dovele do zajedničkih modela. Standardizacija kao takva bi
olakšala posao većini tih organizacija ili institucija implementirajući sustave koji bi spojili,
danas još razdvojene, modele u jedan složen od više različitih modela. To bi zahtijevalo dosta
snalažljivosti i upućenosti, no koliko se isplati je pitanje koje zahtjeva odgovor.
1 Hrvatski zavod za norme, Pojmovi, nazivi i definicije, URL: http://www.hzn.hr/default.aspx?id=89 (25.8.2014.)
5
2. Testbed Cost Model for Digital Preservation (T-CMDP)
Ovaj model je započeo kao praktični istraživački projekt autora Jacqueline Slats i
Remc-a Verdegema u sklopu Nacionalnog arhiva Kraljevine Nizozemske. Kao jedan od
glavnih ciljeva ističu istraživanje načina kojima bi se omogućo dugoročni pristup arhivskom
gradivu, a kao glavna metoda je poslužio eksperiment u kontroliranim uvjetima. U svome
radu uspoređuju tri pristupa digitalnom očuvanju: migraciju, XML2 i UVC3, u pogledima
njihovih mogućnosti, korisnosti te troškova. Koristili su 4 vrste zapisa: tekstualni dokument,
proračunske tablice, elektronsku poštu i baze podataka različitih veličina, složenosti i
karaktera4.
Kao glavne pokazatelje, navode:
1. troškove digitalnog arhivskog sustava i njegovu funkcionalnost za dugoročno
očuvanje digitalnih zapisa,
2. troškove osoblja,
3. troškove razvoja softvera i metoda/strategija za očuvanje digitalnih zapisa,
4. troškove izvođenja određenih djelatnosti očuvanja,
5. druge faktore koji utječu na ukupne troškove očuvanja.
Unutar svakog od navedenih elemenata navedeni su i podelementi. Troškovi
digitalnog arhivskog sustava obuhvaćaju fizički prostor i hardver potreban za pohranu i
upravljanje zapisima; poslužitelji (engl. servers), mediji za pohranu (engl. storage media) i
back up oprema. Budući da se radi o dugoročnom digitalnom očuvanju, potrebno je voditi
brigu o vrsti i kvaliteti same opreme. Teško je, i gotovo nemoguće, predvidjeti količinu
zapisa i gradiva koju će biti potrebno pohraniti u budućnosti, no moguće je odrediti granice
koje u danom trenutku nadilaze potrebe pohrane i očuvanja. Osim hardvera, bitna je i vrsta
softvera koja bi odgovarala potrebama institucije ili organizacije koja posjeduje digitalni
arhivski sustav. Uz njega, sustav za očuvanje (engl. preservation system) osigurava spremnost
zapisa na operacije očuvanja poput migracije ili konverzije u XML, daje procjenu rezultata
2 Engl. Extensible Markup Language; standardizirani jezik za označavanje podataka.
3 Engl. Universal Virtual Computer; virtualni stroj osmišljen za očuvanje digitalnog gradiva temeljen na
emulaciji
4 Slats, J., Verdegem, R. Cost Model for Digital Preservation (T-CMDP), National Archief of the Netherlands,
2005.
URL: http://dlmforum.typepad.com/Paper_RemcoVerdegem_and_JS_CostModelfordigitalpreservation.pdf
(25.8.2014.)
6
očuvanja i vraća zapise u digitalni sistem. Ovaj sustav, kao i prijašnji, zahtjeva odgovarajući
hardver i softver za ispunjenje svojih zadataka.
Osim toga, za funkcioniranje navedenih sustava, potrebno je i osoblje. Troškovi
osoblja se izračunavaju na temelju vrste osoblja, njihovom broju, sposobnostima i
kvalifikacijama te na temelju vremenskog perioda u kojemu oni ispunjavaju svoju dužnost.
Troškovi razvoja softvera i metoda očuvanja zapisa čine treći glavni element. Svaki zapis ili
serija zapisa (engl. batch) zahtjeva odvajanje vlastitih karakteristika prema važnosti kako bi se
u konačnici ustvrdio integritet i autentičnost zapisa. Na temelju dobivenih rezultata se
osmišljava i realizira prihvatljiv i prilagođen pristup očuvanja. Budući da se radi o velikim
brojevima zapisa za čije je utvrđivanje bitnih karakteristika potreban dugotrajan posao, od
upravitelja zapisima se očekuje da ih navede prilikom njihovog predavanja zaduženom
osoblju za daljnju pohranu. Zbog istog razloga ovaj model predlaže stvaranje internacionalne
kolekcije strategija za dugotrajno očuvanje i pohranu kako bi se olakšao posao u budućnosti.
Kao i kod hardvera i softvera, i u ovom aspektu je potrebna visoka razina kvalitete za
optimalne rezultate i eventualnu buduću uporabu osmišljenog sustava za očuvanje.
Što se tiče samog procesa digitalnog očuvanja, možemo ih podijeliti na migraciju
zapisa, konverziju zapisa u XML format te korištenje UVC-a kako bi se zadržala dostupnost
zapisa. U ovom dijelu autori koriste OAIS5 terminologiju kako bi objasnili djelovanje i
rezultate svakog od procesa očuvanja. Kao najvažniji navode konverziju u XML format
prilikom koje arhivski informacijski paket (engl. Archival Information Package, AIP) prelazi
u AIPX/XML format. Kao glavnu prednost ističu njegov dugi životni vijek i mogućnost
čitanja od strane više različitih aplikacija.
Sljedeći element se bavi različitim faktora koji utječu na ukupne troškove, a nisu se
mogli smjestiti u neku zajedničku skupinu. Iako su već spomenuti troškovi osoblja, javna
služba je još jedna koja zahtjeva određen broj zaposlenika, a sami troškovi ovise o kvaliteti
usluge koju pružaju i veličini ponude. Osim toga, svaki or procesa očuvanja i drugih operacija
je podložan greškama i može oštetiti zapis. Preporuča se ostavljanje određenog vremena
između svake akcije, čuvanje originala, nadgledanje tehnologije koja se koristi i sl. To sve
5 Engl. Open Archival Information System; arhiv koji se sastoji od ljudi i sustava, dio je neke organizacije i
prihvaća odgovornost očuvanja informacija i osiguravanja njegove dostupnosti određenoj zajednici. Drugo
značenje se odnosi na standard digitalnog očuvanja dostupan na :
http://public.ccsds.org/publications/archive/650x0m2.pdf
7
dovodi do povećanja troškova, no dugoročno gledajući, mogu ih i smanjiti s vremenom zbog
predostrožnosti koje se moraju izvršiti njihovim djelovanjem.
2.1. Model troškova
Model troškova koji je stvoren kao glavni dio CMDP-a sastoji se od tri tablice: osnove
troškova (engl. Cost Basis), izračuna vremena (engl. Time Calculation) i izračuna troškova
(engl. Cost Calculation). Prva tablica služi kao „temelj za druge dvije proračunske tablice i
opisuje troškove osoblja, digitalnog arhivskog sustava i sustava očuvanja.“6 Tablica izračuna
vremena opisuje „vrijeme potrebno za izvođenje nekolicine aktivnosti očuvanja zapisa, za
razvoj pristupa očuvanja i za konačno izvršenje tih aktivnosti.“7 Zadnja tablica pokazuje
rezultate usporedbe troškova različitih pristupa očuvanja kojim se ovaj rad bavi.
Naglasak je stavljen na budućoj ulozi ovih izračuna; a poslužit će kao “početna točka
za poboljšanja i povećanja temeljena na zajedničkom iskustvu i podršci.“8 Napominju autori i
kako su ti iznosi troškova samo procjene temeljene na podacima i eksperimentima izvršenim
unutar Testbed projekta, njihovom iskustvu te na zdravom razumu. Ovaj model bi trebao
poslužiti kao okvir unutar kojega će se komentirati dobivene procjene radi poboljšanja i
usporedbi s stvarnim troškovima digitalnog očuvanja.
Za navedene tablice i pojašnjenje podataka unutar njih, postoji nekoliko pretpostavki:
Osoblje:
 kategorija osoblja s 4 različite satnice,
 svaka kategorija radi 1.620 sati godišnje.
Digitalni arhivski sustav i sustav očuvanja:
 4 vrste prostora + troškovi opremanja za svaki,
 troškovi sadrže i broj osoblja za svaku vrstu prostora,
6 Slats, J., Verdegem, R. Cost Model for Digital Preservation (T-CMDP), National Archief of the Netherlands,
2005.
URL:http://dlmforum.typepad.com/Paper_RemcoVerdegem_and_JS_CostModelfordigitalpreservation.pdf
(25.8.2014.)
7 Ibid.
8 Ibid.
8
 objekt u pitanju bi trebao moći upravljati sa 100 Terabajta zapisa i biti proširen na
1000 Terabajta ili više,
 10% zapisa unutar digitalnog arhiva će trebati neku vrstu popravka,
 zapisi u XML formatu neće trebati popravak niti dodavanje meta podataka
 proces migracije bi trebao biti ponovljen svake tri godine, konverzija u XML svake
desete, a UVC nema faktor ponavljanja, no svake godine mora biti osmišljen novi
dekoder.
2.1.1. Aktivnosti čuvanja zapisa
Digitalno očuvanje, prema prijedlozima Testbeda, trebalo bi početi od samog početka
stvaranja zapisa radi kasnijeg olakšanja i smanjenja posla. Tako bi trebalo odmah na početku
početi razmišljati o budućnosti određenog zapisa i njegovoj mogućoj korisnosti.
2.1.2. Razvoj pristupa očuvanja
Tablica 1 pokazuje troškove stvaranja pristupa očuvanja. Planiranje samog razvoja i
njegovo ostvarenje jedan je od glavnih dijelova digitalnog očuvanja u pogledu troškova.
Navedeni primjer prikazuje slučaj u kojemu se godišnje stavlja na čuvanje samo jedna stotina
proračunskih tablica tj. pet serija od dvadeset tablica. Možemo vidjeti odnose troškova
zadovoljavanja prvotnih potreba za pokretanje projekta, troškova razvoja pristupa i njegovog
testiranja za osoblje te za svaki od vrsta procesa očuvanja. Razlike su među njima velike i
primjetne, posebice između migracije i konverzije u XML, i UVC-a. Kao što je već
spomenuto, najbolje rješenje je pokretanje postupka očuvanja na samom početku stvaranja
zapisa i prema tome je stvaranje novih zapisa u XML formatu optimalno i jedino rješenje bez
ikakvih troškova.
9
Tablica 1: Troškovi razvoja pristupa očuvanja
2.1.3. Aktivnosti digitalnog očuvanja
Nakon razvoja i ostvarenja odgovarajućeg pristupa te izračuna troškova, potrebno je
izračunati troškove samih procesa digitalnog očuvanja. Oni su, za razliku od prijašnjih
troškova iz tablice, marginalni te postoji opcija izgradnje automatskih pomagala za evaluaciju
određenih aktivnosti očuvanja.
Sljedeće dvije tablice, Tablica 2 i Tablica 3, prikazuju troškove 4 vrste pristupa
očuvanju te usporedbu pristupa u odnosu na veličinu serija zapisa. Očito je da je UVC format
najskuplji i najmanje isplativ u pogledu troškova na početku stvaranja. Međutim, stvaranje
dekodera je potrebno svakim dolaskom novih formata zapisa te je dugoročno isplativo. No
kada se pogleda konverzija u XML ili stvaranje u XML-u, troškovi u početku su najmanji i za
razliku od migracije više isplativiji. Troškovi se povećavaju jedino zbog potrebe za
prebacivanjem na novi standardni jezik svakih 10 godina. S druge strane, migracija zahtjeva
ponavljanje postupka svake tri godine što vodi do znatnog povećanja troškova unatoč niskim
troškovima u početku. Tablica 3 zanemaruje UVC pristup zbog očitih previsokih troškova te
stavlja naglasak na ostala tri pristupa kako bi se napravila usporedba prema veličini serije
zapisa. I opet, kao najefikasniji pristup je prikazano je stvaranje proračunskih tablica u XML
formatu, bez obzira da li je riječ o serijama od 200 ili 2.000, ili u početku i nakon 20 godina.
10
Tablica 2: Usporedba četiri pristupa očuvanja
Tablica 3: Tri pristupa očuvanja i efekt veličine serija
11
3. LIFE3 Costing Model (LIFE3)
LIFE3, punim imenom Lifecycle Information For E-Literature je projekt započet od
strane Sveučilišta u Londonu (UCL) i završen je 2010. godine. Sastoji se od tri faze: prva faza
LIFE projekta započela je 2006. i bavi se „shvaćanjem dugoročnih troškova digitalnog
očuvanja, što čini bitan korak u pomaganju institucijama pri planiranju budućnosti.“9 Jedan od
glavnih zadataka je utvrđivanje trajanja života digitalnih zapisa te utvrđivanje troškova koji će
se morati pokriti njihovim očuvanjem kroz godina. Druga faza, u trajanju od 2007. do 2008.
nastavlja se na prvu pridodajući joj tri studije slučaja. Treća faza započinje 2009. kao
zajednički rad Sveučilišta u Londonu i Britanske nacionalne knjižnice. Ona donosi alat za
predviđanje troškova koji se temelji na drugoj fazi LIFE projekta te je oblikovan prema
primjerima iz navedenih studija slučajeva. Taj alat služi kao kvalitetno pomagalo
institucijama i organizacijama koje se bave ili će se baviti digitalnim očuvanjem, te pokriva
široki niz mogućih vrsta očuvanja i zapisa.10
LIFE1, kao prva faza projekta, temeljen je na pregledu tada već postojećih modela
digitalnog očuvanja te „nudi upotpunjenu metodologiju izračunavanja troškova digitalnog
očuvanja za sljedećih 5, 10 i 100 godina.“11 Samim time, ta je prva faza dobra osnova za
daljnje širenje modela. Temelja ideja je „davanje pogleda u tipične procese primijenjene na
digitalne objekte kroz njihove životne cikluse od strane organizacije koja nad njima ima
skrbništvo.“12 Kako bi dao detaljni i kompletni prikaz životnog ciklusa digitalnih zapisa, i radi
točnijeg izračunavanja troškova, LIFE3 ga dijeli na šest razina. (Tablica. 4). Svaka razina
predstavlja procese koji se događaju tokom životnog ciklusa, a svaki od njih se sastoji od sebi
specifičnih elemenata i podelemenata. Elementi čine važne dijelove svake od razina i
fokusirani su na različite procese što omogućuje preciznost, točnost te efikasnost u definiranju
dijelova životnog ciklusa. Podelementi, s druge strane, služe za usmjeravanje, no nisu
dovoljno značajni da bi stajali kao glavni elementi razina. Procesi su organizirani kronološki,
od samog nastanka zapisa do pristupa i korištenja zapisa. Međutim, u praksi to može biti
drugačije i većina se procesa događa istovremeno.
9 Lifecycle Information For E-Literature (LIFE3), University College London (UCL) and British Library (BL),
2010. URL: http://www.life.ac.uk/3/docs/life3_report.pdf (25.8.2014.)
10 Ibid.
11 Ibid.
12 Ibid.
12
Tablica 4: Životni vijek zapisa
* Neobavezni elementi za projekte s digitalizacijom
3.1. Analiza predloženog modela
Glavne razine životnog ciklusa digitalnog zapisa sastoje se od nastanka zapisa,
prilikom kojega se obavljaju procesi osmišljavanja aktivnosti, odabiranja i pripremanja zapisa
koji se kasnije transportiraju na željeno mjesto kako bi se digitalizirali. Sljedeća razina je
nabavka (engl. acquisition) odabranog zapisa, sklapanje dogovora o njegovom preuzimanju te
prijavljivanje zapisa kao prisutnog na određenom mjestu. Kako bi se osigurala kvaliteta,
potrebno je navesti preporuke i napomene te ih povezati sa zapisom, ažurirati podatke o
trenutnom položaju/mjestu zapisa. To je treća razina nazvana prihvat (engl. Ingest) nakon
koje slijedi stvaranje metapodataka. Oni su važni za buduće upravljanje zapisima, a posebice
za olakšavanje pristupa željenim podacima i informacijama nekog zapisa. Poželjno je koristiti
već postojeće metapodatke, no potrebno je stvoriti i nove budući da zapis u novoj okolini
može dobiti na vrijednosti ili važnosti. Sljedeća razina je početak digitalnog očuvanja koji se
odvija kroz procese sređivanja administracije, opskrbe skladišta, obnavljanja, stvaranja
pomoćnih (backup) verzija zapisa te provjera provedenog. Potrebno je i zaštititi i sam sadržaj
nekog zapisa. Nadgledanje i planiranje očuvanja digitalnog zapisa potrebno je radi ostvarenja
odgovarajućeg pristupa očuvanja kako bi se, u zadnjoj razini, moglo doći do zapisa bez
problema. Svako pristupanje zapisu treba biti kontrolirano i dozvoljeno, a očekuje se da svaki
korisnik ima pravovaljanu podršku i pomoć u slučaju problema ili nejasnoća.
13
3.2. LIFE3 alat
Nakon što je razvijen sam model razina životnog ciklusa digitalnih apisa, stvoren je i
alat koji, prema navedenom predlošku, daje procjene mogućih troškova. Korisnik ima
mogućnost biranja sadržaja i vrstu organizacije kojoj pripada kako bi dobio podatke stvorene
prema njegovom odabiru. Podaci se mogu mijenjati budući da korisnik sam upravlja onime
što treba i očekuje od alata. Predložak je osmišljen na temelju LIFE3 modela i rezultata
dobivenih iz studija slučajeva provedenih u sklopu LIFE2 projekta.
Zbog same prirode ovog alata, korisnicima je olakšan dolazak do željenih podataka o
mogućim troškovima. On nudi više opcija izbora, ovisno o korisniku i potrebama
organizacije/institucije te njihovih projekata. Ukratko, LIFE3 je uspješno analizirao razine
životnog ciklusa digitalnih zapisa i na temelju toga napravio praktični alat koji cijeli projekt
predstavlja kao novinu koja će olakšati upravljanje zapisima, očuvanje zapisa te općenito
poslovanje korisnika.
14
4. Keeping Research Data Safe (KRDS)
Keeping Research Data Safe je projekt osmišljen kao zajednički rad više institucija:
Charles Beagrie LTD, OCLC istraživanja, Arhiva Ujedinjenog Kraljevstva, Informatičkog
centra Sveučilišta u Londonu i dr. Glavna uloga mu je davanje „okvira za stvaranje i primjenu
lokalnih modela troškova za istraživanje upravljanja podacima i za dugoročno očuvanje.“13
Autori ističu sljedeće mogućnosti kao neke od ciljeva modela vezane uz njegovu primjenu:
 identificiranje trenutnih troškova,
 identificiranje prošlih i budućih troškova,
 usporedba troškova kroz različite kolekcije i institucije koje koriste različite varijable,
 razvoj politike naplaćivanja i adekvatnih troškova arhiviranja,
 fokusiranje na partikularne aktivnosti i modeliranje efekta promjene specifičnih
procesa.14
Ovaj model primjenjuje metode utvrđivanja troškova prema pojedinim fazama
životnog ciklusa digitalnog zapisa na podatke dobivene u istraživanjima. Svaka životna faza
sadrži specifične procese i utvrđuje njima sukladne aktivnosti, varijable koje utvrđuju veličinu
troškova tih aktivnosti te resurse potrebne za očuvanje.
Postoje tri dijela KRDS-a okvira:
1) KRDS model aktivnosti: generički model za aktivnosti identifikacije podataka s
implikacijama troškova očuvanja i njihovo naručivanje prema hijerarhiji faza,
aktivnosti i podaktivnosti,
2) nositelji troškova (engl. cost drivers): ključne varijable poput visine plaća ili stope
inflacije, koje utječu na troškove aktivnosti digitalnog očuvanja. Podijeljeni su u dvije
veće grupe: ekonomske i uslužne prilagodbe,
3) predložak resursa: kategorije troškova i trajanja u jednostavnom, generičkom obliku
bližem onim korištenim u metodologijama troškova sveučilišta Ujedinjenog
Kraljevstva baziranih na TRAC-u (Transparent Approach to Costing method)15.
13 User Guide for Keeping Research Data Safe: Assessing Costs/Benefits of Research Data Management,
Preservation and Re-use, Charled Beagrie Limited, 2011.
URL: http://www.beagrie.com/static/resource/KeepingResearchDataSafe_UserGuide_v2.pdf (25.8.2014.)
14 Ibid.
15 Trac je sustav otvorenog karaktera za upravljanje projektima za razvoj softvera. Više o njemu na:
http://trac.edgewall.org/
15
„Model aktivnosti nudi pomoć prilikom identificiranja pojedinih aktivnosti koje troše
resurse, ekonomske prilagodbe pomažu njihovom širenju i održavanju tokom vremena, a
uslužne prilagodbe pomažu utvrđivanju i podešavanju resursa za specifične zahtjeve.
Predložak resursa nudi okvir za spajanje tih elemenata tako da se mogu implementirati u
model temeljen na TRAC-u.“16 Svaki od ovih dijelova okvira izračuna troškova omogućuje
klasificiranje različitih aktivnosti u unutar jednog modela pritom im dajući određene
vrijednosti ovisno o određenim varijablama radi procjene troškova.
4.1. KRDS model aktivnosti
Kao što je već spomenuto, KRDS model aktivnosti prvi je dio KRDS okvira koji
identificira aktivnosti istraživanja s mogućim troškovima očuvanja. Sastoji se od hijerarhijski
organiziranih razina od koje svaka ima svoje podrazine uz svoja objašnjenja. Sastoji se od tri
razine: predarhivske, arhivske te službe za podršku i nekretnine. Prva razina uključuje sve
djelatnosti, aktivnosti i procese koji se izvode tokom nastajanja zapisa, koji su povezani s
njegovim stvaranjem i korištenjem. Uz to, odnosi se i na upravljanje projektima i
istraživanjima raznih institucija ili organizacija koje se odvija prije samog arhiviranja. Druga
razina, razina arhiviranja i sličnih aktivnosti, povezana je s prethodnom. Treća, međutim,
može biti podrška ostalim razinama kao dio već postojeće infrastrukture. Može sadržavati
aktivnosti vezane uz financije, informatiku i slične druge djelatnosti.
Svaka od faza ima svoje elemente i svaki od njih ima svoje podelemente. Oni se kreću
od aktivnosti poput izbora zapisa, traženja podrške pa sve do stvaranja metapodataka te
stvaranja veza i referenci. Na svakoj od razina moguće je izračunati troškove, bez obzira o
kompleksnosti ili jednostavnosti pojedine aktivnosti. Ovisno o tome što je potrebno ili
korisnije, KRDS nudi dvije verzije modela aktivnosti. Prva, koja je predstavljana na 12
stranica, sadrži popis svih aktivnosti i podaktivnosti koje se nalaze u jednoj od faza, te nudi
objašnjenje za svaku od njih. Ovaj detaljan prikaz dostupan je svima, kao i verzija od jedne
stranice, KRDS „Lite“. Sastoji se od glavnim dijelova modela te njihovih elemenata, no ne
objašnjava niti precizira koje su točno aktivnosti u pitanju. Može poslužiti i kao mali
podsjetnik na cijeli KRDS okvir i model troškova. Međutim, detaljna verzija modela još
uvijek daje bolji pregled nad cjelinom te uvodi korisnika/čitatelja u plan i program očuvanja.
16 User Guide for Keeping Research Data Safe: Assessing Costs/Benefits of Research Data Management,
Preservation and Re-use, Charled Beagrie Limited, 2011. URL:
http://www.beagrie.com/static/resource/KeepingResearchDataSafe_UserGuide_v2.pdf (25.8.2014.)
16
4.2. Nositelji troškova
Nositelji troškova su sve one varijable koje utječu na iznos troškova očuvanja. Mogu
se utvrditi za svaku aktivnost navedenu u modelu i podijeljeni su u dvije skupine. Prva se
odnosi na ekonomske faktore, a druga na uslužne. Međutim, kako bi se najbolje moglo
kontrolirati buduće troškove potrebno je voditi brigu o dobrom izboru formata, vremenu u
kojemu će se odvijati određene aktivnosti te mora bili osiguran pristup zapisima bez kojega
cijeli proces očuvanja nema smisla. Ekonomske prilagodbe se sastoje od inflacije/deflacije,
gubitka na značaju te od iznosa troška povrata financija i investicija. Uslužne prilagodbe se
tiču troškova osoblja; plaće, osiguranje i mirovine. Nadalje, troškovi se mogu izračunati i za
različite karakteristike i sposobnosti osoblja, utječe i na upravljanje te troškove koji se mogu
smanjiti efikasnim metodama upravljanja, no i povećati ukoliko metode ne odgovaraju
potrebama institucije ili organizacije. Trajanje aktivnosti isto utječe na količinu financija
namijenjenih za podmirivanje troškova.
4.3. Predložak resursa
Zadnji dio modela povezan je usko sa svim fazama očuvanja. On nudi okvir koji spaja
sve elemente aktivnosti i varijable izračunavanja troškova i stvara kategorije troškova te
vrijeme koje je potrebno za svaku od njih.
4.4. KRDS analiza koristi
Osim analize troškova, ovaj model nudi i analizu koristi. Glavna prednost je
mogućnost točnije procjene isplativosti nekog projekta ili aktivnosti. Uz troškove, okvir
izračunavanja koristi tvori komplet djelatnosti koje zajedno s analizom troškova nude pristup
ispravnim podacima. Moguće je utvrditi troškove koji će u nekim situacijama biti faktor
izbora i koji će, unatoč prvotnim izračunima, dati prednost skupljim ili kvalitetnijim opcijama.
Npr. očuvanje nekog zapisa može biti ostvareno na više način ili u više formata i logičan izbor
bi bio odabir one najisplativije. Budući da isključivo s analizom troškova ne vidimo
dugoročne koristi, možemo izabrati opciju koja će se s vremenom pokazati kao skupa.
Problemi koji se kasnije javljaju i troškovi koji iz toga proizlaze mogu se izbjeći analizom
koristi s kojom bi eventualno bila izabrana skuplja, ali sigurnija i samim time isplativija
opcija.
17
5. Cost Model for Digital Preservation
Zadnji model kojim će se ovaj rad baviti je Cost Model for Digital Preservation
(CMDP), kreiran od strane Danskog nacionalnog arhiva uz financijsku pomoć Danskog
Ministarstva kulture. Njegov glavni cilj je implementiranje „modela izračuna troškova
očuvanja digitalnog gradiva koje je u nadležnosti nacionalnih kulturnih baštinskih
institucija“17 kako bi povisili financijsku efikasnost digitalnog očuvanja i njegovih aktivnosti.
Uz to, cilj im je i davanje temelja za usporedbu već postojećih i budućih troškova te procjena
budućih zahtjeva digitalnog očuvanja. Kao temeljna ideja i baza za nastanak cijelog modela
korišten je „OAIS standard kako bi utvrdio koje su OAIS aktivnosti i podaktivnosti bitne za
trošak.“18 Osim OAIS-a, kao što je već spomenuto u uvodu, ovaj model pokriva i projekte T-
CMDP, LIFE3 i KRDS uzimajući od njih neke dijelove ili ideje te ih prezentirajući kao jednu
cjelinu.
Cijeli projekt se sastoji od tri faze. Prva faza, pod imenom Planiranje očuvanja i
digitalne migracije (engl. Preservation Planning and digital migrations), započeta je 2009. i
bavila se procjenama i troškovima digitalnog očuvanja, ponajviše planiranjem aktivnosti i
digitalnim migracijama. Druga faza temeljena je na OAIS-u bavila se funkcionalnošću samog
očuvanja i troškovima koji iz toga proizlaze. Treća faza pokrenuta je 2012. sa ciljem izrade
modela arhivskog očuvanja s naglaskom na funkcionalnost i upotrebljivost u praksi.
Unatoč podjelama po fazama, cijeli projekt je osmišljen kako bi dao „okvir za
troškove digitalnog očuvanja, uključujući i detaljnu metodologiju koja daje točne preglede
potrebnih resursa, set jednadžbi koje transformiraju te resurse u podatke o troškovima i
objašnjenje primijenjenih načela.“19
5.1. Metode
CMDP model napravljen je kao model temeljen na aktivnostima i njihovim
troškovima, direktnim i indirektnim, te pruža pregled okvira unutar kojih su oni smješteni.
Preuzima OAIS-ove funkcionalne cjeline: prihvat, arhivska pohrana, upravljanje podacima,
17 Bøgvad Kejser, U., Bo Nielsen, A., Thirifays, The Cost of Digital Preservation: Project Report v.10, Danish
national Archives (DNA) and the Royal Danish Library in Denmark, 2009.
URL:
https://docs.google.com/viewer?a=v&pid=sites&srcid=Y29zdG1vZGVsZm9yZGlnaXRhbHByZXNlcnZhdGlvb
i5ka3xwdWJ8Z3g6NWI5Y2YxNWI3YjBlNzczNg (25.8.2014.)
18 Ibid.
19 Ibid.
18
administracija, planiranje očuvanja, pristup i zajedničke službe. Uključili su i podjelu prema
ulogama (proizvođač, korisnik, uprava) te različite kategorije osoblja. Takve podjele su
prisutne i u T-CMDP-u, no u ovom modelu su detaljnije obrazložene. Svaka od kategorija
sadrži svoje funkcije i obilježja, od kojih svaka zahtjeva drugačije resurse, dokumentaciju te
troškove. Glavna formula koja se pritom koristi služi za izračunavanje troškova aktivnosti.
Glavni iznos tj. rezultat dobiva se umnoškom vremena potrebnog za izvršenje određene
aktivnosti i plaće zaduženog osoblja i zbrojem tog umnoška s novčanim iznosom resursa koji
bi se morali nabaviti. Autori naglašavaju kako su sve formule iskorištene u ovom modelu
temeljene na iskustvima arhivskog sektora. Struktura modela je prikazana u Tablici 5, a
objašnjava funkcije, aktivnosti, komponente i parametre koji se koriste za određivanje visine
troškova. Taj prikaz strukture razdvaja proces planiranja iz OAIS modela na manje jedinice.
Svaka od njih se može iskoristiti u danoj formuli, a cilj takve podjele je stvaranje modela za
cijeli životni ciklus.
5.1.1. Faktor interpretacije formata
Pri svakom izračunavanju troškova postoje određene varijable koje na njih utječu.
Prvenstveno, riječ je o kompleksnosti digitalnih formata i struktura. CMDP model je zbog
toga razvio Faktor interpretacije formata (engl. The Format Interpretation Factor) pomoću
kojega je moguće utvrditi težinu shvaćanja nekog formata. Ovisi o tome koliko je vremena
potrebno uložiti za iščitavanje i shvaćanje nekog zapisa, njegovih specifikacija ili druge
relevantne dokumentacije. Mjeri se u količini osoblja potrebnog za taj posao kroz broj
tjedana. Krajnji iznos ovisi o količini same dokumentacije, vrsti zapisa, broju osoblja te
kompleksnosti cijele aktivnosti. Ta kompleksnost može biti označena kao niska, srednja ili
visoka. Pretpostavlja se da je potrebno u prosjeku 20 minuta osobi da pročita i shvati stranicu
dokumentacije za format s niskom kompleksnošću. Ta brojka se povećava za 25% za formate
sa srednjom kompleksnošću te za 50% za visoku. Primjerice, uzmimo tekstualni format koji
neovisno o broju stranica ima konstantno visoku kvalitetu i nisu kompleksnost. Za shvaćanje
takvog formata nije potrebno previše posla niti su potrebni posebni programi koji bi
omogućili ljudima iščitavanje sadržaja. S druge strane, TIFF 6.0 je klasificiran kao format sa
srednjom kompleksnošću zbog koje se povećava vrijeme iščitavanja podataka i njihovog
shvaćanja, a GML fromat zahtjeva čak 30 minuta u prosjeku za shvaćanje sadržaja. Zbog toga
se automatski povećava i sam faktor interpretacije formata.
19
Prilikom migracije zapisa, osim mogućeg gubitka kvalitete, postoji i opasnost
zastarijevanja formata. Uz to, troškovi se povećavaju učestalošću samih migracija. Model
preporuča migracije više zapisa istog formata istovremeno kako bi se sačuvalo na vremenu,
osoblju te u konačnici i troškovima. Učestalost migracija ovisi o prosječnom životnom vijeku
formata. Radi lakšeg izračunavanja u modelu se koristi vijek od 10 godina, a migracije se
provode svakih 5 godina.
5.1.2. Primjena faktora troškova u CMDP-u
Faktore troškova čine sve varijable koje utječu na konačni iznos troška bez obzira u
kojem obliku i koje prirode. Budući da je potrebno nadgledanje poslovanja kako bi ono teklo
što lakše i kako bi bilo što isplativije, bitno je uočiti kako pravilno biranje formata i metoda
može dati optimalne rezultate. Model daje primjer arhiva kao nadležnog tijela koje ima
dužnost biranja formata digitalnog očuvanja. Taj format bi trebao biti kvalitetan, lako čitljiv i
razumljiv te dugog životnog vijeka. No, izborom formata s visokom razinom kompleksnosti
automatski raste i visina troškova. Dobar izbor u konačnosti će imati i zadovoljavajuće i ne
previsoke troškove.
Potrebno je i razviti strategije očuvanja i standarde na temelju izvještaja nadležnog
tijela radi dobivanja cjelokupnog pregleda nad procesom. Izrada planova migracija bitan je
dio pri smanjenju troškova budući da i njegova pravilna i promišljena izrada olakšava posao.
Testiranje tih planova efikasan je način potvrđivanja iskoristivosti plana, a izrada alata za
izračunavanje posljednji je korak pri stvaranju praktičnog modela za izračune. Međutim, svi
ovi procesi i aktivnosti donose dodatne troškove, posebice izrada alata. On mora biti u
mogućnosti stvarati, čitati te ispravno interpretirati formate. Kompleksnost alata ovisi o vrsti
formata za kojeg je namijenjen te o mogućnostima koje on sam ima za obradu podataka.
CMDP model svojom detaljnošću i razrađenim strategijama i metodama, nudi
korisnicima mogućnost upravljanja zapisima na više razina. Od samog početka stvaranja pa
sve do trenutaka očuvanja i pristupa. Kao projekt, stvorio je samostalnu strukturu za model
troškova baziran na OAIS standardu uzimajući njegovu metodologiju i terminologiju te
proširujući ju u svome radu. Osim OAIS-a, CMDP koristi T-CMDP, LIFE3 i KRDS kao
polazišne točke vlastitog istraživanja. Model je bio testiran, evaluiran te prilagođen na temelju
podataka dobivenih iz studija slučaja kako bi se približio realnim potrebama budućih
korisnika. Sami autori navode da je potrebna veća preciznost ovog modela, ponajviše u
20
pogledu očekivanog životnog vijeka formata koji je trenutno za sve formate stavljen na deset
godina. Da bi postigao kvalitetu i preciznost, morat će se odrediti točno vrijeme i trajanje
životnog vijeka te učestalost migracija.
21
6. Usporedba modela
Analiza ovih četiriju modela (T-CMDP, LIFE3, KRDS i CMDP) nudi pregled nad
glavnim funkcijama i karakteristikama koje model izračuna troškova mora imati. LIFE3 i
KRDS naglasak stavljaju na životni vijek zapisa i razine te izračun troškova temelje na
aktivnostima koje se odvijaju u svakome od njih, često ulazeći u detalje. Unatoč tome, nude i
kraće preglede te odabir određenih faza ovisno o potrebama korisnika. KRDS to naglašava
izdavanjem „LITE“ verzije svog modela, no cijela struktura je upotpunjenija i složenija.
Upravo zbog toga i daje detaljna objašnjenja svakog od elemenata i podelemenata. Osim toga,
uz sam model dolaze uputstva za korisnike kao posebno izdanje koje sadrži sva objašnjenja,
primjere, terminologiju te objašnjenju metodologiju u slučaju nužde. Sadrži i upute pravilnog
postupanja i upravljanja zapisima kroz razrađene i objašnjene korake. LIFE3, s druge strane,
kroz svoje tri faze donosi prijedloge strukturiranja digitalnog očuvanja i procesa vezanih uz
njega, uz navedene aktivnosti te moguće troškove svake od njih. Međutim, za razliku od
KRDS-a, fokusira se više na alat koji je došao s trećom fazom projekta dajući više
mogućnosti i opcija korisniku prilikom korištenja. Unatoč tome što je alat jednostavan za
korištenje i pristupačan korisniku, ne bi se mogao iskoristiti kao jedinstveni alat za troškove.
Na tome tragu je bio i CMDP model, koji uzima elemente LIFE3 projekta i KRDS-a kako bi
stvorio uspješniji i efikasniji alat na temelju već postojećih modela.
CMDP koristi i elemente Testbed projekta, prvenstveno u definiranju razina i faza
očuvanja, definiranju varijabli te u izračunavanju troškova. Ide i korak dalje nudeći formule u
svome modelu kako bi lakše dočarao postupke i približio metode korisniku/čitatelju.
Uvidjevši rezultate proizašle iz T-CMDP-a vezane uz očuvanje različitih formata, CMDP daje
varijable koje mogu na njega utjecati. Pritom ističe i druge faktore i karakteristike modela
troškova koji moraju biti zadovoljeni ili optimalno isplanirani dajući i savjete kako uspješno
provesti te procese. No, ono što zanemaruje su prijedlozi doneseni od strane T-CMDP-a.
Naime, taj model daje rezultate vlastitih istraživanja formata, troškova i njihovog životnog
vijeka. Naglašava i činjenicu da su životni vjekovi različiti ovisno o formatu te da troškovi
variraju od samog nastanka zapisa i prvog očuvanja i tokom godina. Jeftiniji izbori mogu
dovesti do lošeg izbora ukoliko format treba s vremenom mijenjati, čitače treba često
popravljati ili ako treba nalaziti nove načine očuvanja, migracija ili drugih aktivnosti. Isto
tako, skuplji modeli u početku mogu se činiti neiskoristivim i neisplativim ako početni budžet
nije dovoljan. Ali može se dogoditi i da se izabere takva mogućnost kako bi se s vremenom
smanjili troškovi, no ovisi o željama i mogućnostima korisnika. U svakom slučaju, CMDP
22
projekt nije dao dovoljno truda u definiranju trajanja životnog vijeka, određivanju formata i
preciziranju učestalosti određenih procesa, poput migracija, koji se moraju obavljati kako bi
se na pravilan način sačuvao neki zapis. Jedino što je ispravno napravljeno u tome pogledu je
zaključak da je isplativije veći broj zapisa istog formata u isto vrijeme migrirati i da se to
preporučuje uz nadgledanje procesa te planiranje strategija od samog početka.
Iako nijedan od ovih modela nije sam po sebi dovoljan u smislu potpune iskoristivosti
i pružanja usluge za sve vrste institucija i organizacija, razlika u prirodi modela može
poslužiti kao temelj za buduća spajanja ili korištenja više modela istovremeno. Generički
modeli se mogu lakše iskoristiti u većini institucija i organizacija i može poslužiti kao podrška
ili početna točka stvaranja novih modela. Uz to, specifičniji modeli mogu uzeti generičke te
primijeniti dijelove svoje cjeline na njih na mjestima gdje je to potrebno. Takav je slučaj i s
modelima koji su analizirani u ovome radu. CMDP je uzeo ostala tri modela kao predloške i
temeljne modele svog projekta te ih razradio uviđajući pogreške prijašnjih i nalazeći rješenja
za njihove propuste. Na taj način je moguće i stvoriti model koji će s vremenom uspjeti
nadmašiti ostale i koji će se moći koristiti kao standard digitalnog očuvanja i izračunavanja
troškova.
23
7. Zaključak
Digitalno očuvanje jedno je od procesa koji postaju sve važniji za upravljanje
zapisima, poslovanje, buduće projekte i istraživanja i slično. Rijetko tko danas nije upućen u
same karakteristike takvih aktivnosti i to pokazuje važnost i korisnost takvog očuvanja. Iako
se danas očekuje da zapisi nastaju u digitalnom obliku i da je problem jedino u određivanju
dokumenata koji se moraju čuvati i u praktičnom dijelu čuvanja, ostaje još veliki broj zapisa
koje je potrebno očuvati, a neće se moći digitalizirati tako brzo. Samim time je potrebno
uočiti probleme koji postoje, načine na koje se ti procesi mogu ubrzati te što efikasnije
obaviti. Nastanak digitalnih zapisa, posebice u određenom formatu, uvelike olakšava posao i
financijski je isplativije rješenje od drugih mogućnosti poput migracija, konverzije i slično.
Modeli troškova tu pomažu pri pronalasku najboljih rješenja digitalnog očuvanja.
Financijska isplativost jedna je od glavnih varijabli koje treba uzeti u obzir prilikom
planiranja bilo koje vrste očuvanja. Pravi model isto mora biti uzet u obzir i to ovisi o vrsti
organizacije ili institucije koja ga uzima te o njenim potrebama i zahtjevima. Osim izračuna
troškova, izračun koristi u kombinaciji s troškovima daje još bolji uvid u mogućnosti koje
korisnik ima. Iako ne postoji standardni model koji bi mogao uvijek biti upotrjebljen, postoje
naznake stvaranja takvog modela ukoliko se dovoljno dobro analiziraju i usporede svi
dostupni modeli. No, danas je to još nemoguće zbog raznolikosti načina upravljanja zapisima
i općenito financijama institucija. Nemoguće je i zbog razlika u razvoju tehnologije između
različitih društava, različitim standardima koje prate te zbog različito definiranih prioriteta.
Ukoliko se sve to nadiđe i ukoliko se pojavi mogućnost takvog nečega, prvi korak bi trebala
biti spomenuta analiza i usporedba. Svaki od modela nudi različite ideje i praktične savjete i
njihovo uklapanje u jedan jedinstveni model moglo bi stvoriti nove temelje za stvaranje
pravog standardiziranog modela za sve djelatnosti.
24
LITERATURA
Bøgvad Kejser, U., Bo Nielsen, A., Thirifays, The Cost of Digital Preservation:
Project Report v.10, Danish national Archives (DNA) and the Royal Danish Library in
Denmark, 2009.
URL: https://docs.google.com/viewer?a=v&pid=sites&srcid=Y29zdG1vZGVsZm9yZGlnaX
RhbHByZXNlcnZhdGlvbi5ka3xwdWJ8Z3g6NWI5Y2YxNWI3YjBlNzczNg
(25.8.2014.)
Hrvatski zavod za norme, Pojmovi, nazivi i definicije,
URL: http://www.hzn.hr/default.aspx?id=89 (25.8.2014.)
Lifecycle Information For E-Literature (LIFE3), University College London (UCL)
and British Library (BL), 2010.
URL: http://www.life.ac.uk/3/docs/life3_report.pdf (25.8.2014.)
Reference Model for an Open Archival Information System (OAIS), Magenta Book
(CCSDS 650.0-M-2), Consultative Committee for Space Data Systems, NASA,
Washington, DC, SAD, lipanj 2012.
URL: http://public.ccsds.org/publications/archive/650x0m2.pdf (26.8.2014.)
Slats, J., Verdegem, R. Cost Model for Digital Preservation (T-CMDP), National
Archief of the Netherlands, 2005.
URL: http://dlmforum.typepad.com/Paper_RemcoVerdegem_and_JS_CostModelfordigital
preservation.pdf (25.8.2014.)
User Guide for Keeping Research Data Safe: Assessing Costs/Benefits of Research
Data Management, Preservation and Re-use, Charled Beagrie Limited, 2011.
URL: http://www.beagrie.com/static/resource/KeepingResearchDataSafe_UserGuide_v2.pdf
(25.8.2014.)
25
Sažetak
Budući da se nalazimo u dobu informacija u kojemu je potrebno imati ih na
raspolaganju i uvijek dostupne, šire se okviri i područja koja se bave njihovim upravljanjem.
Njihova važnost i učestalost uporabe diktira osmišljavanje novih načina stvaranja,
dobavljanja, obrade te očuvanja gradiva. Digitalno očuvanje isto ide u tome pravcu te polako
ali sigurno preuzima ulogu i bit cijelog procesa, a sama činjenica da je to dio današnje
svakodnevice nam pokazuje koliko se mora uložiti u izradu funkcionalnih i isplativih modela,
sustava i aktivnosti. Standardizacija kao proces kojime se poboljšavaju navedene prakse kako
bi se mogle primijeniti na institucijama različitih karaktera, shvaćena je kao bitna karika
unutar unaprjeđenja poslovanja, ponajviše na području digitalnog očuvanja. U ovome radu su
analizirani i uspoređeni modeli izračuna troškova dugoročnog digitalnog očuvanja T-CMDP,
LIFE3, KRDS i CMDP kako bi se mogla započeti rasprava o samoj mogućnost standardizacije
te optimizacije procesa očuvanja.
Ključne riječi: digitalno očuvanje, standardizacija, T-CMDP, LIFE3, KRDS, CMDP
Analysis of the cost models of digital preservation and the possibility of
standardization
Summary
We live in an age where information is available to almost everyone and it is expected
to have access to it at all times. This fact shows the importance and frequency of their use
which dictates the devising of the new ways of creating, retrieving, processing and
preservation of archival materials. In accordance to this, the area of expertise of digital
preservation seems to grow and it's becoming the main subject and interest in the area of
research. Since long term digital preservation is inevitable part of today's everyday life, it is
important to keep in mind the significance of the whole process of investing in the
development of functional and cost-effective models, systems and activities. Standardization
as a process that improves the practices and logistics of institutions of different nature is
understood as an important link in the improvement of the business, particularly in the area of
digital preservation. This thesis analyses and compares the models for calculating the cost of
long term digital preservation: T-CMDP, LIFE3, KRDS and CMDP in order to start a
26
discussion about the possibility of standardization and optimization of processes of
preservation.
Keywords: digital preservation, standardization, T-CMDP, LIFE3, KRDS, CMDP

More Related Content

Similar to 03 Loncaric, Ksenija, Analiza modela troskova digitalnog ocuvanja v.2 - prepravak

The optimization model of investments in IT infrastructure availability usin...
The optimization model of  investments in IT infrastructure availability usin...The optimization model of  investments in IT infrastructure availability usin...
The optimization model of investments in IT infrastructure availability usin...
Semir Ibrahimovic
 
KosIgor_DiplomskiRad_2016_final
KosIgor_DiplomskiRad_2016_finalKosIgor_DiplomskiRad_2016_final
KosIgor_DiplomskiRad_2016_finalIgor Kos
 
Korisničke podrške 1 i 2 nedelja
Korisničke podrške 1 i 2 nedeljaKorisničke podrške 1 i 2 nedelja
Korisničke podrške 1 i 2 nedeljamuzafers
 
Procesni pristup poslovanju-BPR ppt
Procesni pristup poslovanju-BPR pptProcesni pristup poslovanju-BPR ppt
Procesni pristup poslovanju-BPR pptsetuplinks
 
Modeliranje poslovnih procesa: izvedbeni projekti
Modeliranje poslovnih procesa: izvedbeni projektiModeliranje poslovnih procesa: izvedbeni projekti
Modeliranje poslovnih procesa: izvedbeni projekti
Slaven Brumec
 
Procjena sigurnosti računalnih mreža korištenjem fuzzy analitičkog hijerarhij...
Procjena sigurnosti računalnih mreža korištenjem fuzzy analitičkog hijerarhij...Procjena sigurnosti računalnih mreža korištenjem fuzzy analitičkog hijerarhij...
Procjena sigurnosti računalnih mreža korištenjem fuzzy analitičkog hijerarhij...Roman Tušek
 
Provedba strategije razvoja e-Uprave u 2010. godini
Provedba strategije razvoja e-Uprave u 2010. godiniProvedba strategije razvoja e-Uprave u 2010. godini
Provedba strategije razvoja e-Uprave u 2010. godini
Središnji državni ured za e-Hrvatsku
 
Mr. Jasmin Jajčević, E-zapisi prednosti, nedostaci, preporuke zaštite
Mr. Jasmin Jajčević, E-zapisiprednosti, nedostaci, preporuke zaštiteMr. Jasmin Jajčević, E-zapisiprednosti, nedostaci, preporuke zaštite
Mr. Jasmin Jajčević, E-zapisi prednosti, nedostaci, preporuke zaštite
Arhivistika
 
Case study CLOUD BACKUP - Specijalna bolnica Thalassotherapia Crikvenica
Case study CLOUD BACKUP - Specijalna bolnica Thalassotherapia CrikvenicaCase study CLOUD BACKUP - Specijalna bolnica Thalassotherapia Crikvenica
Case study CLOUD BACKUP - Specijalna bolnica Thalassotherapia Crikvenica
Hrvatski Telekom
 
Sigurnost i upravljanje distribuiranim sustavima
Sigurnost i upravljanje distribuiranim sustavimaSigurnost i upravljanje distribuiranim sustavima
Sigurnost i upravljanje distribuiranim sustavimaDamir Delija
 
Osnove sustava potpunog upravljanja kvalitetom - Zvonko Ladešić
Osnove sustava potpunog upravljanja kvalitetom - Zvonko LadešićOsnove sustava potpunog upravljanja kvalitetom - Zvonko Ladešić
Osnove sustava potpunog upravljanja kvalitetom - Zvonko Ladešić
Pravdic
 
Upravljanje Web Uslugama u IT okruženjima
Upravljanje Web Uslugama u IT okruženjimaUpravljanje Web Uslugama u IT okruženjima
Upravljanje Web Uslugama u IT okruženjima
andrea132961
 
UPD (2).pptx.oasfasfccccccccccccccccccccccccccccccccccccccc
UPD (2).pptx.oasfasfcccccccccccccccccccccccccccccccccccccccUPD (2).pptx.oasfasfccccccccccccccccccccccccccccccccccccccc
UPD (2).pptx.oasfasfccccccccccccccccccccccccccccccccccccccc
Brankouljak
 
Odlučivanje u poslovnim procesima - modeliranje odlučivanja, norma DMN 1.3, o...
Odlučivanje u poslovnim procesima - modeliranje odlučivanja, norma DMN 1.3, o...Odlučivanje u poslovnim procesima - modeliranje odlučivanja, norma DMN 1.3, o...
Odlučivanje u poslovnim procesima - modeliranje odlučivanja, norma DMN 1.3, o...
Slaven Brumec
 
Data WareHose
Data WareHoseData WareHose
Data WareHose
Kruno Ris
 
Razvoj mobilnih informacijskih sustava
Razvoj mobilnih informacijskih sustavaRazvoj mobilnih informacijskih sustava
Razvoj mobilnih informacijskih sustava
Slaven Brumec
 
Završni_rad-Ivan_Kontek_0135208175
Završni_rad-Ivan_Kontek_0135208175Završni_rad-Ivan_Kontek_0135208175
Završni_rad-Ivan_Kontek_0135208175Ivan Kontek
 

Similar to 03 Loncaric, Ksenija, Analiza modela troskova digitalnog ocuvanja v.2 - prepravak (20)

The optimization model of investments in IT infrastructure availability usin...
The optimization model of  investments in IT infrastructure availability usin...The optimization model of  investments in IT infrastructure availability usin...
The optimization model of investments in IT infrastructure availability usin...
 
KosIgor_DiplomskiRad_2016_final
KosIgor_DiplomskiRad_2016_finalKosIgor_DiplomskiRad_2016_final
KosIgor_DiplomskiRad_2016_final
 
Korisničke podrške 1 i 2 nedelja
Korisničke podrške 1 i 2 nedeljaKorisničke podrške 1 i 2 nedelja
Korisničke podrške 1 i 2 nedelja
 
Procesni pristup poslovanju-BPR ppt
Procesni pristup poslovanju-BPR pptProcesni pristup poslovanju-BPR ppt
Procesni pristup poslovanju-BPR ppt
 
Modeliranje poslovnih procesa: izvedbeni projekti
Modeliranje poslovnih procesa: izvedbeni projektiModeliranje poslovnih procesa: izvedbeni projekti
Modeliranje poslovnih procesa: izvedbeni projekti
 
Procjena sigurnosti računalnih mreža korištenjem fuzzy analitičkog hijerarhij...
Procjena sigurnosti računalnih mreža korištenjem fuzzy analitičkog hijerarhij...Procjena sigurnosti računalnih mreža korištenjem fuzzy analitičkog hijerarhij...
Procjena sigurnosti računalnih mreža korištenjem fuzzy analitičkog hijerarhij...
 
Oblikovni obrasci
Oblikovni obrasciOblikovni obrasci
Oblikovni obrasci
 
Provedba strategije razvoja e-Uprave u 2010. godini
Provedba strategije razvoja e-Uprave u 2010. godiniProvedba strategije razvoja e-Uprave u 2010. godini
Provedba strategije razvoja e-Uprave u 2010. godini
 
03 Zelenika
03 Zelenika03 Zelenika
03 Zelenika
 
Mr. Jasmin Jajčević, E-zapisi prednosti, nedostaci, preporuke zaštite
Mr. Jasmin Jajčević, E-zapisiprednosti, nedostaci, preporuke zaštiteMr. Jasmin Jajčević, E-zapisiprednosti, nedostaci, preporuke zaštite
Mr. Jasmin Jajčević, E-zapisi prednosti, nedostaci, preporuke zaštite
 
Case study CLOUD BACKUP - Specijalna bolnica Thalassotherapia Crikvenica
Case study CLOUD BACKUP - Specijalna bolnica Thalassotherapia CrikvenicaCase study CLOUD BACKUP - Specijalna bolnica Thalassotherapia Crikvenica
Case study CLOUD BACKUP - Specijalna bolnica Thalassotherapia Crikvenica
 
Sigurnost i upravljanje distribuiranim sustavima
Sigurnost i upravljanje distribuiranim sustavimaSigurnost i upravljanje distribuiranim sustavima
Sigurnost i upravljanje distribuiranim sustavima
 
Osnove sustava potpunog upravljanja kvalitetom - Zvonko Ladešić
Osnove sustava potpunog upravljanja kvalitetom - Zvonko LadešićOsnove sustava potpunog upravljanja kvalitetom - Zvonko Ladešić
Osnove sustava potpunog upravljanja kvalitetom - Zvonko Ladešić
 
Upravljanje Web Uslugama u IT okruženjima
Upravljanje Web Uslugama u IT okruženjimaUpravljanje Web Uslugama u IT okruženjima
Upravljanje Web Uslugama u IT okruženjima
 
UPD (2).pptx.oasfasfccccccccccccccccccccccccccccccccccccccc
UPD (2).pptx.oasfasfcccccccccccccccccccccccccccccccccccccccUPD (2).pptx.oasfasfccccccccccccccccccccccccccccccccccccccc
UPD (2).pptx.oasfasfccccccccccccccccccccccccccccccccccccccc
 
Odlučivanje u poslovnim procesima - modeliranje odlučivanja, norma DMN 1.3, o...
Odlučivanje u poslovnim procesima - modeliranje odlučivanja, norma DMN 1.3, o...Odlučivanje u poslovnim procesima - modeliranje odlučivanja, norma DMN 1.3, o...
Odlučivanje u poslovnim procesima - modeliranje odlučivanja, norma DMN 1.3, o...
 
Data WareHose
Data WareHoseData WareHose
Data WareHose
 
30
3030
30
 
Razvoj mobilnih informacijskih sustava
Razvoj mobilnih informacijskih sustavaRazvoj mobilnih informacijskih sustava
Razvoj mobilnih informacijskih sustava
 
Završni_rad-Ivan_Kontek_0135208175
Završni_rad-Ivan_Kontek_0135208175Završni_rad-Ivan_Kontek_0135208175
Završni_rad-Ivan_Kontek_0135208175
 

03 Loncaric, Ksenija, Analiza modela troskova digitalnog ocuvanja v.2 - prepravak

  • 1. Filozofski fakultet Sveučilišta u Zagrebu Odsjek za informacijske i komunikacijske znanosti Ak. god. 2013./2014. Ksenija Lončarić Analiza modela troškova digitalnog očuvanja i mogućnost standardizacije Završni rad Mentor: dr. sc. Hrvoje Stančić, izv. prof. Zagreb, rujan 2014.
  • 2. 2 Sadržaj UVOD.........................................................................................................................................3 1. Standardizacija .......................................................................................................................4 2. Testbed Cost Model for Digital Preservation (T-CMDP) ......................................................5 2.1. Model troškova................................................................................................................7 2.1.1. Aktivnosti čuvanja zapisa.........................................................................................8 2.1.2. Razvoj pristupa očuvanja .........................................................................................8 2.1.3. Aktivnosti digitalnog očuvanja.................................................................................9 3. LIFE3 Costing Model (LIFE3)..............................................................................................11 * Neobavezni elementi za projekte s digitalizacijom...........................................................12 3.1. Analiza predloženog modela .........................................................................................12 3.2. LIFE3 alat.......................................................................................................................13 4. Keeping Research Data Safe (KRDS)..................................................................................14 4.1. KRDS model aktivnosti.................................................................................................15 4.2. Nositelji troškova...........................................................................................................16 4.3. Predložak resursa...........................................................................................................16 4.4. KRDS analiza koristi.....................................................................................................16 5. Cost Model for Digital Preservation.....................................................................................17 5.1. Metode...........................................................................................................................17 5.1.2. Primjena faktora troškova u CMDP-u....................................................................19 6. Usporedba modela ................................................................................................................21 7. Zaključak ..............................................................................................................................23 LITERATURA .........................................................................................................................24
  • 3. 3 UVOD Danas živimo u dobu informacija. One su nam svima na dohvat ruke, imamo mogućnost dijeljenja informacija, komuniciranja na daljinu, nismo više limitirani prostorom niti vremenom. Prema teoriji Manuela Castellsa, dio smo umreženog društva (engl. networked society) koje je nastalo tokom '70.-ih godina prošloga stoljeća međudjelovanjem triju procesa; pojave društvenih pokreta, restrukturiranja kapitalizma, i kao najvažnije, razvoja informacijske tehnologije. Takvo društvo je shvaćeno kao globalno, organizirano i povezano u komunikacijskim i medijskim mrežama. Kao jednu vrstu takvih mreža spominje informacijske mreže koje zbog svoje fleksibilnosti, izdržljivosti te proširenosti djeluju kao temelj budućem poslovanju, ekonomiji i drugim praksama. Takvi virtualni svjetovi i sfere zahtijevaju određena znanja, sposobnosti te standarde kako bi omogućili što efikasniju upotrebu informacija. Postojanje arhiva, muzeja, knjižnica i drugih institucija koje se bave prikupljanjem i čuvanjem građe i gradiva dokazuje nam koliki je zapravo značaj pohrane informacija i zašto mi danas, kao suvremenici moderne tehnologije, smo dužni pronaći najbolje moguće načine očuvanja. Prvenstveno, treba uzeti u obzir da nam nisu sve informacije bitne, da nije potrebno težiti očuvanju cjelokupnog stvaralaštva nekog stvaratelja, kako je za struku od najveće važnosti određivanje vrijednosti onoga čime se rukuje i da li ona nadilazi kriterije potrebitosti. U takvim slučajevima je najvažnije poznavati vlastito područje, stvoriti pravila, provjerene procedure i prakse kako bi se mogla omogućiti pohrana te kako bi se to „pohranjeno“ moglo jednoga dana uspješno koristiti. Dugoročno očuvanje i da li je ono moguće, česti je problem spomenutih institucija zbog brzog napretka tehnologije, velikih troškova održavanja sustava i komplikacija koje iz toga prolaze. Ovaj rad će se baviti digitalnim očuvanjem i mogućnostima standardizacije kroz analizu modela izračuna troškova i koristi napravljenih u svrhu stvaranja ekonomski najisplativijeg rješenja dugoročnog očuvanja. Kroz te modele uvidjet ćemo raznolikost prijedloga te ulogu i iskoristivost svakog od njih te može li uopće postojati standardizirani model za institucije različitih karaktera. U radu će biti analizirani modeli T-CMDP, LIFE3, KRDS i CMDP kao dio skupine modela troškova digitalnog očuvanja zbog primijećenih sličnosti i razlika koje će kasnije biti obrađene u tekstu.
  • 4. 4 1. Standardizacija Prema Hrvatskom zavodu za norme, standardizacija ili normizacija je „djelatnost uspostavljanja odredaba za opću i opetovanu uporabu koje se odnose na postojeće ili moguće probleme radi postizanja najboljeg stupnja uređenosti u danome kontekstu.“1 Iako je ova definicija dosta opširna, poslužit će kao polazište shvaćanja uloge standardizacije u digitalnom očuvanju. Kako bi se ostvarili optimalni rezultati, i za stvaratelja i za klijenta, potrebno je uvijek slijediti određena pravila. Pritom norme služe kao upute, sljednice, prijedlozi za dugoročno i kratkoročno postizanje najoptimalnijih rezultata. Svaki standard to ima za cilj i njihova izrada pospješuje poslovanje i upravljanje mnogim korisnicima. Modeli kojima će se ovaj rad baviti bit će shvaćeni kao smjernice za izračun troškova neke organizacije ili institucije sa ciljem pronalaska najisplativijeg načina izračuna. Budući da je očito da svaka organizacija ima vlastite karakteristike, obilježja, zahtjeve i potrebe, logično bi bilo zaključiti kako svaka mora imati osmišljeni vlastiti model. Međutim, da li je uopće to potrebno i da li se isplati? Svaka od njih ima zajedničke točke neke koje se mogu predstaviti kao faktori koji utječu na izračun troškova. Samim time je stvoren i temelj za traženje zajedničkih karakteristika koje bi dovele do zajedničkih modela. Standardizacija kao takva bi olakšala posao većini tih organizacija ili institucija implementirajući sustave koji bi spojili, danas još razdvojene, modele u jedan složen od više različitih modela. To bi zahtijevalo dosta snalažljivosti i upućenosti, no koliko se isplati je pitanje koje zahtjeva odgovor. 1 Hrvatski zavod za norme, Pojmovi, nazivi i definicije, URL: http://www.hzn.hr/default.aspx?id=89 (25.8.2014.)
  • 5. 5 2. Testbed Cost Model for Digital Preservation (T-CMDP) Ovaj model je započeo kao praktični istraživački projekt autora Jacqueline Slats i Remc-a Verdegema u sklopu Nacionalnog arhiva Kraljevine Nizozemske. Kao jedan od glavnih ciljeva ističu istraživanje načina kojima bi se omogućo dugoročni pristup arhivskom gradivu, a kao glavna metoda je poslužio eksperiment u kontroliranim uvjetima. U svome radu uspoređuju tri pristupa digitalnom očuvanju: migraciju, XML2 i UVC3, u pogledima njihovih mogućnosti, korisnosti te troškova. Koristili su 4 vrste zapisa: tekstualni dokument, proračunske tablice, elektronsku poštu i baze podataka različitih veličina, složenosti i karaktera4. Kao glavne pokazatelje, navode: 1. troškove digitalnog arhivskog sustava i njegovu funkcionalnost za dugoročno očuvanje digitalnih zapisa, 2. troškove osoblja, 3. troškove razvoja softvera i metoda/strategija za očuvanje digitalnih zapisa, 4. troškove izvođenja određenih djelatnosti očuvanja, 5. druge faktore koji utječu na ukupne troškove očuvanja. Unutar svakog od navedenih elemenata navedeni su i podelementi. Troškovi digitalnog arhivskog sustava obuhvaćaju fizički prostor i hardver potreban za pohranu i upravljanje zapisima; poslužitelji (engl. servers), mediji za pohranu (engl. storage media) i back up oprema. Budući da se radi o dugoročnom digitalnom očuvanju, potrebno je voditi brigu o vrsti i kvaliteti same opreme. Teško je, i gotovo nemoguće, predvidjeti količinu zapisa i gradiva koju će biti potrebno pohraniti u budućnosti, no moguće je odrediti granice koje u danom trenutku nadilaze potrebe pohrane i očuvanja. Osim hardvera, bitna je i vrsta softvera koja bi odgovarala potrebama institucije ili organizacije koja posjeduje digitalni arhivski sustav. Uz njega, sustav za očuvanje (engl. preservation system) osigurava spremnost zapisa na operacije očuvanja poput migracije ili konverzije u XML, daje procjenu rezultata 2 Engl. Extensible Markup Language; standardizirani jezik za označavanje podataka. 3 Engl. Universal Virtual Computer; virtualni stroj osmišljen za očuvanje digitalnog gradiva temeljen na emulaciji 4 Slats, J., Verdegem, R. Cost Model for Digital Preservation (T-CMDP), National Archief of the Netherlands, 2005. URL: http://dlmforum.typepad.com/Paper_RemcoVerdegem_and_JS_CostModelfordigitalpreservation.pdf (25.8.2014.)
  • 6. 6 očuvanja i vraća zapise u digitalni sistem. Ovaj sustav, kao i prijašnji, zahtjeva odgovarajući hardver i softver za ispunjenje svojih zadataka. Osim toga, za funkcioniranje navedenih sustava, potrebno je i osoblje. Troškovi osoblja se izračunavaju na temelju vrste osoblja, njihovom broju, sposobnostima i kvalifikacijama te na temelju vremenskog perioda u kojemu oni ispunjavaju svoju dužnost. Troškovi razvoja softvera i metoda očuvanja zapisa čine treći glavni element. Svaki zapis ili serija zapisa (engl. batch) zahtjeva odvajanje vlastitih karakteristika prema važnosti kako bi se u konačnici ustvrdio integritet i autentičnost zapisa. Na temelju dobivenih rezultata se osmišljava i realizira prihvatljiv i prilagođen pristup očuvanja. Budući da se radi o velikim brojevima zapisa za čije je utvrđivanje bitnih karakteristika potreban dugotrajan posao, od upravitelja zapisima se očekuje da ih navede prilikom njihovog predavanja zaduženom osoblju za daljnju pohranu. Zbog istog razloga ovaj model predlaže stvaranje internacionalne kolekcije strategija za dugotrajno očuvanje i pohranu kako bi se olakšao posao u budućnosti. Kao i kod hardvera i softvera, i u ovom aspektu je potrebna visoka razina kvalitete za optimalne rezultate i eventualnu buduću uporabu osmišljenog sustava za očuvanje. Što se tiče samog procesa digitalnog očuvanja, možemo ih podijeliti na migraciju zapisa, konverziju zapisa u XML format te korištenje UVC-a kako bi se zadržala dostupnost zapisa. U ovom dijelu autori koriste OAIS5 terminologiju kako bi objasnili djelovanje i rezultate svakog od procesa očuvanja. Kao najvažniji navode konverziju u XML format prilikom koje arhivski informacijski paket (engl. Archival Information Package, AIP) prelazi u AIPX/XML format. Kao glavnu prednost ističu njegov dugi životni vijek i mogućnost čitanja od strane više različitih aplikacija. Sljedeći element se bavi različitim faktora koji utječu na ukupne troškove, a nisu se mogli smjestiti u neku zajedničku skupinu. Iako su već spomenuti troškovi osoblja, javna služba je još jedna koja zahtjeva određen broj zaposlenika, a sami troškovi ovise o kvaliteti usluge koju pružaju i veličini ponude. Osim toga, svaki or procesa očuvanja i drugih operacija je podložan greškama i može oštetiti zapis. Preporuča se ostavljanje određenog vremena između svake akcije, čuvanje originala, nadgledanje tehnologije koja se koristi i sl. To sve 5 Engl. Open Archival Information System; arhiv koji se sastoji od ljudi i sustava, dio je neke organizacije i prihvaća odgovornost očuvanja informacija i osiguravanja njegove dostupnosti određenoj zajednici. Drugo značenje se odnosi na standard digitalnog očuvanja dostupan na : http://public.ccsds.org/publications/archive/650x0m2.pdf
  • 7. 7 dovodi do povećanja troškova, no dugoročno gledajući, mogu ih i smanjiti s vremenom zbog predostrožnosti koje se moraju izvršiti njihovim djelovanjem. 2.1. Model troškova Model troškova koji je stvoren kao glavni dio CMDP-a sastoji se od tri tablice: osnove troškova (engl. Cost Basis), izračuna vremena (engl. Time Calculation) i izračuna troškova (engl. Cost Calculation). Prva tablica služi kao „temelj za druge dvije proračunske tablice i opisuje troškove osoblja, digitalnog arhivskog sustava i sustava očuvanja.“6 Tablica izračuna vremena opisuje „vrijeme potrebno za izvođenje nekolicine aktivnosti očuvanja zapisa, za razvoj pristupa očuvanja i za konačno izvršenje tih aktivnosti.“7 Zadnja tablica pokazuje rezultate usporedbe troškova različitih pristupa očuvanja kojim se ovaj rad bavi. Naglasak je stavljen na budućoj ulozi ovih izračuna; a poslužit će kao “početna točka za poboljšanja i povećanja temeljena na zajedničkom iskustvu i podršci.“8 Napominju autori i kako su ti iznosi troškova samo procjene temeljene na podacima i eksperimentima izvršenim unutar Testbed projekta, njihovom iskustvu te na zdravom razumu. Ovaj model bi trebao poslužiti kao okvir unutar kojega će se komentirati dobivene procjene radi poboljšanja i usporedbi s stvarnim troškovima digitalnog očuvanja. Za navedene tablice i pojašnjenje podataka unutar njih, postoji nekoliko pretpostavki: Osoblje:  kategorija osoblja s 4 različite satnice,  svaka kategorija radi 1.620 sati godišnje. Digitalni arhivski sustav i sustav očuvanja:  4 vrste prostora + troškovi opremanja za svaki,  troškovi sadrže i broj osoblja za svaku vrstu prostora, 6 Slats, J., Verdegem, R. Cost Model for Digital Preservation (T-CMDP), National Archief of the Netherlands, 2005. URL:http://dlmforum.typepad.com/Paper_RemcoVerdegem_and_JS_CostModelfordigitalpreservation.pdf (25.8.2014.) 7 Ibid. 8 Ibid.
  • 8. 8  objekt u pitanju bi trebao moći upravljati sa 100 Terabajta zapisa i biti proširen na 1000 Terabajta ili više,  10% zapisa unutar digitalnog arhiva će trebati neku vrstu popravka,  zapisi u XML formatu neće trebati popravak niti dodavanje meta podataka  proces migracije bi trebao biti ponovljen svake tri godine, konverzija u XML svake desete, a UVC nema faktor ponavljanja, no svake godine mora biti osmišljen novi dekoder. 2.1.1. Aktivnosti čuvanja zapisa Digitalno očuvanje, prema prijedlozima Testbeda, trebalo bi početi od samog početka stvaranja zapisa radi kasnijeg olakšanja i smanjenja posla. Tako bi trebalo odmah na početku početi razmišljati o budućnosti određenog zapisa i njegovoj mogućoj korisnosti. 2.1.2. Razvoj pristupa očuvanja Tablica 1 pokazuje troškove stvaranja pristupa očuvanja. Planiranje samog razvoja i njegovo ostvarenje jedan je od glavnih dijelova digitalnog očuvanja u pogledu troškova. Navedeni primjer prikazuje slučaj u kojemu se godišnje stavlja na čuvanje samo jedna stotina proračunskih tablica tj. pet serija od dvadeset tablica. Možemo vidjeti odnose troškova zadovoljavanja prvotnih potreba za pokretanje projekta, troškova razvoja pristupa i njegovog testiranja za osoblje te za svaki od vrsta procesa očuvanja. Razlike su među njima velike i primjetne, posebice između migracije i konverzije u XML, i UVC-a. Kao što je već spomenuto, najbolje rješenje je pokretanje postupka očuvanja na samom početku stvaranja zapisa i prema tome je stvaranje novih zapisa u XML formatu optimalno i jedino rješenje bez ikakvih troškova.
  • 9. 9 Tablica 1: Troškovi razvoja pristupa očuvanja 2.1.3. Aktivnosti digitalnog očuvanja Nakon razvoja i ostvarenja odgovarajućeg pristupa te izračuna troškova, potrebno je izračunati troškove samih procesa digitalnog očuvanja. Oni su, za razliku od prijašnjih troškova iz tablice, marginalni te postoji opcija izgradnje automatskih pomagala za evaluaciju određenih aktivnosti očuvanja. Sljedeće dvije tablice, Tablica 2 i Tablica 3, prikazuju troškove 4 vrste pristupa očuvanju te usporedbu pristupa u odnosu na veličinu serija zapisa. Očito je da je UVC format najskuplji i najmanje isplativ u pogledu troškova na početku stvaranja. Međutim, stvaranje dekodera je potrebno svakim dolaskom novih formata zapisa te je dugoročno isplativo. No kada se pogleda konverzija u XML ili stvaranje u XML-u, troškovi u početku su najmanji i za razliku od migracije više isplativiji. Troškovi se povećavaju jedino zbog potrebe za prebacivanjem na novi standardni jezik svakih 10 godina. S druge strane, migracija zahtjeva ponavljanje postupka svake tri godine što vodi do znatnog povećanja troškova unatoč niskim troškovima u početku. Tablica 3 zanemaruje UVC pristup zbog očitih previsokih troškova te stavlja naglasak na ostala tri pristupa kako bi se napravila usporedba prema veličini serije zapisa. I opet, kao najefikasniji pristup je prikazano je stvaranje proračunskih tablica u XML formatu, bez obzira da li je riječ o serijama od 200 ili 2.000, ili u početku i nakon 20 godina.
  • 10. 10 Tablica 2: Usporedba četiri pristupa očuvanja Tablica 3: Tri pristupa očuvanja i efekt veličine serija
  • 11. 11 3. LIFE3 Costing Model (LIFE3) LIFE3, punim imenom Lifecycle Information For E-Literature je projekt započet od strane Sveučilišta u Londonu (UCL) i završen je 2010. godine. Sastoji se od tri faze: prva faza LIFE projekta započela je 2006. i bavi se „shvaćanjem dugoročnih troškova digitalnog očuvanja, što čini bitan korak u pomaganju institucijama pri planiranju budućnosti.“9 Jedan od glavnih zadataka je utvrđivanje trajanja života digitalnih zapisa te utvrđivanje troškova koji će se morati pokriti njihovim očuvanjem kroz godina. Druga faza, u trajanju od 2007. do 2008. nastavlja se na prvu pridodajući joj tri studije slučaja. Treća faza započinje 2009. kao zajednički rad Sveučilišta u Londonu i Britanske nacionalne knjižnice. Ona donosi alat za predviđanje troškova koji se temelji na drugoj fazi LIFE projekta te je oblikovan prema primjerima iz navedenih studija slučajeva. Taj alat služi kao kvalitetno pomagalo institucijama i organizacijama koje se bave ili će se baviti digitalnim očuvanjem, te pokriva široki niz mogućih vrsta očuvanja i zapisa.10 LIFE1, kao prva faza projekta, temeljen je na pregledu tada već postojećih modela digitalnog očuvanja te „nudi upotpunjenu metodologiju izračunavanja troškova digitalnog očuvanja za sljedećih 5, 10 i 100 godina.“11 Samim time, ta je prva faza dobra osnova za daljnje širenje modela. Temelja ideja je „davanje pogleda u tipične procese primijenjene na digitalne objekte kroz njihove životne cikluse od strane organizacije koja nad njima ima skrbništvo.“12 Kako bi dao detaljni i kompletni prikaz životnog ciklusa digitalnih zapisa, i radi točnijeg izračunavanja troškova, LIFE3 ga dijeli na šest razina. (Tablica. 4). Svaka razina predstavlja procese koji se događaju tokom životnog ciklusa, a svaki od njih se sastoji od sebi specifičnih elemenata i podelemenata. Elementi čine važne dijelove svake od razina i fokusirani su na različite procese što omogućuje preciznost, točnost te efikasnost u definiranju dijelova životnog ciklusa. Podelementi, s druge strane, služe za usmjeravanje, no nisu dovoljno značajni da bi stajali kao glavni elementi razina. Procesi su organizirani kronološki, od samog nastanka zapisa do pristupa i korištenja zapisa. Međutim, u praksi to može biti drugačije i većina se procesa događa istovremeno. 9 Lifecycle Information For E-Literature (LIFE3), University College London (UCL) and British Library (BL), 2010. URL: http://www.life.ac.uk/3/docs/life3_report.pdf (25.8.2014.) 10 Ibid. 11 Ibid. 12 Ibid.
  • 12. 12 Tablica 4: Životni vijek zapisa * Neobavezni elementi za projekte s digitalizacijom 3.1. Analiza predloženog modela Glavne razine životnog ciklusa digitalnog zapisa sastoje se od nastanka zapisa, prilikom kojega se obavljaju procesi osmišljavanja aktivnosti, odabiranja i pripremanja zapisa koji se kasnije transportiraju na željeno mjesto kako bi se digitalizirali. Sljedeća razina je nabavka (engl. acquisition) odabranog zapisa, sklapanje dogovora o njegovom preuzimanju te prijavljivanje zapisa kao prisutnog na određenom mjestu. Kako bi se osigurala kvaliteta, potrebno je navesti preporuke i napomene te ih povezati sa zapisom, ažurirati podatke o trenutnom položaju/mjestu zapisa. To je treća razina nazvana prihvat (engl. Ingest) nakon koje slijedi stvaranje metapodataka. Oni su važni za buduće upravljanje zapisima, a posebice za olakšavanje pristupa željenim podacima i informacijama nekog zapisa. Poželjno je koristiti već postojeće metapodatke, no potrebno je stvoriti i nove budući da zapis u novoj okolini može dobiti na vrijednosti ili važnosti. Sljedeća razina je početak digitalnog očuvanja koji se odvija kroz procese sređivanja administracije, opskrbe skladišta, obnavljanja, stvaranja pomoćnih (backup) verzija zapisa te provjera provedenog. Potrebno je i zaštititi i sam sadržaj nekog zapisa. Nadgledanje i planiranje očuvanja digitalnog zapisa potrebno je radi ostvarenja odgovarajućeg pristupa očuvanja kako bi se, u zadnjoj razini, moglo doći do zapisa bez problema. Svako pristupanje zapisu treba biti kontrolirano i dozvoljeno, a očekuje se da svaki korisnik ima pravovaljanu podršku i pomoć u slučaju problema ili nejasnoća.
  • 13. 13 3.2. LIFE3 alat Nakon što je razvijen sam model razina životnog ciklusa digitalnih apisa, stvoren je i alat koji, prema navedenom predlošku, daje procjene mogućih troškova. Korisnik ima mogućnost biranja sadržaja i vrstu organizacije kojoj pripada kako bi dobio podatke stvorene prema njegovom odabiru. Podaci se mogu mijenjati budući da korisnik sam upravlja onime što treba i očekuje od alata. Predložak je osmišljen na temelju LIFE3 modela i rezultata dobivenih iz studija slučajeva provedenih u sklopu LIFE2 projekta. Zbog same prirode ovog alata, korisnicima je olakšan dolazak do željenih podataka o mogućim troškovima. On nudi više opcija izbora, ovisno o korisniku i potrebama organizacije/institucije te njihovih projekata. Ukratko, LIFE3 je uspješno analizirao razine životnog ciklusa digitalnih zapisa i na temelju toga napravio praktični alat koji cijeli projekt predstavlja kao novinu koja će olakšati upravljanje zapisima, očuvanje zapisa te općenito poslovanje korisnika.
  • 14. 14 4. Keeping Research Data Safe (KRDS) Keeping Research Data Safe je projekt osmišljen kao zajednički rad više institucija: Charles Beagrie LTD, OCLC istraživanja, Arhiva Ujedinjenog Kraljevstva, Informatičkog centra Sveučilišta u Londonu i dr. Glavna uloga mu je davanje „okvira za stvaranje i primjenu lokalnih modela troškova za istraživanje upravljanja podacima i za dugoročno očuvanje.“13 Autori ističu sljedeće mogućnosti kao neke od ciljeva modela vezane uz njegovu primjenu:  identificiranje trenutnih troškova,  identificiranje prošlih i budućih troškova,  usporedba troškova kroz različite kolekcije i institucije koje koriste različite varijable,  razvoj politike naplaćivanja i adekvatnih troškova arhiviranja,  fokusiranje na partikularne aktivnosti i modeliranje efekta promjene specifičnih procesa.14 Ovaj model primjenjuje metode utvrđivanja troškova prema pojedinim fazama životnog ciklusa digitalnog zapisa na podatke dobivene u istraživanjima. Svaka životna faza sadrži specifične procese i utvrđuje njima sukladne aktivnosti, varijable koje utvrđuju veličinu troškova tih aktivnosti te resurse potrebne za očuvanje. Postoje tri dijela KRDS-a okvira: 1) KRDS model aktivnosti: generički model za aktivnosti identifikacije podataka s implikacijama troškova očuvanja i njihovo naručivanje prema hijerarhiji faza, aktivnosti i podaktivnosti, 2) nositelji troškova (engl. cost drivers): ključne varijable poput visine plaća ili stope inflacije, koje utječu na troškove aktivnosti digitalnog očuvanja. Podijeljeni su u dvije veće grupe: ekonomske i uslužne prilagodbe, 3) predložak resursa: kategorije troškova i trajanja u jednostavnom, generičkom obliku bližem onim korištenim u metodologijama troškova sveučilišta Ujedinjenog Kraljevstva baziranih na TRAC-u (Transparent Approach to Costing method)15. 13 User Guide for Keeping Research Data Safe: Assessing Costs/Benefits of Research Data Management, Preservation and Re-use, Charled Beagrie Limited, 2011. URL: http://www.beagrie.com/static/resource/KeepingResearchDataSafe_UserGuide_v2.pdf (25.8.2014.) 14 Ibid. 15 Trac je sustav otvorenog karaktera za upravljanje projektima za razvoj softvera. Više o njemu na: http://trac.edgewall.org/
  • 15. 15 „Model aktivnosti nudi pomoć prilikom identificiranja pojedinih aktivnosti koje troše resurse, ekonomske prilagodbe pomažu njihovom širenju i održavanju tokom vremena, a uslužne prilagodbe pomažu utvrđivanju i podešavanju resursa za specifične zahtjeve. Predložak resursa nudi okvir za spajanje tih elemenata tako da se mogu implementirati u model temeljen na TRAC-u.“16 Svaki od ovih dijelova okvira izračuna troškova omogućuje klasificiranje različitih aktivnosti u unutar jednog modela pritom im dajući određene vrijednosti ovisno o određenim varijablama radi procjene troškova. 4.1. KRDS model aktivnosti Kao što je već spomenuto, KRDS model aktivnosti prvi je dio KRDS okvira koji identificira aktivnosti istraživanja s mogućim troškovima očuvanja. Sastoji se od hijerarhijski organiziranih razina od koje svaka ima svoje podrazine uz svoja objašnjenja. Sastoji se od tri razine: predarhivske, arhivske te službe za podršku i nekretnine. Prva razina uključuje sve djelatnosti, aktivnosti i procese koji se izvode tokom nastajanja zapisa, koji su povezani s njegovim stvaranjem i korištenjem. Uz to, odnosi se i na upravljanje projektima i istraživanjima raznih institucija ili organizacija koje se odvija prije samog arhiviranja. Druga razina, razina arhiviranja i sličnih aktivnosti, povezana je s prethodnom. Treća, međutim, može biti podrška ostalim razinama kao dio već postojeće infrastrukture. Može sadržavati aktivnosti vezane uz financije, informatiku i slične druge djelatnosti. Svaka od faza ima svoje elemente i svaki od njih ima svoje podelemente. Oni se kreću od aktivnosti poput izbora zapisa, traženja podrške pa sve do stvaranja metapodataka te stvaranja veza i referenci. Na svakoj od razina moguće je izračunati troškove, bez obzira o kompleksnosti ili jednostavnosti pojedine aktivnosti. Ovisno o tome što je potrebno ili korisnije, KRDS nudi dvije verzije modela aktivnosti. Prva, koja je predstavljana na 12 stranica, sadrži popis svih aktivnosti i podaktivnosti koje se nalaze u jednoj od faza, te nudi objašnjenje za svaku od njih. Ovaj detaljan prikaz dostupan je svima, kao i verzija od jedne stranice, KRDS „Lite“. Sastoji se od glavnim dijelova modela te njihovih elemenata, no ne objašnjava niti precizira koje su točno aktivnosti u pitanju. Može poslužiti i kao mali podsjetnik na cijeli KRDS okvir i model troškova. Međutim, detaljna verzija modela još uvijek daje bolji pregled nad cjelinom te uvodi korisnika/čitatelja u plan i program očuvanja. 16 User Guide for Keeping Research Data Safe: Assessing Costs/Benefits of Research Data Management, Preservation and Re-use, Charled Beagrie Limited, 2011. URL: http://www.beagrie.com/static/resource/KeepingResearchDataSafe_UserGuide_v2.pdf (25.8.2014.)
  • 16. 16 4.2. Nositelji troškova Nositelji troškova su sve one varijable koje utječu na iznos troškova očuvanja. Mogu se utvrditi za svaku aktivnost navedenu u modelu i podijeljeni su u dvije skupine. Prva se odnosi na ekonomske faktore, a druga na uslužne. Međutim, kako bi se najbolje moglo kontrolirati buduće troškove potrebno je voditi brigu o dobrom izboru formata, vremenu u kojemu će se odvijati određene aktivnosti te mora bili osiguran pristup zapisima bez kojega cijeli proces očuvanja nema smisla. Ekonomske prilagodbe se sastoje od inflacije/deflacije, gubitka na značaju te od iznosa troška povrata financija i investicija. Uslužne prilagodbe se tiču troškova osoblja; plaće, osiguranje i mirovine. Nadalje, troškovi se mogu izračunati i za različite karakteristike i sposobnosti osoblja, utječe i na upravljanje te troškove koji se mogu smanjiti efikasnim metodama upravljanja, no i povećati ukoliko metode ne odgovaraju potrebama institucije ili organizacije. Trajanje aktivnosti isto utječe na količinu financija namijenjenih za podmirivanje troškova. 4.3. Predložak resursa Zadnji dio modela povezan je usko sa svim fazama očuvanja. On nudi okvir koji spaja sve elemente aktivnosti i varijable izračunavanja troškova i stvara kategorije troškova te vrijeme koje je potrebno za svaku od njih. 4.4. KRDS analiza koristi Osim analize troškova, ovaj model nudi i analizu koristi. Glavna prednost je mogućnost točnije procjene isplativosti nekog projekta ili aktivnosti. Uz troškove, okvir izračunavanja koristi tvori komplet djelatnosti koje zajedno s analizom troškova nude pristup ispravnim podacima. Moguće je utvrditi troškove koji će u nekim situacijama biti faktor izbora i koji će, unatoč prvotnim izračunima, dati prednost skupljim ili kvalitetnijim opcijama. Npr. očuvanje nekog zapisa može biti ostvareno na više način ili u više formata i logičan izbor bi bio odabir one najisplativije. Budući da isključivo s analizom troškova ne vidimo dugoročne koristi, možemo izabrati opciju koja će se s vremenom pokazati kao skupa. Problemi koji se kasnije javljaju i troškovi koji iz toga proizlaze mogu se izbjeći analizom koristi s kojom bi eventualno bila izabrana skuplja, ali sigurnija i samim time isplativija opcija.
  • 17. 17 5. Cost Model for Digital Preservation Zadnji model kojim će se ovaj rad baviti je Cost Model for Digital Preservation (CMDP), kreiran od strane Danskog nacionalnog arhiva uz financijsku pomoć Danskog Ministarstva kulture. Njegov glavni cilj je implementiranje „modela izračuna troškova očuvanja digitalnog gradiva koje je u nadležnosti nacionalnih kulturnih baštinskih institucija“17 kako bi povisili financijsku efikasnost digitalnog očuvanja i njegovih aktivnosti. Uz to, cilj im je i davanje temelja za usporedbu već postojećih i budućih troškova te procjena budućih zahtjeva digitalnog očuvanja. Kao temeljna ideja i baza za nastanak cijelog modela korišten je „OAIS standard kako bi utvrdio koje su OAIS aktivnosti i podaktivnosti bitne za trošak.“18 Osim OAIS-a, kao što je već spomenuto u uvodu, ovaj model pokriva i projekte T- CMDP, LIFE3 i KRDS uzimajući od njih neke dijelove ili ideje te ih prezentirajući kao jednu cjelinu. Cijeli projekt se sastoji od tri faze. Prva faza, pod imenom Planiranje očuvanja i digitalne migracije (engl. Preservation Planning and digital migrations), započeta je 2009. i bavila se procjenama i troškovima digitalnog očuvanja, ponajviše planiranjem aktivnosti i digitalnim migracijama. Druga faza temeljena je na OAIS-u bavila se funkcionalnošću samog očuvanja i troškovima koji iz toga proizlaze. Treća faza pokrenuta je 2012. sa ciljem izrade modela arhivskog očuvanja s naglaskom na funkcionalnost i upotrebljivost u praksi. Unatoč podjelama po fazama, cijeli projekt je osmišljen kako bi dao „okvir za troškove digitalnog očuvanja, uključujući i detaljnu metodologiju koja daje točne preglede potrebnih resursa, set jednadžbi koje transformiraju te resurse u podatke o troškovima i objašnjenje primijenjenih načela.“19 5.1. Metode CMDP model napravljen je kao model temeljen na aktivnostima i njihovim troškovima, direktnim i indirektnim, te pruža pregled okvira unutar kojih su oni smješteni. Preuzima OAIS-ove funkcionalne cjeline: prihvat, arhivska pohrana, upravljanje podacima, 17 Bøgvad Kejser, U., Bo Nielsen, A., Thirifays, The Cost of Digital Preservation: Project Report v.10, Danish national Archives (DNA) and the Royal Danish Library in Denmark, 2009. URL: https://docs.google.com/viewer?a=v&pid=sites&srcid=Y29zdG1vZGVsZm9yZGlnaXRhbHByZXNlcnZhdGlvb i5ka3xwdWJ8Z3g6NWI5Y2YxNWI3YjBlNzczNg (25.8.2014.) 18 Ibid. 19 Ibid.
  • 18. 18 administracija, planiranje očuvanja, pristup i zajedničke službe. Uključili su i podjelu prema ulogama (proizvođač, korisnik, uprava) te različite kategorije osoblja. Takve podjele su prisutne i u T-CMDP-u, no u ovom modelu su detaljnije obrazložene. Svaka od kategorija sadrži svoje funkcije i obilježja, od kojih svaka zahtjeva drugačije resurse, dokumentaciju te troškove. Glavna formula koja se pritom koristi služi za izračunavanje troškova aktivnosti. Glavni iznos tj. rezultat dobiva se umnoškom vremena potrebnog za izvršenje određene aktivnosti i plaće zaduženog osoblja i zbrojem tog umnoška s novčanim iznosom resursa koji bi se morali nabaviti. Autori naglašavaju kako su sve formule iskorištene u ovom modelu temeljene na iskustvima arhivskog sektora. Struktura modela je prikazana u Tablici 5, a objašnjava funkcije, aktivnosti, komponente i parametre koji se koriste za određivanje visine troškova. Taj prikaz strukture razdvaja proces planiranja iz OAIS modela na manje jedinice. Svaka od njih se može iskoristiti u danoj formuli, a cilj takve podjele je stvaranje modela za cijeli životni ciklus. 5.1.1. Faktor interpretacije formata Pri svakom izračunavanju troškova postoje određene varijable koje na njih utječu. Prvenstveno, riječ je o kompleksnosti digitalnih formata i struktura. CMDP model je zbog toga razvio Faktor interpretacije formata (engl. The Format Interpretation Factor) pomoću kojega je moguće utvrditi težinu shvaćanja nekog formata. Ovisi o tome koliko je vremena potrebno uložiti za iščitavanje i shvaćanje nekog zapisa, njegovih specifikacija ili druge relevantne dokumentacije. Mjeri se u količini osoblja potrebnog za taj posao kroz broj tjedana. Krajnji iznos ovisi o količini same dokumentacije, vrsti zapisa, broju osoblja te kompleksnosti cijele aktivnosti. Ta kompleksnost može biti označena kao niska, srednja ili visoka. Pretpostavlja se da je potrebno u prosjeku 20 minuta osobi da pročita i shvati stranicu dokumentacije za format s niskom kompleksnošću. Ta brojka se povećava za 25% za formate sa srednjom kompleksnošću te za 50% za visoku. Primjerice, uzmimo tekstualni format koji neovisno o broju stranica ima konstantno visoku kvalitetu i nisu kompleksnost. Za shvaćanje takvog formata nije potrebno previše posla niti su potrebni posebni programi koji bi omogućili ljudima iščitavanje sadržaja. S druge strane, TIFF 6.0 je klasificiran kao format sa srednjom kompleksnošću zbog koje se povećava vrijeme iščitavanja podataka i njihovog shvaćanja, a GML fromat zahtjeva čak 30 minuta u prosjeku za shvaćanje sadržaja. Zbog toga se automatski povećava i sam faktor interpretacije formata.
  • 19. 19 Prilikom migracije zapisa, osim mogućeg gubitka kvalitete, postoji i opasnost zastarijevanja formata. Uz to, troškovi se povećavaju učestalošću samih migracija. Model preporuča migracije više zapisa istog formata istovremeno kako bi se sačuvalo na vremenu, osoblju te u konačnici i troškovima. Učestalost migracija ovisi o prosječnom životnom vijeku formata. Radi lakšeg izračunavanja u modelu se koristi vijek od 10 godina, a migracije se provode svakih 5 godina. 5.1.2. Primjena faktora troškova u CMDP-u Faktore troškova čine sve varijable koje utječu na konačni iznos troška bez obzira u kojem obliku i koje prirode. Budući da je potrebno nadgledanje poslovanja kako bi ono teklo što lakše i kako bi bilo što isplativije, bitno je uočiti kako pravilno biranje formata i metoda može dati optimalne rezultate. Model daje primjer arhiva kao nadležnog tijela koje ima dužnost biranja formata digitalnog očuvanja. Taj format bi trebao biti kvalitetan, lako čitljiv i razumljiv te dugog životnog vijeka. No, izborom formata s visokom razinom kompleksnosti automatski raste i visina troškova. Dobar izbor u konačnosti će imati i zadovoljavajuće i ne previsoke troškove. Potrebno je i razviti strategije očuvanja i standarde na temelju izvještaja nadležnog tijela radi dobivanja cjelokupnog pregleda nad procesom. Izrada planova migracija bitan je dio pri smanjenju troškova budući da i njegova pravilna i promišljena izrada olakšava posao. Testiranje tih planova efikasan je način potvrđivanja iskoristivosti plana, a izrada alata za izračunavanje posljednji je korak pri stvaranju praktičnog modela za izračune. Međutim, svi ovi procesi i aktivnosti donose dodatne troškove, posebice izrada alata. On mora biti u mogućnosti stvarati, čitati te ispravno interpretirati formate. Kompleksnost alata ovisi o vrsti formata za kojeg je namijenjen te o mogućnostima koje on sam ima za obradu podataka. CMDP model svojom detaljnošću i razrađenim strategijama i metodama, nudi korisnicima mogućnost upravljanja zapisima na više razina. Od samog početka stvaranja pa sve do trenutaka očuvanja i pristupa. Kao projekt, stvorio je samostalnu strukturu za model troškova baziran na OAIS standardu uzimajući njegovu metodologiju i terminologiju te proširujući ju u svome radu. Osim OAIS-a, CMDP koristi T-CMDP, LIFE3 i KRDS kao polazišne točke vlastitog istraživanja. Model je bio testiran, evaluiran te prilagođen na temelju podataka dobivenih iz studija slučaja kako bi se približio realnim potrebama budućih korisnika. Sami autori navode da je potrebna veća preciznost ovog modela, ponajviše u
  • 20. 20 pogledu očekivanog životnog vijeka formata koji je trenutno za sve formate stavljen na deset godina. Da bi postigao kvalitetu i preciznost, morat će se odrediti točno vrijeme i trajanje životnog vijeka te učestalost migracija.
  • 21. 21 6. Usporedba modela Analiza ovih četiriju modela (T-CMDP, LIFE3, KRDS i CMDP) nudi pregled nad glavnim funkcijama i karakteristikama koje model izračuna troškova mora imati. LIFE3 i KRDS naglasak stavljaju na životni vijek zapisa i razine te izračun troškova temelje na aktivnostima koje se odvijaju u svakome od njih, često ulazeći u detalje. Unatoč tome, nude i kraće preglede te odabir određenih faza ovisno o potrebama korisnika. KRDS to naglašava izdavanjem „LITE“ verzije svog modela, no cijela struktura je upotpunjenija i složenija. Upravo zbog toga i daje detaljna objašnjenja svakog od elemenata i podelemenata. Osim toga, uz sam model dolaze uputstva za korisnike kao posebno izdanje koje sadrži sva objašnjenja, primjere, terminologiju te objašnjenju metodologiju u slučaju nužde. Sadrži i upute pravilnog postupanja i upravljanja zapisima kroz razrađene i objašnjene korake. LIFE3, s druge strane, kroz svoje tri faze donosi prijedloge strukturiranja digitalnog očuvanja i procesa vezanih uz njega, uz navedene aktivnosti te moguće troškove svake od njih. Međutim, za razliku od KRDS-a, fokusira se više na alat koji je došao s trećom fazom projekta dajući više mogućnosti i opcija korisniku prilikom korištenja. Unatoč tome što je alat jednostavan za korištenje i pristupačan korisniku, ne bi se mogao iskoristiti kao jedinstveni alat za troškove. Na tome tragu je bio i CMDP model, koji uzima elemente LIFE3 projekta i KRDS-a kako bi stvorio uspješniji i efikasniji alat na temelju već postojećih modela. CMDP koristi i elemente Testbed projekta, prvenstveno u definiranju razina i faza očuvanja, definiranju varijabli te u izračunavanju troškova. Ide i korak dalje nudeći formule u svome modelu kako bi lakše dočarao postupke i približio metode korisniku/čitatelju. Uvidjevši rezultate proizašle iz T-CMDP-a vezane uz očuvanje različitih formata, CMDP daje varijable koje mogu na njega utjecati. Pritom ističe i druge faktore i karakteristike modela troškova koji moraju biti zadovoljeni ili optimalno isplanirani dajući i savjete kako uspješno provesti te procese. No, ono što zanemaruje su prijedlozi doneseni od strane T-CMDP-a. Naime, taj model daje rezultate vlastitih istraživanja formata, troškova i njihovog životnog vijeka. Naglašava i činjenicu da su životni vjekovi različiti ovisno o formatu te da troškovi variraju od samog nastanka zapisa i prvog očuvanja i tokom godina. Jeftiniji izbori mogu dovesti do lošeg izbora ukoliko format treba s vremenom mijenjati, čitače treba često popravljati ili ako treba nalaziti nove načine očuvanja, migracija ili drugih aktivnosti. Isto tako, skuplji modeli u početku mogu se činiti neiskoristivim i neisplativim ako početni budžet nije dovoljan. Ali može se dogoditi i da se izabere takva mogućnost kako bi se s vremenom smanjili troškovi, no ovisi o željama i mogućnostima korisnika. U svakom slučaju, CMDP
  • 22. 22 projekt nije dao dovoljno truda u definiranju trajanja životnog vijeka, određivanju formata i preciziranju učestalosti određenih procesa, poput migracija, koji se moraju obavljati kako bi se na pravilan način sačuvao neki zapis. Jedino što je ispravno napravljeno u tome pogledu je zaključak da je isplativije veći broj zapisa istog formata u isto vrijeme migrirati i da se to preporučuje uz nadgledanje procesa te planiranje strategija od samog početka. Iako nijedan od ovih modela nije sam po sebi dovoljan u smislu potpune iskoristivosti i pružanja usluge za sve vrste institucija i organizacija, razlika u prirodi modela može poslužiti kao temelj za buduća spajanja ili korištenja više modela istovremeno. Generički modeli se mogu lakše iskoristiti u većini institucija i organizacija i može poslužiti kao podrška ili početna točka stvaranja novih modela. Uz to, specifičniji modeli mogu uzeti generičke te primijeniti dijelove svoje cjeline na njih na mjestima gdje je to potrebno. Takav je slučaj i s modelima koji su analizirani u ovome radu. CMDP je uzeo ostala tri modela kao predloške i temeljne modele svog projekta te ih razradio uviđajući pogreške prijašnjih i nalazeći rješenja za njihove propuste. Na taj način je moguće i stvoriti model koji će s vremenom uspjeti nadmašiti ostale i koji će se moći koristiti kao standard digitalnog očuvanja i izračunavanja troškova.
  • 23. 23 7. Zaključak Digitalno očuvanje jedno je od procesa koji postaju sve važniji za upravljanje zapisima, poslovanje, buduće projekte i istraživanja i slično. Rijetko tko danas nije upućen u same karakteristike takvih aktivnosti i to pokazuje važnost i korisnost takvog očuvanja. Iako se danas očekuje da zapisi nastaju u digitalnom obliku i da je problem jedino u određivanju dokumenata koji se moraju čuvati i u praktičnom dijelu čuvanja, ostaje još veliki broj zapisa koje je potrebno očuvati, a neće se moći digitalizirati tako brzo. Samim time je potrebno uočiti probleme koji postoje, načine na koje se ti procesi mogu ubrzati te što efikasnije obaviti. Nastanak digitalnih zapisa, posebice u određenom formatu, uvelike olakšava posao i financijski je isplativije rješenje od drugih mogućnosti poput migracija, konverzije i slično. Modeli troškova tu pomažu pri pronalasku najboljih rješenja digitalnog očuvanja. Financijska isplativost jedna je od glavnih varijabli koje treba uzeti u obzir prilikom planiranja bilo koje vrste očuvanja. Pravi model isto mora biti uzet u obzir i to ovisi o vrsti organizacije ili institucije koja ga uzima te o njenim potrebama i zahtjevima. Osim izračuna troškova, izračun koristi u kombinaciji s troškovima daje još bolji uvid u mogućnosti koje korisnik ima. Iako ne postoji standardni model koji bi mogao uvijek biti upotrjebljen, postoje naznake stvaranja takvog modela ukoliko se dovoljno dobro analiziraju i usporede svi dostupni modeli. No, danas je to još nemoguće zbog raznolikosti načina upravljanja zapisima i općenito financijama institucija. Nemoguće je i zbog razlika u razvoju tehnologije između različitih društava, različitim standardima koje prate te zbog različito definiranih prioriteta. Ukoliko se sve to nadiđe i ukoliko se pojavi mogućnost takvog nečega, prvi korak bi trebala biti spomenuta analiza i usporedba. Svaki od modela nudi različite ideje i praktične savjete i njihovo uklapanje u jedan jedinstveni model moglo bi stvoriti nove temelje za stvaranje pravog standardiziranog modela za sve djelatnosti.
  • 24. 24 LITERATURA Bøgvad Kejser, U., Bo Nielsen, A., Thirifays, The Cost of Digital Preservation: Project Report v.10, Danish national Archives (DNA) and the Royal Danish Library in Denmark, 2009. URL: https://docs.google.com/viewer?a=v&pid=sites&srcid=Y29zdG1vZGVsZm9yZGlnaX RhbHByZXNlcnZhdGlvbi5ka3xwdWJ8Z3g6NWI5Y2YxNWI3YjBlNzczNg (25.8.2014.) Hrvatski zavod za norme, Pojmovi, nazivi i definicije, URL: http://www.hzn.hr/default.aspx?id=89 (25.8.2014.) Lifecycle Information For E-Literature (LIFE3), University College London (UCL) and British Library (BL), 2010. URL: http://www.life.ac.uk/3/docs/life3_report.pdf (25.8.2014.) Reference Model for an Open Archival Information System (OAIS), Magenta Book (CCSDS 650.0-M-2), Consultative Committee for Space Data Systems, NASA, Washington, DC, SAD, lipanj 2012. URL: http://public.ccsds.org/publications/archive/650x0m2.pdf (26.8.2014.) Slats, J., Verdegem, R. Cost Model for Digital Preservation (T-CMDP), National Archief of the Netherlands, 2005. URL: http://dlmforum.typepad.com/Paper_RemcoVerdegem_and_JS_CostModelfordigital preservation.pdf (25.8.2014.) User Guide for Keeping Research Data Safe: Assessing Costs/Benefits of Research Data Management, Preservation and Re-use, Charled Beagrie Limited, 2011. URL: http://www.beagrie.com/static/resource/KeepingResearchDataSafe_UserGuide_v2.pdf (25.8.2014.)
  • 25. 25 Sažetak Budući da se nalazimo u dobu informacija u kojemu je potrebno imati ih na raspolaganju i uvijek dostupne, šire se okviri i područja koja se bave njihovim upravljanjem. Njihova važnost i učestalost uporabe diktira osmišljavanje novih načina stvaranja, dobavljanja, obrade te očuvanja gradiva. Digitalno očuvanje isto ide u tome pravcu te polako ali sigurno preuzima ulogu i bit cijelog procesa, a sama činjenica da je to dio današnje svakodnevice nam pokazuje koliko se mora uložiti u izradu funkcionalnih i isplativih modela, sustava i aktivnosti. Standardizacija kao proces kojime se poboljšavaju navedene prakse kako bi se mogle primijeniti na institucijama različitih karaktera, shvaćena je kao bitna karika unutar unaprjeđenja poslovanja, ponajviše na području digitalnog očuvanja. U ovome radu su analizirani i uspoređeni modeli izračuna troškova dugoročnog digitalnog očuvanja T-CMDP, LIFE3, KRDS i CMDP kako bi se mogla započeti rasprava o samoj mogućnost standardizacije te optimizacije procesa očuvanja. Ključne riječi: digitalno očuvanje, standardizacija, T-CMDP, LIFE3, KRDS, CMDP Analysis of the cost models of digital preservation and the possibility of standardization Summary We live in an age where information is available to almost everyone and it is expected to have access to it at all times. This fact shows the importance and frequency of their use which dictates the devising of the new ways of creating, retrieving, processing and preservation of archival materials. In accordance to this, the area of expertise of digital preservation seems to grow and it's becoming the main subject and interest in the area of research. Since long term digital preservation is inevitable part of today's everyday life, it is important to keep in mind the significance of the whole process of investing in the development of functional and cost-effective models, systems and activities. Standardization as a process that improves the practices and logistics of institutions of different nature is understood as an important link in the improvement of the business, particularly in the area of digital preservation. This thesis analyses and compares the models for calculating the cost of long term digital preservation: T-CMDP, LIFE3, KRDS and CMDP in order to start a
  • 26. 26 discussion about the possibility of standardization and optimization of processes of preservation. Keywords: digital preservation, standardization, T-CMDP, LIFE3, KRDS, CMDP