A digitális archiválás szabályai  Krasznay Csaba Kancellár.hu Kft.
Tartalom A digitális archiválás felhasználási területei A hosszútávú digitális megőrzéssel kapcsolatos igények A digitális archiválással kapcsolatos problémák A hiteles elektronikus archiválás Lehetőségek a hiteles elektronikus archiválásra Problémák a hiteles elektronikus archiválással
Felhasználási területek A digitális archiválásra az élet számos területén szükség van: E-közigazgatás: G2B és G2G relációkban E-kereskedelem: elsősorban a jogi szabályozások miatt, pl. e-számla Oktatás és kutatás: gondoljunk csak az elektronikus tanulmányi rendszerekre! Digitális könyvtárak: talán a legnagyobb kihívás a hagyományos könyvtárak „átalakítása”. E-örökség: a nem hagyományos tartalom archiválása, pl. a WWW tartalma, NAVA Személyes archívumok: lehet, hogy a jelen nagy költőinek levelezése e-mailben folyik?
Igények a hosszútávú digitális megőrzésre Biztosítsuk, hogy minden megőrzött dokumentumból egy másolat elérhető addig, amíg az valakinek érdekes lehet! Biztosítsuk, hogy a felhatalmazott felhasználó megtalálja és felhasználhassa a megőrzött dokumentumot úgy, ahogy azt a dokumentum készítője elképzelte, kiküszöbölve a harmadik személyek (pl. archiváló) által okozott hibákat! Biztosítsuk, hogy a felhasználónak legyen elég információja eldönteni azt, hogy a megkapott információ elég megbízható-e a szándékolt felhasználáshoz!
Igények a hosszútávú digitális megőrzésre Rejtsük el a technológiai komplexitást a végfelhasználók elől! Amikor csak lehetséges, az emberi erőforrást automatizmusokkal helyettesítsük! Adjunk lehetőséget a szerzőnek ahhoz, hogy az információt „becsomagolhassa”, így megkönnyítve a későbbi felhasználást!
A digitális archiválással kapcsolatos problémák Forrás: DELOS – Network of Excellence on Digital Libraries  Megőrzési stratégiák: Tárházak: Nem lehet tudni, hogy a jelenlegi tárházmodellek közül melyik képes hosszú távon megőrizni az információt. Hogyan lehet a megjelenítő szoftvereket tárolni? Hogyan lehet a különböző formátumokat megjeleníteni? Hogyan lehet a régi perifériákkal kommunikálni? Archiváló médiák: van olyan olcsó, hosszú távon használható, hatékony és ellenőrizhető média, ami az archiváláshoz megfelelő?
A digitális archiválással kapcsolatos problémák Adatmentés: hogyan lehet kimenteni az elavult adattárolókról az adatokat? A funkcionalitás és viselkedés dokumentálása: honnan fogja a jövő felhasználója tudni, hogy az általa látott entitás viselkedése miben tér el az archiválás idején meglévő viselkedéstől? Amortizáció: mennyi ideig kell megőrizni az adatot, illetve a megjelenítő környezetet? Az intellektuális tőke megőrzése: milyen körülmények között jött létre az adat?
A digitális archiválással kapcsolatos problémák A megőrzési eljárások újragondolása: A megőrzési eljárások modellezése: hogyan lehet már tervezéskor beépíteni a rendszerekbe vagy adatokba a hosszútávúságot? Az eljárások automatizálása: hogyan érdemes emberi erő helyett automatizált eljárásokat használni? A megbízhatóság és információminőség detektálása: hogyan garantálható az adat sértetlensége és hitelessége, ami alátámasztja a későbbi felhasználók számára az adat minőségét? Skálázhatóság: jelenleg kis és kevés adattal teszteljük az archiválást. Mi lesz sok és nagy adat esetén?
A digitális archiválással kapcsolatos problémák A gyűjtés teljessége és anomáliadetektálás: hogyan lehet meggyőződni egy gyűjtemény teljességéről? Mi a különbség egy hiba és egy szándékosan bevitt „gondolati csavar” között? Elosztott és grid tárolás: milyen hatással van az archiválásra az, ha elosztottan tároljuk? Archiváló rendszerek és technológiák A digitális entitások formátuma: Hogyan vágjunk rendet a különböző formátumok között? Komplex és dinamikus entitások kezelése: hogyan lehet a folyamatosan változó dolgokat eltárolni?
A digitális archiválással kapcsolatos problémák Automatizált metaadat készítés: hogyan lehet erőforrás-gazdaságosan elkészíteni az elengedhetetlenül fontos metaadatokat? A metaadatok hosszútávú életképessége: mennyire lesz értékes a jövőben a ma létrehozott metaadat? Többnyelvűség: hogyan kezeljük az adatok, metaadatok, alkalmazások, dokumentációk és interfészek többnyelvűségét? Elfogadható veszteség: mekkora tartalmi vagy kontextusbeli veszteséget engedhetünk meg? Konvertálás: hogyan lehet új formátumba konvertálni a már archivált tartalmat?
A hiteles elektronikus archiválás Az egyik legizgalmasabb téma napjainkban a hiteles elektronikus archiválás. Enélkül nincs elektronikus közigazgatás, elektronikus számlázás. Ráadásul van rá törvényi szabályozás, és több hivatkozás is különböző jogszabályokban. A hiteles elektronikus archiválás megvalósítására az egyik megoldás szerint az elektronikus aláírást kell használni. Ilyen megoldást használnak az archiválási szolgáltatók is.
A hiteles elektronikus archiválás Az archiválási szolgáltató segítségével biztosítható: A letagadhatatlanság megőrzése, A sértetlenség megőrzése, A rendelkezésre állás biztosítása, Megfelelés a magyar törvényeknek, Gazdaságosság nagy mennyiségű okirat archiválásánál, Hiteles konverzió, Adatok és titkok védelme, Emelt szintű környezeti biztonság, stb.
Lehetőségek a hiteles elektronikus archiválásra Az archiválási szolgáltatók elsősorban elektronikusan aláírt dokumentumok tárolásával foglalkoznak. Ennek során biztosítani kell, az aláírt dokumentum érvényességét. Az érvényességet három dolog határozza meg: a tanúsítványlánc egyik eleme sem kompromittálódott, a kriptográfiai primitívek megfelelően erősek, szervezeti kérdések, pl. a tanúsítványt nem vonták vissza. Az aláírás időpontja után a lehető leghamarabb valamilyen hiteles, időpontot meghatározó adatot kell szerezni (pl. időbélyegző). A „kivárási idő” után minél előbb meg kell szerezni a visszavonási információkat.
Problémák a hosszútávú hiteles archiválással Nem érhető el a teljes tanúsítványlánc. Elképzelhető, hogy az elektronikusan aláírt dokumentum életciklusa alatt megszűnik a végfelhasználói vagy a CA tanúsítványok elérhetősége. Ez lehetetlenné teszi az aláírás hitelességének ellenőrzését. Megoldás: tároljuk a teljes tanúsítási láncot az XML struktúrában.
Problémák a hosszútávú hiteles archiválással Egy olyan visszavonási listát kell szerezni, ami az aláírás időpontja után, de még a tanúsítvány lejárta előtt lett kiadva. A lejárat után kiadott visszavonási listákban már nem szerepel a visszavont tanúsítvány. Ez a végfelhasználói tanúsítványra viszonylag egyszerűen megoldható, de a CA visszavonási listáját van úgy, hogy csak fél évente adják ki. A teljes visszavonási lánc felépítése, így a teljesen hiteles elektronikus aláírás lehet, hogy csak fél év alatt építhető fel. Ráadásul minden visszavonási információt tárolni kell az XML struktúrában, ami adott esetben aránytalanul nagy állományt eredményezhet. Megoldás: OCSP válasz
Problémák a hosszútávú hiteles archiválással Az aláírási szabályzat szükséges egy aláírás érvényességének eldöntéséhez szervezeti szempontból. Erre azonban csak (jó esetben) egy link mutat, így évekkel később nehézkes megszerezni. Ráadásul ennek szentelik a legkisebb figyelmet, holott ezzel lehetnek a legnagyobb visszaélések. Megoldás: az aláírás időpontjában aktuális aláírási szabályzat tárolása (nem megoldott).
Összefoglalás Az elektronikus archiválás az egyik legizgalmasabb, legfontosabb és legkomplexebb informatikai kutatási téma napjainkban. A problémák viszonylag jól ismertek. Egyre több megoldás létezik, de évtizedek kellenek, mire kiderül, hogy az adott megoldás életképes-e. Digitálisan archiválni tehát csak óvatosan szabad, még jó ideig fenntartva a párhuzamos megoldásokat is (sajnos)!
Köszönöm szépen! E-mail cím:  krasznay.csaba @ kancellar.hu Cégünk weboldala:  www.kancellar.hu Az előadás letölthető:  www.krasznay.hu

Rules of digital archiving (in Hungarian)

  • 1.
    A digitális archiválásszabályai Krasznay Csaba Kancellár.hu Kft.
  • 2.
    Tartalom A digitálisarchiválás felhasználási területei A hosszútávú digitális megőrzéssel kapcsolatos igények A digitális archiválással kapcsolatos problémák A hiteles elektronikus archiválás Lehetőségek a hiteles elektronikus archiválásra Problémák a hiteles elektronikus archiválással
  • 3.
    Felhasználási területek Adigitális archiválásra az élet számos területén szükség van: E-közigazgatás: G2B és G2G relációkban E-kereskedelem: elsősorban a jogi szabályozások miatt, pl. e-számla Oktatás és kutatás: gondoljunk csak az elektronikus tanulmányi rendszerekre! Digitális könyvtárak: talán a legnagyobb kihívás a hagyományos könyvtárak „átalakítása”. E-örökség: a nem hagyományos tartalom archiválása, pl. a WWW tartalma, NAVA Személyes archívumok: lehet, hogy a jelen nagy költőinek levelezése e-mailben folyik?
  • 4.
    Igények a hosszútávúdigitális megőrzésre Biztosítsuk, hogy minden megőrzött dokumentumból egy másolat elérhető addig, amíg az valakinek érdekes lehet! Biztosítsuk, hogy a felhatalmazott felhasználó megtalálja és felhasználhassa a megőrzött dokumentumot úgy, ahogy azt a dokumentum készítője elképzelte, kiküszöbölve a harmadik személyek (pl. archiváló) által okozott hibákat! Biztosítsuk, hogy a felhasználónak legyen elég információja eldönteni azt, hogy a megkapott információ elég megbízható-e a szándékolt felhasználáshoz!
  • 5.
    Igények a hosszútávúdigitális megőrzésre Rejtsük el a technológiai komplexitást a végfelhasználók elől! Amikor csak lehetséges, az emberi erőforrást automatizmusokkal helyettesítsük! Adjunk lehetőséget a szerzőnek ahhoz, hogy az információt „becsomagolhassa”, így megkönnyítve a későbbi felhasználást!
  • 6.
    A digitális archiválássalkapcsolatos problémák Forrás: DELOS – Network of Excellence on Digital Libraries Megőrzési stratégiák: Tárházak: Nem lehet tudni, hogy a jelenlegi tárházmodellek közül melyik képes hosszú távon megőrizni az információt. Hogyan lehet a megjelenítő szoftvereket tárolni? Hogyan lehet a különböző formátumokat megjeleníteni? Hogyan lehet a régi perifériákkal kommunikálni? Archiváló médiák: van olyan olcsó, hosszú távon használható, hatékony és ellenőrizhető média, ami az archiváláshoz megfelelő?
  • 7.
    A digitális archiválássalkapcsolatos problémák Adatmentés: hogyan lehet kimenteni az elavult adattárolókról az adatokat? A funkcionalitás és viselkedés dokumentálása: honnan fogja a jövő felhasználója tudni, hogy az általa látott entitás viselkedése miben tér el az archiválás idején meglévő viselkedéstől? Amortizáció: mennyi ideig kell megőrizni az adatot, illetve a megjelenítő környezetet? Az intellektuális tőke megőrzése: milyen körülmények között jött létre az adat?
  • 8.
    A digitális archiválássalkapcsolatos problémák A megőrzési eljárások újragondolása: A megőrzési eljárások modellezése: hogyan lehet már tervezéskor beépíteni a rendszerekbe vagy adatokba a hosszútávúságot? Az eljárások automatizálása: hogyan érdemes emberi erő helyett automatizált eljárásokat használni? A megbízhatóság és információminőség detektálása: hogyan garantálható az adat sértetlensége és hitelessége, ami alátámasztja a későbbi felhasználók számára az adat minőségét? Skálázhatóság: jelenleg kis és kevés adattal teszteljük az archiválást. Mi lesz sok és nagy adat esetén?
  • 9.
    A digitális archiválássalkapcsolatos problémák A gyűjtés teljessége és anomáliadetektálás: hogyan lehet meggyőződni egy gyűjtemény teljességéről? Mi a különbség egy hiba és egy szándékosan bevitt „gondolati csavar” között? Elosztott és grid tárolás: milyen hatással van az archiválásra az, ha elosztottan tároljuk? Archiváló rendszerek és technológiák A digitális entitások formátuma: Hogyan vágjunk rendet a különböző formátumok között? Komplex és dinamikus entitások kezelése: hogyan lehet a folyamatosan változó dolgokat eltárolni?
  • 10.
    A digitális archiválássalkapcsolatos problémák Automatizált metaadat készítés: hogyan lehet erőforrás-gazdaságosan elkészíteni az elengedhetetlenül fontos metaadatokat? A metaadatok hosszútávú életképessége: mennyire lesz értékes a jövőben a ma létrehozott metaadat? Többnyelvűség: hogyan kezeljük az adatok, metaadatok, alkalmazások, dokumentációk és interfészek többnyelvűségét? Elfogadható veszteség: mekkora tartalmi vagy kontextusbeli veszteséget engedhetünk meg? Konvertálás: hogyan lehet új formátumba konvertálni a már archivált tartalmat?
  • 11.
    A hiteles elektronikusarchiválás Az egyik legizgalmasabb téma napjainkban a hiteles elektronikus archiválás. Enélkül nincs elektronikus közigazgatás, elektronikus számlázás. Ráadásul van rá törvényi szabályozás, és több hivatkozás is különböző jogszabályokban. A hiteles elektronikus archiválás megvalósítására az egyik megoldás szerint az elektronikus aláírást kell használni. Ilyen megoldást használnak az archiválási szolgáltatók is.
  • 12.
    A hiteles elektronikusarchiválás Az archiválási szolgáltató segítségével biztosítható: A letagadhatatlanság megőrzése, A sértetlenség megőrzése, A rendelkezésre állás biztosítása, Megfelelés a magyar törvényeknek, Gazdaságosság nagy mennyiségű okirat archiválásánál, Hiteles konverzió, Adatok és titkok védelme, Emelt szintű környezeti biztonság, stb.
  • 13.
    Lehetőségek a hiteleselektronikus archiválásra Az archiválási szolgáltatók elsősorban elektronikusan aláírt dokumentumok tárolásával foglalkoznak. Ennek során biztosítani kell, az aláírt dokumentum érvényességét. Az érvényességet három dolog határozza meg: a tanúsítványlánc egyik eleme sem kompromittálódott, a kriptográfiai primitívek megfelelően erősek, szervezeti kérdések, pl. a tanúsítványt nem vonták vissza. Az aláírás időpontja után a lehető leghamarabb valamilyen hiteles, időpontot meghatározó adatot kell szerezni (pl. időbélyegző). A „kivárási idő” után minél előbb meg kell szerezni a visszavonási információkat.
  • 14.
    Problémák a hosszútávúhiteles archiválással Nem érhető el a teljes tanúsítványlánc. Elképzelhető, hogy az elektronikusan aláírt dokumentum életciklusa alatt megszűnik a végfelhasználói vagy a CA tanúsítványok elérhetősége. Ez lehetetlenné teszi az aláírás hitelességének ellenőrzését. Megoldás: tároljuk a teljes tanúsítási láncot az XML struktúrában.
  • 15.
    Problémák a hosszútávúhiteles archiválással Egy olyan visszavonási listát kell szerezni, ami az aláírás időpontja után, de még a tanúsítvány lejárta előtt lett kiadva. A lejárat után kiadott visszavonási listákban már nem szerepel a visszavont tanúsítvány. Ez a végfelhasználói tanúsítványra viszonylag egyszerűen megoldható, de a CA visszavonási listáját van úgy, hogy csak fél évente adják ki. A teljes visszavonási lánc felépítése, így a teljesen hiteles elektronikus aláírás lehet, hogy csak fél év alatt építhető fel. Ráadásul minden visszavonási információt tárolni kell az XML struktúrában, ami adott esetben aránytalanul nagy állományt eredményezhet. Megoldás: OCSP válasz
  • 16.
    Problémák a hosszútávúhiteles archiválással Az aláírási szabályzat szükséges egy aláírás érvényességének eldöntéséhez szervezeti szempontból. Erre azonban csak (jó esetben) egy link mutat, így évekkel később nehézkes megszerezni. Ráadásul ennek szentelik a legkisebb figyelmet, holott ezzel lehetnek a legnagyobb visszaélések. Megoldás: az aláírás időpontjában aktuális aláírási szabályzat tárolása (nem megoldott).
  • 17.
    Összefoglalás Az elektronikusarchiválás az egyik legizgalmasabb, legfontosabb és legkomplexebb informatikai kutatási téma napjainkban. A problémák viszonylag jól ismertek. Egyre több megoldás létezik, de évtizedek kellenek, mire kiderül, hogy az adott megoldás életképes-e. Digitálisan archiválni tehát csak óvatosan szabad, még jó ideig fenntartva a párhuzamos megoldásokat is (sajnos)!
  • 18.
    Köszönöm szépen! E-mailcím: krasznay.csaba @ kancellar.hu Cégünk weboldala: www.kancellar.hu Az előadás letölthető: www.krasznay.hu