EAD in de praktijk
Wat is EAD ? Encoded Archival Description nonproprietary encoding standard   for machine-readable finding aids in  XML -formaat gebaseerd op ISAD(G) vanaf 199 8
Toegangen Nationaal Archief
DTNA: Digitalisering Toegangen Nat. Archief Productie  Beheer Publicatie synchronisatiemodule stylesheets editor strategieën en tools
Werkvoorraad: ca. 6000 bestaande toegangen
Onderdelen van een toegang
Onderdelen <eadheader> “titelblad”: ABS/Archeion <archdesc> <did>  “archiefgegevens”: ABS/Archeion <descgrp>  “inleiding” <dsc> “eigenlijke inventaris”
<eadheader> voor titelblad
<archdesc> voor archiefgegevens
Kengetallen archiefgegevens / titelblad voorwerk:  2 uur  export:  1 uur  voor het gehele bestand van 6000 toegangen
Digitaliseren van de inleidingen digitale bestanden (WordPerfect, Word) papieren toegangen overtypen OCR spellingscontrole oude spelling lijsten en tabellen
ISAD(G): elements of description Identity statement area Context area Content and structure area Conditions of access and use area Allied materials area Notes area Description control area
citaat EAD tag library When converting finding aids  to an ideal EAD markup , some shifting of text or addition of data may be necessary to conform to the DTD's sequencing of elements and the consignment of certain elements to specific settings.
Inleiding archief Dumas
pre-<dsc> formulier  voor de “inleiding”
Kengetallen inleiding kaal pre-<dsc> formulier <15 minuten abstract 5 – 30 minuten inleiding opknippen >15 minuten – 2 dagen conform ISAD(G)-elementen
Digitaliseren van de eigenlijke inventarislijsten 4 strategieën: digitale bestanden (WordPerfect, Word) papieren toegangen direct in EAD-XML overtypen papieren toegangen overtypen in Word OCR (zelden)
Gedrukt in tabelvorm (1867)
Getypt: per doos beschreven (1953)
Getypt: door / map-nummering (1974)
Geprint: vanuit Word en WordPerfect (2002)
Aanpak digitale bestanden (legacy)  (strategie 1) maken van scripts afsplitsen eigenlijke inventarislijsten scripten inventarislijsten tot EAD-XML-bestanden samenvoegen met “inleidingen” valideren en corrigeren EAD-XML-bestanden
Probleemgevallen bij scripten  (strategie 1)
Aanpak papieren toegangen  (strategie 2 – 4) direct overtypen in XML na precoderen 900 woorden per uur = 35 à 400 inv.nrs. overtypen (tab separated) 1075 woorden per uur = 40 à 450 inv.nrs. OCR met spellingcontrole 725 woorden per uur = 25 à 320 inv.nrs.
Direct in EAD-XML (eerst precoderen)  (strategie 2)
Overtypen TAB separated  (stategie 3)
Kengetallen (direct in EAD-XML)  (strategie 1) Precoderen 1 uur - 3 dagen Controle  op zicht layout en  spelling; 1 uur à 2 dagen Technische  controle 5 minuten – 1 dag
Kengetallen: legacy  en  tab separated  (strategie 2 – 3) conversie en merging Word-toegangen (legacy) ettelijke uren per batch tab separated   <  30 minuten per batch correctie Word-toegangen (legacy) ettelijke uren per toegang tab separated 15 minuten à 2 uur
Aanbevelingen bestaande Word-toegangen omzetten (1): legacy bestanden niet doen ! precoderen als A2A (2) Procrustes-gevallen tab separated  (3) ’t minst bewerkelijk
Stand van zaken 1970 toegangen online oftewel 32% van de totale werkvoorraad voornamelijk grote toegangen 1.227.000 inv.nrs. oftewel 51% van de totale werkvoorraad prioriteiten: meest geraadpleegd archieven eerst aansluiting bij lopende projecten
Conclusies Conversie kan relatief snel, zelfs indien men al hoge standaarden wil voldoen Tempo bepaald door: omvang inventaris afwijkingen van de norm Afwijkingen relatief zeldzaam Niettemin: conversie is kostbaar (tijd !)
Presentatie Stylesheets nodig voor presentatie html pdf Stylesheets baseren zich op richtlijnen
XSLT voor html
XSLT voor pdf
Vragen / informatie [email_address] 070 – 331 5439 projectleider h enny.van.schie @nationaalarchief.nl 070 – 331 5548 [email_address]

20070914 Van Schie Henny

  • 1.
    EAD in depraktijk
  • 2.
    Wat is EAD? Encoded Archival Description nonproprietary encoding standard for machine-readable finding aids in XML -formaat gebaseerd op ISAD(G) vanaf 199 8
  • 3.
  • 4.
    DTNA: Digitalisering ToegangenNat. Archief Productie Beheer Publicatie synchronisatiemodule stylesheets editor strategieën en tools
  • 5.
    Werkvoorraad: ca. 6000bestaande toegangen
  • 6.
  • 7.
    Onderdelen <eadheader> “titelblad”:ABS/Archeion <archdesc> <did> “archiefgegevens”: ABS/Archeion <descgrp> “inleiding” <dsc> “eigenlijke inventaris”
  • 8.
  • 9.
  • 10.
    Kengetallen archiefgegevens /titelblad voorwerk: 2 uur export: 1 uur voor het gehele bestand van 6000 toegangen
  • 11.
    Digitaliseren van deinleidingen digitale bestanden (WordPerfect, Word) papieren toegangen overtypen OCR spellingscontrole oude spelling lijsten en tabellen
  • 12.
    ISAD(G): elements ofdescription Identity statement area Context area Content and structure area Conditions of access and use area Allied materials area Notes area Description control area
  • 13.
    citaat EAD taglibrary When converting finding aids to an ideal EAD markup , some shifting of text or addition of data may be necessary to conform to the DTD's sequencing of elements and the consignment of certain elements to specific settings.
  • 14.
  • 15.
    pre-<dsc> formulier voor de “inleiding”
  • 16.
    Kengetallen inleiding kaalpre-<dsc> formulier <15 minuten abstract 5 – 30 minuten inleiding opknippen >15 minuten – 2 dagen conform ISAD(G)-elementen
  • 17.
    Digitaliseren van deeigenlijke inventarislijsten 4 strategieën: digitale bestanden (WordPerfect, Word) papieren toegangen direct in EAD-XML overtypen papieren toegangen overtypen in Word OCR (zelden)
  • 18.
  • 19.
    Getypt: per doosbeschreven (1953)
  • 20.
    Getypt: door /map-nummering (1974)
  • 21.
    Geprint: vanuit Worden WordPerfect (2002)
  • 22.
    Aanpak digitale bestanden(legacy) (strategie 1) maken van scripts afsplitsen eigenlijke inventarislijsten scripten inventarislijsten tot EAD-XML-bestanden samenvoegen met “inleidingen” valideren en corrigeren EAD-XML-bestanden
  • 23.
  • 24.
    Aanpak papieren toegangen (strategie 2 – 4) direct overtypen in XML na precoderen 900 woorden per uur = 35 à 400 inv.nrs. overtypen (tab separated) 1075 woorden per uur = 40 à 450 inv.nrs. OCR met spellingcontrole 725 woorden per uur = 25 à 320 inv.nrs.
  • 25.
    Direct in EAD-XML(eerst precoderen) (strategie 2)
  • 26.
  • 27.
    Kengetallen (direct inEAD-XML) (strategie 1) Precoderen 1 uur - 3 dagen Controle op zicht layout en spelling; 1 uur à 2 dagen Technische controle 5 minuten – 1 dag
  • 28.
    Kengetallen: legacy en tab separated (strategie 2 – 3) conversie en merging Word-toegangen (legacy) ettelijke uren per batch tab separated < 30 minuten per batch correctie Word-toegangen (legacy) ettelijke uren per toegang tab separated 15 minuten à 2 uur
  • 29.
    Aanbevelingen bestaande Word-toegangenomzetten (1): legacy bestanden niet doen ! precoderen als A2A (2) Procrustes-gevallen tab separated (3) ’t minst bewerkelijk
  • 30.
    Stand van zaken1970 toegangen online oftewel 32% van de totale werkvoorraad voornamelijk grote toegangen 1.227.000 inv.nrs. oftewel 51% van de totale werkvoorraad prioriteiten: meest geraadpleegd archieven eerst aansluiting bij lopende projecten
  • 31.
    Conclusies Conversie kanrelatief snel, zelfs indien men al hoge standaarden wil voldoen Tempo bepaald door: omvang inventaris afwijkingen van de norm Afwijkingen relatief zeldzaam Niettemin: conversie is kostbaar (tijd !)
  • 32.
    Presentatie Stylesheets nodigvoor presentatie html pdf Stylesheets baseren zich op richtlijnen
  • 33.
  • 34.
  • 35.
    Vragen / informatie[email_address] 070 – 331 5439 projectleider h enny.van.schie @nationaalarchief.nl 070 – 331 5548 [email_address]