Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

20070914 Van Schie Henny

1,305 views

Published on

EAD in de praktijk

Published in: Technology
  • Be the first to comment

20070914 Van Schie Henny

  1. 1. EAD in de praktijk
  2. 2. Wat is EAD ? <ul><li>Encoded Archival Description </li></ul><ul><li>nonproprietary encoding standard for machine-readable finding aids </li></ul><ul><li>in XML -formaat </li></ul><ul><li>gebaseerd op ISAD(G) </li></ul><ul><li>vanaf 199 8 </li></ul>
  3. 3. Toegangen Nationaal Archief
  4. 4. DTNA: Digitalisering Toegangen Nat. Archief <ul><li>Productie Beheer Publicatie </li></ul>synchronisatiemodule stylesheets editor strategieën en tools
  5. 5. Werkvoorraad: ca. 6000 bestaande toegangen
  6. 6. Onderdelen van een toegang
  7. 7. Onderdelen <ul><li><eadheader> “titelblad”: ABS/Archeion </li></ul><ul><li><archdesc> </li></ul><ul><ul><li><did> “archiefgegevens”: ABS/Archeion </li></ul></ul><ul><ul><li><descgrp> “inleiding” </li></ul></ul><ul><ul><li><dsc> “eigenlijke inventaris” </li></ul></ul>
  8. 8. <eadheader> voor titelblad
  9. 9. <archdesc> voor archiefgegevens
  10. 10. Kengetallen archiefgegevens / titelblad <ul><li>voorwerk: 2 uur </li></ul><ul><li>export: 1 uur </li></ul><ul><li>voor het gehele bestand van 6000 toegangen </li></ul>
  11. 11. Digitaliseren van de inleidingen <ul><li>digitale bestanden (WordPerfect, Word) </li></ul><ul><li>papieren toegangen </li></ul><ul><ul><li>overtypen </li></ul></ul><ul><ul><li>OCR </li></ul></ul><ul><ul><li>spellingscontrole </li></ul></ul><ul><ul><li>oude spelling </li></ul></ul><ul><li>lijsten en tabellen </li></ul>
  12. 12. ISAD(G): elements of description <ul><li>Identity statement area </li></ul><ul><li>Context area </li></ul><ul><li>Content and structure area </li></ul><ul><li>Conditions of access and use area </li></ul><ul><li>Allied materials area </li></ul><ul><li>Notes area </li></ul><ul><li>Description control area </li></ul>
  13. 13. citaat EAD tag library <ul><li>When converting finding aids to an ideal EAD markup , some shifting of text or addition of data may be necessary to conform to the DTD's sequencing of elements and the consignment of certain elements to specific settings. </li></ul>
  14. 14. Inleiding archief Dumas
  15. 15. pre-<dsc> formulier voor de “inleiding”
  16. 16. Kengetallen inleiding <ul><li>kaal pre-<dsc> formulier <15 minuten </li></ul><ul><li>abstract 5 – 30 minuten </li></ul><ul><li>inleiding opknippen >15 minuten – 2 dagen </li></ul><ul><li>conform ISAD(G)-elementen </li></ul>
  17. 17. Digitaliseren van de eigenlijke inventarislijsten <ul><li>4 strategieën: </li></ul><ul><ul><li>digitale bestanden (WordPerfect, Word) </li></ul></ul><ul><ul><li>papieren toegangen direct in EAD-XML overtypen </li></ul></ul><ul><ul><li>papieren toegangen overtypen in Word </li></ul></ul><ul><ul><li>OCR (zelden) </li></ul></ul>
  18. 18. Gedrukt in tabelvorm (1867)
  19. 19. Getypt: per doos beschreven (1953)
  20. 20. Getypt: door / map-nummering (1974)
  21. 21. Geprint: vanuit Word en WordPerfect (2002)
  22. 22. Aanpak digitale bestanden (legacy) (strategie 1) <ul><li>maken van scripts </li></ul><ul><li>afsplitsen eigenlijke inventarislijsten </li></ul><ul><li>scripten inventarislijsten tot EAD-XML-bestanden </li></ul><ul><li>samenvoegen met “inleidingen” </li></ul><ul><li>valideren en corrigeren EAD-XML-bestanden </li></ul>
  23. 23. Probleemgevallen bij scripten (strategie 1)
  24. 24. Aanpak papieren toegangen (strategie 2 – 4) <ul><li>direct overtypen in XML </li></ul><ul><ul><li>na precoderen 900 woorden per uur </li></ul></ul><ul><li>= 35 à 400 inv.nrs. </li></ul><ul><li>overtypen (tab separated) 1075 woorden per uur </li></ul><ul><li>= 40 à 450 inv.nrs. </li></ul><ul><li>OCR </li></ul><ul><ul><li>met spellingcontrole 725 woorden per uur </li></ul></ul><ul><li>= 25 à 320 inv.nrs. </li></ul>
  25. 25. Direct in EAD-XML (eerst precoderen) (strategie 2)
  26. 26. Overtypen TAB separated (stategie 3)
  27. 27. Kengetallen (direct in EAD-XML) (strategie 1) <ul><li>Precoderen 1 uur - 3 dagen </li></ul><ul><li>Controle op zicht layout en spelling; </li></ul><ul><li>1 uur à 2 dagen </li></ul><ul><li>Technische controle 5 minuten – 1 dag </li></ul>
  28. 28. Kengetallen: legacy en tab separated (strategie 2 – 3) <ul><li>conversie en merging </li></ul><ul><ul><li>Word-toegangen </li></ul></ul><ul><ul><ul><li>(legacy) ettelijke uren per batch </li></ul></ul></ul><ul><ul><li>tab separated < 30 minuten per batch </li></ul></ul><ul><li>correctie </li></ul><ul><ul><li>Word-toegangen </li></ul></ul><ul><ul><ul><li>(legacy) ettelijke uren per toegang </li></ul></ul></ul><ul><ul><li>tab separated 15 minuten à 2 uur </li></ul></ul>
  29. 29. Aanbevelingen <ul><li>bestaande Word-toegangen omzetten (1): </li></ul><ul><ul><li>legacy bestanden niet doen ! </li></ul></ul><ul><li>precoderen als A2A (2) Procrustes-gevallen </li></ul><ul><li>tab separated (3) ’t minst bewerkelijk </li></ul>
  30. 30. Stand van zaken <ul><li>1970 toegangen online </li></ul><ul><li>oftewel 32% van de totale werkvoorraad </li></ul><ul><li>voornamelijk grote toegangen </li></ul><ul><li>1.227.000 inv.nrs. </li></ul><ul><li>oftewel 51% van de totale werkvoorraad </li></ul><ul><li>prioriteiten: </li></ul><ul><ul><li>meest geraadpleegd archieven eerst </li></ul></ul><ul><ul><li>aansluiting bij lopende projecten </li></ul></ul>
  31. 31. Conclusies <ul><li>Conversie kan relatief snel, </li></ul><ul><li>zelfs indien men al hoge standaarden wil voldoen </li></ul><ul><li>Tempo bepaald door: </li></ul><ul><ul><li>omvang inventaris </li></ul></ul><ul><ul><li>afwijkingen van de norm </li></ul></ul><ul><li>Afwijkingen relatief zeldzaam </li></ul><ul><li>Niettemin: conversie is kostbaar (tijd !) </li></ul>
  32. 32. Presentatie <ul><li>Stylesheets nodig voor presentatie </li></ul><ul><ul><li>html </li></ul></ul><ul><ul><li>pdf </li></ul></ul><ul><li>Stylesheets baseren zich op richtlijnen </li></ul>
  33. 33. XSLT voor html
  34. 34. XSLT voor pdf
  35. 35. Vragen / informatie <ul><li>[email_address] </li></ul><ul><li>070 – 331 5439 </li></ul><ul><li>projectleider </li></ul><ul><li>h enny.van.schie @nationaalarchief.nl </li></ul><ul><li>070 – 331 5548 </li></ul><ul><li>[email_address] </li></ul>

×