20070914 Van Schie Henny

1,041 views
965 views

Published on

EAD in de praktijk

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,041
On SlideShare
0
From Embeds
0
Number of Embeds
31
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

20070914 Van Schie Henny

  1. 1. EAD in de praktijk
  2. 2. Wat is EAD ? <ul><li>Encoded Archival Description </li></ul><ul><li>nonproprietary encoding standard for machine-readable finding aids </li></ul><ul><li>in XML -formaat </li></ul><ul><li>gebaseerd op ISAD(G) </li></ul><ul><li>vanaf 199 8 </li></ul>
  3. 3. Toegangen Nationaal Archief
  4. 4. DTNA: Digitalisering Toegangen Nat. Archief <ul><li>Productie Beheer Publicatie </li></ul>synchronisatiemodule stylesheets editor strategieën en tools
  5. 5. Werkvoorraad: ca. 6000 bestaande toegangen
  6. 6. Onderdelen van een toegang
  7. 7. Onderdelen <ul><li><eadheader> “titelblad”: ABS/Archeion </li></ul><ul><li><archdesc> </li></ul><ul><ul><li><did> “archiefgegevens”: ABS/Archeion </li></ul></ul><ul><ul><li><descgrp> “inleiding” </li></ul></ul><ul><ul><li><dsc> “eigenlijke inventaris” </li></ul></ul>
  8. 8. <eadheader> voor titelblad
  9. 9. <archdesc> voor archiefgegevens
  10. 10. Kengetallen archiefgegevens / titelblad <ul><li>voorwerk: 2 uur </li></ul><ul><li>export: 1 uur </li></ul><ul><li>voor het gehele bestand van 6000 toegangen </li></ul>
  11. 11. Digitaliseren van de inleidingen <ul><li>digitale bestanden (WordPerfect, Word) </li></ul><ul><li>papieren toegangen </li></ul><ul><ul><li>overtypen </li></ul></ul><ul><ul><li>OCR </li></ul></ul><ul><ul><li>spellingscontrole </li></ul></ul><ul><ul><li>oude spelling </li></ul></ul><ul><li>lijsten en tabellen </li></ul>
  12. 12. ISAD(G): elements of description <ul><li>Identity statement area </li></ul><ul><li>Context area </li></ul><ul><li>Content and structure area </li></ul><ul><li>Conditions of access and use area </li></ul><ul><li>Allied materials area </li></ul><ul><li>Notes area </li></ul><ul><li>Description control area </li></ul>
  13. 13. citaat EAD tag library <ul><li>When converting finding aids to an ideal EAD markup , some shifting of text or addition of data may be necessary to conform to the DTD's sequencing of elements and the consignment of certain elements to specific settings. </li></ul>
  14. 14. Inleiding archief Dumas
  15. 15. pre-<dsc> formulier voor de “inleiding”
  16. 16. Kengetallen inleiding <ul><li>kaal pre-<dsc> formulier <15 minuten </li></ul><ul><li>abstract 5 – 30 minuten </li></ul><ul><li>inleiding opknippen >15 minuten – 2 dagen </li></ul><ul><li>conform ISAD(G)-elementen </li></ul>
  17. 17. Digitaliseren van de eigenlijke inventarislijsten <ul><li>4 strategieën: </li></ul><ul><ul><li>digitale bestanden (WordPerfect, Word) </li></ul></ul><ul><ul><li>papieren toegangen direct in EAD-XML overtypen </li></ul></ul><ul><ul><li>papieren toegangen overtypen in Word </li></ul></ul><ul><ul><li>OCR (zelden) </li></ul></ul>
  18. 18. Gedrukt in tabelvorm (1867)
  19. 19. Getypt: per doos beschreven (1953)
  20. 20. Getypt: door / map-nummering (1974)
  21. 21. Geprint: vanuit Word en WordPerfect (2002)
  22. 22. Aanpak digitale bestanden (legacy) (strategie 1) <ul><li>maken van scripts </li></ul><ul><li>afsplitsen eigenlijke inventarislijsten </li></ul><ul><li>scripten inventarislijsten tot EAD-XML-bestanden </li></ul><ul><li>samenvoegen met “inleidingen” </li></ul><ul><li>valideren en corrigeren EAD-XML-bestanden </li></ul>
  23. 23. Probleemgevallen bij scripten (strategie 1)
  24. 24. Aanpak papieren toegangen (strategie 2 – 4) <ul><li>direct overtypen in XML </li></ul><ul><ul><li>na precoderen 900 woorden per uur </li></ul></ul><ul><li>= 35 à 400 inv.nrs. </li></ul><ul><li>overtypen (tab separated) 1075 woorden per uur </li></ul><ul><li>= 40 à 450 inv.nrs. </li></ul><ul><li>OCR </li></ul><ul><ul><li>met spellingcontrole 725 woorden per uur </li></ul></ul><ul><li>= 25 à 320 inv.nrs. </li></ul>
  25. 25. Direct in EAD-XML (eerst precoderen) (strategie 2)
  26. 26. Overtypen TAB separated (stategie 3)
  27. 27. Kengetallen (direct in EAD-XML) (strategie 1) <ul><li>Precoderen 1 uur - 3 dagen </li></ul><ul><li>Controle op zicht layout en spelling; </li></ul><ul><li>1 uur à 2 dagen </li></ul><ul><li>Technische controle 5 minuten – 1 dag </li></ul>
  28. 28. Kengetallen: legacy en tab separated (strategie 2 – 3) <ul><li>conversie en merging </li></ul><ul><ul><li>Word-toegangen </li></ul></ul><ul><ul><ul><li>(legacy) ettelijke uren per batch </li></ul></ul></ul><ul><ul><li>tab separated < 30 minuten per batch </li></ul></ul><ul><li>correctie </li></ul><ul><ul><li>Word-toegangen </li></ul></ul><ul><ul><ul><li>(legacy) ettelijke uren per toegang </li></ul></ul></ul><ul><ul><li>tab separated 15 minuten à 2 uur </li></ul></ul>
  29. 29. Aanbevelingen <ul><li>bestaande Word-toegangen omzetten (1): </li></ul><ul><ul><li>legacy bestanden niet doen ! </li></ul></ul><ul><li>precoderen als A2A (2) Procrustes-gevallen </li></ul><ul><li>tab separated (3) ’t minst bewerkelijk </li></ul>
  30. 30. Stand van zaken <ul><li>1970 toegangen online </li></ul><ul><li>oftewel 32% van de totale werkvoorraad </li></ul><ul><li>voornamelijk grote toegangen </li></ul><ul><li>1.227.000 inv.nrs. </li></ul><ul><li>oftewel 51% van de totale werkvoorraad </li></ul><ul><li>prioriteiten: </li></ul><ul><ul><li>meest geraadpleegd archieven eerst </li></ul></ul><ul><ul><li>aansluiting bij lopende projecten </li></ul></ul>
  31. 31. Conclusies <ul><li>Conversie kan relatief snel, </li></ul><ul><li>zelfs indien men al hoge standaarden wil voldoen </li></ul><ul><li>Tempo bepaald door: </li></ul><ul><ul><li>omvang inventaris </li></ul></ul><ul><ul><li>afwijkingen van de norm </li></ul></ul><ul><li>Afwijkingen relatief zeldzaam </li></ul><ul><li>Niettemin: conversie is kostbaar (tijd !) </li></ul>
  32. 32. Presentatie <ul><li>Stylesheets nodig voor presentatie </li></ul><ul><ul><li>html </li></ul></ul><ul><ul><li>pdf </li></ul></ul><ul><li>Stylesheets baseren zich op richtlijnen </li></ul>
  33. 33. XSLT voor html
  34. 34. XSLT voor pdf
  35. 35. Vragen / informatie <ul><li>[email_address] </li></ul><ul><li>070 – 331 5439 </li></ul><ul><li>projectleider </li></ul><ul><li>h enny.van.schie @nationaalarchief.nl </li></ul><ul><li>070 – 331 5548 </li></ul><ul><li>[email_address] </li></ul>

×