Towards the Digital Archive – Challenges and Best Practice: A Look at Digitization Practices, Standards, and Methodology at the National Library of Israel
Chezkie Kasnett Digital Projects Manager, The National Library of Israel, Jerusalem
The National Library of Israel holds vast collections of textual print and audiovisual source material. In today’s digital era, one of our main challenges is making these collections available to the public digitally. This not only serves the interest of the public, but our interests as well. A digitization operation must grapple with numerous challenges and considerations including legal issues, the physical state of the material, digital need and long-term preservation to name but a few. A successful approach to a digitization operation must provide an efficient methodology to deal with these challenges.
Status update: Axiell Roadmap/ New featuresAxiell ALM
More Related Content
Similar to Towards the Digital Archive – Challenges and Best Practice: A Look at Digitization Practices, Standards, and Methodology at the National Library of Israel
Introduction to Digital Preservation - Digitising your collection kevin lon...dri_ireland
Similar to Towards the Digital Archive – Challenges and Best Practice: A Look at Digitization Practices, Standards, and Methodology at the National Library of Israel (20)
Towards the Digital Archive – Challenges and Best Practice: A Look at Digitization Practices, Standards, and Methodology at the National Library of Israel
3. So why are some people afraid of digitization?
• Fear of change
• Fear of irrelevancy of original material
• Fear of lack of need
The OPPOSITE holds true:
Digitization:
INCREASES awareness
INCREASES need
INCREASES relevancy
Who moved my cheese?
4. What we do…..
• We’re a national library….
• Many types of material
• Many sizes of material
• Many different projects
• Thousands of scans a day
5. The 6 Considerations …….
• What is your objective?
• What is the material scope?
• Condition of the source material
• How will the material be used?
• Who is your audience?
• Do you require LTDP?
8. To accomplish this….
• Standards
• Methodology
• Workflow
PRINT MATERIAL
Source Material to Digital File / Microfilm to Digital File
Standards for Digital Image Capture
Material Type News Papers Manuscripts Books / Documents Jacket Maps Photographs
Master / Preservation Images
Target File Bi-Tonal Greyscale Color Greyscale Color Bi-Tonal Greyscale Color Color Greyscale Color Color Color
Format TIFF TIFF TIFF TIFF TIFF TIFF TIFF TIFF TIFF TIFF TIFF TIFF TIFF
Resolution/DPI 300/400 300/400 400-600 300 400-600 300 300 400 300 400 600 600 600
Bit Depth 1-bit 8-bit 24-bit 8-bit 24-bit 1-bit 8-bit 24-bit 24-bit 8-bit 24-bit 24-bit 48-bit
Compression None None None None None None None None None None None None None
Color Mode - - RGB - RGB - - RGB RGB - RGB RGB RGB
Criteria standard Tabloid,
magazine
standard standard If w images standard standard When high
quality
required
Secondary / Production Images
Format TIFF/JPEG2K/
JPEG
TIFF/JPEG2K/
JPEG
TIFF/JPEG2K TIFF/JPEG2K TIFF/JPEG2K TIFF/JPEG2K/
JPEG
TIFF/JPEG2K/
JPEG
TIFF/JPEG2K TIFF/JPEG2K TIFF/JPEG2K TIFF/JPEG2K TIFF/JPEG2K TIFF/JPEG2
K
Resolution 300 DPI 300 DPI 400 DPI 300 DPI 400-600 DPI 300 DPI 300 DPI 400 DPI 300 DPI 400 DPI 400 DPI 600 DPI 600DPI
Compression LZW/ CCITT-4 LZW/ LZW/ LZW/ CCITT-4 LZW/
Image
Processing
De-skew
De-speckle
Crop to edge
De-Skew
De-Speckle
Crop
De-Skew
De-Speckle
Crop
De-Skew
De-Speckle
Crop
De-Skew
Crop
Presentation / Access Images
Format JPEG/PDF JPEG/PDF JPEG/PDF JPEG JPEG JPEG/PDF JPEG/PDF JPEG/PDF JPEG/PDF JPEG JPEG JPEG JPEG
Size
Thumbnail Images
Format JPEG JPEG JPEG JPEG JPEG JPEG JPEG JPEG JPEG JPEG JPEG JPEG JPEG
Size 150x150
בהתאם או
לצורך
150x150
בהתאם או
לצורך
150x150
בהתאם או
לצורך
150x150
בהתאם או
לצורך
150x150
בהתאם או
לצורך
150x150
בהתאם או
לצורך
150x150
בהתאם או
לצורך
150x150
בהתאם או
לצורך
150x150
בהתאם או
לצורך
150x150
בהתאם או
לצורך
150x150
בהתאם או
לצורך
150x150
בהתאם או
לצורך
150x150
בהתאם או
לצורך
9. What we do…..
Preservation Master
Derivative Master
Derivative Access
DAMS
LTDP
TIFF
Single page
no compression
300 + dpi
TIFF
Single page
no compression
300 + dpi
CROPPED
JPEG
As required
10. Digitization… What does it mean?
Analog
• = 1 book (250 pages)
• = generally 1 metadata (catalog) record
• = 2 items
11. Digitization… What does it mean?
Digital
• = 250 preservation master files
• = (250 derivative master files)
• = 250 JPEG access files
• = 1 metadata (catalog) record
• = 1 DAMS record
• = at least (502) 752 items
13. Digitization… What does it mean?
Storage - Costs of 1 GB
$438,0001980
$105,0001985
$11,0001990
$112000
$12005
$0.12012
$0.032014
FREE – Google 15 GB2016
20. Digital Preservation:
- Technological dependence
- Proprietary software dependence
- Technological obsolescence (= questionable longevity)
- hardware
- software
- media
- formats
“Long-term” Digital Preservation = an Oxymoron?
= THREATS
21. Approach to LTDP
- Adopt internationally accepted strategy
- Framework (OAIS, PREMIS)
- Methodology
- Best practice and Standards (of digitization, metadata)
- CONTINUITY
- Assess Threats
- Implement an LTDP System (Risk assessment and consequent actions)
22. LTDP System
- NLI implemented the ExLibris Rosetta System
- Deep storage of digital material
- Based on OAIS / PREMIS
- Periodic migration of file formats – CONTINUITY
- On-demand
- Early
- Late
- Ensures bit level integrity
- Constant risk assessment, timely risk resolving actions
23. Food for Thought:
Define ”Long-Term”?
At some point down the road… will someone be
“digitizing” it all over again?!
Answer: YES!!!!!! But WHY???
Towards the Digital Archive – Challenges and Best Practice
A look at digitization practices, standards, and methodology at the National Library of Israel
Material types,
PREservation Metadata: Implementation Strategies
Open Archival Information System
PREservation Metadata: Implementation Strategies
Open Archival Information System
Material types,
PREservation Metadata: Implementation Strategies
Open Archival Information System
PREservation Metadata: Implementation Strategies
Open Archival Information System
PREservation Metadata: Implementation Strategies
Open Archival Information System
PREservation Metadata: Implementation Strategies
Open Archival Information System
Material types,
PREservation Metadata: Implementation Strategies
Open Archival Information System
Material types,
PREservation Metadata: Implementation Strategies
Open Archival Information System
Material types,
PREservation Metadata: Implementation Strategies
Open Archival Information System
Material types,
PREservation Metadata: Implementation Strategies
Open Archival Information System
Material types,
PREservation Metadata: Implementation Strategies
Open Archival Information System
Material types,
PREservation Metadata: Implementation Strategies
Open Archival Information System
ברגע שטקסט הוא דאטה, הטקסט נהיה האובייקט. (בעייתי – בגלל אי- דיוק של OCR?)
פרויקטים דיגיטליים מייצרים תרבות חדשה של דאטה. ניתן לתרגם את הדאטה לצורות אחרות עבור שימוש שונה למטרות שונות
הטכנולוגיה היא לא הנקודה. היום זה דיגיטיזציה. מחר זה יהיה משהו אחר. הטכנולוגיה היא רק נקודה בדרך
ברגע שטקסט הוא דאטה, הטקסט נהיה האובייקט. (בעייתי – בגלל אי- דיוק של OCR?)
פרויקטים דיגיטליים מייצרים תרבות חדשה של דאטה. ניתן לתרגם את הדאטה לצורות אחרות עבור שימוש שונה למטרות שונות
הטכנולוגיה היא לא הנקודה. היום זה דיגיטיזציה. מחר זה יהיה משהו אחר. הטכנולוגיה היא רק נקודה בדרך
ברגע שטקסט הוא דאטה, הטקסט נהיה האובייקט. (בעייתי – בגלל אי- דיוק של OCR?)
פרויקטים דיגיטליים מייצרים תרבות חדשה של דאטה. ניתן לתרגם את הדאטה לצורות אחרות עבור שימוש שונה למטרות שונות
הטכנולוגיה היא לא הנקודה. היום זה דיגיטיזציה. מחר זה יהיה משהו אחר. הטכנולוגיה היא רק נקודה בדרך
ברגע שטקסט הוא דאטה, הטקסט נהיה האובייקט. (בעייתי – בגלל אי- דיוק של OCR?)
פרויקטים דיגיטליים מייצרים תרבות חדשה של דאטה. ניתן לתרגם את הדאטה לצורות אחרות עבור שימוש שונה למטרות שונות
הטכנולוגיה היא לא הנקודה. היום זה דיגיטיזציה. מחר זה יהיה משהו אחר. הטכנולוגיה היא רק נקודה בדרך
LTDP is NOT an oxymoron when implemented properly.
A successful digital preservation strategy must account for and mitigate the impact of various threats to the accessibility and usability of digital materials over time
So by adopting the above, we don’t necessarily GUARANTEE that our material today will be available in the future, we can be fairly certain that no matter where the future will take us, the material we have today will remain accessible to future generations
OPEN ARCHIVE INFORMATION SYSTEM – A REFERENCE MODEL FOR LTDP
Preservation Metadata: Implementation Strategies (PREMIS)
In Summary:
It is understood that Digital Content, with all of its challenges and disadvantages, still outweighs analog preservation in terms of the advantages it offers