SlideShare a Scribd company logo
1 of 90
Download to read offline
./DATABLE
Wat is een (CAD) bestand?
./DATABLE
./DATABLE
./DATABLE
./DATABLE
inhoud
• Bestand van binnen bekeken
– over enen en nullen
– structuur, identificatie en validatie
– risicofactoren
• CAD bestanden
– kenmerken
– formaten en hun risicofactoren
./DATABLE
I. Bestand van binnen bekeken
./DATABLE
De enen en de nullen
./DATABLE
File preservation risk: bit
integrity
• bit integriteit: bitstream is beschadigd
./DATABLE
Preservation action:
checksums
• Controlegetal (hash) berekend op bitstream
• Gebruikt bij opslag en overdracht van data
• Voorbeelden:
– Parity bit: 11010010
– CRC: 100000111 (CRC-8)
– MD5: d6a209dcb139058f727fb87866f87bde
./DATABLE
MD5 checksum
• unieke vingerafdruk voor hele bestand
• wijziging bit = wijziging checksum
./DATABLE
Toepassing voor duurzame
opslag: BagIt
./DATABLE
• Endianess: volgorde waarin bytes worden
gelezen
file preservation risk:
endianess
./DATABLE
ASCII vs Binair bestand
ASCII
• human readable
• omvangrijk bestand
Binair
• enen en nullen
• compact
./DATABLE
ASCII vs. Binair bestand
ASCII
• 8 bits = 1 karakter
• human readable
• omvangrijk bestand
• voorbeelden:
– TXT
– XML, HTML, SVG
– DXF
– Word (.docx)
Binair
• enen en nullen
• niet human readable
• compact
• voorbeelden:
– JPG
– .exe
– DWG
– Word (.doc)
./DATABLE
Compressie
Datacompressie is een manier om informatie
met minder bits te coderen.
+ compacter bestand
- extra operatie op bestand
- veel verschillende algoritmes
- steeds binair
- soms gegevensverlies (lossy JPG, DWF)
./DATABLE
Compressie
Lossless: proces is omkeerbaar
voorbeeld: zip, lzw, tar, …
Lossy is onomkeerbaar
voorbeeld: jpg
Compressiealgoritme kan op gehele bestand
of op deel ervan worden toegepast.
./DATABLE
File system en files
Een bestandssysteem bepaalt hoe bestanden
worden opgeslagen en teruggevonden op een
gegevensdrager.
Elk besturingssysteem ondersteunt één of
meerdere bestandssystemen.
./DATABLE
./DATABLE
File system en files
file system gebruik opmerkingen
FAT32 Windows, Mac max file size 4GB
HFS+ Mac
NTFS Windows, Mac Mac: read only
ISO 9660 cd-rom, Mac, Windows file name length: 8+3
Amiga FFS Amiga OS 1.3
… …
./DATABLE
Structuur van een bestand
• Header
– byte order (Endianess)
– magic number
– metadata
• Content (sections, blocks, packets, streams)
• Blobs
• Trailer
• Integrity checks (CRC)
./DATABLE
./DATABLE
./DATABLE
./DATABLE
Bestandsspecificatie
• “interpretatie” van een file
• legt criteria vast waaraan bestand moet
voldoen
• compliancy levels
• gelieerd met software
• open vs proprietary
./DATABLE
Format preservation risico’s
(1)
• disclosure:
– specificatie niet beschikbaar
– specificatie in privé beheer
• adoption
– weinig gebruikers of ontwikkelaars
– weinig tools of besturingssystemen
• transparency:
– intransparante opbouw verhindert validatie
– compressie of encryptie
./DATABLE
Format preservation risico’s
(2)
• self-documentation
– interpretatie afhankelijk van externe bron
– geen embedded metadata
• external dependencies
– afhankelijk van hardware of OS
• patents
• technical protection mechanisms
– DRM
./DATABLE
Voorbeeld
bestandsspecificatie: CSV
./DATABLE
Voorbeeld
bestandsspecificatie: TIFF
• Vrij beschikbaar
• Beheerd door Adobe
• Laatste versie 1992
• Onderscheid Baseline – Extensions
• Zeer veel toegepast
./DATABLE
Voorbeeld
bestandsspecificatie: PDF/A1
• ISO 19005-1:2005 Document
management -- Electronic document file
format for long-term preservation -- Part
1: Use of PDF 1.4 (PDF/A-1)
• Beheerd door ISO:
– tegen betaling beschikbaar
– open procedure
– review process
./DATABLE
Hoe beoordeel je CSV, TIFF,
PDF/A?
./DATABLE
Bestandsidentificatie
Bestandsidentificatie is het bepalen aan welk
formaat een bestand beantwoordt.
• aan de hand van extensie of magic number
• uitgevoerd door besturingssysteem of tool
• te onderscheiden van karakterisering:
extractie van bepaalde eigenschappen
./DATABLE
Bestandsidentificatie
Een file name extension is een suffix op de
bestandsnaam waarmee het formaat kan
worden geidentificeerd, maar:
• een extensie kan gewijzigd worden
• verschillende bestandsformaten delen
zelfde extensies
• extensie zegt niets of niet veel over versie
van het bestand
./DATABLE
Bestandsidentificatie
Een file signature (magic number) is een
tekenreeks in de header van een bestand
waarmee het formaat kan worden bepaald.
• File format registries
– PRONOM
– fileinfo.com
• File identification tools
– FILE Command (Linux)
– TrID
– DROID
./DATABLE
File format registry: PRONOM
./DATABLE
File identification tool: DROID
./DATABLE
DROID: functies
• identificatie van formaat + versie (PUID)
• MD5 checksum
• file properties: last modified, size, path
• signaleert ‘extension mismatch’
• rapportage
• export als CSV
./DATABLE
DROID: problemen
• formaat niet in PRONOM
• mismatch (op basis van extensie)
• meerdere mogelijke formaten
• versie onbekend
• meerdere versies mogelijk
./DATABLE
Bestandsvalidatie
Bestandsvalidatie controleert of een bestand
beantwoordt aan de eisen van de formaat specificatie
• tools
– JHOVE en JHOVE2
– Sniffer: DWG (post R2011)
– native software, bv. AutoCAD
• aspecten:
– integriteit - bitrot
– specificatie formaat/versie + compliance levels
– specifieke kenmerken (bv. afmetingen, vorm)
./DATABLE
File validation: jhove en
JHOVE2
./DATABLE
./DATABLE
2. CAD bestanden
./DATABLE
CAD in ontwerppraktijk
• “Ontwerpen gebeurt met potlood en papier.
Het uittekenen doet een medewerker met de
computer.”
• “We importeren een AutoCAD-tekening in
Sketchup en zetten het om naar 3D. Het
resultaat wordt afgedrukt en met viltstift
bijgewerkt. We scannen dit weer en bewerken
het verder in Photoshop.”
• “We scripten alles.”
./DATABLE
CAD in ontwerpraktijk
Interpretatie en inschatten van relevantie
van een CAD bestand kan niet zonder de
ontwerppraktijk te kennen.
./DATABLE
CAD?
‘Tekenen met hulp van computer’
‘Gebruik van computer voor creatie,
optimalisatie, analyse en communicatie
van een ontwerp’
./DATABLE
CAD: creatie van ontwerp
• tekenen in 2D of 3D
• parametrisch ontwerpen (‘scripten’)
– vorm
– budget
– omgeving
– materiaaleigenschappen
– budget
• walktroughs
./DATABLE
CAD: communicatie van
ontwerp
• Plotten van drawings
• Renderings, visualisaties
• Project management (4D)
./DATABLE
CAD: tekenen
./DATABLE
CAD tools
Computer Aided Design: ontwerpen met
behulp van een computer
• AutoCAD (LT, 360, TrueView)
• Microstation (Bentley)
• BricsCAD (OpenDesignAlliance)
• TeighaView
• VectorWorks
./DATABLE
CAD: parametrisch ontwerpen
./DATABLE
Parametrisch design
Ontwerpen aan de hand van parameters die
de vorm bepalen.
• Rhino+Grasshopper
• Catia
• Autodesk Revit
./DATABLE
CAD: Building Information
Modeling
./DATABLE
BIM
Building Information Modelling:
representeren van vorm, functie en
eigenschappen van fysieke omgeving
• Autodesk Revit
• Graphisoft Archicad
• Bentley Architecture
./DATABLE
Renderings, modelling &
animation
./DATABLE
Rendering, modelling &
animation
Creatie van realistische 3D visualisaties en
animatie
• Maya
• 3ds Max
• Blender
./DATABLE
CAD Design standards
• “huisstijl”
• ISO 16792:2006 geometric dimensions
and tolerances
• ISO 13567 organizing and naming CAD
layers
./DATABLE
CAD software markt
• competitieve markt
• allianties (ODA vs. Autodesk)
• veel nieuwe releases met nieuwe features
• uitwisselbaarheid vs. marktprotectie
• verticale integratie
./DATABLE
CAD bestanden:
eigenschappen
• Geometrie: blocks & objects
• Intelligence:
– layers
– attributes
• Structuur:
– embedded raster images
– xrefs
• Look & feel
– modelspace vs paper space
– print-to-pdf
• pcp- en pc2-files, de (vroeger plotstyle tables)
• paperspace
• Metadata
./DATABLE
2.1 GEOMETRIE
• Vector image
– vertices, lijnen,
polygonen
– bezier curves, NURBS
• Pixel-based
– beeldpunten (pixels)
– in vlak (raster) of
ruimte (wolk)
./DATABLE
representatiemethoden
./DATABLE
Constructive solid geometry
./DATABLE
Solid modelling: polygon
mesh
./DATABLE
Freeform surface modelling
./DATABLE
Representatiemethoden voor
vector image
• solid modelling
– boundary representation
– surface mesh modelling
– constructive solid geometry (CSG)
• freeform surface modelling
Bestandsformaten ondersteunen zelden
alle representatiemethoden
./DATABLE
Geometric modelling kernel
Software maakt gebruik van modelling kernels:
• ShapeManager (oa. AutoCAD, fork from
ACIS, Bentley)
• Parasolid (VectorWorks)
• ACIS (BricsCAD)
• SOLIDS+ (Rhinoceros)
Ook modelling kernels ondersteunen
zelden alle representatiemethoden.
./DATABLE
modelling Kernel
implementaties
• besturingssysteem
– ondersteunt:
• software(versie)
– maakt gebruik van:
• software library
– maakt gebruik van:
• modelling kernel
./DATABLE
conversion/migration risks (1)
• Verschillen in representatietechnologie
• Verschillende implementaties in
softwarebibliotheek of kernel
./DATABLE
2.2 Attributen: Intelligentie
• eigenschappen van geometrische
elementen:
– lijndikte, kleur
– afmetingen, positie en tolerancing
– materiaalkenmerken (BIM)
– annotaties
./DATABLE
2.2 Attributen: Intelligentie
./DATABLE
2.2 Attributen: Intelligentie
• layers en layerstates
./DATABLE
conversion/migration risks (2)
• Verschillende functionaliteiten in software
libraries
• Backward compatibility
• Intermediaire conversie
./DATABLE
2.3 Look & Feel
• 2D of 3D
• wireframe, rendered
• rotation
• model & layout
• layerstates
./DATABLE
conversion/migration risks (3)
• Look & feel wijzigt door
– verlies View settings
– andere software
– ander bestandsformaat
– andere hardware (schermresolutie)
./DATABLE
Preservation acties
• Bewaar view settings
• Documenteer hardware, os, software
• Gebruik adequaat bestandsformaat bij
migratie
./DATABLE
2.4 Structuur
• Xrefs (workgroup): gekoppelde drawings
• Block references: gekoppelde blocks (cells,
symbol, group)
• Embedded files: jpg
• Plot style tables
• Fonts
./DATABLE
Preservation risico’s
• Xref gewijzigd of verwijderd
• Pad naar Xref ongeldig
• Objecten verloren
• eTransmit
– zip-bestand met paswoord (obsolete)
– executable (obsolete)
./DATABLE
Preservation acties
• Bewaar objecten afzonderlijk
– Bewaar oorspronkelijke orde
– Gebruik relatieve paden
• Groepeer objecten
– Archiving (binding): externe bestanden
opgenomen in bestand
– eTransmit: creëert folder of zip
– Binding en eTransmit crëeert nieuw bestand
./DATABLE
2.5 Metadata
• Bevatten informatie over een bestand
– descriptief: context
– administratief: beheer en gebruik
• technisch
• juridisch
• preservation metadata
– structurele metadata: onderlinge relaties
./DATABLE
METADATA: types
• Extern
– in database, spreadsheet, …
– file system properties
• Intern (embedded)
– in header
– file properties
– in content
./DATABLE
metadata: file system
./DATABLE
metadata
./DATABLE
metadata: preservation risks
• wijziging bij openen bestand
• wijziging bij kopiëren
• wijziging bij converteren
• extractie content metadata
onmogelijk
./DATABLE
METADATA: preservation
actions
• disk image
• file properties: DROID
• metadata extractie
– dwgprops commando (AutoCAD)
– strings commando (Linux)
• adequaat archiveringsformaat
./DATABLE
Welke eigenschappen zijn
essentieel?
geometrie
intelligentie
look&feel
metatadata
structuur
output
… ?
./DATABLE
Formaten
• DWG, DXF, DWF
• VWX
• PDF
– PDF/A-2
– PDF/E
• STEP, IGES
./DATABLE
CAD Formaten
! "#$%&' "%( ) *&+( *, - "( *. %) %/+0*+"#$%/' #/11"+"#$%' &' ( * * 23245**
*
*
*
*
*
*
! "#$%&'&#'( &)* &)+,#- '( $#'! "#$%&'( ')*+''
. /0&12&#'3,2'&&#'$)14,2&1233)$)14,&5'
'
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
&&#'1$6&'62378',#'. "7)$142'( $#'4&2'9&#2)3%': ;$$%6&'<)14,2&1233)$)14,&( &#'
=&#+': $#62$""&#'
>?@A'
./DATABLE
Format sustainibility factors
Format
disclosure
adoption
transpa-
rency
self-
documen-
tation
external
dependen-
cies
patents
technical
protection
mechanism
s
DWG - + - 0 - - 0
DXF + + + 0 0 0 +
ODA + + - 0 - 0 +
PDF/E + + - 0 + + +
STEP + + + + + + +
IGES + + + + 0 + +
./DATABLE
Significant properties support
Format Geometrie Attributen Look&Feel Structuur Metadata
DWG + + + + +
DXF + +/0 + + +
DWG
(ODA)
+ +/0 + + +
PDF/E + 0 0 0 0
STEP/21 + 0 - - +
IGES + 0 - 0 -
./DATABLE
uitsmijters…
./DATABLE
./DATABLE

More Related Content

Similar to Wat is een (CAD) bestand?

Digitaal archiveren: een kleine inleiding
Digitaal archiveren: een kleine inleidingDigitaal archiveren: een kleine inleiding
Digitaal archiveren: een kleine inleidingTom Cobbaert
 
Vroeger was het simpel... Digitaal archiveren
Vroeger was het simpel... Digitaal archiverenVroeger was het simpel... Digitaal archiveren
Vroeger was het simpel... Digitaal archiverenTom Cobbaert
 
Digital Assets Management in Musea
Digital Assets Management in MuseaDigital Assets Management in Musea
Digital Assets Management in Museadatable_be
 
Gegevensbanken En Gebruikers
Gegevensbanken En GebruikersGegevensbanken En Gebruikers
Gegevensbanken En GebruikersErik Duval
 
Archivering van digitale afbeeldingen: het maken van een beredeneerde keuze v...
Archivering van digitale afbeeldingen: het maken van een beredeneerde keuze v...Archivering van digitale afbeeldingen: het maken van een beredeneerde keuze v...
Archivering van digitale afbeeldingen: het maken van een beredeneerde keuze v...bertwerk
 
Voyager Data op orde bij waterschap Zuiderzeeland
Voyager Data op orde bij waterschap ZuiderzeelandVoyager Data op orde bij waterschap Zuiderzeeland
Voyager Data op orde bij waterschap ZuiderzeelandEsriGISConferentie
 
Presentie duurzaam digitaal beheren
Presentie duurzaam digitaal beherenPresentie duurzaam digitaal beheren
Presentie duurzaam digitaal beherenFARO
 
Voordelen PDF/X-4 en het Testen van Uw Workflow
Voordelen PDF/X-4 en het Testen van Uw WorkflowVoordelen PDF/X-4 en het Testen van Uw Workflow
Voordelen PDF/X-4 en het Testen van Uw WorkflowVIGCbe
 
New features cognos10.2
New features cognos10.2New features cognos10.2
New features cognos10.2Jan van Otten
 
IMPACT Framework en Evaluatie by Clemens Neudecker
IMPACT Framework en Evaluatie by Clemens NeudeckerIMPACT Framework en Evaluatie by Clemens Neudecker
IMPACT Framework en Evaluatie by Clemens NeudeckerIMPACT Centre of Competence
 
metadata & open source #osgeonl dag 2012
metadata & open source #osgeonl dag 2012 metadata & open source #osgeonl dag 2012
metadata & open source #osgeonl dag 2012 pvangenuchten
 
PDF voor Sign: creatie, preflight en de RIP
PDF voor Sign: creatie, preflight en de RIPPDF voor Sign: creatie, preflight en de RIP
PDF voor Sign: creatie, preflight en de RIPVIGCbe
 
Versiebeheer van database changes
Versiebeheer van database changesVersiebeheer van database changes
Versiebeheer van database changesArjen van Vliet
 

Similar to Wat is een (CAD) bestand? (20)

Digitaal archiveren: een kleine inleiding
Digitaal archiveren: een kleine inleidingDigitaal archiveren: een kleine inleiding
Digitaal archiveren: een kleine inleiding
 
Vroeger was het simpel... Digitaal archiveren
Vroeger was het simpel... Digitaal archiverenVroeger was het simpel... Digitaal archiveren
Vroeger was het simpel... Digitaal archiveren
 
Online documenten beheren
Online documenten beherenOnline documenten beheren
Online documenten beheren
 
Digital Assets Management in Musea
Digital Assets Management in MuseaDigital Assets Management in Musea
Digital Assets Management in Musea
 
Het geheugen van de architect: een reality check
Het geheugen van de architect: een reality checkHet geheugen van de architect: een reality check
Het geheugen van de architect: een reality check
 
Gegevensbanken En Gebruikers
Gegevensbanken En GebruikersGegevensbanken En Gebruikers
Gegevensbanken En Gebruikers
 
20081007 Workshop BOM-VL WP3
20081007  Workshop BOM-VL WP320081007  Workshop BOM-VL WP3
20081007 Workshop BOM-VL WP3
 
Documentatie, van last naar kracht
Documentatie, van last naar krachtDocumentatie, van last naar kracht
Documentatie, van last naar kracht
 
Archivering van digitale afbeeldingen: het maken van een beredeneerde keuze v...
Archivering van digitale afbeeldingen: het maken van een beredeneerde keuze v...Archivering van digitale afbeeldingen: het maken van een beredeneerde keuze v...
Archivering van digitale afbeeldingen: het maken van een beredeneerde keuze v...
 
Voyager Data op orde bij waterschap Zuiderzeeland
Voyager Data op orde bij waterschap ZuiderzeelandVoyager Data op orde bij waterschap Zuiderzeeland
Voyager Data op orde bij waterschap Zuiderzeeland
 
Presentie duurzaam digitaal beheren
Presentie duurzaam digitaal beherenPresentie duurzaam digitaal beheren
Presentie duurzaam digitaal beheren
 
Voordelen PDF/X-4 en het Testen van Uw Workflow
Voordelen PDF/X-4 en het Testen van Uw WorkflowVoordelen PDF/X-4 en het Testen van Uw Workflow
Voordelen PDF/X-4 en het Testen van Uw Workflow
 
New features cognos10.2
New features cognos10.2New features cognos10.2
New features cognos10.2
 
Debat Wegwijs in het landschap van archiefbeheersysteem
Debat Wegwijs in het landschap van archiefbeheersysteemDebat Wegwijs in het landschap van archiefbeheersysteem
Debat Wegwijs in het landschap van archiefbeheersysteem
 
IMPACT Framework en Evaluatie by Clemens Neudecker
IMPACT Framework en Evaluatie by Clemens NeudeckerIMPACT Framework en Evaluatie by Clemens Neudecker
IMPACT Framework en Evaluatie by Clemens Neudecker
 
metadata & open source #osgeonl dag 2012
metadata & open source #osgeonl dag 2012 metadata & open source #osgeonl dag 2012
metadata & open source #osgeonl dag 2012
 
(Online) foto’s beheren
(Online) foto’s beheren(Online) foto’s beheren
(Online) foto’s beheren
 
PDF voor Sign: creatie, preflight en de RIP
PDF voor Sign: creatie, preflight en de RIPPDF voor Sign: creatie, preflight en de RIP
PDF voor Sign: creatie, preflight en de RIP
 
IIIF-projecten
IIIF-projectenIIIF-projecten
IIIF-projecten
 
Versiebeheer van database changes
Versiebeheer van database changesVersiebeheer van database changes
Versiebeheer van database changes
 

More from datable_be

Visual recognition voor erfgoedcollecties:
Visual recognition voor erfgoedcollecties: Visual recognition voor erfgoedcollecties:
Visual recognition voor erfgoedcollecties: datable_be
 
Heritage data beyond the GLAM
Heritage data beyond the GLAMHeritage data beyond the GLAM
Heritage data beyond the GLAMdatable_be
 
Preserving born digital architectural drawings : developing preservation stra...
Preserving born digital architectural drawings: developing preservation stra...Preserving born digital architectural drawings: developing preservation stra...
Preserving born digital architectural drawings : developing preservation stra...datable_be
 
ECHO-core: metadataschema voor het beschrijven van studiecollecties
ECHO-core: metadataschema voor het beschrijven van studiecollectiesECHO-core: metadataschema voor het beschrijven van studiecollecties
ECHO-core: metadataschema voor het beschrijven van studiecollectiesdatable_be
 
Duurzaam bewaren van 3D bestanden
Duurzaam bewaren van 3D bestandenDuurzaam bewaren van 3D bestanden
Duurzaam bewaren van 3D bestandendatable_be
 
7 bouwstenen voor een digitale strategie
7 bouwstenen voor een digitale strategie7 bouwstenen voor een digitale strategie
7 bouwstenen voor een digitale strategiedatable_be
 
Prepare your metadata - introductie
Prepare your metadata - introductiePrepare your metadata - introductie
Prepare your metadata - introductiedatable_be
 
Open Cultuur Data: initiatieven, producten en lessons learned
Open Cultuur Data: initiatieven, producten en lessons learnedOpen Cultuur Data: initiatieven, producten en lessons learned
Open Cultuur Data: initiatieven, producten en lessons learneddatable_be
 
CEST 20140513 digitaliseren
CEST 20140513 digitaliserenCEST 20140513 digitaliseren
CEST 20140513 digitaliserendatable_be
 
Open cultuur data in Vlaanderen
Open cultuur data in VlaanderenOpen cultuur data in Vlaanderen
Open cultuur data in Vlaanderendatable_be
 
The memory of the architect: archiving 2D and 3D born digital architectural a...
The memory of the architect: archiving 2D and 3D born digital architectural a...The memory of the architect: archiving 2D and 3D born digital architectural a...
The memory of the architect: archiving 2D and 3D born digital architectural a...datable_be
 
Digital preservation assesment with scoremodel.org
Digital preservation assesment with scoremodel.orgDigital preservation assesment with scoremodel.org
Digital preservation assesment with scoremodel.orgdatable_be
 
Het geheugen van de architect: creatie en preservering van CAD files
Het geheugen van de architect: creatie en preservering van CAD filesHet geheugen van de architect: creatie en preservering van CAD files
Het geheugen van de architect: creatie en preservering van CAD filesdatable_be
 
3,5 meningen over databanken en erfgoed
3,5 meningen over databanken en erfgoed3,5 meningen over databanken en erfgoed
3,5 meningen over databanken en erfgoeddatable_be
 
EDM Fashion Profile
EDM Fashion ProfileEDM Fashion Profile
EDM Fashion Profiledatable_be
 
A score model for digital repositories in the cultural heritage sector
A score model for digital repositories in the cultural heritage sectorA score model for digital repositories in the cultural heritage sector
A score model for digital repositories in the cultural heritage sectordatable_be
 
OAIS groeimodel
OAIS groeimodelOAIS groeimodel
OAIS groeimodeldatable_be
 
CEST @ Document Freedom Day 2012
CEST @ Document Freedom Day 2012CEST @ Document Freedom Day 2012
CEST @ Document Freedom Day 2012datable_be
 
Open erfgoed hvs
Open erfgoed hvsOpen erfgoed hvs
Open erfgoed hvsdatable_be
 

More from datable_be (20)

Visual recognition voor erfgoedcollecties:
Visual recognition voor erfgoedcollecties: Visual recognition voor erfgoedcollecties:
Visual recognition voor erfgoedcollecties:
 
Heritage data beyond the GLAM
Heritage data beyond the GLAMHeritage data beyond the GLAM
Heritage data beyond the GLAM
 
Preserving born digital architectural drawings : developing preservation stra...
Preserving born digital architectural drawings: developing preservation stra...Preserving born digital architectural drawings: developing preservation stra...
Preserving born digital architectural drawings : developing preservation stra...
 
ECHO-core: metadataschema voor het beschrijven van studiecollecties
ECHO-core: metadataschema voor het beschrijven van studiecollectiesECHO-core: metadataschema voor het beschrijven van studiecollecties
ECHO-core: metadataschema voor het beschrijven van studiecollecties
 
Duurzaam bewaren van 3D bestanden
Duurzaam bewaren van 3D bestandenDuurzaam bewaren van 3D bestanden
Duurzaam bewaren van 3D bestanden
 
7 bouwstenen voor een digitale strategie
7 bouwstenen voor een digitale strategie7 bouwstenen voor een digitale strategie
7 bouwstenen voor een digitale strategie
 
Prepare your metadata - introductie
Prepare your metadata - introductiePrepare your metadata - introductie
Prepare your metadata - introductie
 
Open Cultuur Data: initiatieven, producten en lessons learned
Open Cultuur Data: initiatieven, producten en lessons learnedOpen Cultuur Data: initiatieven, producten en lessons learned
Open Cultuur Data: initiatieven, producten en lessons learned
 
Open Data
Open DataOpen Data
Open Data
 
CEST 20140513 digitaliseren
CEST 20140513 digitaliserenCEST 20140513 digitaliseren
CEST 20140513 digitaliseren
 
Open cultuur data in Vlaanderen
Open cultuur data in VlaanderenOpen cultuur data in Vlaanderen
Open cultuur data in Vlaanderen
 
The memory of the architect: archiving 2D and 3D born digital architectural a...
The memory of the architect: archiving 2D and 3D born digital architectural a...The memory of the architect: archiving 2D and 3D born digital architectural a...
The memory of the architect: archiving 2D and 3D born digital architectural a...
 
Digital preservation assesment with scoremodel.org
Digital preservation assesment with scoremodel.orgDigital preservation assesment with scoremodel.org
Digital preservation assesment with scoremodel.org
 
Het geheugen van de architect: creatie en preservering van CAD files
Het geheugen van de architect: creatie en preservering van CAD filesHet geheugen van de architect: creatie en preservering van CAD files
Het geheugen van de architect: creatie en preservering van CAD files
 
3,5 meningen over databanken en erfgoed
3,5 meningen over databanken en erfgoed3,5 meningen over databanken en erfgoed
3,5 meningen over databanken en erfgoed
 
EDM Fashion Profile
EDM Fashion ProfileEDM Fashion Profile
EDM Fashion Profile
 
A score model for digital repositories in the cultural heritage sector
A score model for digital repositories in the cultural heritage sectorA score model for digital repositories in the cultural heritage sector
A score model for digital repositories in the cultural heritage sector
 
OAIS groeimodel
OAIS groeimodelOAIS groeimodel
OAIS groeimodel
 
CEST @ Document Freedom Day 2012
CEST @ Document Freedom Day 2012CEST @ Document Freedom Day 2012
CEST @ Document Freedom Day 2012
 
Open erfgoed hvs
Open erfgoed hvsOpen erfgoed hvs
Open erfgoed hvs
 

Wat is een (CAD) bestand?

Editor's Notes

  1. Introductie we zijn gewend te werken met bestanden en bestandsformaten op computers, en meestal loopt dit goed en doet een computer wat we verwachten. Soms loopt het echter mis: je computer interpreteert het bestand verkeerd of kan er helemaal niets mee. Om de oorzaken te begrijpen gaan we bekijken hoe een bestand in het algemeen er uit ziet en wat er vereist is om dit door een computer te begrijpen. Daarbij komen een aantal risico’s aan het licht. Deze risicofactoren zijn groter naarmate de gebruikte bestandsformaten complexer zijn en naarmate ze ouder zijn. Digital preservation komt vaak neer op het herkennen van deze risico’s en het zoeken naar oplossingen om de risico’s te minimaliseren.
  2. Problemen manifesteren zich op twee manieren: een bestand wordt fout weergegeven: in dit voorbeeld zijn enkele visueel vast te stellen eigenschappen verdwenen (zoals kleuren) verdwenen. in hetzelfde voorbeeld is een component van plaats veranderd (de centrale trap staat nu buiten het gebouw)
  3. (3) erger is dit probleem, waar een bestand – om wat voor reden dan ook - helemaal niet meer leesbaar is. Om deze drie problemen te tackelen, is inzicht nodig in de opbouw van een bestand en de factoren die een bestand leesbaar maken voor een computer.
  4. In deze sessie bespreken we eerst een aantal algemene aspecten van een computer file of bestand. Daaruit kunnen we telkens enkele risicofactoren voor digital preservation uit afleiden. In een tweede deel gaan we dieper in op CAD bestanden en de specifieke kenmerken en risico’s die ermee gepaard gaan.
  5. Brainstorm: waaraan denk je bij het woord “bestand”? wat is het precies? waaraan herken je het? welke soorten zijn er? hoe gebruik je het? …
  6. Een bestand is in principe altijd binair: het bestaat uit bits (enen en nullen). In deze screenshot zie je een binaire weergave (boven de hexadecimale voorstelling) Wanneer een bit wordt gewijzigd, verwijderd of toegevoegd, kan het bestand corrupt worden. Corrupt betekent dat de inhoud niet meer correct gerepresenteerd wordt, of dat het bestand onleesbaar is. Een ander woord is ‘bitrot’. De integriteit van het bestand (bit integriteit) is dus beschadigd. Bitrot wordt meestal veroorzaakt tijdens het kopiëren van een bestand of door schade van de drager (chemisch verval, elektromagnetisch veld). (DEMO: OxED op /Users/henkvanstappen/Dropbox/1_Projecten/2016_HNI_MVRDV/2_lespakket/4_samples/9938_inplanting_2007.dwg) Opmerking: Hexadecimale voorstelling: elke reeks van 4 bits wordt gerepresenteerd door cijfer of letter (0-9 A-F) 0100 0000 = 40 ASCII gebruikt reeksen van 8 bits om een letterteken voor te stellen: 0100 0000 = @
  7. Daarmee is dus een eerste risicofactor geïdentificeerd: wanneer de bitstream beschadigd is, leidt dit tot informatieverlies.
  8. Een maatregel om bitrot op te sporen is het gebruik van controlegetallen (vergelijkbaar met de laatste cijfers van je bankrekeningnummer of ISBN): het is een getal dat wordt berekend op basis van een reeks getallen of bits. een parity bit is de achtste bit, berekend op de zeven voorgaande bits in een byte (geeft aan of het aantal 1-en even of oneven is) een Cyclic Redundancy check (CRC) wordt onder meer gebruikt in sommige CAD-bestanden. Het biedt (soms) de mogelijkheid om foutcorrectie uit te voeren (wordt onder meer ook bij cd-rom gebruikt) een MD5 checksum wordt doorgaans gebruikt op een volledig bestand of groep van bestanden. Een MD5 berekening genereert een (praktisch) unieke code. Wanneer je een MD5 berekent en een ander resultaat verkrijgt, betekent dit dus dat ergens in het bestand een wijziging is opgetreden. Vandaar dat MD5 een goed controle middel is om de integriteit van bestanden te controleren. Met MD5 kan je echter geen foutcorrectie uitvoeren: als er dus iets mis is me de integriteit, moet je beroep doen op een back-up.
  9. Voorbeeld van een MD5 checksumberekening op het bestand dat we corrupt hebben gemaakt: een aanpassing van slechts 1 bit geeft een heel andere checksum.
  10. MD5 wordt daarom vaak gebruikt in systemen of processen voor duurzame opslag. Hier een voorbeeld van een bag: dit is een ‘verpakking” waarin bestanden en hun metadata worden verpakt. Van elk onderdeel en van het geheel wordt een MD5 checksum gecreëerd om de bitintegriteit te verzekeren.
  11. Bij het lezen van een bestand gebruikt een computer een bepaalde volgorde voor het inlezen van groepjes bytes. Wanneer die volgorde niet gerespecteerd wordt, klopt de informatie niet. Normaal gezien wordt deze volgorde (Endianess) aangegeven in de header.
  12. Beeld: screenshot van dwg en dxf met 0xED.
  13. ASCII is een manier om karakters (letters, cijfers, tekens) te coderen aan de hand van een combinatie van 8 bits. Bestanden die enkel uit een opeenvolging van dergelijke ASCII tekens bestaan, zijn dus ‘leesbaar’ alsof het een tekst is. Doordat het bestand ‘mensleesbaar’ is, is het ook transparanter en gemakkelijker te interpreteren. Nadeel van ASCII bestanden is dat ze vaak veel omvangrijker zijn dan hun binaire tegenhanger: zo is een DXF gemakkelijk 5x groter dan een DXF. We komen later nog terug op dit risico.
  14. optioneel: over risico’s van compressie
  15. optioneel: over risico’s van compressie
  16. Optioneel: file system (bijvoorbeeld FAT32, NTFS) zorgen voor de indeling van de drager in blokken waar (delen van) bestanden worden weggeschreven. Elk deel wordt geïndexeerd en is zo terugvindbaar. Een file system identificeert dus de files op een harde schijf. RISICO: wanneer een file system niet wordt ondersteund, is het bestand niet terug te vinden.
  17. Optioneel: file system (bijvoorbeeld FAT32, NTFS) zorgen voor de indeling van de drager in blokken waar (delen van) bestanden worden weggeschreven. Elk deel wordt geïndexeerd en is zo terugvindbaar. Een file system identificeert dus de files op een harde schijf. RISICO: wanneer een file system niet wordt ondersteund, is het bestand niet terug te vinden.
  18. Onderdelen van een typisch bestand magic number: geeft indicatie van bestandsformaat byte order: indicatie van leesrichting van bytes metadata: ingebedde gegevens over het bestand (zie ook verder) content: de eigenlijke inhoud van het bestand. Deze is vaak opgedeeld in verschillende secties of onderdelen. blobs: binaire bestanden binnen ASCII bestand (bijvoorbeeld jpeg in tekst) trailer: soms wordt een bestand afgelsoten met een trailer, die extra gegevens bevat over de inhoud van het bestand (bijvoorbeeld PDF) sommige bestandsformaten voorzien in interne integrity checks, vaak in de vorm van een CRC. Een voorbeeld hiervan is het CAD-formaat DWG (niet in DXF!)
  19. Een voorbeeld van een dxf file: de structuur is relatief eenvoudig te herkennen: het is een ASCII-gebaseerd formaat.
  20. De structuur van een multipage TIFF file: het bestand begint met een header. Omdat het een multipage-tiff is (met meerdere afbeeldingen in één bestand) volgen dan een aantal tagslists met de metadata van elk beeld. Daarna volgt een verwijzing naar de plaats waar het beeld zelf begint.
  21. MPEG is een bestandsformaat voor video: Het bestaat uit verschillende streams (voor beeld, geluid, ondertiteling). Een stuk complexer dus…
  22. http://www.digitalpreservation.gov/formats/sustain/sustain.shtml
  23. CSV: https://tools.ietf.org/pdf/rfc4180.pdf CSV is een van de eenvoudigste bestandsformaten. De specificatie wordt op 2 pagina’s toegelicht. Dit formaat is zeer eenvoudig en daarom wel geschikt voor archiveringstoepassingen – toch bestaat er geen officiële standaard.
  24. TIFF: http://partners.adobe.com/public/developer/en/tiff/TIFF6.pdf Hoe zou je dit beoordelen met betrekking tot duurzaamheid?
  25. http://www.iso.org/iso/catalogue_detail?csnumber=38920 Hoe zou je dit beoordelen met betrekking tot duurzaamheid?
  26. brainstorm: hoe zou je het deze formaten beoordelen op vlak van duurzaamheid?
  27. Bestanden worden vaak geïdentificeerd op basis van de extensie. Dit is echter niet erg betrouwbaar: een extensie kan gewijzigd worden verschillende bestandsformaten delen zelfde extensies extensie zegt niets of niet veel over versie van het bestand
  28. Bestanden worden vaak geïdentificeerd op basis van de extensie. Dit is echter niet erg betrouwbaar: een extensie kan gewijzigd worden verschillende bestandsformaten delen zelfde extensies extensie zegt niets of niet veel over versie van het bestand
  29. http://www.nationalarchives.gov.uk/PRONOM/BasicSearch/proBasicSearch.aspx?status=new
  30. DROID identificeert bestanden op basis van het magic number. Als dat niet lukt, wordt het formaat geïdentificeerd aan de hand van de extensie. Die laatste methode is echter veel minder betrouwbaar. Enkele voorbeelden: TP 175 BMW Center/1 PHASE panels/SWADECOM.PRE: geidentificeerd als een presentatieformaat van Freelance Graphics (Lotus). TP 175 BMW Center/1 PHASE panels ACQ038/BMWDIREC/XTRAS/MIX/TIFFIMPO.RTE: geïdentificeerd als Revit template TP 054 Nieuw Leyden/EWR 2.8/01 Drawings/runes shortcuts/formZ Short Cuts.sct: geïdentificeerd als SAS for MS-DOS Catalog, maar behoor ttot FormZ software.
  31. Een veel gebruikte typologie van bestandsformaten Gevraagd: geef enkele voorbeelden bij elke categorie -> veel formaten kunnen ondergebracht worden bij meerdere categorieeen (bijvoorbeeld CSV: tekst en database; .doc is eigenlijk xml -> indeling is slechts hulpmiddel MIMEtypes: application text image video audio model
  32. Punten, lijnen, vlakken en volumes kunnen op twee manieren voorgesteld worden: (1) als een verzameling beeldpunten (pixels) in een vlak (raster) of ruimte (puntenwolk); (2) als punten, lijnen, vlakken of volumes met bepaalde afmetingen, relatieve positie en eigenschappen (vectoren). CAD is steeds gebaseerd op vectoren
  33. bestandsformaten ondersteunen bepaalde (niet alle) representatietechnologieën
  34. brainstorm: Wat zijn de te bewaren eigenschappen? Is dat bij elk bestand hetzelfde? Is dat bij elk archief/elke architect hetzelfde? is dat voor elke gebruiker hetzelfde? Zijn er prioriteiten?
  35. NOG UITWERKEN