PDF und PDF/A für Langzeitarchivierung
Upcoming SlideShare
Loading in...5
×

Like this? Share it with your network

Share

PDF und PDF/A für Langzeitarchivierung

  • 5,640 views
Uploaded on

PDF-Überblick, aufbau von PDF-Files. ...

PDF-Überblick, aufbau von PDF-Files.
Einsatz von PDF/A zur Langzeitarchivierung

More in: Self Improvement
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
5,640
On Slideshare
5,640
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
14
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. PDF-Struktur und PDF/A für Langzeitarchivierung
    Schnell-Einstieg in das Thema PDF und PDF/A.
    PDF-Dateistruktur
    Besonderheiten von PDF/A

  • 2. PDF = Portable Document Format
    1993 von Adobe veröffentlicht (basierend auf Postscript)
    Ziele:
    Dateiformat für elektronische Dokumente
    Unabhängig von Anwendungsprogramm
    --“-- Betriebssystem
    --“-- Hardwareplattform
    Originalgetreue Wiedergabe
    Ansicht und Ausdruck immer in der vom Author festgelegten Form
    Einbetten von Multimedia-Inhalten
    PDF - Überblick
  • 3. PDF-Versionen (bis 1.4)
  • 4. PDF-Versionen (seit 1.4)
    Quelle: http://en.wikipedia.org/wiki/Portable_Document_Format
  • 5. PDF Sub-Sets
    Quelle: http://de.wikipedia.org/wiki/Portable_Document_Format#Normen_und_Standards
  • 6. Einteilung der PDF-Struktur:
    Objekte
    Dateistruktur (Objektverweise)
    Dokumentenstruktur (Objekte <-> PDF-Komponenten)
    Aufbau der Datei:
    Sequenz von 8-Bit-Zeichen
    Max. Zeilenlänge: 255 Zeichen
    CR/LF am Zeilenende
    Case-Sensitive
    Nur druckbare ASCII-Zeichen
    Aufbau von PDF-Dateien
  • 7. Boolesche Objekte (boolean): true / false
    Zahlen (integer oder real)
    Strings (Folge von Bytes - unsigned integer)
    (Hello World, hello PDF! n)
    Als Hex: <ff02335a0>
    Namen (name)
    /Label1 /A;Name_mit_verschiedenen_Zeichen_****?
    Objekt-Typen
  • 8. Null-Objekt
    Arrays
    [11.2 (Das ist ein Feld) /Label1 false]
    Wörterbuch-Objekt (dictionary)
    «
    /Type /Beispiel1
    /Subtype /DictionaryBeispiel
    /Version 1.0
    /Subdictionary
    «
    /Schlüssel1 100
    /Schlüssel2 (Test)
    »
    »
    Objekt-Typen (2)
  • 9. Streams
    Folge von Bytes
    Inkrementelles Einlesen möglich
    Keine Fixe Größe
    Bestehen aus Wörterbuch-Objekt und Inhalt (zwischen „stream“ und „endstream“)
    Zwingend: Angabe von /Length
    Objekt-Typen (3)
    Quelle: http://blog.didierstevens.com/2008/05/19/pdf-stream-objects/
  • 10. Objekte – Streams - Filter
    Filter (kaskadierend, können Optionen enthalten) - zB:
    ASCIIHEX / ASCII85
    LZW (Lempel-Ziv-Welch): Text, Grafiken, usw – ca 2:1
    JPEG – ca 10:1
    CCITT – JBIG2: monochrome Bilder ca20-50:1
    Crypt

    http://www.adobe.com/content/dam/Adobe/en/devnet/acrobat/pdfs/PDF32000_2008.pdf (Seite 23)
  • 11. Dateistruktur
    Im wesentlichen 4 Teile:
    Head (nur 1x)
    PDF-Version
    zB%PDF-1.4
    Body (mehrfach)
    PDF-Objekte (direkte und indirekte)
    Baumstruktur
    XRef(mehrfach)
    Cross-Reference-Tabelle (indirekte Objekte)
    Trailer (mehrfach)
    Position von XRef
    Dictionary mit besonderen Informationen
    Quelle: http://www.iicm.tu-graz.ac.at/thesis/dekert.pdf
  • 12. Dateistruktur – Inkrementell
    Inkrementelles Speichern
    Schnelleres Speichern
    Rollback leicht möglich
    Ermöglicht mehrfache Signaturen
    Dateigröße wächst an
    Keine Optimierung nach Signatur!
    Quelle: http://labs.appligent.com/pdfblog/pdf_basic_file_layout.php
  • 13. Dateistruktur - Linearization
    Aka „Fast Web View“
    Umstrukturiertung der Objekte: erste Seite am Dateianfang
    Tips:
    Initial View auf „Page Only“ setzen
    Formulare nicht linearisieren
    Kein Vorteil bei einseitigen PDFs
    Doku in der Adobe Referenz mangelhaft
    Testen nur schwer möglich
    Quelle: http://labs.appligent.com/pdfblog/linearization.php
  • 14. xref
    67 7
    0000000016 00000 n
    0000000687 00000 n
    0000001193 00000 n
    0000001347 00000 n
    0000001530 00000 n
    0000002053 00000 n
    0000002621 00006 f
    Dateistruktur - XRef
    67 7 – Objekt-ID und Anzahl der Objekte in dem Abschnitt
    [blank]
    0000000016 – 10 Byte: Offset ab Dateibeginn / führende Nullen
    [blank]
    00000 – 5 Byte: Versionsnummer / Init mit 00000 / Objekt 0 = 65535
    [blank]
    n/f – f=„freies Objekt“ / n = „belegtes Objekt“
    EOF oder [blank] + CR / LF
    Immer 20 Byte je Zeile
    Größenbeschränkung durch Offset: ca. 9,3 GB
    Quelle: http://www.iicm.tu-graz.ac.at/thesis/dekert.pdf
  • 15. trailer
    « /Size 14346
    /Info 14116 0 R
    /Root 14128 0 R
    /Prev 2737603
    /ID[<6543940949663bb28cd1f1fbbbc93894>
    <f562340632c0b5acb04029e70d9c36db>]
    »
    startxref 0
    %%EOF
    Dateistruktur - Trailer
    Acrobat Reader liest PDF-Dateien von hinten
    X-RefStart-Pos: zwischen startxref und EOF
    Trailer-Wörterbuch:
    Size - Anzahl der Einträge in der XRef;
    Prev – Offset von Dateibeginn bis zum vorherigen Xref
    Root- Objektnummer des catalogdictionary
    Encrypt- Objektnummer des encryptiondictionary;
    Info- Die Objektnummer des Wörterbuches, welches den Meta-Inhalt enthält (information
    dictionary);
    ID- ein Array, bestehend aus zwei Strings; die ID dient als eindeutige Identifikation der Datei
    Quelle: http://www.iicm.tu-graz.ac.at/thesis/dekert.pdf (Seite 49)
  • 16. DocumentCatalog
    Angaben zur Dokumentenanzeige (zBPageMode)
    Page Tree(alle Seiten)
    Outline hierarchy: Lesezeichen <-> Seiten
    Articlethreads Textfluss für Artikel > 1 Seite
    Nameddestinations Namen <-> Objekte
    Interactive Forms Formularfelder
    1 0 obj
    «
    /Type /Catalog
    /Pages 5 0 R
    /Outlines 10 0 R
    /PageMode /UseOutlines
    »
    endobj
    http://www.adobe.com/content/dam/Adobe/en/devnet/acrobat/pdfs/PDF32000_2008.pdf (Seite 72)
    Quelle: http://www.iicm.tu-graz.ac.at/thesis/dekert.pdf
  • 17. Page Tree
    2 0 obj
    «
    /Type /Pages
    /Kids [ 4 0 R 10 0 R 24 0 R ]
    /Count 3
    »
    endobj
    4 0 obj
    «
    /Type /Page
    /Parent 2 0 R
    /MediaBox [0 0 612 792]
    /Resources
    «
    /Font
    «
    /F3 7 0 R
    /F5 9 0 R
    /F7 11 0 R
    »
    /ProcSet [/PDF]
    »
    /Contents 12 0 R
    /Thumb 14 0 R
    »
    endobj»
    Optimal: Balancedtree– Alle Blätter sind gleich weit von der Wurzel entfernt
    Beispiel:
    3 Seiten mit /Kids definiert
    Einzelne Seiten mit /Type /Page
    /Parent - Verknüpfung mit Page Tree
    /MediaBox– Größe der Seite
    /Resources – dictionary
    /Contents – Referenz zu Content-Stream
    /Thumb – Referenz zu Thumbnails
    Sonstiges: Annotationen / Meta-Infos / Versionierung / Größenangabe (CrobBox, TrimBox, ArtBox, BlendBox)
  • 18. Seitengeometrie
    MediaBox
    Größe des Ausgabemediums
    CropBox
    Größe für Ausgabe (Drucker, Bildschirm)
    BleedBox
    Anschnittrahmen (meist 3mm)
    TrimBox
    Endformat ohne Beschnitt
    ArtBox
    Objektrahmen
    Quelle: http://de.wikipedia.org/wiki/Portable_Document_Format#Angaben_der_Seitengeometrie
  • 19. Schriftarten eingebettet vs. verlinkt
    Fonts
    TrueType / Type1 / Type3 / OpenType
    Ca 30-40 kB pro eingebetteter Schriftart
    Subsetting vs. Fullembedding
    Ähnliche Schriftart: Multiple Master Font
    Extrahieren nicht möglich
  • 20. PDF/A - Überblick
    Ziel: Langzeitarchivierung
    2005 veröffentlicht – 2007 korrigiert
    2 Sub-Sets:
    PDF/A-1b– Level B (Basic)  eindeutige visuelle Reproduzierbarkeit
    PDF/A-1a - Level A(Accessible) eindeutige visuelle Reproduzierbarkeit als auch Abbildbarkeit von Text nach Unicode und inhaltliche Strukturierung des Dokuments (ISO 19005-1)
    Vollständigkeit der Daten
    Alle Schriftarten und Bilder eingebettet
    Kennzeichnung als PDF/A-1 mit XMP
    Eindeutigkeit
    Farb-Definition
    Eindeutige Kodierung der Schrift
    Keine Alternativen Bilder
    Zugänglichkeit
    Verschlüsselung bzw. Sperren nicht erlaubt
    Keine Dynamischen Funktionen
  • 21. PDF/A-1 a/b - Gemeinsamkeiten
    Basis für PDF/A-1: PDF 1.4
    Metadaten müssen XMP-Konform sein
    Verschlüsselung: keine Sicherheitseinstellungen möglich: Das Öffnen/Verarbeiten muss auch ohne Passwort gewährleistet sein
    Farben: Alle Farben müssen gekennzeichnet sein, geräteabhängige Farbräume müssen per OutputIntent gekennzeichnet sein. Mischen von CMYK und RGB verboten.
    Tranzparenz: nicht zulässig
    PDF-Ebenen: Nicht zulässig
    Kompression: LZW und JPEG2000 geht nicht
    Fonts: müssen eingebettet sein (zumindest als Untergruppe) / Eindeutige Kodierung der Schrift
    Anmerkungen: Sound, Movie-Kommentare gehen nicht / Normale Text-Markierungen sind zulässig
    Keine Referenzierten Objekte (nicht eingebettet)
    Alternative Bilder nicht zulässig
    JavaScript nicht zulässig
    Formulare: Mit Einschränkungen möglich (zB keine versteckten Felder, keine Aktionen)
    Aktionen: nicht zulässig
    Kein Postscript
  • 22. PDF/A-1 a/b - Unterschiede
  • 23. Ausblick: PDF/A-2
    Enthält die Änderungen von PDF 1.5, 1.6 und 1.7 (ISO 19005-2)
    PDFA/A-1 sind automatisch PDF/A-2 kompatibel (aber nicht andersrum)
    PDF/A2 beruht nicht mehr auf der Adobe PDF Referenz sondern auf ISO 32000-1
    Veröffentlichung noch für 2011 vorgesehen (Info lt. Ricoh Roadshow Mai 2011)
    Technisches Komitee:
    AIIM (http://www.aiim.org/Resources/Standards/Committees/PDFA)
  • 24. Komprimierung von PDF/A
    Derzeit erlaubt: ZIP / JPEG / CCITT
    Nicht erlaubt: LZW, da Patent-Probleme
    Künftig erlaubt: JPEG2000
    ca 30% höhere Kompressionsrate gegenüber JPEG
    JPEG: Schwächen bei Liniengrafiken, Texten, Cartoons behoben
    Idee: Ressourcen absplitten
    Quelle: http://www.pdf-tools.com/pdf/pdfa-langzeitarchivierung-iso-19005-pdf.aspx#PDFAprodukte
     
    Quelle: http://www.nets.rwth-aachen.de/content/teaching/proseminars/sub/2002_2003_ws_docs/jpeg.pdf
  • 25. Metadaten
    XMP – Extensible MetadataPlatform
    Basiert auf RDF (Resource Description Framework)
    Verwendung zB bei PDF, JPG, PNG, MP3, MP4, usw…
    Verwendung von XMP-Schemata (http://www.adobe.com/products/xmp/pdfs/whitepaper.pdf)
    2001: XMP von Adobe konzipiert (Teil von Acrobat 5.0)
    2004: Zusammenarbeit mit anderen Firmen um neues Schema zu erstellen
    2005: v 1.0 von XMP veröffentlicht
    2007: Toolkit unter BSD-Lizenz freigegeben
    Fasst Properties zusammen
    z.B. Autor, Thema, Titel in DC Schema
    z.B. Besitzer, Zertifikat, Rechte in RightsManagement Schema
    Eindeutige Namespace-URI pro Schema
    z.B. DC Schema = http://purl.org/dc/elements/1.1/
    Präfix: dc
  • 26. XMP und PDF/A
    XMP zwingend bei PDF/A
    XMP-Metadaten sind als Stream in einem Objekt gespeichert
    Binary-Daten nicht erlaubt – Konvertierung zB mit Base64
    Basieren auf XMP 2004
    Erfordert gespiegelte Einträge zum Dokumentinfo
    Strenge Regeln für XMP Schema
    Vordefinierte Schemas in PDF/A
    Dublin Core: Standard-Eigenschaften (http://dublincore.org) (zBcontributor, creator, format, language, subject)
    XMP Basic: Beschreibende Eigenschaften (zBCreateDate, CreateTool, ModifyDate)
    XMP Rights Management
    XMP Media Management (zBScanning, History)
    Adobe PDF (zBKeywords, PDFVersion, Producer)
    XMP-Erweiterungen
    Erweiterungen sind Schemas „Extension Schema Container Schema“
    Definieren neue Eigenschaften (Name, Beschreibung, Datentyp)
    Neue, komplexe Datentypen können definiert werden.
    Quellen: http://www.pdfa.org/doku.php?id=artikel:pdfa_und_metadaten_teil_4
    Und http://nestor.sub.uni-goettingen.de/seminar_bundesarchiv/docs/04-Metadaten-KK.pdf
  • 27. XMP-Toolkit
    XMP-Toolkit von Adobe (http://www.adobe.com/devnet/xmp.html)
    Sources und Samples sind in C++ und Java verfügbar
    Besteht aus 2 Teilen:
    XMPCore: zum erstellen und bearbeiten von XMP-Daten
    XMPFiles: zum auslesen von XMP-Daten
    <x:xmpmetaxmlns:x="adobe:ns:meta/" x:xmptk="Adobe XMP Core 4.2.1-c043 52.372728, 2009/01/18-15:08:04 ">
    <rdf:RDFxmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"> <rdf:Descriptionrdf:about="„ xmlns:pdf="http://ns.adobe.com/pdf/1.3/">
    <pdf:Producer>GPL Ghostscript 9.0</pdf:Producer>
    <pdf:Keywords/>
    </rdf:Description>
    <rdf:Descriptionrdf:about="„ xmlns:xmp="http://ns.adobe.com/xap/1.0/"> <xmp:ModifyDate>2011-05-23T17:23:33+02:00</xmp:ModifyDate> <xmp:CreateDate>2011-05-23T08:53:07+02:00</xmp:CreateDate> <xmp:CreatorTool>PDFCreator Version 1.2.0</xmp:CreatorTool>
    Weitere Infos
    Online XMP-Validator: http://www.pdflib.com/de/knowledge-base/xmp-metadaten/kostenloser-xmp-validator/
    Überblick zu XMP: http://www.pdflib.com/de/knowledge-base/xmp-metadaten/
    Detaillierte Spezifikation: http://partners.adobe.com/public/developer/en/xmp/sdk/XMPspecification.pdf
  • 28. Tagged PDF
    Grundlage für barrierefreie PDF-Dokumente
    Syntax ähnlich (X)HTML
    zB Lesezeichen, Alternativtexte für Bilder, Inhalte Strukturieren, usw
    Re-flow (Anpassung an das Lesegerät)
    Künftiger Standard: PDF/UA für barrierefreie Dokumente
    Nachträgliche Anpassung meist nur händisch möglich  sehr Zeitaufwendig
    Weitere Infos:
    AIIM: http://www.aiim.org/Resources/Standards/Committees/PDFUA
    ISO: http://www.iso.org/iso/iso_catalogue/catalogue_ics/catalogue_detail_ics.htm?ics1=35&ics2=240&ics3=30&csnumber=54564
  • 29. Beschränkungen
    Seitengröße
    Bis Version 3: 45x45 Zoll (ca. 1,14 m)
    Bis Version 6: 200x200 Zoll (ca. 5,08 m)
    Seit Version 7: 15.000.000x15.000.000 Zoll (ca. 381 km)
    Seitenanzahl
    Lt. Spezifikation nicht begrenzt
    Dateigröße
    Bis pdf v1.5: Max. 10 GB (Danach unbegrenzt durch XRef-Streams)
    PDF/A: Beschränkung auf max. 2 GB
  • 30. PDFs generieren
    Postscript-Umweg
    Anwendung  Postscript  PDF
    zB Adobe Distiller / Ghostscript (unzählige Wrapper verfügbar – zBRumborak)
    TIP: Es sollte ein spezieller PDF/A-Druckertreiber verwendet werden (zBeDocPrintProPDF/A http://www.pdf-signatur.at/pdf-und-pdfa-drucker/edocprintpro-pdfa.html)
    Scan + OCR + Konvertierung
    Direkt aus der Anwendung heraus
    Anwendung  PDF
    Vorteil: Tagging kann übernommen werden
    zB Adobe PDF-Writer / OpenOffice / Scribus / pdfTex
    Tip: PDF-Writer umgeht Postscript und ist schneller als der Distiller
    Via APIs aus eigenen Anwendungen
    zBXpdf (C++) / PdfLIb (C) / Reportlab (Python) / iText, pjx, pdfbox (Java) / fpdf (PHP)
  • 31. PDFs Generieren – via XML
    2 Schritte zum Konvertieren:
    Transformation mit Hilfe eines XSLT-Stylesheets in das XSL-FO-Format
    Ein PDF-Prozessor (zum Beispiel Apache FOP (Open Source - http://xmlgraphics.apache.org/fop/), Altsoft Xml2PDF (kommerziell http://www.alt-soft.com/Products_xml2pdf.aspx) erzeugt daraus das fertige PDF-Dokument.
    <?xmlversion="1.0"?>
    <fo:rootxmlns:fo="http://www.w3.org/1999/XSL/Format">
    <fo:layout-master-set>
    <fo:simple-page-master master-name="A4"
    page-width="210mm" page-height="297mm">
    <fo:region-bodyregion-name="xsl-region-body" margin="2cm"/>
    </fo:simple-page-master>
    </fo:layout-master-set>
    <fo:page-sequence master-reference="A4"> <!-- (in Versionen < 2.0 "master-name") -->
    <fo:flowflow-name="xsl-region-body">
    <fo:block>Hallo Welt!</fo:block>
    </fo:flow>
    </fo:page-sequence>
    </fo:root>
    Quelle: http://de.wikipedia.org/wiki/Extensible_Stylesheet_Language_%E2%80%93_Formatting_Objects
  • 32. PDF-Generieren – Delphi mit PDFLib
    var
    p: TPDFCanvas;
    begin
    p := TPDFCanvas.Create;
    p.OpenFile(sFileName, crBestCompressed, 'Generator', 'Author', 'Keywords', '', '', true);
    p.SetFontPath('..VorlagenBerichte', ftFontOutLine);
    p.OpenFont('Univers','UVL_____.TTF', ftFontOutLine);
    p.OpenFont('UniversBold','unvr55w.ttf', ftFontOutLine);
    p.BeginPage(21.0, 29.7, 0, 0, 0, 0);
    p.fMarginLeft := 2;
    p.fMarginTop := 4;
    p.fMarginRight := 2;
    p.fMarginBottom := 2;
    p.SetTextAt(p.fMarginLeft, 0, 3, 0, 'Hello World', tmLeft);
    p.EndPage;
    p.CloseFile;
    p.Destroy;
    end;
  • 33. PDFs validieren
    Was wird geprüft:
    für die entsprechenden Objekte werden auch die passenden Datentypen genutzt
    keine unnötige Konvertierung (zB Kreis zu Linienstücken)
    Wenig redundanter Code – Analyse der Content-Streams
    Bilder in gut komprimierenden Formaten (Analyse der XObjects)
    Tools zum Validieren:
    PDF ToolKit (http://www.pdflabs.com/tools/pdftk-the-pdf-toolkit/)
    Xpdf (http://foolabs.com/xpdf/)
    Editoren (vim, notepad, …)
    Viewer (Acrobat Reader, Xpdf)
    Rasterizer (gs, pdftoppm, …)
    Preflight von Adobe Acrobat
    3-Heights PDF Validator (http://www.pdf-tools.com/)
    Callas pdfaPilot 2 (http://www.callassoftware.com/callas/doku.php/de)
    Onlinedienst: http://www.validatepdfa.com/de/
    Software-Übersicht: http://www.pdfa.org/doku.php?id=pdfa:produkte:validieren
  • 34. PDF-Signaturen
    Ziel: Identität des Absenders feststellen
    PDF/A erlaubt nur Dokumentsignatur (PDF/A Konformität für sichtbare Signaturen - Schriftarten einbetten!)
    Eintragung ins „Signaturedictionary“ des Document-Catalogs
    Umgekehrtes Public-Key-Verfahren
    Tools zum Signieren:
    Zb Online via: http://www.buergerkarte.at/pdf-as/UpdateForm
    Weitere Tools: http://www.pdfa.org/doku.php?id=pdfa:produkte:signaturen
  • 35. Verschlüsselung / Passwortschutz
    Verschlüsseln / Passwort bei PDF/A-Files lt. Standard nicht erlaubt
    Lösungsansatz: PDF-Files unverschlüsselt anlegen, und dann auf passwortgeschütztem Volume / Datenträger ablegen
    Bis v1.4: MD5, RC4-40-128Bit,
    Ab v1.4: PKCS#7 with SHA384, SHA512, RIPEMD160, DSA up to 4096-bit, RSA up to 4096-bits
    Tools (Variable Key-Länge):
    Acrobat Onboard
    VeryPDF (http://www.verypdf.com/encryptpdf/index.htm)
    PDF Encrypt Tool v2 (http://www.pdf-convert.com/pdf-encrypt-tool/index.htm)
    A-Pdf (http://www.a-pdf.com/security/password.htm)
    PDF-Toolkit (http://www.pdflabs.com/tools/pdftk-the-pdf-toolkit/)
     
    Beispiel mit PDF-Toolkit:
    pdftk mydoc.pdf output mydoc.128.pdf owner_pwfoopass
  • 36. Tipps & Tricks
    Herausforderungen beim Konvertieren:
    Farben: Farbprofile in der Quelle fehlen – Annahmen über Farbraum müssen getroffen werden
    Schriften: Fehlende Schriften müssen ersetzt werden. Voraussetzung: Text muss als Unicode vorliegen
    Transparenz: Verflachen von Transparenz ist komplex  Gefahr von Informationsverlust
    Digitale Signaturen: Prüfen, Dokumentieren, Neu Signieren
    Platz sparen zB durch:
    Absplitten von Elementen (zB Schriftarten) und späterem Mergen (vgl. pdf-tools.com)
    Daten-Deduplizierung – zB von EMC
  • 37. Tipps & Tricks
    Best Practice bei Umwandlung von E-Mails
    Probleme: Attachment-formate, Verschiedene Informationen (Header, Body, RTF, Text Only, usw…)
    Body und Anhänge einzeln konvertieren, dann in ein Dokument zusammenfassen. Signaturen auch einzeln behandeln.
    Best Practice bei Webseiten
    Problem: Druck-Ansicht oder Bildschirm-Ansicht
    Einen Browser als Referenz festlegen / evtl. Richtlinien für archivfreundliche Seitengestaltung / entweder Bildschirm oder Druckdarstellung / Zusätzliche Inhalte speichern (zB Texte, Bilder, Fonts, Hintergründe, Flash-Previews)
  • 38. Doku / Literatur
    Allgemeiner PDF/A Überblick
    PDF/A Kompakt (gratis, aber registrierung nötig – recht guter überblick): http://www.pdfa.org/doku.php?id=pdfa:pdfa_kompakt
    Generelle Infos zu PDFs:http://www.prepressure.com/pdf/basics
    Diplomarbeit mit Allgemeinen Infos: http://www.iicm.tu-graz.ac.at/thesis/dekert.pdf
    PDF-Referenzen
    PDFlibCookbook:  http://www.pdflib.com/pdflib-cookbook/
    PDF-Bibel: http://www.pdflib.com/developer/technical-documentation/books/postscript-pdf-bibel/
    ISO-Standard 19005-1:2005 (CHF 118,-): http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=38920(Achtung: Corrigendum 1 beachten)
    PDF-Standard lt. ISO 3200: http://www.adobe.com/content/dam/Adobe/en/devnet/acrobat/pdfs/PDF32000_2008.pdf
    SchnellerÜberblick der Dateistruktur: http://www.planetpdf.com/planetpdf/pdfs/seyboldseminars/ny02/king_jim_PDFAsPackageAnnot.pdf
    Langzeitarchivierung
    Nestor-Handbuch: eine kleine Enzyklopädie der digitalen Langzeitarchivierung: http://nestor.sub.uni-goettingen.de/handbuch/nestor-handbuch_23.pdf
    Sonstiges
    Bericht über die Genauigkeit von PDF/A-Validatoren von PDFLib: http://www.pdflib.com/fileadmin/pdflib/pdf/pdfa/2009-05-04-Bavaria-report-on-PDFA-validation-accuracy.pdf
    Gute Software-Übersichtsseite: http://www.pdfa.org/doku.php?id=pdfa:produkte
    PDF/A Competence Center: http://www.pdfa.org/
  • 39. Richard Gaun
    Diplom-Wirtschaftsinformatiker
    Mail: richard@gaun.eu
    Fon: +43 (0) 680 / 123 87 87
    Twitter: RichardGaun
    IT-Consulting mit 360°-Blick.
    Kontakt