White Paper Systemarchitektur

  • 1,549 views
Uploaded on

Dieses White Paper ist das erste einer Reihe von Dokumenten, die dem technisch interessierten Leser die Architektur des DocuWare-Systems erläutern. Es werden die zugrunde liegenden Technologien …

Dieses White Paper ist das erste einer Reihe von Dokumenten, die dem technisch interessierten Leser die Architektur des DocuWare-Systems erläutern. Es werden die zugrunde liegenden Technologien erwähnt sowie ihre Anwendung durch das DocuWare-System beschrieben.

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
1,549
On Slideshare
0
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
15
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. White Paper Systemarchitektur Version 1.2 Februar 2010 DocuWare AG Therese-Giehse-Platz 2 82110 Germering
  • 2. Impressum: DocuWare AG Therese-Giehse-Platz 2 82110 Germering Telefon: +49.89.89 4433-0 Telefax: +49.89.841 9966 E-Mail: infoline@docuware.com Disclaimer: Dieses Dokument wurde nach bestem Wissen mit großer Sorgfalt zusammengestellt. Sämtliche Angaben beziehen sich auf DocuWare-Produkte ab Version DocuWare 5.1c. Es sollen im Wesentlichen die technische Grundstruktur der DocuWare-Produkte erläutert werden. Abweichungen einzelner Funktionen von der jeweils verfügbaren Version, die von geringer oder kurzfristiger Bedeutung sind, sind möglich. © Copyright 2010 DocuWare AG, alle Rechte vorbehalten. 2
  • 3. Inhalt Inhalt 1. Zielsetzung des White Papers ......................................................................... 5 2. Die Anforderungen der Zukunft ....................................................................... 6 3. Überblick Systemarchitektur ........................................................................... 8 3.1. Design-Vorgaben ..................................................................................................................... 8 3.1.1. Anforderungen aus Betreibersicht ....................................................................................................... 8 3.1.2. Anforderungen aus Benutzersicht...................................................................................................... 10 3.2. N-Tier-Architektur .................................................................................................................. 12 3.3. DocuWare-Systemarchitektur............................................................................................... 13 3.4. Betriebssysteme und Systemvoraussetzungen ................................................................. 15 3.4.1. Client-Systeme .................................................................................................................................. 15 3.4.2. DocuWare-Server .............................................................................................................................. 15 3.4.3. Infrastruktur-Komponenten ................................................................................................................ 16 3.4.4. Terminalserver ................................................................................................................................... 16 3.5. Zusammenfassung ................................................................................................................ 16 4. Authentication Server ..................................................................................... 17 4.1. Passwörter .............................................................................................................................. 18 4.2. Login im LAN/VPN ................................................................................................................. 18 4.3. Login via Internet ................................................................................................................... 19 4.4. Berechtigungskonzept .......................................................................................................... 19 4.4.1. Rollen ................................................................................................................................................ 19 4.4.2. Profile ................................................................................................................................................ 20 4.4.3. Benutzer und Gruppen ...................................................................................................................... 20 5. Content Server ................................................................................................ 21 5.1. Archiv ...................................................................................................................................... 22 5.2. Ablagestruktur........................................................................................................................ 23 5.3. Plattenkonzept........................................................................................................................ 24 5.4. Unterstützte Ablagemedien .................................................................................................. 25 5.4.1. Festplatten, RAID .............................................................................................................................. 25 5.4.2. Optische Wechselplatten ................................................................................................................... 25 5.4.3. Jukeboxen ......................................................................................................................................... 26 5.4.4. Content Adressed Storage (CAS) ...................................................................................................... 26 5.4.5. NetApp Storage ................................................................................................................................. 27 5.5. Header-Datei ........................................................................................................................... 27 5.6. Metadaten ............................................................................................................................... 28 5.7. Dokument................................................................................................................................ 29 3
  • 4. Inhalt 6. Datenbanken ................................................................................................... 30 6.1. Datenbank-Struktur ............................................................................................................... 30 6.2. Integrierte Datenbank ............................................................................................................ 31 6.3. Direkte Datenbank-Kopplung ............................................................................................... 31 6.4. Datenbank-Administration .................................................................................................... 32 7. Webbasierte Anwendungen ........................................................................... 33 7.1. Dokumentzugriff mittels Web Client .................................................................................... 33 7.1.1. Web Client Server.............................................................................................................................. 33 7.1.2. Imaging Server .................................................................................................................................. 33 7.1.3. Thumbnail Server .............................................................................................................................. 34 7.1.4. Web Instanzen ................................................................................................................................... 34 7.1.5. Web Client ......................................................................................................................................... 34 7.1.6. Click-Once Anwendungen ................................................................................................................. 35 7.1.7. Silverlight Plug-In für Web-Briefkörbe ................................................................................................ 35 7.1.8. Integration des Web Client in andere Anwendungen ......................................................................... 35 7.2. Webbasierte Administration ................................................................................................. 35 8. Process Management Framework ................................................................. 36 8.1. Workflow Server ..................................................................................................................... 36 8.2. Vordefinierte Batch-Prozesse ............................................................................................... 37 9. Volltext-Index .................................................................................................. 38 9.1. Funktionsprinzip .................................................................................................................... 38 9.2. Volltext-Tabellen und -Dateien ............................................................................................. 39 10. Verteilte und redundante Archive .................................................................. 40 10.1. Satellitenarchive..................................................................................................................... 40 10.2. Mobile Nutzer.......................................................................................................................... 41 10.3. Selbsttragende Archive ......................................................................................................... 41 11. Integration ....................................................................................................... 42 12. Skalierbarkeit .................................................................................................. 44 12.1. Clustering und Lastverteilung .............................................................................................. 45 12.2. Sonstige Performance-Maßnahmen .................................................................................... 45 13. Glossar ............................................................................................................ 46 4
  • 5. Zielsetzung des White Papers 1. Zielsetzung des White Papers Dieses White Paper ist das erste einer Reihe von Dokumenten, die dem technisch interessierten Leser die Architektur des DocuWare-Systems erläutern. Es werden die zugrunde liegenden Technologien erwähnt sowie ihre Anwendung durch das DocuWare- System beschrieben. Der Leser kann sich damit ein technisch fundiertes Urteil über das DocuWare-System bilden und die Leistungsfähigkeit im Hinblick auf Anpassungsfähigkeit, Skalierbarkeit und Performance bei bestehenden Anforderungen einschätzen. Es werden die getroffenen Maßnahmen erläutert, um einerseits Zugangs- und Zugriffssicherheit zu erreichen und andererseits Ausfälle von vorneherein zu vermeiden oder zumindest die Auswirkungen für die Benutzer zu minimieren. Weiterhin liegt ein Schwerpunkt auf den Integrationsaspekten, damit der Leser eine Vorstellung davon bekommt, wie sich das DocuWare-System im IT- Umfeld mit anderen Systemen verhält und inwieweit im Sinne des Investitionsschutzes und minimaler Administrationsaufwendungen (Total Cost of Ownership) Anpassungen erforderlich sind. Die technischen Mitarbeiter bei Kunden, Beratungsunternehmen, Fachzeitschriften und Vertriebspartnern sind gleichermaßen angesprochen. Vorausgesetzt wird lediglich technisches Grundlagenwissen über den Aufbau moderner Software-Applikationen, idealerweise von Dokumenten-Management-Systemen. Detaillierte Kenntnisse aktueller oder vorheriger DocuWare-Systeme sind nicht erforderlich. Als erstes White Paper dieser Serie gibt das vorliegende Papier einen Überblick über die Gesamtarchitektur. Des Weiteren existieren White Paper zu den Themen Sicherheit und Integrationen. 5
  • 6. Die Anforderungen der Zukunft 2. Die Anforderungen der Zukunft DocuWare ist sowohl in Deutschland als auch international einer der führenden Hersteller für Dokumenten-Management-Systeme. Dies ist das wichtigste und beste Urteil über die Qualität und Leistungsfähigkeit der Systeme. Ein Erfolgsfaktor ist die intuitive Installation, Bedienung und Administration des Systems. Der Erfolg führt dazu, dass DocuWare-Systeme in zunehmend größeren und komplexeren Installationen eingesetzt werden. Dieses White Paper zeigt auf, dass das DocuWare-System technisch für diese größeren und komplexeren Umgebungen vorbereitet ist und auch ein solides Fundament für die Anforderungen der Zukunft bildet. Bei dem Wettbewerb um größere und komplexere Installationen misst sich DocuWare mit anderen Konkurrenten als bisher, die aber größtenteils ihre Komplexität nach außen tragen. DocuWare hingegen hält es für wichtig, die bisherigen Erfolgsfaktoren zu erhalten und weiterhin führend in der Einfachheit bei Installation, Bedienung und Administration zu sein. Obwohl heute nach wie vor eindeutig die konventionelle Nutzung von Archiven dominiert, ist die Marktentwicklung hin zum „Integrierten Dokumenten-Management (IDM)“ und langfristig hin zu „Enterprise Content Management“-System abzusehen. Während die inhaltliche Definition bzgl. Enterprise Content Management (ECM) noch nicht abgeschlossen ist, sind die Anforderungen des IDM in großen Teilen bereits heute aktuell und werden auch durch die DocuWare-Systeme größtenteils abgedeckt. Abbildung 1: Einsatzgebiete und Umsetzung der IDM-Anforderungen in DocuWare Integriertes Dokumenten-Management muss unabhängig sein von „Zeit und Raum“. Das heißt, es muss überall verfügbar sein, unabhängig davon, ob sich der Benutzer in der Unternehmenszentrale, in einer Niederlassung, beim Kunden oder im Home-Office befindet. Dazu gehört auch, dass die Ablage von Dokumenten nicht zwangsweise dort erfolgen muss, wo die Dokumente anfallen, und dass die Dokumente unabhängig von dem Ort, von dem aus sie archiviert wurden, zur Verfügung stehen. 6
  • 7. Die Anforderungen der Zukunft Hinzu kommen die unterschiedlichen Anforderungen der Kunden. Teilweise müssen enorme Dokumentmengen erfasst und abgespeichert werden, obwohl wenige Zugriffe stattfinden. Teilweise handelt es sich um relativ geringe Dokumentvolumen, auf die durch sehr viele Benutzer aus unterschiedlichen Lokationen kontinuierlich zugegriffen werden muss. Eine Differenzierung zwischen den Systemen und die Bewertung der Eignung für große/komplexe Installationen müssen daher heute vor allem aufgrund der Systemarchitektur erfolgen. Wichtig ist die Evaluierung der folgenden Kriterien:  Administration Intuitive und einheitliche Administration für das Gesamtsystem zur Reduktion der Wartungskosten, einem Teil der Total Cost of Ownership (TCO).  Skalierbarkeit Um die Anforderungen zu erfüllen, kann es notwendig sein, ein großes standortübergreifendes System zu realisieren oder aber mehrere kleinere Installationen, falls dies den organisatorisch-technischen Gegebenheiten besser entspricht. Auf jeden Fall braucht der mobile Nutzer die Möglichkeit, Teilarchive auf seinem Notebook zu transportieren. Es versteht sich von selbst, dass diese unterschiedlichen Anforderungen nicht mit verschiedenen Systemen, sondern mit der gleichen Technik in unterschiedlichen Ausbaustufen abgedeckt werden sollen.  Sicherheit Speziell bei Archiven spielt das Thema Sicherheit in den unterschiedlichsten Facetten eine große Rolle. Einerseits ergibt sich über die Grundforderung der Revisionssicherheit bereits die Notwendigkeit zumindest Datenverluste bei Ausfällen zuverlässig zu vermeiden. Ist der Kunde von der Verfügbarkeit des Systems abhängig, was zunehmend der Fall ist, so ergeben sich erhöhte Anforderungen an die Ausfallsicherheit. Weiterhin spielt die Abbildung der organisatorischen Kompetenzen und Befugnisse eine wesentliche Rolle. Die für den Benutzer verfügbare Funktionalität und die zugreifbaren Dokumente müssen im Sinne der Zugangs- und Zugriffssicherheit flexibel nach organisatorischen Gesichtspunkten eingeschränkt werden können.  Integrationsfähigkeit Die Verfügbarkeit von Schnittstellen, die Nutzung vorhandener IT-Infrastruktursysteme, die Einhaltung von Standards und die Offenheit bzgl. Systeminternas sind die bestimmenden Elemente für die Integrationsfähigkeit in die heutigen komplexen und heterogenen IT-Landschaften.  Migrationsfähigkeit Bekanntlich hat die Informationstechnik sehr kurze Innovationszyklen, während die Archive teilweise eine sehr lange Lebensdauer haben. Migration hat somit viel mit der oben erwähnten Integrationsfähigkeit zu tun. Hinzu kommen Kompatibilitätsanforderungen bzgl. der Systemgenerationen sowie Migrationstools. In dem vorliegenden Dokument liegt der Schwerpunkt auf der Gesamtarchitektur. Zu den Themen Sicherheit und Integrationsfähigkeit existieren weitere White Paper, die die Details zu den genannten Aspekten beschreiben. 7
  • 8. Überblick Systemarchitektur 3. Überblick Systemarchitektur 3.1. Design-Vorgaben Die Architektur des DocuWare-Systems wurde gezielt entwickelt, um ein stabiles Fundament für die heutige Funktionalität wie auch für die absehbaren zukünftigen Anforderungen zu bilden. Um die volle IDM-Funktionalität in großen und komplexen Installationen anbieten zu können und die aufgeführten Anforderungen an Skalierbarkeit, Integrationsfähigkeit etc. zu erfüllen, wurden die Design-Vorgaben unterteilt in  Anforderungen aus Betreibersicht und  Anforderungen aus Benutzersicht. 3.1.1. Anforderungen aus Betreibersicht Zu den Anforderungen aus Betreibersicht gehören:  Mandantenfähigkeit, Unterstützung ASP-Modelle (Application Service Provider)  Eignung für Betrieb in externen Rechenzentren  Unterstützung browserbasierter Web-Zugriffe  Unterstützung unterschiedlicher Sprachräume  Unterstützung komplexer Installationen über mehrere Standorte hinweg  Unterstützung sehr großer, revisionssicherer Dokumentablagen  Offenheit für System-und Speichertechnologien  Zusammenführung und Erweiterung der Workflow- und Automatisierungsfunktionen in einem Process Management Framework  Administration sämtlicher Module über ein Werkzeug  Optimaler Betrieb im Microsoft-Umfeld  Optimale Einbindung von Datenbanktechnologien der führenden Anbieter, unabhängig vom Betriebssystem Diese Anforderungen werden im Folgenden kurz beschrieben, weil sie wesentlich für die Gestaltung der Systemarchitektur waren. Mandantenfähigkeit und ASP-Unterstützung DocuWare-Systeme sind voll mandantenfähig, d.h. ein Outsourcing-Dienstleister kann ein System für unterschiedliche Kunden betreiben. Für jeden Kunden können Nutzer, Ablagen, Funktionsmodule, Sprachunterstützung etc. völlig unabhängig voneinander definiert werden, ohne Rücksicht auf die Einstellungen in anderen Mandanten nehmen zu müssen. Dazu gehört natürlich auch, dass mehrere völlig unterschiedliche Archive, z.B. für unterschiedliche Mandanten, mit verschiedenen Ablagestrukturen und/oder unterschiedlichen Speicher- technologien gemeinsam in einem DocuWare-System betrieben werden können. Realisiert wird dies durch die Definition verschiedener „Organisationen“ in der Administration, wobei jede „Organisation“ für einen Mandanten steht. Weiterhin ist es möglich, für jeden Kunden eigene Administratoren mit entsprechenden Rechten zu definieren und damit auch zeitlich parallel kundenspezifische Konfigurationen vorzunehmen. 8
  • 9. Überblick Systemarchitektur Lediglich die Änderungen an Hardware und Basiskonfiguration, z.B. Art und Anzahl Server, die das Gesamtsystem betreffen, erfordern eine abgestimmte Vorgehensweise. Dazu ist ein separater „System-Administrator “ vorgesehen, der zwar befugt ist, solche Systemänderungen durchzuführen, aber bzgl. der Datenbestände einzelner Mandanten durchaus in seinen Rechten begrenzt sein kann. Über die Protokollierung kann die Nutzung nachvollzogen und Sicherheit hergestellt werden. Über die eingebaute Protokollierung ist auch eine Abrechnungsbasis für den Betrieb im ASP- Modell verfügbar. Ein DocuWare-Betreiber kann daher als Dienstleister für mehrere Kunden unterschiedliche DocuWare-Konfigurationen gleichzeitig fahren. Web-Zugriffe Mit dem Web Client bietet DocuWare die Möglichkeit, über Internet/Intranet/Extranet auf die DocuWare-Archive zuzugreifen. Alle wesentlichen Funktionen, wie Dokumente öffnen, mit Anmerkungen und Stempeln versehen, Indexbegriffe ändern und Dokumente ablegen, stehen so unabhängig vom Arbeitsplatz und ohne Installation am Client-Rechner zur Verfügung. Mehrere Sprachräume Als internationaler Anbieter ist die volle Unterstützung der wichtigsten romanischen, germanischen, slawischen und Sprachen sowie Japanisch und Arabisch eine wesentliche Anforderung. Dazu gehört nicht nur die Übersetzung der Oberflächenelemente, sondern z.B. auch die Unterstützung verschiedener Zahlen- und Datums-Formate. DocuWare nutzt auf der Serverseite und bei den neueren Client-Komponenten den Unicode. Unicode-Zeichen (UTF8) werden sowohl für die Oberflächen als auch für die Datenhaltung benutzt. Damit können in einem Archiv Dokumente und zugehörige Indexdaten aus unterschiedlichen – auch asiatischen - Sprachräumen gemeinsam verwaltet werden. Dies gilt auch für die Nutzung des Volltext-Index. Standortunabhängigkeit Um in größeren Organisationen als Infrastruktur dienen zu können, müssen die Systeme standortübergreifend funktionieren. Standortübergreifende Archive und Teilarchive, Kommunikation zwischen den Komponenten über WAN-Technologie, entfernte Administration und Synchronisationsmechanismen sind daher wesentliche Bestandteile der Architektur. Große, revisionssichere Installationen Die heutige Hardware erlaubt die Speicherung enormer Informationsmengen, so dass viele Kunden bereits über gewaltige Archive verfügen. Die Software sollte dafür keine Begrenzung darstellen. Es wurde darauf geachtet, dass das DocuWare-System beliebig große Dokumentmengen mit der vollen Funktionalität, inkl. Sicherheitsfunktionen verarbeiten kann. Offenheit für System- und Speichertechnologien Aufgrund der oben geschilderten Notwendigkeit, sich in heterogene IT-Landschaften optimal integrieren zu können, wurde großer Wert auf die Unterstützung und Nutzung bestehender De-facto-Standards gelegt. Dies bezieht sowohl die Nutzung von vorhanden Directory-, Datenbank- und Mail-Servern, als auch die Offenheit für unterschiedliche Speichertechnologien mit ein. 9
  • 10. Überblick Systemarchitektur Process Management Framework Im täglichen Betrieb eines DMS gibt es viele Routineaufgaben, z.B. zur Dokumentüber- nahme aus Datenquellen, die sich weitgehend automatisieren lassen. Gleichermaßen ergeben sich bei den Benutzern – vor allem in administrativen Bereichen – häufig gleichartig wiederkehrende Abläufe. Es bestand daher die Forderung, ein leistungsfähiges Werkzeug für die Automatisierung von sowohl systeminternen als auch von benutzerorientierten Abläufen zu entwickeln. Die Anforderungen an modernes Dokumenten-Management gehen heute über die reine Informationssammlung und -bereitstellung weit hinaus. Eine weitestmögliche Automatisierung erfordert flexibel definierbare Prozesse für die Dokumenterfassung und Weiterverarbeitung. Darüber hinaus steuern Dokumente heute vielfältig Arbeitsabläufe in den Organisationen. Die elektronische Abbildung dieser Prozesssteuerung durch Dokumenten- Workflow-Funktionen gehört zu den Aufgaben des Dokumenten-Managements. Das DocuWare-System verfügt zu diesem Zweck über den Workflow Server, der sämtliche Automationsprozesse steuert und als Workflow-Engine für den Dokumenten-Workflow dient. Administration sämtlicher Module über ein Werkzeug Komplexe Systeme, mit vielen Modulen, Schnittstellen und Optionen neigen zu exponentiell steigendem Administrationsaufwand. Der Name DocuWare steht hingegen für einfach zu installierende, zu bedienende und zu administrierende Systeme. Dieses Ziel wird auch in Zukunft weiterverfolgt. Somit bestand die Forderung, auch große und komplexe Installationen über ein zentrales, einfach zu handhabendes Werkzeug administrieren zu können. Datenbanktechnologien der führenden Anbieter Optimale Einbindung von Datenbanktechnologien der führenden Anbieter unabhängig vom Betriebssystem ist erforderlich, um das DocuWare-System möglichst transparent und problemlos in die bestehenden Infrastrukturen einbinden zu können. Diese Anforderung ergibt sich sowohl aus Gründen des Investitionsschutzes als auch wegen der effizienteren Administrierbarkeit. Offenheit für unterschiedliche Speichertechnologien Verschiedene Speichertechnologien stehen seit geraumer Zeit in einem harten Wettbewerb zueinander. Die jeweiligen Stärke- / Schwäche-Profile ändern sich entsprechend schnell. Andererseits müssen Archivsysteme effiziente und sichere Ablagen über lange Zeiträume gewähren. Offenheit für unterschiedliche Speichertechnologien, unabhängig vom Betriebssystem ist daher entscheidend, um diese Sicherheit und Effizienz über die gesamte Ablagezeit zu erreichen. 3.1.2. Anforderungen aus Benutzersicht Auch wenn die Anforderungen aus Betreibersicht essentiell für die Systemarchitektur sind, so ergibt sich der Nutzen für den Anwender dennoch aus der Funktionalität des Dokumenten-Management-Systems. An dieser Stelle sind die Funktionen summarisch aufgelistet, um einen Überblick der Anforderungen zu geben. Detaillierte Beschreibungen sind der entsprechenden Produktliteratur und der DocuWare Web-Site zu entnehmen (www.docuware.com). 10
  • 11. Überblick Systemarchitektur Kategorie Abdeckung heute Imaging Voll integrierter Scan-Client Flexible Integration von Netzwerkscannern und Digitalkopierern, zum Teil mit direkten Konnektoren Integrierte Funktionen für die Bildverbesserung Barcode-Erkennungen, zonenbasierte und Volltext-OCR Dokumentklassifikation Dokument-Viewer mit hoher Darstellungsqualität, umfangreichen Funktionen und breiter Formatunterstützung, sowohl im Web- als auch im Windows-Client Integration von High-End Imaging- und Klassifikationswerkzeugen (Ascent Capture, VRS, AnyDoc …) COLD/ERM High Performance COLD mit effizientem Speicherformat Flexible Anpassung von Spool-Dateien an Klassifizierungsregeln Schneller Import von Spool-Dateien Tiff-Drucker als leistungsstarke Komponente für das Imaging Integration Leistungsstarker Konnektor für SAP R/3 Archivierungs- und Recherchekonnektor für Notes / Domino Konnektor zu SharePoint Integration für die Mail-Archivierung aus Outlook und Exchange Einfache, menügeführte Integration in fast alle Windows-Anwendungen Integration des Web Clients oder einzelnen Elementen davon in andere Anwendungen über URL Konnektoren zur direkten Anbindung von Multifunktionskopierern verschiedener Anbieter Verschiedenste Programmierschnittstellen zur Ansteuerung von DocuWare aus anderen Anwendungen heraus Das White Paper Integrationen bietet Ihnen eine detaillierte Beschreibung der Integrationsmöglichkeiten von DocuWare Dokumenten Volle Viewer-Unterstützung für viele Formate „Codierter Informationen (CI)“, Management einschließlich umfassender Anmerkungs-Funktionen Automatischer Import und Klassifizierung von CI-Dateien, einschließlich E-Mail und Office-Dateien Sichere Locking-Mechanismen für das Bearbeiten von CI-Dateien mit ihren Originalprogrammen Überwachung der Manipulation von CI-Dateien durch Checksummen-Funktionen und elektronische Signaturen Check-in / Check-out für einfaches Versionsmanagement Herunterladen oder Versenden von Dokumenten im Original- oder PDF-Format Records Revisionssichere Archivierung aller Arten von CI- und NCI-Dokumente (NCI=Nicht Management Codierte Information) Export- und Migrationsfunktionen Verwaltung und Überwachung von Aufbewahrungsfristen Flexible Zugriffssicherung durch die Integration der Netzwerk-User-Directories Protokollierung der Benutzerzugriffe auf die Dokumente 11
  • 12. Überblick Systemarchitektur Repository Unterstützung aller Arten von Speichertechnologien Universelle Datenbankunterstützung, incl. Volltext Offene, standard-basierte Architektur Voll skalierbar Flexible Zugriffskontrolle Elektronische Signaturen Umfangreiche Administrationswerkzeuge Unterstützung marktführender Sicherheits- und Backuptechnologien Windows- und Beide Clients einfach zu benutzen und zu administrieren Web-Client Abdeckung aller Imaging und Dokumentenmanagement-Funktionen mit einem einheitlichen, durchgängigen Benutzerinterface Web-Client nahtlos in fast alle Web-Anwendungen integrierbar Workflow Einfacher regelbasierter Dokumenten-Workflow für Ad-hoc- und Production- Workflow Herausragende Benutzerfreundlichkeit durch den Einsatz der Stempeltechnologie Automatisches Document Batch Processing Sonstige ECM Nahtlose Integration von IDM-Funktionen in Web-Seiten Steuerung der Dokumentbereitstellung im Web über Standard-IDM-Funktionen in DocuWare Offene Architektur des Dokumenten-Repositorys ermöglicht die Aufnahme aller Digital-Asset-Typen In den folgenden Kapiteln wird dargestellt, wie die oben beschriebenen Anforderungen in der Systemarchitektur umgesetzt wurden. 3.2. N-Tier-Architektur Die Architektur des DocuWare Systems folgt dem „N-tier-Konzept“, das eine Weiterentwicklung des Client-Server-Konzepts darstellt. Das Konzept charakterisiert sich dadurch, dass  stark dialogorientierte Funktionen auf den Arbeitsplatzsystemen ablaufen,  die Applikationslogik auf einem oder mehreren zentralen DocuWare-Servern lokalisiert ist,  mehrere Applikationen gemeinsame Ressourcen auf einem oder mehreren zentralen Hintergrund-Servern nutzen. Wie schon im klassischen Client-Server-Konzept, so steht auch hier der Begriff Server für einen Software-Dienst und nicht für eine Hardware. Ein DocuWare-System besteht in diesem Sinn immer aus mehreren (Software-)Servern, die aber - im Extremfall - alle auf einem Hardware-System gleichzeitig ablaufen können. 12
  • 13. Überblick Systemarchitektur Abbildung 2: Grundsätzliche Produktarchitektur 3.3. DocuWare-Systemarchitektur An dieser Stelle geben wir einen Überblick über die Architekturkomponenten. Die einzelnen Komponenten werden anschließend in eigenen Kapiteln detaillierter beschrieben. Ein DocuWare-System besteht mindestens aus den folgenden Software-Komponenten:  Windows-Client Um die Möglichkeiten der N-Tier-Architektur optimal zu nutzen, sind dialogintensive Funktionen in der Client-Komponente auf jedem Arbeitsplatz zusammengefasst. Damit wird ein Optimum an Bedienkomfort und Performance erreicht. Weiterhin enthält der Windows-Client immer auch einen Scan-Client, so dass diese Funktionalität –bei Verfügbarkeit eines Scanners am Arbeitsplatz – direkt bereit steht. Durch die Bereitstellung der Scan-Funktionalität an jedem Client-Arbeitsplatz soll dem Trend zum dezentralen Scannen Rechnung getragen werden. Dabei wird das Ziel verfolgt, dem einzelnen Anwender die Erfassung von Informationen so einfach wie möglich zu machen.  Authentication Server Der Authentication Server verwaltet sämtliche Ressourcen und Benutzer. Er ist die zentrale „Schaltstelle“, die Anmeldungen (Login) entgegennimmt, Berechtigungen prüft, Funktionen frei gibt und Ressourcen, z.B. Server den Benutzern zuweist.  Content Server Der Content Server verwaltet die logischen Archive. Er bedient sich dazu der Datenbank zur Verwaltung der Indexdaten und sonstigen Anmerkungen zu den Dokumenten. Die Dokumente selbst werden zusammen mit der Header-Datei in der Dateiablage abgelegt (siehe Kapitel 5 „Content Server“). 13
  • 14. Überblick Systemarchitektur Abbildung 3: Systemarchitektur Minimalsystem Aus diesem Basissystem heraus ist das DocuWare-System funktional ausbaufähig und in feinen Stufen skalierbar. Das folgende Bild zeigt beispielhaft  die funktionale Ergänzung um Prozess-Server,  die Einbindung von Web-Clients mittels Web Client Server,  die Nutzung separater Hardware-Systeme für  Authentication Server und Workflow Server einerseits und  Content Server andererseits,  Datenbank und Dateiablage Abbildung 4: Funktional erweitertes und optimiertes System  Workflow Server Der Workflow Server steuert sämtliche Automations- und Workflowprozesse. Zu den Automationsprozessen gehören z.B. Dokumentenimport, -export, Archivsynchronisation, Migration und Volltext-Indexierung.  Web Client Server und Imaging Server Über den Web Client Server, der wiederum auf den Imaging Server zugreift, können Web Clients eingebunden werden. Die Nutzer dieser Clients benötigen lediglich einen Browser (Internet Explorer oder Firefox) und können damit Dokumente in DocuWare- Archiven ablegen, recherchieren, anzeigen, mit Anmerkungen und Stempeln versehen und vieles mehr. 14
  • 15. Überblick Systemarchitektur Die Kommunikation zwischen den Komponenten erfolgt über Standard-Protokolle wie TCP/IP und HTTP. Damit können auch standortübergreifende Systeme problemlos durch die Nutzung der Internet-Technologie realisiert werden. Entsprechend dem Sicherheitsbedürfnis ist die Kommunikation auch über VPN (Virtual Private Network) machbar. Abbildung 5: Standortübergreifende Archive mit Master (m) und Satellite (s) Diese Architektur erlaubt nicht nur den wechselseitigen Zugriff auf entfernte Archive, sondern ebenfalls den Aufbau von redundanten Archiven, um unabhängig von Standort und Übertragungskapazität auf den gleichen Archiven arbeiten zu können. Unabhängig von der Art des Archivs („Master“ oder „Satellite“) kann in beiden Standorten die volle DocuWare- Funktionalität inkl. Übernahme beliebiger Dokumente genutzt werden. Die Synchronisation zwischen „Master“ und „Satellite“ erfolgt über den Workflow Server (siehe 8.1). Die gewählte Architektur folgt damit vor allem den Anforderungen zur Skalierung über Standortgrenzen hinaus in regional weit verzweigte Betriebsstätten einer Organisation. 3.4. Betriebssysteme und Systemvoraussetzungen 3.4.1. Client-Systeme Auf der Client-Seite werden sämtliche Versionen von Microsoft Windows ab Version Windows XP unterstützt. D. h. für diese Windows-Versionen ist ein Rich-Client verfügbar, der sämtliche Funktionen des DocuWare-Systems zugänglich macht. Über den Web Client Server können Benutzer mittels eines Web Browsers auf DocuWare zugreifen.. Für den vollen Funktionsumfang bestehen für diese Web Clients folgende Voraussetzung: Windows XP oder höher und Internet Explorer ab Version 6 oder Firefox ab Version 2. Der Web Client kann aber auch mit Firefox auf Mac- oder Linux-Systemen verwendet werden. (Einschränkungen im Funktionsumfang siehe 7.1.6 Click-Once Anwendungen und 7.1.7 Silverlight Plug-In für Web-Briefkörbe.) 3.4.2. DocuWare-Server Die Server des DocuWare-Systems sind auf Basis der .NET-Architektur von Microsoft realisiert. Durch die Optimierung auf die Microsoft-Plattformen sind Installation und Administration erheblich vereinfacht und es wurde maximale Performance erzielt. 15
  • 16. Überblick Systemarchitektur Obwohl das DocuWare-System eine Reihe eigener Server umfasst, benötigt es keine Windows-Server-Lizenz, sondern lediglich die „Windows-Engine“. Damit ergeben sich klare Vorteile bei der Wirtschaftlichkeit des Systems, auch bei Installationen mit mehreren DocuWare-Servern. DocuWare Server sind somit auf allen Plattformen lauffähig, die eine der Versionen Windows XP/2003 oder höher unterstützen. 3.4.3. Infrastruktur-Komponenten Essenziell benötigt DocuWare eine Datenbank und eine Dateiablage. Mit MySQL ist bereits eine leistungsfähige Datenbank im Basissystem enthalten. Als Dateiablage kann ein DocuWare Server beliebiges Windows-Dateisystem, z.B. das der Content Server-Plattform genutzt werden. Für beide Aufgaben werden häufig dedizierte, bereits vorhandene File Store User Directory Database Hardwaresysteme genutzt, die eventuell LDAP auch auf Nicht-Windows-Plattformen lokalisiert sind. Auch diese „Ressourcen“ Active können mit DocuWare genutzt werden. Directory NT Domain Abbildung 6: Integration Offene Systeme 3.4.4. Terminalserver Die Lauffähigkeit des DocuWare-System unter Nutzung des Microsoft Terminalserver und der Citrix Metaframe Erweiterungen wurde ausgiebig getestet. Somit ist die Nutzung durch sehr einfache Windows-Stationen in diesem Umfeld gewährleistet. 3.5. Zusammenfassung DocuWare-Systeme lassen sich optimal in vorhandene IT-Landschaften integrieren, ohne dass redundante Installations- und Administrationsaufwendungen, z.B. für Datenbanken oder eine zusätzliche Benutzerverwaltung, anfallen. Zusammenfassend kann man festhalten, ein DocuWare-System besteht immer aus  einem oder mehreren DocuWare-Clients,  einem Authentifizierungs-Server,  einem oder mehreren weiteren DocuWare Server-Modulen. Mindestens ein Content Server muss vorhanden sein. Dieser Content-Server greift immer zu auf  eine oder mehrere Datenbanken, ggf. auf fremden Servern,  eine oder mehrere Dokumentablagen. Für Web-Clients und automatisierte Prozesse stehen weitere Server-Module für funktionale Erweiterungen zur Verfügung. Die Server-Funktionalität kann auf vielen Hardware-Systemen verteilt sein. Die Integration mit „Nicht-Windows“-Systemen ist möglich. 16
  • 17. Authentication Server 4. Authentication Server Der Authentication Server verwaltet sämtliche Benutzer und Ressourcen des Gesamtsystems. Die Nutzung des Systems erfordert zunächst immer eine Anmeldung am Authentication Server. Er ist zuständig für  das Login der Benutzer,  die Lizenzverwaltung,  die Verwaltung der benutzerspezifischen Einstellungen. Damit DocuWare mandantenfähig sein kann, sind Benutzer „Organisationen“ zugeordnet, die über den Authentication Server verwaltet werden. Eine Organisation ist damit eine logische Struktur. Diese umfasst:  Benutzer und Benutzergruppen  Logische Archive, inkl. zugehöriger Platten  Prozesse  Templates für Stempel, Erkennungsschemata für OCR (Optical Character Recognition) und Barcode, Auswahllisten  Protokollierung Pro DocuWare-System existiert genau ein Authentication Server, der organisationsübergreifend agiert. Um Ausfällen vorzubeugen oder eine sehr hohe Anzahl von Benutzeranfragen besser bedienen zu können, kann der Authentication Server redundant installiert sein. Benutzt wird der Authentication Server somit durch  eine oder mehrere Organisationen mit jeweils  mindestens einem oder vielen Benutzern. DocuWare arbeitet mit internen User-IDs statt mit dem Benutzernamen des Login. Nur diese User-IDs dienen als Datenbank-Schlüssel. Somit können Benutzer jederzeit umbenannt werden, ohne die zugeordneten Einstellungen ändern zu müssen. Abbildung 7: Authentifizierung 17
  • 18. Authentication Server Bei der Anmeldung eines Benutzers überprüft der Authentication Server auch die Lizenzen für die verschiedenen DocuWare-Server, die diesem Nutzer zur Verfügung stehen. Es werden sowohl „Concurrent Licenses“ als auch „Named Licenses“ unterstützt. 4.1. Passwörter Passwörter werden generell verschlüsselt bzw. als Hash-Wert abgespeichert. Dies gilt auch für Systemeinstellungen, wie z.B. das Login beim Datenbank-Server. Konkret wird das sogenannte „salted“ Hash-Verfahren verwendet, bei dem durch Kombination mit einem Zufallswert auch bei zwei identischen Passwörtern nicht der gleiche Hashwert entsteht. Passwörter sind damit weder lesbar noch reproduzierbar Die Möglichkeiten des Login werden bei der Definition des Benutzers spezifiziert. Die Benutzerverwaltung obliegt dem Organisations-Administrator. 4.2. Login im LAN/VPN Unterstützt werden die folgenden Methoden für das Login:  DocuWare Login Der Benutzer muss sich über Benutzernamen und Kennwort, wie in DocuWare hinterlegt, als berechtigt ausweisen. Unabhängig von den verschiedenen DocuWare Servern muss sich der Benutzer nur einmal einloggen.  Trusted Login (Single Sign-On) Der Client identifiziert sich – ohne weitere Benutzereingabe – über den Login-Namen des Windows-Betriebssystems. Der Authentication Server prüft den Login mittels der Benutzerverwaltung von Windows. Über dieses Verfahren ist auch die Kooperation mit anderen Single-Sign-On-Systemen möglich. Unterstützt werden dabei Verzeichnisdienste auf Basis von LDAP und Windows Active Directory. Login in DocuWare erfolgt immer über den Authentication Server. Das Login-Verfahren enthält gleichzeitig die Prüfung der für den Nutzer verfügbaren Lizenzen. DocuWare arbeitet mit einem „Ticket-Granting-Ticket“ (TGT), bei dem ein Benutzer bzw. Client sich am Authentication Server identifiziert, um einen Service nachfragt, ein „Ticket“ erhält und mit diesem Ticket den Service eines anderen Servers, z.B. eines Content Server, nutzen kann. Um sich am Authentication Server zu identifizieren, benötigt der Client „Credentials“, die er – wie oben erläutert –entweder über die Benutzereingabe (DocuWare- Login) oder durch die Windows-Benutzerverwaltung (Trusted-Login) erhält. Der Authentication Server hat damit die zentrale Kontrollfunktion über die Sessions im System und kann somit einerseits Sicherheitsvorgaben umsetzen und auch bei Ausfall oder Überlastung von einzelnen Servern aktiv reagieren. Die Kommunikation zwischen Client und Servern und zwischen den Servern erfolgt gesichert. Unterstützt werden die Protokolle NTLM und Kerberos. Zwischen den DocuWare- Servern wird wegen der höheren Sicherheit optional Kerberos genutzt, bei der Kommunikation mit externen Systemen wird nach Möglichkeit ebenfalls Kerberos benutzt. Lediglich wenn das Partner-System dies nicht unterstützt, z.B. bei älteren Windows- Versionen, wird aus Kompatibilitätsgründen auch NTLM angewendet. 18
  • 19. Authentication Server Abbildung 8: Ticket-Granting-Ticket-Verfahren Die einzelnen Authentifizierungsschritte des Ticket-Granting-Ticket-Verfahrens laufen ohne für den Benutzer spürbaren Zeitverzug im Hintergrund ab. 4.3. Login via Internet Prinzipiell erfolgt die Anmeldung entfernter Nutzer über die Web-Technologie ähnlich dem beschriebenen Verfahren für DocuWare-Login für LAN-/VPN-Nutzer. Jedoch findet die Kommunikation nicht direkt zwischen Web-Client und DocuWare-Server statt, sondern es ist der Web Client Server zwischengeschaltet, der von IIS (Internet Information Services) gehostet wird. Ggf. sind auch noch Proxy-Server und Firewalls zwischengeschaltet, die jedoch auf den Ablauf der hier beschriebenen Sessions keinen Einfluss haben. 4.4. Berechtigungskonzept Mitarbeiter in großen Organisationen absolvieren komplexe Abläufe und unterliegen einer Vielzahl von Regularien. Um ihre Aufgaben erfüllen zu können, benötigen sie Berechtigungen zur Benutzung vorhandener Funktionen, Daten und Dokumente. Dabei sind auch Beschränkungen erforderlich, um nur berechtigten Personen bestimmte Befugnisse erteilen zu können und um die Übersichtlichkeit für alle Beteiligten zu erhalten. 4.4.1. Rollen Das DocuWare-System bedient sich dafür neben den „Benutzergruppen“ des so genannten Rollenkonzeptes, bei dem „Rollen“ definiert werden können, denen dann wiederum Berechtigungsprofile (Sammlung von Einzelrechten) zugeordnet werden können. Die „Rolle“ fasst somit Berechtigungen und keine Benutzer zusammen. Sie richtet sich typischerweise an den notwendigen Rechten für die Erfüllung einer bestimmten Aufgabe in einem betrieblichen Prozess aus. Durch die Zuordnung einer Rolle zu einem Benutzer oder einer Gruppe von Benutzern, erhalten diese die Berechtigungen, die in den entsprechenden Profilen vordefiniert wurden. Eine Rolle verfügt über ein oder mehrere Profile, das die ausführbaren Funktionen definiert und ein oder mehrere Profile, die die Zugriffe auf die abgelegten Dokumente bestimmen (siehe „Funktionsprofil“ und „Archivprofil“ im Glossar). Einem Benutzer oder einer Gruppe können eine oder mehrere Rollen zugewiesen sein. 19
  • 20. Authentication Server Abbildung 9: Berechtigungskonzept (Bx = Berechtigung, Ux = Benutzer) 4.4.2. Profile Es können mit einer Position bzw. einer „Rolle“ in einer Organisationseinheit ganz unterschiedliche Aufgaben mit der Notwendigkeit für mehrere Berechtigungen zusammenhängen. Daher werden die Einzelberechtigungen zu Profilen zusammengefasst. So können beispielsweise einer Rolle „Chefeinkäufer“ die Profile für das Genehmigen von Urlaubsanträgen und für das Einkaufen komplexer IT-Systeme zugewiesen werden, weil beide Aufgaben mit dieser Position verbunden sind, obwohl sie miteinander direkt nichts zu tun haben. Generell wird unterschieden zwischen  Archivprofilen und  Funktionsprofilen. Während Archivprofile eine Zusammenstellung der Rechte auf einem logischen Archiv darstellen, bilden Funktionsprofile die Möglichkeiten zur Nutzung oder Verwehrung einzelner DocuWare-Funktionen ab. 4.4.3. Benutzer und Gruppen Den Benutzern werden die Rollen entsprechend ihrer Aufgaben in der Organisation zugewiesen. Typischerweise füllen Benutzer verschiedene Rollen aus und häufig agieren mehrere Benutzer in den gleichen Rollen. Benutzer können daher zu „Gruppen“ zusammengefasst werden. Eine „Gruppe“ ist immer eine Summe von Benutzern. Gruppen können selbst keine weiteren Gruppen enthalten. Ein Nutzer kann in mehreren Gruppen vertreten sein. Nutzern können Profile und Einzelberechtigungen auch direkt zugewiesen werden. Da DocuWare den Austausch mit externern Benutzerverwaltungssystemen erlaubt, die typischerweise auch „Gruppen“ kennen, lässt sich über diese Einstellungen auch eine einfach zu administrierende Zuordnung der DocuWare-Rechte zu extern verwalteten Benutzer realisieren. 20
  • 21. Content Server 5. Content Server Clients und andere Server greifen über den Content Server auf A und Datenbank- Informationen zu. Der Content Server ist damit zuständig für die Gewährleistung eines einheitlichen Zugriffs und die zentrale Kontrolle bzw. Protokollierung der Archivnutzung. Die verschiedenen Organisationen, die ein DocuWare-System benutzen, können gleichzeitig verschiedene Content-Server nutzen. Die Content Server sind alle einzeln skalierbar, so dass eine optimale Lastverteilung innerhalb eines DocuWare-Systems leicht realisierbar ist. Alle Content-Server verwalten die Index- und Metadaten der abgelegten Dokumente in einer oder mehreren Datenbanken. Der Content Server verwaltet dazu „logische Archive“, denen die Dokumente zugeordnet sind. Er ist zuständig für sämtliche Zugriffe auf die zugeordneten Archive sowohl für die Ablage von Dokumenten als auch für die Recherche und die Reproduktion von Dokumenten. Um die Abbildung auf Wechselmedien zu erleichtern, werden dem Archiv „logische Platten“ zugeordnet und mit ihrer Kapazität spezifiziert. So kann sichergestellt werden, dass bestimmte Dokumente später auch physikalisch zusammen gespeichert werden und damit leichter ausgelagert, vernichtet oder transportiert werden können. Abbildung 10: Logische Ablagestruktur Lokalisiert sind die „Platten“ in einem „Speicherort“. Ein Speicherort kann eine beliebige Dateiablage sein. Für die Dateiablage werden verschiedene Ablagemedien (siehe 5.4) unterstützt. Auch innerhalb einer Dateiablage sind unterschiedliche Medien möglich. Jede Organisation kann mehrere Archive haben. Jedes Archiv nutzt eine Datenbank zur Verwaltung der Indexdaten und einen oder mehrere Speicherorte zur Ablage der Dokumente und Header-Dateien. Wie bereits erwähnt, können Archive standortübergreifend in einer Master-Satelliten-Struktur aufgebaut werden. Die Synchronisation zwischen Master und Satellit übernimmt der Workflow Server. Für den Anwender bieten Master und Satellit die gleichen Funktionalitäten. In beiden Archiven können beliebig Dokumente hinzugefügt und – wenn erlaubt – auch geändert oder gelöscht werden. Ein Archiv verfügt über eine weltweit eindeutige, nicht veränderbare Kennung, so dass auch bei der Verbindung der Systeme keine Konflikte aufgrund zufälliger Namensgleichheit entstehen können. 21
  • 22. Content Server Beim Design der DocuWare Server war die Erreichung einer hohen Sicherheit ein wesentliches Designkriterium. Zu den wichtigsten Sicherheitsmaßnahmen des Content Servers gehören die im Folgenden gelisteten Punkte 1:  Anwender und Administratoren benötigen keine Kenntnisse und damit auch keine Zugriffsrechte auf die interne Ablagestruktur  Dokumente und Dateien können verschlüsselt in der Dateiablage abgespeichert werden (Nur in Verbindung mit Enterprise Server)  Dateien werden über einen „Hash-Algorithmus“ mit einer Art Prüfsumme versehen, die Veränderungen sofort offensichtlich macht.  Bei gleichzeitigem Zugriff verschiedener Nutzer auf dieselben Dokumente wird die Konsistenz durch das DocuWare-System sichergestellt. Weitere Sicherheitsmaßnahmen finden sich in der folgenden Beschreibung der wesentlichen Elemente von Content Server und Archiven. 5.1. Archiv Im Folgenden ist die Art der Ablage der Daten und Dokumente im DocuWare-System beschrieben. Ablage und Zugriff auf die Dokumente wird durch den Content Server verwaltet, Administratoren und Benutzer benötigen keinen direkten Zugriff auf die Dokumente, weil sie über die DocuWare-Software zugreifen. Die Beschreibung dient somit primär der Transparenz und Nachvollziehbarkeit. Ein Archiv ist eine organisationsabhängige Einheit und kennzeichnet sich durch die benutzerdefinierten Angaben über die Plattenverwaltung und die Indexdaten zu den Dokumenten. Jede Organisation hat mindestens ein oder mehrere logische(s) Archiv(e) für die Dokumentablage. Im Einzelnen werden über die Archiveinstellungen bestimmt:  Allgemeine Angaben zum Archiv, wie z.B. Name des Archivs  Zu benutzende Datenbank und weitere Datenbank-Einstellungen  Zu benutzende Dateiablage und ggf. deren Aufteilung in logische Platten mit jeweiliger Kapazitätsbeschränkung  Zugriffsrechte (und Archivprofile) für das Archiv und für einzelne Felder  Benutzerdialoge für Ablage, Suche und Ergebnisliste  Web-Instanz(en), in denen das Archiv zur Verfügung steht (für den Zugriff über Web Client) Bei der Einrichtung eines Archivs wird ebenfalls der Content Server, über den dieses Archiv erreichbar ist, festgelegt. Weiterhin werden wesentliche Funktionalitäten über die Archiveinstellungen bestimmt. So sind beispielsweise sowohl die Verfügbarkeit eines Volltext-Index als auch Art und Umfang der für die Dokumentbearbeitung verfügbaren Stempel und elektronischen Signaturen abhängig von den Archiveinstellungen. Optional kann ein Archiv über mehrere Content Server erreicht werden. Die Zuweisung erfolgt, gesteuert durch den Authentication Server, beim Login der Benutzer. Damit ist 1 Aufgrund der Bedeutung des Themas „Sicherheit“ für DocuWare existiert ein weiteres White Paper, welches sich explizit und ausführlich mit den implementierten Sicherheitsmaßnahmen beschäftigt. 22
  • 23. Content Server einerseits eine Lastverteilung über mehrere Content Server möglich und zusätzlich kann eine „Umschaltung“ beim Ausfall eines Content Servers erfolgen. 5.2. Ablagestruktur Schwarz-weiß gescannte Dokumente in DocuWare werden typischerweise in Form von je einer TIFF-Datei pro Dokumentseite abgelegt. Die Ablage farbiger Scans erfolgt als JPEG- oder PNG-Datei. Speziell für Im- und Export kann DocuWare auch Multipage-TIFF-Dateien handhaben. Alle übrigen von DocuWare übernommenen Dokumente, z.B. PDF- und Office- Dateien, werden in ihrem Originalformat verwaltet. Die Dokumentablage in den Speicherorten enthält neben dem abgelegten Dokument selbst weiterhin eine „Header-Datei“ sowie ggf. weitere Dateien für Sprachanmerkungen. Pro abgelegtem Dokument können so eine Reihe von Dateien zu verwalten sein. Ein Dokument im DocuWare-Verständnis kann sogar aus einer Kombination mehrerer TIFF-, Office-, PDF und anderer Dateien bestehen, etwa wenn DocuWare eine E-Mail mit mehreren Anhängen als zusammengehöriges Dokument übernimmt. DocuWare bezeichnet diese Teildokumente auch als „Seiten“ (siehe 5.5 bis 5.7). DocuWare erstellt für jedes abzulegende Dokument ein eigenes Dokumentverzeichnis. Die Verwaltung erfolgt über die erwähnte Header-Datei im XML-Format. Jedes Dokument erhält eine eindeutige, fortlaufende Nummer, die DOCID. Diese wird für jedes neue Dokument automatisch erhöht. Um größtmögliche Flexibilität und Offenheit zu erreichen, erfolgt die Abbildung der Dokumentablage auf ein Dateiverzeichnis, von dem aus ggf. externe Speichersysteme angesprochen werden. Die Möglichkeiten von Dateiverzeichnissen sind jedoch abhängig von dem zugehörigen Betriebssystem. Aufgrund der angestrebten Offenheit und Unabhängigkeit bzgl. der Ablagesysteme orientiert sich DocuWare an den Möglichkeiten der folgenden Dateisysteme:  CD-ROM-Standards ISO 9660 und Joliet  DVD-Standard  Microsoft NTFS, FAT16, FAT32  Linux-Dateisysteme (ext2, Minix, NFS etc.)  Novell File System Daraus ergaben sich die Randbedingungen für die Struktur der DocuWare-Dokumentablage. Da in einem Verzeichnis aus Kompatibilitäts- und Performancegründen nur 256 Dateien abgelegt werden sollen, müssen mehrere Hierarchieebenen verwendet werden. DocuWare nutzt vier Ebenen und kann damit pro Archiv über 4 Mrd. (2564 = 4.294.967.296) Dokumente verwalten. Unterhalb des vom Administrator zugewiesen Dateiverzeichnisses wird das DocuWare-Verzeichnis adressiert durch Archivnamen, Plattennummern, drei Verzeichnisebenen und die Dokumentebene. 23
  • 24. Content Server Wird dem Archiv beispielsweise das Verzeichnis „D:DOCS“ zugewiesen und als Archivname „VERKAUF“ gewählt, so finden sich die Dokumente der ersten Platte in folgendem Unterverzeichnis: Verzeichnis zu Header zu Platte 1 Dokument 1 Dokument 1 D: DOCS VERKAUF.000001 000000000 00000001 00000001.XML Neben der Header-Datei, finden sich in dem Dokumentverzeichnis die Dateien zu dem abgelegten Dokument, die alle mit der Bezeichnung „F“ (=File) und einer laufenden Nummer versehen sind. Sound-Anmerkungen zu dem Dokument (gesprochener Text etc.) sind über die Nutzung des Namens „A“ (=Annotations), die Nummer der zugehörigen F-Datei sowie eine laufende Nummer zu identifizieren. Ein Dokument, das aus unterschiedlichen Teilen besteht und über Sprachanmerkungen verfügt, würde dann beispielsweise folgendermaßen dargestellt: 00000001 00000001.XML F1.pdf F2.doc F3.tif A1_1.wav A1_2.wav 5.3. Plattenkonzept Die Dokumente eines Archivs werden in so genannten DocuWare-Platten abgespeichert. DocuWare-Platten sind Verzeichnisse in der Dateiablage, die einen von DocuWare vorgegebenen Namen tragen. Die Unterteilung der Dokumentablage in logische Platten dient der Organisation der Speichermedien. Diese – logischen – Platten können jederzeit oder bei Erreichen einer vorher eingestellten Größe, auf ein anderes – physikalisches – Medium übertragen werden. Dadurch ergibt sich bei der Verwaltung der Dokumente mit DocuWare der Vorteil, dass die Dokumente nach vordefinierten Regeln oder automatisch auf andere physikalische Medien ausgelagert werden können. DocuWare bietet dazu komfortable Unterstützungsfunktionen an, die auch eine Automatisierung der entsprechenden Schritte erlauben. Das Konzept der logischen Platten und die offengelegte Ablagestruktur bietet dem Administrator sehr hohe Transparenz und Flexibilität in seiner täglichen Arbeit mit der Ablage. Aufgrund dieser Orientierung an den verbreiteten Standards kann dies, wenn gewünscht, auch – weniger komfortabel – über die Werkzeuge des Betriebssystems geschehen. 24
  • 25. Content Server 5.4. Unterstützte Ablagemedien Je nach Dokumentenvolumen, Zugriffs- und Aufbewahrungsanforderungen ist der Einsatz unterschiedlicher Speichermedien notwendig. Weiterhin spielen bei der Gestaltung der Speichersysteme Sicherheitsgesichtspunkte eine große Rolle. Durch seine standardbasierte Architektur unterstützt DocuWare hier ein breites Spektrum an Optionen. Unterstützt werden sowohl lokale Festplatten als auch (virtuelle) Netzwerk-Ablagen und externe Speichersysteme. Auf welcher technologischen Basis diese Ablagen realisiert sind, ist für DocuWare unerheblich. Bei Einhaltung der Konventionen für Windows-Dateisysteme kann DocuWare beliebige Ablagemedien unterstützen. Daher sind moderne Speicherverfahren wie RAID-Systeme, NetApp-Speicherlösungen, Network Attached Storage (NAS), andere „Shared Disk“-Systeme oder Storage Area-Networks (SAN) nutzbar, sofern sie sich als virtuelles Laufwerk in das Windows-Dateisystem einbinden lassen. Zusätzlich werden einige Jukeboxen und spezielle Speichersysteme direkt unterstützt. D.h. DocuWare liefert Software, mit der diese Speichersysteme als DocuWare-Dateiablage analog der Benutzung von Windows-Dateiablagen in ein Archiv einbindbar sind. Es ist einstellbar, ob Dateien bei der Archivierung direkt auf das Zielmedium geschrieben werden sollen, z.B. bei WORM-Einsatz um maximale Sicherheit zu erhalten, oder ob zunächst eine Zwischenspeicherung auf der virtuellen Platte erfolgt, weil beispielsweise CDs/DVDs nicht sukzessive brennbar sind. Im Folgenden werden die unterschiedlichen Medien und ihr Einsatzgebiet aufgeführt: 5.4.1. Festplatten, RAID Pro GB Speicher können ca. 20.000 DIN A4 Seiten abgespeichert werden. Dies entspricht in etwa 40 gut gefüllten Aktenordnern. Es besteht zusätzlich die Möglichkeit, mehrere Festplatten zu einem sogenannten Disk-Array zusammenzuschalten. Diese Arrays sind für einen Speicherbedarf von bis zu 150 GB die ideale Lösung für ein Archivsystem, wenn die Magnetspeicherung kein prinzipielles Problem darstellt. In der Form eines RAID (Redundant Array of Independent Disks) erhält man durch die Redundanz erhöhte Sicherheit gegen Datenverlust bei Ausfall einer Festplatte und kann – je nach RAID-Level – den Austausch während des laufenden Betriebes vornehmen. 5.4.2. Optische Wechselplatten Auf einer optischen Wechselplatte (CD, DVD, Blu-Ray, WORM) können bis zu 50 GByte an Daten gespeichert werden. Dies entspricht bis zu 800.000 reinen Textseiten. Der Einsatz solcher Laufwerke ist ohne Jukebox nur im Einzelplatzsystem sinnvoll. Der Vorteil dieser Systeme liegt darin, dass ein Archiv beliebig erweitert werden kann, indem weitere Platten eingelegt werden. Die Verwaltung und Nummerierung der Platten wird von DocuWare vorgenommen. Wenn die Platten gemäß den Vorschlägen von DocuWare beschriftet sind, ist ein Wiederfinden der Dokumente auch bei mehreren Platten denkbar einfach. Lange Zeit galten optische Wechselmedien als „revisionssicher“ im Vergleich zur Magnetspeicherung und wurden deshalb auch dann bevorzugt, wenn eine Speicherung auf Magnetplatten möglich gewesen wäre. Das DocuWare-System stellt jedoch auch auf Magnetspeichern sicher, dass keine Veränderungen vorgenommen werden können oder diese zumindest auffallen. 25
  • 26. Content Server 5.4.3. Jukeboxen Bei Jukeboxen handelt es sich um „Plattenroboter“ für den automatischen Wechsel von optischen Medien in typischerweise ein bis vier Laufwerken. Jukeboxen bieten heute die größte Speichermenge im Online-Zugriff. Kleinere Lösungen speichern 10 GB, High-End- Maschinen bis zu mehreren tausend Gigabyte. Diese Geräte bieten sich als Medien für Netzwerke an, in denen sehr große Datenmengen anfallen. Die Zugriffsgeschwindigkeit hängt von der Anzahl der eingebauten Laufwerke ab. Bei häufigen Plattenwechseln liegt die Zugriffszeit bei mehreren Sekunden pro Bilddatei. Analog zu den plattenbasierten Jukeboxen können auch moderne Bandsysteme (Tape Libraries), z.B. WORM-Bänder eingesetzt werden, mit denen sich kostengünstig ebenfalls sehr große Ablagekapazitäten realisieren lassen. Voraussetzung ist lediglich, dass die Systeme sich in das Windows-Dateisystem integrieren lassen. Teilweise liegen auch Zertifizierungen durch DocuWare vor. Jukeboxen können über spezielle Zugangssoftware ebenfalls transparent in das Windows Dateiverzeichnis eingebaut werden und sind dann auch für DocuWare nutzbar. Die zusätzlich direkt von DocuWare unterstützten – und z.T. zertifizierten – Speichersysteme sind unter www.docuware.com aufgeführt. 5.4.4. Content Adressed Storage (CAS) Während die Anforderungen an die Revisionssicherheit bisher typischerweise zum Einsatz eines optischen Mediums führte, etablieren sich bei großen Volumina mittlerweile RAID- basierte Speicherlösungen, die durch spezielle Software ähnliche Eigenschaften wie WORM- Medien aufweisen. Es handelt sich um geschlossene Subsysteme, die sich typischerweise durch folgende Merkmale charakterisieren:  Anwendung und Nutzer haben keinerlei Kenntnis über den Ort der physikalischen Ablage einer Datei im Subsystem. Versehentliche oder vorsätzliche Veränderung des Bestandes durch Nutzer/Administratoren ist nicht möglich.  Datei erhält über ein „Hashing“ analog dem Signaturverfahren einen spezifischen „Fingerabdruck“, der gleichzeitig als Adresse dient.  Identische Kopien werden nur einmal gespeichert.  Datei erhält automatisch eine Zeitsignatur.  Ablage und Zugriff können von unterschiedlichen Systemen auf unterschiedlichen Plattformen erfolgen. D.h. mit DocuWare abgelegte Dokumente können prinzipiell von Applikationen auf anderen Plattformen gelesen werden.  Kapazität kann im laufenden Betrieb erweitert werden. Daten werden automatisch verteilt. Damit kann auch automatisch auf andere Medien (innerhalb des gleichen Systems) migriert werden.  System verfügt über Redundanz, Fehlerüberwachung und – soweit möglich – selbstständige Fehlerbehebung Um diese Funktionen zu nutzen, muss die Anwendung jedoch eine spezifische Schnittstelle des CAS-Systems ansprechen. Die direkt von DocuWare unterstützten CAS sind unter www.docuware.com gelistet. Wie erwähnt, realisiert DocuWare die CAS-Funktionalität teilweise ebenfalls auf Applikationsebene, unabhängig von dem Speichersystem. CAS-Systeme sind somit dann zu empfehlen, wenn besonders hohe Anforderungen an Kapazität, Performance und Sicherheit gestellt werden. 26
  • 27. Content Server 5.4.5. NetApp Storage Die NetApp-Speicherlösungen basieren auf einem von NetApp hauseigenen Betriebssystem und lassen sich in verschiedenste Speichernetzwerke integrieren (NAS, SAN, iSCSI). Sie sind insbesondere für die Verwaltung großer Datenmengen und die Langzeitarchivierung von WORM-Dokumenten vorgesehen. Das Unternehmen bietet spezielle Software für das Datenmanagement an. Diese unterstützt unter Anderem folgende Aufgaben:  Verwaltung von Speichernetzwerken  Leistungsoptimierung  Anwendungsintegration (z.B. mit VMware, SAP, Oracle, Windows, Exchange, SharePoint)  Datensicherung und -wiederherstellung  Archivierung  Sicherstellung der Einhaltung gesetzlicher vorgeschriebener Aufbewahrungsfristen ("retention periods") Zusammen mit DocuWare steht NetApp Storage nur für die Speicherung von Dokumenten zur Verfügung und erfordert eine Enterprise-Lizenz von DocuWare. 5.5. Header-Datei Alle in DocuWare verwalteten Dokumente haben eine Header-Datei, die sowohl die für dieses Dokument vergebenen Meta- und Indexdaten als auch die Anmerkungen, Stempel, Signaturen etc. enthält. Indexdaten werden einerseits in die Datenbank und andererseits auch in die Header-Datei zum Dokument geschrieben. Diese doppelte Datenhaltung gibt größte Sicherheit. Selbst bei einem Totalausfall der Datenbank ohne Backup stehen die Dokumente und Indexdaten trotzdem noch zur Verfügung. Header-Dateien sind als XML-Datei realisiert. Durch die Verwendung dieses Standard- Dateiformats ergeben sich für den Kunden folgende Vorteile:  Stärkere Unabhängigkeit vom Anbieter durch Offenlegung der internen Verwaltungsstrukturen  Maximale Transparenz durch les- und schreibbare Formate  Vereinfachter Austausch mit allen standardkonformen Systemen, inkl. zukünftiger DocuWare-Generationen  Vereinfachter Austausch mit Capturing-Systemen und Scan-Dienstleistern DocuWare benutzt dieses Format für die Speicherung der Metadaten und Dokumentergänzungen. Der Content selbst wird aus Performancegründen separat gespeichert (Ausnahme Export). DocuWare verwendet die XML-Datei nicht nur für NCI, sondern für alle im DocuWare System verwalteten Dokumente. Für jede Datei, die Bestandteil eines DocuWare-Dokumentes ist, existiert in der XML-Datei ein eigener Abschnitt, der jeweils eigene Metadaten enthalten kann. 27
  • 28. Content Server Es lassen sich im Wesentlichen unterscheiden:  Dokument Beschreibung (Document Description) Informationen, die das gesamte Dokument betreffen, z.B. Signaturen und Verschlüsselung  Metadaten (Document Metadata) Alle zu beschreibenden Daten (Indexdaten) für das Dokument, die aus Benutzer- oder Systemsicht benötigt werden, inkl. DOCID, Plattennummer etc.  Seiteninformationen (Page Rendition Content Description) Seitenbezogene Ergänzungen, wie z.B. Text- oder Sprachanmerkungen, Ebenen, Red- Lining etc. Für den Austausch zwischen DocuWare-Systemen an verschiedenen Standorten können in einem reservierten Bereich Dateien direkt eingebunden werden. Die folgende Abbildung zeigt die Struktur der XML-Header-Datei. Abbildung 11: Struktur des XML-Headers (vereinfacht) 5.6. Metadaten Innerhalb des Bereiches Metadaten sind sowohl die vom Benutzer vergebenen Attribute (Indexdaten, Field Properties) gespeichert als auch die Daten, die von DocuWare für die Verwaltung benötigt werden (System Properties), wie z.B. die DOCID hinterlegt. Diese Daten sind identisch zu den Indexdaten, die zu der Datei in der Datenbank vorgehalten werden. DocuWare stellt die Integrität zwischen Datenbank und Header-Datei sicher. Sollte eine Datenbank unwiederbringlich verloren gehen (kein lauffähiges Backup verfügbar), können somit aus den einzelnen Header-Dateien die Datenbank-Informationen wieder hergestellt werden. Dieser Vorgang kann jedoch sehr zeitintensiv sein, so dass er nicht als Substitut für eine herkömmliche Datensicherung dienen sollte. 28
  • 29. Content Server Innerhalb der Ablageinformationen (Store Properties) werden Informationen über die Historie und das logische Archiv der Datei gespeichert. Bei den Applikationsspezifika (Application Properties) handelt es sich um Informationen, die für die Integration mit anderen Applikationen, z.B. SAP, benötigt werden. 5.7. Dokument Ein Dokument in DocuWare kann aus mehreren Dateien verschiedenen Formats (TIFF, Word, PDF etc) bestehen, die wiederum aus mehreren Seiten bestehen können. Beispiele: I. Ein 3-seitiges Papierdokument, das durch Scannen in DocuWare erfasst wurde, besteht aus drei einseitige Dateien (von DocuWare erzeugte s/w TIFF-Dateien). II. Für ein Dokument werden eine von DocuWare erzeugte s/w TIFF-Datei, eine 3-seitige Word-Datei und eine 2-seitige PDF-Datei zusammengeheftet. Das Dokument besteht dann aus drei Dateien: 1. Datei: s/w TIFF-Datei mit der Seite 1 2. Datei des Dokuments: Word-Datei mit den Seiten 1, 2 und 3 3. Datei des Dokuments: PDF-Datei mit den Seiten 1 und 2 Annotationen (Red-Lining in mehreren Layern, Text- und Sprachanmerkungen etc.) können innerhalb eines Dokuments in jeder Datei vorgenommen werden, innerhalb einer Datei jedoch nur auf der ersten Seite. Wie in Adobe PDF werden die Annotationen mit Ihren Merkmalen und zusätzlichen Attributen, z.B. Benutzerinformationen gespeichert und zur Laufzeit durch den Viewer reproduziert. Es sind daher keine zusätzlichen Image-Dateien notwendig und die Annotationen können flexibel geändert und nachvollzogen werden. 29
  • 30. Datenbanken 6. Datenbanken Die Installation einer relationalen Datenbank ist Voraussetzung für den Betrieb von DocuWare. Sie wird sowohl für die Speicherung und Recherche in den strukturierten Indexdaten der Dokumente als auch für den Volltext-Index verwendet. Weiterhin legt DocuWare wesentliche Systeminformationen, z.B. des Authentication Server, in der Datenbank ab. Bei der Installation richtet DocuWare optional automatisch die mitgelieferte, integrierte Datenbank ein, es sei denn, der Administrator wählt die Option explizit ab, etwa um ausschließlich die bereits im Einsatz befindlichen Systeme zu nutzen. DocuWare unterstützt unterschiedliche Datenbank-Systeme innerhalb eines DocuWare- Systems. Der Administrator kann für jedes Archiv wählen, welche Datenbank genutzt werden soll. Auch der nachträgliche Wechsel auf ein anderes Datenbank-System ist möglich. 6.1. Datenbank-Struktur Die Recherche der in DocuWare abgelegten Dokumente erfolgt immer über eine Datenbank. Dazu werden die Indexdaten des Dokumentes entweder in strukturierter Form (relational) und optional in Form eines Volltext-Index abgelegt. Neben den für den Benutzer wesentlichen Suchkriterien verwaltet die Datenbank auch die systeminternen Informationen zum Speichern und Wiederfinden der Dokumente in den Speicherorten. Das wesentliche kennzeichnende Merkmal eines Dokumentes ist dabei die DOCID. Bei der DOCID handelt es sich um eine pro Archiv eindeutige Nummer für ein Dokument, das aus vielen Dateien bestehen kann. Besondere Bedeutung haben naturgemäß die benutzerdefinierten Felder. Mit ihnen wird festgelegt, nach welchen Begriffen und Kategorien die Dokumente abgelegt und wieder gesucht werden. Durch die separaten Stichworttabellen ist es grundsätzlich möglich, beliebig viele Stichwörter zu einem Dokument zu speichern. Außerdem ist es möglich, mehrere Stichwortfelder in einem Archiv anzulegen. Die Geschwindigkeit beim Suchen innerhalb des Stichwortfeldes ist dabei sehr hoch, da in der Tabelle ein Index auf die Stichwort-Spalte gesetzt wird. Wenn dann der entsprechende Eintrag gefunden wurde, kann direkt über die DOCID auf die Datenbankeinträge der gefundenen Dokumente zugegriffen werden. 30
  • 31. Datenbanken Die Datenbank verwaltet im Wesentlichen die folgenden Tabellen: Bezeichnung Bedeutung Tabellenname Systemtabelle Beschreibt alle in dieser Datenbank verwalteten DWSYS Archive mit deren Namen, ID, aktuellem Speichermedium (DiskID) Plattentabelle Beschreibt die Platten im System. D.h. alle Platten <Archivname>_DISKS aller Archive mit ihren Nummern und Restkapazitäten Archivhaupttabelle Beschreibt die Dokumente pro Archiv über stets <Archivname> vorhandene Systemfelder wie, z.B. Anzahl Seiten, Plattennr., Ablagedatum, Versionsnummer, Zugriffprotokollinformationen, Synchronisierungsinformationen (nur bei Satelliten) und benutzerdefinierte Felder mit den Feldtypen - Text, - Datum/Zeit, - Numerisch, - Bemerkung Stichwort-Tabellen Für jedes Stichwort Feld, das in einem Archiv <Archivname>_<Name angelegt wird, wird eine Tabelle angelegt, die das Stichwortfeld> Stichwort direkt mit der DOCID verknüpft. Locking-Tabelle Beschreibt die Dokumente eines Archivs, die für <Archivname>_LOCK Veränderungen gesperrt sind mit Datum/Zeit, User und Computer bei dem das Dokument in Bearbeitung ist sowie Informationen über Check-In / Check-Out Status. 6.2. Integrierte Datenbank Die Datenbank MySQL gehört als „integrierte Datenbank“ zum Standard-Lieferumfang. Bei Benutzung der integrierten Datenbank werden alle notwendigen Einstellungen automatisch während der Installation vorgenommen. Diese Einstellungen stellen gleichzeitig die Standardwerte für die Benutzung anderer Datenbanken dar. 6.3. Direkte Datenbank-Kopplung Die marktführenden Datenbanksysteme (MS SQL, Oracle, MySQL) werden direkt an das DocuWare-System gekoppelt. Die direkte Kopplung unterscheidet sich für den Benutzer nicht von anderen Datenbanken. Die Zugriffe laufen lediglich nicht über die ODBC- Schnittstelle, sondern die Datenbank wird direkt mit ihren spezifischen SQL-Kommandos angesprochen. Daraus ergibt sich ein Geschwindigkeitsvorteil. 31
  • 32. Datenbanken 6.4. Datenbank-Administration Datenbanken können auf eigenständigen Servern (außerhalb des DocuWare- Serverbereiches) lokalisiert sein und DocuWare kann gleichzeitig mit mehreren Datenbank- Verbindungen zu unterschiedlichen Servern und verschiedenen Datenbanken arbeiten. Ob mehrere Verbindungen gleichzeitig zu einer Datenbank aufgebaut werden können, ist abhängig von der verwendeten Datenbank. 32
  • 33. Webbasierte Anwendungen 7. Webbasierte Anwendungen Der Trend bei IT-Anwendungen geht immer mehr hin zu webbasierten Lösungen. Installation und Wartung auf Client-Rechnern werden dadurch überflüssig, Zugriff auf die Anwendung ist von überall und von allen Rechnern, unabhängig vom Betriebssystem, aus möglich. Einzige Voraussetzung ist eine Internetverbindung. Auch DocuWare geht diesen Weg. Mit dem Web Client wird der Archivzugriff realisiert. Recherche und Ablage von Dokumenten ist aus Anwenderperspektive analog zum Windows- Client realisiert, technologisch ist es jedoch eine komplette Neuentwicklung basierend auf ASP.NET, JAVA-Script, AJAX und Silverlight. Die Administration des DocuWare-Systems wird ebenfalls zunehmend webbasiert umgesetzt. Perspektivisch soll die komplette Administration über Internetverbindung möglich sein. Technologisch wird auch hier auf Silverlight gebaut. 7.1. Dokumentzugriff mittels Web Client 7.1.1. Web Client Server Basis für den Archivzugriff über Internet ist der Web Client Server, der innerhalb des DocuWare-Systems als ein weiteres Servermodul installiert wird. Der Web Client Server stellt die Benutzeroberfläche, die im Browser-Fenster angezeigt wird, zur Verfügung. Für einen Archivzugriff verbindet sich der Anwender über Internet mittels Web Client mit dem Web Client Server. Letzterer leitet die Anfrage an den Authentication Server zur Prüfung des Benutzerkontos und der Rechte für den Archivzugriff über den Content Server weiter. Aus der Perspektive vom Authentication Server und Content Server verhält sich der Web Client Server wie ein Client. Abbildung 12: Achivzugriff über Web Client Server 7.1.2. Imaging Server Der Imaging Server, ein weiterer Bestandteil für den webbasierten Dokumentzugriff, konvertiert die archivierten Dokumente, die im Viewer des Web Clients angezeigt werden sollen, in ein Grafik-Format. Dadurch können alle gängigen Dateiformate in hoher Qualität angezeigt und ausgedruckt werden, ohne dass am Client-Rechner etwas installiert werden 33
  • 34. Webbasierte Anwendungen muss. Des Weiteren ist der Imaging Server für die Konvertierung der Dateien in PDF und die Textsuche im Viewer des Web Clients verantwortlich. Der Web Client Server kommuniziert direkt mit dem Imaging Server. Innerhalb eines DocuWare-Systems können mehrere Imaging Server installiert werden, so dass eine Lastverteilung möglich ist. 7.1.3. Thumbnail Server Im Web Client können Dokumente im Viewer und im Briefkorb als Thumbnails dargestellt werden. Um eine höhere Performance zu erreichen, werden die Thumbnails nicht für jeden Aufruf neu berechnet, sondern in einer dedizierten Datenbank gespeichert und bei Bedarf von dort für die Anzeige bereitgestellt. Das Speichern und Abfragen von Thumbnails übernimmt der Thumbnail Server, der sowohl zum Web Client Server als auch zur Datenbank Verbindung hat. Abbildung 13: Web Client Server mit Imaging Server und Thumbnail Server 7.1.4. Web Instanzen Für einen Web Client Server können beliebig viele Web-Instanzen eingerichtet werden. Jeder dieser Instanzen wird eine eindeutige URL zugeordnet. Über diese URL verbindet sich der Anwender mit dem Web Client Server und ruft so die entsprechende Instanz im Web Client auf. Pro Instanz wird festgelegt, welche Archive und Archivdialoge zur Verfügung stehen und wie die Anmeldung am DocuWare-System erfolgt. 7.1.5. Web Client Der Web Client ist das Benutzerinterface für den webbasierten Archivzugriff. Indem der Anwender im Browser eine URL zu einer Web-Instanz aufruft, wird der Web Client im Browserfenster angezeigt. Über den Web Client lassen sich alle wesentlichen Funktionen des Dokumentenmanagement-Systems ausführen: Dokumente öffnen, mit Anmerkungen und Stempeln versehen, Indexbegriffe ändern, Dokumente ablegen, versenden und vieles mehr. 34
  • 35. Webbasierte Anwendungen Technologisch basiert der DocuWare Web Client auf ASP.NET und Ajax (Asynchronous JavaScript and XML). Dank dieser Technologien bearbeitet der Web Client Recherchen sehr schnell, und der Anwender bekommt unmittelbar eine Antwort auf seine Anfrage. Grundlage des Web Clients sind einzelne Steuerelemente, sogenannte Web Parts. Der Web Client kommt prinzipiell ohne jegliche Installation am Client-Rechner aus und ist Betriebssystem unabhängig. Lediglich für Funktionen, die nicht rein browserbasiert umsetzbar sind, werden Anwendungen am Client-Rechner installiert (siehe folgende Kapitel). 7.1.6. Click-Once Anwendungen Das Versenden von archivierten Dokumenten über den lokalen Mail-Client, einer weiteren Funktion des DocuWare Web Clients, ist technisch nicht vollständig browserbasiert möglich. Es muss eine DocuWare-Anwendung, ein sogenannter Smart Client, am lokalen Client- Rechner installiert werden. DocuWare verwendet dazu die Click-Once-Technologie von Microsoft. Der Anwender lädt so per Mausklick einmalig beim ersten Mail-Versand die DocuWare-Anwendung herunter, die automatisch am lokalen Client-Rechner installiert wird. Hierzu sind keine Administrationsrechte unter Windows erforderlich. Ein Update dieser Anwendung kann automatisch erfolgen. Ebenso wird für die browserbasierte Client-Anwendung des DocuWare Zusatzmoduls SmartConnect eine lokale Anwendung benötigt. Auch diese wird über das Click-Once- Verfahren am Client-Rechner installiert. Voraussetzung für Click-Once-Anwendungen ist ein Windows-Betriebssystem. 7.1.7. Silverlight Plug-In für Web-Briefkörbe Das Bearbeiten von Dokumenten, wie z.B. Heften, Entheften und Vorindexieren, erfolgt in DocuWare in sogenannten Briefkörben. Für den Web Client befinden sich solche Briefkörbe im Allgemeinen nicht auf dem lokalen Rechner, sondern im Netzwerk. Diese Briefkörbe, auch Web-Briefkörbe genannt, werden vom Content Server verwaltet. Damit der Benutzer des Web-Clients solche Web-Briefkörbe nutzen kann, ist die lokale Installation eines Silverlight Browser-Plug-In erforderlich. Voraussetzung für ein Silverlight Browser-Plug-In ist ein Windows- oder Mac-Betriebssystem. 7.1.8. Integration des Web Client in andere Anwendungen Die Integrationsmöglichkeiten des Web Client sind vielfältig. Es kann sowohl der Web Client als Ganzes in andere Anwendungen eingebaut werden als auch einzelne Elemente wie Ergebnisliste oder Anzeigefenster. Die Integration funktioniert mit Windows- und Web- Programmen über spezielle URL-Aufrufe. Eine vollständige Übersicht über die Integrationsmöglichkeiten des DocuWare Web Clients ist im White Paper „Integrationen“ enthalten. 7.2. Webbasierte Administration Langfristiges Ziel ist es, die Administration des DocuWare-Systems soweit wie möglich webbasiert zu realisieren. Umgesetzt ist dieses Ziel bereits für einige neuere Elemente, wie das Verwalten von Web-Briefkörben und E-Mail-Alerts sowie für die Administration der DocuWare Zusatzmodule SmartConnect und CONNECT to MFP. Technologisch wird hier auf Silverlight gebaut, d.h. der Administrator benötigt ein Silverlight Browser-Plug-In. Voraussetzung dafür ist ein Windows- oder Mac-Betriebssystem. 35
  • 36. Process Management Framework 8. Process Management Framework Ein wesentliches Nutzenpotenzial von DMS liegt in der Automatisierung von Routinetätigkeiten und in der Unterstützung bestehender Prozesse. Dazu gehören sowohl systemorientierte Standardabläufe als auch anwendungs- und nutzerabhängige Prozesse. DocuWare hat als übergeordneten Architekturrahmen das Process Management Framework definiert, das die Verwaltung und Abarbeitung der Prozesse beschreibt. Es lassen sich drei Prozesskategorien unterscheiden:  Dokumenten-Stapel-Verarbeitung (Document Batch Process) Diese Prozesse benötigen keine Benutzer-Interaktion, sondern sie realisieren Standardabläufe, z.B. Import, Speicherung, Export, Migration und Löschen von Dokumenten und Daten.  Dokumenten Workflow Die automatische Versendung, inkl. Benutzer-Interaktion von Dokumenten entlang vordefinierter Wege ist eine der häufigsten Workflow-Anwendungen. Von Rechnungen, über Bestellanforderungen bis zu Urlaubsanträgen sind Dokumente – speziell in größeren Organisationen – über mehrere Stationen zu erstellen, zu genehmigen und zu buchen. Diese Prozesse lassen sich mit dem Document Workflow steuern und verfolgen.  Datenaustausch mit Fremdapplikationen (Data Acquisition and Distribution, EAI) Ein Dokumenten-Management-System muss Daten und Dokumente aus verschiedenen anderen Systemen übernehmen und teilweise, auf Anforderung durch diese Systeme, auch wieder übergeben. Die Systeme stellen somit häufig eine Form der „Enterprise Application Integration (EAI)“ dar, weil sie als generelle Infrastruktur vielen Anwendungen und vielen Anwendern dienen. Realisiert werden diese Prozesse derzeit über die Module LINK, AUTOINDEX und ACTIVE IMPORT. 8.1. Workflow Server Für die Steuerung von automatisierbaren (Teil-)Prozessen existiert mit dem Workflow Server ein eigenes Servermodul in DocuWare, das die verschiedenen Funktionalitäten zur Automatisierung von Arbeitsschritten anbietet und als zentrales Element für diese Aufgaben, inkl. deren Administration fungiert. Der Workflow Server ist die zentrale Workflow-Engine zur Ausführung der vordefinierten Workflows. Workflows kennzeichnen sich durch folgende Merkmale:  Auslösendes Ereignis  Eingabedaten  Diverse logisch getrennte Verarbeitungsschritte  Ausgabedaten Analog zu diesem Modell agiert der Workflow Server. Ereignisse können sowohl durch Nutzeraktionen als auch durch zeitliche Vorgaben oder das Erreichen bestimmter Systemzustände, z.B. „Platte voll“, ausgelöst werden. Durch ein solches Ereignis wird ein bestimmter Workflow gestartet, der dann gemäß seiner Vorgaben typischerweise zunächst Eingabedaten einliest. Die Eingabe kann durch Interaktion oder durch das Lesen einer Datei aus einem bestimmten Verzeichnis oder von Daten aus einer Datenbank erfolgen. 36
  • 37. Process Management Framework Die Verarbeitung erfolgt in verschiedenen Verarbeitungsschritten, die in sich eine Transaktion darstellen. D.h. kann ein Schritt nicht erfolgreich abgeschlossen werden, gibt der Workflow Server eine Meldung in eine Datei (Protokoll) aus und der letzte gültige Zwischenstand wird wiederhergestellt. Bei erfolgreicher Verarbeitung in einem Schritt, erfolgt automatisch die Übergabe des (Zwischen-)ergebnisses an den nächsten Verarbeitungsschritt und am Schluss die Ausgabe entweder an den Benutzer in ein Verzeichnis oder auch an das DocuWare-Archiv. Durch ein Zwischenergebnis oder durch die Workflow-Aufgabe gesteuert, können neue Ereignisse ausgelöst werden, die wiederum andere Workflows initiieren können. Verschiedene Workflows können parallel die gleichen Aufgaben lösen und sich dazu auch derselben Ressourcen, z.B. Verzeichnisse, Archive etc. bedienen. Der Workflow Server stellt sicher, dass die Integrität der Daten bestehen bleibt. Über das Monitoring ist der Verarbeitungsstatus der Prozesse insgesamt und auch der einzelnen Workflow-Aufgabe jederzeit transparent. Innerhalb eines DocuWare-Systems können mehrere Workflow Server installiert werden. Einzelnen Workflows wird dann ein bestimmter Workflow Server zugewiesen. Auf diese Weise kann eine Lastverteilung bei den Workflow Servern realisiert werden. 8.2. Vordefinierte Batch-Prozesse DocuWare nutzt die beschriebene Funktionalität des Workflow Server selbst für systemorientierte Standardabläufe. Derzeit werden über den Workflow Server die verschiedenen Abläufe, die mit Dokumentenstapel agieren, gesteuert. Vordefinierte Prozesse werden sowohl bei der DocuWare-Erstinstallation implementiert als auch bei der – ggf. auch späteren – Installation zusätzlicher Erweiterungsmodule. Entsprechende Berechtigungen vorausgesetzt, können Nutzer die vordefinierten Prozesse nach eigenen Bedürfnissen ändern. Typischerweise ist dies eine Aufgabe des Organisation- Administrators. Für die folgenden Aufgaben existieren vordefinierte Workflows, die durch den Workflow Server gesteuert werden:  Migration  Export von Archiven oder Teilarchiven  Erzeugung und Synchronisation von Satellitenarchiven  Erzeugung von selbsttragen CD/DVD-Archiven  Ergänzen von Indexinformationen aus externen Datenquellen (AUTOINDEX)  Wiederherstellen der Indexeinträge (Restore)  Löschen von Dokumenten, die über Filter definiert werden  Erzeugen bzw. Aktualisieren des Volltextkatalogs  Übername von Dokumenten aus Spool-Dateien (COLD/READ) 37
  • 38. Volltext-Index 9. Volltext-Index 9.1. Funktionsprinzip Zur DocuWare-Funktionalität gehört generell ein Volltext-Index, dessen Benutzung für den Anwender jedoch optional ist. Der Volltext-Service nutzt die gleiche Datenbank wie der Content Server, legt dort jedoch seine eigenen Tabellen an. Der Zugriff auf die Archiv- Datenbank und die Dokumente erfolgt beim Erzeugen des Volltext-Indexes direkt, also ohne zwischengeschalteten Content Server. Die Volltext-Recherche ist voll in die Client-Funktionalität sowohl für den Windows- als auch für den Web-Client integriert. Somit werden weder spezielle Datenbanken benötigt, noch muss sich der Anwender mit verschiedenen Recherche-Clients auseinandersetzen. Lediglich bei der Konfiguration der Archive ist zu entscheiden, ob ein Volltext-Index für die Dokumente erstellt werden soll. Die Volltext-Recherche erfolgt über den Content Server Die wesentlichen Vorteile dieser Volltext-Architektur sind:  Arbeitet mit allen von DocuWare unterstützen Datenbanken  Keine speziellen Erfordernisse für die Verwendung im Web Client  Keine Restriktionen für die Verwendung im Web Client  „Wildcards“ (?, *) können auch am Beginn des Suchstrings stehen Da die Indexierung größerer Dokumentmengen erhebliche Computer-Ressourcen beanspruchen kann, erfolgt die Volltext-Indexierung in der DocuWare-Architektur als eigenständiger Workflow auf dem Workflow Server, der im Hintergrund, unabhängig von anderen Transaktionen innerhalb von DocuWare ausgeführt wird. In den meisten Fällen ist der Volltext-Index nicht unmittelbar nach Dokumenteingang erforderlich, so dass eine organisatorische Optimierung dadurch erfolgen kann, dass die Indexierung in Zeiten geringerer Systemlast, typischerweise nachts, gelegt werden kann. Für jedes logisches Archiv ist ein Volltext-Index erstellbar. Welche Dokumente in den Volltext-Index aufgenommen werden sollen, bestimmt sich durch die Zugehörigkeit zu einem bestimmten Archiv. Da sehr viele Archive in einem DocuWare-System vorhanden sein können, kann es entsprechend viele Volltext-Indexe geben. Da die generelle Fluktuation von Dokumenten im Archiv durch den Content Server verwaltet wird, ist eine Kommunikation zwischen Content Server und Volltext-Workflow notwendig, obwohl beide unabhängig agieren. Dies geschieht „indirekt“ über die Volltext-Haupttabelle, in die der Content Server neu zu indizierende Dokumente oder Dateien einträgt und gelöschte entsprechend markiert. Der Volltext-Workflow arbeitet daraufhin die notwendigen Änderungen ab und setzt entsprechende Statusfelder. Neben den Fundstellen für die einzelnen Begriffe, erfolgt gleichzeitig eine Bewertung der voraussichtlichen Relevanz eines Begriffs. Die Ergebnisliste einer Volltextrecherche sortiert sich entsprechend dieser Relevanz (bzw. Nicht-Relevanz = Noise). Um den Volltext-Index nicht mit irrelevanten Begriffen, wie Artikel (der, die, das), Personal- pronomen etc. zu belasten, beinhaltet der Volltext-Prozess eine „Stoppwortliste“, die bei der Volltext-Indexierung automatisch als Filter dient. Diese Liste ist durch den Archiv- Administrator veränderbar. Damit können spezifische, im Unternehmen sehr häufig verwendete Begriffe von vornherein aus dem Volltext-Index ausgeschlossen werden, weil sie für die Recherche nicht dienlich sind. Beispielsweise ist der Begriff DocuWare im Hause DocuWare nicht zur Differenzierung geeignet. Weiterhin können Dateien über ihre Endung aus dem Volltext ausgeschlossen werden, um beispielsweise Grafiken auszuschließen. 38
  • 39. Volltext-Index Um performant nach Teilstrings suchen und Wildcards auch vor dem Suchbegriff platzieren zu können, wird ein spezieller Algorithmus verwendet, der sich „Multi-Suffix-Tree“ (MST) nennt. Dieses Verfahren arbeitet mit zwei speziellen Dateien, über die zunächst der richtige Eintrag in der Dictionary-Tabelle identifiziert wird, der dann alle weiteren Informationen (Relevanz, Position etc.) verfügbar macht. Der eigentliche Volltext-Index wird über die beiden Dateien (MST-Datei, Stringlist-Datei) realisiert, die je Archiv innerhalb des Dateisystems gespeichert werden. Die einzelnen Wörter und Teilstrings sind als Baumstruktur in der MST-Datei gespeichert. Die Stringlist- Datei ist eine Liste von IDs, über die alle Wörter und Teilstrings mit den Einträgen der Dictionary-Tabelle verknüpft sind. 9.2. Volltext-Tabellen und -Dateien Für jedes Archiv, welches Volltext-Informationen beinhalten soll, müssen diese Tabellen vorhanden sein. Im Folgenden werden die Tabellen, die für die Volltext-Suche benötigt werden, und die von DocuWare erzeugten Index-Dateien kurz beschrieben. Bezeichnung Bedeutung Volltext- Enthält pro Datei eines Dokuments Informationen über die letzte Haupttabelle Indexierung. Diese Tabelle wird von dem Content Server aktualisiert und dient dem Volltext-Workflow als „Aufgabenliste“. Dictionary-Tabelle In dieser Tabelle wird jeder String, der aus einem Dokument herausgezogen wurde, einmal gespeichert. Gleichzeitig wird hier auch mitgezählt, wie oft das Wort im Archiv vorkommt, in wie vielen Dokumenten es vorkommt, und welchen NOISEWert dieses Wort hat. Der NOISE-Wert zeigt die Wahrscheinlichkeit an, mit der das Wort relevant ist. Index-Tabelle In der Index-Tabelle wird gespeichert, welcher String in welchem Dokument wie häufig und auf welcher Seite vorkommt. Dadurch wird die Zuordnung eines Wortes zu einem Dokument möglich. Ranking Info Mit Hilfe dieser Tabelle kann DocuWare die Suchergebnisse nach Relevanz Tabelle sortieren. Dazu wird auch der oben schon angesprochene NOISE-Wert berücksichtigt. MST-Datei Baumstruktur der Wörter und Teilstrings Stringlist-Datei Wortverzeichnis mit Einsprungpunkten in die Dictionary-Tabelle 39
  • 40. Verteilte und redundante Archive 10.Verteilte und redundante Archive Über die Möglichkeiten aktueller Betriebs- und Netzwerksysteme ist eine standortübergreifende Nutzung der DocuWare-Archive heute problemlos zu realisieren. Das gilt sowohl für den Zugriff entfernter Clients auf die DocuWare-Server als auch für die Kommunikation der Server untereinander. DocuWare hat dazu das Modell der „Satellitenarchive“ entwickelt. Weiterhin ist häufig der Export von (Teil-)archiven gewünscht, um beispielsweise bestimmte Informationen mobilen Benutzern auch außerhalb der Firmeninfrastruktur zur Verfügung zu stellen. Dazu dienen die so genannten „Selbsttragende Archive“. Durch den Einsatz moderner Sicherheitstechnologien, wie z.B. VPN´s, Firewalls etc. kann Missbrauch weitestgehend vermieden werden. In diesem Kapitel werden daher lediglich die direkt von DocuWare bereitgestellten Funktionen für verteilte und redundante Archive besprochen. 10.1. Satellitenarchive Wie bereits unter Systemarchitektur (siehe 3.3) und Workflow Server (siehe 8.1) erwähnt, kann sich eine DocuWare-Installation über mehrere Standorte erstrecken. Weiterhin kann in einer eigentlich eigenständigen DocuWare-Installation auch ein „Satellitenarchiv“ einer anderen Lokation etabliert werden. Dabei erfolgt – einstellbar – eine periodische Synchronisation zwischen den Standorten, um beide Bestände aktuell zu halten. Die Architektur der Satellitenarchive kennzeichnet sich über die folgenden Merkmale:  Es kann mehrere Satellitenarchive zu einem Master geben.  Ein Satellitenarchiv kann selbst wiederum Master für andere Satellitenarchive sein, aber es hat immer nur einen Master. Unabhängig von der Art des Archivs („Master“ oder „Satellit“) kann in beiden Standorten die volle DocuWare-Funktionalität, inkl. Übernahme beliebiger Dokumente genutzt werden. Sofern zwischen zwei Synchronisationsläufen ein Dokument auf beiden Seiten verändert wurde, greifen die Regeln des vordefinierten Workflows. Es ist genau definiert, wie mit gelöschten, veränderten und neuen Dokumenten auf beiden Seiten zu verfahren ist. Sofern Modifikationen am Dokument und/oder am Indexeintrag zum Dokument festgestellt wurden, lauten die verfügbaren Einstellungen:  Master überschreibt Satellit  Satellit überschreibt Master  Letzte Änderung ist gültig  Keine Aktion, sondern Aufnahme in Log-Datei Im letzten Fall kann dann eine manuelle Nachbearbeitung erfolgen. Es lassen sich Zeitvorgaben für die Synchronisationen machen oder die Workflows manuell starten. 40
  • 41. Verteilte und redundante Archive 10.2. Mobile Nutzer Neben der Realisierung standortübergreifender Archive sind Satellitenarchive vor allem auch für mobile Nutzer vorgesehen. Ähnlich wie bei den Groupware-Clients der bekannten Anbieter ist hiermit auch für die Archivnutzer eine komfortable Nutzung der Funktionalität unabhängig von dem aktuellen Online- oder Offline-Status möglich. D. h. das Dokumente auch im Offline-Betrieb nicht nur gelesen, sondern auch bearbeitet werden können. Neue Dokumente lassen sich in das Archiv einbringen und über die Workflow-Steuerung lassen sich offene Aufgaben erledigen, z. B. Freigaben erteilen. Die Synchronisation mit dem Master erfolgt zeitgesteuert oder von Hand gestartet durch den Anwender. Da Veränderungen meist nur in Teilbereichen des Archivs erfolgen bzw. erfolgen dürfen, lassen sich über die sehr leistungsfähige Filterfunktion die Synchronisationsbereiche vorgeben. Die benutzerindividuelle Beschränkung der Synchronisation auf einzelne Archive und Teilbereiche von Archiven ist besonders wichtig, um sowohl den Speicherbedarf auf den mobilen PCs als auch das Datentransfervolumen bei der regelmäßigen Synchronisation so gering wie möglich zu halten. Technisch gesehen handelt es sich bei einem Mobilen Nutzer um eine Single-User- Installation, bei der ein komplettes DocuWare-System, inklusive Authentication Server, Content Server und ggf. Workflow Server auf einem Rechner – typischerweise ein Notebook - installiert ist. 10.3. Selbsttragende Archive Selbsttragende Archive ermöglichen es, ein (Teil-)Archiv auf ein externes Speichermedium zu kopieren, um die Inhalte, unabhängig von der normalen Infrastrukturumgebung, auf einem anderen System recherchieren zu können. Die Systemarchitektur entspricht nicht der o. e. Single-User-Installation, sondern dem Export eines oder mehrerer (Teil-)Archive mit zusätzlichen Recherchemöglichkeiten. Um eigenständig zu funktionieren, verfügen diese Installationen über eine lokale Datenbank. Alle notwendigen Bestandteile für die Nutzung des Archivs sind zusammen mit den Daten und Dokumenten auf einem Medium, z.B. CD oder DVD, gemeinsam gespeichert. Auf dem Zielsystem ist keine Software-Installation erforderlich. Sie kann jedoch optional erfolgen, um die Geschwindigkeit noch weiter zu steigern. Dieses Archiv kann somit flexibel auf unterschiedlichsten Computern, z.B. Notebooks genutzt werden, ohne dass eine Verbindung zur sonstigen IT-Infrastruktur besteht. Die Kapazität des Archives ist lediglich von der Mediumskapazität abzüglich der Recherchesoftware abhängig. Typische Einsatzfelder sind:  Auslagerung von Altbeständen  Sicherheitskopien von Teilarchiven  Zusammenarbeit mit externen Partnern, z. B. Dienstleistern oder Unterauftragnehmern  Publizieren und verteilen von Katalogen, Teilelisten und Zeichnungen  Bereitstellung von Normen und technischen Dokumentationen, z. B. für Entwicklung, Qualitätssicherung, Einkauf und Vertrieb Wenn keine Änderungen gemacht werden sollen oder dürfen, ist auch der Einsatz zur reinen Recherche – eben ohne Synchronisation – auf einem Notebook sinnvoll. 41
  • 42. Integration 11. Integration Archivsysteme müssen sich typischerweise in ein bestehendes IT-Umfeld integrieren. Die Herausforderung ist dabei nicht nur Koexistenz zu ermöglichen, sondern durch Austausch von Daten und Dokumenten mit Fremdsystemen ein systemtechnisches Optimum zu erreichen, ohne gleichzeitig komplexe und hochgradig redundante Administrationsaufwendungen hinnehmen zu müssen. Durch die Aufteilung in verschiedene Server und die Bereitstellung entsprechender Schnittstellen sowie der Orientierung an Standards, löst das DocuWare-System dieses Problem in eleganter Weise. Beispielsweise können Benutzerdaten, die in Active Directories oder in LDAP-Verzeichnissen gepflegt werden, durch DocuWare übernommen werden. Dazu gehört natürlich auch eine Synchronisation der Änderungen im laufenden Betrieb. Weiterhin lassen sich beliebige Speichertechnologien nutzen, sofern sie sich als Windows- Dateiverzeichnis darstellen lassen. Dies ist bei allen namhaften Systemen möglich. Damit sind DocuWare-Archive auch unter Einbeziehung von Non-Microsoft-Systemplattformen (z.B. Linux, Novell, Solaris) realisierbar. Die Einbindung „fremder“ Plattformen ist weiterhin möglich für Datenbank-Server, Mail- Systeme, Web-Server oder Applikationen, zu denen Schnittstellen bestehen, wie z.B. SAP. Abbildung 14: Integrationsfähigkeit Aufgrund der Bedeutung des Themas „Integration“ gibt es hierzu ebenfalls ein „White Paper“. Die folgende Grafik bietet bereits hier einen Überblick darauf, wie mit Fremdapplikationen auf DocuWare aufgesetzt werden kann. Detailliert ist auch dies im White Paper „Integrationen“ beschrieben. 42
  • 43. Integration Abbildung 15: DocuWare Architektur mit Schnittstellen für Fremdanwendungen 43
  • 44. Skalierbarkeit 12.Skalierbarkeit DocuWare-Systeme sind hochgradig skalierbar. Dies beginnt mit Einzelplatzsystemen und endet mit organisations- und standortübergreifenden Systemen mit Tausenden von Nutzern und einer Verteilung über mehrere Server. Abbildung 16: Skalierbarkeit; „DocuWare Client“ subsummiert Windows Client und Web Client DocuWare-Installationen können als eigenständige Systeme auf einem einzigen Rechner installiert sein. Dieser Rechner verfügt dann über sämtliche Module: Authentication Server, Content Server, Workflow Server, Datenbank-Server und den zugehörigen Client. Die Architektur und die funktionalen Möglichkeiten entsprechen den größeren Installationen. Das Mehrbenutzersystem in einem lokalen Netzwerk wird jedoch der häufigste Installationsfall sein. Bei intensiver Nutzung kommt die Leistungsfähigkeit der beschriebenen Systemarchitektur voll zum Tragen, weil die Funktionalität nach organisatorischen, technischen und performanceorientierten Gesichtspunkten auf verschieden konfigurierten Servern verteilt sein kann. Netzwerktechnisch sind TCP/IP-Netze Voraussetzung, die heute flächendeckend verbreitet sind. Für die DocuWare-Server werden MS-Windows-Plattformen benötigt, die aber – wie unter Integration beschrieben – mit anderen Plattformen zusammenarbeiten können. 44
  • 45. Skalierbarkeit 12.1. Clustering und Lastverteilung Sämtliche Zugriffe auf die Dokumente zur Ablage oder Reproduktion erfolgen über den Content-Server. Ein Content Server kann dabei auch für mehrere Archive zuständig sein. Bei großen Installationen und intensiver Nutzung des Systems kann der Content Server daher zum Engpassfaktor werden. In diesem Fall ist die Last auf mehrere Content Server aufzuteilen. Fällt ein Content Server aus, wird durch einen Neustart des Clients von dem Authentication Server ein neuer Content Server (CTS) zugewiesen. Abbildung 17: Lastverteilung auf mehrere Content Server Weiterhin ist Lastverteilung durch die Plattformvarianten der Systemhersteller, z.B. Microsoft Cluster-Lösung, möglich. Durch die modulare Struktur und die N-tier-Architektur lassen sich die dort gegebenen Möglichkeiten optimal nutzen, weil das System die Ressourcen bedarfsgerecht zuordnen kann. Details zur Ausfallsicherheit des DocuWare-Systems enthält das White-Paper „Security“. 12.2. Sonstige Performance-Maßnahmen DocuWare-Clients nutzen standardmäßig „Caching“. D.h. angeforderte Dokumente werden in einem lokalen Speicher, temporär zwischengespeichert, weil die Nutzer während eines gewissen Zeitraums meist mehrfach auf dieselben Dokumente zugreifen. Der Organisations-Administrator kann entsprechende Kapazitätsvorgaben bei der Einrichtung der Clients machen. Wird diese Kapazität erreicht, so wird ein Teil dieses Speichers geleert, um Raum für neue Dokumente zu schaffen. Optional wird der Cache am Ende einer User-Session geleert. Weiterhin kann eingestellt werden, dass im Cache immer nur aktuelle Daten gehalten werden. D.h. alle Daten ab einem vorgegebenen Alter werden automatisch gelöscht. Integration mit anderen IT-Systemen, redundante Archive, Installation mehrerer Instanzen der jeweiligen Server-Komponenten, Verteilung auf mehrere Hardware-Systeme etc. sind alles Möglichkeiten, um die Performance und Ausfallsicherheit des DocuWare-Systems den Anforderungen anpassen zu können. Die Architektur bietet somit Flexibilität bei der Gestaltung von technisch und wirtschaftlich optimalen Konfigurationen. 45
  • 46. Glossar 13.Glossar Administrative Rechte Administrative Rechte umfassen die Rechte zur Änderung von Archivdefinitionen oder Definitionen innerhalb einer Organisation. Archiv Ein „Archiv“ ist in DocuWare eine logische Einheit, die Dokumente entgegennimmt, speichert, sucht und wieder bereitstellt. Ein Archiv umfasst immer die Dateiablage, in der die Dokumente physikalisch gespeichert sind, sowie die zugehörigen Datenbanktabellen, die Indexdaten und andere beschreibende oder ergänzende Elemente zu dem Dokument enthalten. Optional kann ein Archiv auch einen Volltext-Index enthalten, der die Dokumente zusätzlich über die Volltext-Information zugänglich macht. Für die Dateiablage können unterschiedliche Ablagemedien Verwendung finden. Dazu werden den Archiven „logische Platten“ zugeordnet, die nach vorgegebenen Regeln auf physikalische Ablagemedien abgebildet werden. Ein Archiv ist eine Sammlung verschlagworteter Dokumente. Für Archive können fein abgestimmte Zugriffs- und administrative Rechte vergeben werden. Archiv-Administrator Nutzer, dem das Administrationsrecht für ein Archiv gegeben wurde. Er kann dieses Recht nicht weitergeben. Archiv-Besitzer Nutzer, der ein Archiv anlegt und administrieren darf. Dieser verwaltet die Archivstruktur und vergibt die Zugriffsrechte auf das Archiv. Das Recht zur Administration kann weitergegeben werden, d.h. der Besitzer kann die Administrationsaufgabe delegieren. Archivprofil Ein Archivprofil umfasst die Zugriffsrechte auf ein Archiv. Dazu gehören unter anderem die Zugriffsrechte auf Indexfelder oder Dokumente, die auch von bestimmten Indexeinträgen abhängig sein können (feldabhängige Rechte). Ein Archivprofil kann auch administrative Rechte innerhalb eines Archivs umfassen. Ein Archivprofil wird innerhalb eines Archivs definiert. Benutzer In diesem White Paper ist ein Benutzer immer ein DocuWare Benutzer. Benutzer können zu Gruppen zusammengefasst werden. Benutzer erhalten Rechte sowohl über Einzelrechte, Profile oder Rollen. COLD Einziges proprietäres Dateiformat in DocuWare ist das COLD-Format. Es ist ein ANSI-Format und nimmt die Text-Spooldaten beim Einlesen mit DocuWare COLD/READ auf. DocuWare-Client DocuWare-Client ist ein Oberbegriff für den Windows- und den Web Client. Der Windows-Client wird auf einem Windows-Rechner installiert und läuft dort als eigene Anwendung. Zusammen mit den DocuWare-Servern ergibt er eine funktionsfähige Installation. In einem DocuWare-System ist immer mindestens ein Windows-Client erforderlich. Über den DocuWare Web Client kann man über das Internet auf DocuWare-Archive zugreifen. Eine Installation am Client-Rechner ist nicht erforderlich. Im DocuWare-System muss dafür der Web Client Server installiert sein. DocuWare-Server DocuWare-Server ist ein Oberbegriff und umfasst alle Server-Module wie Authentication Server, Content Server, Workflow Server, Imaging Server und Web Client Server. DocuWare-System Das DocuWare-System umfasst eine komplette DocuWare-Installation mit allen dafür erforderlichen sowie eventuell optionalen Komponenten. Ein DocuWare-System kennzeichnet sich durch gemeinsame Hardware und Systemeinstellungen für eine oder mehrere „Organisationen“ aus. Teilweise wird anstatt vom DocuWare-System auch einfach von DocuWare gesprochen. 46
  • 47. Glossar Dokument Ein „Dokument“ ist ein Oberbegriff für die im Archiv abgelegten Objekte, die aus Benutzersicht eine logische Einheit - eben ein Dokument - bilden. Ein Dokument kann aus einer beliebigen Anzahl von Dateien bestehen. Häufig wird es sich um gescannte Informationen im TIFF oder Multi-TIF-Format handeln. Dateien aus Output-Management-Systemen, Office- oder Grafik- applikationen oder gar Binärdateien werden aber gleichartig behandelt. Eine Datei kann eine oder mehrere Seite(n) repräsentieren. Eine Datei kann aber auch Stempel, Signaturen, Anmerkungen o.ä. ergänzende Informationen zum Dokument beinhalten. Dokumente können weiterhin aus Dateien mit unterschiedlich formatierten Inhalten bestehen. So können eine Office-Datei, zusammen mit einer E-Mail-Datei und mehreren TIFF-Dateien zusammen ein Dokument darstellen. Eindeutig identifiziert wird das Dokument über die DOCID. Feldabhängige Rechte Feldabhängige Rechte sind Rechte, die abhängig von bestimmten Indexfeldeinträgen sind. Funktionsprofil Ein Funktionsprofil umfasst Zugriffsrechte auf Funktionen des DocuWare Clients. Dazu gehören u.a. die Zugriffsrechte auf Menüfunktionen und Stempel. Funktionsprofile werden auf Organisationsebene definiert. Ein Funktionsprofil kann auch administrative Rechte auf Organisationsebene umfassen. Gruppe Unabhängig von Rollen können Benutzer zu Gruppen zusammengefasst werden, denen dann ebenfalls Rollen zugewiesen werden können. Eine Gruppe ist somit eine Zusammenfassung von Benutzern. Gruppen können ausschließlich über Rollen Rechte zugewiesen werden. Gruppen dienen der einfacheren Administration von mehreren Benutzern. Header DocuWare verwendet das XML-Format für die Speicherung der Metadaten (Indexdaten) und Dokumentergänzungen (Anmerkungen, Stempel etc.). Der Content selbst wird aus Performancegründen separat gespeichert (Ausnahme Export). Zusammengefasst werden diese Informationen in der „XML-Header-Datei“. Für jedes in DocuWare abgelegte Dokument existiert eine solche Header- Datei, die mit dem Dokument selbst („Content“) in der Dateiablage abgelegt wird. Indexdaten Siehe Header JPEG Joint Photographic Experts Group. Spezifikation zur verlustbehafteten Kompression von Farbbildern. "Verlustbehaftet" bedeutet, dass Bildinformationen beim Speichern irreversibel verloren gehen. JPEG wird eingesetzt, um Bilder mit großem Farbraum (großer Bittiefe) zu komprimieren. Menüfunktion Eine Menüfunktion umfasst eine Funktion innerhalb des DocuWare Clients. Dazu gehören u.a. die Funktionen Scannen und Dokumente anzeigen oder bearbeiten. Metadaten Siehe Header Organisation Eine Organisation umfasst im Wesentlichen das Management der Benutzer und der Archive. Innerhalb der Organisation werden keine Hardware- Administrationen durchgeführt. Die gesamte Systemverwaltung erfolgt auf Systemebene. Organisations- Der Organisations-Administrator verwaltet wie schon sein Name sagt eine Administrator Organisation. Ein DocuWare-System kann eine oder auch mehrere Organisationen umfassen. Der Organisations-Administrator verwaltet insbesondere die Rechte und Benutzer einer Organisation. Er hat keine Zugriffsrechte auf Archive und ihre Verwaltung. 47
  • 48. Glossar PNG Abkürzung für "portable network graphic format". Das vom World Wide Web Consortium (W3C) entwickelte und als Standard verabschiedete Format ist lizenzfrei und soll GIF- und JPEG-Bilder ablösen - komprimierend und ohne gravierende Qualitätseinbußen. Profile Profile sind die Zusammenfassung von Einzelrechten. Profile werden in Archivprofile und Funktionsprofile unterschieden. Profile können entweder administrative Rechte oder Zugriffsrechte auf ein Archiv enthalten. Rechte Rechte erlauben die Ausführung von bestimmten Funktionalitäten innerhalb des DocuWare Systems. Einzelrechte können in Archiven und auf Organisationsebene vergeben werden. Rolle Benutzer haben in den Unternehmensorganisationen verschiedene Rollen, die sich aus Ihrer Stellung in der Hierarchie (z.B. Genehmigung von Urlaubsanträgen) und aus Ihrer Aufgabenbeschreibung (z.B. Einkäufer) ergeben. Entsprechende Rollen lassen sich in DocuWare abbilden, um die Installation und Administration zu vereinfachen. Dazu werden Funktionen und Zugriffsrechte in Profilen zusammengefasst, die den Rollen zugewiesen werden. Das Rollenkonzept wird auch vom DocuWare-System selbst benutzt, in dem bestimmte Rollen mit entsprechenden Profilen für administrative Aufgaben bereits vordefiniert sind. Eine Rolle ist eine Zusammenfassung von Profilen. Rollen können keine Einzelrechte beinhalten. Vordefinierte Rollen erlauben die einfache Vergabe von administrativen Rechten. System Siehe DocuWare System System-Administrator Der System-Administrator verwaltet das System, insbesondere aus Hardwaresicht. Dazu gehören u.a. die Verwaltung der Datenbankverbindungen, die Verwaltung der Kommunikationswege und die Ablagepfade für die Dokumente. Der System-Administrator hat keine Zugriffsrechte auf Organisationsinformationen, insbesondere kann er nicht in die Benutzerverwaltung eingreifen. TIFF Tagged Image File Format: Wichtigstes Format in DocuWare ist Schwarz- Weiß (1-bit) TIFF, nach CCITT Group 4 komprimiert. Dieses Format hat sich für die elektronische Archivierung gescannter Dokumente als Standard durchgesetzt. Zur Archivierung erzeugt DocuWare für jede Seite eines Dokumentes eine Datei. Vordefinierte Rollen Vordefinierte Rollen werden vom DocuWare System mitgeliefert und garantieren die Arbeitsfähigkeit des Systems bei einer ersten Installation. Vordefinierte Rollen sind der System-Administrator, der Organisations- Administrator und der Archiv-Besitzer. Workflow Ein Workflow ist eine vordefinierte Folge von Arbeitsschritten, die bei dem Eintreffen eines vordefinierten Ereignisses automatisch innerhalb von DocuWare ausgeführt wird. Workflow Server Der Workflow Server ist das Modul, das die Workflows zur Laufzeit ausführt. XML Siehe Header Zugriffsrechte Zugriffsrechte umfassen Zugriffe auf Archive oder Menüfunktionen innerhalb des DocuWare Clients. 48