Loading...
Flash Player 9 (or above) is needed to view slideshows. We have detected that you do not have it on your computer.To install it, go here
Integrationsansätze: Überblick und Potentiale semantischer Technologien
Vortrag auf dem Business Integration Forum 2007, Mainz, 25.4.07
1411 views | comments | 0 favorites | 45 downloads | 0 embeds (Stats)
More Info
This slideshow is Public
Total Views: 1411 on Slideshare: 1411 from embeds: 0
Slideshow Transcript
- Slide 1: Andreas Schmidt
Integrationsansätze: Überblick und
Potentiale semantischer Technologien
Abteilungsleiter im
Forschungsbereich Information Process Engineering
FZI Forschungszentrum Informatik, Karlsruhe
Andreas.Schmidt@fzi.de
http://www.fzi.de/ipe
FZI Research Center for Information Technologies Karlsruhe, Germany | Information Process Engineering | www.fzi.de/ipe 1
- Slide 2: Agenda
Strukturierung der Integrationsproblematik
• Informationsebene
• Anwendungsebene
• Prozessebene
• Präsentationsebene
Potentiale semantischer Technologien
• Informationsebene
• Anwendungsebene
• Prozessebene
• Präsentationsebene
Fazit
Business Integration Forum 2007 2
- Slide 3: Integrationsebenen
Präsentationsfragmente
Präsentationsebene
client-seitige Integration
Prozeßebene Dienste
Dienstschnittstelle, -semantik
Dienstfindung, -orchestrierung
Anwendungslogikebene
Informationsquellen
Informationsebene Datenmodell, Schema,
semantische Heterogenität
Netzwerkprotokolle, RPC
Technische Ebene
Darstellungssyntax
Business Integration Forum 2007 3
- Slide 4: Informationsperspektive
Einzubindende „Quellen“ sind Informationsquellen
Interaktion mit den externen Quellen läuft über das
Anfrage-Ergebnis-Paradigma
Es existiert eine zentrale Stelle, an der alle Informationen
zusammenlaufen
Hauptproblem:
• Überwindung der semantischen Heterogenität
(Datenmodell, Schema, Instanzdaten)
• Architekturen zur konsistenten Datenhaltung (Aktualisierung!)
Business Integration Forum 2007 4
- Slide 5: Arten von Integrationskonflikten
Unterschiedliche Ausdrucksmächtigkeit von
Datenmodellen
Datenmodell
Relational, Objektorientiert, XML, Semistrukturiert
Freiheitsgrade in der Modellierung der realen Welt
Logische Ebene:
klassische »Schemaintegration«
Schema
Zusammenführen von Instanzen
Daten (Objektidentität/Duplikaterkennung)
Instanzen Widersprüchlichkeit, Inkonsistenzen, Subjektivität
Business Integration Forum 2007 5
- Slide 6: Arten von Integrationskonflikten
Unterschiedliche Ausdrucksmächtigkeit von
Datenmodellen
Datenmodell
Relational, Objektorientiert, XML, Semistrukturiert
Freiheitsgrade in der Modellierung der realen Welt
Schema klassische »Schemaintegration«
Zusammenführen von Instanzen
Daten (Objektidentität/Duplikaterkennung)
Instanzen Widersprüchlichkeit, Inkonsistenzen, Subjektivität
Business Integration Forum 2007 6
- Slide 7: Arten von Integrationskonflikten
Unterschiedliche Ausdrucksmächtigkeit von
Datenmodellen
Datenmodell
Relational, Objektorientiert, XML, Semistrukturiert
Freiheitsgrade in der Modellierung der realen Welt
Schema klassische »Schemaintegration«
Zusammenführen von Instanzen
Daten (Objektidentität/Duplikaterkennung)
Instanzen Widersprüchlichkeit, Inkonsistenzen, Subjektivität
Business Integration Forum 2007 7
- Slide 8: Arten von Integrationskonflikten
Unterschiedliche Ausdrucksmächtigkeit von
Datenmodellen
Datenmodell
Relational, Objektorientiert, XML, Semistrukturiert
Freiheitsgrade in der Modellierung der realen Welt
Schema klassische »Schemaintegration«
Zusammenführen von Instanzen
Daten (Objektidentität/Duplikaterkennung)
Instanzen Widersprüchlichkeit, Inkonsistenzen, Subjektivität
Business Integration Forum 2007 8
- Slide 9: Ebenen der semantischen Integration
Schemaintegration
(bzw. Integration auf Schemaebene)
• Zusammenführen und semantische Vereinheitlichung allein auf der Basis
von Schemainformationen
o Typen, Klassen, Attribute, Vererbungsrelation etc.
o Abbildung wird auf alle Instanzen angewendet
• Mapping-Tools
Instanzintegration
(bzw. Integration auf Instanzebene)
• Zusammenführen von Informationen über einzelne Instanzen (oder
Objekte)
o auf der Basis von Werten
o typisch: Ähnlichkeitsmaße, paarweise Vergleich, Objektidentität,
wertabhängige Abbildungsregeln
o Schemainformation reicht als Information nicht aus!
Business Integration Forum 2007 9
- Slide 10: Konflikte auf Instanzebene
Probleme
• Duplikate
• Veraltete Daten
• falsche Daten
Kunden Abnehmer
KName KStrasse KStadt KPlz Name Strasse Stadt Plz Land
Neuestr. 8, Heidelberg, 69115, Deutschland
Blau AG Domstr. 3 Köln 50033 BLAU
... ... ... ... ... ... ... ... ...
bestellt versorgt
Kunde Ware Datum BestMenge Abnehmer Produzent Datum Ware Preis Menge
Blau AG Zement 20.05.01 100
... ... ... ...
Waren
WBeschreibung WPreis hergestelltVon Produzent
PName PStrasse PStadt PPlz PLand betreutVon
Hersteller
HName HStrasse HStadt HPlz Verband
VBranche
System 1 System 2
Business Integration Forum 2007 10
- Slide 11: Architektur : Virtuell vs. materialisiert
Aufbau einer zentralen Datenbasis, in die die Inhalte
der angeschlossenen Quellen in einem
Vorverarbeitungsschritt importiert werden. Diese
Datenbasis stellt die integrierte Sicht dar
materialisierter Ansatz
a priori Integration (eager)
Nutzung der Systeme der Quellen für die
Anfrageauswertung (Durchreichen von Anfragen). Die
integrierte Sicht ist physisch nicht vorhanden; sie wird
von Mediatoren dynamisch bereitgestellt:
virtueller Ansatz
Integration bei Bedarf (lazy)
Business Integration Forum 2007 11
- Slide 12: Materialisierter Ansatz
Anwendung
für Anfragen wird nur die
zentrale Datenbasis genutzt
Zentrale Datenbasis
(periodischer) Import in die
zentrale Datenbasis
Quellen
Business Integration Forum 2007 12
- Slide 13: Virtuelle Integration
Quellenauswahl Facilitator
Schema- und
Mediator Mediator
Instanzintegration
Datenmodell-
Wrapper Wrapper Wrapper
integration
Business Integration Forum 2007 13
- Slide 14: Materialisierter Ansatz – Vorteile
Einfach zu realisieren
• Anwendungsentwicklung unterscheidet sich durch zentrale
Datenbasis kaum vom Ein-Quellen-Fall
• Mehr Informationen über vorhandene Daten
Performant
• Direkte Datenbankzugriffe für Anfrageauswertung
• Entkopplung von (evtl. langsamen, nur teilweise
verfügbaren) externen Systemen
• gezielte Optimierungen möglich
Nachbearbeitungsoperationen möglich
• Von den Fremdanbietern gelieferte Daten können (auch
aufwendig) geprüft und bereinigt werden
• Aggregation von Daten ebenfalls leicht möglich
Business Integration Forum 2007 14
- Slide 15: Materialisierter Ansatz: Nachteile
(redundante) Speicherung evtl. großer Datenmengen
• leistungsfähige Infrastruktur erforderlich
Aktualität der Daten ist nicht gewährleistet
• klassisches Caching-Problem
Aktualisierung
• auf Initiative der Datenquellen
o organisatorische Maßnahmen erforderlich
o Insbesondere: wir brauchen ein Austauschformat!
• Aktualisierung auf Initiative des Portals
o bei großen Datenmengen häufig unpraktikabel
o keine Information, was geändert wurde
Keine Kontrolle des Urhebers mehr über die Daten!
Business Integration Forum 2007 15
- Slide 16: Integrationsebenen
Präsentationsfragmente
Präsentationsebene
client-seitige Integration
Prozeßebene Dienste
Dienstschnittstelle, -semantik
Dienstfindung, -orchestrierung
Anwendungslogikebene
Informationsquellen
Informationsebene Datenmodell, Schema,
semantische Heterogenität
Netzwerkprotokolle, RPC
Technische Ebene
Darstellungssyntax
Business Integration Forum 2007 16
- Slide 17: Dienstperspektive
Einzubindende Systeme sind Dienste
• klar definierte Schnittstelle und zu erbringende Funktionalität
• deutlich spezifischer als Anfrageschnittstellen
Autonomen Dienste soll durch eine Infrastruktur die
gegenseitige Nutzung ermöglicht werden
=> Dienstorientierte Architekturen
Hauptprobleme
• Wie mache ich Dienste interoperabel?
• Wie finde ich benötigte Dienste?
• Wie beschreibe ich Dienste?
Business Integration Forum 2007 17
- Slide 18: Kernprobleme für dienstorientierte Architekturen
Kommunikationsprotokoll (technische Ebene)
• Kodierung von Methodenaufruf und Parameterübergabe
• Authentifizierung, Sicherheit etc.
Dienstbeschreibung
• Konkrete Adresse (wie erreiche ich den Dienst)
• Dienstschnittstelle (wie rufe ich ihn auf)
• Semantik des Dienstes (was tut der Dienst)
• Organisatorisches (was kostet der Dienst o.ä.)
Verzeichnisdienste
Möglichkeiten zur Aggregierung von Diensten
Business Integration Forum 2007 18
- Slide 19: Dienstorientierte Architekturen – Lose Kopplung
Dienst- Implementie-rungen
nutzen
nehmer werden
austauschbar
(service requestor)
Dienst-
Mehrere Dienste
nutzen
nehmer hinter derselben
(service requestor) Fassade
Dienst-
nutzen mehrschrittige
nehmer Verarbeitung
(service requestor)
Business Integration Forum 2007 19
- Slide 20: Prozessperspektive
Auf der Abstraktionsebene von Diensten spielt nicht nur
die isolierte Dienstfunktionalität eine Rolle, sondern auch
deren Abfolge.
• hier ist auch die wichtige Brücke zwischen der IT-Sicht und der
Geschäfts-Sicht
Dementsprechend spielt auch die Prozessintegration eine
große Rolle.
• viele Versuche, Prozess- und Dienstebene voneinander zu
trennen
• allerdings: klare und eindeutige Trennung ist nicht so einfach
möglich
Business Integration Forum 2007 20
- Slide 21: Die Web-Service-Welt
Geschäftsprozesse Management
BPML WS-Events
BPEL
WSMF MOWS
WS-Choreography
WS-Management WSMF-WSM
WS-Choreography Description Language
MUWS
Sicherheit Zuverlässigkeit Transaktionen Ressourcen
WS-Security
WS-Business Activity
WS-Reliability Web Services
WS-Trust
WS-Atomic Transact.
WS-Reliable Messag. Resources Framework
WS-Security Policy
WS-Federation WS-Coordination
WS-Secure Conversat.
Metadaten Nachrichten
WSDL WS-Policy SOAP WS-Notification WS-Adressing
WS-Discovery WS-Metadata-Exchange
UDDI
Business Integration Forum 2007 21
- Slide 22: Integrationsebenen
Präsentationsfragmente
Präsentationsebene
client-seitige Integration
Prozeßebene Dienste
Dienstschnittstelle, -semantik
Dienstfindung, -orchestrierung
Anwendungslogikebene
Informationsquellen
Informationsebene Datenmodell, Schema,
semantische Heterogenität
Netzwerkprotokolle, RPC
Technische Ebene
Darstellungssyntax
Business Integration Forum 2007 22
- Slide 23: Präsentationsebene
Grundidee ist hier: einheitliche Darstellung von
unterschiedlichen Inhalten
Ansätze
• Einbindung gerenderter Inhalte, also HTML-Fragmente
(=> Portlets)
• reine Overlay-Techniken
• Einbindung von GUI-Steuerelementen
Business Integration Forum 2007 23
- Slide 24: Google Maps Mashups
Business Integration Forum 2007 24
- Slide 25: Potentiale semantischer Technologien
FZI Research Center for Information Technologies Karlsruhe, Germany | Information Process Engineering | www.fzi.de/ipe 25
- Slide 26: Motivation
Hauptherausforderung bei der Informationsintegration ist
die Überwindung der semantischen Heterogenität
Dabei steht die prinzipielle Machbarkeit außer Frage.
Aber wie bekommt semantische Integration auch effizient
(i.S.d. menschlichen Aufwandes), wartbar und skalierbar
in den Griff?
• kann nur durch einen höheren Grad der Automatisierung erreicht
werden
• und durch Spezifikationen auf höherer Abstraktionsebene
Business Integration Forum 2007 26
- Slide 27: Semantische Technologien...
... sind ein Sammelbegriff für aktuelle technische Ansätze,
um dies zu realisieren.
Überwiegend bedienen sie sich Ontologien als Instrument
zur expliziten und maschinenverarbeitbaren
Repräsentation von Semantik.
Prominenteste Vision dieser Technologieansätze ist das
Semantic Web.
Business Integration Forum 2007 27
- Slide 28: Arten von Semantik
[Uschold (2002), “Where are the Semantics in the Semantic Web?”]
Business Integration Forum 2007 28
- Slide 29: Ontologien in der Informatik
Eine Ontologie [in der Informatik] ist eine
• explizite Spezifikation einer Konzeptualisierung [explicit
specification of a conceptualization] (Gruber 1993)
• ein gemeinsames Verständnis einer bestimmten Domäne
[shared understanding of a domain of interest]
(Uschold & Grüninger 1996)
Formalitätsgrad kann variieren:
• von kontrollierten Vokabularen bis hin zu schwergewichtigen
Ontologien mit logischer Axiomatisierung
Business Integration Forum 2007 29
- Slide 30: Integrationsebenen
Präsentationsfragmente
Präsentationsebene
Microformats
Prozeßebene Dienste
Dienstsemantik
Dienstfindung, -orchestrierung
Anwendungslogikebene
gemeinsame Semantik
Abbildungen auf konzeptueller
Informationsebene
Ebene spezifizieren
Technische Ebene
Business Integration Forum 2007 30
- Slide 31: Grundidee
Modellierung von Konzepten und Relationen der
Anwendungswelt als Ontologie
(= konzeptuelle Modellierung)
Deklarative Spezifikation von Abbildungsregeln zwischen
der Ontologie und den beteiligten Quellen
Zur Laufzeit: Ausführung dieser Abbildungsregeln
Fortgeschritten:
• semiautomatische Entdeckung diese Abbildungsregeln
Business Integration Forum 2007 31
- Slide 32: Anwendungen: Datenaustausch
automatisierter Vorgang
manueller Vorgang
Ontologie
Bezug Bezug
XML-Struktur Ontologie XML-Struktur Ontologie
XSL-T
Import-Werkzeuge
Export-Werkzeuge
des RDBMS
des RDBMS
XML XML
RDBMS 1 RDBMS 2
XSL-T
Werkzeug
Business Integration Forum 2007 32
- Slide 33: Bewertung
Ontologien sind wohl dosiert eingesetzt elegante (da auf
deskriptiven Spezifikationen aufbauend) Bausteine für
typische Integrationsprobleme, vor allem wenn
• viel Domänenwissen benötigt wird
• mit unvollständigen Informationen umgegangen wird
Schritt auf dem Weg zu mehr modellgetriebenen
Integrationsansätzen
Business Integration Forum 2007 33
- Slide 34: Integrationsebenen
Präsentationsfragmente
Präsentationsebene
Microformats
Prozeßebene
Dienste
Anwendungslogikebene Dienstsemantik
Dienstfindung, -orchestrierung
gemeinsame Semantik
Abbildungen auf konzeptueller
Informationsebene
Ebene spezifizieren
Technische Ebene
Business Integration Forum 2007 34
- Slide 35: Motivation
Bislang hat sich die Beschreibung von Web Services auf
syntaktische Aspekte beschränkt
• Überprüfung, ob syntaktisch korrekter Aufruf
• Generierung von sprachspezifischen Bindings
Aber:
• keine Suche nach Diensten, die etwas Bestimmtes tun
• keine automatisierte Kopplung
• keine Prüfung von Qualitätsbeschreibungen
Idee: Erweiterung der Beschreibungskonzepte für Web
Services durch ontologiebasierte Verfahren, so dass eine
maschinenverarbeitbare semantische Beschreibung entsteht.
Business Integration Forum 2007 35
- Slide 36: Dienste: Was wollen wir semantisch beschreiben?
Semantik der übertragenen Parameter
• Mittel: semantische Annotation der Nachrichtenschemata
• Zweck: Interoperabilität/Mediation
Semantik der Dienstfunktionalität
• Mittel: Annotation, ggf. mit Vor-/Nachbedingungen
• Zweck: Dienstfindung und -komposition
Semantik der Dienstgüte
• Mittel: formale Beschreibung der Dienstgüte / SLAs
• Zweck: Dienstfindung und Überprüfbarkeit
Ausführungssemantik
• Mittel: formale Modellierung der Abläufe
• Zweck: Validierung, Verifikation
Business Integration Forum 2007 36
- Slide 37: Beispiel: SemanticUDDI
Grundidee:
• UDDI-Dienstverzeichnisse sind derzeit für Fachexperten nur
schwer zu benutzen
• deshalb: Annotation um Fachsemantik
• dies kann allerdings nur durch die Fachexperten selbst erfolgen
Lösung
• Kopplung eines UDDI-Verzeichnisses an ein SemanticWiki-
System
Projekt im Auftrag der LUBW – Landesanstalt für
Umweltschutz Baden-Württemberg
Business Integration Forum 2007 37
- Slide 38: Ontologiezentrierter Architekturstil
Business Integration Forum 2007 38
- Slide 39: Ontologie für die Lernunterstützung
http://professional-learning.eu
Business Integration Forum 2007 39
- Slide 40: Integrationsebenen
Präsentationsfragmente
Präsentationsebene
Microformats
Prozesse
Prozeßebene Traceability, Compliance
Anwendungslogikebene
gemeinsame Semantik
Abbildungen auf konzeptueller
Informationsebene
Ebene spezifizieren
Technische Ebene
Business Integration Forum 2007 40
- Slide 41: Semantik für die Geschäftsprozessmodellierung
Traceability
• Explizite semantische Zusammenhänge zwischen
Prozessmodellen und technischen Diensten
• dadurch leichteres Change Management
• erste Anwendungen im eGovernment
Überprüfung der Compliance
• Beschreibung von Ausführungsbedingungen
• damit z.B. Risikomanagement automatisierbar
Business Integration Forum 2007 41
- Slide 42: Integrationsebenen
Präsentationsfragmente
Präsentationsebene
Microformats
Prozesse
Prozeßebene Traceability, Compliance
Anwendungslogikebene
gemeinsame Semantik
Abbildungen auf konzeptueller
Informationsebene
Ebene spezifizieren
Technische Ebene
Business Integration Forum 2007 42
- Slide 43: Fazit: Semantische Technologien
Ontologiegestützte semantische Technologien sind mächtige
Werkzeuge
• standardisierte Technologien (Sprachen, Werkzeuge) für die breite
Anwendung vorhanden
• erste Implementierungserfahrungen
• bieten Vorteile in Richtung modellgetriebener Entwicklung
• bessere Beherrschbarkeit komplexer Systeme durch höhere
Abstraktionsebene
Allerdings sollte ihr Einsatz wohldosiert erfolgen
• Berücksichtigung von Skalierbarkeit
• Aufwendige Entwicklung von Ontologien
• Nutzen von Ontologien liegt vor allem im Umgang mit
o unvollständigen Informationen
o hohem Maß an Hintergrundwissen
Business Integration Forum 2007 43
- Slide 44: Kontakt
Andreas Schmidt
Ableitungsleiter
Forschungsbereich Information Process Engineering
FZI Forschungszentrum Informatik, Karlsruhe
andreas.schmidt@fzi.de
http://www.fzi.de/ipe
Business Integration Forum 2007 44