Loading...
Flash Player 9 (or above) is needed to view slideshows. We have detected that you do not have it on your computer.To install it, go here
 
Post to Twitter Post to Twitter
Myspace Hi5 Friendster Xanga LiveJournal Facebook Blogger Tagged Typepad Freewebs BlackPlanet gigya icons
SlideShare is now available on LinkedIn. Add it to your LinkedIn profile.

Integrationsansätze: Überblick und Potentiale semantischer Technologien

From aps, 2 years ago Add as contact

Vortrag auf dem Business Integration Forum 2007, Mainz, 25.4.07

1411 views | 0 comments | 0 favorites | 45 downloads | 0 embeds (Stats)

Categories

Business & Mgmt

Groups/Events

Embed in your blog options close
Embed (wordpress.com) Exclude related slideshows Embed in your blog

More Info

This slideshow is Public
CC Attribution-NonCommercial-ShareAlike LicenseCC Attribution-NonCommercial-ShareAlike LicenseCC Attribution-NonCommercial-ShareAlike License
Total Views: 1411 on Slideshare: 1411 from embeds: 0
Flagged as inappropriate Flag as inappropriate

Flag as inappropriate

Select your reason for flagging this slideshow as inappropriate.

If needed, use the feedback form to let us know more details.

Slideshow Transcript

  1. Slide 1: Andreas Schmidt Integrationsansätze: Überblick und Potentiale semantischer Technologien Abteilungsleiter im Forschungsbereich Information Process Engineering FZI Forschungszentrum Informatik, Karlsruhe Andreas.Schmidt@fzi.de http://www.fzi.de/ipe  FZI Research Center for Information Technologies Karlsruhe, Germany | Information Process Engineering | www.fzi.de/ipe 1
  2. Slide 2: Agenda  Strukturierung der Integrationsproblematik • Informationsebene • Anwendungsebene • Prozessebene • Präsentationsebene  Potentiale semantischer Technologien • Informationsebene • Anwendungsebene • Prozessebene • Präsentationsebene  Fazit Business Integration Forum 2007 2
  3. Slide 3: Integrationsebenen Präsentationsfragmente Präsentationsebene client-seitige Integration Prozeßebene Dienste Dienstschnittstelle, -semantik Dienstfindung, -orchestrierung Anwendungslogikebene Informationsquellen Informationsebene Datenmodell, Schema, semantische Heterogenität Netzwerkprotokolle, RPC Technische Ebene Darstellungssyntax Business Integration Forum 2007 3
  4. Slide 4: Informationsperspektive  Einzubindende „Quellen“ sind Informationsquellen  Interaktion mit den externen Quellen läuft über das Anfrage-Ergebnis-Paradigma  Es existiert eine zentrale Stelle, an der alle Informationen zusammenlaufen  Hauptproblem: • Überwindung der semantischen Heterogenität (Datenmodell, Schema, Instanzdaten) • Architekturen zur konsistenten Datenhaltung (Aktualisierung!) Business Integration Forum 2007 4
  5. Slide 5: Arten von Integrationskonflikten Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen Datenmodell Relational, Objektorientiert, XML, Semistrukturiert Freiheitsgrade in der Modellierung der realen Welt Logische Ebene: klassische »Schemaintegration« Schema Zusammenführen von Instanzen Daten (Objektidentität/Duplikaterkennung) Instanzen Widersprüchlichkeit, Inkonsistenzen, Subjektivität Business Integration Forum 2007 5
  6. Slide 6: Arten von Integrationskonflikten Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen Datenmodell Relational, Objektorientiert, XML, Semistrukturiert Freiheitsgrade in der Modellierung der realen Welt Schema klassische »Schemaintegration« Zusammenführen von Instanzen Daten (Objektidentität/Duplikaterkennung) Instanzen Widersprüchlichkeit, Inkonsistenzen, Subjektivität Business Integration Forum 2007 6
  7. Slide 7: Arten von Integrationskonflikten Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen Datenmodell Relational, Objektorientiert, XML, Semistrukturiert Freiheitsgrade in der Modellierung der realen Welt Schema klassische »Schemaintegration« Zusammenführen von Instanzen Daten (Objektidentität/Duplikaterkennung) Instanzen Widersprüchlichkeit, Inkonsistenzen, Subjektivität Business Integration Forum 2007 7
  8. Slide 8: Arten von Integrationskonflikten Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen Datenmodell Relational, Objektorientiert, XML, Semistrukturiert Freiheitsgrade in der Modellierung der realen Welt Schema klassische »Schemaintegration« Zusammenführen von Instanzen Daten (Objektidentität/Duplikaterkennung) Instanzen Widersprüchlichkeit, Inkonsistenzen, Subjektivität Business Integration Forum 2007 8
  9. Slide 9: Ebenen der semantischen Integration  Schemaintegration (bzw. Integration auf Schemaebene) • Zusammenführen und semantische Vereinheitlichung allein auf der Basis von Schemainformationen o Typen, Klassen, Attribute, Vererbungsrelation etc. o Abbildung wird auf alle Instanzen angewendet • Mapping-Tools  Instanzintegration (bzw. Integration auf Instanzebene) • Zusammenführen von Informationen über einzelne Instanzen (oder Objekte) o auf der Basis von Werten o typisch: Ähnlichkeitsmaße, paarweise Vergleich, Objektidentität, wertabhängige Abbildungsregeln o Schemainformation reicht als Information nicht aus! Business Integration Forum 2007 9
  10. Slide 10: Konflikte auf Instanzebene  Probleme • Duplikate • Veraltete Daten • falsche Daten Kunden Abnehmer KName KStrasse KStadt KPlz Name Strasse Stadt Plz Land Neuestr. 8, Heidelberg, 69115, Deutschland Blau AG Domstr. 3 Köln 50033 BLAU ... ... ... ... ... ... ... ... ... bestellt versorgt Kunde Ware Datum BestMenge Abnehmer Produzent Datum Ware Preis Menge Blau AG Zement 20.05.01 100 ... ... ... ... Waren WBeschreibung WPreis hergestelltVon Produzent PName PStrasse PStadt PPlz PLand betreutVon Hersteller HName HStrasse HStadt HPlz Verband VBranche System 1 System 2 Business Integration Forum 2007 10
  11. Slide 11: Architektur : Virtuell vs. materialisiert  Aufbau einer zentralen Datenbasis, in die die Inhalte der angeschlossenen Quellen in einem Vorverarbeitungsschritt importiert werden. Diese Datenbasis stellt die integrierte Sicht dar materialisierter Ansatz a priori Integration (eager)  Nutzung der Systeme der Quellen für die Anfrageauswertung (Durchreichen von Anfragen). Die integrierte Sicht ist physisch nicht vorhanden; sie wird von Mediatoren dynamisch bereitgestellt: virtueller Ansatz Integration bei Bedarf (lazy) Business Integration Forum 2007 11
  12. Slide 12: Materialisierter Ansatz Anwendung für Anfragen wird nur die zentrale Datenbasis genutzt Zentrale Datenbasis (periodischer) Import in die zentrale Datenbasis Quellen Business Integration Forum 2007 12
  13. Slide 13: Virtuelle Integration Quellenauswahl Facilitator Schema- und Mediator Mediator Instanzintegration Datenmodell- Wrapper Wrapper Wrapper integration Business Integration Forum 2007 13
  14. Slide 14: Materialisierter Ansatz – Vorteile  Einfach zu realisieren • Anwendungsentwicklung unterscheidet sich durch zentrale Datenbasis kaum vom Ein-Quellen-Fall • Mehr Informationen über vorhandene Daten  Performant • Direkte Datenbankzugriffe für Anfrageauswertung • Entkopplung von (evtl. langsamen, nur teilweise verfügbaren) externen Systemen • gezielte Optimierungen möglich  Nachbearbeitungsoperationen möglich • Von den Fremdanbietern gelieferte Daten können (auch aufwendig) geprüft und bereinigt werden • Aggregation von Daten ebenfalls leicht möglich Business Integration Forum 2007 14
  15. Slide 15: Materialisierter Ansatz: Nachteile  (redundante) Speicherung evtl. großer Datenmengen • leistungsfähige Infrastruktur erforderlich  Aktualität der Daten ist nicht gewährleistet • klassisches Caching-Problem  Aktualisierung • auf Initiative der Datenquellen o organisatorische Maßnahmen erforderlich o Insbesondere: wir brauchen ein Austauschformat! • Aktualisierung auf Initiative des Portals o bei großen Datenmengen häufig unpraktikabel o keine Information, was geändert wurde  Keine Kontrolle des Urhebers mehr über die Daten! Business Integration Forum 2007 15
  16. Slide 16: Integrationsebenen Präsentationsfragmente Präsentationsebene client-seitige Integration Prozeßebene Dienste Dienstschnittstelle, -semantik Dienstfindung, -orchestrierung Anwendungslogikebene Informationsquellen Informationsebene Datenmodell, Schema, semantische Heterogenität Netzwerkprotokolle, RPC Technische Ebene Darstellungssyntax Business Integration Forum 2007 16
  17. Slide 17: Dienstperspektive  Einzubindende Systeme sind Dienste • klar definierte Schnittstelle und zu erbringende Funktionalität • deutlich spezifischer als Anfrageschnittstellen  Autonomen Dienste soll durch eine Infrastruktur die gegenseitige Nutzung ermöglicht werden => Dienstorientierte Architekturen  Hauptprobleme • Wie mache ich Dienste interoperabel? • Wie finde ich benötigte Dienste? • Wie beschreibe ich Dienste? Business Integration Forum 2007 17
  18. Slide 18: Kernprobleme für dienstorientierte Architekturen  Kommunikationsprotokoll (technische Ebene) • Kodierung von Methodenaufruf und Parameterübergabe • Authentifizierung, Sicherheit etc.  Dienstbeschreibung • Konkrete Adresse (wie erreiche ich den Dienst) • Dienstschnittstelle (wie rufe ich ihn auf) • Semantik des Dienstes (was tut der Dienst) • Organisatorisches (was kostet der Dienst o.ä.)  Verzeichnisdienste  Möglichkeiten zur Aggregierung von Diensten Business Integration Forum 2007 18
  19. Slide 19: Dienstorientierte Architekturen – Lose Kopplung Dienst- Implementie-rungen nutzen nehmer werden austauschbar (service requestor) Dienst- Mehrere Dienste nutzen nehmer hinter derselben (service requestor) Fassade Dienst- nutzen mehrschrittige nehmer Verarbeitung (service requestor) Business Integration Forum 2007 19
  20. Slide 20: Prozessperspektive  Auf der Abstraktionsebene von Diensten spielt nicht nur die isolierte Dienstfunktionalität eine Rolle, sondern auch deren Abfolge. • hier ist auch die wichtige Brücke zwischen der IT-Sicht und der Geschäfts-Sicht  Dementsprechend spielt auch die Prozessintegration eine große Rolle. • viele Versuche, Prozess- und Dienstebene voneinander zu trennen • allerdings: klare und eindeutige Trennung ist nicht so einfach möglich Business Integration Forum 2007 20
  21. Slide 21: Die Web-Service-Welt Geschäftsprozesse Management BPML WS-Events BPEL WSMF MOWS WS-Choreography WS-Management WSMF-WSM WS-Choreography Description Language MUWS Sicherheit Zuverlässigkeit Transaktionen Ressourcen WS-Security WS-Business Activity WS-Reliability Web Services WS-Trust WS-Atomic Transact. WS-Reliable Messag. Resources Framework WS-Security Policy WS-Federation WS-Coordination WS-Secure Conversat. Metadaten Nachrichten WSDL WS-Policy SOAP WS-Notification WS-Adressing WS-Discovery WS-Metadata-Exchange UDDI Business Integration Forum 2007 21
  22. Slide 22: Integrationsebenen Präsentationsfragmente Präsentationsebene client-seitige Integration Prozeßebene Dienste Dienstschnittstelle, -semantik Dienstfindung, -orchestrierung Anwendungslogikebene Informationsquellen Informationsebene Datenmodell, Schema, semantische Heterogenität Netzwerkprotokolle, RPC Technische Ebene Darstellungssyntax Business Integration Forum 2007 22
  23. Slide 23: Präsentationsebene  Grundidee ist hier: einheitliche Darstellung von unterschiedlichen Inhalten  Ansätze • Einbindung gerenderter Inhalte, also HTML-Fragmente (=> Portlets) • reine Overlay-Techniken • Einbindung von GUI-Steuerelementen Business Integration Forum 2007 23
  24. Slide 24: Google Maps Mashups Business Integration Forum 2007 24
  25. Slide 25: Potentiale semantischer Technologien  FZI Research Center for Information Technologies Karlsruhe, Germany | Information Process Engineering | www.fzi.de/ipe 25
  26. Slide 26: Motivation  Hauptherausforderung bei der Informationsintegration ist die Überwindung der semantischen Heterogenität  Dabei steht die prinzipielle Machbarkeit außer Frage.  Aber wie bekommt semantische Integration auch effizient (i.S.d. menschlichen Aufwandes), wartbar und skalierbar in den Griff? • kann nur durch einen höheren Grad der Automatisierung erreicht werden • und durch Spezifikationen auf höherer Abstraktionsebene Business Integration Forum 2007 26
  27. Slide 27: Semantische Technologien...  ... sind ein Sammelbegriff für aktuelle technische Ansätze, um dies zu realisieren.  Überwiegend bedienen sie sich Ontologien als Instrument zur expliziten und maschinenverarbeitbaren Repräsentation von Semantik.  Prominenteste Vision dieser Technologieansätze ist das Semantic Web. Business Integration Forum 2007 27
  28. Slide 28: Arten von Semantik [Uschold (2002), “Where are the Semantics in the Semantic Web?”] Business Integration Forum 2007 28
  29. Slide 29: Ontologien in der Informatik  Eine Ontologie [in der Informatik] ist eine • explizite Spezifikation einer Konzeptualisierung [explicit specification of a conceptualization] (Gruber 1993) • ein gemeinsames Verständnis einer bestimmten Domäne [shared understanding of a domain of interest] (Uschold & Grüninger 1996)  Formalitätsgrad kann variieren: • von kontrollierten Vokabularen bis hin zu schwergewichtigen Ontologien mit logischer Axiomatisierung Business Integration Forum 2007 29
  30. Slide 30: Integrationsebenen Präsentationsfragmente Präsentationsebene Microformats Prozeßebene Dienste Dienstsemantik Dienstfindung, -orchestrierung Anwendungslogikebene gemeinsame Semantik Abbildungen auf konzeptueller Informationsebene Ebene spezifizieren Technische Ebene Business Integration Forum 2007 30
  31. Slide 31: Grundidee  Modellierung von Konzepten und Relationen der Anwendungswelt als Ontologie (= konzeptuelle Modellierung)  Deklarative Spezifikation von Abbildungsregeln zwischen der Ontologie und den beteiligten Quellen  Zur Laufzeit: Ausführung dieser Abbildungsregeln  Fortgeschritten: • semiautomatische Entdeckung diese Abbildungsregeln Business Integration Forum 2007 31
  32. Slide 32: Anwendungen: Datenaustausch automatisierter Vorgang manueller Vorgang Ontologie Bezug Bezug XML-Struktur  Ontologie XML-Struktur  Ontologie XSL-T Import-Werkzeuge Export-Werkzeuge des RDBMS des RDBMS XML XML RDBMS 1 RDBMS 2 XSL-T Werkzeug Business Integration Forum 2007 32
  33. Slide 33: Bewertung  Ontologien sind wohl dosiert eingesetzt elegante (da auf deskriptiven Spezifikationen aufbauend) Bausteine für typische Integrationsprobleme, vor allem wenn • viel Domänenwissen benötigt wird • mit unvollständigen Informationen umgegangen wird  Schritt auf dem Weg zu mehr modellgetriebenen Integrationsansätzen Business Integration Forum 2007 33
  34. Slide 34: Integrationsebenen Präsentationsfragmente Präsentationsebene Microformats Prozeßebene Dienste Anwendungslogikebene Dienstsemantik Dienstfindung, -orchestrierung gemeinsame Semantik Abbildungen auf konzeptueller Informationsebene Ebene spezifizieren Technische Ebene Business Integration Forum 2007 34
  35. Slide 35: Motivation  Bislang hat sich die Beschreibung von Web Services auf syntaktische Aspekte beschränkt • Überprüfung, ob syntaktisch korrekter Aufruf • Generierung von sprachspezifischen Bindings  Aber: • keine Suche nach Diensten, die etwas Bestimmtes tun • keine automatisierte Kopplung • keine Prüfung von Qualitätsbeschreibungen  Idee: Erweiterung der Beschreibungskonzepte für Web Services durch ontologiebasierte Verfahren, so dass eine maschinenverarbeitbare semantische Beschreibung entsteht. Business Integration Forum 2007 35
  36. Slide 36: Dienste: Was wollen wir semantisch beschreiben?  Semantik der übertragenen Parameter • Mittel: semantische Annotation der Nachrichtenschemata • Zweck: Interoperabilität/Mediation  Semantik der Dienstfunktionalität • Mittel: Annotation, ggf. mit Vor-/Nachbedingungen • Zweck: Dienstfindung und -komposition  Semantik der Dienstgüte • Mittel: formale Beschreibung der Dienstgüte / SLAs • Zweck: Dienstfindung und Überprüfbarkeit  Ausführungssemantik • Mittel: formale Modellierung der Abläufe • Zweck: Validierung, Verifikation Business Integration Forum 2007 36
  37. Slide 37: Beispiel: SemanticUDDI  Grundidee: • UDDI-Dienstverzeichnisse sind derzeit für Fachexperten nur schwer zu benutzen • deshalb: Annotation um Fachsemantik • dies kann allerdings nur durch die Fachexperten selbst erfolgen  Lösung • Kopplung eines UDDI-Verzeichnisses an ein SemanticWiki- System  Projekt im Auftrag der LUBW – Landesanstalt für Umweltschutz Baden-Württemberg Business Integration Forum 2007 37
  38. Slide 38: Ontologiezentrierter Architekturstil Business Integration Forum 2007 38
  39. Slide 39: Ontologie für die Lernunterstützung http://professional-learning.eu Business Integration Forum 2007 39
  40. Slide 40: Integrationsebenen Präsentationsfragmente Präsentationsebene Microformats Prozesse Prozeßebene Traceability, Compliance Anwendungslogikebene gemeinsame Semantik Abbildungen auf konzeptueller Informationsebene Ebene spezifizieren Technische Ebene Business Integration Forum 2007 40
  41. Slide 41: Semantik für die Geschäftsprozessmodellierung  Traceability • Explizite semantische Zusammenhänge zwischen Prozessmodellen und technischen Diensten • dadurch leichteres Change Management • erste Anwendungen im eGovernment  Überprüfung der Compliance • Beschreibung von Ausführungsbedingungen • damit z.B. Risikomanagement automatisierbar Business Integration Forum 2007 41
  42. Slide 42: Integrationsebenen Präsentationsfragmente Präsentationsebene Microformats Prozesse Prozeßebene Traceability, Compliance Anwendungslogikebene gemeinsame Semantik Abbildungen auf konzeptueller Informationsebene Ebene spezifizieren Technische Ebene Business Integration Forum 2007 42
  43. Slide 43: Fazit: Semantische Technologien  Ontologiegestützte semantische Technologien sind mächtige Werkzeuge • standardisierte Technologien (Sprachen, Werkzeuge) für die breite Anwendung vorhanden • erste Implementierungserfahrungen • bieten Vorteile in Richtung modellgetriebener Entwicklung • bessere Beherrschbarkeit komplexer Systeme durch höhere Abstraktionsebene  Allerdings sollte ihr Einsatz wohldosiert erfolgen • Berücksichtigung von Skalierbarkeit • Aufwendige Entwicklung von Ontologien • Nutzen von Ontologien liegt vor allem im Umgang mit o unvollständigen Informationen o hohem Maß an Hintergrundwissen Business Integration Forum 2007 43
  44. Slide 44: Kontakt Andreas Schmidt Ableitungsleiter Forschungsbereich Information Process Engineering FZI Forschungszentrum Informatik, Karlsruhe andreas.schmidt@fzi.de http://www.fzi.de/ipe Business Integration Forum 2007 44