• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
EnArgus – ein ontologiebasiertes Forschungsinformationssystem
 

EnArgus – ein ontologiebasiertes Forschungsinformationssystem

on

  • 1,149 views

Vortrag zum Projekt EnArgus (www.enargus.de) auf der Python Konferenz in Leipzig (PyCon DE 2012) am 30.10.2012

Vortrag zum Projekt EnArgus (www.enargus.de) auf der Python Konferenz in Leipzig (PyCon DE 2012) am 30.10.2012

Statistics

Views

Total Views
1,149
Views on SlideShare
1,127
Embed Views
22

Actions

Likes
0
Downloads
2
Comments
0

1 Embed 22

http://lanyrd.com 22

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    EnArgus – ein ontologiebasiertes Forschungsinformationssystem EnArgus – ein ontologiebasiertes Forschungsinformationssystem Presentation Transcript

    • EnArgus – ein ontologiebasiertes Forschungsinformationssystem Thomas Koch OrbiTeam Software GmbH & Co. KG PyCon.DE 2012, Leipzig
    • Kurzvorstellung: EnArgus-Projekt• Ziel: Entwicklung und Erprobung eines zentralen Informationssystems für Energieforschungs- vorhaben aus dem Bereich der Förderung durch Bund und Länder• Unterschiedliche Zielgruppen – Die interessierte Öffentlichkeit • Überblick über Forschungsprojekte – Die Politik: Ministerien & Projektträger • Was wird/wurde gefördert (inhaltliche Fragen) • Forschungstrends, Experten, Verteilung Fördermittel etc.30.10.2012 PyCon 2012 2
    • AusgangssituationDiverse Problemstellungen und Anforderungen• Informationen über Projekte auf diverse Quellen verstreut: – Datenbanken, Dokumente (z.B. Berichte)• Projektdatenbanken – sind eher betriebswirtschaftlich motiviert – sind zur fachlichen Auswertung wenig geeignet• Projektdokumente – sind oftmals sehr fachspezifisch formuliert• Bedarf nach – Übergreifenden komfortablen Recherchemöglichkeiten – Einbeziehung von Wissen über Fachgebiet bei der Recherche – Auswertungswerkzeugen (auf Suchergebnissen)30.10.2012 PyCon 2012 3
    • IdeeVerbesserte Suche durchWissenserschließung• Wiki-Artikel Fachexperte – Zu Fachbegriffen der Energieforschung – Von Fachexperten gemeinsam verfasst• Informationsextraktion – Aufbau der Ontologie durch Textanalyse• Ontologie – Dient der formalen und expliziten Repräsentation von Wissen• Suchanfrage – Wird durch verwandte Begriffe aus Ontologie angereichert• Optimierte Suchergebnisse  zufriedene Benutzer 30.10.2012 Anwender
    • Vorgehen• Zusammenführen von Daten – Projektdaten aus PROFI (administrative Daten) – Projektdokumente aus versch. Quellen – Inhaltliche Erschließung über Suchmaschine • Inhaltssuche (Volltext) und Metadatensuche• Unterstützung der Recherche durch Fachontologie – Fachontologie wird mit Hilfe der Energieexperten erstellt – Energieexperten formulieren Sachzusammenhänge im Wiki – Ontologieexperten realisieren Erfassung des Wikis durch Methoden der Sprachanalyse und Wissensextraktion – IT-Experten implementieren das Basis-System mit Suchfunktionen, die auf die Ontologie zurückgreifen30.10.2012 PyCon 2012 5
    • Fakten: EnArgus®• Nationales Forschungsvorhaben – Partner: aus Energieforschung und Informatik • Fraunhofer FIT, FKIE, UMSICHT und ISI • Forschungszentrum Jülich • Ruhr-Universität Bochum • OrbiTeam Software – Gefördert durch BMWi • Bundesministerium für Wirtschaft und Technologie • 5. Energieforschungsprogramm der Bundesregierung • 2 Jahre Laufzeit (Juli 2011 bis Juni 2013) – Mehr Infos: https://www.enargus.de30.10.2012 PyCon 2012 6
    • EnArgus: TeilsystemeFür die Öffentlichkeit Für die interne Nutzung EnArgus.public EnArgus.master• Einfache Bedienung • Expertensuche• Ansprechende Webseiten • Vollzugriff auf Vorhaben• Eingeschränkter Zugriff • Hinzufügen von Inhalten• Einfache Suchfunktionen • Statistische• Faceted Search Auswertungen• Zugriff auf EnArgus.wiki • Suchen speichern • Suchen veröffentlichen 30.10.2012 PyCon 2012 7
    • EnArgusSystemarchitektur Auswertung & Suchanfragen Energie- Kooperations- Ontologie- Visualisierung & -ergebnisse Unterstützg. forschungs Editor Recherche-Cockpit -Wiki BSCW Core Ontologie Core Wiki Core Index EnArgus-DB Dokumente Ontologie-DB Wiki-Texte30.10.2012 PyCon 2012 8
    • EnArgusSystemarchitektur Auswertung & Suchanfragen Energie- Kooperations- Ontologie- Visualisierung & -ergebnisse Unterstützg. forschungs Editor Recherche-Cockpit -Wiki BSCW Core Ontologie Core Wiki Core Index EnArgus-DB Dokumente Ontologie-DB Wiki-Texte30.10.2012 PyCon 2012 9
    • • Öffentliches Teilsystem – Einfache Bedienung – Ansprechende Webseiten30.10.2012
    • • Faceted Search – Einfache Suchfunktion – Einschränkung über Facetten – Facette: Filter nach bestimmten Kriterien (auch mehrstufig)30.10.2012
    • • Detailansicht – Eingeschränkter Zugriff auf Details30.10.2012
    • EnArgus Wiki• Mehrfacher Nutzen – Einfache Bedienung • Fachexperten beschreiben Anwendungsdomäne im Wiki • Fachexperten müssen nichts über die Fachontologie wissen – Wiki ist zugleich hilfreich für Anwender • Verknüpfung von Fachbegriffen mit Wiki als eine Art Glossar • Wiki soll später der Öffentlichkeit zur Verfügung stehen• Technische Basis – MoinMoin Wiki – Einfache Integration („SSO“)30.10.2012 PyCon 2012 13
    • Wiki: Beispiele30.10.2012 14
    • Informationsextraktion• Aufbau der Ontologie durch Textanalyse – Wiki-Texte werden (durch Software) ausgewertet • Dabei erfolgt die Umwandlung von Text in Wissen! • Ergebnis der Informationsextraktion ist die (aktualisierte/erweiterte) Ontologie – Ziel: Unterstützung der Suche • z.B. Vorschlagen von verwandten Begriffen • Dadurch mehr relevante Treffer und zielgerichtete Suche – Technik: • Text mining • Semantic Role Labeling (SRL) – Tools: • GATE (General Architecture for Text Engineering) • Protegé (Ontologie-Editor und Java-Bibliothek)30.10.2012 PyCon 2012 15
    • Ontologie: Beispiel Anode besteht-aus Blei-Säure-Batterie Kathode ist-ein Lithium-Ionen- Elektrolyt Batterie Natrium-Schwefel- Batterie Batterie Nickel-Cadmium- Batterie Druckluftspeicher Nickel-Metallhydrid- Energiespeicher Batterie Kurzzeitspeicher Vanadium-Redox- Redox-Flow-Batterie Flow-Batterie Wasserstoffspeicher Label: Flussbatterie Redox-Flow-Zelle Redox-Flussbatterie30.10.2012 PyCon 2012 16
    • ENARGUS.MASTER Ontologiebasierte Suche• Benutzer können eine Suchanfrage starten und Suchbegriff(e) eingeben• in der einfachen Suche werden Synonyme automatisch mit in die Anfrage einbezogen (optional, EnArgus.public)• in der erweiterten Suche werden semantisch verwandte Begriffe (aus der Ontologie) angeboten (nur in EnArgus.master) 30.10.2012
    • ENARGUS.MASTER Ontologiebasierte Suche• Benutzer können eine Suchanfrage starten und Suchbegriff(e) eingeben• in der einfachen Suche werden Synonyme automatisch mit in die Anfrage einbezogen (optional, EnArgus.public)• in der erweiterten Suche werden semantisch verwandte Begriffe (aus der Ontologie) angeboten (nur in EnArgus.master) 30.10.2012
    • ENARGUS.MASTER Ontologiebasierte Suche• Technik: – JPype zur Anbindung an die Java-Bibliothek(en) – Eigener Prozess verkürzt Zugriffszeit • Starten der JVM und Laden der Bibliotheken (JAR) • Laden der Ontologie (aus OWL-Datei) Service RPC JPype Ontologie- Bibliothek für BSCW Core (Python) Service Ontologie-Anfragen (Python) (Java) :Web-Request-Prozess Protégé-API Ontologie-Datei30.10.2012 Ontologie-Service-Prozess (OWL)
    • ENARGUS.MASTER Erweiterte Suche• Benutzerschnittstelle für Experten – Erlaubt Klammerung von Suchbegriffen – Auswahl diverser Attribute (Metadaten)• Technik: – HTML/CSS/Dojo (JavaScript Framework) – Suchanfrage wird in JSON codiert 30.10.2012
    • ENARGUS.MASTER Erweiterte Suche• Benutzerschnittstelle für Experten – Komplexes Suchformular – Wunsch nach Übersicht zur formulierten Suche Repräsentation in Graph Enthält Suchterme und Klammerung Darstellung von UND- / ODER-Gruppen• Technik: – GraphViz, pydot30.10.2012 PyCon 2012 21
    • ENARGUS.MASTER Vorhabendetails• Detailansicht zu einem Projekt – Metadaten – Dokumente – Verwandte Projekte30.10.2012 PyCon 2012 22
    • ENARGUS.MASTER Vorhabendetails• Detailansicht zu einem Projekt – Metadaten – Dokumente – Verwandte Projekte30.10.2012 PyCon 2012 23
    • ENARGUS.MASTER Auswertungen• Akkumulation der Suchergebnisse – z.B. Fragestellung: Verteilung der Förderkosten über die Jahre• Technik – pandas,matplotlib 30.10.2012
    • ENARGUS.MASTER Auswertungen• Akkumulation der Suchergebnisse – z.B. Fragestellung: Verteilung der Förderkosten über die Jahre• Technik – pandas,matplotlib 30.10.2012
    • Systeme im Einsatz• BSCW-Server – Verwaltet Benutzer, Dokumente, Metadaten, Zugriffsrechte etc.• Wiki-Server – MoinMoin (angepasstes ‚look&feel‘) – Verwaltet Wiki-Texte der Fachexperten• Ontology-Service – Basiert auf Protegé (Java) und OWL – Python-Bridge als lokaler Prozess• Diverse Python Tools – Issue Tracker (Trac) – Test (Py.test) …30.10.2012 PyCon 2012 26
    • Bibliotheken im Einsatz• Numpy, Pandas, Matplotlib – Statistische Auswertungen und Visualisierung (Teil der Pydata Familie)• GraphViz, pydot – Darstellung von Graphen• PyLucene – Volltextsuche, Facetten• JPype – Anbindung an Java-Bibliotheken (hier: Protegé)30.10.2012 PyCon 2012 27
    • ? Diskussion/FragenKontakt für weitere Fragen • koch@orbiteam.de • @tomy_kochMehr Infos zum Projekt • Am Stand im Foyer! • www.enargus.de30.10.2012 PyCon 2012 28