Semantisches und vernetztes Wissensmanagement für Forschung und Wissenschaft - Presentation Transcript
Semantisches und vernetztes Wissensmanagement für Forschung und Wissenschaft WissKom 2007 Jülich, November 2007 Katrin Weller Institut für Sprache und Information, Abteilung for Informationswissenschaft, Heinrich-Heine-Universität Düsseldorf Dank an Indra Mainz, Dominic Mainz & Ingo Paulsen gefördert durch
e-Science
„ Enhanced Science“
Ziele:
Entlastung in Organisationsaufgaben und bei technischen Routinearbeiten
Vereinfachung wissenschaftliche Arbeitsabläufe
Effizientere Infrastrukturen in der Forschung
Umfassende Vernetzung von wissenschaftlichen Einrichtungen
e-Science
Anfänglicher Schwerpunkt: technische Möglichkeiten für verteilte Rechenleistung ( Grid-Computing bzw. Cyberinfrastructures)
Erste Ansätze, z. B. SETI@home.
Aktuelle deutsche Grid-Projekte, z. B.
MediGrid, Verknüpfung und Bereitstellung zahlreicher Daten der biomedizinischen Forschung
AeroGrid, Arbeitsumgebung für die deutsche Luftfahrtforschung
AstroGrid, Infrastruktur für die deutsche astronomische und astrophysikalische Forschung
TextGrid, Workbench für die gemeinschaftliche philologische Bearbeitung, Analyse, Annotation, Edition und Publikation von Textdaten der Geisteswissenschaften
Und weitere, siehe http://www.d-grid.de
e-Science
“ Scientific progress increasingly depends on pooling resources, know-how and results; making connections between ideas, people, and data; and finding and interpreting knowledge generated by others, in ways that may have not been anticipated when it was created. “
Goble et al. (2006)
Weitere relevante Entwicklungen
Open Access
Freier Zugang zu Daten, insbesondere zu wissenschaftlichen Publikationen.
Web 2.0
Vernetzung von Menschen in aller Welt (Social Networking) und Bereitstellung von Tools zur Zusammenarbeit (Social Software). Gemeinschaftliche Produktion neuer Inhalte.
Semantic Web
Abbilden von Informationen in formalen, semantischen Strukturen (Ontologien). Informationsvernetzung mittels semantischer Annotationen.
Ebenen in e-Science
Web 2.0
Das “Mitmach-Web”
Die Nutzer stehen im Mittelpunkt, Many-to-Many-Relationships, Community-Vernetzung.
Grenzen zwischen Konsumenten und Produzenten fallen weg.
Social Software zur gemeinsamen Datensammlung und -aufbereitung, Vernetzung von Menschen und Content.
Chancen für wissenschaftliche Communities und gemeinschaftliches Wissensmanagement.
Social Networking
Abbildung von bestehenden Kontakten.
Eingabe von Personenprofilen, Interessen, Expertisen.
Suche nach Personen, auch über Personenprofile.
Leichte Kontaktaufnahme, Verwaltung von Kontaktdaten.
Oft können zusätzlich innerhalb der Plattform Gruppen gebildet und Diskussionen geführt werden.
Networking & Communities Beispiel: Persönliches Profil bei XING.
XING beherbergt derzeit rund 5000 thematische Gruppen 129 davon in der Kategorie „Wissenschaft“
Beispiele:
„Metallpulverspritzguss: Hart wie Stahl – Formbar wie Kunststoff“, 10 Mitglieder
„Schlafmedizin“, 30 Mitglieder
derzeitige Spitzenreiter:
Promotion, 5.150 Mitglieder
Zeitgeist/Zukunft - international – Megatrends - Szenarien, Utopien und Visionen unserer Welt von Morgen, 4.741 Mitglieder
„Geistreich – Interdisziplinärer Dialog“, 3.017 Mitglieder
„Arbeits- und Organisationspsychologie“, 2.669 Mitglieder
„Life Sciences“, 2.340 Mitglieder
Stand vom 05.11.2007, deutschsprachiger Zugang zur Plattform XING.
Networking & Communities
Networking & Communities Interessengruppen auf den Social Networking Plattformen Facebook und Nature Network.
Networking & Communities Alternative Networking Ansätze Beispiel Upcoming: Vernetzung über einen Kalender.
Gemeinschaftliche Wissensaufbereitung
Aktuelles Erfolgsmodell der kollaborativen Wissens- und Datenorganisation: gemeinschaftliche Datenerstellung + gemeinschaftliche Indexierung
Social Software
Privatnutzerbereich: Verwalten von Fotos und Videos.
privat u. wissenschaftlicher Bereich: Verwalten von Weblinks und bibliographischen Angaben.
Künftig ggf. auch wissenschaftliche Bild- und Multimediadateien oder gar experimentelle und primäre Forschungsdaten.
Social Tagging
Nutzer vergeben frei gewählte Schlagworte (Tags) zu einzelnen Einträgen innerhalb einer Plattform.
Folksonomies als neue Erschließungsmethoden und Suchhilfen.
Social Software und wissenschaftliche Daten Connotea & Bibsonomy: Ausrichtung auf Wissenschafter und Forscher, die hier ihre Favoritenlinks und Literaturangaben verwalten und mit Kollegen austauschen können.
Social Software und wissenschaftliche Daten
Beispiele Swivel und IBM Many Eyes:
Gemeinschaftliche Sammlung und Aufbereitung von Daten als Tabellen und Graphiken.
Einsatzmöglichkeiten reichen von kleinen Arbeitsgruppen bis zu weltweiten Kollaborationen.
Probleme
aktive Teilnahme der Mitglieder erforderlich
Sorgfalt im Umgang mit Personendaten als Mindestanforderungen
Anreizsysteme, beispielsweise verfeinerte und explizite Möglichkeiten für den Aufbau von Reputation
Kennzeichnungen von Urheberschaften, explizite Nutzungsrechte als Gegenmaßnahme zu möglicher Zweckentfremdung und Missbrauch von Inhalten
Web 2.0 Anwendungen in der Wissenschaft
Ontologien und semantische Informationsintegration
Problem:
Gemeinschaftliches Taggen von Informationseinheiten reicht für die Forschungskontext langfristig nicht aus.
Probleme: Keine Synonymkontrolle, keine Homonymauflösung, Tippfehler, Mehrsprachigkeit, Spam, Personenbezüge etc.
Weiterführende Ansätze zur semantischen Informationsintegration.
Bislang oberste und schwierigste Ebene einer vernetzten Wissenschaftslandschaft.
Kontrollierte und strukturierte Metadaten sollen eine Kontexteinbettung und semantische Suchen ermöglichen.
Semantic Web
Semantic Integration : Wissen soll nicht nur besser auffindbar gemacht werden, sondern auch unmittelbar in einen globalen Kontext eingegliedert werden; neue Informationen werden zum bestehenden Informationsgeflecht in Beziehung gesetzt.
Zusammenhänge zwischen Wissensbausteinen müssen explizit gemacht werden.
Ansätze:
Semantische Annotationen – neue Indexierungsansätze.
strukturierte Umsetzung von Wissen in Form von Ontologien. Auch: Wissen einer Forschungsgemeinschaft in eine eindeutige Form bringen, und dabei möglichst einen aktuellen Konsens zum Wissenstand abzubilden.
Ontologien und semantische Informationsintegration
Ontologien
= Systeme der Wissensrepräsentation bestehend aus Konzepten, Instanzen, und den Relationen zwischen ihnen.
Formalisierung von Wissen mit Hilfe von Ontologie-Editoren und Ontologiesprachen (z. B. OWL).
Konsens-Abbildung: Festhalten eines Wissensstandes mit expliziter Darstellung der Zusammenhänge.
http://protege.stanford.edu
Ontologien und semantische Informationsintegration Klassen: hierarchisches Klassenaufbau im Editor, Regeln für die Klassen-zugehörigkeit können ergänzt werden. Instanzen werden den Klassen zugeordnet. Auszug aus Generations Ontology: http://www.co-ode.org/ontologies/
Beispiel Generations Ontology: http://www.co-ode.org/ontologies/, dargestellt mit Protege OntoViz Tab.
Einsatzbereich: Beispiel Life Sciences
Große Mengen heterogener Daten müssen zueinander in Bezug gesetzt werden, z. B. Nukleotidsequenzen, Aminosäuresequenzen, molekulare 3D-Strukturen.
Hochspezialisierte Forschungsbereiche müssen formal strukturiert werden.
Umgesetzt wird vor allem die Annotation von Literatur (z. B. mit UMLS) und Gen-Daten (z. B. mit Gene Ontology).
Einsatz von Ontologien
Einsatz von Ontologien
Semantisches Grid
Semantic Grid Projekte befassen sich mit einer Verbesserung der Interoperabilität aktueller Grid-Applikationen.
Ontologien helfen hier in erster Linie bei der Maschine-Maschine Kommunikationen und sollen einen verbesserten Workflow zwischen einzelnen Anwendungen gewährleisten.
Umfassende Infrastrukturen, in der alle Ressourcen (auch die Services selbst) maschinenlesbar beschrieben sind.
Quelle: http://www.semanticgrid.org/vision.html
Semantisch angereicherte Social Software & Wikis
Beispiel DBin: Neue Informationen und Bilder werden direkt mit Instanzen der Ontologie verknüpft.
Semantische Annotationen werden direkt in den Wiki-Text eingebaut.
Ermöglicht u. A. neue Formen der Suche, z. B.:
Alle Wiki-Artikel über Städte in NRW?
Alle Asteroiden, die nach Menschen benannt sind?
Alle bedeutenden Personen, die 1975 gestorben sind?
Zusammenführung von Semantic Web und Web 2.0 Weitere Beispiele und Use-Cases unter http://ontoworld.org/wiki/Semantic_MediaWiki
Semantic Media Wiki
Zusammenführung von Semantic Web und Web 2.0 Aussage „Harry Osborn kennt Aunt Mary“ im FOAF Format. Quelle: http://www.foaf-project.org/2004/us/about.html Alternative Community-Repräsentation: FOAF
Kollaborativ erstellte Ontologien
Die Ontologien, die für die semantische Annotation verwendet werden, sollten im Idealfall den Konsens einer Gemeinschaft abbilden.
Benötigt werden Editoren, die speziell den gemeinschaftlichen Aufbau von Ontologien ermöglichen.
Angeschlossen sein sollten Diskussionsmöglichkeiten, Kommentarfunktionen und Möglichkeiten zum Anhang von zusätzlichen Daten (z. B. Konzeptskizzen).
Formalisierungen verschiedener Wissensbereiche müssen auf einer weiter übergeordneten Ebene wiederum zueinander in Beziehung gesetzt werden, Konkordanzen und Querverweise müssen aufgebaut werden.
Aktuelle Forschungen im Bereich Ontology Mapping bereiten diese Aufgaben bereits vor.
Erschwert werden diese Bemühungen vor allem noch dadurch, dass sich Ontologien durch fortdauernde Aktualisierungen und Ergänzungen im ständigen Wandel befinden können
Fazit
Aktuelle Trendbegriffe wie e-Science, Web 2.0 und Social Software oder Ontologien und Semantic Web bzw. die jeweils dahinter stehenden Techniken und Entwicklungen sind nicht isoliert zu betrachten. Zusammengenommen entwickeln sie Potential für grundlegende Veränderungen.
Es ergeben sich daraus für eine vernetzte Wissenschaftslandschaft insbesondere die folgenden Merkmale:
Ressourcenverknüpfung und freier Zugang zu Wissensbeständen
Soziale Netzwerke und Wissensaustausch
Kollaborative Wissensaufbereitung
Semantische Informationsintegration
Ausblick
Idealfall?
Mit vernetzter Rechenleistung werden wissenschaftliche Fragestellungen bearbeitet und Daten gewonnen, welche dann in umfassende und allgemein zugängliche Archive abgelegt werden.
In diesen Archiven liegen sowohl wissenschaftliche Primärdaten (z. B. Ergebnisse aus Experimenten) wie auch wissenschaftliche Publikationen vor.
Diese werden kollaborativ gepflegt und von Communities mit neuen Ergebnissen angereichert.
Interessensgruppen kommentieren und diskutieren vorhandene Daten und nutzen bereitgestellte Portale für die strukturierte Aufbereitung der enthaltenen Informationen, wobei bestehende Ontologien und semantische Technologien für die Informationsvernetzung genutzt werden.
Viele Grüße aus Düsseldorf
Für Fragen, Anregungen, Anmerkungen:
[email_address]
Katrin Weller
Institut für Sprache und Information
Abteilung Informationswissenschaft
Heinrich-Heine-Universität Düsseldorf
Universitätsstraße 1, Geb. 23.21.04
40225 Düsseldorf
www.phil-fak.uni-duesseldorf.de/infowiss
Links
Bibsonomy: http://www.bibsonomy.org
Connotea: http://www.connotea.org
DBin: http://www.dbin.org
D-Grid Initiative: http://www.d-grid.de
del.icio.us: http://del.icio.us
Facebook: http://www.facebook.com
Flickr: http://www.flickr.com
FOAF: http:// www.foaf-project.org
Gene Ontology: http://www.geneontology.org
IBM Many Eyes: http://services.alphaworks.ibm.com/manyeyes/app
MetaCollab: http:// collaboration.wikia.com
MyExperiment: http:// myexperiment.org
Nature Network: http:// network.nature.com
Ontoverse: http://www.ontoverse.org
OntoWiki: http://ontowiki.net/Projects/OntoWiki
Protégé: http://protege.stanford.edu/
Semantic Media Wiki (Projekt): http://ontoworld.org/wiki/Semantic_MediaWiki
SETI@home: http:// setiweb.ssl.berkeley.edu /
Soboleo: http://soboleo.fzi.de:8080/webPortal/
Swivel: http:// www.swivel.com
UMLS: http://www.nlm.nih.gov/research/umls/
Upcoming: http://upcoming.yahoo.com
Wikipedia: http://www.wikipedia.org
Xing: http:// www.xing.com , ehemals openBC
Literatur (Auszug)
Alby, T. (2007): Web 2.0. Konzepte, Anwendungen, Technologien. München, Wien: Carl Hanser Verlag.
Alexiev V, Breu M et al. (2005): Information Integration with Ontologies. Experiences from an Industrial Showcase, Chichester: Wiley & Sons.
Antoniou G, van Harmelen F (2004): A Semantic Web Primer, Cambridge, Mass.: MIT Press.
Davies J, Fensel D, van Harmelen F (Hrsg., 2003): Towards the Semantic Web. Ontology-Driven Knowledge Management, Chichester: Wiley & Sons.
Davies J, Studer R, Warren P (2006): Semantic Web Technologies. Trends and Research in Ontology-Based Systems, Chichester: Wiley & Sons.
Goble C, Corcho , O, et al. (2006): E-Science and the Semantic Web: A Symbiotic Relationship. In: Proceedings of Discovery Science, 9th International Conference, DS 2006, Barcelona, Spain , S. 1-12.
Gordon-Murnane , L. (2006). Social Bookmarking, Folksonomies, and Web 2.0 Tools. In: Searcher. The Magazine for Database Professionals, 14(6), S. 26-38.
Hey T, Trefethen A (2005) : Cyberinfrastructures for e-Science. In: Science 308, S. 817-821.
Leuf, B.; Cunningham , W. (2001): The Wiki Way. Quick Collaboration on the Web, London: Addison-Wesley.
Macgregor , G., McCulloch , E. (2006). Collaborative tagging as a knowledge organisation and resource discovery tool. In: Library Review, 55(5), 291-300.
Maness , J. (2006): Library 2.0 Theory. Web 2.0 and Its Implications for Libraries. In: Webology , 3 (2), Article 25. Verfügbar über: http://www.webology.ir/2006/v3n2/a25.html.
Neumann E, Prusak L (2007): Knowledge Networks in the Age of the Semantic Web. In: Briefings in Bioinformatics 2007 8 (3), S. 141-149.
Peters , I; Stock , W.G. (2007b): Folksonomy and Information Retrieval. In: Proceedings of the 70th Annual Meeting of the American Society for Information Science and Technology (Vol. 45) (CD-ROM).
0 comments
Post a comment