• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
(Meta-) Informationen von Communitys und Netzwerken. Entstehung und Nutzungsmöglichkeiten
 

(Meta-) Informationen von Communitys und Netzwerken. Entstehung und Nutzungsmöglichkeiten

on

  • 4,447 views

Schaffert, Sandra; Eder, Julia; Hilzensauer, Wolf, Kurz, Thomas; Markus, Mark; Schaffert, Sebastian; Westenthaler, Rupert & Wieden-Bischof, Diana (2009). (Meta-) Informationen von Communitys und ...

Schaffert, Sandra; Eder, Julia; Hilzensauer, Wolf, Kurz, Thomas; Markus, Mark; Schaffert, Sebastian; Westenthaler, Rupert & Wieden-Bischof, Diana (2009). (Meta-) Informationen von Communitys und Netzwerken. Entstehung und Nutzungsmöglichkeiten. Erschienen in der Reihe „Social Media“, hrsg. von Georg Güntner und Sebastian Schaffert, Band 2. Salzburg: Salzburg Research. (ISBN 978-3-902448-15-6 - frei zugängliche Version (CC Lizenz) - auch im Buchhandel erhältlich!

Statistics

Views

Total Views
4,447
Views on SlideShare
4,447
Embed Views
0

Actions

Likes
4
Downloads
148
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

CC Attribution-NoDerivs LicenseCC Attribution-NoDerivs License

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    (Meta-) Informationen von Communitys und Netzwerken. Entstehung und Nutzungsmöglichkeiten (Meta-) Informationen von Communitys und Netzwerken. Entstehung und Nutzungsmöglichkeiten Document Transcript

    • schriftenreihe: social Media Band 2 Media special Data Community Tagging warm © shutterstock Social Media amazing Weblog Knowledge Context Semantic Web Content  (Meta-) Informationen von Communitys und netzwerken Entstehung und Nutzungsmöglichkeiten Sandra Schaffert mit Beiträgen von Julia Eder, Wolf Hilzensauer, Thomas Kurz, Mark Markus, Sebastian Schaffert, Rupert Westenthaler und Diana Wieden-Bischof
    • Sandra Schafert (Meta-) Informatonen von Communitys und Netzwerken Entstehung und Nutzungsmöglichkeiten mit Beiträgen von Julia Eder, Wolf Hilzensauer, Thomas Kurz, Mark Markus, Sebastan Schafert, Rupert Westenthaler und Diana Wieden-Bischof veröfentlicht unter der „Creatve Commons Namensnennung-Keine Bearbeitung 3.0 Österreich License“ siehe htp://creatvecommons.org/licenses/by-nd/3.0/at
    • Salzburg NewMediaLab (SNML), das Kompetenzzentrum für Neue Medien gab die vorliegende Broschüre im Rahmen des Projekts „ComStudy“ (Leitung: Dr. Sandra Schafert) in Aufrag. Unter der Leitung von DI Georg Güntner arbeitet das SNML dar- an, digitale Inhalte clever zu strukturieren, verknüpfen, personalisieren, für alle auf- fndbar zu machen und nachhaltg zu nutzen. Das SNML ist ein industrielles Kompe- tenzzentrum im Rahmen der Aktonslinie Kind des Bundesministerium für Wirtschaf und Arbeit (BMWA) und wird gefördert aus Miteln des BMWA und des Landes Salz- burg. Homepage: newmedialab.at © Salzburg NewMediaLab 2009 ISBN 978-3-902448-15-6 Sandra Schafert, Julia Eder, Wolf Hilzensauer, Thomas Kurz, Mark Markus, Sebastan Schafert, Rupert Westenthaler und Diana Wieden-Bischof: (Meta-) Informatonen von Communitys und Netzwerken. Entstehung und Nutzungsmöglichkeiten. Band 2 der Reihe „Social Media“, herausgegeben von Georg Güntner und Sebastan Schafert Verlag und Herstellung: Salzburg Research, Salzburg Umschlaggestaltung: Daniela Gnad, Salzburg Research Lektorat: Diana Wieden-Bischof, Salzburg Research Bibliografsche Informaton der Deutschen Natonalbibliothek: Die Deutsche Natonalbibliothek verzeichnet diese Publikaton in der Deutschen Natonalbibliografe; detaillierte bibliografsche Daten sind im Internet über htp://dnb.d-nb.de abrufar.
    • VORWORT Das Kompetenzzentrum für Neue Medien, Salzburg NewMediaLab, betrachtet im Rah- men seines Forschungsprogramms die Wechselwirkung zwischen digitalen Inhalten und ihren AutorInnen bzw. KonsumentInnen aus technologischer und sozialer Perspektve. Dabei ergibt sich naturgemäß die Frage, welche Art von Bindung zwischen AutorInnen und LeserInnen untereinander, aber auch zu deren Inhalten besteht und wie sich die aufgrund dieser Bindung entstehenden Gemeinschafen auf die Atraktvität und Nut- zung der Inhalte sowie auf das Angebot von erweiterten Diensten auswirkt. Dies führte zur Beaufragung einer Studie des Salzburg NewMediaLab („ComStudy“), die sich mit Orienterungs- und Entscheidungshilfen für den Aufau von Online-Communitys beschäfigt. Dabei betrachten wir auch die in der Wechselwirkung von Inhalten und Communitys aus technischer Sicht anfallenden Metainformatonen und die auf den In- halten basierenden Dienste, wie etwa Empfehlungs- und Reputatonssysteme. Im vorliegenden (zweiten) Band der Reihe „Social Media“ untersuchen wir die im Um- feld von Online-Communitys und deren Interakton mit digitalen Inhalten anfallenden Metainformatonen und deren Mehrwert. Dabei geht es nicht nur um von den NutzerIn- nen bewusst verfügbar gemachtes Datenmaterial (z. B. „Tags“), sondern auch um impli- zit anfallende Informatonen, die zur Optmierung von unterschiedlichsten Funktonen (z. B. Suche, Navigaton, Anzeige) und zur Unterstützung von Geschäfsprozessen (z. B. Trend- und Marktanalysen) herangezogen werden können. Metainformatonen erschlie- ßen sich dabei vielfach nicht nur aus den Primär-Quellen (z. B. Einträgen in Weblogs), sondern auch aus deren Metabeschreibungen und Beziehungsstrukturen sowie Interak- tonsspuren durch die NutzerInnen. Gerade unter dem Blickwinkel der aktuellen Diskussion über Nutzen und Gefahren sozia- ler Netzwerke und Communitys im Internet stellt und beantwortet der vorliegende Band einige interessante Grundfragen und bietet praktsche Orienterungs- und Entschei- dungshilfen, für deren Lektüre ich Ihnen namens des Salzburg NewMediaLab gute Un- terhaltung und viele in Ihrer praktschen Arbeit umsetzbare Anregungen wünsche. Georg Güntner Leiter des Salzburg NewMediaLab November 2009
    • DANK & ANMERKUNG ZUR SCHREIBWEISE Den Expertnnen und Experten, die für ein Kurzinterview persönlich, per E-Mail oder Skype an ihrer Expertse teilnehmen ließen, herzlichen Dank: Andreas Blumauer, Dr. Ralf Klamma, Dr. Sebastan Schafert, Dr. Katharina Siorpaes und Dr. Riina Vuorikari. Herzli- cher Dank gilt auch den Ko-Autorinnen und Autoren Julia Eder, Thomas Kurz, Dr. Mark Markus, Dr. Sebastan Schafert, Rupert Westenthaler und Diana Wieden-Bischof sowie den Kollegen, die hilfreiche Tipps gaben: Wernher Behrendt, Dr. Guntram Geser, Andre- as Gruber, Georg Güntner, Werner Moser, Rolf Sint und Dr. Andreas Strasser. Danke- schön auch an Daniela Gnad für das Titelbild und Diana Wieden-Bischof für das Lektorie- ren! Um diesen Beitrag nicht durch weibliche Endungen, Bindestriche und Klammern zu ei- nem zwar korrekten, aber auch schwerer zu lesenden Werk zu machen, haben wir im Folgenden durchgehend darauf verzichtet, die gendergerechte Schreibweise zu verwen- den. Zudem haben wir uns bemüht, auf englische Ausdrücke oder Lehenswörter zu ver- zichten wo sie uns unnötg erschienen – aber im Bereich des Internets und der moder- nen Managementheorie kommt man leider viel zu of nicht darum herum. Sandra Schafert
    • INHALTSVERZEICHNIS 1 Einleitung und Hintergrund........................................................................................ 9 2 Nutzerverhalten....................................................................................................... 13 2.1 Formen und Systeme ...........................................................................................13 2.2 Nutzen und Nutzung.............................................................................................13 3 Kommunikatons- und Vernetzungsstruktur............................................................. 19 3.1 Daten und Formen der Analyse............................................................................ 19 3.2 Nutzen und Nutzung.............................................................................................20 4 Bewertungen............................................................................................................27 4.1 Formen und Einsatz ............................................................................................. 27 4.2 Nutzen und Nutzung.............................................................................................28 5 Social Tagging .......................................................................................................... 35 5.1 Konzept und Anwendungen................................................................................. 35 5.2 Nutzen und Nutzung.............................................................................................36 6 Texte.........................................................................................................................47 6.1 Entstehung von Texten fördern............................................................................ 47 6.2 Nutzen und Nutzung.............................................................................................49 7 Metadatenformate und Ontologien......................................................................... 55 7.1 Konzept und Beispiele.......................................................................................... 55 7.2 Nutzen und Nutzung ............................................................................................57 8 Linked Data.............................................................................................................. 63 8.1 Konzept und Hintergrund..................................................................................... 63 8.2 Nutzen und Nutzung (in der Zukunf)................................................................... 65 9 Ergänzung und Zusammenfassung ...........................................................................69 Literatur und Quellen................................................................................................. 75 Autorinnen und Autoren............................................................................................ 80
    • Sandra Schafert und Diana Wieden-Bischof 1 EINLEITUNG UND HINTERGRUND (Meta-) Informatonen Das Web 2.0 und seine Fülle an einfachen und neuen Beteiligungsformen hat die Zahl der aktven Nutzer und die Zahl der Beiträge zum Web enorm ansteigen lassen. Gerade da, wo sich Menschen stark austauschen und interagieren, werden besonders viele In- formatonen zusammengetragen. Es gibt eine Reihe von Defnitonen und Verständnisse des Wortes „Informaton“, wir verstehen darunter alle Datenmaterialien und darin ent- haltenes Wissen und Botschafen, die Nutzer im Web veröfentlichen und hinterlassen. Viele öfentlich zugängliche Informatonen entstehen in Online-Communitys. Eine Onli- ne-Community besteht aus Personen mit gemeinsamen Interessen, die Internet- und an- dere Kommunikatonstechnologien nutzen, um sich regelmäßig auszutauschen und/oder gemeinsam Inhalte zu entwickeln, dabei starke Bindungen entalten und sich als zusammengehörig fühlen (Schafert & Wieden-Bischof, 2009). Auch bei weniger star- ken Bindungen, wie in sozialen Netzwerken oder anderen kommunikatv oder kollabora- tv angelegten Systemen, z. B. Weblogs oder Microblogging, entstehen viele Informato- nen. Schließlich entstehen solche Informatonen selbst dort, wo sich Nutzer untereinan- der nicht kennen, aber gemeinsam aktv sind, beispielsweise Kunden eines Online-Shops sind oder Leser einer Online-Enzyklopädie. Neben den unmitelbaren Beiträgen bei der Content-Entwicklung – beispielsweise dem Hochladen von Videos, Fotos auf entsprechenden Platormen oder Textbeiträgen in Weblogs – generieren Nutzer bzw. die Communitys auch „Metainformatonen“. Darun- ter verstehen wir beispielsweise Metadaten, d. h. Angaben über Autoren von Beiträgen im Html-Code, aber auch andere „Informatonen über Informatonen“. Solche Metain- formatonen sind beispielsweise die Zahl der Beiträge eines Nutzers oder die Zahl der Klicks auf einen Beitrag und werden so teilweise erst nachträglich ermitelt. Ähnliche Begrife sind Metadaten und Metawissen, alle Begrife werden unterschiedlich defniert (s. z. B. Riekert, 1996). Wir verwenden die beiden Begrife Informaton und Me- tainformaton in dieser Studie pragmatsch: Wir versuchen zusammenzutragen und vor- zustellen, was „alles“ in Communitys und Netzwerken entsteht und wie es für ganz un- terschiedliche Zwecke genutzt wird. Entstehung von Metainformatonen Grundsätzlich kann zwischen einer aktven und einer passiven Entwicklung von Metain- formatonen von Nutzern unterschieden werden: | Aktv tragen Nutzer, insbesondere solche mit Expertenstatus in einer spezifschen Do- mäne, zur Entwicklung von Metainformatonen bei, wenn sie beispielsweise Formu- lare ausfüllen oder Schlagworte vergeben, also aktv und bewusst Beiträge liefern. | Passiv tragen Nutzer zur Entwicklung von Metainformatonen bei, wenn dies beiläu- fg und auch unbewusst geschieht, indem beispielsweise nach bestmmten Begrifen recherchiert wird oder Links ausgewählt werden. 9
    • In der Praxis zeigt sich, dass diese Unterscheidung nicht immer einfach und eindeutg ist. So werden wir in dieser Veröfentlichung einige Beispiele für spielerische Ansätze vor- stellen, wo Nutzer aktv Metainformatonen entwickeln, ihnen dies aber eventuell durch den Spielcharakter nicht bewusst ist. Auch wird beispielsweise beim Hochladen eines Fotos gleichzeitg und ohne weiteres Zutun der Nutzer eine Reihe von relevanten Meta- daten zum Foto (z. B. Blendeneinstellung) zur Verfügung gestellt, was dem Nutzer auch selbst nicht bewusst sein muss. Im Web und insbesondere da, wo sich Personen eng austauschen und zusammenarbei- ten, nämlich in Communitys oder sozialen Netzwerken, entstehen besonders viele (Meta-) Informatonen. Diese können wiederum durch unterschiedliche Methoden aus- getauscht, zusammengebracht und analysiert werden. In geschlossenen Systemen, bei denen beispielsweise eine Anmeldung erfolgt, ist so bereits eine Reihe von Informato- nen zu den einzelnen Nutzern bekannt. In sozialen Netzwerken sind nach erfolgter Anmeldung typischerweise folgende Infor- matonen über einzelne Nutzer bekannt und können entsprechend genutzt werden: Vor- name und Name, Geschlecht, Alter, aktueller Arbeitgeber, Positon im Unternehmen, Wohnort und Land, ein Foto, Homepage, E-Mail-Adresse, aktueller Online-Status (ob der User eingeloggt ist), Datum der Registrierung (Erstanmeldung), letztes Login, ob die An- meldung durch eine Einladung eines anderen Nutzer (und von wem) erfolgt ist, ein Text mit einer Beschreibung der Person und ihrer Interessen, Kontakte. Aber auch in ofenen Systemen oder übergreifenden Services ist eine Reihe von Metain- formatonen zugänglich und nutzbar. Nicht nur die Anbieter von Webangeboten und -services, z. B. Online-Shops oder soziale Netzwerke haben Interesse an Metainforma- tonen zu ihren Inhalten und Nutzern, auch die Nutzer selbst können davon profteren, wenn dadurch beispielsweise | Such- und Recherchemöglichkeiten verbessert werden, weil Inhalte und Objekte bes- ser erschlossen sind, | Angebote auf spezifsche persönliche Interessen hin dargestellt und nutzbar gemacht werden, beispielsweise passende Empfehlungen gegeben werden können, | oder wenn allgemein Angebote optmiert werden können um Nutzer und Communi- tys zu unterstützen. Wie wir insbesondere im letzten Kapitel zeigen werden, profteren nicht nur die Anbie- ter von Webservices, und Nutzer, sondern vielfach auch Drite, beispielsweise externe Anbieter, Forscher oder Analysten von den entstandenen und zugänglichen Metainfor- matonen. Schwerpunkte, Forschungsfragen und Vorgehen In dieser Studie haben wir folgende Bereiche ausgewählt und genauer angeschaut: | das Nutzerverhalten, beispielsweise das Such- und Browsingverhalten, | die Kommunikatons- und Netzwerkstruktur als Möglichkeit die sozialen Gegebenhei- ten zu erfassen und zu nutzen, | Bewertungen, die dazu genutzt werden um Produkte, Personen, Objekte oder Web- seiten zu evaluieren und beurteilen, | Social Tagging als eine innovatve und populäre Variante von gemeinschaflicher Ver- schlagwortung von Dokumenten, 10
    • | Texte, da aus dieser Datenquelle eine Reihe von (auch überraschenden) Metainfor- matonen analysiert und abgeleitet werden können, | Metadatenformate als klassische Form von Metainformatonen, wir geben hier u. a. einen Überblick über aktuelle Schemata, sowie schließlich | aktuelle Entwicklungen und Projekte zu Linked Data als eine atraktve aktuelle Ent- wicklung zur weiteren Nutzung und Verlinkung von Daten auf dem Weg zum „Seman- tschen Web“. Abbildung 1: (Meta-) Informatonen aus Communitys und Netzwerken Wie in der Abbildung dargestellt, lassen sich die dargestellten Informatonen beispiels- weise darin unterscheiden, welche Expertse bei der Entwicklung bzw. Generierung die- ses Quellmaterials aufgebracht werden muss. So ist in der Regel beim bearbeiten von Metadaten Fachwissen zum Gegenstand notwendig, währenddessen Suchen oder einfa- ches Browsen nicht notwendigerweise Fachwissen benötgt – das kann quasi jeder. Gleichzeitg zeigt sich bei dieser Anordnung, dass das Aufmerksamkeitslevel graduell ab- nimmt: Während das Schreiben von Weblogeinträgen eher mehr Aufmerksamkeit des Erstellers benötgen, werden etliche Klicks eher beiläufg vorgenommen. Diese Abstu- fung und Darstellung ist sicherlich nicht für jeden Fall zutrefend. Forschungsleitend waren bei dieser Zusammenstellung folgende, eher praktsche Frage- stellungen: | Wie entstehen (Meta-) Informatonen unterschiedlicher Art? | Wie kann man sie auswerten und analysieren? | Wie werden sie genutzt? Diese Publikaton verfolgt dabei das Ziel, über unterschiedliche Branchen und Anwen- dungsbereichen hinweg Beispiele und Nutzungsmöglichkeiten vorzustellen. Es wird da- bei nicht nur betrachtet, welchen Nutzen einzelne Benutzer eines Services oder einzelne Community-Mitglieder haben oder wie die Nutzergruppen insgesamt davon profteren, um beispielsweise ihr gemeinsames Ziel besser verfolgen zu können. Auch die Betreiber von Communitys oder auch Drite haben Interesse an (Meta-) Informatonen. 11
    • Abbildung 2: Nutzer von (Meta-) Informatonen Ein gewisses technisches Grundverständnis voraussetzend, wendet sich diese Studie vor allem an Praktker, die sich durch die unterschiedlichen Nutzungsmöglichkeiten anregen lassen wollen, für ihre eigenen Produkte und Dienstleistungen innovatve Einsatzmög- lichkeiten zu entwickeln. In Rücksprache mit den Kollegen beim Salzburg NewMediaLab wurden dabei die oben genannten Schwerpunkte gesetzt, und dazu nach Beispielen, Publikatonen und Exper- ten recherchiert, um einen guten Einsteg und Überblick in den aktuellen Stand der Nut- zung sowie anregende Einblicke gewinnen zu können. Hintergrund und Kontext der Studie Diese Broschüre ist ein Ergebnis der „ComStudy“, die am Salzburg NewMediaLab (SNML) im Zeitraum von Oktober 2008 bis Januar 2010 durchgeführt wird. Das SNML, das Kom- petenzzentrum für Neue Medien in Österreich, arbeitet daran, digitale Inhalte clever zu strukturieren, verknüpfen, personalisieren, für alle aufndbar zu machen und nachhaltg zu nutzen und betrachtet dabei die Community als einen wesentlichen Faktor vieler Pro- jekte. Im Rahmen der ComStudy wurde bereits eine Studie zum erfolgreichen Communi- ty-Aufau durchgeführt, die anhand Literaturanalysen, Best-Practce-Beispielen, Fallana- lysen und Expertenbefragungen für unterschiedliche Szenarien konkrete Implemente- rungsempfehlungen gibt (Schafert & Wieden-Bischof, 2009). Zusätzlich beschreiben wir drei wesentliche Funktonalitäten von Community-Systemen, die bisher kaum dezidiert untersucht wurden, durch Vorstellung und Vergleich unterschiedlicher Realisierungen und Systeme, Best-Practce-Lösungen sowie die Erfahrungen mit dem Community-Auf- bau: Die vorliegende Studie fokussiert auf die Entwicklung und Auswertung von (Meta-) Informatonen von Communitys und ihren Aktvitäten. In zwei weiteren Studien werden schließlich (a) die Möglichkeiten mit Empfehlungen Communitys zu unterstützen sowie (b) Systeme zur Darstellung von Engagement und Reputaton der Community-Mitglieder vorgestellt. 12
    • Sandra Schafert und Mark Markus 2 NUTZERVERHALTEN Auch das Nutzerverhalten, also das Browsing-, Klick- oder Suchverhalten, ist eine inter- essante Quelle. Das Nutzerverhalten wird dabei für sehr unterschiedliche Zwecke analy- siert. 2.1 Formen und Systeme Viele Nutzer nehmen zur Informatonsrecherche im Internet oder auf einzelnen Websi- tes (Portalen), Suchmaschinen in Anspruch. Die Verwendung von Suchmaschinen wird dabei durch die Inhalte des Webs, aber auch durch das Wissen der Nutzer selbst beein- fusst. Sie geben dem Anbieter Aufschluss über die Nutzeraktvitäten und das Nutzungs- verhalten auf seiner Website, z. B.: gesuchte Kategorien, aufgesuchte Bereiche oder Sei- ten, Dauer des Aufenthalts, wie of der Besucher auf die Seite wiederkehrt, die Historie der einzelnen Website-Nutzer (Klickstream), die chronologische Reihenfolge der Aufrufe oder Suchbegrife. Nicht zu vergessen sind in diesem Zusammenhang auch die Verwer- tung von Cookies, (Informatonen, die auf dem Computer des Nutzers der Website ge- speichert werden), um Metainformatonen zu sammeln. Geschlossene Systeme, bei denen sich Nutzer einloggen müssen und damit alle Aktvitä- ten überprüfar und auswertbar sind, erfassen eine ganze Reihe von Daten des Nutzer- verhaltens. Folgende Liste gibt eine Überblick über mögliche auswertbare Daten, die ty- pischerweise in Community-Platormen und Sozialen Netzwerken im Bezug auf das Be- nutzerverhalten anfallen und ausgewertet werden. Einige Daten zum Benutzerverhalten sind: | Einloggen | Zahl der Beiträge in Relaton zu an- | Orte (Ortswechsel) deren Nutzern | Anzahl der Logins | Antwortverhalten (Reaktonszeit, | Uhrzeit (Tageszeit) Häufgkeit) | Schreiben des ersten Beitrags | Bewertungen abgegeben (neuer Thread) | Editeren | Anzahl der Kommentare | Erstes Login (Registrierung) Beispielsweise können Systeme auswerten, ob jemand in einer Nacht seinen Aufent- haltsort häufg wechselt oder ob er sich regelmäßig zu bestmmten Uhrzeiten einloggt. Aus solchen Daten können detaillierte Nutzerprofle generiert werden die auf spezif- sche Interessenslagen und Verhaltensweisen hinweisen können und sowohl für Reputa- tonssysteme als auch als Grundlage zur Verbesserung des Informatonsmanagements verwendet werden können. 2.2 Nutzen und Nutzung Im folgenden haben wir Anwendungen bzw. Nutzungen beschrieben, die allein auf Da- tenmaterial aus dem Nutzungsverhalten beruhen. Darüberhinaus werden Daten zum Nutzerverhalten in einigen Anwendungen als eine von mehreren Quellen genutzt, bei- spielsweise bei Reputatons- und Empfehlungssystemen. 13
    • Evaluaton und Optmierung von Webaufriten Durch Daten zum Verhalten kann der Anbieter Benutzerprofle erstellen, analysieren und Interessengruppen besser identfzieren, die dann zur weiteren Optmierung der Website beitragen können. Typischerweise wird dies genutzt, um den eigenen Webauf- trit zu optmieren, um mehr über die Interessen und Vorlieben der Nutzer zu erfahren, um entsprechende Angebote strategisch besser oder unter anderen Überschrifen zu positonieren und anzubieten. Browsingverhalten und Geschlechterschätzung Aus Untersuchungen sind typische Vorlieben von Frauen und Männern bekannt, bei- spielweise welche Websites sie aufrufen oder welche Art von Fotos sie vorziehen. Das bedeutet nicht, dass eine Zuordnung aufgrund eines spezifschen Verhaltens eindeutg und folgerichtg sein muss, allerdings ist es eine durchaus pragmatsche heuristsche Möglichkeit, eine Annahme über das Geschlecht des Nutzers zu erhalten. Dies ist insbe- sondere bei anonymen, d. h. also nicht eingeloggten Nutzern von Interesse. Wie eine solche Auswertung des Browsingverhaltens auf eine (heuristsche) Zuordnung des Geschlechts funktoniert, wird durch eine Anwendung bei Mikeonads.com (2008) nachvollziehbar: Hier gibt man mit einem Blick den Grif auf die History-Dateien frei, das heisst die zuletzt aufgerufenen URL sind auswertbar. Aufgrund dieser Angaben wird eine Zuordnung vorgenommen. Eine Variante für ein Tool, das aus Nutzerverhalten auf das Geschlecht tppt, ist der „Gender-Guesser“1, der aus den Vorlieben für Fotos das Ge- schlecht errät und auch von jedem auszuprobieren ist. Abbildung 3: Ergebnis der Geschlechtschätzung durch Analyse der Browsing-History Quelle: www.mikeonads.com/2008/07/13/using-your-browser-url-history-estmate-gender/ (10/2009) Technische Websites sind demnach (stereo-) typisch für Männer, Mode-Websites für Frauen – Fehler sind so durchaus möglich. Gedacht ist eine solche Anwendung jedoch nicht notwendigerweise um das Geschlecht zu erraten, sondern um Informatonen über Interessen und Vorlieben zu erhalten um entsprechend passende Werbung platzieren zu können. Um Daten über das Browsingverhalten zu erlangen, ist es nicht unbedingt not- wendig, dass Nutzer die History-Daten freigeben: Es gibt Javascripts, die aus der Farbe der „besuchten Links“ ableiten, welche Webseiten bereits aufgerufen wurden (vgl. Mi- keonads.com, 2008; dort wird auf eine Anwendung von Paul Cook hingewiesen). 1 htp://www.espgame.org/gwap/, Stand 1.9.2009 14
    • Inwieweit das Browsingverhalten bei personalisierter Werbung eingesetzt wird, ist nicht eindeutg zu klären, aber die Platzierung der oben genannten Anwendung in einem We- blog über Werbung sowie die entsprechenden Diskussionen in den verknüpfen We- blogs lassen vermuten, dass hier sehr viel Aktvität vorliegt. Suchwortanzeigen Alle großen Suchmaschinen blenden neben den Suchergebnissen auch Werbung und/oder Links ein, die als Werbung markiert sind und zur Suchanfrage passen. Dieses Werbeverfahren wird als SEM (Search Engine Marketng) bezeichnet. In diesem Werbe- segment wird noch einiges ausprobiert und optmiert, die Zahl von 7 Millionen Such- wortanzeigen im Jahr 2009 bei den Suchmaschinen MSN, Yahoo und Google zeigt jedoch die Bedeutung, die unter anderem dazu führt, dass dieser Markt mit einem Search Ad- vertsing Index monatlich beobachtet wird (Graf, 2009). Suchverhalten als Basis für Brandanalyse Das Suchverhalten wird auch im Webmonitoring eingesetzt. Mit Hilfe von Google Trends und Google Insights lässt sich so feststellen wie häufg Google-Nutzer Suchbegrife ein- gegeben haben. Diese Abfragen lassen sich wiederum vergleichen, in Zeitreihen oder auch nach dem Herkunfsland der Nutzer darstellen. Folgendes Fallbeispiel verdeutlicht, wie mit Hilfe vom Google Insight Marken in der Skiherstellerbranche sowie die Branche an sich analysiert werden können. Gleichzeitg geht es um den Versuch einer groben Ein- schätzung der Verlässlichkeit dieses Tools, indem die Ergebnisse mit anderen Daten und Informatonen ver- bzw. abgeglichen werden (vgl. Markus & Schafert, 2010). Das Web-Tool Google Insight stellt visuell dar, wie of ein Begrif mit Hilfe der Suchma- schine Google in einem bestmmten Zeitraum (max. jedoch in den letzten fünf Jahren) und in einer bestmmten Region (natonal und regional) gesucht wurde. Es können maxi- mal fünf Begrife gleichzeitg gesucht und miteinander verglichen werden, wobei auch getrennte Wörter wie „Atomic Ski“ als ein Begrif gelten. Damit kann auch die Suchhäu- fgkeit von bestmmten Marken ermitelt werden. Ein hohes Suchvolumen impliziert eine hohe Bekanntheit der Marke, woraus wiederum (nicht notwendigerweise) Aussa- gen in Bezug auf die Kaufabsichten abgeleitet werden können. Die Ergebnisse der Suche werden „normalisiert“ dargestellt, d. h. dargestellt werden nicht absolute (Such-) Zah- len, sondern Daten in Relaton zueinander auf einer Skala von null bis 100 (vgl. Google, Insights for Search Help). Wichtg ist, dass der gesuchte Begrif, z. B. eine Marke oder eine Person im Internet, in ausreichender Menge gesucht worden ist, damit er bei Goo- gle Insight überhaupt Spuren hinterlässt. Das Tool eignet sich daher nur zur Analyse von massenhaf gesuchten Begrifen. Folgende Abbildung zeigt, wie of fünf renommierte Skimarken gesucht worden sind. Es handelt sich um fünf Skimarken, die einen Löwenanteil der gesamten Skiprodukton weltweit ausmachen, wobei Salomon und Atomic zur fnnischen Amer Gruppe gehören, die „der größte Skihersteller der Welt“ ist (Herr, 2006). Die neueren und Trendskimar- ken, wie Armada, Pure Skis oder Amplid, tauchen in den Ergebnissen nicht auf. Anschlie- ßend wird das Ergebnis interpretert. 15
    • Suchvolumen weltweit Suchzeit: 01/2004 bis 06/2009 Suchbegriffe: „Salomon Ski“ (blau), „Atomic Ski“ (rot), „Head Ski“ (orange), „Fischer Ski“ (grün), „Elan Ski“ (dunkel blau) 2004 2005 2006 2007 2008 2009 Abbildung 4: Weltweit abnehmendes Suchvolumen nach den renommierten Skimarken. Quelle: Ergebnisse nach Google Insights (Stand 06/2009) Das Ergebnis verdeutlicht ein über die Jahre hinweg sinkendes Suchvolumen, das alle re- nommierten Skiartkelhersteller gleichermaßen betrift. Die Schwankungen sind saisonal bedingt und zeigen, dass die Suchhäufgkeit in den Wintermonaten, d. h. während der Skisaison erwartungsgemäß stark zunimmt. Dieser Befund kann zunächst als ein abneh- mendes Interesse an den Skiprodukten und vielleicht sogar auch am Skisport gedeutet werden. Angesichts des Leihtrends – immer mehr Skifahrer kaufen nicht, sondern leihen die aktuellen Skimodelle – ist bei den Schlussfolgerungen mit Blick auf das grundsätzli- che Skiinteresse jedoch Vorsicht geboten. Weil das sinkende Suchvolumen alle Skimarken betrift, indiziert es einen rückläufgen Skiabsatz, der statstsch belegt ist. Von 669.000 verkaufer Paar Ski in Deutschland in der Saison 2000/01 sank der Absatz über die Jahre hinweg kontnuierlich auf nunmehr 377.000 verkaufe Paar Ski in der Saison 2006/07. Ein Abgleich von objektven Absatz- zahlen mit den Suchvolumina zeigt zwar eine generelle Übereinstmmung (siehe folgen- de Abbildung), es wird aber auch deutlich, dass sich Suchanfragen aus dem Jahr 2004 keineswegs in den Absatzzahlen unmitelbar widerspiegeln. Ansonsten müsste der Ab- satz im Jahr 2004 jedenfalls deutlich größer sein als in den Jahren 2005 und 2006. Zu- dem kann aus den Ergebnissen indirekt eine zunehmende Sätgung des Skimarktes, die mit einer Intensivierung des Wetbewerbs und Verdrängung verknüpf ist, abgelesen werden. Darauf deuten die immer geringer werdenden Suchabstände zwischen den ein- zelnen Skimarken hin. Damit verbunden ist in der Regel ein starker Preiswetbewerb (vgl. Herr, 2005) sowie starke Konzentratonstendenzen und Übernahmen (vgl. Herr, 2006), die ebenfalls aus den Ergebnissen indirekt hervorgehen. Während die Skimarken Salomon und Atomic noch in den Jahren 2004 und 2005 meistgesucht (und damit ver- mutlich die bekanntesten) waren, schmolz ihr Vorsprung im Jahr 2006 fast gänzlich weg. Im Jahre 2007 haben dann zum ersten Mal mehr Personen nach der Marke Head als nach der Marke Atomic im Internet gesucht, während Salomon nach wie vor die meist- gesuchte Skimarke blieb. Head konnte allerdings nicht die Bekanntheit der Marke erhö- hen, etwa durch innovatve Produkte oder Marketngkampagnen, sondern es ist eher so, dass das nachhaltg sinkende Skiartkelinteresse Atomic am stärksten geschadet hat. In- direkt gibt das Ergebnis eine Austauschbarkeit von Skiprodukten und damit Diferenzie- rungsnotwendigkeit zu erkennen (vgl. Herr, 2005; weitere Interpretatonen und Analy- sen in Markus & Schafert, 2010). 16
    • Aus der Google-Insight-Analyse geht hervor, dass die Produkte von Atomic und Rossignol auf das größte Interesse in die letzten zwölf Monate steßen, wobei dies regional sehr unterschiedlich ausfällt: Während die Marke Rossignol vor allem in Frankreich gesucht wurde, ist die Marke Atomic für den deutschsprachigen Raum interessanter, aus wel- chem sie stammt (Österreich). Die Google-Insight-Ergebnisse ergänzen, ersetzen aber nicht die traditonelle Recherche, die Markt- oder Werbewirkungsforschung. Der Hauptvorteil liegt in der Möglichkeit, schnell und automatsiert wertvolle Teil- und Überblickinformatonen etwa zu einzelnen Marken in Relaton zueinander ermiteln zu können. Auch kann man gut die Bekanntheit von neuen Produkten oder Anbietern verfolgen, vorausgesetzt, diese hinterlassen eine deutliche Suchspur. Der Nachteil aus Sicht der Branchenanalyse liegt in den relatv gene- rischen Erkenntnissen, die jeder guter Marketer oder Produktmanager eigentlich wissen sollte. Das Potenzial von Google Insight ist damit eher die Untermauerung bestehender als die Gewinnung neuer Zusammenhänge. Allerdings sind Zusammenhangshypothesen wie „je häufger Produkte gesucht werden, desto größer ist das Kaufnteresse“ oder „je mehr Webseiten mit Produktnamen gefun- den werden, desto bedeutsamer ist dieses Produkt im Branchenvergleich“, zwar plausi- bel, wurden jedoch bisher nur unzureichend empirisch überprüf wurden. Dass Begrife häufg gesucht werden, muss nicht zwangsläufg positv konnotert sein, das kann bei- spielsweise auch auf Negatvmeldungen oder Rückrufaktonen zurückzuführen sein, wo- bei auch letztere bei Konsumenten positv konnotert sein können. Suchverhalten: Weitere Nutzungen Das Suchverhalten von Nutzern ist nicht alleine für Brand- und Produktanalysen einzu- setzen, sondern bietet auch andere überraschende Einsatzmöglichkeiten. | Beispielsweise hat das Deutsche Insttut für Wirtschafsforschung analysiert, inwie- weit das Suchverhalten nach Begrifen wie „Arbeitsamt“ und „Kurzarbeit“ nach Goo- gle Insight als Datengrundlage zur Prognose der Arbeitslosigkeit im nächsten Monat geeignet ist und kommt dabei zu brauchbaren Ergebnissen (Askitas & Zimmermann, 2009). | Das Suchverhalten ist ebenso auch im Fokus des Interesse um Wahlprognosen zu ge- ben. Google hat dies im Google-Weblog bei den Präsidentschafswahlen in den USA kommentert (s. Marketng Pilgrim, 2008), auch für die deutschen Bundestagswahlen wurde das Suchverhalten analysiert. | Die Suchmaschine Google hat im Jahr 2009 in den USA den Service „Flu Trends“ an- geboten, mit dem festgestellt wurde, in welchen Regionen nach dem Begrif Grippe gesucht wird. Wissenschafler, u. a. des „Europäischen Zentrum für die Präventon und die Kontrolle von Krankheiten“ haben festgestellt, dass diese Suchanfragen tat- sächlich mit dem Ausbruch von Grippewellen korrellieren (Ginsberg et al., 2009). | Zur Optmierung von Webangeboten, z. B. Webshops ist es hilfreich, die Suchanfra- gen der Nutzer zu analysieren. So muss sich niemand wundern, wenn er nur wenige „Pants“ verkauf, wenn seine Kunden nach Unterhosen suchen (vgl. Interview mit Thomas Kaiser in Gelin, 2009) | Auch für Werbetreibende sind Analysen des Suchverhaltens aufschlussreich, um bei- spielsweise gezielt Aktonen zu platzieren: Zu bestmmten Anlässen, beispielsweise dem Valentnstag, wird immer nach denselben Keywords gesucht, „saisonale Search- Trends“ werden so zu einem „kritschem Erfolgsfaktor“ (Groß, 2009). 17
    • Es ist anzunehmen, dass gerade für die Nutzung der Daten zum Suchverhalten noch vie- le weitere Einsatzmöglichkeiten erprobt und entwickelt werden. So wird – teils scherz- haf – in Weblogs gezeigt, dass im Dezember deutlich häufger nach „Sex“ gesucht wird als in den anderen Monaten und „Sex“ damit insgesamt „wichtger“ ist als „Liebe“ ist und dass man die regionale Analyse von Google Insights verwenden kann, um nach po- tentellen Absatzmärkten für Ostriesentee zu suchen (Basic Thinking Blog, 2009) Zusammenfassung Das Wissen darüber, wohin Nutzer klicken, welche Seiten sie aufrufen und mit welchen Begrifen sie suchen lässt sich vielfältg nutzen: Es kann der Personalisierung dienen, z. B. für Empfehlungen, aber auch zur Schaltung passender Werbung, es auch ist we- sentlicher Bestandteil von Reputatonssystemen. Nutzerverhalten sollte auch wesentlich dabei unterstützen, Webangebote und deren Nutzung zu evaluieren. Insbesondere die Suchanfragen bei Google und das Angebot von Google Insights zeigt innovatve Ansätze, wie Nutzerverhalten auch für das Webmonitoring eingesetzt werden kann. Abbildung 5: Nutzung des Wissens über Nutzerverhalten 18
    • Sandra Schafert 3 KOMMUNIKATIONS- UND VERNETZUNGSSTRUKTUR Eine interessante Informaton über Communitys und Netzwerke ist auch, wie Personen miteinander verbunden sind, d. h. ob sie sich kennen und miteinander kommunizieren. Auf den Informatonen über die Kommunikaton- und Vernetzungsstruktur können nicht nur Reputatons- und Empfehlungssysteme aufauen, sondern auch vielfältge Analysen und Services darauf. 3.1 Daten und Formen der Analyse Wer sich mit wem, wie und über was austauscht, ist für viele Anwendungen und Interes- sen von Nutzen. Ganz unterschiedliche Informatonen dazu liegen vor und können aus- gewertet werden. In geschlossenen Communitys, Mailinglisten oder Newsforen können zum Beispiel im Bezug auf einzelne Nutzer und deren Kommunikatons- und Vernet- zungsstrukturen folgende Aspekte erfasst und ausgewertet werden: | hat eine Frage gestellt, die keine Antwort und keine Kommentare erhalten hat und von wenigen Nutzern angesehen wurde, | hat eine Frage gestellt, über die 10/25/100 Mal abgestmmt wurde, | hat eine Frage gestellt, die von 25/100 Usern als Favorit gewertet wurde, | hat eine Frage gestellt, die von 1.000/2.500/10.000 User angesehen wurde, | hat eine Antwort gegeben, über die 10/25/100 Mal abgestmmt wurde oder | ist gemeinsam mit 3 Freunden des anderen Geschlechts eingecheckt. Darüber bieten die Vielzahl von sozialen Netzwerken und Platormen, bei denen sich „Freund“, „Kontakte“ oder „Follower“ wählen lassen, die Möglichkeit näheres über Be- kannte und Interessen auszuwerten. Es gibt mit „Friend-of-a-Friend“ (FOAF) sogar ein Metadatenformat, dass diese Beziehungsnetzwerke beschreibt (FOAF-project.org). Typischerweise spannen sich Kontakte und Kommunikaton wie ein Netz auf: Man kom- muniziert mit einem, der wiederum mit anderen kommuniziert. Aus den Sozialwissen- schafen gibt es mit der sozialen Netzwerkanalyse ein Verfahren, dass die Vernetzung berechnen und darstellen lässt. Dadurch kann man gut Kommunikatonsstrukturen er- kennen und Eigenschafen von Personen im Netz feststellen, z. B. ob sie stark vernetzt und im Zentrum stehen oder ob sie Schlüsselpositonen zwischen Subgruppen besetzen. Nähe und Verknüpfung wird dabei in Form von „Netzwerken“ dargestellt. Mit dem aufommenden vielen neuen Daten im Internet wird das Verfahren vermehrt auch zur Auswertung von diesen Informatonen eingesetzt. Beispielsweise kann das ei- gene Netzwerke, also Kontakte und Kontakte-von-Kontakten so visualisiert werden. 19
    • Abbildung 6: Darstellung von Kontakten als Netzwerk Quelle: htp://asset.soup.io/asset/0054/6740_ca5c.png (10/2009) Häufg liegen die exakten Daten über Netzwerke nicht vor, können jedoch über Angaben über Kontaktntensität oder Vorkommen der Namen in gleichen Dokumenten abgeleitet werden, beispielsweise durch Analyse von Diskussionsforen. Vier Varianten von Daten lassen sich dabei unterscheiden (Kirchhof et al., 2008, 7): Explizite soziale Verbindungen sind beispielsweise öfentlich zugängliche Freundeslisten, explizite indirekte soziale Ver- bindungen sind demnach Hyperlinks auf Weblogeinträge von anderen. Implizite soziale Verbindungen sind textuelle Hinweise, die eindeutg auf eine soziale Beziehung hinwei- sen, beispielsweise Ko-Autorschafen bei Publikatonen. Schließlich sind implizite soziale Verbindungen beispielsweise Käufer des gleichen Produkts. 3.2 Nutzen und Nutzung Diese direkt oder indirekt abrufaren Informatonen über die Strukturen der Kommuni- katon und Vernetzung werden auf unterschiedliche Weise erhoben, ausgewertet und genutzt. Freunde und Freundesfreunde in Sozialen Netzwerken Soziale Netzwerke wie LinkedIn, StudiVZ, Xing, MySpace und Facebook basieren wesent- lich darauf, dass bekannt ist wer wen kennt. Das ermöglicht, die Bekannten, genannt „Freunde“ auf dem Laufenden zu halten, nachzulesen, was diese bewegt, neue Fotos anzusehen oder die letzte Powerpoint-Präsentaton – je nachdem welches Netzwerk und mit welchem Hauptokus man es benutzt. Aufauend auf dem Wissen, mit wem man bekannt ist bzw. wen man als Freund ausgewählt hat gibt es auch aufauende Ap- plikatonen, die beispielsweise darstellen, welche Tags in einer Gruppe oder im eigenen Bekanntenkreis gerade genutzt werden. 20
    • Es sind jedoch nicht nur diejenigen Personen interessant, die man bereits als Kontakte gekennzeichnet und/oder akzeptert hat, dieses Wissen wird auch in unterschiedlicher Form für den einzelnen Nutzer oder die Community genutzt. Im Folgenden einige Bei- spiele dazu: | Nutzer werden über Personen informiert bzw. diese als neue Kontakte vorgeschla- gen, die man kennen könnte, beispielsweise weil man viele gemeinsame Bekannte hat oder weil sie das öfentliche Profl betrachtet haben (z. B. bei Facebook). | Bei Recherchen wird dargestellt, über wieviele Ecken (Personen) man mit jemanden verknüpf ist, d. h. ob man beispielweise über einen gemeinsamen Kontakt vorge- stellt werden kann (z. B. bei LinkedIn). | In manchen Netzwerken kann man auch nachvollziehen, was die eigenen Kontakte öfentlich mit weiteren Kontakten austauschen, z. B. auf den Pinnwänden von Nut- zern hinterlassen, die man nicht selbst in der Kontaktliste hat (z. B. bei Facebook). | Gerade in professionellen Netzwerken wie LinkeIn und Xing, wird über die Zahl der bestätgten Kontakte auch eine gewisse „Bedeutsamkeit“ der entsprechenden Perso- nen abgeleitet. | Einige soziale Netzwerke bieten auch an, dass man anderen gemeinsame Kontakte vorschlagen kann, dies ist besonders dann wichtg, wenn jemand neu bei einem Netzwerk ist (z. B. Facebook). Um die unterschiedlichen Netzwerke und Kommunikatonstools auf einer Platorm ver- folgen und bedienen (also z. B. Statusmeldungen schreiben) zu können, gibt es Werkzeu- ge (z. B. Tweetdeck) und Websites (z. B. Friendfeed.com) die hier die unterschiedlichen Kanäle zentral zusammenbringen. Aus der Vorstellung heraus, dass Mitglieder der gleichen oder verwandten Communitys bzw. mit ähnlichen Interessen und Arbeitsgebieten auch von den Suchstrategien und -ergebnissen der Anderen profteren könnten, werden Suchmaschinen konzeptonisiert, die dieses Wissen adäquat verarbeiten und darstellen wollen (z. B. Chi, Pirolli & Lam, 2007; Odden, 2009). Beispielsweise wird das Wissen über das soziale Netzwerk genutzt, um Vorschläge für den Besuch von Konferenzen bzw. einzelne Präsentatonen zu geben (z. B. Klamma, Cuong & Cao, 2009) oder um Tagvorschläge zu geben (Klamma, Spaniol & Renzel, 2007). Das Wissen über Kontakte und deren Vorlieben und Verhalten ist auch Bestandteil von Empfehlungs- und Reputatonssystemen. In den sozialen Netzwerken wird dabei experimentert, welche Arten von Informatonen über das Kommunikatons- und Vernetzungsverhalten für die Nutzer bzw. die Communi- ty insgesamt interessant sind und wie sie genutzt werden können. Auch für „normale“ Nutzer ist die Darstellung ihrer Verknüpfung zu anderen „interessant“, auch wenn häufg Angaben über die Hintergründe der Darstellungen und Interpretatonsmöglichkeiten fehlen. Beispielsweise kann man sich mit der Facebook-Applikaton TouchGraph die Ver- knüpfung mit anderen als Netzwerk darstellen lassen. Open Social Networking „Friend of a Friend“ heisst das Metadatenformat, mit dem die Kontakte bzw. Netzwerke beschrieben werden können. Die eigenen Netzwerke persönlich nutzen zu können, bei- spielsweise um sie unabhängig von spezifschen Anwendungen auswerten und nutzen zu können ist die Idee der Initatve „FOAF + SSL“: „FOAF+SSL is a way of allowing open social networking, while stll leaving everything under the control of the individual. It 21
    • uses well-established protocols, virtually every standard Web browser supports it. Whe- rever you need to interact over the Web with others but retain a level of trust - your se- crets are your secrets - FOAF+SSL is there for you.“ (ESW-Wiki, 2009). Dieses Vorhaben möchte also ermöglichen, dass man beispielsweise Adressdaten von seinen Kontakten immer auf dem Laufenden halten kann, ohne notwendigerweise alle diese Daten öfent- lich und zentral zugänglich halten zu müssen. Trendforschung in Sozialen Netzen Die Methode der sozialen Netzwerkanalyse wird derzeit mit Daten aus sozialen Netz- werken v. a. dazu genutzt, um „Zukunfsprognosen zu generieren, die Aufschluss über zukünfige Produktrends geben“ (s. Baumöl & Ickler, 2008). Maßgeblich ist hier eine Ar- beitsgruppe am MIT um Peter Gloor zugange, der die Suche nach Trends mit Hilfe der Netzwerkanalyse unter dem Begrif „Coolhuntng“ beschreibt. Durch die Analyse von be- kannten Innovatonsprozessen hat die Arbeitsgruppe um Gloor typische „Bilder“ für (in- novatve) Lernnetzwerke dargestellt, die wiederum bei der Identfzierung von Trendsan- bahnungen eingesetzt werden können (u. a. Gloor et al., 2008). Dazu wurde u. a. auch die Entwicklung von neuen Tools notwendig. Bei Condorview wird die Vernetzung mit Hilfe des Hin-und-Her von E-Mails gemessen und dargestellt und damit soziale Netze transparent. In der Auswertung der Inbox eines E-Mails-Nutzer sind Newsleter oder Mailinglisten „isolierte Netzwerke“, weil man nur lesend partzi- piert. Meinungsführer identfzieren Netzwerkanalysen werden in Unternehmen gezielt eingesetzt um Meinungsführer bzw. um wichtge Knoten in Netzwerken zu analysieren. Beispielweise argumentert die öster- reichische FAS.research so den Nutzen des Einsatzes damit: „Das Ziel der Sozialen Netz- werkanalyse ist, Ihnen Ihre Freiheit wieder zu geben: Global Players bleiben nicht länger unerreichbar, wichtge Kontakte lassen sich herstellen und Sie bleiben nicht mehr in der Verfechtung rivalisierender Cliquen gefangen.“ (Homepage, Stand 12.10.2009). Das Wissen über Netzwerke ermöglicht ausserdem, gezielte PR-Maßnahmen durchführen zu können, indem beispielsweise Meinungsführer festgestellt werden und gezielt einge- bunden werden (vgl. Leisenberg, 2008). Soziale Netzwerkanalyse aus Wissenschafsperspektve Die neuen Strukturen und Kommunikatonsformen des Internets sind auch für die Wis- senschaf interessant, hier wird gerade vom Einsatz der sozialen Netzwerkanalyse ein großes Potental erwartet: Hiermit sollen Einblicke in Strukturen erlangt werden, die durch andere Verfahren nicht ohne weiteres aufgedeckt werden können. Beispielsweise untersucht Stegbauer (2009) damit, exploratv wie in der Online-Enzyklopädie Artkel entstehen und diskutert werden, weil in diesem Kontext herkömmliche Theorien zum Kooperatonsverhalten scheitern (z. B. S. 103 f.). Community-Aware-Services Aus der Vorstellung heraus, dass Mitglieder der gleichen oder verwandten Communitys bzw. mit ähnlichen Interessen und Arbeitsgebieten auch von den Suchstrategien und -ergebnissen der anderen profteren könnten, werden Suchmaschinen konzeptonisiert, 22
    • die dieses Wissen adäquat verarbeiten und darstellen wollen (z. B. Chi, Pirolli & Lam, 2007; Odden, 2009). Beispielsweise wird das Wissen über das soziale Netzwerk genutzt, um Vorschläge für den Besuch von Konferenzen bzw. einzelne Präsentatonen zu geben (z. B. Klamma, Cuong & Cao, 2009) oder um Tagvorschläge zu geben (Klamma, Spaniol & Renzel, 2007). Das Wissen über Kontakte und deren Vorlieben und Verhalten ist auch Bestandteil von Empfehlungs- und Reputatonssystemen. Wissen über soziale Netze analysieren und nutzbar machen Ralf Klamma leitet eine Forschungsgruppe, die sich mit der Nutzung unterschiedlicher Metadaten beschäfigt, sich dabei aber auf soziale Netze und deren Anliegen fokussiert. Wissen über soziale Netze analysieren und nutzbar machen - im Gespräch mit Ralf Klamma ? In Ihrer Gruppe beschäfigen Sie sich mit unterschiedlichen Metadaten und wie man sie nutzen kann. Was ist so atraktv an dem Wissen über die sozialen Strukturen von Usern und Communitys? Wozu kann es genutzt werden? Wir haben einen neuartgen Ansatz für sogenannte refektve Community- Informatonssysteme entwickelt. Dieser Ansatz beruht zum einen auf der Möglichkeit für Praxisgemeinschafen fortlaufend über ihre Nutzung von Informatonssystemen (IS) zu refekteren, zum anderen auf der Möglichkeit, diese Erfahrungen mitelbar für die Weiterentwicklung der Informatonssystem- komponenten einzusetzen. Daten über soziale Strukturen sind deshalb so atraktv, weil sie zwischen quanttatven und qualitatven Methoden der Informatonssystembewertung vermiteln. Nutzungshäufgkeiten und qualitatve Aussagen über die Qualität von IS können besser gewürdigt werden, wenn zusätzliche Informatonen über die Positon der Nutzer in einer sozialen Struktur vorliegen. Bei unseren Forschungen sind wir inzwischen so weit, bestmmten sozialen Strukturen positve oder negat- ve Einfüsse auf die IS Entwicklung zuschreiben zu können. Das klassische Beispiel ist der sogenannte Troll, eine immer wieder aufretende Rolle, die anderen Benutzern durch wenig zielführende Diskussio- nen Zeit und Energie raubt. Und auch hier unterscheidet sich unser Ansatz von vielen bedrohlich wirken- den Aktvitäten zur Überwachung der Nutzer in sozialer Sofware. Wir stellen die Daten nur den Nutzern in den Praxisgemeinschafen selbst zur Verfügung. Diese mögen über die weitere Nutzung selbst ent- scheiden und auch über die Konsequenzen, die sie aus den gewonnenen Erkenntnissen ziehen. Für ein- geschränkte Fragestellungen arbeiten wir aber auch an Recommender-Systemen, die auf der Analyse der sozialen Netze beruhen. ? In welcher Weise werden solche Informatonen über soziale Netzstrukturen konkret eingesetzt? Wir setzen diese Systeme gezielt zusammen mit professionellen Praxisgemeinschafen ein, bestehend also aus Künstlern, Ingenieuren, Ärzten, Wissenschaflern usw. Ein aktuelles Beispiel ist die nachhaltge Entwicklung des Bamiyan Tales in Afghanistan, wo eine bunte Mischung aus Wissenschaflern, Ingenieu- ren, Denkmalschützern, Kulturbürokraten, Politkern, und Tourismusmanagern damit beschäfigt ist, einen Masterplan für die Nutzung des Tales nach Beendigung des Bürgerkrieges zu erstellen. Hier stellen wir mobile soziale Sofware zur Verfügung und beraten. Wir haben aber auch gerade ein neues Projekt gewinnen können, bei dem es um die Untersuchung der Kooperatonsmuster zwischen europäischen Schulen geht. Im Moment sind in der über die Jahre angelegten eTwinning-Datenbank 50.000 Schulen aufgenommen. Die spannende Frage ist hier, wie Lehrer die Analyse und Visualisierung existerender Ko- operatonsmuster lernen und nutzen können, um ihr eigenes Kooperatonsverhalten zu optmieren. 23
    • ? Wo sehen Sie gerade besonders hohen Forschungs- und Entwicklungsbedarf? Das Gebiet bildet gerade eine neue Disziplin heraus, die sich „Web Science“ nennt. Hier geht es darum, anspruchsvolle analytsche Einsichten in die generelle Natur von Netzen - insbesondere des Webs - mit herausragenden Ingenieursleistungen zur Erreichung eines gewünschten Verhaltens von Nutzern zu ver- binden. Web Science wird sicherlich noch einige Jahre brauchen, um sich als eigenständige Disziplin zu etablieren, aber an der RWTH Aachen haben wir schon begonnen, Studenten aus verschiedenen techni- schen Masterprogrammen in Vorlesungen, Seminaren und Masterarbeiten mit dieser neuen Disziplin vertraut zu machen. Forschungsbedarf gibt es vor allem beim Schrit von der statschen Analyse von Netzen hin zu dynamischen Analyse, die alle Formen von Veränderungen über die Zeit in Netzwerken berücksichtgt. Hier gibt es erste Schrite zu einem vertefen Verständnis dynamischer Prozesse in Net- zen, z. B. bei der Analyse von Bewegungsmuster von Nutzern mobiler Informatonssysteme, aber noch keine ausgearbeitete Theorie. Ein weiterer Punkt ist ein umfassenderes Verständnis der verwendeten Medien in sozialen Netzen. Bislang werden Medien ausgeblendet und bilden einen blinden Fleck der Theorie sozialer Netze. Wir verbinden in unseren Forschungen Entwurfstheorien der Informatk mit ope- ratonalen Medientheorien, die eine medienspezifsche Ausgestaltung von Informatonssystemen erlau- ben, z. B. bei der Nutzung von mobilem Multmedia. Letztlich will unsere Forschung dem Nutzer des Webs nicht nur die Folgen des eigenen Handelns bewusst machen, sondern auch sein „Leiden“ unter den Handlung der anderen. Durch die immer weiter Durchdringung unserer Lebenswelt durch Informa- tonstechnologien müssen wir uns immer mehr bewusst werden, dass wir auch durch die Spuren beur- teilt werden, die wir im Netz hinterlassen. Dr. Ralf Klamma leitet die Arbeitsgruppe „Metadata in Community Informaton Systems“ (MCIS) am Lehrstuhl für Informatonssysteme und Datenbanktechnologie der RTHW Aachen. Die Gruppe beschäf- tgt sich im Rahmen des DFG Exzellenzclusters UMIC (Ultra High-Speed Informaton and Communicaton) und des EU IP ROLE (Responsive Open Learning Environments) sowie einiger anderer natonaler wie in- ternatonaler Forschungsprojekte mit der Entstehung, dem Nutzen und die Wartung von Metadaten in Social Sofware und Community-Systemen beschäfigt. Dabei wird auch die Rolle von Metadatenbe- schreibungsstandards in unterschiedlichen Anwendungskontexten untersucht. Zusammenfassung Das Wissen über Kommunikatons- und Vernetzungsstrukturen kann ganz unterschied- lich genutzt werden. So hilf es zum einen, das persönliche Informatons- bzw. Kontakt- management zu verbessern und dient generell dazu, die Kommunikaton von Nutzern gleicher Services oder von Communitys zu verbessern. Auch kann es dienlich sein, um Communitys efektv zu moderieren und die Qualität der Prozesse zu evaluieren. Schließlich ergeben sich aus diesen Strukturen und Abläufen auch Hinweise für beson- ders innovatve Vernetzungen und Prozesse. 24
    • Abbildung 7: Nutzung Kommunikatons- und Vernetzungsstruktur Insbesondere die Methode der Sozialen Netzwerkanalyse hat in den letzten Jahren er- heblich an Aufmerksamkeit gewonnen und wird immer häufger für die Daten und Mög- lichkeiten des Webs adaptert und eingesetzt. 25
    • 26
    • Sandra Schafert und Diana Wieden-Bischof 4 BEWERTUNGEN Wenn viele Produkte oder Informatonen vorhanden sind, verlässt man sich gerne auf Empfehlungen oder Reputatonssysteme2. Grundlage für diese sind Bewertungen, die Leser oder Kunden oder andere Nutzer abgegeben haben. 4.1 Formen und Einsatz Bewertungen können auf unterschiedliche Weise vorgenommen werden, so gibt es qua- litatve Verfahren wie sie in der Online-Enzyklopädie Wikipedia eingesetzt werden: Dort werden mit Hilfe von Diskussionsseiten Verbesserungsvorschläge gemacht oder Kritk geübt. Abbildung 8: Kennzeichnung eines qualitatv unzureichenden Beitrag bei Wikipedia Quelle: Wikipedia.de (10/2009) In quanttatven Systemen, kommen standardisierte Formulare oder Ratng-Skalen zum Einsatz. Mit letzterem werden wir uns in diesem Abschnit beschäfigen. Abbildung 9: Zwei Formen der Bewertung Quelle: Amazon.de, Tripwolf.com (10/2009) Bewertungen können auf unterschiedliche Weise z. B. in Form von Sternen, Smileys aber auch nach dem Schulnotensystem dargestellt werden. Dem Einsatz sind keine Grenzen gesetzt und sowohl Inhalte (wie Geschichten, Artkel), Gegenstände (wie Autos, Brief- marken) als auch Personen und Organisatonen (wie Arbeitgeber, Ärzte, Lehrer) können 2 Empfehlungs- und Reputatonssysteme sind die Themen der beiden folgenden Veröf- fentlichungen im Rahmen des Projektes ComStudy. 27
    • bewertet werden. Anbieter können somit leichter den Wert oder die Bedeutung des Sachverhalts, Gegenstands oder Inhalts für die Nutzer einschätzen. Für praktsch alle Produkte und Dienstleistungen des Alltags, z. B. Elektroartkel, Hotels oder Skiprodukte lassen sich im Web Foren fnden, bei denen Nutzer und Kunden Be- wertungen hinterlassen. Eine Auswertung der Bewertungen, beispielsweise ein Produkt- vergleich, gibt häufg hilfreiche Rückmeldungen zum Produkt bzw. den Dienstleistungen. Zu den bekannteren Angeboten gehören Ciao.de und Qype.at (vgl. Markus & Schafert, 2010). Bewertungssysteme bzw. darauf aufauende Empfehlungs- und Reputatonsysteme ha- ben mit einigen Herausforderungen zu kämpfen, zu den bekannten zählen: Das Cold- Start-Problem bezeichnet die Tatsache, dass zunächst keine oder nur wenige Bewertun- gen vorliegen, „Feedback Padding“ ist das Erschleichen von günstgen Bewertungen und „Ballot Stufng“ ist der Versuch, durch mehrmaliges Bewerten das Ergebnis zu beein- fussen. 4.2 Nutzen und Nutzung Im Folgenden werden wir an einigen Beispielen zeigen, welche Formen der Bewertung bekannte Webangebote nutzen und stellen einzelne Anwendungen vor. Bewertungssysteme bei bekannten Webangeboten Im Rahmen einer Diplomarbeit bei Salzburg Research wurden bekannte Webangebote, nämlich der Verkaufplatormen Amazon und Ebay, sowie der beiden kollaboratv entwi- ckelten Online-Enzyklopädien Wikipedia (in beiden Versionen) sowie Citzendium im Hinblick auf ihr Bewertungssystem analysiert. Amazon Ebay Wikipe- Wikipe- Citzen- dia dia neu dium Geschlossenes System P P P Sichtbarkeit von Benutzerdetails P P P Verschiedene Benutzergruppen P Kommentare und Diskussion P P P P P Berücksichtgung der Reputaton P P P P Bewertung von Inhalten P Bewertung von Bewertern P Darstellung der Ergebnisse als Zahlenwerte P P Darstellung der Ergebnisse als Balken oder Sterne P P Darstellung der Ergebnisse als Wörter P Anzahl von Bewertungen P P Anzahl der bewerteten Inhalte P P Tabelle 1: Einsatz von Bewertungssystemen bei bekannten Webangeboten Quelle: gekürzte Darstellung einer Darstellung in Gruber (2008) Bei allen Angeboten kommen demnach auch qualitatve Verfahren zum Einsatz, wobei die quanttatven Empfehlungssysteme mit Sternen und Balken wohl eher bei den kom- merziellen Anbietern zu fnden sind. 28
    • Produkt- und Dienstleistungsbewertung: Datngjungle Im Web gibt es eine Vielzahl von Portalen die Meinungen zu Produkten und Dienstleis- tungen abfragen und damit versuchen, einen Überblick über den Markt zu geben. Am Beispiel von Datngjungle zeigen wir, wie dabei Bewertungen vorgenommen werden können. Tabelle 2: Bewertungsformular bei Datngjungle (Ausschnit) Quelle: htp://www.datngjungle.de/ (10/2009) Datngjungle versucht einen Überblick über Online-Partneragenturen zu geben und bit- tet deren Nutzer einen Fragebogen auszufüllen. Die Ergebnisse, also Empfehlungen und Ranglisten von solchen Online-Partneragenturen basieren auf diesen Angaben. Datng- jungle ist also – wie alle vergleichbaren Angebote – auf die Bewertungen seiner Nutzer angewiesen, auf welchen weitere Empfehlungen bzw. die Reputaton und Ranglisten der Anbieter aufauen. Produktbewertungsportale Für Internet-Nutzer sind die Bewertungen von Produkten sowie Online-Shops entschei- dend für ihren Einkauf, wie die Befragung einer Internet-Beratungsagentur zeigt (Fitkau & Maaß Consultng, 2008). 29
    • Abbildung 10: Bewertung von Nutzermeinungen bei Kaufentscheidungen Quelle: htp://www.w3b.org/e-commerce/produktbewertungen- beeinfussen-kaufentscheidungen.html (10/2009) Hinter den Bewertungsplatormen von Produkten (dies gilt auch für die Angebote mit Preisvergleichen) verbergen sich unterschiedliche Businessmodelle: So fndet man bei Idealo.de und Billiger.de nur Produkte von Händlern, die für diesen Service zahlen; bei Dealjäger dagegen können Nutzer selbst Produkte einstellen (vgl. Randler, 2009). Der Oto-Konzern hat mit Smatch.com eine Bewertungsplatorm mit Community-Feature, bei der nur spezifsche Produkte aus seinem Angebot vorgestellt werden (Mode-, Mö- bel-, Lifestyletrends). Auch bei Smatch.com ist davon auszugehen, dass der Oto-Konzern das Feedback der Nutzer zur Verbesserung seines Warenbestands nutzt. Der eigentliche Nutzen des Ange- bots besteht jedoch weniger darin, die konkreten Bewertungen zu erhalten als um den Service herum eine Community aufzubauen die letztlich durch ihre Aktvitäten den Ab- satz von Oto erhöhen sollen, der Verkauf ist und bleibt das Kerngeschäf (s. Groß, 2008). Community-Einbindungen sind für Online-Shops nicht zwangsläufg notwendig; Experten empfehlen den Shop-Anbietern nicht unbedingt eigene Communitys aufzubau- en, aber mit bestehenden Angeboten – beispielsweise den Bewertungsplatormen – zu kooperieren (vgl. Groß, 2008). Nachrichtenranking mit Yigg Es gibt jedoch eine Anwendung, in der sich die Tätgkeit bzw. die Community rund um das Tagging und Bewerten von Nachrichten herum bildet, es also als wesentlichen Inhalt betrachtet: Die Website Yigg.de beschreibt sich folgendermaßen (vgl. Website, Stand März 2009): 30
    • „YiGG ist eine Nachrichten-Website, auf der die Benutzer selber Nachrichten einstellen, bewerten und kommenteren können. Die Community der Nutzer ist sozusagen das Re- daktonsteam, das darüber entscheidet, welche Nachrichten den Lesern präsentert werden sollen. YiGG bietet allen seinen Nutzern die Möglichkeit, Nachrichten zu bewer- ten. Du bewertest eine Nachricht, indem Du einfach auf den grünen Buton neben jeder Nachricht unter dem Stmmenzähler klickst. Die besten Nachrichten kommen auf unsere Homepage, wo sie jeder neue Besucher sofort lesen kann. Dabei kombiniert YiGG sozia- les Bookmarking, Blogs, RSS-Feeds, Nachrichteneinträge, Tags, Videos und mehr. Da die Benutzer entscheiden, was interessant ist, handelt es sich um eine nicht-hierarchische Nachrichtenverteilung.“ Abbildung 11: Screenshot von Yigg.de Quelle: Yigg.de (03/2009) Meinungsumfragen am Beispiel I-Predict Seit Juni 2007 stellt MSNBC seinen Nutzern iPredict für Abstmmungen zur Verfügung. Nutzer werden aufgerufen, zu verschiedenen Aussagen und Geschehnissen Bewertun- gen abzugeben. Dabei kann eine abgestufe Beurteilung von „very likely“ (sehr wahr- scheinlich) bis „very unlikely“ (sehr unwahrscheinlich) abgegeben werden. Sie können zwischen sechs verschiedenen Kategorien (Politk, News, Unterhaltung, Business, Ge- sundheit, Sport und Technologie) auswählen, um ihre Meinungen in diesen Bereichen zu äußern. Pro Tag ist nur eine Bewertung pro Frage möglich (Wieden-Bischof & Schafert, 2008, 24f). 31
    • Abbildung 12: Abstmmung bei iPredict vom 18.3.09 Quelle: MSNBC htp://www.msnbc.msn.com/id/18661488/vid/24982552 (03/2009) Nach Abgabe der Bewertung erscheint direkt im Diagramm ein grünes Kästchen „You“ (Du), welches die eigene Bewertung mit der durchschnitlichen Leserbewertung im ro- ten Kästchen gegenüberstellt. Die „eigene Stmme“ wird durch ein Cookie im System ge- speichert. Kehrt man daher nach einer längeren Zeit zu der Umfrage zurück, fndet man seine alte Bewertung vor und kann erneut zu dem Thema abstmmen. Nutzer können also nicht nur die Veränderung der durchschnitlichen Nutzerbewertung grafsch darge- stellt verfolgen, sondern auch die Änderungen der eigenen Einschätzungen (Wieden-Bi- schof & Schafert, 2008, 24f). Werden im Zeitraum der Umfrage auf dem Nachrichtenportal thematsch zusammen- hängende Artkel bzw. Schlüsselereignisse veröfentlicht, dann werden diese ebenfalls automatsch im Diagramm in Form eines kleinen Vierecks angezeigt. Es beinhaltet Infor- matonen über den Titel des Artkels und sein Erscheinungsdatum sowie Informatonen über die durchschnitliche Bewertung der Frage bis zu diesem Zeitpunkt und der Anzahl der Bewertungen. Dadurch kann gut beobachtet werden, ob der Artkel beispielsweise Auslöser für Meinungsänderungen ist/war. Klickt man auf den Titel des Beitrags, dann wird man automatsch auf den vollständigen Artkel im Portal verlinkt (Wieden-Bischof & Schafert, 2008, 24f). Abstmmung: Der Batleout-Fotowetbewerb Bei Batleout (batleout.zapak.com) bewerten Mitglieder jeweils zwei gegenübergestell- te, hochgeladene Fotos von anderen Nutzern. Der Wetkampf um das bessere Bild dau- ert fünf Tage; das Foto mit der höheren Punktzahl gewinnt. Wetbewerbe von Nutzern ofener Video- und Fotoplatormen um das beste Bild werden auch zu speziellen The- men durchgeführt, manchmal werden Preise von Firmen gesponsert, der Wetbewerb wird also (auch) im Rahmen von PR-Aktonen durchgeführt (vgl. htp://www.buzznet.- com/www/contests). 32
    • Zusammenfassung Im Überblick ergeben sich folgende drei Nutzungsmöglichkeiten von Rankings: Zunächst einmal kann es dem eigenen Informatonsmanagement dienen (z. B. um schlechte Er- fahrungen mit Händlern zu noteren), dann nutzt diese Informaton der Community, da darauf Empfehlungssysteme und Reputatonssysteme aufauen und schließlich ergeben sich insbesondere für Unternehmen viele Möglichkeiten des Webmonitorings, beispiels- weise zur Evaluierung von Produkten oder potentellen Marktchancen und Innovatons- bedürfnissen. Abbildung 13: Nutzung von Bewertungen Im Bezug auf Bewertungssysteme ist zu erwarten, dass hier zukünfig noch weitere Möglichkeiten entwickelt und erprobt werden, wie Bewertungen vorgenommen, darge- stellt und ausgewertet werden können. 33
    • 34
    • Sandra Schafert, Wolf Hilzensauer und Diana Wieden-Bischof 5 SOCIAL TAGGING Im Folgenden betrachten wir eine relatv neue Variante von Metadaten die überra- schend populär ist und der wir uns daher in einem eigenen Abschnit beschäfigen. In traditonellen Medienarchiven werden Materialien zu Kategorien und Unterkategori- en zugeordnet, welche häufg auch zusätzliche Kurzbeschreibungen und Schlagworte beinhalten. Im Web hat sich ein Verfahren etabliert, das Nutzern ermöglicht, Webseiten oder anderen Ressourcen (Bilder, Videos, Musikstücke) mit eigenen Schlagworten zu markieren, sie zu „taggen“ (von Engl. „tag“: Etket). Mit Hilfe der Tags können andere entsprechende Ressourcen recherchieren; schnell haben sich populäre Webdienste ent- wickelt. 5.1 Konzept und Anwendungen Social Tagging, also das gemeinsame Taggen, führt zur Entstehung von Metainformato- nen, die wiederum neue Zugänge zu Ressourcen ermöglichen. Weinberger (2007) be- schreibt in seinem Buch „Everything is miscellaneous: the power of the new digital dis- order“ wie diese neuen Metainformatonen im Vergleich zu herkömmlichen (hierarchi- schen) Kategoriensystemen zu scheinbar chaotschen Zuordnungen führen, tatsächlich aber neue, überzeugende und adaptve digitale Ordnungssysteme schafen. Die „Schlag- wortsammlung, die aus den Tagging-Aktvitäten aller Nutzer/innen innerhalb eines Sys- tems erwächst und sich dynamisch mit jeder neuen Eingabe ändert“ wird als „Folksono- my“ bezeichnet, einem Kunstwort aus „Taxonomy“ (Engl. für Taxonomie, Systematk) und „Folk“ (Engl. für Volk, Leute; s. Gaiser, Hampel & Panke 2008, 12). Während die Er- zeugung von traditonellen Metadaten also eher einem ausgewählten Benutzerkreis vor- behalten ist, sind beim Social Tagging potentell alle Benutzer beteiligt (Derntl et al., 2009). Es ist also „eine ofene, efziente Möglichkeit der Klassifkaton von Dokumenten“ weil „eine breite Palete von unterschiedlichen Termen für die Beschrei- bung eines Dokuments bereitgestellt wird“ (Güntner, Sint & Westenthaler, 2009, 192). Die Schlagworte, die beim Social Tagging benutzt werden, sind in der Regel nicht auf in- haltliche Beschreibungen beschränkt, sondern können sich auch auf den Materialtyp („website“, „blogpost“) beziehen und persönliche Anweisungen („toread“) oder auch Be- wertungen sein („cool“; vgl. Barbosa, 2008, 5). Aus Sicht der Nutzer werden u. a. folgende Motve genannt, warum sie Tags verwenden bzw. sich beim Social Tagging beteiligen (vgl. Marlow et al. 2006): um das spätere Aufn- den der Dokumente zu erleichtern, einfach um beizutragen und auch um zu teilen, um Aufmerksamkeit zu erreichen, aber auch um sich an Spielen und Wetbewerben zu be- teiligen, um sich selbst zu präsenteren oder auch um die eigene Meinung auszu- drücken. Tagging-Systeme werden auf zweierlei Weisen genutzt: Zum einen können sie im System angeboten werden, d. h. die Tags im ofenen Fotoarchiv FlickR werden dort erstellt und verwaltet. Daneben gibt es auch zentrale Tagging-Services wie delicious (bis August 2008: del.icio.us), die es erlauben, jede Webseite zu taggen und diese Informatonen wiederum allen Nutzern zugänglich zu machen. In so genannten „Tag-Clouds“ („Tag-Wolken“) werden die am häufgsten genutzten Tags dargestellt, wobei wiederum häufger genutzte Tags dicker und größer dargestellt wer- 35
    • den. Auf diese Weise erhält man einen schnellen Überblick über Ressourcen, beispiels- weise über Einträge in Weblogs. Abbildung 14: Tag-Wolke des Salzburg NewMediaLab (Stand Februar 2009) Eine weitere Variante des Taggens von Bildern ist das Taggen von einzelnen Punkten oder Bereichen in Bildern. So kann man beispielsweise im ofenen Fotoarchiv FlickR und im sozialen Netzwerk Facebook Bilderausschnite taggen bzw. auch mit den Proflen an- derer Nutzer verknüpfen. Auch eine Variante des ESP-Game, das wir im Folgenden aus- führlicher vorstellen werden, nutzt diese spezielle Variante des Taggens. 5.2 Nutzen und Nutzung Im Folgenden beschreiben wir eine Reihe von konkreten Beispielen, wie Social Tagging eingesetzt und genutzt wird. Delicious: Social Bookmarking Social Tagging wird in der Regel mit der Website Delicious in Verbindung gebracht: Deli- cious ist ein Social-Bookmarking-Service, d. h. mit der Hilfe dieses Services können Nut- zer Webadressen speichern, mit Schlagworten versehen und mit anderen teilen. Dazu ist inzwischen nicht mehr notwendig, die Website Delicious aufzurufen, da der Service direkt im Browser integrierbar und abrufar ist. 36
    • Abbildung 15: Ergebnisse der Suche nach dem Tag „ComStudy“ bei Del.icio.us (Ausschnit) Quelle: htp://delicious.com/search?p=comstudy (03/2009) In einer unveröfentlichten Studie wurde verglichen, wie die Recherche mit Hilfe von Del.icio.us im Vergleich zu Suchmaschinen und Webverzeichnissen abschneidet (s. Wi- chowski, 2009): Morrison (2007) stellte dabei fest, dass Delicious hier einen knappen zweiten Platz einnimmt. Zudem stellte er jedoch fest, dass eine Kombinaton der Deli- cous-Tags mit einem kontrollierten Vokabular bessere Ergebnisse liefert als die Recher- che in Webverzeichnissen. Tagging bei ofenen Foto- und Videoarchiven Im Rahmen dieser Studie haben wir sechs der größten ofenen Foto- und Videoportale hinsichtlich des Taggings untersucht. Dabei lässt sich feststellen, dass von den sechs ge- wählten Portalen nur beim Video-Portal YouTube, das Taggen von Videos durch die Nut- zer nicht vorgesehen ist und auf die Ersteller der Videos beschränkt ist. Bei einigen der Angebote (z. B. FlickR) können die Eigentümer der Bilder festlegen, ob andere Nutzer die Fotos bzw. Bilder taggen können; sehr häufg wird dies nicht erlaubt. 37
    • Name Start Anzahl der Kategorie URL Tagging Mitglieder Broad- 2006 25.400.000 Videos, broadcaster.com Videos der Nutzer können getaggt caster auch live werden, „related tags“ werden zur weiteren Recherche angeboten. Buzznet 2005 10.000.000* Musik buzznet.com Es kann getaggt werden, allerdings ist dies z. T. durch die Nutzer selbst ein- geschränkt. Flickr 2002 4.000.000 Fotos fickr.com Es kann getaggt werden, allerdings ist dies z. T. durch die Nutzer selbst ein- geschränkt. Es kann nach Tags recher- chiert werden. Fotki 1998 5.000.000 Fotos fotki.com Taggen möglich – Recherche via Tags möglich und prominent platziert. Fotolog 2002 24.339.520* Fotos fotolog.com Taggen und Recherche der Tags ist möglich, andere Nutzer werden mit deren häufgsten Tags „beschrieben“. YouTube 2005 40.000.000 Videos youtube.com YouTube bietet nur den Erstellern der Videos an, Tags zu erstellen. Tabelle 3: Bekannte ofene Foto- und Videoarchive: Nutzerzahlen und Taggingmöglichkeiten Quelle: Startjahr, Nutzerzahlen und Kategorie nach www.linqia.com bzw. (*) Betreiberangaben, Stand November 2008, Tagging: eigene Recherchen Tagging von Kunstobjekten: Projekt Steve.Museum Social Tagging wird nur selten in digitalen Archiven der Bibliotheken, Archive und Muse- en eingesetzt, ein Beispiel ist das Projekt steve.museum beim Metropolitan Museum3. Versuchsweise wurden im Herbst 2005 Freiwillige gebeten, 30 Bilder der Sammlung des Metropolitan Museums zu taggen. Diese Tags wurden mit der professionellen Beschrei- bung aus dem Katalog verglichen (Chun, Cherry, Hiwiller, Trant & Wyman, 2006): Die Tags wurden von den Fachleuten auf Relevanz überprüf und obwohl es nur ein kleines Testsetng war, sofort in den Katalog aufgenommen. Grund dafür war, dass rund 80 Pro- zent der Tags in den vorhandenen Beschreibungen nicht genutzt bzw. verwendet wur- den. Daher betrachtete man die von den Freiwilligen genannten Tags als sinnvolle und hilfreiche Ergänzung des Katalogs. Folgende Illustraton zeigt zunächst, wie unterschied- liche Nutzer das Objekt mit der Nummer 17.190.746 aus der „The Metropolitan Muse- um’s Collecton“ taggen: 3 htp://www.steve.museum 38
    • Abbildung 16: Tagging von Objekten Quelle: Chun, Cherry, Hiwiller, Trant & Wyman (2006), Abbildung 2 Der Katalogeintrag dieses Beispiels und die gesammelten Tags der Nutzer sind in der Ta- belle auf der folgenden Seite exemplarisch dargestellt. Das Projekt läuf weiter, und eine Reihe von Veröfentlichungen lassen sich dazu fnden. So stellt Trant (2008) dar, dass die Tags der Nutzer helfen können, den vorhandenen „mis-match between vocabulary of visitor and the museum“ zu überwinden: Üblicher- weise recherchieren und fragen Nutzer der Archive eben selten nach den im Katalog ver- zeichneten Merkmalen der Artefakte, sondern eher nach Aspekten, die über die Tags der Nutzer hinzugefügt werden (könnten). Die Sofware des Projekts wurde für Museen und andere Applikatonen erweitert und es gibt inzwischen auch eine Anwendung für das soziale Netzwerk Facebook4, die den Facebook-Nutzern erlaubt, Kunst zu taggen und damit zum Projekt beizutragen. Ein weiteres Beispiel für die Verwendung von Tags im Bereich der Bibliotheken, Archive und Museen ist die Biodiversity Heritage Library (BHL), eine Initatve von zehn großen naturhistorischen Museumsbibliotheken, Bibliotheken botanischer Gärten sowie For- schungsinsttuten aus den USA und dem Vereinigten Königreich. Ziel der Initatve ist es, eine Strategie zur Digitalisierung ihrer Bibliotheksbestände zu erarbeiten und diese (langfristg) global im Rahmen einer „Biodiversity Commons“5 online verfügbar zu ma- chen. Die Startseite erlaubt dabei nicht nur die Suche nach unterschiedlichen Kategorien (wie Titel, Autoren, Themen, Namen, Karten oder Jahr) der bereits erschlossenen Inhal- te, sondern auch die Suche/den Zugang zu den unterschiedlichen Themen über Tags. 4 htp://apps.facebook.com/steve-museum 5 htp://www.biodiversitylibrary.org 39
    • Cataloguing from The Metropolitan Museum’s Sample Terms Collected Collectons Management System Artst/Maker(s) Maker: Joachim Friess, ca. 1579-1620, m. 1610 A sampling of unique terms (not in Title Diana and the Stag the museum’s collectons manage- Object Name AUTOMATON ment system) collected from volun- Date First quarter 17th century, (about 1620) teer cataloguers. Culture German (Augsburg) acton Made in Country: Germany, City: Augsburg animal Medium Silver, partly gilt, jewels, enamel antler Classifcaton Metalwork-Silver archery Dimensions 14 3/4 x 9 1/2 in. (37.5 x 24.1 cm) arrow Credit Line Gif of J. Pierpont Morgan, 1917 baroque bejeweled Department European Sculpture and Decoratve Arts bow Markings bridle [1] A pine cone (Augsburg town mark in use between 1620 and 1625). chain See Helmut Seling, Die Kunst der Augsburger Goldschmiede 1529-1868, clockwork Munich, 1980, vol. III, p. 19, no. 44. [2] Roman capitals I F within a rect- container angle (cameo) (maker's mark of Joachim Friess or Fries, born in Lubeck deer/reindeer about 1579 master goldsmith in Augsburg in 1610, died 1620). See Sel- dog/dogs ing, Vol. III, p. 143, no. 1248. [3] A Roman capital B below a crown and fguratve within a shield (cameo), unidentfed. [4] A Roman capital E below a gilded crown, and within a shaped reserve (cameo) (French guarantee mark for gold Foreign silver in use between 1809 and 1819). See Tardy, Internatonal horse Hallmarks on Silver, Paris, 1981, p. 190. Locaton of marks: [1] On the hunt/hunter/huntng/huntress neck and inside the neck, and on the base. [2] Twice on the neck, on top intricate of the base. [3] Inside and on the outside of the neck. [4] Inside the jumping neck. leap/leaping Descripton luxury Diana seated on stag, with Cupid on croup, and three hounds below; mechanical stag's head removable, body a fask; spring-driven mechanism in base movement permits automaton to move. Diana wears a crescent set with eight rose mythological/mythology diamonds and one pink tourmaline; stag with coronet, pierced collar, nude lion mask on breast and trappings of scrolling ornament and cherubs; ornamental/ornamentaton set with three pink imitaton tourmalines; on base three lizards, two of /ornamented them with green enamel, one small lizard, two frogs and four beetles, ornate one of them with green enamel; octagonal casket-like base, decorated precious with applied ornament in same style as trappings; in center of lef side rearing movable key-hole cover on spring. rider/riding Accession Num- saddle 17.190.746 ber woman Tabelle 4: Dokumentaton der Sammlung im Managementsystem im Vergleich mit den Schlag- worten der Nutzer am Beispiel eines Objektes (Nr. 17.190.746) aus der „The Metroplitan Museum ’s Collecton“ Quelle: Chun, Cherry, Hiwiller, Trant, & Wyman, 2006 40
    • Gerade die Beispiele Untersuchungen aus dem Bereich der Archive der Bibliotheken, Museen und Archive zeigen, dass Tagging die vorhandenen professionellen Beschreibun- gen der Archivare sinnvoll ergänzen, weil sie häufg(er) den Rechercheinteressen und -verhalten der nicht- und semiprofessionellen Anwender entsprechen, die beispielswei- se tendenziell eher nach Äußerlichkeiten als technische oder historische Rahmendaten recherchieren. Social Tagging bei Nachrichten-Sites Nur wenige Nachrichen-Sites bieten an, einzelne Beiträge zu taggen: In einer Untersu- chung von 46 Websites war es nur das Portal des Nachrichten-Anbieters „Verdens Gang (NO)“, welches diesen Service anbot (Wieden-Bischof & Schafert, 2008, 25). Inzwischen gibt es wohl einige Beispiele, wo den Lesern von Nachrichten-Sites das Taggen erlaubt wird, allerdings – und das ist wohl eine Folge der konfikträchtgen Inhalte von Nach- richten – ist dies nur selten realisiert: erfahrungsgemäß werden hier besonders gerne unfätge oder politsch motvierte Tags verwendet. Social Tagging und traditonelle Klassifkaton Um Texte recherchierbar zu machen, werden häufg Volltextsuchen eingesetzt. Dabei stößt man auf das Problem, dass man verwandte Begrife oder Konzepte, die im Text bzw. den vorhandenen Tags nicht vorkommen auch nicht recherchieren kann. Mit Hilfe von kontrollierten Vokabularen und Thesauri werden Terme in Verbindung gebracht, so dass beispielsweise ein Text zu Skifahren dem Bereich „Sport“ zugeordnet werden kann. Bei solchen geschlossenen Systemen „kann die semantsche Lücke zwischen den Autor/inn/en des kontrollierten Vokabular und dem Domänenwissen der Anwender/in- nen zu Problemen führen“, diese werden als „Vocabulary Problem“ bezeichnet (s. Günt- ner, Sint & Westenthaler, 2009, 192). Um zu ausreichenden und qualitatv besseren Er- gebnissen zu kommen, werden drei Formen der Generierung von Metadaten auch kom- biniert eingesetzt (s. Kitl & Zeidler, 2007): die automatsche Generierung von Metada- ten (durch Informatonsextrakton) sowie manuell erzeugte Metadaten durch Tagging oder Klassifkaton. Für das integrierte Projekt LIVE6 wurde daher ein Prototyp entwickelt, der versucht, die Vorteile des traditonellen Klassifzierens mit den Vorteilen des Social Taggings zu verbin- den (Güntner, Sint & Westenthaler, 2009). Die folgende Abbildung zeigt einen Screens- hot der Anwendung, die klassische Klassifkaton mit Social Tagging kombiniert und als Prototyp entwickelt wurde: 6 Live Staging of Media Events, htp://ist-live.org (2009-10-12) 41
    • Abbildung 17: Vocabulary-Management-Tool – ein Prototyp Quelle: Güntner, Sint & Westenthaler, 2009, 195 Das Tool wird folgendermaßen beschrieben: „Der Kalender (1) dient zur zeitlichen Ein- schränkung und Auswahl der Dokumente und Auswahl der Dokumente und vergebenen Tags. Im linken Fensterbereich wird das kontrollierte Vokabular (Thesaurus) dargestellt (2), welches im Falle des Prototypen ohne Beschränkung der Allgemeinheit auf den IPTC Newscodes basiert. Der Vocabulary-Manager kann die Schaltlächen (3) benutzen, um die vergebenen Tags dem Vokabular hinzuzufügen bzw. sie mit dem Vokabular in Bezie- hung zu setzen: Die Schaltlächen ermöglichen das Eingügen eines Tags als neue Unter- kategorie („<< new subconcept“) oder als neues Synonym („<<new synonym“) für einen bestehenden Term im Thesaurus. Weiters können mit der Schaltläche „<<set new rela- ted>>“ Terme miteinander verbunden werden, die thematsch in einem Zusammenhang stehen.“ (Güntner, Sint & Westenthaler, 2009, 195). Aufauend auf den Erfahrungen mit diesem Prototyp, wurde das Konzept auch im Rah- men des Projektes KiWi7 eingebracht und in das KiWi-System implementert. Die folgen- de Abbildung zeigt die Realisierung des Ansatzes im KiWi-System. 7 Knowledge in a Wiki, htp:// www.kiwi-project.eu/ (2009-10-12) 42
    • Abbildung 18: Vocabulary-Management bei KiWi (Stand 10/2009) Automatsche Tags und Qualitätssicherung Wenn Systeme auf Social Tagging aufauen, haben sie mit dem Cold-Start-Problem zu kämpfen: Solange keine Tags vorhanden sind, sind entsprechende Dokumente z. B. über entsprechende Suchfunktonen nicht aufndbar. Um dieses Problem zu entschärfen, werden automatsche Tags vergeben, die beispielsweise durch Methoden des Text-Mi- ning (siehe Abschnit zu Texten) ermitelt werden. Diese automatschen Tags können also auch fehlerhaf oder unsinnig sein. Im Projekt „Interedu“ des Salzburg NewMediaLab wurde daher ein System der Qualitätssicherung eingeführt um automatsche Tags und Tags der Lehrer unterscheiden zu können. Zu die- sem Zweck wurde folgende Markierung der Lernmaterialien eingeführt: | Wolken kennzeichnen Lernmaterialen, denen automatsch Tags zugewiesen wurden, die also auf statstschen Analysen beruhen und fehlerhaf sein können. | Wolken mit einer durchbrechenden Sonne markieren Lernmaterialien, bei denen ein beliebiger Nutzer bereits eigene Tags ergänzt hat (und ggf. die automatsch ermitel- ten übernommen hat). | Eine Sonne haben schließlich die Lernmaterialien, wenn ein Administrator oder Ge- genstandsbetreuer das Lernmaterial über eine spezielle Schaltläche freigegeben hat. Jede weitere Bearbeitung führt wieder zur vorherigen Stufe (Wolken mit durchbre- chender Sonne), so dass das Lernmaterial einer erneuten Freigabe durch einen Admi- nistrator oder Gegenstandsbetreuer bedarf. Nicht immer ist so eine relatv rigide Kontrolle der Qualität von Tags notwendig, wie es im Falle der Lernressourcen in diesem Projekt erwartet wurde; aber es zeigt sich an die- sem Beispiel, dass auch hier die Qualität von Social-Tagging-Systemen noch erhöht wer- den kann. Social Tagging als Spiel Um im größeren Umfang Tags zu Bildern zu erhalten, entwickelten kreatve Köpfe das ESP-Game (www.espgame.org, von Ahn & Dabbish, 2004). Die Spielidee liegt darin, dass 43
    • Spieler zu Bildern Tags eingeben, von denen sie annehmen, dass sie auch von anderen Nutzern verwendet werden und je nach Übereinstmmung Punkte erhalten. Dabei hat sich gezeigt, dass schnell allgemeine Tags verwendet werden, so dass diese Worte inzwi- schen ausgeschlossen werden, was das Spielen jedoch nicht weniger spannend macht, sondern eher noch herausfordernder. Abbildung 19: ESP-Spiel (Stand März 2009) Quelle: htp://www.espgame.org/ (03/2009) Die Autoren rechneten aus den ersten Versuchen mit dem ESP-Spiel aus, dass 5.000 Spieler genügen würden, um alle Bilder, die von Google indiziert sind (Stand, 2004) in wenigen Wochen mit Schlagworten zu beschreiben. Dies ist wirklich überraschend, weil 5.000 keine große Zahl ist; die meisten populären Online-Spiele haben im Vergleich dazu mehr als 5.000 Spieler, die gleichzeitg spielen (von Ahn & Dabbish, 2004). Die Idee des ESP-Spiels wurde inzwischen von anderen aufgegrifen. So hat Google den „Google Image Labeler“ implementert und erhält durch dessen Spieler viele Metainfor- matonen über Bilder. Auch wurde die Spielidee auf andere Medien übertragen (z. B. auf Musikstücke: „Tag a Tune“, via www.espgame.org). Hier werden Musikstücke vorge- spielt, die getaggt werden sollen. Andere wiederum entwickelten daraus ein Spiel (und Patent), das auf einem horizontalen Display gespielt wird (Diakopoulos & Chiu, 2007). Sogar für die Erstellung von Mitarbeiterproflen wurde es abgewandelt und eingesetzt (vgl. Zhang, Dong, Ackerman & Qu, 2008): Gewonnen hate hier derjenige Mitarbeiter, dessen Tags mit Kompetenzen der Kollegen am besten zu deren Selbstbeschreibungen passt. Durch die Spielbeteiligung wurden vergleichsweise schnell und spielerisch Kom- petenzbeschreibungen der Mitarbeiter zugänglich. Insbesondere für (nichtextuelle) Medienarchive ist im Allgemeinen davon auszugehen, dass für die Dokumentaton und die Nutzer ein echter Mehrwert entstehen kann, wenn Tagging möglich ist. Um wirklich viele Tags zu erhalten, können die genannten Spielide- en helfen, diesen Prozess atraktv zu machen und ins Laufen zu bringen; zudem können sie Teil einer PR-Akton sein. 44
    • Erfahrungen mit Tagging von Lernressourcen Unterschiedliche Formen des Taggings und Erfahrungen damit sind Gegenstand einer Reihe von Untersuchungen. Riina Vuorikari hat eine preisgekrönte Untersuchung dazu veröfentlicht (Vuorikari, 2009), wir haben sie dazu befragt. Bei dem Portal „Learning Re- source Exchange“8 bestand die Herausforderung vor allem darin, Tagging im mehrspra- chigen Kontext einzusetzen, weil das Portal mit Lernressourcen von Lehrern aus ver- schiedenen Ländern genutzt wird. Tagging von Lernressourcen – Interview mit Riina Vuorikari ? Sie haben eine Studie zu Metadaten von Lernressourcen durchgeführt. Wie taggen den Ihren Erfahrungen nach Nutzer? Gibt es Unterschiede zwischen ihnen? Unsere Nutzer sind Lehrer von Grund- und Sekundarschulen aus ganz Europa. Ganz allgemein haben wir herausgefunden, dass Tags, die sie nutzen sehr deskriptv sind und fast so gut sind wie die Stchwörter, die Bibliothekare zu den Lernressourcen hinzugefügt haben. Weil wir Nutzer aus verschiedenen Ländern haben, haben wir natürlich auch Tags in verschiedenen Sprachen! Nutzer taggen dabei gleichzeitg in ihrer eigenen Sprache (z. B. ein deutscher Lehrer auf Deutsch) aber auch auf Englisch. Es trift besonders auf Sprachlehrer zu, dass sie Ressourcen in der Sprache taggen, in der die Materialien sind (z. B. taggt ein Französischlehrer auf Französisch). ? Klicken sie denn auch auf Tags? Gibt es da Unterschiede im Verhalten? Wir haben herausgefunden, dass nicht alle Nutzer interessiert daran sind, Tags zu nutzen um Ressour- cen zu fnden. 59 Prozent der Nutzer unseres Portals nutzen Tags um Ressourcen zu fnden, 35 Prozent waren überhaupt nicht daran interessiert. Interessanterweise haben etwa ein Dritel der Nutzer niemals getaggt, nutzen Tags aber bei der Recherche. Es ist wie so of im Internet, einige machen die Arbeit und viele andere Nutzer profteren davon. Das ist großartg! ? Was denken denn die professionellen Ressourcenverwalter über die Tags? Unserer Evaluaton zufolge waren ihre Antworten im Bezug auf Tags eher positv. In manchen Fällen wa- ren sie sogar der Meinung, dass die Tags direkt in die Metadaten-Beschreibung übernommen werden könnten, weil sie so gut waren. Of wiederholen Tags jedoch auch nur Informatonen, die über die Res- source vorhanden sind (beispielsweise, dass die Ressource in Englisch ist), aber der zusätzliche Vorteil der Tags ist, dass die Ressourcen über die Tagcloud beworben werden. 8 htp://lreforschools.eun.org, Stand 12.10.2009 45
    • ? Was empfehlen Sie für die erfolgreiche Einführung eines Taggingsystems? Das Hinzufügen von Tags muss leicht gemacht werden, und auch bedeutsam für Nutzer sein. Wenn Tags dazu genutzt werden, Sammlungen von Ressourcen anzulegen, die einfach mit anderen Lehrern oder auch Schülern geteilt werden können, fnden das Lehrer nützlich. Ein anderer wichtger Aspekt ist, dass zu den Tags auch Metadaten hinzugefügt werden, aber das passiert verdeckt. Für das System ist es wich- tg zu wissen, wer den Tag hinzu gefügt hat und in welcher Sprache er ist. Dr. Riina Vuorikari arbeitet seit 2000 für das European Schoolnet (EUN, europeanschoolnet.org) zu ei- nem weiten Themengebiet von digitalen Lernressourcen, Web-2.0-Themen wie Tagging und sozialen Netzwerken, bis zu Themen wie Interoperabilität und Metadaten sowie Kollaboraton von Schulen. Vor kurzem hat sie ihre Dissertaton zum Thema Tags und Lernressourcen im mehrsprachigen Kontext erfolg- reich verteidigt. Zusammenfassung Tagging bzw. das Zusammentragen von Tags mehrerer Nutzer (Social Tagging) wird in un- terschiedlicher Weise genutzt. Wesentlich erscheinen hier der Beitrag zum persönlichen Informatonsmanagement, Beiträge zur Verbesserung von Recherchemöglichkeiten so- wie die Möglichkeit, Empfehlungen zu geben. Auch kann Social Tagging neue (ggf. besse- re) Kategorien und Strukturen entwickeln und schließlich auch im Rahmen von Webmo- nitoring-Aktvitäten analysiert werden. Abbildung 20: Nutzung von (Social) Tagging Social Tagging ist vergleichsweise neu, und die Untersuchungen dazu und Nutzungsmög- lichkeiten sind noch nicht ausgereizt. Beispielsweise ist das Taggen von Personen ein völ- lig neuer Ansatz, der noch wenig erprobt ist. Mit der Facebook-Applikaton „Collabio“ experimentert hier beispielsweise eine Arbeitsgruppe von Microsof Research (s. Bern- stein et al., 2009). 46
    • Sandra Schafert und Diana Wieden-Bischof 6 TEXTE Text entsteht beim Schreiben von Weblog-Nachrichten, Pinnwandeinträgen, Kommenta- ren, Editeren von Wiki-Seiten und vielem mehr. Im Web stehen so jede Menge Texte als „Rohdaten“ zur Verfügung, die ausgewertet und weiterverwendet werden können: bei- spielsweise um weitere Informatonen zu erhalten oder passende Informatonen zu ver- knüpfen, oder um Suchen efzienter zu gestalten. Im Folgenden beschreiben wir erstens wie und warum gerade Medienarchive die Entste- hung von Texten fördern sowie zweitens, wie Texte ausgewertet werden können, um darüber hinausgehenden Informatonen zu erhalten und wie dies konkret genutzt wird. 6.1 Entstehung von Texten fördern Wie wir darstellen werden, sind Texte außerordentlich wichtg, um weitere Informato- nen über andere Objekte wie Fotos, Videos oder Personen zu erhalten. Es gibt daher ein großes Interesse, auch aktv die Entstehung von Text zu unterstützen: Zwar sagt man „Ein Bild sagt mehr als tausend Worte“, diese Informatonen und Eindrücke können aber nur schwer von Maschinen generiert und damit automatsch ausgewertet und weiter verwendet werden. Gerade (Bild-) Archive sind daran interessiert, Texte zu ihren Abbil- dungen oder Objekten zu erhalten. Dort fnden sich kreatve Beispiele, wie versucht wird, Nutzer dazu zu bringen, Texte zu Bildern zu schreiben. Dem Verschlagworten (Tag- ging) war bereits das Kapitel 5 gewidmet, so dass wir uns im Folgenden auf Texte bezie- hen, die nicht nur bzw. keine Schlagworte sind. Das Spiel „Phetch“ Die Idee des Spiels „Phetch“ ist es, mehr Informatonen zu Bildern zu bekommen (vgl. von Ahn et al., 2006): Das Online-Spiel ist für je drei bis fünf Spieler entwickelt. Einer der Spieler wird zufällig als „Beschreiber“ ausgewählt, die anderen sind die „Sucher“. Der „Beschreiber“ erhält vom Spiel ein Bild vorgelegt, dass er mit einem kurzen Text be- schreiben soll, beispielsweise mit „ein weißes Gespenst steht auf der Brücke und schreit“. Die Sucher, die das Bild nicht gesehen haben, müssen nun möglichst schnell das richtge Bild mit Hilfe einer Bildersuchmaschine fnden, indem sie dort nach passenden Suchbegrifen recherchieren und sich dann für ein Bild entscheiden. Wer als erstes das richtge Bild wählt, erhält Punkte und ist in der nächsten Runde der „Beschreiber“. Wenn das richtge Bild gefunden wurde, erhält natürlich auch der „Beschreiber“ Punkte. Bei folgendem Foto würden die Beschreibungen bei Phetch folgendermaßen lauten: „halb- Mann-halb-Frau mit schwarzem Haar“ sowie „eine abstrakte Zeichnung mit einem Mann mit einer Violine und einer Frau mit einer Flöte“ (s. von Ahn et al., 2006). 47
    • Abbildung 21: Beispielabbildungen zur Beschreibung des Spieles „Phetch“ Quelle: von Ahn et al., 2006, Abbildung 1 Mit Hilfe dieses Spiels können also gute, hilfreiche Beschreibungen für Bilder entwickelt und validiert werden; durch den Spielcharakter kann dies mitunter recht schnell gehen, so dass in kurzer Zeit eine große Zahl von Bildern beschrieben wird. Im Vergleich mit ei- ner Spiel-Variante (dem ESP-Game), bei der nur Schlagworte eingegeben werden sollen zeigt sich, dass Phetch-Beschreibungen in 98,5 Prozent der Fälle richtg identfziert wur- den, hingegen traf dies nur bei 73,5 Prozent der Bilder mit ESP-Tags zu (von Ahn et al., 2006, 81). Die Geschichte zum Bild bei Einestages Aus dem Bereich der Nachrichten-Sites gibt es zwei interessante Beispiele, wie Leser er- muntert werden, zu Fotos bzw. Landkarten Texte zu schreiben. Einestages ist seit Okto- ber 2007 das Zeitgeschichte(n)-Portal von Spiegel Online, in welchem Leser dazu mot- viert werden, auch eigene Geschichten beizutragen. Einestages möchte mit seinem Por- tal ein kollektves Gedächtnis der (Zeit-) Geschichte schafen und alle Informatonen gut aufereitet präsenteren. Als Kooperatonspartner von Einestages konnte Spiegel Online Partner wie das Bildarchiv Preußischer Kulturbesitz, das Filmarchiv der Deutschen Wo- chenschau, den Geschichtswetbewerb des Bundespräsidenten (Körber-Stfung) und das Deutsche Auswandererhaus gewinnen (Spiegel Online, 2007). Um dies zu ermögli- chen, ist Einestages auf das Engagement, die Unterstützung und Mitarbeit aller Interes- sierten, der so genannten Zeitzeugen, angewiesen (Spiegel-Online, 2007), dazu können Leser andere Nutzer nach der passenden Geschichte zu ihrem Bild/Foto fragen bzw. nach dem passenden Bild zu einer Geschichte suchen. Reiseberichterstatung bei Times Online Ein weiteres Beispiel, wie Geschichten mit Bildern verknüpf werden, ist die Reisebe- richterstatung und Verortung der Berichte bei der Times Online (tmesonline.co.uk): Ti- mes Online bietet in Zusammenarbeit mit BMW eine Weltkarte an, in der registrierte Nutzer über ihre Reiseerfahrungen berichten können. Die Karte kann zur Navigaton ver- wendet werden, indem man entweder auf den gewünschten Kontnent klickt oder die rechte Spalte mit der Aufistung der Kontnente betätgt. Nach Auswahl des gewünschten Landes, erhält man eine Detailkarte, die durch einen Raster in Abschnite eingeteilt wird. Nutzer können nun selbst einen Beitrag in dem aus- gewählten Bereich (z. B. Kontnent, Land) hinzuzufügen, welcher in Form einer „Postkar- 48
    • te“ dargestellt wird und von den Nutzern mit den eigenen Erlebnissen aus dem Urlaub gefüllt werden kann. Auch Bilder und Videos können hochgeladen werden, sie zieren dann die „Rückseite“ der Postkarte. Auch die bereits vorhandenen und von anderen Nutzern bereitgestellten Reiseberichte können gelesen und versendet werden. Leider ist dieser Service von Times Online zurzeit (Stand Juni 2009) nicht verfügbar („Page under constructon“). Abbildung 22: Reiseberichterstatung als E-Postkarte bei Times Online Quelle: htp://yourworld.tmesonline.co.uk, (10/2007) Alterraten bei Agester Spielerisch werden auch bei Agester.com Informatonen über Fotos eingeholt: Hier kön- nen Nutzer das Alter von Personen auf Fotos raten bzw. erraten lassen, also herausfn- den, wie alt andere einen schätzen. Abbildung 23: Screenshot Agester: Wie alt ist die Person? Quelle: htp://www.fickr.com/photos/xingty/431041471/ (03/2009) 6.2 Nutzen und Nutzung Die unterschiedlichen Texte, die im Web zu fnden sind, also beispielsweise Weblogein- träge oder Diskussionsbeiträge, Microblogging-Meldungen oder Webseiten werden auf ganz unterschiedliche Weise genutzt. Bevor wir konkrete Beispiele nennen, muss der 49
    • Text jedoch zunächst ausgewertet werden, dabei kommen Verfahren der „Informaton Extracton“ zum Zuge. Verfahren der Informaton Extracton Unter anderem kommen folgende Verfahren der „Informaton Extracton“, also Verfah- ren, um aus Texten automatsch weiterführende Informatonen zu erlangen, zum Ein- satz. „Informaton Extracton“ defniert sich als der selektven Strukturierung und Kombi- naton von impliziten oder expliziten Daten in einem oder mehreren Dokumenten. Infor- maton Extracton benutzt dazu semantsche Klassifzierungen von Informatonen (vgl. Knoth, Schmidt & Smrž, 2008; Moens, 2006). Dabei kommen semantsche als auch statstsche Verfahren zum Einsatz (s. Knoth, Schmidt & Smrž, 2008): Semantsche Verfahren versuchen, u. a. aus der Satzstellung heraus zu erkennen, welche Bedeutung der Text hat. Statstsche Verfahren benötgen große Mengen an Text, um beispielsweise Häufgkeitsanalysen durchzuführen. Beide An- sätze werden vielerlei kombiniert. Automatsche Tag-Vorschläge Texte werden auch automatsch ausgewertet, um Tags vorzuschlagen (s. Abschnit über Social Tagging). Dies ist beispielsweise hilfreich, um Tags für Weblogeinträge automa- tsch vorzuschlagen (Mishne, 2006). Im Projekt „Interedu“9 des Salzburg NewMediaLab wurde ein System entwickelt, das das Tagging von Lernressourcen unterstützt, indem es Tagvorschläge generiert. Dabei kommen mehrere Verfahren zum Einsatz, die hier kurz skizziert werden, die folgenden Angaben stammen aus einem Projektbericht: | Die Hauptkomponentenanalyse ist ein statstsches Verfahren, dass mit Hilfe einer Analyse „Trainingsdaten“ Rückschlüsse auf das Vorschlagen von Tags geben kann: Dazu werden die Texte der Trainingsdaten in Schlüsselworte zerlegt, Stopworte aus- gefltern und Stammformen gebildet, dann wird eine Dokument-Term-Matrix ange- legt und Vektoren beschrieben. Weil allein durch das Vorkommen eines Schlüssel- wortes nicht die Relevanz gezeigt ist, wird mit dem TF-IDF-Verfahren (Term Frequen- cy/Inverse Document Frequency) festgestellt, ob es vergleichsweise häufg vor- kommt, also „besonders“ ist. Ziel der Hauptkomponentenanalyse ist es nun, die be- stehende Matrix so in der Anzahl der Dimensionen zu reduzieren, dass bis auf Rau- schen alle Hauptrichtungen vertreten sind. | Mit KEA können Texte klassifziert werden und sogenannte Keyphrases oder „Schlüs- selwortketen“ in Texten erkannt werden. KEA unterstützt zwei Arten von Klassifzie- rungen: die freie Klassifzierung (Schlüsselwortextrakton) sowie die eingeschränkte Klassifzierung (Kategorisierung), bei der der Text in eine Kategorie eingeordnet wird. Auch hierzu muss eine sogenannte Trainingsphase Trainingsdaten, die bereits diese Zuordnungen haben, durchgeführt werden, bei der ein Klassifzierungsmodell erstellt wird. | Auch Assoziatonsregeln können zum Vorschlagen von Tags oder Schlüsselworte ein- gesetzt werden. Sobald eine Menge von Dokumenten signifkant häufg mit den sel- ben Tags oder Schlüsselworten versehen wurde, kann ein Benutzer von dem Wissen der Vorgänger profteren, indem seine Tags vervollständigt werden. Das Konzept der Assoziatonsregeln setzt somit voraus, dass schon Tags vergeben worden sind. 9 Partner: Salzburg Research, Educaton Highway und Punkt Netservices. 50
    • Das Beispiel zeigt, dass die Entwicklung eines solchen Systems, bei dem Text-Mining-Ver- fahren zum Einsatz kommen jeweils sehr spezifsche Anforderungen erfüllen muss und durch das Einsetzen und Auswerten von Trainingsdaten auch zeitaufwändig ist. Recherche von „Hot Topics“ und Trendscoutng Das erste Beispiel, für welche Zwecke Texte, die in Communitys und Netzwerken entste- hen und ausgewertet werden ist die Analyse von „Hot Topics“: Die Inhalte der Weblogs sind für viele interessant und werden beispielsweise nicht nur im Rahmen non-reaktver sozialwissenschaflicher Untersuchungen analysiert, sondern sind auch im Rahmen von Innovatonsentwicklungen oder Trendscoutng für Unternehmen von Interesse. Hohe Aufmerksamkeit, auch von Seiten der Wissenschaf, hat beispielsweise die Analyse der Zahl von Weblogpostngs während der Präsidentschafskandidatur in den USA im Jahr 2008. Mehrere Websites bieten kostenlose Recherchemöglichkeiten und -auswertungen von Weblogs, die auf Häufgkeitsanalysen von Begrifen beruhen (vgl. Markus & Schafert 2010): Während Technorat.com nur ein einfaches Tools für Zeitreihen und Vergleiche bietet, bietet Blogpulse.com eine komfortablere Analyse von Weblogeinträgen, Zeitrei- hen und Vergleichen an. Bei der Darstellung der Zeitreihe wird die Zahl der Suchtrefer an den einzelnen Tagen eines bestmmten Zeitraums in einem Diagramm dargestellt. Abbildung 24: Screenshot Blogpulse Live vom 9.10.2009 Quelle: htp://www.blogpulse.com (10/2009) Auch für die bekannte Microblogging-Anwendung „Twiter“ gibt es eine Reihe von Tools, die Auswertungen ermöglichen: Sofern Twiter-Meldungen als „öfentlich“ freigeschal- ten sind, und das ist die Regel, stehen sie dazu zur Verfügung. Twitscoop zeigt so, über welche Themen in den letzten drei Tagen getwitert wurde und zeigt diese Ergebnisse in Form einer Zeitreihe. Solche Analysen funktonieren allerdings beispielsweise nur bei Begrifen, die eindeutg sind. So kann es sein, dass beispielsweise Produktnamen in anderen Sprachen Begrife oder Personennamen sind, so dass spezifsche Einschränkungen der Recherche vorge- nommen werden müssen. Auch weitere Fehler können sich bei der Erhebung, Analyse und Interpretaton einschleichen; ein fundiertes Wissen ist hier notwendig (s. Markus & Schafert, 2010). 51
    • Sentment-Analyse – Gefühlsäußerungen auf der Spur Eine Besonderheit stellen die beiden kostenlos zugänglichen Web-Tools Moodviews.com und Wefeelfne.org dar, da sie sich darauf spezialisiert haben, „Gefühlsäußerungen“ (engl. „sentment analysis“) in Weblogs zu untersuchen. Jonathan Harris und sein Team hat mit Wefeelfne,org ein Tool entwickelt, das Weblogs auswertet, die „I feel“ oder „I am feeling“ enthalten. Mit Hilfe von Wefeelfne kann man z. B. recherchieren, wie sich weibliche Blogger zwischen 30 und 40 in Orten mit schlech- tem Weter gerade fühlen bzw. wie deren Gefühlsäußerungen interpretert werden. Abbildung 25: Screenshot: Gefühlsäußerungen von Männern zwischen 30 und 39 Jahren Quelle: htp://www.wefeelfne.org (10/2009) Bei einem ähnlichen Angebot, der Website Moodviews.com können Aussagen wie „Ich fühle mich …“ auch im Bezug auf Begrife recherchiert werden, also auch im Bezug auf Markennamen. Man kann dann beispielsweise feststellen, wie häufg der Ausdruck „cool“ oder „good“ in den analysierten Weblogs im Zusammenhang mit einem Produkt genannt wird. Aus der Kombinaton der Analyse von Gefühlsäußerungen mit der Idee, zukünfiges Ver- halten vorherzusagen entstand u. a. die Idee, zu untersuchen inwieweit Gefühlsäuße- rungen zu Kinoflmen mit dem späteren Erfolg der Filme im Zusammenhang stehen (Mishne & Glance, 2006). Ein weiteres Anwendungsgebiet ist die kontextsensitve Wer- beeinblendung (vgl. Altsearchengines.com, 2009). In den letzten beiden Jahren haben sich mehrere Forscher mit der Frage beschäfigt, wie solchermaßen ausgewertete Gefühle auch passend in Formen und Farben dargestellt werden können (vgl. Synesketch, 2009). 52
    • Zusammenfassung Zusammengefasst gibt es im wesentlichen folgende drei Nutzungsaspekte von Texten: Zum einen sind sie hilfreich, um Dokumente wie Fotos oder Videos zu erschließen (und recherchierbar zu machen), um Empfehlungen zu geben oder Services (auch Werbung) zu personalisieren, und schließlich um Inhalte zu analysieren, beispielsweise im Rahmen von Webmonitoring wie Trendanalysen. Abbildung 26: Nutzung von Texten Texte sind nicht die alleinigen „Primärquellen“, die im Web von Communitys und Nut- zern zur Verfügung gestellt werden, auch Videos, Audiodateien und Fotos könnten hier im einzelnen vorgestellt werden. Ein paar kurze Hinweise fnden sich dazu im letzten Ab- schnit. 53
    • 54
    • Sandra Schafert, Sebastan Schafert, Rupert Westenthaler und Julia Eder 7 METADATENFORMATE UND ONTOLOGIEN 7.1 Konzept und Beispiele Metadaten eines Buches sind beispielsweise die Autorennamen, die ISBN, der Verlag, der Erscheinungsort. Metadaten sind im Gegensatz zu Webseiten meist strukturierte Daten und daher vom Computer weiterverwendbar. Im Internet bzw. der Informatk werden solche „Daten über Daten“ als Metadaten bezeichnet, die jedoch ganz unter- schiedliches beinhalten. Um einen geregelten Austausch von Daten in einem Anwend- nungsbereich zu verbessern oder zu erleichtern, hat man sich in vielen Bereichen, auf genau beschriebene Metadatenformate geeinigt. Treiber dieser Bestrebungen sind vor allem Archive, welche verbunden mit der Digitalisierung ihrer Bestände auch den Aus- tausch ihrer Daten über Publikatonen ermöglichen und vereinfachen wollten (z. B. mit Dublin Core). In der Nachrichtenindustrie macht vor allem der Zeitdruck einen reibungs- losen Austausch von Nachrichten den Einsatz von Metadatenformaten wie NewsML und EXIF erforderlich. Beim Web 2.0 und den sozialen Netzwerken steht die Vernetzung der Community im Vordergrund (z. B. FOAF, SIOC). Eine Technologie welche es erlaubt derartge reichhaltge Beziehungen auch für Comp- ter berechenbar zu defnieren sind Ontologien. Ontologien sind dabei weitaus komple- xere Systeme der Datenbeschreibung, die von Experten entwickelt wurden und Wissens- bestände beschreiben. Mit ihnen lassen sich hierarchische Gliederungssysteme von Wis- sen (Taxonomien, z. B. Artenbeschreibungen in der Biologie), aber auch komplexe Anga- ben über die Relatonen von Wissen in einer Form , dass auch Computer diese verarbei- ten können. Aus diesem Grund werden vermehrt Metadatenformate mit Hilfe von Onto- logien beschrieben. Zum Beispiel sind z. B. EXIF und Dublin Core (s.o.) auch als Ontologi- en beschrieben. Ein weiterer Vorteil liegt darin, dass verschiedene durch Ontologien beschriebene Meta- datenformate miteinander verknüpf werden können. Beispielsweise kann das Metada- tenfeld eines Fotos, dass den Fotografen nennt (exif:artst) mit dem Metadatenfeld „Creator“ im Dublin-Core-Standard verknüpf werden (dc:creator). Dadurch stehen die Angaben zu Fotos „automatsch“ auch im Bibliotheksformat zur Verfügung. Metadaten- formate und Ontologien sind also eine Möglichkeit, Wissen im Web austauschbar und maschinenlesbar zu machen. Bei der Entwicklung und auch der Benutzung ist in aller Re- gel Expertenwissen notwendig. Ohne allzu sehr in die Tiefen dieses Themas einzusteigen ist für unsere Studie wichtg, dass in Communitys Metadaten in zweierlei Weise eine Rolle spielen können: So entste- hen zum einen Datensammlungen von Daten in Metadatenstandards, wenn beispiels- weise Nutzer von dem Fotoverzeichnis FlickR ihre Fotos hochladen: Ohne ihr explizites Dazutun laden sie neben den reinen Bilddateien auch EXIF-Angaben zum Bild hoch, die automatsch von der Kamera erfasst wurden. Die solchermaßen „beiläufg“ erstellten Datensammlungen können genutzt werden. Zum anderen gibt es in den letzten Jahren zunehmende Bemühungen Metadatenformate sowie Ontologien kollaboratv in Com- munitys zu entwickeln. Dies ist insbesondere für Unternehmen interessant, die gemein- same Wissensmodelle entwickeln und dazu unternehmensspezifsche Prozesse und In- halte beschreiben wollen. 55
    • Um also den Austausch von Daten zwischen verschiedenen Datenquellen zu fördern ist es sinnvoll sich auf Metadatenformate zu einigen. Diese werden verwendet um entwe- der direkt in HTML-Seiten zusätzliche Informatonen einzubinden (Microformate bzw. RDFa) oder aber diese Informatonen direkt über RESTful-Services zugreifar zu machen. Im Folgenden sind einige gebräuchliche Metadatenformate mit einer kurzen Beschrei- bung aufgelistet. Personen und Organisatonen: | hCard: ein Microformat-Version des vCard-Standards, das erlaubt die Defniton von Informatonen, wie sie typischerweise auf Visitenkarten zu fnden sind | vCard: dieser Standard ist eigentlich in einem rein textbasierten Format defniert; es gibt jedoch auch entsprechende Versionen als XML und Ontologie | XFN (xhtml friend network): ein Microformat, welches es erlaubt, Verbindungen zwi- schen Personen auszudrücken Events/Termine: | hCalendar: Microformat für die Defniton von Event-Informatonen, wie man sie ty- pischerweise in Terminkalendern fndet. | vCalendar/iCal: ähnlich wie vCard ist auch vCalendar ein reiner textbasierter Stan- dard, für den es wiederum Versionen als XML und auch als Ontologie gibt Orte/Geo-Informatonen: | geo: einfaches lat/long/alt-basiertes Geokoordinatenschemata, gibt es sowohl als Mi- croformat als auch als Ontologie | geoNames: defniert weiterreichende Schemata zur Beschreibung von Objekten und Regionen; vor allem verwendet es Feature-Codes welche den Typ des beschriebenen Objektes defnieren Produkte: | hProduct: ist ein Microformat zur Beschreibung von Produkten | Good Relatons: ist eine Ontologie, welche die Beschreibung von Produkten und Dienstleistungen ermöglicht | hReview: ein Microformat, um Bewertungen von Produkten, Musik, Filmen, Restau- rants u. a. zu beschreiben Soziale Medien: | SIOC (Semantcally-Interlinked Online Communites): beschreibt eine Ontologie wel- che es erlaubt Daten von verschiedenen Online-Communitys miteinander zu ver- knüpfen; so erlaubt es dieser Standard z. B. verschiedenen Accounts von ein und der- selben Person zu beschreiben; auch der Aufau von Foren, Rollen von Usern usw. kann mit SIOC beschrieben werden | FOAF (Friend of a Friend): beschreibt Benutzer in sozialen Netzwerken und Beziehun- gen zwischen ihnen; diese Ontologie ist die am weitesten verbreitete im Internet und wird von vielen Webseiten unterstützt | HGTAGS und MOAT (Meaning of a Tag): erlaubt die Beschreibung von Taggings mit Hilfe von RDF Relatonen und ermöglicht damit den einfachen Austausch von Tagin- 56
    • formatonen zwischen verschiedenen Webseiten; MOAT erlaubt es zusätzlich, die Se- mantk eines Tags mit Hilfe von RDF zu beschreiben. SCOT (Social Semantc Cloud of Tags): ermöglicht die Darstellung von ganzen Tagclouds mit Hilfe von RDF und erlaubt damit den Austausch von solchen Informatonen mit an- deren Systemen Weitere: | Dublin Core: defniert ein Set von Atributen, welches bibliographische Informato- nen zu Dokumenten, Bücher, Medien, Texten u. ä. Beschreibt; diese Standards stehen sowohl als XML auch als RDF zu Verfügung | SKOS (Simple Knowledge Organizaton System): ist ein Metamodel für die Defniton von kontrollierten Vokabularen. SKOS erlaubt die Defniton von Konzepten; dazu de- fniert es eine Reihe von Metadaten (z. B. Bezeichnungen, Beschreibungen) als auch semantsche Beziehungen zwischen Konzepten. | Descripton of a Project (DOAP): eine Ontologie welche es erlaubt (Sofware-) Projek- te zu beschreiben; im Fokus liegen die Beschreibung des Projektes und deren Res- sourcen (wie Releases, Repository, Dokumentaton, Downloads, Homepage); die De- fniton von Aufgaben, Zeitplänen u.ä. liegt nicht im Fokus. | Creatve Commons: erlaubt die Defniton von Copyright und Lizenzen 7.2 Nutzen und Nutzung Wohl der wichtgste Aspekt der Nutzung von Metadaten wird darin gesehen, dass man bei der Verwendung von solchen Standards und entsprechende Suchfunktonen schnell und präzise auf entsprechende Informatonen zugreifen kann. Exemplarisch zeigen wir dies am Beispiel von Fotos. Recherche von Metadaten zu Fotos Die Metadaten zu Fotos, wie sie beispielsweise in EXIF-Metadatenformat beschrieben sind und häufg von Digitalkameras zur Verfügung gestellt werden beinhalten u. a. Be- lichtungsdauer, Brennweite, Aufnahmedatum. Diese Angaben können für den individu- ellen Nutzer von Bedeutung sein, aber auch bei der Recherche nach anderen Bildern Unterstützung bieten (z. B. Nachtaufnahme, Portraits). Obwohl diese Metadaten von sehr vielen digitalen Kameras und auch Handys mit Fotofunkton automatsch mit dem eigentlichen Foto abgespeichert werden, und somit auch häufg beim Hochladen der Bil- der in Webverzeichnisse mit hochgeladen werden und zur Verfügung stehen würden, werden diese Informatonen derzeit noch nicht häufg genutzt. Man kann sie z. B. Nut- zen, um nach Bildern in bestmmten Pixel-Maßen oder die mit sehr kurzen Verschluss- zeiten aufgenommen wurden zu suchen. Viele Fotoverwaltungssysteme bieten dies bereits an, die Online-Fotodatenbank FlickR bietet aber noch keine Recherche in solchen Metadaten der Fotos an. Sofern die Foto- daten auch Geo-Referenzen, also Angaben über die Orte enthalten, können die Fotos auch in Google-Earth hochgeladen werden und damit auf den Landkarten von Google mit bestmmten Orten verknüpf und dort angezeigt werden. Ein Beispiel für eine solche Anwendung stellen wir im Folgenden vor. 57
    • Kombinaton von Geodaten und Fotos bei TagIT TagIT ist eine Anwendung die mit dem Ziel entwickelt wurde, interessante Orte, Routen, sowie aggregierte Inhalte von Blogs, sozialen Netzwerken und anderen sozialen Medien zu integrieren und gemeinsam auf einer Karte anzuzeigen. Die Idee dahinter ist, dass Menschen meist an den Dingen interessiert sind die „um sie herum" passieren und in- teressant sind. TagIT ermöglicht es daher einerseits, durch den umfangreichen Nachrich- tenbestand der Salzburger Nachrichten zu „browsen“ und von anderen sozialen Medien gesammelte Inhalte dazu anzuzeigen. Andererseits gibt es Benutzern die Möglichkeit, in- teressante Orte (z. B. Cafés, Parks, Sportstäten) und Routen (z. B. Wanderrouten, Ski- touren) mit Beschreibungen und optonal Fotos und Videos zu versehen. Andere Benut- zer können dann diese Inhalte entdecken und kommenteren oder mit weiteren Fotos zu ergänzen. TagIT basiert auf der KiWi-Platorm die im Rahmen des EU-Projekts KiWi - Knowledge in a Wiki10 entwickelt wird. Sowohl Nachrichten als auch Orte und Routen werden einheit- lich mit Hilfe des Metadatenstandards RDF (Resource Descripton Framework) beschrie- ben. Dies ermöglicht eine sehr fexible Nutzung der Inhalte. So kann beispielsweise jeder Inhalt der eine Geopositon hat auf der Karte dargestellt werden, unabhängig davon ob es sich um einen Nachrichteninhalt oder eine Person handelt. Ebenso können alle Inhal- te mit Hilfe von semantschem Tagging auf Basis von SKOS (Simple Knowledge Organiza- ton System) miteinander in Beziehung gesetzt werden. Die Metadaten werden in der KiWi-Platorm für das Reasoning und die Personalisierung genutzt. So kann beispiels- weise fexibel anhand des Inhalts und der Benutzer-präferenzen entschieden werden, wie ein Inhalt dargestellt werden soll. TagIT ist also ein Beispiel, bei dem die Nutzer keine ausgesprochenes Wissen über Meta- datenformate haben müssen, aber durch das Hochladen von Fotos und entsprechenden Beschreibungen, den wesentlichen Beitrag des Mehrwerts des Projektes leisten. Gemeinsame Online-Literaturverwaltung: Bibsonomy Für Bibliotheken ist die Verwendung von Metadatenformaten nichts neues, schon lange hat man sich hier auf eindeutge Beschreibungen von Büchern (ISBN) geeinigt, das Inter- net und die zunehmende Verknüpfung und Austausch unterschiedlicher Datenbanken macht hier eine Vereinheitlichung notwendig. Eine besondere Anwendung, die nicht nur von Bibliothekaren oder ähnlichen Experten, sondern von „normalen“ Nutzern getrieben und mit Metadaten gefüllt wird ist das Sys- tem Bibsonomy.org. Dabei handelt es sich um ein System, bei dem URL und Publikato- nen eingetragen und mit anderen Nutzern geteilt werden und somit der Austausch von Publikatonlisten bzw. Bibliographien möglich wird. Dabei wird der BibTex-Standard ein- gesetzt. Bibsonomy erlaubt dabei Daten-Importe wie auch -Exporte, die Einträge von an- deren Nutzern kann in eigene Sammlungen übertragen werden. Diese Verwaltung von Publikatonen ist dabei insbesondere für Wissenschafler eine atraktve Möglichkeit. Durch den Austausch und Teilen der Ressourcen sowie dem Verwenden von Social Tag- ging entstehen weitere Mehrwerte (vgl. Jaschke et al., 2007). 10 htp://www.kiwi-project.eu, Stand 23.9.2009 58
    • Abbildung 27:Trefer für die Suche nach „Metainformatonen“ bei Bibsonomy Quelle: Screenshot, htp://www.bibsonomy.org/search/metainformatonen (10/2009) Darstellung von Metadaten bei Yahoo Search Monkey Suchlisten in Suchmaschinen zeigen in der Regel den Titel der Webseite, einen Aus- schnit aus dem Text bzw. dem Beschreibungstext der Webseite und den Link zur Web- seite. Yahoo möchte seinen Service wesentlich verbessern, in dem die Suchmaschine zu- künfig die Inhalte der Webseiten präsentert. Im Video zur Vorstellung der Initatve wird dabei zur Illustraton das Beispiel genannt, dass man ein bestmmtes Restaurant sucht und nun eine Liste mit Links erhält, auf denen der Name des Restaurants vor- kommt. Zukünfig sollten aber beispielsweise Bewertungen (sofern vorhanden) gleich in der Ergebnisliste mit angezeigt werden. Im folgenden Screenshot wird das exemplarisch an einem Trefer zu einem Film gezeigt. Um dies zu ermöglichen, werden Metadatenfor- mate, u. a. hcard, hcalender, hreview, sowie das Resource Descripton Framework (RDF) genutzt. 59
    • Abbildung 28: Neue Darstellung von Suchergebnissen bei Yahoo Quelle: htp://developer.yahoo.com/searchmonkey/ (10/2009) Spielerische Ontologieentwicklung Wie einleitend dargestellt, spielen Communitys nicht nur bei der beiläufgen Sammlung von Daten im Metadatenformat eine wichtge Rolle, auch bei der kollaboratven Ent- wicklung von Metadatenformaten oder auch Ontologien kommen sie in manchen Ansät- zen zum Zuge, bzw. wird damit experimentert, ob diese Schemata auch in kollaborat- ven Onlinesetngs entwickelt werden können. Ontologien zu entwickeln ist sehr herausfordernd, komplex, benötgt Expertse und ist auch ein mühsamer Prozess. Im Rahmen eines Forschungsprojektes wird auch versucht, Ontologien für Bilder und Videos zu entwickeln (genannt OntoPronto und OntoTube, via www.ontogame.org, s. Siorpaes & Hepp, 2007): Katharina Siorpaes beantwortet dazu Fragen, wie aus ihrer Sicht sogar spielerische Verfahren eingesetzt werden können. Sie greif dabei auch auf ihre Erfahrung im Rahmen des Projekte Insemtves11 zurück, einem Forschungsprojekt, dass versucht, die Erstellung von semantschem Content zu fördern. 11 htp://insemtves.eu/, Stand 1.9.2009 60
    • Ontologien spielerisch entwickeln – im Gespräch mit Katharina Siorpaes ? Metadaten zu erfassen ist manchmal sehr mühsam. Sie untersuchen und nutzen spielerische Ansätze zur Entwicklung von Ontologien. Wie und wo funktoniert das? Die Idee ist, Aufgaben in der Wissensakquise hinter Spielen gut zu ver- stecken. Die Spiele dienen als Motvaton für Menschen, Zeit für Aufgaben zu verwenden, für die menschlicher Input dringend nötg ist. In den Spielen (siehe www.ontogame.org) müssen zwei Partner Aufgaben gemeinsam lösen jedoch ohne kommunizieren zu können. Dabei ist die beste Strategie um Punkte zu bekommen, die Wahrheit zu sagen. Die dadurch generierten Daten können wir mit Methoden im Hintergrund weiter- verarbeiten und Ontologien bauen oder Inhalte semantsch annoteren. ? Sind alle Nutzer gleichermaßen für solche Spiele zugänglich? Grundsätzlich sollten die Spiele so gebaut sein, dass sie jeder spielen kann und der abstrakte Gehalt der Aufgaben sehr gut versteckt ist. Das Zielpublikum sind Spieler von sogenannten Casual Games. ? Wem können Sie solche spielerischen Ansätze empfehlen? Spiele zur Wissensakquise sind gut geeignet für Bereiche, in denen allgemeines Wissen (wie zum Bei- spiel das Thema oder der Schauplatz von YouTube-Videos) benötgt wird, da dies bei den meisten Spie- lern vorausgesetzt werden kann. Weiters macht es Sinn, dass große Datenmengen beschrieben werden: andernfalls ist der Aufwand des Spieldesigns zu hoch. Beispiele sind das semantsche Beschreiben von YouTube Videos wie in dem Spiel OntoTube (www.ontogame.org) oder das Bauen einer großen „Gene- ral-Interest“-Ontologie. ? Wo sehen Sie besonderen Entwicklungs- oder Forschungsbedarf? Den Forschungs- und Entwicklungsbedarf sehe ich vor allem im Bereich der Incentves: Warum sollten Nutzer Zeit mit Wissensakquise bzw. dem Training von automatschen Systemen verwenden? Weiters ist es auch interessant, welche Aufgaben wirklich menschlichen Input benötgen und welche großteils auto- matsiert werden können. Dr. Katharina Siorpaes ist wissenschafliche Mitarbeiterin am Semantc Technology Insttute (STI), einer Forschungseinrichtung der Universität Innsbruck. In ihrer Forschungstätgkeit beschäfigt sie sich unter anderem mit der Möglichkeit mit Spielen und spielerischen Ansätzen Ontologien zu entwickeln und ver- schiedene Inhalte semantsch zu annoteren. Zusammenfassung Zusammenfassend sind zwei ganz unterschiedliche Formen der Community-Beteiligung und Nutzung von Metadatenformaten und Ontologien von Interesse: Zum einen stellen Community-Mitglieder und Nutzer von Services Metadaten in Metadatenformaten zur Verfügung, zum anderen können sie auch ganz gezielt bei der Entwicklung von Metada- tenstandards, Ontologien oder Taxonomien beitragen. 61
    • Abbildung 29: Nutzung von Metadatenformaten und Ontologien Die Nutzung der Metdadaten, die durch Communitys zusammengetragen werden kön- nen, beispielsweise durch das Hochladen von Fotos mit EXIF-Dateien, umfasst dabei po- tental all diejenigen Aspekte, Vorteile und Einsatzgebiete, die in der Diskussion um das „Sematc Web“ anzutrefen sind. 62
    • Thomas Kurz, Sandra Schafert und Rupert Westenthaler 8 LINKED DATA 8.1 Konzept und Hintergrund Das Web – und vor allem das Web 2.0 sowie das Social Web – bestehen immer weniger aus in sich abgeschlossenen Dokumenten, sondern aus Content-Elementen deren Nütz- lichkeit sich auch durch ihre Vernetzung mit anderem Content defniert. Einen Ansatz, Daten in unterschiedlichen Quellen im Sinne des „Semantc Web“ sinnvoll miteinander verknüpfar und recherchierbar zu machen stellt die Initatve „Linked Open Data“ dar. Damit ist es ein Schrit in Richtung der unerwarteten Neu- und Wiederverwendung von Informaton, von der Tim Berners-Lee spricht, die das Web ermöglichen kann: „It is the unexpected re-use of informaton which is the value added by the web.“ (Berners-Lee 2006). Kernidee ist es dabei, externe Informatonen mit dem (eigenen) Web-Content zu verknüpfen und zu integrieren und damit wieder zu verwenden (s.a. „Giant Global Graph“, Berners-Lee, 2007). Jeder von uns benutzt täglich eine große Menge von Daten. Zum Beispiel werden Freundschafskontakte über das Internet gepfegt, Fotos ins Netz gestellt oder Kalender- daten online verwaltet. Es ist jedoch nicht möglich, diese unterschiedlichen Informato- nen automatsiert sinnvoll zu verknüpfen, um zum Beispiel Fotos in Beziehung mit den dargestellten Personen und persönlichen Terminen zu bringen. Das liegt zum einen dar- an, dass die verschiedenen Applikatonen, die die oben genannten Möglichkeiten bie- ten, ihre Daten meist exklusiv halten und sie nicht nach außen hin zur Verfügung stellen. Es entstehen sog. „Datensilos“. Zum anderen folgt die Struktur der Daten of keinem ein- heitlichen Schema. Somit kann deren Inhalt oder Bedeutung nicht maschinell interpre- tert bzw. folgerichtg untereinander verknüpf werden. Eine umfassende und seman- tsch korrekte Suche von Informatonen wird dadurch nahezu unmöglich (vgl. Hitzler & Krötsch, 2008). Grundvoraussetzungen für ein semantsches Web bzw. einer Vernetzung von Daten ist es daher, „einheitliche, ofene Standards für die Beschreibung von Infor- matonen zu vereinbaren, die es […] ermöglichen sollen, Informatonen über verschiede- ne Anwendungen und Platormen auszutauschen und zueinander in Beziehung zu set- zen“ (Hitzler & Krötsch, 2008, Abschnit 1.3). Linked Data Von speziellem Interesse ist in diesem Zusammenhang die Linked-Data-Initatve, eine Initatve, welche das Ziel hat, Ressourcen im Web miteinander zu verbinden. Verein- facht dargestellt ist Linked Data die Verknüpfung von strukturierten Daten, so wie das Web die Verknüpfung von unstrukturierten Inhalten (Text, Bilder) ist. Durch die Kombi- naton von Daten aus verschiedenen Quellen im Web lassen sich bisher noch unvorstell- bare neue Anwendungen entwickeln. Die Linked-Data-Wolke beinhaltet eine Vielzahl von Datenquellen wie z. B. alle Artkel von Wikipedia, alle Geo-Punkte von geonames.org, alle Musikgruppen, Musiker, Alben und Songs von Musicbrainz, alle länderspezifschen Informatonen des World-Fact-Book. Zusätzlich sind diese Daten aber noch miteinander verlinkt. So verlinken Musiker in Mu- sicbrainz auf den Artkel in Wikipedia, wobei die Orte und Regionen in geonames.org mit den Wikipedia-Artkeln verknüpf sind. Auf diese Art und Weise bietet Linked Data 63
    • eine sehr gute Abdeckung von beinahe allen Themengebieten in einer Qualität, die man selber nie erreichen könnte. Durch die so strukturierten und verlinkten Daten kann letztlich mehr Nutzen gezogen werden, indem wie beim traditonellen Web über Links von Informaton zu Informaton gesprungen wird. So liefert eine Suchmaschine im Semantc Web zum Beispiel bei der Suche nach einer befreundeten Person die sich derzeit in Paris aufält, zusätzliche Infor- matonen über die dortgen Sehenswürdigkeiten wie Eifelturm und Louvre. Durch die Verlinkung ist es dann auch möglich, Daten wie Öfnungszeiten, Eintritspreise, An- fahrtspläne etc. abzurufen. Zudem ermöglicht die Struktur im Stle einer Datenbank den Suchmaschinen komplexe Anfragen zu verarbeiten, welches ein schnelleres Aufnden gesuchter Daten ermöglicht (Bizer, Cyganiak & Heath, 2006). Linked Data defniert sich jedoch nicht nur anhand der darin enthaltenen Informatonen, sondern beschreibt auch einige Technologien und die Methodologie wie man mit Hilfe dieser Technologien die oben beschriebene Funktonalität bereitstellen kann. Ähnlich zu Hypertexten wird die Struktur des „Web of Data“ durch textuelle Dokumente ermög- licht, die im Netz zugänglich sind. Ein großer Unterschied ist jedoch die Verlinkung bei Hypertexten durch die Auszeichnungssprache HTML, beim „Web of Data“ jedoch mitels Resource Descripton Framework (RDF). Das Linking-Open-Data-Projekt Das Linking-Open-Data-Projekt (LOD-Projekt) wurde im Februar 2007 von Chris Bizer und Richard Cyganiak ins Leben gerufen. Unterstützung erhielten sie dabei von der „Se- mantc Web Educaton and Outreach (SWEO) Interset Group“ der W3C. Die Idee der Gruppe entstand vor allem aus dem Wunsch heraus, die Methoden des Semantschen Webs an realen Daten zu testen (Berners-Lee, 2008, Folie 14). Am LOD-Projekt beteiligt sich eine stetg wachsende Zahl von Universitäten und Firmen. Darunter sind z. B. die Freie Universität Berlin, das MIT, OpenLink Sofware, Talis und viele weitere. Eine voll- ständige Liste aller Teilnehmer fndet sich im ESW-Wiki. Wie schnell die Community wächst, zeigen eindrucksvoll die Grafken der LOD-Cloud, in der die einzelnen „Datensi- los“ und deren Verbindungen schemenhaf dargestellt sind. Im Mai 2007 bestand die Vernetzung aus über 500 Millionen RDF-Tripeln und in etwa 120.000 RDF-Links zwischen den einzelnen Datensätzen – dies waren bereits beeindruckende Zahlen. Diese „Wolke“ von vernetzten Daten vergrößerte sich allerdings rasant und so konnten im April 2008 bereits mehr als 2 Milliarden RDF-Triple und eine Verlinkung der Daten durch ca. 3 Mil- lionen RDF-Links gemessen werden. Die Abbildung zeigt die Ausdehnung der LOD-Cloud im März 2009 (Bizer, 2009): Hinzugekommen sind dabei u. a. viele medizinische Initat- ven. 64
    • Abbildung 30: LOD-Cloud im März 2009 Quelle: Bizer (2009) Im Allgemeinen verfolgt das LOD-Projekt das Ziel immer mehr „open licence datasets“ in RDF zu überführen und untereinander zu verlinken um so den Wandel des Webs vom globalen File-System zur globalen Datenbank herbeizuführen. Darüberhinaus sind fol- gende Ziele wichtg (Berners-Lee, 2008, Folien 34-38): | Zum einen ist es natürlich wichtg eine möglichst weit reichende Vernetzung zwi- schen den einzelnen Data-Sets zu erreichen. Allerdings steigern nur sinnvolle Links den Wert der Vernetzung. Deshalb beschäfigen sich derzeit viele damit, bessere Lö- sungen zu fnden. | Benutzer wollen eine integrierte Sicht auf alle Daten, die zu einem Objekt zur Verfü- gung stehen. Ein Problem unter anderen ist dabei, eine korrekte Fusion der Daten zu erreichen bzw. durch Fusion korrekte Daten zu liefern. | Einer sinnvollen und „korrekten“ Nutzung von Daten muss eine Lizenzregelung zu Grunde liegen. So muss eine Möglichkeit gegeben sein, die Daten mit Metadaten zu verknüpfen, die eine Lizenzierung beschreiben. | Um die Daten der Open-Data-Cloud von der RDF-Darstellung in benutzerfreundlicher Form anzubieten und darzustellen sind semantsche Browser und Suchmaschinen unumgänglich. Nur damit wird sich eine Akzeptanz seitens der User einstellen. 8.2 Nutzen und Nutzung (in der Zukunf) Derzeit gibt es noch nicht viele Nutzungen von Linked Data bzw. Open Linked Data, aber ein großes Interesse und Forschungsaktvitäten. Im folgenden dazu die Einschätzungen 65
    • von zwei Experten, die sich stark mit der Forschungsperspektve und auch der Anwen- dersicht beschäfigen. Auf dem Weg zum Semantc Web - Im Gespräch mit Sebastan Schafert ? Die Vision eines verknüpfen und clever recherchier- und nutzbarem Semantc Web klingt spannend. Wie realistsch ist aus Ihrer Sicht die Umsetzung der Linked-Data-Idee? Wo sehen Sie Herausforderungen und Probleme? Linked Data ist die Umsetzung des Semantc Web, so wie es die ursprüngliche Vision beschrieben hat. Während in den letzten Jahren der Schwerpunkt der Forschung im Wesentlichen auf dem Semantc Web (also Logik und Theorie) lag, beschäfigt sich die Forschung im Rahmen von Linked Data endlich wieder mit dem Semantc-Web-Aspekt (also Ver- knüpfung von Daten im Web). Insofern sind wir dem Semantc Web damit so nahe wie nie und eine Um- setzung ist greifar. Herausforderungen gibt es dabei naturgemäß noch viele. Auf eher sozialer Ebene stellt sich die große Frage, welchen Daten man überhaupt vertrauen kann – denn Daten werden im Un- terschied zu Inhalten automatsch weiterverarbeitet und können deshalb nicht durch ausreichende Me- dienkompetenz gefltert werden. Auf technologischer Ebene sind große Fragen in den Bereichen verteile Suche, Reasoning und Nutzung der Daten noch zu klären. ? Welche Nutzungsmöglichkeiten und Anwendungen sind aus des Salzburg NewMediaLab besonders in- teressant? Für uns schaft Linked Data eine tolle und fexible Möglichkeit, Inhalte und Daten aus verschiedenen Sys- temen unserer Partner miteinander zu integrieren, beispielsweise die textuellen Daten aus einem Con- tent-Management-System mit den Multmediadaten aus einem Media-Asset-Management-System. Wenn alle Daten mit Hilfe von Linked Data in einem einheitlichen Format verfügbar gemacht werden, dann wird Systemintegraton erheblich vereinfacht. Daneben sind für uns natürlich die Forschungsfrage- stellungen interessant. ? Wo sehen Sie besonders hohen Forschungs- und Entwicklungsbedarf? Forschungsbedarf besteht vor allem in oben genannten technologischen Fragestellungen, insbesondere in den Bereichen verteilte Suche über Systemgrenzen hinweg, verteiltes Reasoning, und Weiterverarbei- tung von Daten. Möchte ich beispielsweise nach sämtlichen Inhalten im Semantc Web suchen, die eine Ortsinformaton haben um diese auf einer Karte darzustellen, müsste ich entweder alle diese Inhalte zentral indexieren oder eine verteilte Suche über verschiedene Systeme hinweg (z.B. Peer-to-Peer) durchführen. Probleme ergeben sich vor allem dann wenn diese Suche auch noch komplexes Reasoning erfordert, z. B. „wenn eine auf Webseite V beschriebene Veranstaltung einen Ort A hat und der Ort A auf Webseite W die Koordinaten x und y hat, dann hat die Veranstaltung ebenfalls die Koordinaten x und y“. Entwicklungsbedarf besteht im Entwurf und in der Implementerung von Systemen ,die ihre Da- ten mit Hilfe von Linked Data anbieten können und eventuell als Wrapper vor einem bereits bestehen- den System eingesetzt werden. Ein solches System entsteht bei uns gerade im Rahmen des EU-Projekts KiWi - Knowledge in a Wiki. Dr. Sebastan Schafert ist wissenschaflicher Leiter des Salzburg NewMediaLab und arbeitet als Senior Researcher bei der Salzburg Research Forschungsgesellschaf. Der promovierte Informatker forscht, pu- bliziert und entwickelt dabei, u. a. im Rahmen des von ihm geleiteten EU-Projektes KiWi (Knowledge in a Wiki), zu innovatven Social-Media-Anwendungen. 66
    • Linked Open Data aus Sicht von Unternehmen und Anwender - im Gespräch mit Andreas Blumauer ? Wie realistsch ist aus Ihrer Sicht die Umsetzung der Linked-Data-Idee? Wo sehen Sie Herausforderungen und Probleme? In einer Welt, in der das Web nicht mehr wegzudenken ist, kann sich auch eine Linked Data Infrastruktur entwickeln. Es dauerte nicht einmal lange von der Spezifkaton von RDF bis hin zur „Explosion“ der Linked-Data-Cloud. Das Henne- Ei-Problem ist damit erst mal überwunden, und die ersten brauchbaren Anwendungen wie sig.ma sind bereits sichtbar. Getrieben von Open-Data-Initatven verschiedener Regierungen und auch dem zuneh- menden Trend größerer Suchmaschinenhersteller, RDF-Daten zu indizieren und im Suchergebnis zu ver- wenden, tragen dazu bei, dass die breite Adapterung von Semantc-Web-Technologien bereits stat fn- det. Zahlreiche kleinere und auch ganz große Content-Provider, Medienhäuser, Verlagshäuser, Nachrich- tenagenturen etc. spielen längst mit dem Gedanken, das Thema aufzugreifen. Doch weniger die techni- schen Fragen stehen dabei im Zentrum, vielmehr die Frage, wie sehr „man sich“ nun öfnen müsse, wel- che Daten man aus der Hand geben müsse, oder welche Geschäfsmodelle dadurch möglich werden. Wie jede Innovaton, muss auch diese erst einmal von den Betrofenen verstanden und in das Bestehen- de integriert werden, bevor sie breit ausgerollt werden kann. ? Welche Nutzungsmöglichkeiten und Anwendungen sind aus der Sicht der Anwender von großem In- teresse? Im Endefekt geht es immer um drei Anwendungstypen: Mashups und Datenintegraton, Unterstützung kollaboratver Arbeit und intelligente Suche. Dies lässt sich auf viele Geschäfsprozesse und Fachdomä- nen übertragen. Einige Branchen sind dabei federführend, wie der Finanzsektor, Life Sciences, Medien und auch der IT- und Engineering-Sektor. Getrieben durch komplexe Arbeitsabläufe und verteilte Daten- bestände verlieren Mitarbeiter in diesen Bereichen schnell den Überblick, hier kommen schließlich Se- mantc-Web-Anwendungen ins Spiel. Interessant wird es vor allem dann, wenn interne Informatonen mit Webquellen verknüpf werden sollen, spätestens dann macht es sich bezahlt, Metadaten auf Basis eines interoperablen Frameworks aufzubauen. ? Wo sehen Sie, aus Sicht der Anwender und Unternehmen, besonders hohen Forschungs- und Entwick- lungsbedarf? Knackpunkt bei der kommerziellen Anwendung sind Lizenzierungsmodelle und Verfahren zur semi-auto- matschen Qualitätssicherung. Auch sind noch einige technische Grundprobleme, vor allem im Umfeld des Reasonings über größere Datenbestände im Web ungeklärt. Doch zeigt sich, dass Linked Data auch ganz gut mit einigen einfachen Inferenz-Mechanismen das Auslangen fndet und dabei bereits mit sehr großen Datenmengen eine brauchbare Performance und Stabilität erzielt werden kann. ? Wo sehen Sie uns im Jahr 2020 im Bezug auf Linked Open Data? Ich denke, das Web bietet 2020 neue, ungeahnte Möglichkeiten auf Basis einer ausgereifen Linked Data Infrastruktur. Jene Unternehmen, die dann diese Daten für ihr Business Intelligence, Market Intelligence oder ihr Wissensmanagement nutzen werden, haben einen großen Wetbewerbsvorteil gegenüber je- nen, die das semantsche Web übersehen. Andreas Blumauer ist Geschäfsführer der punkt. netServices, Wien. und Mitgründer der Semantc Web Company, sowie u. a. Herausgeber von Fachbüchern zu Semantc Web und Social Semantc Sofware (Foto: Weinwurm). 67
    • Zusammenfassung Fasst man die (zukünfigen) Möglichkeiten der Linked-Data-Ideen zusammen, ergibt sich daraus ein ähnliches Bild wie im Abschnit „Metadatenformate und Ontologien“: Abbildung 31: (Zukünfige) Nutzung von Linked Data Linked Data hat über die Möglichkeiten von Metadatenformaten hinaus wesentliche Fortschrite in der Verknüpfung von unterschiedlichen Daten sowie ofenen Datenbe- ständen im Auge und geht damit noch einen guten Schrit weiter bei der Verfolgung der Idee des „Semantc Web“. 68
    • Sandra Schafert 9 ERGÄNZUNG UND ZUSAMMENFASSUNG In dieser Studie wurde beschrieben, wie (Meta-) Informatonen entstehen, damit ver- bunden auch vorgestellt, wie sie genutzt werden. Hier möchten wir kurz auf weitere (Meta-) Informatonen und Nutzungsmöglichkeiten eingehen. Zudem fassen wir zusam- men, welche allgemeinen Fragestellungen bei der Nutzung von (Meta-) Informatonen zielführend erscheinen. Weitere (Meta-) Informatonen Die Darstellung der in dieser Broschüre vorgestellten (Meta-) Informatonen und ihre Nutzung ist nicht abgeschlossen, viele Nutzungsmöglichkeiten werden gerade erst ent- wickelt oder entstehen völlig neu.Beispielsweise haben neben den vorgestellten Text- quellen auch Audiodateien, Fotos und Videos vielfältge Nutzungsmöglichkeiten: | So haben Biologen der Universität Harvard Aufnahmen von Vögeln auf der Video- Platorm YouTube ausgewertet, um deren Rhythmusgefühl zu analysieren und konn- ten so Datenmaterial auswerten, das auf traditonellem Wege kaum zugänglich ge- macht werden könnte (Welt.de, 2009). | Audiodateien fnden beispielsweise auch überraschende Verwendung in Sprachkur- sen, in denen damit Übungen zum Hörverständnis gestaltet werden. Eine klassische Übung ist das Hörverstehen von Durchsagen, beispielsweise im Bahnhof, die überra- schend einfach in den Online-Datenbanken zu fnden und in den Kursen einzusetzen sind (DaF-Blog, 2009). | Auch Annotatonen, also Tags, werden nicht alleine in Textorm gegeben. So gibt es Ansätze, Audio-Annotatonen von Museumsbesuchern unter Einsatz von mobilen Ap- plikatonen in Museen anderen Besuchern zugänglich zu machen (Puig et al., 2009). Weitere Nutzungsmöglichkeiten Es gibt einige Anwendungen, bei denen unterschiedliche (Meta-) Informatonen kombi- niert ausgewertet werden, die hier nur zum Teil angesprochen wurden. Bezogen auf die unterschiedlichen Nutzer lassen sich diese folgendermaßen darstellen. 69
    • Abbildung 32: Nutzung von kombinierten (Meta-) Informatonen unterschiedlicher Nutzer Zu den Nutzungen von kombinierten, also unterschiedlichen (Meta-) Informatonen im Einzelnen: | Personalisierte Informatons- und Empfehlungssysteme: Passende, also auf den Nut- zer zugeschnitene Informatonen zu bieten ist ein Anliegen in vielen Systemen, bei- spielweise der Online-Händler: Ebay verschickt so Neuigkeiten der Lieblingshändler, Amazon empfehlt Produkte, die andere Käufer eines Produktes gekauf haben. Die- ser Bedarf, verschiedene Quellen und Ressourcen zu nutzen und auf persönliche In- teressen und Bedürfnisse zusammenzubringen steht auch hinter dem Konzept der „Persönlichen Lernumgebung“ (s. Schafert & Kalz, 2009) und Möglichkeiten, durch Mash-Ups und Recommender-Strategien Lern-Empfehlungen im Web 2.0 zu geben (Drachsler, 2009). | Reputatonssysteme: Neben eher kompettven Angeboten wie beispielsweise die Bestenliste von Herstellern oder Dienstleistern gibt es auch eher kooperatve Reputa- tonsysteme, bei denen eher „Labels“, also Nutzerbeschreibungen, als Bewertungen eingesetzt werden. Auch hier gibt es eine Reihe recht unterschiedlicher Daten, die bei der Darstellung und Bewertung von Reputaton einfießen können. | Adaptve bzw. personalisierte Werbung im Web: (Meta-) Informatonen ermöglichen zum einen die Platzierung von Werbung passend zum Kontext, beispielsweise zum Nachrichtenartkel über eine Modenschau die Werbung eines Modelabels. Die Daten die Nutzer über sich selbst preisgeben oder durch ihr Verhalten bekannt sind können ebenfalls genutzt werden, beispielsweise die Werbeeinblendungen in der Suchma- schine Google.com darunter, Yahoo.de hat durch die Schaltung von Werbung im Be- zug auf Region und Interesse der Nutzer die Werbeeinnahmen erhöhen können (Spiegel Online, 2009). Es ist anzunehmen, dass gerade in diesem Bereich viele Un- tersuchungen und Tests laufen, die von Unternehmen getrieben sind und die daher nicht öfentlich gemacht werden. | Evaluaton und Erfolgsmessung: Wenn der Erfolg von Maßnahmen im Web 2.0, bei- spielsweise die Gesundheit einer Online-Community oder die Atraktvität eines neu- en Online-Angebots bewertet werden soll, stehen potentell recht unterschiedliche und viele Informatonen zur Verfügung (u. a. Schafert & Wieden-Bischof, 2009, 63f), unter anderem Klickverhalten, Bewertungen, Auswertung von Kommentaren. Für 70
    • Werbetreibende ist so nicht mehr die Zahl der Webseitenaufrufe von Bedeutung, neue Kennzahlen beinhalten u. a. die Zahl der eindeutg aktven User (Unique User), registrierte und aktve User (s. Rönisch, 2008). | Webmonitoring: Um Aussagen zu Trends und Entwicklungen zu erhalten, die Verbrei- tung von Begrifen bzw. Verwendung von Markennamen vergleichend zu analysieren und um Rückschlüsse über die Bewertung von Produkten und Dienstleistungen aus Kundensicht zu erlangen sind die Möglichkeiten des Webmonitoring für Unterneh- men von besonderem Interesse (Markus & Schafert, 2010). Gerade Letzteres ist im Hinblick auf unzufriedene Kunden, die man nur schwer durch traditonelle Verfahren erreicht, von Interesse (vgl. Infospeed, 2008), immer mehr Unternehmen beobach- ten das Internet aktv (Fank, 2008). Auch wissenschafliche Untersuchungen und Pro- gnoseinstrumente arbeiten mit Webmonitoring, beispielsweise zum Monitoring von politschen Meinungsbildungsprozessen (siehe z. B. Wahlradar.de) sowie der Entwick- lung von Pandemien (z. B. mit Hilfe von Twiter-Analysen: Chew & Eysenbach, 2009), mit Hilfe von Facebook-Analysen: Luo, Paton & Witaker, 2009). Es zeigt sich: Wirklich alle Arten von Informatonen, die derzeit durch Communitys und soziale Netzwerke und die Möglichkeiten des Web 2.0 entstehen, und deren Nutzungs- möglichkeiten erschöpfend zu beschreiben erscheint nicht nur im Rahmen der be- schränkten Möglichkeiten dieser Broschüre derzeit unmöglich. In den beiden noch aus- stehenden Veröfentlichungen im Rahmen der ComStudy werden wir uns jedoch aus- führlicher mit Empfehlungs- und Reputatonssystemen beschäfigen. Überblick zur Nutzung von (Meta-) Informatonen Allgemein werden Informatonen und Metainformatonen immer dann gerne genutzt, wenn keine anderen Daten vorliegen, beispielsweise keine Befragungsergebnisse vorlie- gen oder wenn gezielt viele Informatonen eingeholt und kombiniert werden, um die „Weisheit der Massen“, also Efekte der „kollektven Intelligenz“, der „Schwarmintelli- genz“ bzw. der „Schwarmkreatvität“ zu nutzen, d. h. auszunutzen, das große Gruppen zu intelligenten, kreatven und angemessenen Lösungen kommen können. In folgender Tabelle wird der aktuelle Einsatz der Daten bzw. das Wissen über (Meta-) Informatonen für die vier Nutzertypen im Überblick beschrieben. Dunkel eingefärbt wurden hier Nutzungsformen, die vergleichsweise bedeutsam sind, d. h. aktuell viel Ak- tvität „rund herum“ zu sehen ist, auch wenn es insgesamt nur von wenigen Anwendun- gen oder Nutzern tatsächlich genutzt wird, wie es beispielsweise beim Tagging der Fall ist. 71
    • (Meta-) Informatonen über ... … werden genutzt von … Einzelne Communitys Betreiber von Drite Nutzer bzw. Nutzer Communitys einer Anwen- & -anwen- dung dungen Nutzerverhalten (Klicks, Suchen) ¢ ¢ ¢ ¢ Kommunikatons- & Vernetzungsstruktur ¢ ¢ ¢ ¢ Bewertungen ¢ ¢ ¢ ¢ Social Tagging ¢ ¢ ¢ ¢ Texte ¢ ¢ ¢ ¢ Metadatenformate ¢ ¢ ¢ ¢ Tabelle 5:Nutzung von (Meta-) Informatonen im Überblick Anmerkung: dunkel markiert sind Einsatzformen, die vergleichsweise bedeutsam sind Entstehung und Nutzung von (Meta-) Informatonen unterstützen Das Durchblätern und Lesen dieser Broschüre kann dazu verleiten sich zu fragen, inwie- weit man selbst die Vielzahl von (Meta-) Informatonen nutzen kann, insbesondere dann, wenn man selbst Initator und Betreiber einer Online-Community ist. Folgende Leitragen können dabei hilfreich sein: | Welches Ziel wird verfolgt? Welcher Prozess soll unterstützt werden? | Welche Informatonen sind hilfreich bzw. können dazu hilfreich sein? | Welche Daten liegen bereits vor bzw. können ausgewertet werden? | Welche Verfahren können dabei helfen? | Welche weiteren Daten und Informatonen werden benötgt bzw. wären hilfreich? | Welche vergleichbaren Projekte gibt es? Was kann man daraus lernen? Prinzipiell können dabei Ziele der Community selbst verfolgt werden, beispielsweise die Qualität der Kommunikaton und Gesundheit einer Community zu überwachen. Häufg weichen aber die Ziele der Betreiber von Community-Platormen, Websites und Sozia- len Netzwerken davon ab, insbesondere dann, wenn sie von kommerziellen Interessen getrieben sind. Mit Blick auf die teils recht kreatve und innovatve Nutzung der (Meta-) Informatonen, insbesondere im Webmonitoring, erscheint es bei der Erörterung solcher Themen im hohen Maße wichtg, kreatven Lösungen die Möglichkeit der Entaltung zu geben: Die Möglichkeiten für die unterschiedlichen Nutzer und Nutzungen der Daten ist noch kei- neswegs ausgereizt. Eine interdisziplinäre Zusammensetzung von solchen Innovatons- entwicklungsprozessen sowie entsprechende Kreatvitätstechniken sollten Bestandteil der Entwicklungen von Ideen und Lösungen sein. Gesellschafliche Perspektve In dieser Studie sind wir eher pragmatsch mit der Fragestellung umgegangen und ha- ben unterschiedliche Nutzungsszenarien von (Meta-) Informatonen vorgestellt, ohne 72
    • diese in Hinsicht auf mögliche soziale, politsche oder auch rechtliche Herausforderun- gen und Konsequenzen hinzuweisen. Hier sind in den letzten Jahren eine große Zahl an Möglichkeiten entstanden, Informa- tonen über einzelne Personen zu erheben und darüber zu verfügen, wie es vor einige Jahren noch undenkbar war. Dabei werden diese Daten nicht von staatlichen Einrichtun- gen, sondern im großen Umfang von Unternehmen erhoben, beispielsweise bei den So- zialen Netzwerken wie Facebook oder LinkedIn. Die Nutzer geben dabei freiwillig Selbst- auskunf an Unternehmen, und durch ihre Aktvitäten und Vernetzung kommen eine Vielzahl an Informatonen hinzu, die in aller Regel auch dauerhaf im Internet zu fnden sind. Hier besteht gesellschaflicher Handlungsbedarf um diesen neuen Bedingungen angemessen Rechnung zu tragen, beispielsweise verändern sie das soziale Zusammen- sein, wenn viele persönliche Dinge oder familiäre Geschichten, die früher „vergessen“ worden wären dauerhaf präsent sind (s. Mayer-Schönberger, 2009). Natürlich sind auch entsprechende politsche und juristsche Reaktonen notwendig, wie mit den neuen Da- tenmonopolen umgegangen werden soll. So stellt sich auch die Frage inwieweit öfent- lich zugängliche Daten auch in wissenschaflichen Veröfentlichungen personenbezogen ausgewertet werden dürfen, problematsch erscheint hier z. B. die Auswertung der PWM-Platorm (s. Mayr, 2009) bei der keine Anonymisierung vorgenommen wurde. Schließlich bedarf es auch Aktvitäten, wie im Bildungswesen adäquat auf diese Entwick- lungen eingegangen wird: Es ist heute kinderleicht ein Bild mit dem Handy aufzuneh- men und online zu stellen, die möglichen Konsequenzen für Jugendliche häufg nicht zu überschauen. Auch bei Erwachsenen erscheint hier Auflärung über die Funktonswei- sen von Microblogging-Angeboten wie Twiter oder Kurznachrichten in Sozialen Netzen, wie dort zu fndende negatve Aussagen über die Arbeit und den Chef und damit ver- bundene Kündigungen beispielhaf zeigen. Ein Forum, das versucht Chancen, Möglichkeiten und Herausforderungen des zukünfi- gen Webs aus Sicht von Unternehmen und Anwendern zu diskuteren und dazu Meinun- gen zusammenzutragen, ist das österreichische Projekt Zukunfsweb.at. 73
    • 74
    • LITERATUR UND QUELLEN | von Ahn, L. & Dabbish, L. (2004). Labeling Images with a Computer Game. In ACM Conference on Human Factors in Computng Systems (CHI), 2004, pp 319-326. | von Ahn, L; Ginosar, S., Kedia, M., Liu, R. & Blum, M. (2006): Improving Accessibility of the Web with a Computer Game. Proceedings of the SIGCHI conference on Human Factors in computng systems table of contents, Montréal, Québec, Canada, SESSION: Games table of contents, 79-82. | Altsearchengines.com (2009). ePulze uses sentment analysis to build beter advertsing. (2009-10-04) | Askitas, Nikos & Zimmermann, Klaus F. (2009). Prognosen aus dem Internet: Weitere Erho- lung am Arbeitsmarkt erwartet. In: Wochenbericht des DIW, 25/2009, 402-408. | Barbosa, Daniela (2008). The Taxonomoy Cookbook. Finding the Right Recipe for Organizing Enterprise Metadata. htp://solutons.dowjones.com/cookbook/ebook_sla2008/cookbooke- book.pdf (2009-08-14) | Basic Thinking Blog (2009). Wann die Deutschen am geilsten sind. Weblogeintrag vom 23.3.2009. htp://www.basicthinking.de/blog/2009/03/23/wann-die-deutschen-am-geilsten- sind/ (2009-10-13) | Baumöl, Ulrike & Ickler, Henrik (2008). Soziale Netzwerkanalyse. In: Karl Kurbel, Jörg Becker, Norbert Gronau, Elmar Sinz & Leena Suhl (Hrsg.), Enzyklopädie der Wirtschafsinformatk. On- line-Lexikon. htp://www.enzyklopaedie-der-wirtschafsinformatk.de/wi-enzyklopaedie/lexi- kon/daten-wissen/Wissensmanagement/Soziales-Netzwerk/Soziale-Netzwerkanalyse (2009- 10-03) | Berners-Lee, Tim (2006). Linked Data - personal view. htp://www.w3.org/DesignIssues/Lin- kedData.html (2009-07-24) | Berners-Lee, Tim (2007). Giant Global Graph. Weblogeintrag vom 21.11.2007, htp://dig.c- sail.mit.edu/breadcrumbs/node/215 (2009-11-21) | Berners-Lee, Tim (2008). Slides for Open Data (State of the Art). URL: htp://www.w3.org/ 2008/ Talks/0617-lod-tbl/#(1) (2009-07-24) | Bernstein, Michael; Tan, Desney; Smith, Greg; Czerwinski; Mary & Horvitz, Eric (2009). Colla- bio: A Game for Annotatng People within Social Netzworks. In: UIST '09, October 4-7, Canaca. htp://research.microsof.com/en-us/um/people/horvitz/collabio.pdf (2009-10-03) | Bizer, Christan (2009). LOD-Dataset. htp://www4.wiwiss.fu-berlin.de/bizer/pub/lod-data- sets_2009-03-05.html (2009-10-15) | Bizer, Chris, Cyganiak, Richard & Heath, Tom (2006). How to Publish Linked Data on the Web. URL: htp://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/ (2009-07-24) | Brauckmann, Patrick (2010), Web-Monitoring. Gewinnung und Analyse von Daten über das Kommunikatonsverhalten im Internet, Konstanz: UVK-Verlag. | Chew, Cynthia Mei & Eysenbach, Gunther (2009). Pandemics in the Age of Twiter: Content Analysis of “Tweets” During the H1N1 Outbreak. Präsentaton auf der Konferenz Medicine 2.0, 17-18.9.2009, Toronto, USA. | Chi, E.H.; Pirolli, P. & Lam, S.K. (2007). Aspects of Augmented Social Recogniton: Social In- formaton Foraging and Social Search. In: D. Schuler (Ed.), Online Communites and Social Computng. Berlin: Springer, 60-69. | Chun, S., Cherry, R., Hiwiller, D., Trant, J. & Wyman, B. (2006). Steve.museum: An Ongoing Ex- periment in Social Tagging, Folksonomy, and Museums. In: Proceedings of the Museum and the Web 2.0 conference, March 22-25, 2006, Albuquerque, New Mexico. Online zugänglich unter: htp://www.archimuse.com/mw2006/papers/wyman/wyman.html (2009-02-19) 75
    • | DaF-Blog (2009). Durchsagen. Weblogeintrag vom 21.9.2009. htp://cornelia.siteware.ch/ blog/ wordpress/2009/09/21/durchsagen (2009-10-04) | Derntl, Thomas; Hampel, Thorsten; Motschnig, Renate & Pitner, Tomas (2009). Social Tagging und Inclusive Universal Access. In: Birgit Gaiser, Thorsten Hampel & Stephanie Panke (Hrsg.), Good Tags – Bad Tags. Social Tagging in der Wissensorganisaton, Münster: Waxmann, S. 51- 71. | Diakopoulos, N. & Chiu, P. (2007). PhotoPlay: A Collocated Collaboratve Photo Tagging Game on a Horizontal Display. In: Proceedings addendum of User Interface Sofware Technology (UIST). Newport, Rhode Island, October 2007. | Drachsler, Hendrik (2009). Navigaton Support for Learners in Informal Learning Networks. Maastricht: Open Universiteit Nederland. | ESW-Wiki (2009). FOAF+SSL. htp://esw.w3.org/topic/foaf+ssl (2009-10-01) | Fank, Mathias (2008). WebKnow Studie 2008. Status Quo von Webmonitoring in Unterneh- men. Online zugänglich unter: htp://www.infospeed.de/data/WebKnow-Studie-2008.pdf (2008-12-23) | FAS.research (2009). Homepage. htp://www.fas.at/ (2009-10-14) | Fitkau & Maaß Consultng (2008). Produktbewertungen beeinfussen Kaufentscheidungen. htp://www.w3b.org/e-commerce/produktbewertungen-beeinfussen-kaufentscheidun- gen.html (2009-1014). | ESW Wiki. URL: htp://esw.w3.org/topic/FrontPage (2009-07-24) | Gaiser, Birgit, Hampel, Thorsten & Panke, Stephanie (2008). Vorwort. In: dies. (Hrsg.), Good Tags Good Tags – Bad Tags. Social Tagging in der Wissensorganisaton, Münster: Waxmann. | Gelin, Rene (2009). Aufgepasst! So wird es gemacht. SEO-Special: Expertentpps aus der Praxis In websellling, 5, 38-41. | Ginsberg, Jeremy; Mohebbi, Mathew H.; Patel, Rajan S.; Brammer, Lynnete, Smolinski, Mark S. & Brilliant, Larry (2009). Detectng infuenza epidemics using search engine query dataIn: Nature 457, 1012-1014. | Google, Insights for Search Help, htp://www.google.com/support/insights//bin/answer.py? answer=87285 (2009-06-02) | Gloor, Peter, Krauss, Jonas S., Nann, Stefan, Fischbach, Kai and Schoder, Detlef, Web Science 2.0: Identfying Trends Through Semantc Social Network Analysis (November 11, 2008). htp://ssrn.com/abstract=1299869 (2009-10-14) | Graf, Joachim (2009). Start des iBusiness 'Search Advertsing Index': Hoher Werbedruck im SEM-Markt. In: iBusiness Executve Summary, 19, 8, 15. | Groß, Olaf (2008). Community-Strategien für den Online-Shops: Kaufen als Gesellschafser- lebnis. In: iBusiness Executve Summary, Jg. 18, Ausgabe 16/17, 8-9. | Groß, Olaf (2009). Saisonale Search-Trends im SEM und Afliate-Marketng: Das Wissen um die richtge Stunde. In: iBusiness Executve Summary, 19, 6, 6-7. | Gruber, Thomas (2008). Ein Bewertungssystem für kollaboratv erstellte Inhalte. Eine prototy- pische Implementerung eines generischen Frameworks. Vorstellung der Diplomarbeit bei Salzburg Research, 22.1.2008. | Güntner, Georg; Sint, Rolf & Westenthaler, Rupert (2009). Ein Ansatz zur Unterstützung tradi- toneller Klassifkaton durch Social Tagging. In: Birgit Gaiser, Thorsten Hampel & Stephanie Panke (Hrsg.), Good Tags – Bad Tags. Social Tagging in der Wissensorganisaton, Münster: Wa- xmann, S. 187-199. 76
    • | Herr, Joachim (2005). Der Kampf um die Spitzenplätze. Branchen (71): Sportartkel. Online zu- gänglich unter: htp://www.faz.net/s/ RubD16E1F55D21144C4AE3F9DDF52B6E1D9/ Doc~EC4A E7272834A4D1DBDCDD2D4586FE41E~ATpl~Ecommon~Scontent.html [2009-06- 02] | Herr, Joachim (2006). Die höhere Mehrwertsteuer trübt die Freude. Branchen (71): Sportart- kel. Online zugänglich unter: htp://www.faz.net/s/ Rub39D62EB10953443E- B82D694D50AE0845/ Doc~EDEBF09CAD89B4B38B0017A43F18F7AEA~ATpl~Ecommon~con- tent.html [2009-06-02] | Hitzler, Pascal & Krötsch, M. (2008). Semantc Web Technologies. Berlin: Springer. | Infospeed (2008). Homepage. Online zugänglich unter: htp://www.infospeed.de/ [2008-12- 22] | Jaschke, Robert; Grahl, Miranda; Hotho, Andreas; Krause, Beate; Schmitz, Christoph & Stum- me, Gerd (2007). Organizing Publicatons and Bookmarks in BibSonomy. In: Proceedings of the WWW 2007, May 8-12, 2007, Banf, Canada. | Kirchhof, Lars; Stanoevska-Slabeva; Katarina; Nicolai, Thomas & Fleck, Mathes (2008). Using social network analysis to enhance retrieval systems. In: Applicatons of Social Network Analy- sis (ASNA) (Zurich), 12.9.2008 htp://www.alexandria.unisg.ch/EXPORT/DL/46828.pdf (2009- 10-12) | Kitl, Christan & Zeidler, Christan (2007). User Generated Content und Metadatenmanage- ment. In: HMD, Praxis der Wirtschafsinformatk, Hef 258, 57-67. | Klamma, Ralf; Cuong, Pham Manh & Cao, Yiwei (2009). You Never Walk Alone: Recommen- ding Academic Events Based on Social Network Analysis. Complex (1) 2009: 657-670. | Klamma, Ralf; Spaniol, M. & Renzel, D. (2007). Community-Aware Semantc Multmedia Tag- ging – From Folksonomies to Commsonomies, in: K. Tochtermann, H. Maurer, F. Kappe, A. Scharl (Eds.): Proceedings of I-Media'07, Internatonal Conference on New Media Technology and Semantc Systems, Graz, Austria, September 5 - 7, 2007, J.UCS (Journal of Universal Com- puter Science) Proceedings, pp. 163-171. | Knoth, Petr; Schmidt, Marek & Smrž, Pavel (2008). Informaton Extracton — State-of-the-Art. Knowledge in a Wiki (KiWi), Deliverable 2.5. htp://wiki.kiwi-project.eu/multmedia/kiwi-pub: KiWi_D2.5_fnal.pdf (2009-09-02) | Leisenberg, Manfred (2008). Soziale Netze und Web 2.0 - Chance für die Marktorschung. In: Computerwoche, 9.6.2008 htp://www.computerwoche.de/netzwerke/web/1866180/ (2009- 10-03) | Luo, Chen; Paton, Chris & Witaker, Robyn (2009). Facebook: An Innovatve Infuenza Pande- mic Early Warning System. Präsentaton auf der Konferenz Medicine 2.0, 17-18.9.2009, Toron- to, USA. | Marketng Pilgrim (2008). Using Web Metrics to Analyze the ‘Palin Efect’ & 2008 Presidental Campaign. Monday, October 13th, htp://www.marketngpilgrim.com/2008/10/sarah-palin- internet-popularity.html (2009-10-13) | Markus, Mark & Schafert, Sandra (2010). Web-Monitoring mit freien Quellen und Werkzeu- gen für Unternehmen. Beispiel: Skiherstellerbranche. In: Patrick Brauckmann (Ed.), Web-Mo- nitoring. Gewinnung und Analyse von Daten über das Kommunikatonsverhalten im Internet, Konstanz: UVK-Verlag, 190-204. | Marlow, Cameron; Naaman, Mor; Boyd, Danah, & Davis, Marc (2006). HT06, Tagging Paper, Taxonomy, Flickr, Academic Title, ToRead. In: Proceedings of Hypertext 2006, New York: ACM Press. | Mayer-Schönberger, Viktor (2009). Delete: The Virtue of Forgetng in the Digital Age. Prince- ton: Princeton University Press. 77
    • | Mayr, Manuela (2006). Soziale Netzwerkanalyse der PWM. In: Platorm Wissensmanagement (Hrsg.) Wissen wirkt! Aber wie?! PWM-Jahrbuch 2006/2007, Wien, 35-44. | Mikeonads.com (2008). Using your browser URL history to estmate gender. Weblogeintrag vom 13.7.2009 htp://www.mikeonads.com/2008/07/13/using-your-browser-url-history-est- mate-gender/ (2009-08-12) | Mishne, Gilad (2006). AutoTag: a collaboratve approach to automated tag assignment for we- blog posts. WWW 2006: 953-954. | Mishne, G. & Glance, N. (2006). Predictng Movie Sales from Blogger Sentment Export: In AAAI 2006 Spring Symposium on Computatonal Approaches to Analysing Weblogs. | Moens, M.-F. (2006). Informaton Extracton: Algorithms and Prospects in a Retrieval Context (The Informaton Retrieval Series). New York: Springer. | Morrison, P.J. (2007). Tagging and Searching: Search retrieval efectveness of folksonomies on the Web. Unpublished master’s thesis, Kent State University. | Odden, L. (2009). 6 Social Search Engines to Start 2009. Weblogeintrag vom 4.1.2009, URL: htp://www.toprankblog.com/2009/01/6-social-search-engines/ (2009-07-24) | Puig, V., L’Hour, Y.-M.; Haussonne, Y.-M. & Jauniau, C. (2009). Collaboratve Annotaton System Using Vocal Comments Recorded on Mobile Phones and Audio Guides: The Centre Pompidou Exhibiton Traces Du Sacré. Museums and the Web. | Randler, Stephan (2009). Die Zukunfsperspektven von Social Shopping: Wo das größte Marktpotental lauert. In: iBusiness Executve Summary, 19, 8, 12-13. | Riekert, Wolf-Fritz (1996). Bericht der Arbeitsgruppe Metadaten. In: R. Gütler, & W. Geiger (Hrsg.), Integraton von Umweltdaten, 3. Workshop Schloß Dagstuhl 1995. Marburg: Monopo- lis. | Rönisch, Susan (2008). Online-Werbemessung: Web 2.0 braucht Kennzahlen 2.0. In: iBusiness ExecutveSummary, Jg. 18, 20, 6-7. | Schafert, Sandra & Kalz, Marco (2009). Persönliche Lernumgebungen: Grundlagen, Möglich- keiten und Herausforderungen eines neuen Konzepts. In K. Wilbers & A. Hohenstein (Hrsg.), Handbuch E-Learning. Expertenwissen aus Wissenschaf und Praxis - Strategien, Instrumente, Fallstudien. (Gruppe 5, Nr. 5.16, pp. 1-24). Köln: Deutscher Wirtschafsdienst (Wolters Kluwer Deutschland), 27. Erg.-Lfg. Januar 2009. | Schafert, Sandra & Wieden-Bischof, Diana (2009). Erfolgreicher Aufau von Online-Commu- nitys. Konzepte, Szenarien und Handlungsempfehlungen. Erschienen in der Reihe “Social Me- dia”, hrsg. von Georg Güntner und Sebastan Schafert, Band 1. Salzburg: Salzburg Research. | Siorpaes, K. and M. Hepp, OntoGame (2007). Towards Overcoming the Incentve Botleneck in Ontology Building, in Proceedings of the 3rd Internatonal IFIP Workshop On Semantc Web & Web Semantcs (SWWS '07) co-located with OTM Federated Conferences. Springer LNCS: Vila- moura, Portugal, November 29-30. | Spiegel Online (2007). SPIEGEL ONLINE startet Zeitgeschichte-Projekt. Online zugänglich un- ter: htp://www.spiegelgruppe.de/spiegelgruppe/home.nsf/PMWeb/DDE0FC2234B59CBD- C125731B002710F5 (2009-12-15) | Spiegel Online (2009). Yahoo beschert US-Zeitungen mehr Erlöse. htp://www.spiegel.de/ netzwelt/ web/0,1518,626250,00.html (2009-10-14) | Stegbauer, Christan (2009). Wikipedia. Das Rätsel der Kooperaton. Wiesbaden: VS Verlag. | Synesketch (2009). Gallery and Demo. htp://www.synesketch.krcadinac.com/ wiki/index.- php?ttle=Demonstraton#Synemania (2009-10-09) 78
    • | Trant, J. (2008). Access to art museums online: a role for social tagging and folksonomy? Key- note address. Dublin Core Metadata Initatve Annual Meetng, Berlin, Germany, September 23, 2008. | Vuorikari, Riina (2009). Are tags from Mars and descriptors from Venus? A study on the ecolo- gy of educatonal resource metadata. In: Proceedings of the ICWL 2009, Aachen, Aug 19. | Weinberger, David (2007). Everything is miscellaneous: the power of the new digital disorder. New York: Times Books. | Wichowski, Alexis (2009). Survival of the ftest tag: Folksonomies, fnability, and the evolut- on of informaton organizaton. In: frst monday, Volume 14, Number 5-4, May 2009. htp://frstmonday.org/ htbin/cgiwrap/bin/ojs/index.php/fm/artcle/view/2447/2175 (2009- 09-21) | Welt.de (2009). So stampfen Vögel mit den Füßen zur Musik htp://www.welt.de/wissen- schaf/artcle3656551/So-stampfen-Voegel-mit-den-Fuessen-zur-Musik.html (2009-10-14) | Wieden-Bischof, Diana & Schafert, Sandra (2008). Nachrichten 2.0. Eine Analyse internato- naler Nachrichtenangebote im Internet. Norderstedt: Books on Demand. | Zhang, J., Dong T., Ackerman M.S., Qu Y. (2008). Expertse-Tagging Game: Identfying Expertse Networks in Organizatons, CSCW Workshop on What to expect from Enterprise 3.0: Adaptng Web 2.0 to Corporate Reality, 2008, San Diego. 79
    • AUTORINNEN UND AUTOREN Dr. Sandra Schafert arbeitet seit 2006 als wissenschafliche Mitarbeiterin und Projekt- managerin bei der Salzburg Research Forschungsgesellschaf (SRFG) zu Webbasierten (Bildungs-) Innovatonen. Sie leitet die ComStudy, in deren Rahmen diese Veröfentli- chung entstand. Julia Eder ist Mitarbeiterin der SRFG im Bereich Communicatons und dort u.a. für das Projekt TagIT verantwortlich. Mag. Wolf Hilzensauer ist wissenschaflicher Mitarbeiter der SRFG im Bereich Informat- on Society Research, spezialisiert auf Webbasierte (Bildungs-) Innovatonen. Dipl. Inf. Thomas Kurz ist wissenschaflicher Mitarbeiter der SRFG im Bereich Wissens- und Medienmanagement. Dr. Mark Markus ist wissenschaflicher Mitarbeiter der SRFG im Bereich Informaton So- ciety Research und Spezialist für Innovatonsmanagement. Dr. Sebastan Schafert ist wissenschaflicher Leiter des Salzburg NewMediaLab und ar- beitet seit 2005 als wissenschaflicher Mitarbeiter in der SRFG, wo er u. a. das EU-Pro- jekt „Knowledge in a Wiki“ (KiWi) leitet. DI (FH) Rupert Westenthaler ist wissenschaflicher Mitarbeiter bei der SRFG im Bereich Wissens- und Medienmanagement. Mag. Diana Wieden-Bischof ist wissenschafliche Mitarbeiterin bei der SRFG im Bereich Informaton Society Research. 80
    • Das Web 2.0 und seine Fülle an einfachen und neuen Beteiligungsformen hat die Zahl der aktiven Nutzerinnen und Nutzer und die Zahl der Beiträge enorm ansteigen lassen. Gerade da, wo sich Menschen stark austauschen und interagieren werden besonders viele Informationen zusammengetragen. Neben den unmittelbaren Beiträgen bei der Content-Entwicklung – beispielsweise dem Hochladen von Videos, Fotos auf entspre- chende Plattformen oder Textbeiträgen in Weblogs – entstehen auch Metainformatio- nen wie Informationen über das Suchverhalten oder durch Social Tagging. In dieser Broschüre wird dargestellt, wie solche (Meta-) Informationen entstehen und wie sie genutzt werden. Dazu werden Beispiele aus unterschiedlichen Branchen und aus Sicht unterschiedlicher Akteure vorgestellt: aus Sicht einzelner Nutzer, von Communitys, der Betreiber von Web-Angeboten sowie aus Sicht Dritter, z. B. externer Unternehmen oder der Wissenschaft. Ein gewisses technisches Grundverständnis voraussetzend, wendet sich diese Studie vor allem an Praktiker, die sich durch die unterschiedlichen und auch überraschenden Nutzungsmöglichkeiten anregen lassen wollen, ihre eigenen Produkte und Dienstleistungen weiter zu entwickeln. Diese Broschüre ist ein Ergebnis der „ComStudy“, die am Salzburg New Media Lab (SNML) im Zeitraum von Oktober 2008 bis Dezember 2009 durchgeführt wird. Das SNML, das Kompetenzzentrum für Neue Medien in Österreich, arbeitet daran, digitale Inhalte clever zu strukturieren, verknüpfen, personalisieren, für alle auffindbar zu machen und nachhaltig zu nutzen und betrachtet dabei die Community als einen wesentlichen Faktor vieler Projekte. ISBN 978-3-902448-15-6