• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Empfehlungen im Web. Konzepte und Realisierungen
 

Empfehlungen im Web. Konzepte und Realisierungen

on

  • 5,069 views

Schaffert, Sandra; Bürger, Tobias; Hilzensauer, Wolf; Schneider, Cornelia & Wieden-Bischof, Diana (2010). Empfehlungen im Web. Konzepte und Realisierungen. Band 3 der Reihe „Social Media“ (hrsg. ...

Schaffert, Sandra; Bürger, Tobias; Hilzensauer, Wolf; Schneider, Cornelia & Wieden-Bischof, Diana (2010). Empfehlungen im Web. Konzepte und Realisierungen. Band 3 der Reihe „Social Media“ (hrsg. von Georg Güntner und Sebastian Schaffert), Salzburg: Salzburg Research. (ISBN 978-3-902448-16-3) - frei zugängliche Version (CC Lizenz!) - auch im Buchhandel erhältlich!

Statistics

Views

Total Views
5,069
Views on SlideShare
5,069
Embed Views
0

Actions

Likes
4
Downloads
177
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

CC Attribution-NoDerivs LicenseCC Attribution-NoDerivs License

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Empfehlungen im Web. Konzepte und Realisierungen Empfehlungen im Web. Konzepte und Realisierungen Document Transcript

    • Schriftenreihe: Social media band 3   © sxc.hu    B "    Empfehlungen im Web Konzepte und Realisierungen Sandra Schaffert, Tobias Bürger, Wolf Hilzensauer, Cornelia Schneider und Diana Wieden-Bischof
    • Sandra Schafert Empfehlungen im Web Konzepte und Realisierungen mit Beiträgen von Tobias Bürger, Wolf Hilzensauer, Cornelia Schneider und Diana Wieden-Bischof
    • Salzburg NewMediaLab (SNML), das Kompetenzzentrum für Neue Medien, gab die vorliegende Broschüre im Rahmen des Projekts „ComStudy“ (Leitung: Dr. Sandra Schafert) in Aufrag. Unter der Leitung von DI Georg Güntner arbeitet das SNML dar- an, digitale Inhalte clever zu strukturieren, verknüpfen, personalisieren, für alle auf- fndbar zu machen und nachhaltg zu nutzen. Das SNML ist ein industrielles Kompe- tenzzentrum im Rahmen der Aktonslinie Kind des Bundesministeriums für Wirtschaf und Arbeit (BMWA) und wird gefördert aus Miteln des BMWA und des Landes Salz- burg. Homepage: newmedialab.at © Salzburg NewMediaLab 2010 ISBN 978-3-902448-16-3 Sandra Schafert, Tobias Bürger, Wolf Hilzensauer, Cornelia Schneider und Diana Wieden-Bischof: Empfehlungen im Web. Konzepte und Realisierungen. Band 3 der Reihe „Social Media“, herausgegeben von Georg Güntner und Sebastan Schafert Verlag und Herstellung: Salzburg Research, Salzburg Umschlaggestaltung: Daniela Gnad, Salzburg Research Lektorat: Andreas Strasser und Renate Steinmann, Salzburg Research Bibliografsche Informaton der Deutschen Natonalbibliothek: Die Deutsche Natonalbibliothek verzeichnet diese Publikaton in der Deutschen Natonalbibliografe; detaillierte bibliografsche Daten sind im Internet über htp://dnb.d-nb.de abrufar.
    • VORWORT Das Kompetenzzentrum für Neue Medien, das Salzburg NewMediaLab, betrachtet im Rahmen seines Forschungsprogramms die Wechselwirkung zwischen digitalen Inhalten und ihren Autor(inn)en bzw. Konsument(inn)en aus technologischer und sozialer Per- spektve. Dabei ergibt sich naturgemäß die Frage, welche Art von Beziehungen zwischen Autor(inn)en und Leser(innen) untereinander, aber auch zu den von ihnen erstellten bzw. konsumierten Inhalten besteht. Weiters untersuchen wir, wie sich die aufgrund die- ser Beziehungen entstehenden Gemeinschafen auf die Atraktvität und Nutzung der In- halte sowie auf das Angebot von erweiterten Diensten auswirkt. Unter der Bezeichnung „ComStudy“ wurde im Oktober 2009 am Salzburg NewMediaLab eine Studie gestartet, die sich mit Orienterungs- und Entscheidungshilfen für den Auf- bau und die Nutzung von Online-Communitys beschäfigt. Dabei betrachten wir auch die in der Wechselwirkung von Inhalten und Communitys anfallenden Metainformato- nen und die auf den Inhalten basierenden Dienste, wie etwa Empfehlungs- und Reputa- tonssysteme. Das Informatonsangebot im Internet ist mitlerweile so angewachsen und unübersicht- lich geworden, dass Suchmaschinen alleine die Flut der Daten für die Benutzer(innen) nicht mehr ausreichend fltern und darstellen können. Deswegen gehen fortschritliche Informatonsplatormen und digitale soziale Netzwerke zunehmend dazu über, das Pa- radigma des Suchens umzukehren: Nicht mehr die Benutzer(innen) suchen nach Infor- matonen, sondern die Informatonen suchen (und fnden) die Benutzer(innen). Voraus- setzung dafür sind Empfehlungssysteme, die Informatonen nach unterschiedlichen Ge- sichtspunkten – z.B. anhand der Profle der Anwender(nnen) – (semi-)automatsch aus- wählen, fltern und vorschlagen. Der vorliegende Band stellt Ansätze und Methoden für Empfehlungssysteme vor, zeigt mögliche Einsatzgebiete auf und gibt praktsche Hinweise für die Implementerung solcher Systeme. Die Darstellung der Analyse und von deren Ergebnissen erfolgt – wie in den beiden vor- angehenden Publikatonen – stets unter dem Gesichtspunkt, den Leserinnen und Lesern praktsche Orienterungs- und Entscheidungshilfen für die Konzepton und Umsetzung zur Verfügung zu stellen. Im Namen des Salzburg NewMediaLab wünsche ich Ihnen in diesem Sinne bei der Lektüre viele brauchbare Anregungen und viel Erfolg bei der prak- tschen Umsetzung in Ihren Online-Communitys oder bei Ihren Informatonssystemen. Georg Güntner Leiter des Salzburg NewMediaLab Februar 2010
    • DANK & ANMERKUNG ZUR SCHREIBWEISE Herzlichen Dank an Prof. Dr. Peter Dolog, Dr. Hendrik Drachsler sowie Dr. Marco Kalz für Ihre Bereitschaf, uns in diesem Studie einige Fragen zu beantworten und uns so an ih- rer Expertse teilhaben zu lassen. Danke auch an meine Kolleginnen und Kollegen: an Mag. Diana Wieden-Bischof und Mag. Wolf Hilzensauer für ihre Unterstützung bei der Recherche und Beschreibung von Beispielen; an Dr. Tobias Bürger für seinen Beitrag zu LIVE und sein Feedback zur Studie sowie an DI (FH) Mag. Cornelia Schneider für ihren Beitrag zu Empfehlungssystemen im Gesundheitsbereich, an Mag. Renate Steinmann und Dr. Andreas Strasser für das Lekto- rat, danke auch an Daniela Gnad für das Titelbild! Da die Gefahr groß ist, die eine oder den anderen zu übersehen, der bei den Trefen, oder in E-Mails oder beim informellen Gespräch beim Kafee hilfreich war, danke ich den weiteren Kolleg(inn)en ohne einzelne Namen zu nennen: Wie bei jeder der Veröfentli- chungen im Rahmen des Projektes ComStudy stecken auch hier hinter vielen Ideen und Hinweisen auf interessante Tools, Projekte, Veröfentlichungen und Expert(inn)en zahl- reiche Kolleg(inn)en des Salzburg NewMediaLab und der Salzburg Research Forschungs- gesellschaf. Es macht Spaß, mit so vielen cleveren Köpfen zusammenzuarbeiten! Schließlich, wie bei den bisherigen Veröfentlichungen dieser Reihe auch hier: Um die- sen Beitrag nicht durch weibliche Endungen, Bindestriche und Klammern zu einem zwar korrekten, aber auch schwerer zu lesenden Werk zu machen, haben wir im Folgenden durchgehend darauf verzichtet, die gendergerechte Schreibweise zu verwenden. Zudem haben wir uns bemüht, auf englische Ausdrücke oder Lehenswörter zu verzichten, wo sie uns unnötg erschienen – aber im Bereich des Internets und der modernen Manage- mentheorie kommt man leider viel zu of nicht darum herum. Sandra Schafert Salzburg Research Forschungsgesellschaf Februar 2010
    • INHALTSVERZEICHNIS 1 Einleitung und Hintergrund........................................................................................ 9 1.1 Empfehlungen im Web........................................................................................... 9 1.2 Schwerpunkte, Forschungsfragen und Vorgehen.................................................10 1.3 Hintergrund.......................................................................................................... 10 2 Empfehlungssysteme: Ansätze und Methoden......................................................... 13 2.1 Ziele und Zwecke des Einsatzes von Empfehlungssystemen................................. 13 2.2 Quellen für Empfehlungssysteme.........................................................................14 2.3 Personalisierte und allgemeine Empfehlungen ....................................................15 2.4 Inhaltsbasiertes Filtern......................................................................................... 15 2.5 Kollaboratves Filtern............................................................................................22 2.6 Verfahren der Ähnlichkeitsfeststellung von Nutzern bzw. Elementen..................25 2.7 Ähnlichkeit und weitere Kriterien.........................................................................28 2.8 Nachteile und Herausforderungen der Ansätze ...................................................28 2.9 Hybride Lösungen.................................................................................................30 3 Empfehlungssysteme: Ausgewählte Einsatzgebiete.................................................. 35 3.1 Überblick über fünf ausgewählte Einsatzgebiete..................................................35 3.2 Experten- und Arbeitsplatzsuche im Web............................................................ 36 3.3 Partnersuche im Web........................................................................................... 39 3.4 Produktempfehlungen .........................................................................................42 3.5 Empfehlungssysteme für Web-Materialien.......................................................... 51 3.6 Spezielle Einsatzgebiete und weitere Empfehlungssysteme................................. 58 4 Entwicklung von Empfehlungssystemen...................................................................67 4.1 Entwicklung im Überblick..................................................................................... 67 4.2 Aktve Einbindung von Nutzern............................................................................ 67 4.3 Ziel und Zweck des Empfehlungssystem...............................................................68 4.4 Konzeptonelle Beschreibung............................................................................... 68 4.5 Implementerung ................................................................................................69 4.6 Evaluaton: Überprüfung der Qualität und Nützlichkeit von Empfehlungen.........70 5 Ausblick....................................................................................................................73 Literatur und Quellen.................................................................................................. 75 Autorinnen und Autoren............................................................................................. 80 Social Media – Weitere Bände.....................................................................................80
    • 1 EINLEITUNG UND HINTERGRUND 1.1 Empfehlungen im Web Wachsende Datenbestände machen es schwierig sich zu orienteren. Empfehlungssyste- me werden daher immer häufger eingesetzt. Sie schlagen zum Beispiel Produkte, Dienstleistungen, Webseiten, Filme, Bilder, Lieder, Experten, Musikgruppen oder poten- zielle Freunde und Lebenspartner vor. Insbesondere durch den Anwuchs von Beiträgen in Social-Media-Anwendungen sind Empfehlungssysteme gefragt, damit interessante Beiträge und Personen nicht „untergehen“. Auch bei der gezielten und personalisierten Werbung im Web oder bei Suchmaschinen werden Verfahren der Empfehlungssysteme eingesetzt. Empfehlungen unterstützen auch Prozesse wie die Reiseplanung, das Lernen, das Tagging und auch das Verschreiben von Arzneimiteln. Empfehlungssysteme haben die Aufgabe (vgl. Sorge, 2008) „einem Nutzer Objekte zu empfehlen, die für ihn interessant sein könnten“ (S. 18). Klahold (2009) versteht unter einem Empfehlungssystem ein System, „das einem Benutzer in einem gegebenen Kon- text aus einer gegebenen Enttätsmenge aktv eine Teilmenge „nützlicher“ Elemente empfehlt“ (S. 1). Empfehlungssysteme werden auch im Deutschen häufg als „Recom- mender-Systeme“ bezeichnet. Als Voraussetzung für die Notwendigkeit von Empfehlungssystemen betrachtet Klahold (2009) das Anwachsen von Informatonen und den exponentellen Ansteg des Datenvo- lumens im 20. Jahrhundert (S. 16). Auch wenn es nicht als Empfehlungssystem bezeich- net wird, ist Klahold (2009) zufolge, die erste akademische Beschäfigung mit einem Empfehlungssystem das Werk von Luhn (1958): Er beschreibt ein System, dass selektv Informatonen an bestmmte Organisatonen verteilt. Ein Überblick über aktuelle Realisierungen und Erfahrungen mit solchen Empfehlungs- systemen, die als Service für Nutzer und Communitys einen entscheidenden Faktor für die Atraktvität eines Systems ausmachen können, wird hier gegeben, wobei auch die konkrete technologische Umsetzung und die Konzepte beschrieben werden. Während sich der Begrif der „Empfehlungssysteme“ in einigen Beiträgen nur auf automatsche Verfahren der Empfehlung beschränkt, beziehen wir in dieser Arbeit alle Formen der Empfehlungen mit ein. Grundsätzlich wird für Empfehlungssysteme in der Regel eines der beiden folgenden Verfahren oder eine Kombinaton von beiden genutzt: | Beim inhaltsbasierten Filtern (Engl. „Content Based Filtering“) beruhen die Empfeh- lungen auf den Eigenschafen der Elemente, die empfohlen werden. Beispielsweise wird ein Buch empfohlen, weil ein Abgleich des Klappentexts sowie des Benutzerpro- fls ergeben hat, dass es ihn interessieren könnte (Klahold, 2009). | Beim kollaboratven Filtern (Engl. „Collaboratve Filtering“) werden Empfehlungen auf der Basis von Daten zu ähnlichen Benutzerproflen gegeben. Beispielsweise wer- den hier Bücher empfohlen, die andere Nutzer mit ähnlichem Benutzerprofl bereits gekauf, gelesen oder positv bewertet haben (Klahold, 2009). Ein weiteres wichtges Beschreibungsmerkmal eines Empfehlungssystem ist es, ob per- sonalisierte Empfehlungen gegeben werden oder ob die Empfehlung für jeden Nutzer gleichermaßen gilt. Darüberhinaus gibt es auch Systeme und Anwendungen, die unterstützen, dass Nutzer anderen Nutzern direkte (persönliche) Empfehlungen geben (s. Terveen & Hill, 2001; Brand-Haushofer, 2005). 9
    • 1.2 Schwerpunkte, Forschungsfragen und Vorgehen Schwerpunkte unserer Ausführungen sind die unterschiedlichen Formen und Einsatz- möglichkeiten von Empfehlungssystemen im Web. Folgende, eher praktsche Fragen waren dabei forschungsleitend: | Welche Arten von Empfehlungssystemen im Web gibt es derzeit? | Wie und zu welchem Zweck werden sie eingesetzt? | Welche Erfahrungen wurden dabei bisher gemacht? Diese Publikaton verfolgt das Ziel, über unterschiedliche Branchen und Anwendungsbe- reiche hinweg, Realisierungsmöglichkeiten und Beispiele vorzustellen. Dabei wird be- trachtet, welchen Nutzen einzelne Benutzer eines Services oder einzelne Community- Mitglieder haben und wie ggf. die Nutzergruppe insgesamt davon proftert. Im Überblick beschäfigt sich die Studie also mit: | Motven für den Einsatz von Empfehlungssystemen, | unterschiedlichen Ansätze und technologischen Grundlagen, | Realisierungen für unterschiedliche Einsatzbereiche, | Hinweisen zur Entwicklung solcher Systeme sowie | Herausforderungen und zukünfigen Forschungsfragen. Ein gewisses technisches Grundverständnis voraussetzend, wendet sich diese Studie vor allem an Praktker, die sich durch die unterschiedlichen Nutzungsmöglichkeiten anregen lassen wollen, für ihre eigenen Webplatormen innovatve Empfehlungsservices zu ent- wickeln. Hierfür wurden Beispiele, Publikatonen und Experten einbezogen, um einen guten Einsteg und Überblick zum aktuellen Stand der Nutzung sowie anregende Einbli- cke ermöglichen zu können. Beim Entwurf des Projektes und der Forschungsschwerpunkte gab es keine deutschspra- chige umfangreichere Einführung in Empfehlungssysteme. Während der Recherchen er- schien jedoch ein neues Buch: Klahold (2009) führt in die unterschiedlichen Empfeh- lungssysteme, ihre Struktur und verwendete Technologien und Methoden systematsch für Studierende der Informatk ein. Diese Broschüre hat hingegen eher die unterschiedli- chen Einsatzgebiete und Erfahrungen sowie die Entwicklung von Empfehlungssystemen für Gestalter und Verantwortliche von Webplatormen im Fokus. Auf alle Fälle beein- fusste und inspirierte uns das Buch von Klahold (2009); häufg wird daher auf diese Quelle verwiesen. 1.3 Hintergrund Diese Broschüre ist ein Ergebnis der „ComStudy“, die am Salzburg NewMediaLab (SNML) im Zeitraum von Oktober 2008 bis Januar 2010 durchgeführt wurde. Das SNML, das Kompetenzzentrum für Neue Medien in Österreich, arbeitet daran, digitale Inhalte cle- ver zu strukturieren, verknüpfen, personalisieren, für alle aufndbar zu machen und nachhaltg zu nutzen und betrachtet dabei die Community als einen wesentlichen Faktor vieler Projekte. Im Rahmen der ComStudy wurde bereits eine Studie zum erfolgreichen Community- Aufau durchgeführt, die anhand von Literaturanalysen, Best-Practce-Beispielen, Fall- analysen und Expertenbefragungen für unterschiedliche Szenarien konkrete Implemen- terungsempfehlungen gibt (Schafert & Wieden-Bischof, 2009). In einer weiteren Bro- schüre wurde die Entstehung und Nutzung von (Meta-) Informatonen in Communitys 10
    • beschrieben. Unterschiedliche Einsatzgebiete und Nutzungen, von der Entwicklung von Services für die Communitys selbst bis zum unternehmensgetriebenen Webmonitoring werden dabei beschrieben (Schafert u.a., 2009). Auf diesen Vorarbeiten beruht im Rah- men des Projektes zudem eine Studie zu Feedback- und Reputatonssystemen (Schafert u.a., 2010). Auch dieser Band basiert darauf, da bei der Entwicklung von Empfehlungssystemen auf (Meta-) Informatonen unterschiedlichster Art zurückgegrifen werden kann (s. letzte Seite in diesem Band). 11
    • 12
    • 2 EMPFEHLUNGSSYSTEME: ANSÄTZE UND METHODEN In diesem Abschnit werden die unterschiedlichen Ansätze und Methoden von Empfeh- lungssystemen vorgestellt. Dazu werden zunächst Ziele und Zwecke ihres Einsatzes und ihre Quellen vorgestellt. Im Anschluss wir ein Einsteg in die unterschiedlichen Verfahren des inhaltsbasierten als auch kollaboratven Filtern und hybrider Ansätze geboten. Leider nutzen einige Forscher unterschiedliche Bezeichnungen für die gleichen Verfah- ren von Empfehlungssystemen, während andere identsche Bezeichnungen verwenden, aber ofensichtlich unterschiedliches verstehen (Schickel-Zuber, 2007, 21). Im Folgenden wurde Aufau und Bezeichnungen der Verfahren aus aktuelleren Veröfentlichungen ge- wählt und beschrieben (u.a. Schickel-Zuber, 2007; Klahold, 2009). 2.1 Ziele und Zwecke des Einsatzes von Empfehlungssystemen Einleitend wurde festgestellt, dass Empfehlungssysteme die Aufgabe haben, Nutzern von Anwendungen Objekte vorzuschlagen, die für sie interessant sein können. Doch welche Ziele und Zwecke verfolgen Betreiber eines Angebots, das ein Empfehlungssys- tem enthält? Unmitelbare Zwecke, die Empfehlungssysteme erfüllen sollen sind, dass | Nutzer für sie interessante, neuartge und nützliche Empfehlungen für Experten, Pro- dukte, Dienstleistungen, potenzielle Ehepartner, Lernpartner, Webseiten, usw. erhal- ten, und/oder | dadurch Prozesse, beispielsweise Recherchen, Lernen, Arzneiverordnung, Planung von Reisen etc. erleichtert, beschleunigt und verbessert werden. Ziele, die Betreiber mit dem Einsatz von Empfehlungssystemen verfolgen, können dabei sein: | mit Hilfe des Empfehlungssystems mehr Nutzer zu bekommen, | zufriedenere Nutzer zu erhalten, | sich durch besseren Service von Mitbewerbern zu unterscheiden sowie | höhere Umsätze und/oder Gewinne zu sichern. Insbesondere im Online-Handel versprechen gute Empfehlungssysteme so erhöhte Um- sätze durch das Vorschlagen passender, reizvoller weiterer Produkte, die für die Kunden auch tatsächlich interessant sind. So wird das Hauptgeschäf bei Amazon oder iTunes Store nicht mehr mit den Verkaufsschlagern gemacht, sondern mit Nischenprodukten. Diese gilt es aber zu fnden, daher sind Empfehlungssysteme unabdingbar (vgl. Klahold, 2009). Strategische Ziele, die damit verfolgt werden können sind zum Beispiel: die Nutzer an den eigenen Service zu binden, sie zu aktvieren und/oder ein Alleinstellungsmerkmal im Vergleich mit den Mitbewerbern zu erlangen. Gleichzeitg, wenn beispielsweise mit der Einführung von Empfehlungssystemen auch Bewertungssysteme eingeführt werden können, ermöglichen Empfehlungssysteme auch leichteres Monitoring und Auswertung der Nutzer und ihrer Interessen. Auch können Betreiber, beispielsweise in Handelsplatormen Auswirkungen der Empfehlungen von Produkten oder personalisierter Werbung analysieren und dadurch auch Wissen über gute Produktplatzierung und Werbung gewinnen. 13
    • 2.2 Quellen für Empfehlungssysteme Als Quellen für Empfehlungssysteme stehen eine ganze Reihe von (Meta-) Informato- nen über Nutzer sowie den Empfehlungselementen zur Verfügung. Beispielsweise sind dies (s. Schafert u.a. 2009, 10): | das Nutzerverhalten, beispielsweise das Such- und Browsingverhalten, | die Kommunikatons- und Netzwerkstruktur als Möglichkeit die sozialen Gegebenhei- ten zu erfassen und zu nutzen, | Bewertungen, die dazu genutzt werden, um Produkte, Personen, Objekte oder Web- seiten zu evaluieren und zu beurteilen, | Social Tagging als eine innovatve und populäre Variante von gemeinschaflicher Ver- schlagwortung von Dokumenten, | Texte, da aus dieser Datenquelle eine Reihe von (auch überraschenden) Metainfor- matonen analysiert und abgeleitet werden können, | Metadatenformate als klassische Form von Metainformatonen sowie schließlich | verknüpfe Daten und Schemata (z. B. Thesauri, Ontologien, Linked Data). Bei Empfehlungssystemen wird darüberhinaus auch damit experimentert, beispielswei- se Persönlichkeitsmerkmale abzufragen und auszuwerten, um Empfehlungen zu verbes- sern (Nunes & Blanc, 2008). Die unterschiedlichen Quellen werden in explizite Empfehlungen, d.h. Empfehlungen durch Bewertungen von Nutzern, sowie verhaltensbasierte Empfehlungen durch sonst- ge Aktvitäten der Nutzer unterschieden. Nach Neumann (2009) sind mit der Nutzung dieser unterschiedlichen Quellen auch unterschiedliche Herausforderungen verbunden. Nutzer Designprobleme der Mechanismen Nutzertyp Verhalten Explizite Empfehlungen Verhaltensbasierte Empfehlungen unvoreingenommen passiv passiver Konsum Free-Rider-Efekt, – Netzwerkefekte unvoreingenommen aktv wahrheitsgemäßer Beitrag Privatsphäre (Privatsphäre) voreingenommen, aktv voreingenommener Beitrag Voreingenommenheit, (Voreingenommenheit) Feedback-Efekte Glaubwürdigkeit Tabelle 1: Nutzertypen und Designprobleme von Empfehlungssystemen mit expliziten vs. verhaltensbasierten Empfehlungen Quelle: Neumann, 2009, Tabelle 3.1, 28 Prinzipiell sind bei beiden Verfahren v.a. Voreingenommenheit und Parteilichkeit bei Nutzern eine Herausforderung, insbesondere wenn bewusst und intensiv zugunsten oder gegen Produkte bewertet wird. Parteiische Nutzer können auch Feedback-Efekte hervorrufen, d.h. dass ein frühzeitges positves Feedback zu größeren Marktchancen von Produkten führt, ein frühes negatves Feedback jedoch die Chancen für spätere Ver- besserungen der Bewertungen und Absatzchancen stark einschränkt. Empfehlungen sind auch gewissermaßen ein öfentliches Gut, von dem jeder profteren kann. Dies gilt im besonderen Maße für Nutzer, die nur von den Bewertungen anderer 14
    • profteren, aber nicht selbst daran mitwirken („Free-Rider-Efekt“). Wünschenswert ist allerdings, dass alle Nutzer mitwirken und Netzwerkefekte entstehen können. 2.3 Personalisierte und allgemeine Empfehlungen Als erstes Unterscheidungsmerkmal der unterschiedlichen Verfahren wird häufg ausge- wählt, ob das System personalisierte, d.h. auf einen Nutzer zugeschnite, Empfehlungen gibt. Insbesondere Bewertungsplatormen wie die Nachrichtensammlung Digg1 geben auf der Startseite keine personalisierten Empfehlungen ab, sondern aggregieren aus den Bewertungen der Digg-Nutzer Empfehlungen von Nachrichten, die für alle Besucher der Seite gelten. Registrierte Nutzer bekommen jedoch auch ihr Profl zugeschnitene Emp- fehlungen (s. Abbildung 1). Ebenso keine personalisierten Empfehlungen in diesem Sinne geben beispielsweise Sys- teme, die zu einzelnen Produkten oder Webseiten weiterführende oder ähnliche Pro- dukte und Webseiten anbieten, wenn diese Empfehlungen nicht aufgrund des Nutzer- profls gegeben werden, sondern bei jedem Nutzer gleichermaßen angezeigt werden. Abbildung 1: Allgemeine Nachrichtenempfehlungen und die personalisierte Empfehlungsmaschine bei Digg Quelle: htp://digg.com (02/2010) Als registrierter Nutzer erhält man bei Digg jedoch personalisierte Empfehlungen für Ar- tkel: Vorgeschlagen werden Beiträge, die Nutzer mit einem ähnlichen Profl gut fnden. Personalisierte Empfehlungssysteme können auch die Nutzer-History berücksichtgen und (auch ohne Berücksichtgung anderer Nutzerprofle) Empfehlungen geben (Tanaka, Hori & Yamamoto 2008). Im Folgenden stellen wir die zwei grundsätzlich unterschiedliche Verfahren vor, die bei Empfehlungssystemen eingesetzt werden: das inhaltsbasierte sowie das kollaboratve Filtern. 2.4 Inhaltsbasiertes Filtern Das inhaltsbasierte Filtern hängt stark von den Objekten ab, die empfohlen werden sol- len: Bücher, Videos, Fotos, Musikdateien und andere Produkte sind dabei unterschied- lich beschrieben und nutzen auch unterschiedliche Metadatenformate. Die Eigenschaf- ten der Objekte sind die Basis für die Empfehlungen. Was andere Nutzer machen, spielt also keine Rolle. Folgende Abbildung gibt einen Überblick über die Prozesse beim in- haltsbasierten Filtern, die wir im Folgenden genauer vorstellen. 1 htp://digg.com, Stand 02/2010 15
    • Abbildung 2: Überblick über das Vorgehen bei inhaltsbasierten Empfehlungen Quelle: Nutzung von Abbildungen von Artkeln der folgenden Zeitschrifen: Oberbadisches Volksblat, Ahlener Zeitung, Rheinische Zeitung, Kleine Zeitung Eigenschafsanalyse Die Datenbasis des Systems kann beim inhaltsbasierten Filtern grundsätzlich unter- schiedlich erlangt werden: | Die Elemente können mit Hilfe von Experten beschrieben werden. Insbesondere Ler- nempfehlungen in Lernumgebungen werden aufgrund von Angaben von Experten, i.d.R. der Lehrenden gegeben. Dazu werden beispielsweise im Lernmanagementsys- tem Angaben zum Aufau der Lerneinheiten gemacht, welches Modul beispielsweise welchem Modul folgt bzw. folgen sollte. Eine Reihe von weiteren Empfehlungssyste- men verwenden Metadaten von Objekten, ohne dass spezifsche weitere Auswertun- gen vorgenommen werden: So können Bücher von gleichen Autoren empfohlen wer- den oder Bücher, die in der gleichen Rubrik veröfentlicht wurden. | Davon unterscheiden sich Empfehlungssysteme, die zu empfehlende Objekte bzw. deren Nutzer erst weiteren Auswertungen und Analysen unterziehen, um entspre- chende Daten zu erhalten. Viele Empfehlungssysteme greifen nicht auf explizite Ele- mentbeschreibungen wie z. B. Metadaten zurück. Of sind Eigenschafen der Empfehlungselemente eben noch nicht bekannt oder be- schrieben, sondern müssen erst analysiert werden (in der Abbildung 2 mit „a“ gekenn- zeichnet). 16
    • Auch für andere Formate wie Videos, Audios und Bilder gibt es Verfahren der automat- schen Analyse. Erprobter und sehr häufg im Einsatz sind bei Empfehlungssystemen je- doch vor allem Eigenschafsanalysen von Texten. Auf diesen Bereich gehen wir daher im Folgenden besonders ein. Eigenschafsanalyse am Beispiel von Texten Besonders bei Texten müssen deren Besonderheiten erst vom Empfehlungssystem fest- gestellt werden. Die Verfahren zur Analyse von Eigenschafen von Texten heißt „Feature Selecton“ bzw. eben Eigenschafsanalyse (vgl. Klahold, 2009, 42). Dazu gibt es eine Rei- he von Verfahren, die diese Analyse ermöglichen. Bei Texten ist es wichtg, die Schlüssel- worte (bzw. Stchworte) zu erhalten, die zentrale Bedeutung für den Text haben (siehe Klahold, 2009, 42f). Dabei kommen Verfahren der Informaton Extracton (auf Deutsch „Informatonsgewinnung“), zum Einsatz, also semantsche wie statstsche Verfahren (s. Knoth, Schmidt & Smrž, 2008). Nicht zuletzt durch Empfehlungssysteme ist die Nachfra- ge und Zitatonshäufgkeit von einschlägigen Werken wie „Informaton to modern infor- maton retrieval“ von Salton und McGill (1986) oder „Informaton Retrieval von van Rijs- bergen (1979) immer noch hoch (s. Heymann, 2004). Im Folgenden zeigen wir ein typisches Verfahren am Beispiel von vier Ausschniten aus Liedtexten. Hier werden zunächst Wörter, die in der deutschen Sprache sehr häufg sind und keinen Mehrwert für die Diferenzierung von Texten haben, gestrichen und nicht weiter ausgewertet. In solchen „Stopplisten“ stehen typischerweise Worte wie „auch“, „als“, „an“, „keine“, „kann“, „sind“, „oder“ sowie „und“. In der folgenden Tabelle wird ge- zeigt, welche Wortlisten sich aus drei Beispielsätzen ergeben, wenn Stopplistenwörter gestrichen werden, Wiederholungen gelöscht sowie Wörter auf ihre Grundformen zu- rückgeführt werden. Originalsatz (Liedtexte) Nach Streichung der Stoppwörter Text A „Wir tanzen Tango und möglichst lang. Es spielt sich eng wir, tanzen, Tango, möglichst, lange, spielt, eng, Gedräng bei dem Gedräng.“ Text B „Eins, zwei, drei, vier, Brüderchen, komm tanz mit mir. eins, zwei, drei, vier, Brüderchen, komm, tanz, mir, eins, zwei, Eins, zwei, drei, vier, beide Hände reich ich dir.“ drei, vier, beide, Hände, reich, ich, dir Text C „Oh, Donna Clara, ich hab dich tanzen gesehn, und deine oh, Donna, Clara, ich, tanzen, gesehn, deine, Schönheit, Schönheit hat mich toll gemacht.“ mich, toll, gemacht Text D „Komm, tanz den Tango mit mir! Und folge mir im Tango- komm, tanz, Tango, mir, folge, mir, Tangoschrit, hier, ich, schrit hier! Ich tanz den Tanz ganz lange mit dir.“ tanz, Tanz, ganz, lange, dir Tabelle 2: Charakteristk der Empfehlungssysteme in ausgewählten Einsatzgebieten. Quelle: Textauszüge von Nina Hagen, Volksgut, Comedian Harmonists und Bodo Wartke Folgende Verfahren zur Textanalyse werden in der Praxis häufg eingesetzt: | Das Verfahren „Term Frequency – Inverse Document Frequency“ (kurz TF/IDF) ist ein statstsches Verfahren: Es zählt alle Wörter im Text. Wörter, die dabei in allen Texten (im gesamten Korpus) vorkommen, erhalten ein geringes Gewicht. Wörter, die nur in wenigen Texten vorkommen, erhalten ein größeres Gewicht und werden zur Be- schreibung eines Textes bedeutsamer eingeschätzt. Dabei werden in aller Regel auch Stemming- bzw. Lemmatsierungs-Verfahren eingesetzt, d.h. Worte werden auf ihre Stammformen gebracht, um beispielsweise unterschiedliche Beugungsformen kor- rekt zu zählen. 17
    • | Der Ansatz der „Mutual Informaton“ berechnet die Wahrscheinlichkeit, dass zwei Worte gemeinsam in einem Text vorkommen. Durch den Vergleich der Wahrschein- lichkeit des gemeinsamen Aufretens mit der des unabhängigen Aufretens der Wort- paare wird ein Ähnlichkeitsmaß von Texten berechenbar. Diese Ansätze wurden vielfältg präzisiert und weiterentwickelt, beispielsweise sind das „Okapi Weightng Scheme“ und das Okapi-BM2-Verfahren Weiterentwicklungen des TF/IDF-Verfahrens (s. Cummins & O’Riordan, 2006). Ein weiteres patentertes Verfahren ist das Latent Semantc Indexing. Marco Kalz beschreibt es im Expertengespräch (s. S. 65). Bei solchen statstschen Verfahren werden v.a. Wörter gezählt und seltener semant- sche Bezüge ausgewertet. Verwandte Wörter bzw. die Wortbedeutungen zu berücksich- tgen wird v.a. durch Einbezug von Thesauri, Synonym-Lexika und Wörterbüchern mög- lich. Bei mehrdeutgen Wörtern wie „Bank“ können beispielsweise über die assoziierten Wörter weitere Zuordnungen vorgenommen werden. Trit das Wort „Bank“ beispiels- weise im Zusammenhang mit „Kredit“, „Überweisung“ auf, passt dieser Beitrag wohl eher zu einem Artkel mit Beiträgen zu Geldinsttuten als zu anderen Beiträgen zur Sitz- gelegenheit „Bank“ (siehe ausführlich bei Klahold, 2009, 48). Ein Verfahren, das ebenso Wortbedeutungen auswertet ist der Ansatz der „Named Entty Recogniton“: Hier wer- den sogenannte „Enttätstypen“ durch die Stellung im Satz identfziert. Beispielsweise können das Personen, Firmen oder Orte sein, die aufgrund der Stellung im Satz, der Häufgkeit oder auch durch Abgleich mit Listen als Personennamen, Firmennamen oder Ortsnamen identfziert werden. Für Empfehlungssysteme wurden eigene Heuristken dafür entwickelt, welche Wörter wichtg sind bzw. den Inhalt des analysierten Textes widerspiegeln. Für ein Empfehlungs- system von Webseiten, dem InfoFinder, wurde beispielsweise folgende Heuristk einge- setzt (Krulwosh & Burkey, 1997; Übersetzung in Klahold, 2009, 112): | Worte, die in einer Stoppwortliste, stehen sind grundsätzlich unwichtg, | komplet groß geschriebene Worte sind wichtg (Vermutung, es handelt sich um ein Akronym), | in Klammern oder Anführungszeichen stehende Worte nach einem komplet groß ge- schriebenen Wort sind wichtg (Vermutung, es handelt sich dabei um eine Defniton eines Akronyms), | anders formaterte Wortolgen von zwei bis drei Worten, die kein eigenständiger Satz sind, sind wichtg (Vermutung, es handelt sich um die erstmalige Verwendung eines wichtgen Wortes), | Worte in Aufzählungen, Überschrifen, Bildunterschrifen, Tabellenspalten und -zei- len sind wichtg, | ofmals wiederholte Wortolgen sind wichtg, | Substantve in direkter Folge sind wichtg (Vermutung, es handelt sich um einen Fachbegrif), | Worte, die Sonderzeichen (beispielsweise einen Bindestrich), Zifern oder Großbuch- staben enthalten, sind wichtg. 18
    • Darstellung und Speicherung der Eigenschafen Eine einfache Darstellung von Eigenschafen eines Textes ist die einfache unstrukturierte Sammlung der Schlüsselworte („Bag of Words“, Klahold, 2009, 58). In der Regel werden die Eigenschafen in Form von Vektoren dargestellt (s. Klahold, 2009, 56f; Abbildung 2 mit „b“ gekennzeichnet). Texte werden dabei i.d.R. mit Vektoren repräsentert, die so viele Komponenten haben, wie der Korpus Worte besitzt. Anhand der Ähnlichkeit von Vektoren wird auf die Ähnlichkeit der analysierten Texte geschlossen (s. Abschnit 2.6, S. 25) Am obigen Beispiel der Liedtexte dargestellt (s. Tabelle 2, S. 17), können Vektoren bei- spielsweise folgendermaßen aussehen: Schlüsselworte Vektoraufau: wir, tanzen, Tango, möglichst, lange, spielt, eng, Gedräng, Zahl der eins, zwei, drei, vier, Brüderchen, komm, tanz, mir, beide, Hände, reich, ich, Schlüssel- dir, oh, Donna, Clara, gesehn, deine, Schönheit, mich, toll, gemacht, folge, worte ohne Tangoschrit, hier, Tanz, ganz Wiederho- lungen Text A wir, tanzen, Tango, mög- VRA=(1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0) 8 lichst, lange, spielt, eng, VBA=(1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0) Gedräng Text B eins, zwei, drei, vier, Brü- VRB=(0,0,0,0,0,0,0,0,2,2,2,2,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0) 14 derchen, komm, tanz, mir, VBB=(0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0) eins, zwei, drei, vier, beide, Hände, reich, ich, dir Text C oh, Donna, Clara, ich, tan- VRC=(0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,1,1,1,1,1,1,1,1,1,0,0,0,0,0) 11 zen, gesehn, deine, Schön- VBC=(0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,1,1,1,1,1,1,1,1,1,0,0,0,0,0) heit, mich, toll, gemacht Text D komm, tanz, Tango, mir, VRD=(0,0,1,0,1,0,0,0,0,0,0,0,0,1,2,2,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,1,1,1,1,1) 12 folge, mir, Tangoschrit, VRD=(0,0,1,0,1,0,0,0,0,0,0,0,0,1,1,1,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,1,1,1,1,1) hier, ich, tanz, Tanz, ganz, lange, dir Tabelle 3: Darstellung der Schlüsselworte in Vektoren mit reellen und binären Komponenten In der Darstellung wird die Zahl der entsprechenden Worte im Vektor dargestellt. Mög- lich ist auch eine binäre Darstellung, bei der „1“ für „vorhanden“ und „0“ für „nicht vor- handen“ steht. Vektoren mit mehr als drei Dimensionen lassen sich dabei kaum bildlich vorstellen. In der Darstellung wird die Zahl der entsprechenden Worte im Vektor darge- stellt. Schon beim Betrachten der Vektoren kann man sich vorstellen, welche Vektoren ähnlich sind. Vergleich der Empfehlungselemente Sind die Eigenschafen von Empfehlungselementen analysiert bzw. bekannt, wird beim inhaltsbasierten Filtern ein Vergleich zwischen den Empfehlungselementen vorgenom- men. Dazu stehen wiederum unterschiedliche Verfahren bzw. Algorithmen zur Verfü- gung (in der Abbildung c). Typischerweise wird die Ähnlichkeit von Elementen als nütz- lich empfunden, um darauf aufauend Empfehlungen auszusprechen. Wir stellen ausge- wählte Verfahren in Abschnit 2.6 vor (s. S. 25). 19
    • Bei der Entscheidung für ein oder mehrere Verfahren bzw. einen Algorithmus ist es wichtg, dass die Ergebnisse in einer angemessenen Zeit zur Verfügung stehen: „Um die Laufzeitkomplexität zu reduzieren muss die Eigenschafsanalyse ein möglichst gutes Ver- hältnis zwischen der Menge der Eigenschafen und der dadurch gegebenen diskriminie- renden Wirkung bezüglich der Empfehlungselemente erzielen“ (Klahold, 2009, 42). Fallbezogenes und eigenschafsbezogenes Filtern Es können zwei Arten des inhaltsbasierten Filterns unterschieden werden. Zum einen werden beim eigenschafsbezogenen Filtern (Engl. „atributon based“) Emp- fehlungen aufgrund der Übereinstmmungen des Profls der Nutzer (z. B. seinen Qualif- katonen) mit den Elementen (z. B. Stellenanzeigen) gegeben (siehe Abbildung 3, rechts). Zum anderen werden beim fallbezogenen Verfahren (Engl. „case based“) personalisierte Empfehlungen auf Basis der Ähnlichkeiten von Elementen gegeben (siehe Abbildung 3, links): Hat jemand z. B. einen Text zu Delphinen hoch bewertet, so wird er weitere Texte zu diesem Thema vorgeschlagen bekommen. Abbildung 3: Inhaltsbasiertes Filtern: eigenschafsbezogenes (links) und fallbezogenes Filtern (rechts) Quelle: Darstellung in Anlehnung an Kim, 2006, abgebildet in Drachsler, 2009 20
    • Beispiele für Empfehlungssysteme mit inhaltsbasiertem Filtern Ausgewählte Beispiele für Empfehlungssysteme, die auf inhaltsbasiertem Filtern beru- hen, werden in Klahold (2009, 102f) vorgestellt und hier zusammengefasst. Name Empfeh- Kurzbeschreibung Eigenschafsanalyse Proflbildung Distanzmaß Literatur lungsele- ment Informaton E-Mail E-Mails erhalten Manuelle Ergänzung Manuelle Erstel- Regelbasiert Malone, Grant, Lense Metadaten (Ort, der Metadaten lung des Interes- (einfache Über- Turbak (1986) Produkt etc.) sensprofls durch einstmmung) Nutzer Infoscope Usenet- Vorhandene Filterre- Heuristk, manuelle Manuelle Pfege regelbasiert Fischer & Ste- Nachrichten geln für eine „virtu- Metadaten, Text- vens (1991) elle“ Newsgroup struktur, NLP, Basis- werden bewertet korpus-Statstk, TF- IDF-Derivat Letzia Webseiten Webseiten (Subsei- TF-IDF-Derivat Manuelle Pfege Cosinus-Ähn- Liebermann ten oder Links) wer- (Schlüsselworte) lichkeitsmaß (1995) den empfohlen WebWatcher Webseiten Hyperlinks auf Web- TF-IDF-Derivat Manuelle Pfege Mutual Infor- Armstrong, Frei- seiten und neue (Interessensspezif- maton tag, Joachims & Webseiten werden katon) Mitchell (1995) empfohlen u.a. Syskill & We- Webseiten Webseiten werden TF-IDF-Derivat Auf Basis von Be- Naiver-Bayes- Pazanni, mUra- bert empfohlen wertungen des Klassifkator matsu & Billsus Nutzers von Web- (1996) seiten (Schlüssel- worte) InfoFinder Webseiten Webseiten werden Heuristk Auf Basis von Be- ID3-Algorithmus Krulwosh & Bur- empfohlen wertungen des key (1997) Nutzers (Smiley anklicken) LIBRA Bücher Bücherempfehlun- Manuelle Metada- Auf Basis von Naiver-Bayes- Mooney & Roy gen ten Buchbewertungen Klassifkator (2000) des Nutzers Tabelle 4: Übersicht über ausgewählte Empfehlungssysteme, die inhaltsbasiertes Filtern verwenden. Quelle: Klahold, 2009, 102f Die hier genannten Verfahren zur Distanzermitlung werden in Abschnit 2.6 (S.25) be- schrieben. 21
    • 2.5 Kollaboratves Filtern Beim kollaboratven Filtern werden Empfehlungen aufgrund anderer ähnlicher Benutzer- profle gegeben (Klahold, 2009, 62f). Folgende Abbildung gibt einen Überblick über das Verfahren, dass wir im Folgenden detaillierter beschreiben. Abbildung 4: Überblick des Vorgehens beim kollaboratven Filtern Implizite und explizite Bewertungen Grundlage für das kollaboratve Filtern sind die Bewertungen von Nutzern (siehe Abbil- dung 4 mit „a“ gekennzeichnet). Diese können implizit durch Auswertung des Nutzerver- haltens generiert werden, zum Beispiel kann vermerkt werden, welche Elemente an- geklickt und/oder länger betrachtet wurden oder was gekauf wurde. So wird bei WAIR, einem Empfehlungssystem für Webseiten, die Bewertung einer Webseiten nicht explizit durch den Nutzer erbeten: Bewertungen von Webseiten werden hier aus dem Nutzer- verhalten abgeleitet beispielsweise der Lesedauer, Setzen von Lesezeichen, Scrollen, Be- nutzen von Hyperlinks (in der Webseite; s. Seo & Zang, 2000; Klahold, 2009, 133f). Häu- fg werden jedoch auch explizite Bewertungen der Nutzer erbeten, beispielsweise auf ei- ner Skala mit fünf Sternen. Unterschiedliche Verfahren kollaboratven Filterns Mit Hilfe dieser Daten wird nun berechnet, wie relevant ein Empfehlungselement für einen Nutzer ist. Dazu gibt es beim kollaboratven Filtern wiederum mindestens vier An- sätze zu unterscheiden (in der Abbildung 4 mit „b“ gekennzeichnet, Klahold, 2009, 62f; Kim, 2006; Drachsler, 2009 u.a.). 22
    • Abbildung 5: Nutzer- und elementbasiertes kollaboratves Filtern Quelle: Darstellung in Anlehnung an Kim, 2006; abgebildet in Drachsler, 2009 (i) Beim nutzerbezogenen Algorithmus wird festgestellt, welche Nutzer besonders ähn- lich sind und deren Bewertungen eines Empfehlungselement als Relevanzmaß festge- legt: Was ähnliche Nutzer als gut befnden, erhält eine hohe Relevanz und wird dem Nutzer empfohlen (in der Abbildung 5 links). (ii) Beim elementbezogenen Algorithmus werden eigene, als gut bewertete Elemente ge- nommen und dann wird paarweise nach Elementen gesucht, die ebenso gut bewertet werden. Die Relevanz berechnet sich beispielsweise in Form eines „gewichteten Durch- schnits der Bewertungen des Benutzers für die (..) ähnlichsten Empfehlungselemente“ (Klahold, 2009, 65, in der Abbildung 5 rechts). Abbildung 6: Modell- bzw. speicherbasiertes Verfahren beim kollaboratven Filtern (iii) Beim modell- bzw. speicherbasierten Verfahren werden alle Benutzerdaten und das Benutzerverhalten in den Filterprozess eingebunden. Dabei kommen multvariate Ver- fahren zum Einsatz, die am Ende von Abschnit 2.6 (S. 25) beschrieben werden, bei- spielsweise K-Means-Clustering. (iv) Wenn die Zuordnung nicht aufgrund solcher Verfahren, sondern auf Basis einfacher Angaben wie beispielsweise Alter und Geschlecht erfolgt, werden darauf beruhende Empfehlungen für Elemente, die Gleichaltrige und Gleichgeschlechtliche als stereotypes bzw. demographisches kollaboratves Filtern bezeichnet (siehe z. B. Drachsler, 2009, 57). 23
    • Beispiele von Empfehlungssystemen für kollaboratves Filtern Ausgewählte Beispiele für Empfehlungssysteme, die auf kollaboratven Filtern beruhen, werden in Klahold (2009) vorgestellt und hier zusammengefasst. Name Empfeh- Kurzbeschreibung Eigenschafsanalyse Proflbildung Distanzmaß Literatur lungsele- ment Tapestry E-Mails Anzeige von E-Mails, Relevanzbewertung Manuelle Pfege regelbasiert Goldberg u.a. die von anderen durch Nutzer (muss Nutzer aus- (1992) Nutzern als relevant wählen, dessen eingestuf werden Einschätzungen man nutzen will) Ringo Musik Vorschläge für Inter- Bewertungen durch Bewertung von Regelbasiert Shardanand & preten und Alben Nutzer Musikstücken (benutzerbezo- Maes (1995) gener Korrelat- onskoefzient) Group Lense Usenet- In Newsgroup-Rea- Bewertungen auf ei- Bewertung von Pearson Korre- Resnick u.a. Nachrichten dern werden Nach- ner Skala von 1-5 Usenet-Nachrich- latonskoefzi- (1994) richten gekennzeich- ten ent net Siteseer Bookmark- Browser-Bookmark- Manuelle Metada- Bookmarks und Nearest-Neig- Rucker & Polanco Empfehlun- vergleich ten und Bookmarks ihre Gruppierun- bours-Verfahren (1997) gen gen Jester (Eigen- Witze Witzempfehlungen Bewertung auf Initale Bewertung Nearest-Neig- Goldberg u.a. taste) 200er-Skala ausgewählter Wit- bours-Verfahren (2000) ze auf 200er-Skala, Zuordnung in Be- nutzergruppen (Clusteranalyse, 40 Gruppen) Amazon Bücher Bücherempfehlun- Kaufverhalten (ele- Weitere Empfeh- Kosinus-Ähn- Linden, Smith & gen „Käufer dieses mentbasiertes kolla- lungen zu aktuell lichkeitsmaß York (2003) Buches kaufen boratves Filtern) aufgerufenen Bü- zwischen Buch- auch...“ chern vektoren SurfLen Webseiten Empfehlungen im Webseitenaufrufe Weitere Empfeh- Heuristk Fu, Budzik & Browser-Plugin (elementbasiertes lungen zu aktuell Hammond (2000) kollaboratves Fil- aufgerufenen Web- tern) seiten Tabelle 5: Übersicht über ausgewählte Empfehlungssysteme die kollaboratves Filtern verwenden. Quelle: Klahold, 2009, 87f In dieser Übersicht werden, wie auch schon beim inhaltsbasierten Filtern, Verfahren der Ähnlichkeitsfeststellung genannt, auf die wir im Folgenden eingehen werden. 24
    • 2.6 Verfahren der Ähnlichkeitsfeststellung von Nutzern bzw. Elementen Beim inhaltsbasierten wie beim kollaboratven Filtern wird in aller Regel versucht, ähnli- che Nutzer bzw. ähnliche Elemente zu identfzieren: Es werden entweder ähnliche Nut- zerprofle oder auch ähnliche Elemente gesucht, um daraus Empfehlungen abzuleiten. Dazu kommen beim inhaltsbasierten und kollaboratven Filtern die gleichen Methoden zum Einsatz. Einige davon beschreiben wir im Folgenden kurz: Zum einen kommen dabei Verfahren, die Distanzen zwischen bzw. Ähnlichkeiten von Vektoren berechnen zum Ein- satz, denn wie oben dargestellt sind Vektoren die übliche Darstellung von Eigen- schafsproflen. Zum anderen werden Verfahren eingesetzt, die versuchen, Empfeh- lungselemente oder auch Nutzergruppen zuzuordnen. Distanzen und Ähnlichkeitsmaße von Vektoren Wenn es darum geht, „ähnliche“ Elemente zu empfehlen, müssen Aussagen über die Ähnlichkeiten von (allen) Elementen eines Korpus von möglichen Empfehlungselemen- ten vorliegen. Es gibt eine Vielzahl von Möglichkeiten, Aussagen über Ähnlichkeiten von Vektoren zu generieren. Bei den Verfahren werden in aller Regel zwei Vektoren miteinander verglichen. | Ein einfaches Verfahren beruht darauf zu zählen, wie of an der gleichen Stelle eines Vektors eine „1“ vorkommt, d.h. in unserem Beispiel, zu zählen, wieviele gemeinsa- me Worte zwei Texte aufweisen. Schnell wird allerdings klar, dass so längere Texte mit diesem Verfahren deutlich häufger „Ähnlichkeiten“ aufweisen als kürzere. Hier sind Korrekturen vorzunehmen. Folgende beiden Koefzienten wurden daher u.a. entwickelt. | Der Overlap-Koefzient berechnet sich aus dem Quotenten der gemeinsamen Wort- menge und der kleineren der beiden Wortmengen und kann als „Maß für die wech- selseitge Inklusion“ interpretert werden (Klahold, 2009, 73). Für den Vergleich von Vektor B und Vektor D des Beispiels berechnet er sich folgendermaßen: 5/12=0,42; 5 ist dabei die Zahl der gemeinsamen Worte, 12 die kleinere Wortmenge beider Vekto- ren. | Der Dice-Koefzient berechnet sich dem Quotenten der doppelten Anzahl der ge- meinsamen Worte und der Summe der Worte beider Wortmengen. Die Beziehung wird auch hier aus dem Grad des gemeinsamen Vorkommens von Worten abgeleitet. Im Beispiel berechnet sich der Koefzient für die Vektoren B und D folgendermaßen: 2*5/(14+12)=0,38; 5 ist dabei die Zahl der gemeinsamen Worte, 14 die Zahl der Wor- te von Vektor B, 12 die Zahl der Worte von Vektor D. Bei beiden Koefzienten kennzeichnen also höhere Werte eine größere Ähnlichkeit der Vektoren. Exemplarisch zeigen wir die Ergebnisse dieser Berechnungen an unserem Bei- spiel des Vergleichs von Liedertexten (s. Tabelle 2, S. 17 Und Tabelle 3, S. 19). 25
    • Ver- Vektoren gemein- Overlap- Dice-Koef- Pearson Kor- gleich same Koefzient zient relatonsko- Wort- efzient menge A,B VA=(1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0) 0 0,00 0,00 -0,43 VB=(0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0) B,C VB=(0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0) 1 0,09 0,08 -0,41 VC=(0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,1,1,1,1,1,1,1,1,1,0,0,0,0,0) C,D VC=(0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,1,1,1,1,1,1,1,1,1,0,0,0,0,0) 1 0,09 0,09 -0,34 VD=(0,0,1,0,1,0,0,0,0,0,0,0,0,1,1,1,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,1,1,1,1,1) A,C VA=(1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0) 0 0,00 0,00 -0,21 VC=(0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,1,1,1,1,1,1,1,1,1,0,0,0,0,0) B,D VB=(0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0) 5 0,42 0,38 0,04 VD=(0,0,1,0,1,0,0,0,0,0,0,0,0,1,1,1,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,1,1,1,1,1) Tabelle 6: Ausgewählte Koefzienten zum Vergleich von Vektoren In unserem Beispiel zeigt sich durch die Berechnung dieser Koefzienten (s. Tabelle 6), dass die Zeilen „Eins, zwei, drei, vier, Brüderchen, komm tanz mit mir. Eins, zwei, drei, vier, beide Hände reich ich dir“ sowie „Komm, tanz den Tango mit mir! Und folge mir im Tangoschrit hier! Ich tanz den Tanz ganz lange mit dir“ die größte Ähnlichkeit im Bezug auf die ihre (auf simple Weise extrahierten) Schlüsselwörter haben. Das Beispiel macht also auch deutlich, dass das Verfahren der Text-Extrahierung nicht immer brauchbare Er- gebnisse für nützliche Empfehlungen ergeben. Es erscheint wenig wahrscheinlich, dass jemand der ein Kinderlied mag, die Empfehlung eines Schlagers als sehr nützlich ein- schätzt. Schließlich gibt es weitere Verfahren der Ähnlichkeitsberechnungen, die das Streuungs- verhalten der Vektoren vergleichen (Klahold, 2009, 71): Der Pearson-Korrelatonskoef- zient vergleicht so die jeweiligen Abweichungen von den mitleren Werten für jede Ei- genschaf und kann Werte von -1 bis +1 ergeben. Eine negatve Korrelaton (-1) würde in unserem Beispiel bedeuten, dass die beiden zu vergleichenden Vektoren quasi spiegel- bildlich aufgebaut sind, z. B. V1=(0,0,1,1) und V2=(1,1,0,0). Gleiche bzw. ähnliche Vekto- ren würden hoch korrelieren (bis max. +1). Distanzen sind „der klassische Weg, die Dimension der 'Ähnlichkeit' mathematsch bere- chenbar zu machen“ (Klahold, 2009, 68). Im Folgenden werden zwei Beispiele für Di- stanzberechnungen vorgestellt: | Der Euklidische Abstand ist „die Wurzel der Summe der quadrierten Diferenzen über alle Koordinaten“ (Rahnenführer, 2009, 8). Im zwei- bzw. dreidimensionalen Raum ist der Euklidische Abstand der Abstand zwischen zwei Punkten im Koordinatensystem. | Der „Manhatan Abstand“ oder auch „City-Block-Abstand“ ist die „Summe der abso- luten (unquadrierten) Diferenzen über alle Koordinaten“ (Rahnenführer, 2008, 9). Im zweidimensionalen Raum ist der Manhaten-Abstand der Weg, den man gehen muss, wenn man nicht zu einem anderen Punkt geht, sondern sich nur in Richtung der Di- mensionen bewegen kann. In der Darstellung erinnern diese Abstände an die recht- winkligen Straßenpläne des Zentrums von New York. Ein weiteres Maß, das häufg eingesetzt wird, ist das Cosinus-Ähnlichkeitsmaß. Es be- rechnet den Unterschied zwischen den Winkeln der Vektoren durch deren Cosinus. Zwar 26
    • lässt sich dieses Vorgehen insbesondere bei den vieldimensionalen Vektoren unserer Beispiele bildlich kaum vorstellen, es handelt sich dabei allerdings um ein Standardver- fahren des Vektorenvergleichs. Je ähnlicher sich Vektoren sind, desto kleiner ist der Win- kel zwischen ihnen (s. Klahold, 2009, 72). Bei der Wahl eines Verfahrens sind neben der Laufzeitkomplexität auch weitere grund- sätzliche Überlegungen wichtg. Beispielsweise ist zu überlegen, ob grobe Unterschiede bei den Abweichungswerten (Streuungsmaß) der einzelnen Eigenschafen durch eine Normalisierung ausgeglichen werden sollten. Umgekehrt könnte auch überlegt werden, ob es Eigenschafen gibt, die wichtger bzw. unwichtger bei der Berechnung der Ähn- lichkeit sind und dementsprechend Gewichtungen vorgenommen werden sollten. Bei- spielsweise würde ein gleichwertger Einbezug aller Eigenschafen von Kleidungsstücken auf einer Handelsplatorm kaum nützliche Empfehlungen für Käufer ergeben: Hohe Zu- sammenhänge bzw. Ähnlichkeitsmaße würden sich typischerweise für die gleichen Pro- dukte in unterschiedlichen Konfektonsgrößen ergeben. Nützliche Empfehlungen sind je- doch eher passende oder ergänzende Kleidungsstücke in der gleichen Konfektonsgröße, beispielsweise das Hemd zur Jeans in der gleichen Konfektonsgröße (siehe auch Ab- schnit 2.7, S. 28). Klassifkatonsverfahren Während die bisher vorgestellten Verfahren versuchen, jedes Element in einem System miteinander zu vergleichen, versuchen die folgenden Verfahren, Elemente zu gruppie- ren. Empfohlen werden dann Elemente aus einer Gruppe. In der Regel werden die Grup- pen mit Trainingsdaten bzw. der aktuellen Version des Korpus unter Einbezug von Exper- tenwissen gebildet; weitere Elemente werden dann den Gruppen zugeordnet. Das Spek- trum an multvariaten Verfahren stellt zahlreiche Möglichkeiten und Ansätze zur Verfü- gung. Im Folgenden möchten wir nur kurz einige Ansätze skizzieren (s. Klahold, 2009, 77f): | Das Minimum-Descripton-Length-Verfahren verfolgt den Ansatz, dass ein Empfeh- lungselement immer derjenigen Klasse zugeordnet wird, bei deren erweiterter binär- codierten Darstellung am wenigsten Speicherplatz benötgt wird. Es basiert also auf der Annahme, dass das kompakteste Modell optmal ist. | Der Naive-Bayes-Klassifkator berechnet die bedingte Wahrscheinlichkeit, dass ein Empfehlungselement einer Klasse zugehörig ist. Es wird dabei von der (naiven) An- nahme ausgegangen, dass alle Atribute unabhängig voneinander aufreten. | Beim ID3-Verfahren wird mit Trainingsdaten ein Entscheidungsbaum aufgebaut. Dazu durchläuf ein Algorithmus die Daten, der jeweils diejenigen Eigenschafen (Vektor- positonen) auswählt, die den Korpus am deutlichsten teilen. Das kann bei Personen beispielsweise das Rauchverhalten sein (Raucher bzw. Nichtraucher). Alle Elemente werden dann in diesem Baum zugeordnet. | K-Means-Clustering ist das klassische Clustering-Verfahren. Besonderheit beim Clus- tering ist, dass die Gruppierungen erst im Verfahren entstehen und nicht schon vor- her bekannt sind. Es werden willkürlich im Vektorenraum Punkte ausgewählt und es wird geschaut, ob diese brauchbare „Zentren“ für Ansammlungen von Elementen (im mehrdimensionalen Vektorraum) sind. Dann wird solange iteratv verbessert, bis pas- sende „Cluster“ entdeckt und ausgewählt sind. 27
    • Soziale Netzwerkanalyse als alternatver Ansatz für die Ähnlichkeitssuche beim kolla- boratven Filtern Neben den oben beschriebenen „klassischen“ Verfahren der Ähnlichkeitsfeststellung gibt es Versuche, auch die Soziale Netzwerkanalyse als eigenständiges Verfahren für Empfehlungssysteme fruchtbar zu machen. Typischerweise spannen sich Kontakte und Kommunikaton wie ein Netz auf: Man kommuniziert mit jemandem, der wiederum mit anderen kommuniziert. Aus den Sozialwissenschafen gibt es mit der sozialen Netzwerk- analyse ein Verfahren, das die Vernetzung berechnen und darstellen lässt. Es kann also auch Nähe berechnet werden. Nun steckt hinter der Verwendung der sozialen Netz- werkanalyse in Empfehlungssystemen die Absicht, ein alternatves Instrument zur Be- rechnung von „Nähe“ zu erproben. Es gibt dazu erste Untersuchungen, die dermaßen generierte Empfehlungen mit herkömmlich generierten Empfehlungen vergleichen und mit beiden Verfahren ähnliche Ergebnisse erzielen (Kamper, Meyer & Reichart, 2008). 2.7 Ähnlichkeit und weitere Kriterien Häufg wird das Kriterium der Ähnlichkeit als Grundlage für Empfehlungen gewählt. So werden beispielsweise in Online-Shops Bücher mit ähnlichen Inhalten angeboten, weil man davon ausgeht, dass diese für den potenziellen Käufer interessant sind. Es wird da- von ausgegangen, dass Nutzer mit ähnlichem Profl auch ähnliche Interessen und Ge- schmack haben, so dass darauf aufauend nützliche Empfehlungen entstehen können. Allerdings ist das Kriterium der Ähnlichkeit nicht immer hilfreich. So kann es sein, dass bei der Suche nach einem portugiesischen Restaurant auch andere Restaurants empfoh- len werden, die ähnlich sind: Wenn diese jedoch in einem weit enternten Ort liegen, am gesuchten Tag geschlossen haben usw., ist die Ähnlichkeit kein nützliches Kriterium. Was also „nützlich“ erscheint, muss nicht zwangsläufg „ähnlich“ zu einem bestmmten Element sein oder auf Ähnlichkeiten mit anderen Benutzern beruhen. Weitere Kriterien können sein: Räumliche Nähe, Aktualität, Bewertungen, Komplementarität oder auch Vollständigkeit (siehe auch Abschnit 4.6, S. 71f). 2.8 Nachteile und Herausforderungen der Ansätze Die beiden vorgestellten Ansätze haben Vorteile, auf die im wesentlichen bereits einge- gangen wurde. Im folgenden werden kurz Einschränkungen und Herausforderungen der Verfahren beschrieben. Einschränkungen und Herausforderungen inhaltsbasierten Filterns Beim (reinen) inhaltsbasierten Filtern liegen folgende Einschränkungen und Herausfor- derungen für den Einsatz vor: | Es müssen bereits zahlreiche Daten über die zu empfehlenden Elemente vorliegen (z. B. in Form von Metadaten), durch Experten erstellt werden oder automatsch gene- riert werden. Während letzteres bei Texten, wie dargestellt, noch vergleichsweise einfach ist, ist es für textarme Materialien wie Videos, Musik und Fotos deutlich schwerer und stark eingeschränkt. | Das inhaltsbasierte Filtern vertraut nur auf die Inhalte der Objekte selbst und lässt Empfehlungen oder Erfahrungen von anderen (ähnlichen) Nutzern ausser Acht. 28
    • | Die Gewichtung der Eigenschafen von Empfehlungselementen, die bevorzugt bei Empfehlungen zum Tragen kommen sollen, ist sorgfältg vorzunehmen. So ist es beim Einkaufen im Online-Modeshop eher sinnvoll, ergänzende und passende Kleidung in der gleichen Konfektonsgröße empfohlen zu bekommen. Ein wesentlicher Vorteil der Nutzung vorhandener Daten ist beim inhaltsbasierten Fil- tern, dass solche Systeme von Anfang an „laufen“ und sinnvolle Empfehlungen geben können. Herausforderungen kollaboratven Filterns Beim inhaltsbasierten Filtern werden folgende Probleme gesehen (s. Klahold, 2009, 66f; sofern keine andere Quelle genannt): | Es gibt ein sogenanntes „Kaltstart-Problem“: Wenn eine gewisse kritsche Masse an Daten nicht vorhanden ist, können keine (sinnvollen) Empfehlungen gegeben wer- den. Voraussetzung eines solchen Systems ist also, dass es bereits eine aktve Com- munity und Nutzer bzw. generierte Daten gibt. Daher gibt es Ansätze, wie solche feh- lenden Daten, beispielsweise für neue Elemente (Neuerscheinungen) vorhergesagt werden können (s. Givon & Lavrenko, 2009). | Diese Abhängigkeit von den Aktvitäten der Nutzer ergibt auch die Herausforderung der „Spärlichkeit“: Benutzerbasierte Metadaten, die von den Benutzern selbst aktv vergeben wurden (Bewertung, Präferenzen, Empfehlungen), sind of nur spärlich vor- handen. | Das Problem der „grauen Schafe“ liegt vor, „wenn ein Benutzer bezüglich seiner Be- wertungen zwar Profl-Überdeckungen mit anderen Benutzern hat, diese aber in Sa- chen Bewertung so stark variieren, dass keine 'verwandten' Benutzer selektert wer- den können“ (Klahold, 2009, 150) Weitere Herausforderungen beziehen sich weniger auf die Datenlücken als auf die Be- sonderheiten kollaboratver Empfehlungen: | Der „Lemming-Efekt“ bezieht sich auf das Phänomen, dass Empfehlungen zu Selbst- läufern werden. Empfohlene Elemente werden häufg betrachtet oder gekauf. Da- durch wird die Relevanz „künstlich“ erhöht. Potenzielle Bestseller bei Amazon, bei- spielsweise von populären Krimiautoren, tauchen auf einmal in vielen Einkaufslisten auf; werden folglich in vielen Buchbeschreibungen als Kaufempfehlung gelistet, ob- wohl sachlich kein Zusammenhang besteht und sie bekommen dadurch eine erhöhte Aufmerksamkeit. Sprichwörtlich „wie die Lemminge“ kaufen Amazonkunden dann auf einmal ein Buch, nach dem sie ursprünglich gar nicht gesucht haben. | Wenn sich ein System nur auf die Nutzergemeinschaf „verlässt“ kann dies auch dazu führen, dass andere relevante, bzw. neue Empfehlungselemente nur schwer aufge- nommen werden, da alle mit den bereits vorhandenen Empfehlungen „eingedeckt sind“. Hier läuf das System bzw. ihre Nutzer in die Gefahr eines Tunnelblicks (Kla- hold, 2009, 118). Um solche Efekte vorzubeugen, empfehlt es sich zufällige „Emp- fehlungen“ zu geben. Aus Nutzersicht können sich weitere Schwächen ergeben. So kann es sein, dass bei- spielsweise Nutzerprofle relatv früh (bei der Registrierung) festgelegt werden und Ver- änderungen im Profl nicht unbedingt wahrgenommen werden müssen. 29
    • 2.9 Hybride Lösungen Eine Lösung, mit den Vor- und Nachteilen der beiden Ansätze des kollaboratven sowie des inhaltsbasierten Filterns umzugehen, ist die Kombinaton beider Verfahren. Tatsäch- lich wird dies inzwischen auch in vielen, wenn nicht sogar den meisten Empfehlungssys- temen im Web in dieser Weise realisiert. Bei einigen Systeme können sich Nutzer gegen- seitg „persönliche Empfehlungen“ schicken. Pfadbasierte Empfehlungen Ausgehend von der Erfahrung, dass viele die gleichen Wege nutzen um durch das Web zu navigieren, wurde das sogenannte pfadbasierte Verfahren (Engl. trail based) für Emp- fehlungen entwickelt (u.a. Gams & Reich, 2004). Dazu wurde ein Konzept entwickelt, wie solche Pfade im Web beschrieben werden können, wie Ähnlichkeiten der Pfade berech- net werden können und wie Benutzer mit ähnlichen Spuren gefunden werden können (Gams, 2005). Auf Grundlage dieser Fußspuren von Gleichgesinnten und -interessierten sollen dann Empfehlungen für die weitere Navigaton gegeben werden. Der Ansatz wur- de also für die Informatonsrecherche im Web vorgeschlagen und entwickelt. Bei Gams (2005) wurden im Experiment drei Szenarien durchgespielt und zwar jeweils mit und ohne Unterstützung durch den Empfehlungsservice. Dabei galt es vier Rechercheaufga- ben zu erledigen, u.a. mussten Projektpläne von vier Projekten gefunden werden, die mit Miteln der Europäischen Kommission ko-fnanziert wurden. Das System erhielt hier erwartungsgemäß positve Werte. Tabelle 7, 8: Durchschnitliche Zahl der Schrite und Zeiten für die Erledigung von 4 Aufgaben mit und ohne pfadbasierten Empfehlungen (n=14) Quelle: Gams, 2005, Tabellen 7.4 und 7.5, 152 Ontologiebasierte Ansätze Ontologiebasierte Ansätze verwendet weder inhaltsbasiertes noch kollaboratves Filtern wie oben beschrieben. Dieser Ansatz beruht im wesentlichen darauf, dass Ontologien verwendet werden. Mit ihrer Hilfe werden in diesem Fall auf fehlende Informatonen zu dem Nutzer geschlossen. Dadurch wird vermieden, dass die Nutzer z. B. fehlende Anga- ben in Fragebögen ergänzen müssen bzw. trotz lückenhafer Profle Empfehlungen gege- ben werden können. Ontologien sind eine Technologie, welche es erlaubt, reichhaltge Beziehungen auch für Computer berechenbar zu defnieren. Ontologien sind also kom- plexe Systeme der Datenbeschreibung, die von Experten entwickelt werden und Wis- sensbestände beschreiben. Mit ihnen lassen sich hierarchische Gliederungssysteme von Wissen (Taxonomien, z. B. Artenbeschreibungen in der Biologie), aber auch komplexe Angaben über die Relatonen von Wissen in einer Form darstellen, dass auch Computer diese verarbeiten können (vgl. Schafert u.a., 2009). 30
    • Schickel-Zuber (2007, 12) schließt bei den Einsatzmöglichkeiten die Finanzbranche, den Gaming- und den Gesundheitssektor aus. Dort würde er eher regelbasierte Ansätze ver- wenden. Für die von ihm untersuchten Anwendungsbereiche des Online-Handels mit umfangreichen Produktkatalogen hat er seinen Ansatz mit anderen Verfahren verglichen und gute Ergebnisse erhalten. Dabei zeigt sich u.a., dass der ontologiebasierte Ansatz v.a. im Bezug auf die Neuartgkeit der Empfehlungen sehr gute Werte erhält (S. 130). Die Ausarbeitungen von Schickel-Zuber (2007) wurden patentert und werden unter der Be- zeichnung „Prediggo Technologie“2 stark beworben. Tag-basierte Empfehlungen In traditonellen Medienarchiven werden Materialien zu Kategorien und Unterkategori- en zugeordnet, welche häufg auch zusätzliche Kurzbeschreibungen und Schlagworte beinhalten. Im Web hat sich ein Verfahren etabliert, das Nutzern ermöglicht, Webseiten oder andere Ressourcen (Bilder, Videos, Musikstücke) mit eigenen Schlagworten zu mar- kieren, sie zu „taggen“ (von Engl. „tag“: Etket). Mit Hilfe der Tags können andere ent- sprechende Ressourcen recherchieren; schnell haben sich populäre Webdienste entwi- ckelt (vgl. Schafert, Hilzensauer & Wieden-Bischof, 2009). Während die Erzeugung von traditonellen Metadaten eher einem ausgewählten Benutzerkreis vorbehalten ist, sind beim Social Tagging potenziell alle Benutzer beteiligt (Derntl et al., 2009). Es ist also „eine ofene, efziente Möglichkeit der Klassifkaton von Dokumenten“, weil „eine brei- te Palete von unterschiedlichen Termen für die Beschreibung eines Dokuments bereit- gestellt wird“ (Güntner, Sint & Westenthaler, 2009, 192). Tags werden als gute Datenbasis für Empfehlungen gesehen, da anzunehmen ist, dass Beiträge und Objekte ähnlich sind, wenn sie mit den identschen Tags versehen werden. Beispielsweise wird dieser Ansatz bei Librarything.com (2006) eingesetzt. Im Forschungsprojekt KiWi3 wird mit diesem Ansatz versucht, die Vorschläge für andere Wiki-Inhalte zu verbessern und auch semantsche Empfehlungen einzubauen, die auf den Tags der Nutzer des semantschen Wikis basieren (vgl. Dolog, 2009). Wir haben dazu Peter Dolog als zuständigen Experten Fragen gestellt. 2 htp://www.prediggo.com, Stand 12/2009 3 htp://www.kiwi-project.eu, Stand 02/2010 31
    • Interview mit Peter Dolog zu tagbasierten Empfehlungen ? Social Tagging ist sehr populär. Warum ist es aus Ihrer Sicht hilfreich, auf Grundlage von nutzergenierten Schlagworten Empfehlungen zu geben? ! Da gibt es zwei Aspekte des Social Tagging: den persönlichen Aspekt (eigene Tags) sowie den sozialen Aspekt, nämlich Tags von Personen in der Community, mit denen man in Beziehung steht. In beiden Fällen repräsenteren Tags Interesse, persönlicher oder gemeinschaflicher Art. Wenn daher die Tags gut kombiniert werden, kann das helfen, neue Entwicklungen, Informatonen, Diskussionen und so weiter zu fnden und aufzuzeigen. ? Tags sind manchmal nur persönliche Aufgabenbeschreibungen wie "erledigen". Wie gehen Sie mit sol- chen Tags um, die ofensichtlich für andere keinen Sinn machen? ! Es gibt immer einen Weg der Normalisierung. Einige Tags können einfach bei der Berechnung von Empfehlungen ausgeschlossen werden, wenn sie keinen Sinn machen. Das ist jedoch domänenabhängig und benötgt Konfguratonen. Aber auch "Erledigen"-Tags sind wichtg, weil sie aktuelle Aufgaben re- präsenteren, die von anderen genutzt werden können, weil sie Hinweise darauf geben, für was die Res- source nützlich sein könnte. Auch diese Tags könnten also hilfreich sein, um Ressourcen zu empfehlen, aber dies hängt vom Kontext ab. ? Was empfehlen Sie Entwicklern, die über ein tag-basiertes Empfehlungssystem nachdenken? ! Sie sollten die Tags mit zusätzlichen Informatonen verknüpfen, um sie für Empfehlungen nützlich zu machen. Dr. Peter Dolog ist Professor für „Intelligent Web and Informaton Systems“ am Computer Science De- partment der Universität Aalborg in Dänemark. Er forscht dort zu tag-basierten Empfehlungssystemen. Ein vollständiges Profl fndet sich auf seiner Homepage htp://www.cs.aau.dk/~dolog/ (12/2010) 32
    • Beispiele für hybride Empfehlungssysteme Eine Übersicht über Beispiele für solche hybriden Lösungen fndet sich in Klahold (2009): Name Emp.- Kurzbeschrei- Eigenschafsanalyse Proflbildung Distanzmaß Literatur ele- bung ment Fab Web- Einzelne Analyse TF-IDF-Derivat Erstellung und Vergleich von Cosinus-Ähnlich- Balabano- seiten zwischen Doku- Benutzerproflen (Verhalten keitsmaß, Nearest vic u.a. menten und Be- und Bewertungen) Neighbours Verfah- (1997) nutzern Empfehlungen auf Basis der ren Ähnlichkeit von Benutzern PHOAKS Web- Nach News- Manuelle Metadaten, Manuelle Erstellung des Pro- Cosinus-Ähnlich- Terveen, (People Help seiten groups gruppier- Heuristk, TF-IDF-Deri- fls durch Auswahl der News- keitsmaß, Nearest Hill, Amen- One another te Empfehlungen vat group Neighbours Verfah- to, Mc Do- Know Stuf) relevanter Web- ren nald & Cre- seiten ter (1997) Let's Browse Web- Webseiten (Sub- TF-IDF-Derivat Analyse einer „Start-Websei- Cosinus-Ähnlich- Lieberman, seiten seiten, Links) te“ (einfaches explizites keitsmaß Van Dyke & werden empfoh- Strukturprofl) sowie Verfol- Vivacqua len gung der Links (1999) CASMIR Doku- Empfehlung von TF-IDF-Derivat Erstellung eines Profls durch Cosinus-Ähnlich- Klahold mente Dokumenten die Gewichtung von Wort- keitsmaß (2009) nach Relevanz vektoren (Interesse) LaboUr Web- Auf Basis des TF-IDF-Derivat Generierung eines Benutzer- Naiven Bayes Klas- Pohl & Nick (Learning seiten Profls werden profls aus dem impliziten sifkator (NBK), (1999) about the verwandte Be- Verhalten Pearson Korrelat- User) nutzer gesucht onskoefzienten (PC) Tango Artkel Noch nicht gele- Manuelle Metadaten, Manuelle Pfege (Kategorien, Overlap Koefzient Claypool sene Artkel wer- TF-IDF-Derivat, Schlüsselworte) (OK), Pearson Kor- u.a. (1999) den empfohlen Bewertung von Artkel relatonskoefzein- auf einer Skala von 1- ten (PC) 10 Nakif Filme Filme werden TF-IDF-Derivat Manuelle Pfege: Benutzer Heuristk Klahold empfohlen sowie die Empfehlungsele- (2009) mente (z. B. Filme) haben ei- gene Profle; Kombinaton von Wertungsspalten MovieLens Filme Filme werden DoppelgaengerBots Bewertung von Filmen auf ei- Heuristk, Pearson Good, empfohlen (TF-IDF-Derivat) ana- ner Skala von 1-5 Korrelatonskoef- Schafer, lysieren die Filmbe- zienten (PC), Cosi- Konstan & schreibung nus-Ähnlichkeits- Borchers RipperBots – iterat- maß (1999) ven Regelerzeugung GenreBots bewerten Filme in Abhängigkeit des Genres Tabelle 9: Übersicht über ausgewählte hybride Empfehlungssysteme Quelle: Klahold, 2009, 144f 33
    • 34
    • 3 EMPFEHLUNGSSYSTEME: AUSGEWÄHLTE EINSATZGEBIETE Überall dort, wo mit pffgen Ideen und guten Lösungen Geld verdient werden kann, ist es schwierig, konkrete Aussagen über technologische Lösungen zu bekommen. Dies trift nach unseren Erfahrungen insbesondere auf Empfehlungssysteme zu: Gute Lösun- gen für Empfehlungssysteme lassen sich in der Regel mit geringen Adaptonen an meh- rere Kunden aus unterschiedlichen Branchen verkaufen. Dabei gibt es jedoch keine Ver- lautbarungen dazu, welche Systeme, die zum Teil in der wissenschaflichen Literatur be- schrieben werden, bei Firmen eingesetzt werden. Hinzu kommt wohl auch, dass die ex- akten Vorgänge und Algorithmen of schwer zu beschreiben sind. Abbildung 7: Ausschnit aus der SonntagsZeitung zu einem Artkel über Gavin Poter, Entwickler eines Empfehlungssystem Quelle: SonntagsZeitung, 13. Juli 2008, 81 Auf alle Fälle haten wir bei den folgenden Beschreibungen von Realisierungen der Emp- fehlungssysteme das Problem, dass es in der Regel nur unzureichende Beschreibungen der konkreten Lösung frei verfügbar gibt. Was da genau passiert, wird of mit einem Halbsatz abgehandelt, nach dem Moto „and the magic occurs“, oder es werden andere esoterische Bezüge gegeben (siehe Auszug der SonntagsZeitung in Abbildung 7). 3.1 Überblick über fünf ausgewählte Einsatzgebiete Im Folgenden haben wir uns fünf Einsatzgebiete, in denen Reputatonssysteme zur Erfül- lung von unterschiedlichen Zwecken eingesetzt werden können, genauer angeschaut. Die Einsatzgebiete wurde gezielt so ausgewählt, dass eine möglichst weite Spanne abge- deckt und viele verschiedene Varianten vorgestellt werden können. 35
    • Einsatzgebiet Experten- und Ar- Partnersuche Produkte und Web-Materialien Prozess- beitsplatzsuche Dienstleistungen empfehlungen Absicht Arbeitsstellen bzw. Finden von Lebens- Unterstützung bei Empfehlungen für diverse (u.a. Arznei- Experten mit größt- partnern der Entscheidung für kostenlos zugängli- verschreibung, Unter- möglicher Passung Produkte und che Materialien stützung Lernender, zu fnden Dienstleistungen Fernsehprodukton) Verfahren Suchanfragen und Eingangsbefragung, Alle bekannten Emp- of tagbasierte Emp- Inhaltsbasierte und Ergebnisse aufgrund Partnervorschläge fehlungsverfahren fehlungen und kolla- kollaboratve Ansätze eigenschafsbasier- aufgrund paarpsy- sind im Einsatz boratves Filtern ter Verfahren; aber chologischer Er- auch Inhalts- und kenntnisse, eigen- Netzwerkanalysen schafsbasierte, teils fallbasierte Verfah- ren Visualisierung Ranglisten (v.a. Su- Ranglisten mit Fo- u.a. Treferlisten für Markierung im Text, Treferlisten, Vor- chergebnisse) tos, teils inkl. „Mat- Empfehlungen am Ranglisten schläge, auch Signal- ching-Punkte“, auch Seitenrand, Ranglis- ton (Alarm!) Benachrichtung per ten, E-Mail-Benach- E-Mail richtgung Anmerkung Gewichtung der Ei- Partnervorschläge Online-Händler für - Einige der Beispiele genschafen (z. B. nach Passung der Ei- Bestseller verwen- sind nicht webbasiert räumliche Nähe) z. T. genschafen, auf- den eher kollabort- notwendig grund persönlich- ves Filtern, Nischen- keitspsychologischer händler und Spezia- Untersuchungen listen eher inhalts- basiertes Filtern Beispiele Virtueller Arbeits- Parship, Friens- Amazon, Zappas, Photoree, fwd, Re- ALOE, LIVE u.a. markt, Manager cout24, Elitepartner Last.fm, Library- Mashed u.a. Lounge, Biomedex- Things, Preiser Re- perts cords, Pandora, Mo- vielens u.a. Tabelle 10: Charakteristk der Empfehlungssysteme in ausgewählten Einsatzgebieten Im folgenden stellen wir die einzelnen Bereiche und Beispiele vor, soweit wir dazu Infor- matonen gefunden haben. 3.2 Experten- und Arbeitsplatzsuche im Web Während es nicht weiter schlimm ist, mal eine Filmempfehlungen zu erhalten, die nicht ganz den eigenen Geschmack trift, sind Fehlgrife bei der Personalauswahl deutlich ver- heerender. Nicht zuletzt daher wird hier versucht, „fehlerhafe“ Empfehlungen weitest- gehend zu vermeiden. Ofensichtliche Vorteile bieten Online-Jobbörsen, Business-Clubs und Karriere- oder Expertenplatormen daher nicht nur für Unternehmen, sondern auch für Arbeitssuchende selbst. Im folgenden stellen wir Empfehlungssysteme für die Arbeitsplatz- und Expertensuche vor. Wie sich zeigt, arbeiten diese, soweit wir dies von aussen beurteilen können, fast alle mit einem eigenschafsbasierten Ansatz, d.h. Empfehlungen werden aufgrund des Nutzerprofls bzw. der Sucheingaben gegeben. Bei der vorgestellten Expertensuche im biomedizinischen Bereich wird neben semantsch unterstützten Auswertungen der Ver- öfentlichungen als Grundlage eine soziale Netzwerksanalyse verwendet. Schließlich stellen wir kurz das Modell eines Empfehlungsservices für Arbeitnehmer vor, der auf kol- laboratvem Filtern, nämlich Angaben von Arbeitgebern, beruhen soll. 36
    • Virtueller Arbeitsmarkt der deutschen Arbeitsagenturen Am „Virtuellen Arbeitsmarkt“, der Stellen- und Bewerberbörse der deutschen Bundesan- stalt für Arbeit, werden Arbeitssuchenden Stellenvorschläge gemacht. Als Arbeitssu- chender kann man in der Detailsuche bis zu 15 Kriterien angeben, beispielsweise Regi- on, PLZ, Mindestgehalt. Im System können sich auch Arbeitgeber Stellensuchende vor- schlagen lassen, dabei sind u.a. auch persönliche und soziale Fähigkeiten auswählbar. Diese Informatonen beruhen auf den Selbstauskünfen der Stellensuchenden. Zwar unterliegen die genauen verwendeten Empfehlungsverfahren der Geheimhaltung, es ist aber bekannt, dass die Sofware ELISE 5.0 von der Firma WCC eingesetzt wird, die auch beim englischen Arbeitsmarktservice, dem „Job Center Plus“ verwendet wird (vgl. Heymann, 2004, 14). Daher werden wird uns im folgenden darauf beschränken müssen, die Funktonalitäten zu beschreiben. Ofensichtlich wird im System jedoch kein kollabo- ratves Filtern eingesetzt, weil keine entsprechenden Daten erfragt werden (z. B. Bewer- tungen von Arbeitgebern oder Arbeitssuchenden). In einer Seminararbeit weisst Heymann darauf hin, dass das System Schwierigkeiten hat, die korrekte Semantk zu erkennen: „So erhält man bei der Suche nach einem „Astro- nom“ eine 100%ige Trefergenauigkeit für einen „Gastronom“. Gibt man die im Arbeits- leben synonymen Begrife „Logopäde“, „Sprachtherapeut“ und „Sprachheilpädagoge“ an (…), so werden nur Trefer mit der exakten Berufsbezeichnung geliefert“ (Heymann, 2004, 15). Ein Test hat ergeben, dass auch heute bei der Suche nach dem Beruf „Astro- nom“ auch diverse Gastronomie-Berufe vorgeschlagen werden und Stellensuchende un- bedingt alle synonym verwendeten Berufsbezeichnungen verwenden sollten, um alle Stellenanzeigen zu sehen: Weiterhin erhält man bei der Suche nach „Logopäde“ nicht auch automatsch alle Anzeigen für „Sprachtherapeut“ oder „Sprachheilpädagoge“4. Da im Formular angekreuzt werden kann „Keine Stellenangebote mit ähnlichen Berufen an- zeigen“ geht ein Stellensucher höchstwahrscheinlich (und irrtümlich) davon aus, ver- wandte Stellen angezeigt zu bekommen. Heymann (2004) fasst zusammen, und auf- grund des von uns gewonnen Eindruck bestätgen wir diesen Eindruck, „dass das Ge- samtsystem derzeit noch nicht die Leistung bietet, die a) von der Bundesagentur ange- strebt wird und b) den Anwendern des Systems den Eindruck vermitelt, ein kompe- tentes Empfehlungssystem zu sein“ (S. 16). Die Jobbörse Manager-Lounge Manager-Lounge5 ist eine internetbasierte Jobbörse, die sich auf die Vermitlung von Top-Management-Positonen ab einem Jahresgehalt von 100.000 Euro spezialisiert hat und dabei wie ein Businessclub agiert. Die streng defnierten Aufnahmebedingungen (z. B. mehrjährige Personal-, Budget- und Führungsverantwortung) sollen Exklusivität ga- ranteren. Derzeit gibt es einen geschlossenen Mitgliederkreis von über 2.200 Personen, die sich auch auf regelmäßig statindenden lokalen Versammlungen trefen. Erst nach einer erfolgreichen Testphase (z. B. Coaching- und Aufnahme-Telefonat, Einhaltung der Clubregeln, Engagement) wird das Mitglied in den kostenpfichtgen Club aufgenommen. Die Daten für das Profl des Bewerbers werden nach und nach manuell von Manager- Lounge selbst in den sogenannten MatchManager übertragen und stellen die Basis für den Vermitlungsprozess dar. Die Erhebung der Daten erfolgt dabei durch ein elektroni- sches oder schrifliches Antragsformular, das von dem Bewerber mit den wichtgsten 4 Diese Überprüfung wurde am 23.1.2010 vorgenommen. 5 htps://manager-lounge.manager-magazin.de, Stand 02/2010 37
    • Daten (z. B. Kontakt, Alter, derzeitge Stelle) ausgefüllt werden muss, sowie ein telefoni- sches Coaching- und Aufnahmegespräch, in dem die Angaben des Antragstellers über- prüf sowie ein Lebenslauf und Fähigkeitenprofl erstellt werden. Unternehmen, die nach Bewerbern in der Manager-Lounge suchen, geben ein Suchpro- fl in den sogenannten Match-Manager ein. Dieses wird mit den in der Datenbank vor- handenen Proflen abgeglichen. Als Abfragekriterium sind auch Und- und Oder-Verknüp- fungen möglich. Das Suchprofl umfasst sieben Kategorien, wie beispielsweise Positon, Funkton, Branche und Alter. Als Ergebnis werden anonymisierte Mitglieder angezeigt, die den Auswahlkriterien entsprechen. Hat das Unternehmen Interesse an einem be- stmmten Person gefunden, dann kann es mit dem Kandidaten in Kontakt treten. Dem Angeschriebenen steht es dann auch frei, seine Anonymität aufzuheben und seinen Le- benslauf zur Ansicht freizugeben (Heymann, 2004, 17f). Biomedexperts Strukturiertes Wissen und ein vielseitges Netzwerk sind wichtge Voraussetzungen für die wissenschafliche Zusammenarbeit. Biomedexperts6 ist ein soziales Netzwerk, das Forscher und Experten im Anwendungsfeld der Biowissenschafen sowie Mediziner und Fachjournalisten zusammenbringt, um einen länderübergreifenden wissenschaflichen Austausch sowie ein gemeinsames Arbeiten zu ermöglichen und zu verbessern. Die für Mitglieder kostenlose Platorm wurde 2008 von Collexis7 ins Leben gerufen. Seitdem sind über 270.000 Biowissenschafler dem Netzwerk beigetreten. Nachdem sich der Nutzer angemeldet hat und sein Fachgebiet angegeben hat, liefert ihm das System Ex- perten aus dem Sachgebiet auf der Basis der Häufgkeit von wissenschaflichen Publika- tonen. Biomedexpert wertet dazu kontnuierlich Publikatonen aus dem Fachgebiet aus und generiert und ergänzt so automatsch Profle der Mitglieder. Biomedexperts schaft es auf diesem Weg weltweit fast alle Forscher im Bereich der Biowissenschafen, die in den letzten zehn Jahren publiziert haben, in das Netzwerk einzubeziehen, sämtliche re- levanten professionellen Verbindungen innerhalb des Netzwerks zu analysieren und neue mögliche Forschungspartner, Mitautoren, usw. ausfndig zu machen. Mitglieder können im System nach Name, Land oder Schlüsselwörter (z. B. Krankheiten, Sympto- me) suchen und so ihr eigenes Netzwerk aufauen, welches auch die Koautoren von Ko- autoren umfasst. Wie bei sozialen Netzwerken üblich, können neue Kollegen eingeladen werden und Mitglieder dem eigenen Netzwerk hinzufügen. Auch ist ein detailliertes wis- senschafliches Profl mit den Publikatonen des Mitglieds, deren Relevanz sowie der Pu- blikatonshäufgkeit im Verlauf der Jahre einzusehen. Eine geographische Darstellung zeigt in welchen Ländern der jeweilige Experte vernetzt ist (Herzog & Dix, 2009). Durch die sogenannte „Fingerprint-Technologie“ (Engl. für „Fingerabdruck“), die hinter dem System von Biomedexperts steckt, werden mehrdeutge oder irrelevante Ergebnis- se automatsch eliminiert. Dies ist durch eine semantsche Analyse von Textdokumen- ten, durch die interne und externe Dokumente analysiert, aggregiert und semantsch verknüpf werden können, möglich. „Die semantsche Analyse erfolgt auf der Basis eines oder mehrerer Thesauri. Bei der Indexierung eines Textes wird jeder Begrif des Doku- mentes mit den eingebundenen Fachthesauri verglichen. Taucht ein Begrif sowohl im Text als auch im Thesaurus auf, wird er in dem sogenannten Fingerprint des Dokuments gespeichert. Für jeden Begrif des Fingerprints wird nun mitels komplexer Algorithmen die Relevanz im Kontext des verarbeitenden Textes ermitelt. So wird eine gewichtete In- 6 htp://www.biomedexperts.com, Stand 02/2009 7 htp://www.collexis.com, Stand 02/2010 38
    • dizierung durchgeführt, die als Ergebnis eine inhaltliche Repräsentaton des Ausgangs- textes bereitstellt. Diese Konzeptzuordnung schließt Mehrdeutgkeiten und mangelnde Priorisierung aus, die bei Stchwortsuchen aufreten“ (Herzog & Dix, 2009). Abbildung 8: Empfehlung von Experten auf Basis der Autorschaf und Themen in wissenschaflichen Publikatonen Quelle: htp://www.biomedexperts.com (02/2010) Bei Biomedexpert wird die Suche nach Experten also durch eine Kombinaton von In- haltsanalysen der verknüpfen Veröfentlichungen sowie von Netzwerkanalysen der Au- torenschaf erleichtert. Konzept für ein Arbeitnehmerempfehlungsservice Färber u.a. entwerfen ein Modell zur Empfehlung von Arbeitnehmer aufgrund der Ein- schätzungen von Personalmanagern, das daimit auf kollaboratvem Filtern beruht. Als Eigenschafen für die Arbeitnehmer werden dazu direkt erfassbare Kriterien (Alter, Ge- haltsvorstellungen) als auch Einschätzungen zur Führungsqualität gegeben. Dazu wur- den auch standardisierte Verfahren und Hilfsmitel eingesetzt (Färber, Weitzel, Keim & Wendt, 2002; s. Heymann, 2004). 3.3 Partnersuche im Web Freundschafen und Partnerschafen werden immer häufger im Web geknüpf. Immer mehr Services versuchen, das Zusammenfnden von potenziellen Freunden und Part- nern zu erleichtern. Schon im Frühjahr 2003 haben acht Prozent der Internetnutzer an- gegeben, ihren aktuellen Lebenspartner im Netz gefunden zu haben (TNS EMNID, 2003). Die Suche nach potenziellen Partnern erfolgt dabei in Chatoren der Region, oder auch mithilfe von professionellen Paaragenturen. Doch nach welchen Kriterien werden Partnervorschläge gegeben? Hier spielen zum einen grundsätzliches Überlegungen, ob jemand (Nicht-) Raucher ist, oder ob Kinder vorhanden sind und auch die Region, in der jemand lebt, eine Rolle. Zieht man auch Per- sönlichkeitsmerkmale in Betracht, ist nicht mehr so eindeutg, welche Personen empfoh- len werden sollten: Sollten die potenziellen Paare besonders viele gemeinsamen Inter- 39
    • essen haben? Sollten Sie möglichst ähnlich in Ihrem Verhalten und Werten sein, z. B. im Grad ihrer Impulsivität, Introvertertheit oder Risikofreudigkeit? Volksweisheiten sind hier nicht hilfreich; so sprechen sie zum einen davon, dass sich „Gleich und Gleich gerne gesellt“, zum anderen davon, dass sich „Gegensätze anziehen“. Allerdings gibt es zahlreiche Studien, die sich genau mit dieser Thematk auseinander- setzen. In einer amerikanischen Untersuchung von über 1.000 Personen zwischen 18 und 24 Jahren kamen die Verhaltensforscher Buston und Emlen (2003) zu dem Ergebnis, dass die Partnerwahl auf Ähnlichkeiten abzielt. Männer wie auch Frauen suchen nach Partnern mit ähnlichen Qualitäten (z. B. Interessen, gemeinsame Werte, ähnliche famili- äre Herkunf), da diese eine größere Stabilität versprechen. Auch die Mannheimer Psy- chologin Beatrice Rammstedt vom Gesis-Leipniz-Insttut für Sozialwissenschafen und ihr Berliner Kollege Jürgen Schupp vom Deutschen Insttut für Wirtschafsförderung ka- men zu dem Ergebnis, dass sich Gleich und Gleich gern gesellt, als sie nahezu 7.000 Paa- re befragten. Zumindest auf längere Sicht kommen Partner besser miteinander aus, bei denen in den drei Dimensionen Verträglichkeit, Gewissenhafigkeit und Ofenheit eine Ähnlichkeit vorherrscht (Stüvel, 2009). Die Studien der Psychologie zeigen jedoch auch, dass Ähnlichkeit hier – anders als in an- deren Gebieten der Empfehlungssysteme – unter Umständen nicht das beste Kriterium ist: Beim Kennenlernen und auch im Bezug auf die Beständigkeit einer Partnerschaf zeigt sich, dass Persönlichkeitsprofle gut miteinander harmonieren sollten, was aber nicht mit einer Kongruenz der Profle zu verwechseln ist. Partner- und Freundschafsver- mitlung sind immer dann besonders glücklich und erfolgreich, wenn die Personen pas- sende Lebensstle, gemeinsame Wertvorstellungen, Interessen und Ziele haben (Klam- bauer, 2008); das bedeutet jedoch nicht, dass sie sich im hohen Grade übereinstmmen- de Eigenschafsprofle haben müssen. Friendscout24 Friendscout248 wurde 1999 gegründet und verfügt mitlerweile über rund zehn Millio- nen Mitgliederprofle in ganz Europa. Nutzer können sich kostenlos mit einem Pseud- onym registrieren und in ihrem persönlichen Profl beschreiben. Seit 2009 setzt Friends- cout24 einen Fragebogen ein, der neben Fragen über die eigene Person (Geburtsdatum, Beruf, Aussehen) auch Fragen zum Aussehen des Wunschpartners, Beziehungsvorstel- lungen, Sternzeichen oder Lieblingsliteratur stellt. Die Partnersuche kann entweder über die Schnellsuche (Abfrage von Geschlecht, Alter, Postleitzahl, Land) oder über eine de- taillierte Suchmaske statinden und dann beispielsweise auch Aussehen, Bildung, Fami- lienstand und Lebensstl berücksichtgen. Das System ist also ein rein inhaltsbasiertes System, bei dem aus der Gesamtmenge an Mitgliedern die passenden bzw. passendsten Partner gefltert werden. Die Partnermat- ching-Funkton wird anhand eines Kompatbilitäts-Tests durchgeführt, der das Ausmaß der Übereinstmmung zwischen zwei Personen misst. Je höher die Ausprägung des ICI (Interpersonal Compatbility Indicator) ist, desto besser passen zwei Personen zusam- men. Nach Angaben von Friendscout24 waren Experten der Universität Bucknell (USA) bei der Entwicklung des Systems beteiligt (Friendscout24, 2002). 8 htp://www.friendscout24.de, Stand 01/2010 40
    • Parship Der Service Parship.de ist Marktührer im deutschsprachigen Raum. In seiner Datenbank sind derzeit rund 5.500.000 Partnersuchende registriert, davon sind 49 Prozent männ- lich und 51 Prozent weiblich (Stand01/20109). Nach der Registrierung legen Nutzer ihr Online-Profl bei Parship10 an und füllen einen Persönlichkeitstest mit 80 Fragen aus. Par- ship erstellt daraus ein Profl partnerschafsrelevanter Persönlichkeitsmerkmale und wertet 24 wesentliche Charaktereigenschafen aus (nach dem „Parship-Prinzip“). Basie- rend darauf werden anonymisierte Partnervorschläge gegeben, die am besten zu dem Nutzer passen. Aktve Mitglieder, die sich häufg einloggen, werden dabei bevorzugt vor- geschlagen. Ein mit der Universität Hamburg entwickelter Algorithmus, unter der Lei- tung von Prof. Dr. Hugo Schmale, berechnet wie gut einzelne Mitglieder auf welchen Ge- bieten zusammenpassen und durch welche Eigenschafen sie sich gut ergänzen. Welche Muss-Kriterien (Alter, Größe) der passende Partner tatsächlich haben soll, kann vom Mitglied selbst defniert werden. Die Vorschläge sind nach dem Grad der Übereinstm- mung (max. 100 Punkte) sortert. ElitePartner ElitePartner11 hat rund 2 Millionen Mitglieder, davon 53 Prozent Frauen und 47 Prozent Männer. Nach der Anmeldung bei ElitePartner durchlaufen Nutzer einen dynamischen Persönlichkeitstest, welcher von Wissenschaflern unter der Leitung des Diplom-Psycho- logen Volker Drewes entwickelt wurde und davon ausgeht, das Menschen sich verän- dern und gemeinsam entwickeln. Basierend auf Erkenntnissen der Beziehungsforschung werden im Test Persönlichkeitsmerkmale, die für eine glückliche Partnerschaf relevant sind (z. B. Nähe und Distanz), soziale Kompetenzen, Interessen und Handlungsmotve (z. B. Anerkennung, Unabhängigkeit, Romantk) analysiert. Mit Hilfe des Algorithmus werden die Antworten im Persönlichkeitstest mit denen der anderen Mitgliederprofle verglichen und passende Partnervorschläge herausgefltert. Die Passung wird in Form von „Matching-Punkten“ ausgedrückt. Der Matching-Algorithmus kombiniert Elemente aus verschiedenen paarpsychologischen Tests miteinander. Die vorgeschlagenen Partner können vom Nutzer mit „+“, „o“ oder „-“ bewertet werden, wodurch die Auswahl quali- tatv hochwertger und genauer wird, das System lernt dabei mit (ElitePartner, 201012). Diese dynamische Anpassung an eventuell konkreter werdende Partnervorstellungen, also der Einsatz fallbasierter Empfehlungen, scheint ein Alleinstellungsmerkmal dieses Verfahrens zu sein. 9 htp://www.singleboersen-vergleich.de/analysen/parship.htm, Stand 01/2009 10 htp://www.parship.de, Stand 02/2010 11 htp://www.elitepartner.de, Stand 02/2010 12 htps://www.elitepartner.de/km/service/matching/persoenlichkeitstest_details.html, Stand 01/2010 41
    • Abbildung 9: Partner-Matching auf ElitePartner Quelle: htp://www.datngservices.at/2009/08/elitepartner (02/2010) 3.4 Produktempfehlungen Das Angebot an Produkten und Dienstleistungen, die im Web zu kaufen sind, ist riesig. Empfehlungssysteme bieten Käufern Recherche- und Kaufunterstützung. Während man sich früher zum Beispiel im Musikladen auf die Empfehlungen der Verkäufer verlassen musste bzw. sich an den vorhandenen Schallplaten und CDs orienteren musste, fnden sich jetzt im Internet die Angaben zu tausenden von Musikstücken. Musikstücke lassen sich so leicht recherchieren, sorteren und es gibt dazu Rezensionen zu lesen und Hör- proben oder ganze Stücke anzuhören: Die immer größer werdene Zahl an Musikstücken weckt den Bedarf für Empfehlungssysteme (vgl. Block & Pohl, 2006). Für Online-Händler sind gute Empfehlungsysteme also wichtg. Auch für den herkömmli- chen Handel werden immer häufger im Vorfeld Online-Recherchen vorgenommen, wel- che Produkte besonders interessant sind. Die Motvaton zum Kauf hängt häufg stark davon ab, was andere über das Produkt denken. Auch laut der „Digital-Consumer-Beha- vior“-Studie von „avenue a razorfsh“, bei der insgesamt 475 US-amerikanische Onli- neshop-Kunden befragt wurden, vertrauen Kunden bei der Recherche nach Produkten vor allem den Bewertungen und Rezensionen von anderen Nutzern (Schmit, 2007). Dies bestätgte auch eine Erhebung der Nielsen Company bei der insgesamt 26.312 Internet- nutzer in 48 Märkten in Europa, Asien, Nord-Amerika, Afrika und dem Mitleren Osten zum Einkauf via Internet befragt wurden. „Recommendatons from fellow consumers – whether they are people they know or fellow online shoppers – play an enormous role in the decision-making process“ (Nielson Company, 2008). Im folgenden beschreiben wir Empfehlungssysteme von Online-Händlern als auch von Websites, deren Fokus weniger im direkten Absatz liegt, als bei der Rechecheunterstüt- zung. Schaut man sich die verschiedenen Empfehlungssysteme an, dann zeigen sich deutliche Unterschiede, ob hinter einem System der Wunsch steht, z. B. Bücher zu ver- kaufen oder nur zu empfehlen. Amazon geht beispielsweise davon aus, dass der Käufer 42
    • auch immer der Konsument ist. So werden bei Amazon häufg Empfehlungen von neu erschienenen oder der am meisten gekaufen Bücher gegeben, während nicht primär auf Verkauf gerichtete Angebote, wie die beschriebene Platorm Librarything eher ver- sucht, passende Bücher zu empfehlen. Tendenziell zeigt sich, dass Angebote die den all- gemeinen Mainstream der Kunden bedienen und entsprechende Empfehlungen für ak- tuell nachgefragte und neuerschienene Bücher geben wollen, eher kollaboratve Filter nutzen. Im Unterschied dazu beschreiben wir eine Reihe von Empfehlungsdiensten für Musikstücke die mit inhaltsbasiertem Filtern auch (eher) unbekannte Stücke empfehlen (können). Produktempfehlungen werden natürlich auch in anderen Branchen als den im Folgen- den vorwiegend näher beschriebenen Buch- und Filmbereich gegeben: So werden in der Finanzbranche Empfehlungssysteme zur Unterstützung der Entscheidungsprozesse beim Kauf von Produkten eingesetzt. Diese beruhen in der Regel auf eigenschafsbasiertes Fil- tern der Inhalte, z. B. durch Ausfüllen von Suchmasken mit persönlichen Daten und Risi- koeinschätzung (z. B. für Investmentonds Kaas & Schneider, 2007). Auch werden Emp- fehlungssysteme bei der Wahl der Urlaubsreise bzw. des Hotels eingesetzt (z. B. Glachs & Osterrieder, 2006). Buch- und Produktempfehlungen bei Amazon Das erste Empfehlungssystem welches von Amazon13 verwendet wurde nannte sich BookMatcher. Die Sofware dafür wurde von einem externen Unternehmen bereitge- stellt, erfüllte jedoch nicht seinen Zweck (z. B. langsam, unzuverlässig) und wurde schon bald danach wieder eingestellt. Das neue Empfehlungssystem sollte schnell, skalierbar und schon bei einer geringen Anzahl an Bewertungen oder Einkäufen einsetzbar sein (Linden, 2006). Der Ansatz, der heute hinter dem System von Amazon steckt, nennt sich „Item-to-Item Collaboratve Filtering“. Dabei werden nicht Ähnlichkeiten bei den Nutzern, wie es beim kollaboratven Filtern traditonell geschieht, sondern Ähnlichkeiten zwischen den konsu- mierten und von den Nutzern bewerteten Produkten herangezogen (s. Linden, Smith & York, 2003, 78f). Auf Amazon gibt es verschiedene Arten von Empfehlungen für die Nutzer. Allgemein werden die Produkte, die gerade am beliebtesten und am meist verkaufen sind, als „Bestseller“ vorgestellt. Dies gibt Nutzern einen guten Überblick, welche Artkel die All- gemeinheit interessant fndet. Dabei geht jedoch nicht unmitelbar hervor, ob die Nut- zer auch wirklich zufrieden mit dem Produkt sind. So gibt es eine Reihe von personalisierten Empfehlungen, die aufgrund der individuellen Nutzerhistorie, also des Käuferprofls, des Wunschzetels, der Bewertungen oder der be- trachteten Produkte gegeben werden. Beispielsweise informieren sie den Nutzer über neue Produkte, die ihn eventuell interessieren könnten: „Kunden, die Artkel von Ihrem Wunschzetel gekauf haben, kaufen auch ...“. So werden auf der Seite der Produktbeschreibung eine Reihe von weiteren Produktemp- fehlungen gegeben: Am bekanntesten ist wohl die Empfehlung, welche anderen Produk- te Käufer dieses Produktes gekauf haben, oder was Kunden gekauf haben, nachdem sie diesen Artkel angesehen haben. 13 htp://www.amazon.com, Stand 03/2010 43
    • Die Beschreibungen der Produkte werden durch Kundenrezensionen und Bewertungen ergänzt, es gibt also einen Überblick, wie zufrieden oder unzufrieden andere Nutzer mit einem gekaufen Artkel sind. Jeder registrierte Nutzer hat auf Amazon die Möglichkeit seine Meinung kundzutun und die Produkte mit Sternen (1-5) zu bewerten. Abbildung 10: Diverse Empfehlungsmöglichkeiten bei Amazon Quelle: htp://www.amazon.de (02/2010) Ein Großteil der Berechnungen für die Empfehlungen werden bei Amazon ofine durch- geführt. Für Nutzer, die gerade angemeldet sind, werden ähnlichen Objekte während des Empfehlungsprozesses jedoch online ermitelt. Die Dauer des Vorgangs ist dabei von der Anzahl der bewerteten oder gekaufen Objekte durch den Nutzer abhängig (s. Lin- den, Smith & York, 2003, 79). Neuere Angaben dazu haben wir nicht gefunden. Zappos Zappos14 ist ein amerikanischer Online-Schuhhändler, der einen anderen Ansatz verfolgt, um Empfehlungen zu personalisieren. In 2009 wurde die Betaversion von MyZappos15 ins Leben gerufen. Auf dieser Platorm können sich Nutzer ausgewählte Schuhe, Klei- dungsstücke und Accessoires in ihren virtuellen „Kleiderschrank“ legen und Fragen oder Kommentare zu den Produkten hinzufügen. Anschließend besteht die Möglichkeit, den „Kleiderschrank“ mit Freunden über andere Netzwerke wie Twiter oder Facebook zu öfnen und zu diskuteren. Kommenteren andere Nutzer die ausgewählten Artkel wird dies im persönlichen Bereich des Mitglieds angezeigt. Es ist auch möglich, die Schränke anderer Mitglieder einzusehen zu kommenteren, mit Produkten, die eventuell gut dazu passen würden zu ergänzen, Freundschafen zu schließen und neue Bekanntschafen in seine Kontaktliste aufzunehmen. 14 htp://www.zappos.com, Stand 02/2010 15 htp://my.zappos.com, Stand 02/2010 44
    • Abbildung 11: Unterstützung bei der Kaufentscheidung durch andere Nutzer Quelle: htp://my.zappos.com/tdarby (02/2010) Werbung Während Empfehlungssysteme in Online-Shops vor allem eine Service-Leistung darstel- len, die das Einkaufen leichter machen sollen und ggf. zum Kauf weiterer Produkte ver- leiten sollen, sind die Erwartungen an Empfehlungssysteme die für Werbung eingesetzt werden höher: Werbung muss so genau zu den Bedürfnissen und Interessen eines Nut- zers passen oder wecken, dass im besten Falle darauf geklickt wird. Im Bereich der Werbung wird daher viel mit Empfehlungsverfahren gearbeitet ohne dazu besonders viel genaues veröfentlicht wird. Zur Personalisierung der Werbung wer- den beispielsweise Rückschlüsse aus dem Nutzerverhalten gezogen. Wie eine solche Auswertung des Nutzerverhaltens Browsingverhaltens auf eine (heuristsche) Zuord- nung des Geschlechts funktoniert, wird durch eine Anwendung bei Mikeonads.com (2008) nachvollziehbar (siehe Schafert u.a., 2009): Hier gibt man mit einem Blick den Grif auf die History-Dateien frei, das heisst die zuletzt aufgerufenen URL sind auswert- bar. Aufgrund dieser Angaben wird eine Zuordnung vorgenommen. Eine Variante für ein Tool, das aus Nutzerverhalten auf das Geschlecht tppt, ist der „Gender-Guesser“16, der aus den Vorlieben für Fotos das Geschlecht errät und auch von jedem auszuprobieren ist. 16 htp://www.espgame.org/gwap/, Stand 09/2009 45
    • Abbildung 12: Ergebnis der Geschlechtschätzung durch Analyse der Browsing-History Quelle: www.mikeonads.com/2008/07/13/using-your-browser-url-history-estmate-gender/ (10/2009) Technische Websites sind demnach (stereo-) typisch für Männer, Mode-Websites für Frauen – Fehler sind so durchaus möglich. Gedacht ist eine solche Anwendung jedoch nicht notwendigerweise um das Geschlecht zu erraten, sondern um Informatonen über Interessen und Vorlieben zu erhalten um entsprechend passende Werbung platzieren zu können. Um Daten über das Browsingverhalten zu erlangen, ist es nicht unbedingt not- wendig, dass Nutzer die History-Daten freigeben: Es gibt Javascripts, die aus der Farbe der „besuchten Links“ ableiten, welche Webseiten bereits aufgerufen wurden (vgl. Mi- keonads.com, 2008; dort wird auf eine Anwendung von Paul Cook hingewiesen). Vergleichsweise einfach sind Werbeeinblendungen zu Suchbegrifen: Dieses Werbever- fahren wird als SEM (Search Engine Marketng) bezeichnet. Die Zahl von 7 Millionen Suchwortanzeigen im Jahr 2009 bei den Suchmaschinen MSN, Yahoo und Google zeigt die Bedeutung, die unter anderem dazu führt, dass dieser Markt mit einem Search Ad- vertsing Index monatlich beobachtet wird (Graf, 2009). Konzept für ein Empfehlungssystem für Trendprodukte und -themen Saisonale, politsche Ereignisse, Sportevents, Modeevents oder auch Naturkatastrophen können das Kaufverhalten in Online-Shops beeinfussen. Empfehlungen für solche kurz- fristg interessanten Produkte erscheinen daher sinnvoll. Während sich beim Valentns- tag das Kaufverhalten jedes Jahr ähnelt, sind Trends oder Moden nicht immer klar vor- hersehbar. Auf dieser Feststellung beruht die Idee eines buzz-basierten Empfehlungssys- tem (Englisch für „Modewort“). Es versucht, aktuelle Suchtrends auszuwerten und ent- sprechende Empfehlungen daraus zu generieren, Trends können so dynamisch als Emp- fehlung weitergegeben werden und werden von Nutzern überwiegend positv bewertet (Parikh & Sundaresan, 2009). LibraryThing Die Platorm LibraryThing17 versucht, passende Bücher zu empfehlen, ohne dass es dar- um geht, die Verkaufszahlen für ein Buch in die Höhe zu treiben. Es behauptet daher: „recommendatons are already beter than Amazon's—richer, more inspired and based on what's good to read NOT what's selling this month“ (zit. Libarything.com, 2006). 17 htp://www.librarything.com, Stand 02/2010 46
    • LibraryThing ermöglicht seinen Nutzern einen eigenen Bücherkatalog sowie Medienlis- ten anzulegen, zu kategorisieren sowie mit freien Schlagworten (engl. Tags) zu versehen. Daten aus fast 700 teilnehmenden Online-Bibliotheken werden importert und indexiert. Um Bücher zur eigenen Liste hinzuzufügen, gibt der Nutzer einfach Autor, Titel oder ISBN des Werkes in die Suchmaske ein. Basierend auf dem was bisher eingetragen und bewertet wurde, gibt LibraryThing einerseits explizite Empfehlungen von einzelnen Mit- gliedern und andererseits mehrere Empfehlungslisten, die durch einen von LibraryThing entwickelten eigenen Algorithmus, bezeichnet als BookSuggester, eingebunden werden (Spalding, 2006). Der BookSuggester analysiert die Bücherkataloge aller Nutzer, und empfehlt Bücher aus Katalogen sich ähnelnder Nutzer. Diese Empfehlungen können von dem Nutzer wiederum bewertet werden, wonach dann neue Empfehlungen ermitelt werden. Empfehlungen können auch anhand der am häufgsten vorkommenden Library- Tags gefltert werden. Es werden ofensichtlich also parallel bzw. kombiniert tagbasierte, inhaltsbasierte und elementbasierte, kollaboratve Verfahren eingesetzt. LibraryThing verfügt auch über einen „UnSuggester“, der absichtlich „Ant-Empfehlun- gen“ gibt, also Bücher nennt, die man quasi auf keinen Fall lesen sollte. Der Nutzer fn- det bzw. kann auch von anderen Nutzern mit ähnlichen Vorlieben über das Feature „si- milar libraries“ (Englisch für „ähnliche Bibliotheken“) gefunden werden, Gruppen bilden, Bücher rezensieren und sich mit Gleichgesinnten austauschen. Abbildung 13: Diverse Empfehlungsmöglichkeiten bei LibraryThing Quelle: htp://www.librarything.com/profle/sweetegherkin/recommendatons (01/2010) Ob Nutzer diese Art und Weise der Empfehlungen von LibraryThing als angenehmer und nützlicher empfnden, ist uns nicht bekannt. Last.fm Das Internetradio Last.fm18 erstellt ein Profl, welche Lieder der Nutzer wie of gehört hat und versucht basierend auf dem Gehörten, Empfehlungen zu generieren, damit Nut- zer andere mit ähnlichem Hörverhalten fnden können und darüber hinaus über deren Playlists interessante Musik fnden können. Durch eine Sofware „Audioscrobbler“, wel- che ursprünglich als Informatkprojekt von Richard Jones an der Universität Southamp- ton in England gestartet wurde, weiß das Unternehmen genau, welches Lied wie of ge- hört wird und welches nie. Die Titelzeile und der Interpret des vom Nutzer gehörten Musikttels werden im Nutzerprofl gespeichert und statstsch ausgewertet. Somit ist bekannt, welche Musik die Nutzer wirklich hören. Der Scrobbler lernt ständig dazu, 18 htp://www.last.fm, Stand 02/2010 47
    • übermitelt die Musikttel an die Datenbank, füllt automatsch die Musiksammlung der Nutzer und aktualisiert sie mit den Liedern, die sie auf ihren Computern oder iPods an- hören. Basierend auf ihrem Hörverhalten erhalten Nutzer Empfehlungen zu Musik, Vi- deos und auch kostenlosen MP3-Dateien. Die individuellen Charts erscheinen im Last.fm-Profl der einzelnen Nutzer, wo sie von anderen Leuten angesehen werden kön- nen. Dort werden auch Nutzer mit ähnlichem musikalischen Geschmack angezeigt. Wei- ters gibt ein Online-Konzertinder den Nutzern anhand ihres Musikgeschmacks und ihres Wohnortes auch Konzertempfehlungen (Wikipedia 2010). Abbildung 14: Proflseite eines Nutzers bei Last.fm Quelle: htp://www.lastm.de/user/Seli77 (01/2010) Musikempfehlungen bei Preiser Records Ein eher traditonelles Verfahren, nämlich den des eigenschafsbezogenen Filterns, wählt Preiser Records, die sich auf den Verkauf von klassischer Musik spezialisiert ha- ben. Experten beschreiben hier Musikstücke, die vom Nutzer durch das Ausfüllen einer Suchmaske ausgewählt werden. Allerdings werden hier nicht nur die bekannten, übli- chen Komponisten- oder Genrezuschreibungen genutzt, da die Musikstücke zusätzlich von den Experten auch im Hinblick auf die geweckten Höreremotonen beschrieben wurden: Bei Preiser Records kann man sich so Musikstücke empfehlen lassen, die „erhe- bend“ oder als „heiter/fröhlich“ beschrieben werden. 48
    • Abbildung 15: Die „Emotonale Suche“ – Recherchemöglichkeit bei Preiser Records Quelle: htp://www.preiserrecords.at/extendedSearch2.php?resetForm=resetForm (02/2010) Pandora Der amerikanische Musikempfehlungsdienst Pandora19 versucht unter dem Namen „Mu- sic Genome Project“ (Englisch für musikalisches Genom-Projekt), Musik zu analysieren und zu kartograferen. Pandora hat jeden einzelnen Song von gelernten Musikern nach 400 verschiedenen Kriterien (z. B. Dimension der Melodie, Rhythmus, Harmonie, ver- wendete Instrumente, Art der Texte usw.) analysieren lassen und ordnet ihnen unter- schiedliche Atribute zu. Es wird nach Ähnlichkeiten und Gemeinsamkeiten der Musik- stücke gesucht und diese danach für die Nutzer in Form von Empfehlungslisten zusam- mengestellt. (Pandora, 2010). Dabei werden auch Genre- und Stl-Grenzen übersprun- gen und es wird auf die größten Übereinstmmungen mit dem eigenen Geschmack Wert gelegt. Neben einzelnen Song-Titeln oder Gruppennamen können Nutzer auch persönli- che Vorlieben, wie beispielsweise Trompetensolos, Art der Texte, Tanzbarkeit oder Typ der Stmme eingeben (heise, 2001). Durch das eigenschafsbezogene Filtern und den Verzicht auf kollabortves Filtern entdeckt man mit diesem Verfahren eher neue, bisher unbekannte Stücke: „It’s the introducton to new music that makes Pandora uniquely in- terestng as a recommendaton system“ (Simon, 2009). 19 htp://www.pandora.com, Stand 02/2010 49
    • Abbildung 16: Proflseite bei Pandora Quelle: htp://hayfwood.fles.wordpress.com/2009/03/pandora1.jpg (02/2010) Mufn, eMusic und Audiobaba Um einen Einblick in die höchst unterschiedlichen Empfehlungssysteme zu geben, be- schreiben wir hier noch kurz drei weitere Empfehlungsdienste für Musikstücke: Mufn's20 Empfehlungssystem analysiert zuerst die fundamentalen klanglichen Eigen- schafen eines Liedes nach beispielsweise Tempo, Instrumenterung, Klangdichte oder Harmonie und gibt dann ausschließlich Empfehlungen nach der musikalischen Ähnlich- keit zwischen Songs. Das Empfehlungssystem von eMusic21 basiert auf einer Technologie von MediaUn- bound22, einem Anbieter von Personalisierungs- und Empfehlungssystemen. Die Emp- fehlungen auf eMusic werden ständig und automatsch fein abgestmmt durch die eige- nen Aktvitäten der Nutzer auf der Website, dem MediaUnbound-Algorithmus und dem eMusic-Editor (ReadWriteWeb, 2009). Im Unterschied zu den oben genannten Empfeh- lungssystemen werden hier Daten über die Musikstücke durch die Nutzer selbst einge- tragen, es handelt sich also dabei nicht unbedingt um Experten. Auf Audiobaba23 werden Audiostreams analysiert und unterschiedliche Eigenschafen der Musikstücke für die Empfehlungen (z. B. Rhythmus, Beat) herangezogen. Hier wer- den, wieder im Unterschied zu den oben genannten Empfehlungssystemen, Daten über die Musikstücke automatsch analysiert. 20 htp://www.mufn.com, Stand 01/2010 21 htp://www.emusic.com, Stand 01/2010 22 htp://www.mediaunbound.com, Stand 02/2010 23 htp://www.audiobaba.com, Stand 02/2010 50
    • MovieLens MovieLens24 ist ein Empfehlungssystem für Filme und verwendet die Technologie des kollaboratven Filtern. Nachdem der Nutzer sich angemeldet hat, werden ihm Listen mit Filmen, deren Veröfentlichungsjahr sowie Genres angezeigt. Filme, die er davon bereits gesehen hat, kann er mit Sternen (1 Stern = „schrecklich“ bis 5 Sterne = „muss man se- hen“) bewerten. Mindestens 15 Filme muss der Nutzer bewertet haben, damit Movie- Lens Empfehlungen geben kann. Je mehr Filme der Nutzer allerdings bewertet, desto genauer und persönlicher werden diese. MovieLens wurde vom Department of Computer Science and Engineering der Universi- tät von Minnesota ins Leben gerufen. Der ursprüngliche MovieLens-Algorithmus („user- user“) generierte einen Korrelatonskoefzient zwischen Nutzer A und allen anderen Nutzern in der Datenbank. Dann wurden die Filme einem Ranking, basierend auf den Bewertungen der anderen Mitglieder, mit einem hohen Korrelatonskoefzient unterzo- gen (Economic Expert, 2010). Mitlerweile verwendet MovieLens auch den Ansatz des Item-Based Collaboratve Filtering, der zuerst die Nutzer-Elemente-Matrix analysiert, um Beziehungen zwischen den verschiedenen Objekten zu bekommen. Danach wird diese Beziehung herangezogen, um indirekt die Empfehlungen für Nutzer zu berechnen bzw. zu erhalten (Henze, 2008): Abbildung 17: Empfehlungen auf MovieLens Quelle: htp://www.movielens.org/search?acton=loadSearch&xmlId=2 (02/2010) 24 htp://www.movielens.org, Stand 02/2010 51
    • 3.5 Empfehlungssysteme für Web-Materialien Im Folgenden geben wir einen Überblick über Empfehlungssysteme für die Recherche nach kostenlos verfügbaren Webmaterialien, wie Weblogs oder Videos. Dabei verweisen wir zunächst auf drei Arten von Anwendungen, nämlich Suchmaschi- nen, Taggingplatormen und Soziale Netze, die natürlich auch als eine Art Empfehlungs- system für verteilte Informatonen im Web betrachtet werden können. Drei Empfeh- lungssysteme werden dann im Anschluss genauer betrachtet: Bei Photoree werden Bil- der aus unterschiedlichen Datenbanken, bei fwd Videos aus unterschiedlichen Daten- banken empfohlen. ReMashed ist ein community-basiertes Verfahren des Austauschs von Empfehlungen unter Personen mit ähnlichen Interessen. Suchmaschinen und Verzeichnisse Klassische Unterstützung bei der Suche nach Webmaterialien bieten Suchmaschinen und Webverzeichnisse. Hier werden Suchbegrife eingeben oder mit Hilfe von Kategori- en und weiteren Einschränkungen (Aktualität des Trefers, Format des Trefers usw.) Lis- ten von passenden Trefern ausgegeben. Während bei Suchmaschinen der ersten Generaton vor allem die Inhalte der Webseiten bzw. Metadaten ausgewertet wurden, spielen heute für das Ranking, also die Rangfolge in den Treferlisten, auch weitere Aspekte eine Rolle: So wird der Grad der Vernetzung mit anderen Webseiten, die Dynamik des Angebots sowie die Zugrife auf diesen Trefer in der Suchmaschine ausgewertet. Der Rankingalgorithmus basiert hier folglich auch auf weiteren Analysen der Webseiten sowie des Benutzerverhaltens. Suchmaschinen ver- wenden also Algorithmen und Verfahren, die den Empfehlungssystemen ähnlich sind. Neue Entwicklungen beschäfigen sich unter der Bezeichnung „Social Search“ damit, dass Suchmaschinen die Informatonen über das Suchverhalten der eigenen Community einbinden, also Ansätze des kollaboratven Filtern bzw. des pfadbasierten Filterns nutzen (z. B. Smyth, Briggs& Coyle, 2009). Social Tagging und persönliche Empfehlungen mit Delicious Social Tagging, also das gemeinsame Verschlagworten von Webressourcen mit Hilfe von Services wie Delicious25 und MisterWong26, ermöglicht neue Zugänge zu Webseiten und Objekten (Schafert, Hilzensauer & Wieden-Bischof, 2009, s. S. 31 in diesem Buch). Auf den Webseiten der Social-Tagging-Anbieter lassen sich daher auch Empfehlungen für Beiträge in Weblogs und andere Webseiten mit den gleichen Tags fnden. Darüberhinaus bietet Delicious eine interessante Möglichkeit an, eigene Lesezeichen als persönliche, direkte Empfehlungen an andere Nutzer des Systems weiterzugeben bzw. diesen eine Webseite vorzuschlagen. Diese Empfehlungen können im Nutzerprofl einge- sehen werden, aber auch als RSS-Feed abonniert werden. 25 htp://delicious.com, Stand 02/2010 26 htp://www.mister-wong.de/, Stand 02/2010 52
    • Abbildung 18: Persönliche Empfehlungen für Lesezeichen von anderen Nutzern bei Delicious Quelle: htp://delicious.com/inbox/ (02/2010) Soziale Netze – Beispiel Facebook Facebook27 ist ein Soziales Netzwerk, bei dem Nutzer Bilder hochladen können und mit den Namen der anderen versehen können. Die Idee von sozialen Netzwerken ist es, dass Nutzer, die sich als Kontakte oder „Freunde“ gekennzeichnet oder in „Gruppen“ zusam- mengeschlossen haben, über die Aktvitäten der anderen informiert werden können. Beispielsweise gibt es so die Möglichkeit, anderen Fotos aus dem Urlaub zu zeigen, die dann wiederum kommentert werden können. Photoree Photoree ist ein Bewertungs- und Empfehlungssystem für Bilder. Hat man sich bei Pho- toree28 als Nutzer registriert, wird in der Datenbank ein persönlicher Filter für das jewei- lige Mitglied angelegt. Dieser Filter ist für die Auswahl der Bilder verantwortlich, die dem Nutzer gezeigt und vorgeschlagen werden. Dem Mitglied werden verschiedene Bil- der vorgeführt, die er bewerten muss, damit der dahinter stehende Algorithmus nach und nach den persönlichen Geschmack kennenlernen kann. Je mehr Bilder vom Nutzer bewertet werden, desto persönlicher und detaillierter wird die Auswahl. Die Bilder wer- den aus dem Internet abgerufen und in der Datenbank indiziert, auch ihre genaue Her- kunf und Details (z. B. Titel, Quellseite, Lizenz) werden angezeigt. Nutzer können die Bil- der verwenden, um beispielsweise ihre Blogeinträge oder Webseiten mit Fotos aufzupo- lieren oder um Collagen zu gestalten. Die Bewertung der Bilder erfolgt anhand von Pfei- len. Der grüne, nach oben zeigende Pfeil, ist eine positve, der rote nach unten zeigende Pfeil eine negatve Bewertung. Die positv bewerteten Bilder werden in die persönliche Galerie gelegt, in der die Bewertung auch noch zu einem späteren Zeitpunkt geändert werden kann. Hat der Nutzer mindestens 100 Bilder bewertet, werden ihm vom System Empfehlungen für Bilder von anderen Mitgliedern mit ähnlichem Geschmack geliefert, die er bewerten kann. Er hat auch die Möglichkeit sich individuelle Statstken vom Sys- tem auswerten und anzeigen zu lassen, um so andere Mitglieder die dem eigenen Be- wertungsprofl ähnlich sind, zu fnden, in seine Kontaktliste aufzunehmen und deren Bil- der anzusehen. 27 htp://www.facebook.com, Stand 11/2009 28 htp://www.photoree.com, Stand 01/2010 53
    • Abbildung 19: Bildempfehlungen auf Basis ähnlicher Bewertungsprofle von Nutzern Quelle: htp://www.photoree.com/photos/recommend (02/2010) 54
    • Abbildung 20: Prozentuale Angabe der Übereinstmmung von Nutzern mit dem eigenen Profl Quelle: htp://www.photoree.com/photos/recommend (02/2010) Best-Of aus den Videoplatormen mit fwd fwd29 ist ein Videoportal das Videos von verschiedenen Platormen (z. B. YouTube, Fun- ny or Die, Blip.tv, MySpace) nach dem persönlichen Geschmack der Nutzer empfehlt. Nach Registrierung werden per Fragebogen Lieblingsgenres, -flme und -serien be- stmmt. Dadurch kann er einem bestmmten Typ, einer sogenannten „Videopersönlich- keit“, zugeordnet werden, welche optsch in Form eines Monsters oder Männchens dar- gestellt wird. Ein Auszug aus den über 15 unterschiedlichen Typen: 29 htp://www.fwd.com, Stand 02/2010 55
    • Typen Symbol Beschreibung The Class Clown Der Klassenclown hat viel Charme und versteht es, jede Alltagssituaton (Der Klassenclown) in eine gute und vergnügliche Zeit zu verwandeln. The Critc Der Kritker ist rede- und wortgewandt und kann nahezu über alle TV- (Der Kritker) Shows und deren Dialoge, Schauspielerei und Regie diskuteren. The Paparazzi Der Paparazzi ist hauptsächlich ein Beobachter, dessen Glücksgefühl (Der Paprazzi) durch das Betrachten der (Helden-) Taten von Driten entsteht. The Social Buterfy Der soziale Schmeterling ist lustg, spontan und bringt Aufregung in je- (Der gesellige/soziale dermanns Leben. Er hat viele Freunde und möchte wissen, was bei allen Schmeterling los ist und liebt es über die Höhen und Tiefen von Beziehungen zu hören. weitere The Best Friend (Der beste Freund), The Cameleon (Das Chamäleon), The Comedy Writer (Der Komödienautor), The Contestant (Der Wetkämpfer), The Forensics Expert (Der forensische Experte), The Hero (Der Held), The Oddball (Der Exzentriker), The Rebel (Der Rebell), The Split Personality (Die gespaltene Persönlichkeit), The Professor (Der Professor), The Super Fan (Der Superfan), The Talent Scout (Der Talent Scout) Tabelle 11: Bedeutung der Videopersönlichkeiten bei fwd. Quelle: fwd.com (02/2009) Wurde man einem bestmmten Typ zugeordnet, werden dem Nutzer Videos angezeigt, die für ihn interessant sein könnten. Folgende Möglichkeiten stehen dem Nutzer des Vi- deoportals zur Verfügung (s. MashupYourLife.com, 2009): | Jedes Video kann an Freunde weiter empfohlen, versendet oder verteilt (z. B. Twiter, Facebook, delicious, Hi5, MySpace, StubleUpon), aber auch zu den eigenen Favoriten hinzugefügt werden. Nutzer erhalten auch Empfehlungen von anderen. | Videos können bewertet und auch mit Tags versehen werden. | Auf einfachem Weg können andere Nutzer mit demselben bzw. ähnlichen Ge- schmack gefunden werden. | Durch eine Wii-optmierte Version von fwd können Videos auch direkt im Wohnzim- mer angesehen werden. Nutzer können auch ihren eigenen und persönlichen Video-Kanal gestalten bzw. einrich- ten. 56
    • ReMashed – Empfehlungen der Community Das Empfehlungssystem ReMashed30 ist ein community-basiertes Empfehlungssystem für verschiedene Web-2.0-Formate wie Videos, Präsentatonen, Blogs, Bookmarks und Micro-Blogging. Gleichgesinnte können damit eigene Online-Ressourcen (wie Weblo- geinträge und Lesezeichen bei Delicious31) teilen, bewerten und erhalten Empfehlungen für Beiträge der anderen (s. Drachsler, 2009). Das Empfehlungssystem arbeitet mit zwei unterschiedlichen Datenquellen auf denen unterschiedliche Empfehlungsalgorithmen aufauen: Zum einen mit der Tag-Cloud eines Nutzers, zum anderen mit einer Bewertung der Beiträge (bis zu fünf Sterne). Auf diesen beiden Datenquellen bauen zwei unterschiedliche Empfehlungsalgorithmen auf, die Hendrik Drachsler im folgenden erläutert. Abbildung 21: ReMashed: Web-2.0-Empfehlungen aus der Community Quelle: htp://remashed.ou.nl (02/2010) Hendrik Drachsler zu Empfehlungen von Webcontent in Communitys ? Welche Erfahrungen haben Sie mit den unterschiedlichen Empfehlungsarten Ihres Systems gemacht? ! Wir nutzen zunächst die Tag-Cloud-Daten der Web-2.0-Inhalte eines Nutzers als eine erste Eingrenzung des Interessengebietes. Konkret bedeutet das, dass wir aus allen angegebenen Web-2.0-Tools des Nutzers eine kombinierte persönliche Tag- Cloud generieren. Diese wird dann durch mathematsche Verfahren mit den Tag- Clouds anderer Nutzer im ReMashed System verglichen. Im Anschluss werden Web-2.0-Ressourcen von Nutzern mit ähnlichen Tag-Clouds, die der aktuelle Nutzer noch nicht kennt, vom Empfehlungssystem vorgeschlagen. Die Tag-Clouds werden benötgt, um der sogenannten ‚Cold-Start‘-Phase des Empfeh- lungssystem entgegen zu wirken, wo noch nicht ausreichende Informatonen über einen neuen Nutzer vorhanden sind. 30 htp://remashed.ou.nl, Stand 02/2010 31 htp://delicious.com, Stand 02/2010 57
    • Der zweite Empfehlungsalgorithmus, der auf Basis der Sternbewertung arbeitet, kann erst aktv werden, wenn der Nutzer eine bestmmte Anzahl an Ressourcen im System bewertet hat. Das bedeutet, dass der Nutzer über die Sternbewertung dem System erst seine Interessensbereiche antrainieren muss, damit dieses eine Empfehlung generieren kann. Solange dieser Trainingsprozess noch nicht abgeschlossen, ist bieten wir dem Nutzer Empfehlungen auf Basis der Tag-Cloud an. Prinzipiell ist das Sternbewertungsverfahren lernfähiger als das tag-cloud-basierte Verfahren. Das be- deutet, umso mehr ein Nutzer seine Interessengebiete mit positven oder negatven Bewertungen ein- grenzt, umso akkurater und genauer werden die Vorschläge des Empfehlungssystem. Das tag-cloud-ba- sierte Verfahren hingegen ist wesentlich träger, weil sich Tag-Clouds nicht so dynamisch entwickeln und insgesamt ungenauer vergleichen lassen als die mit Sternen bewerteten Inhalte. Dafür kann das tag- cloud-basierte Verfahren schon nach dem ersten Einloggen des Nutzers Vorschläge generieren und be- nötgt keine Trainingsphase. Die Kombinaton beider Techniken in einem hybriden Empfehlungssystem erscheint uns als efektvste Lösung, Web-2.0-Inhalte nach persönlichen Interessen zu fltern. ? Welche Empfehlungen erleben Nutzer Ihres Systems als besonders hilfreich? ! Im ReMashed System wurden beide Empfehlungsalgorithmen von den Nutzern ähnlich positv bewer- tet. Jedoch blieb der tag-cloud-basierte Empfehlungsalgorithmus die beliebtere Empfehlungstechnik. Dies kann aber auch an einer zu kurzen Trainingsphase des auf Sternbewertung basieren Algorithmus liegen. ? Welche Ratschläge möchten Sie anderen Entwicklern von communitybasierten Empfehlungssystemen für Web-Content geben? ! Die Nutzer unseres ReMashed-Systems haten vor allem Bedenken, dass das System auch ihre privaten Bookmarks und Blogbeiträge auslesen wird. Daher erklären Sie explizit, dass nur öfentlich verfügbare Informaton für das Empfehlungssystem genutzt werden. Beachten Sie, dass die Community ein gutes Verständnis der Funktonalität des Empfehlungssystems bekommt. Machen Sie die Prozesse des Emp- fehlungssystems so transparent wie möglich, das steigert das Vertrauen der Nutzer in das System. Desweiteren ist es wichtg, den Nutzern das Löschen von Empfehlungen aus der Empfehlungsliste zu er- möglichen. Wir haben hierfür einen sogenannten ‚Black Star‘ eingeführt, der es den Nutzern ermöglicht, eine ungeliebte Empfehlungen von der Vorschlagsliste zu enternen. Vor allem für community-basierte Empfehlungssysteme ist es wichtg, Interakton der Nutzer unterein- ander zu ermöglichen, andernfalls wird Ihr System zu passiv. Integrieren Sie synchrone oder asynchrone Chats neben Ihren Empfehlungen, um das gesamte Erscheinungsbild atraktver und lebhafer für die Community zu gestalten. Im heutgen vernetzten Arbeiten wollen Nutzer nicht immer zu einer bestmmten Webseite gehen müs- sen, um einen Service in Anspruch nehmen zu können. Daher planen Sie von Anfang an Widgets und Plugin-Interfaces für Ihr Empfehlungssystem mit ein, die die Nutzer in ihrem Browser oder ihrer persön- lichen Lernumgebung, wie iGoogle oder Netvibes integrieren können. Dr. Hendrik Drachsler arbeitet als Assistant Professor für Technology Enhanced Learning beim Center for Learning Science and Technologies (CELSTEC) an der Open Universiteit Nederland. Sein Arbeitsschwer- punkt ist die Personalisierung des Lernens mit Informaton Retrieval Methoden und deren Applikaton in Empfehlungssystemen. Über seine Forschungsergebnisse berichtet er regelmäßig in seinem Weblog htp://www.drachsler.de/blog/ (02/2010). 58
    • 3.6 Spezielle Einsatzgebiete und weitere Empfehlungssysteme Im folgenden Abschnit haben wir Beispiele für Empfehlungssysteme und ihren Einsatz gesammelt, die nicht zu den bereits vorgestellten Einsatzgebieten passen, weil es sich bei ihnen nicht explizit um Empfehlungssysteme für Personen, Produkte oder Webmate- rialien handelt. Genau genommen sind einige der folgenden Empfehlungssysteme auch nicht im Internet für die Allgemeinheit zugänglich, sondern werden in spezifscher Sof- ware eingesetzt. Dabei betrachten wir folgende Bereiche genauer: Empfehlungssysteme für die Generie- rung von Tags, Empfehlungssysteme im Einsatz bei der interaktven Live-Erstellung von Fernsehproduktonen, Empfehlungssysteme bei der Verschreibung von Arzneimiteln, Empfehlungen bei der Suche und Recherche, Empfehlungssysteme für Lernende sowie eine kurze Übersicht weiterer Einsatzgebiete. Tag-Empfehlungen Immer häufger wird im Web Social Tagging eingesetzt. Dabei haben Nutzer die Möglich- keit, Webseiten oder anderen Ressourcen (Bilder, Videos, Musikstücke) mit eigenen Schlagworten zu markieren. Weil Tagging das Erschließen und Recherchieren von vielen Daten erst ermöglicht oder deutlich verbessert, wird es von vielen Systemen auch unter- stützt. Damit das Tagging leicht von der Hand geht, werden Tagvorschläge gemacht. Einen Überblick über unterschiedliche Quellen, die für Tag-Vorschläge herangezogen werden können, gibt Kockler (2008) in seiner Diplomarbeit, abgebildet hier eine Über- sicht aus Memmel, Kockler & Schirru (2009). Abbildung 22: Mögliche Quellen für Tag-Empfehlungen Quelle: Memmel, Kockler, & Schirru, 2009, Abbildung 1, 680 59
    • Folgendes Beispiel für einen Tag-Recommender stammt aus Schafert u.a. (2009, 50f): Im Projekt „Interedu“32 des Salzburg NewMediaLab wurde ein System entwickelt, das das Tagging von Lernressourcen unterstützt, indem es Tagvorschläge generiert. Dabei kommen mehrere Verfahren zum Einsatz: | Die Hauptkomponentenanalyse ist ein statstsches Verfahren, dass mit Hilfe einer Analyse von „Trainingsdaten“ Rückschlüsse auf das Vorschlagen von Tags geben kann: Dazu werden die Texte der Trainingsdaten in Schlüsselworte zerlegt, Stoppworte ge- fltert und Stammformen gebildet, dann wird eine Dokument-Term-Matrix angelegt und Vektoren beschrieben. Weil allein durch das Vorkommen eines Schlüsselwortes nicht die Relevanz gezeigt ist, wird mit dem TF-IDF-Verfahren (Term Frequency/Inver- se Document Frequency) festgestellt, ob es vergleichsweise häufg vorkommt, also „besonders“ ist. Ziel der Hauptkomponentenanalyse ist es nun, die bestehende Ma- trix so in der Anzahl der Dimensionen zu reduzieren, dass alle Hauptrichtungen ver- treten sind. | Mit KEA können Texte klassifziert werden und sogenannte Keyphrases oder „Schlüs- selwortketen“ in Texten erkannt werden. KEA unterstützt zwei Arten von Klassifzie- rungen: die freie Klassifzierung (Schlüsselwortextrakton) sowie die eingeschränkte Klassifzierung (Kategorisierung), bei der der Text in eine Kategorie eingeordnet wird. | Auch Assoziatonsregeln können zum Vorschlagen von Tags oder Schlüsselworte ein- gesetzt werden. Wenn eine Menge von Dokumenten signifkant häufg mit den sel- ben Tags oder Schlüsselworten versehen wurde, kann ein Benutzer von dem Wissen der Vorgänger profteren, indem seine Tags vervollständigt werden. Das Konzept der Assoziatonsregeln setzt somit voraus, dass schon Tags vergeben worden sind. Neben inhaltsbasierten Filtern kommt also wird auch ein kollaboratves Filtern einge- setzt. Andere Verfahren setzten wiederum deutlich stärker auf das Tagging-Verhalten anderer Nutzer (s. Mishne, 2006). Mit der ALOE-Platorm wird derzeit versucht, eine Schnitstelle zu entwickeln, die es Nutzern erlaubt, selbst die Regeln für die Erstellung der Tag-Vorschläge zu steuern. Wie die Abbildung der derzeitgen Nutzeroberfäche zeigt (s. Abbildung 23. S. 61), kann bei- spielsweise vom Nutzer festgelegt werden, ob Tag-Vorschläge aus dem Tagging-Verhal- ten aller ALOE-Nutzer generiert werden sollen, oder ob nur Kontakte einbezogen wer- den sollen. 32 Partner: Salzburg Research, Educaton Highway und Punkt Netservices 60
    • Abbildung 23: ALOE-Interface zur Festlegung der Quellen für Tag-Vorschläge Quelle: Memmel, Kockler & Schirru (2009), Abbildung 4, 688 LIVE – Inhaltsempfehlung in der Fernsehprodukton Das LIVE-Projekt33, hate zum Ziel die Produkton von großen Medienereignissen live auf mehreren Sendekanälen zu realisieren. Hierzu hat es ein komplexes Framework entwi- ckelt, das das Produktonsteam dabei unterstützen soll, Archivmaterial semi-automa- tsch zu erfassen, Benutzerverhalten und Vorlieben zu analysieren, und relevante Inhalte vorzuschlagen welche sowohl die aktuellen Geschehnisse in den Events als auch die In- teressen der Zuschauer widerspiegeln. Eine Hauptherausforderung dieses Systems sind die Echtzeit-Anforderungen: Der Direktor bzw. sein Team müssen in Echtzeit Entschei- dungen trefen und Live-Inhalte bzw. relevantes Sekundärmaterial auswählen und zur Aussendung freigeben. Eine Kernkomponente dieses Systems ist ein Empfehlungssys- tem, das das Produktonsteam bei der Auswahl geeigneter Inhalte unterstützt und gleichzeitg Zuschauer-Feedback analysiert, um das ausgestrahlte Programm den Inter- essen der Zuschauer anzupassen. Das LIVE Empfehlungssystem unterstützt aus diesem Grund mehrere Arbeitsprozesse: (1) Die Auswahl und Organisaton von Sekundär-Inhal- ten aus Archiven, (2) die Sammlung von Zuschauer-Feedback, (3) die Analyse und Prä- sentaton des Feedbacks und (4) die Erzeugung von Empfehlungen auf Basis des Feed- backs und dem aktuell ausgestrahlten Programm. 33 htp://www.ist-live.org, Stand 02/2010 61
    • Das System gliedert sich in zwei Phasen des Produktonsprozesses ein: die Vorberei- tungs- und die Live-Phase. In der Vorbereitungsphase unterstützt das Empfehlungssys- tem bei der Vorauswahl von Inhalten aus dem Archiv. Dies beinhaltet Interviews oder Beiträge zu den beteiligten Personen bei dem jeweiligen Ereignis. In der Live-Phase ana- lysiert das Empfehlungssystem semi-automatsch ausgezeichnete Kamera-Live-Ströme und erzeugt darauf aufauende, automatsche Empfehlungen. Zusätzlich zu rein inhaltsbasierten Empfehlungen unterstützt das Empfehlungssystem personalisierte Empfehlungen, die das Profl der Zuschauer in den Empfehlungsprozess integrieren. Hierzu wurde ein spezielles Zuschauerfeedback- und -analysesystem entwi- ckelt, das in Echtzeit implizites und explizites Feedback der Zuschauer analysiert. Implizi- tes Feedback umfasst das Sehverhalten der Zuschauer, wie etwa das Umschalten oder die Verweildauer auf einzelnen Kanälen. Explizites Feedback beinhaltet Bewertungs- und Abstmmungsinformatonen, welche über einen Feedback-Kanal aufgenommen werden. Abbildung 24: Screenshot des LIVE-Recommender Quelle: htp://www.ist-live.org (02/2010) Empfehlungssysteme bei der Verschreibung von Arzneimiteln Vor allem wenn mehrere unterschiedliche Ärzte in den Behandlungsprozess eingebun- den sind, beispielsweise wenn mehrere Krankheiten vorliegen, können Fehler bei der Verschreibung von Medikamenten passieren. Immer häufger werden daher in Kranken- häusern Alarmierungssysteme eingesetzt, die beispielsweise bei unzureichender oder zu hoher Dosierung, oder wenn zwei Medikamente nicht gleichzeitg verordnet werden sol- len, Alarm schlägt. Diese Empfehlungssysteme werden als „Elektronische Arzneimitel- verschreibung“ bezeichnet (Engl. „computerised physician order entry system“). Da die vorhandenen Systeme häufg Alarm schlagen, ist bei den Benutzern eine gewisse Alarm- müdigkeit festzustellen. Um den entgegenzuwirken, werden Möglichkeiten gesucht, wie man Fehlalarme möglichst vermeidet ohne im Gegenzug Fehler oder Schwierigkeiten bei der Verschreibung zu übersehen. 62
    • Miyo et al. (2007) sind bei der Entwicklung ihres Systems für das Universitätskranken- haus Tokyo davon ausgegangen, dass eine bei ähnlichen Krankheitsbildern von Paten- ten häufge durchgeführte Medikaton die beste ist. Es wurde daher ein echtzeit- und fallbasiertes Medikatonsalarm- und Empfehlungssystem basierend auf einer Datenbasis von früheren Verschreibungen entwickelt. Grundlage beim neu entwickelten System sind Daten über vorherige Verschreibungen (von 2000 bis 2005). Das System schlägt Alarm, wenn ein Problem vorliegt. Ereignisse, die einen Alarm anstoßen können sind: Dosierung bezogen auf das Behandlungsschema, Dauer der Verabreichung des Arznei- mitels, gleichzeitg eingenommene Arzneimitel. Das System bietet eine Entscheidungs- unterstützung bei der Medikaton. Auf Basis der Werte aus der Vergangenheit und der Patentenparameter erhalten Ärzte z. B. eine geeignete Dosierung und Verabreichungs- dauer vorgeschlagen. Bei einer Evaluierung des Systems wurden die ausgelösten Alarme für die zehn am häu- fgsten verschriebenen Medikamente des neuen Systems mit herkömmlichen, „stat- schen“ Systemen verglichen. Bei einem Versuch mit den zehn am häufgsten verschrie- benen Medikamenten im Universitätskrankenhaus Tokyo wurde festgestellt, dass dieses System die Zahl der Fehlalarme reduziert. Solche Empfehlungssysteme werden in der Praxis jedoch nicht nur gut geheißen, v.a. dann wenn sie Ärzte in ihren Freiräumen einschränken. So sind uns Rückmeldungen von Ärzten zu existerenden Systemen bekannt, die sich durch solche „Empfehlungssysteme“ eher eingeschränkt fühlen, beispielsweise wenn Medikamente bewusst zur Behandlung für Krankheiten eingesetzt werden für die sie ofziell nicht gedacht sind und weil die Verträglichkeit und Dosierung der Medikamente in vielen Fällen (noch) individueller ist, als es die Theorie bzw. das Empfehlungssystem für richtg hält. Empfehlungssysteme werden auch für die Erstellung von Pfegeplänen entwickelt (Duan, Street & Lu, 2008, ein aktueller Überblick fndet sich in Traurig, 2009). Anfang 2010 star- tet zusammen mit Salzburg Research ein Forschungsprojekt, in dessen Rahmen u.a. sol- che unterstützenden Services zur Behandlung von Herzpatenten entwickelt werden34. Empfehlungen für Suche und Recherche Empfehlungssysteme werden auch zur Unterstützung der Recherche eingesetzt, im Fol- genden dazu einige Beispiele: | Zum Beispiel werden auf Fehler in der Rechtschreibung der Suchbegrife hingewie- sen, ein relatv einfacher Ansatz um die Treferquote und Nutzerzufriedenheit zu er- höhen. | In der Wissenschafs-Suchmaschine Scirus35 werden beispielsweise auch Vorschläge für die Eingrenzung des Suchgebietes auf bestmmte Themen, Webressourcen oder Journals gegeben. | Suchtechnologien wie von Findologic36 sind für Online-Shops entworfen worden, um den Kunden systematsch zu leiten, indem beispielsweise weitere Unterkategorien vorgeschlagen werden und nicht nur eine lange Treferliste anzuzeigen. 34 Siehe htp://www.srdc.com.tr/icardea/, Stand 02/2010 35 htp://scirus.com, Stand 02/2010 36 htp://www.fndologic.com, Stand 02/2010 63
    • | Auf der Platorm für Wissensmananagement PWM37 werden bei Recherchen z. B. das semantsche Netz des Suchbegrifs graphisch dargestellt, das die die semantsche Bedeutung des Suchwortes im Kontext von Wissensmanagement zeigt (Beier & Blu- mauer, 2004) Empfehlungen für Lernende Auch Systeme zur Lernunterstützung können als Empfehlungssysteme verstanden wer- den. Die ersten Lernprogramme gaben zwar weniger „Empfehlungen“, als dass sie die Lernwege und einzelne Schrite nicht vorschlugen, sondern vorgaben: Passend zu dem Profl des Lernenden, z. B. seinem Vorwissen, werden Lerneinheiten angeboten. Tradi- tonelle Systeme werden dabei von Experten entwickelt und Lernwege und -materialien vorgeben. In den letzten Jahren wird immer häufger mit Lern-„Empfehlungen“ gearbei- tet. Das ist zum einen darauf zurückzuführen, dass Vorgänge des selbstorganisierten und informellen Lernens, also das nichtormal organisierte Lernen, in den Vordergrund der Aufmerksamkeit gerückt ist. Zum anderen stehen durch die Entwicklungen des Webs im- mer mehr Lernquellen und -materialien frei verfügbar im Netz, ohne das beispielsweise explizite Daten zur Verfügung stehen, wann und für welchen Lerner sie geeignet sind. Eines der ersten Empfehlungssysteme für Lernende beschrieben Linton und Charron (1998): Sie entwickelten ein Empfehlungssystem, dass das Verhalten der Nutzer einer Anwendung (Word) auswertet, daraus ein Fähigkeitenprofl entwickelt und entsprechen- de Tipps für die Nutzung (und das weitere Lernen) gibt. Aktuelle Forschung beschäfigt sich mit den Möglichkeiten, wie sinnvolle und hilfreiche Empfehlungen für das Lernen gegeben werden können und dabei gleichermaßen die vielen frei verfügbaren Quellen als auch das Wissen im sozialen Netz bzw. in der Community genutzt werden können. Überlegungen, wie Empfehlungssysteme bei der Unterstützung von Lernenden im Web eingesetzt werden können, werden so u.a. in der Gesundheitserziehung vorgenommen (Fernandez-Luque, Karlsen & Vognild, 2009). Im Rahmen seiner Doktorarbeit hat der Er- stautor ein existerendes System entwickelt das versucht, die Quellen zu nutzen und ent- sprechende Empfehlungen für Lernende zu geben, der MyHealth-Service38. Auch wird versucht, das Wissen über Lerneinheiten und -Wege, das in Ontologien und Metadaten beschrieben ist, mit den Erfahrungen von bestmmten Lernergruppen zu kombinieren. Spannend ist auch der Versuch, das persönliche E-Portolio der Lerner, also ihre Sammlung von Texten über ihre Lernerfolge und -ergebnisse, automatsch auszu- werten, um so eine Einschätzung ihres Vorwissens zu erhalten. Das Ziel ist dabei, ihnen so gezielte Lernempfehlungen geben zu können, ohne beispielsweise Wissenstests durchführen zu müssen. Zu dieser Fragestellung haben wir Marco Kalz befragt, der seine Dissertaton in diesem Fachgebiet abgeschlossen hat (Kalz, 2009). 37 htp://www.pwm.at, Stand 02/2010 38 htp://myhealthservice.itek.norut.no, Stand 12/2009 64
    • Marco Kalz zur automatschen Vorwissensanalyse ? Auf welche Weise haben Sie das Vorwissen der Lernenden analysiert? ! Wir haben dazu die Texte in den E-Portolios der Lernenden einer Analyse unterzo- gen Zum Einsatz kam dabei die Latent Semantsche Analyse (LSA, früher auch Latent Semantsches Indexieren oder LSI genannt). Das ist ein statstsches Verfahren zur Berechnung von Ähnlichkeit von Texten. Im Unterschied zu Verfahren, die auf Key- words oder klassischen Thesauri basieren umgeht LSA die Probleme der Poly- semie/Homonymie (Ein Wort mit unterschiedlichen Bedeutungen). Die Methode berechnet statstsch das Aufreten von Wörtern im Kontext von anderen Wörtern. Dazu werden Texte zu Beginn in eine Wort-Dokumenten-Matrix zerlegt, in der das Aufreten von Wörtern gezählt wird. Mit Hilfe der mathe- matschen Methode der Singulärwertzerlegung wird diese Matrix in 3 einzelne Matrizen zerlegt. Das Er- gebnis des Prozesses ist ein multvektorieller reduzierter semantscher Raum, in dem man neue Doku- mente über deren Vektor in diesem Raum mit dort vorhandenen Dokumenten (auch repräsentert als Vektoren) vergleichen kann. In unserem Fall hat das Verfahren brauchbare Ergebnisse geliefert! ? Haben Sie die Ergebnisse Ihrer automatschen Auswertung von E-Portolios von Lernenden mit tradi- tonellen Verfahren der (Vor-) Wissensanalyse verglichen? ! Unter traditonellen Verfahren von Wissensanalysen sehe ich in erster Linie Tests, um relatv objektve Ergebnisse über das Wissen einer Person über bestmmte Aspekte einer Wissensdomäne zu erlangen. Da wir ein Verfahren evaluieren wollten, bei dem keine zusätzlichen organisatorischen oder personellen Belastungen für die Experten hinzukommen, kam ein Vergleich mit klassischen Tests für uns nicht in Fra- ge. ? Auf welche Weise erhalten Lernende mit einem so erstellten Vorwissensprofl dann Lernempfeh- lungen? ! LSA kann dazu genutzt werden, um Inhalte aus Lernaktvitäten mit Inhalten von Lernerdokumenten zu vergleichen. Auf Basis dieser Ähnlichkeit lassen sich so z.B. redundanten Aktvitäten identfzieren und aus einem personalisierten Curriculum enternen. Je nach Basis von vorhandenen Referenzbeispielen wäre es aber ebenso gut möglich, in Zukunf sehr detaillierte Empfehlungen über ein ideales Curriculum zu geben. Hier würde man methodisch so wie bei der automatsierten Bewertung von Essays vorgehen. ? Welche Ratschläge möchten Sie anderen Entwicklern von Empfehlungssystemen für die automatsche Auswertung von E-Portolios von Lernenden geben? ! Besonderer Forschungsfokus sollte in Zukunf auf Methoden liegen, informell erworbenes Wissen und Kompetenzen zu analysieren anstat sich auf XML-Formate für die Auswertung von Zertfkaten zu kon- zentrieren. Dr. Marco Kalz arbeitet als Erziehungswissenschafler bei CELSTEC, der Forschungseinrichtung der Open Universiteit Nederlands und hat dort im Jahr 2009 erfolgreich seine Dissertaton zum Thema „Placement support for learners in learning network“ abgeschlossen. Ein kompletes Profl fndet sich auf seiner Ho- mepage htp://marcokalz.de (02/2010). 65
    • Weitere Empfehlungssysteme im Einsatz Abschließend noch eine Sammlung von weiteren Einsatzgebieten und Empfehlungssys- temen, die bisher nicht angesprochen wurden: | Populär und hilfreich sind die Empfehlungen der webbasierten Kartendienste bei Google-Maps39 oder Map2440. Hier können Abfahrtsort und Ziel angegeben werden und es werden die kürzesten (und andere, z. B. die schnellsten) Fahrtstrecken be- rechnet, angezeigt und beschrieben. | Für die Sofwareentwicklung wurden Systeme entwickelt, die bei der Fehleranalyse Unterstützung bieten, in dem zum Beispiel auf typische Fehler in der spezifschen Si- tuaton hingewiesen werden. Der DebugAdvisor ist ein Beispiel hierfür (Ashok u.a. 2009). | Kamper, Meyer & Reichart (2008) haben ein Empfehlungssystem für Konferenzbesu- cher entwickelt, das Vorschläge für Sessions und Workshops aufgrund der Buchun- gen ähnlicher Konferenzteilnehmer gibt. | Nachrichtenanbieter verweisen auf ihren Seiten gerne auf verwandte Texte, z. B. bei der Deutschen Handwerkszeitung41. 39 htp://maps.google.de/maps, Stand 02/2010 40 htp://www.de.map24.com, Stand 02/2010 41 htp://www.deutsche-handwerks-zeitung.de, Stand 02/2010 66
    • 67
    • 4 ENTWICKLUNG VON EMPFEHLUNGSSYSTEMEN Empfehlungssysteme können entscheidend für den Erfolg einer Anwendung sein. Im Fol- genden haben wir Hinweise zusammengestellt, die bei der Entwicklung eines neuen Empfehlungssystems hilfreich sind. 4.1 Entwicklung im Überblick Im Folgenden wurden einige grundlegende Überlegungen zur Entwicklung von Empfeh- lungssystemen zusammengestellt (in Anlehnung an Schafert & Wieden-Bischof, 2009; Klahold, 2009). Wichtg erscheinen dabei eine Festlegung von Zielen und Zwecken des Empfehlungssystem, eine konzeptonelle Beschreibung und eine (erste) Implemente- rung für Testzwecke. Dann wird empfohlen, mögliche Varianten zu testen und zu verglei- chen, dazu stellen wir in diesem Abschnit insbesondere die Evaluatonsmöglichkeiten von Empfehlungssystemen hin. Auf Grundlage dieser Überprüfungen können einige Pro- zesse neu aufgerollt und wiederholt durchlaufen werden. Abbildung 25: Entwicklung von Empfehlungssystemen im Überblick 4.2 Aktve Einbindung von Nutzern Diese Broschüre entstand in Rahmen eines Projektes, dass sich mit neuen Formen der Unterstützung von Communitys beschäfigt oder auf Informatonen, die in Communitys entstehen, beruht. Bei den anderen Projektveröfentlichungen zum Aufau von Online- Communitys sowie zur Entwicklung von Reputatonssystemen handelt es sich jeweils um Systeme, die eine starke Community-Einbindung auch bei der Entwicklung notwendig machen. „Wachsen lassen“ lautet eines der generellen Prinzipien im Umgang mit Com- munitys, was eine starke Einbindung voraussetzt (vgl. Schafert & Wieden-Bischof, 2009). Bei der Entwicklung von Reputatonssystemen wird diese Einbindung von Exper- ten weniger häufg angesprochen. Technologische und methodische Entscheidungen treten in der Literatur zur Entwicklung von Empfehlungssystemen deutlich stärker in den Vordergrund. Es ist jedoch anzunehmen, dass dies vor allem daran liegt, dass die Beiträ- ge eher von Technologen geschrieben werden. Dort wo tatsächliche Implementerungen erfolgen zeigt die Praxis, dass die Nutzer of eingebunden werden. Eine Einbindung der Nutzer bei der Entwicklung erscheint aus unserer Sicht unbedingt empfehlenswert: 68
    • Ein Beitrag von Turof und Hiltz (2008) zeigt exemplarisch am Beispiel einer Erkundungs- studie für die Bedürfnisse von Notallmedizinern, wie bei der Planung und Entwicklung eines Empfehlungssystem unter Einbindung von Nutzern vorgegangen werden könnte. Ihr Beitrag beurteilt den Informatonsbedarf dieser Zielgruppe. 34 Experten die Mitglie- der einer Online-Community sind, wurden dazu befragt. Turof & Hiltz eruieren auf diese Weise erstaunlich konkrete und brauchbare Vorschläge und Wünsche der Nutzer, bei- spielsweise dass | die Nutzer das Filtern und Organisieren des Materials kontrollieren wollen | die Nutzer mehr professionelle Hilfe bei ihrer Informatonssuche erwarten | auch graue Literatur eingebunden wird und bewertet werden kann | eigene Best-Practces dargestellt und bewertet werden kann sowie | dass Social Tagging erwünscht ist. Auch wenn Empfehlungssysteme „fertg“ entwickelt sind, sollten Nutzer ernstgenom- men werden: So zeigen Befragungen, dass Nutzer gegenüber Empfehlungen, deren Grundlage sie kennen bzw. einschätzen können, größeres Vertrauen haben (Sinha & Swearingen, 2002). Es gibt sogar Anwendungen, bei denen Nutzer ihre Empfehlungen bzw. die Arten ihrer Empfehlungen selbst steuern können (z. B. Memmel, Kockler & Schi- iru, 2009). Zudem weist Hendrik Drachsler in seinem Expertenstatement darauf hin (S. 57), dass Nutzer v. a. Wert auf den Schutz ihrer persönlichen Daten legen. Transpa- renz sollte also im Hinblick auf die Quelle der Empfehlung als auch im Hinblick auf den Umgang mit den Daten der Nutzer bestehen (siehe auch Schickel-Zuber, 2007, 10). 4.3 Ziel und Zweck des Empfehlungssystem Bereits in Abschnit 2.1 (S. 13) haben wir unterschiedliche mögliche Ziele und Zwecke des Empfehlungssystems genannt. Die Betreiber einer Services sollten die genannten Punkte diskuteren und ggf. durch weitere Beweggründe erweitern. Das verfolgte Ziel klar zu benennen ist wichtg, weil es beispielsweise nicht nur die Gestaltung der Nutze- roberfäche beeinfusst, sondern auch ganz grundsätzlich die Wahl des technologischen Verfahrens des Empfehlungssystems beeinfusst. Beispielsweise würde ein kollaborat- ves Filtern bei einem Partnerschafsportal wohl die Benutzer irriteren („Frauen, denen dieser Mann gefallen hat, haten auch Gefallen an ...“). 4.4 Konzeptonelle Beschreibung Bezogen auf die drei Bereiche des Konzeptes, nämlich die Daten, die Anwendung sowie die Präsentaton können folgende Hinweise gegeben werden. 69
    • Abbildung 26: Schichten von Empfehlungssystemen im Überblick (a) Bei den Daten sollte sich das System möglichst mit vorhandenen Daten begnügen. Das bedeutet, dass komplizierte oder lange Fragebögen vermieden werden sollen und bevorzugt aus der Verhaltenshistorie Schlüsse für Interessen gezogen werden sollten. Das Verfahren sollte also möglichst genügsam sein (vgl. Schickel-Zuber, 2010, 10). (b) Bezogen auf die Anwendungen lassen sich folgende Empfehlungen geben: Zunächst muss die Anwendung möglichst präzise Empfehlungen zu geben. Konkrete Überprü- fungsmöglichkeiten beschreiben wir in Abschnit 4.6 (S. 71). Zudem muss die Anwen- dung auch skalierbar sein, d.h. sie muss mit denkbar grossen Mengen an Nutzern und Objekten zurecht kommen. Für welches Verfahren man sich entscheidet, ist auch eine Frage der damit verbundenen Ziele und Zwecke (s.o.). Anregungen lassen sich dabei von den Empfehlungssystemen in dieser Studie holen, zweckmäßig ist dabei auch, die Vor- und Nachteile der Verfahren durchzugehen und eigene Kombinatonen der Verfahren zu entwickeln (S. 28f). (c) Im Bezug auf die Präsentaton der Empfehlungen ergibt sich aus dieser Studie keine besonders aufregende oder aus dem Rahmen fallende Darstellungen. In der Regel wer- den Empfehlungen am Seitenrand oder in Listenform gegeben, wenn möglich, mit einer passenden Illustraton. Allerdings kann unter dem Aspekt der Präsentaton überlegt wer- den, ob und welche Formen der Modifkaton man den Betreibern sowie auch den Nut- zern überlässt: Können beispielsweise die Auswahl der Empfehlungen, die Algorithmen oder die Darstellung beeinfusst werden? Es ist anzunehmen, dass zumindest für einige Nutzer hier Einfussmöglichkeiten erwünscht sind. Beispielsweise liesse sich so denken, dass Amazon-Kunden in ihrem Nutzerprofl auch Neuerscheinungen aus einem be- stmmten, von ihnen zu wählenden Gebiet eingeblendet bekommen. Zum Abschnit der Präsentaton gehört auch der Hinweis von Hendrik Drachsler, dass zunehmend Widgets- und Plugin-Interfaces mitgedacht werden sollten. Auch an RSS-Feeds, E-Mail-Services oder Einbindungen in Facebook und ähnliche soziale Netzwerke sind ggf. zu überdenken. Schließlich ist bei der Präsentaton des Empfehlungssystems darauf zu achten, dass Vor- lieben der Nutzer nur für sie einsehbar sein sollten (Schickel-Zuber, 2007). 4.5 Implementerung In den bisherigen Ausführungen und Beschreibungen haben wir die Implementerung ei- nes Empfehlungssystems in eine vorhandene Anwendung nicht weiter thematsiert. Auch haben wir dazu keine spezifschen Hinweise erhalten, was konkrete Gefahren und Begleitmaßnahmen belangt. In diesem Zusammenhang sei aber noch einmal darauf hin- 70
    • gewiesen, dass eine frühzeitge Einbindung der Nutzer zu empfehlen ist, ein Schutz der privaten Daten jederzeit gewährleistet muss und von Anfang an Transparenz über die genutzten Daten und Verfahren hergestellt sein muss. Entsprechende Informatonen und Materialien müssen bei der Einführung also bereits vorliegen. Bevor ein Empfehlungssystem in den Realbetrieb geht, sollte es ausgiebig erprobt und getestet werden. Unterschiedliche Algorithmen, z. B. unterschiedliche Verfahren, Kom- binatonen oder Gewichtungen, sollten systematsch erprobt und verglichen werden. Der folgende Abschnit stellt mögliche Vorgehen vor. 4.6 Evaluaton: Überprüfung der Qualität und Nützlichkeit von Empfehlungen Wie lassen sich Empfehlungssysteme bewerten? Die Qualität einer Empfehlung lässt sich nur dann eindeutg bewerten, wenn es anerkannte Maßstäbe und Richtlinien für eine qualitatv hochwertge Empfehlung gibt. Bewertung von Empfehlungen durch Befragungen Relatv einfach können Empfehlungssysteme bewertet werden, bei denen die korrekten bzw. optmalen Lösungen eindeutg und bekannt sind. Ein Beispiel hierfür ist eine Rou- tenempfehlung, wo die Qualität anhand von Kilometern oder Fahrzeit festgemacht wer- den kann. Wenn ein System die besten Empfehlungen gibt, arbeitet es optmal. Auch nicht eindeutge Empfehlungen verlangen jedoch nach einer Überprüfung ihrer Qualität. Auch für sie wurden spezifsche Qualitätskriterien entwickelt, um objektv ihre Brauchbarkeit zu überprüfen. Klahold (2009) geht dabei auf Möglichkeiten der Evaluat- on durch Befragungen ein (S. 37f). | Eine Möglichkeit der Überprüfung ist die Bewertung der Empfehlungen im Hinblick auf ihre Nützlichkeit aus Nutzersicht. Allerdings sind dazu ausreichend viele Nutzer zu befragen.. | Zudem kann das Empfehlungssystem systematsch mit Empfehlungen von Experten verglichen werden. Dazu müssen Experten auf Grundlage der zu empfehlenden Ob- jekte Empfehlungen abgeben. Die Ähnlichkeit der Empfehlungen des Systems sowie der Empfehlungen der Experten kann wiederum berechnet werden und als Maßstab hergenommen werden. Eine Übereinstmmung von 100 Prozent ist hier die Zielgrö- ße. Bewertung von Algorithmen durch Analysen mit Testdaten Bei der Entwicklung von Empfehlungssystemen gilt es häufg einen Vergleich unter- schiedlicher Algorithmen und Verfahren vorzunehmen. Es ist dazu jedoch nicht zwangs- läufg notwendig, wie bei Klahold (2009) beschrieben, Nutzer- oder Expertenbefragun- gen durchzuführen. Wenn beispielsweise Einschätzungen der Nutzer über (zu empfehlende Elemente) oder ein paar Erkenntnisse über ihr Nutzerverhalten vorliegen, ist das folgende Verfahren möglich: Man greif darauf zurück, dass ein Empfehlungssystem „versucht, die Bewer- tung vorherzusagen, die der Nutzer dem Objekt geben würde, falls er es nach der Be- nutzung selbst bewerten müsste“ (Sorge, 2009, 19). Dazu berechnet man mit Hilfe der Algorithmen Bewertungen von Objekten die (eigentlich) bereits bekannt sind und ver- gleicht das Ergebnis mit der tatsächlichen Bewertung. 71
    • Dieses Vorgehen wird anhand der Evaluaton unterschiedlicher Empfehlungsalgorithmen bei Shardanand und Maes (1995) genauer beschrieben: Ziel der Untersuchung war es, den besten Algorithmus für ein Empfehlungssystem für Musik auszuwählen. Basis für Empfehlungen sind dabei die Nutzerbewertungen von Musikstücken und ein kollaborat- ves Filtern. Jedes Musikstück wird auf einer Skala von 1 („pass my earplugs“) bis 7 („one of my favorite few! can't live without them!!“) bewertet. Für die Evaluaton der Empfehlungsalgorithmen wurden in 1.000 Nutzerproflen je 20 Prozent der bereits bewerteten Musikstücke in einem Nutzerprofl herausgenommen und als Zielmenge bestmmt. Die übrigen 80 Prozent der bewerteten Musikstücke wur- den genommen, um daraus zu berechnen, welche Bewertung die Stücke aufgrund des verwendeten Algorithmus in der vorher bestmmten Zielmenge für jeden Nutzer erhal- ten würden. Diese errechnete Bewertung wird mit der tatsächlichen Bewertung des Be- nutzers verglichen. Dabei kann untersucht (und verglichen) werden, inwieweit die Bewertungen durch die Algorithmen mit den tatsächlichen abweichen: Dabei sollten Mitelwert und Streuung der Fehler möglichst klein sein sollten: So sollte die Bewertung nicht nur im Mitel mög- lichst korrekt geschätzt werden, sondern auch möglichst selten (hoch) abweichen. Weil nicht mit jedem Algorithmus gleichermaßen für jeden Fall Werte berechnet werden kön- nen, ist zudem zu untersuchen, wie hoch der Prozentsatz zu schätzender Werte ist (sie- he Shardanand & Maes, 1995). Auf diese Weise ist es – vorausgesetzt, entsprechende Nutzerdaten liegen vor – sehr gut möglich (unterschiedliche) Algorithmen zu bewerten. Kennzahlen für Empfehlungssysteme: Precision, Recall und Novelty Eben genannt wurden die mitleren Fehler und die Standardabweichung für Fehler bei Empfehlungen sowie der Prozentsatz des Anteils, zu dem ein Algorithmus überhaupt Empfehlungen berechnen kann (s.o.). Im Bereich der Empfehlungssysteme gibt es darüber hinaus zwei spezifsche Größen, die bei der Einschätzung der Qualität eines Systems berechnet werden können (Herlocker u.a., 2004). Sie werden „Precision“ und „Recall“ genannt. Precision (Englisch für „Präzisi- on“) ist dabei der Anteil der relevanten Empfehlungen an den empfohlenen Objekten. Recall (Englisch für „Aufruf“) ist der Anteil der empfohlenen Elemente an den relevanten Elementen. Anhand einer Darstellung lässt es sich leichter darstellen, wie sich diese bei- den Maßstäbe unterscheiden. Abbildung 27: Grundlagen für die Berechnung von Recall und Precision Quelle: Abbildung nach einer Darstellung in Klahold, 2009, 40. 72
    • Dazu das Berechnungsbeispiel aus Klahold (2009): „Gibt es beispielsweise 10 relevante Empfehlungselemente und sind unter 15 empfohlenen Elementen 5 relevante, so hat Precision einen Wert von 33% und Recall einen Wert von 50%“ (S. 41). Zwar geben die beiden Maßzahlen Prozentangaben an, die eine gewisse Exaktheit vor- spiegeln. Da die beiden Maßzahlen jedoch wiederum auf Daten beruhen, die mit obigen Verfahren erfasst wurden, ist ihre Genauigkeit und Brauchbarkeit nicht von vornherein gegeben. Neben der Genauigkeit muss ein System auch wirklich neue und nicht einfach nahe lie- gende Empfehlungen geben (Schickel-Zuber, 2007, 17): Wenn jemand den Kinoflm über Harry Poter und den Orden der Phönix gesehen hat, wäre es auf den ersten Blick sinn- voll, ihm auch die ersten vier Harry-Poter-Filme zu empfehlen. Allerdings ist die Wahr- scheinlichkeit groß, dass er sie eh schon kennt. Die Neuartgkeit (Engl. „Novelty“) einer Empfehlung zu überprüfen ist im Zweifel nur durch Befragungen der Nutzer feststellbar. Trotzdem gibt es Algorithmen, die die Neuar- tgkeit der Empfehlungen bewerten lassen (s. Schickel-Zuber, 2007, 19; er verweist auf Equaton 2.4): Die Neuartgkeit wird dabei erudiert, in dem berechnet wird, wieviele der Empfehlungen auch in den allgemeinen Empfehlungen der Community aufreten. Je mehr es sind, desto weniger neuartg ist erwartungsgemäß eine Empfehlung für einen Nutzer. 73
    • 5 AUSBLICK Ausgangslage der Studie und dieses Bandes war das Fehlen eines deutschsprachigen Buchs über aktuelle Empfehlungssysteme im Web. Es gab keine Darstellung mit dem Ziel, einen Überblick zu vorhandenen Systemen und Verfahren zu geben und das The- mengebiet eher allgemeinverständlich auch für Betreiber und Manager von Webanwen- dungen und Systemen darzustellen. Darauf auf mangelndes Interesse am Thema zu schließen, wäre jedoch falsch: Im Gegen- teil, das Interesse ist groß und wuchs in den letzten Jahren enorm. So hat die Zahl der wissenschaflichen Veröfentlichungen rasant zugenommen: In der einschlägigen DLPB- Literaturdatenbank42 für das Jahr 1995 sind 29 Trefer für „recommender“ zu fnden, für 1998 38, 2000 bereits 134, 2003 dann 318, im Jahr 2005 sind es 508 und für das Jahr 2008 sind es dann sogar 1.001 verzeichnete Veröfentlichungen zum Thema. Auch wäh- rend wir an dieser Studie arbeiteten, haben wir beispielsweise immer wieder auf die Lieferzeiten eines englischsprachigen Handbuchs geschielt, dass nun im April 2010 er- scheinen soll und verspricht, eine gute Übersicht über Empfehlungssysteme zu geben (Kantor u.a., im Druck). Es ist anzunehmen, dass dieses Forschungsinteresse auch mit Erwartungen und Interes- se der Wirtschaf im Zusammenhang steht und dadurch weitere Experimente und Inno- vatonen in diesem Bereich zu erwarten sind. Viele Anwendungsbereiche werden dabei gerade erst entdeckt. Besondere Anwendungsfälle liegen hier insbesondere bei den So- cial-Media-Systemen, da man hier viele Nutzerinformatonen, enorm viele Inhalte und auch einen besonderen Bedarf hat, die Übersicht zu behalten. Auch ist zu erwarten, dass beispielsweise die Entwicklungen zu Linked Data, die Soziale Netzwerkanalyse von Webdaten oder auch neue Community-Anwendungen Anregungen für bessere oder neuartge Empfehlungssysteme bieten. Auch neue technische Konzepte sind denkbar: Mit der Idee, die Daten eines Empfehlungssystem nicht auf zentralen Servern zu spei- chern, erörtert Sorge (2008) so die Möglichkeiten von Peer-to-Peer-Systemen. Gleichzeitg gehen wir davon aus, dass mit der intensiven Verwendung und Analyse un- ter Umständen auch eine erhöhte Aufmerksamkeit der Öfentlichkeit über die Verwen- dung von persönlichen Daten entstehen könnte und hier entsprechende eher sozialwis- senschafliche und rechtliche Fragestellungen zu bearbeiten sind. Natürlich muss ein Buch, dass soviel über Empfehlungssysteme berichtet, auch mit einer Empfehlung enden: Zu diesem Band fnden sich auch weitere Materialien im Web, u.a. ein Video43. Und natürlich könnten Sie auch die weiteren Veröfentlichungen des Projek- tes interessieren: Zum erfolgreichen Aufau von Online-Communitys, zu (Meta-) Infor- matonen aus Communitys und Netzwerken sowie zu Feedback und Reputatonssyste- men (siehe letzte Seite). 42 htp://dblp.l3s.de/?q=recommender&search_opt=all&newQuery=yes&resTableName= query_resultQpXzHt&synt_query_exp=full, Stand 02/2010 43 erreichbar via htp://www.newmedialab.at, Stand 02/2010 74
    • 75
    • LITERATUR UND QUELLEN | Armstrong, Robert; Freitag, Deyne; Joachims, Thorsten & Mitchell, Tom (1995). Webwatcher: A lear- ning apprentce for the world wide web. In: AAAI Spring Symposium on Informaton Gathering from Hete- rogeneous, Distributed Environments, Standford, USA. | Ashok, B.; Joy, Joseph; Liang, Hongkang; Rajamani, Sriram K.; Srinivasa, Gopal & Vangala, Vipindeep (2009). DebugAdvisor: a recommender system for debugging. In: Proceedings of the the 7th joint meetng of the European sofware engineering conference and the ACM SIGSOFT symposium on The foundatons of sofware engineering; Amsterdam, The Netherlands, 373-382. | Balabanovic, Marko & Shoham, Yoav (1997). Fab: content-based, collaboratve recommendaton. Onli- ne zugänglich unter: htp://portal.acm.org/citaton.cfm? id=245124&dl=GUIDE&coll=GUIDE&CFID=75884622&CFTOKEN=61674452 (2010-02-01) | Beier, Heiko & Blumauer, Andreas (2004). Arbeitsplatz der Zukunf auf der Platorm Wissensmanage- ment. Wissensmanagement Magazin, Büro für Medien, Oliver Lehnert (Hrsg.), Ausgabe 01/2004. | Block, Amke & Pohl, Gerrit (2006). Musik im Internet. Deutscher Musikrat, Bonn. Online zugänglich un- ter: htp://www.zukunfsmusik.net/db/upload/pdf/blockpohl.pdf (2010-01-24) | Brand-Haushofer, Richard (2005). Recommender Systeme in digitalen Bibliotheken. Bakk. Arbeit. Inst- tut: Informatonsverarbeitung., Abt. f. Informatonswirtschaf. Wien, Wirtschafsuniv.. Online zugänglich unter: htp://epub.wu-wien.ac.at/dyn/virlib/bakkWI/showentry?ID=epub-wu-01_93d&style=aihtml (2010- 01-04) | Buston, Peter M. & Emlen, Stephen T. (2003). Cognitve processes underlying human mate choice: The relatonship between self-percepton and mate preference in Western society. Online zugänglich unter: htp://www.pnas.org/content/100/15/8805.full.pdf+html (2010-02-07) | Claypool , Mark; Gokhale, Anuja; Miranda, Tim; Murnikov, Pavel; Netes, Dmitry & Sartn, Mathew (1999). Combining Content-Based and Collaboratve Filters in an Online Newspaper. Online zugänglich un- ter: htp://web.cs.wpi.edu/~claypool/papers/content-collab/content-collab.pdf (2010-02-02) | Cummins, Ronan & O’Riordan, Colm (2006). Evolving local and global weightng schemes in informat- on retrieval. In: Informaton Retrieval, 9, 311-330. | Derntl, Thomas; Hampel, Thorsten; Motschnig, Renate & Pitner, Tomas (2009). Social Tagging und In- clusive Universal Access. In: Birgit Gaiser, Thorsten Hampel & Stephanie Panke (Hrsg.), Good Tags – Bad Tags. Social Tagging in der Wissensorganisaton, Münster: Waxmann, 51-71. | Dolog, Peter (2009). Tag Based Recommendaton in KIWI. OntologSession, 12 February 2009. Online zugänglich unter: htp://ontolog.cim3.net/fle/work/SemantcWiki/SWiki-05_Applicaton-2_20090212/Tag- based-Recommendatons-in-KIWI--PeterDolog_20090212.pdf (2010-02-18) | Duan, Lian; Street, W. Nick & Lu, Der-Fa (2008). A Nursing Care Plan Recommender System using a data mining approach. In: Proceedings of the 3rd INFORMS Workshop on Data Mining and Health Informatcs. | Economic Expert (2010). MovieLens. Online zugänglich unter: htp://www.economicexpert.com/a/Mo- vieLens.html (2010-02-09) | Färber, Frank; Weitzel, Tim; Keim, Tobias & Wendt, Oliver (2002). A model-based approach to recom- mending partners. In: Wirtschafsinformatk (1) 2003: 447-466. | Fernandez-Luque, Luis; Karlsen, Randi & Vognild, Lars K. (2009). Challenges and Opportunites of Using Recommender Systems for Personalizes Health Educaton. In: Medical Informatcs in a United and Healthy Europe. | Fischer, Gerhard; Stevebs Curt (1991). INFOSCOPE – Informaton access in complex poorly structured informaton spaces. In: Proceedings of the SIGCHI conference on Human Factors in Computng Sytems: Re- aching through technology, New Orleans, US, 63-70. | Friendscout24 (2002). FriendScout24: dann klappt's auch mit dem Partner! FriendScout24 startet wis- senschaflichen Kompatbilitäts-Test. Neues Verfahren fndet den idealen Partner. Online zugänglich unter: htp://www.presseportal.de/pm/19470/342487/friendscout24 (2010-02-06) 76
    • | Fu, W.; Budzik, J. Hammond, K.J. (2000). Mining Navigaton History for Recommendaton. In: Procee- dings of the internatonal confernce for intelligent user interfaces, New Orleans, US, 106-112. | Gams, Erich & Reich, Siegfried (2004). Following your colleagues footprints:Navigaton support with trails in shared directories. In: Proceedings of the 04 ACM Conference on Hypertext, August 9-13, Santa Cruz, California, USA. | Gams, Erich (2005). Following your Colleagues’ Footprints: Assistng Navigaton with User Trails. Dis- sertaton an der Johannes Keppler Universität Linz. | Glachs, Dietmar & Osterrieder, Christan (2006). Bringing Marketng to Tourist Stakeholders. Recom- mender Engine for Tourist Organizatons. In: Proceedings of the IWWPST '06. | Givon, Sharon & Lavrenko, Viktor (2009). Predictng social-tags for cold start book recommendatons. In: Proceedings of the third ACM conference on Recommender systems table of contents, New York, USA, 333-336. | Herlocker, J., Borchers, A., Konstan, J., and Riedl, J. (1999). An algorithmic framework for performing collaboratve fltering. In Proceedings of the 22nd annual internatonal ACM SIGIR conference on Research and development in informaton retrieval, SIGIR’1999, pages 230-235. | Goldberg, David; Nichols, David; Oki, Brian & Terry, Douglas (1992). Using collaboratve fltering to weave an informaton tapestry. Communicaton of the ACM, 35, 12, 61-70. | Goldberg, Ken; Roeder, Theresa; Gupta, Dnruv & Perkins, Chris (2000). Eigentaste: A Constant Time Collaboratve Filtering Algorithm. In: Informaton Retrieval, 4, 2, 133-151. | Good, Nathaniel; Schafer, Ben J.; Konstan, Joseph A.; Borchers, Al; Sarwar, Badrul; Herlocker, Jon & Riedl, John (1999). Combining Collaboratve Filtering with Personal Agents for Beter Recommendatons. Online zugänglich unter: htp://www.grouplens.org/papers/pdf/aaai-99.pdf (2010-02-02) | Graf, Joachim (2009). Start des iBusiness 'Search Advertsing Index': Hoher Werbedruck im SEM-Markt. In: iBusiness Executve Summary, 19, 8, 15. | Güntner, Georg; Sint, Rolf & Westenthaler, Rupert (2009). Ein Ansatz zur Unterstützung traditoneller Klassifkaton durch Social Tagging. In: Birgit Gaiser, Thorsten Hampel & Stephanie Panke (Hrsg.), Good Tags – Bad Tags. Social Tagging in der Wissensorganisaton, Münster: Waxmann, 187-199. | heise online (2001). Datenbank für ‘Gene der Musik’. Online zugänglich unter: htp://www.heise.de/newstcker/meldung/Datenbank-fuer-Gene-der-Musik-41794.html (2010-01-25). | Henze, N. (2008). Personalisierung und Benutzermodellierung. Recommender Systeme I. Collaboratve Recommender Systeme. Online zugänglich unter: htp://www.kbs.uni-hannover.de/Lehre/pers08/recom- mender1.pdf (2010-02-09) | Herzog, Christan & Dix, Jörg (2009). BioMedExperts – Connectng Brains. Online zugänglich unter: htp://www.telemedizinfuehrer.de/index.php?opton=com_content&task=view&id=463&Itemid=62 (2010- 02-09) | Heymann, Martn (2004). Recommender Systeme in Theorie und Praxis. Seminararbeit an der Johann Wolfgang Goethe Universität Mainz. Online zugänglich unter: htp://www.is-frankfurt.de/uploads/dow- n271.pdf (2010-01-23) | Kaas, Klaus-Peter und Schneider, Tobias (2007). Ein präferenzbasiertes Recommender System für In- vestmentonds. In: Tomás Bayón, Andreas Herrmann und Frank Huber (Hrsg.), Vielfalt und Einheit in der Marketngwissenschaf. Ein Spannungsverhältnis, Gabler, 499-521. | Kamper, Gerald; Meyer, Ludwig & Reichart, Martn (2008). Recommendaton Systeme. Social Network Day, 31.5.2008, TU Wien. Online zugänglich unter: htp://www.ansna.org/konferenz_papers/recommenda- ton.pdf (2010-01-15) | Kalz, Marco (2009). Placement Support for Learners in Learning Networks. SIKS Dissertaton Series. | Kantor, Paul B.; Ricci, Francesco; Rokach, Lior & Shapira, Bracha (in Druck). Recommender Systems Handbook. New York: Springer. | Kim, Juntae (2006). What is a recommender system? Proceedings of Recommenders 06, 12.-13.9.2006, Bilbao. Zitert in Drachler (2009), nicht mehr online zugänglich. 77
    • | Klahold, André (2009). Empfehlungssysteme: Recommender Systems – Grundlagen, Konzepte und Lö- sungen. Wiesbaden: Vieweger + Teubner. | Klambauer, Kerstn (2008). Virtuelle Liebe. Psychologische Determinanten bei der Partnersuche im In- ternet. Online zugänglich unter: htp://www.kramurlozly.at/psychologie/psychologie_downloads/Mag- KlambauerVirtuelleLiebe.pdf (2010-02-06) | Knoth, Petr; Schmidt, Marek & Smrž, Pavel (2008). Informaton Extracton — State-of-the-Art. Know- ledge in a Wiki (KiWi), Deliverable 2.5. htp://wiki.kiwi-project.eu/multmedia/kiwi-pub: KiWi_D2.5_f- nal.pdf (2009-09-02) | Kockler, Michael (2008). Concepton and Implementaton of Tagging Support Mechanisms in a Web 2.0 Social Media Sharing Platorm. Diplomarbeit an der Technischen Universität Karlsruhe. | Krulwosh, B. & Burkey, C. (1997). The InfoFinder Agent: Learning User Interests through Heuristc Phra- se Extracton. In: IEEE Expert/Intelligent Systems and Their Applicatons, 12, 5, 22-27. | Lang, K. (1995). News{W}eeder: learning to flter netnews. In: Proceedings of the 12th Internatonal Conference on Machine Learning, Lake Tahoe, CA, US, 1995. | Librarything.com (2006). New feature: Tag-based recommendatons. Weblogeintrag vom 1.1.2006. On- line zugegänglich unter: htp://www.librarything.com/blog/2006/01/new-feature-tag-based-recommenda- tons.php (2010-01-23) | Lieberman, Henry (1995). Letzia: An Agent That Assits Web Browsing. In: Proceedings fo the Four- teenth Internatonal Joint Conference on Artfcial Intelligence, San Mateo, US, 924-929. | Lieberman, Henry; Van Dyke, Neil W. & Vivacqua, Adriana S. (1999). Let's Browse: A Collaboratve Web Browsing Agent. Online zugänglich unter: htp://agents.media.mit.edu/publicatons/lets-browse-iui99/pa- per.pdf (2010-02-02) | Linden, Greg; Smith, Brent & York, Jeremy (2003), Amazon.com Recommendatons. Item-to-Item Colla- boratve Filtering. In: IEEE Internet Computng, 7, 1, 76-80. Online zugänglich unter: htp://www.cs.umd.e- du/~samir/498/Amazon-Recommendatons.pdf (2010-01-25) | Linden, Greg (2006). Early Amazon: Recommendatons. Online zugänglich unter: htp://glinden.blogs- pot.com/2006/04/early-amazon-recommendatons.html (2010-01-25) | Linton, Frank & Charron, Andy (1998). OWL: A Recommender System for Organizaton-Wide Learning. In: AAAI Technical Report WS-98-08. Online zugänglich unter: htps://www.aaai.org/Papers/Workshops/1998/WS-98-08/WS98-08-017.pdf (2010-01-24). | Luhn, Hans Peter (1958). A Business Intelligence System. In: IBM Journal, 2, 4, 314-319. | Malone, T.W.; Grant, K.R.; Turbak, F.A. (1986). The informaton lens: an intelligent system for informat- on sharing in organizatons. In: Proceedings of the SIGCHI conference on Human Factors in Computng Sys- tems, Boston, US. | Memmel, Martn; Kockler, Michael und Schiiru, Rafael (2009). Providing Mult Source Tag Recommen- datons in a Social Resource Sharing Platorm. Journal of Universal Computer Science, vol. 15, no. 3, 678- 691. | Mikeonads.com (2008). Using your browser URL history to estmate gender. Weblogeintrag vom 13.7.2009 htp://www.mikeonads.com/2008/07/13/using-your-browser-url-history-estmate-gender/ (2009-08-12) | Mishne, Gilad (2006). AutoTag: a collaboratve approach to automated tag assignment for weblog posts. WWW 2006: 953-954. | Miyo, Kengo; Nitami, Yuki S.; Kitagawa, Yoichiro & Ohe, Kazuhiko (2007). Development of Case-based Medicaton Alertng and Recommender System: A New Approach to Prevente for Medicaton Error. In: Stu- dies in Health Technology and Informatcs, 129, 2, 871-874. | Mooney, R.J. & Roy, L. (2000). Content-Based Book Recommending Using Learning for Text Catogizat- on. In: Proceedings of the ffh ACM conference on Digital Libaries, San Antonio, US, 195-204. | Neumann, Andreas W. (2009). Recommender Systems for Informaton Provides. Designing Customer Centric Paths to Informaton. Heidelberg: Physica-Verlag. 78
    • | Nunes, Maria & Cerri, Stefano (2008). Improving Recommendatons by Using Personality Traits in User Profles. In: Proceedings of I-Know '08 and I-Media '08, Graz, Austria, 92-100. | Pandora (2010). About The Music Genome Project. Online verfügbar unter: htp://www.pandora.com/corporate/mgp (2010-01-25) | Parikh, Nish & Sundaresan, Neel (2009). Buzz-Based Recommender System. Posterbeitrag auf der WWW-Konferenz in Madrid. Online zugänglich unter: htp://www2009.org/proceedings/pdf/p1231.pdf (2010-01-14) | Pazzani, M.; Muramatsu, J. & Billsus, D. (1996). Syskill & Webert: Identfying interestng web sites. In: Proceedings of the AAAI Spring Symposium on Machine Learning in Informaton Access, Irvine, US. | Pohl, Wolfgang & Nick, Achim (1999). Machine Learning and Knowledge Representaton in the LaboUr Approach to User Modeling. Online zugänglich unter: htp://www.cs.usask.ca/um99/Proc/pohl.pdf (2010- 02-02) | Prediggo (2010). Intelligent Cross Selling Solutons for eShops. Online zugänglich unter: htp://ww- w.prediggo.com/technology-.html (2010-02-06) | Rahnenführer, Jörg (2008). Ähnlichkeits-und Distanzmaße. Unterlagen zur Vorlesung „Multvariate Ver- fahren“ an der TU Dortmund. Online zugänglich unter: htp://www.htw- saarland.de/Members/grabowski/uebersicht/vl/statstk-material/R_Kap2_neu.pdf/download (2010-01- 04) | ReadWriteWeb (2009). Four Approaches to Music Recommendatons: Pandora, Mufn, Lala, and eMu- sic. Online zugänglich unter: htp://www.readwriteweb.com/archives/music_recommendatons_four_ap- proaches.php (2010-02-07) | Resnick, P.; Iacovou, N.; Suchak, M.; Bergstrom, P.; Riedl, J. (1994). GroupLens: An Open Architecture for Collaboratve Filtering of Netnews. In: Proceedings of ACM, Conference on Computer Supported Co- operatve Work, Chapel, US, 175-186. | van Rijsbergen, C.J. (1979). Informaton Retrieval, London. | Rucker, J.; Polanco, M.J. (1997). Siteseer: Personalizes Navigaton for the Web. In: Communicatons of the ACM, 40, 3, 73-75. | Salton, G. & McGill, M.J. (1986). Introducton to Modern Informaton Retrieval, New York. | Schafert, Sandra; Eder, Julia; Hilzensauer, Wolf, Kurz, Thomas; Markus, Mark; Schafert, Sebastan; Westenthaler, Rupert & Wieden-Bischof, Diana (2009). (Meta-) Informatonen von Communitys und Netz- werken. Entstehung und Nutzungsmöglichkeiten. Erschienen in der Reihe “Social Media”, hrsg. von Georg Güntner und Sebastan Schafert, Band 2. Salzburg: Salzburg Research. | Schafert, Sandra; Hilzensauer, Wolf & Wieden-Bischof, Diana (2009). Social Tagging. In: Sandra Scahf- fert u.a., (Meta-) Informatonen von Communitys und Netzwerken. Entstehung und Nutzungsmöglichkei- ten. Erschienen in der Reihe “Social Media”, hrsg. von Georg Güntner und Sebastan Schafert, Band 2. Salzburg: Salzburg Research, 34-46. | Schafert, Sandra & Wieden-Bischof, Diana (2009). Erfolgreicher Aufau von Online-Communitys. Kon- zepte, Szenarien und Handlungsempfehlungen. Erschienen in der Reihe “Social Media”, hrsg. von Georg Güntner und Sebastan Schafert, Band 1. Salzburg: Salzburg Research. | Schafert, Sandra; Güntner, Georg; Lassnig, Markus & Wieden-Bischof, Diana (2010). Reputaton und Feedback im Web. Einsatzgebiete und Beispiele. Erschienen in der Reihe “Social Media”, hrsg. von Georg Güntner und Sebastan Schafert, Band 4. Salzburg: Salzburg Research. | Schickel-Zuber, Vincent (2007). Ontology Filtering. Inferring Missing User’s Preferences in eCommerce Recommender Systems. Thesis an der Ecole Polytechnique Federale de Lausanne. Online zugänglich unter: htp://vpaa.epf.ch/webdav/site/vpaa/shared/Prix%20de%20recherche%2008/Thesis_3934_Schickel.pdf [2010-01-23] | Seo, Y.W. & Zhang, B.T. (2000). Personlized Web-Document Filtering using reinforcement learning. In: Applied Artfcial Intelligence, 15, 7, 665-668. 79
    • | Shardanand, Upendra, Maes, Pate (1995). Social Informaton Filtering: Algorithms for Automatng „Word of Mouth“. In: Proceedings of ACM CHI'95 Conference on Human Factros in Computng Systems, Denver, US, 210-217. Online zugänglich unter: htp://jolomo.net/ringo/chi-95-paper.pdf (2010-01-07) | Simon, Nina (2009). Recommendaton Engines. Online zugänglich unter: htp://museumtwo.pbworks.- com/Ch2_pt13 (2010-01-26) | Sinha, Rashmi & Swearingen, Kirsten (2002). The role of transparency in recommender systems. In: CHI '02 extended abstracts on Human factors in computng systems, 830-831. | Smyth, Barry; Briggs, Peter & Coyle, Maurice (2009). Google Shared. A Case-Study in Social Search. In: User Modeling, Adaptaton, and Personalizaton, Berlin: Springer, 283-294. | Sorge, Christoph (2007). Selbstorganisierende Empfehlungssysteme im Internet. Eine interdisziplinäre zwischen Technik und Recht. Karlsruhe: Universitätsverlag. | Stüvel, Heike (2009). Je gleicher die Partner, desto glücklicher das Paar. Online zugänglich unter: htp://www.welt.de/wissenschaf/psychologie/artcle3616398/Je-gleicher-die-Partner-desto-gluecklicher- das-Paar.html (2010-02-07) | Tanaka, Katsuaki; Hori, Koichi; Yamamoto, Masato (2008). Development of a Recommender System ba- sed on Personal History. In: Transactons of the Japanese Society for Artfcial Intelligence, Volume 23, Issue 6, 412-423. | Terveen L. & Hill W. (2001): Beyond Recommender Systems: Helping People Help Each Other, In: HCI in the New Millennium, Jack Carroll, ed., Addison-Wesley. | Terveen, Loren; Hill, Will; Amento, Brian; Mc Donald, David & Creter, Josh (1997). PHOAKS: A System for Sharing Recommendatons, In: Communicaton of the ACM, March 1997/Vol. 40, No. 3, p. 59(4), Online zugänglich unter: htp://www.ischool.utexas.edu/~i385d/readings/Terveen_PHOAKS_97.pdf (2010-02-02) | Traurig, Peter (2009). Sofwaresysteme zur Entscheidungsunterstützung bei Medikamentenverordnun- gen. In: Public Health Forum, Volume 17, Issue 4, December 2009, 32.e1-32.e3. | Turof, Murray & Hiltz, Starr Roxanne (2008). Assessing the health informaton needs of the emergency prepardness and management community. In: Informaton Services & Use, 28, 269-280. | Wikipedia (2010): Last.fm. Online zugänglich unter: htp://en.wikipedia.org/wiki/Last.fm (2010-02-01) 80
    • AUTORINNEN UND AUTOREN Dr. Sandra Schafert arbeitet als wissenschafliche Mitarbeiterin und Projektmanagerin bei der Salzburg Research Forschungsgesellschaf (SRFG) zu Webbasierten (Bildungs-) In- novatonen. Sie leitet die ComStudy, in deren Rahmen diese Veröfentlichung entstand. Dr. Tobias Bürger ist wissenschaflicher Mitarbeiter bei der SRFG im Bereich Wissens- und Medientechnologien. Mag. Wolf Hilzensauer ist wissenschaflicher Mitarbeiter bei der SRFG im Bereich Infor- maton Society Research. DI (FH) Mag. Cornelia Schneider ist wissenschafliche Mitarbeiterin bei der SRFG im Be- reich Mobile and Webbased Informaton Systems. Mag. Diana Wieden-Bischof ist wissenschafliche Mitarbeiterin bei der SRFG im Bereich Informaton Society Research. SOCIAL MEDIA – WEITERE BÄNDE In der Reihe „Social Media“ (herausgegeben von Georg Güntner und Sebastan Schafert sind bisher erschienen: Band 1 Erfolgreicher Aufau von Online-Communitys. Konzepte, Szenarien und Handlungsempfehlungen. (Sandra Schafert und Diana Wieden-Bischof) ISBN 978-3-902448-13-2 Band 2 (Meta-) Informatonen von Communitys und Netzwerken. Entstehung und Nutzungsmöglichkeiten. (Sandra Schafert, Julia Eder, Wolf Hilzensauer, Thomas Kurz, Mark Markus, Sebastan Schafert, Rupert Westenthaler, Rupert und Diana Wieden-Bischof) ISBN 978-3-902448-15-6 Band 4 Reputaton und Feedback im Web. Einsatzgebiete und Beispiele. (Sandra Schafert, Georg Güntner, Markus Lassnig und Diana Wieden-Bischof) ISBN 978-3-902448-17-0 Auf der Website des Salzburg NewMediaLab fnden Sie weitere Materialien zu den Ver- öfentlichungen im Rahmen des Projektes, unter anderem Videos zu jeder Studie, Film- aufnahmen und Präsentatonsunterlagen der Buchvorstellungen. 81
    • Wachsende Datenbestände machen es schwierig sich zu orientieren. Empfehlungs­ systeme werden daher immer häufiger eingesetzt. Sie schlagen zum Beispiel Produkte, Dienstleistungen, Webseiten, Filme, Bilder, Musik (­gruppen), Experten oder potenti­ elle Freunde und Lebenspartner vor. Insbesondere durch den Anwuchs von Beiträgen in Social­Media­Anwendungen sind Empfehlungssysteme gefragt, damit interessante Beiträge und Personen nicht untergehen. Auch bei der gezielten und personalisierten Werbung im Web oder bei Suchmaschinen werden Verfahren der Empfehlungssysteme eingesetzt. Empfehlungen unterstützen auch Prozesse wie die Reiseplanung, das Lernen, das Tagging und auch das Verschreiben von Arzneimitteln. In dieser Broschüre werden Konzepte und Realisierungen von Empfehlungssystemen im Web vorgestellt und beschrieben. Dazu werden unter anderem das inhaltsbasierte und kollaborative Filtern als Strategien beschrieben. Die unterschiedlichen Konzepte werden kritisch betrachtet und für mehrere Einsatzgebiete Realisierungen vorgestellt. Schließ­ lich werden in der Studie Hinweise für die Entwicklung von Empfehlungssystemen gegeben. Diese Broschüre ist ein Ergebnis der ComStudy, die am Salzburg NewMediaLab (SNML) im Zeitraum von Oktober 2008 bis Februar 2010 durchgeführt wird. Das SNML, das Kom­ petenzzentrum für Neue Medien in Österreich, arbeitet daran, digitale Inhalte clever zu strukturieren, verknüpfen, personalisieren, für alle auffindbar zu machen und nachhaltig zu nutzen und betrachtet dabei die Community als einen wesentlichen Faktor vieler Projekte. ISBN 978­3­902448­16­3