• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Von Information zu Wissen - Einsichten Gewinnen - Text Mining
 

Von Information zu Wissen - Einsichten Gewinnen - Text Mining

on

  • 1,057 views

Themen finden,

Themen finden,
Themen beschreiben in Zusammenhang mit Meinungen, Vielfalt und Lokalisierung

Statistics

Views

Total Views
1,057
Views on SlideShare
1,055
Embed Views
2

Actions

Likes
0
Downloads
4
Comments
0

1 Embed 2

http://bottlenose.com 2

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment
  • Business communities slightly different:Grouped around a business/enterpriseAim: add value to business (Knowledge management, public relations, customer aquisition, support, etc.)Conclusion: communities have a value, that needs to be taken care ofValue is endangered by risks (e.g. experts leaving) or might be increased by seizing opportunities (e.g. connect people working on the same topic)
  • Not a happy situationLets look into the problem of this unhappy champ

Von Information zu Wissen - Einsichten Gewinnen - Text Mining Von Information zu Wissen - Einsichten Gewinnen - Text Mining Presentation Transcript

  • Von Information zu Wissen Einsichten Gewinnen Prof. Dr. Steffen Staab Institute for Web Science and Technologies EC Project 257859
  • Business Communities• Informationsökosystem – Angestellte – Geschäftspartner, Kunden – Öffentlichkeit Werte Risiken Gelegenheiten Steffen Staab, staab@uni-koblenz.de 08/09/2012 2
  • Anwendungsfälle Lotus Connections SAP Community Network (SCN) MeaningMine Communities Communities Communities • Employees • Customers • Social media • Working groups • Partners • News • Interest Groups • Suppliers • Web fora • Projects • Developers • Public communities Business value Business value Business value • Task relevant information • Products support • Topics • Collaboration • Services • Opinions • Innovation • Find business partners • Service for partners Volume Volume Volume • 4,000 posts/day • 6,000 posts/day • 1,400,000 posts/day • 386,000 employees • 1,700,000 subscribers • 708,000 web sources • 1.5GB content/day • 16GB log/day • 45GB content/day Employees Business Partners Public Domain Intranet Extranet Internet Steffen Staab, staab@uni-koblenz.de 08/09/2012 3
  • Information Verstehen • Finden von Themen • Meinungen zu Themen: – Topic-opinion analysis • Z.B. positive und negative Meinungen zu Produkten • Diversität von Meinungen – Vermeiden von „group think“ • Lokalisierung von Themen – Globale Themen vs regionale Themen • Z.B. Nachtflugverbot am Frankfurter Flughafen – Themen, die sich zeitlich ändern • XML - 2000 • Soziale Netzwerke - 2010 Steffen Staab, staab@uni-koblenz.de 08/09/2012 4
  • Einfaches Beispiel: Yahoo Nachrichten Steffen Staab, staab@uni-koblenz.de 08/09/2012 5
  • Kommentare • Viele Kommentare • Verschiedene Meinungen • Verschieden wichtige Kommentare Wie macht man Wissen aus der Informationsflut? Steffen Staab, staab@uni-koblenz.de 08/09/2012 6
  • Erster Schritt: Extraktion Steffen Staab, staab@uni-koblenz.de 08/09/2012 7
  • Zweiter Schritt: Themen erkennen Torpedo attack Spiritualism Religion
  • Zweiter Schritt: Themen erkennenErkannteThemen
  • Dritter Schritt: Themenbasierte Übersicht more.. more.. Steffen Staab, staab@uni-koblenz.de 08/09/2012 10
  • MEINUNGEN ZU THEMEN
  • Werkzeug für Themen & Meinungen
  • Was ist eine Meinung?
  • Vokabelsammlungen für Meinungen, Gefühle, etc.ANEW – LIWC – Linguistic Inquiry and WordAffective Words for English CountTerms (http://www.liwc.net/)(http://csea.phhp.ufl.edu/media/anewmessa – socialge.html) – posemo – Valence – negemo – affect – Arousal – anx – Dominance – anger – sad – feel – ….ADUW, POMS,…. Steffen Staab, staab@uni-koblenz.de 08/09/2012 14
  • Vocabulary example: ANEW Valence Arousal Dominance Freq Mean SD Mean SD Mean SD Wordrescue 7.70 1.24 6.53 2.56 6.45 2.29 15gun 3.47 2.48 7.02 1.84 3.53 2.72 118hopeful 7.10 1.46 5.78 2.09 5.41 1.92 12ignorance 3.07 2.25 4.39 2.49 4.41 2.38 16crash 2.31 1.44 6.95 2.44 3.44 2.21 20confident 7.98 1.29 6.22 2.41 7.68 1.94 16improve 7.65 1.16 5.69 2.15 6.08 2.25 39…. Steffen Staab, staab@uni-koblenz.de 08/09/2012 15
  • Vierter Schritt: Übersicht nach Thema und Meinung Verschiedene Meinungen für ein Thema Steffen Staab, staab@uni-koblenz.de 08/09/2012 16
  • DIVERSITÄT VON MEINUNGEN
  • Diversität von Themen und Meinungen Review 1 of 498 Review 2 of 498 "A Review for 99% "Hype reloaded of us" reloaded: (still) 25 % Judging by most quality, 75 % hype" of the bad reviews Overexpensive, by 12 year old overhyped phone kids, I doubt most with nice, cool (and of these people also counter- even own the new productive) touch- iPhone. so let me give you the real Welche Kommentare screen interface to show-off.… lowdown from … soll ich lesen, wenn ich ein zutreffendes Gesamtbild erhalten möchte?
  • Beobachtungen zu Produktkommentaren  Initiale Kommentare sind oft lang – und bezahlt  (Nicht die Stimme der Nutzer)  Leser stimmen darüber ab, welcher Kommentar hilfreich ist  (Rich get richer)  Quantität != Qualität  Kürzere Kommentare of objektiver und präziser  Viel redundante Information in den Kommentaren Ziel: Bestmögliche Abdeckung der verschiedenen Produkteigenschaften und Meinungen
  • FREuD Analyse und Vorschläge Steffen Staab, staab@uni-koblenz.de 08/09/2012 20
  • FREuD Vorschläge Review: 1 Review : 2 Apps dont crash, native With the addition of new apps open quicker, hardware features Apple voice controls, video has also fractured the funtionality same once very simple and cosmetic shape as last unified ecosystem that years 3G New features OSX Mobile represented. such as video and voice To exploit new features control along with the developers now need to speed boost make the decide if they want to 3GS a great upgrade … support … Review : 3 Review : 4 I am trying to find out what The iPhone 3GS is virtually the pros and cons of this the same as its 3G phone are but I havent predecessor. The been able to because so improvements (3.2 far everyone here is megapixel camera, discussing AT&T , MMS, magnetometer, slightly and tethering. Please faster processor) are hardly people, take it elsewhere exciting, and the fact that and let someone review many of the software ….. the darned phone… Steffen Staab, staab@uni-koblenz.de 08/09/2012 21
  • LOKALISIERUNG VONTHEMEN
  • 34,707 Flickr Bilder mit Geodaten BMW Audi Audi Citroen BMW Chevrolet Peugeot Renault Citroen Chevrolet BMW Pontiac Mercedes Audi Chevrolet Pontiac Fiat Mercedes BMW34,707 Flickr photos containing car brandschevrolet, pontiac, cadillac, gmc, buick, audi, bmw, mercedesbenz, fiat, peugeot, citroen, renault(removed: event-like images tagged by autoshow, show, race, racing) Steffen Staab, staab@uni-koblenz.de 08/09/2012 23
  • Gibt es Gebiete in denen Themen dominieren? chevrolet citroen pontiac renault bmw BMW Audi peugeot mercedes Audi Citroen bmw audi Chevrolet Peugeot BMW Renault Citroen Chevrolet BMW Pontiac Mercedes Audi Chevrolet Pontiac Fiat Mercedes BMW bmw audi mercedes fiat citroen Steffen Staab, staab@uni-koblenz.de 08/09/2012 24
  • Geographical network construction Data points Spatial region centroids Geographical network Steffen Staab, staab@uni-koblenz.de 08/09/2012 25
  • Visualisationchevrolet 0.35 bmw 0.29bmw 0.18 audi 0.18cadillac 0.16 fiat 0.10pontiac 0.09 citroen 0.09gmc 0.07 renault 0.09buick 0.06 peugeot 0.08audi 0.05 mercedesbenz 0.06 chevrolet 0.05 Steffen Staab, staab@uni-koblenz.de 08/09/2012 26
  • Visualisationbmw 0.63 fiat 0.66 renault pontiac 0.92mercedesbenz 0.17 bmw 0.10 0.28audi 0.13 citroen 0.09 citroen renault 0.05 0.22 peugeot 0.15 bmw 0.10 audi 0.09 fiat 0.07 Steffen Staab, staab@uni-koblenz.de 08/09/2012 27
  • Von Information zu Wissen • Themen in Dokumenten / Web 2.0 erkennen • Themen verstehen – Meinungen – Diversität Unser Know-How! – Lokation • Räumlich Ihre Informationen! • Zeitlich • Sozial Ihre Einsichten! • Beispiele – Nachrichtenkommentare – Produktkommentare – Flickr Steffen Staab, staab@uni-koblenz.de 08/09/2012 28
  • Unser Know-How! Ihre Informationen! Ihre Einsichten!http://robust-project.eu/http://west.uni-koblenz.de/VIELEN DANK FÜR IHREAUFMERKSAMKEIT! Steffen Staab, staab@uni-koblenz.de 08/09/2012 29
  • Bibliographie Naveed, Nasir; Gottron, Thomas; Sizov, Sergej; Staab, Steffen (2012): FREuD: Feature-Centric Sentiment Diversification of Online Discussions. In: WebSci12: Proceedings of the 4th International Conference on Web Science. ACM, 2012. Sergej Sizov: GeoFolk: latent spatial semantics in web 2.0 social media. Proc. of Conf. on Web Search and Data Mining 2010: 281-290, AAAI. Nasir Naveed, Sergej Sizov, Steffen Staab: ATTention: Understanding Authors and Topics in Context of Temporal Evolution. European Conference on Information Retrieval 2011: 733-737. Springer, 2011. Some of the described work is currently being prepared for publication.