Quantität vor Qualität?
Big Data im Kontext von Social Media Daten
Wiesbaden, 12. November 2013
Sitzung von ADM, ASI, Stat...
Besondere
Eigenschaften von
Social Media

Hintergrund und
Forschungsstand

Herausforderungen
im Umgang mit
Social Media Da...
Social Media Daten?
https://www.facebook.com/note.php?note_id=469716398919

http://www.ccs.neu.edu/home/amislove/t
witterm...
Social Media Daten - Vorteile
• Nutzer sprechen über Themen, die sie bewegen
• Zusammenhänge lassen sich über Links gut na...
Forschungsstand? Twitter vs. Facebook

Scopus (TITLE-ABS-KEY(Twitter) AND PUBYEAR > 2006)
(TITLE-ABS-KEY(Facebook) AND PUB...
Was wird erforscht?
Was wird erforscht?
•
•
•
•
•
•

Reichweiten
Informationsfluss
Einfluss
Meinungen, Stimmungen
Netzwerke
Ereignisse
Big Data?
Am Beispiel Twitter
• 309740 Twitter users (with followers and tweets)
• 17,803 tweets from 8,616 users + 1st de...
Methoden?
Verschiedene Ansätze, darunter:
•
•
•
•
•

Interviews mit Nutzern
Experimente
Quantitative Analysen von Beiträge...
Top 10
Herausforderungen im
Umgang mit Social
Media Daten
10
0. Universität vs. Unternehmen
• Verschiedene Herangehensweisen, wenig Austausch
• Klout & Co. – großer Wettbewerb
1. Datenzugang
Via API
• Nicht explizit für Wissenschaftler entwickelt
• Ggf. nicht vollständig (z.B. Twitter)
 Änderunge...
2. Datenzugang
Über Drittanbieter
• Black Box – fehlende Transparenz
• Änderungen möglich
• Z.T. kostenintensiv
• Auch hie...
3. Rechtlicher Rahmen

Nutzungsbedingungen

Datenschutzbestimmungen
4. Forschungsethik
• Anonymisierung/Pseudonymisierung möglich bzw. nötig?
• Richtlinien für den Umgang mit Personendaten?
...
5. Verlässlichkeit
• Verifizierte Accounts?
• Verifizierte Inhalte?
• (Datenausfälle)

16
6. Vergleichbarkeit?
Bislang wenig einheitliche Standards für Methoden, z.B.
• Erhebung
• Datenbereinigung / -manipulation...
7. Reproduzierbarkeit
•
•

Die gleichen Daten zweimal erheben?
Mit bestehenden Datensätzen arbeiten?

18
8. Repräsentativität
•
•
•
•

Nutzerzahlen
Zeitpunkt/Dauer der Datenerhebung
Datenauswahl
Sampling (Größe der Datensätze, ...
9. Fehlender Kontext
• Informationen über Nutzer (z.B. Geo-Informationen)
• Informationen über Nutzung
• Messung von Expos...
Vielen Dank für die Aufmerksamkeit!
Weller, K., Bruns, A., Burgess, J., Mahrt, M.
& Puschmann, C. (Eds.) (2013): Twitter a...
Quantität vor Qualität? Big Data im Kontext von Social Media Daten
Upcoming SlideShare
Loading in …5
×

Quantität vor Qualität? Big Data im Kontext von Social Media Daten

950 views
823 views

Published on

Published in: Social Media
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
950
On SlideShare
0
From Embeds
0
Number of Embeds
9
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Quantität vor Qualität? Big Data im Kontext von Social Media Daten

  1. 1. Quantität vor Qualität? Big Data im Kontext von Social Media Daten Wiesbaden, 12. November 2013 Sitzung von ADM, ASI, Statistisches Bundesamt Dr. Katrin Weller (Kontakt: katrin.weller@gesis.org, @kwelle)
  2. 2. Besondere Eigenschaften von Social Media Hintergrund und Forschungsstand Herausforderungen im Umgang mit Social Media Daten
  3. 3. Social Media Daten? https://www.facebook.com/note.php?note_id=469716398919 http://www.ccs.neu.edu/home/amislove/t wittermood/ http://www.cci.edu.au/node/1362; http://livehoods.org/maps/montreal http://chronicle.com/blogs/wiredcampus/this-is-what-ahttp://www.scimaps.org/maps/map/history_flow_visuali_56/detail/ sabbatical-at-twitter-looks-like/31498
  4. 4. Social Media Daten - Vorteile • Nutzer sprechen über Themen, die sie bewegen • Zusammenhänge lassen sich über Links gut nachvollziehen • Meist einheitliche Struktur mit Metadaten
  5. 5. Forschungsstand? Twitter vs. Facebook Scopus (TITLE-ABS-KEY(Twitter) AND PUBYEAR > 2006) (TITLE-ABS-KEY(Facebook) AND PUBYEAR > 2006)
  6. 6. Was wird erforscht?
  7. 7. Was wird erforscht? • • • • • • Reichweiten Informationsfluss Einfluss Meinungen, Stimmungen Netzwerke Ereignisse
  8. 8. Big Data? Am Beispiel Twitter • 309740 Twitter users (with followers and tweets) • 17,803 tweets from 8,616 users + 1st degree network (3,048,360 directed edges, 631,416 unique followers, and 715,198 unique friends) • 1.3 million Twitter conversations, with each conversation containing between 2 and 243 posts • 20,000 tweets • 21,623,947 geo-tagged tweets • 99,832 tweets Aber auch: • One person’s Twitter network (652 followers, 114 followings). • Experiment with 125 students. • 1,827 annotated tweets • Experiment with 1677 participants • Survey with 505 young American adults • none
  9. 9. Methoden? Verschiedene Ansätze, darunter: • • • • • Interviews mit Nutzern Experimente Quantitative Analysen von Beiträgen und deren Eigenschaften Netzwerkananlysen Linguistische Analysen, z.B. word clustering, event detection, sentiment analysis • Inhaltsanalysen  Selten mehrere in Kombination  In der Forschung: viele Case Studies, wenig methodische Standards
  10. 10. Top 10 Herausforderungen im Umgang mit Social Media Daten 10
  11. 11. 0. Universität vs. Unternehmen • Verschiedene Herangehensweisen, wenig Austausch • Klout & Co. – großer Wettbewerb
  12. 12. 1. Datenzugang Via API • Nicht explizit für Wissenschaftler entwickelt • Ggf. nicht vollständig (z.B. Twitter)  Änderungen möglich
  13. 13. 2. Datenzugang Über Drittanbieter • Black Box – fehlende Transparenz • Änderungen möglich • Z.T. kostenintensiv • Auch hier sind Änderungen möglich • Zusätzliche Ebene der Vertragsbindung (ggf. eingeschränkte Publikationsmöglichkeiten)
  14. 14. 3. Rechtlicher Rahmen Nutzungsbedingungen Datenschutzbestimmungen
  15. 15. 4. Forschungsethik • Anonymisierung/Pseudonymisierung möglich bzw. nötig? • Richtlinien für den Umgang mit Personendaten? • Kontakt zu Social Media Nutzern aufnehmen?
  16. 16. 5. Verlässlichkeit • Verifizierte Accounts? • Verifizierte Inhalte? • (Datenausfälle) 16
  17. 17. 6. Vergleichbarkeit? Bislang wenig einheitliche Standards für Methoden, z.B. • Erhebung • Datenbereinigung / -manipulation • Auswertung • Definitionen / Theorie 17
  18. 18. 7. Reproduzierbarkeit • • Die gleichen Daten zweimal erheben? Mit bestehenden Datensätzen arbeiten? 18
  19. 19. 8. Repräsentativität • • • • Nutzerzahlen Zeitpunkt/Dauer der Datenerhebung Datenauswahl Sampling (Größe der Datensätze, Zufallsstichproben, Bias) 19
  20. 20. 9. Fehlender Kontext • Informationen über Nutzer (z.B. Geo-Informationen) • Informationen über Nutzung • Messung von Exposure
  21. 21. Vielen Dank für die Aufmerksamkeit! Weller, K., Bruns, A., Burgess, J., Mahrt, M. & Puschmann, C. (Eds.) (2013): Twitter and Society. New York et al.: Peter Lang. 486 Seiten Ab. 15.11.2013 ISBN-10: 1433121697 | ISBN-13: 978-1433121692 katrin.weller@gesis.org @kwelle

×