Social Media Daten als Grundlage
sozialwissenschaftlicher Forschung:
Chancen und Herausforderungen
Kassel, 11.06.2014
Dr. ...
Dr. Katrin Weller
GESIS – Leibniz Institut für Sozialwissenschaften
Datenarchiv für Sozialwissenschaften
2006-2012: Heinri...
Fragen & Kommentare
Slides: http://de.slideshare.net/katrinweller
Hintergrund / Forschungsstand
5
http://www.conversationprism.com//
© Statista
Von welchen der folgenden Netzwerke und Plattformen haben Sie schon gehört?
Umfrage zur Bekanntheit von Social ...
Social Media Forschung in (Publikations)zahlen
0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
Anzahl an Publikationen ...
Publikationen nach Fachgebieten (Scopus)
10650; 36%
5542; 19%
2384
2288
2151
1535
773
772
65 Computer Science
Social Scien...
http://kwelle.wordpress.com/2014/04/07/bibliometric-analysis-of-social-media-research/#more-149
Forschungsthemen
pointless babble?
Top Thema: Wahlen
#egypt
Dauerthemen
E-Learning Marketing
Marktforschung /
Nutzerstudien
Journalismus
Trends?
Vorhersagen Gesundheit Big Data
Was wird erforscht?
• Nutzergruppen
• Ereignisse
• Zielgruppen
• Nutzungspraxis
• Informationsflüsse
• Einfluss
• Meinunge...
Social Media Daten
Social Media Daten
• Texte
• Bilder
• Videos
• Multimedia
• Verbindungen I (Freunde, Follower)
• Verbindungen II (Links/UR...
Beispiel: Twitter Daten
Datenzugang? Twitter APIs
• Nicht explizit für Wissenschaftler entwickelt
• Nicht rückwirkend zugänglich
• Nicht vollständ...
https://dev.twitter.com/console
EigeneUser-IDfinden:
http://www.idfromuser.com/
2013: Twitter und Wahlen
No. of Tweets No. Of publications (2013)
0-500 3
501-1.000 4
1.001-5.000 1
5.001-10.000 1
10.001-...
Chancen
Top 4: Chancen
#1
Beobachtung von spontanen
Interaktionen und flüchtiger
Kommunikation
#2
Daten sind für eine Vielzahl von
Ereignissen, Kontexten und
Fragestellungen verfügbar.
#3
„Rich data“: Multimedia plus
Netzwerke plus Interaktionen
#4
Interdisziplinäres Forschungsumfeld;
Möglichkeit, neue Methoden
auszuprobierne und zu kombinieren
Methoden & Tools
Methoden
Content Analysis
(qual. / quant.)
Umfrage / Interview)
Experiment /
Feldforschung
Mehr Methoden?
34
Methoden (in der sozialw. Twitter Forschung)
Weller, K. (2014). What do we get from Twitter – and what not? A close loo...
TOOLS
• Datensammlung
• Analyse
Data collection
• dapper: http://open.dapper.net/
• SocSciBot “Web crawler and link analyser for the social sciences and
h...
Social Network Analysis
• NodeXL (mit Datenimport-Funktion)
• ORA (http://www.casos.cs.cmu.edu/projects/ora), a
social net...
Digital Methods Initiative
• https://wiki.digitalmethods.net/Dmi/ToolDatabase
GNIP
TOPSY
YourTwapperkeeper
NodeXL
Network Analysis – basierend auf Excel.
Integrierte Funktion zur Sammlung von Daten aus u.a.:
• Facebook
• Twitter
...
NodeXL
NodeXL
Gephi
Gephi
46
Stephen Wolfram
Daten: Facebook
http://blog.stephenwolfram.com/2013/04/data-science-of-the-facebook-world/
47
Alternative:...
48
Sentiment Analysis
Dictionaries:
z.B. ANEW
NLP / Sentiment Analysis
• Discover text: http://discovertext.com/
• Twitter NLP: http://www.ark.cs.cmu.edu/TweetNLP/
• In...
Tool-Klassiker
• Nicht auf Social Media spezialisierte Tools, die man
aus der klassischen Methoden-Arbeit kennt.
51
Inhaltsanalyse
52
CAQDAS Computer-Assisted Qualitative Data AnalysiS
– (z.B. MAXQDA, QDAMiner, ATLAS.ti, Qualrus, Nvivo)
–...
Oxford Internet Institute
Methoden-Guidelines: http://microsites.oii.ox.ac.uk/tidsr/welcome
Wichtig: Hintergrundwissen
54
Herausforderungen
Top 4: Herausforderungen
#1
Mangel an Theorie
Ende der Theorie?
58
because it’s there?
Big Data vs. Found Data
Ende der Theorie?
Sozialwissenschaften
1. Problem
2. Forschungsfrage/
Hypothesen
3. Theorien
4. Methoden
5. Daten
6. Analy...
Anfang der Theorie?
“The interesting point is that these limitations can (and have to)
be addressed by theory guided resea...
#2
„data haves“ vs. „data have-nots“
boyd, danah and Kate Crawford. (2012).
“Critical Questions for Big Data”
Technische Herausforderungen
• Zugänglichkeit
• Data Sharing
• Änderungen
• Manipulation (z.B. Twitter Bomb) & Spam
• Pers...
#3
Representativität?
Local Following
Repräsentativität
“The core challenge is that most big data that have
received popular attention are not the output of
ins...
Blank, G. (2014). Who uses Twitter? Representativeness of Twitter Users. Presentation at General Online Research GOR 14.
R...
Repräsentativitätsprobleme auf
mehreren Ebenen
“About a third of all UK Internet users have a twitter profile; a
subset of...
Gefahren durch fehlende Repräsentativität
• Diskussion: Menschen, die
durch Big Data nicht
repräsentiert sind
http://stree...
#4
Interdisziplinarität und
methodische Standards
Fazit
• Spannendes Forschungsfeld mit viel
Pioniergeist
• Beginnende Professionalisierung im Bereich
Methoden und Standards
Literatur• Literaturliste zum Thema Big Data in den Sozialwissenschaften:
http://kwelle.wordpress.com/2014/04/12/big-data-...
Grüße aus Köln!
73
Fragen und Feedback:
Dr. Katrin Weller
GESIS Leibniz Institute for the Social
Sciences
katrin.weller@gesis.org
@kwelle
htt...
Social-Media-Forschung
Social-Media-Forschung
Social-Media-Forschung
Upcoming SlideShare
Loading in …5
×

Social-Media-Forschung

1,508 views

Published on

Eingeladener Vortrag in der interdisziplinären Ringvorlesung des Kompetenzzentrums für empirische Forschungsmethoden der Universität Kassel

Published in: Social Media
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,508
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
4
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Social-Media-Forschung

  1. 1. Social Media Daten als Grundlage sozialwissenschaftlicher Forschung: Chancen und Herausforderungen Kassel, 11.06.2014 Dr. Katrin Weller, katrin.weller@gesis.org, @kwelle http://katrinweller.net
  2. 2. Dr. Katrin Weller GESIS – Leibniz Institut für Sozialwissenschaften Datenarchiv für Sozialwissenschaften 2006-2012: Heinrich-Heine-Universität Düsseldorf, Promotion in Informationswissenschaft Weller, K., Bruns, A., Burgess, J., Mahrt, M., & Puschmann, C. (Eds.) (2014). Twitter and Society. New York et al.: Peter Lang.
  3. 3. Fragen & Kommentare Slides: http://de.slideshare.net/katrinweller
  4. 4. Hintergrund / Forschungsstand
  5. 5. 5 http://www.conversationprism.com//
  6. 6. © Statista Von welchen der folgenden Netzwerke und Plattformen haben Sie schon gehört? Umfrage zur Bekanntheit von Social Media Plattformen in Deutschland (2012) 30 40 55 56 58 62 67 68 69 71 72 80 87 96 Yappy Flickr Xing Lokalisten MeinVZ MyVideo MySpace SchülerVZ StudiVZ Stayfriends Wer-kennt-… Twitter YouTube Facebook 0 20 40 60 80 100 120 Anteil der Befragten in % Quelle: PwC, Entwicklung sozialer Medien im Vergleich, Seite 11 ID 76144 http://de.statista.com/statistik/daten/studie/76144/umfrage/umfrage-zur-bekanntheit-von-social-media-plattformen-in-deutschland/
  7. 7. Social Media Forschung in (Publikations)zahlen 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 Anzahl an Publikationen in Scopus (TITLE-ABS-KEY("social media") OR TITLE-ABS-KEY("social web") OR TITLE-ABS-KEY("social software") OR TITLE-ABS-KEY("web 2.0")) AND PUBYEAR > 1999 [ März 2014]
  8. 8. Publikationen nach Fachgebieten (Scopus) 10650; 36% 5542; 19% 2384 2288 2151 1535 773 772 65 Computer Science Social Sciences Engineering Medicine Business, Management and Accounting Mathematics Arts and Humanities Decision Sciences Psychology Nursing Economics, Econometrics and Finance Biochemistry, Genetics and Molecular Biology Health Professions Environmental Science Earth and Planetary Sciences Agricultural and Biological Sciences Pharmacology, Toxicology and Pharmaceutics Physics and Astronomy Materials Science Multidisciplinary Neuroscience Immunology and Microbiology Chemical Engineering Veterinary Dentistry Chemistry Energy
  9. 9. http://kwelle.wordpress.com/2014/04/07/bibliometric-analysis-of-social-media-research/#more-149
  10. 10. Forschungsthemen
  11. 11. pointless babble?
  12. 12. Top Thema: Wahlen
  13. 13. #egypt
  14. 14. Dauerthemen E-Learning Marketing Marktforschung / Nutzerstudien Journalismus
  15. 15. Trends? Vorhersagen Gesundheit Big Data
  16. 16. Was wird erforscht? • Nutzergruppen • Ereignisse • Zielgruppen • Nutzungspraxis • Informationsflüsse • Einfluss • Meinungen und Stimmungen • Netzwerke • Interaktionen • …
  17. 17. Social Media Daten
  18. 18. Social Media Daten • Texte • Bilder • Videos • Multimedia • Verbindungen I (Freunde, Follower) • Verbindungen II (Links/URLs) • Verbindungen/Aktionen (Likes, Favs, Kommentare, Downloads)
  19. 19. Beispiel: Twitter Daten
  20. 20. Datenzugang? Twitter APIs • Nicht explizit für Wissenschaftler entwickelt • Nicht rückwirkend zugänglich • Nicht vollständig Änderungen möglich
  21. 21. https://dev.twitter.com/console EigeneUser-IDfinden: http://www.idfromuser.com/
  22. 22. 2013: Twitter und Wahlen No. of Tweets No. Of publications (2013) 0-500 3 501-1.000 4 1.001-5.000 1 5.001-10.000 1 10.001-50.000 7 50.001-100.000 4 100.001-500.000 5 500.001-1.000.000. 3 1.000.001-5.000.000 3 mehr als 5.000.000 3 mehr als 100.000.000 1 mehr als 1.000.000.000 1 keine/ungenaue Angabe 13 Weller, K. (im Druck): Twitter und Wahlen: Zwischen 140 Zeichen und Milliarden von Tweets. Erscheint im R. Reichert:Big Data. http://www.transcript-verlag.de/978-3-8376-2592-9/big-data
  23. 23. Chancen
  24. 24. Top 4: Chancen
  25. 25. #1 Beobachtung von spontanen Interaktionen und flüchtiger Kommunikation
  26. 26. #2 Daten sind für eine Vielzahl von Ereignissen, Kontexten und Fragestellungen verfügbar.
  27. 27. #3 „Rich data“: Multimedia plus Netzwerke plus Interaktionen
  28. 28. #4 Interdisziplinäres Forschungsumfeld; Möglichkeit, neue Methoden auszuprobierne und zu kombinieren
  29. 29. Methoden & Tools
  30. 30. Methoden Content Analysis (qual. / quant.) Umfrage / Interview) Experiment / Feldforschung
  31. 31. Mehr Methoden?
  32. 32. 34 Methoden (in der sozialw. Twitter Forschung) Weller, K. (2014). What do we get from Twitter – and what not? A close look at Twitter research in the social sciences. Knowledge Organization 41(3), 238-248.
  33. 33. TOOLS • Datensammlung • Analyse
  34. 34. Data collection • dapper: http://open.dapper.net/ • SocSciBot “Web crawler and link analyser for the social sciences and humanities http://socscibot.wlv.ac.uk • Chorus: http://www.chorusanalytics.co.uk/ • SODATO (Copenhagen Business School): http://cssl.cbs.dk/software/sodato/ • NVivo 10 (eigenltich Tool für qualitative Inhaltsanalyse), jetzt mit Import von Tweets, Facebook Posts, YouTube Daten, LinkedIn. • YourTwapperkeeper – für Twitter • Python Packages, z.B. für Wikipedia 36
  35. 35. Social Network Analysis • NodeXL (mit Datenimport-Funktion) • ORA (http://www.casos.cs.cmu.edu/projects/ora), a social network analysis (SNA) software package, for basic manipulations and visualization of the network data • UCINET (http://www.analytictech.com/ucinet) 37
  36. 36. Digital Methods Initiative • https://wiki.digitalmethods.net/Dmi/ToolDatabase
  37. 37. GNIP
  38. 38. TOPSY
  39. 39. YourTwapperkeeper
  40. 40. NodeXL Network Analysis – basierend auf Excel. Integrierte Funktion zur Sammlung von Daten aus u.a.: • Facebook • Twitter • YouTube • Flickr • Wikipedia
  41. 41. NodeXL
  42. 42. NodeXL
  43. 43. Gephi
  44. 44. Gephi 46
  45. 45. Stephen Wolfram Daten: Facebook http://blog.stephenwolfram.com/2013/04/data-science-of-the-facebook-world/ 47 Alternative: Crowdsourcing
  46. 46. 48
  47. 47. Sentiment Analysis Dictionaries: z.B. ANEW
  48. 48. NLP / Sentiment Analysis • Discover text: http://discovertext.com/ • Twitter NLP: http://www.ark.cs.cmu.edu/TweetNLP/ • Internet Community Text Analyzer (ICTA) http://textanalytics.net • Twitter NLP and Part-of-Speech Tagging: http://www.ark.cs.cmu.edu/TweetNLP/ • SentiStrength http://sentistrength.wlv.ac.uk/ • Sentiment analysis of Danish texts (by Copenhagen Business School): http://130.226.34.13/dh/sentiment_workshop/demo.php 50
  49. 49. Tool-Klassiker • Nicht auf Social Media spezialisierte Tools, die man aus der klassischen Methoden-Arbeit kennt. 51
  50. 50. Inhaltsanalyse 52 CAQDAS Computer-Assisted Qualitative Data AnalysiS – (z.B. MAXQDA, QDAMiner, ATLAS.ti, Qualrus, Nvivo) – Speech Act Analyse – Statistik  Data Science?
  51. 51. Oxford Internet Institute Methoden-Guidelines: http://microsites.oii.ox.ac.uk/tidsr/welcome
  52. 52. Wichtig: Hintergrundwissen 54
  53. 53. Herausforderungen
  54. 54. Top 4: Herausforderungen
  55. 55. #1 Mangel an Theorie
  56. 56. Ende der Theorie? 58 because it’s there? Big Data vs. Found Data
  57. 57. Ende der Theorie? Sozialwissenschaften 1. Problem 2. Forschungsfrage/ Hypothesen 3. Theorien 4. Methoden 5. Daten 6. Analyse 7. Ergebnispräsentation Typische Big Data-Analyse 1. Methoden 2. Daten 3. Analyse 4. Ergebnispräsentation 5. Problem Korrelation vs. Kausalität Pfeffer, J. (2013). Big data, big research? Opportunities and constraints for computer supported social science. Keynote zur „Digital methods“-Tagung der DGPuK-Fachgruppe Computervermittelte Kommunikation, Wien. Abgerufen von http://www.pfeffer.at/slides/DigitalMethods-BigData.pdf
  58. 58. Anfang der Theorie? “The interesting point is that these limitations can (and have to) be addressed by theory guided research that is typically conducted by social scientists. Accordingly, opportunities emerge for those social and behavioral scientists who are willing to collaborate with the Big Data researchers in the natural, engineering, and computer sciences.” 60 Snijders, C., Matzat, U., & Reips, U.-D. (2012). ‘Big Data’: Big gaps of knowledge in the field of Internet. International Journal of Internet Science, 7, 1-5. Retrieved from http://www.ijis.net/ijis7_1/ijis7_1_editorial.html
  59. 59. #2 „data haves“ vs. „data have-nots“ boyd, danah and Kate Crawford. (2012). “Critical Questions for Big Data”
  60. 60. Technische Herausforderungen • Zugänglichkeit • Data Sharing • Änderungen • Manipulation (z.B. Twitter Bomb) & Spam • Personalisierte Ergebnisse •  Fehlende Reproduzierbarkeit und Nachvollziehbarkeit 62
  61. 61. #3 Representativität?
  62. 62. Local Following
  63. 63. Repräsentativität “The core challenge is that most big data that have received popular attention are not the output of instruments designed to produce valid and reliable data amenable for scientific analysis.“ Lazer, D., Kennedy, R., King, G., & Vespignani, A. (2014). The parable of Google Flu: Traps in big data analysis. Science, 343(6176), 1203-1205.
  64. 64. Blank, G. (2014). Who uses Twitter? Representativeness of Twitter Users. Presentation at General Online Research GOR 14. Retrieved from: http://conftool.gor.de/conftool14/index.php?page=downloadPaper&filename=Blank- Who_uses_Twitter_Representativeness-119.pptx&form_id=119&form_version=final 34 26 8 12 18 14 10 17 12 23 28 3330 35 0 20 40 60 80 100 InterestPolitical activities Interest in politics Send political message Contact MP online Re-post political news Political comment on SNS Find political facts Sign online petition OxIS current users: 2013 N=1,613 Figure 6: Political Activities of Twitter Users Twitter user Non-user
  65. 65. Repräsentativitätsprobleme auf mehreren Ebenen “About a third of all UK Internet users have a twitter profile; a subset of that group are the active tweeters who produce the bulk of content; and then a tiny subset of that group (about 1%) geocode their tweets (essential information if you want to know about where your information is coming from).” Graham M. (2012). Big data and the end of theory?". The Guardian. Retrieved from: http://www.theguardian.com/news/datablog/2012/mar/09/big-data-theory
  66. 66. Gefahren durch fehlende Repräsentativität • Diskussion: Menschen, die durch Big Data nicht repräsentiert sind http://streetbump.org Siehe auch: http://www.wired.com/2014/03/potholes-big-data- crowdsourcing-way-better-government/
  67. 67. #4 Interdisziplinarität und methodische Standards
  68. 68. Fazit • Spannendes Forschungsfeld mit viel Pioniergeist • Beginnende Professionalisierung im Bereich Methoden und Standards
  69. 69. Literatur• Literaturliste zum Thema Big Data in den Sozialwissenschaften: http://kwelle.wordpress.com/2014/04/12/big-data-links-and-literature/ Literaturempfehlungen • Ackland, R. (2013). Web Social Science. Los Angeles et al: SAGE. • Boyd, D., & Crawford, K. (2012). Critical questions for big data: Provocations for a cultural, technological, and scholarly phenomenon. Information, Communication, & Society, 15(5), 662-679. • Bruns, A. (2013). Faster than the speed of print: Reconciling ‘big data’ social media analysis and academic scholarship. First Monday 10(18). Available http://firstmonday.org/ojs/index.php/fm/article/view/4879 • Giglietto, F., Rossi, L., & Bennato, D. (2012). The Open Laboratory: Limits and Possibilities of Using Facebook, Twitter, and YouTube as a Research Data Source. Journal of Technology in Human Services, 30(3-4), 145–159. • Karpf, D. (2012). Social science research methods in internet time. Information, Communication & Society, 5(15), 639-661. • Weller, K., Bruns, A., Burgess, J., Mahrt, M., & Puschmann, C. (2014). Twitter and Society. New York et al.: Peter Lang. • Williams, S. A., Terras, M. M., Warwick, C. (2013). What do people study when they study Twitter? Classifying Twitter related academic papers. Journal of Documentation, 69(3), 384-410.
  70. 70. Grüße aus Köln! 73
  71. 71. Fragen und Feedback: Dr. Katrin Weller GESIS Leibniz Institute for the Social Sciences katrin.weller@gesis.org @kwelle http://katrinweller.net 74

×