Digitale Methoden in den Sozial- und Geisteswissenschaften: Chancen und Herausforderungen

1,265 views

Published on

Held on December 17th, 2012, as part of the Göttingen Center for Digital Humanities' lecture series on Internet and society. My thanks to Heidi Hanekop for the kind invitation.
http://www.gcdh.de/en/events/calendar-view/dr.-cornelius-puschmann-digitale-methoden-in-den-sozial-und-geisteswissenschaften-chancen-und-herausforderungen

Published in: Education
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,265
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
10
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Digitale Methoden in den Sozial- und Geisteswissenschaften: Chancen und Herausforderungen

  1. 1. Digitale Methoden in den Sozial- undGeisteswissenschaften: Chancen und Herausforderungen Dr. Cornelius Puschmann Berlin School of Library and Information Science / Humboldt Institute for Internet and Society Göttingen Center for Digital Humanities Ringvorlesung „Internet & Society“ 17. Dezember 2012
  2. 2. Inhalt #1„Digitale Methoden“ -- ein Einordnungsversuch #2 Analysen anhand von Social Media-Daten #3Potentiale und Probleme digitaler Methoden
  3. 3. „Internetforschung?“ Netz als Datenquelle Netz als Gegenstand Netz als Forschungsinfrastruktur
  4. 4. Text- und Korpusananalyse NetzwerkanalyseBildanalyse „Digitale Methoden“Sentimentanalyse Visualisierung Maschinenlernverfahren
  5. 5. Durch das Internet und die steigende Beliebtheit vonSocial Media-Diensten gewinnen Forschungsansätze fürden Umgang mit digitalen Kommunikationsdaten anRelevanz:• digital methods (Rogers, 2009)• cultural analytics (Manovich, 2007)• computational social science (Lazer et al, 2009)
  6. 6. Issue Crawler (Rogers et al)
  7. 7. ImagePlot (Manovich/Software Studies Initiative)
  8. 8. „Digitale Methoden“Software Datenquellen• open source • große Zahl von Quellen• benutzerfreundlich + unterschiedlicher Daten• leistungsstark • Netz-nativ und digitalisiert • größtenteils öffentlich
  9. 9. Quelle: http://socialmediainbusiness.com
  10. 10. Web 1.0• kaum nutzergenerierte Inhalte• kein einfacher Zugriff auf Daten (scraping) Web 2.0 • große Menge nutzergenerierter Inhalte • besserer Zugriff auf Daten über Programmierschnittstellen (APIs)
  11. 11. Zugang KontrolleTOS API“law” regeln Umgang Daten ermöglicht Zugriff “code” Besitz Interpretation
  12. 12. Was sind die Implikationen von „Big Data“?“There are also significant questions of truth, control, andpower in Big Data studies: researchers have the tools and theaccess, while social media users as a whole do not. Their datawere created in highly context-sensitive spaces, and it is entirelypossible that some users would not give permission for theirdata to be used elsewhere.”(boyd & Crawford, 2012, p.12)
  13. 13. Beispiel Twitter• Mikroblog/Online-Kurznachrichtendienst, gestartet 2006• inzwischen 500 Millionen aktive Benutzer• wird für die Verbreitung von Nachrichten, öffentliche Kommunikation genutzt• Daten größtenteils über API öffentlich zugänglich
  14. 14. Daten aus Twitter extrahierenHTTP request liefere alle Daten eines bestimmten Users/von einem bestimmten Ort/... Application Programming Interface (API) Daten*
  15. 15. Archivieren von Tweets via yourTwapperKeeper
  16. 16. SoftwareSammeln: • The Archivist (Windows) • yourTwapperKeeper (erfordert Webserver) • 140kit.com (web-basierte Plattform)Analysieren: • Excel, Open Office Calc, SPSS, R, Google Docs..Visualisieren: • (Excel, OO Calc, R), Gephi, NodeXL
  17. 17. Rechtliche und ethische Hürden• Daten dürfen nicht weitergegeben werden (Twitter Terms of Service)• Datenschutzrichtlinien müssen eingehalten werden (etwa European Data Protection Directive)• ethische Fragen stellen sich auch dann, wenn die Daten öffentlich sind!
  18. 18. Beispiel: eine Untersuchung der akademischenBlogplattform hypotheses.org
  19. 19. 0 500 1000 15002004−012004−022004−032004−042004−052004−062004−072004−082004−092004−102004−112004−122005−012005−022005−032005−042005−052005−062005−072005−082005−092005−102005−112005−122006−012006−022006−032006−042006−052006−062006−072006−082006−092006−102006−112006−122007−012007−022007−032007−042007−052007−062007−072007−082007−092007−102007−112007−122008−012008−022008−032008−042008−052008−062008−072008−082008−092008−102008−112008−12 Posts per 2004 - 2004−012009−012009−022009−032009−04 Aktivität Januar month startingJuli 20122009−052009−062009−072009−082009−092009−102009−112009−122010−012010−02 Blogplattform hypotheses.org2010−032010−042010−052010−062010−072010−082010−092010−102010−112010−122011−012011−022011−032011−042011−052011−062011−072011−082011−092011−102011−112011−122012−012012−022012−032012−042012−052012−062012−07
  20. 20. Blogplattform hypotheses.org Aktivste Blogs10nach Beiträgen (n=45.528) Top Blogs by numer of posts (n=45528)6000500040003000200010000 Indústrias Culturais Criminocorpus Radar Veille énergie climat Veille sur la Corée Le Cresson veille Corps et Médecine URFIST Info No Mundo dos Museus Nuevo Mundo radar Blog de l'IRHiS
  21. 21. Blogplattform hypotheses.org Sprachen
  22. 22. Blogplattform hypotheses.org Verlinkungen externer Webseiten
  23. 23. Offene Fragen:• Wem gehören die Daten?• Wie wird die Privatsphäre der Nutzer gewahrt?• Wer sichert die Qualität der Daten?• Wie reproduzierbar sind die Ergebnisse?• Über welche Art von Prozesse lassen sich Aussagen treffen?• Wie generalisierbar sind Einzelstudien?
  24. 24. Potentielle Probleme:• Wettlauf um Kompetenzen und Ressourcen (zwischen Fachbereichen, Wissenschaft/ Industrie), um komplexe Phänomene untersuchen zu können• Wandel der Forschungsfragen• Stärkerer Druck zu Team- und Verbundforschung
  25. 25. Vielen Dank für Ihre Aufmerksamkeit!

×