LAKO Kreativpreis_2024_Startnummer_02_(LFS_LA).pdf
Digitale Methoden und soziale Netzwerkplattformen. Zwischen Mediumspezifizität und Analytischen Gesten
1. Digitale Methoden und soziale Netzwerkplattformen
Zwischen Mediumspezifizität und Analytischen Gesten
Bernhard Rieder
Associate Professor, Universiteit van Amsterdam
Mediastudies Department, Digital Methods Initiative
2. Kontext
Blickwinkel:
Methodenentwicklung, Methodenreflektion, Methodenkritik.
Methodologischer Kontext:
Digital Methods (Rogers 2013), "quali-quanti" Beschreibung (Latour
2010), explorative Datenanalyse (Tukey 1962, 1977), computergestützte
Analyse von digitalen Daten ("data mining")
Anwendungskontext:
Soziale Netzwerkdienste, große Datenmengen (Millionen), viele
Einheiten, Heterogenität, diverse Praktiken, wenig a priori Überblick, etc.
3. Kontext
Versuch der Methodenentwicklung mit stabilem Anschluss an
verschiedene Debatten, u.a. über
☉
formale Techniken (z.B. Nullhypothesentests, Interpretation von
Metriken, algorithmische Verfahren, etc.)
☉
"redistribution of method" (Marres 2012) und die Rolle von Software in geistesund sozialwissenschaftlicher Forschung
☉
"politics of method" (Savage/Burrows 2007)
☉
mediumspezifische Metriken (z.B. Bruns/Stieglitz 2012), etc.
Nicht alle Probleme sind neu, viele schon.
Wie generieren wir Wissen? Welchen Status hat dieses Wissen? Wie
lassen sich große Datenmengen erforschen? Wie
beschreiben, charakterisieren, qualifizieren wir mit Methoden?
4. Überblick
Dieser Vortrag nähert sich diesen Fragen, anhand ausgewählter Beispiele
aus der Entwicklung zweier DM Tools:
☉
Netvizz (Datenextraktion für Facebook), Rieder 2013
https://apps.facebook.com/netvizz/, 3K+ user/Monat
☉
DMI-TCAT, (DMI Twitter Capture and Analysis Toolkit), Borra & Rieder forthcoming
in Kürze open source, 425M tweets, ca. 20 Forschungsprojekte
Zugang über das Spannungsfeld zwischen Mediumspezifizität und
Analytische Gesten und die Frage der Expressivität digitaler Methoden.
5. Mediumspezifizität
In Anschluss an McLuhan, Hayles, etc. ist Mediumspezifizität (medium
specificity) ein Schlüsselbegriff in DM Zugängen (Rogers 2013).
Traditionell: spezifische Materialität verschiedener Medientypen.
Im DM Kontext: "Medien" (z.B. Soziale Netzwerk Plattformen) integrieren spezifische
Elemente (z.B. like-button) und Methoden (z.B. zur Informations-hierarchisierung); diese
können zur Internet Forschung gebraucht werden.
"Follow the actors, follow the medium." (Latour + Rogers)
Spezifische (medienspezifische) Möglichkeiten (viele detaillierte und
strukturierte Daten) und Probleme auf verschiedenen Ebenen (siehe z.B.
boyd/Crawford 2012, Burgess/Puschmann 2013), z.B.
Datenqualität, technische Herausforderungen, Ethik, etc.
8. Analytische Gesten
Das Konzept der Geste bei Flusser (1994), versucht menschliches, nichtkausales Handeln zwischen Konvention und Freiheit zu thematisieren.
Unsere Methoden beinhalten analytische Gesten (z.B.
Stichprobenziehung, Korrelationsberechnungen, Layoutalgorithmen, etc.)
die in einerseits in Forschungstraditionen – Paradigmen, "styles of
reasoning" (Hacking 1991) – eingebettet sind, und doch durch
verschiedene lokale Erkenntnisinteressen moduliert und variiert werden.
Womit gehen wir auf das Datenmaterial zu? Warum?
9. Zwei mathematische Perspektiven
Statistik
Graphentheorie
Beobachtet: Objekte und Eigenschaften
Beobachtet: Objekte und Verbindungen
Abgeleitet: Korrel. zwischen Eigenschaften
Abgeleitet: Struktur und Dynamik
Datastruktur: Tabelle
Datenstruktur: Matrix
Vis. Darstellung: quantitative Diagramme
Vis. Darstellung: Netzwerkdiagramme
Gruppen: Klassen (ähnliche Eigenschaften)
Gruppen: Cliquen (dichte Verbindungen)
10. DMI-TCAT (tweet export Interface)
mediumspezifisch: technische und funktionelle Elemente
mediumspezifisch: legale Komponente
11. Methodenentwicklung
Methoden/Softwareentwicklung für DM verbindet Untersuchung des
mediumspezifischen "Materials" mit motivierten analytische Gesten.
Maireder: "was ermöglicht uns die Technik?"
Wenn Methoden systematische Techniken der Realitätsbeschreibung
sind, wie diese expressiv, eloquent, detailreich, anregend, etc. machen?
Ohne verlässliche demographische Daten?
Roter Faden: Beispiele mit Fokus auf Zeitkomponente (aber nicht nur).
12. Facebook Seite "ElShaheeed", Juni 2010 – Juni 2011, (Poell / Rieder, forthcoming)
7K posts, 700K users, 3.6M comments, 10M likes (tool: netvizz), in Arbeit
33. Schluss
Mediumspezifizität als Problem und Chance. Wir bekommen viele
Elemente und Indikatoren, aber was bedeuten diese technisch/funktionell
und in Bezug auf ihren Gebrauch?
Spannungsfeld Materialität der Plattform vs. Analytische Gesten.
Eine der interessantes Möglichkeiten ist die Qualifikation spezifischer
Elemente durch andere Elemente, wobei unterschiedliche formelle
Verknüpfungsmöglichkeiten bestehen (z.B. Diversität).
Wir benötigen stärkere Verbindungen zwischen:
☉
Methodenwissen
☉
Mediumwissen
☉
Fallwissen
☉
Sozial- und Kulturtheorie
34. Danke für Ihre Aufmerksamkeit!
rieder@uva.nl
http://rieder.polsys.net
http://thepoliticsofsystems.net
https://www.digitalmethods.net
"Of course, in the study of such complicated phenomena as occur in biology and
sociology, the mathematical method cannot play the same role as, let us say, in
physics. In all cases, but especially where the phenomena are most complicated, we
must bear in mind, if we are not to lose our way in meaningless play with
formulas, that the application of mathematics is significant only if the concrete
phenomena have already been made the subject of a profound theory." (Aleksandrov
1963)
Editor's Notes
Präsentation aus der Werkstatt der Methodenentwicklung.Rogers, Richard. 2013. Digital Methods. Cambridge MA: The MIT Press.Latour, B. 2010. “An Attempt at a ‘Compositionist Manifesto’.” New Literary History 41 (3): 471–490.Tukey, John W. 1962. “The Future of Data Analysis.” The Annals of Mathematical Statistics 33 (1) (March 1): 1–67.Tukey, John Wilder. 1977. Exploratory Data Analysis. Addison-Wesley Publishing Company.
Unsere Methoden sind in der Regel nicht an ein Projekt gebunden, sondern richten sich an ein breites Publikum.Marres, Noortje. 2012. “The Redistribution of Methods: on Intervention in Digital Social Research, Broadly Conceived.” The Sociological Review 60 (December 17): 139–165. doi:10.1111/j.1467-954X.2012.02121.x.Savage, Mike, and Roger Burrows. 2007. “The Coming Crisis of Empirical Sociology.” Sociology 41 (5) (October 1): 885–899. doi:10.1177/0038038507080443.Bruns, Axel, and Stefan Stieglitz. 2012. “Quantitative Approaches to Comparing Communication Patterns on Twitter.” Journal of Technology in Human Services 30 (3-4) (July): 160–185. doi:10.1080/15228835.2012.744249.
Rieder, Bernhard. 2013. “Studying Facebook via Data Extraction: the Netvizz Application.” In, 346–355. New York, New York, USA: ACM Request Permissions. doi:10.1145/2464464.2464475.
Was drückt eine Postleitzahl aus, was das Alter oder Einkommen einer Person?Die APIs von Facebook undTwitter z.B. sind sehr verschieden.Rogers, Richard. 2013. Digital Methods. Cambridge MA: The MIT Press.boyd, danah, and Kate Crawford. 2011. “Six Provocations for Big Data.” SSRN Electronic Journal. doi:10.2139/ssrn.1926431.Puschmann, Cornelius, and Jean Burgess. 2013. “The Politics of Twitter Data” (January 24).
Anatomy of a tweet:Frontside.
Anatomy of a tweet: Backside.
Viele andere Möglichkeiten, z.B. machinelearning, etc.
Viele wichtige Themen schneide ich hier nicht an: Validierung, Datenanreicherung, etc.
http://www.facebook.com/ElShaheeed (CreatedbyWael Ghonim, consideredtobe a centralplaceforthesparkingoftheEgyptian Revolution)http://apps.facebook.com/netvizz/ (toolusedforextraction)Arbeit zusammen mit Arabistik Abteilung der UvA und der American University of Kairo
Einfaches Plotten ist schon eine analytische Geste.Post Typus: mediumspezifisches Element
Einfaches Plotten ist schon eine analytische Geste.Post Typus: mediumspezifisches Element – in der Phase bis Ende Jänner dominieren Photos, danach statusupdates.
Arithmeticmean: Arithmetisches Mittel (Durchschnitt)Median: Median (Zentralwert)Skewness: SymmetrieKurtosis: Steilheit
Die Seite spielt auch nach der Revolution eine Rolle, und user posten auch weiter auf den alten Posts.Diese Erforschung der Zeitdimension ist nur mit Kommentaren aber nicht mit Likes möglich.
Bauen einer Methode: Element 1, Frequenz über ZeitKleinesDatenset, aber auch schon sehr viele User
Bauen einer Methode: Element 1,Bezug zu einer GesamtheitAnalytische Geste: Betrachtung eines Themenindikators über Zeit und in Bezug auf eine GesamtheitNB: wir sehen, dass tweets mit "pakistan" öfter URLs beinhalten dann das ganze Datenset (URL als Indikator)
Bauen einer Methode:Element 3, co-hashtag AnalyseCo-hashtag Analyse ist doppelt mediumspezifisch: - hashtags als Worte mit spezifischen semantischen und funktionellen Eigenschaften - der tweet als "Fenster" in dem der Zusammenhang zwischen zwei Hashtags etabliert wirdKartographie der Kakophonie, Themenübersicht, Erweiterung von KeywordlistenGerlitz, Carolin, and Bernhard Rieder. "Mining OnePercentofTwitter: Collections, Baselines, Sampling." M/C Journal 16, no. 2 (2013).
UserDiversity = Frequenz eines Hashtags dividiert durch die Zahl der User die ihn benutzen.
Hashtags als Themenmarker oder Qualifikatoren ("love") oder Praxismarker ("tbt")?
Bauen einer Methode:Was passiert nun wenn wir die Analyse der Frequenz über Zeit mit dem co-hashtag Konzept verbinden?Frequenz über ZeitBezug auf GesamtheitCo-hashtag AnalyseErlaubt die Erforschung von Issue Drift, auch über lange Zeit.
Wer sind die aktivsten accounts?
Auch wieder die Zeit Komponente, hier über dasUTCoffset Feld in der Twitter API – geographischer Indikator, ungenauer als "lat/lng" und "location", aber dafür von viel mehr Nutzern gebraucht.
Cascade Interface, typischesquali-quanti designZeitmuster als bot-Erkennungsmechanismus
Welche accounts halten die Topologie des Netwzerks zusammen?
Wo sind die roten Knoten? Die Celebrityaccounts (high mentions per tweet) sind nicht wirklich Teil der Debatte
Link diversity (postet ein account verschiedene domainnames oder immer den/die selben?) ist ziemlich gut um Medienaccounts (blau), auch Journalisten zu identifizierenAuch Möglichkeit Ähnlichkeiten zu berechnen
Hier sind Kanten gefärbt nach dem Unterschied in der Followerzahl zweier account.
Netzwerkmetriken können statistisch bearbeitet werden.Pfeffer: "Something alwayscorrelates". Wie interpretieren?
Massig Material um Einheiten zu Qualifizieren. Es gibt sehr viele mediumspezifische Elemente.
Aleksandrov, A D, A N Kolmogorov, and M A Lavrent'Ev. 1963. Mathematics. Cambridge MA: The MIT Press.