Presentación realizada para el coloquio de mediatizaciones tematizado en Big Data y ciencias sociales organizado por el CIM (Centro de Investigación en Mediatizaciones) de la Universidad Nacional de Rosario (http://www.cim.unr.edu.ar/)
3. Métodos Digitales
• “techniques for the study of societal change and cultural
condition with online data” (Rogers, 2015, p. 1)
• Pregunta(s) de investigación siempre es el norte
• Eminentemente ad-hoc:
(…) digital methods are often experimental and situational,
because they developed in tandem with the medium conditions,
and occasionally are built on top of other devices (Rogers, 2015, p.
9)
2
5. Epistemitología del Big Data
• ¿¿¿Bigger Data = Better data???
• “the widespread belief that large data sets offer a higher
form of intelligence and knowledge that can generate
insights that were previously impossible, with the aura of
truth, objectivity, and accuracy” (boyd & Crawford, 2012,
p. 663).
4
13. Consistencia Fuentes Múltiples de Datos
12
Id_TAGS Id_Sifter
¿¿35% de inconsistencia??
• Sifter incluye # de tweets
originales
• 3% sin #ForaTemer (¿?)
• Sifter captura ID tweet
original, TAGS captura ID del
retweet
• Campos con nombres
inconsistentes
• TAGS no captura cuando
hashtag está adjacente a un
signo gráfico o palabra: “blab
la bla#ForaTemer” o
“.#ForaTemer”
14. Proxies de tópicos: hashtags
• Espacio público ad hoc (ad hoc
publics, Bruns y Burgess, 2011)
• Nivel Macro (Bruns y Moe, 2014)
• Diferentes funciones retóricas
(Daer et al., 2014)
13
16. Interpretando hashtags
Alinear selección de grupos y sub-grupos de hashtags con
preguntas de investigación implica reconocer:
• Frecuencia de uso de hashtag no necesariamente
equivale a diversidad de actores y vice-versa: agenda
setting o propaganda?
• Mapa con tres dimensiones para selección de hashtags:
frecuencia uso x diversidad de actores x “densidad”
(frecuencia de uso / núm actores)
17. Interpretando hashtags
• Mapa tridimensional para selección de hashtags:
(1) frecuencia uso
x
(2) diversidad de actores
x
(3) “densidad”
(frecuencia de uso / núm actores)
(1) (2) (3)
18. Model of Hashtag Density
User-specific hashtags Low-density hashtags
High-density hashtags
User-diverse hashtags
Frequency of Hashtag
HighLow
Averagetweetsperuser
LowHigh
19. Figura 1: Ejercicio de priorización desarrollado durante Escuela de Verano de Digital Methods Initiative en 2016.
Size = number of users
Low-density hashtags
High-density hashtags
User-diverse hashtags
User-specific hashtags
21. Δt Captura vs Análisis
• En un año 17% contenido mediático
(Links, Imágenes o Videos) en un set
de datos de Twitter (#ForaTemer) está
indisponible (borrado, protegido,
usuario removido etc.)
20
24. Estrategias de muestreo y
representatividad
• “The distinction between the sample collected and the
goal of broad generalization is quintessentially important,
as it can result in a mismatch between whom or what is
being sampled, and the scope of any generalizations
drawn from subsequent data analysis” (Rafail, 2017, p. 4)
• “even samples collected by searching for the most widely
used hashtag could potentially overlook approximately
half of all user activity” (Rafail, 2017, p. 10)
• “we captured some 790,000 tweets containing the
hashtag #tsunami, but close to four times as many
tweets simply featuring the word ‘tsunami’” (Bruns & Moe,
2014, p. 25)
23
29. ¿Ideas?
• Documentar métodos de forma detallada y transparente
• Búsqueda de documentación/transparencia de
plataformas y datos
• Énfasis en etapa de operacionalización: del concepto a
la(s) variable(s)
• Variables multidimensionales
• Limitar planteamientos a las opciones o restricciones
epistemológicas y operacionales de los procesos, datos,
métodos y herramientas
• Triangular/convergir/explorar resultados obtenidos con
diferentes procesos y tecnologías de forma a asegurar
conclusiones
28
----- Meeting Notes (14-08-17 11:23) -----
Al usar separation wall, tengo claramente un conjunto de fotos del muro que separa Israel de Palestina
----- Meeting Notes (14-08-17 11:23) -----
Pero al usar "security fence", se nota que estamos claramente ante un enmarque suavizador de la problemática; como si fuera lo mismo una gigantesca muralla gris y una rejita para la cancha de fútbol o la plaza