SlideShare a Scribd company logo
1 of 30
BIG DATA EN MEDIOS
SOCIALES DESDE LAS
CIENCIAS SOCIALES
Desafíos metodológicos
de la capturAnálisis de datos
CIM – Rosario, Agosto de 2017
Marcelo Luis Barbosa dos Santos, PhD © UC-Chile
Investigador CIDOC – Universdidad Finis Terrae
CONTEXTO
Big data de medios sociales para ciencias sociales
1
Métodos Digitales
• “techniques for the study of societal change and cultural
condition with online data” (Rogers, 2015, p. 1)
• Pregunta(s) de investigación siempre es el norte
• Eminentemente ad-hoc:
(…) digital methods are often experimental and situational,
because they developed in tandem with the medium conditions,
and occasionally are built on top of other devices (Rogers, 2015, p.
9)
2
Métodos Digitales
(Rogers, 2015, p. 7)
3
Epistemitología del Big Data
• ¿¿¿Bigger Data = Better data???
• “the widespread belief that large data sets offer a higher
form of intelligence and knowledge that can generate
insights that were previously impossible, with the aura of
truth, objectivity, and accuracy” (boyd & Crawford, 2012,
p. 663).
4
DATOS
capturAnálisis
5
Tópicos x Usuarios (Rafail, 2017)
6
(p. 4)
7
User-restricted
bounded pop.
Proxies de tópicos: palabras-clave
• Query: programa y anti-programa (Rogers, 2016)
Security Fence Separation Wall
X
Separation Wall
Security Fence
Consistencia Fuentes Múltiples de Datos
12
Id_TAGS Id_Sifter
¿¿35% de inconsistencia??
• Sifter incluye # de tweets
originales
• 3% sin #ForaTemer (¿?)
• Sifter captura ID tweet
original, TAGS captura ID del
retweet
• Campos con nombres
inconsistentes
• TAGS no captura cuando
hashtag está adjacente a un
signo gráfico o palabra: “blab
la bla#ForaTemer” o
“.#ForaTemer”
Proxies de tópicos: hashtags
• Espacio público ad hoc (ad hoc
publics, Bruns y Burgess, 2011)
• Nivel Macro (Bruns y Moe, 2014)
• Diferentes funciones retóricas
(Daer et al., 2014)
13
Monopolio de uso
del hashtag
Interpretando hashtags
Alinear selección de grupos y sub-grupos de hashtags con
preguntas de investigación implica reconocer:
• Frecuencia de uso de hashtag no necesariamente
equivale a diversidad de actores y vice-versa: agenda
setting o propaganda?
• Mapa con tres dimensiones para selección de hashtags:
frecuencia uso x diversidad de actores x “densidad”
(frecuencia de uso / núm actores)
Interpretando hashtags
• Mapa tridimensional para selección de hashtags:
(1) frecuencia uso
x
(2) diversidad de actores
x
(3) “densidad”
(frecuencia de uso / núm actores)
(1) (2) (3)
Model of Hashtag Density
User-specific hashtags Low-density hashtags
High-density hashtags
User-diverse hashtags
Frequency of Hashtag
HighLow
Averagetweetsperuser
LowHigh
Figura 1: Ejercicio de priorización desarrollado durante Escuela de Verano de Digital Methods Initiative en 2016.
Size = number of users
Low-density hashtags
High-density hashtags
User-diverse hashtags
User-specific hashtags
User-specific Low-density
High-Density User-diverse
Size = number of users
Low-density hashtags
High-density hashtags
User-diverse hashtags
User-specific hashtags
Δt Captura vs Análisis
• En un año 17% contenido mediático
(Links, Imágenes o Videos) en un set
de datos de Twitter (#ForaTemer) está
indisponible (borrado, protegido,
usuario removido etc.)
20
21
CAPTURANÁLISIS
22
CAPTURA
ANÁLISIS
Estrategias de muestreo y
representatividad
• “The distinction between the sample collected and the
goal of broad generalization is quintessentially important,
as it can result in a mismatch between whom or what is
being sampled, and the scope of any generalizations
drawn from subsequent data analysis” (Rafail, 2017, p. 4)
• “even samples collected by searching for the most widely
used hashtag could potentially overlook approximately
half of all user activity” (Rafail, 2017, p. 10)
• “we captured some 790,000 tweets containing the
hashtag #tsunami, but close to four times as many
tweets simply featuring the word ‘tsunami’” (Bruns & Moe,
2014, p. 25)
23
Comportamientos x Datasets
24
Total Originals % Testimonials
%
Originals
%
Total
DS 1 19.290 924 5% 114 12% 0,6%
DS 2 12.662 1.569 12% 186 12% 1,5%
DS 3 52.452 3.666 7% 1.466 40% 2,8%
Totals 84.404 6.159 7% 1.766 29% 2,1%
DS3 = 3*DS1 | DS2
Metadata y Data screening (Filtraje)
25
Total Originals % Testimonials
%
Originals
%
Total
DS 1 19.290 924 5% 114 12% 0,6%
DS 2 12.662 1.569 12% 186 12% 1,5%
DS 3 52.452 3.666 7% 1.466 40% 2,8%
Totals 84.404 6.159 7% 1.766 29% 2,1%
CAMINOS
26
Métodos Mixtos
27
¿Ideas?
• Documentar métodos de forma detallada y transparente
• Búsqueda de documentación/transparencia de
plataformas y datos
• Énfasis en etapa de operacionalización: del concepto a
la(s) variable(s)
• Variables multidimensionales
• Limitar planteamientos a las opciones o restricciones
epistemológicas y operacionales de los procesos, datos,
métodos y herramientas
• Triangular/convergir/explorar resultados obtenidos con
diferentes procesos y tecnologías de forma a asegurar
conclusiones
28
¡GRACIAS!
MSANTOS@UFT.CL
29

More Related Content

Similar to Marcelo santos cim-2017-social_data_big_data

Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosLuis Fernando Aguas Bucheli
 
Presentaciones digitales
Presentaciones digitalesPresentaciones digitales
Presentaciones digitalesJosue Venegas
 
La geografía y la estadística. dos necesidades para entender big data
La geografía y la estadística. dos necesidades para entender big dataLa geografía y la estadística. dos necesidades para entender big data
La geografía y la estadística. dos necesidades para entender big datapedro_juanes
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de DatosLuisAzofeifa6
 
BIG DATA (MACRODATOS).pdf
BIG DATA (MACRODATOS).pdfBIG DATA (MACRODATOS).pdf
BIG DATA (MACRODATOS).pdfssuser88a1941
 
El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH DigitalesEl Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH DigitalesMaría Sánchez González (@cibermarikiya)
 
Community sence community
Community sence communityCommunity sence community
Community sence communityjohanc2005
 
Presentación Viernes 02 de Octubre - Luis Ramírez Donoso
Presentación Viernes 02 de Octubre  -  Luis Ramírez DonosoPresentación Viernes 02 de Octubre  -  Luis Ramírez Donoso
Presentación Viernes 02 de Octubre - Luis Ramírez DonosoInsotec Group
 
Del plan al data paper dgb unam
Del plan al data paper dgb unamDel plan al data paper dgb unam
Del plan al data paper dgb unamLourdes Feria
 
¿Cómo enseñar a usar datos?
¿Cómo enseñar a usar datos?¿Cómo enseñar a usar datos?
¿Cómo enseñar a usar datos?SocialTIC
 
Tableau Public: Herramienta para la visualización de datos 1
Tableau Public: Herramienta para la visualización de datos 1Tableau Public: Herramienta para la visualización de datos 1
Tableau Public: Herramienta para la visualización de datos 1Francisco Pesante
 
Escuela de Datos
Escuela de DatosEscuela de Datos
Escuela de DatosSocialTIC
 
MultimoDig: investigación sobre textos multimodales y comunicación digital y ...
MultimoDig: investigación sobre textos multimodales y comunicación digital y ...MultimoDig: investigación sobre textos multimodales y comunicación digital y ...
MultimoDig: investigación sobre textos multimodales y comunicación digital y ...Andrea Melissa Mora Umaña
 

Similar to Marcelo santos cim-2017-social_data_big_data (20)

Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de Datos
 
Presentaciones digitales
Presentaciones digitalesPresentaciones digitales
Presentaciones digitales
 
Tema1
Tema1Tema1
Tema1
 
La geografía y la estadística. dos necesidades para entender big data
La geografía y la estadística. dos necesidades para entender big dataLa geografía y la estadística. dos necesidades para entender big data
La geografía y la estadística. dos necesidades para entender big data
 
Infotecnología
InfotecnologíaInfotecnología
Infotecnología
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
 
BIG DATA (MACRODATOS).pdf
BIG DATA (MACRODATOS).pdfBIG DATA (MACRODATOS).pdf
BIG DATA (MACRODATOS).pdf
 
El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH DigitalesEl Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
 
2.10.1 Metodología de la Investigación - Unidad 4
2.10.1 Metodología de la Investigación - Unidad 42.10.1 Metodología de la Investigación - Unidad 4
2.10.1 Metodología de la Investigación - Unidad 4
 
Community sence community
Community sence communityCommunity sence community
Community sence community
 
Presentación Viernes 02 de Octubre - Luis Ramírez Donoso
Presentación Viernes 02 de Octubre  -  Luis Ramírez DonosoPresentación Viernes 02 de Octubre  -  Luis Ramírez Donoso
Presentación Viernes 02 de Octubre - Luis Ramírez Donoso
 
Del plan al data paper dgb unam
Del plan al data paper dgb unamDel plan al data paper dgb unam
Del plan al data paper dgb unam
 
Tecnologia en investigacion
Tecnologia en investigacionTecnologia en investigacion
Tecnologia en investigacion
 
Infotecnología
InfotecnologíaInfotecnología
Infotecnología
 
Investigación social
Investigación socialInvestigación social
Investigación social
 
¿Cómo enseñar a usar datos?
¿Cómo enseñar a usar datos?¿Cómo enseñar a usar datos?
¿Cómo enseñar a usar datos?
 
Tableau Public: Herramienta para la visualización de datos 1
Tableau Public: Herramienta para la visualización de datos 1Tableau Public: Herramienta para la visualización de datos 1
Tableau Public: Herramienta para la visualización de datos 1
 
Escuela de Datos
Escuela de DatosEscuela de Datos
Escuela de Datos
 
Clase 05 metodos de recoleccion de datos primarios
Clase 05   metodos de recoleccion de datos primariosClase 05   metodos de recoleccion de datos primarios
Clase 05 metodos de recoleccion de datos primarios
 
MultimoDig: investigación sobre textos multimodales y comunicación digital y ...
MultimoDig: investigación sobre textos multimodales y comunicación digital y ...MultimoDig: investigación sobre textos multimodales y comunicación digital y ...
MultimoDig: investigación sobre textos multimodales y comunicación digital y ...
 

More from Marcelo Luis Barbosa dos Santos

More from Marcelo Luis Barbosa dos Santos (20)

Pauta trabajo 03 sostenibilidad financiera
Pauta trabajo 03   sostenibilidad financieraPauta trabajo 03   sostenibilidad financiera
Pauta trabajo 03 sostenibilidad financiera
 
16 semio uc_lenguaje_tecnologia_instinto
16 semio uc_lenguaje_tecnologia_instinto16 semio uc_lenguaje_tecnologia_instinto
16 semio uc_lenguaje_tecnologia_instinto
 
07. gadgets
07. gadgets07. gadgets
07. gadgets
 
Sanatorio manicomio-aula_magna_casper
 Sanatorio manicomio-aula_magna_casper Sanatorio manicomio-aula_magna_casper
Sanatorio manicomio-aula_magna_casper
 
14 semio uc_mitologia
14 semio uc_mitologia14 semio uc_mitologia
14 semio uc_mitologia
 
05 tpdii narrativa_transmedia
05 tpdii narrativa_transmedia05 tpdii narrativa_transmedia
05 tpdii narrativa_transmedia
 
11 semio uc_encuadre
11 semio uc_encuadre11 semio uc_encuadre
11 semio uc_encuadre
 
10 semio uc_acd
10 semio uc_acd10 semio uc_acd
10 semio uc_acd
 
04 ns escritura_web
04 ns escritura_web04 ns escritura_web
04 ns escritura_web
 
09 semio uc_intertextualidad
09 semio uc_intertextualidad09 semio uc_intertextualidad
09 semio uc_intertextualidad
 
03 tpdii redes sociales
03 tpdii redes sociales03 tpdii redes sociales
03 tpdii redes sociales
 
Ensayo semio uc 2020
Ensayo semio uc 2020Ensayo semio uc 2020
Ensayo semio uc 2020
 
02 tpdii sistemas_de_gestion_de_contenido
02 tpdii sistemas_de_gestion_de_contenido02 tpdii sistemas_de_gestion_de_contenido
02 tpdii sistemas_de_gestion_de_contenido
 
07 semio uc_greimas
07 semio uc_greimas07 semio uc_greimas
07 semio uc_greimas
 
06 semio uc_barthes
06 semio uc_barthes06 semio uc_barthes
06 semio uc_barthes
 
01 tpdii fundamentos_2020
01 tpdii fundamentos_202001 tpdii fundamentos_2020
01 tpdii fundamentos_2020
 
05 semio uc_saussure
05 semio uc_saussure05 semio uc_saussure
05 semio uc_saussure
 
04 semio uc_semiosis_od-oi
04 semio uc_semiosis_od-oi04 semio uc_semiosis_od-oi
04 semio uc_semiosis_od-oi
 
03 semio uc_categorias
03 semio uc_categorias03 semio uc_categorias
03 semio uc_categorias
 
02 representacion ideograma
02 representacion ideograma02 representacion ideograma
02 representacion ideograma
 

Recently uploaded

BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICAÁngel Encinas
 
6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primariaWilian24
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptAlberto Rubio
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAJAVIER SOLIS NOYOLA
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Alejandrino Halire Ccahuana
 
Biografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfBiografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfGruberACaraballo
 
FUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
FUERZA Y MOVIMIENTO ciencias cuarto basico.pptFUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
FUERZA Y MOVIMIENTO ciencias cuarto basico.pptNancyMoreiraMora1
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptxdeimerhdz21
 
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VSOCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VSYadi Campos
 
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptxRigoTito
 
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...jlorentemartos
 
Análisis de los Factores Externos de la Organización.
Análisis de los Factores Externos de la Organización.Análisis de los Factores Externos de la Organización.
Análisis de los Factores Externos de la Organización.JonathanCovena1
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESOluismii249
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAEl Fortí
 
La Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración AmbientalLa Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración AmbientalJonathanCovena1
 
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docxEliaHernndez7
 
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxRESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxpvtablets2023
 
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.docRodneyFrankCUADROSMI
 

Recently uploaded (20)

BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
 
Tema 11. Dinámica de la hidrosfera 2024
Tema 11.  Dinámica de la hidrosfera 2024Tema 11.  Dinámica de la hidrosfera 2024
Tema 11. Dinámica de la hidrosfera 2024
 
6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
 
Biografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfBiografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdf
 
FUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
FUERZA Y MOVIMIENTO ciencias cuarto basico.pptFUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
FUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptx
 
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VSOCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
 
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
 
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
 
Análisis de los Factores Externos de la Organización.
Análisis de los Factores Externos de la Organización.Análisis de los Factores Externos de la Organización.
Análisis de los Factores Externos de la Organización.
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
 
La Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración AmbientalLa Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración Ambiental
 
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
 
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxRESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
 
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
 

Marcelo santos cim-2017-social_data_big_data

  • 1. BIG DATA EN MEDIOS SOCIALES DESDE LAS CIENCIAS SOCIALES Desafíos metodológicos de la capturAnálisis de datos CIM – Rosario, Agosto de 2017 Marcelo Luis Barbosa dos Santos, PhD © UC-Chile Investigador CIDOC – Universdidad Finis Terrae
  • 2. CONTEXTO Big data de medios sociales para ciencias sociales 1
  • 3. Métodos Digitales • “techniques for the study of societal change and cultural condition with online data” (Rogers, 2015, p. 1) • Pregunta(s) de investigación siempre es el norte • Eminentemente ad-hoc: (…) digital methods are often experimental and situational, because they developed in tandem with the medium conditions, and occasionally are built on top of other devices (Rogers, 2015, p. 9) 2
  • 5. Epistemitología del Big Data • ¿¿¿Bigger Data = Better data??? • “the widespread belief that large data sets offer a higher form of intelligence and knowledge that can generate insights that were previously impossible, with the aura of truth, objectivity, and accuracy” (boyd & Crawford, 2012, p. 663). 4
  • 7. Tópicos x Usuarios (Rafail, 2017) 6 (p. 4)
  • 9. Proxies de tópicos: palabras-clave • Query: programa y anti-programa (Rogers, 2016) Security Fence Separation Wall X
  • 12.
  • 13. Consistencia Fuentes Múltiples de Datos 12 Id_TAGS Id_Sifter ¿¿35% de inconsistencia?? • Sifter incluye # de tweets originales • 3% sin #ForaTemer (¿?) • Sifter captura ID tweet original, TAGS captura ID del retweet • Campos con nombres inconsistentes • TAGS no captura cuando hashtag está adjacente a un signo gráfico o palabra: “blab la bla#ForaTemer” o “.#ForaTemer”
  • 14. Proxies de tópicos: hashtags • Espacio público ad hoc (ad hoc publics, Bruns y Burgess, 2011) • Nivel Macro (Bruns y Moe, 2014) • Diferentes funciones retóricas (Daer et al., 2014) 13
  • 16. Interpretando hashtags Alinear selección de grupos y sub-grupos de hashtags con preguntas de investigación implica reconocer: • Frecuencia de uso de hashtag no necesariamente equivale a diversidad de actores y vice-versa: agenda setting o propaganda? • Mapa con tres dimensiones para selección de hashtags: frecuencia uso x diversidad de actores x “densidad” (frecuencia de uso / núm actores)
  • 17. Interpretando hashtags • Mapa tridimensional para selección de hashtags: (1) frecuencia uso x (2) diversidad de actores x (3) “densidad” (frecuencia de uso / núm actores) (1) (2) (3)
  • 18. Model of Hashtag Density User-specific hashtags Low-density hashtags High-density hashtags User-diverse hashtags Frequency of Hashtag HighLow Averagetweetsperuser LowHigh
  • 19. Figura 1: Ejercicio de priorización desarrollado durante Escuela de Verano de Digital Methods Initiative en 2016. Size = number of users Low-density hashtags High-density hashtags User-diverse hashtags User-specific hashtags
  • 20. User-specific Low-density High-Density User-diverse Size = number of users Low-density hashtags High-density hashtags User-diverse hashtags User-specific hashtags
  • 21. Δt Captura vs Análisis • En un año 17% contenido mediático (Links, Imágenes o Videos) en un set de datos de Twitter (#ForaTemer) está indisponible (borrado, protegido, usuario removido etc.) 20
  • 24. Estrategias de muestreo y representatividad • “The distinction between the sample collected and the goal of broad generalization is quintessentially important, as it can result in a mismatch between whom or what is being sampled, and the scope of any generalizations drawn from subsequent data analysis” (Rafail, 2017, p. 4) • “even samples collected by searching for the most widely used hashtag could potentially overlook approximately half of all user activity” (Rafail, 2017, p. 10) • “we captured some 790,000 tweets containing the hashtag #tsunami, but close to four times as many tweets simply featuring the word ‘tsunami’” (Bruns & Moe, 2014, p. 25) 23
  • 25. Comportamientos x Datasets 24 Total Originals % Testimonials % Originals % Total DS 1 19.290 924 5% 114 12% 0,6% DS 2 12.662 1.569 12% 186 12% 1,5% DS 3 52.452 3.666 7% 1.466 40% 2,8% Totals 84.404 6.159 7% 1.766 29% 2,1% DS3 = 3*DS1 | DS2
  • 26. Metadata y Data screening (Filtraje) 25 Total Originals % Testimonials % Originals % Total DS 1 19.290 924 5% 114 12% 0,6% DS 2 12.662 1.569 12% 186 12% 1,5% DS 3 52.452 3.666 7% 1.466 40% 2,8% Totals 84.404 6.159 7% 1.766 29% 2,1%
  • 29. ¿Ideas? • Documentar métodos de forma detallada y transparente • Búsqueda de documentación/transparencia de plataformas y datos • Énfasis en etapa de operacionalización: del concepto a la(s) variable(s) • Variables multidimensionales • Limitar planteamientos a las opciones o restricciones epistemológicas y operacionales de los procesos, datos, métodos y herramientas • Triangular/convergir/explorar resultados obtenidos con diferentes procesos y tecnologías de forma a asegurar conclusiones 28

Editor's Notes

  1. ----- Meeting Notes (14-08-17 11:23) ----- Al usar separation wall, tengo claramente un conjunto de fotos del muro que separa Israel de Palestina
  2. ----- Meeting Notes (14-08-17 11:23) ----- Pero al usar "security fence", se nota que estamos claramente ante un enmarque suavizador de la problemática; como si fuera lo mismo una gigantesca muralla gris y una rejita para la cancha de fútbol o la plaza