SlideShare a Scribd company logo
1 of 92
Download to read offline
PROFESOR GUÍA: LAUTARO GUERRA GENSKOWSKY

PROFESOR CORREFERENTE: RICARDO ACEVEDO ALMONACID
CREACIÓN DE PROTOTIPO PARA LA GENERACIÓN
DE REPORTES A PARTIR DE TWITTER
MEMORIA PARA OPTAR AL TÍTULO DE INGERIERO CIVIL INFORMÁTICO
1
FRANCO CASTRO NAVEA
INDICE
ÍNDICE
1. Contexto
2. Problema a abordar
3. Propuesta
4. Resultados
5. Conclusiones y trabajos futuros
6. Preguntas y comentarios
2
3
4
|
ɒ Ô
|
ɒ Ô
5
|
ɒ Ô
6
CONTEXTO
Ôɒ
|
7
PROCESO GATEKEEPING
INFORMACIÓN EN BRUTO
NOTICIA
CONTEXTO / PROCESO DE GATEKEEPING
MEDIO DE PRENSA
FUERZAS: 

SELECCIONES 

NO OPERATIVAS
EJEMPLO: ¿VA
ACORDE

A LA LINEA EDITORIAL 

DEL MEDIO DE
PRENSA?
8
PUERTAS:
SELECCIONES
OPERATIVAS.

EJEMPLO: ¿ES
POSIBLE VERIFICAR 

LA FUENTE?
CONTEXTO / PROCESO DE GATEKEEPING 9
CONTEXTO / PROCESO DE GATEKEEPING 10
CONTEXTO / PROCESO DE GATEKEEPING 11
CONTEXTO / PROCESO DE GATEKEEPING 12
CONTEXTO / PROCESO DE GATEKEEPING 13
CONTEXTO / PROCESO DE GATEKEEPING 14
NOTICIAS 

GENERADAS
”UNA NOTICIA ES LA COMUNICACIÓN DE
INFORMACIÓN SELECCIONADA SOBRE UN
EVENTO ACTUAL QUE POSTERIORMENTE ES
PRESENTADO A TRAVÉS DE CUALQUIER MEDIO
DE COMUNICACIÓN EXISTENTE”.[66]
Clay Shirky [1]
CONTEXTO / PROCESO DE GATEKEEPING 15
GATEKEEPING
VISIONES REFERENTES AL
16
CONTEXTO / VISIONES REFERENTES AL GATEKEEPING 17
VISIONES REFERENTES AL GATEKEEPING
White [2] identifica el proceso como
demasiado subjetivo, pues las
distintas etapas dependen de
aspectos personales del gatekeeper.
Breed [3] identifica que los
gatekeepers principales
son los editores.
Gans [4] considera que el proceso de
construcción de una noticia no está
principalmente en el periodista o editor,
sino en el proceso, las rutinas y las a
disposiciones de la organización se
dedican a la creación de noticias.
Lewin [5] señala que la redacción de una
noticia incluyen el nivel individual de cada
periodista, el nivel de las rutinas o prácticas
de periodismo, el nivel de organización, el
nivel de los medios de comunicación y el
nivel del sistema social en cada uno de los
cuales actúan fuerzas.
CONTEXTO / VISIONES REFERENTES AL GATEKEEPING 18
ȍƁ
ɀ
nj
IRRUPCIÓN CON 

LAS REDES SOCIALES 

Y EL PERIODISMO 

CIUDADANO
CONTEXTO / VISIONES REFERENTES AL GATEKEEPING 19
ȍƁ
ɀ
nj
ɔ
HERMINDA [6]
NUESTRO ESTUDIO INDICA QUE LA SELECCIÓN
O FILTRO, ES EL PROCESO DE GATEKEEPING
MÁS CERRADO PARA LOS USUARIOS Y
CREEMOS QUE LO SEGUIRÁ SIENDO
HERMINDA [6]
CONTEXTO / VISIONES REFERENTES AL GATEKEEPING 20
PROBLEMA A
ABORDAR
A PESAR DE LA IRRUPCIÓN
DE LAS REDES SOCIALES Y EL
SURGIMIENTO DEL
PERIODISMO CIUDADANO, NO
EXISTE PARTICIPACIÓN
EFECTIVA NI TRASPARENCIA
PARA LOS CIUDADANOS
REFERENTE A LOS PROCESOS
DE GATEKEEPING O
SELECCIÓN DE UNA NOTICIA.
21
PROPUESTA
PROPUESTA
▸ Twitter como red social presenta interesantes
componentes que llevan a que mucha gente lo utilice hoy
en día como fuente de información inmediata.
▸ Se busca diseñar e implementar una herramienta que
permita generar reportes de hechos noticiosos basado en
las potencialidades de Twitter de un determinando evento,
privilegiando aquellos reportes con menor cantidad de
intermediarios, siendo estos, las y los observadores más
cercanos físicamente al lugar donde ocurrió el hecho.
22
PROPUESTA / OBJETIVO PRINCIPAL
OBJETIVO PRINCIPAL
▸ Desarrollar un algoritmo computacional que permita
recoger tweets que reporten un evento, priorizando los
tweets geoposicionados cercano al lugar de ocurrencia
del evento, para generar un relato temporal referente a
dicho evento que será presentado mediante una interfaz
web.
23
PROPUESTA / OBJETIVOS SECUNDARIOS
OBJETIVOS SECUNDARIOS
▸ Analizar trabajos previos y herramientas creadas con
anterioridad para encontrar la forma adecuada y mas
conveniente de proceder a la construcción de esta
herramienta.
▸ Dotar al público interesado en informarse sobre eventos
noticiosos de una herramienta de reporte de eventos que
minimiza el filtrado y tratamiento editorial de contenidos.
▸ Desarrollar una interfaz web que sea clara y fácil de usar
por el usuario.
24
DESARROLLO DEL PROTOTIPO
25
DESARROLLO DEL PROTOTIPO / ARQUITECTURA DE LA SOLUCIÓN
ARQUITECTURA DE LA SOLUCIÓN
26
PRESENTACIÓN DE LOS DATOS
PROCESAMIENTO DE DATOS
CAPTURA DE DATOS
ARQUITECTURA DE LA SOLUCIÓN / CAPTURA DE DATOS
ARQUITECTURA DE LA SOLUCIÓN
27
PRESENTACIÓN DE LOS DATOS
PROCESAMIENTO DE DATOS
CAPTURA DE DATOS
CAPTURA DE DATOS / PROCESOS DE CAPTURA
PROCESOS DE CAPTURA
28
CAPTURA DE
USUARIOS
GEOPOSICIONAMIENTO
DE LOS USUARIOS
CAPTURA DE DATOS
CAPTURA DE
TWEETS
CAPTURA DE USUARIOS
PROCESOS DE LA CAPTURA DE USUARIOS
29
CAPTURA DE USUARIOS
CAPTURA DE MEDIOS
DE PRENSA
CAPTURA DE
SEGUIDORES DE LOS
MEDIOS DE PRENSA
CAPTURA DE USUARIOS 30
LISTA DE MEDIOS
LISTA DE
SEGUIDORES DE
LOS MEDIOS
CAPTURA DE MEDIOS DE PRENSA
CAPTURA DE SEGUIDORES
DE LOS MEDIOS DE PRENSA
CAPTURA DE USUARIOS
ARQUITECTURA DE LA SOLUCIÓN / PROCESAMIENTO DE DATOS
ARQUITECTURA DE LA SOLUCIÓN
31
PRESENTACIÓN DE LOS DATOS
PROCESAMIENTO DE DATOS
CAPTURA DE DATOS
PROCESAMIENTO DE LOS DATOS
PROCESAMIENTO DE DATOS
32
PROCESAMIENTO DE DATOS
DEFINICIÓN DEL
TÓPICO
OBTENCIÓN DEL
CONJUNTO DE
TWEETS
CLASIFICACIÓN Y
APLICACIÓN DE
FILTROS
PROCESAMIENTO DE DATOS / DEFINICIÓN TÓPICO
¿QUÉ ES UN TÓPICO?
▸ TÍTULO
▸ FECHA INICIO CAPTURA
▸ COMUNA ORIGEN
33
UN TÓPICO ES UN HECHO
NOTICIOSO O UN
CONJUNTO DE ELLOS
SOBRE UNA MISMA
TEMÁTICA.
PROCESAMIENTO DE DATOS / OBTENCIÓN CONJUNTO TWEETS
OBTENCIÓN DEL CONJUNTO DE TWEETS
34
OBTENCIÓN DEL CONJUNTO DE TWEETS
RECOGER
CONJUNTO DE
TWEETS
ELIMINAR TWEETS
REPETIDOS
APLICACIÓN
CLASIFICADOR
BAYER-NAIVE
PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS
CLASIFICACIÓN Y APLICACIÓN DE FILTROS
35
CLASIFICACIÓN Y APLICACIÓN DE FILTROS
CONJUNTO DE
TWEETS
ORDEN
CRONOLÓGICO
OBTENCIÓN DE
ENLACES
ORDEN
GEOGRÁFICO
ORDEN
RELEVANCIA
PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS
ORDEN DE RELEVANCIA
▸ Busca ordenar los tweets en base a su relevancia,
entendida como la utilidad del tweet para informar al
usuario.
▸ Se basa en la cantidad de re-tweet. La acción de re-tweet
incluye leer el tweet, decidir si vale la pena compartir y
luego actuar sobre ella. Es posible considerar el re-tweet
como una señal explícita de que el usuario considera el
tweet como información relevante [77].
▸ Este orden implementa un sistema de penalización
temporal.
36
{
{
PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS
ORDEN DE RELEVANCIA
▸ Sistema de penalización temporal
37
{
FUERA DE FECHA TOTALMENTE 

FUERA DE FECHA
VIGENTE
PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS
ORDEN DE RELEVANCIA
▸ Sistema de penalización temporal
38
{PRIMERA
CLASE
{SEGUNDA
CLASE
TERCERA
CLASE
Nº RT
{
PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS
ORDEN DE RELEVANCIA
▸ Sistema de penalización temporal
39
{
{Nº RT
{
Fuera de
fecha
PRIMERA
CLASE
SEGUNDA
CLASE
TERCERA
CLASE
PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS
ORDEN DE RELEVANCIA
▸ Sistema de penalización temporal
40
Nº RT
TOTALMENTE

FUERA DE FECHA
{
{
{
PRIMERA
CLASE
SEGUNDA
CLASE
TERCERA
CLASE
PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS
ORDEN GEOGRÁFICO
▸ Busca ordenar los tweets en base a la cercanía geográfica
de su autor con respecto al lugar del tópico.
▸ Los tweets no vinculados a una zona geográfica son
sancionados bajo los que sí están vinculados.
41
PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS
ORDEN GEOGRÁFICO
42
PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS
ORDEN GEOGRÁFICO
43
PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS
ORDEN GEOGRÁFICO
44
PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS
ORDEN GEOGRÁFICO
45
PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS
PANEL DE ENLACES
46
Ôɒ
|
PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS
FILTRO MEDIOS DE PRENSA
47
PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS
FILTRO MEDIOS DE PRENSA
48
ARQUITECTURA DE LA SOLUCIÓN / PRESENTACIÓN DE DATOS
ARQUITECTURA DE LA SOLUCIÓN
49
PRESENTACIÓN DE DATOS
PROCESAMIENTO DE DATOS
CAPTURA DE DATOS
PRESENTACIÓN DE LOS DATOS
NUEVO TÓPICO
50
PRESENTACIÓN DE LOS DATOS
ORDEN CRONOLÓGICO
51
PRESENTACIÓN DE LOS DATOS
ORDEN GEOGRÁFICO
52
PRESENTACIÓN DE LOS DATOS
ORDEN RELEVANCIA
53
PRESENTACIÓN DE LOS DATOS
RESUMEN DE ENLACES COMPARTIDOS
54
PRESENTACIÓN DE LOS DATOS
MENÚ ON/OFF MEDIOS DE PRENSA
55
PRESENTACIÓN DE LOS DATOS
LISTA DE TÓPICOS
56
RESULTADOS
57
MODELO EVALUACIÓN / ASPECTOS VALOR NOTICIOSO
¿CÓMO MEDIR EL VALOR NOTICIOSO QUE 

TIENEN LOS RESULTADOS RECOGIDOS?
58
NOTICIA DELIMITACIÓN
VIGENCIA
IMPACTO
QUE SURJA
RESPECTO A UN
HECHO CONCRETO
OCURRIDO
QUE SE ENCUENTRE EN
EL MARGEN

TEMPORAL CERCANO AL
SUCESO QUE O ORIGINÓ
QUE SEA PRESENTADA POR

ALGÚN MEDIO DE PRENSA
RESULTADOS / MODELO EVALUACIÓN
¿QUE CONTIENEN LOS TWEETS RECOGIDOS PARA UN TÓPICO?
59
¿El tweet se refiere al tópico en cuestión?
¿El tweet se refiere en general o a un hecho en particular?
¿El hecho aludido es nacional o internacional?
¿Posee gran envergadura?
Tweet 

descartado
Opinión 

general
Insumo

Internacional
Aporte a la 

discusión
Se refiere a un 

hecho noticioso
MODELO EVALUACIÓN / CRITERIOS DE SELECCIÓN MEDIOS DE REFERENCIA
¿CÓMO MEDIR LA REGENCIAS A LAS NOTICIAS?
60
NOTICIA
POPULARIDAD

EN TWITTER
PUBLICACIÓN CONSTANTE
MÉTODO DE DIFUSIÓN
CANTIDAD DE
SEGUIDORES EN
TWITTER.
QUE SEA PRESENTADA POR

ALGÚN MEDIO DE PRENSA
PRIMERAS POSICIONES 

RANKING ALEXA
RANKING DE
TRÁFICO
NOTICIAS GENERALISTAS
MODELO EVALUACIÓN / CRITERIOS DE SELECCIÓN MEDIOS DE REFERENCIA
MEDIOS CHILENOS DE REFERENCIA
61
24 Horas

1.6M seguidores

246K tweets

15/11/2009
Bío-Bío Chile

1.3M seguidores

432K tweets

3/05/2008
La Tercera

0,9M seguidores

265K tweets

2/04/2007
62
CASO DE PRUEBA: EL ABORTO
1 de junio del 2014 al 18 de febrero 2015
CASO DE PRUEBA: EL ABORTO
CONJUNTO DE TWEETS
▸ Tweets recogidos: 1357
▸ Ubicación tópico: Santiago.
▸ Enlaces recogidos: 613 enlaces.
63
CASO DE PRUEBA: EL ABORTO / ANÁLISIS DE CONTENIDO
ANÁLISIS DE CONTENIDO
64
35%
65%
No hacen referencia
Hacen referencia
CASO DE PRUEBA: EL ABORTO / ANÁLISIS DE CONTENIDO
CONTENIDOS QUE NO
SE REFIEREN A UN
HECHO NOTICIOSO
65
35%
65%
8%
18%
73%
Opinión General
Aporte a la discusión
Insumo Internacional
Tweet descartado
CASO DE PRUEBA: EL ABORTO / ANÁLISIS DE CONTENIDO
REFERENCIA A HECHOS
NOTICIOSO CUBIERTOS POR
LOS MEDIOS DE REFERENCIA
66
35%
65%
54% 46%55% 45%
58%
42%
Con referencia a hecho noticioso
Sin referencia a hecho noticioso
CASO DE PRUEBA: EL ABORTO / ANÁLISIS TEMPORAL
ANÁLISIS TEMPORAL
67
CASO DE PRUEBA: EL ABORTO / ANÁLISIS TEMPORAL
HECHOS NOTICIOSOS DURANTE EL PERIODO
68
CASO DE PRUEBA: EL ABORTO / ANÁLISIS DE CONTENIDO
ANÁLISIS GEOGRÁFICO DE LOS AUTORES
69
CONCLUSIONES
70
CONCLUSIONES
CONCLUSIONES
▸ Cumplimiento de objetivos.
▸ Aplicación a otras regiones geográficas.
▸ Consideraciones sobre las conclusiones.
71
MEJORAS Y TRABAJOS FUTUROS
MEJORAS Y TRABAJOS FUTUROS
▸ Geoposicionamiento de los usuarios
▸ Incorporación de AWS.
▸ Consideraciones sobre las conclusiones.
72
¿PREGUNTAS?
¿COMENTARIOS?
73
BIBLIOGRAFÍA
BIBLIOGRAFÍA
▸ [1] Clay Shirky. Here Comes Everybody. Penguin Books, London, 2008.
▸ [2] D. M. White. The gate keeper: A case study in the selection of news. Journalism
Quarterly. Bobbs-Merrill, 1950.
▸ [3] W. Breed. Social Control in the Newsroom: A Functional Analysis. Bobbs-Merrill
Reprint Series in the Social Sciences, S34. Bobbs-Merrill, 1955.
▸ [4] H.J. Gans. Deciding What’s News: A Study of CBS Evening News, NBC Nightly
News, Newsweek, and Time. Medill School of Journalism Visions of the American
Press Series. Northwestern University Press, 1979.
▸ [5] K. Lewin. Field theory in social science: selected theoretical papers. Social
science paperbacks. Harper, 1951.
▸ [6] Alfred Hermida. Twittering the news. Journalism Practice, 4(3):297–308, 2010.
74
PROFESOR GUÍA: LAUTARO GUERRA GENSKOWSKY

PROFESOR CORREFERENTE: RICARDO ACEVEDO ALMONACID
CREACIÓN DE PROTOTIPO PARA LA GENERACIÓN
DE REPORTES A PARTIR DE TWITTER
MEMORIA PARA OPTAR AL TÍTULO DE INGERIERO CIVIL INFORMÁTICO
FRANCO CASTRO NAVEA
ANEXOS
76
ANEXOS/ EL PROCESO DE GATEKEEPING
MEDIO DE PRENSA 1 MEDIO DE PRENSA 2 MEDIO DE PRENSA 3
77
DISTINTOS MEDIOS DE PRENSA,
DISTINTOS GATEKEEPING
78
VISIONES REFERENTES AL GATEKEEPING
White [1] identifica el proceso como
demasiado subjetivo, pues las
distintas etapas dependen de
aspectos personales del gatekeeper.
Breed [2] identifica que los
gatekeepers principales
son los editores.
Gans [3] considera que el proceso de
construcción de una noticia no está
principalmente en el periodista o editor,
sino en el proceso, las rutinas y las a
disposiciones de la organización se
dedican a la creación de noticias.
Lewin [4] señala que la redacción de una
noticia incluyen el nivel individual de cada
periodista, el nivel de las rutinas o prácticas
de periodismo, el nivel de organización, el
nivel de los medios de comunicación y el
nivel del sistema social en cada uno de los
cuales actúan fuerzas.
79
VISIONES REFERENTES AL GATEKEEPING
Lorenzo Gomis en [8] desarrolla la
siguiente idea: los medios de
comunicación y los periodistas no
sienten interés por los problemas
derivados de las posibles
repercusiones de sus mensajes, pues
no son ellos quienes los generan
intencionalmente, sólo los comunican
y los efectos de ambas acciones son
incomparables 3.
Jean-François en [7] crítica
la tendencia a priori que
inducen los distintos
medios de prensa en las
distintas noticias
Real, Agudiez, Príncipe en [9] afirman que
actualmente existe un descontento y
desilusión ciudadana con los medios de
prensa pues éstos últimos no cumplieron
con su parte del contrato social (la de velar
por la transparencia y la difusión de ésta
información).
80
FORMAS CIUDADANAS ACTUALES DE

PARTICIPAR EN LOS MEDIOS DE PRENSA
Blogs.

Envío de fotografías y vídeos.

Entrevistas colectivas.

Comentarios. 

Ranking de contenidos según
votos de Usuarios.

Foros.

Encuestas. 

Comentarios en redes sociales.
ɔ
USUARIOS
GEOPOSICIONAMIENTO DE
81
ANEXOS
GEOPOSICIONAMIENTO DE LOS USUARIOS
▸ Cheng [10] identifica utilizando sólo el campo de
ubicación a 12% de los usuarios mediante el campo
ubicación. 10,12% utilizando el contenido de los tweets y
mediante el uso de palabras más utilizadas de acuerdo a
un contexto geográfico sin mucho éxito. (inferior al 10%)
▸ Al analizar técnicas mixtas (análisis de palabras típicas y
relaciones sociales en la Twitter) logra posicionar el
54.26% de los usuarios.
82
GEOPOSICIONAMIENTO DE USUARIOS
GEOPOSICIONAMIENTO DE USUARIOS
▸ Se considera el campo ubicación del perfil del usuario de
Twitter y se realiza una similitud con el nombre de las
comunas de Chile [9] utilizando la distancia de
Levenshtein.
▸ Se identifica que el valor más óptimo de la distancia de
Levenshtein es 3, con el cual se consigue geoposicionar
114.016 del total de 650.000 usuarios (correspondiente al
17,54 % de usuarios).
83
GEOPOSICIONAMIENTO DE USUARIOS 84
GEOPOSICIONAMIENTO DE USUARIOS 85
Región
Usuarios de Twitter Población real
Usuarios(M) Porcentaje Habitantes(M) Porcentaje
Región de Arica y Parinacota 1,914 1,68 185,0 1,1
Región de Tarapacá 4,477 3,93
5,27
314,5 1,8
Región de Antofagasta 6,005 5,27 575,3 3,4
Región de Atacama 0,974 0,85 280,5 1,6
Región de Coquimbo 4,411 3,87 718,7 4,2
Región de Valparaíso 7,111 6,24 1759,2 10,3
Región de O’higgins 4,756 4,17 883,4 5,2
Región del Maule 6,183 5,42 1007,8 5,9
Región del Bío-Bío 16,862 14,79 2036,4 11,9
Región de La Araucanía 0,825 0,72 970,4 5,7
Región de Los Ríos 2,245 1,97 379,7 2,2
Región de Los Lagos 4,891 4,29 836,3 4,9
Región de Aisén 0,565 0,5 104,8 0,6
Región de Magallanes y la Antártica 1,298 1,14 158,7 0,9
Región Metropolitana 51,499 45,17 6883,6 40,3
Total 114,016 100 17094,3 100
Usuarios de Twitter por región de Chile.
CAPTURA DE LOS DATOS 86
Dato Nº registros
USUARIOS 650.000
TWEETS 17.300.000
Cantidad de datos capturados por el prototipo. Elaboración propia.
TIEMPOS DE LOS ALGORITMOS 87
Dato Tiempo (s)
USUARIO 2,6945
TWEET 0,9658
Tiempo promedio para descargar un dato respetando las restricciones de

solicitudes por hora impuestos por la API TWITTER
ANÁLISIS DE RESULTADOS
MUESTRA REPRESENTATIVA
▸ Tamaño Conjunto = 1357
▸ Error Estándar = 15%
▸ Porcentaje estimado de la muestra P = 0,9
▸ Tamaño de la muestra 309
88
ANÁLISIS DE RESULTADOS
CONJUNTOS DE CLASIFICACIÓN BAYES-NAIVE
89
Clasificación Aceptados Rechazados Total
Entrenamiento 181 19 200
Validación 93 6 99
CASO DE PRUEBA: EL ABORTO 90
Comisiones de salud de las cámaras
de diputados y senadores inician
debate sobre proyectos de
despenalización del aborto.
Anuncio del proyecto de
despenalización del aborto.
ONU pide a Chile incluir violación como
causa para hacerlo de forma legal.
Caso de joven de 13 años violada y
embarazada.
2 JUNIO 2014
26 JUNIO 2014
24 JUNIO 2014
3 NOVIEMBRE 2014
Declaraciones de ministra de salud Henia
Molina en La Segunda sobre los abortos
en clínicas chicas.
30 DICIEMBRE 2014
CASO DE PRUEBA: EL ABORTO 91
Renuncia de la ministra de
salud Henia Molina.
DC afirma que sus votos no están
asegurados para apoyar el proyecto de
despenalización del aborto.
Declaraciones Rector PUC respecto a
trabajadores que quieran realizar abortos en
la RED PUC
10 DICIEMBRE 2014
17 ENERO 2015
1 FEBRERO 2015
Red Clínicas privadas declara que no
realizará abortos en sus recintos.5 FEBRERO 2015
6 FEBRERO 2015
Críticas a dichos de Lorenzini sobre los
motivos, que a su juicio, causarían una
decisión.
Cade: 71% aprueba proyecto de ley de
despenalización del aborto.
9 FEBRERO 2015
ANEXOS
COTIZACIÓN EN AWS
92
Instancia Descripción
Costo Mensual
(US$)
EC2
Linux c4.2xlarge, On demand con 1 adelanto parcial de reser-
va, 20 % utilizacion por mes. Transferencia de datos de
entrada ́
10GB/Mes, Transferencia de datos de salida 3GB/Mes
102,930
EC2
Linux t2.small, On demand con 1 adelanto parcial de reserva,
100 % utilizacion por mes. Transferencia de datos de entrada ́
10GB/Mes, Transferencia de datos de salida 3GB/Mes
4,380
RDS
db.r3.large, 100 GB, 200 IOPS, Mysql, 100 % utilización por
mes
19,900
Costo total mensual
344.2
($244.928,4)

More Related Content

Similar to Reportes de Twitter sobre eventos noticiosos

Programa ADSI - SENA
Programa ADSI - SENAPrograma ADSI - SENA
Programa ADSI - SENAErika Galvis
 
Tecnólogo en análisis y desarrollo de sistemas de información
Tecnólogo en análisis y desarrollo de sistemas de informaciónTecnólogo en análisis y desarrollo de sistemas de información
Tecnólogo en análisis y desarrollo de sistemas de informaciónLj Castañeda
 
Administraci N De Los Sistemas De Informaci N 7Ma Edici N Kenneth J Sousa
Administraci N De Los Sistemas De Informaci N 7Ma Edici N Kenneth J SousaAdministraci N De Los Sistemas De Informaci N 7Ma Edici N Kenneth J Sousa
Administraci N De Los Sistemas De Informaci N 7Ma Edici N Kenneth J SousaLisa Muthukumar
 
 “SOFTWARE DE APLICACIÓN Y GERENCIA DE IMPRENTA MARU-SAN”
 “SOFTWARE DE APLICACIÓN Y GERENCIA DE IMPRENTA MARU-SAN” “SOFTWARE DE APLICACIÓN Y GERENCIA DE IMPRENTA MARU-SAN”
 “SOFTWARE DE APLICACIÓN Y GERENCIA DE IMPRENTA MARU-SAN”silvestre s
 
Proceso del diseño arq
Proceso del diseño arqProceso del diseño arq
Proceso del diseño arqalvaro LAURA
 
Valoración de plataformas web para la vigilancia tecnológica
Valoración de plataformas web para la vigilancia tecnológicaValoración de plataformas web para la vigilancia tecnológica
Valoración de plataformas web para la vigilancia tecnológicaFernando Martínez Rivero
 
¡Dos meses para entregar! ¿Es posible?
¡Dos meses para entregar! ¿Es posible?¡Dos meses para entregar! ¿Es posible?
¡Dos meses para entregar! ¿Es posible?Mercy Falconí
 
RESUMEN DIAPOSITIVAS AA18 EV 1 Y 2.pptx
RESUMEN DIAPOSITIVAS AA18 EV 1 Y 2.pptxRESUMEN DIAPOSITIVAS AA18 EV 1 Y 2.pptx
RESUMEN DIAPOSITIVAS AA18 EV 1 Y 2.pptxDIANNYSTELLAORTEGATA
 
analisis-y-disenio-de-sistemas-kendall-kendall.pdf
analisis-y-disenio-de-sistemas-kendall-kendall.pdfanalisis-y-disenio-de-sistemas-kendall-kendall.pdf
analisis-y-disenio-de-sistemas-kendall-kendall.pdfManuelQuintanaValien
 
Ciclo de Vida y Diseño de los Sistemas de Información
Ciclo de Vida y Diseño de los Sistemas de InformaciónCiclo de Vida y Diseño de los Sistemas de Información
Ciclo de Vida y Diseño de los Sistemas de Informaciónerwin portillo
 
El ciclo de proyecto en Big Data
El ciclo de proyecto en Big DataEl ciclo de proyecto en Big Data
El ciclo de proyecto en Big DataRafael Morales
 
Ciclo de Vida de un sistema de información y técnicas para su desarrollo
Ciclo de Vida de un sistema de información y técnicas para su desarrollo Ciclo de Vida de un sistema de información y técnicas para su desarrollo
Ciclo de Vida de un sistema de información y técnicas para su desarrollo Daniel221A
 
IMPLEMENTCIÓN DE SOFTWARE DE MATRÍCULA "ISM" (PMBOK)
IMPLEMENTCIÓN DE SOFTWARE DE MATRÍCULA "ISM" (PMBOK)IMPLEMENTCIÓN DE SOFTWARE DE MATRÍCULA "ISM" (PMBOK)
IMPLEMENTCIÓN DE SOFTWARE DE MATRÍCULA "ISM" (PMBOK)Geraldine Mendoza Rodríguez
 
MetodologiaSistemas_2024_Análisisdesistemasdeinformacion.pptx
MetodologiaSistemas_2024_Análisisdesistemasdeinformacion.pptxMetodologiaSistemas_2024_Análisisdesistemasdeinformacion.pptx
MetodologiaSistemas_2024_Análisisdesistemasdeinformacion.pptxflosasso
 
Introducción a la tecnología cluster
Introducción a la tecnología clusterIntroducción a la tecnología cluster
Introducción a la tecnología clusterRafael Morales
 

Similar to Reportes de Twitter sobre eventos noticiosos (20)

Informe programa
Informe programaInforme programa
Informe programa
 
Programa ADSI - SENA
Programa ADSI - SENAPrograma ADSI - SENA
Programa ADSI - SENA
 
Tecnólogo en análisis y desarrollo de sistemas de información
Tecnólogo en análisis y desarrollo de sistemas de informaciónTecnólogo en análisis y desarrollo de sistemas de información
Tecnólogo en análisis y desarrollo de sistemas de información
 
Administraci N De Los Sistemas De Informaci N 7Ma Edici N Kenneth J Sousa
Administraci N De Los Sistemas De Informaci N 7Ma Edici N Kenneth J SousaAdministraci N De Los Sistemas De Informaci N 7Ma Edici N Kenneth J Sousa
Administraci N De Los Sistemas De Informaci N 7Ma Edici N Kenneth J Sousa
 
 “SOFTWARE DE APLICACIÓN Y GERENCIA DE IMPRENTA MARU-SAN”
 “SOFTWARE DE APLICACIÓN Y GERENCIA DE IMPRENTA MARU-SAN” “SOFTWARE DE APLICACIÓN Y GERENCIA DE IMPRENTA MARU-SAN”
 “SOFTWARE DE APLICACIÓN Y GERENCIA DE IMPRENTA MARU-SAN”
 
Proceso del diseño arq
Proceso del diseño arqProceso del diseño arq
Proceso del diseño arq
 
Valoración de plataformas web para la vigilancia tecnológica
Valoración de plataformas web para la vigilancia tecnológicaValoración de plataformas web para la vigilancia tecnológica
Valoración de plataformas web para la vigilancia tecnológica
 
Los estándares de aseguramiento de ingresos
Los estándares de aseguramiento de ingresosLos estándares de aseguramiento de ingresos
Los estándares de aseguramiento de ingresos
 
Proyec to
Proyec toProyec to
Proyec to
 
Informe de auditoria
Informe de auditoriaInforme de auditoria
Informe de auditoria
 
¡Dos meses para entregar! ¿Es posible?
¡Dos meses para entregar! ¿Es posible?¡Dos meses para entregar! ¿Es posible?
¡Dos meses para entregar! ¿Es posible?
 
RESUMEN DIAPOSITIVAS AA18 EV 1 Y 2.pptx
RESUMEN DIAPOSITIVAS AA18 EV 1 Y 2.pptxRESUMEN DIAPOSITIVAS AA18 EV 1 Y 2.pptx
RESUMEN DIAPOSITIVAS AA18 EV 1 Y 2.pptx
 
analisis-y-disenio-de-sistemas-kendall-kendall.pdf
analisis-y-disenio-de-sistemas-kendall-kendall.pdfanalisis-y-disenio-de-sistemas-kendall-kendall.pdf
analisis-y-disenio-de-sistemas-kendall-kendall.pdf
 
Ciclo de Vida y Diseño de los Sistemas de Información
Ciclo de Vida y Diseño de los Sistemas de InformaciónCiclo de Vida y Diseño de los Sistemas de Información
Ciclo de Vida y Diseño de los Sistemas de Información
 
El ciclo de proyecto en Big Data
El ciclo de proyecto en Big DataEl ciclo de proyecto en Big Data
El ciclo de proyecto en Big Data
 
Posibilidades de uso de la Mineria de Procesos en ITSM
Posibilidades de uso de la Mineria de Procesos en ITSMPosibilidades de uso de la Mineria de Procesos en ITSM
Posibilidades de uso de la Mineria de Procesos en ITSM
 
Ciclo de Vida de un sistema de información y técnicas para su desarrollo
Ciclo de Vida de un sistema de información y técnicas para su desarrollo Ciclo de Vida de un sistema de información y técnicas para su desarrollo
Ciclo de Vida de un sistema de información y técnicas para su desarrollo
 
IMPLEMENTCIÓN DE SOFTWARE DE MATRÍCULA "ISM" (PMBOK)
IMPLEMENTCIÓN DE SOFTWARE DE MATRÍCULA "ISM" (PMBOK)IMPLEMENTCIÓN DE SOFTWARE DE MATRÍCULA "ISM" (PMBOK)
IMPLEMENTCIÓN DE SOFTWARE DE MATRÍCULA "ISM" (PMBOK)
 
MetodologiaSistemas_2024_Análisisdesistemasdeinformacion.pptx
MetodologiaSistemas_2024_Análisisdesistemasdeinformacion.pptxMetodologiaSistemas_2024_Análisisdesistemasdeinformacion.pptx
MetodologiaSistemas_2024_Análisisdesistemasdeinformacion.pptx
 
Introducción a la tecnología cluster
Introducción a la tecnología clusterIntroducción a la tecnología cluster
Introducción a la tecnología cluster
 

More from Franco Navea

La universidad entre la dialectica de sus actores y el poder del conocimiento
La universidad entre la dialectica de sus actores y el poder del conocimientoLa universidad entre la dialectica de sus actores y el poder del conocimiento
La universidad entre la dialectica de sus actores y el poder del conocimientoFranco Navea
 
Comunicado 24. el vergel(1)
Comunicado 24. el vergel(1)Comunicado 24. el vergel(1)
Comunicado 24. el vergel(1)Franco Navea
 
Cronograma sesión 2 vocalias
Cronograma sesión 2 vocaliasCronograma sesión 2 vocalias
Cronograma sesión 2 vocaliasFranco Navea
 
Organica vocalias final
Organica vocalias finalOrganica vocalias final
Organica vocalias finalFranco Navea
 
Padlet ideas semana mechona 2014
Padlet   ideas semana mechona 2014Padlet   ideas semana mechona 2014
Padlet ideas semana mechona 2014Franco Navea
 
Educación para la igualdad
Educación para la igualdadEducación para la igualdad
Educación para la igualdadFranco Navea
 
Triptico 2012 pagina interior
Triptico 2012    pagina interiorTriptico 2012    pagina interior
Triptico 2012 pagina interiorFranco Navea
 
Afiche Proyecto Amor
Afiche Proyecto AmorAfiche Proyecto Amor
Afiche Proyecto AmorFranco Navea
 
Nuestro programa en 50 tweets
Nuestro programa en 50 tweetsNuestro programa en 50 tweets
Nuestro programa en 50 tweetsFranco Navea
 
Académico reflexiona sobre la formación integral necesaria en la USM
Académico reflexiona sobre la formación integral necesaria en la USMAcadémico reflexiona sobre la formación integral necesaria en la USM
Académico reflexiona sobre la formación integral necesaria en la USMFranco Navea
 
Seminario interdiciplinario
Seminario interdiciplinarioSeminario interdiciplinario
Seminario interdiciplinarioFranco Navea
 
Resumen organizacion listas_feutfsm
Resumen organizacion listas_feutfsmResumen organizacion listas_feutfsm
Resumen organizacion listas_feutfsmFranco Navea
 
Carta colecta para AMORTV
Carta colecta para AMORTVCarta colecta para AMORTV
Carta colecta para AMORTVFranco Navea
 
Proyecto de investigación informatica y sociedad
Proyecto de investigación informatica y sociedadProyecto de investigación informatica y sociedad
Proyecto de investigación informatica y sociedadFranco Navea
 
Encuentro aranceles 19 nov
Encuentro aranceles 19 novEncuentro aranceles 19 nov
Encuentro aranceles 19 novFranco Navea
 
Comunicado ii aranceles
Comunicado ii arancelesComunicado ii aranceles
Comunicado ii arancelesFranco Navea
 
Acuerdos claustro casa central 02 y 03 agosto 2011
Acuerdos claustro casa central 02 y 03 agosto 2011Acuerdos claustro casa central 02 y 03 agosto 2011
Acuerdos claustro casa central 02 y 03 agosto 2011Franco Navea
 
Acuerdo petitorio casa central utfsm 2007
Acuerdo petitorio casa central utfsm 2007Acuerdo petitorio casa central utfsm 2007
Acuerdo petitorio casa central utfsm 2007Franco Navea
 

More from Franco Navea (20)

La universidad entre la dialectica de sus actores y el poder del conocimiento
La universidad entre la dialectica de sus actores y el poder del conocimientoLa universidad entre la dialectica de sus actores y el poder del conocimiento
La universidad entre la dialectica de sus actores y el poder del conocimiento
 
Comunicado 24. el vergel(1)
Comunicado 24. el vergel(1)Comunicado 24. el vergel(1)
Comunicado 24. el vergel(1)
 
Cronograma sesión 2 vocalias
Cronograma sesión 2 vocaliasCronograma sesión 2 vocalias
Cronograma sesión 2 vocalias
 
Organica vocalias final
Organica vocalias finalOrganica vocalias final
Organica vocalias final
 
Padlet ideas semana mechona 2014
Padlet   ideas semana mechona 2014Padlet   ideas semana mechona 2014
Padlet ideas semana mechona 2014
 
Educación para la igualdad
Educación para la igualdadEducación para la igualdad
Educación para la igualdad
 
Triptico 2012 pagina interior
Triptico 2012    pagina interiorTriptico 2012    pagina interior
Triptico 2012 pagina interior
 
Afiche Proyecto Amor
Afiche Proyecto AmorAfiche Proyecto Amor
Afiche Proyecto Amor
 
Nuestro programa en 50 tweets
Nuestro programa en 50 tweetsNuestro programa en 50 tweets
Nuestro programa en 50 tweets
 
Académico reflexiona sobre la formación integral necesaria en la USM
Académico reflexiona sobre la formación integral necesaria en la USMAcadémico reflexiona sobre la formación integral necesaria en la USM
Académico reflexiona sobre la formación integral necesaria en la USM
 
Seminario interdiciplinario
Seminario interdiciplinarioSeminario interdiciplinario
Seminario interdiciplinario
 
Resumen organizacion listas_feutfsm
Resumen organizacion listas_feutfsmResumen organizacion listas_feutfsm
Resumen organizacion listas_feutfsm
 
Carta colecta para AMORTV
Carta colecta para AMORTVCarta colecta para AMORTV
Carta colecta para AMORTV
 
Bri 1.0 cast
Bri 1.0 castBri 1.0 cast
Bri 1.0 cast
 
Proyecto de investigación informatica y sociedad
Proyecto de investigación informatica y sociedadProyecto de investigación informatica y sociedad
Proyecto de investigación informatica y sociedad
 
Aranceles y sba
Aranceles y sbaAranceles y sba
Aranceles y sba
 
Encuentro aranceles 19 nov
Encuentro aranceles 19 novEncuentro aranceles 19 nov
Encuentro aranceles 19 nov
 
Comunicado ii aranceles
Comunicado ii arancelesComunicado ii aranceles
Comunicado ii aranceles
 
Acuerdos claustro casa central 02 y 03 agosto 2011
Acuerdos claustro casa central 02 y 03 agosto 2011Acuerdos claustro casa central 02 y 03 agosto 2011
Acuerdos claustro casa central 02 y 03 agosto 2011
 
Acuerdo petitorio casa central utfsm 2007
Acuerdo petitorio casa central utfsm 2007Acuerdo petitorio casa central utfsm 2007
Acuerdo petitorio casa central utfsm 2007
 

Reportes de Twitter sobre eventos noticiosos

  • 1. PROFESOR GUÍA: LAUTARO GUERRA GENSKOWSKY
 PROFESOR CORREFERENTE: RICARDO ACEVEDO ALMONACID CREACIÓN DE PROTOTIPO PARA LA GENERACIÓN DE REPORTES A PARTIR DE TWITTER MEMORIA PARA OPTAR AL TÍTULO DE INGERIERO CIVIL INFORMÁTICO 1 FRANCO CASTRO NAVEA
  • 2. INDICE ÍNDICE 1. Contexto 2. Problema a abordar 3. Propuesta 4. Resultados 5. Conclusiones y trabajos futuros 6. Preguntas y comentarios 2
  • 3. 3
  • 8. CONTEXTO / PROCESO DE GATEKEEPING MEDIO DE PRENSA FUERZAS: 
 SELECCIONES 
 NO OPERATIVAS EJEMPLO: ¿VA ACORDE
 A LA LINEA EDITORIAL 
 DEL MEDIO DE PRENSA? 8 PUERTAS: SELECCIONES OPERATIVAS.
 EJEMPLO: ¿ES POSIBLE VERIFICAR 
 LA FUENTE?
  • 9. CONTEXTO / PROCESO DE GATEKEEPING 9
  • 10. CONTEXTO / PROCESO DE GATEKEEPING 10
  • 11. CONTEXTO / PROCESO DE GATEKEEPING 11
  • 12. CONTEXTO / PROCESO DE GATEKEEPING 12
  • 13. CONTEXTO / PROCESO DE GATEKEEPING 13
  • 14. CONTEXTO / PROCESO DE GATEKEEPING 14 NOTICIAS 
 GENERADAS
  • 15. ”UNA NOTICIA ES LA COMUNICACIÓN DE INFORMACIÓN SELECCIONADA SOBRE UN EVENTO ACTUAL QUE POSTERIORMENTE ES PRESENTADO A TRAVÉS DE CUALQUIER MEDIO DE COMUNICACIÓN EXISTENTE”.[66] Clay Shirky [1] CONTEXTO / PROCESO DE GATEKEEPING 15
  • 17. CONTEXTO / VISIONES REFERENTES AL GATEKEEPING 17 VISIONES REFERENTES AL GATEKEEPING White [2] identifica el proceso como demasiado subjetivo, pues las distintas etapas dependen de aspectos personales del gatekeeper. Breed [3] identifica que los gatekeepers principales son los editores. Gans [4] considera que el proceso de construcción de una noticia no está principalmente en el periodista o editor, sino en el proceso, las rutinas y las a disposiciones de la organización se dedican a la creación de noticias. Lewin [5] señala que la redacción de una noticia incluyen el nivel individual de cada periodista, el nivel de las rutinas o prácticas de periodismo, el nivel de organización, el nivel de los medios de comunicación y el nivel del sistema social en cada uno de los cuales actúan fuerzas.
  • 18. CONTEXTO / VISIONES REFERENTES AL GATEKEEPING 18 ȍƁ ɀ nj IRRUPCIÓN CON 
 LAS REDES SOCIALES 
 Y EL PERIODISMO 
 CIUDADANO
  • 19. CONTEXTO / VISIONES REFERENTES AL GATEKEEPING 19 ȍƁ ɀ nj ɔ HERMINDA [6]
  • 20. NUESTRO ESTUDIO INDICA QUE LA SELECCIÓN O FILTRO, ES EL PROCESO DE GATEKEEPING MÁS CERRADO PARA LOS USUARIOS Y CREEMOS QUE LO SEGUIRÁ SIENDO HERMINDA [6] CONTEXTO / VISIONES REFERENTES AL GATEKEEPING 20
  • 21. PROBLEMA A ABORDAR A PESAR DE LA IRRUPCIÓN DE LAS REDES SOCIALES Y EL SURGIMIENTO DEL PERIODISMO CIUDADANO, NO EXISTE PARTICIPACIÓN EFECTIVA NI TRASPARENCIA PARA LOS CIUDADANOS REFERENTE A LOS PROCESOS DE GATEKEEPING O SELECCIÓN DE UNA NOTICIA. 21
  • 22. PROPUESTA PROPUESTA ▸ Twitter como red social presenta interesantes componentes que llevan a que mucha gente lo utilice hoy en día como fuente de información inmediata. ▸ Se busca diseñar e implementar una herramienta que permita generar reportes de hechos noticiosos basado en las potencialidades de Twitter de un determinando evento, privilegiando aquellos reportes con menor cantidad de intermediarios, siendo estos, las y los observadores más cercanos físicamente al lugar donde ocurrió el hecho. 22
  • 23. PROPUESTA / OBJETIVO PRINCIPAL OBJETIVO PRINCIPAL ▸ Desarrollar un algoritmo computacional que permita recoger tweets que reporten un evento, priorizando los tweets geoposicionados cercano al lugar de ocurrencia del evento, para generar un relato temporal referente a dicho evento que será presentado mediante una interfaz web. 23
  • 24. PROPUESTA / OBJETIVOS SECUNDARIOS OBJETIVOS SECUNDARIOS ▸ Analizar trabajos previos y herramientas creadas con anterioridad para encontrar la forma adecuada y mas conveniente de proceder a la construcción de esta herramienta. ▸ Dotar al público interesado en informarse sobre eventos noticiosos de una herramienta de reporte de eventos que minimiza el filtrado y tratamiento editorial de contenidos. ▸ Desarrollar una interfaz web que sea clara y fácil de usar por el usuario. 24
  • 26. DESARROLLO DEL PROTOTIPO / ARQUITECTURA DE LA SOLUCIÓN ARQUITECTURA DE LA SOLUCIÓN 26 PRESENTACIÓN DE LOS DATOS PROCESAMIENTO DE DATOS CAPTURA DE DATOS
  • 27. ARQUITECTURA DE LA SOLUCIÓN / CAPTURA DE DATOS ARQUITECTURA DE LA SOLUCIÓN 27 PRESENTACIÓN DE LOS DATOS PROCESAMIENTO DE DATOS CAPTURA DE DATOS
  • 28. CAPTURA DE DATOS / PROCESOS DE CAPTURA PROCESOS DE CAPTURA 28 CAPTURA DE USUARIOS GEOPOSICIONAMIENTO DE LOS USUARIOS CAPTURA DE DATOS CAPTURA DE TWEETS
  • 29. CAPTURA DE USUARIOS PROCESOS DE LA CAPTURA DE USUARIOS 29 CAPTURA DE USUARIOS CAPTURA DE MEDIOS DE PRENSA CAPTURA DE SEGUIDORES DE LOS MEDIOS DE PRENSA
  • 30. CAPTURA DE USUARIOS 30 LISTA DE MEDIOS LISTA DE SEGUIDORES DE LOS MEDIOS CAPTURA DE MEDIOS DE PRENSA CAPTURA DE SEGUIDORES DE LOS MEDIOS DE PRENSA CAPTURA DE USUARIOS
  • 31. ARQUITECTURA DE LA SOLUCIÓN / PROCESAMIENTO DE DATOS ARQUITECTURA DE LA SOLUCIÓN 31 PRESENTACIÓN DE LOS DATOS PROCESAMIENTO DE DATOS CAPTURA DE DATOS
  • 32. PROCESAMIENTO DE LOS DATOS PROCESAMIENTO DE DATOS 32 PROCESAMIENTO DE DATOS DEFINICIÓN DEL TÓPICO OBTENCIÓN DEL CONJUNTO DE TWEETS CLASIFICACIÓN Y APLICACIÓN DE FILTROS
  • 33. PROCESAMIENTO DE DATOS / DEFINICIÓN TÓPICO ¿QUÉ ES UN TÓPICO? ▸ TÍTULO ▸ FECHA INICIO CAPTURA ▸ COMUNA ORIGEN 33 UN TÓPICO ES UN HECHO NOTICIOSO O UN CONJUNTO DE ELLOS SOBRE UNA MISMA TEMÁTICA.
  • 34. PROCESAMIENTO DE DATOS / OBTENCIÓN CONJUNTO TWEETS OBTENCIÓN DEL CONJUNTO DE TWEETS 34 OBTENCIÓN DEL CONJUNTO DE TWEETS RECOGER CONJUNTO DE TWEETS ELIMINAR TWEETS REPETIDOS APLICACIÓN CLASIFICADOR BAYER-NAIVE
  • 35. PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS CLASIFICACIÓN Y APLICACIÓN DE FILTROS 35 CLASIFICACIÓN Y APLICACIÓN DE FILTROS CONJUNTO DE TWEETS ORDEN CRONOLÓGICO OBTENCIÓN DE ENLACES ORDEN GEOGRÁFICO ORDEN RELEVANCIA
  • 36. PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS ORDEN DE RELEVANCIA ▸ Busca ordenar los tweets en base a su relevancia, entendida como la utilidad del tweet para informar al usuario. ▸ Se basa en la cantidad de re-tweet. La acción de re-tweet incluye leer el tweet, decidir si vale la pena compartir y luego actuar sobre ella. Es posible considerar el re-tweet como una señal explícita de que el usuario considera el tweet como información relevante [77]. ▸ Este orden implementa un sistema de penalización temporal. 36
  • 37. { { PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS ORDEN DE RELEVANCIA ▸ Sistema de penalización temporal 37 { FUERA DE FECHA TOTALMENTE 
 FUERA DE FECHA VIGENTE
  • 38. PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS ORDEN DE RELEVANCIA ▸ Sistema de penalización temporal 38 {PRIMERA CLASE {SEGUNDA CLASE TERCERA CLASE Nº RT {
  • 39. PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS ORDEN DE RELEVANCIA ▸ Sistema de penalización temporal 39 { {Nº RT { Fuera de fecha PRIMERA CLASE SEGUNDA CLASE TERCERA CLASE
  • 40. PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS ORDEN DE RELEVANCIA ▸ Sistema de penalización temporal 40 Nº RT TOTALMENTE
 FUERA DE FECHA { { { PRIMERA CLASE SEGUNDA CLASE TERCERA CLASE
  • 41. PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS ORDEN GEOGRÁFICO ▸ Busca ordenar los tweets en base a la cercanía geográfica de su autor con respecto al lugar del tópico. ▸ Los tweets no vinculados a una zona geográfica son sancionados bajo los que sí están vinculados. 41
  • 42. PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS ORDEN GEOGRÁFICO 42
  • 43. PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS ORDEN GEOGRÁFICO 43
  • 44. PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS ORDEN GEOGRÁFICO 44
  • 45. PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS ORDEN GEOGRÁFICO 45
  • 46. PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS PANEL DE ENLACES 46 Ôɒ |
  • 47. PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS FILTRO MEDIOS DE PRENSA 47
  • 48. PROCESAMIENTO DE DATOS / CLASIFICACIÓN Y APLICACIÓN DE FILTROS FILTRO MEDIOS DE PRENSA 48
  • 49. ARQUITECTURA DE LA SOLUCIÓN / PRESENTACIÓN DE DATOS ARQUITECTURA DE LA SOLUCIÓN 49 PRESENTACIÓN DE DATOS PROCESAMIENTO DE DATOS CAPTURA DE DATOS
  • 50. PRESENTACIÓN DE LOS DATOS NUEVO TÓPICO 50
  • 51. PRESENTACIÓN DE LOS DATOS ORDEN CRONOLÓGICO 51
  • 52. PRESENTACIÓN DE LOS DATOS ORDEN GEOGRÁFICO 52
  • 53. PRESENTACIÓN DE LOS DATOS ORDEN RELEVANCIA 53
  • 54. PRESENTACIÓN DE LOS DATOS RESUMEN DE ENLACES COMPARTIDOS 54
  • 55. PRESENTACIÓN DE LOS DATOS MENÚ ON/OFF MEDIOS DE PRENSA 55
  • 56. PRESENTACIÓN DE LOS DATOS LISTA DE TÓPICOS 56
  • 58. MODELO EVALUACIÓN / ASPECTOS VALOR NOTICIOSO ¿CÓMO MEDIR EL VALOR NOTICIOSO QUE 
 TIENEN LOS RESULTADOS RECOGIDOS? 58 NOTICIA DELIMITACIÓN VIGENCIA IMPACTO QUE SURJA RESPECTO A UN HECHO CONCRETO OCURRIDO QUE SE ENCUENTRE EN EL MARGEN
 TEMPORAL CERCANO AL SUCESO QUE O ORIGINÓ QUE SEA PRESENTADA POR
 ALGÚN MEDIO DE PRENSA
  • 59. RESULTADOS / MODELO EVALUACIÓN ¿QUE CONTIENEN LOS TWEETS RECOGIDOS PARA UN TÓPICO? 59 ¿El tweet se refiere al tópico en cuestión? ¿El tweet se refiere en general o a un hecho en particular? ¿El hecho aludido es nacional o internacional? ¿Posee gran envergadura? Tweet 
 descartado Opinión 
 general Insumo
 Internacional Aporte a la 
 discusión Se refiere a un 
 hecho noticioso
  • 60. MODELO EVALUACIÓN / CRITERIOS DE SELECCIÓN MEDIOS DE REFERENCIA ¿CÓMO MEDIR LA REGENCIAS A LAS NOTICIAS? 60 NOTICIA POPULARIDAD
 EN TWITTER PUBLICACIÓN CONSTANTE MÉTODO DE DIFUSIÓN CANTIDAD DE SEGUIDORES EN TWITTER. QUE SEA PRESENTADA POR
 ALGÚN MEDIO DE PRENSA PRIMERAS POSICIONES 
 RANKING ALEXA RANKING DE TRÁFICO NOTICIAS GENERALISTAS
  • 61. MODELO EVALUACIÓN / CRITERIOS DE SELECCIÓN MEDIOS DE REFERENCIA MEDIOS CHILENOS DE REFERENCIA 61 24 Horas
 1.6M seguidores
 246K tweets
 15/11/2009 Bío-Bío Chile
 1.3M seguidores
 432K tweets
 3/05/2008 La Tercera
 0,9M seguidores
 265K tweets
 2/04/2007
  • 62. 62 CASO DE PRUEBA: EL ABORTO 1 de junio del 2014 al 18 de febrero 2015
  • 63. CASO DE PRUEBA: EL ABORTO CONJUNTO DE TWEETS ▸ Tweets recogidos: 1357 ▸ Ubicación tópico: Santiago. ▸ Enlaces recogidos: 613 enlaces. 63
  • 64. CASO DE PRUEBA: EL ABORTO / ANÁLISIS DE CONTENIDO ANÁLISIS DE CONTENIDO 64 35% 65% No hacen referencia Hacen referencia
  • 65. CASO DE PRUEBA: EL ABORTO / ANÁLISIS DE CONTENIDO CONTENIDOS QUE NO SE REFIEREN A UN HECHO NOTICIOSO 65 35% 65% 8% 18% 73% Opinión General Aporte a la discusión Insumo Internacional Tweet descartado
  • 66. CASO DE PRUEBA: EL ABORTO / ANÁLISIS DE CONTENIDO REFERENCIA A HECHOS NOTICIOSO CUBIERTOS POR LOS MEDIOS DE REFERENCIA 66 35% 65% 54% 46%55% 45% 58% 42% Con referencia a hecho noticioso Sin referencia a hecho noticioso
  • 67. CASO DE PRUEBA: EL ABORTO / ANÁLISIS TEMPORAL ANÁLISIS TEMPORAL 67
  • 68. CASO DE PRUEBA: EL ABORTO / ANÁLISIS TEMPORAL HECHOS NOTICIOSOS DURANTE EL PERIODO 68
  • 69. CASO DE PRUEBA: EL ABORTO / ANÁLISIS DE CONTENIDO ANÁLISIS GEOGRÁFICO DE LOS AUTORES 69
  • 71. CONCLUSIONES CONCLUSIONES ▸ Cumplimiento de objetivos. ▸ Aplicación a otras regiones geográficas. ▸ Consideraciones sobre las conclusiones. 71
  • 72. MEJORAS Y TRABAJOS FUTUROS MEJORAS Y TRABAJOS FUTUROS ▸ Geoposicionamiento de los usuarios ▸ Incorporación de AWS. ▸ Consideraciones sobre las conclusiones. 72
  • 74. BIBLIOGRAFÍA BIBLIOGRAFÍA ▸ [1] Clay Shirky. Here Comes Everybody. Penguin Books, London, 2008. ▸ [2] D. M. White. The gate keeper: A case study in the selection of news. Journalism Quarterly. Bobbs-Merrill, 1950. ▸ [3] W. Breed. Social Control in the Newsroom: A Functional Analysis. Bobbs-Merrill Reprint Series in the Social Sciences, S34. Bobbs-Merrill, 1955. ▸ [4] H.J. Gans. Deciding What’s News: A Study of CBS Evening News, NBC Nightly News, Newsweek, and Time. Medill School of Journalism Visions of the American Press Series. Northwestern University Press, 1979. ▸ [5] K. Lewin. Field theory in social science: selected theoretical papers. Social science paperbacks. Harper, 1951. ▸ [6] Alfred Hermida. Twittering the news. Journalism Practice, 4(3):297–308, 2010. 74
  • 75. PROFESOR GUÍA: LAUTARO GUERRA GENSKOWSKY
 PROFESOR CORREFERENTE: RICARDO ACEVEDO ALMONACID CREACIÓN DE PROTOTIPO PARA LA GENERACIÓN DE REPORTES A PARTIR DE TWITTER MEMORIA PARA OPTAR AL TÍTULO DE INGERIERO CIVIL INFORMÁTICO FRANCO CASTRO NAVEA
  • 77. ANEXOS/ EL PROCESO DE GATEKEEPING MEDIO DE PRENSA 1 MEDIO DE PRENSA 2 MEDIO DE PRENSA 3 77 DISTINTOS MEDIOS DE PRENSA, DISTINTOS GATEKEEPING
  • 78. 78 VISIONES REFERENTES AL GATEKEEPING White [1] identifica el proceso como demasiado subjetivo, pues las distintas etapas dependen de aspectos personales del gatekeeper. Breed [2] identifica que los gatekeepers principales son los editores. Gans [3] considera que el proceso de construcción de una noticia no está principalmente en el periodista o editor, sino en el proceso, las rutinas y las a disposiciones de la organización se dedican a la creación de noticias. Lewin [4] señala que la redacción de una noticia incluyen el nivel individual de cada periodista, el nivel de las rutinas o prácticas de periodismo, el nivel de organización, el nivel de los medios de comunicación y el nivel del sistema social en cada uno de los cuales actúan fuerzas.
  • 79. 79 VISIONES REFERENTES AL GATEKEEPING Lorenzo Gomis en [8] desarrolla la siguiente idea: los medios de comunicación y los periodistas no sienten interés por los problemas derivados de las posibles repercusiones de sus mensajes, pues no son ellos quienes los generan intencionalmente, sólo los comunican y los efectos de ambas acciones son incomparables 3. Jean-François en [7] crítica la tendencia a priori que inducen los distintos medios de prensa en las distintas noticias Real, Agudiez, Príncipe en [9] afirman que actualmente existe un descontento y desilusión ciudadana con los medios de prensa pues éstos últimos no cumplieron con su parte del contrato social (la de velar por la transparencia y la difusión de ésta información).
  • 80. 80 FORMAS CIUDADANAS ACTUALES DE
 PARTICIPAR EN LOS MEDIOS DE PRENSA Blogs.
 Envío de fotografías y vídeos.
 Entrevistas colectivas.
 Comentarios. 
 Ranking de contenidos según votos de Usuarios.
 Foros.
 Encuestas. 
 Comentarios en redes sociales. ɔ
  • 82. ANEXOS GEOPOSICIONAMIENTO DE LOS USUARIOS ▸ Cheng [10] identifica utilizando sólo el campo de ubicación a 12% de los usuarios mediante el campo ubicación. 10,12% utilizando el contenido de los tweets y mediante el uso de palabras más utilizadas de acuerdo a un contexto geográfico sin mucho éxito. (inferior al 10%) ▸ Al analizar técnicas mixtas (análisis de palabras típicas y relaciones sociales en la Twitter) logra posicionar el 54.26% de los usuarios. 82
  • 83. GEOPOSICIONAMIENTO DE USUARIOS GEOPOSICIONAMIENTO DE USUARIOS ▸ Se considera el campo ubicación del perfil del usuario de Twitter y se realiza una similitud con el nombre de las comunas de Chile [9] utilizando la distancia de Levenshtein. ▸ Se identifica que el valor más óptimo de la distancia de Levenshtein es 3, con el cual se consigue geoposicionar 114.016 del total de 650.000 usuarios (correspondiente al 17,54 % de usuarios). 83
  • 85. GEOPOSICIONAMIENTO DE USUARIOS 85 Región Usuarios de Twitter Población real Usuarios(M) Porcentaje Habitantes(M) Porcentaje Región de Arica y Parinacota 1,914 1,68 185,0 1,1 Región de Tarapacá 4,477 3,93 5,27 314,5 1,8 Región de Antofagasta 6,005 5,27 575,3 3,4 Región de Atacama 0,974 0,85 280,5 1,6 Región de Coquimbo 4,411 3,87 718,7 4,2 Región de Valparaíso 7,111 6,24 1759,2 10,3 Región de O’higgins 4,756 4,17 883,4 5,2 Región del Maule 6,183 5,42 1007,8 5,9 Región del Bío-Bío 16,862 14,79 2036,4 11,9 Región de La Araucanía 0,825 0,72 970,4 5,7 Región de Los Ríos 2,245 1,97 379,7 2,2 Región de Los Lagos 4,891 4,29 836,3 4,9 Región de Aisén 0,565 0,5 104,8 0,6 Región de Magallanes y la Antártica 1,298 1,14 158,7 0,9 Región Metropolitana 51,499 45,17 6883,6 40,3 Total 114,016 100 17094,3 100 Usuarios de Twitter por región de Chile.
  • 86. CAPTURA DE LOS DATOS 86 Dato Nº registros USUARIOS 650.000 TWEETS 17.300.000 Cantidad de datos capturados por el prototipo. Elaboración propia.
  • 87. TIEMPOS DE LOS ALGORITMOS 87 Dato Tiempo (s) USUARIO 2,6945 TWEET 0,9658 Tiempo promedio para descargar un dato respetando las restricciones de
 solicitudes por hora impuestos por la API TWITTER
  • 88. ANÁLISIS DE RESULTADOS MUESTRA REPRESENTATIVA ▸ Tamaño Conjunto = 1357 ▸ Error Estándar = 15% ▸ Porcentaje estimado de la muestra P = 0,9 ▸ Tamaño de la muestra 309 88
  • 89. ANÁLISIS DE RESULTADOS CONJUNTOS DE CLASIFICACIÓN BAYES-NAIVE 89 Clasificación Aceptados Rechazados Total Entrenamiento 181 19 200 Validación 93 6 99
  • 90. CASO DE PRUEBA: EL ABORTO 90 Comisiones de salud de las cámaras de diputados y senadores inician debate sobre proyectos de despenalización del aborto. Anuncio del proyecto de despenalización del aborto. ONU pide a Chile incluir violación como causa para hacerlo de forma legal. Caso de joven de 13 años violada y embarazada. 2 JUNIO 2014 26 JUNIO 2014 24 JUNIO 2014 3 NOVIEMBRE 2014 Declaraciones de ministra de salud Henia Molina en La Segunda sobre los abortos en clínicas chicas. 30 DICIEMBRE 2014
  • 91. CASO DE PRUEBA: EL ABORTO 91 Renuncia de la ministra de salud Henia Molina. DC afirma que sus votos no están asegurados para apoyar el proyecto de despenalización del aborto. Declaraciones Rector PUC respecto a trabajadores que quieran realizar abortos en la RED PUC 10 DICIEMBRE 2014 17 ENERO 2015 1 FEBRERO 2015 Red Clínicas privadas declara que no realizará abortos en sus recintos.5 FEBRERO 2015 6 FEBRERO 2015 Críticas a dichos de Lorenzini sobre los motivos, que a su juicio, causarían una decisión. Cade: 71% aprueba proyecto de ley de despenalización del aborto. 9 FEBRERO 2015
  • 92. ANEXOS COTIZACIÓN EN AWS 92 Instancia Descripción Costo Mensual (US$) EC2 Linux c4.2xlarge, On demand con 1 adelanto parcial de reser- va, 20 % utilizacion por mes. Transferencia de datos de entrada ́ 10GB/Mes, Transferencia de datos de salida 3GB/Mes 102,930 EC2 Linux t2.small, On demand con 1 adelanto parcial de reserva, 100 % utilizacion por mes. Transferencia de datos de entrada ́ 10GB/Mes, Transferencia de datos de salida 3GB/Mes 4,380 RDS db.r3.large, 100 GB, 200 IOPS, Mysql, 100 % utilización por mes 19,900 Costo total mensual 344.2 ($244.928,4)