SlideShare a Scribd company logo
1 of 52
TECNOLOGÍA DE LATECNOLOGÍA DE LA
COMUNICACIÓN I
Lic. en Periodismo
Periodismo Universitario
FCH-UNSL (Año 2015)
CLASE IV
“PERIODISMO DE BASE DE DATOS:
BÚSQUEDA, EXTRACCIÓN,
PROCESAMIENTO Y VISUALIZACIÓNPROCESAMIENTO Y VISUALIZACIÓN
DE GRANDES VOLÚMENES DE
INFORMACIÓN”
CREATIVE COMMONS RECONOCIMIENTO-NOCOMERCIAL-
COMPARTIRIGUAL 3.0 UNPORTED LICENSE
¿QUÉ ES EL PERIODISMO DE BASE DE
DATOS (PBD)?
Es una manera de crear o complementar noticias haciendo uso de los datos
existentes en la WWW.
Incluye el PI (periodismo de investigación) para revelar una verdad social
desconocida; el PP (periodismo de precisión) cuando aplica métodos de la
investigación social, el PA (periodismo analítico) porque analiza una realidad
compleja para lograr la comprensión del público y el PAC (periodismo asistido porcompleja para lograr la comprensión del público y el PAC (periodismo asistido por
computadora) para el análisis estadístico de los datos.
EJEMPLOS DE NOTICIAS CON PBD
ARTÍCULOS BASADOS EN DATOS
Se desarrollan en base a información ya existente en la red. Son artículos de corta a
mediana extensión (http://www.lanacion.com.ar/1484852-los-millones-de-la-ape-
como-se-repartio-en-2011-la-caja-que-era-de-moyano)
EJEMPLOS DE NOTICIAS CON PBD
ARTÍCULOS BASADOS EN DATOS
Al igual que en el
caso anterior se
basan en
información ya
existente en la red.
EJEMPLOS DE NOTICIAS CON PBD
VISUALIZACIONES INTERACTIVAS
La diferencia
radica en las
noticias, en las que
un título o
descripción basta.
(http://www.lanacio
n.com.ar/1546303-
los-bienes-de-los-
funcionarios-en-la-
primera-news-
application-de-la-
nscion)
EJEMPLOS DE NOTICIAS CON PBD
VISUALIZACIONES INTERACTIVAS
Son recopilados por los propios periodistas debido a la ausencia de acceso
abierto por parte de las organizaciones
(http://data.lanacion.com.ar/dashboards/5068/inflacion-y-precios)
EJEMPLOS DE NOTICIAS CON PBD
CONJUNTO DE DATOS ABIERTOS
Son desarrolladas por periodistas y programadores
(http://gastopublicobahiense.org). Permiten agrupar y analizar variables
mediante diversos parámetros..
EJEMPLOS DE NOTICIAS CON PBD
APLICACIONES DE NOTICIAS
EJEMPLOS DE NOTICIAS CON PBD
APLICACIONES DE NOTICIAS
Publican la información en blogs
(http://soloopendata.blogspot.com.ar/)
EJEMPLOS DE NOTICIAS CON PBD
BLOGS DE DATOS
Se encuentran dentro de una sección de un medio digital
(http://www.lanacion.com.ar/data)
EJEMPLOS DE NOTICIAS CON PBD
CANALES DE DATOS
OPERACIONES QUE IMPLICA
EL PBD
•BÚSQUEDA•BÚSQUEDA
•EXTRACCIÓN
•PROCESAMIENTO y
•VISUALIZACIÓN de la
información…
OPERACIONES DEL PBD
BÚSQUEDA DE DATOS:
Puede ser realizada…
-mediante buscadores de la Web Invisible (Google Búsqueda Avanzada, Google
Scholar, Scielo, Wayback Machine, Socialmention, Twitterfall, etc.)
OPERACIONES DEL PBD
BÚSQUEDA DE DATOS:
Puede ser realizada…
-mediante buscadores internos de sitios web que almacenan bases de datos
(por ej. del sitio del Boletín Oficial del Gobierno de la Provincia de San Luis, del
Ministerio de Educación de San Luis, etc.)
OPERACIONES DEL PBD
EXTRACCIÓN o SCRAPING DE
DATOS:
Cuando los datos no son abiertos, es decir, no permiten la descarga y/o
copias de la información (por ej. se encuentran en un formato .pdf y no
.xls o .csv) se puede hacer uso de herramientas que nos permitan
acceder a los datos abiertos, antes de tener que producirla de forma
manual.
Las herramientas que se utilizan son:
- OCR
- ZAMZAR
- NITRO PDF,
- TABULA, etc.
EXTRACCIÓN MEDIANTE OCR
OPERACIONES DEL PBD
Posibilita
extraer
texto detexto de
una
imagen
…
EXTRACCIÓN MEDIANTE OCR
OPERACIONES DEL PBD
Puede utilizarse para extraer el texto de la primera página de un
documento y en la actualidad se está perfeccionando para convertir
hasta las primeras 10 páginas de un documento.
Permite extraer el
contenido textual y
gráfico de un
documento y el envío
de la conversión se
EXTRACCIÓN MEDIANTE ZAMZAR
OPERACIONES DEL PBD
de la conversión se
realiza por email.
Actualmente es uno
de los sitios en línea
gratuito cuyo proceso
de conversión
funciona.
EXTRACCIÓN MEDIANTE NITRO PDF
OPERACIONES DEL PBD
Funciona de modo similar a ZAMZAR, pero es gratuito durante un
período de prueba. Al finalizar el mismo, se debe comprar el software
para continuar su uso. Es muy completo y funciona muy bien.
Permite extraer textos
y gráficos, a través de
un programa gratuito
que se instala en la
computadora y realiza
el proceso de
EXTRACCIÓN MEDIANTE TABULA
OPERACIONES DEL PBD
el proceso de
extracción por partes.
Su uso es
independiente de la
conexión a Internet y
garantiza su
durabilidad en el
tiempo.
Implica la creación y/o procesamiento de los datos
a través de diversas herramientas:
PROCESAMIENTO
OPERACIONES DEL PBD
a través de diversas herramientas:
-Google Drive (gratuita y de rápido acceso)
-Socrata, Document Cloud y Junar (son de código
abierto o pagas, especializadas, profesionales, y
exigen condiciones antes de permitir el uso del
servicio).
PROCESAMIENTO CON DOCUMENT CLOUD
OPERACIONES DEL PBD
Es de código abierto y puede ser utilizada por periodistas u otro
usuario que realice PBD. Exige muestra de informes y permisos
para ser contribuyente. Tarda al menos dos semanas para la
otorgación de una cuenta.
PROCESAMIENTO CON SOCRATA Y JUNAR
OPERACIONES DEL PBD
Son utilizadas por importantes medios de comunicación del mundo que
abogan por el acceso abierto a los datos. Permiten la descarga de una
versión de demostración antes de decidirse pagar por el servicio. Son
muy completas, potentes y poseen ayuda y soporte en línea.
PROCESAMIENTO CON GOOGLE DRIVE
OPERACIONES DEL PBD
Es la aplicación que utilizaremos porque posibilita que el periodista
pueda, a través de una hoja de cálculo, administrar gran cantidad de
datos de forma gratuita y operar con ellos mediante diversos tipos de
fórmulas. Además, es de rápido acceso y permite la integración con
aplicaciones en línea que permiten su visualización de forma gráfica.
Requiere del análisis profundo de los datos para decidir no solo qué formulas usar,
sino también en qué casos hacerlo
(https://docs.google.com/spreadsheet/ccc?key=0AgX1zNUFm5hcdEVPNjY0cUpWV
GVQYl9jQ2pNQlUwc0E&usp=drive_web#gid=7)
PROCESAMIENTO EN GOOGLE DRIVE
OPERACIONES DEL PBD
Con los datos de una planilla pueden efectuarse diversos cálculos. Los más
comunes son:
A B C
1 2010 2011
2 Ecuador 372,163 409,125
3 El Salvador 2,918 3,574
4 Guatemala 1,738 1,959
MAX
Permite obtener el mayor valor de
un conjunto de datos.
PROCESAMIENTO EN GOOGLE DRIVE
OPERACIONES DEL PBD
4 Guatemala 1,738 1,959
5 Honduras 10,252 14,651
6 Nicaragua 4,415 6,246
7 Panamá 1,172 1,291
8 Paraguay 30,212 38,154
9 Perú 136,919 141,44
10
República
Dominicana 84,721 90,278
MÁXIMO VALOR 372,163 409,125
MÍNIMO VALOR
PROMEDIO
un conjunto de datos.
En su sintaxis pide que se coloque
el primer y último valor del rango de
datos separado por el símbolo “:”
=MAX (B2:B10)
=MAX (C2:C10)
A B C
1 2010 2011
2 Ecuador 372,163 409,125
3 El Salvador 2,918 3,574
4 Guatemala 1,738 1,959
MIN
Permite obtener el mínimo valor de
un conjunto de datos.
En su sintaxis pide que se coloque
PROCESAMIENTO EN GOOGLE DRIVE
OPERACIONES DEL PBD
4 Guatemala 1,738 1,959
5 Honduras 10,252 14,651
6 Nicaragua 4,415 6,246
7 Panamá 1,172 1,291
8 Paraguay 30,212 38,154
9 Perú 136,919 141,44
10
República
Dominicana 84,721 90,278
MÁXIMO VALOR 372,163 409,125
MÍNIMO VALOR 1,172 1,291
PROMEDIO
el primer y último valor del rango de
datos separado por el símbolo “:”
=MIN (B2:B10)
=MIN (C2:C10)
A B C
1 2010 2011
2 Ecuador 372,163 409,125
3 El Salvador 2,918 3,574
4 Guatemala 1,738 1,959
5 Honduras 10,252 14,651
PROMEDIO
Permite obtener el valor
promedio de un conjunto de
datos.
En su sintaxis pide que se
coloque el primer y último
PROCESAMIENTO EN GOOGLE DRIVE
OPERACIONES DEL PBD
5 Honduras 10,252 14,651
6 Nicaragua 4,415 6,246
7 Panamá 1,172 1,291
8 Paraguay 30,212 38,154
9 Perú 136,919 141,44
10
República
Dominicana 84,721 90,278
MÁXIMO VALOR 372,163 409,125
MÍNIMO VALOR 1,172 1,291
PROMEDIO 71,6122222 78,5242222
coloque el primer y último
valor del rango de datos
separado por el símbolo “:”
=AVERAGE (B2:B10)
=AVERAGE (C2:C10)
EXISTEN OTRAS FORMULAS QUE PODEMOS
APLICAR, ENTRE ELLAS:
PROCESAMIENTO EN GOOGLE DRIVE
OPERACIONES DEL PBD
APLICAR, ENTRE ELLAS:
- Mode (Moda): devuelve el valor que más se
repite dentro de un conjunto de datos.
- Median: devuelve el valor que deja el mismo
número de datos antes y después que él.
- Varianza: devuelve la dispersión entre datos,
etc.
Para el procesamiento de datos numéricos
en general existen además numerosas
PROCESAMIENTO
OPERACIONES DEL PBD
en general existen además numerosas
herramientas en línea, entre ellas:
- Calculadoras virtuales (comunes,
científicas, de porcentaje, etc.)
- Conversores de unidades (de área,
volumen, longitud, etc.)
PROCESAMIENTO CON CALCULADORAS
VIRTUALES
OPERACIONES DEL PBD
PROCESAMIENTO CON CONVERSORES
DE UNIDADES
OPERACIONES DEL PBD
Implica representar los datos en una
VISUALIZACIÓN
OPERACIONES DEL PBD
Implica representar los datos en una
forma gráfica que facilite su interpretación
por parte de los lectores.
Aquí se utilizan herramientas como
Tableau Public, Datawrapper y
Google Fusion Tables.
VISUALIZACIÓN CON TABLEU PUBLIC
OPERACIONES DEL PBD
Es complejo en su manejo porque requiere de un minucioso y
controlado proceso a la hora de subir los conjuntos de datos y
obtener su visualización. Su uso es gratuito.
VISUALIZACIÓN CON TABLEU PUBLIC
OPERACIONES DEL PBD
Otorga un código en Java Script que permite su inserción dentro de
un sitio web. Es importante tener instalado en la PC la última
versión de Java para que Tableu Public funcione adecuadamente.
VISUALIZACIÓN CON DATA WRAPPER
OPERACIONES DEL PBD
Es más sencillo y posee menores restricciones. Requiere registro al
igual que Tableau Public y brinda código de programación para su
inserción en sitios web.
VISUALIZACIÓN CON DATA WRAPPER
OPERACIONES DEL PBD
Al igual que en Tableau Public las planillas pueden ser generadas
en el mismo sitio o bien importadas en formato .xls o .csv
(estándares para los grandes volúmenes de datos).
VISUALIZACIÓN CON GOOGLE FUSION TABLES
OPERACIONES DEL PBD
Es la aplicación que utilizaremos pues aunque se encuentra aún en
fase de experimentación y no posee un proceso de trabajo sencillo,
es gratuita y permite la interacción con otras aplicaciones de Google,
como las planillas de cálculo creadas en Drive.
VISUALIZACIÓN CON GOOGLE FUSION TABLES
OPERACIONES DEL PBD
Al crear una nueva fusión de tablas, el programa nos solicita la hoja
de datos que podrá estar almacenada en la computadora, en línea, o
bien, deberá ser creada desde cero. En este caso particular los datos
ya se encuentran en línea (opción Spreadsheets).
VISUALIZACIÓN CON GOOGLE FUSION TABLES
OPERACIONES DEL PBD
Cuando los datos están en línea deben ser seleccionados y
posteriormente autorizados para poder dar inicio al proceso de
fusión de los datos.
VISUALIZACIÓN CON GOOGLE FUSION TABLES
OPERACIONES DEL PBD
Solo si los datos importados son correctos, se visualizarán
satisfactoriamente y se podrá continuar con el siguiente paso.
VISUALIZACIÓN CON GOOGLE FUSION TABLES
OPERACIONES DEL PBD
El título del gráfico, autor, enlaces relacionados (si posee) y
descripción son también importantes de definir previa generación de
la visualización.
VISUALIZACIÓN CON GOOGLE FUSION TABLES
OPERACIONES DEL PBD
Finalmente, la visualización admite diversas posibilidades: mapa,
gráficos, resumen, etc. Las más utilizadas son las dos primeras.
VISUALIZACIÓN CON GOOGLE FUSION TABLES
OPERACIONES DEL PBD
Visualización
mediante un
MAPAMAPA
VISUALIZACIÓN CON GOOGLE FUSION TABLES
OPERACIONES DEL PBD
Visualización
mediante un
gráfico de
COLUMNAS
(todos los(todos los
países en
todos los
años)
VISUALIZACIÓN CON GOOGLE FUSION TABLES
OPERACIONES DEL PBD
Visualización mediante un
gráfico CIRCULAR (todos los
países en un año en particular)
VISUALIZACIÓN CON GOOGLE FUSION TABLES
OPERACIONES DEL PBD
Visualización
mediante un gráfico
CARDS (útil para
pocos datos porque
permite concentrar enpermite concentrar en
una sola vista toda la
información de la que
se dispone )
VISUALIZACIÓN CON GOOGLE FUSION
TABLES
OPERACIONES DEL PBD
EMBEBER GRÁFICOS EN UN SITIO WEB
Posibilita insertar uno o más gráficos generados en la
aplicación Google Fusion Tables en un sitio web.
Para ello se debe:
• Hacer públicas la/s tabla/s generada/s en esta aplicación
(no se puede compartir lo que no está permitido)
• Obtener el código de inserción provisto por cada tipo de
gráfico (solo tiene sentido si la/s tabla/s son pública/s)…
VISUALIZACIÓN CON GOOGLE FUSION
TABLES
OPERACIONES DEL PBD
HACER PÚBLICAS LAS TABLAS EN DRIVE
Permite el posterior acceso a las mismas desde la Web…
VISUALIZACIÓN CON GOOGLE FUSION
TABLES
OPERACIONES DEL PBD
OBTENER EL CÓDIGO DE INSERCIÓN DE CADA GRÁFICO
Permite insertar un gráfico como parte de los contenidos de un
sitio ya existente…
FIN DE PRESENTACIÓN
Gracias por su atención…
Elaborado por Prof. Viviana M. Ponce
vmponce@unsl.edu.ar
Fac. de Cs. Humanas- UNSL

More Related Content

What's hot

Periodismo de Datos - Congreso Fopea 2014
Periodismo de Datos - Congreso Fopea 2014Periodismo de Datos - Congreso Fopea 2014
Periodismo de Datos - Congreso Fopea 2014
Elena Brizuela
 
Herramientas Digitales
Herramientas DigitalesHerramientas Digitales
Herramientas Digitales
Karen Vanessa
 

What's hot (18)

Clase 3 tecno i- periodismo 2015
Clase 3  tecno i- periodismo 2015Clase 3  tecno i- periodismo 2015
Clase 3 tecno i- periodismo 2015
 
Clase 2 tecno 1-2019
Clase 2 tecno 1-2019Clase 2 tecno 1-2019
Clase 2 tecno 1-2019
 
Clase 3 tecno i- periodismo 2016
Clase 3  tecno i- periodismo 2016Clase 3  tecno i- periodismo 2016
Clase 3 tecno i- periodismo 2016
 
Clase 2 tecno 1-2017
Clase 2 tecno 1-2017Clase 2 tecno 1-2017
Clase 2 tecno 1-2017
 
Eq1_Actividad12_Foro-Sladeshare
Eq1_Actividad12_Foro-SladeshareEq1_Actividad12_Foro-Sladeshare
Eq1_Actividad12_Foro-Sladeshare
 
Vigilancia 2.0
Vigilancia 2.0Vigilancia 2.0
Vigilancia 2.0
 
informe sobre motores de búsqueda y herramientas web
informe sobre motores de búsqueda y herramientas web informe sobre motores de búsqueda y herramientas web
informe sobre motores de búsqueda y herramientas web
 
Periodismo de Datos - Congreso Fopea 2014
Periodismo de Datos - Congreso Fopea 2014Periodismo de Datos - Congreso Fopea 2014
Periodismo de Datos - Congreso Fopea 2014
 
Web profunda
Web profundaWeb profunda
Web profunda
 
EJE TEMATICO 6
EJE TEMATICO 6EJE TEMATICO 6
EJE TEMATICO 6
 
Herramientas Digitales
Herramientas DigitalesHerramientas Digitales
Herramientas Digitales
 
Herramientas digitales para la cobertura periodística del desarrollo sostenible
Herramientas digitales para la cobertura periodística del desarrollo sostenibleHerramientas digitales para la cobertura periodística del desarrollo sostenible
Herramientas digitales para la cobertura periodística del desarrollo sostenible
 
Presentacion slideshare Buscadores Web
Presentacion slideshare Buscadores WebPresentacion slideshare Buscadores Web
Presentacion slideshare Buscadores Web
 
Clase1
Clase1Clase1
Clase1
 
Taller maracaibo
Taller maracaiboTaller maracaibo
Taller maracaibo
 
Servicios de Internet
Servicios de InternetServicios de Internet
Servicios de Internet
 
La web semántica
La web semánticaLa web semántica
La web semántica
 
WEB SEMANTICA
WEB SEMANTICAWEB SEMANTICA
WEB SEMANTICA
 

Similar to Clase 4 tecno i- periodismo 2015

Visualización de datos con Tableau Public - Comité de Investigación
Visualización de datos con Tableau Public - Comité de InvestigaciónVisualización de datos con Tableau Public - Comité de Investigación
Visualización de datos con Tableau Public - Comité de Investigación
IAB México
 
Tipo De Redes.Doc
Tipo De Redes.DocTipo De Redes.Doc
Tipo De Redes.Doc
sami222
 

Similar to Clase 4 tecno i- periodismo 2015 (20)

Clase 4 periodismo de base de datos
Clase 4  periodismo de base de datosClase 4  periodismo de base de datos
Clase 4 periodismo de base de datos
 
BigData
BigDataBigData
BigData
 
Visualización de datos con Tableau Public - Comité de Investigación
Visualización de datos con Tableau Public - Comité de InvestigaciónVisualización de datos con Tableau Public - Comité de Investigación
Visualización de datos con Tableau Public - Comité de Investigación
 
Tipo De Redes.Doc
Tipo De Redes.DocTipo De Redes.Doc
Tipo De Redes.Doc
 
Datos abiertos en el Ayuntamiento de Lorca
Datos abiertos en el Ayuntamiento de LorcaDatos abiertos en el Ayuntamiento de Lorca
Datos abiertos en el Ayuntamiento de Lorca
 
Presentación big data
Presentación big dataPresentación big data
Presentación big data
 
Webinario sobre Periodismo de Datos
Webinario sobre Periodismo de DatosWebinario sobre Periodismo de Datos
Webinario sobre Periodismo de Datos
 
Diseño de salida de un Sistema
Diseño de salida de un SistemaDiseño de salida de un Sistema
Diseño de salida de un Sistema
 
Fernando Marco - BI al servicio de las Instituciones
Fernando Marco - BI al servicio de las InstitucionesFernando Marco - BI al servicio de las Instituciones
Fernando Marco - BI al servicio de las Instituciones
 
big data
big  databig  data
big data
 
Cluster Multinodo en Apache Hadoop - Arquitectura Lambda
Cluster Multinodo en Apache Hadoop - Arquitectura LambdaCluster Multinodo en Apache Hadoop - Arquitectura Lambda
Cluster Multinodo en Apache Hadoop - Arquitectura Lambda
 
Base de Datos - Daniela Monsalve
Base de Datos - Daniela MonsalveBase de Datos - Daniela Monsalve
Base de Datos - Daniela Monsalve
 
Base de Datos
Base de DatosBase de Datos
Base de Datos
 
Introducción a BigData - up - 2015
Introducción a BigData - up - 2015Introducción a BigData - up - 2015
Introducción a BigData - up - 2015
 
Visualización de Big Data con Power View
Visualización de Big Data con Power ViewVisualización de Big Data con Power View
Visualización de Big Data con Power View
 
tutorial de informatica
tutorial  de informaticatutorial  de informatica
tutorial de informatica
 
Developing Stories for Data Analytics - Semana 2
Developing Stories for Data Analytics - Semana 2Developing Stories for Data Analytics - Semana 2
Developing Stories for Data Analytics - Semana 2
 
Introducción a arquitecturas y herramientas de Big Data.pdf
Introducción a arquitecturas y herramientas de Big Data.pdfIntroducción a arquitecturas y herramientas de Big Data.pdf
Introducción a arquitecturas y herramientas de Big Data.pdf
 
Herramientas open source BI
Herramientas open source BIHerramientas open source BI
Herramientas open source BI
 
tics
ticstics
tics
 

Recently uploaded

RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxRESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
pvtablets2023
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Fernando Solis
 

Recently uploaded (20)

Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
 
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxRESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
 
Abril 2024 - Maestra Jardinera Ediba.pdf
Abril 2024 -  Maestra Jardinera Ediba.pdfAbril 2024 -  Maestra Jardinera Ediba.pdf
Abril 2024 - Maestra Jardinera Ediba.pdf
 
Sesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronósticoSesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronóstico
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
 
Infografía EE con pie del 2023 (3)-1.pdf
Infografía EE con pie del 2023 (3)-1.pdfInfografía EE con pie del 2023 (3)-1.pdf
Infografía EE con pie del 2023 (3)-1.pdf
 
Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024
 
TIENDAS MASS MINIMARKET ESTUDIO DE MERCADO
TIENDAS MASS MINIMARKET ESTUDIO DE MERCADOTIENDAS MASS MINIMARKET ESTUDIO DE MERCADO
TIENDAS MASS MINIMARKET ESTUDIO DE MERCADO
 
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VSOCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
 
Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024
 
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIASISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
 
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
 
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptxCONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
 
Biografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfBiografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdf
 
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLAACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
 

Clase 4 tecno i- periodismo 2015

  • 1. TECNOLOGÍA DE LATECNOLOGÍA DE LA COMUNICACIÓN I Lic. en Periodismo Periodismo Universitario FCH-UNSL (Año 2015)
  • 2. CLASE IV “PERIODISMO DE BASE DE DATOS: BÚSQUEDA, EXTRACCIÓN, PROCESAMIENTO Y VISUALIZACIÓNPROCESAMIENTO Y VISUALIZACIÓN DE GRANDES VOLÚMENES DE INFORMACIÓN” CREATIVE COMMONS RECONOCIMIENTO-NOCOMERCIAL- COMPARTIRIGUAL 3.0 UNPORTED LICENSE
  • 3. ¿QUÉ ES EL PERIODISMO DE BASE DE DATOS (PBD)? Es una manera de crear o complementar noticias haciendo uso de los datos existentes en la WWW. Incluye el PI (periodismo de investigación) para revelar una verdad social desconocida; el PP (periodismo de precisión) cuando aplica métodos de la investigación social, el PA (periodismo analítico) porque analiza una realidad compleja para lograr la comprensión del público y el PAC (periodismo asistido porcompleja para lograr la comprensión del público y el PAC (periodismo asistido por computadora) para el análisis estadístico de los datos.
  • 4. EJEMPLOS DE NOTICIAS CON PBD ARTÍCULOS BASADOS EN DATOS Se desarrollan en base a información ya existente en la red. Son artículos de corta a mediana extensión (http://www.lanacion.com.ar/1484852-los-millones-de-la-ape- como-se-repartio-en-2011-la-caja-que-era-de-moyano)
  • 5. EJEMPLOS DE NOTICIAS CON PBD ARTÍCULOS BASADOS EN DATOS
  • 6. Al igual que en el caso anterior se basan en información ya existente en la red. EJEMPLOS DE NOTICIAS CON PBD VISUALIZACIONES INTERACTIVAS La diferencia radica en las noticias, en las que un título o descripción basta. (http://www.lanacio n.com.ar/1546303- los-bienes-de-los- funcionarios-en-la- primera-news- application-de-la- nscion)
  • 7. EJEMPLOS DE NOTICIAS CON PBD VISUALIZACIONES INTERACTIVAS
  • 8. Son recopilados por los propios periodistas debido a la ausencia de acceso abierto por parte de las organizaciones (http://data.lanacion.com.ar/dashboards/5068/inflacion-y-precios) EJEMPLOS DE NOTICIAS CON PBD CONJUNTO DE DATOS ABIERTOS
  • 9. Son desarrolladas por periodistas y programadores (http://gastopublicobahiense.org). Permiten agrupar y analizar variables mediante diversos parámetros.. EJEMPLOS DE NOTICIAS CON PBD APLICACIONES DE NOTICIAS
  • 10. EJEMPLOS DE NOTICIAS CON PBD APLICACIONES DE NOTICIAS
  • 11. Publican la información en blogs (http://soloopendata.blogspot.com.ar/) EJEMPLOS DE NOTICIAS CON PBD BLOGS DE DATOS
  • 12. Se encuentran dentro de una sección de un medio digital (http://www.lanacion.com.ar/data) EJEMPLOS DE NOTICIAS CON PBD CANALES DE DATOS
  • 13. OPERACIONES QUE IMPLICA EL PBD •BÚSQUEDA•BÚSQUEDA •EXTRACCIÓN •PROCESAMIENTO y •VISUALIZACIÓN de la información…
  • 14. OPERACIONES DEL PBD BÚSQUEDA DE DATOS: Puede ser realizada… -mediante buscadores de la Web Invisible (Google Búsqueda Avanzada, Google Scholar, Scielo, Wayback Machine, Socialmention, Twitterfall, etc.)
  • 15. OPERACIONES DEL PBD BÚSQUEDA DE DATOS: Puede ser realizada… -mediante buscadores internos de sitios web que almacenan bases de datos (por ej. del sitio del Boletín Oficial del Gobierno de la Provincia de San Luis, del Ministerio de Educación de San Luis, etc.)
  • 16. OPERACIONES DEL PBD EXTRACCIÓN o SCRAPING DE DATOS: Cuando los datos no son abiertos, es decir, no permiten la descarga y/o copias de la información (por ej. se encuentran en un formato .pdf y no .xls o .csv) se puede hacer uso de herramientas que nos permitan acceder a los datos abiertos, antes de tener que producirla de forma manual. Las herramientas que se utilizan son: - OCR - ZAMZAR - NITRO PDF, - TABULA, etc.
  • 17. EXTRACCIÓN MEDIANTE OCR OPERACIONES DEL PBD Posibilita extraer texto detexto de una imagen …
  • 18. EXTRACCIÓN MEDIANTE OCR OPERACIONES DEL PBD Puede utilizarse para extraer el texto de la primera página de un documento y en la actualidad se está perfeccionando para convertir hasta las primeras 10 páginas de un documento.
  • 19. Permite extraer el contenido textual y gráfico de un documento y el envío de la conversión se EXTRACCIÓN MEDIANTE ZAMZAR OPERACIONES DEL PBD de la conversión se realiza por email. Actualmente es uno de los sitios en línea gratuito cuyo proceso de conversión funciona.
  • 20. EXTRACCIÓN MEDIANTE NITRO PDF OPERACIONES DEL PBD Funciona de modo similar a ZAMZAR, pero es gratuito durante un período de prueba. Al finalizar el mismo, se debe comprar el software para continuar su uso. Es muy completo y funciona muy bien.
  • 21. Permite extraer textos y gráficos, a través de un programa gratuito que se instala en la computadora y realiza el proceso de EXTRACCIÓN MEDIANTE TABULA OPERACIONES DEL PBD el proceso de extracción por partes. Su uso es independiente de la conexión a Internet y garantiza su durabilidad en el tiempo.
  • 22. Implica la creación y/o procesamiento de los datos a través de diversas herramientas: PROCESAMIENTO OPERACIONES DEL PBD a través de diversas herramientas: -Google Drive (gratuita y de rápido acceso) -Socrata, Document Cloud y Junar (son de código abierto o pagas, especializadas, profesionales, y exigen condiciones antes de permitir el uso del servicio).
  • 23. PROCESAMIENTO CON DOCUMENT CLOUD OPERACIONES DEL PBD Es de código abierto y puede ser utilizada por periodistas u otro usuario que realice PBD. Exige muestra de informes y permisos para ser contribuyente. Tarda al menos dos semanas para la otorgación de una cuenta.
  • 24. PROCESAMIENTO CON SOCRATA Y JUNAR OPERACIONES DEL PBD Son utilizadas por importantes medios de comunicación del mundo que abogan por el acceso abierto a los datos. Permiten la descarga de una versión de demostración antes de decidirse pagar por el servicio. Son muy completas, potentes y poseen ayuda y soporte en línea.
  • 25. PROCESAMIENTO CON GOOGLE DRIVE OPERACIONES DEL PBD Es la aplicación que utilizaremos porque posibilita que el periodista pueda, a través de una hoja de cálculo, administrar gran cantidad de datos de forma gratuita y operar con ellos mediante diversos tipos de fórmulas. Además, es de rápido acceso y permite la integración con aplicaciones en línea que permiten su visualización de forma gráfica.
  • 26. Requiere del análisis profundo de los datos para decidir no solo qué formulas usar, sino también en qué casos hacerlo (https://docs.google.com/spreadsheet/ccc?key=0AgX1zNUFm5hcdEVPNjY0cUpWV GVQYl9jQ2pNQlUwc0E&usp=drive_web#gid=7) PROCESAMIENTO EN GOOGLE DRIVE OPERACIONES DEL PBD
  • 27. Con los datos de una planilla pueden efectuarse diversos cálculos. Los más comunes son: A B C 1 2010 2011 2 Ecuador 372,163 409,125 3 El Salvador 2,918 3,574 4 Guatemala 1,738 1,959 MAX Permite obtener el mayor valor de un conjunto de datos. PROCESAMIENTO EN GOOGLE DRIVE OPERACIONES DEL PBD 4 Guatemala 1,738 1,959 5 Honduras 10,252 14,651 6 Nicaragua 4,415 6,246 7 Panamá 1,172 1,291 8 Paraguay 30,212 38,154 9 Perú 136,919 141,44 10 República Dominicana 84,721 90,278 MÁXIMO VALOR 372,163 409,125 MÍNIMO VALOR PROMEDIO un conjunto de datos. En su sintaxis pide que se coloque el primer y último valor del rango de datos separado por el símbolo “:” =MAX (B2:B10) =MAX (C2:C10)
  • 28. A B C 1 2010 2011 2 Ecuador 372,163 409,125 3 El Salvador 2,918 3,574 4 Guatemala 1,738 1,959 MIN Permite obtener el mínimo valor de un conjunto de datos. En su sintaxis pide que se coloque PROCESAMIENTO EN GOOGLE DRIVE OPERACIONES DEL PBD 4 Guatemala 1,738 1,959 5 Honduras 10,252 14,651 6 Nicaragua 4,415 6,246 7 Panamá 1,172 1,291 8 Paraguay 30,212 38,154 9 Perú 136,919 141,44 10 República Dominicana 84,721 90,278 MÁXIMO VALOR 372,163 409,125 MÍNIMO VALOR 1,172 1,291 PROMEDIO el primer y último valor del rango de datos separado por el símbolo “:” =MIN (B2:B10) =MIN (C2:C10)
  • 29. A B C 1 2010 2011 2 Ecuador 372,163 409,125 3 El Salvador 2,918 3,574 4 Guatemala 1,738 1,959 5 Honduras 10,252 14,651 PROMEDIO Permite obtener el valor promedio de un conjunto de datos. En su sintaxis pide que se coloque el primer y último PROCESAMIENTO EN GOOGLE DRIVE OPERACIONES DEL PBD 5 Honduras 10,252 14,651 6 Nicaragua 4,415 6,246 7 Panamá 1,172 1,291 8 Paraguay 30,212 38,154 9 Perú 136,919 141,44 10 República Dominicana 84,721 90,278 MÁXIMO VALOR 372,163 409,125 MÍNIMO VALOR 1,172 1,291 PROMEDIO 71,6122222 78,5242222 coloque el primer y último valor del rango de datos separado por el símbolo “:” =AVERAGE (B2:B10) =AVERAGE (C2:C10)
  • 30. EXISTEN OTRAS FORMULAS QUE PODEMOS APLICAR, ENTRE ELLAS: PROCESAMIENTO EN GOOGLE DRIVE OPERACIONES DEL PBD APLICAR, ENTRE ELLAS: - Mode (Moda): devuelve el valor que más se repite dentro de un conjunto de datos. - Median: devuelve el valor que deja el mismo número de datos antes y después que él. - Varianza: devuelve la dispersión entre datos, etc.
  • 31. Para el procesamiento de datos numéricos en general existen además numerosas PROCESAMIENTO OPERACIONES DEL PBD en general existen además numerosas herramientas en línea, entre ellas: - Calculadoras virtuales (comunes, científicas, de porcentaje, etc.) - Conversores de unidades (de área, volumen, longitud, etc.)
  • 33. PROCESAMIENTO CON CONVERSORES DE UNIDADES OPERACIONES DEL PBD
  • 34. Implica representar los datos en una VISUALIZACIÓN OPERACIONES DEL PBD Implica representar los datos en una forma gráfica que facilite su interpretación por parte de los lectores. Aquí se utilizan herramientas como Tableau Public, Datawrapper y Google Fusion Tables.
  • 35. VISUALIZACIÓN CON TABLEU PUBLIC OPERACIONES DEL PBD Es complejo en su manejo porque requiere de un minucioso y controlado proceso a la hora de subir los conjuntos de datos y obtener su visualización. Su uso es gratuito.
  • 36. VISUALIZACIÓN CON TABLEU PUBLIC OPERACIONES DEL PBD Otorga un código en Java Script que permite su inserción dentro de un sitio web. Es importante tener instalado en la PC la última versión de Java para que Tableu Public funcione adecuadamente.
  • 37. VISUALIZACIÓN CON DATA WRAPPER OPERACIONES DEL PBD Es más sencillo y posee menores restricciones. Requiere registro al igual que Tableau Public y brinda código de programación para su inserción en sitios web.
  • 38. VISUALIZACIÓN CON DATA WRAPPER OPERACIONES DEL PBD Al igual que en Tableau Public las planillas pueden ser generadas en el mismo sitio o bien importadas en formato .xls o .csv (estándares para los grandes volúmenes de datos).
  • 39. VISUALIZACIÓN CON GOOGLE FUSION TABLES OPERACIONES DEL PBD Es la aplicación que utilizaremos pues aunque se encuentra aún en fase de experimentación y no posee un proceso de trabajo sencillo, es gratuita y permite la interacción con otras aplicaciones de Google, como las planillas de cálculo creadas en Drive.
  • 40. VISUALIZACIÓN CON GOOGLE FUSION TABLES OPERACIONES DEL PBD Al crear una nueva fusión de tablas, el programa nos solicita la hoja de datos que podrá estar almacenada en la computadora, en línea, o bien, deberá ser creada desde cero. En este caso particular los datos ya se encuentran en línea (opción Spreadsheets).
  • 41. VISUALIZACIÓN CON GOOGLE FUSION TABLES OPERACIONES DEL PBD Cuando los datos están en línea deben ser seleccionados y posteriormente autorizados para poder dar inicio al proceso de fusión de los datos.
  • 42. VISUALIZACIÓN CON GOOGLE FUSION TABLES OPERACIONES DEL PBD Solo si los datos importados son correctos, se visualizarán satisfactoriamente y se podrá continuar con el siguiente paso.
  • 43. VISUALIZACIÓN CON GOOGLE FUSION TABLES OPERACIONES DEL PBD El título del gráfico, autor, enlaces relacionados (si posee) y descripción son también importantes de definir previa generación de la visualización.
  • 44. VISUALIZACIÓN CON GOOGLE FUSION TABLES OPERACIONES DEL PBD Finalmente, la visualización admite diversas posibilidades: mapa, gráficos, resumen, etc. Las más utilizadas son las dos primeras.
  • 45. VISUALIZACIÓN CON GOOGLE FUSION TABLES OPERACIONES DEL PBD Visualización mediante un MAPAMAPA
  • 46. VISUALIZACIÓN CON GOOGLE FUSION TABLES OPERACIONES DEL PBD Visualización mediante un gráfico de COLUMNAS (todos los(todos los países en todos los años)
  • 47. VISUALIZACIÓN CON GOOGLE FUSION TABLES OPERACIONES DEL PBD Visualización mediante un gráfico CIRCULAR (todos los países en un año en particular)
  • 48. VISUALIZACIÓN CON GOOGLE FUSION TABLES OPERACIONES DEL PBD Visualización mediante un gráfico CARDS (útil para pocos datos porque permite concentrar enpermite concentrar en una sola vista toda la información de la que se dispone )
  • 49. VISUALIZACIÓN CON GOOGLE FUSION TABLES OPERACIONES DEL PBD EMBEBER GRÁFICOS EN UN SITIO WEB Posibilita insertar uno o más gráficos generados en la aplicación Google Fusion Tables en un sitio web. Para ello se debe: • Hacer públicas la/s tabla/s generada/s en esta aplicación (no se puede compartir lo que no está permitido) • Obtener el código de inserción provisto por cada tipo de gráfico (solo tiene sentido si la/s tabla/s son pública/s)…
  • 50. VISUALIZACIÓN CON GOOGLE FUSION TABLES OPERACIONES DEL PBD HACER PÚBLICAS LAS TABLAS EN DRIVE Permite el posterior acceso a las mismas desde la Web…
  • 51. VISUALIZACIÓN CON GOOGLE FUSION TABLES OPERACIONES DEL PBD OBTENER EL CÓDIGO DE INSERCIÓN DE CADA GRÁFICO Permite insertar un gráfico como parte de los contenidos de un sitio ya existente…
  • 52. FIN DE PRESENTACIÓN Gracias por su atención… Elaborado por Prof. Viviana M. Ponce vmponce@unsl.edu.ar Fac. de Cs. Humanas- UNSL