Análisis de contenido cuantitativo
Análise de conteúdo quantitativa
1. Teoría.
2. Ejemplo de un Trabajo Científico.
3. Práctica 1.
4. Práctica 2. Análisis Bibliométrico de
un área
Rafael Repiso rafael.repiso@gmail.com
Universidad Internacional de la Rioja
Rafael Repiso
- Profesor de la Universidad Internacional de la Rioja.
- Socio de la Spin Off EC3metrics. Universidad de Granada.
- Doctorando de la Universidad de Huelva (segunda tesis)
rafael.repiso@gmail.com
• Google Profile: https://scholar.google.com/citations?user=IEfRsHkAAAAJ&hl=es
• Slideshare: http://es.slideshare.net/rrepiso
Archivos de soporte del curso:
https://goo.gl/NjZRtq
Archivo en Figshare https://figshare.com/articles/Datos_trabajo_REDC/3033880
Formación en métodos de investigación
Social en Comunicación
Técnicas que elaboran y registran
datos a partir de situaciones
espontáneas
Técnicas que elaboran y registran
datos a partir de situaciones
artificiales
Técnicas de
observación
Técnicas de análisis
de documentos Conversaciones Encuestas
Experimentos
Experimentos
objetivos
Experimentos
grupales
Experimentos subjetivos y
proyectivos
Auto-observación
Observación sistemática
Observación participante
Catalogación, archivo,
documentación, bibliometría
Análisis de contenido
Entrevistas
Grupos de discusión
Delphi / discusión por
escrito
Cara a cara
Postal
Telefónica
Internet
Sociométrica
Test psicotécnicos
Esquema Piñuel Reigada (2002)
(modificado)
O que é um documento?
Un documento es cualquier soporte físico que contenga
información, principalmente experiencia humana. ´Podemos
clasificar los documentos según el tipo de soporte (blando o
duro), según tipo de registros (visuales, sonoros, audiovisuales,
y táctiles) o según el origen de la información (primario,
secundario o terciario).
Disciplinas auxiliares que estudam os documentos:
Biblioteconomia
Codicologia
Arquivística
Paleografia / epigrafia
Computação
Documentação
O que é um documento?
Documento principal: Documentos produzidos primeira consequência de uma
ação, seja por registro do mesmo ou a criação de documentos de derivativos,
relatórios, memórias, cartas, artigos, conjunto de dados. Orignal, finalmente,
fornecer informações de seus autores.
Documento secundário: Eles são o resultado da execução de tratamentos
externos para documentos primários, por exemplo, um resumo, os
comentários anotados ou qualquer processo que altera o original informativa.
Documento terciário: documentos terciários são o resultado da execução de
tratamentos informativos para documentos secundários, tais como
enciclopédias.
Tipos de documento
- O pesquisador não tem que desafiar a sociedade para
encontrar informações, mas isso está registrado em um
documento. Objetividad.
- Não sendo preconceitos reativas processos inquisitoriais são
perdidos, no entanto, permanece influenciar o processo de
interpretar informações e documentos viés em si (exceto
quando registros).
- O documentário é sempre uma técnica de análise
retrospectiva, que depende do estudo dos documentos
criados anteriormente, por isso é uma boa reflexão / registo
de uma situação passada.
Benefícios do Uso de Documentos
Tipos de Documentos Sociales
Personales
Autobiografías
Diarios
Cartas
Testimonios Orales
Institucionales Prensa y Medios
Material Judicial
Documentos Políticos
Material Administrativo
Huellas Físicas
Como estudar os documentos?
Objeto de
Estudio
Os documentos têm duas dimensões:
- Gravação informações (testemunhas).
- Soporte de mensajes. -> Análisis de Contenido
Características de emisor. ¿Quién es? ¿Cómo es? Cuando hay varios
emisores ¿hay agrupaciones de emisores?
Qué se intenta decir. Definir Cuál es el tema central, cuales son los
subtemas.
A quién va dirigido el mensaje. Quién es el receptor o quiénes son los
posibles receptores.
Cuál es el mensaje manifiesto y cual el mensaje latente o implícito
Con qué resultado
"A análise de conteúdo é uma técnica de pesquisa para a descrição
objetiva, sistemática e quantitativa do conteúdo manifesto da
comunicação." Samuel Berelson. 1952
"Qualquer técnica de pesquisa que serve para fazer inferências pela
identificação sistemática e objetiva de características específicas dentro
de um texto." Holsti, Ole de 1969.
"A análise de conteúdo é uma técnica de pesquisa [que usa um
conjunto de procedimentos] para fazer inferências reprodutíveis e
válidos a partir de um texto (contexto de dados do mesmo)".
Krippendorff de 1980.
Definições. Análise de Conteúdo.
Análise de conteúdo é usado para fins descritivos
(principalmente) ou uma ordem inferencial
Conclusão:
El Origen, en los medios…
Tres etapas
1. Fase Inicial:
1915-1940. Primeros análisis de Propaganda y Publicidad.
Dos Guerras Mundiales
1940- 1950. Sistematización de las reglas
2. Fase Metodológica / Epistemológica 1950-1960
3. Fase Tecnológica. 1960-
El Origen, en los medios…
Passo 1. Propaganda e manipulação em tempo de guerra
1. Los estudios de análisis de contenido aplicado a
los medios comenzaron a desarrollarse en
Europa Central y Gran Bretaña tímidamente. Su
objetivo era medir la efectividad de los mensajes,
en prensa y en cine (Europa Central y Gran
Bretaña). Hay que decir que en EE.UU se
desarrollan inmediatamente después en mayor
número y calidad.
2. La aparición en 1927 del libro de Laswell
“Propaganda Technique in the World War”
marca un antes y un después, basado en
información recopilada en la I Guerra Mundial,
tiene una gran influencia en la II Guerra Mundial
Etapa 1.
El análisis de Contenido aplicado
Análisis de la prensa:
• Localización de los temas favorables al enemigo, y contextualización del conjunto
• Comparación de contenidos entre diarios sospechosos y diarios ejemplares
• Comparación de contenidos entre diarios sospechosos y las emisiones nazis
• Análisis lexicológicos a través de palabras sospechosas
Creación de Contenidos, propaganda.
• Películas
• Comics (Payne Fund Studies)
• Carteles
• Noticias
Etapa 1.
Se unen dos hechos clave:
1. Dos Guerras Mundiales.
2. Creación y expansión de los medios de masas.
A esta teoría se le llamó posteriormente cuando se
analizaron los efectos que los medios habían tenido en las
poblaciones afectadas durante los conflictos
La teoría plantea que la manipulación es posible ya que frente al enorme y
creciente poder de los medios, no hay ningún elemento de resistencia; el mensaje
se dirigirá por los medios de comunicación de masas, a partir de ahí, es posible
crear un estímulo, un mensaje tan fuerte que se “inyecte dentro de la piel de cada
miembro de la sociedad” (de ahí el nombre “aguja hipodérmica”). Entre emisor y
receptor, entre estímulo y respuesta no hay ninguna intermediación que impida
conseguir los objetivos, hay una relación directa de causa-efecto, algo mecánico.
Teoria agulha hipodérmica
Passo 2. Metodologia Conceituação
Los mayores desarrollos de la técnica del Análisis de Contenido, a partir de la
codificación manual, corresponde a las décadas de 1950 y 1960, cabiendo
distinguir aquí los trabajos Ithiel de Sola Pool. También hay que destacar los
trabajos de Lasswell , y los de Holsti.
• Berelson, Bernard (1952). Content Analysis in Communications
Research. New York: The Free Press
• Holsti, O.(1969). Content Analysis for the Social Science and
Humanities. Reading: Addison Weslet.
• Lasswell, Harold et al. (1965). Language of Politics: Studies in
Quantitative Semantics. Cambridge: MIR Press.
• Pool, I de Sola (1959). Trends in Content Analysis. Urbana Illinois.
University of Illinois.
• George, A.
Passo 3. Técnicas de automação 1960-
Los últimos desarrollos tienen que ver con la aplicación de los computadores al
análisis de contenido, con el consiguiente desarrollo de la codificación electrónica
automatizada. Los recientes desarrollos esta relacionado con la utilización de
programas especializados tales como el ETHNOGRAPH o Atlas TI para el análisis
del contenido de mensajes.
Simple Concordance
Program
Estudo de caso
Como os jornais espanhóis estão posicionados em notícias da
Igreja Católica.
O Dia Mundial da Juventude em Madrid. 2011: cabeçalhos de
escalonamento multidimensional através do uso de termos
negativos
Paso 1. Selección de Datos
Paso 2. Importación de los Datos a una hoja de Éxcel
Paso 3. Normalización y Procesado de Datos
Paso 4. Análisis Descriptivo de Datos
Paso 5. Análisis Multivariante de Datos
Fase 0. La inspiración
La inspiración existe, pero tiene que encontrarte trabajando.
Fase 0. La inspiración
Tema polémico, lo que había generado
una alta polarización de los medios (a
favor, en contra, etc.).
Mi hipótesis original es que
probablemente había habido una
cobertura desigual, número de noticias,
tamaño de las noticias, posición de las
noticias, enfoque de las noticias…
La pregunta era. ¿Me puedo descargar
todas las noticias de prensa de forma
rápida?
Paso 1. Selección de Datos
¿De dónde extraigo los datos?
Muestra 1. Hemeroteca de cabeceras más importantes.
Muestra 2. Periódicos de la base de datos Lexis Nexis
Muestra 3. Periódicos de la base de datos MyNews Online
Muestra 4. Noticias Digitales de las cabeceras digitales
Paso 1. Selección de Datos
Éstrategia de Búsqueda:
Busco noticias que contengan los términos= JMJ o “Jornada
Mundial de la Juventud”
En cualquier medio indexado por la base de datos My News
Online, los días 15-22 de Agosto de 2011.
RESULTADO más de 10,000 noticias…
Hay un problema la base de datos sólo me ofrece las 600 primeras
Búsqueda por medios…
Paso 1. Selección de Datos
TÍTULO
MEDIO FECHA CATEGORIAS
CÓDIGO RARO
ARTÍCULO
Paso 2. Importación de los Datos
a una hoja de Éxcel
Importación de datos mediante una Macro hecha con el programa WORD
Datamining aka Minería de Datos
Paso 3. Normalización y Procesado de Datos
- Eliminación de noticias duplicadas
- Eliminación de noticias erróneas
- Normalización de nombres y títulos
• Periódico El País EL País
• Dierio El Mundo El Mundo
• El Mundo Se queda igual…
Paso 4. Análisis Descriptivo de Datos
BUENO YA TENEMOS LA MADERA (LOS MATERIALES PRIMARIOS)
AHORA DEBEMOS PENSAR ¿QUÉ HERRAMIENTAS TENEMOS PARA
TRABAJAR CON MADERA? ¿CON LA MADERA Y CON LAS
HERRAMIENTAS QUE POSEEMOS, QUÉ TIPO DE PRODUCTO SOMOS
CAPACES DE HACER?
Mis Metodologías de Investigación
- Estadística Descriptiva
- Estadística Multivariante
- Bibliometría
- Análisis de Redes Sociales
Paso 4. Análisis Descriptivo de Datos
Lo primero que se descubre cuando se analizan grandes cantidades de datos
son aquellos errores debido a una mala estandarización
El País/El Pais (por una tilde de menos el pc entiende que son dos periódicos
diferentes.
DETECTAR TODOS LOS FALLOS
Y VOLVER A NORMALIZAR
Paso 4. Análisis Descriptivo de Datos
¿Qué datos tengo? Vamos a hacer la Descriptiva…
Fecha
Cabeceras (Diferencio regionales, nacionales..)
Títulos - Conteo de Palabras (Análisis de Contenido)
Cuerpo – Conteo de Palabras (Análisis de Contenido)
450
571 587
720
692
599
634
606
0
100
200
300
400
500
600
700
800
15 Aug 16 Aug 17 Aug 18 Aug 19 Aug 20 Aug 21 Aug 22 Aug
Rk. Periódicos Noticias
1 La Razon 283
2 ABC 232
3 El Mundo 189
4 Gaceta Negocios 175
5 Estrelladigital.es 82
6 La Verdad Murcia 76
7 Diario EL PAIS, S.A. 74
8 Ideal 68
9 La Voz de Cadiz 65
10 La Rioja 59
11 La Voz Galicia 58
12 El Norte de Castilla 2
13 Público 55
14 Diario Sur 54
15 El Progreso 53
16 El Diario Montañés 52
17 Ultima Hora 51
18 El Correo 50
19 Diario de Las Palmas 49
20 El Diario de Sevilla 49
Títulos - Conteo de Palabras (Análisis de Contenido)
Cuerpo de la noticia – Conteo de Palabras (Análisis de Contenido)
Rank. Palabra Freq.
1MADRID 1920
2JMJ 1870
3PAPA 1796
4JÓVENES 1028
5JUVENTUD 971
6JORNADA 964
7XVI 948
8PEREGRINOS 897
9BENEDICTO 861
10MUNDIAL 857
11AYER 772
12ESPAÑA 525
13VISITA 517
14CUATRO 457
15MUNDO 367
16VIENTOS 337
17MILES 303
18FE 284
19SOL 281
20IGLESIA 274
Uso de un programa de Análisis de Léxico (Simple Concordance Program en este caso)
Y de repente…
Paso 4. Análisis Descriptivo de Datos
Paso 5. Análisis Multivariante
Voy a analizar el uso de los términos relacionados con los
eventos negativos del acto porque:
a) Depende del posicionamiento de cada medio, utilizarán unos u otros para
referirse a los sucesos negativos
Manifestante o indignado
a) Depende del posicionamiento de cada medio, dará mayor cobertura a las
noticias relacionadas con eventos negativos
Paso 5. Análisis Multivariante
Utilizando el programa de análisis de palabras,
localizamos los términos negativos más usados:
Laica Policía Manifestantes Indignados Detenido
Laicos Anti Incidentes Tensión Ateos
Paso 5. Análisis Multivariante
Nos planteamos realizar un Escalamiento Multidimensional
Fase 1. Crear Matriz de Similitud (condición indispensable)
Fase 2. Crear Escalamiento Multidimensional
Utilizamos el Programa XLSTAT
Paso 5. Análisis Multivariante
La Razon ABC El Mundo
Gaceta
Negocios
estrelladigit
al.es
La Verdad
Murcia
Diario EL
PAIS, S.A.
Ideal
La Razon 1 0,897 0,892 0,824 -0,124 0,695 0,010 0,318
ABC 0,897 1 0,725 0,704 0,024 0,540 0,230 0,037
El Mundo 0,892 0,725 1 0,615 -0,090 0,845 -0,019 0,529
Gaceta Negocios 0,824 0,704 0,615 1 -0,061 0,639 0,019 0,262
estrelladigital.es -0,124 0,024 -0,090 -0,061 1 0,210 0,899 0,000
La Verdad
Murcia
0,695 0,540 0,845 0,639 0,210 1 0,191 0,503
Diario EL PAIS,
S.A.
0,010 0,230 -0,019 0,019 0,899 0,191 1 -0,283
Ideal 0,318 0,037 0,529 0,262 0,000 0,503 -0,283 1
Matriz de Similitud (Coeficiente de Pearson)
Paso 5. Análisis Multivariante
Escalamiento Multidimensional
La Razon
ABC
El Mundo
Gaceta Negocios
estrelladigital.es
La Verdad Murcia
Diario EL PAIS, S.A.
Ideal
La Voz de Cadiz
La Rioja
La Voz Galicia
El Norte de Castilla
Público
Diario Sur
El Progreso
El Diario Montañés
Ultima Hora
El Correo
Diario de Las Palmas
El Diario de Sevilla EFE
Europa Press
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 1.2
Dim2
Dim1
50
E agora que? Escrever artigo
• Decidir con qué Resultados me quedo y redactarlo
• Escribir las Conclusiones
• Antes de que se me olvide, escribir en Material y Métodos cómo lo he hecho
• Escribir la Introducción Necesito un socio Francisco García García
• Ponerle un nombre al artículo y enviarlo
Congreso Bedfordshire (UK)
Publicación en
Estudios Sobre el Mensaje
Repiso, R., Rodríguez-Pinto, M. Á., & García, F. (2013). Posicionamiento y agrupación de la
prensa española: Análisis de contenido de las noticias generadas en la Jornada Mundial
de la Juventud 2011. Estudios sobre el Mensaje Periodístico, 19(2), 1091-1106.
1. Búsqueda y captura de noticias en prensa
+ Descargar datos de Figshare.
2. Normalización de datos.
+ E
3. Análisis de datos:
- Estadística Descriptiva. Por universidades públicas y privadas
- Matriz de similitud. Coeficiente del Coseno. (XLSTAT
Software)
- Red Social de Universidades.
+TXT2pajek
+ Pajek
Práctica
Similitud entre Universidades Españolas
Presencia en Prensa
3. Análisis de datos:
- Estadística Descriptiva.
-Noticias Universidades
-Descripción por titularidad
- Matriz de similitud
-Coeficiente del Coseno.
-Red Social de Universidades.
- Conversión de datos a Pajek. TXT2PAJEK
- Apertura en Pajek. PATHFINDER. (XLSTAT
Software)
(Network / Create New Network / Transform / Reduction / Pathfinder*).
Análisis de contenido cuantitativo
Análise de conteúdo quantitativa
1. Teoría.
2. Ejemplo de un Trabajo Científico.
3. Práctica 1.
Rafael Repiso rafael.repiso@gmail.com
Universidad Internacional de la Rioja