1. Análisis de Información en el
Proceso de Investigación:
Elementos Básicos.
Gerly Carolina Ariza Zabala
Jorge Andrick Parra Valencia
Grupo de Investigación en Pensamiento Sistémico
UNAB
gariza@unab.edu.co
2. Participación de la Comunidad
• ¿Qué tipo de análisis de información o análisis
de datos utiliza en sus investigaciones?
• ¿Por qué utiliza dicho tipo de análisis?
• ¿Qué le aportan dichos análisis a la
investigación?
3. ¿Qué entendemos por análisis de
información?
Depende del enfoque y del tipo de investigación
que se haya seleccionado, como también de los
objetivos planteados.
4. ¿Qué es un dato?
Interacciones,
situaciones,
fenómenos u
objetos de la
realidad estudiada
útiles para el logro
de los objetivos.
7. Propósito del Análisis de Información
Dar sentido a la información obtenida
Tratar la información estadísticamente
Organizar la información
Reducir los datos
Describir, interpretar, explicar un fenómeno
Estudiar las relaciones de los problemas
8. Análisis Cualitativo
1. Preparación y
descripción del
material bruto
documental
completa y
fácilmente accesible
2. Reducción
de los datos
3. Elección y
aplicación de
los métodos
de análisis
4. Análisis
transversal de
los casos
estudiados (si
hubiera más de
uno)
9. Análisis Cuantitativo
1. Seleccionar el
programa
estadístico
2. Ejecutar el
programa
3. Analizar y
visualizar los datos
por variable
4. Realizar análisis
adicionales
5. Analizar
hipótesis
6. Evaluar
confiabilidad
7. Presentación de
tablas, gráficas,
etc.
10. Factores de Análisis de los Datos
La estadística no es un fin en sí misma, sino una
herramienta para evaluar datos
El análisis
descriptivo
final es sobre
las variables
del estudio.
1. Nivel de
medición de
la variable
2. Como se
formularon
las hipótesis u
objetivos
3. Interés del
investigador
11. La estadística se constituye en una herramienta fundamental para el análisis de la
información.
Es necesario precisar y seleccionar el tratamiento estadístico dependiendo del
enfoque cuantitativo o cualitativo, de la escala de medición de las variables, de las
hipótesis y de los objetivos.
La estadística es fundamental para resolver problemas de descripción de datos,
análisis de muestras, contrastación de hipótesis, medición de relaciones y
predicciones.
Proporciona una metodología para evaluar y juzgar las discrepancias entre la
realidad y la téoría
Permite entender las posibilidades y limitaciones de la investigación experimental, para
diferenciar las conclusiones que pueden obtenerse de los datos de aquellas que carecen
de base empírica y en definitiva para desarrollar un pensamiento crítico y ante la realidad.
14. Estadística Descriptiva
Permite describir
resumir y analizar la
información
obtenida de la
muestra.
Para tal fin se
recolecta la
información, se
tabula, se grafica.
Se destacan tres
tipos de medidas de
tendencia central,
medidas de
dispersión o
variabilidad de los
datos y medidas de
ubicación.
16. Descripción de datos
Podríamos suponer que queremos ver cuántos productores agrícolas en una vereda
son grandes, medianos o pequeños productores.
Entrevistamos a los productores de la vereda y les preguntamos la extensión de su
explotación y la clasificamos de acuerdo con el tamaño (magnitud) en una de las
tres categorías.
Ejemplo: distribución de frecuencias.
17. Distribución de frecuencias
Los datos cualitativos, denominados también
atributos, son todos aquellos fenómenos que
pueden ser descritos cualitativamente, es decir
mediante palabras; son ejemplos de atributos: la
clasificación de los alumnos de una universidad por
departamento de origen, clasificación de un grupo
de personas por ocupación, por sexo, por cargo,
etc.
Los caracteres cuantitativos, denominados
variables, son todos aquellos fenómenos
susceptibles de ser expresados cuantitativamente,
es decir mediante números. Por ejemplo: peso,
estatura, edad, número de hijos, salarios, etc.
Es un método para organizar y resumir datos. Bajo este método los
datos que componen una serie, se clasifican y ordenan, indicándose el
número de veces en que se repite cada valor.
19. Medidas de Tendencia Central
Son valores medios o centrales de una distribución que sirve para ubicarla
dentro de la escala de medición. El nivel de medición de la variable
determina cual es la medida de tendencia central apropiada.
• Se define como el
valor que
presenta la mayor
frecuencia. Se usa
con mediciones
de escala nominal,
ordinal, de
intervalo o de
razón
MODA
• Se usa en variables
medidas en escala
ordinal, intervalo o
de razón. Su
mayor uso es
cuando se tienen
muchas
observaciones.
MEDIANA
• Es el promedio
aritmético de una
distribución y es la
medida de
tendencia central
más utilizada. Es la
suma de todos los
valores dividida
entre el número
de casos.
MEDIA
20. Medidas de la Variabilidad
Son intervalos que indican la dispersión de los datos en la escala
de medición, las medidas de variabilidad más utilizadas son
rango, desviación estándar y varianza.
• Rango= extensión total de los datos
• Desviación estándar= promedio de desviación de las
puntuaciones con respecto a la media
• Varianza = Desviación estándar elevada al cuadrado y se
utiliza en análisis inferenciales
21. Razones y Tasas
• Una razón es la relación entre
dos categorías por ejemplo:
Categorías Frecuencia
masculino 60
femenino 30
La razón de hombres a mujeres
es de 60/30 = 2 es decir que
por cada dos hombres hay
una mujer.
• Tasa es la relación entre el
número de casos de una
categoría y el número total
de observaciones
multiplicada por un múltiplo
de l0, 100 o 1,000
Tasa= Número de eventos durante
un periodo/ número total de
eventos posibles x 100 o 1000
22. Análisis de Información en el
proceso de Investigación: Elementos
Básicos
Gerly Carolina Ariza Zabala
Jorge Andrick Parra Valencia
Grupo de Investigación en Pensamiento Sistémico
UNAB
gariza@unab.edu.co
23. Distribución obtenida al estudiar los
puntajes obtenidos por 50 estudiantes
como calificación en un curso de física.
El intervalo que contiene el mayor
número de casos, o mayor frecuencia
es 42 - 44.
Este intervalo contiene los puntajes 42,
43 y 44. El valor medio del intervalo es,
por lo tanto, 43 y lo denominamos
como la moda.
Ejemplo
de Moda
24. ¿Hasta Aquí Llegamos?
Cuando el estudio tiene una finalidad puramente
exploratoria o descriptiva todo lo anterior se puede
utilizar para hacer el análisis y debemos comenzar a
preparar el reporte de la investigación.
25. Así, en la siguiente distribución de notas:
78,95,86,73,52,90,89,84,76,92
El valor de la mediana es 85, porque, primero al ordenar la distribución de
menor a mayor así:
52,73,76,78,84,86,89,90,92,95
Siendo 10 el total de notas, las que aparecen en la posición quinta y sexta
están en la mitad de la distribución, entonces la mediana será:
84+86 =85
Cuando se tiene información agrupada, la mediana se define como el valor
dentro del intervalo que divide la distribución en dos partes iguales.
Ejemplo de
Mediana
26. X
A
= 79.5 X
B
= 79.7
La media aritmética de ambas series es
prácticamente igual (79.5 en el grupo A y
79.7 en el grupo B).
Un análisis de las cifras individuales revelan
un gran contraste.
En el grupo A hubo muy poca variación
entre las notas, siendo la más alta 83 y la más
baja 75.
En el grupo B, se nota mayor variación, en
este grupo la mayor nota fue 97 y la menor
71.
Como conclusión se podría decir que en el
grupo B hubo notas muy altas y muy bajas.
En el grupo A las notas tuvieron una mayor
concentración alrededor del promedio.
Ejemplo
de Media
27. •Se procede a la interpretación de los
datos utilizando tres posibles métodos
de análisis para detectar “patrones” a
partir de los datos previamente
organizados
• Emparejamiento (compara una
configuración teórica predicha con
una configuración empírica
observada)
• Iterativo (Abordaje de los datos con
mínima formalización teórica y
construcción progresiva de una
explicación.
• Histórico (Consiste en formular
predicciones sobre la evolución en el
tiempo)
3. Elección y aplicación
de los métodos de
análisis
• Apunta esencialmente a verificar si
hay replica de resultados entre
varios casos o situaciones.
• Se agrega a las etapas precedentes
cuando los datos cualitativos
recolectados se refieren a varios
casos del fenómeno (organizaciones,
situaciones, individuos...)
• Procede por comparación dónde
cada situación es analizada de
acuerdo al o los modos de análisis
descritos precedentemente, de
manera de captar si los modelos o
patrones observados se reproducen.
4. Análisis Transversal
28. •Consiste en preparar la base
documental completa y fácilmente
accesible.
•La información debe ser detectable
(saber que existe) ubicable (dónde
se encuentra) y trazable (dónde y
como se obtuvo, cuales son sus
fuentes). Existe software que facilita
algo esta tarea
•La información suele ser
voluminosa por lo que en muchos
casos se requiere bastante trabajo
de preparación.
1. Preparación y
descripción del
material bruto
• Despejando los componentes (las
variables) de interés para la
investigación.(puede ser sólo
enumerativo como en el análisis
de contenidos o más complejo
como en el análisis semiótico)
• A. La redacción de resúmenes
• B. La codificación (Consiste en
atribuir categorías o conceptos a
porciones del materia)
• C. Inducción (identificar temas a
partir de la base de datos y luego
realizar reagrupamientos a partir
de estos temas)
2. Reducción de
datos
29. Otras
• Asimetría: es la estadística que se usa para conocer cuánto se
parece una distribución a la distribución teórica llamada curva
normal y que constituye un indicador del lado de la curva en
el que las frecuencias se agrupan más.
• Curtosis: indicador de lo plano o picuda que es una curva.
• PUNTUACIONES Z :Es la medida que indica la dirección y el
grado en que un valor individual se aleja de la media, en una
escala de unidades de desviación estándar
30. Para el caso de variables medidas a nivel
intervalo o de razón, podemos hacer
exactamente el mismo ejercicio.
Si se tiene, por ejemplo, la información
acerca del número de cajas de madera
que construyen al día unos carpinteros
en un taller, podríamos clasificarlos por
su productividad.
31. Ejemplo
Tomemos como ejemplo una muestra de 20 alumnos, determinando su peso en kilos; para
facilitar el trabajo redondeamos las cifras.
X
1
= 74 X
2
=67 X
3
=94 X
4
=70
X
5
= 69 X
6
=61 X
7
=71 X
8
=79
X
9
= 47 X
10
=85 X
11
=82 X
12
=55
X
13
=65 X
14
=88 X
15
=52 X
16
=58
X
17
=76 X
18
=57 X
19
=72 X
20
=66
El primer paso a seguir consiste en determinar el valor máximo y el mínimo.
En el ejemplo tenemos:
Xmáximo = 94; Xmínimo = 47
La diferencia entre el valor máximo y el mínimo se denomina recorrido o rango.
94 - 47 = 47
El rango, será entonces de 47.
32. La amplitud del intervalo de clase será:
Rango R =47
Número de intervalos m = 5
C= R de donde C= 47 = 9.4 m5
Redondeando y para mejor manejo de los datos, se puede considerar que la amplitud del
intervalo sea de 9.
La tabla de frecuencias nos quedará en la siguiente forma,
33. Introducimos dos nuevos símbolos que son:
m = número de intervalos (o clase de la distribución)
c = amplitud de intervalo (o de clase de la distribución)
El valor de m, o sea, el número de intervalos se puede obtener mediante la siguiente
fórmula:
m=1+3.3 log n, donde n es el número de datos
Es de anotar que la anterior fórmula es poco conocida, por consiguiente, es poco usual. Se
recomienda que el número de intervalos, hasta donde sea posible, no sea menor de 5 ni
mayor de 16.
Para el cálculo de amplitud del intervalo se puede aplicar la siguiente fórmula:
X -X osea rango max. min.
C= C= mm
En el caso de nuestro ejemplo, el número de intervalos será:
m=1 +3.3 log 2O de donde m=1+3.3, x1,30
m=1 +4,29
m = 5.29 ≅ 5 intervalos.