El documento presenta un ejemplo numérico para calcular el coeficiente de correlación r de Pearson entre dos variables estadísticas utilizando el método de tablas de doble entrada. Se proporciona un cuadro con los datos de 134 estudiantes que muestran sus puntajes en hábitos de estudio y matemáticas agrupados en intervalos. Luego, se construye un cuadro auxiliar para calcular las desviaciones unitarias requeridas y aplicar la fórmula de correlación, obteniendo un valor de r = 0.59.
1. UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI
ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN COMERCIAL
INTERNACIONAL
TEMA: Aplicación de Ejercicios de estadística
Msc. Jorge pozo
Integrante
Ayala Maricela
NIVEL: 6TO “A”
Periodo – 2012
2. TEMA: Aplicación de Ejercicios de estadística
Problema:
La dificultad del estudiante para calcular los Ejercicios de estadística
Objetivos:
Objetivo General.
Identificar como calcular los Ejercicios de estadística
Objetivos Específicos.
Recopilar conceptos sobre los Ejercicios de estadística
Analizar los conceptos sobre los Ejercicios de estadística
Poner en práctica los conocimientos sobre los Ejercicios de estadística
Justificación
Este trabajo se realiza para que el estudiante sea práctico en el cálculo de la
correlación y relación lineal y domine bien el tema y se involucre en
investigaciones cada vez más profundas analizando algunas características
generales como es la de calcular el coeficiente de correlación r de Pearson de
acuerdo a los datos planteados, al observar los resultados se puede sacar
3. importantes análisis con el fin de determinar si es aceptable o no el tipo de
caso aplicado,
Desarrollo
CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS EN
CLASES
El presente tema nos conduce a calcular el coeficiente de correlación r, que
nos proporciona información de la fuerza de la relación que existe entre dos
conjuntos de datos que se encuentran agrupados, cada uno de ellos formando
por separados una distribución de frecuencias, mejor dicho teniendo por
separado sus intervalos de clase con sus respectivas frecuencias.
4. Para realizar una exposición del tema en forma más entendible, presentamos el
ejemplo del Cuadro Nº 4.1.7.
Ejemplo:
Calcular el grado de correlación entre las puntaciones obtenidas en inventario
de hábitos de estudio y los puntajes obtenidos en un examen de Matemática,
aplicados a un total de 134 alumnos de un colegio de la localidad.
CUADRO Nº 4.1.7
X Hábitos de estudio
20 30 30 40 40 50 50 60 Total
Y Matemática
70 80 3 2 2 7
60 70 1 0 4 5 10
50 60 2 6 16 3 27
40 50 4 14 19 10 47
30 40 7 15 6 0 28
20 30 8 2 0 1 11
10 20 1 1 2 4
Total 23 40 48 23 134
Podemos notar que el problema no es tan simple, como el caso anterior, dado
que ahora los datos se han clasificado en una tabla de doble entrada Nº 4.1.7.
Este cuadro muestra, en la primera columna del lado izquierdo los intervalos de
clase de la variable Y, los que cubren todos los posibles datos acerca de las
puntuaciones alcanzadas por los estudiantes en la prueba de Matemática.
Nótese que los intervalos crecen de abajo hacia arriba. En la fila superior se
presentan los intervalos de clase todos los 134 posibles datos acerca de los
puntajes obtenidos por los estudiantes en la variable hábitos de estudios
representados por la letra X.
5. Dentro del Cuadro Nº 4.1.7 en los casilleros interiores o celdas de la tabla, se
encuentran las frecuencias de celdas que corresponden a puntajes que
pertenecen tanto a un intervalo de la variable Y como a un intervalo de la
variable X.
En la fila interior del Cuadro se presentan los totales de los puntajes de la
variable X, hábitos de estudio. Esos totales se llaman frecuencias marginales
de la variable X y se representan por .
En la última columna de la derecha se encuentran los totales de los puntajes de
la variable rendimiento en matemática. Estos totales se denominan frecuencias
marginales de la variable Y.
Cuando los datos se presentan tal como el presente caso, formando tablas de
doble entrada, es conveniente usar el método clave que expondremos a
continuación porque con este procedimiento se evita manejar grandes
números, como sería el caso si se emplearán las fórmulas para trabajar con la
calculadora de bolsillo.
La fórmula que utilizaremos es la siguiente:
Para obtener los datos que deben aplicarse en la fórmula Nº 4.1.2., vamos a
construir el cuadro auxiliar Nº 4.1.8, al mismo tiempo que se explica el
significado de los símbolos de esa fórmula.
Lo primero que hacemos es reemplazar los intervalos horizontales y verticales
por sus respectivas marcas de clase; a continuación adicionaremos al Cuadro
Nº 4.1.7, cinco columnas por el lado derecho; cuyos encabezamientos son:
para la primera para la segunda, para la tercera, para la cuarta
y para la quinta columna.
6. Por la parte inferior del cuadro le adicionamos cuatro filas que se nombran:
para la primera para la segunda fila que está debajo de la anterior,
para la tercera fila y por último, para la cuarta fila que está debajo de
todas; de esta manera se va elaborando el Cuadro Auxiliar Nº 4.1.8.
1) Para determinar las frecuencias marginales que se deben colocar en la
columna para la primera para la segunda, para la tercera,
sumamos las frecuencias de las celdas que están en la misma fila de la
marca de clase 75, obtenemos: 3+2+2=7, número que se escribe en el
primer casillero o celda de la columna para la primera para la
segunda, para la tercera, En la fila de la marca de clase 65,
sumamos 1+4+5=10, número que se escribe debajo del 7.
Para la fila de la marca de clase 55, tenemos: 2+6+16+3=27.
Para la fila de la marca de clase 45, se tiene: 4+14+19+10=47.
En igual forma: 7+15+6=28.
Lo mismo: 8+2+1=11
Y en la última fila: 1+1+2=4
A continuación sumamos estas frecuencias marginales de la variable Y:
7+10+27+47+28+11+4=134 es el total general.
2) Ahora a determinar las frecuencias marginales de la variable X: En columna
encabezada con la marca de clase 25 sumemos verticalmente las
frecuencias: 1+2+4+7+8+1=23.
En la columna encabezada con 35, tenemos: 3+6+14+15+2=40
En la siguiente: 2+4+16+19+6+1=48
En la última: 2+5+3+10+1+2=23
3) Centremos nuestra atención en la columna encabezada para la primera
para la segunda, para la tercera, este signo significa desviación
unitaria, y procedemos en la misma forma que en las Tablas Nº 2.1.2 y Nº
2.1.3 (b). recuerden que las desviaciones unitarias positivas: +1, +2, y +3
corresponden a los intervalos mayores y por el contrario las desviaciones
unitarias negativas: -1, -2 y -3 corresponden a los intervalos menores. Como
7. origen de trabajo se tomó la marca de clase 45 y por lo tanto su desviación
unitaria es cero.
4) Luego vamos a determinar las desviaciones unitarias horizontales de la
variable X. el origen de trabajo es la marca de clase 45 que se halla en la
fila superior del cuadro, por esa razón, escribimos cero debajo de la
frecuencia marginal 48. Las desviaciones unitarias negativas: -1 y -2 se
escriben a la izquierda cero, porque se corresponden con los intervalos de
clase que tienen menores marcas de clase y que están a la izquierda de 45.
La desviación unitaria positiva, se corresponde con el intervalo de mayor
marca de clase, 55 (en parte superior del Cuadro Nº 4.1.8.)
5) A continuación vamos a determinar los valores que deben colocarse en la
columna encabezada ; este símbolo indica que se debe multiplicar
cada valor de por su correspondiente valor de , así: 7(+3)=21;
10(+2)=20; 27(+1)=27; 47(0)=0; 28(-1)=-28; 11(-2)=-22 y 4(-3)=-12.
Sumando algebraicamente, tenemos: 21+20+27=68 los positivos: y (-
28)+ (-22)+ (-12)=-62 los negativos.
Por último: 68-62=6 total, que se coloca en la parte inferior de la columna
Para obtener los valores de la cuarta columna encabezada debemos
tener en cuenta que ( , por lo tanto basta multiplicar cada
valor de la segunda columna por su correspondiente valor de la tercera
columna así se obtiene el respectivo valor de la cuarta columna. En efecto:
(+3)(21)=63; (+2)(20)=40; (+1)(27)=27; 0*0=0; (-1)(-28)=28; (-2)(-22)=44 y (-3)(-
12)=36
La suma: 63+40+27+28+44+36=238
Ahora nos fijamos horizontalmente en la tercera fila. Tenemos que
( = por consiguiente basta multiplicar verticalmente un valor de la
8. primera fila por su correspondiente valor de la segunda dila para obtener el
respectivo valor de la tercera fila.
(23)(-2)=-46; (40)(-1)=-40; (48)(0)=0 y (23)(+1)=23
Sumando horizontalmente:
(-46)+ (-40)+ (23)=-86+23=-63
Vamos por la cuarta fila; vemos que . Luego basta multiplicar
cada elemento de la segunda fila por su correspondiente elemento de la tercera
fila para obtener el respectivo elemento de la cuarta fila así:
(-2)(46)=92; (-1) (-40)=40; 0*0=0 y (+1) (23)=23
Para obtener los valores de la quinta columna observamos que hay
tres factores; el 1º es la frecuencia de la celda o casillero que se está
considerando, el segundo factor es la desviación unitaria , el tercer factor es
la desviación unitaria . Por tanto el procedimiento será el siguiente:
Tomemos el número 3 que es la frecuencia de la celda determinada por el
cruce de los intervalos que tienen la marcha de clase 75 horizontalmente y 35
verticalmente.
Bajemos la vista del número 3 hacia donde se halla el respectivo valor (-1) de
la desviación unitaria (ver la línea punteada).
Para indicar el tercer factor corremos la vista del número 3 hacia su derecha
hasta llegar a la columna de las desviaciones unitarias y ubicamos el
número +3 (ver la línea punteada) formemos el producto de estos tres
9. números: (3) (-1) (+3)=-9. Este número -9 encerrado en un semicírculo lo
escribimos en la celda elegida.
En la misma fila tomamos la celda siguiente: (2) (0) (+3)=0
Continuando hacia la derecha: (2) (+1) (+3)=6
CUADRO AUXILIAR Nº 4.1.8
CUADRO CORREGIDO DEL CUADRO AUXILIAR Nº 4.1.8
10. La fórmula del paso (9) lleva el signo para indicar que se deben sumar
horizontalmente los números que están encerrados en los semicírculos de esa
primera fila elegida, así: -9+0+6=-3. Este número se escribe en la quinta
columna.
Trabajemos con la siguiente fila: (1) (-2) (+2)=-4 se encierra en un semicírculo.
(0)(-1)(+2)=0
(4)(0)8+2)=0
(5)(+1)(+2)=10
Sumando 0+0+10=10
Ahora con la tercera fila:
(2)(-2)(+1)=-4
(6)(-1)(+1)=-6
(16)(0)(+1)=0
12. RELACIONES
La correlación se ocupa de establecer la magnitud y la dirección de las
relaciones. Antes de profundizar en estos aspectos particulares de las
relaciones, analizaremos algunas características generales de éstas, con las
cuales podemos comprender mejor el material específico acerca de la
correlación.
13. RELACIONES LINEALES
Para iniciar nuestro análisis de las relaciones, veamos una relación entre dos
variables. La siguiente tabla muestra el salario mensual que percibieron cinco
agentes ventas y el valor en dólares de la mercancía vendida por cada uno de
ellos en ese mes.
AGENTE VARIABLE X MERCANCÍA Y VARIABLE
VENDIDA ($) SALARIO ($)
1 0 500
2 1000 900
3 2000 1300
4 3000 1700
5 4000 2100
Podemos analizar mejor la relación entre estas variables si trazamos una
gráfica utilizando los valores X y Y, para cada agente de ventas, como los
puntos de dicha gráfica. Él es una gráfica de dispersión o dispersigrama.
Una gráfica de dispersión o dispersigrama es una gráfica de parejas de
valores X y Y.
La gráfica de dispersión para los datos de los agentes de ventas aparece en
la figura 6.1. En relación con esta figura, vemos que todos los puntos caen
sobre una línea recta. Cuando una línea recta describe la relación entre dos
variables, se dice que esta relación lineal.
Una relación lineal entre dos variables es aquella que puede representarse
con la mejor exactitud mediante una línea recta.
14. Observe que no todas las relaciones son lineales; algunas son curvilíneas.
En este caso, al trazar una gráfica de dispersión para las variables X y Y,
una línea curva ajusta mejor a los datos que una línea recta.
CÁLCULO DE LA (r) DE PEARSON
La ecuación para calcular la r de
Pearson mediante datos:
Donde es la suma de los productos de cada pareja de puntajes z.
15. Para utilizar esta ecuación, primero hay que convertir cada dato en bruto en su
valor transformado. Esto puede tardar mucho tiempo y crear errores de
redondeo. Con algún álgebra, esta ecuación se puede transformar en una
ecuación de cálculo que utilice datos en bruto:
ECUACIÓN PARA EL CÁLCULO DE LA (r) DE PEARSON
Donde: es la suma de los productos de cada pareja X y Y, también
se llama la suma de productos cruzados.
La tabla 6.4 contiene algunos de los datos hipotéticos reunidos a partir de cinco
sujetos.
Datos hipotéticos para el cálculo de la r de Pearson
TABLA 6.4
SUBJETIVO X Y XY
A 1 2 1 4 2
B 3 5 9 25 15
C 4 3 16 9 12
D 6 7 36 49 42
E 7 5 49 25 35
TOTAL 21 22 111 112 106
16. Utilicemos estos datos para calcular la r de Pearson:
es la suma de los productos cruzados; se determina multiplicando los
datos X y Y para cada sujeto y luego sumando los productos resultantes. El
cálculo de y de los otros términos aparece en la tabla 6.4. al sustituir
estos valores en la ecuación anterior, obtenemos.
PROBLEMA DE PRÁCTICA 6.1
17. Resolvamos otro ejercicio. Esta utilizaremos los datos de la tabla 6.1. Para su
conveniencia, hemos reproducido estos datos en las primeras tres columnas de
la tabla 6.5. En este ejemplo tenemos una relación lineal imperfecta y estemos
interesados en calcular la magnitud y dirección de la relación mediante la r de
Pearson. La solución también aparece en la tabla 6.5.
IQ y el promedio de las calificaciones: cálculo de la r de Pearson
TABLA 6.5
ESTUDIANTE IQX PROMEDIO
NÚMERO DE DATOS Y
1 110 1.0 12,100 1.00 110.0
2 112 1.6 12,544 2.56 179.2
3 118 1.2 13,924 1.44 141.6
4 119 2.1 14,161 4.41 249.9
5 122 2.6 14,884 6.76 317.2
6 125 1.8 15,625 3.24 225.0
7 127 2.6 16,129 6.76 330.2
8 130 2.0 16,900 4.00 260.0
9 132 3.2 17,424 10.24 422.4
10 134 2.6 17,956 6.76 384.4
11 136 3.0 18,496 9.00 408.0
12 138 3.6 19,044 12.96 496.8
TOTAL 1503 27.3 189,187 69.13 3488.7
18. PROBLEMA DE PRÁCTICA 6.2
Tratemos de resolver otro problema. ¿Se ha puesto a reflexionar si es verdad
que los opuestos se atraen? Todos hemos estado ante parejas en las que sus
miembros parecen ser muy diferentes entre sí. ¿Pero esto es lo usual? ¿Qué
fomenta la atracción: las diferencias o las similitudes? Un psicólogo social
abordó este problema pidiendo a 15 estudiantes que respondieran un
cuestionario relacionado con un sus actitudes hacia una amplia gama de
temas. Tiempo después les mostró las “actitudes” de un extraño hacia los
mismos temas y les pidió que evaluaran su agrado o inclinación por el extraño
y si, probablemente, disfrutarían el trabajar con él. En realidad, las “actitudes”
del extraño fueron elaboradas por el experimentador y variaron de sujeto a
sujeto, con respecto a la proporción de actitudes similares que hubo entre el
extraño y el individuo que participó en el experimento. De esa manera, se
obtuvieron datos, para cada sujeto a sus actitudes y la atracción que sintió
hacia un extraño, basada en las actitudes de este último hacia los mismos
temas. Si los iguales se atraen, entonces debería existir una relación directa
entre la atracción hacia un extraño y la proporción de actitudes similares. Los
datos se presentan en la tabla 6.6. Entre mayor sea la atracción, más alto será
el puntaje. El puntaje de atracción máximo es de 14. Calcule el coeficiente de
correlación r de Pearson * para determinar si existe una relación directa entre la
similitud de actitudes y el grado de atracción.
Datos y solución del problema de práctica 6.2
20. Por lo tanto, con base en estos estudiantes, existe una relación muy fuerte
entre las similitudes y las atracciones.
Una segunda interpretación de la r de Pearson. La r de Pearson también se
puede interpretar en términos de la variabilidad de Y explicada por medio de X.
este punto de vista produce más información importante acerca de r y la
relación entre X y Y. Considere, por ejemplo, la figura 6.9, en la cual se
muestra una relación imperfecta entre X y Y. En este ejemplo, la variable X
representa una competencia de ortografía y la variable Y la habilidad en la
escritura de seis estudiantes de tercer grado. Suponga que queremos predecir
la calificación en la escritura de María, la estudiante cuya calificación en
ortografía es de 88. Si no hubiese una relación entre la escritura y la ortografía.
EJERCICIOS DE APLICACIÓN
1. En un largo curso de introducción a la sociología, un profesor hace dos
exámenes. El profesor quiere determinar si las calificaciones de los
21. estudiantes en el segundo examen correlacionadas con las
calificaciones del primero. Para facilitar la los, se elige una muestra de
ocho estudiar calificaciones aparecen en la siguiente tabla.
ESTUDIANTE EXÁMEN 1 EXÁMEN 2
1 60 60
2 75 100
3 70 80
4 72 68
5 54 73
6 83 97
7 80 85
8 65 90
a. Construya una gráfica de dispersión para datos, utilizando la
calificación del primer examen como la variable X. ¿Parece lineal
la relación?
b. Suponga que existe una relación lineal en calificaciones de los
dos exámenes, calcule la r de Pearson.
c. ¿Qué tan bien explican la relación, las calificaciones del segundo
examen?
120
100
80
60
Series1
40
20
0
0 20 40 60 80 100
22. 0,629531757
Se puede decir que es una relación Baja y positiva que los dos exámenes
tienen entre si
2. Un investigador realiza un estudio de la relación entre el consumo de
cigarros y las enfermedades determinan la cantidad de cigarros fumados
diariamente y de días de ausencia en el trabajo dura último año debido a
23. una enfermedad para 13 individuos en la compañía donde trabaja este
investigador. Los datos aparecen en la tabla anexa.
SUJETO CIGARROS DÍAS DE
CONSUMIDOS AUSENCIA
1 0 1
2 0 3
3 0 8
4 10 10
5 13 4
6 20 14
7 27 5
8 35 6
9 35 12
10 44 16
11 53 10
12 60 16
a. Construya una gráfica de dispersión para estos datos: ¿Se ve una
relación lineal?
b. Calcule el valor de la r de Pearson.
c. Elimine los datos de los sujetos 1, 2, 3, 10, 11 y 12. Esto
disminuye el rango de ambas variables. Vuelva a calcular r para
los sujetos restantes. ¿Qué afecto tiene la disminución del rango
sobre r?
d. A utilizar todo el conjunto de datos, ¿qué porcentaje de la
variabilidad en el número de días de ausencia es explicado por la
cantidad de cigarros fumados diariamente? ¿De qué sirve ese
valor?
26. 3. Un educador ha construido un examen para las aptitudes mecánicas y
desea determinar si éste es confiable, mediante dos administraciones
con un lapso de 1 mes entre ellas. Se realiza un estudio en el cual 10
estudiantes reciben dos administraciones del examen, donde la segunda
administración ocurre un mes después que la primera. Los datos
aparecen en la tabla.
a. Construya una gráfica de dispersión para las parejas de datos.
b. Determine el valor de r.
c. ¿Sería justo decir que éste es un examen confiable? Explique esto al
utilizar .
SUJETO ADMINISTRACIÓ ADMINISTRACIÓ
N1 N2
1 10 10
2 12 15
3 20 17
4 25 25
5 27 32
6 35 37
7 43 40
8 40 38
9 32 30
10 47 49
28. La investigación no es confiable por que los datos son tomados en dos fecha
totalmente distintas
4. Un grupo de investigadores ha diseñado un cuestionario sobre la
tensión, consistente en 15 sucesos. Ellos están interesados en
determinar si existe una coincidencia entre dos culturas acerca de la
cantidad relativa de ajustes que acarrea cada suceso. El cuestionario se
aplica a 300 estadounidenses y 300 italianos. Cada individuo debe
utilizar el evento “matrimonio” como estándar y juzgar los demás eventos
en relación con el ajuste necesario para el matrimonio. El matrimonio
recibe un valor arbitrario de 50 puntos. Si se considera que un evento
requiere de más ajustes que el matrimonio, el evento debe recibir más
de 50 puntos. El número de puntos excedentes depende de la cantidad
de ajustes requeridos. Después de que cada sujeto de cada cultura ha
asignado puntos a todos los eventos, se promedian los puntos de cada
evento. Los resultados aparecen en la siguiente tabla:
EVENTOS ESTADOUNIDENSES ITALIANOS
29. Muerte de la esposa 100 80
Divorcio 73 95
Separación de la pareja 65 85
Temporada en prisión 63 52
Lesiones personales 53 72
Matrimonio 50 50
Despedido del trabajo 47 40
Jubilación 45 30
Embarazo 40 28
Dificultades sexuales 39 42
Reajustes económicos 39 36
Problemas con la familia
política 29 41
Problemas con el jefe 23 35
Vacaciones 13 16
Navidad 12 10
a. Suponga que los datos tienen al menos una escala de intervalo y
calcule la correlación entre los datos estadounidenses y la de los
italianos.
b. Suponga que los datos sólo tienen una escala ordinal y calcule la
correlación entre los datos de ambas culturas.
100
80
60
40 Series1
20
0
0 50 100 150
30. 0,8519
La r es alta y positiva es decir que los comportamiento de las dos
nacionalidades son bastante similares
INDIVIDUO EXÁMEN CON LÁPIZ SIQUIATRA SIQUIATRA
Y PAPEL A B
31. 1 48 12 9
2 37 11 12
3 30 4 5
4 45 7 8
5 31 10 11
6 24 8 7
7 28 3 4
8 18 1 1
9 35 9 6
10 15 2 2
11 42 6 10
12 22 5 3
5. Un psicólogo ha construido un examen lápiz - papel, a fin de medir la
depresión. Para comparar los datos del examen con los datos de los
expertos, 12 individuos “con perturbaciones emocionales” realizan el
examen lápiz – papel. Los individuos también son calificados de manera
independiente por dos siquiatras, de acuerdo con el grado de depresión
determinado por cada uno como resultado de entrevistas detalladas. Los
datos aparecen a continuación. Los datos mayores corresponden a una
mayor depresión.
a. ¿Cuál es la correlación entre los datos de los dos siquiatras?
b. ¿Cuál es la correlación entre las calificaciones del examen con
lápiz y papel y los datos de cada siquiatra?
32. 14
12
10
8
6 Series1
4
2
0
0 5 10 15
0,8519
La relación se da con un mismo criterio por los psiquiatras
33. 14
12
10
8
6 Series1
4
2
0
0 20 40 60
0,6973
La relación entre las dos variables es baja y positiva
34. 14
12
10
8
6 Series1
4
2
0
0 20 40 60
0,697
6. Para este problema, suponga que usted es un psicólogo que labora en
el departamento de recursos humanos de una gran corporación. El
presidente de la compañía acaba de hablar con usted acerca de la
importancia de contratar personal productivo en la sección de
35. manufactura de la empresa y le ha pedido que ayude a mejorar la
capacidad de la institución para hacer esto. Existen 300 empleados en
esta sección y cada obrero fabrica el mismo artículo. Hasta ahora, la
corporación sólo ha recurrido a entrevistas para elegir a estos
empleados. Usted busca bibliografía y descubre dos pruebas de
desempeño, lápiz – papel, bien estandarizadas, y piensa que podrían
estar relacionados con los requisitos desempeño de esta sección. Para
determinar si alguna de ellas se puede utilizar como dispositivo de
selección, elige 10 empleados representativos de la sección de
manufactura, garantizando que un amplio rango de desempeño quede
representado en la muestra, y realiza las dos pruebas con cada
empleado. Los datos aparecen en la siguiente tabla.
Mientras mayor sea la calificación, mejor será el desempeño. Las
calificaciones de desempeño en el trabajo. Las calificaciones de
desempeño fabricados por cada empleado por semana, promediados
durante los últimos 6 meses.
a. Construya una gráfica de dispersión del desempeño en el trabajo
y la primera prueba, utilizando la prueba 1 como la variable X.
¿Parece lineal la relación?
b. Suponga que la relación anterior es lineal y calcule el valor de la r
de Pearson.
c. Construya una gráfica de dispersión del desempeño en el trabajo
y la segunda prueba, utilizando la prueba 2 como la variable X.
¿Parece lineal la relación?
d. Suponga que la relación anterior es lineal, calcule el valor de la r
de Pearson.
e. Si sólo pudiera utilizar una de las pruebas para la selección de los
empleados, ¿utilizaría alguna de ellas? En tal caso, ¿cuál de
ellas? Explique.
EMPLEADO
38. 0,9076
Análisis
El trabajo realizado acerca de cómo realizar calcular la correlación y relación
lineal se analizado que es un método el cual permite comparar e interpretar
resultados a través de la recolección de datos de cualquier institución con el
objetivo de llegar a establecer deducciones.
Conclusión.
Al realizar el trabajo permite que cada uno de nosotros tenga conocimientos
claros acerca de la correlación y relación lineal para poner en práctica en los
problemas que se presentan el mundo en especial de comercio exterior,
ayudan a interpretar datos en forma resumida los datos planteados y a dar
solución al problema.
Recomendación
39. El tema de investigación es de mucha relevancia porque la correlación y
relación lineal nos permiten determinar un promedio de algunos datos
estadísticos, tomando variables correspondientes para la interpretación de los
datos.
Lincografía.
www.profesorenlinea.cl/.../EstadisticaMediaMedianaModa.htm
Cronograma
Actividades Abril
días 21 22 23 24
Definición del
x
tema
Problema de
x
investigación
Objetivos x
Justificación
de la x
investigación
Marco
x
Referencial
Aspectos
x x
metodológicos
Pres. Proy. X
Recursos
PRESUPUESTO
Trabajo
CANTIDAD Valor PRESUPUESTO
40. unitario
PAPEL 20 0,02 0,40
IMPRESIÓN 20 0,06 1,20
INTERNET 2 0,5 1,00
TOTAL 2.60
DESARROLLO DE EJERCICIOS HIPOTESIS
1.- El banco de préstamos estudia la relación entre ingreso (X) y de ahorros (Y)
mensuales de sus clientes.
Meses 1 2 3 4 5 6 7 8 9
Ingresos 350 400 450 500 950 850 700 900 600
Ahorro 100 110 130 160 350 350 250 320 130
a) Determinar la ecuación lineal de las dos variables.
b) Trace el diagrama de dispersión en el plano cartesiano
400
350 y = 0.451x - 74.91
R² = 0.926
300
250
Ahorros
200
150
100
50
0
0 200 400 600 800 1000
Ingresos
c) Estime el ingreso que corresponde a un ahorro semanal de 90 dólares.
41. d) Si el ahorro es de 200 dólares que gasto puede realizar el obrero en
dicha semana.
e) Si el ingreso es de 350 dólares cual es el salario.
Desarrollo
Ahorros
Meses Ingresos(X) (Y) X*y
1 350 100 122500 10000 35000 80277,78 12345,68
2 400 110 160000 12100 44000 54444,44 10223,46
3 450 130 202500 16900 58500 33611,11 6579,01
4 500 160 250000 25600 80000 17777,78 2612,35
5 950 350 902500 122500 332500 100277,78 19290,12
6 850 350 722500 122500 297500 46944,44 19290,12
7 700 250 490000 62500 175000 4444,44 1512,35
8 900 320 810000 102400 288000 71111,11 11856,79
9 600 130 360000 16900 78000 1111,11 6579,01
5700 1900 4020000 491400 1388500 410000,00 90288,89
Primer caso
45. b. Estime la cosecha si se aplica 12 sacos de fertilizantes.
1000
900
800
700
Ventas
600
500
400
300
200
100
0
0 10 20 30 40 50 60 70 80 90
Gastos
a) Determina el coeficiente de determinación. De su comentario sobre este
valores
yr= -5,27 + 10,79(30)
yr= 318,43
46. 3.- Se obtuvieron los siguientes datos para determinar la relación entre cantidad
de fertilizante y producción de papa por hectárea.
Sacos de fertilizante por
hectárea 3 4 5 6 7 8 9 10 11 12
Rendimiento en quintales 45 48 52 55 60 65 68 70 74 76
a) Encuentre la ecuación de regresión de la cosecha sobre el fertilizante,
por el método de mínimos cuadrados.
Sacos de Rendimiento
fertilizantes en quinta
Periodo X (Y) X*y
1 3 45 9 2025 135 20,25 265,69
2 4 48 16 2304 192 12,25 176,89
3 5 52 25 2704 260 6,25 86,49
4 6 55 36 3025 330 2,25 39,69
5 7 60 49 3600 420 0,25 1,69
6 8 65 64 4225 520 0,25 13,69
7 9 68 81 4624 612 2,25 44,89
8 10 70 100 4900 700 6,25 75,69
9 11 74 121 5476 814 12,25 161,29
10 12 76 144 5776 912 20,25 216,09
75 613 645 38659 4895 82,50 1082,10
47. b. Estime la cosecha si se aplica 12 sacos de fertilizantes ¿Cuánto es el error o
residual?
-76=1.63 es el error.
b) Determina el coeficiente de determinación. De su comentario sobre este
valores
48. 4.- El número de horas de estudio invertidas y las calificaciones finales en un
curso de matemáticas de una muestra 10 alumnos ha dado los siguientes
resultados:
Alumno
Horas de estudio 14 16 22 20 18 16 18 22 10 8
Calificación 12 13 15 15 17 11 14 16 8 5
a) Determine la recta de regresión de la calificación sobre el número de
horas de estudio invertidos. Interprete la ecuación de regresión.
Horas
de
estudio Calificación
Alumno X (Y) X*y
1 14 12 196 144 168 5,76 0,36
2 16 13 256 169 208 0,16 0,16
3 22 15 484 225 330 31,36 5,76
4 20 15 400 225 300 12,96 5,76
5 18 17 324 289 306 2,56 19,36
51. 5.- Una muestra de 60 de las 350 agencias de ventas de automóviles de una
importadora registrada en un mes con X (autos vendidos por agencia), Y
(ventas en miles de dólares) ha dado los siguientes resultados:
a) Determine la ecuación de regresión:
52. Ecuación
b) Calcule el coeficiente de terminación ¿Qué porcentaje de la variación
total es explicada por la regresión?
53. 6.- Los contadores con frecuencia estiman los gastos generales basados en el
nivel de producción. En la tabla que sigue se da la información recabada sobre
gastos generales y las unidades producidas en 10 plantas y se desea estimar
una ecuación de regresión para estimar gastos generales futuros.
Gastos generales
($) 300 1000 1100 1200 600 800 900 500 400 200
Unidades
producidas 15 45 55 75 30 40 45 20 18 10
a) Determine la ecuación de regresión y haga un análisis del coeficiente de
regresión.
Gasto Unidades
generales producidas
Periodos X (Y) X*y
1 300 15 90000 225 4500 160000,00 412,09
2 1000 45 1000000 2025 45000 90000,00 94,09
3 1100 55 1210000 3025 60500 160000,00 388,09
4 1200 75 1440000 5625 90000 250000,00 1576,09
5 600 30 360000 900 18000 10000,00 28,09
6 800 40 640000 1600 32000 10000,00 22,09
7 900 45 810000 2025 40500 40000,00 94,09
8 500 20 250000 400 10000 40000,00 234,09
9 400 18 160000 324 7200 90000,00 299,29
10 200 10 40000 100 2000 250000,00 640,09
7000 353 6000000 16249 309700 1100000,00 3788,10