2. En un municipio español se ha realizado una pequeña encuesta
en la que se ha preguntado por el nº de personas que habitan
en el hogar y el nº de habitaciones del mismo.
Si ambas variables se distribuyen normalmente:
-Averiguar si existe correlación entre ambas variables en la
población de donde derivan los datos.
-Calcular el coeficiente de correlación de Pearson.
-Averiguar si el coeficiente de correlación es significativo. Realizar
las hipótesis.
-Incluir los datos en SSPS y realizar gráfico dispersión simple,
realizar la correlación de Pearson y evaluar los resultados.
3. Lo primero que tenemos que hacer es
averiguar si existe normalidad en la
muestra. Esto lo sabremos mediante
las pruebas de normalidad en SPSS.
Para ello, miraremos el test de
Kolmogorov-Smirnov si el tamaño de
la muestra es mayor a 50, y el Test de
Shapiro Wills si el tamaño de la
muestra es menor a 50.
Después, usaremos R de Pearson si
se distribuye normalmente y Rho de
Spearman si no se distribuye
normalmente.
4. Vamos a ver si las
variables se
distribuyen
normalmente en
SPSS
7. Pinchamos en “niveles de los
factores juntos”---- “De tallo
y hojas”---- “Gráficos con
prueba de normalidad”
10. Ahora nos va a salir una tabla y nos
tendremos que fijar en la parte de “Sig.”
(nivel de significación).
Si el resultado del nivel de significación es
mayor de 0,05 el conjunto de datos sigue
una distribución normal, es decir, se
acepta la Ho, y usaremos R de Pearson
Si el resultado del nivel de significación es
menor de 0,05, el conjunto de datos no
sigue una distribución normal, es decir, se
rechaza la Ho y usaremos Rho de Spearman
11. La sig. es mayor
que 0,05 por lo
que sigue una
distribución
normal. Así que,
aceptamos la
hipótesis nula y
utilizaremos la
R de Pearson
En la tabla nos
aparece
Kolmogorov-
Smirnov y
Shapiro Will.
Como la
muestra es
menor de 50
nos fijamos en
Shapiro-Wills.
12. Vamos a utilizar la FÓRMULA DE R DE
PEARSON, porque se distribuye normalmente:
R= coeficiente de correlación de pearson
∑xy= sumatorio de los productos de ambas variables
∑x=sumatoria de los valores de la variable independiente
∑y= sumatoria de los valores de la variable dependiente
∑x^2= sumatoria de los valores al cuadrado de la variable
independiente
∑y^2= sumatoria de los valores al cuadrado de la variable
dependiente
N= tamaño de la muestra en función de parejas.
14. Si Pearson nos da cero pues entonces en esa población no hay
correlación.
Si es diferente de cero, como en nuestro caso (Pearson = 0,63==0), el
resultado obtenido hay que estudiarlo y para eso haremos la T de
Student, con N-2 grados de libertad (N= nº de muestra).
La T de Student informa de si la relación se ha producido al azar o
no.
T(n-2) = r xy
= 1,63
(n-2)
1-rxy^2
T (n-2) = 0,63
( 6-2
1-(0,63)^2
15. .
Ya sabemos el valor de la T de Student (1,63). Ahora tenemos
que compararlo con el valor de la tabla de distribución de la T
de Student. Si el valor de la fórmula es mayor que el valor de
las tablas rechazamos la hipótesis nula, y diremos que las
variables están relacionadas. Si T de student de la fórmula <
T de las tablas, aceptamos la hipótesis nula, y las variables no
están relacionadas.
Todo esto teniendo en cuenta que:
•H0: No hay relación entre el número de personas
que viven en una casa y el número de habitaciones de
ella.
•H1: Hay relación significativa entre el número de
personas que viven en una casa y el número de
habitaciones de la misma
16. Para buscar en la tabla
tenemos que tener en
cuenta el grado de
libertad (n-2= 6-2= 4), y el
nivel de confianza, que
vamos a suponer que es del
95%.
Vemos que la T de Student
de la fórmula es menor que
la T de las tablas
(1,63<2,132) por lo que
aceptamos la hipótesis nula.
Por tanto, las variables no
están relacionadas, es
decir, no existe relación
significativa entre las
personas que habitan una
casa y el número de
habitaciones que tiene.
17. Incluir los datos en SSPS y realizar gráfico dispersión simple, realizar
la correlación de Pearson y evaluar los resultados.
Incluimos los datos
en SPSS
18. Para realizar el gráfico de
dispersión simple tenemos
que seguir los siguientes
pasos:
---”Gráficos”--- “cuadros de
diálogo antiguos”---
“Dispersión/puntos”
25. Vemos que la
significación es
0,177 > 0,05 por
lo que
aceptamos la
hipótesis nula y,
por tanto, no
existe relación
entre las
variables, así
que la relación
entre ambas
variables se ha
producido al
azar.