Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Seminario 8

Análisis bivariado con variables cuentitativas

  • Login to see the comments

  • Be the first to like this

Seminario 8

  1. 1. SEMINARIO 8: Análisis bivariado con variables cuantitativas. Normalidad y linealidad. Diagrama de dispersión. Coeficientes de correlación de Pearson y Rho de Spearman
  2. 2. Ejercicio: • Determina si existe relación entre las variables altura y peso del fichero de datos “activos en salud” y si existe determina cómo de fuerte es.
  3. 3. 1º ¿Ante qué nos encontramos? • En primer lugar comprobamos que se trata de dos variables cuantitativas. • El ejercicio pide una correlación. • Por tanto debemos de emplear para su análisis y relación la Correlación de Pearson o Rho de Spearman. • Para averiguar cual de las dos debemos de aplicar hemos de tener en cuenta una serie de características entre las variables. • Se trata de un análisis de dos variables, es decir, bivariada. • Sabiendo que la correlación es el grado o fuerza de relación entre dos variables.
  4. 4. 2º ¿Qué prueba debemos de usar? • Tenemos que tener en cuenta si se puede usar una prueba paramétrica o no paramétrica: PRUEBAS PARAMÉTRICAS PRUEBAS NO PARAMÉTRICAS Para estimar un parámetro •con al menos una variable cuantitativa • las variables siguen una distribución normal –Si se comparan dos muestras »Homocedasticidad ó igualdad de las varianzas PEARSON Cuando los datos se han recogido con escala nominal u ordinal –No implican suposición de normalidad –Son menos sensibles, son más robustos, que los test paramétricas SPEARMAN
  5. 5. 2º ¿Qué prueba debemos de usar? • En definitiva, según si las variables siguen o no una distribución normal emplearemos una prueba u otra: • Si sigue una DISTRIBUCIÓN NORMAL usaremos PEARSON. • Si NO sigue una DISTRIBUCIÓN NORMAL usaremos por tanto SPEARMAN.
  6. 6. 3º Comprobar la normalidad de los datos. • Para ello vamos a emplear dos métodos diferentes. En este caso ambos para asegurarnos de que nuestras observaciones son correctas: • A) MÉTODOS GRÁFICOS (histogramas, Box- plot y gráfico QQ). • B) PRUEBAS DE NORMALIDAD (Siendo el test de Shapiro Wilk el más usado)
  7. 7. a) Métodos gráficos: PESO (En R) GRÁFICO QQ: Seleccionamos la variable peso Y DISTRIBUCIÓN NORMAL.
  8. 8. a) Métodos gráficos:PESO HISTOGRAMA
  9. 9. a) Métodos gráficos: PESO GRÁFICO BOX-PLOT O DIAGRAMA DE CAJA
  10. 10. a) Métodos gráficos: PESO • Podemos observar que no sigue una distribución normal. Distribución normal Distribución del peso
  11. 11. b) Pruebas de normalidad: PESO No sigue una distribución normal
  12. 12. a) Métodos gráficos: ALTURA Observamos que tampoco se sigue una distribución normal
  13. 13. b) Pruebas de normalidad: ALTURA • No sigue una distribución normal.
  14. 14. 4º Elegir la prueba en base a lo que hemos observado • Ninguna de las variables sigue una distribución normal, por tanto es NO PARAMÉTRICA y aplicamos Rho de Spearman.
  15. 15. 5º Ver el tipo de relación y cómo de fuerte es: • Se trata de ver la regresión (tipo de relación entre ambas variables) y la • Correlación ( si existe una relación fuerte y cómo es). • Para ello: • A) Estudiamos la linealidad entre las variables. • B) Obtenemos los coeficientes de correlación.
  16. 16. a) Linealidad de las variables:
  17. 17. A partir del diagrama obtenido no podemos determinar que existe relación entre ambas variables, debemos de obtener los datos numéricos No se aprecia con suficiente claridad, mejor comparar con los resultados numéricos
  18. 18. b) Coeficientes de correlación Seleccionar ambas variables
  19. 19. 6º Interpretar los resultados de la prueba • Los valores se sitúan en torno a -1 y 1. Valores cercanos al -1 nos muestran correlación negativa, los cercanos al 1 positiva; pero los que son igual a 0 no tienen correlación. • Hay una correlación buena. 0.622

×