Seminario de Estadísticas:Ejercicio de CorrelaciónRealizado por Alba Gutiérrez ÁlvarezGrupo 6 Curso 2012/131ºGrado en Enfe...
¿Qué es la correlación?A modo de introducción, la correlación es relacióndependencia que existe entre dos variables ocambi...
Ejercicio 1
1.1.- Utilizando nuestra base de datos comprueba la correlaciónentre la variable peso y la variable horas de dedicación al...
En el gráfico obtenido, podemos apreciar como si existe unacorrelación, quizás débil, ya que la nube de puntos sedistribuy...
Para calcular el coeficiente de Pearson, primero debemosde comprobar si ambas variables son cuantitativas y sitienen una d...
Como obtenemos que el coeficiente de Pearson es diferentede cero (Pxy= 0,4) podemos afirmar que SÍ hay correlación,aunque ...
Antes de realizar el contraste de hipótesis, estableceremoslas dos hipótesis:H = no hay correlación entre ambas variables ...
1.2.- Calcula el Coeficiente de Correlación de Pearson para lasvariables número de cigarrillos fumados al día y nota de ac...
Como podemos observar en la gráfica resultante, los datospodemos decir que se sitúan alineados (aunque no de formaexacta) ...
Como hemos obtenido que el coeficiente de correlación esdiferente de 0 (p= -0,97), podemos afirmar sí existecorrelación, q...
Ya sabemos que en la muestra sí hay correlación, pero lo quenosotros queremos comprobar es sí esa correlación tambiénse da...
1.3.- Calcula el Coeficiente de Correlación de Pearson paralas variables peso y altura (limitando la muestra a 10 casos).C...
En primer lugar, haremos la gráfica desde SPSS yobtenemos lo siguiente :Observando la gráfica, podemos suponer que sí hayc...
Para comprobar con certeza si hay o no correlación,calcularemos el coeficiente lineal de Pearson, haciendo usodel programa...
Como el valor del punto crítico (0,011) es menor que el nivel designificancia (0,05), debemos de rechazar la hipótesis nul...
Ejercicio S10.2: De una muestra de niños conocemos su edad (X) medidaen días y su peso (Y) en kg., según los resultados de...
1. Calcular el coeficiente de correlación de Pearson.Antes de usar la correlación de Pearson, debemos de comprobar sisigue...
Una vez realizada la tabla, aplicaremos la siguiente fórmulapara calcular el coeficiente de correlación de Pearson, cuyore...
2. Averiguar si el coeficiente de correlación es significativo.Antes de realizar el contraste de hipótesis (por el quesabr...
A continuación, pasaremos a calcular el punto crítico. Para ello,nos iremos a la tabla de T-Student, con n-2 grados delibe...
Si comparamos el punto crítico con el estadístico t calculado,podemos observar que el estadístico es mayor que el puntocrí...
Ejercicio S10.3: De una muestra de alumnos conocemos lasnotas de Matemáticas (X) y de Lengua (Y), según losresultados de l...
Calcular el coeficiente de correlación de Pearson.Antes de calcular el coeficiente, debemos de asegurarnos sulas variables...
Una vez realizada la tabla, calcularemos el coeficiente decorrelación de Pearson entre X e Y.00Como observamos, tras el cá...
Seminario 10 de estadísticas
Upcoming SlideShare
Loading in …5
×

Seminario 10 de estadísticas

668 views

Published on

  • Be the first to comment

  • Be the first to like this

Seminario 10 de estadísticas

  1. 1. Seminario de Estadísticas:Ejercicio de CorrelaciónRealizado por Alba Gutiérrez ÁlvarezGrupo 6 Curso 2012/131ºGrado en EnfermeríaU.D. Virgen del Rocío
  2. 2. ¿Qué es la correlación?A modo de introducción, la correlación es relacióndependencia que existe entre dos variables ocambio sistémico en las puntuaciones de dosvariables de intervalo/razón.Dos variables presentan correlación cuando almodificar una (aumentar o disminuir) tambiénmodifica la otra variable.
  3. 3. Ejercicio 1
  4. 4. 1.1.- Utilizando nuestra base de datos comprueba la correlaciónentre la variable peso y la variable horas de dedicación al deporte.Comenta los resultados.Para esta primera actividad, donde usaremos la base de datos deSPSS, primero identificaremos las dos variables (peso y dedicaciónal estudio).Desde el programa estadístico SPSS, le damos a analizar, dispersióny elegiremos la opción de dispersión simple.
  5. 5. En el gráfico obtenido, podemos apreciar como si existe unacorrelación, quizás débil, ya que la nube de puntos sedistribuyen alrededor de la recta aunque no de formaperfecta.Como la recta es creciente la correlación es positiva o directa:al aumentar una variable, la otra tiene también tendencia aaumentar.Sin embargo, con la nube de puntos no podemos confirmar concerteza que exista correlación. Para ello, debemos de usaruna prueba de hipótesis para valorar si existe o nocorrelación lineal entre las dos variables cuantitativas.Esa prueba de contraste de hipótesis se realiza calculando eldenominado coeficiente de correlación lineal de Pearson. Elcoeficiente de correlación lineal de Pearson permite estudiarla fuerza de la correlación o asociación lineal entre dosvariables cuantitativas.
  6. 6. Para calcular el coeficiente de Pearson, primero debemosde comprobar si ambas variables son cuantitativas y sitienen una distribución normal (que sí lo cumple puesto queel número de la muestra estudiada es de 30).Una vez comprobada estas dos premisas, pasamos acalcular el coeficiente de Pearson con SPSS.De nuevo le damos a analizar, correlaciones, bivariadas, yaquí es donde elegimos las dos variables estudiadas, ledamos a aceptar y obtenemos los gráficos esperados.
  7. 7. Como obtenemos que el coeficiente de Pearson es diferentede cero (Pxy= 0,4) podemos afirmar que SÍ hay correlación,aunque ésta es débil.Hecho esto, sabemos que en la muestra sí hay correlación,es decir, que las variables peso y dedicación al deporteestán relacionadas, pero lo que nosotros debemoscomprobar es sí esa correlación también se de en lapoblación. Para ello, llevamos a cabo el:CONTRASTE DE HIPÓTESIS
  8. 8. Antes de realizar el contraste de hipótesis, estableceremoslas dos hipótesis:H = no hay correlación entre ambas variables (p=0)₀H = sí hay correlación entre las dos variables (p ≠ 0 )₁Como el valor del punto crítico (p: 0,091) es mayor que el nivelde significancia (α: 0,05) podemos afirmar que se acepta lahipótesis nula (rechazamos la hipótesis alterna).CONCLUSIÓN En la población, NO hay correlaciónentre las variables peso y dedicación al deporte.
  9. 9. 1.2.- Calcula el Coeficiente de Correlación de Pearson para lasvariables número de cigarrillos fumados al día y nota de acceso.Comenta los resultados.Como en el ejercicio anterior, buscamos en la tabla las dos variablesen las cuales queremos comprobar si hay correlación, que son el nºde cigarrillos fumados al día y la nota de acceso.Para ello, desde el programa de SPSS, le damos a analizar, dispersióny elegiremos dispersión simple.
  10. 10. Como podemos observar en la gráfica resultante, los datospodemos decir que se sitúan alineados (aunque no de formaexacta) en torno a una recta, aunque también destacar queuno de los datos se encuentra aislado.Para comprobar con exactitud si hay o no correlación entreambas variables, tenemos que calcular el coeficiente linealde Pearson.Como explicamos anteriormente, las dos premisas necesariasque debe de cumplirse para poder aplicar Pearson es queambas sean variables cuantitativas y que sigan unadistribución normal (que sí lo cumple porque n>30).Contrastadas estas premisas, podemos pasar a calcular elcoeficiente de Pearson.Desde SPSS, le damos a analizar, correlaciones, bivariadas, yelegimos nuestras dos variables.
  11. 11. Como hemos obtenido que el coeficiente de correlación esdiferente de 0 (p= -0,97), podemos afirmar sí existecorrelación, que además es muy fuerte y que es decreciente( ya que el número obtenido es negativo).
  12. 12. Ya sabemos que en la muestra sí hay correlación, pero lo quenosotros queremos comprobar es sí esa correlación tambiénse da en la población. Para ello, realizaremos el contraste dehipótesis.En primer lugar, estableceremos ambas hipótesis:H : hipótesis nula; afirma que en la población no existe₀correlación entre ambas variables (en la muestra lacorrelación se ha debido al azar).H : hipótesis alterna; afirma que sí existe correlación en la₁población , al igual que en la muestra.Como observamos en la tabla, el grado de significación esα= 0,05. Por ello, como p (0,001) es menor que el grado designificación (0,01), aceptamos la hipótesis alterna, por lo querechazamos la nula.CONCLUSIÓN En la población, SÍ hay correlación entrelas variables nº de cigarrillos y nota de acceso.
  13. 13. 1.3.- Calcula el Coeficiente de Correlación de Pearson paralas variables peso y altura (limitando la muestra a 10 casos).Comenta los resultados.Antes de realizar el coeficiente de correlación de Pearson,debemos de confirmar que se cumple que las variablessean cuantitativas (que sí lo son) y que siguen unadistribución normal. Esta segunda premisa no la cumple,puesto que el número de individuos es menor que 30 (es10).Para comprobar si sigue una distribución normal, hacemos laprueba de normalidad con Kolmogorov. Para ello, desdeSPSS, le daremos a analizar, estadísticos descriptivos,explorar, opciones, pruebas de normalidad y le damos aaceptar.Tras realizar Kolmogorov, obtenemos que el punto crítico es0,2, que al ser mayor que el nivel de significación es 0,05,las variables se distribuyen normalmente.Por lo que ya podremos utilizar la prueba de correlación dePearson.
  14. 14. En primer lugar, haremos la gráfica desde SPSS yobtenemos lo siguiente :Observando la gráfica, podemos suponer que sí haycorrelación entre ambas variables, por la forma en la que sedistribuyen los puntos en torno a la gráfica, y que el valor dela correlación será positivo puesto que es ascendente.
  15. 15. Para comprobar con certeza si hay o no correlación,calcularemos el coeficiente lineal de Pearson, haciendo usodel programa estadístico SPSS, y obtenemos lo siguiente:Vemos como sí existe correlación (puesto que el valor no es 0),y que además es fuerte (p= 0,757) y ascendente (porque elvalor es positivo).Tras esto, estableceremos ambas hipótesis:H (hipótesis nula): afirma que no hay correlación entre las dos₀variables, solo se debe al azar.H (hipótesis alterna): sí existe correlación entre la variable₁peso y altura en la población.
  16. 16. Como el valor del punto crítico (0,011) es menor que el nivel designificancia (0,05), debemos de rechazar la hipótesis nula yaceptar la alterna, con un nivel de confianza del 95%.CONCLUSIÓN Al igual que ocurre en la muestra, en lapoblación también hay correlación entre las variables peso yaltura.
  17. 17. Ejercicio S10.2: De una muestra de niños conocemos su edad (X) medidaen días y su peso (Y) en kg., según los resultados de la tabla. Si ambasvariables se distribuyen normalmente, averiguar si existe correlación entreambas variables en la población de donde proviene la muestra?Tenemos dos variables cuantitativas “edad” y “peso” que se distribuyennormalmente, por lo que tenemos que:Edad (días) Peso corporal(Kg)0 3,650 3,40 3,17530 3,930 4,230 5,1960 5,8260 5,11560 4,590 5,290 6,890 6,2120 7,07120 7,85150 7,235150 6,12150 8,1180 8,67180 7,75180 6,9
  18. 18. 1. Calcular el coeficiente de correlación de Pearson.Antes de usar la correlación de Pearson, debemos de comprobar sisigue una distribución normal las variables (que sí puesto que lodice el enunciado) y que ambas variables sean cuantitativas(premisa que también cumple).Tras comprobar que podemos utilizar la correlación de Pearson,pasamos a calcularlo. Para ello, debemos de realizar una tabla,quedando de la siguiente forma:
  19. 19. Una vez realizada la tabla, aplicaremos la siguiente fórmulapara calcular el coeficiente de correlación de Pearson, cuyoresultado es:0,910,91Como hemos obtenido que el coeficiente es distinto de cero(Rxy=0,91), podemos afirmar que sí hay correlación y que además,ésta es fuerte y ascendente (puesto que el valor es positivo).Por ello, podemos decir que en la muestra sí hay correlación entreambas variables, pero debemos de comprobar sí esa correlacióntambién existe en la población CONTRASTE DE HIPÓTESIS
  20. 20. 2. Averiguar si el coeficiente de correlación es significativo.Antes de realizar el contraste de hipótesis (por el quesabremos si existe o no correlación en la población),estableceremos las dos hipótesis:H (hipótesis nula): afirma que en la población no hay₀correlación, solo se debe al azar.H (hipótesis alterna): afirma que en la población, al igual que₁en la muestra, si existe correlación entre las dos variables“edad” y “peso”.Para el contraste de hipótesis, se calcula el estadístico t, quesigue una distribución de T-Student, con n-2 grados delibertad:t n-2= rxy √ [(n-2)/1- (rxy)²]= 0.91·√19/0,1719= 9,57
  21. 21. A continuación, pasaremos a calcular el punto crítico. Para ello,nos iremos a la tabla de T-Student, con n-2 grados delibertad (20-2=19), y con α= 0,05 (nivel de significancia), yobtenemos que el punto crítico es 2,093
  22. 22. Si comparamos el punto crítico con el estadístico t calculado,podemos observar que el estadístico es mayor que el puntocrítico, por lo que rechazaríamos la hipótesis nula yaceptamos la alterna: en la población, sí hay correlaciónentre las variables edad y peso
  23. 23. Ejercicio S10.3: De una muestra de alumnos conocemos lasnotas de Matemáticas (X) y de Lengua (Y), según losresultados de la tabla. Si ambas variables se distribuyennormalmente, averiguar ¿existe correlación entre ambasvariables en la población de donde proviene la muestra?.Tenemos dos variables cuantitativas “nota de matemáticas”y “nota de lengua” que se distribuyen normalmente, por loque tenemos:X Y6 73 67 25 64 52 71 2
  24. 24. Calcular el coeficiente de correlación de Pearson.Antes de calcular el coeficiente, debemos de asegurarnos sulas variables son cuantitativas (que sí lo son) y si siguen unadistribución normal (que también lo cumple).Cumplidas ambas condiciones, pasaremos a realizar la tablaen primer lugar:X Y X² Y² X·Y6 7 36 49 423 6 9 36 187 2 49 4 145 6 25 36 304 5 16 25 202 7 4 49 141 2 1 4 2: 28 : 35 : 140 : 203 : 140
  25. 25. Una vez realizada la tabla, calcularemos el coeficiente decorrelación de Pearson entre X e Y.00Como observamos, tras el cálculo vemos que el coeficientede correlación es 0, por lo que no podemos de seguir conla actividad, puesto que en la muestra, no hay correlaciónentre las variables.Debido a ello, no realizaremos el contraste de hipótesispuesto que, al igual que en la muestra, en la poblacióntampoco habrá correlación entre las variables de notas dematemáticas y las notas de lengua.

×