Your SlideShare is downloading. ×
0
Regresión lineal y correlación
Análisis de correlación <ul><li>El  análisis de correlación  es un grupo de técnicas estadísticas usadas para medir la fue...
El coeficiente de correlación,  r <ul><li>El  coeficiente de correlación  ( r ) es una medida de la intensidad de la relac...
Correlación negativa perfecta 10 9 8 7 6 5 4 3 2 1 0 0  1  2  3  4  5  6  7  8  9  10 X Y
Correlación positiva perfecta 10 9 8 7 6 5 4 3 2 1 0 0  1  2  3  4  5  6  7  8  9  10 X Y
Correlación cero 10 9 8 7 6 5 4 3 2 1 0 0  1  2  3  4  5  6  7  8  9  10 Y X
Correlación positiva fuerte Y X 10 9 8 7 6 5 4 3 2 1 0 0  1  2  3  4  5  6  7  8  9  10
Fórmula para  r <ul><li>Calculamos el coeficiente de correlación de las fórmulas siguientes. </li></ul>
Coeficiente de determinación <ul><li>El coeficiente de determinación ( r 2 ) es la proporción de la variación total en la ...
Ejemplo 1 <ul><li>Juan Escobedo, presidente de la sociedad de  alumnos de la Universidad de Toledo, se ocupa de estudiar e...
<ul><li>Libro   Páginas   Precio ($) </li></ul><ul><li>Intr. a la Historia 500 84 </li></ul><ul><li>Álgebra 700 75 </li></...
Ejemplo 1  (Continuación)
<ul><li>Libro   Páginas   Precio ($) </li></ul><ul><li>  X  Y   XY   X 2 Y 2 </li></ul><ul><li>Intr. a la Historia 500   8...
Ejemplo 1  (Continuación)
<ul><li>La correlación entre el número de páginas y el precio de venta del libro es 0.614. Esto indica una asociación mode...
<ul><li>Paso 3:   Para encontrar el valor del  estadístico de prueba, utilizamos: </li></ul><ul><li>Paso 4:  H 0  no se re...
Análisis de regresión <ul><li>En análisis de regresión utilizamos la variable independiente ( X ) para estimar la variable...
Análisis de regresión <ul><li>La ecuación de regresión es:  Y' = a + bX,  donde: </li></ul><ul><li>Y'  es el valor pronost...
Análisis de regresión <ul><li>El principio de mínimos cuadrados se utiliza para obtener  a  y  b . Las ecuaciones para det...
<ul><li>Desarrolle una ecuación de regresión para la información dada en el Ejemplo 1 que se puede utilizar para estimar e...
<ul><li>La ecuación de regresión es: </li></ul><ul><li>Y'  = 48.0 + .05143X </li></ul><ul><li>La ecuación cruza al eje Y e...
<ul><li>Podemos utilizar la ecuación de regresión para  </li></ul><ul><li>estimar valores de  Y. </li></ul><ul><li>El prec...
El error estándar de estimación <ul><li>El error estándar de estimación  mide la dispersión de los valores observados alre...
<ul><li>Encuentre el error estándar de estimación para el  </li></ul><ul><li>problema que implica el número de páginas en ...
Suposiciones subyacentes en el análisis de regresión lineal <ul><li>Para cada valor de  X,  hay un grupo de valores de  Y,...
Intervalo de confianza <ul><li>El intervalo de confianza para el valor medio de  Y  para un valor dado de  X  está dado po...
Intervalo de predicción <ul><li>El intervalo de predicción para un valor individual de  Y  para un valor dado de  X  se da...
<ul><li>Resumir los resultados: </li></ul><ul><li>El precio de venta estimado para un libro con 800 páginas es $89.14. </l...
<ul><li>Regression Analysis: Price versus Pages </li></ul><ul><li>The regression equation is </li></ul><ul><li>Price = 48....
Upcoming SlideShare
Loading in...5
×

Regresión lineal y correlación

162,704

Published on

Published in: Technology
5 Comments
33 Likes
Statistics
Notes
No Downloads
Views
Total Views
162,704
On Slideshare
0
From Embeds
0
Number of Embeds
14
Actions
Shares
0
Downloads
3,092
Comments
5
Likes
33
Embeds 0
No embeds

No notes for slide

Transcript of "Regresión lineal y correlación"

  1. 1. Regresión lineal y correlación
  2. 2. Análisis de correlación <ul><li>El análisis de correlación es un grupo de técnicas estadísticas usadas para medir la fuerza de la asociación entre dos variables. </li></ul><ul><li>Un diagrama de dispersión es una gráfica que representa la relación entre dos variables. </li></ul><ul><li>La variable dependiente es la variable que se predice o calcula. </li></ul><ul><li>La variable independiente proporciona las bases para el cálculo. Es la variable de predicción. </li></ul>
  3. 3. El coeficiente de correlación, r <ul><li>El coeficiente de correlación ( r ) es una medida de la intensidad de la relación lineal entre dos variables. </li></ul><ul><li>Requiere datos de nivel de razón. </li></ul><ul><li>Puede tomar cualquier valor de -1.00 a 1.00. </li></ul><ul><li>Los valores de -1.00 o 1.00 indican la correlación perfecta y fuerte. </li></ul><ul><li>Los valores cerca de 0.0 indican la correlación débil. </li></ul><ul><li>Los valores negativos indican una relación inversa y los valores positivos indican una relación directa. </li></ul>
  4. 4. Correlación negativa perfecta 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 X Y
  5. 5. Correlación positiva perfecta 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 X Y
  6. 6. Correlación cero 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 Y X
  7. 7. Correlación positiva fuerte Y X 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10
  8. 8. Fórmula para r <ul><li>Calculamos el coeficiente de correlación de las fórmulas siguientes. </li></ul>
  9. 9. Coeficiente de determinación <ul><li>El coeficiente de determinación ( r 2 ) es la proporción de la variación total en la variable dependiente ( y ) que se explica por la variación en la variable independiente ( x ) . </li></ul><ul><li>Es el cuadrado del coeficiente de correlación. </li></ul><ul><li>Su rango es de 0 a 1. </li></ul><ul><li>No da ninguna información sobre la dirección de la relación entre las variables. </li></ul>
  10. 10. Ejemplo 1 <ul><li>Juan Escobedo, presidente de la sociedad de alumnos de la Universidad de Toledo, se ocupa de estudiar el costo de los libros de texto. Él cree que hay una relación entre el número de páginas en el texto y el precio de venta del libro. Para proporcionar una prueba, selecciona una muestra de ocho libros de texto actualmente en venta en la librería. Dibuje un diagrama de dispersión. Compruebe el coeficiente de correlación. </li></ul>
  11. 11. <ul><li>Libro Páginas Precio ($) </li></ul><ul><li>Intr. a la Historia 500 84 </li></ul><ul><li>Álgebra 700 75 </li></ul><ul><li>Intr.a la Psicología 800 99 </li></ul><ul><li>Intr. a la Sociología 600 72 </li></ul><ul><li>Mercadotecnia 400 69 </li></ul><ul><li>Intr. a la Biología 500 81 </li></ul><ul><li>Fund. de Jazz 600 63 </li></ul><ul><li>Intr.a la Enfermería 800 93 </li></ul>Ejemplo 1 (Continuación)
  12. 12. Ejemplo 1 (Continuación)
  13. 13. <ul><li>Libro Páginas Precio ($) </li></ul><ul><li> X Y XY X 2 Y 2 </li></ul><ul><li>Intr. a la Historia 500 84 42,000 250,000 7,056 </li></ul><ul><li>Álgebra 700 75 52,500 490,000 5,625 </li></ul><ul><li>Intr. a la Psicología 800 99 79,200 640,000 9,801 </li></ul><ul><li>Intr. a la Sociología 600 72 43,200 360,000 5,184 </li></ul><ul><li>Mercadotecnia 400 69 27,600 160,000 4,761 </li></ul><ul><li>Intr. a la Biología 500 81 40,500 250,000 6,561 </li></ul><ul><li>Fund. de Jazz 600 63 37,800 360,000 3,969 </li></ul><ul><li>Intr. a la Enfermería 800 93 74,400 640,000 8,649 </li></ul><ul><li>Total 4,900 636 397,200 3,150,000 51,606 </li></ul>Ejemplo 1 (Continuación)
  14. 14. Ejemplo 1 (Continuación)
  15. 15. <ul><li>La correlación entre el número de páginas y el precio de venta del libro es 0.614. Esto indica una asociación moderada entre las variables. Pruebe la hipótesis de que no hay correlación en la población. Utilice un nivel de la significancia del .02. </li></ul><ul><li>Paso 1: H 0 : La correlación en la población es cero. </li></ul><ul><li>H 1 : La correlación en la población no es cero. </li></ul><ul><li>Paso 2: H 0 es rechazada si t >3.143 o si t <-3.143 . </li></ul><ul><li>Hay 6 grados de libertad, encontrados cerca. </li></ul><ul><li>n – 2 = 8 – 2 = 6. </li></ul>Ejemplo 1 (Continuación)
  16. 16. <ul><li>Paso 3: Para encontrar el valor del estadístico de prueba, utilizamos: </li></ul><ul><li>Paso 4: H 0 no se rechaza. No podemos rechazar la hipótesis de que no hay correlación en la población. La cantidad de asociación puede ser debido al azar. </li></ul>Ejemplo 1 (Continuación)
  17. 17. Análisis de regresión <ul><li>En análisis de regresión utilizamos la variable independiente ( X ) para estimar la variable dependiente ( Y ) . </li></ul><ul><li>La relación entre las variables es lineal. </li></ul><ul><li>Ambas variables deben ser por lo menos escala del intervalo. </li></ul><ul><li>El criterio de mínimos cuadrados se utiliza para determinar la ecuación. Este es el término (Y – Y') 2 </li></ul>
  18. 18. Análisis de regresión <ul><li>La ecuación de regresión es: Y' = a + bX, donde: </li></ul><ul><li>Y' es el valor pronosticado de la variable Y para un valor seleccionado de X . </li></ul><ul><li>a es la ordenada de la intersección con el eje Y cuando X = 0. Es el valor estimado de Y cuando X= 0 </li></ul><ul><li>b es la pendiente de la recta, o el cambio promedio en Y' para cada cambio de una unidad en X. </li></ul><ul><li>el principio de mínimos cuadrados se utiliza para obtener a y b . </li></ul>
  19. 19. Análisis de regresión <ul><li>El principio de mínimos cuadrados se utiliza para obtener a y b . Las ecuaciones para determinar a y b son: </li></ul>
  20. 20. <ul><li>Desarrolle una ecuación de regresión para la información dada en el Ejemplo 1 que se puede utilizar para estimar el precio de venta basado en el número de páginas. </li></ul>Ejemplo 2 (Continuación)
  21. 21. <ul><li>La ecuación de regresión es: </li></ul><ul><li>Y' = 48.0 + .05143X </li></ul><ul><li>La ecuación cruza al eje Y en $48. Un libro sin las páginas costaría $48. </li></ul><ul><li>La pendiente de la línea es .05143. El costo de cada página adicional es de cinco céntimos. </li></ul><ul><li>El signo del valor de b y el signo del valor de r serán siempre iguales. </li></ul>Ejemplo 2 (Continuación)
  22. 22. <ul><li>Podemos utilizar la ecuación de regresión para </li></ul><ul><li>estimar valores de Y. </li></ul><ul><li>El precio de venta estimado de un libro de 800 páginas es $89.14, encontrado por </li></ul>Ejemplo 2 (Continuación)
  23. 23. El error estándar de estimación <ul><li>El error estándar de estimación mide la dispersión de los valores observados alrededor de la línea de regresión. </li></ul><ul><li>Las fórmulas que se utilizan para comprobar el error estándar son: </li></ul>
  24. 24. <ul><li>Encuentre el error estándar de estimación para el </li></ul><ul><li>problema que implica el número de páginas en un libro </li></ul><ul><li>y el precio de venta. </li></ul>Ejemplo 3
  25. 25. Suposiciones subyacentes en el análisis de regresión lineal <ul><li>Para cada valor de X, hay un grupo de valores de Y, y estos valores de Y se distribuyen normalmente. </li></ul><ul><li>Las medias de estas distribuciones normales de valores Y, caen todas en la recta de regresión. </li></ul><ul><li>Las desviaciones estándar de estas distribuciones normales son iguales. </li></ul><ul><li>Los valores de Y son estadísticamente independendientes. Esto significa que en la selección de una muestra, los valores de Y elegidos para un valor particular de X no dependen de los valores de Y de ningún otro valor de X. </li></ul>
  26. 26. Intervalo de confianza <ul><li>El intervalo de confianza para el valor medio de Y para un valor dado de X está dado por: </li></ul>
  27. 27. Intervalo de predicción <ul><li>El intervalo de predicción para un valor individual de Y para un valor dado de X se da por: </li></ul>
  28. 28. <ul><li>Resumir los resultados: </li></ul><ul><li>El precio de venta estimado para un libro con 800 páginas es $89.14. </li></ul><ul><li>El error estándar de estimación es $10.41. </li></ul><ul><li>El intervalo de confianza de 95% para todos los libros con 800 páginas es $89.14+-$15.31. Esto significa que los límites están entre $73.83 y $104.45. </li></ul><ul><li>El intervalo de predicción de 95% para un libro particular con 800 páginas es $89.14+-$29.72. Esto significa que los límites están entre $59.42 y $118.86. </li></ul><ul><li>Estos resultados aparecen en la siguiente salida de MINITAB. </li></ul>Ejemplo 3 (Continuación)
  29. 29. <ul><li>Regression Analysis: Price versus Pages </li></ul><ul><li>The regression equation is </li></ul><ul><li>Price = 48.0 + 0.0514 Pages </li></ul><ul><li>Predictor Coef SE Coef T P </li></ul><ul><li>Constant 48.00 16.94 2.83 0.030 </li></ul><ul><li>Pages 0.05143 0.02700 1.90 0.105 </li></ul><ul><li>S = 10.41 R-Sq = 37.7% R-Sq(adj) = 27.3% </li></ul><ul><li>Analysis of Variance </li></ul><ul><li>Source DF SS MS F P </li></ul><ul><li>Regression 1 393.4 393.4 3.63 0.105 </li></ul><ul><li>Residual Error 6 650.6 108.4 </li></ul><ul><li>Total 7 1044.0 </li></ul><ul><li>Predicted Values for New Observations </li></ul><ul><li>New Obs Fit SE Fit 95.0% CI 95.0% PI </li></ul><ul><li>1 89.14 6.26 ( 73.82, 104.46) ( 59.41, 118.88) </li></ul>Ejemplo 3 (Continuación)
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×