Regresion lineal simple.

62,698 views
62,325 views

Published on

Regresion lineal simple
PODRÁS DESCARGARLO EL ARCHIVO COMPLETO: COPIANDO Y PEGANDO EL ENLACE Y ESPERAR 5 SEGUNDOS Y SALTAR PUBLICIDAD http://adf.ly/sjOk5

9 Comments
52 Likes
Statistics
Notes
No Downloads
Views
Total views
62,698
On SlideShare
0
From Embeds
0
Number of Embeds
398
Actions
Shares
0
Downloads
757
Comments
9
Likes
52
Embeds 0
No embeds

No notes for slide

Regresion lineal simple.

  1. 1. REGRESION LINEAL
  2. 2. DEFINICIÓN Técnica estadística Se adapta a una amplia variedad utilizada de situaciones ANÁLISIS DEREGRESIÓN Relación entre Para estudiar: LINEAL variables Medidas económicas, hasta diferentes En lo social: aspectos del comportamiento humano. Para predecir Comenzando un amplio por: rango de fenómenos.
  3. 3. En lo referente a la investigación de mercados: Puede utilizarse para : o para predecir el numero de ventas de un determinado producto. Determinar en cual de los diferentes medios de comunicación es mas eficaz intervenir.
  4. 4. Clases de regresión lineal: Clases de regresión lineal: Regresión lineal Regresión lineal simple multiple
  5. 5. Regresión lineal simple:• Este tipo se presenta cuando una variable independiente ejerce influencia sobre otra variable dependiente. Ejemplo: Y = f(x).• Es una ecuación que define la relación lineal entre dos variables donde una variable depende de la otra variable. Se puede decir que Y depende de X. Y = f(X) Como Y depende de X, entonces: Y es la variable dependiente, explicativa o de predicción . X es la variable independiente o variable respuesta.
  6. 6. PRINCIPIO DE MINIMOS CUADRADOS Técnica empleada para obtener la ecuación de regresión, minimizando la suma de los cuadrados de las distancias verticales entre los valores verdaderos de Y y los valores pronosticados de Y.
  7. 7. ¿QUÉ ES UN GRAFICO DE DISPERSION?Se trata de una representación gráfica del gradode relación entre dos variables cuantitativas
  8. 8. DIAGRAMAS DE DISPERSION
  9. 9. INTRODUCCION:Este documento describe el proceso completo a seguirpara analizar la existencia de una relación lógica entredos variables.Describe la construcción de los Diagramas deDispersión a partir de la recogida de datos acerca dedichas variables y el análisis posterior necesario paraconfirmar la correlación que puede mostrar dichodiagrama, ya que ésta no implica la existencia de unarelación lógica.
  10. 10. DIAGRAMA DE DISPERSION:Es un tipo de diagrama matemático queutiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos. Los datos se muestran como un conjunto de puntos, cada uno con el valor de una variable que determina laposición en el eje horizontal y el valor de la otra variable determinado por la posición en el eje vertical.
  11. 11. CARACTERISTICAS• IMPACTO VISUAL Un Diagrama de Dispersión muestra la posibilidad de la existencia de correlación entre dos variables de un vistazo.• COMUNICACIÓN Simplifica el análisis de situaciones numéricas complejas.• GUÍA EN LA INVESTIGACIÓN El análisis de datos mediante esta herramienta proporciona mayor información que el simple análisis matemático de correlación, sugiriendo posibilidades y alternativas de estudio, basadas en la necesidad de conjugar datos y procesos en su utilización.
  12. 12. NUBE DE PUNTOS O DIAGRAMA DE DISPERSIÓN. 1 Correlación directaSobre la nube depuntos puede trazarseuna recta que se ajustea ellos lo mejor posible, La recta correspondiente a la nube dellamada recta de puntos de la distribución es una recta creciente.regresión.
  13. 13. 2º Correlación inversa 3º Correlación nula En este caso se dice que las La recta correspondiente a la variables son encorraladas y lanube de puntos de la distribución es nube de puntos tiene una formauna recta decreciente. redondeada.
  14. 14. Llamado también ajuste de curvas es una ecuación dada en un grafico,dependiendo del grado de correlación que mas se ajuste al conjuntode datos. AJUSTE LINEAL: Y=BX+A AJUSTE LOGARITMICO: Y=B Ln X+A AJUSTE EXPONENCIAL: Y=AC BX AJUSTE PARABOLICO, CUADRATICO O POLINOMIAL: Y= AX2 + BX + A
  15. 15. Modelos de diagrama de dispersión
  16. 16. El diagrama de dispersión esuna de las herramientas básicas de control de calidad, queincluyen además el histograma, el diagrama de Pareto, la hoja de verificación, los gráficos de control el diagrama de flujo. UN DIAGRAMA DE DISPERSIÓN PUEDE SUGERIR VARIOS TIPOS DE CORRELACIONES ENTRE LAS VARIABLES CON UN INTERVALO DE CONFIANZA DETERMINADO. LA CORRELACIÓN PUEDE SER POSITIVA (AUMENTO), NEGATIVA (DESCENSO), O NULA (LAS VARIABLES NO ESTÁN CORRELACIONADAS).
  17. 17. ¿Cómo elaborar un diagrama de dispersión?
  18. 18. QUE HACER PARA ELABORAR UN DIAGRAMA DE DISPERSIÓN:1. Obtener tabla de pares de valores con valores máximos y mínimos de cada variable.2. Situar la causa sospechada en el eje horizontal.3. Dibujar y rotular los ejes horizontales y verticales.4. Trazar el área emparejada usando círculos concéntricosen pares de datos idénticos.5. Poner título al gráfico y rotular.6. Identificar y clasificar el modelo de correlación.7. Comprobar los posibles fallos en el análisis
  19. 19. ¿Cuando se emplea un diagrama de dispersión? Si existe un parámetro que se incrementa oSe emplea cuando existe disminuye de forma sistemática por el una variable que está experimentador bajo el control del experimentador.. se le denomina parámetro de control o variable independiente = eje de x y habitualmente se representa a lo largo del eje horizontal
  20. 20. UN DIAGRAMA DE DISPERSION ME REPRESENTARÁ a) Una relación causal  Solamente relaciones b) Una explicación lógica para establecer causa-efecto
  21. 21. LOS DIAGRAMAS DE DISPERSIÓN PUEDEN SER:a. De Correlación Positiva Se caracterizan porque al aumentar el valor de una variable aumenta el de la otra.b. De Correlación Negativa Sucede justamente lo contrario, es decir, cuando una variable aumenta, la otra disminuye.c. De Correlación No Lineal. No hay relación de dependencia entre las dos variables.
  22. 22. LINEA DE TENDENCIA Según sea la dispersión de los datos (nube de puntos) en el plano cartesiano, pueden darse alguna de las siguientes relaciones, Lineal, Logarítmica, Exponencial, Cuadrática, entre otras.
  23. 23. El análisis de un Diagrama de Dispersión es un proceso de cuatro pasos:Primero: Elaborar una teoría admisible y relevante sobre la supuesta relaciónentre dos variables.Segundo: Recoger datos y construir el Diagrama.Tercero: Identificar y clasificar la pauta de correlación.Cuarto: Discutir la teoría original y considerar otras explicaciones.La construcción y clasificación del Diagrama de Dispersión es la parte centraldel proceso. No es ni el principio ni el final.
  24. 24. Ventajas ydesventajas de los diagramas de dispersión
  25. 25. VENTAJAS DE LOS DIAGRAMAS DE DISPERSION:  Se trata de una herramienta especialmente útil para estudiar e identificar las posibles relaciones entre los cambios observados en dos conjuntos diferentes de variables.  Suministra los datos para confirmar hipótesis acerca de si dos variables están relacionadas.  Proporciona un medio visual para probar la fuerza de una posible relación.  Su utilización será beneficiosa para el desarrollo de los proyectos abordados por los Equipos y Grupos de Mejora y por todos aquellos individuos u organismos w que estén implicados en la mejora de la calidad.
  26. 26. DESVENTAJAS DEL DIAGRAMA DE DISPERSIÓN: No funciona si sucede que una dupla se repita Solo se emplea cuando existe una variable que esta bajo el control del experimentador. Un diagrama de dispersión puede sugerir varios tipos de correlaciones entre las variables .
  27. 27. CONCLUSIÓNDIAGRAMA DE DISPERSION:Su utilización será beneficiosa para eldesarrollo de los proyectos abordados porlos Equipos y Grupos de Mejora y por todosaquellos individuos u organismos queestén implicados en la mejora de la calidad.
  28. 28. FORMA GENERAL DE LA ECUACION DE REGRESIÒN SIMPLE Y’=a+bxDonde:• Y’ se lee Y prima, es el valor pronosticado de la variable Y para un valor seleccionador de X.• «a» es la ordenada de la intersección con el eje Y, es decir, el valor estimado de Y cuando X=0, es decir, donde la recta de regresión cruza el eje Y.• «b» es la pendiente de la recta, o el cambio promedio en Y’ por unidad de cambio en la variable independiente X.• X es cualquier valor seleccionado de la variable independiente. los valores de a y b en la ecuación de regresión En general, se denominan coeficientes de regresión estimados, o también coeficientes de regresión.
  29. 29. Pendiente de la línea de regresiónDonde:X es el valor de la variable independiente.Y es el valor de la variable dependiente.n es el numero de elementos en la muestra.
  30. 30. Consideraciones básicas para la regresión lineal:Para aplicar correctamente la regresión linealdeben satisfacerse varias suposiciones: 1.-Para cada valor de la variable X hay un conjunto de valores. 2.-Las desviaciones estándar de todas estas distribuciones normales son iguales.
  31. 31. 3.-Las medias de estas distribucionesnormales se encuentran sobre lalínea de regresión.4.-Los valores de Y sonestadísticamente independientes.Esto significa que al tomar lamuestra un determinado valor de Xno depende de ningún otro valorde X. Esta suposición esespecialmente importante cuandose toman los datos durante unperiodo.
  32. 32. Regresión lineal múltiple:• Este tipo se presenta cuando dos o más variables independientes influyen sobre una variable dependiente. Ejemplo: Y = f(x, w, z).• El modelo de regresión lineal múltiple es idéntico al modelo de regresión lineal simple, con la única diferencia de que aparecen más variables explicativas.
  33. 33. CALCULOS NECESARIOS PARA DETERMINAR LAECUACION DE REGRESION DE MINIMOS CUADRADOS EJEMPLO: En la empresa Copier Sales of América, la gerente de ventas recopilo información respecto al numero de llamadas telefónicas hechas y la cantidad de copiadoras vendidas, para una muestra de 10 representantes de ventas. A la señorita Madelei, gerente de esa área, le gustaría ofrecer información especifica referente a la relación entre el numero de llamadas y la cantidad de productos vendidos. Utilice el método de mínimos cuadrados para determinar la ecuación lineal.
  34. 34. Representantes de Llamadas Copiadoras XY ventas de ventas vendidas (Y) (X)CINTHIA 20 30 400 900 600CAROLINA 40 60 1600 3600 2400JOSE LUIS 20 40 400 1600 800CARLOS 30 60 900 3600 1800MILAGROS 10 30 100 900 300MALENA 10 40 100 1600 400BRYAN 20 40 400 1600 800ANGEL 20 50 400 2500 1000BEATRIZ 20 30 400 900 600ANTONIO 30 70 900 4900 2100TOTAL 220 450 5600 22100 10800
  35. 35. Encontrando «b»:
  36. 36. Luego «a»:
  37. 37. De modo que si un vendedor hace 20llamadas telefónicas, puede esperarse que venda :Y’=18.9476+1.1842(X)Y’=18.9476+1.1842(20)Y’=42.6316valor b=1.1842 , significa El que para cada llamada adicional que realizan los representantes de ventas pueden esperar aumentar en casi 1.2 el numero de copiadoras vendidas.
  38. 38. El valor a=18.9476 es el punto dondela ecuación cruza el eje Y. Unatraducción literal es que si no sehacen llamadas, esto es, X=0, sevenderán 18.9476 copiadoras.Obsérvese que X=0 se encuentra fueradel intervalo de valores incluidosen la muestra, las llamadas aclientes fueron de 10 a 40, así que loscálculos deben hacerse dentro deesa gama de valores.
  39. 39. 7060 y`=18,9476+1,1842x5040 Valores Y30 Linear (Valores Y)2010 0 0 10 20 30 40 50
  40. 40. El error de estándar de estimación La desviación estándar se basa es los cuadrados de las desviaciones respecto a la media, mientras que el error estándar de estimación se basa en los en los cuadradosde las desviaciones respecto a la línea de regresión .Si la suma de los cuadrados de las desviaciones es pequeñaesto significa que la línea de regresión es representativa de los datos. Si los cuadrados son grandes, entonces la recta de regresión puede no representar a los datos.
  41. 41. formulas
  42. 42. . ejemplo El ejemplo que se relaciona con la empresa sales of América. La gerente de ventas determino que la ecuación de regresión de mínimos cuadrados era y’=18.9476+ 1.1842x donde y se refiere al número de copiadoras vendidas y X a la cantidad de llamadas telefónicas hechas. Evalué el error estándar de estimación.
  43. 43. CACULOS NECESARIOS PARA OBTENER EL ERROR ESTÁNDARDE ESTIMACIÓN.REPRESENTANTE VENTAS REALES VENTAS DESVIACION DESVIACION ALDE VENTAS (Y) CALCULADAS (Y’) (Y-Y’) CUADRADO (Y-Y’)TOM KELLER 30 42.6316 -12.6316 159.557JEFF HALL 60 66.3156 -6.3156 39.887BRIAN VIROST 40 42.6316 -2.6316 6.925GREG FISH 60 54.4736 5.5264 30.541SUSAN WELCH 30 30.7896 -0.7896 0.623CARLOS RAMIREZ 40 30.7896 9.2104 84.831RICH NILES 40 42.6316 -2.6316 6.925MIKE KIEL 50 42.6316 7.3684 54.293 MARK REYNOLDS 30 42.6316 -12.6316 159.557SONI JONES 70 54.4736 15.5264 241.069 0.0000 784.208
  44. 44. ERROR ESTANDAR DE ESTIMACION SE DETERMINA APLICANDO LA SIGUIENTE FORMULA. ENTONCES EL RESULTADO ES 9.901
  45. 45. El error de estándar de estimación sirve para mostrar la semejanzaque existe en concepto y calculo entre la desviación estándar y elerror estándar de estimación.Supóngase que se estudia un gran número de observaciones y quelas cifras son grandes. Determine cada punto y’ sobre la recta deregresión y elevar al cuadrado las DIFERENCIAS ESTO ES (Y-Y’),SERIA MUY TEDIOSO. LA FORMULA QUE SIGUE ES IDENTICADESDE EL PUNTO DE VISTA ALGEBRAICO A LA ANTERIOR PERO ESMUCHO MAS FACIL DE UTILIZAR.
  46. 46. FORMULA PARA EL ERROR ESTANDAR DE ESTIMACION.Al aplicar esta fórmula sale el mismoresultado que se calculo antes. Se trata delmismo error estándar de estimación.
  47. 47. COEFICIENTE DE CORRELACIÓN Es el estudio de relación que existe entre las variables dependientes e independientes. Que describe la intensidad entre dos conjuntos
  48. 48. EJEMPLOSVARIABLE DEPENDIENTE (Y) VARIABLES INDEPENDIENTES (X1, X2,......)VOLUMEN DE VENTAS, EN UNIDADES Precio unitario Gasto de PropagandaPESO DE LOS ESTUDIANTES Estatura EdadCONSUMO DE BIENES INDUSTRIALES POR Ingreso disponibleAÑO Importación de bienes de consumoUNIDADES CONSUMIDAS DE UN BIEN POR Precio unitario del bienFAMILIA Ingreso Número de integrantes por familia Nº de habitacionesPRECIO DE UNA VIVIENDA Nº de pisos Área construida Área techada , etc.
  49. 49. Nuestro principal objetivo alanalizar las dos variables X yY, para poder determinar larelación entre éstas dosvariables, es decir como secomportan las dos variablesuna con respecto a la otra
  50. 50. COEFICIENTE DE CORRELACIÓN El Coeficiente de Correlación (r): requiere variables medidas en escala de intervaloso de proporción, que Varía entre -1 y 1. • Valores de -1 ó 1 indican correlación perfecta. • Valor igual a 0 indica ausencia de correlación. • Valores negativos indican una relación lineal inversa • valores positivos indican una relación lineal directa
  51. 51. EJEMPLOS DE GRAFICAS DE CORRELACIÓN CORRELACION POSITIVA PERFECTA CORRELACIÓN NEGATIVA PERFECTA10 109 9, 9 98 87 76 65 54 43 32 21 10 0 0 2 4 6 8 10 0 2 4 6 8 10 12 10 CORRELACIÓN NULA 9 8 7 6 5 4 3 2 1 0 0 2 4 6 8 10
  52. 52. FORMULAS QUE NOS PERMITEN HALLAR EL COEFICIENTE DE CORRELACIÓN “R” DE PEARSONMODELOS LÍNEA RECTA y= a+bx CALCULA EL COEFICIENTE DE CORRELACIÓN “R” SIN UTILIZAR MEDIAS ARITMÉTICAS DE LAS VARIABLES n(ΣXY ) (ΣX )(ΣY ) R 2 n(ΣX 2 ) (ΣX ) 2 n ΣY 2 - ΣY
  53. 53. TAMBIÉN SE PUEDE CALCULA EL COEFICIENTE DE CORRELACIÓN “R” UTILIZANDO LAS MEDIAS ARITMÉTICAS DE LAS VARIABLES (x x )( y y) R 2 2 (x x) (y y)n = es el número de pares de observaciones.∑X = es la suma de los valores de la variable X.∑Y = es la suma de los valores de la variable Y.(∑X2) = es la suma de los cuadrados de los valores de la variable X.(∑X)2 = es el cuadrado de la suma de los valores de la variable X.(∑Y2) = es la suma de los cuadrados de los valores de la variable Y.(∑Y)2 = es el cuadrado de la suma de los valores de la variable Y.∑XY = suma de los productos de X y Y.
  54. 54. LÍNEA DOBLE LOGARÍTMICA O CURVA GEOMÉTRICA : y=axb Calcular el coeficiente correlación “R” sin utilizar medias aritméticas de las variables n (log x log y ) ( log x)( log y ) R n (log x) 2 ( log x) 2 n (log y ) 2 ( log y ) 2 Calcular el coeficiente correlación “R” utilizando medias aritméticas de las variables (log x log x)(log y log y ) R (log x log x) 2 (log y log y ) 2
  55. 55. LÍNEA SEMILOGARITMICA O DEL INTERÉS COMPUESTO: Y=abx Calcular el coeficiente correlación sin utilizar los medias aritméticas de las variables n ( x log y ) ( x)( log y ) R n ( x) 2 ( x) 2 n (log y ) 2 ( log y ) 2 Calcular el coeficiente correlación utilizando los medias aritméticas de las variables ( x x)(log y log y ) R (x x) 2 (log y log y ) 2
  56. 56. 57
  57. 57. EJEMPLO El gerente de ventas de la compañía Copiar Sales oí América empresa que tiene una gran fuerza de ventas en todo Estados Unidos y Canadá, desea determinar si existe una relación entre el número de llamadas telefónicas de ventas hechas en un mes, y la cantidad de copiadoras vendidas durante ese lapso. El gerente selecciona al azar una muestra de 10 representantes, y determina el número de tales llamadas que hizo cada uno el mes anterior y la cantidad de productos vendidos. PARA ESTO UTILIZAREMOS LOS MODELOS • LINEAL • DOBLELOGARÍTMICA • SEMILOGARÍTMICA
  58. 58. LLAMADAS Y COPIADORAS VENDIDAS POR LOS 10 REPRESENTANTES REPRESENTANTE NUMERO DE NUMERO DE COPIADORAS VENDIDAS “Y” DE VENTAS LLAMADAS “x”TOM KELLER 20 30JEFF HALL 40 60BRIAN VIROST 20 40GREG FISH 30 60SUSAN WELLCH 10 30CARLOS RAMANIREZ 10 40RICH NILES 20 40MIKE KIEL 0 50MARK REYNOLDS 20 30SONI JONES 30 70TOTAL 220 450
  59. 59. GRÁFICA DE CORRELACIÓN 80 70 y = 1.1842x + 18.947 R² = 0.5761 60COPIADORAS VENDIDAS 50 40 Linear (N° COPIADORAS VENDIDAS) 30 Indica las ventas que hacen más llamadas 20 10 0 0 5 10 15 20 25 30 35 40 45 LLAMADAS
  60. 60. LLAMADAS A CLIENTES REALIZADAS Y COPIADORAS VENDIDAS POR LOS 10 VENDEDORES DE LA MUESTRAS REPRESENTANTE NUMERO DE NUMERO DE COPIADORAS VENDIDAS X2 Y2 xy DE VENTAS LLAMADASTOM KELLER 20 30 400 900 600JEFF HALL 40 60 1600 3600 2400BRIAN VIROST 20 40 400 1600 800GREG FISH 30 60 900 3600 1800SUSAN WELLCH 10 30 100 900 300CARLOS RAMANIREZ 10 40 100 1600 400RICH NILES 20 40 400 1600 800MIKE KIEL 20 50 400 2500 1000MARK REYNOLDS 20 30 400 900 600SONI JONES 30 70 900 4900 2100TOTAL 220 450 5600 22100 10800
  61. 61. LÍNEA RECTA y= a + bx CALCULA EL COEFICIENTE DE CORRELACIÓN “R” SIN UTILIZAR MEDIAS ARITMÉTICAS DE LAS VARIABLES n(ΣXY ) (ΣX )(ΣY ) R 2 n(ΣX 2 ) (ΣX ) 2 n ΣY 2 - ΣY R= 0.759
  62. 62. TAMBIÉN SE PUEDE CALCULAR EL COEFICIENTE DE CORRELACIÓN “R” UTILIZANDO LAS MEDIAS ARITMÉTICAS DE LAS VARIABLES REPRESENT. N° N° COPIADORAS DE VENTAS LLAMADAS “X” “Y” X- X ̅ Y- Y ̅ (X- X ̅ )(Y- Y ̅) (X- X ̅ )2 (Y- Y ̅)2TOM KELLER 20 30 -2 -15 30 4 225JEFF HALL 40 60 18 15 270 324 225BRIAN VIROST 20 40 -2 -5 10 4 25GREG FISH 30 60 8 15 120 64 225SUSAN WELLCH 10 30 -12 -15 180 144 225C. RAMANIREZ 10 40 -12 -5 60 144 25RICH NILES 20 40 -2 -5 10 4 25MIKE KIEL 20 50 -2 5 -10 4 25MARK REYNOLDS 20 30 -2 -15 30 4 225SONI JONES 30 70 8 25 200 64 625TOTAL 220 450 900 760 1850
  63. 63. UTILIZAREMOS LA MEDIA Y SUS PRODUCTOS PARA CALCULAR “R” REPRESENT. N° N° LLAMADAS COPIADORAS DE VENTAS “X” “Y” X- X ̅ Y- Y ̅ (X- X ̅ )(Y- Y ̅) (X- X ̅ )2 (Y- Y ̅)2TOTAL 220 450 900 760 1850 (x x )( y y) R 2 (x x)2 (y y) 900 R (760)(1850) R 0.759
  64. 64. interpretación• El coeficiente de correlación es igual a 0.759• Es positivo de manera que hay una relación directa entre el numero de llamadas a clientes y la cantidad de copiadoras vendidas• El valor esta bastante cercano a 1 por lo que se concluye que la relación es fuerte
  65. 65. LÍNEA DOBLE LOGARÍTMICA O CURVA GEOMÉTRICA: y=axbREPRESENT. NUMERO DE N°DE VENTAS LLAMADAS COPIADORAS log x log y logx logy (log x)2TOM KELLER 20 30 1.30103 1.47712125 1.92177906 1.69267905JEFF HALL 40 60 1.60205999 1.77815125 2.84870498 2.56659622BRIAN VIROST 20 40 1.30103 1.60205999 2.0843281 1.69267905GREG FISH 30 60 1.47712125 1.77815125 2.62654501 2.1818872SUSAN WELLCH 10 30 1 1.47712125 1.47712125 1C. RAMANIREZ 10 40 1 1.60205999 1.60205999 1RICH NILES 20 40 1.30103 1.60205999 2.0843281 1.69267905MIKE KIEL 20 50 1.30103 1.69897 2.21041094 1.69267905MARK REYNOLDS 20 30 1.30103 1.47712125 1.92177906 1.69267905SONI JONES 30 70 1.47712125 1.84509804 2.72543353 2.1818872TOTAL 220 450 13.0614525 16.3379143 21.50249 17.3937659
  66. 66. CALCULA EL COEFICIENTE DE CORRELACIÓN “R” SIN UTILIZAR MEDIAS ARITMÉTICAS DE LAS VARIABLES REPRESENT. NUMERO DE N° DE VENTAS LLAMADAS COPIADORAS log x log y logx logy (log x)2 TOTAL 220 450 13.0614525 16.3379143 21.50249 17.3937659 n (log x log y ) ( log x)( log y )R n (log x) 2 ( log x) 2 n (log y ) 2 ( log y ) 2 10(21.5024) (13.0614525 )(16.33791 439)R 10(17.3937659 - (13.061452 2 . 10(26.8599798 - (16.337914 2 ) 5) ) 3)R 0.68924226 1
  67. 67. TAMBIÉN SE PUEDE CALCULA EL COEFICIENTE DE CORRELACIÓN “R” UTILIZANDO LAS MEDIAS ARITMÉTICAS DE LAS VARIABLESREPRESENT. N° N°DE VENTAS LLAMADAS COPIADORAS Logx-logx logy-logy (logx-logx)2 (logy-logy)2 (logx-logx)(logy-logy)TOM KELLER 20 30 -0.005115 -0.15667 2.616E-05 0.0245455 0.000801369JEFF HALL 40 60 0.295915 0.1443598 0.0875657 0.0208398 0.042718235BRIAN VIROST 20 40 -0.005115 -0.031731 2.616E-05 0.0010069 0.000162306GREG FISH 30 60 0.1709763 0.1443598 0.0292329 0.0208398 0.024682101SUSAN WELLCH 10 30 -0.306145 -0.15667 0.0937248 0.0245455 0.047963791C. RAMANIREZ 10 40 -0.306145 -0.031731 0.0937248 0.0010069 0.009714421RICH NILES 20 40 -0.005115 -0.031731 2.616E-05 0.0010069 0.000162306MIKE KIEL 20 50 -0.005115 0.0651786 2.616E-05 0.0042482 -0.000333389MARK REYNOLDS 20 30 -0.005115 -0.15667 2.616E-05 0.0245455 0.000801369SONI JONES 30 70 0.1709763 0.2113066 0.0292329 0.0446505 0.036128413TOTAL 2.479E-06 -1.67E-08 0.3336118 0.1672355 0.162800923
  68. 68. TAMBIÉN SE PUEDE CALCULAR EL COEFICIENTE DE CORRELACIÓN “R” UTILIZANDO LAS MEDIAS ARITMÉTICAS DE LAS VARIABLESREPRESENT. N° N° Logx-logx logy-logy (logx-logx)2 (logy-logy)2 (logx-logx)(logy-logy)DE VENTAS LLAMADAS COPIADORASTOTAL 2.479E-06 -1.67E-08 0.3336118 0.1672355 0.162800923 (log x log x)(log y log y ) R (log x log x) 2 (log y log y ) 2 0.16280092 3 R 0.3336118 0.1672355 R 0.68924226
  69. 69. LÍNEA SEMILOGARTMICA O DEL INTERÉS COMPUESTO: Y=abx N° COPIADORAS REPRESENTANTES NUMERO DE log y xlogy X2 (log y)2 VENDIDAS"y" DE VENTAS LLAMADAS "X"TOM KELLER 20 30 1.47712125 29.5424251 400 2.1818872JEFF HALL 40 60 1.77815125 71.12605 1600 3.16182187BRIAN VIROST 20 40 1.60205999 32.0411998 400 2.56659622GREG FISH 30 60 1.77815125 53.3445375 900 3.16182187SUSAN WELLCH 10 30 1.47712125 14.7712125 100 2.1818872CARLOS RAMANIREZ 10 40 1.60205999 16.0205999 100 2.56659622RICH NILES 20 40 1.60205999 32.0411998 400 2.56659622MIKE KIEL 20 50 1.69897 33.9794001 400 2.88649908MARK REYNOLDS 20 30 1.47712125 29.5424251 400 2.1818872SONI JONES 30 70 1.84509804 55.3529412 900 3.40438678TOTAL 220 450 16.3379143 367.761991 5600 26.8599798
  70. 70. Calcular el coeficiente correlación sin utilizar los medias aritméticos de las variables N° COPIADORAS REPRESENTANTES NUMERO DE log y xlogy X2 (log y)2 DE VENTAS LLAMADAS "X" VENDIDAS "y"TOTAL 220 450 16.3379143 367.761991 5600 26.8599798 n ( x log y ) ( x)( log y ) R n ( x) 2 ( x) 2 n (log y ) 2 ( log y ) 2 10(367.76199)- 220(16.337 914) R 10(5600) - (220)2 10(26.85998) (16.337914)2 83.278769 R 7600 1.672355 R 0.738692
  71. 71. TAMBIÉN SE PUEDE CALCULAR EL COEFICIENTE DE CORRELACIÓN “R” UTILIZANDO LAS MEDIAS ARITMÉTICAS DE LAS VARIABLES N° REPRESENT. NUMERO DE DE VENTAS LLAMADAS "X" COPIADORAS "y" (X- X ) (log y-logy) (X- X)2 (X- X) (log y-logy) (logy-logy)2TOM KELLER 20 30 -2 -0.156670175 4 0.313340351 0.02454554JEFF HALL 40 60 18 0.14435982 324 2.598476767 0.02083976BRIAN VIROST 20 40 -2 -0.031731439 4 0.063462877 0.00100688GREG FISH 30 60 8 0.14435982 64 1.154878563 0.02083976SUSAN WELLCH 10 30 -12 -0.156670175 144 1.880042103 0.02454554CARLOS RAMANIREZ 10 40 -12 -0.031731439 144 0.380777264 0.00100688RICH NILES 20 40 -2 -0.031731439 4 0.063462877 0.00100688MIKE KIEL 20 50 -2 0.065178574 4 -0.130357149 0.00424825MARK REYNOLDS 20 30 -2 -0.156670175 4 0.313340351 0.02454554SONI JONES 30 70 8 0.21130661 64 1.69045288 0.04465048TOTAL 220 450 760 8.327876885 0.16723553
  72. 72. Calcular el coeficiente correlación utilizando los medias aritméticas de las variables REPRESENT. NUMERO DE N° (logy-logy)2 DE VENTAS LLAMADAS "X" COPIADORAS "y" (X- X ) (log y-logy) (X- X)2 (X- X) (log y-logy)TOTAL 220 450 760 8.327876885 0.16723553 (x x)(log y log y ) R (x x) 2 (log y log y ) 2 8.327876885 R 760 0.1672355 R 0.738692
  73. 73. El coeficiente de correlación para estos modelos esLÍNEA RECTA y= a+bx R= 0.759 76%LÍNEA DOBLE LOGARÍTMICA:y=axb R 0.689 68%LÍNEA SEMILOGARTMICA: Y=abx R 0.738 74% De esto podemos concluir que el mejor modelo para calcular el coeficiente de correlación es el de la línea recta ya que explica un 75%
  74. 74. COEFICIENTE DE DETERMIANCION Mide la variación de la variable y explicada en la variable x. Es útil porque da la proporción de la varianza (variación) de una variable que es predecible a partir de la otra variable. El coeficiente de determinación es la proporción de la variación explicada al total variación.
  75. 75. Formula para calcular el Coeficiente de Determinación ^ 2 2 (Y Y ) r 1 2 (Y Y )
  76. 76. Otro método de calcularlo Es elevar al cuadrado el coeficiente de correlación n(ΣXY ) (ΣX )(ΣY )r 2 n(ΣX ) (ΣX ) n ΣY - ΣY 2 2 2
  77. 77. Ingreso A. X.Y y2 (x) familiar(y) x2 Y^ Ejemplo 48 24 1152 2304 576 23.7 40 18 720 1600 324 16.7 30 9 270 900 81 7.9 39 14 546 1521 196 15.8Determinar el 46 22 1012 2116 484 21.9coeficiente de 42 22 924 1764 484 18.4determinación 27 4 108 729 16 5.3 36 13 468 1296 169 13.2 34 10 340 1156 100 11.4 46 20 920 2116 400 21.9Ingreso y 32 12 384 1024 144 9.7ahorro familiar 42 18 756 1764 324 18.4de 15trabajadores 40 16 640 1600 256 16.7 32 8 256 1024 64 9.7 27 6 162 729 36 5.3 561 216 8658 21643 3654 216
  78. 78. donde Variación no explicada (Y Y ^ )2 78.82 Variación total (Y Y )2 543.60 Por lo tanto el 93.4% de la 543.60 78.82 variación en y(ahorro familiar)r2 0.934 543.60 esta siendo explicado por su relación lineal con x(ingreso)
  79. 79. DR: CARLOS FRANCO C. ALUMNOS: • VALLADARES DE LA CRUZ CARLA VANESA • GRAUS RIOS ADAN • MERCEDES AMARANTO JEFFERSON • MARQUEZ MESTANZA KATHIA • REYES BARRETO JUAN DIEGO • VARGAS BARRANTES JUAN ALBERTO
  80. 80. Merecemos un aplauso por nuestra participación ¡Gracias!

×