Selección de un modelo de ajuste de datos ybg

2,274 views
2,170 views

Published on

Regresión y ajuste de modelos. El análisis de regresión consiste en encontrar un modelo que relacione los valores medidos de un conjunto de variables.

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
2,274
On SlideShare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
70
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Selección de un modelo de ajuste de datos ybg

  1. 1. TAREA NM TIPO IIPor: Yohana Bonilla GutiérrezI. Alturas ganadoras de medalla de oro. La siguiente tabla muestra la altura ganadora (cm) alcanzada por los medallistas de oro en diversos JuegosOlímpicos: Año 1932 1936 1948 1952 1956 1960 1964 1968 1972 1976 1980 Altura (cm) 197 203 198 204 212 216 218 224 223 225 236Tabla 1 1. Para graficar los puntos de la Tabla 1, utilzaremos el programa Microsoft Office Excel. Nuestras variablesserán:Variable independiente: AñoVariable dependiente: Altura (cm)Los posibles parámetros o variables desconocidas, serian los datos de la Altura (cm), en años posteriores, por ejemplo1984, 1988, etc; o en años previos 1928, 1924... Por lo tanto crearemos dos columnas A y B en una hoja de cálculo de Excel. En el eje X (columna A) pondremosla variable Año, y en el eje Y (columna B) la variable Altura (cm), como vemos en la Fig 1. Figura 1: Columnas en Excel Seleccionamos las dos columnas Año y Altura (cm) e insertamos un gráfico de Dispersión también conocidocomo gráfico XY. (Figura 2). Para esto vamos al menú: Insertar==>Gráficos==>Dispersión ==>Dispersión con líneas suavizadas y marcadores. (Figura 2) 1
  2. 2. Figura 2: Uso del estilo Dispersión para agregar un gráfico en Excel 2. Ahora trataremos de buscar una función que modele el comportamiento de la Gráfica que obtuvimos: Figura 3: Gráfica con los datos de la Tabla 1. El objetivo en este caso, es tratar de encontrar una función que al graficarla tenga aproximadamente la mismaforma de la curva de la Gráfica en la Fig.3 o que cuando reemplacemos los datos de los Años de la Tabla 1, en estafunción, podamos obtener alturas ganadoras cercanas a las reportadas en la Tabla 1. i) Como en la Figura 3 vemos una curva, podriamos empezar tratando de aproximar nuestra función por unpolinomio: y = a0 + a1 x + a2 x2 + ... (1) Pero tratar de encontrar manualmente esta función, es muy complicado, ya que necesitariamos idear una formapara calcular los coeficientes a0 , a1 , a2 ..etc de nuestro polinomio; usando los datos de la Tabla 1. ii) Para evitarnos esta complicación de cálculo podemos empezar proponiendo, una función más simple, unafunción de potencias del tipo: 2
  3. 3. y = bxa (2)donde a y b son constantes, o parámetros que necesitamos determinar. Tenemos aplicando log10 logy = log(bxa ) (3) logy = alogx + logb (4) La Ec (4) tiene la forma de una función lineal cuya gráfica es una recta, donde a es la pendiente de la recta ylogb es el intercepto. Así, si graficamos log(Año) y log(Altura) en un plano XY podemos obtener a y b con los datosde la Tabla 1. Excel nos ayudará a calcular estos logaritmos, y obtenemos la siguiente Tabla: Figura 4: Tabla 2, logarítmica. Hacemos nuevamente un gráfico de Dipersión en Excel y obtenemos: Figura 5: Gráfica de log(Altura) vs. log(Año) Recordemos que nuestro objetivo es la Ecuación 4 , por lo tanto buscamos la mejor línea recta que se ajuste ala Grafica de la Figura 5. En Excel nos paramos en el Gráfico y damos clic derecho en la opción: Agregar líneade tendencia. 3
  4. 4. Figura 6: Agregar linea de tendencia Y nos sale el menú: Formato línea de tendencia==>Opciones línea de tendencia. Elegimos Lineal==>Presentar ecuación en el gráfico, como veremos a continuación: Figura 7: Formato de la linea de tendencia Y finalmente obtenemos el gráfico con la ecuación de la recta que se ajusta a los nuevos datos logarítmicos: 4
  5. 5. Figura 8: Recta de ajuste Excel nos dio la siguiente Ecuación para esta recta: Y = 6, 9012X − 20, 388 y si comparamos con la ecuación: logy = alogx + logb a = 6, 9012 logb = −20, 388 b = 4, 09 × 10−21 Finalmente nuestra función de potencias será: Altura = 4, 09 × 10−21 A˜o6,9012 n (5) 3. En un nuevo sistema de ejes ponemos la función modelo (línea negra sólida) Altura = 4, 09 × 10−21 A˜o6,9012 n con la Gráfica original (puntos rojos): Figura 9: Función modelo y datos originales. Ahora vamos a calcular la Altura (cm) para cada Año, con esta función.Por ejemplo, para el año1932 reemplazamos: Altura = 4, 09 × 10−21 (1932)6,9012 = 194.59 Y así obtenemos la siguiente Tabla: 5
  6. 6. Como los datos se alejan de los de la Tabla 1 Año 1932 1936 1948 1952 1956 1960 1964 1968 1972 1976 1980 Altura (cm) 197 203 198 204 212 216 218 224 223 225 236Tabla 1 , esto nos lleva a pensar que se debe hacer algún tipo de mejora en la función modelo. 4. Hallaremos otra función modelo, probaremos con un polinomio de grado 2: Para hacer esto, estando en Excel, vamos a la Gráfica de la Figura 3. Usamos la opción de Excel Agregar líneade tendencia ==>Formato línea de tendencia==>Opciones línea de tendencia. Y en estas opciones, elegimos: Tipo de tendencia o regresión==>Polinómica==>Ordenación 2. Figura 10: Curva de tendencia: polinomio de grado 2 6
  7. 7. Y finalmente presentamos la Gráfica de los datos de la Tabla 1 y en negro el polinomio de Grado 2 obtenido conExcel: Figura 11: Polinomio de grado 2 y Gráfica inicial La ecuación del polinomio dada por Excel es: y = 0, 0113x2 − 43, 434x + 41947 donde y=Altura, x=Año. Altura = 0, 0113(A˜ o)2 − 43, 434(A˜ o) + 41947 n n (6) Con esta Ecuación (6), obtenemos las Alturas ganadoras de los Años: 1940 y 1944 al reemplazar - 1940: 213,7 cm - 1944: 215,5 cm Y están dentro del rango de los datos de la Tabla 1. * Con este mismo modelo calculamos las Alturas para los Años 1984 y 2016 - 1984: 253,6 cm - 2016: 310,1 cm Estos resultados están por fuera del rango de los datos disponibles, por lo tanto, dependen de la función queelegimos para modelar nuestros datos, en este caso el polinomio de Grado 2. 5. Tabla de datos adicionales: Año 1896 1904 1908 1912 1920 1928 1984 1988 1992 1996 2000 2004 2008 Altura (cm) 190 180 191 193 193 194 235 238 234 239 235 236 236Tabla 3. Datos adicionales Para ver como se ajusta la función polinómica de grado 2 a estos datos adicionales, calcularemos las alturas deestos Años, con la función Ecuación (6): Año 1896 1904 1908 1912 1920 1928 1984 1988 1992 1996 2000 2004 2008 Altura (cm) 217,6 213,6 212,2 211,1 210,10 210,4 253,6 259,4 265,6 272,1 279,0 286,2 293,9Tabla 4. Datos calculados 7
  8. 8. Es claro que los datos que se obtuvieron calculados directamente del polinomio de grado 2, tienen diferenciascon los de la Tabla 3, porque las alturas siempre son muy grandes comparadas con los datos adicionales. Esto nos puede llevar a pensar que quizá podamos probar con una función de un grado más bajo, para obtenerdatos de las Alturas más pequeños. Para ver la tendencia general desde 1986 hasta 2008, llevamos los datos Adicionales, de la Tabla 3. Datos adicionales, a un gráfico de Excel, con el fin de ver el comportamiento de los datos: Gráfica de los Datos Adicionales.Las Alturas ganadoras van aumentando a medida que pasan los Años. Sin embargo hay algunos años donde las Alturas ganadoras no han seguido la tendencia de aumento, por ejemploel año 1904 la altura fue de 180 cm, es decir disminuyó respecto al año anterior reportado 1896, 190cm. Tambiéna partir de 1996 (Altura 239cm) todas las alturas siguientes fueron menores a 239cm. Esto indica la presencia defluctuaciones o cambios en la tendencia de aumento. 6. Vamos a cambiar el polinomio de Grado 2, por uno de orden 1 o sea una función lineal, porque como yavimos con el de orden 2 se obtienen Alturas (cm) que se alejan mucho de las esperadas, porque son muy grandes.Esta función la obtenemos en Excel y su gráfica. i) Como punto de partida podemos intentar graficar una recta que pase por la mayor cantidad de puntos de laGráfica (Fig. 3), en este caso la función que buscariamos sería una función lineal. Recordemos que: una función lineal es una función de la forma y = mx + b (7)donde y y x son las variables dependiente e independiente, m y b son parámetros, y su gráfica es una línea recta. m y b se conocen también como la pendiente de la recta, y el intercepto con el eje de las y, y son variablesdesconocidas. En Excel seguimos la secuencia Agregar línea de tendencia==>lineal, usada antes. Y finalmente obtenemosel gráfico 8
  9. 9. Figura 12: Función lineal Excel nos da la Ecuación: y = 0, 7551x − 1264, 6, donde y=Altura, x=Año, o sea: Altura = 0, 7551(A˜ o) − 1264, 6 n Así, reemplazamos por ejemplo el año 1984, en esta ecuación y obtenemos Altura = 0, 7551 ∗ 1984 − 1264, 6=233,5 y si volvemos la Tabla 3 de los datos adicionales Año 1896 1904 1908 1912 1920 1928 1984 1988 1992 1996 2000 2004 2008 Altura (cm) 190 180 191 193 193 194 235 238 234 239 235 236 236Tabla 3. Datos adicionales podemos comparar y vemos que para ese Año (1984) la altura era de 235cm. Y también hacemos la tabla con la ecuación y = 0, 7551x − 1264, 6 para comparar Finalmente introduciremos un cuadro comparativo de todas las funciones modelos utilizadas, donde se hancalculado con los Años dados en las Tablas las Alturas (cm). 9
  10. 10. 10Figura 13: Cuadro comparativo.

×