Unidad V

658 views
615 views

Published on

Que el estudiante, se capacite en el tratamiento estadístico de datos experimentales utilizando el método de mínimos cuadrados. Explicar qué es un diagrama de dispersión y cuál es la causa de la dispersión de los datos en dicho diagrama

Published in: Education
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
658
On SlideShare
0
From Embeds
0
Number of Embeds
30
Actions
Shares
0
Downloads
51
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Unidad V

  1. 1. UNIDAD VANÁLISIS DE DATOSEXPERIMENTALESPOR MÍNIMOS CUADRADOS
  2. 2. CONTENIDO5.1 Ajuste de Curvas5.2 Análisis de Regresión5.2.1 Métodos de Mínimos Cuadrados5.2.2 Regresión Lineal5.2.3 Regresión Curvilínea5.2.3.1 Función Potencial: YC = a Xb5.2.3.2 Función Exponencial: YC = a bx
  3. 3. 5.1 AJUSTE DE CURVASUno de los objetivos en el análisis de resultados es elllegar a establecer una relación cuantitativa entre dos omás variables y mediante esta relación poder efectuarpredicciones.Por lo general la relación consiste en una ecuación queexpresa cómo la variable dependiente (cuyo valor sedesea predecir) es afectada por una o más variablesindependientes.
  4. 4. En esta unidad se ilustra la forma de establecer la posiblerelación de una variable dependiente con otra variableconsiderada independiente. El primer paso es disponerde una colección de datos obtenidos experimentalmente.Si se simbolizan por X y Y las variables independiente ydependiente respectivamente, y sus valores particularespor X1, Y1, X2, Y2, etc., en una tabla se dispondrían así.El siguiente paso es representar los puntos (X1, Y1 ), (X2,Y2) . . . . , (XN, YN) en un sistema de coordenadasrectangulares. El sistema de puntos resultantes se llamadiagrama de dispersión.
  5. 5. Con el diagrama de dispersión es posible representar unacurva que se aproxime a los datos, es decir, que siga latendencia de los mismos. Tal curva se llama curva deaproximación.En la figura 5.1 (a) , por ejemplo, se ve que los datosexperimentales se aproximan bien a una línea recta y sedice que entre las variables existe una relación lineal. Enb), existe una relación no lineal.
  6. 6. Las curvas mostradas en la Fig. 5.1 se denominan curvasde aproximación y describen la tendencia de los puntosen el diagrama de dispersión. El problema general dehallar la ecuación de la curva de aproximación que seajuste mejor al conjunto de datos con los que se obtuvo eldiagrama de dispersión se denomina determinación de laCURVA DE AJUSTE.Una curva de aproximación como la de la Fig. 5.1 (a)sugiere una ecuación lineal; (ecuación de la recta) Y = a +bX; mientras que la de la curva en la Fig. 5.1 (b) sugiereuna ecuación cuadrática (parabólica) de la forma Y = a +bX + cX2
  7. 7. La dispersión de los puntos se debe a los errores queafectan en el proceso de medición tanto a la variabledependiente como a la independiente. En ocasionespuede despreciarse el error en la variable independienteal compararse con el error (o variación aleatoria) de lavariable dependiente. Esto dependerá de la situaciónparticular de las causas de error sobre cada variable alrealizar el experimento.
  8. 8. Ejemplo:Del análisis de un fenómeno se obtuvieron los siguientesresultados.
  9. 9. 5.2 ANÁLISIS DE REGRESIÓNUno de los propósitos principales de la curva de ajuste esestimar una de las variables a partir de la otra. El procesode estimación se conoce como regresión. Si Y se va aestimar a partir de X por medio de alguna ecuación lallamamos ecuación de regresión de Y sobre X y a la curvacorrespondiente curva de regresión de Y sobre X.A continuación se presentan algunos ejemplos derelaciones denominadas funciones o ecuaciones depredicción:
  10. 10. Línea Recta:Yc = a + bXEcuación de segundo grado o cuadrática:Yc = a + bX + cX2Ecuación potencial:Yc = KXn o Yc = aXbEcuación exponencial:Yc = A DX o Yc = a bX
  11. 11. En estos ejemplos, Yc representa el valor estimado de lavariable dependiente a partir del valor X, de la variableindependiente.Existen varios métodos para determinar la ecuación deregresión. El "método de mínimos cuadrados", que sedescribe mas adelante, se considera el mejor; porfundamentarse en el tratamiento estadístico de los datosexperimentales.
  12. 12. Como se mencionó anteriormente, los errores afectantanto a la variable independiente como a la variabledependiente, sin embargo en muy diversos casos lavariable independiente puede considerarse sin error (ode error despreciable) y considerar que la dispersión esdebido únicamente a los errores en la variabledependiente. En este caso se considera que para un valorpuntual de X (sin error) el valor experimental de Y seaparta del valor que predice la curva de regresión.
  13. 13. 5.2.1 MÉTODO DE MÍNIMOS CUADRADOSGeneralmente, más de una curva de un tipo dado pareceajustarse a un conjunto de datos. Para evitar el juicioindividual en la construcción de rectas, parábolas u otrascurvas de aproximación, es necesario obtener unadefinición de la "mejor curva de ajuste", mejor parábolade ajuste," etc.Considérese la Fig. 5.2 en la cual los puntos de unconjunto de datos (hipotéticamente experimentales) seexpresan por (X1 , Y1), (X2, Y2) . . . . . (Xn, Yn).
  14. 14. Para un valor dado de x, por ejemplo X1 habrá unadiferencia entre el valor de Y1 y el valor correspondientede la curva C.Esta diferencia se denota por D1 y se conoce comodesviación, error, o residuo y puede ser positivo, negativoo cero. Análogamente, correspondiendo a los valores X2 ,X3 . . . , XN obtenemos las desviaciones D2 , D3 , . . . , DN
  15. 15. Una medida de la "bondad de ajuste" de la curva C alconjunto de datos la suministra la cantidad D12 + D22 +….. + DN2. Si la suma es pequeña el ajuste es bueno, si esgrande, el ajuste es malo.Definición:De todas las curvas de aproximación correspondientes aun conjunto de puntos dados, la curva que tenga lapropiedad de que D12 + D22 + ….. + DN2 es mínimo, seconoce como la mejor curva de ajuste.
  16. 16. Una curva con esta propiedad se dice que ajusta los datospor mínimos cuadrados y se llama "Curva de regresiónde mínimos cuadrados" o simplemente "Curva demínimos cuadrados“.Una recta con esta propiedad se llama recta de mínimoscuadrados, una parábola con esta propiedad se llamaparábola de mínimos cuadrados, etc.
  17. 17. 5.2.2 REGRESIÓN LINEALSe aplica el método de mínimos cuadrados paradeterminar la ecuación de regresión. Para una relaciónlineal en general Yc = a + bX ; Yc representa el valorteórico de Yi ó el valor estimado de Y que corresponde aun valor particular de X.El criterio de mínimos cuadrados requiere ladeterminación de los valores de "a" y "b" tal que Z = Σ(Yi- Yc)2 sea un mínimo (es decir, que tienda a cero). En laecuación de la relación lineal "a" y "b" se denominancoeficientes de regresión:"a" es la intercepción con el eje de las ordenadas Y"b" es la pendiente de la línea, que mejor se ajusta.
  18. 18. Como se busca la recta que mejor se ajuste a los puntosexperimentales, el intercepto “a” y la pendiente “b”adquieren el carácter de variables; ya que estosparámetros son los que diferencian a una recta de otra.Sea:Z = Σ(Yi - Yc)2Sustituyendo Yc = a + bXZ = Σ(Yi - a - bX)2Debe ser un mínimo de acuerdo a la definición de mejorcurva de ajuste (en este caso, mejor recta de ajuste).
  19. 19. Utilizando el cálculo diferencial con derivadas parcialesactuando sobre sumatorias, se llega a establecer unsistema de dos ecuaciones, denominadas ecuacionesnormales para la regresión lineal o ecuaciones normalespara la recta de mínimos cuadrados.Donde n es el número de pares ordenados (X, Y) onúmero de puntos o número de observaciones, a y b sonincógnitas que representan, como ya se mencionó,respectivamente, el intercepto y la pendiente de la rectade mínimos cuadrados.
  20. 20. Para resolver estas ecuaciones se requiere obtener ΣX,ΣY, ΣXY y ΣX2Simultaneando las ecuaciones (1) y (2), de manera literal,estás se disponen de la siguiente manera:
  21. 21. Ejemplo:Se quiere determinar la constante “K” (N/m) de unresorte, a partir de la ley de Hooke. Para el experimento sedispone de diferentes masas y por cada variación de masa,se mide la deformación del resorte.El equipo con el cual, se harán las pruebas se muestra acontinuación:
  22. 22. La tabla de datos, generada a partir de la observación es:Considere las siguientes observaciones: La ley de Hooke: Fs = K*x (N) Aceleración de la gravedad: g = 9.78 m/s2Construya preliminarmente la tabla de datos querelacione la fuerza con la deformación:
  23. 23. La tabla de datos, generada a partir de la observación es:Construya el diagrama de dispersión, para la relaciónentre las variables de fuerza contra deformación delresorte. Con esto se verificará la tendencia de los datosexperimentados.
  24. 24. Grafico:Diagrama deDispersión
  25. 25. Grafico:Curva deAproximación
  26. 26. Al analizar la dispersión de los datos y trazando latendencia de ellos, podemos observar que es una relaciónlineal. Por lo consiguiente aplicaremos el método demínimos cuadrados.Acomodando las ecuaciones de mínimos cuadrados a lasvariables que poseemos en el experimento:Construya la tabla para satisfacer las relacionesanteriores:
  27. 27. Llenando la tabla con los datos requeridos:
  28. 28. Resolviendo las ecuaciones de solución:•Resolviendo para “a”•Resolviendo para “b”
  29. 29. Finalmente, la ecuación de regresión queda así:Se tomaran dos de los datos de la variable independientey se realizara una interpolación con la ecuación calculada(a través del método de mínimos cuadrados).Este procedimiento se realizara para determinar la“Curva de regresión de mínimos cuadrados”
  30. 30. Grafico:Curva deRegresión deMínimosCuadrados
  31. 31. 5.2.3 Regresión Curvilínea5.2.3.1 Función potencial o curva geométrica: Yc = aXbAplicando logaritmo a la función Yc = aXb, tenemos:Log Yc = Log a + b Log XTal como hemos dicho anteriormente, la expresión(Log Yi - Log Yc)2 es un mínimo; sustituyendo en estaexpresión Log Yc por su valor, tenemos:(Log Yi - Log a - b Log X)2 (es un mínimo)
  32. 32. Al derivar parcialmente con respecto a "a" y respecto a"b" e igualar a cero las derivadas, obtenemos lasecuaciones normales siguientes:Log Y = n Log a + b Log X (1)Log X Log Y = Log a Log X + b (Log X)2 (2)Despejando para “a” y “b” tenemos que:
  33. 33. Ejemplo:Una muestra de un gas ideal se expande, según la tablade datos extraídos del experimento; el proceso se da encondiciones de cuasiequilibrio, para el cual podemosdecir que la relación entre las variables es: P = kVb
  34. 34. Grafico
  35. 35. Grafico
  36. 36. Relacionando las ecuaciones para determinar lasvariables “a” y “b”Aplicándola a nuestras variablesPlantear la tabla en relación con las ecuaciones:
  37. 37. Tabla con los datos obtenidos:Sustituir los datos calculados en las ecuaciones, paradeterminar las constantes “k” y “b”
  38. 38. •Calculo para determinar la constante “k”:•Calculo para determinar la constante “b”:
  39. 39. La Ecuación de regresión se puede expresar como:De acuerdo al planteamiento anterior, la relación entre lasvariables se puede escribir de la siguiente manera:(Pa)
  40. 40. Curva de regresión parabólica de mínimos cuadrados
  41. 41. 5.2.3 REGRESIÓN CURVILÍNEA5.2.3.2 Caso Exponencial: Yc = A DXLa función exponencial se presenta en multitud defenómenos de crecimiento animal, vegetal, económico,físicos, etc. En todos ellos la variable mas usada es eltiempo.En el crecimiento exponencial, cada valor de “Y” seobtiene multiplicando el valor anterior por una cantidadconstante “D”
  42. 42. Donde “A” es el valor inicial para x=0, además, “A” es elfactor por el que se multiplica en cada unidad de lavariable independiente. Si 0 < D < 1 se trata de undecrecimiento exponencial.La función exponencial sirve para describir cualquierproceso que evolucione de modo que el aumento (odisminución) en un pequeño intervalo, sea proporcionala lo que había al comienzo del mismo.Al aplicar cálculo integral, se llega a una expresión deltipo Y = A DX , que es una relación exponencial ya que xestá como exponente de una base D.
  43. 43. Para encontrar la función que mejor se ajusta a losresultados obtenidos, haremos uso de los mínimoscuadrados.Aplicando logaritmo a Yc = ADX tenemos:Log Yc = Log A + X Log DComo en los casos anteriores, interesa minimizar laexpresión:Z = (Log Yi - Log a - X Log b)2
  44. 44. Al derivar parcialmente con respecto a “A" y “D" e igualara cero las derivadas llegamos a las siguientes ecuacionesnormales:Log Yi = n Log A + Log D Xi (1)X Log Yi = Log A Xi + Log D Xi2 (2)En este caso, X representa a la variable independiente, yY es la variable dependiente. Despejando para “A” y “D”:
  45. 45. Ejemplo:Se lleva a verificación la ley de enfriamiento de Newton yse dispone el equipo como se muestra en la figura. Luegoque el termómetro alcanza el equilibrio en el medioambiente, se obtuvieron los siguientes datos:
  46. 46. Fundamento Teórico:La ley de enfriamiento de Newton se escribe como:Donde:dT/dt: representa la rapidez del enfriamientoT: es la temperatura instantánea del cuerpoK: es una constante que define el ritmo del enfriamientoTo: es la temperatura del ambienteSi el cuerpo se enfría a partir de la temperatura Tm hastauna To y la ley de enfriamiento de Newton es válida paraexplicar su enfriamiento, la ecuación:
  47. 47. Cuantificando el fenómeno, se recogieron los siguientesvalores experimentales; donde cada cinco minutos se leíael termómetro expuesto al medio (To = 32 oC)
  48. 48. Grafico de dispersión
  49. 49. Curva de aproximación
  50. 50. Relacionando las ecuaciones para determinar lasvariables “A” y “D” :Aplicándola a nuestras variables:Plantear la tabla en relación con las ecuaciones:
  51. 51. Tabla con los datos obtenidos:
  52. 52. Sustituir los datos calculados en la tabla, para lasecuaciones de mínimos cuadrados:
  53. 53. De acuerdo al planteamiento anterior, la relación entre lasvariables se puede escribir de la siguiente manera:Realizando la mejor curva de ajuste, a partir de laecuación de ajuste
  54. 54. Curva de regresión exponencial de mínimos cuadrados
  55. 55. Calculo del porcentaje de error para “D”:
  56. 56. UNIDAD VANÁLISIS DE DATOSEXPERIMENTALESPOR MÍNIMOS CUADRADOS(Ejercicios adicionales)
  57. 57. Ejercicio 13Un grupo de alumnos investigaron sobre el movimientoparabólico de un balín, los valores que obtuvieron semuestran en la tabla siguiente:a. Diagrama de dispersión y dibujar curva de aprox.b. Ecuación de regresiónc. Encontrar el error en el exponente
  58. 58. a. Diagrama de dispersión y dibujar la curva de aprox.
  59. 59. a. Diagrama de dispersión y dibujar la curva de aprox.
  60. 60. b. Determinar ecuación de regresión que relaciona lasvariables X e YConstrucción de tabla:
  61. 61. Llenar los campos:Ecuaciones normales:
  62. 62. Calculo de constante “a”
  63. 63. Calculo de constante “b”Ecuación de ajuste:
  64. 64. Curva de ajuste:
  65. 65. Ejercicio 16:Un grupo de alumnos investigo la relación que existeentre la variación de temperatura y el tiempo que tarde enenfriarse hasta la temperatura ambientea. Hacer diagrama de dispersiónb. Dibujar curva de aproximaciónc. Determinar la ecuación de regresión
  66. 66. a. Diagrama de dispersión.
  67. 67. Curva de aproximación y ecuación de regresión.
  68. 68. Curva de ajuste:

×