0
Taller #2:Modelos estadísticosde cultivosSharon GourdjiCIAT11-Apr-2013
Perfil de temas• Cómo hacer un modelo estadístico del cultivosque explique rendimiento con datos climáticos• Ejemplo con e...
Modelos estadísticos/ de proceso• Generalmente, los modelos estadísticos son mássencillos que los modelos de proceso, y má...
Modelos estadísticos en R• Comandos básicos:model = lm(Y ~ X)summary(model)model$coefsummary(model)$coefmodel$fitted, mode...
Usamos la base de datos y el modelo deesta publicación como ejemplo:
Empezamos con 25 años de ensayosinternacionales del trigo de CIMMYT…Gran variabilidad de rendimientos y condicionesclimáti...
Ensayos de 3 viveros con estrategias diferentes:– Elite Spring Wheat Yield Trial (ESWYT), n=959– Semi-Arid Wheat Yield Tri...
Reconstrucción de datos climáticos• Interpolamos a cada punto de ensayo desde lafecha de siembra hasta 300 días después(te...
Interpolación de temperatura(taller #1)• Estacionesclimáticas delGlobal HistoricalClimatologyNetwork & GlobalSurface Summa...
Definir etapas• Se pueden tener relaciones diferentes entrelas variables climáticas y el rendimiento endiferentes etapas f...
Definir variables potenciales• No tiene que explicar toda la variabilidad derendimiento!!!– Necesitamos que la variabilida...
Relaciones nonlineales• La relación entre temperatura y rendimientono es lineal (EJEMPLO EN R…)
Interacciones entre variables• De wikipedia: “the interaction between anexplanatory variable and an environmental variable...
Escoger variables• Queremos un modelo que seasuficientemente complejo para capturarprocesos importantes, pero que no trata...
Modelo estadístico “final”Yield = βW + cj + αn + (αn x year) + εW: variables ambientales por las 3 etapas (vegetativa,repr...
Nota en asunción de normalidad• Las asunciones de la regresión son que loserrores (ε) tienen una distribución normal– No e...
Sabiduría del internet• Dehttp://stackoverflow.com/questions/7781798/seeing-if-data-is-normally-distributed-in-r :– “I hav...
Resultados – efectos fijos• Se pueden interpretar como promedios derendimiento, por país o nursery, que no sepuede explica...
Resultados – relaciones temperatura/rendimiento• Cuando una variable está en más de untérmino en la regresión, tiene que d...
Curvas temperatura-rendimiento
Intervalos de confidencia?• Para solo una variable, se puede mirar loserrores estanderes asociados con elcoeficiente.• Per...
Qué es bootstrap?• Hacer n modelos usando las observacionescomo una distribución y tomando muestreasdiferentes (con reempl...
Aumento “genético” de rendimientoUsando el modelo,podemos cuantificarel aumento“verdadero” enrendimiento desde elprincipio...
Progreso genético por vivero y temperaturadurante la etapa de llena de granosDesde 1983SAWYTESWYT• El único progreso en ES...
Upcoming SlideShare
Loading in...5
×

Taller 2 modelos estadísticos de cultivos

829

Published on

0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
829
On Slideshare
0
From Embeds
0
Number of Embeds
5
Actions
Shares
0
Downloads
11
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Transcript of "Taller 2 modelos estadísticos de cultivos"

  1. 1. Taller #2:Modelos estadísticosde cultivosSharon GourdjiCIAT11-Apr-2013
  2. 2. Perfil de temas• Cómo hacer un modelo estadístico del cultivosque explique rendimiento con datos climáticos• Ejemplo con ensayos internacionales de trigo– Definir etapas– Escoger variables (selección de modelos)– Relaciones no lineales e interacciones– Interpretar resultados• Derivar curvas de temperatura – rendimiento• Estimar incertidumbre con el “bootstrap”• Medir progreso genético con tiempo• Modelos estadísticos del grupo….
  3. 3. Modelos estadísticos/ de proceso• Generalmente, los modelos estadísticos son mássencillos que los modelos de proceso, y másesforzados por los datos• Pero todos los modelos son una mezcla– En modelos estadísticos, usamos conocimientosfisiológicos cuando escogemos variables einteracciones– Los modelos de proceso (e.g. DSSAT) están calibradosusando datos….• Pero, porqué son más sencillos, es muy fácil crearun modelo estadístico si tiene un base de datosadecuado!!!
  4. 4. Modelos estadísticos en R• Comandos básicos:model = lm(Y ~ X)summary(model)model$coefsummary(model)$coefmodel$fitted, model$residls(modelb)ls(summary(model))
  5. 5. Usamos la base de datos y el modelo deesta publicación como ejemplo:
  6. 6. Empezamos con 25 años de ensayosinternacionales del trigo de CIMMYT…Gran variabilidad de rendimientos y condicionesclimáticas en la base de datos
  7. 7. Ensayos de 3 viveros con estrategias diferentes:– Elite Spring Wheat Yield Trial (ESWYT), n=959– Semi-Arid Wheat Yield Trial (SAWYT), n=259– High Temperature Wheat Yield Trial (HTWYT), n=135• Filtramosensayos conplaga o “lodging”• ESWYT & HTWYTtienen riego,pero SAWYT no
  8. 8. Reconstrucción de datos climáticos• Interpolamos a cada punto de ensayo desde lafecha de siembra hasta 300 días después(temp max y min)• Bajamos datos de radiación y humedadrelativa de NASA POWER(http://power.larc.nasa.gov/cgi-bin/cgiwrap/solar/agro.cgi?email=agroclim@larc.nasa.gov)
  9. 9. Interpolación de temperatura(taller #1)• Estacionesclimáticas delGlobal HistoricalClimatologyNetwork & GlobalSurface Summaryof the Day• En cada punto y día, interpolamos anomalías de laclimatología de WorldClim usando “angular distanceweighting” con estaciones en radio de 100km
  10. 10. Definir etapas• Se pueden tener relaciones diferentes entrelas variables climáticas y el rendimiento endiferentes etapas fisiológicasPerfil de temperatura típico del trigosiembrainflorescenciacosechaUsamos 3 etapas:vegetativa,reproductiva yllenado de granos
  11. 11. Definir variables potenciales• No tiene que explicar toda la variabilidad derendimiento!!!– Necesitamos que la variabilidad “inexplicable” no estácorrelacionado con las variables en la regresión…• Nos preocupamos aquí de la precipitación(debido a que se estudia el efecto de las laboresde riego)• Usamos:– Temperatura (y rango de temperatura diaria)– Radiación y horas de sol– Deficit de presión de vapor (VPD)– Longitud de etapa (días)
  12. 12. Relaciones nonlineales• La relación entre temperatura y rendimientono es lineal (EJEMPLO EN R…)
  13. 13. Interacciones entre variables• De wikipedia: “the interaction between anexplanatory variable and an environmental variablesuggests that the effect of the explanatory variablehas been moderated or modified by theenvironmental variable.”• Por ejemplo, el calor tiene efecto diferente en climahúmida vs. seca, porque de la tasa de transpiración𝑦𝑖𝑒𝑙𝑑 = 𝛽0 + 𝛽1 ∗ 𝑡𝑒𝑚𝑝 + 𝛽2 ∗ 𝑉𝑃𝐷 + 𝛽3 ∗ (𝑡𝑒𝑚𝑝 ∗ 𝑉𝑃𝐷)En R: lm(yield ~ temp*VPD)
  14. 14. Escoger variables• Queremos un modelo que seasuficientemente complejo para capturarprocesos importantes, pero que no trata deexplicar “ruido” en los datos…• Podemos usar:– Conocimientos “expertos”– Pruebas de “backward selection”, R2a, AIC, BIC– (Nota: es dificil probar efectos fijos con estaspruebas…)• EJEMPLO EN R…
  15. 15. Modelo estadístico “final”Yield = βW + cj + αn + (αn x year) + εW: variables ambientales por las 3 etapas (vegetativa,reproductiva, llena de granos)cj : promedios por paísαn : promedios por viveroαn x year: cambios en tiempo por viveroε: errores(W: tavg, tavg2, vpd, longitud de etapa, srad, daylength, dtr,interacciones entre tavg, tavg2 & vpd, interacciones entretavg & longitud de etapa)
  16. 16. Nota en asunción de normalidad• Las asunciones de la regresión son que loserrores (ε) tienen una distribución normal– No es necesario que los predictores o variable derespuesta tienen distribuciones normales– A veces, se puede hacer un “log” del variable deresponsa, pero este cambia el significado de loscoeficientes….• Se puede probar la normalidad de los errorescon la prueba de Shapiro-Wilk en R, pero conmuchos datos, es probable que la pruebarechaza normalidad….
  17. 17. Sabiduría del internet• Dehttp://stackoverflow.com/questions/7781798/seeing-if-data-is-normally-distributed-in-r :– “I have never come across a situation where anormal test is the right thing to do. When thesample size is small, even big departures fromnormality are not detected, and when yoursample size is large, even the smallest deviationfrom normality will lead to a rejected null.”
  18. 18. Resultados – efectos fijos• Se pueden interpretar como promedios derendimiento, por país o nursery, que no sepuede explicar por las otras variables.• Todos los niveles de los efectos fijos en R sonrelativos al primer efecto (empezando con A…)– En nuestro modelo, todos los efectos del país sonrelativos a Afghanistan…• Interpretamos los efectos fijos del país aquícómo los efectos de manejo
  19. 19. Resultados – relaciones temperatura/rendimiento• Cuando una variable está en más de untérmino en la regresión, tiene que derivar larelación entre sí y la variable de respuesta.– Usar derivadas!!• EJEMPLO EN LA PIZARRA
  20. 20. Curvas temperatura-rendimiento
  21. 21. Intervalos de confidencia?• Para solo una variable, se puede mirar loserrores estanderes asociados con elcoeficiente.• Pero cuando se tiene una relacion máscomplicada (e.g. con temperatura yrendimiento en en este modelo), se puedehacer …–  Bootstrap!
  22. 22. Qué es bootstrap?• Hacer n modelos usando las observacionescomo una distribución y tomando muestreasdiferentes (con reemplazo) de ella• Usar los coeficientes estimados de losmodelos diferentes como medida deincertidumbre• EJEMPLO EN LA PIZARRA
  23. 23. Aumento “genético” de rendimientoUsando el modelo,podemos cuantificarel aumento“verdadero” enrendimiento desde elprincipio del vivero- corrigiendo elaumento observadopor la variabilidad declima y país en la basede datosESWYT
  24. 24. Progreso genético por vivero y temperaturadurante la etapa de llena de granosDesde 1983SAWYTESWYT• El único progreso en ESWYT ha sido en las temperaturas más frías,cerca de lo óptimo para producción• En SAWYT, vemos el opuesto, pero no tiene el mismo potencial derendimiento como en ESWYT
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×