Your SlideShare is downloading. ×
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivos
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Taller 2 modelos estadísticos de cultivos

805

Published on

0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
805
On Slideshare
0
From Embeds
0
Number of Embeds
5
Actions
Shares
0
Downloads
10
Comments
0
Likes
2
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Taller #2:Modelos estadísticosde cultivosSharon GourdjiCIAT11-Apr-2013
  • 2. Perfil de temas• Cómo hacer un modelo estadístico del cultivosque explique rendimiento con datos climáticos• Ejemplo con ensayos internacionales de trigo– Definir etapas– Escoger variables (selección de modelos)– Relaciones no lineales e interacciones– Interpretar resultados• Derivar curvas de temperatura – rendimiento• Estimar incertidumbre con el “bootstrap”• Medir progreso genético con tiempo• Modelos estadísticos del grupo….
  • 3. Modelos estadísticos/ de proceso• Generalmente, los modelos estadísticos son mássencillos que los modelos de proceso, y másesforzados por los datos• Pero todos los modelos son una mezcla– En modelos estadísticos, usamos conocimientosfisiológicos cuando escogemos variables einteracciones– Los modelos de proceso (e.g. DSSAT) están calibradosusando datos….• Pero, porqué son más sencillos, es muy fácil crearun modelo estadístico si tiene un base de datosadecuado!!!
  • 4. Modelos estadísticos en R• Comandos básicos:model = lm(Y ~ X)summary(model)model$coefsummary(model)$coefmodel$fitted, model$residls(modelb)ls(summary(model))
  • 5. Usamos la base de datos y el modelo deesta publicación como ejemplo:
  • 6. Empezamos con 25 años de ensayosinternacionales del trigo de CIMMYT…Gran variabilidad de rendimientos y condicionesclimáticas en la base de datos
  • 7. Ensayos de 3 viveros con estrategias diferentes:– Elite Spring Wheat Yield Trial (ESWYT), n=959– Semi-Arid Wheat Yield Trial (SAWYT), n=259– High Temperature Wheat Yield Trial (HTWYT), n=135• Filtramosensayos conplaga o “lodging”• ESWYT & HTWYTtienen riego,pero SAWYT no
  • 8. Reconstrucción de datos climáticos• Interpolamos a cada punto de ensayo desde lafecha de siembra hasta 300 días después(temp max y min)• Bajamos datos de radiación y humedadrelativa de NASA POWER(http://power.larc.nasa.gov/cgi-bin/cgiwrap/solar/agro.cgi?email=agroclim@larc.nasa.gov)
  • 9. Interpolación de temperatura(taller #1)• Estacionesclimáticas delGlobal HistoricalClimatologyNetwork & GlobalSurface Summaryof the Day• En cada punto y día, interpolamos anomalías de laclimatología de WorldClim usando “angular distanceweighting” con estaciones en radio de 100km
  • 10. Definir etapas• Se pueden tener relaciones diferentes entrelas variables climáticas y el rendimiento endiferentes etapas fisiológicasPerfil de temperatura típico del trigosiembrainflorescenciacosechaUsamos 3 etapas:vegetativa,reproductiva yllenado de granos
  • 11. Definir variables potenciales• No tiene que explicar toda la variabilidad derendimiento!!!– Necesitamos que la variabilidad “inexplicable” no estácorrelacionado con las variables en la regresión…• Nos preocupamos aquí de la precipitación(debido a que se estudia el efecto de las laboresde riego)• Usamos:– Temperatura (y rango de temperatura diaria)– Radiación y horas de sol– Deficit de presión de vapor (VPD)– Longitud de etapa (días)
  • 12. Relaciones nonlineales• La relación entre temperatura y rendimientono es lineal (EJEMPLO EN R…)
  • 13. Interacciones entre variables• De wikipedia: “the interaction between anexplanatory variable and an environmental variablesuggests that the effect of the explanatory variablehas been moderated or modified by theenvironmental variable.”• Por ejemplo, el calor tiene efecto diferente en climahúmida vs. seca, porque de la tasa de transpiración𝑦𝑖𝑒𝑙𝑑 = 𝛽0 + 𝛽1 ∗ 𝑡𝑒𝑚𝑝 + 𝛽2 ∗ 𝑉𝑃𝐷 + 𝛽3 ∗ (𝑡𝑒𝑚𝑝 ∗ 𝑉𝑃𝐷)En R: lm(yield ~ temp*VPD)
  • 14. Escoger variables• Queremos un modelo que seasuficientemente complejo para capturarprocesos importantes, pero que no trata deexplicar “ruido” en los datos…• Podemos usar:– Conocimientos “expertos”– Pruebas de “backward selection”, R2a, AIC, BIC– (Nota: es dificil probar efectos fijos con estaspruebas…)• EJEMPLO EN R…
  • 15. Modelo estadístico “final”Yield = βW + cj + αn + (αn x year) + εW: variables ambientales por las 3 etapas (vegetativa,reproductiva, llena de granos)cj : promedios por paísαn : promedios por viveroαn x year: cambios en tiempo por viveroε: errores(W: tavg, tavg2, vpd, longitud de etapa, srad, daylength, dtr,interacciones entre tavg, tavg2 & vpd, interacciones entretavg & longitud de etapa)
  • 16. Nota en asunción de normalidad• Las asunciones de la regresión son que loserrores (ε) tienen una distribución normal– No es necesario que los predictores o variable derespuesta tienen distribuciones normales– A veces, se puede hacer un “log” del variable deresponsa, pero este cambia el significado de loscoeficientes….• Se puede probar la normalidad de los errorescon la prueba de Shapiro-Wilk en R, pero conmuchos datos, es probable que la pruebarechaza normalidad….
  • 17. Sabiduría del internet• Dehttp://stackoverflow.com/questions/7781798/seeing-if-data-is-normally-distributed-in-r :– “I have never come across a situation where anormal test is the right thing to do. When thesample size is small, even big departures fromnormality are not detected, and when yoursample size is large, even the smallest deviationfrom normality will lead to a rejected null.”
  • 18. Resultados – efectos fijos• Se pueden interpretar como promedios derendimiento, por país o nursery, que no sepuede explicar por las otras variables.• Todos los niveles de los efectos fijos en R sonrelativos al primer efecto (empezando con A…)– En nuestro modelo, todos los efectos del país sonrelativos a Afghanistan…• Interpretamos los efectos fijos del país aquícómo los efectos de manejo
  • 19. Resultados – relaciones temperatura/rendimiento• Cuando una variable está en más de untérmino en la regresión, tiene que derivar larelación entre sí y la variable de respuesta.– Usar derivadas!!• EJEMPLO EN LA PIZARRA
  • 20. Curvas temperatura-rendimiento
  • 21. Intervalos de confidencia?• Para solo una variable, se puede mirar loserrores estanderes asociados con elcoeficiente.• Pero cuando se tiene una relacion máscomplicada (e.g. con temperatura yrendimiento en en este modelo), se puedehacer …–  Bootstrap!
  • 22. Qué es bootstrap?• Hacer n modelos usando las observacionescomo una distribución y tomando muestreasdiferentes (con reemplazo) de ella• Usar los coeficientes estimados de losmodelos diferentes como medida deincertidumbre• EJEMPLO EN LA PIZARRA
  • 23. Aumento “genético” de rendimientoUsando el modelo,podemos cuantificarel aumento“verdadero” enrendimiento desde elprincipio del vivero- corrigiendo elaumento observadopor la variabilidad declima y país en la basede datosESWYT
  • 24. Progreso genético por vivero y temperaturadurante la etapa de llena de granosDesde 1983SAWYTESWYT• El único progreso en ESWYT ha sido en las temperaturas más frías,cerca de lo óptimo para producción• En SAWYT, vemos el opuesto, pero no tiene el mismo potencial derendimiento como en ESWYT

×