Presentación de BIg Data en Arroz en Colombia en el marco de la XXXIV Reunión del Comité Administrativo del FLAR, realizada el 4 y 5 de noviembre en San José, Costa Rica
Tendencias relacionados con Covid-19 de la cadena de suministro en los sector...
Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia
1. Uso de grandes datos (Big Data) en la
Agricultura- Caso de estudio
FEDEARROZ en Colombia
Big Data
www.ciat.cgiar.org
Agricultura Eco-Eficiente para Reducir la Pobreza
2. Información eventos productivos (cosechas) =
Grandes datos
•Utilizar información de eventos productivos para entender la
variabilidad en la producción
•De reduccionista a holístico (combinación de factores y sus
interacciones)
•Basado en los principios de investigación operacional
•Generación de conocimiento para tomadores de decisiones en
agricultura (investigadores, gremios, extensionistas, agricultores)
•N= Todo (eventos productivos)
4. Cómo hacerlo?
Información primaria: capturada a través de diferentes fuentes –
Plataforma en línea
Información secundaria : Bases de datos existentes
Divulgación
Captura
Limpieza, organización,
almacenamiento
Reporte
Interpretación, validación
Análisis
Motor cuyo combustible
son los datos !
5. Caso de estudio datos FEDEARROZ en
Colombia
Colombia? laboratorio natural
6. Caso de estudio datos FEDEARROZ en
Colombia
Colombia? FEDEARROZ un gremio que ha compartido información
ENA (Encuesta Nacional Arrocera)
3 semestres de datos
Registros de cosecha
• Saldaña y Purificación
o 08/2009 a 12/2012
• 2010A :
• 2011A :
• 2012A :
o 530 eventos productivos
• Casanare – Yopal
Total : alrededor de 400 eventos
productivos
o 07 a 09/2013
o 91 eventos productivos
• Monteria (CI La Victoria)
o 2012A
o 192 eventos productivos
De lo general…………………………………………………………….. A lo específico
7. Rendimieto (Kg/HA)
Baja productividad inhabitual
N= alrededor de 400 eventos productivos
7000
6500
6000
5500
5000
4500
4000
3500
3000
2010A
2011A
Riego integral
Semestre evaluado
Riego complementario
2012A
Secano mecanizado
Rendimientos promedios nacionales por sistema de riego, periodo 2010-2012.
Fuente ENA FEDEARROZ
Zona llanos
Rendimieto (Kg/HA)
7000
6200
5400
4600
3800
3000
2010A
2011A
2012A
Semestre evaluado
Riego integral
Secano mecanizado
Rendimientos promedios zona llanos por sistema de riego, periodo 2010-2012.
Fuente ENA FEDEARROZ
8. Panorama actual de la producción
Sistema riego integral
Rendimiento de las diferentes variedades en función de la zona
N= alrededor de 400 eventos productivos
Desempeño de variedades de arroz bajo 4 diferentes zonas agroecológicas
9. Caso específico estación de Saldaña
• Cuenta con
meteorológica
estación
• Ha
Compartido
información
Saldaña 08/2009 a
12/2012
N: 530 eventos
productivos
Clima (%)
+ Suelo + Manejo agronómico =
Rdto/Lote
10. Hipótesis de trabajo
la variación del rendimiento en arroz en Saldaña esta asociada al
clima
Lote
Siembra
Cosecha
tiempo
Un evento
productivo de arroz = alrededor de 120 días
Serie climática completa para 5 variables
11. Arroz
Información secundaria -> FEDEARROZ un gremio con
información
Clima (%)
+ Suelo (%) + Manejo agronómico (%) =
Rdto/Lote
Análisis multivariado para Saldaña : Todos los eventos (2010 hasta 2012), con
todas las variedades, N = 329
8
6.12
% Contribución al R2
6
5.59
5.04
4
3.39
2.97
2.33
2
0.86
0
Tmx
Tmean
Ener_min
Ener_Accu
Tmin
Days_Tmax1 AccuT_Base11
Clima explica: 26.3 % del rendimiento
12. Información secundaria -> FEDEARROZ un gremio con
información
Análisis multivariado para Saldaña : Todos los eventos (2010 hasta
2012), con por variedad
N = 98
% de varianza explicada
Fedearroz 733
12.00
Para FEDEARROZ 733, el clima explica el
37% del rendimiento
10.43
10.00
8.00
6.20
6.03
6.00
4.78
4.00
3.76
3.74
1.92
2.00
0.00
N = 112
% de varianza explicada
Lagunas
10.00
8.00
8.05
6.57
6.00
4.00
2.00
0.00
3.53
1.26
1.03
0.94
0.50
Para Lagunas, el clima explica el
22% del rendimiento
13. Arroz
Información secundaria -> FEDEARROZ un gremio con información
Análisis multivariado para Saldaña : Todos los eventos (2010 hasta 2012), con
variedad FEDEARROZ 733
% de varianza explicada
Fedearroz 733
12.00
N = 98
10.43
10.00
8.00
6.20
6.00
6.03
4.78
4.00
3.76
3.74
1.92
2.00
0.00
No lineal - Naturaleza
Perfiles de las variables – conocimiento valioso ! – Aprovechando el poder de la tecnología
Ener_accu
Tmax
9000
9000
7500
Rendimiento
Rendimiento
7500
6000
4500
3000
6000
4500
3000
1500
1500
0
34
35
36
37
Tmax
38
39
0
52000 53000 54000 55000 56000 57000 58000
Ener_accut
14. Arroz
Análisis por etapas fenológicas : Trabajo multidiciplinario , combinación
FEDEARROZ CIAT
Siembra
VEG
FLOR
FLOR
Ini Pan
Ini Pan
Cosecha
VEG
Cómo aumentar la predicción?
Variedad 1
Variedad 2
Fase vegetativa
Iniciación panícula
Floración
Llenado grano
15. Arroz
Todos los eventos (2010 hasta 2012), todas las variedades, trabajando en conjunto, N= 329
20
Perfil de la variable – Eneraccu_LLEN
17.76
Varianza explicada
15
10
6.03
Alcanzamos a
explicar más del
40 % de variación
en el rendimiento
5
3.06 2.74
2.56
1.87 1.56 1.51 1.46
1.38 1.31
0.85 0.69 0.53 0.53 0.50
0
•
•
•
Pasamos de explicar con clima 26.3 % a 44.3 % con etapas fenológicas
Siembras orientadas a aprovechar al máximo Eneraccu_llen. Mitigar influencia del
clima
Bases de mejoramiento para el futuro
17. Resultados preliminares con manejo agronómico
Clima (%) + Suelo +
siembra
canhec
cultant1
nitroge
fosfate
potash
numfer
numher
numins
numfun
duracin_ciclo
sistecose
humedad
impure
semestre
vartip
variedad
cozona
sistema
rend
Manejo agronómico = Rdto/Lote
Fecha de siembra evaluada en día calendario, cuantos días tiene el cultivo
tomando como referencia el 1 de enero
Cantidad de semilla por hectárea (Kg/HA)
Cual fue el cultivo anterior
Cantidad de nitrógeno por hectárea utilizado sobre el cultivo (kg/HA)
Cantidad de fosforo por hectárea utilizado sobre el cultivo (kg/HA)
Cantidad de potasio por hectárea utilizado sobre el cultivo (kg/HA)
Número de veces que el cultivo fue fertilizado
Número de veces que el cultivo fue tratado con herbicidas
Número de veces que el cultivo fue tratado con insecticidas
Número de veces que el cultivo fue tratado con funguicidas
Duración en días del ciclo productivo
Sistema de cosecha implementado en el cultivo
Humedad del grano en %
Impureza del grano en %
Semestre en el que el cultivo es establecido
Tipo de variedad (certificado/No Certificado)
Variedad utilizada en el cultivo
Zona en la que fue sembrada el cultivo
Sistema en el que fue sembrado el cultivo
Rendimiento del cultivo (kg/HA)
18. Resultados preliminares con manejo agronómico
Fedearroz 733
ZONA 1
Sistema de riego 1
N= 32 eventos de producción
(Centro)
(Riego Integral)
Coefficients:
30.00
Estimate Std. Error t value Pr(>|t|)
fosfate
potash
numins
numfun
duracin_ciclo
semestre2011A
semestre2012A
vartipN
13448.43 1667.654
-18.774
5.819
13.748
3.354
-347.542
94.22
262.812
98.161
-41.153
13.212
-688.294 372.795
-1543.34 353.488
-488.663 286.116
8.064
-3.226
4.099
-3.689
2.677
-3.115
-1.846
-4.366
-1.708
1.03E-07 ***
0.004236 **
0.000559 ***
0.001455 **
0.014476 *
0.005457 **
0.079701 .
0.000299 ***
0.103128
25.00
Varianza explicada
(Intercept)
27.37
20.00
15.00
14.14
10.09
10.00
5.00
0.00
--Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 427.2 on 20 degrees of freedom
Multiple R-squared:
0.7863,
Adjusted R-squared:
0.7009
78 % de variación en el rendimiento
8.76
7.40
5.49
5.37
19. Resultados preliminares con manejo agronómico
Fedearroz 733
ZONA 3
Sistema de riego 1
(Nororiental)
(Riego Integral)
N=26 eventos de producción
30.00
Coefficients:
nitroge
fosfate
potash
numfer
vartipN
Estimate Std. Error t value Pr(>|t|)
7180.568 996.539
7.206 5.64E-07 ***
12.308
5.193
2.37
0.028 *
6.473
4.671
1.386
0.181
-10.59
6.169
-1.717
0.1015
-541.692 195.855
-2.766
0.0119 *
-960.314 350.047
-2.743
0.0125 *
25.00
Varianza explicada
(Intercept)
28.08
20.00
15.00
10.37
10.00
9.01
5.63
--Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
0.5558,
Adjusted R-squared:
F-statistic: 5.005 on 5 and 20 DF,
2.48
0.00
Residual standard error: 779.7 on 20 degrees of freedom
Multiple R-squared:
5.00
0.4447
vartip
numfer
nitroge
fosfate
potash
p-value: 0.003912
55 % de variación en el rendimiento
Vartip: Tipo de variedad (certificado/No Certificado)
20. Resultados preliminares con manejo agronómico
Fedearroz 60
ZONA 1
Sistema de riego 1
N= 27 eventos de producción
(Centro)
(Riego Integral)
25.00
siembra
canhec
potash
numfer
numher
numins
semestre2011A
semestre2012A
--Signif. codes:
20.47
20.00
Varianza explicada
(Intercept)
Estimate Std. Error t value
Pr(>|t|)
3690.987
861.08
4.286 0.000444 ***
5.633
2.637
2.136 0.046704 *
14.776
3.703
3.991 0.000857 ***
3.886
2.52
1.542 0.140414
302.712
86.07
3.517 0.002462 **
-451.635 109.235
-4.135 0.000623 ***
-213.417
105.87
-2.016 0.058995 .
-371.702 373.825
-0.994 0.333247
1376.037 765.684
1.797 0.089113 .
15.00
12.40
11.39
9.14
10.00
8.64
5.37
5.00
2.76
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
0.00
Residual standard error: 508.1 on 18 degrees of freedom
Multiple R-squared:
0.7016,
Adjusted R-squared:
F-statistic: 5.291 on 8 and 18 DF,
numher semestre canhec
0.569
p-value: 0.00162
70 % de variación en el rendimiento
numfer siembra
potash
numins
21. Resultados preliminares con manejo agronómico
(Noroccidental)
(Riego Integral)
Coefficients:
Estimate Std. Error t value
Pr(>|t|)
(Intercept) 16194.3 5881.317
2.754
0.0249 *
canhec
10.56
6.08
1.737
0.1206
cultant1 -279.315 263.478
-1.06
0.32
nitroge
19.214
5.982
3.212
0.0124 *
numher
206.886 171.314
1.208
0.2617
duracin_ciclo
-107.901
47.52
-2.271
0.0528 .
semestre2012A
-2028.42 764.114
-2.655
0.029 *
vartipN
667.718 432.321
1.544
0.161
vartipP
-264.846 599.059
-0.442
0.6701
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 510 on 8 degrees of freedom
Multiple R-squared: 0.893, Adjusted R-squared: 0.786
F-statistic: 8.347 on 8 and 8 DF, p-value: 0.00351
N= 17 eventos de producción
35.00
30.00
Varianza explicada
Fedearroz 473
ZONA 4
Sistema de riego 1
29.92
25.00
20.00
15.00
17.18
12.99
10.00
9.17
8.68
6.12
5.00
0.00
89.3 % de variación en el rendimiento
5.25
22. Resultados preliminares con manejo agronómico
Improarroz 1550
ZONA 2
Sistema de riego 3
(Llanos)
(Secano Mecanizado)
N=15 eventos de producción
Coefficients:
45.00
35.00
30.00
25.00
19.90
20.00
15.00
10.00
--Signif. codes:
41.59
40.00
Varianza explicada
Estimate Std. Error t value
Pr(>|t|)
(Intercept)
6346.356 1070.254
5.93 0.00103 **
siembra
-12.365
5.164
-2.395 0.05369 .
cultant1
-111.82
61.405
-1.821 0.11845
numfer
-247.794 123.417
-2.008 0.09144 .
numher
-623.946 201.154
-3.102 0.02107 *
numins
591.289 205.221
2.881 0.02801 *
numfun
1026.2 314.061
3.268 0.01709 *
semestre2011A -1169.03 309.927
-3.772 0.00927 **
semestre2012A -2506.37 643.193
-3.897 0.00801 **
7.31
6.55
6.04
5.80
5.00
2.38
0.00
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
semestre
numfun
Residual standard error: 475.2 on 6 degrees of freedom
Multiple R-squared:
0.8956,
Adjusted R-squared:
F-statistic: 6.436 on 8 and 6 DF,
0.7565
p-value: 0.01783
89 % de variación en el rendimiento
numins
cultant1
siembra
numher
numfer
23. Conclusiones
• Las herramientas de análisis han arrojado resultados
preliminares que tienen sentido
• Trabajo multidisciplinario mucho más poderoso que el
individual
(fisiólogos,
agrónomos,
estadísticos,
fitomejoradores, acompañamiento de expertos)
• Por ahora clima y manejo… a probar suelos… otros
factores
• A mayor cantidad de información mayor confiabilidad y
robustez de los resultados
24. Perspectivas
• Acercamiento que responde a los propósitos de donantes
y clientes (product- outcome- impact)
• Explotación de información que ha sido obtenida con
múltiples fuentes y diferentes propósitos para generar
nuevo conocimiento para acelerar el desarrollo en la
agricultura
• En la medida que hayan datos disponibles se puede hacer
en cualquier lugar
• Mas importante….
25. • Hoy arroz en Colombia pero las herramientas, recurso
humano, tecnológico , voluntad y pasión están al
servicio de toda la región !
Muchas gracias por su atención !
Agricultura Específica por Sitio (AEPS) y uso de grandes datos (Big Data) en la
Agricultura
Información primaria:
capturada a través de
diferentes fuentes :
http://www.youtube.com/watch?v=qju9Y-X1mN8
Contacto :
Daniel Jiménez R
d.jimenez@cgiar.org