Maxent  Modelamiento de distribución de especies Johannes Signer [email_address]
Agenda <ul><li>¿Qué son  Spatial Distribution Models  (SDM)? </li></ul><ul><li>¿Qué es Maxent? </li></ul><ul><li>Ejemplo d...
Realidad Mapa Mapa con más detalle  Una foto Modelo
Los modelos tienen un propósito
 
Aspectos importantes <ul><li>Los modelos son representaciones simplificadas de la realidad. </li></ul><ul><li>Los modelos ...
Modelos de distribución potencial <ul><li>Hay diferentes modelos de distribución potencial (Maxent, BRT, GAM, GLM, EcoCrop...
¿Por qué usamos Maxent? <ul><li>Proporciona: </li></ul><ul><ul><li>Buenos resultados (Elith et al. 2006). </li></ul></ul><...
¿Cómo funciona Maxent? <ul><li>Tenemos puntos de presencia. </li></ul><ul><li>Maxent crea 10,000 puntos de pseudo-ausencia...
¿Cómo funciona Maxent ? <ul><li>Diferentes variables ambientales: </li></ul><ul><ul><li>Variables continuas (e.g. temperat...
¿Como funciona  Maxent  ? <ul><li>Maxent asume una distribución de la especie en todas las celdas. </li></ul><ul><li>Poste...
Ejemplo
Antes de empenzar <ul><li>Necesitamos los puntos de presencia en el formato de *.csv </li></ul><ul><li>Necesitamos las cua...
Corrida en Maxent (I) <ul><li>Abrimos el Maxent (./maxent/maxent.jar) </li></ul><ul><li>Elegimos el archivo de las muestra...
Variables ambientales <ul><li>Bioclim: </li></ul><ul><li>BIO1 = Annual Mean Temperature </li></ul><ul><li>BIO2 = Mean Diur...
Configuración y  'gain '  <ul><li>Usualmente la configuración predeterminada esta bien. </li></ul><ul><li>exp(gain) = x ma...
Resultados: diferentes archivos <ul><li>Los archivos *.html y *.asc son los más importantes. </li></ul><ul><li>El archivo ...
El archivo *.asc <ul><li>Representa la cuadricula con las predicciones para el área de estudio. </li></ul><ul><li>Lo mejor...
Umbral <ul><li>¿Qué es un umbral? </li></ul><ul><li>¿Por qué necesitamos un umbral? </li></ul>> 0.4
Sensibilidad y Especificidad <ul><li>Verdad positiva </li></ul>Falso positivo Falso negativo Verdad negativa
Sensibilidad <ul><li>Un modelo con una baja sensibilidad tiene muchos falso negativos. </li></ul>
Especificidad <ul><li>Un modelo con una baja especificidad tiene muchos falsos positivos </li></ul>
El archivo *.html <ul><li>Un resumen del modelo. </li></ul><ul><li>Gráficas del modelo.  </li></ul><ul><li>Análisis estadí...
AUC <ul><li>AUC –  A rea  U nder the Receiver Operating  C urve   </li></ul><ul><li>Es una medida de la calidad del modelo...
AUC plot
Tasa de omisión
Predicción de presencia <ul><li>1 significa una alta probabilidad. </li></ul><ul><li>0 una baja  probabilidad.  </li></ul>...
Sugerencias para un umbral <ul><li>Maxent tiene algunas sugerencias para un umbral. </li></ul><ul><li>Los umbrales son sie...
¿Qué importancia tienen las variables? <ul><li>Contribución de cada variable. </li></ul><ul><li>Diferencias en AUC sin la ...
El efecto de las variables (IV) <ul><li>¿Cómo cambiar la probabilidad de presencia con las variables? </li></ul><ul><li>Va...
El efecto de las variables (II) <ul><li>Se debe tener cuidado si las variables están correlacionadas. </li></ul>Bio 5 = Te...
Prueba del modelo <ul><li>Selección de puntos al azar para evaluación (e.g. 25% de los puntos). </li></ul><ul><li>Un archi...
Validación <ul><li>El principio es siempre el mismo: </li></ul><ul><ul><li>Usamos algunos puntos para crear el modelo. </l...
Evaluación con un porcentaje de los puntos <ul><li>Abrir Maxent. </li></ul><ul><li>Abrir la ventana  'Settings ' </li></ul...
Resultados
Validación cruzada <ul><li>Validación cruzada =  cross validation  (CV). </li></ul><ul><li>Maxent divide los puntos en  n ...
Creemos un modelo con CV <ul><li>Revisar que el  ramdom test percentage  es cero (0). </li></ul><ul><li>Abrir  settings  y...
Resultados <ul><li>Un resultado para cada corrida. </li></ul><ul><li>Un resumen para todos los resultados. </li></ul>
Resultados de la CV Promedio Desviación estándar
¿Preguntas?
Proyección con datos de clima futuro
¿Por qué? <ul><li>Tenemos la distribución de hoy. </li></ul><ul><li>¿Cambiará la distribución en el futuro? </li></ul><ul>...
Fuentes de datos <ul><li>www.worldclim.org </li></ul><ul><li>http://gisweb.ciat.cgiar.org/GCMPage/ </li></ul><ul><li>www.i...
Entonces… proyectemos un modelo <ul><li>Abrimos Maxent. </li></ul><ul><li>Todo los ajustes son los mismos. </li></ul><ul><...
Resultados
'Clamping ' <ul><li>Clamping : </li></ul><ul><ul><li>Si variables tienen un rango diferente en el futuro, con  'clamping '...
Prediciones con cuidado <ul><li>Superficie de Similaridad Multi-variada (Elith, 2010). </li></ul><ul><li>Valores negativos...
Encontrar el cambio <ul><li>Se trabaja con DIVA- GIS y para esto es necesario el formado de *.grd. </li></ul><ul><li>Corre...
Abrir las cuadriculas en DIVA-GIS <ul><li>Abrir DIVA-GIS. </li></ul><ul><li>Abrir la cuadricula de la distribución potenci...
Reclasificar los valores <ul><li>Grid / reclass </li></ul><ul><li>Buscamos el umbral en el *.html. </li></ul><ul><li>El nu...
Creemos un  'stack ' <ul><li>Abrir  Stack / make stack </li></ul><ul><li>Seleccionar las cuadriculas </li></ul><ul><ul><li...
Sumar las cuadriculas <ul><li>Abrir  Stack / calculate </li></ul><ul><li>¿Qué significan los valores? </li></ul><ul><ul><l...
Recursos <ul><li>Primary Literature </li></ul><ul><ul><li>R. A Baldwin, “Use of Maximum Entropy Modeling in Wildlife Resea...
Recursos <ul><li>Books </li></ul><ul><ul><li>Jane Franklin, Modelling Distribution of species </li></ul></ul><ul><li>Inter...
[email_address]
Formato de SWD <ul><li>¿Qué es SWD? </li></ul><ul><li>¿Por qué usamos SWD? </li></ul><ul><li>¿Cómo creamos un SWD? </li></...
Batch Running <ul><li>¿Qué es un  batch ? </li></ul><ul><li>¿Por qué necesitamos el  batch ? </li></ul><ul><li>¿Cómo cream...
Upcoming SlideShare
Loading in …5
×

Introduction to sdm with Maxent Johannes S

2,376 views

Published on

1 Comment
1 Like
Statistics
Notes
No Downloads
Views
Total views
2,376
On SlideShare
0
From Embeds
0
Number of Embeds
115
Actions
Shares
0
Downloads
64
Comments
1
Likes
1
Embeds 0
No embeds

No notes for slide

Introduction to sdm with Maxent Johannes S

  1. 1. Maxent Modelamiento de distribución de especies Johannes Signer [email_address]
  2. 2. Agenda <ul><li>¿Qué son Spatial Distribution Models (SDM)? </li></ul><ul><li>¿Qué es Maxent? </li></ul><ul><li>Ejemplo de un corrida </li></ul><ul><li>Ejemplo de evaluación </li></ul>
  3. 3. Realidad Mapa Mapa con más detalle Una foto Modelo
  4. 4. Los modelos tienen un propósito
  5. 6. Aspectos importantes <ul><li>Los modelos son representaciones simplificadas de la realidad. </li></ul><ul><li>Los modelos tienen un propósito y es importante tener muy claro cuál es dicho propósito. </li></ul>
  6. 7. Modelos de distribución potencial <ul><li>Hay diferentes modelos de distribución potencial (Maxent, BRT, GAM, GLM, EcoCrop). </li></ul><ul><li>Maxent es un modelo que utiliza el principio de máxima entropía. </li></ul><ul><li>Maxent sólo necesita puntos de presencia de una especie y variables ambientales. </li></ul>
  7. 8. ¿Por qué usamos Maxent? <ul><li>Proporciona: </li></ul><ul><ul><li>Buenos resultados (Elith et al. 2006). </li></ul></ul><ul><ul><li>Buenos resultados con pocos puntos (< 50). </li></ul></ul><ul><ul><li>Sólo necesita puntos de presencia. </li></ul></ul><ul><ul><li>Es un programa fácil para usar. </li></ul></ul><ul><li>Algoritmo de difícil comprensión ('Blackbox') </li></ul><ul><li>Hay también otros buenos algoritmos (BRT...) </li></ul>
  8. 9. ¿Cómo funciona Maxent? <ul><li>Tenemos puntos de presencia. </li></ul><ul><li>Maxent crea 10,000 puntos de pseudo-ausencia ( background points ). </li></ul>
  9. 10. ¿Cómo funciona Maxent ? <ul><li>Diferentes variables ambientales: </li></ul><ul><ul><li>Variables continuas (e.g. temperatura) </li></ul></ul><ul><ul><li>Variables categóricas (e.g. uso del suelo, zonas ecológicas) </li></ul></ul><ul><li>Todas las cuadrículas deben tener los mismos límites geográficos y el mismo tamaño de celda. </li></ul>
  10. 11. ¿Como funciona Maxent ? <ul><li>Maxent asume una distribución de la especie en todas las celdas. </li></ul><ul><li>Posteriormente Maxent restringe la distribución dependiendo de las variables ambientales . </li></ul>
  11. 12. Ejemplo
  12. 13. Antes de empenzar <ul><li>Necesitamos los puntos de presencia en el formato de *.csv </li></ul><ul><li>Necesitamos las cuadriculas en el formato de *.asc. </li></ul><ul><li>Todas las cuadriculas necesitan la misma extensión. </li></ul><ul><li>Los puntos de presencia y las cuadriculas necesitan la misma proyección (e.g. WGS84) </li></ul>
  13. 14. Corrida en Maxent (I) <ul><li>Abrimos el Maxent (./maxent/maxent.jar) </li></ul><ul><li>Elegimos el archivo de las muestras. (./datos/va.csv) </li></ul><ul><li>Elegimos el directorio de las variables ambientales (./datos/env) </li></ul><ul><li>Creamos un directorio de output (./datos/output) </li></ul>
  14. 15. Variables ambientales <ul><li>Bioclim: </li></ul><ul><li>BIO1 = Annual Mean Temperature </li></ul><ul><li>BIO2 = Mean Diurnal Range (Mean of monthly (max temp - min temp)) </li></ul><ul><li>BIO3 = Isothermality (P2/P7) (* 100) </li></ul><ul><li>BIO4 = Temperature Seasonality (standard deviation *100) </li></ul><ul><li>BIO5 = Max Temperature of Warmest Month </li></ul><ul><li>BIO6 = Min Temperature of Coldest Month </li></ul><ul><li>BIO7 = Temperature Annual Range (P5-P6) </li></ul><ul><li>BIO8 = Mean Temperature of Wettest Quarter </li></ul><ul><li>BIO9 = Mean Temperature of Driest Quarter </li></ul><ul><li>BIO10 = Mean Temperature of Warmest Quarter </li></ul><ul><li>BIO11 = Mean Temperature of Coldest Quarter </li></ul><ul><li>BIO12 = Annual Precipitation </li></ul><ul><li>BIO13 = Precipitation of Wettest Month </li></ul><ul><li>BIO14 = Precipitation of Driest Month </li></ul><ul><li>BIO15 = Precipitation Seasonality (Coefficient of Variation) </li></ul><ul><li>BIO16 = Precipitation of Wettest Quarter </li></ul><ul><li>BIO17 = Precipitation of Driest Quarter </li></ul><ul><li>BIO18 = Precipitation of Warmest Quarter </li></ul><ul><li>BIO19 = Precipitation of Coldest Quarter </li></ul>
  15. 16. Configuración y 'gain ' <ul><li>Usualmente la configuración predeterminada esta bien. </li></ul><ul><li>exp(gain) = x max alta del background </li></ul><ul><li>e.g. gain=1.4, exp(1.4)=4.05 </li></ul>Lo que se mide aquí es cuántas veces un modelo que resulta de los puntos de presencia es mejor que el modelo que resulta del background
  16. 17. Resultados: diferentes archivos <ul><li>Los archivos *.html y *.asc son los más importantes. </li></ul><ul><li>El archivo *.lambdas contiene los parámetros del modelo. </li></ul><ul><li>El archivo maxentResults.csv </li></ul><ul><li>La carpeta plots </li></ul>
  17. 18. El archivo *.asc <ul><li>Representa la cuadricula con las predicciones para el área de estudio. </li></ul><ul><li>Lo mejor es verlo con un software de SIG (e.g. ArcMap, DIVA etc..) </li></ul><ul><li>Con ese archivo podemos hacer mas análisis. </li></ul>
  18. 19. Umbral <ul><li>¿Qué es un umbral? </li></ul><ul><li>¿Por qué necesitamos un umbral? </li></ul>> 0.4
  19. 20. Sensibilidad y Especificidad <ul><li>Verdad positiva </li></ul>Falso positivo Falso negativo Verdad negativa
  20. 21. Sensibilidad <ul><li>Un modelo con una baja sensibilidad tiene muchos falso negativos. </li></ul>
  21. 22. Especificidad <ul><li>Un modelo con una baja especificidad tiene muchos falsos positivos </li></ul>
  22. 23. El archivo *.html <ul><li>Un resumen del modelo. </li></ul><ul><li>Gráficas del modelo. </li></ul><ul><li>Análisis estadístico. </li></ul>
  23. 24. AUC <ul><li>AUC – A rea U nder the Receiver Operating C urve </li></ul><ul><li>Es una medida de la calidad del modelo. </li></ul><ul><li>Hay otras medidas, pero el AUC es la más importante. </li></ul><ul><li>AUC > 0.9: muy buen modelo. </li></ul><ul><li>AUC 0.7 – 0.9: buen modelo. </li></ul><ul><li>AUC 0.5 – 0.7: mal modelo. </li></ul>
  24. 25. AUC plot
  25. 26. Tasa de omisión
  26. 27. Predicción de presencia <ul><li>1 significa una alta probabilidad. </li></ul><ul><li>0 una baja probabilidad. </li></ul><ul><li>Los puntos blancos son los puntos de presencia. </li></ul>
  27. 28. Sugerencias para un umbral <ul><li>Maxent tiene algunas sugerencias para un umbral. </li></ul><ul><li>Los umbrales son siempre difíciles de determinar y justificar. </li></ul><ul><li>Es mejor utilizar una mapa con probabilidades. </li></ul>
  28. 29. ¿Qué importancia tienen las variables? <ul><li>Contribución de cada variable. </li></ul><ul><li>Diferencias en AUC sin la variable . </li></ul>
  29. 30. El efecto de las variables (IV) <ul><li>¿Cómo cambiar la probabilidad de presencia con las variables? </li></ul><ul><li>Vamos a correr Maxent otra vez. </li></ul>
  30. 31. El efecto de las variables (II) <ul><li>Se debe tener cuidado si las variables están correlacionadas. </li></ul>Bio 5 = Temperatura máxima en el trimestres más caliente
  31. 32. Prueba del modelo <ul><li>Selección de puntos al azar para evaluación (e.g. 25% de los puntos). </li></ul><ul><li>Un archivo con nuevos (otros puntos) puntos </li></ul><ul><li>Metodología estadística como la validación cruzada. </li></ul>
  32. 33. Validación <ul><li>El principio es siempre el mismo: </li></ul><ul><ul><li>Usamos algunos puntos para crear el modelo. </li></ul></ul><ul><ul><li>Usamos los demás puntos para la evaluación. </li></ul></ul>
  33. 34. Evaluación con un porcentaje de los puntos <ul><li>Abrir Maxent. </li></ul><ul><li>Abrir la ventana 'Settings ' </li></ul><ul><li>Usamos un valor de 25% en el espacio ' random percentage ' </li></ul><ul><li>Cerrar la ventana. </li></ul><ul><li>Correr Maxent. </li></ul>
  34. 35. Resultados
  35. 36. Validación cruzada <ul><li>Validación cruzada = cross validation (CV). </li></ul><ul><li>Maxent divide los puntos en n partes. </li></ul><ul><li>Maxent crea n modelos, siempre sin la parte n. </li></ul><ul><li>La parte omitida para crear los modelos es usada para la validación. </li></ul><ul><li>El resultado son n modelos. </li></ul>
  36. 37. Creemos un modelo con CV <ul><li>Revisar que el ramdom test percentage es cero (0). </li></ul><ul><li>Abrir settings y elegir cross validate. </li></ul><ul><li>Ingresar cinco (5) en el espacio frente a replicates </li></ul>
  37. 38. Resultados <ul><li>Un resultado para cada corrida. </li></ul><ul><li>Un resumen para todos los resultados. </li></ul>
  38. 39. Resultados de la CV Promedio Desviación estándar
  39. 40. ¿Preguntas?
  40. 41. Proyección con datos de clima futuro
  41. 42. ¿Por qué? <ul><li>Tenemos la distribución de hoy. </li></ul><ul><li>¿Cambiará la distribución en el futuro? </li></ul><ul><li>Usamos diferentes modelos del cambio climático. </li></ul>
  42. 43. Fuentes de datos <ul><li>www.worldclim.org </li></ul><ul><li>http://gisweb.ciat.cgiar.org/GCMPage/ </li></ul><ul><li>www.ipcc.ch </li></ul>
  43. 44. Entonces… proyectemos un modelo <ul><li>Abrimos Maxent. </li></ul><ul><li>Todo los ajustes son los mismos. </li></ul><ul><li>Elegimos el directorio que tiene los datos de clima del futuro. </li></ul>
  44. 45. Resultados
  45. 46. 'Clamping ' <ul><li>Clamping : </li></ul><ul><ul><li>Si variables tienen un rango diferente en el futuro, con 'clamping ' los valores que están fuera del rango se mantendrán constantes. </li></ul></ul>
  46. 47. Prediciones con cuidado <ul><li>Superficie de Similaridad Multi-variada (Elith, 2010). </li></ul><ul><li>Valores negativos (rojo) son celdas donde el valor para una o más de las cuadriculas de los variables ambientales no están en el rango de valores de training . </li></ul>
  47. 48. Encontrar el cambio <ul><li>Se trabaja con DIVA- GIS y para esto es necesario el formado de *.grd. </li></ul><ul><li>Correr Maxent otra vez y cambiar el formato. </li></ul>
  48. 49. Abrir las cuadriculas en DIVA-GIS <ul><li>Abrir DIVA-GIS. </li></ul><ul><li>Abrir la cuadricula de la distribución potencial actual y la cuadricula de la distribución potencial por el ano 2080. </li></ul><ul><li>Layer / add layer </li></ul>
  49. 50. Reclasificar los valores <ul><li>Grid / reclass </li></ul><ul><li>Buscamos el umbral en el *.html. </li></ul><ul><li>El nuevo valor (hasta el umbral 0, después 1). </li></ul><ul><li>Creamos dos (2) nuevas cuadriculas: </li></ul><ul><ul><li>hoy_reclass.grd </li></ul></ul><ul><ul><ul><li>Presencia 1 </li></ul></ul></ul><ul><ul><ul><li>Ausencia 0 </li></ul></ul></ul><ul><ul><li>2080_reclass.grd </li></ul></ul><ul><ul><ul><li>Presencia 10 </li></ul></ul></ul><ul><ul><ul><li>Ausencia 0 </li></ul></ul></ul>
  50. 51. Creemos un 'stack ' <ul><li>Abrir Stack / make stack </li></ul><ul><li>Seleccionar las cuadriculas </li></ul><ul><ul><li>hoy_reclass.grd </li></ul></ul><ul><ul><li>2080_reclass.grd </li></ul></ul>
  51. 52. Sumar las cuadriculas <ul><li>Abrir Stack / calculate </li></ul><ul><li>¿Qué significan los valores? </li></ul><ul><ul><li>0 Ausencia. </li></ul></ul><ul><ul><li>1 Presencia actual, ausencia en el futuro. </li></ul></ul><ul><ul><li>10 Ausencia actual, presencia en el futuro. </li></ul></ul><ul><ul><li>11 Presencia actual y en el futuro. </li></ul></ul>
  52. 53. Recursos <ul><li>Primary Literature </li></ul><ul><ul><li>R. A Baldwin, “Use of Maximum Entropy Modeling in Wildlife Research,” Entropy 11, no. 4 (2009): 854–866. </li></ul></ul><ul><ul><li>Jane Elith et al., “A statistical explanation of MaxEnt for ecologists,” Diversity and Distributions (11, 2010) </li></ul></ul><ul><ul><li>J. Elith et al., “Novel methods improve prediction of species’ distributions from occurrence data,” Ecography 29, no. 2 (2006): 129–151. </li></ul></ul><ul><ul><li>S. J Phillips and M. Dudík, “Modeling of species distributions with Maxent: new extensions and a comprehensive evaluation,” Ecography 31, no. 2 (2008): 161–175. </li></ul></ul><ul><ul><li>S. J Phillips, M. Dudík, and R. E Schapire, “A maximum entropy approach to species distribution modeling,” in Proceedings of the twenty-first international conference on Machine learning, 2004, 83. </li></ul></ul><ul><ul><li>R. J Hijmans et al., “Very high resolution interpolated climate surfaces for global land areas,” International Journal of Climatology 25, no. 15 (2005): 1965–1978. </li></ul></ul>
  53. 54. Recursos <ul><li>Books </li></ul><ul><ul><li>Jane Franklin, Modelling Distribution of species </li></ul></ul><ul><li>Internet </li></ul><ul><ul><li>Google Group on Maxent </li></ul></ul><ul><ul><li>Tutorial in English and Spanish </li></ul></ul>
  54. 55. [email_address]
  55. 56. Formato de SWD <ul><li>¿Qué es SWD? </li></ul><ul><li>¿Por qué usamos SWD? </li></ul><ul><li>¿Cómo creamos un SWD? </li></ul><ul><li>SWD para las especies y background ? </li></ul>
  56. 57. Batch Running <ul><li>¿Qué es un batch ? </li></ul><ul><li>¿Por qué necesitamos el batch ? </li></ul><ul><li>¿Cómo creamos un batch ? </li></ul><ul><li>Más opciones con R, Python, Java etc ... </li></ul>

×