Your SlideShare is downloading. ×
Introduction to SDM with Maxent JohannesS Signer
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Introduction to SDM with Maxent JohannesS Signer

3,765

Published on

2 Comments
3 Likes
Statistics
Notes
No Downloads
Views
Total Views
3,765
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
155
Comments
2
Likes
3
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Maxent Modelamiento de distribución de especies Johannes Signer [email_address]
  • 2. Agenda
    • ¿Qué son Spatial Distribution Models (SDM)?
    • ¿Qué es Maxent?
    • Ejemplo de un corrida
    • Ejemplo de evaluación
  • 3. Realidad Mapa Mapa con más detalle Una foto Modelo
  • 4. Los modelos tienen un propósito
  • 5.  
  • 6. Aspectos importantes
    • Los modelos son representaciones simplificadas de la realidad.
    • Los modelos tienen un propósito y es importante tener muy claro cuál es dicho propósito.
  • 7. Modelos de distribución potencial
    • Hay diferentes modelos de distribución potencial (Maxent, BRT, GAM, GLM, EcoCrop).
    • Maxent es un modelo que utiliza el principio de máxima entropía.
    • Maxent sólo necesita puntos de presencia de una especie y variables ambientales.
  • 8. ¿Por qué usamos Maxent?
    • Proporciona:
      • Buenos resultados (Elith et al. 2006).
      • Buenos resultados con pocos puntos (< 50).
      • Sólo necesita puntos de presencia.
      • Es un programa fácil para usar.
    • Algoritmo de difícil comprensión ('Blackbox')
    • Hay también otros buenos algoritmos (BRT...)
  • 9. ¿Cómo funciona Maxent?
    • Tenemos puntos de presencia.
    • Maxent crea 10,000 puntos de pseudo-ausencia ( background points ).
  • 10. ¿Cómo funciona Maxent ?
    • Diferentes variables ambientales:
      • Variables continuas (e.g. temperatura)
      • Variables categóricas (e.g. uso del suelo, zonas ecológicas)
    • Todas las cuadrículas deben tener los mismos límites geográficos y el mismo tamaño de celda.
  • 11. ¿Como funciona Maxent ?
    • Maxent asume una distribución de la especie en todas las celdas.
    • Posteriormente Maxent restringe la distribución dependiendo de las variables ambientales .
  • 12. Ejemplo
  • 13. Antes de empenzar
    • Necesitamos los puntos de presencia en el formato de *.csv
    • Necesitamos las cuadriculas en el formato de *.asc.
    • Todas las cuadriculas necesitan la misma extensión.
    • Los puntos de presencia y las cuadriculas necesitan la misma proyección (e.g. WGS84)
  • 14. Corrida en Maxent (I)
    • Abrimos el Maxent (./maxent/maxent.jar)
    • Elegimos el archivo de las muestras. (./datos/va.csv)
    • Elegimos el directorio de las variables ambientales (./datos/env)
    • Creamos un directorio de output (./datos/output)
  • 15. Variables ambientales
    • Bioclim:
    • BIO1 = Annual Mean Temperature
    • BIO2 = Mean Diurnal Range (Mean of monthly (max temp - min temp))
    • BIO3 = Isothermality (P2/P7) (* 100)
    • BIO4 = Temperature Seasonality (standard deviation *100)
    • BIO5 = Max Temperature of Warmest Month
    • BIO6 = Min Temperature of Coldest Month
    • BIO7 = Temperature Annual Range (P5-P6)
    • BIO8 = Mean Temperature of Wettest Quarter
    • BIO9 = Mean Temperature of Driest Quarter
    • BIO10 = Mean Temperature of Warmest Quarter
    • BIO11 = Mean Temperature of Coldest Quarter
    • BIO12 = Annual Precipitation
    • BIO13 = Precipitation of Wettest Month
    • BIO14 = Precipitation of Driest Month
    • BIO15 = Precipitation Seasonality (Coefficient of Variation)
    • BIO16 = Precipitation of Wettest Quarter
    • BIO17 = Precipitation of Driest Quarter
    • BIO18 = Precipitation of Warmest Quarter
    • BIO19 = Precipitation of Coldest Quarter
  • 16. Configuración y 'gain '
    • Usualmente la configuración predeterminada esta bien.
    • exp(gain) = x max alta del background
    • e.g. gain=1.4, exp(1.4)=4.05
    Lo que se mide aquí es cuántas veces un modelo que resulta de los puntos de presencia es mejor que el modelo que resulta del background
  • 17. Resultados: diferentes archivos
    • Los archivos *.html y *.asc son los más importantes.
    • El archivo *.lambdas contiene los parámetros del modelo.
    • El archivo maxentResults.csv
    • La carpeta plots
  • 18. El archivo *.asc
    • Representa la cuadricula con las predicciones para el área de estudio.
    • Lo mejor es verlo con un software de SIG (e.g. ArcMap, DIVA etc..)
    • Con ese archivo podemos hacer mas análisis.
  • 19. Umbral
    • ¿Qué es un umbral?
    • ¿Por qué necesitamos un umbral?
    > 0.4
  • 20. Sensibilidad y Especificidad
    • Verdad positiva
    Falso positivo Falso negativo Verdad negativa
  • 21. Sensibilidad
    • Un modelo con una baja sensibilidad tiene muchos falso negativos.
  • 22. Especificidad
    • Un modelo con una baja especificidad tiene muchos falsos positivos
  • 23. El archivo *.html
    • Un resumen del modelo.
    • Gráficas del modelo.
    • Análisis estadístico.
  • 24. AUC
    • AUC – A rea U nder the Receiver Operating C urve
    • Es una medida de la calidad del modelo.
    • Hay otras medidas, pero el AUC es la más importante.
    • AUC > 0.9: muy buen modelo.
    • AUC 0.7 – 0.9: buen modelo.
    • AUC 0.5 – 0.7: mal modelo.
  • 25. AUC plot
  • 26. Tasa de omisión
  • 27. Predicción de presencia
    • 1 significa una alta probabilidad.
    • 0 una baja probabilidad.
    • Los puntos blancos son los puntos de presencia.
  • 28. Sugerencias para un umbral
    • Maxent tiene algunas sugerencias para un umbral.
    • Los umbrales son siempre difíciles de determinar y justificar.
    • Es mejor utilizar una mapa con probabilidades.
  • 29. ¿Qué importancia tienen las variables?
    • Contribución de cada variable.
    • Diferencias en AUC sin la variable .
  • 30. El efecto de las variables (IV)
    • ¿Cómo cambiar la probabilidad de presencia con las variables?
    • Vamos a correr Maxent otra vez.
  • 31. El efecto de las variables (II)
    • Se debe tener cuidado si las variables están correlacionadas.
    Bio 5 = Temperatura máxima en el trimestres más caliente
  • 32. Prueba del modelo
    • Selección de puntos al azar para evaluación (e.g. 25% de los puntos).
    • Un archivo con nuevos (otros puntos) puntos
    • Metodología estadística como la validación cruzada.
  • 33. Validación
    • El principio es siempre el mismo:
      • Usamos algunos puntos para crear el modelo.
      • Usamos los demás puntos para la evaluación.
  • 34. Evaluación con un porcentaje de los puntos
    • Abrir Maxent.
    • Abrir la ventana 'Settings '
    • Usamos un valor de 25% en el espacio ' random percentage '
    • Cerrar la ventana.
    • Correr Maxent.
  • 35. Resultados
  • 36. Validación cruzada
    • Validación cruzada = cross validation (CV).
    • Maxent divide los puntos en n partes.
    • Maxent crea n modelos, siempre sin la parte n.
    • La parte omitida para crear los modelos es usada para la validación.
    • El resultado son n modelos.
  • 37. Creemos un modelo con CV
    • Revisar que el ramdom test percentage es cero (0).
    • Abrir settings y elegir cross validate.
    • Ingresar cinco (5) en el espacio frente a replicates
  • 38. Resultados
    • Un resultado para cada corrida.
    • Un resumen para todos los resultados.
  • 39. Resultados de la CV Promedio Desviación estándar
  • 40. ¿Preguntas?
  • 41. Proyección con datos de clima futuro
  • 42. ¿Por qué?
    • Tenemos la distribución de hoy.
    • ¿Cambiará la distribución en el futuro?
    • Usamos diferentes modelos del cambio climático.
  • 43. Fuentes de datos
    • www.worldclim.org
    • http://gisweb.ciat.cgiar.org/GCMPage/
    • www.ipcc.ch
  • 44. Entonces… proyectemos un modelo
    • Abrimos Maxent.
    • Todo los ajustes son los mismos.
    • Elegimos el directorio que tiene los datos de clima del futuro.
  • 45. Resultados
  • 46. 'Clamping '
    • Clamping :
      • Si variables tienen un rango diferente en el futuro, con 'clamping ' los valores que están fuera del rango se mantendrán constantes.
  • 47. Prediciones con cuidado
    • Superficie de Similaridad Multi-variada (Elith, 2010).
    • Valores negativos (rojo) son celdas donde el valor para una o más de las cuadriculas de los variables ambientales no están en el rango de valores de training .
  • 48. Encontrar el cambio
    • Se trabaja con DIVA- GIS y para esto es necesario el formado de *.grd.
    • Correr Maxent otra vez y cambiar el formato.
  • 49. Abrir las cuadriculas en DIVA-GIS
    • Abrir DIVA-GIS.
    • Abrir la cuadricula de la distribución potencial actual y la cuadricula de la distribución potencial por el ano 2080.
    • Layer / add layer
  • 50. Reclasificar los valores
    • Grid / reclass
    • Buscamos el umbral en el *.html.
    • El nuevo valor (hasta el umbral 0, después 1).
    • Creamos dos (2) nuevas cuadriculas:
      • hoy_reclass.grd
        • Presencia 1
        • Ausencia 0
      • 2080_reclass.grd
        • Presencia 10
        • Ausencia 0
  • 51. Creemos un 'stack '
    • Abrir Stack / make stack
    • Seleccionar las cuadriculas
      • hoy_reclass.grd
      • 2080_reclass.grd
  • 52. Sumar las cuadriculas
    • Abrir Stack / calculate
    • ¿Qué significan los valores?
      • 0 Ausencia.
      • 1 Presencia actual, ausencia en el futuro.
      • 10 Ausencia actual, presencia en el futuro.
      • 11 Presencia actual y en el futuro.
  • 53. Recursos
    • Primary Literature
      • R. A Baldwin, “Use of Maximum Entropy Modeling in Wildlife Research,” Entropy 11, no. 4 (2009): 854–866.
      • Jane Elith et al., “A statistical explanation of MaxEnt for ecologists,” Diversity and Distributions (11, 2010)
      • J. Elith et al., “Novel methods improve prediction of species’ distributions from occurrence data,” Ecography 29, no. 2 (2006): 129–151.
      • S. J Phillips and M. Dudík, “Modeling of species distributions with Maxent: new extensions and a comprehensive evaluation,” Ecography 31, no. 2 (2008): 161–175.
      • S. J Phillips, M. Dudík, and R. E Schapire, “A maximum entropy approach to species distribution modeling,” in Proceedings of the twenty-first international conference on Machine learning, 2004, 83.
      • R. J Hijmans et al., “Very high resolution interpolated climate surfaces for global land areas,” International Journal of Climatology 25, no. 15 (2005): 1965–1978.
  • 54. Recursos
    • Books
      • Jane Franklin, Modelling Distribution of species
    • Internet
      • Google Group on Maxent
      • Tutorial in English and Spanish
  • 55. [email_address]
  • 56. Formato de SWD
    • ¿Qué es SWD?
    • ¿Por qué usamos SWD?
    • ¿Cómo creamos un SWD?
    • SWD para las especies y background ?
  • 57. Batch Running
    • ¿Qué es un batch ?
    • ¿Por qué necesitamos el batch ?
    • ¿Cómo creamos un batch ?
    • Más opciones con R, Python, Java etc ...

×