Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional J. Salvador Arias CONICET, INSUE, Facultad ...
Biogeografía histórica Distribución geográfica en un contexto filogenético Brundin, 1972
Biogeografía histórica Los métodos se basan en una analogía entre la reconstrucción filogenética y la biogeografía. Optima...
Biogeografía histórica Áreas predefinidas: Definidas arbitrariamente, nunca se contrastan Ignoran la naturaleza espacial d...
Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica
Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica En lugar de...
Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica En lugar de...
Distribuciones
Distribuciones Puntos georeferenciados
1. Para cada terminal  t 2. Para todas las celdas  (i,j) 3. D t  (i,j)   ←  0,  4. Para cada registro  r  en  t 5. D t  (i...
Relleno de “imagen digital”
Distribuciones Rellenado de la distribución
Distribuciones Grilla de 1x1 grados, entre los 60º N y 60º S: 360 x 120 celdas. Un poco más de 70 terminales, eso es más d...
Quad-árboles Construir Q (i1, i2, j1, j2, anc) 1. Si (D|i1, i2, j1, j2| = 0) retornar NULO 2. Q -> ancestro  ←  anc 3. Asi...
Quad-árboles
Criterio de optimalidad
Las reconstrucciones posibles se evalúan eliminando nodos, y revisando si dicho eliminación incrementa el número de nodos ...
Criterio de optimalidad Sea un nodo- j  un nodo en donde todos sus descendientes menos uno tienen una eliminación de distr...
Sea  C n  el costo de la reconstrucción del nodo  n , y  desc (n)  es la lista de descendientes de  n . C n  =  (  ∑ i = d...
Criterio de optimalidad C n  =  (  ∑ i = desc(n)   C i  ) +  Y n  +  X n Donde  Y n Y n  = costo de una eliminación, si la...
C n  =  (  ∑ i = desc(n)   C i  ) +  Y n  +  X n y  X n X n  = 0, si  n  es un nodo- j , X n  = 0, si  n  es un nodo vicar...
Esta operación permite conocer el costo del árbol para una reconstrucción dada. El peso de la búsqueda esta en la optimaci...
Optimar (nodo  n ) 1. Si ( n  es eliminado) C n   ←  costo_eliminación Sino C n   ←  0 2. Si  n  es terminal, retornar  C ...
Optimación ingenua Requiere visitar todos los nodos del árbol. Su estructura revela la posibilidad de una optimación más a...
Optimar (nodo  n ) 1. Minetras n dif NULL 2. Si ( n  es eliminado) C n   ←  costo_eliminación Sino C n   ←  0 2. Si  n  es...
Optimación incremental Depende de la estructura del árbol. En el peor caso, revisa todos los nodos del árbol. En promedio ...
Búsquedas heurísticas Las búsquedas exactas son muy costosas. El problema es una combinatoria, por lo que existen múchisim...
“ Subida de colina” simple 1. Min  ←  C t 2. Para cada nodo  n  en el árbol  t 3. Eliminar  n Optimizar  t 4. Si ( C t  < ...
“ Subida de colina” simple Rápida, independiente del punto de partida. En el peor caso revisa todos los nodos, 2n optimiac...
Heurística de Page 1.  Prev  ←  C t 2. Min  ←  C t Pos   ←  NULL 3. Para cada nodo  n  en el árbol  t 4. Eliminar  n , Opt...
Más exhaustiva que la subida simple. En cada eliminación hace dos optimaciones. Un ciclo completo hace 2n optimiaciones. S...
Los algoritmos presentados aquí se encuentran implementados en VIP (Vicariance Inference Program), un programa que pronto ...
Es difícil que se consigan mejores soluciones para la compresión de datos geográficos o optimaciones más rápidas. En cambi...
Este trabajo a recibido financiación de CONICET (beca doctoral), y FONCyT (PICT 1314). P. Hovenkamp ha mostrado un gran in...
Upcoming SlideShare
Loading in …5
×

Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional

6,888 views

Published on

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
6,888
On SlideShare
0
From Embeds
0
Number of Embeds
1,023
Actions
Shares
0
Downloads
48
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional

  1. 1. Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional J. Salvador Arias CONICET, INSUE, Facultad de Ciencias Naturales e Instituto Miguel Lillo, Universidad Nacional de Tucumán, Tucumán
  2. 2. Biogeografía histórica Distribución geográfica en un contexto filogenético Brundin, 1972
  3. 3. Biogeografía histórica Los métodos se basan en una analogía entre la reconstrucción filogenética y la biogeografía. Optimación de caracteres, bien sea usando parsimonia de Fitch o similares a Sankoff, o mapeo estocástico usando likelihood.
  4. 4. Biogeografía histórica Áreas predefinidas: Definidas arbitrariamente, nunca se contrastan Ignoran la naturaleza espacial de los datos No permiten escalas detalladas Solo son viables con pocos “caracteres” (áreas) Susceptibles a problemas que no son propios de la biogeografía (v.g. especies ampliamente distribuídas) Nylander et al. 2008
  5. 5. Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica
  6. 6. Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica En lugar de enfocarse en el área, hay que fijarse en la disyunción (vicarianza/alopatría) de las distribuciones
  7. 7. Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica En lugar de enfocarse en el área, hay que fijarse en la disyunción (vicarianza/alopatría) de las distribuciones Distribución de un nodo es la suma de sus descendientes
  8. 8. Distribuciones
  9. 9. Distribuciones Puntos georeferenciados
  10. 10. 1. Para cada terminal t 2. Para todas las celdas (i,j) 3. D t (i,j) ← 0, 4. Para cada registro r en t 5. D t (i,j) ← 1 para la celda (x,y) asignada al registro r 6. Para cada V k de (x,y) , D t (v1,v2) ← 1 7. Fin-para 2 8. Fin-para 1 ∎ Relleno de “imagen digital”
  11. 11. Relleno de “imagen digital”
  12. 12. Distribuciones Rellenado de la distribución
  13. 13. Distribuciones Grilla de 1x1 grados, entre los 60º N y 60º S: 360 x 120 celdas. Un poco más de 70 terminales, eso es más de 140 nodos: 360x120x140 celdas. Más de 6'000.000 de celdas, en su mayor parte vacías!
  14. 14. Quad-árboles Construir Q (i1, i2, j1, j2, anc) 1. Si (D|i1, i2, j1, j2| = 0) retornar NULO 2. Q -> ancestro ← anc 3. Asignar coordenadas del cuadrante a Q 4. Si ((i1 = i2) y (j1=j2)) Q -> esCelda? ← verdadero retornar Q 5. x ← i1 + ((i2 – i1) / 2), y ← j1 + ((j2 – j1) / 2) Q -> esCelda? ← falso 6. Q -> NW ← Construir Q (i1, x, j1, y, Q) Q -> NE ← Construir Q (x, i2, j1, y, Q) Q -> SW ← Construir Q (i1, x, y, j2, Q) Q -> NW ← Construir Q (x, i2, y, j2, Q) 7. Retornar Q ∎
  15. 15. Quad-árboles
  16. 16. Criterio de optimalidad
  17. 17. Las reconstrucciones posibles se evalúan eliminando nodos, y revisando si dicho eliminación incrementa el número de nodos vicariantes. El criterio optimo es entonces: (i) minimizar nodos no vicariantes (ii) minimizar eliminación de nodos Criterio de optimalidad
  18. 18. Criterio de optimalidad Sea un nodo- j un nodo en donde todos sus descendientes menos uno tienen una eliminación de distribucion (Page, 1994; Arias et al. 2008). Cualquier otro node es vicariante o no vicariante.
  19. 19. Sea C n el costo de la reconstrucción del nodo n , y desc (n) es la lista de descendientes de n . C n = ( ∑ i = desc(n) C i ) + Y n + X n Criterio de optimalidad
  20. 20. Criterio de optimalidad C n = ( ∑ i = desc(n) C i ) + Y n + X n Donde Y n Y n = costo de una eliminación, si la distribución de n es eliminada, De lo contrario, Y n = 0
  21. 21. C n = ( ∑ i = desc(n) C i ) + Y n + X n y X n X n = 0, si n es un nodo- j , X n = 0, si n es un nodo vicariante, X n = costo de un nodo no vicariante, si n es no vicariante. Criterio de optimalidad
  22. 22. Esta operación permite conocer el costo del árbol para una reconstrucción dada. El peso de la búsqueda esta en la optimación del árbol: cada reconstrucción propuesta, requiere una optimación. Optimación
  23. 23. Optimar (nodo n ) 1. Si ( n es eliminado) C n ← costo_eliminación Sino C n ← 0 2. Si n es terminal, retornar C n 3. Para cada i que sea desc(n) C n ← C n + Optimar ( i ) 5. Si n es no vicariante C n ← C n + Costo_no_vic 6. Retornar C n ∎ Optimación ingenua
  24. 24. Optimación ingenua Requiere visitar todos los nodos del árbol. Su estructura revela la posibilidad de una optimación más adecuada: el costo de de un nodo depende solo de sus nodos descendientes, por lo tanto, si se parte de una reconstrucción, es posible únicamente optimar los nodos ancestrales al nodo modificado.
  25. 25. Optimar (nodo n ) 1. Minetras n dif NULL 2. Si ( n es eliminado) C n ← costo_eliminación Sino C n ← 0 2. Si n es terminal, n ← anc (n) , volver a 1 3. Para cada i que sea desc(n) C n ← C n + C i 4. Si n es no vicariante C n ← C n + Costo_no_vic 5. n ← anc (n) 6. Fin-Mientras ∎ Optimación incremental
  26. 26. Optimación incremental Depende de la estructura del árbol. En el peor caso, revisa todos los nodos del árbol. En promedio el número de visitas es el número de nodos entre el terminal más alejado de la raíz y la raíz.
  27. 27. Búsquedas heurísticas Las búsquedas exactas son muy costosas. El problema es una combinatoria, por lo que existen múchisimas posibilidades. Búsquedas heurísticas no garantizan encontrar el óptimo, pero permiten atacar problemas mucho mayores.
  28. 28. “ Subida de colina” simple 1. Min ← C t 2. Para cada nodo n en el árbol t 3. Eliminar n Optimizar t 4. Si ( C t < Min ) volver a 1. 5. Restaurar n Optimizar t 6. Fin para-2. ∎
  29. 29. “ Subida de colina” simple Rápida, independiente del punto de partida. En el peor caso revisa todos los nodos, 2n optimiaciones. Es poco efectiva en árboles grandes, las primeras eliminaciones pueden ser poco óptimas.
  30. 30. Heurística de Page 1. Prev ← C t 2. Min ← C t Pos ← NULL 3. Para cada nodo n en el árbol t 4. Eliminar n , Optimizar t 5. Si ( C t < Min ) Min ← C t Pos ← n 6. Restaurar n , Optimizar t 7. Fin para-3. 8. Si ( Min < Prev ) Eliminar n , Optimizar t volver a 2. ∎
  31. 31. Más exhaustiva que la subida simple. En cada eliminación hace dos optimaciones. Un ciclo completo hace 2n optimiaciones. Si no hay empates, siempre realiza la misma secuencia. Heurística de Page
  32. 32. Los algoritmos presentados aquí se encuentran implementados en VIP (Vicariance Inference Program), un programa que pronto estará disponible de manera gratuita en internet. Este es el primer programa de biogeografía que utiliza filogenias y datos geográficos simultáneamente Implementación
  33. 33. Es difícil que se consigan mejores soluciones para la compresión de datos geográficos o optimaciones más rápidas. En cambio, hay muchas posibilidades para mejorar las heurísticas: búsquedas limitando los nodos a optimar, muestreos basados en cristalización simulada, o fusión de soluciones. Perspectivas
  34. 34. Este trabajo a recibido financiación de CONICET (beca doctoral), y FONCyT (PICT 1314). P. Hovenkamp ha mostrado un gran interés y retroalimentación al proyecto. C.A. Szumik, P.A. Goloboff, D. Casagranda, S. Catalono y M. Mirande han proporcionado ideas, discusión y apoyo. Agradecimientos

×