SlideShare a Scribd company logo
1 of 34
Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional J. Salvador Arias CONICET, INSUE, Facultad de Ciencias Naturales e Instituto Miguel Lillo, Universidad Nacional de Tucumán, Tucumán
Biogeografía histórica Distribución geográfica en un contexto filogenético Brundin, 1972
Biogeografía histórica Los métodos se basan en una analogía entre la reconstrucción filogenética y la biogeografía. Optimación de caracteres, bien sea usando parsimonia de Fitch o similares a Sankoff, o mapeo estocástico usando likelihood.
Biogeografía histórica Áreas predefinidas: Definidas arbitrariamente, nunca se contrastan Ignoran la naturaleza espacial de los datos No permiten escalas detalladas Solo son viables con pocos “caracteres” (áreas) Susceptibles a problemas que no son propios de la biogeografía (v.g. especies ampliamente distribuídas) Nylander et al. 2008
Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica
Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica En lugar de enfocarse en el área, hay que fijarse en la disyunción (vicarianza/alopatría) de las distribuciones
Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica En lugar de enfocarse en el área, hay que fijarse en la disyunción (vicarianza/alopatría) de las distribuciones Distribución de un nodo es la suma de sus descendientes
Distribuciones
Distribuciones Puntos georeferenciados
1. Para cada terminal  t 2. Para todas las celdas  (i,j) 3. D t  (i,j)   ←  0,  4. Para cada registro  r  en  t 5. D t  (i,j)   ←  1 para la celda  (x,y)  asignada al registro  r 6. Para cada  V k  de  (x,y) ,  D t  (v1,v2)   ←  1 7. Fin-para 2 8. Fin-para 1 ∎ Relleno de “imagen digital”
Relleno de “imagen digital”
Distribuciones Rellenado de la distribución
Distribuciones Grilla de 1x1 grados, entre los 60º N y 60º S: 360 x 120 celdas. Un poco más de 70 terminales, eso es más de 140 nodos: 360x120x140 celdas. Más de 6'000.000 de celdas, en su mayor parte vacías!
Quad-árboles Construir Q (i1, i2, j1, j2, anc) 1. Si (D|i1, i2, j1, j2| = 0) retornar NULO 2. Q -> ancestro  ←  anc 3. Asignar coordenadas del cuadrante a Q 4. Si ((i1 = i2) y (j1=j2))  Q -> esCelda?  ←  verdadero retornar Q 5. x  ←  i1 + ((i2 – i1) / 2), y  ←  j1 + ((j2 – j1) / 2) Q -> esCelda?  ←  falso 6. Q -> NW  ←  Construir Q (i1, x, j1, y, Q) Q -> NE  ←  Construir Q (x, i2, j1, y, Q) Q -> SW  ←  Construir Q (i1, x, y, j2, Q) Q -> NW  ←  Construir  Q (x, i2, y, j2, Q) 7. Retornar Q ∎
Quad-árboles
Criterio de optimalidad
Las reconstrucciones posibles se evalúan eliminando nodos, y revisando si dicho eliminación incrementa el número de nodos vicariantes. El criterio optimo es entonces: (i) minimizar nodos no vicariantes (ii) minimizar eliminación de nodos Criterio de optimalidad
Criterio de optimalidad Sea un nodo- j  un nodo en donde todos sus descendientes menos uno tienen una eliminación de distribucion (Page, 1994; Arias et al. 2008). Cualquier otro node es vicariante o no vicariante.
Sea  C n  el costo de la reconstrucción del nodo  n , y  desc (n)  es la lista de descendientes de  n . C n  =  (  ∑ i = desc(n)   C i  ) +  Y n  +  X n Criterio de optimalidad
Criterio de optimalidad C n  =  (  ∑ i = desc(n)   C i  ) +  Y n  +  X n Donde  Y n Y n  = costo de una eliminación, si la distribución de  n  es eliminada, De lo contrario,  Y n  = 0
C n  =  (  ∑ i = desc(n)   C i  ) +  Y n  +  X n y  X n X n  = 0, si  n  es un nodo- j , X n  = 0, si  n  es un nodo vicariante, X n  = costo de un nodo no vicariante, si n es no vicariante. Criterio de optimalidad
Esta operación permite conocer el costo del árbol para una reconstrucción dada. El peso de la búsqueda esta en la optimación del árbol: cada reconstrucción propuesta, requiere una optimación. Optimación
Optimar (nodo  n ) 1. Si ( n  es eliminado) C n   ←  costo_eliminación Sino C n   ←  0 2. Si  n  es terminal, retornar  C n 3. Para cada  i  que sea  desc(n) C n   ←   C n  + Optimar ( i ) 5. Si  n  es no vicariante C n   ←   C n  + Costo_no_vic 6. Retornar  C n ∎ Optimación ingenua
Optimación ingenua Requiere visitar todos los nodos del árbol. Su estructura revela la posibilidad de una optimación más adecuada: el costo de de un nodo depende solo de sus nodos descendientes, por lo tanto, si se parte de una reconstrucción, es posible únicamente optimar los nodos ancestrales al nodo modificado.
Optimar (nodo  n ) 1. Minetras n dif NULL 2. Si ( n  es eliminado) C n   ←  costo_eliminación Sino C n   ←  0 2. Si  n  es terminal,  n   ←   anc (n) , volver a 1 3. Para cada  i  que sea  desc(n) C n   ←   C n  +  C i 4. Si  n  es no vicariante C n   ←   C n  + Costo_no_vic 5. n   ←   anc (n) 6. Fin-Mientras ∎ Optimación incremental
Optimación incremental Depende de la estructura del árbol. En el peor caso, revisa todos los nodos del árbol. En promedio el número de visitas es el número de nodos entre el terminal más alejado de la raíz y la raíz.
Búsquedas heurísticas Las búsquedas exactas son muy costosas. El problema es una combinatoria, por lo que existen múchisimas posibilidades. Búsquedas heurísticas no garantizan encontrar el óptimo, pero permiten atacar problemas mucho mayores.
“ Subida de colina” simple 1. Min  ←  C t 2. Para cada nodo  n  en el árbol  t 3. Eliminar  n Optimizar  t 4. Si ( C t  < Min ) volver a 1. 5. Restaurar  n Optimizar  t 6. Fin para-2. ∎
“ Subida de colina” simple Rápida, independiente del punto de partida. En el peor caso revisa todos los nodos, 2n optimiaciones. Es poco efectiva en árboles grandes, las primeras eliminaciones pueden ser poco óptimas.
Heurística de Page 1.  Prev  ←  C t 2. Min  ←  C t Pos   ←  NULL 3. Para cada nodo  n  en el árbol  t 4. Eliminar  n , Optimizar  t 5. Si ( C t  < Min ) Min  ←  C t Pos  ←  n 6. Restaurar  n , Optimizar  t 7. Fin para-3. 8. Si ( Min < Prev ) Eliminar  n , Optimizar  t volver a 2. ∎
Más exhaustiva que la subida simple. En cada eliminación hace dos optimaciones. Un ciclo completo hace 2n optimiaciones. Si no hay empates, siempre realiza la misma secuencia. Heurística de Page
Los algoritmos presentados aquí se encuentran implementados en VIP (Vicariance Inference Program), un programa que pronto estará disponible de manera gratuita en internet. Este es el primer programa de biogeografía que utiliza filogenias y datos geográficos simultáneamente Implementación
Es difícil que se consigan mejores soluciones para la compresión de datos geográficos o optimaciones más rápidas. En cambio, hay muchas posibilidades para mejorar las heurísticas: búsquedas limitando los nodos a optimar, muestreos basados en cristalización simulada, o fusión de soluciones. Perspectivas
Este trabajo a recibido financiación de CONICET (beca doctoral), y FONCyT (PICT 1314). P. Hovenkamp ha mostrado un gran interés y retroalimentación al proyecto. C.A. Szumik, P.A. Goloboff, D. Casagranda, S. Catalono y M. Mirande han proporcionado ideas, discusión y apoyo. Agradecimientos

More Related Content

What's hot

abigail paillacho zoologia reptiles
abigail paillacho zoologia reptilesabigail paillacho zoologia reptiles
abigail paillacho zoologia reptiles
abigailpaillacho
 
Anfibios métodos y técnicas para el estudio de anfibios
Anfibios métodos y técnicas para el estudio de anfibiosAnfibios métodos y técnicas para el estudio de anfibios
Anfibios métodos y técnicas para el estudio de anfibios
danjatonys
 
11. anatomia del craneo de mamiferos
11. anatomia del craneo de mamiferos11. anatomia del craneo de mamiferos
11. anatomia del craneo de mamiferos
adrianatotto
 
Piso tropical nor occidental por Jessica Quinchiguango
Piso tropical nor occidental por Jessica QuinchiguangoPiso tropical nor occidental por Jessica Quinchiguango
Piso tropical nor occidental por Jessica Quinchiguango
jessicaquinchiguango
 

What's hot (20)

UCE Carrera de Biologia Y Quimica Pisos zoograficos del ecuador Freddy Proano
UCE Carrera de Biologia Y Quimica Pisos zoograficos del ecuador Freddy ProanoUCE Carrera de Biologia Y Quimica Pisos zoograficos del ecuador Freddy Proano
UCE Carrera de Biologia Y Quimica Pisos zoograficos del ecuador Freddy Proano
 
Biorregiones del mundo
Biorregiones del mundoBiorregiones del mundo
Biorregiones del mundo
 
Peces oseos
Peces oseosPeces oseos
Peces oseos
 
Metodos de trabajo en campo para aves del ecuador
Metodos de trabajo en campo para aves del ecuadorMetodos de trabajo en campo para aves del ecuador
Metodos de trabajo en campo para aves del ecuador
 
Piso Alto andino del Ecuador
Piso Alto andino del EcuadorPiso Alto andino del Ecuador
Piso Alto andino del Ecuador
 
Metodo de-estudio-de-campo-de-mamiferos. Por José Coro y Wendy Quinatoa
Metodo de-estudio-de-campo-de-mamiferos. Por José Coro y Wendy QuinatoaMetodo de-estudio-de-campo-de-mamiferos. Por José Coro y Wendy Quinatoa
Metodo de-estudio-de-campo-de-mamiferos. Por José Coro y Wendy Quinatoa
 
Reptiles: Técnicas de Captura
Reptiles: Técnicas de CapturaReptiles: Técnicas de Captura
Reptiles: Técnicas de Captura
 
Pisos zoogeográficos
Pisos zoogeográficosPisos zoogeográficos
Pisos zoogeográficos
 
Fauna vertebrada del parque nacional machalilla
Fauna vertebrada del parque nacional machalillaFauna vertebrada del parque nacional machalilla
Fauna vertebrada del parque nacional machalilla
 
Anfibios del Parque Nacional Machalilla y Sangay por Nicole Guaraca
Anfibios del Parque Nacional Machalilla y Sangay por Nicole GuaracaAnfibios del Parque Nacional Machalilla y Sangay por Nicole Guaraca
Anfibios del Parque Nacional Machalilla y Sangay por Nicole Guaraca
 
Radiacion adaptativa por Glenda Túquerres
Radiacion adaptativa por Glenda TúquerresRadiacion adaptativa por Glenda Túquerres
Radiacion adaptativa por Glenda Túquerres
 
Moluscos
MoluscosMoluscos
Moluscos
 
abigail paillacho zoologia reptiles
abigail paillacho zoologia reptilesabigail paillacho zoologia reptiles
abigail paillacho zoologia reptiles
 
Fauna Ecuatoriana y su taxonomía de peces e imágenes
Fauna Ecuatoriana y su taxonomía de peces e  imágenes Fauna Ecuatoriana y su taxonomía de peces e  imágenes
Fauna Ecuatoriana y su taxonomía de peces e imágenes
 
PECES ÓSEOS DEL ECUADOR
PECES ÓSEOS DEL ECUADOR PECES ÓSEOS DEL ECUADOR
PECES ÓSEOS DEL ECUADOR
 
Anfibios métodos y técnicas para el estudio de anfibios
Anfibios métodos y técnicas para el estudio de anfibiosAnfibios métodos y técnicas para el estudio de anfibios
Anfibios métodos y técnicas para el estudio de anfibios
 
Actinopterygii
ActinopterygiiActinopterygii
Actinopterygii
 
11. anatomia del craneo de mamiferos
11. anatomia del craneo de mamiferos11. anatomia del craneo de mamiferos
11. anatomia del craneo de mamiferos
 
Biología de los Anélidos
Biología de los AnélidosBiología de los Anélidos
Biología de los Anélidos
 
Piso tropical nor occidental por Jessica Quinchiguango
Piso tropical nor occidental por Jessica QuinchiguangoPiso tropical nor occidental por Jessica Quinchiguango
Piso tropical nor occidental por Jessica Quinchiguango
 

Viewers also liked (6)

Biogeografía
BiogeografíaBiogeografía
Biogeografía
 
BIOGEOGRAFÍA: FACTORES Y EXPONENTES. Lic Javier Cucaita
BIOGEOGRAFÍA: FACTORES Y EXPONENTES. Lic Javier CucaitaBIOGEOGRAFÍA: FACTORES Y EXPONENTES. Lic Javier Cucaita
BIOGEOGRAFÍA: FACTORES Y EXPONENTES. Lic Javier Cucaita
 
Síntesis histórica de la biogeografía - Resumen
Síntesis histórica de la biogeografía - ResumenSíntesis histórica de la biogeografía - Resumen
Síntesis histórica de la biogeografía - Resumen
 
1 historia biogeografía clasico linneo de candolle
1 historia biogeografía clasico linneo de candolle1 historia biogeografía clasico linneo de candolle
1 historia biogeografía clasico linneo de candolle
 
Biogeografia histórica e ecológica1 1
Biogeografia histórica e ecológica1 1Biogeografia histórica e ecológica1 1
Biogeografia histórica e ecológica1 1
 
Biogeografia aula 1
Biogeografia   aula 1Biogeografia   aula 1
Biogeografia aula 1
 

Similar to Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional

Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4
jcbenitezp
 
Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4
jcbenitezp
 
Sandoya fernando métodos exactos y heurísticos para el vrp jornadas
Sandoya fernando métodos exactos y heurísticos para el vrp jornadasSandoya fernando métodos exactos y heurísticos para el vrp jornadas
Sandoya fernando métodos exactos y heurísticos para el vrp jornadas
olimpica
 
Sistemas ecuaciones no lineales
Sistemas ecuaciones no linealesSistemas ecuaciones no lineales
Sistemas ecuaciones no lineales
Andres Milquez
 
Soluciones por series
Soluciones por seriesSoluciones por series
Soluciones por series
Kike Prieto
 

Similar to Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional (20)

Optimización. Métodos numéricos
Optimización. Métodos numéricosOptimización. Métodos numéricos
Optimización. Métodos numéricos
 
Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...
Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...
Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...
 
Algoritmo NVMO para problemas multimodales
Algoritmo NVMO para problemas multimodalesAlgoritmo NVMO para problemas multimodales
Algoritmo NVMO para problemas multimodales
 
Sistemas Difusos
Sistemas DifusosSistemas Difusos
Sistemas Difusos
 
S13 - Procesamiento digital de imágenes y visión artificial.pptx-1.pdf
S13 - Procesamiento digital de imágenes y visión artificial.pptx-1.pdfS13 - Procesamiento digital de imágenes y visión artificial.pptx-1.pdf
S13 - Procesamiento digital de imágenes y visión artificial.pptx-1.pdf
 
Optimizacion Univariada
Optimizacion UnivariadaOptimizacion Univariada
Optimizacion Univariada
 
Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4
 
Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4
 
Paralela4
Paralela4Paralela4
Paralela4
 
Paralela6
Paralela6Paralela6
Paralela6
 
Sandoya fernando métodos exactos y heurísticos para el vrp jornadas
Sandoya fernando métodos exactos y heurísticos para el vrp jornadasSandoya fernando métodos exactos y heurísticos para el vrp jornadas
Sandoya fernando métodos exactos y heurísticos para el vrp jornadas
 
Clase io3
Clase io3Clase io3
Clase io3
 
Metodo Simplex
Metodo SimplexMetodo Simplex
Metodo Simplex
 
1157834458 pauta i1 optimiz 1 2005
1157834458 pauta i1 optimiz 1 20051157834458 pauta i1 optimiz 1 2005
1157834458 pauta i1 optimiz 1 2005
 
Complejidad de Algoritmos
Complejidad de AlgoritmosComplejidad de Algoritmos
Complejidad de Algoritmos
 
Clustering.ppt
Clustering.pptClustering.ppt
Clustering.ppt
 
Sistemas ecuaciones no lineales
Sistemas ecuaciones no linealesSistemas ecuaciones no lineales
Sistemas ecuaciones no lineales
 
2014 iii 07 cocientes notables
2014 iii 07 cocientes notables2014 iii 07 cocientes notables
2014 iii 07 cocientes notables
 
Soluciones por series
Soluciones por seriesSoluciones por series
Soluciones por series
 
Analisis de Algoritmos tarea 1
Analisis de Algoritmos tarea 1Analisis de Algoritmos tarea 1
Analisis de Algoritmos tarea 1
 

More from Asociación Argentina de Bioinformática y Biología Computacional

More from Asociación Argentina de Bioinformática y Biología Computacional (16)

About using new descriptors for cheminformatics
About using new descriptors for cheminformaticsAbout using new descriptors for cheminformatics
About using new descriptors for cheminformatics
 
La Unidad de Bioinformática del INTA
La Unidad de Bioinformática del INTALa Unidad de Bioinformática del INTA
La Unidad de Bioinformática del INTA
 
Structural Order and Disorder Dictate Sequence And Functional Evolution of th...
Structural Order and Disorder Dictate Sequence And Functional Evolution of th...Structural Order and Disorder Dictate Sequence And Functional Evolution of th...
Structural Order and Disorder Dictate Sequence And Functional Evolution of th...
 
Discovery Of Functional Protein Linear Motifs Using a Greaddy Algorithm and I...
Discovery Of Functional Protein Linear Motifs Using a Greaddy Algorithm and I...Discovery Of Functional Protein Linear Motifs Using a Greaddy Algorithm and I...
Discovery Of Functional Protein Linear Motifs Using a Greaddy Algorithm and I...
 
Cooperatividad en la Expresión Génica: Abordaje Estocástico
Cooperatividad en la Expresión Génica: Abordaje EstocásticoCooperatividad en la Expresión Génica: Abordaje Estocástico
Cooperatividad en la Expresión Génica: Abordaje Estocástico
 
Prediction of heparin binding sites on GAPDH
Prediction of heparin binding sites on GAPDHPrediction of heparin binding sites on GAPDH
Prediction of heparin binding sites on GAPDH
 
Signals of Evolution: Conservation, Specificity Determining Positions and Coe...
Signals of Evolution: Conservation, Specificity Determining Positions and Coe...Signals of Evolution: Conservation, Specificity Determining Positions and Coe...
Signals of Evolution: Conservation, Specificity Determining Positions and Coe...
 
Predicting peptide/MHC interactions: Application to epitope identification an...
Predicting peptide/MHC interactions: Application to epitope identification an...Predicting peptide/MHC interactions: Application to epitope identification an...
Predicting peptide/MHC interactions: Application to epitope identification an...
 
Design of degenerated primers from bioinformatics online software for putativ...
Design of degenerated primers from bioinformatics online software for putativ...Design of degenerated primers from bioinformatics online software for putativ...
Design of degenerated primers from bioinformatics online software for putativ...
 
A structure-function analysis of s HSPs in plants
A structure-function analysis of s HSPs in plantsA structure-function analysis of s HSPs in plants
A structure-function analysis of s HSPs in plants
 
Modelado de la proteína p35 de toxoplasma gondii
Modelado de la proteína p35 de toxoplasma gondiiModelado de la proteína p35 de toxoplasma gondii
Modelado de la proteína p35 de toxoplasma gondii
 
Data balancing for phenotype classification based on SNPs
Data balancing for phenotype classification based on SNPsData balancing for phenotype classification based on SNPs
Data balancing for phenotype classification based on SNPs
 
Gene selection via significant subset using silhouette index
Gene selection via significant subset using silhouette indexGene selection via significant subset using silhouette index
Gene selection via significant subset using silhouette index
 
Bolstered error estimation for discrete classifier applied to genomic signal ...
Bolstered error estimation for discrete classifier applied to genomic signal ...Bolstered error estimation for discrete classifier applied to genomic signal ...
Bolstered error estimation for discrete classifier applied to genomic signal ...
 
Biopython: Overview, State of the Art and Outlook
Biopython: Overview, State of the Art and OutlookBiopython: Overview, State of the Art and Outlook
Biopython: Overview, State of the Art and Outlook
 
¿Cuál es la estabilidad relevante de las proteínas?
¿Cuál es la estabilidad relevante de las proteínas?¿Cuál es la estabilidad relevante de las proteínas?
¿Cuál es la estabilidad relevante de las proteínas?
 

Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional

  • 1. Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional J. Salvador Arias CONICET, INSUE, Facultad de Ciencias Naturales e Instituto Miguel Lillo, Universidad Nacional de Tucumán, Tucumán
  • 2. Biogeografía histórica Distribución geográfica en un contexto filogenético Brundin, 1972
  • 3. Biogeografía histórica Los métodos se basan en una analogía entre la reconstrucción filogenética y la biogeografía. Optimación de caracteres, bien sea usando parsimonia de Fitch o similares a Sankoff, o mapeo estocástico usando likelihood.
  • 4. Biogeografía histórica Áreas predefinidas: Definidas arbitrariamente, nunca se contrastan Ignoran la naturaleza espacial de los datos No permiten escalas detalladas Solo son viables con pocos “caracteres” (áreas) Susceptibles a problemas que no son propios de la biogeografía (v.g. especies ampliamente distribuídas) Nylander et al. 2008
  • 5. Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica
  • 6. Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica En lugar de enfocarse en el área, hay que fijarse en la disyunción (vicarianza/alopatría) de las distribuciones
  • 7. Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica En lugar de enfocarse en el área, hay que fijarse en la disyunción (vicarianza/alopatría) de las distribuciones Distribución de un nodo es la suma de sus descendientes
  • 10. 1. Para cada terminal t 2. Para todas las celdas (i,j) 3. D t (i,j) ← 0, 4. Para cada registro r en t 5. D t (i,j) ← 1 para la celda (x,y) asignada al registro r 6. Para cada V k de (x,y) , D t (v1,v2) ← 1 7. Fin-para 2 8. Fin-para 1 ∎ Relleno de “imagen digital”
  • 11. Relleno de “imagen digital”
  • 12. Distribuciones Rellenado de la distribución
  • 13. Distribuciones Grilla de 1x1 grados, entre los 60º N y 60º S: 360 x 120 celdas. Un poco más de 70 terminales, eso es más de 140 nodos: 360x120x140 celdas. Más de 6'000.000 de celdas, en su mayor parte vacías!
  • 14. Quad-árboles Construir Q (i1, i2, j1, j2, anc) 1. Si (D|i1, i2, j1, j2| = 0) retornar NULO 2. Q -> ancestro ← anc 3. Asignar coordenadas del cuadrante a Q 4. Si ((i1 = i2) y (j1=j2)) Q -> esCelda? ← verdadero retornar Q 5. x ← i1 + ((i2 – i1) / 2), y ← j1 + ((j2 – j1) / 2) Q -> esCelda? ← falso 6. Q -> NW ← Construir Q (i1, x, j1, y, Q) Q -> NE ← Construir Q (x, i2, j1, y, Q) Q -> SW ← Construir Q (i1, x, y, j2, Q) Q -> NW ← Construir Q (x, i2, y, j2, Q) 7. Retornar Q ∎
  • 17. Las reconstrucciones posibles se evalúan eliminando nodos, y revisando si dicho eliminación incrementa el número de nodos vicariantes. El criterio optimo es entonces: (i) minimizar nodos no vicariantes (ii) minimizar eliminación de nodos Criterio de optimalidad
  • 18. Criterio de optimalidad Sea un nodo- j un nodo en donde todos sus descendientes menos uno tienen una eliminación de distribucion (Page, 1994; Arias et al. 2008). Cualquier otro node es vicariante o no vicariante.
  • 19. Sea C n el costo de la reconstrucción del nodo n , y desc (n) es la lista de descendientes de n . C n = ( ∑ i = desc(n) C i ) + Y n + X n Criterio de optimalidad
  • 20. Criterio de optimalidad C n = ( ∑ i = desc(n) C i ) + Y n + X n Donde Y n Y n = costo de una eliminación, si la distribución de n es eliminada, De lo contrario, Y n = 0
  • 21. C n = ( ∑ i = desc(n) C i ) + Y n + X n y X n X n = 0, si n es un nodo- j , X n = 0, si n es un nodo vicariante, X n = costo de un nodo no vicariante, si n es no vicariante. Criterio de optimalidad
  • 22. Esta operación permite conocer el costo del árbol para una reconstrucción dada. El peso de la búsqueda esta en la optimación del árbol: cada reconstrucción propuesta, requiere una optimación. Optimación
  • 23. Optimar (nodo n ) 1. Si ( n es eliminado) C n ← costo_eliminación Sino C n ← 0 2. Si n es terminal, retornar C n 3. Para cada i que sea desc(n) C n ← C n + Optimar ( i ) 5. Si n es no vicariante C n ← C n + Costo_no_vic 6. Retornar C n ∎ Optimación ingenua
  • 24. Optimación ingenua Requiere visitar todos los nodos del árbol. Su estructura revela la posibilidad de una optimación más adecuada: el costo de de un nodo depende solo de sus nodos descendientes, por lo tanto, si se parte de una reconstrucción, es posible únicamente optimar los nodos ancestrales al nodo modificado.
  • 25. Optimar (nodo n ) 1. Minetras n dif NULL 2. Si ( n es eliminado) C n ← costo_eliminación Sino C n ← 0 2. Si n es terminal, n ← anc (n) , volver a 1 3. Para cada i que sea desc(n) C n ← C n + C i 4. Si n es no vicariante C n ← C n + Costo_no_vic 5. n ← anc (n) 6. Fin-Mientras ∎ Optimación incremental
  • 26. Optimación incremental Depende de la estructura del árbol. En el peor caso, revisa todos los nodos del árbol. En promedio el número de visitas es el número de nodos entre el terminal más alejado de la raíz y la raíz.
  • 27. Búsquedas heurísticas Las búsquedas exactas son muy costosas. El problema es una combinatoria, por lo que existen múchisimas posibilidades. Búsquedas heurísticas no garantizan encontrar el óptimo, pero permiten atacar problemas mucho mayores.
  • 28. “ Subida de colina” simple 1. Min ← C t 2. Para cada nodo n en el árbol t 3. Eliminar n Optimizar t 4. Si ( C t < Min ) volver a 1. 5. Restaurar n Optimizar t 6. Fin para-2. ∎
  • 29. “ Subida de colina” simple Rápida, independiente del punto de partida. En el peor caso revisa todos los nodos, 2n optimiaciones. Es poco efectiva en árboles grandes, las primeras eliminaciones pueden ser poco óptimas.
  • 30. Heurística de Page 1. Prev ← C t 2. Min ← C t Pos ← NULL 3. Para cada nodo n en el árbol t 4. Eliminar n , Optimizar t 5. Si ( C t < Min ) Min ← C t Pos ← n 6. Restaurar n , Optimizar t 7. Fin para-3. 8. Si ( Min < Prev ) Eliminar n , Optimizar t volver a 2. ∎
  • 31. Más exhaustiva que la subida simple. En cada eliminación hace dos optimaciones. Un ciclo completo hace 2n optimiaciones. Si no hay empates, siempre realiza la misma secuencia. Heurística de Page
  • 32. Los algoritmos presentados aquí se encuentran implementados en VIP (Vicariance Inference Program), un programa que pronto estará disponible de manera gratuita en internet. Este es el primer programa de biogeografía que utiliza filogenias y datos geográficos simultáneamente Implementación
  • 33. Es difícil que se consigan mejores soluciones para la compresión de datos geográficos o optimaciones más rápidas. En cambio, hay muchas posibilidades para mejorar las heurísticas: búsquedas limitando los nodos a optimar, muestreos basados en cristalización simulada, o fusión de soluciones. Perspectivas
  • 34. Este trabajo a recibido financiación de CONICET (beca doctoral), y FONCyT (PICT 1314). P. Hovenkamp ha mostrado un gran interés y retroalimentación al proyecto. C.A. Szumik, P.A. Goloboff, D. Casagranda, S. Catalono y M. Mirande han proporcionado ideas, discusión y apoyo. Agradecimientos