Successfully reported this slideshow.
Análisis Bayesiano de Tablas de Contingencia Bidimensionales Ing. Juan Manuel Casanova González Trabajo de Investigación 0...
Introducción  (1/5) <ul><li>Tablas de Contingencia </li></ul><ul><ul><li>Analizan la relación o dependencia de dos o más v...
Introducción  (2/5)   /  29 Análisis Bayesiano de Tablas de Contingencia  Bidimensionales <ul><li>Estudio sobre Contaminac...
Introducción  (3/5) <ul><li>Estadística   Bayesiana </li></ul><ul><ul><li>Enfoque alternativo para el análisis estadístico...
Introducción  (4/5) <ul><li>Teorema de Bayes </li></ul><ul><li>Manejo subjetivo del concepto de probabilidad.  </li></ul><...
Introducción  (5/5) <ul><li>Estadística Bayesiana </li></ul><ul><ul><li>Es un proceso comparativo.  Compara la probabilida...
Identificación del Problema (1/3) <ul><li>Tablas de Contingencia: Análisis Clásico </li></ul><ul><ul><li>Sea observa  D = ...
<ul><li>Tablas de Contingencia: Análisis Bayesiano </li></ul><ul><ul><li>La probabilidad a posteriori de que sea válida  H...
Identificación del Problema (3/3) <ul><li>Entonces…. </li></ul><ul><li>Por lo general el p-valor puede llegar a ser sustan...
Objetivos  (1/1) <ul><li>Objetivos Específicos </li></ul><ul><ul><li>Estimar las probabilidades posteriores en las celdas ...
Metodología  (1/10) <ul><li>Una tabla de contingencia tiene la siguiente estructura: </li></ul><ul><li>Modelo multinomial ...
Metodología  (2/10) <ul><li>Modelo 1: Multinomial-Dirichlet  </li></ul><ul><ul><li>Una tabla de contingencia tiene muestre...
Metodología  (3/10) <ul><li>¿Qué distribución a priori se les puede asignar? </li></ul><ul><ul><li>Dificultad de obtener i...
Metodología  (4/10) <ul><li>Pruebas y Modelos Utilizados </li></ul><ul><ul><li>Valoración Bayesiana de la prueba Chi-cuadr...
Metodología  (5/10) <ul><li>Valoración Bayesiana de la Prueba Chi-Cuadrado (Matthews, 1999) </li></ul><ul><ul><li>En condi...
Metodología  (6/10) <ul><li>Prueba Bayesiana de Independencia (Homogeneidad) </li></ul><ul><ul><li>La función  ctable  de ...
Metodología  (7/10) <ul><li>Análisis Bayesiano de los Modelos Log-lineales  </li></ul><ul><ul><li>En una tabla de continge...
Metodología  (8/10) <ul><li>Análisis Bayesiano de los Modelos Log-lineales  </li></ul><ul><ul><li>Congdon (2005) propone q...
Metodología  (9/10) <ul><li>Medidas de selección del mejor modelo </li></ul><ul><ul><li>Criterio más usado es el  DIC (Dev...
Metodología  (10/10) <ul><li>Cadenas de Markov vía Monte Carlo (MCMC) </li></ul><ul><ul><li>Uno de los más grandes problem...
Resultados y Discusión  (1/10) <ul><li>Estudio sobre Contaminación Ambiental </li></ul><ul><li>Con el fin de estudiar la r...
Resultados y Discusión  (1/10) <ul><li>Programa en Winbugs </li></ul>  /  29 Análisis Bayesiano de Tablas de Contingencia ...
Resultados y Discusión  (1/10) <ul><li>Modelo Multinomial - Dirichlet </li></ul><ul><ul><ul><li>Reporte obtenidos usando 3...
Resultados y Discusión  (2/10) <ul><li>Modelo Multinomial - Dirichlet </li></ul><ul><li>En  azul , resultados del análisis...
Resultados y Discusión  (8/10) <ul><li>Pruebas de Homogeneidad </li></ul><ul><ul><li>Análisis Clásico: Chi-cuadrado </li><...
Resultados y Discusión  (8/10) <ul><li>Pruebas de Homogeneidad </li></ul><ul><ul><li>¿Qué pasa si cambia la probabilidad a...
Resultados y Discusión  (8/10) <ul><li>Pruebas de Homogeneidad </li></ul><ul><ul><li>Prueba Bayesiana de Independencia </l...
Resultados y Discusión  (8/10) <ul><li>Modelo Log-lineal  </li></ul><ul><ul><li>A través de los Modelos Log-lineales podem...
Resultados y Discusión  (8/10) <ul><li>Modelo Log-lineal Clásico de Independencia </li></ul>  /  29 Análisis Bayesiano de ...
Resultados y Discusión  (8/10) <ul><li>Modelo Log-lineal Clásico Saturado </li></ul>  /  29 Análisis Bayesiano de Tablas d...
Resultados y Discusión  (8/10)   /  29 Análisis Bayesiano de Tablas de Contingencia  Bidimensionales <ul><li>Modelo Log-li...
Resultados y Discusión  (8/10)   /  29 Análisis Bayesiano de Tablas de Contingencia  Bidimensionales <ul><li>Modelo Log-li...
Resultados y Discusión  (8/10)   /  29 Análisis Bayesiano de Tablas de Contingencia  Bidimensionales <ul><li>Modelo Log-li...
Resultados y Discusión  (8/10)   /  29 Análisis Bayesiano de Tablas de Contingencia  Bidimensionales <ul><li>Modelo Log-li...
Resultados y Discusión  (9/10) <ul><li>Modelos Log-lineal de Independencia  (30000 iteraciones – 5000 descartadas) </li></...
Resultados y Discusión  (9/10) <ul><li>Modelos Log-lineal Saturado  (30000 iteraciones – 5000 descartadas) </li></ul>  /  ...
Resultados y Discusión  (10/10) <ul><li>Selección del mejor modelo </li></ul><ul><ul><li>Análisis Clásico </li></ul></ul><...
Conclusiones  (1/2) <ul><li>Las inferencias generadas a partir de la metodología Bayesiana son   más informativas y fácile...
Conclusiones  (2/2) <ul><li>Los valores de los parámetros log-lineales obtenidos en ambas tablas de contingencia desde el ...
Bibliografía  (1/1) <ul><li>MATTHEWS, Robert. Significance Levels for the assessment of anomalous phenomena. Journal of Sc...
Fin   /  29 Análisis Bayesiano de Tablas de Contingencia  Bidimensionales Muchas Gracias!
Upcoming SlideShare
Loading in …5
×

Trabajo de Investigación: Análisis Bayesiano de Tablas de Contingencia Bidimensionales

6,866 views

Published on

  • Be the first to comment

Trabajo de Investigación: Análisis Bayesiano de Tablas de Contingencia Bidimensionales

  1. 1. Análisis Bayesiano de Tablas de Contingencia Bidimensionales Ing. Juan Manuel Casanova González Trabajo de Investigación 09 de Septiembre del 2009
  2. 2. Introducción (1/5) <ul><li>Tablas de Contingencia </li></ul><ul><ul><li>Analizan la relación o dependencia de dos o más variables cualitativas o “discretizadas”. </li></ul></ul><ul><ul><li>Cuando describen la relación entre dos variables son llamadas tablas de contingencia IxJ o bidimensionales. </li></ul></ul><ul><ul><li>Determinar si las variables están relacionadas de alguna manera (pruebas de independencia y homogeneidad) </li></ul></ul><ul><ul><li>Técnicas que usualmente se aplican: </li></ul></ul><ul><ul><ul><li>Prueba Chi – Cuadrado </li></ul></ul></ul><ul><ul><ul><li>Medidas de asociación (Coef. Contingencia, V de Cràmer) </li></ul></ul></ul><ul><ul><ul><li>Análisis de Correspondencias (Simple, Múltiple) </li></ul></ul></ul><ul><ul><ul><li>Modelos Log-lineales </li></ul></ul></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales
  3. 3. Introducción (2/5) / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales <ul><li>Estudio sobre Contaminación Ambiental </li></ul><ul><li>Con el fin de estudiar la relación entre el grado de contaminación ambiental y la climatología se han recogido datos durante 200 días y se han clasificado según el grado de contaminación (1=alta, 2=media, 3=baja) y según la nubosidad (1=intensa, 2=débil, 3=inexistente). </li></ul><ul><li>Estructura probabilística de la tabla se ajusta a un modelo Producto de Multinomiales. La hipótesis adecuada es la de homogeneidad. </li></ul>Grado de Contaminación Nivel de Nubosidad Total Intensa Débil Inexistente Alta 28 16 12 56 Media 23 52 21 96 Baja 12 21 15 48 Total 63 89 48 200
  4. 4. Introducción (3/5) <ul><li>Estadística Bayesiana </li></ul><ul><ul><li>Enfoque alternativo para el análisis estadístico convencional de datos. </li></ul></ul><ul><ul><li>Se basa en el Teorema de Bayes: </li></ul></ul><ul><ul><li>P(A/B): Probabilidad del evento A dado el evento B o probabilidad a posteriori </li></ul></ul><ul><ul><li>P(A): Probabilidad a priori del evento A </li></ul></ul><ul><ul><li>P(B/A)/P(B): Evidencia </li></ul></ul><ul><ul><ul><li>P(B/A): Probabilidad del evento B dado el evento A </li></ul></ul></ul><ul><ul><ul><li>P(B): Probabilidad a priori del evento A </li></ul></ul></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales
  5. 5. Introducción (4/5) <ul><li>Teorema de Bayes </li></ul><ul><li>Manejo subjetivo del concepto de probabilidad. </li></ul><ul><li>Permite incorporar las evidencias aportadas por experiencias previas dentro del proceso analítico y las contempla, por ende, en las conclusiones. </li></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales Probabilidad de  , dado los datos (Distribución a Posteriori) Probabilidad de los datos, dado   Verosimilitud  Probabilidad de los datos (Constante Normalizadora) Probabilidad a priori de  (Distribución a priori)
  6. 6. Introducción (5/5) <ul><li>Estadística Bayesiana </li></ul><ul><ul><li>Es un proceso comparativo. Compara la probabilidad del suceso observado bajo la hipótesis nula y bajo diferentes hipótesis alternativas. </li></ul></ul><ul><ul><li>Factor de Bayes: </li></ul></ul><ul><ul><li>Los métodos Bayesianos han abierto nuevas expectativas en el análisis de tablas de contingencia. </li></ul></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales Probabilidad de los datos, dado   Probabilidad de los datos, dado   Probabilidades a priori de ambas hipótesis
  7. 7. Identificación del Problema (1/3) <ul><li>Tablas de Contingencia: Análisis Clásico </li></ul><ul><ul><li>Sea observa D = d 0 medida usando el estadístico Chi-cuadrado. </li></ul></ul><ul><ul><li>Se calcula la probabilidad de haber obtenido dicha diferencia u otra mayor, suponiendo válida la hipótesis nula H 0 . </li></ul></ul><ul><ul><li>Esta probabilidad se emplea como base para la decisión (valor de probabilidad o p-valor ). </li></ul></ul><ul><ul><li>Es decir, lo que se calcula es: </li></ul></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales
  8. 8. <ul><li>Tablas de Contingencia: Análisis Bayesiano </li></ul><ul><ul><li>La probabilidad a posteriori de que sea válida H 0 suponiendo que se observaron los datos que dan lugar a la diferencia observada d 0 . </li></ul></ul><ul><ul><li>Es decir, lo que se calcula es: </li></ul></ul><ul><ul><li>La interpretación de los resultados es más sencilla. Expresa el grado de creencia. </li></ul></ul><ul><ul><li>Más adecuado a la realidad. </li></ul></ul>Identificación del Problema (2/3) / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales
  9. 9. Identificación del Problema (3/3) <ul><li>Entonces…. </li></ul><ul><li>Por lo general el p-valor puede llegar a ser sustantivamente menor que la probabilidad …..Paradoja de Lindley! </li></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales ó
  10. 10. Objetivos (1/1) <ul><li>Objetivos Específicos </li></ul><ul><ul><li>Estimar las probabilidades posteriores en las celdas y sus intervalos de densidad posterior más grande. </li></ul></ul><ul><ul><li>Determinar la probabilidad de que exista asociación entre dos variables categóricas usando el concepto del factor de Bayes. </li></ul></ul><ul><ul><li>Aplicar modelos log-lineales Bayesianos a las tablas de contingencia IxJ , para determinar si las variables están relacionadas de alguna manera. </li></ul></ul><ul><ul><li>Desarrollar algoritmos con el programa Winbugs como herramienta para hacer las estimaciones de los parámetros y las regiones de credibilidad en los modelos presentados. </li></ul></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales Generales Presentar la metodología del modelamiento Bayesiano aplicado a las tablas de contingencia IxJ Ilustrar la metodología Bayesiana aplicada a tablas de contingencia IxJ con datos experimentales y comparar sus resultados con el análisis Clásico.
  11. 11. Metodología (1/10) <ul><li>Una tabla de contingencia tiene la siguiente estructura: </li></ul><ul><li>Modelo multinomial </li></ul><ul><li>Modelo producto de multinomiales </li></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales
  12. 12. Metodología (2/10) <ul><li>Modelo 1: Multinomial-Dirichlet </li></ul><ul><ul><li>Una tabla de contingencia tiene muestreo multinomial cuando el total de observaciones n es fijo. </li></ul></ul><ul><ul><li>Hipótesis planteada es la de independencia. </li></ul></ul><ul><ul><li>Distribución posterior: </li></ul></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales Verosimilitud Distribución a Priori Distribución Posterior <ul><li>Modelo 2: Producto de Multinomiales - Dirichlet </li></ul><ul><ul><li>Los totales marginales son fijos. </li></ul></ul><ul><ul><li>Se tienen I subpoblaciones, es de interés conocer el comportamiento de la variable columna en cada una de ellas – Homogeneidad. </li></ul></ul><ul><ul><li>Distribución posterior de la primera fila: </li></ul></ul>Verosimilitud Distribución a Priori Distribución Posterior
  13. 13. Metodología (3/10) <ul><li>¿Qué distribución a priori se les puede asignar? </li></ul><ul><ul><li>Dificultad de obtener información a priori sobre los valores de los parámetros de las tablas. </li></ul></ul><ul><ul><li>Generalmente se recurre a distribuciones a priori no informativas. </li></ul></ul><ul><ul><li>La manera más usual (pero no la única) es haciendo α i =1 para los parámetros Dirichlet, así se obtiene una distribución Uniforme (esta otorga igual densidad a todo vector π – La información previa que se tiene es la misma para todos los parámetros). </li></ul></ul><ul><ul><li>Es posible utilizar esta distribución a priori tanto en el caso de muestreo multinomial como en el caso de muestreo producto de multinomiales. </li></ul></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales
  14. 14. Metodología (4/10) <ul><li>Pruebas y Modelos Utilizados </li></ul><ul><ul><li>Valoración Bayesiana de la prueba Chi-cuadrado (Matthews, 1999). </li></ul></ul><ul><ul><li>Prueba Bayesiana de Independencia – Homogeneidad (Albert 2007). </li></ul></ul><ul><ul><li>Modelos Log-Lineales Bayesianos </li></ul></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales
  15. 15. Metodología (5/10) <ul><li>Valoración Bayesiana de la Prueba Chi-Cuadrado (Matthews, 1999) </li></ul><ul><ul><li>En condiciones bastante generales, se puede hallar una cota inferior para el factor de Bayes, en función del valor observado Χ 2 : </li></ul></ul><ul><ul><li>Esto da lugar a la siguiente desigualdad : </li></ul></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales Probabilidad mínima de que la hipótesis de independencia (u homogeneidad) sea cierta dado los datos. Probabilidad a priori de H 0
  16. 16. Metodología (6/10) <ul><li>Prueba Bayesiana de Independencia (Homogeneidad) </li></ul><ul><ul><li>La función ctable de la biblioteca LearnBayes del paquete estadístico R , diseñada por Albert (2007), calcula esta prueba. </li></ul></ul><ul><ul><li>Reporta el factor de Bayes contra de la hipótesis de independencia . </li></ul></ul><ul><ul><li>Luego: </li></ul></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales Probabilidad de que exista asociación dado los datos.
  17. 17. Metodología (7/10) <ul><li>Análisis Bayesiano de los Modelos Log-lineales </li></ul><ul><ul><li>En una tabla de contingencia IxJ , se tiene que </li></ul></ul><ul><ul><li>Modelo de Independencia: </li></ul></ul><ul><ul><li>Modelo Saturado o de asociación: </li></ul></ul><ul><ul><li>Para asegurar la identificabilidad del modelo (número de parámetros igual o menor al número de celdas en la tabla) , se igualan a cero todos los efectos donde participen las primeras categorías de cada variable. </li></ul></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales
  18. 18. Metodología (8/10) <ul><li>Análisis Bayesiano de los Modelos Log-lineales </li></ul><ul><ul><li>Congdon (2005) propone que los parámetros restantes sean tomados como efectos fijos independientemente distribuidos, con media cero y varianza muy grande: </li></ul></ul><ul><ul><li>Una alternativa (Agresti y Hitchcock (2005)), es usar un modelo jerárquico Bayesiano: </li></ul></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales u i 1/ σ 2 δ Ga(0.1,0.1) N( δ , σ 2 ) U(0,1) u i N(0,1000) 1er Nivel 1er Nivel 2do Nivel Precisión =1/1000
  19. 19. Metodología (9/10) <ul><li>Medidas de selección del mejor modelo </li></ul><ul><ul><li>Criterio más usado es el DIC (Deviance Information Criteria) , Spiegelhalter (2006). </li></ul></ul><ul><ul><li>Análogo del AIC (Akaike Information Criteria) del análisis clásico. </li></ul></ul><ul><ul><li>Es muy útil en la comparación de modelos (ej. Modelo de Independencia con el Modelo Saturado). </li></ul></ul><ul><ul><li>Modelos con un menor valor del DIC ajustan mejor los datos. </li></ul></ul><ul><ul><li>Otros criterios: </li></ul></ul><ul><ul><ul><li>BIC (Bayesian Information Criteria) </li></ul></ul></ul><ul><ul><ul><li>Factor de Bayes </li></ul></ul></ul><ul><ul><ul><li>A partir del BIC es posible aproximar el valor del factor de Bayes de un modelo frente al otro. </li></ul></ul></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales
  20. 20. Metodología (10/10) <ul><li>Cadenas de Markov vía Monte Carlo (MCMC) </li></ul><ul><ul><li>Uno de los más grandes problemas con el uso de las aproximaciones Bayesianas es la obtención de la distribución posterior. </li></ul></ul><ul><ul><li>Los métodos MCMC (Smith & Roberts (1993)) simulan la gráfica de una distribución compleja de interés, a través del muestreo de largas y posiblemente múltiples cadenas de valores de un determinado parámetro, también de interés. </li></ul></ul><ul><ul><li>Muestrear un punto θ * de una distribución llamada “de salto”, el cual es comparado con el valor anterior de la cadena θ t-1 a través de una razón de verosimilitudes denotada por α , se acepta el punto si con p = min ( α ,1), si no, se descarta y se muestrea otro. </li></ul></ul><ul><li>WinBUGS 1.4.2 </li></ul><ul><ul><li>Programa para el análisis Bayesiano de modelos estadísticos complejos utilizando técnicas MCMC (como el muestreo de Gibbs). </li></ul></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales
  21. 21. Resultados y Discusión (1/10) <ul><li>Estudio sobre Contaminación Ambiental </li></ul><ul><li>Con el fin de estudiar la relación entre el grado de contaminación ambiental y la climatología se han recogido datos durante 200 días y se han clasificado según el grado de contaminación (1=alta, 2=media, 3=baja) y según la nubosidad (1=intensa, 2=débil, 3=inexistente). </li></ul><ul><li>Estructura probabilística de la tabla se ajusta a un modelo multinomial. La hipótesis adecuada es la de independencia . </li></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales Grado de Contaminación Nivel de Nubosidad Total Intensa Débil Inexistente Alta 28 16 12 56 Media 23 52 21 96 Baja 12 21 15 48 Total 63 89 48 200
  22. 22. Resultados y Discusión (1/10) <ul><li>Programa en Winbugs </li></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales
  23. 23. Resultados y Discusión (1/10) <ul><li>Modelo Multinomial - Dirichlet </li></ul><ul><ul><ul><li>Reporte obtenidos usando 30000 iteraciones (5000 descartadas). </li></ul></ul></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales
  24. 24. Resultados y Discusión (2/10) <ul><li>Modelo Multinomial - Dirichlet </li></ul><ul><li>En azul , resultados del análisis Bayesiano. </li></ul><ul><li>Los resultados son iguales a los obtenidos al análisis clásico. </li></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales Grado de Contaminación Nivel de Nubosidad Total Intensa Débil Inexistente Alta 0.140 (0.140) 0.080 (0.080) 0.059 (0.060) 1.000 Media 0.115 (0.115) 0.260 (0.260) 0.105 (0.105) 1.000 Baja 0.060 (0.060) 0.105 (0.105) 0.075 (0.075) 1.000
  25. 25. Resultados y Discusión (8/10) <ul><li>Pruebas de Homogeneidad </li></ul><ul><ul><li>Análisis Clásico: Chi-cuadrado </li></ul></ul><ul><ul><ul><li>chisq.test(contami) </li></ul></ul></ul><ul><ul><ul><li>Pearson's Chi-squared test </li></ul></ul></ul><ul><ul><ul><li>data: contami </li></ul></ul></ul><ul><ul><ul><li>X-squared = 15.0626, df = 4, p-value = 0.004573 </li></ul></ul></ul><ul><ul><li>Valoración Bayesiana de la Prueba de Independencia </li></ul></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales Probabilidad a priori de H 0 0.5 Valor m í nimo del FB 0. 0034 Valor mínimo de P(H 0 /Datos) 0.0034
  26. 26. Resultados y Discusión (8/10) <ul><li>Pruebas de Homogeneidad </li></ul><ul><ul><li>¿Qué pasa si cambia la probabilidad a priori P(Ho) de que sea cierta la hipótesis planteada que habla de la homogeneidad entre las respuestas de las poblaciones? </li></ul></ul><ul><ul><li> > tabla </li></ul></ul><ul><ul><li>PHo PMinimaHo </li></ul></ul><ul><ul><li>1 0.1 0.000 </li></ul></ul><ul><ul><li>2 0.2 0.001 </li></ul></ul><ul><ul><li>3 0.3 0.001 </li></ul></ul><ul><ul><li>4 0.4 0.002 </li></ul></ul><ul><ul><li>5 0.5 0.003 </li></ul></ul><ul><ul><li>6 0.6 0.005 </li></ul></ul><ul><ul><li>7 0.7 0.008 </li></ul></ul><ul><ul><li>8 0.8 0.014 </li></ul></ul><ul><ul><li>9 0.9 0.030 </li></ul></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales
  27. 27. Resultados y Discusión (8/10) <ul><li>Pruebas de Homogeneidad </li></ul><ul><ul><li>Prueba Bayesiana de Independencia </li></ul></ul><ul><ul><li>La probabilidad de que exista asociación entre el grado de contaminación y el nivel de nubosidad es de 0.93. </li></ul></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales FB en contra de la homogeneidad 12.56 Probabilidad a priori de H 0 0.50 0.93
  28. 28. Resultados y Discusión (8/10) <ul><li>Modelo Log-lineal </li></ul><ul><ul><li>A través de los Modelos Log-lineales podemos investigar la existencia de asociación entre ambas variables. </li></ul></ul><ul><ul><li>Para ellos se obtienen los resultados del modelo saturado y el de independencia, y se evalúa cual se ajusta mejor a los datos. </li></ul></ul><ul><ul><li>Se comparan los resultados obtenidos del modelo clásico con el modelo bayesiano. </li></ul></ul><ul><ul><li>Se utilizan medidas de adecuación del mejor modelo: AIC por el lado clásico, y DIC por el lado bayesiano. </li></ul></ul><ul><ul><li>El modelo clásico y bayesiano pueden obtenerse de los paquetes de R glm() y zelig(). </li></ul></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales
  29. 29. Resultados y Discusión (8/10) <ul><li>Modelo Log-lineal Clásico de Independencia </li></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales
  30. 30. Resultados y Discusión (8/10) <ul><li>Modelo Log-lineal Clásico Saturado </li></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales
  31. 31. Resultados y Discusión (8/10) / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales <ul><li>Modelo Log-lineal Bayesiano de Independencia </li></ul>
  32. 32. Resultados y Discusión (8/10) / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales <ul><li>Modelo Log-lineal Bayesiano de Independencia </li></ul>
  33. 33. Resultados y Discusión (8/10) / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales <ul><li>Modelo Log-lineal Clásico Saturado </li></ul>
  34. 34. Resultados y Discusión (8/10) / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales <ul><li>Modelo Log-lineal Clásico Saturado </li></ul>
  35. 35. Resultados y Discusión (9/10) <ul><li>Modelos Log-lineal de Independencia (30000 iteraciones – 5000 descartadas) </li></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales Coeficiente Notaci ó n Estimado (Cl á sico) Media (Bayesiano) Intercepto 2.8702 2.8550 Media 0.5390 0.5434 Baja -0.1542 -0.1554 Débil 0.3455 0.3477 Inexistente -0.2719 -0-2740
  36. 36. Resultados y Discusión (9/10) <ul><li>Modelos Log-lineal Saturado (30000 iteraciones – 5000 descartadas) </li></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales Si se hace , se puede decir que, comparado con el nivel de nubosidad intenso, es 3 veces más probable que en un día de nivel de nubosidad débil se obtenga una medición de grado de contaminación baja contra que la medición sea un grado de contaminación alto. Coeficiente Notaci ó n Estimado (Cl á sico) Media (Bayesiano) Intercepto 3.3322 3.3150 Media -0.1967 -0.1996 Baja -0.8473 -0.8729 Débil -0.5596 -0.5703 Inexistente -0.8473 -0.8735 Media-Débil 1.3754 1.3960 Baja-Débil 1.1192 1.1470 Media-Inexistente 0.7563 0.7772 Baja-Inexistente 1.0704 1.1050
  37. 37. Resultados y Discusión (10/10) <ul><li>Selección del mejor modelo </li></ul><ul><ul><li>Análisis Clásico </li></ul></ul><ul><ul><li>AIC del modelo Saturado: 61.581 </li></ul></ul><ul><ul><li>AIC del modelo de Independencia: 68.176 </li></ul></ul><ul><ul><li>Análisis Bayesiano </li></ul></ul><ul><ul><li>DIC del modelo Saturado: </li></ul></ul><ul><ul><li>DIC del modelo de Independencia: </li></ul></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales
  38. 38. Conclusiones (1/2) <ul><li>Las inferencias generadas a partir de la metodología Bayesiana son más informativas y fáciles de interpretar desde el punto de vista probabilístico que las realizadas a partir de la metodología clásica. </li></ul><ul><li>El uso del WinBUGS en el presente estudio permitió realizar inferencia Bayesiana de manera más sencilla y rápida, además de demostrar la utilidad e importancia de los métodos de simulación de Cadenas de Markov vía Monte Carlo. </li></ul><ul><li>El análisis Bayesiano de la tabla Contaminación Ambiental permite concluir que es muy probable que exista asociación entre la nubosidad y el nivel de contaminación, pues la probabilidad calculada es 0.93. </li></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales
  39. 39. Conclusiones (2/2) <ul><li>Los valores de los parámetros log-lineales obtenidos en ambas tablas de contingencia desde el punto de vista Bayesiano, fueron muy similares a los obtenidos a través del punto de vista clásico, esto por el uso de distribuciones a priori no informativas. </li></ul><ul><li>La aplicación de criterios para la selección del mejor modelo, como el DIC, permitió tomar una decisión respecto a si el modelo saturado ajustaba mejor a los datos que el de independencia. </li></ul><ul><li>La simulación MCMC puede ser peligrosa, y de haber algún fallo en el modelo, WinBUGS podría obtener resultados erróneos. Por ello se recomienda analizar cuidadosamente los resultados, después de un número convincente de simulaciones. </li></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales
  40. 40. Bibliografía (1/1) <ul><li>MATTHEWS, Robert. Significance Levels for the assessment of anomalous phenomena. Journal of Scientific Exploration. USA, 1999. Vol. 13, Nº 1. Pág 1-7. </li></ul><ul><li>ALBERT, James H. Bayesian Computation with R. Ohio. Springer Ed. 2007. 280 p. </li></ul><ul><li>BERGER, J, SELLKE, T. Testing a point null hypothesis: the irreconcilability of P-values and evidence. Journal of American Statistical Association. USA, 1987. Número 82, página 112. </li></ul><ul><li>CONGDON, Peter. Bayesian Models for Categorical Data. Londres, John Wiley & Sons Ltd. 2005. 425 p. </li></ul><ul><li>Winbugs 1.4 </li></ul><ul><li>Epidat 3.1 </li></ul> / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales
  41. 41. Fin / 29 Análisis Bayesiano de Tablas de Contingencia Bidimensionales Muchas Gracias!

×