Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

1,351 views

Published on

Presentación del Seminario del Grupo Ciencia, Razón y Fe de la Universidad de Navarra, Jesús López Fidalgo, Pamplona, 17 de enero de 2017.

Ponente:
Jesús López Fidalgo es catedrático de Estadística en el ICS; ha realizado estancias prolongadas de investigación y docentes en las Universidades de Manchester, Glasgow, UCLA y California en Riverside; profesor adjunto de la Universidad Nacional de Colombia en Medellín; vicepresidente de la Sociedad de Estadística e Investigación Operativa y editor-jefe de la revista Test. Es también miembro electo del Instituto Internacional de Estadística. Ha sido gestor del Plan Nacional de Matemáticas en el Ministerio de Ciencia e Innovación (2009-2011) y director de la Escuela Técnica Superior de Ingenieros Industriales de la UCLM (2008-2016). Ha publicado más de 100 artículos en revistas científicas. Autor del libro de divulgación “el azar no existe”. Ha dirigido trece tesis doctorales y coordina un nodo de la red nacional de bioestadística.

Resumen:
La investigación científica, entre otras muchas cosas, es deductiva e inductiva. La deducción es utilizada en todas las disciplinas. Sus demostraciones, irrefutables, suelen acabar con un q.e.d. Por otra parte, en las así llamadas ciencias experimentales, la inducción es cada vez más esencial. La estadística moderna ha venido a dar consistencia matemática a la inducción mediante las leyes del azar. En este seminario se pretende mostrar cómo lo hace, utilizando los procesos naturales de la mente humana para extraer conclusiones de datos sencillos. Se abordará el tema de la posible manipulación en todas las fases de la investigación, desde la planificación de la recogida de datos hasta la toma de decisiones a partir de la interpretación de los resultados. Se abordarán con ejemplos sencillos algunos temas candentes hoy día como son la inferencia causal, los procedimientos bayesianos, cuestiones ético-estadísticas, el tratamiento de datos masivos, la detección estadística de datos fraudulentos o la dificultad de hacer predicciones cuando entra en juego la libertad humana.

Published in: Science
  • Be the first to comment

  • Be the first to like this

q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

  1. 1. q.e.d. (quod erat demonstrandum) ¿Es cient´ıfica la demostraci´on estad´ıstica? Jes´us L´opez Fidalgo fidalgo@unav.es https://www.uclm.es/profesorado/jesuslopezfidalgo/ CRYF La demostraci´on estad´ıstica
  2. 2. Esquema Mala prensa de la estad´ıstica. Estad´ıstica y sentido com´un. La magia blanca de la estad´ıstica. Manipulaci´on en todos los niveles. Temas candentes: Reproducibilidad. Inferencia causal. ´Etica de la estad´ıstica. Paradigma bayesiano. ¿Por qu´e fallan las encuestas? Casualidades de la vida. CRYF La demostraci´on estad´ıstica
  3. 3. Mala prensa de la estad´ıstica CRYF La demostraci´on estad´ıstica
  4. 4. Miedo a la estad´ıstica Al desastre de las ´ultimas predicciones de voto. Al uso que otros hagan de ella. A sus limitaciones. A sus nuevas dimensiones: capacidad de c´alculo, simulaciones, remuestreo, m´etodos bayesianos, Big Data (¡M´as datos en los 2 ´ultimos a˜nos que en toda la historia!). CRYF La demostraci´on estad´ıstica
  5. 5. La prensa “mala” CRYF La demostraci´on estad´ıstica
  6. 6. La prensa “mala” Encuestas telediario: 4 escogidos ¿“al azar”? Opiniones viajeros ocasionales: 7–15 d´ıas: Establecen teor´ıas generales irrefutables. 1 mes: Establecen teor´ıas generales con muchas excepciones. 1 a˜no: No se atreven a generalizar. CRYF La demostraci´on estad´ıstica
  7. 7. Estad´ıstica y sentido com´un Una muestra estad´ıstica convenientemente torturada confiesa lo que quieras. CRYF La demostraci´on estad´ıstica
  8. 8. ¿Existe el azar? Henri Poincar´e (+1912): “El azar es la medida de nuestra ignorancia”. Florence Nightingale (+1910): “Para entender los pensamientos de Dios hemos de estudiar estad´ıstica, porque esta es la medida de su prop´osito”. Albert Einstein (+1955): “No existe el azar, Dios no juega a los dados” (atribuida, no verificada). George Box (+2013): “Tengo la impresi´on de que cuanto m´as trabajo m´as suerte tengo”. Picaso: “La inspiraci´on me pilla siempre trabajando”. Cualquiera: Un mismo plan puesto en pr´actica dos veces, exactamente en las mismas condiciones, conduce habitualmente a resultados similares, pero no id´enticos. CRYF La demostraci´on estad´ıstica
  9. 9. ¿Qu´e hace? Inferir conclusiones de los datos (descubrir relaciones): Genes relacionados con una enfermedad. Influencia de una dieta en la prevenci´on de un c´ancer. Si un carburante es m´as contaminante que otro. Modelo para identificar una imagen (c´amaras de vigilancia). Decidir si un cirujano opera o no a un paciente. ´Indices de valoraci´on: “Da miedo el uso de indicadores, pero temo m´as a los que no los quieren usar”. Fichar al delantero que necesitamos. ... CRYF La demostraci´on estad´ıstica
  10. 10. La magia blanca de la estad´ıstica CRYF La demostraci´on estad´ıstica
  11. 11. Estad´ıstica moderna Uni´on de dos disciplinas que evolucionaron independientemente: C´alculo de Probabilidades Estad´ıstica como simple descripci´on de datos Resultado: Inferencia, toma de decisiones CRYF La demostraci´on estad´ıstica
  12. 12. Dado regular M´etodo deductivo CRYF La demostraci´on estad´ıstica
  13. 13. Dado irregular M´etodo inductivo CRYF La demostraci´on estad´ıstica
  14. 14. Demostraci´on R´apida y eficaz. No exacta, pero rigurosa y cient´ıfica (en cierto sentido s´ı es exacta). La madre de Sergio sabe c´omo hacerlo... CRYF La demostraci´on estad´ıstica
  15. 15. Ha desaparecido la tableta de chocolate Primera hip´otesis (“nula”): Cuando lo compr´o esta ma˜nana lo guard´o en otro sitio y no se acuerda d´onde. Segunda hip´otesis (“alternativa”): Se la ha comido Sergio. Recojamos informaci´on: b´usqueda en otros armarios, bolsas... Se convoca a Sergio... CRYF La demostraci´on estad´ıstica
  16. 16. Sergio asegura que no sabe nada del tema ¡No puede sancianar a Sergio si no est´a completamente segura! CRYF La demostraci´on estad´ıstica
  17. 17. Sistematizaci´on del razonamiento ordinario Queremos comprobar si una moneda est´a trucada o no. Obtenemos 63 caras en 100 lanzamientos. Si no est´a trucada deber´ıan ser unas 50 (?). Su probabilidad es de menos de 3 entre 1.000 (¡muy sospechoso!). Problemas reales no son tan sencillos, pero tenemos herramientas para calcular probabilidades. CRYF La demostraci´on estad´ıstica
  18. 18. El modelo estad´ıstico Modelo matem´atico que deja un espacio a la incertidumbre (error aleatorio): Caja del “azar” o “error aleatorio” donde introducimos bien empaquetada nuestra ignorancia. Admitida nuestra ignorancia, esto es una idea genial. Cierto control de lo desconocido con las leyes del azar. CRYF La demostraci´on estad´ıstica
  19. 19. Contraste de hip´otesis Culpable vs. Inocente (“mejor tratamiento” vs. “no mejor”). CRYF La demostraci´on estad´ıstica
  20. 20. Contraste de hip´otesis El sistema asume inocencia hasta que se prueba la culpabilidad (rechazo hip´otesis nula, significatividad). Verdad H0 H1 Inocente Culpable H0 Inocente Culpable En libertad en libertad en libertad Sentencia ERROR II H1 Inocente Culpable Condenado condenado condenado ERROR I CRYF La demostraci´on estad´ıstica
  21. 21. El p-valor No mide la magnitud de la asociaci´on entre dos variables (Ej. Pisa). No es la probabilidad de H0. No rechazar H0 no significa aceptar H0. Importancia del dise˜no y el muestreo para conseguir rechazar H0 cuando es falsa. CRYF La demostraci´on estad´ıstica
  22. 22. Un teorema m´agico CRYF La demostraci´on estad´ıstica
  23. 23. Teorema Central del L´ımite (m´agico) ¿Y si la distribuci´on de los datos es desconocida? “La distribuci´on de la media se aproxima a una campana de Gauss” Para n ≥ 30 la aproximaci´on es buena (¿?). CRYF La demostraci´on estad´ıstica
  24. 24. Un ejemplo: Casos at´ıpicos de leucemia Proporci´on nacional: 0.0001 (1 de cada 10000). Proporci´on de 0.0017 (17 veces m´as) en un colegio (¿?). H0: Es pura casualidad (azar). H1: Hay algo raro (causalidad). Colegio 1800 alumnos 3 casos de leucemia (rechazamos H0). Colegio 600 alumnos 1 caso de leucemia (no rechazamos). CRYF La demostraci´on estad´ıstica
  25. 25. Manipulaci´on en todos los niveles CRYF La demostraci´on estad´ıstica
  26. 26. Niveles en una posible manipulaci´on Procedimiento estad´ıstico: Dise˜no experimental / muestreo: Planificaci´on incorrecta. Recogida y preparaci´on de los datos: E.g. modificar o suprimir datos (la estad´ıstica ayuda a descubrirlo). An´alisis: Elecci´on equivocada (e.g. tratamiento de la no respuesta). Interpretaci´on y toma de decisiones: E.g. Gr´aficos, comunicaci´on de los resultados. CRYF La demostraci´on estad´ıstica
  27. 27. Cultura general Saber estad´ıstica protege contra la manipulaci´on CRYF La demostraci´on estad´ıstica
  28. 28. Plan de recogida de datos CRYF La demostraci´on estad´ıstica
  29. 29. Pensar antes de actuar Ronald Fisher: “Llamar a un estad´ıstico despu´es de que el experimento ya est´a hecho es llamarle para que realice un examen post-mortem: solamente podr´a decir de qu´e muri´o el experimento.” S´ofocles: “Uno debe probar a hacer algo; aunque uno piense que ya sabe lo que va a ocurrir, no lo sabe con certeza hasta que lo prueba.” “Si no sabes hacia donde vas, cualquier camino te lleva all´ı.” CRYF La demostraci´on estad´ıstica
  30. 30. Tazas de t´e con leche de Fisher (aleatorizaci´on) Miss Buriel Bristol rechaz´o una taza de t´e con leche a Ronald Fisher al reconocer que la leche hab´ıa sido agregada al final. Para probar si realmente era capaz de reconocerlo prepar´o 8 tazas, 4 con cada combinaci´on. Orden aleatorio, pero no s´olo desordenado. P(“acertar al azar”)= 1 28 = 0,0039 P(“fallar exactamente una al azar”)=0,03125 CRYF La demostraci´on estad´ıstica
  31. 31. Paradoja de Simpson Nuevo f´armaco: Fraudol. F´armaco tradicional: Curamina. Experimentaci´on: Mejora No mejora % Curamina 20 20 50 % Fraudol 24 16 60 % CRYF La demostraci´on estad´ıstica
  32. 32. Desagregados Hombres: Mejora No mejora % Curamina 12 18 40 % Fraudol 3 7 30 % Mujeres: Mejora No mejora % Curamina 8 2 80 % Fraudol 21 9 70 % CRYF La demostraci´on estad´ıstica
  33. 33. ¿Cu´antas observaciones? 10 20 30 40 50 n 0.2 0.4 0.6 0.8 1.0 1 β Potencia de contraste (capacidad de demostrar la hip´otesis interesante) CRYF La demostraci´on estad´ıstica
  34. 34. Recogida de los datos CRYF La demostraci´on estad´ıstica
  35. 35. Monitorizaci´on de la recogida El ayuntamiento de Londres en encarg´o un estudio a la RSS sobre los excrementos de caballo en sus calles. Ejemplo fermentaci´on del vino. CRYF La demostraci´on estad´ıstica
  36. 36. An´alisis (modelo) CRYF La demostraci´on estad´ıstica
  37. 37. Modelos George Box (+2013): “Todos los modelos son falsos, pero algunos son ´utiles”. “¿c´omo de err´oneos pueden ser para que no dejen de ser ´utiles?” Giberson y Artigas (2012): “Los resultados interesantes en f´ısica matem´atica casi siempre contienen asunciones y simplificaciones. Por muy notable que pueda ser el ajuste entre el mundo natural y las matem´aticas, no hay virtualmente casos en los que el ajuste sea tan perfecto que no se requieran asunciones simplificadoras.” CRYF La demostraci´on estad´ıstica
  38. 38. Interpretaci´on CRYF La demostraci´on estad´ıstica
  39. 39. Interpretaci´on No es lo mismo: “El 90 % de los enfermos de c´ancer de pulm´on han sido fumadores” que “El 90 % de los fumadores desarrolla c´ancer de pulm´on” Probabilidad (condicional) inversa. CRYF La demostraci´on estad´ıstica
  40. 40. Interpretaci´on: Informe PISA 2012 Informe oficial: “Por consiguiente, si los intervalos de confianza de dos pa´ıses tienen intersecci´on com´un, la diferencia entre sus resultados no es estad´ısticamente significativa.” Desviaci´on t´ıpica aparece s´olo para hablar de tipificaci´on (16 veces) en 243 pg. ¿Tama˜nos de muestra? Espa˜na (484), OCDE (494, s), UE (489, ns). ns con Reino Unido (494), Noruega (489), Portugal (487), Italia (485), Estados Unidos (481), Suecia (478)... s con Corea del Sur (554), Suiza (531), Pa´ıses Bajos (523)... Si se transforman a una escala de estatura: en lectura OCDE, 180 cm, Espa˜na 178,8. Contenidos de estad´ıstica en la prueba: 25 %. CRYF La demostraci´on estad´ıstica
  41. 41. Interpretaci´on y uso de los gr´aficos CRYF La demostraci´on estad´ıstica
  42. 42. El mismo, pero bien hecho CRYF La demostraci´on estad´ıstica
  43. 43. Proporci´on rigurosa CRYF La demostraci´on estad´ıstica
  44. 44. Temas candentes CRYF La demostraci´on estad´ıstica
  45. 45. Reproducibilidad Helic´optero: CRYF La demostraci´on estad´ıstica
  46. 46. R´eplicas CRYF La demostraci´on estad´ıstica
  47. 47. Medidas repetidas ... CRYF La demostraci´on estad´ıstica
  48. 48. Inferencia causal Covariaci´on no significa relaci´on causa/efecto. CRYF La demostraci´on estad´ıstica
  49. 49. El problema estad´ıstico de la causalidad Relaci´on determinista: Si A causa B entonces B siempre se sigue de A (fumar no produce enfisema o c´ancer). Causalidad probabil´ıstica: Si A causa probablemente B entonces la informaci´on de que ha ocurrido A aumenta la verosimilitud de B. Pero es m´as general que P(B|A) > P(B): Ejemplo: A=“Es fumador”, B=“Tiene o tendr´a c´ancer”, C=“Tiene o tendr´a enfisema”, P(B|A) > P(B), P(C|A) > P(C)yP(B|C) > P(B). Estimar el correcto efecto causal de X en Y : Variables confusoras : Variables extra˜nas que correlacionan con ambas. Variable instrumental : Z afecta a Y solamente a trav´es de X. CRYF La demostraci´on estad´ıstica
  50. 50. La ´etica en la estad´ıstica Dise˜no experimental secuencial. Principio de solidaridad en compa˜n´ıas de seguros. Orde˜nar los datos: Generamos 100 datos de 8 variables independientemente. Estudio correlaciones 2 a 2. La 3 y la 8 significativamente correlacionadas. CRYF La demostraci´on estad´ıstica
  51. 51. Estad´ıstica Bayesiana (probabilidad subjetiva) Un ejemplo asombroso: Aleatoriedad de las terminaciones del n´umero premiado en la loter´ıa nacional en los ´ultimos 200 a˜nos. CRYF La demostraci´on estad´ıstica
  52. 52. ¿Ha habido trampa? La estad´ıstica frecuentista basada solo en los datos dice que s´ı. Poco probable que haya ocurrido por azar. Estad´ıstica Bayesiana es m´as delicada: Eval´ua el riesgo de la decisi´on equivocada. Utiliza una probabilidad subjetiva de que haya habido trampa. CRYF La demostraci´on estad´ıstica
  53. 53. Soluci´on que minimiza el riesgo 0.95 1 En azul el riesgo de decidir err´oneamente que NO hay trampa. En rojo el riesgo de decidir err´oneamente que SI hay trampa. CRYF La demostraci´on estad´ıstica
  54. 54. Fracasos en las encuestas de intenci´on de voto Resultados obtenidos bastantes d´ıas antes de las elecciones. La comunicaci´on de unos resultados influye en la intenci´on de voto. No respuesta: voto de castigo y voto ´util. Abstenci´on contabilizada como intenci´on de ir a votar. Comportamientos hist´oricos invalidados por nuevos partidos emergentes o las nuevas tecnolog´ıas. El mundo y la mafia de las apuestas. Dificultad de hacer predicciones cuando entra en juego la libertad humana. CRYF La demostraci´on estad´ıstica
  55. 55. Casualidades de la vida A finales de 2015 hubo una votaci´on de un conocido partido para apoyar una candidatura. Resultado: 3030 votantes, 1515 votaron SI y 1515 NO. Bajo la hip´otesis del 50 % la probabilidad de ese evento es 0.0145. Este resultado es el m´as probable. Hay otros razonamientos/supuestos. CRYF La demostraci´on estad´ıstica
  56. 56. Casualidades de la vida Muchas cosas raras pueden ocurrir en un momento dado. La probabilidad de que ocurra alguna ya no es tan rara. CRYF La demostraci´on estad´ıstica
  57. 57. La estad´ıstica m´as cerca de lo que pensamos Probabilidad de lluvia. Horquillas en las elecciones. En Google hay muchos estad´ısticos trabajando. Estad´ısticos sin fronteras. ¡Ah! Miss Buriel Bristol acert´o con las 8 tazas. CRYF La demostraci´on estad´ıstica
  58. 58. GRACIAS CRYF La demostraci´on estad´ıstica

×