Lectura crítica de artículos mayo 2012
Upcoming SlideShare
Loading in...5
×

Like this? Share it with your network

Share

Lectura crítica de artículos mayo 2012

  • 1,417 views
Uploaded on

Guía para la lectura crítica de datos científicos y estadísticos especialmente de salud con algunos links a documentos de referencia y checklists. Espero que sea útil.

Guía para la lectura crítica de datos científicos y estadísticos especialmente de salud con algunos links a documentos de referencia y checklists. Espero que sea útil.

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
1,417
On Slideshare
1,401
From Embeds
16
Number of Embeds
2

Actions

Shares
Downloads
56
Comments
0
Likes
1

Embeds 16

https://www.linkedin.com 9
http://www.linkedin.com 7

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Lectura crítica de artículosEnrique GranadosGerente Médico Investigación Clínica@enrigranadoshttp://es.linkedin.com/in/enriquegranadosMayo 2012 "Statistical thinking will one day be as necessary for efficient citizenship as the ability to read and write" - H.G. Wells
  • 2. Buena noticia: Nonecesitas comerte la vacaentera!! Puedes asimilar importantes conceptos de un artículo sin entender latotalidad del mismo
  • 3. “Vayamos por partes!”Abstract: ¿Me sirve este artículo para algo?, ¿Me interesa?Tablas: ¿Qué es lo que realmente han encontrado los autores?Métodos: ¿Me creo la tabla anterior?Discusión: ¿Y ahora qué? ¿Qué me implica?Referencias de la literatura: ¿Qué se sabía de este tema antes?
  • 4. Mala noticia: necesitas saber algo deestadística y de números!!Asociación frente a causalidadCorrelación frente a regresiónmúltipleSignificación frente a magnitud
  • 5. Emplea la intuición o la reflexión ycontesta!!Un bate y una pelota cuestan $1.10El bate cuesta un dólar más que la pelota.¿Cuánto cuesta la pelota?
  • 6. Dos sistemas cognitivos, un sólo cerebroKahneman, Premio Nobel Economía 2002 Sistema 1: rápido, intuitivo, sin esfuerzo, esclavo de las emociones y … a menudo incorrecta – Contesta 10c$ Sistema 2: lento, reflexivo, exige concentración – Contesta 5c$
  • 7. “El hombre anumérico”John Allen Paulos (1988) Término equivalente a “analfabeto” Menor reproche social “Usted puede elegir entre tener unas ciertas nociones claras de matemáticas o no tenerlas, pero debe saber que si no las tiene, es usted una persona mucho más manipulable que en el caso contrario.” La imparcialidad frente a los números una actitud que debe entrenarse
  • 8. “The perception of risk”Paul Slovic, 2000La gente responde únicamente ante los riesgosque percibeLos ictus producen el doble de todas las muertespor accidente, pero el 80% cree que los accidentesson más probablesLos tornados se perciben como más peligrosos que el asma, aunque esteproduce 20 veces más muertesMuerte por electrocución se considera menos probable que la muerte porbotulismo, aunque en realidad es 52 veces más frecuenteLa muerte por enfermedad es 18 veces más probable que por accidente, y lagente las considera igual de probableLa muerte por accidente es considerada por la gente como 300 veces másprobable que la muerte por diabetes, pero la realidad es que la proporción es 1:4
  • 9. www.riskliteracy.org “Berlin numeracy test”: test para comprobar tu grado de compresión sobre el concepto de probabilidad Ejemplo: De 1,000 personas en un pueblo pequeño, 500 son miembros de un coro. De esos 500 miembros en el coro 100 son hombres. De los 500 habitantes que no están en el coro, 300 son hombres. ¿Cual es la probabilidad de que un hombre cogido al azar sea un miembro del coro? – a) 10% – b) 25% – c) 40% – d) Ninguno de ellos Cokely, Judgment and Decision Making, 2012
  • 10. Sesgos cognitivos Ver presentación: http://www.slideshare.net/efern211/cognitive-biases-a-visual- study-guide-by-the-royal-society-of-account-planning
  • 11. Los 4 principios éticos aplicables a todo tipo deestudiosAutonomía Reconocimiento y respeto de la capacidad de cada persona a ser informado y a decidir si desea participar.Beneficencia Velar por el bienestar del paciente y que siempre sea superior el beneficio al riesgoJusticia Distribución equitativa de los riesgos y beneficios, sin discriminacionesNo La investigación no debe causar dañomaleficiencia (primum non nocere)
  • 12. Asociación versus causalidadAsociación: A y B tienden a ocurrir de manera conjuntamás frecuentemente que lo uno esperaría por azar A B
  • 13. Explicando la asociación entre dos variablesbinarias1. Por pura chiripa2. A causa B3. B causa A4. Algo desconocido causa tanto A como B A B
  • 14. Dormir con zapatos se asocia adolor de cabezaAzarLos zapatos apretadosproducen dolor decabezaTe dolía la cabeza y teacostaste con zapatosBeber en exceso seasocia a acostarse conzapatos y a cefalea
  • 15. Asociación versus causalidadLa Estadística SOLOpuede demostrarasociacionesLa estadística NUNCApuede demostrarcausalidad Inferimos la causalidad a partir del diseño experimental o la teoría combinada con la asociación estadística
  • 16. Según el Nature la luz nocturna a losniños les produce miopía “….los hallazgos sugieren que la ausencia de un período de oscuridad durante la infancia es un factor precipitante para desarrollar miopía.” Quinn, Myopia and Ambient Lighting at Night, Nature, 1999
  • 17. Debate: “quizás es la miopía de los padres la quecausa tanto la miopía de los hijos como el usar másluz eléctrica nocturna” “El estudio de Quinn y cols debería haber controlado por la miopía parental Gwiazda, Nature, 1999
  • 18. Correlación versus regresión múltiple Correlación: dos variables cuantitativas X e Y parecen comportarse de manera paralela más que si lo explicara el azar – Cuando X aumenta, también lo hace Y (Correlación positiva) – Cuando X aumenta, Y disminuye (Correlación negativa) Regresión múltiple: las dos variables siguen comportándose de manera igual incluso cuando se tienen en cuenta nuevas variables
  • 19. Regresión a la media “En muchas ocasiones he felicitado a los cadetes por su ejecución. La siguiente vez en general lo han hecho peor. Por el contrario, cuando les he gritado por una mala ejecución, en general luego lo han hecho mejor. Así, que por favor no me digas que la recompensa funciona y el castigo no, porque es el caso contrario.”
  • 20. Regresión a la mediaDescubierta por Sir Francis Galton (1822-1911): – Al cruzar las plantas de mayor tamaño se obtienen en promedio plantas de tamaño inferior, y al cruzar las plantas más pequeñas se obtienen de promedio plantas de tamaño mayorSe manifiesta como una tendencia de los valores extremos de unavariable a presentarse con resultados menos extremos por términomedio en mediciones sucesivas.
  • 21. Regresión a la media Dos requisitos: – Selección de los pacientes en función de los valores de una variable (p.e. colesterol > 600 mg/dl) – Cierto grado de variabilidad intraindividual de los valores de esa variable (circunstancias ambientales, aleatorias…) Cuanto más extremo es el punto de corte y cuanto mayor es la variabilidad de la medida, mayor es el efecto de la regresión a la media Más fácil de ver en estudios no controlados con medición antes - después
  • 22. Explicando la correlación1. Por pura chiripa2. A causa B3. B causa A4. Algo desconocido causa tanto A como B La regresión múltiple permite ir excluyendo items específicos del punto 4
  • 23. Correlación y causalidad Las mujeres muyinteligentes tienden a casarse con hombres que son menos inteligentes que ellas
  • 24. Correlación y causalidad Las mujeres muy La correlación entreinteligentes tienden la inteligencia de las a casarse con parejas es muy poco hombres que son perfecta menos inteligentes que ellas
  • 25. Correlación y causalidad Las mujeres muy La correlación entreinteligentes tienden la inteligencia de las a casarse con parejas es muy poco hombres que son perfecta menos inteligentes Ambas expresiones que ellas son algebraicamente equivalentes, pero la primera anima la cena y la segunda no
  • 26. Significación versus magnitud Las investigaciones testan una pequeña muestra para predecir la totalidad P<.05 significa que hay menos de un 5% (1 de 20) de probabilidades que el resultado sea causado por azar y no por una diferencia real
  • 27. Significación versus magnitud Medidas de la magnitud: – Variables binarias: • Razón de tasas de incidencia • Riesgo relativo • Odds ratio • Diferencia absoluta de riesgo • Reducción absoluta de riesgo • Diferencia relativa de riesgo • Reducción relativa de riesgo • Número necesario a tratar – Variables contínuas: • Diferencia entre medias
  • 28. Significación clínica o estadísticaLo importante es siempre la clínica!!!Estadísticamente significativo, clínicamente NO significativo – “La p depende de la N”, “La significación estadística se puede comprar con una N grande” – Ejemplos: • Aumento de una semana en la supervivencia del cáncer • Aumento de 2-3 ovocitos en ciclos de FIV – Insuficiente para obtener autorizaciones de comercializaciónEstadísticamente NO significativo, clínicamente significativo – Ejemplo: Aparición de eventos adversos muy graves que modifican el perfil riesgo / beneficio – Pueden llevar a la no aprobación o incluso a una posterior retirada de la autorización de comercialización
  • 29. ¿Es la pregunta del estudio relevante?¿Añade el estudio algo nuevo?¿Qué tipo de pregunta de investigación se está realizando?¿Era el diseño del estudio apropiado para la pregunta en investigación?¿Minimizaban los métodos del estudio las principales fuentes desesgos? – Error aleatorio – Error sistemático (validez del estudio) • Sesgo de selección • Sesgo de información¿Se realizó el estudio de acuerdo al protocolo original?¿Testaba el estudio una hipótesis explícita?¿Se realizaron los análisis estadísticos correctamente?¿Justifican los datos las conclusiones?¿Existen conflictos de interés? Young, Nature Clin Prac Gastroenterology & Hepatology 2009
  • 30. Young, Nature Clin Prac Gastroenterology & Hepatology 2009
  • 31. ¿Es la pregunta del estudio relevante? Incluso si un estudio tiene el máximo rigor metodológico es de escaso valor si no aborda un tema importante y añade algo a lo ya conocido. Opinión subjetiva. Premios Ig-Nobel (http://improbable.com/ig/ )
  • 32. ¿Es la pregunta del estudio relevante?
  • 33. ¿Es la pregunta del estudio relevante?
  • 34. ¿Es la pregunta del estudio relevante?
  • 35. ¿Es la pregunta del estudio relevante?
  • 36. ¿Añade el estudio algo nuevo?¿O al menos corroborahallazgos previos?“Si he logrado ver máslejos, ha sido porque hesubido a hombros degigantes” Atribuída a Isaac Newton
  • 37. ¿Qué tipo de pregunta de investigación seestá realizando? En función de la pregunta será necesario un diseño u otro del estudio. – Preguntas sobre la frecuencia de algún evento • Incidencia o prevalencia de una enfermedad, de un factor de riesgo, de un diagnóstico • Lo más apropiado es un diseño observacional – Preguntas sobre la utilidad de un test diagnóstico – Preguntas sobre la efectividad de un tratamiento • Lo más apropiado es un diseño intervencional
  • 38. ¿Minimizaban los métodos del estudio lasprincipales fuentes de sesgos? No implica una preconcepción por parte del investigador, sino simplemente como los resultados pueden apartarse de la verdad. Dos tipos de error o sesgo: – Error aleatorio o debido al azar • No afecta a los resultados del estudio en ninguna dirección en particular, pero afecta a la precisión. – Error sistemático o debido a los métodos del estudio • Sobreestima o infraestima “la verdad” (afecta a la validez del estudio) • Sesgo de selección: ¿Cómo se cogían los pacientes? Ejemplo: comparar un tratamiento quirúrgico aplicado a pacientes "operables", con un tratamiento médico aplicado a los "no operables". • Sesgo de información: ¿Cómo se procesaba la información?
  • 39. Validez y precisión: símil de las dianas
  • 40. Si aumentamos el tamaño muestral,aumentamos la precisión pero no la exactitud Precisión: dispersión (desviación estándar) del conjunto de valores obtenidos de mediciones repetidas. – Cuanto menor es la dispersión mayor la precisión. Exactitud o validez (accuracy): cuán cerca del valor real se encuentra el valor medido. Cuanto menor es el sesgo más exacta es una estimación. – El problema de las variables de confusión de los estudios observacionales NO se soluciona aumentando el tamaño muestral.
  • 41. ¿Era el diseño del estudio apropiado para lapregunta en investigación? Cada diseño de estudio proporciona una jerarquía de evidencia en función de cómo protege de los sesgos Disminución de la evidencia Resultados de ensayos controlados Resultados de estudios de casos y controles Resultados de series de casos Documentos de consenso u opiniones de experto Inferencia de la patofisiología
  • 42. ¿Era el diseño del estudio apropiado para lapregunta en investigación? Birmingham Critical Appraisal Skills Programme http://medweb4.bham.ac.uk/websites/caspb/cribsheets/ Checklists y documentos de consenso para – Ensayo clínico (CONSORT) – Evaluación económica (DRUMMOND) – Revisión sistemática y meta- análisis (PRISMA, QUOROM y MOOSE) – Estudios observacionales (STROBE) – Estudios diagnósticos (STARD)
  • 43. ¿Era el diseño del estudio apropiado para la preguntaen investigación? - Revisión sistemática y meta-análisis Revisión sistemática: protocolo meticuloso y estandarizado para la lectura crítica de todos los estudios relevantes en un tema particular. Meta-análisis: los resultados de estudios individuales se combinan estadísticamente para producir un resultado único conjunto PRISMA (Preferred Reporting Items for Systematic Reviews and Meta- Analyses) (anteriormente conocido como QUOROM (Quality of Reporting of Meta-Analyses) Moher, Lancet 1999 Urrutia, Medicina Clínica 2010 www.prisma-statement.org MOOSE (Meta-Analysis Of Observational Studies in Epidemiology) Stroup, JAMA 2000
  • 44. El cuadrado negro y la línea horizontalcorresponde al odds ratio y al 95% deintervalo de confianza de cadaensayo.El tamaño del cuadrado negro reflejael peso de cada ensayo.El diamante representa el odds ratiocombinado y el 95% del intervalo deconfianzaUna línea discontínua vertical atravésdel odds ratio combinado: cruza todaslas líneas horizontales de los estudiosindividuales excepto una (N): estudiohomogéneo
  • 45. Análisis de la Heterogeneidad de losmeta-análisis Evaluación gráfica Evaluación estadística (Valor I2) – 25% Heterogeneidad baja – 50% Heterogeneidad media – 100% Heterogeneidad alta Higgins, BMJ 2003
  • 46. ¿Era el diseño del estudio apropiado para la preguntaen investigación? - Revisión sistemática y meta-análisis
  • 47. QUOROM statement (Moher, Lancet 1999)
  • 48. QUOROM statement (Moher, Lancet 1999)
  • 49. MOOSE statement (Stroup, JAMA 2000 )
  • 50. ¿Era el diseño del estudio apropiado para la preguntaen investigación? – Ensayos clínicos randomizados Variable o factor de confusión: Existen cuando los grupos que se comparan en un estudio son diferentes respecto a factores distintos del que se están estudiando. – Ejemplo, si un grupo de personas con sobrepeso y otro sin sobrepeso tienen diferentes edades, una diferencia en el riesgo de enfermedad cardiaca podría no ser debida al sobrepeso. La edad puede actuar como factor de confusión. – Conocidos y no conocidos Maneras de controlar el sesgo de selección (Variables de Confusión conocidas) en estudios observacionales: – Estratificación, – Modelos de regresión – Indice de propensión La randomización es la mejor herramienta para conseguir que las variables de confusión conocidas y no conocidas estén igualmente repartidas entre ambos grupos
  • 51. ¿Era el diseño del estudio apropiado para la preguntaen investigación? – Ensayos clínicos randomizados Ensayo clínico randomizado: – Archie Cochrane, “Mi primer, peor y más exitoso ensayo clínico” (BMJ 1984) – Prisionero de guerra en un campo de concentración de Salónica (1941- 1945) observó ictericia edema en las piernas y planteó la hipótesis de que podía ser beri-beri (déficit de vitamina B) – Compró levadura en el mercado negro y dividió la muestra entre dos barracones
  • 52. 1er ensayo clínico randomizado reglado en 1946Ensayo del MRC (1946): estreptomicina y reposo en cama vs. reposo en cama enenfermos con TBC pulmonar.Asignación aleatoria. 107 pacientes: 52 grupo “reposo” y 55 grupo “estreptomicina”
  • 53. ¿Era el diseño del estudio apropiado para la preguntaen investigación? – Ensayos clínicos randomizados
  • 54. ¿Era el diseño del estudio apropiado para la preguntaen investigación? – Ensayos clínicos randomizados CONSORT (Consolidated Standards of Reporting Trials) – Publicada inicialmente en 1996 para mejorar la manera en que se reportaban los estudios – Revisada en 2001 y 2010 – Lista de comprobación de 25 ítems – Diagrama para ilustrar el flujo de pacientes a lo largo del ensayo – www.consort-statement.org/ y www.espanol.equator-network.org/
  • 55. ¿Era el diseño del estudio apropiado para la preguntaen investigación? – Estudios de cohortes Prospectivas o retrospectivas Alto riesgo de tener sesgos de selección y variables de confusión especialmente si se usan para valorar distintas terapias. Los tratamientos se han podido seleccionar por: – Preferencias del médico o paciente – De donde vienen referidos los pacientes – Paradigmas actuales de tratamiento – Políticas locales STROBE (Strengthening the Reporting of Observational Studies in Epidemiology) www.strobe-statement.org Von Elm, Gac Sanitaria 2008
  • 56. ¿Era el diseño del estudio apropiado para la preguntaen investigación? – Estudios de cohortes
  • 57. ¿Era el diseño del estudio apropiado para la preguntaen investigación? – Estudios de casos-controles Siempre retrospectivos. Se recogen factores de riesgo a los que se han expuesto: – Los Casos (presentan un determinado estado de salud) – Los Controles (NO presentan ese determinado estado de salud) Ideal para estudiar los factores de riesgo de eventos raros que llevaría mucho tiempo estudiar a través de una cohorte prospectiva La mayor dificultad metodológica es la selección de los controles y el sesgo de memoria (los casos pueden recordar de manera distinta la exposición a determinados factores que los controles)
  • 58. ¿Era el diseño del estudio apropiado para la preguntaen investigación? – Estudios de casos-controles
  • 59. ¿Era el diseño del estudio apropiado para la preguntaen investigación? – Estudios transversales Todos los factores de riesgo y resultados se evalúan a la vez en una sóla “fotografía”.
  • 60. ¿Era el diseño del estudio apropiado para la preguntaen investigación? – Estudios de series de casos Muy bajo nivel de evidencia a pesar de que son muy frecuentes en la literatura
  • 61. ¿Era el diseño del estudio apropiado para la preguntaen investigación? – Estudios de tests diagnósticos Usualmente son transversales Una muestra de pacientes y dos tests diagnósticos (el nuevo y el gold-standard). El nivel de acuerdo entre los dos tests se comunica mediante la sensibilidad, la especificidad y la razón de verosimilitud.
  • 62. ¿Era el diseño del estudio apropiado para la preguntaen investigación? – Estudios de tests diagnósticos STARD (Standards for the Reporting of Diagnostic Accuracy Studies) www.stard-statement.org/
  • 63. ¿Era el diseño del estudio apropiado para la preguntaen investigación? – Estudios de tests diagnósticos STARD
  • 64. ¿Era el diseño del estudio apropiado para la preguntaen investigación? – Evaluaciones económicas Estudios de coste – beneficio: ambos costos y beneficios se miden en unidades monetarias Estudios de coste – utilidad: Los costos se miden en unidades monetarias y los efectos en unidades de utilidad (AVAC (años de vida ajustados por calidad de vida). Estudios de coste – efectividad: Los costos se miden en unidades monetarias y los efectos en unidades sanitarias (años de vida ganados (AVG), % respuestas, PFS, OS, ingresos…). Estudios de minimización de costes: asume iguales resultados y mide los costos.
  • 65. Drummond, BMJ 1996
  • 66. Drummond checklist1996
  • 67. Años de Vida Ajustados por Calidad (AVACs)
  • 68. ¿Era el diseño del estudio apropiado para la preguntaen investigación? – Estudios de cribado deenfermedadesFenómeno de Lead-time bias: ocurre cuando dos tests para una enfermedad secomparan y un test (el nuevo experimental) diagnostica la enfermedad antes, perono cambia el curso de la enfermedad.Ejemplo: – Sin cribado, diagnostico a 67 años y muerte a los 70 años. Supervivencia (5 a)= 0% – Con cribado, diagnóstico a los 60 años y muerte a los 70 años. Supervivencia (5 a)=100%
  • 69. ¿Era el diseño del estudio apropiado para la preguntaen investigación? – Estudios de cribado deenfermedadesFenómeno de Sobrediagnóstico: detección extra de casos que no progresaránEjemplo: – Sin cribado, se detectan 1000 pacientes con cáncer y sobreviven 400 a 5 años. Supervivencia (5 a)= 400 / 1000 – Con cribado, se detectan 2000 pacientes más. Supervivencia (5 a)= 2400 / 3000 = 80%Conclusión: – Se pueden observar cambios en la supervivencia sin ningún cambio en la mortalidad. • En estudio aleatorizado de tratamiento, la supervivencia se basa sobre la población inicial del estudio: si el 10% de los pacientes mueren en un año, el 90% sobrevivió. • En un estudio de cribado, el término “supervivencia” tiene otro significado porque el cálculo de la supervivencia tiene puntos de comienzo distintos para las personas cribadas y las no cribadas. – La disminución de la mortalidad en un estudio aleatorizado es la única estadística que demuestra fiablemente que una prueba de cribado puede salvar vidas.
  • 70. Encuesta al público en 9 países de la Unión Europea: lamayoría o sobreestima el beneficio o no lo sabe “De 1000 mujeres mayores de 50 años que siguen mamografías regulares, ¿cuantas menos morirán de cáncer de mama en comparación con las que no participan?” 60 50 40 % mujeres Alemania 30 España 20 10 0 1 10 50 0 0 o be 10 20 un sa evidencia g in o N N Gigerenzer, Mata, & Frank JNCI 2009
  • 71. A finales del 2009, la Asociación Contra el Cáncer alemana actualizósus folletos de información a pacientes sobre cribado de cáncer demama para ser más trasparentes y completos 1000 mujeres no 1000 mujeres con cribadas cribados anuales durante 10 años Beneficios Mortalidad total por cáncer No diferencia Mortalidad por cáncer de mama 5 4 Daños Falsos positivos con biopsias - 50 a 200 Sobretratamiento - 2 a 10 Un test positivo significa que: - 1 de cada 10
  • 72. ¿Entienden los médicos lasestadísticas sobre cribado de cáncer?Encuesta on line de 412 médicos de atenciónprimaria en USA(76%) de los respondedores dijeron incorrectamenteque el incremento en la supervivencia a 5 años y ladetección precoz del cáncer prueban que un test decribado salva vidas. Wegwarth , Ann Int Med 2012
  • 73. ¿Se realizó el estudio de acuerdo alprotocolo original? Necesario que se describan: – Cambios en los criterios inclusión y exclusión – Variaciones en los tratamientos o en los seguimientos – Cambios en las analíticas realizadas – Lista de violaciones mayores y / o menores El lector interpretará los resultados a la luz de estas descripciones Imposibilidad de reclutar los pacientes previstos → perdida de potencia estadística – Hasta 1/3 de los ensayos reclutan menos del 75% de los pacientes previstos Ross, J Clin epidemiol 1999
  • 74. Importancia buen cálculo del tamañomuestral Tamaño Tamaño excesivo insuficiente Gasto de recursos Gasto de más Económica sin obtener recursos que los conocimiento (*) necesarios Riesgo para ¿Estás “comprando” pacientes sin la p a base de una N Etica avance de muy grande?1 conocimiento (*) (*): posibilidad de metanálisis posteriores 1: Bacchetti, Am J Epidemiol 2005
  • 75. Dos tipos de error Error alfa o tipo I: probabilidad de producir un falso positivo. – Se rechaza la hipótesis nula , aunque esta es cierta – Error del exceso de credulidad – También llamado “nivel de significación del test” – Por convención se suele poner en el 5%. Más raro en el 1% o 10% Error beta o tipo II: probabilidad de producir un falso negativo. – No se rechaza la hipótesis nula, a pesar de ser falsa – La potencia (1 - beta), representa la probabilidad de rechazar la Ho cuando en realidad es falsa (decisión correcta) – Error del exceso de escepticismo – Por convención se suele poner en 10-20% Convención: α=5%, β=20%. Se considera que el error tipo II es menos serio que el error tipo I. Preferimos pasarnos de “escépticos”.
  • 76. Un ruido en la noche en la sabana africana … Yo creo que es … Tigre Rama Error tipo II Tigre Acertaste EresEn realidad devoradoes… Error tipo I Rama Falsa Acertaste alarma
  • 77. Un ruido en la noche en la sabanaafricana … Michael Shermer: “Nuestro sistema cognitivo ha ido evolutivamente sesgándose para ser crédulos, para tolerar errores tipo I “
  • 78. ¿Testaba el estudio una hipótesis explícita? Todo estudio debe tener una hipótesis: una afirmación clara de lo que los investigadores esperan encontrar en el estudio y debe ser identificada a priori.
  • 79. ¿Testaba el estudio una hipótesis explícita? La hipótesis nula afirma que los hallazgos del estudio no son diferentes de los que se hubieran encontrado al azar. Análisis posthoc: asociaciones que no estaban pre-especificadas en la hipótesis original → más probabilidad de encontrar falsos positivos. ¿Se han reportado todos los objetivos buscados? Estudios de equivalencia o no inferioridad necesitan pre-especificar cual es el margen de no inferioridad. – El análisis debe calcular los intervalos de confianza del efecto del tratamiento y determinar si esos límites están dentro del margen de no inferioridad. – Necesitan un mayor tamaño muestral que los estudios de superioridad
  • 80. Análisis post hoc: “testamos 100 items yencontramos que 5 eran significativos a p<0,05”
  • 81. ¿Se realizaron los análisis estadísticoscorrectamente? ¿Cómo se trataron los datos perdidos?. Descripción en la sección de “Métodos” y de “Resultados” Análisis por “intención de tratar” o “por protocolo” – IDT: todos los pacientes – PP: los que siguieron fielmente el protocolo
  • 82. Análisis “por intención de tratar”Analizar los datos con los participantes en el grupo en que fueronasignados en la aleatorización, aunque no cumplieran con eltratamiento o cambiaran de grupo Es conservador, infraestima la eficacia del tratamiento Acerca la evaluación a las condiciones habituales Preserva los beneficios de la aleatorización (ambos gruposcomparables) Resultados difíciles de interpretar si la adherencia es baja o haymucho cruce entre grupos Inadecuado para los estudios de “no-inferioridad”
  • 83. Análisis “por protocolo”Analizar los datos con los participantes cumplidores y en el grupoen que han acabado el ensayo Mayor riesgo de sesgo de selección Sólo válido para complementar el análisis por ITT
  • 84. IDT IDTPP PP
  • 85. Greenhalgh , BMJ 1997
  • 86. Reducción en la anchura del intervalo deconfianza al aumentar el tamaño de la muestra Jones, EMJ online 2009
  • 87. Efecto de la reducción del intervalo de confidenciapara demostrar una diferencia en las medias Jones, EMJ online 2009
  • 88. Estimación del efecto de una variablebinaria
  • 89. Estimación del efecto de una variablebinaria Los beneficios de tomar un fármaco pueden expresarse de tres maneras: – Lipitor ® reduce las posibilidades de sufrir un ictus aproximadamente un 48% (RRR) – Lipitor ® reduce las posibilidades de sufrir un ictus desde aproximadamente un 28 de cada 1000 a alrededor de un 15 de cada 1000 (13 de 1000 o 1,3%) (RAR) – Para prevenir un ictus, 77 personas necesitan tomar Lipitor® (NNT) Gingerenzer 2007, Psycol Science Pub Interest
  • 90. Estimación del efecto de una variable binaria Reducción absoluta del riesgo (RAR) o riesgo atribuible: la diferencia entre el riesgo del grupo control y el riesgo del grupo tratado – Se expresa con un número pequeño → ¿Influye en la percepción de que el efecto es menor? – Según como hagamos la resta da un número positivo o negativo Reducción relativa del riesgo (RRR) o fracción atribuible: cociente entre la RAR y el riesgo del grupo control – Expresa el beneficio en términos relativos – Si el riesgo basal es bajo → sobrestima el efecto del tratamiento – Si el riesgo basal es alto → infraestima el efecto del tratamiento Nº personas a tratar para curar un caso o evitar un perjuicio adicional – (Number Needed to Treat) = NNT= 1 / RAR – Cuanto mayor sea el efecto del tratamiento, menor será el NNT – Intuitivo para la toma de decisiones clínicas
  • 91. Estimación del efecto de una variable binariaRiesgo relativo (RR): cociente entre el riesgo delgrupo tratado y el riesgo del grupo control – Da la misma información que el RRR. RR = 1 - RRROdss ratio (OR) : – Odds (término que proviene mundo de las apuestas): cociente entre la probabilidad de que el episodio de interés ocurra y la probabilidad de que no ocurra – Odds ratio: cociente entre odds grupo tratado y odds grupo control – Muy usado, pero poco intuitivo, y de difícil traducción – Cuanto mayor es el efecto del tratamiento, más se aleja el OR de 1. – Principal ventaja: permite la regresión logística ajustar la relación en estudio por el efecto de otras variables y permite usarse en estudios de casos y controles
  • 92. Entonces, ¿presentamos los riesgosrelativos o absolutos?Lo mejor: ambos o los absolutosLo peor: uno de cada tres estudios usa diferentes riesgos: – Relativos para los beneficios ….. Grandes números – Absolutos para los daños ……. Pequeños números Sedrakyan A, Medical Care 2007
  • 93. Disponibilidad a prescribir un fármaco hipotético enfunción de cómo se presenten los datos Bobbio, Lancet 1994
  • 94. Estimación del efecto de una variable binaria:ejemplos Abraira, Notas estadísticas SEMERGEN 2001
  • 95. Estimación del efecto de una variable binaria:ejemplos Abraira, Notas estadísticas SEMERGEN 2001
  • 96. Análisis del tiempo hasta un evento oanálisis de la supervivencia Eventos adversos (muerte, progresión enfermedad…) o positivo (curación, normalización de un parámetro…) Cada observación tiene un par de variables: – el tiempo y – el estado (evento (E) o censura (C)) Pac Tiempo Estado F 6 C E 4 C D 8 E C 12 C B 2 E A 3 C
  • 97. Función de supervivenciaEjemplo Curvas de Kaplan-Meier (CRYSTAL) Datos curvas Medianas Cruces negras, censura Pacientes por timepoint
  • 98. Gráfico de Forest de Hazard ratios porsubgrupos Poblacion global beneficia a Pani.Reduccion riesgo 20%. IC no llega a 1 Pacientes con ECOG 2 aumenta mucho el riesgo de progresar con Pani (IC casi llega a 1)
  • 99. ¿Justifican los datos las conclusiones? ¿Tiene validez externa? ¿Se están generalizando los hallazgos a otros grupos de pacientes que no se han testado? ¿Son los hallazgos clínicamente relevantes? ¿Se puede deber la falta de hallazgos a un pequeño tamaño muestral? ¿Se está implícitamente confundiendo una asociación con una relación causa-efecto? ¿Puede haber fenómenos de regresión a la media?
  • 100. ¿Justifican los datos las conclusiones? René Magritte “La clarividencia”, 1936
  • 101. ¿Existen conflictos de interés (CDI)?Cuando algún factor personal puede interferir con el profesional.Al serle revelado al lector, este puede cambiar la credibilidadUn potencial CDI ≠ mala práctica investigadoraUbicuos en medicina: gran multiplicidad de actores (pacientes,médicos, compañías farmacéuticas, pagadores, compañías de seguro,universidades, editoriales, revisores, escritores…).De carácter financiero (grants por reclutamiento de pacientes, porcoordinación o advisory boards, tenencia acciones, propiedadpatentes,…) o no (prestigio, posición social futura…)La mejor, imperfecta, y casi única manera de tratar el CDI es latransparencia (revelación).
  • 102. Fuentes:-Russell James www.slideshare.net-Unidad investigación Ramón y Cajal http://www.hrc.es/investigacion/inves_unidadbio.htm-Young, Nature Clin Prac Gastroenterology & Hepatology 2009-Better Doctors, Better Patients, Better Decisions: Envisioning Health Care 2020