Evaluacion pruebas diagnosticas_08_07 (1)

2,545 views

Published on

Published in: Health & Medicine
  • Be the first to comment

Evaluacion pruebas diagnosticas_08_07 (1)

  1. 1. EVALUACIÓN DE PRUEBAS DIAGNÓSTICASNotasÍndice1. INTRODUCCIÓN 12. CLASIFICACIÓN DE ENFERMEDADES POR DIAGNOSIS 13. CRITERIOS DE CALIDAD DE LAS PRUEBAS DIAGNÓSTICAS 24. TIPOS DE PRUEBAS 35. PATRÓN ÁUREO 35.1. Diseño de investigación para evaluar una prueba diagnóstica 36. PARÁMETROS DE VALORACIÓN DE LAS PRUEBAS DIAGNÓSTICAS 46.1. Sensibilidad 56.2. Especificidad 56.3. Valor predictivo positivo 66.4. Valor predictivo negativo 66.5. Razones de verosimilitud 76.6. Intervalo de confianza (IC) para la sensibilidad y la especificidad 86.7. Intervalos de confianza para los coeficientes de probabilidad 96.8. Variabilidad de las razones de verosimilitud 96.9. Valores predictivos y razones de verosimilitud. Interés en la evaluación de las pruebas diagnósticas 156.10. Falsos positivos frente a falsos negativos. Criterios 196.11. Odds ratio diagnóstica 196.12. Efectividad de una prueba 206.13. Eficiencia diagnóstica de una prueba 206.14. El índice de Youden (Y) 206.15. El efecto de concentración 216.16. Ganancia diagnóstica 227. COMENTARIOS 248. ETAPAS DE UN ESTUDIO DE EVALUACIÓN DE PRUEBAS DIAGNÓSTICAS 259. SESGOS POTENCIALES DE LOS ESTUDIOS SOBRE PRUEBAS DIAGNÓSTICAS2510. EVALUACIÓN DIAGNÓSTICA: JERARQUIZACIÓN 26BIBLIOGRAFÍA 261. IntroducciónSe trata de estudiar aquellos procedimientos estadísticos que permiten evaluar la validez, es decir cuánto seaproxima una medida al valor real que pretende medir. Son procedimientos muy generales, pero aquí se vana tratar al hilo del problema de las pruebas diagnósticas (problema muy importante en la práctica y lainvestigación clínica): pruebas para determinar si un individuo tiene, o no, una cierta enfermedad (u otracaracterística). Hay que resaltar (y no siempre se hace) que si bien la validez de una prueba dependeexclusivamente de la prueba, las estimaciones numéricas que se obtengan de la misma pueden dependerde la prevalencia y de las características clínicas de los pacientes que se hayan estudiado.2. Clasificación de enfermedades por diagnosisDebe tenerse muy en cuenta el tipo de enfermedad que se está analizando y el grado de avance de lamisma en el paciente, porque de acuerdo a ello se deberá puntualizar en ciertos aspectos, más que enotros, como se explicará más adelante. Por ahora, basta con efectuar una primera clasificación de lasenfermedades en tres tipos básicos de acuerdo al siguiente esquema: 1
  2. 2. Tipo I: Son todas aquellas enfermedades donde la peor equivocación que se puede cometer en el diagnóstico es un falso negativo.Tipo II: Son todas aquellas enfermedades donde la peor equivocación que se puede cometer en el diagnóstico es un falso positivo.Tipo III: Son las restantes, donde no se puede clasificar claramente como una de las anteriores.Las enfermedades que se pueden clasificar como Tipo I son:• Una enfermedad que es curable si se detecta a tiempo;• Una enfermedad que es grave y no puede dejarse pasar inadvertida;• Los falsos positivos no traumatizan ni psicológicamente, ni económicamente al paciente, pero los diagnósticos falsos negativos sí lo hacen.Ejemplos: infarto de miocardio, enfermedades venéreas y otras enfermedades infecciosas curables, lafenilcetonuria, el feocromocitoma (curable en el 100% de los casos sí es detectado a tiempo), cáncer demama o de útero, etc.En cambio, una enfermedad donde para el paciente, un diagnóstico falso positivo es más peligroso que unfalso negativo, se considera como del Tipo II, como ser:• La enfermedad es grave, pero difícilmente curable o sin remisión;• Es muy importante para el paciente o para la población él saberse un verdadero negativo;• Los falsos positivos traumatizan seriamente al paciente, en cambio los falsos negativos no;• El tratamiento de los falsos positivos ocasiona serios perjuicios al paciente;Ejemplos: estado terminal o sin remisión de la enfermedad, cáncer oculto, esclerosis en placas, tratamientoscomo radioterapia, quimioterapia, lobectomía, cirugía innecesaria, estadio IV de la sífilis cuando ya no tieneremedio, etc.Cuando la enfermedad no puede ser encasillada en ninguno de los dos casos anteriores, entonces se laconsidera como del Tipo III, como por ejemplo: lupus eritematoso, ciertas formas de leucemia o linfoma,diabetes, etc. En el caso del SIDA un falso positivo puede ser muy dañino para el paciente, pero un falsonegativo sería muy peligroso para la sociedad y como ambos peligros son graves, lo mejor es clasificarlacomo del Tipo III desde un punto de vista ético. Notar que una misma enfermedad puede ser clasificada demaneras diferentes, de acuerdo al estado de avance que tiene en el paciente. Un cáncer que pueda sercurado si se detecta a tiempo es un claro caso de Tipo I, pero una vez que se produjo una metástasis en elpaciente pasa a ser del Tipo II.Lo mismo ocurre con los diferentes estados de la sífilis, que se puede curar si es detectada a tiempo, perose torna incurable cuando está muy avanzada.3. Criterios de calidad de las pruebas diagnósticasCapacidad de la prueba para medir efectivamente lo que se quiere medir• Identificación de los enfermos/sujetos sanos • Enfermo ⇒ Test positivo • Sujeto sano ⇒ Test negativo • Test positivo ⇒ Enfermo • Test negativo ⇒ Sujeto sano Una prueba diagnóstica es considerada de buena calidad si es capaz de clasificar correctamente alos miembros de la población a la que se aplica, dando resultados positivos en las personas enfermas ynegativos en las carentes de la enfermedad de estudio. Es un grave error asumir que el resultado de unaprueba diagnóstica es una representación fiel de la situación real de salud de un individuo. Por el contrario,el médico que reconoce las imperfecciones de una prueba se preguntará: ¿a la vista de este resultado, quégrado de seguridad tengo acerca del estado de salud de este paciente?La importancia de una prueba diagnóstica desde el punto de vista de evaluación de tecnologías se basa envarios factores. Al evaluar una prueba diagnóstica, no obstante, no debe tenerse en cuenta la calidad de laprueba aisladamente, sino que se deben valorar también las acciones que se van a poner en prácticacuando el resultado sea anormal. Así, una prueba cuyo resultado no tenga influencia sobre el manejo delpaciente ni sobre su estado de salud, tendrá poca importancia en salud pública, y su evaluación no seráprioritaria. 2
  3. 3. Otros factores que se deben valorar son el precio de la prueba así como su inocuidad, ya que pueden existirmétodos menos invasivos o más económicos para obtener una información suficiente para nuestrospropósitos.La calidad de una prueba diagnóstica se mide en términos de validez y seguridad. La validez de unaprueba es el grado en que mide lo que se supone debe medir y para determinarla se debe comparar conotra prueba de probada eficacia en la enfermedad de estudio o con el verdadero resultado en el caso deque pueda ser conocido. Estos términos de comparación se denominan patrón áureo, “gold standard” ocriterio de referencia. La validez se mide a través de la sensibilidad y la especificidad de la prueba.La seguridad de una prueba es la capacidad para predecir la presencia o ausencia de enfermedad y semide en términos de los valores predictivos, positivo y negativo.4. Tipos de Pruebas• Pruebas con respuesta dicotómica (positivo, “+”; negativo, ”–“), por ejemplo, la prueba de embarazo;• Pruebas con respuesta policotómica, por ejemplo, estadios del cáncer;• Pruebas con respuesta cuantitativa, por ejemplo, glucosa/diabetes, troponina/IAM. En este caso se presenta el problema de establecer un punto de corte para dicotomizar la respuesta (“+” o “–“).5. Patrón áureoPara identificar la enfermedad se requiere disponer de un diagnóstico de certeza, una prueba de referencia,lo que se conoce con el nombre de patrón áureo (patrón oro, “gold standard”), para poder ver con respectoa este patrón la validez de otras pruebas diagnósticas, su calidad, su capacidad para identificar unaenfermedad o para seguir un tratamiento. 1 PATRON DE REFERENCIA POBLACION PACIENTE + – Pr(PREPRUEBA) 3 2 4 + 6 PRUEBA DIAGNOSTICA – Pr(POSTPRUEBA) 5 Figura 1. Esquema de los estudios de evaluación de pruebas diagnósticas. (1) patrón áureo (gold standard) válido; (2) comparación independiente; (3) espectro de pacientes adecuado; (4) descripción completa de los métodos; (5) presentación correcta de los resultados; (6) repercusión sobre el manejo diagnóstico–terapéutico.5.1. Diseño de investigación para evaluar una prueba diagnósticaEl modelo apropiado es un diseño descriptivo, en el cual un grupo de participantes con característicasdeterminadas acorde a la prueba a probar es sometido a la prueba y concomitantemente al patrón áureo. 3
  4. 4. Enfermedad Enfermedad presente ausente, la detectada por la prueba sugirió su Muestra (individuos A todos se prueba presencia consecutivos con efectúa la las características prueba y el establecidas) patrón áureo Enfermedad Enfermedad presente no ausente, la detectada por la prueba coincidió prueba Figura 2.De esta manera, al cabo del estudio se dispondrá de los datos necesarios para completar la tabla decontingencia, permitiendo calcular todos los indicadores presentados.Para minimizar los sesgos, se deben considerar algunas premisas claves, a saber:1. Selección de la muestra: la muestra debe incluir participantes que representen todas las formas clínicasdel daño buscado y respetando la proporción en que la misma se presenta en la práctica cotidiana. Aúnpruebas de escasa capacidad detectan aceptablemente los casos graves al compararlas con los sin daño.El mayor problema se presenta al intentar detectar a los casos de gravedad moderada a leve. Por ello, lamuestra debe obtenerse desde la presentación consecutiva de casos clínicos que reúnan las característicasque los haría pasibles de la indicación de la prueba. Entre ellos, habrá casos de todas las formas clínicas eincluso casos sin daño.2. Comparación: la misma debe establecerse con un patrón de referencia apropiado y confiable. El patrónáureo debe reunir esas características y todos los participantes deben recibir las dos pruebas (la que seestá investigando y el patrón áureo). Es frecuente observar que si se seleccionó un patrón áureo invasivoy/o costoso, éste se aplique solamente a los que arrojaron un resultado anormal de la prueba en análisis.Este proceder impide que se completen los datos de la tabla de contingencia, ya que no se dispondría delos necesarios para llenar los casilleros c ni d y, por lo tanto, se hace imposible calcular sensibilidad niespecificidad. A este error de procedimiento (o error sistemático o sesgo) se lo denomina error deverificación (“work-up bias”).3. Interpretación de los resultados: La lectura del resultado de la prueba analizada debe ser realizadadesconociendo el resultado del patrón áureo, para evitar el sesgo hacia una coincidencia espúrea.6. Parámetros de valoración de las pruebas diagnósticasImaginemos que queremos evaluar una técnica analítica para el diagnóstico de una enfermedad (infecciosa,por ejemplo). Mediante un procedimiento aleatorio seleccionamos 200 personas que son evaluadas desdeel punto de vista clínico, diagnosticándose 33 personas como enfermas. Tras realizar la prueba en todosellos el resultado es el siguiente: prueba positiva prueba negativa total pacientes enfermos 27 (VP) 6 (FN) 33 (TE) pacientes no enfemos 3 (FP) 164 (VN) 167 (TNE) total 30 (TP) 170 (TN) 200 (T) Tabla 1Los 27 pacientes que, estando enfermos, dieron positiva la prueba diagnóstica se consideran verdaderospositivos (VP). Los seis pacientes enfermos que dieron negativa la prueba de laboratorio son consideradoscomo falsos negativos (FN). Los tres pacientes no enfermos que dieron positiva la prueba se denominanfalsos positivos (FP). Los 164 pacientes no enfermos que no dieron positivo en la prueba son los verdaderosnegativos (VN).A continuación se procederá a definir los parámetros de valoración de las pruebas diagnósticas. 4
  5. 5. 6.1. SensibilidadEs el porcentaje de resultados positivos en pacientes con una determinada enfermedad.Mide el porcentaje de individuos enfermos correctamente diagnosticadosLa sensibilidad indica la capacidad de una prueba para detectar a un sujeto enfermo.La sensibilidad es la probabilidad de que la prueba identifique como enfermo a aquel que realmente lo está.La sensibilidad expresa cuán "sensible" es la prueba a la presencia de la enfermedad.Una alta sensibilidad indica un bajo número de falsos negativos.La sensibilidad sería la probabilidad de que un paciente enfermo diese la prueba positiva o el porcentaje depositivos de la prueba en pacientes con la enfermedad, VP ×100 Sensibilidad ( % ) = TEEn el ejemplo la sensibilidad ( Se ) será: 27 ×100 Se = = 81,8% 33Una sensibilidad del 81,8 % indica que solo el 81,8 % de los pacientes enfermos darán positiva la prueba.En este caso habrá un 18,2 % de falsos negativos (pacientes enfermos que han dado negativa la prueba).Cuanto más sensible es una prueba, más probable es que detecte a las personas con enfermedad. Por ello,las pruebas con una sensibilidad muy elevada son muy útiles para descartar la presencia de enfermedad.6.2. EspecificidadEs el porcentaje de resultados negativos en pacientes que no padecen esa enfermedad.Valora la capacidad de una prueba para detectar correctamente individuos sanos.La especificidad es la probabilidad de que un individuo sano tenga un resultado negativo.Una alta especificidad indica una baja frecuencia de falsos positivos.La especificidad sería la probabilidad de que un paciente sano diese la prueba negativa o el porcentaje denegatividad de la prueba diagnóstica en ausencia de enfermedad, o: VN ×100 Especificidad ( % ) = TNEEn el ejemplo la especificidad ( Es ) será: 164 ×100 Es = = 98, 2 % 167Una especificidad del 98,2 % indica que el 98,2 % de los individuos sanos darán negativa la prueba. En estecaso habrá un 1,8 % de falsos positivos (pacientes sanos que han dado positiva la prueba). Las pruebasmuy específicas se usan para confirmar la presencia de una enfermedad. Si la prueba es muy específica yda positiva, indica la presencia de enfermedad, ya que apenas produce falsos positivos.Aunque la sensibilidad y la especificidad son dos índices de calidad de la prueba, en la práctica clínica laspreguntas a las que interesa responder son: ¿cuál es la probabilidad de que esté verdaderamente enfermosi un sujeto ha resultado positivo, Pr ( E + | T + ) ? y, por el contrario, ¿cuál es la probabilidad de querealmente esté sano si el sujeto resultó negativo en la prueba, Pr ( E − | T − ) ? Estas dos probabilidades sepueden calcular aplicando el teorema de Bayes, siempre que se conozca la probabilidad de que el sujetoesté enfermo antes de realizar la prueba, o probabilidad preprueba. Si no se dispone de ningunainformación adicional sobre el sujeto, dicha probabilidad será la prevalencia de la patología en la población,aplicable sólo en el caso de programas de cribado ("screening") sobre la población general, ya que en lapráctica habitual los sujetos candidatos a una prueba diagnóstica lo son por las sospechas deducidas de laanamnesis o por una sintomatología previa, y por tanto la probabilidad de que padezcan la enfermedad bajosospecha será superior a la prevalencia de ésta en la población general. 5
  6. 6. Denominando P a la probabilidad preprueba de padecer la enfermedad, Se a la sensibilidad de la prueba yEs a su especificidad, las siguientes fórmulas permiten calcular la probabilidad postprueba de que el sujetoesté enfermo cuando resultó positivo o de que esté sano cuando resultó negativo: Se × P Pr ( E + | T + ) = Se × P + (1 − Es )(1 − P ) Es × P Pr ( E − | T − ) = Es (1 − P ) + (1 − Se ) × Pdonde la probabilidad condicional se representa de la forma habitual con el símbolo |Así Pr ( E + | T + ) significa: suceso E + (enfermo) condicionado a que haya ocurrido el suceso T +(resultado positivo en la prueba).Si se calculan estas probabilidades únicamente con los datos de la tabla, la primera de ellas,Pr ( E + | T + ) , a la proporción de sujetos que verdaderamente tienen la enfermedad, de entre los quedieron positivo, y se conoce como valor predictivo positivo, VPP: VP VPP = VP + FPIgualmente se puede calcular en la tabla la proporción de sujetos verdaderamente sanos sobre el total delos que dieron negativo, valor predictivo negativo, VPN: VN VPN = VN + FN6.3. Valor predictivo positivoEl valor predictivo positivo es el porcentaje de pacientes enfermos entre todos los pacientes con resultadospositivos. Valora la probabilidad de que una prueba positiva diagnostique correctamente a un individuoenfermo.El valor predictivo positivo de una prueba sería la probabilidad de que una prueba positiva correspondiese aun verdadero enfermo o el porcentaje de pacientes enfermos con resultados positivos con respecto al totalde resultados positivos, o: VP ×100 VPP ( % ) = TPEn el ejemplo, el VPP será: 27 ×100 VPP = = 90 % 30Un VPP del 90 % indica que de cada 100 pacientes que dan la prueba positiva solo 90 padecen laenfermedad, o lo que es lo mismo: si la prueba da positiva, la probabilidad de padecer la enfermedad es deun 90 %. En este caso habrá un 10 % de individuos sanos diagnosticados incorrectamente como enfermos.Pero esto no significa que haya un 10 % de falsos positivos.6.4. Valor predictivo negativoEl valor predictivo negativo Indica la frecuencia de pacientes no enfermos entre todos los pacientes conresultado negativo. Valora la probabilidad de que una prueba negativa diagnostique correctamente a unindividuo sano. El valor predictivo negativo de una prueba será la probabilidad de que una prueba negativadiagnosticase correctamente a un individuo sano o el porcentaje de individuos sanos con resultadosnegativos con relación al total de resultados negativos, o: VN ×100 VPN ( % ) = TNEn el ejemplo, el VPN será: 6
  7. 7. 164 ×100 VPN = = 96,5% 170Un valor predictivo negativo del 96,5 % indica que de cada 100 pruebas negativas, 96,5 pertenecerán aindividuos sanos, o lo que es igual, si la prueba da negativa, la probabilidad de no padecer la enfermedad esdel 96.5 %. En este caso hay un 3,5 % de individuos enfermos que serán diagnosticados erróneamentecomo no enfermos. Esto tampoco significa que haya un 3,5 % de falsos negativos.El intervalo de confianza al 95 % de los valores predictivos se calculan de acuerdo con las siguientesexpresiones: VPP (1 − VPP ) VPP ± ε a+b VPN (1 − VPN ) VPN ± ε c+ddonde ε =1,96Los valores predictivos dependen mucho de la prevalencia de la enfermedad en la población (cociente entreenfermos y población), no así la sensibilidad y la especificidad, que son independientes de la misma.Puesto que esos dos índices VPP y VPN son los que interesan en la práctica clínica, parecería naturalutilizarlos como índices de comparación a la hora de evaluar dos métodos diagnósticos diferentes. Sinembargo presentan un grave inconveniente, ya que si se calculan a partir de la tabla dependen de laproporción de enfermos en la muestra estudiada. Por ello para una determinada prueba resulta necesariodeterminar unos índices de valoración que, respondiendo a las necesidades reales en cuanto a laclasificación de pacientes, sin embargo no dependan de esa proporción de enfermos en la muestra, talescomo las razones de verosimilitud6.5. Razones de verosimilitudSe puede calcular el cociente entre la tasa de verdaderos positivos y la tasa de falsos positivos: Pr (T + | E ) CP + = Pr (T + | NE )Este cociente CP + se conoce como cociente de probabilidad positivo o también como cociente deverosimilitud de una prueba positiva (likelihood ratio of positive test, LR + o L + ), razón de verosimilitud deuna prueba positiva ( RV + ) , razón de verosimilitud de inclusión, potencia (o poder) predictiva de unaprueba positiva, o índice de eficiencia pronóstica ( IEP ) de un resultado positivo. Valores mayores deCP + indican mejor capacidad para diagnosticar la presencia de enfermedad.De la misma forma, podemos definir un cociente de probabilidad negativo CP − Pr (T − | E ) CP − = Pr (T − | NE )Valores de CP − menores indican una mejor capacidad diagnóstica de la prueba (mejor capacidad paradiagnosticar la ausencia de enfermedad).El cociente de probabilidad negativo también se conoce como cociente de verosimilitud negativo( LR − , λ ) , razón de verosimilitud negativa ( RV − ) , razón de verosimilitud de exclusión, índice deeficiencia pronóstica de una prueba negativa. El inverso de este cociente se llama poder (o potencia)predictiva de una prueba negativa.Se puede determinar unas fórmulas para expresar los cocientes de probabilidad en función de lasensibilidad Se y de la especificidad Es : 7
  8. 8. Se CP + = 1 − Es 1 − Se CP − = EsLa ventaja de los cocientes CP + y CP − frente a los valores predictivos positivo y negativo de la pruebaradica en que, a diferencia de éstos, no dependen de la proporción de enfermos en la muestra, sino tan sólode la sensibilidad y especificidad de ésta, de ahí su utilidad a la hora de comparar pruebas diagnósticas.Además si se conoce o se puede hacer una estimación de la probabilidad preprueba de que un sujetopadezca la enfermedad, utilizando los cocientes de probabilidad, al realizar la prueba se podrá "corregir" esevalor de acuerdo con el resultado, de tal manera que la probabilidad aumenta o disminuye según que elresultado sea positivo o negativo, aplicando la siguiente fórmula P × CP Pr post = 1 + P ( CP −1)donde P es la probabilidad preprueba, CP el correspondiente cociente de probabilidad (positivo sideseamos calcular la probabilidad de que padezca la enfermedad, negativo en caso contrario) y Pr post es laprobabilidad postprueba.Véase un ejemplo numérico de todo lo anterior: patología enfermo ( E + ) no enfermo ( E − ) positiva (T + ) 72 100 positivos: 172 prueba negativa (T − ) 18 150 negativos: 168 total enfermos: 90 no enfermos: 250 total: 340 Tabla 2Aplicando las fórmulas anteriores se tiene: valor estimado intervalo de confianza al 95 % sensibilidad 0,80 0,72 – 0,88 especificidad 0,60 0,54 – 0,66 CP+ 2,00 1,66 – 2,40 CP– 0,33 0,22 – 0,51 Tabla 3Evidentemente los valores de los diferentes índices son estimaciones realizadas mediante un experimentodiseñado al efecto, por lo que es necesario calcular algún indicador de su grado de incertidumbre, comopuede ser un intervalo de confianza del 95 %.6.6. Intervalo de confianza (IC) para la sensibilidad y la especificidad Se (1 − Se ) IC 95% ( Se ) = Se ± 1,96 m Es (1 − Es ) IC 95% ( Es ) = Es ± 1,96 ndonde m es el número de enfermos; y 8
  9. 9. n es el número de no enfermos.Para un intervalo de confianza (IC) del 99 % hay que reemplazar 1,96 por 2,576 y para un IC del 99,9% hayque reemplazar 1,96 por 3,2906.7. Intervalos de confianza para los coeficientes de probabilidad¿Cuán fiables son los coeficientes de probabilidad ( CP ) calculados sobre muestras? Se necesita calcularsu intervalo de confianza que no es fácil para cocientes de probabilidades. Hay varios métodos aproximadospara muestras grandes.6.7.1. Si el CP es próximo a 1: método de Miettinen zα 2 ± χ2 CPdonde χ 2 es el estadístico de asociación de la tabla 2 x 2. 1,96 ±Por ejemplo, para χ 2 = 0, 2 , el intervalo de confianza al 95 % es 1, 02 0,2 = ( 0,92 , 1, 09 )6.7.2. Si el CP no es próximo a 1: aproximación de primer orden del desarrollo de Taylor 1− Se Es ln ( CP + ) ± zα + IC [CP + ] (1 − α ) % = e 2 d c Se 1− Es ln ( CP − ) ± zα + IC [CP − ] (1 − α ) % = e 2 b aSi se comparan dos pruebas diagnósticas A y B , se calculan sus cocientes de probabilidad positivos, y seobserva que CPA + > CPB + , se podrá afirmar que la prueba A es mejor que la B para confirmar lapresencia de enfermedad. Si en cuanto a los cocientes de probabilidad negativos se observa queCPA − < CPB − se podrá afirmar que la prueba A es mejor que la B para confirmar la ausencia deenfermedad.6.8. Variabilidad de las razones de verosimilitudLa incidencia de las razones de verosimilitud sobre los valores predictivos y sobre la utilización diagnósticade los signos y de las pruebas es tal que resulta útil analizar aunque sea brevemente, el respectivo papel desus dos componentes, sensibilidad y especificidad. SeSi la especificidad es constante, las razones de verosimilitud positivas L = son función lineal de la 1 − Essensibilidad. Cuando la sensibilidad aumenta, L aumenta en la misma proporción. 1 − EsLa razón de verosimilitud negativa λ= es igualmente una función lineal de la sensibilidad, pero Senegativa: cuando aumenta la sensibilidad, λ disminuye en la misma proporción (Figura 3) 9
  10. 10. Figura 3. Variación de la razón de verosimilitud en función de la sensibilidad para diferentes pruebas cuya especificidad es igual a 0,90.Cuando Se = 1 − Es = 0,1 , las dos razones de verosimilitud son iguales a 1 la prueba no tiene ningún valordiagnóstico. El valor diagnóstico del resultado –positivo o negativo– de la prueba crece linealmente cuandola sensibilidad aumenta de 0,10 a 1,00. Figura 4. Variación de las razones de verosimilitud en función de la especificidad para diferentes pruebas cuya sensibilidad es igual a 0.80 10
  11. 11. Cuando Es = 1 − Se = 0,8 , las dos razones de verosimilitud son iguales a 1 y por lo tanto en esta situación laprueba carece de utilidad diagnóstica. Se nota que la progresión de L es muy rápida cuando laespecificidad es superior a 0,7. La razón de verosimilitud negativa se modifica poco cuando Es crece de0,50 a 1,00, mientras que la razón de verosimilitud positiva L se afectada mucho por variaciones mínimasde la especificidad cuando ésta es muy elevada; así, cuando Es crece de 0,90 a 0,95, L pasa de 8 a 16.Si la sensibilidad es constante, las dos razones de verosimilitud son funciones hiperbólicas de laespecificidad. La razón de verosimilitud positiva L , en particular, crece muy rápidamente y tiende hacia elinfinito cuando la especificidad de una prueba –o de un grupo de pruebas– tiende hacia 1.Se dice que la eficacia diagnóstica de una prueba, en la investigación de una enfermedad determinada E ,está estrechamente ligada al crecimiento de su especificidad, cualidad que, precisamente, es estable en elcaso de los sujetos no afectados por la enfermedad EComparando los cocientes de probabilidad de dos pruebas diagnósticas existen cuatro posibles resultadosque podemos reflejar en una gráfica. En el eje de las Y representamos la sensibilidad, en el eje de las Xse representa (1−especificidad). El punto representa los valores de sensibilidad y (1−especificidad)observados para la prueba A . Se traza una línea desde el origen (0,0) que pase por el punto A y otradesde el valor (1,1) que también pase por ese punto, quedando dividido el gráfico en cuatro zonas como seve en la Figura 5, de tal manera que cualquier otra prueba cuyo resultado representemos en esa gráficaestará en alguna de las cuatro zonas Figura 5. Las zonas corresponden a las siguientes situaciones: 1: en esta región la prueba B es siempre superior a la A, tanto para confirmar presencia como ausencia de enfermedad; 2: aquí la prueba B sólo es superior a la A para confirmar ausencia de enfermedad; 3: en esta zona B siemprees inferior a A; 4: si el resultado de B está en este área, será superior a A para confirmar la presencia de enfermedad.Supóngase ahora que se desea comparar la prueba A con otra prueba B cuya sensibilidad es 0,9 yespecificidad 0,5. Representándolo en la Figura 6 se obtiene: 11
  12. 12. Figura 6. B cae en la zona 2 por lo que es una prueba mejor que A para confirmar la ausencia de enfermedad, como se puede determinar también numéricamente al calcular los correspondientes cocientes de probabilidad CP+ = 1,8 y CP− = 0,2.Todas estas consideraciones se refieren únicamente a la capacidad discriminatoria de una prueba. Ladecisión sobre qué prueba diagnóstica es más adecuada, siempre es algo más complicada, puesto queintervienen otros aspectos, como son el coste de la prueba, los riesgos que supone para el paciente, valorarlas consecuencias que conlleva un falso positivo o un falso negativo...Evidentemente para comparar los parámetros de dos pruebas diagnósticas habrá que considerar que losvalores obtenidos sólo son estimaciones y están sometidos por tanto a posibles errores de muestreo, por loque habrá que efectuar el correspondiente contraste estadístico para determinar si las diferenciasencontradas son suficientemente importantes como para no poder ser atribuidas al azar.Si la razón de verosimilitud es igual a 1, la probabilidad del diagnóstico es la misma antes y después deaplicar la prueba. En este caso la prueba es inútil, no tiene capacidad discriminante. Cuanto más se aleje de1 el valor de la razón de verosimilitud, mas interés presenta la prueba.CP + > 10 ó CP − < 0,1 Generan cambios amplios y a menudo concluyentes desde una probabilidad preprueba hasta una probabilidad postprueba5 < CP + < 10 y 0,1< CP − < 0, 2 Generan cambios moderados desde la probabilidad preprueba hasta la probabilidad postprueba2 < CP + < 5 y 0, 05 < CP − < 0, 2 Generan cambios pequeños (pero en ocasiones importantes) de la probabilidad1 < CP + < 2 y 0,5 < CP − < 1 Alteran la probabilidad en un grado insignificante (y rara vez importante).Tabla 4. Interpretación de los cocientes de probabilidad (según el Evidence-based Medicine Working Group)Ventajas de la razón de verosimilitud• Es independiente de la prevalencia;• Es un buen reflejo del valor de la prueba cualquiera que sea el grupo al que se aplique;• Resumen la información en sólo parámetro; 12
  13. 13. • Utilizable para diferentes niveles de resultados de una prueba. Para cada nivel procura una información diferente permitiendo interpretar mejor los resultados de la prueba;• Permite calcular de manera individual el interés de realizar la prueba a partir de la probabilidad inicial de la enfermedad del paciente.Los cocientes de probabilidad permiten transformar la probabilidad preprueba en probabilidad postpruebamediante la relación: odds post = CPR × odds preRecuérdese que se denomina odds i al cociente entre la probabilidad de que un evento (en este caso “estarenfermo”) ocurra y la probabilidad de que no ocurra, por lo tanto: p odds odds = ⇒ p = 1− p 1 + oddslos subíndices post y pre indican postprueba y preprueba respectivamente y el subíndice R representa elresultado obtenido.En el caso del siguiente ejemplo: ecocardiograma péptido natriurético tipo B (pmol/L) normal ( <18,7) elevado (≥ 18,7) total normal a 93 b 50 r=a+b 143 disfunción c 1 d 11 s=c+d 12 total t=a+c 94 u=b+d 61 N=a+b+c+d 155 Tabla 5. Resultados de la evaluación del péptido natriurético tipo B d Se d ×r CP + = = s = 1 − Es b b× s r c 1 − Se c×r CP − = = s = Es a a× s rLos CP de la prueba del ejemplo son d ×r 11×143 CP + = = = 2, 62 b× s 50 ×12 c×r 1×143 CP − = = = 0,13 a× s 93×12supóngase que se le aplica la prueba a un anciano al que por su sintomatología e historia se le estima unaprobabilidad alta (por ejemplo, 0,7) de padecer disfunción ventricular izquierda ¿cómo se modificaría estaprobabilidad si se le midiera la concentración plasmática del péptido y resultara positiva ( ≥ 18,7)? A partir 0, 7de la probabilidad preprueba, primero se calcula el odds pre = = 2,33 ; como el resultado es positivo 1 − 0, 7 6,10 CPR = CP + = 2, 62 , por tanto odds post = 2, 62 × 2,33 = 6,10 y Pr ( post ) = = 0,86 ; si el resultado de 7,10la prueba hubiera sido negativo CPR = CP − = 0,13 y odds post = 0,13 × 2,33 = 0,30 y por lo tanto 0,30Pr ( post ) = = 0, 23 . 1,30 13
  14. 14. Figura 7. Nomograma de Fagan (Fagan TJ. Letter: Nomogram for Bayes theorem. N Engl J Med. 1975; 293(5): 257)Fagan (1975) describió un nomograma para el teorema de Bayes, basado en la capacidad de convertir elteorema de Bayes en una función sumatoria lineal simple. Con un par de trucos matemáticos se puedeconseguir esto. Primero, se necesita la versión de probabilidad del teorema de Bayes: " Odds postprueba " = " Odds preprueba " × CPo de forma simbólica: R Pr   E E O  = O(E)   R R Pr   EDonde E representa enfermedad; E representa ausencia de enfermedad; y R es un resultado específico de la prueba.Tomando logaritmos, se convierte en una simple suma: log (" Odds postprueba ") = log (" Odds preprueba ") + log ( CP )o de forma simbólica:   R   E   Pr  E   log  O    = log ( O ( E ) ) + log       R   Pr  R     E    o también: Pr ( postprueba ) = Pr ( preprueba ) x CP log ( Pr ( postprueba ) ) = log ( Pr ( preprueba ) ) + log ( CP ) 14
  15. 15. El nomograma tiene tres columnas: la primera es la probabilidad de tener la enfermedad antes de aplicar laprueba (prevalencia), la segunda es la razón de verosimilitud ( CP ) y la tercera la probabilidad postprueba( PPP, VPP ) . Con una regla se traza una línea entre la probabilidad preprueba y la razón de verosimilitud.La prolongación de esta línea corta en la tercera columna la probabilidad de tener la enfermedad en funcióndel resultado de la prueba, Figura 8. Nomograma de Fagan. Para una prevalencia de 34 % se observa como mejora la probabilidad postprueba de las variables estudiadas6.9. Valores predictivos y razones de verosimilitud. Interés en la evaluación de laspruebas diagnósticas P × Se Pr ( M | S ) = VPP = P × Se + (1 − P )(1 − Es ) P× L VPP = P × ( L − 1) + 1 1− P VPN = P × ( λ − 1) + 1 P VPP VPN 1–VPN 1,0 1,0 0,00 1,0 0,95 0,98 0,095 0,905 0,90 0,96 0,18 0,82 0,80 0,92 0,33 0,67 0,70 0,87 0,46 0,54 0,666 0,86 0,50 0,50 0,60 0,82 0,57 0,43 0,50 0,75 0,666 0,33 0,45 0,71 0,71 0,29 0,40 0,67 0,75 0,25 0,30 0,56 0,82 0,18 15
  16. 16. P VPP VPN 1–VPN 0,25 0,50 0,86 0,14 0,20 0,43 0,89 0,11 0,10 0,25 0,95 0,05 0,05 0,14 0,97 0,03 0,01 0,03 0,99 0,01 0,00 0,00 1,00 0,00 Tabla 5. Variación de los valores predictivos de una misma prueba ( L = 3 y λ = 0,50 ) cuando P varía de 1 a 0. (1 − VPN ) es la probabilidad de sufrir una enfermedad en presencia de una prueba negativa. Figura 9. Variación de los valores predictivos de una prueba cuyas cualidades son (L =3 y λ = 0,50 ) , cuando la probabilidad preprueba de la enfermedad varía entre 0 y 1Las curvas de los valores predictivos en función de la probabilidad a priori P son hipérbolas. Los puntosdestacables de estas tres curvas son:• A donde el valor predictivo positivo es igual a 0,50;• B donde el valor predictivo negativo es igual a 0,50; 1• C donde VPP = VPN , cuando P = 1+ L λPara una misma prueba, cuando P disminuye, VPP disminuye y VPN aumenta. Cuando P aumenta,VPP aumenta y VPN disminuye.Se nota que el valor predictivo positivo al principio crece rápidamente cuando la probabilidad prepruebacrece entre 0 y 0,50 y después más lentamente. El VPP es inferior a 0,50 cuando la probabilidad a priori o 1 1preprueba es inferior a P1 = , en el ejemplo, donde L = 3 , cuando P es inferior a = 0, 25 (Figura 1+ L 1+ 38). 16
  17. 17. 1Cuando la probabilidad preprueba de la enfermedad E es inferior a , el VPP o probabilidad 1+ Lpostprueba de la enfermedad es inferior al 50 %, incluso si la prueba da un resultado positivo.El VPN disminuye cuando crece la probabilidad preprueba de la enfermedad. Es inferior a 0,50 cuando P 1 1es inferior a P2 = , en el ejemplo P2 = = 0, 666 (Figura 8). 1+ λ 1 + 0,50 1Así, cuando la probabilidad primaria es superior a P2 = incluso si la prueba da un resultado negativo, 1+ λla probabilidad a posteriori o postprueba de la enfermedad es superior al 50 %.Los dos valores P1 y P2 de la probabilidad primaria, tales que: 1 P1 = 1+ L 1 P2 = 1+ λdeterminan lo que se puede definir como el intervalo de seguridad de la prueba. En efecto, cuando laprobabilidad primaria se sitúa dentro de este intervalo, un resultado positivo de la prueba da unVPP superior al 50 % y un resultado negativo da una probabilidad secundaria de la enfermedad inferior al50 %. Este no es el caso cuando P se sitúa fuera de este intervalo: si P es inferior a P1 , la probabilidadpostprueba de la enfermedades inferior a 1 cambio sobre dos, incluso si la prueba da un resultado positivo.Cuando P es superior a P2 , incluso si el resultado de la prueba es negativo, la probabilidad postprueba dela enfermedad es todavía superior a 1 cambio sobre 2 ( > 0,50 ) . Estas consecuencias matemáticas delintervalo de seguridad de la probabilidad primaria, tal como está definido por los límites P1 y P2 , son de unaimportancia capital para la conducta del razonamiento y de la decisión diagnóstica. Intervalo de seguridad diagnóstica Figura 10. Comparación de las curvas VPP y VPN de las pruebas “1” y “2” en función de lasvariaciones de la probabilidad primaria. Las cualidades diagnósticas respectivas de las dos pruebas son: para la prueba “1”: L = 18; λ = 0,105 ; Para la prueba “2”: L = 3; λ = 0,50 . Se observa que el intervalo de seguridad diagnóstica para la prueba “1” es mas estrecho que para la prueba “2”. 17
  18. 18. La curva del valor predictivo positivo VPP es tanto mayor cuanto más elevada es L , y la curva del valorpredictivo negativo VPN es tanto menor cuanto más pequeña es λ . El Intervalo de seguridad diagnósticaes tanto más amplio cuanto más elevada es L y más pequeña λ . Figura 11. Variaciones de la probabilidad postprueba de la enfermedad E en función de la probabilidad preprueba P y de las cualidades diagnósticas de la prueba (Sox H.C. Ann Inter Med 1986;104:60-6).La Figura 11A representa tres pruebas cuya sensibilidad es idéntica, 0,90, y cuyas especificidades soncrecientes, 0,80 para la prueba 1, 0,90 para la prueba 2 y 0,98 para la prueba 3.En la Figura 11B, las tres pruebas tienen una especificidad idéntica igual a 0,90, y las sensibilidades sonrespectivamente 0,60 para la prueba 1, 0,80 para la prueba 2 y 0,95 para la prueba 3.En la figura 11A, las tres pruebas tienen una sensibilidad idéntica, igual a 090 y una especificidad creciente,con las cualidades respectivas siguientes: sensibilidad especificidad L λ prueba 1 0,90 0,80 4,5 0,125 prueba 2 0,90 0,90 9,0 0,110 prueba 3 0,90 0,98 45,0 0,100 Tabla 6La figura 11A muestra que para valores bajos de la probabilidad preprueba P , la eficacia diagnóstica delresultado positivo de la prueba –medida por el VPP – es tanto mas grande cuanto mas elevados son laespecificada y la razón de verosimilitud positiva. En contra, las variaciones de la especificidad modificanmuy poco la consecuencia del resultado negativo: en este caso el efecto de la probabilidad primaria espredominante.Las conclusiones inversas resultan de la figura 11B donde las tres pruebas tienen una especificidad idénticaigual a 0,90 y una sensibilidad creciente: sensibilidad especificidad L λ prueba 1 0,60 0,90 6,0 0,44 prueba 2 0,80 0,90 8,0 0,22 prueba 3 0,95 0,90 9,5 0,055 Tabla 7Las variaciones de la sensibilidad afectan poco los valores predictivos positivos; en cambio, modificanconsiderablemente el efecto de un resultado negativo de la prueba, sobre todo cuando la probabilidadpreprueba de la enfermedad es superior a 0,50 ó 0,60.En suma, cuando la probabilidad preprueba P es baja, un resultado negativo de la prueba tiene pocaincidencia sobre la decisión diagnóstica; el de un resultado positivo de una prueba específica es elevado. Lo 18
  19. 19. inverso ocurre cuando la probabilidad preprueba es elevada: la consecuencias diagnósticas de un resultadonegativo de una prueba sensible es considerable, el de un resultado positivo es débil.En una situación diagnóstica dada, la elección de una prueba por el clínico está guiada pues por laprobabilidad preprueba de la enfermedad: si el diagnóstico es casi cierto, su confirmación por una pruebaespecífica modifica muy poco su probabilidad; en cambio, el resultado negativo de una prueba sensibleimpondría una revisión seria de la toma de decisiones. Para optimizar la toma de decisiones, el clínico debepues elegir una prueba cuya sensibilidad y especificidad sean apropiadas a la probabilidad preprueba de laenfermedad.La incidencia del resultado de la prueba sobre el proceso decisional traduce la eficacia diagnóstica de laprueba. Esta eficacia está medida sobre el efecto de concentración y por la noción de ganancia diagnóstica.Hasta ahora se ha estudiado el caso de un resultado dicotómico, pero en muchas ocasiones las pruebasdiagnósticas son cuantitativas, sobre todo cuando corresponden a determinaciones analíticas.Evidentemente, se pueden utilizar todas las consideraciones hechas hasta el momento si se fija un punto decorte, un valor determinado de la prueba, que marque el límite entre “sano” y “enfermo”. Pero eso no sueleser una tarea sencilla. Se puede reflejar esquemáticamente en la figura 12: Figura 12Existe una zona de posibles resultados de la prueba para la que la distribución de sujetos sanos y enfermosse solapan. Si se desea aumentar la probabilidad de detectar pacientes enfermos (en la Figura 12corresponde a mover el punto de corte hacia la izquierda) se ve como también aumentan el número defalsos positivos. Si se desplaza el punto de corte hacia la derecha, disminuirán los falsos positivos, pero acosta de aumentar el de falsos negativos. Resumiendo, un aumento de la sensibilidad disminuye laespecificidad, y viceversa.6.10. Falsos positivos frente a falsos negativos. Criterios1. Gravedad o importancia en salud pública. Si el evento puede ser tratado y detectado evitando complicaciones posteriores han de utilizarse pruebas que minimicen el número de falsos negativos, es decir, se elegirán pruebas con alta sensibilidad;2. Coste de las distintas pruebas, exámenes y cuidados médicos y de enfermería requeridos. Si el coste de todos ellos es alto han de minimizarse el número de falsos positivos, eligiendo pruebas con alta especificidad;3. Consecuencias psicosociales. Si la enfermedad diagnosticada conlleva consecuencias al creer que uno está enfermo por ejemplo en el caso de VIH+ han de minimizarse los falsos positivos, eligiendo pruebas de alta especificidad;4. Prevalencia de la enfermedad. Si es baja se ha de maximizar la especificidad para que aumente la eficiencia del programa.6.11. Odds ratio diagnósticaLa odds ratio diagnóstica (DOR) es conocida como un índice estadístico en los estudios epidemiológicoscasos/controles representando la fuerza de asociación entre el factor de riesgo y la enfermedad. Aquí podría 19
  20. 20. ser útil para mostrar la fuerza de asociación entre el resultado de una prueba y la enfermedad. Este índicetraduce las prestaciones de una prueba con un solo valor que no está influenciado por la prevalencia.Es la razón entre la odds de estar enfermo si la prueba da positivo y la odds de no estar enfermo si laprueba da negativo. VP VPP DOR = FN = CP + = (1 − VPP ) FP VN CP − (1 − VPN ) VPNLos valores de la DOR varían de cero a infinito (cuantos más altos son los valores, mejor es la prueba). Elvalor DOR = 1 significa que la prueba no es discriminante, es la prueba inútil. Los valores mayores de 1significan que es más probable que la prueba de positivo en el caso de enfermos que en sanos.6.12. Efectividad de una pruebaLa efectividad de la prueba, cuya distribución es aproximadamente normal, se define como 3  Se Es  3 CP + δ =  ln + ln  = ln π  1 − Se 1 − Es  π CP −y que puede interpretarse como la diferencia entre las medias de los resultados entre una población deenfermos y otra de sanos en una escala normalizada. Si δ = 1 la prueba no es efectiva y si δ = 3 esaltamente efectiva.6.13. Eficiencia diagnóstica de una pruebaEs el porcentaje de pacientes correctamente clasificados, o la probabilidad de que esa prueba diagnósticaacierte en sus conclusiones: VP + VN Eficiencia = VP + VN + FP + FNSi se tiene en cuenta la prevalencia, la expresión sería: Pr ( M ) × Se Eficiencia = (1 − Pr ( M ) ) × EsEn el caso de que la prevalencia de la enfermedad sea 0,50, sería Eficiencia = 0,5 × Se + 0,5 × Es yentonces se llamaría eficiencia estándar: Se + Es Eficiencia estándard = 2que también se conoce como valor predictivo global y exactitud diagnóstica6.14. El índice de Youden (Y)Este índice clínico fue propuesto por Youden (1950) para analizar la capacidad del método de diagnóstico,usando un único valor en reemplazo de la forma dual de hacerlo (sensibilidad y especificidad). La idea esmezclar los dos índices anteriores para hacer el estudio de calidad. Se define como: Y = Se + Es −1Varía de (–1) a (+1). Si es inferior o igual a 0, la prueba no tiene ningún valor informativo. La prueba es tantode mejor cuanto el índice de Youden se acerca a 1.Hay una relación lineal entre este índice y la eficiencia estándar, ya que: Y = 2 ( Se + Es ) − 1 2 20
  21. 21. 6.15. El efecto de concentraciónSe llama “efecto de concentración” al aumenta de la densidad –o de la probabilidad– investigada que esaportada por el resultado positivo de la prueba. El efecto de la concentración se traduce por la relación: Probabilidad postprueba de M Pr ( M | T + ) VPP = = Probabilidad preprueba de M Pr ( M ) PEl efecto de concentración es precioso en situación de cribado de una enfermedad cuya prevalencia es muybaja en la población estudiada.Por ejemplo, como el feocromocitoma puede ser una causa, rara, de hipertensión arterial, su investigaciónsistemática se aconseja a causa de las posibilidades terapéuticas que aporta la ablación quirúrgica deltumor. Las pruebas diagnósticas propuestas son la medida de la eliminación urinaria de los derivadosmetoxilados de las catecolaminas. Las cualidades diagnósticas de la prueba en caso de los pacienteshipertensos son sensibilidad = 0,97; especificidad = 0,95 y razón de verosimilitud positiva = 19,4. Si estacostosa prueba se aplica al conjunto de los sujetos hipertensos donde la prevalencia del feocromocitoma es P = 0, 004 , la probabilidad de una causa tumoral cuando la prueba es positiva no rebasa 0,07: por un solopaciente realmente portador de un tumor, la prueba da pues 13 resultados falsamente positivos. PF Plouinet al. (1981) han aconsejado aplicar esta prueba bioquímica sólo a los hipertensos que presenten lasiguiente tríada sintomática: cefaleas, palpitaciones y crisis de sudoración. Las cualidades diagnósticas dela tríada han sido obtenidas sobre una muestra de 2585 sujetos hipertensos. feocromocitoma presente ausente presente 10 160 170 tríada ausente 1 2414 2415 11 2574 2585 Tabla 8La presencia de la triada sintomática en el caso de un sujeto hipertenso aumenta la probabilidad del 10feocromocitoma a = 0, 06 . La presencia de la triada sintomática tiene pues un “efecto de 170concentración” de la probabilidad del feocromocitoma en el caso de tales hipertensos, igual a: VPP 0, 06 = = 14, 7 veces P 0, 004Cuando la prueba bioquímica se aplica entonces a los pacientes seleccionados por este criterio clínico (enla hipótesis de que se mantengan en este grupo las cualidades diagnósticas establecidas en el conjunto delos hipertensos) su valor predictivo positivo sería entonces: 0, 06 ×19, 4 VPP = = 0,55 ( 0, 06 ×18, 4 ) + 1La prueba esta vez es perfectamente aceptable: por cada enfermo diagnosticado, no da mas que unresultado falsamente positivo, gracias al efecto de concentración provocado por el criterio clínico inicial. Elefecto de concentración obtenido por el conjunto de esta “estrategia secuencial” es igual a 0,55 = 137,5 veces .0, 004 1La ausencia de la triada sintomática reduce la probabilidad de feocromocitoma a = 0, 0004 , es decir a 2415un nivel 10 veces mas bajo que en el conjunto de los hipertensos. 21
  22. 22. 6.16. Ganancia diagnósticaSe llama ganancia diagnóstica a la diferencia entre la probabilidad preprueba de la enfermedad y laprobabilidad postprueba obtenida por el resultado de la prueba. Si el resultado de la prueba es positivo, laganancia diagnóstica G ( + ) se mide por la diferencia G ( + ) = Pr ( E + | T + ) − Pr ( E + ) = VPP − PSi el resultado de la prueba es negativo, la reducción de la probabilidad de la enfermedad se mide en valorabsoluto por la diferencia G ( − ) = Pr ( E + ) − Pr ( E + | T − ) = P − (1 − VPN )El conjunto de la ganancia diagnóstica alcanzada por la aplicación de la prueba, o contenido diagnóstico Γ(gamma) de la prueba es igual a la suma de estas dos ganancias diagnósticas: Γ = G (+) + G (−) Γ =  Pr ( E + | T + ) − Pr ( E + )  +  Pr ( E + ) − Pr ( E + | T − )      = Pr ( E + | T + ) − Pr ( E + | T − )El contenido diagnóstico Γ alcanzado por la aplicación de una prueba se mide por la diferencia entre lasdos probabilidades postprueba de la enfermedad, que son obtenidas respectivamente por el resultadopositivo y negativo de la prueba.Por ejemplo, una prueba con respuesta dicotómica cuyas cualidades diagnósticas son: Se = 0,80 Es = 0,90 L = 8 λ = 0, 222es aplicable a la investigación de una enfermedad cuya probabilidad preprueba es 0,30.Si la respuesta de la prueba es “positiva”, la probabilidad postprueba de la enfermedad se eleva a: PL Pr ( E + | T + ) = VPP = P ( L − 1) + 1 0,30 × 8 = = 0, 77 ( 0,30 × 7 ) + 1La ganancia diagnóstica aportada por la respuesta positiva de la prueba es: G ( + ) = VPP − P = 0, 77 − 0,30 = 0, 47Si la respuesta de la prueba es “negativa”, la probabilidad de la enfermedad baja a: Pλ Pr ( E + | T − ) = 1 − VPN = P ( λ − 1) + 1 0,30 × 0, 222 = = 0, 09 ( 0,30 × ( 0, 222 −1) ) + 1La ganancia diagnóstica obtenida por la respuesta negativa de la prueba, en valor absoluto es: G ( − ) = P − (1 − VPN ) = 0,30 − 0, 09 = 0, 21Las ganancias diagnósticas se pueden visualizar en la Figura 13. En función de la probabilidad prepruebaP en abscisas, las dos curvas dan los valores de las probabilidades postprueba de la enfermedad Esegún que el resultado de la prueba sea positivo (curva superior) o negativo (curva inferior). La gananciadiagnóstica G ( + ) aportada por el resultado positivo es igual a la distancia OA; la ganancia G ( − ) aportadapor un resultado negativo es igual en valor absoluto a la distancia OB; la ganancia total o contenido 22
  23. 23. diagnóstico Γ de la prueba cuando la probabilidad preprueba es 0,30, es igual a la distancia AB entre lasdos curvas: Γ : Γ = 0, 47 + 0, 21 = 0, 68 Figura 13. Ganancia diagnóstica obtenida por la respuesta de una prueba en función de la proba- bilidad preprueba. La figura muestra que la ganancia diagnóstica obtenida por la prueba tiende aanularse cuando la probabilidad primaria de la enfermedad se aproxima a los valores extremos 0 y 1.El cálculo muestra que la ganancia diagnóstica aportada por la respuesta positiva de la prueba es máximacuando la probabilidad preprueba es igual a: 1 P (+) = 1+ L 1En el ejemplo, P ( + ) = = 0, 26 1+ 8En caso de respuesta negativa, la ganancia diagnóstica es máxima cuando la probabilidad primaria es: 1 P (+) = 1+ L 1En el ejemplo, P ( − ) = = 0, 68 1 + 0, 222El contenido diagnóstico de la prueba es máximo cuando la probabilidad preprueba de la enfermedad es: 1 Pmáx = 1+ L λ 1En el ejemplo, Pmáx = = 0, 43 . 1 + 8 × 0, 222Esta probabilidad es aquella en que los dos valores predictivos positivo VPP y negativo VPN son iguales.En el ejemplo, cuando P es igual a Pmáx = 0, 43 , los dos valores predictivos son VPP = VPN = 0,86 . Escuando la probabilidad preprueba está próxima a valores medianos –próxima al 50 %– cuando la respuestade la prueba aporta la información diagnóstica mas elevada (Figura 14). Este valor Pmáx de la probabilidad 23
  24. 24. preprueba es 0,50 cuando el producto L λ = 1 , es decir cuando las dos razones de verosimilitud L y λ soninversas la una de la otra.Figura 14. Ganancia diagnóstica en función de la probabilidad preprueba P, aportada por una prueba cuyas cualidades diagnósticas son L = 8 y λ = 0,222G ( + ) es la ganancia diagnóstica aportada por una respuesta positiva: su valor máximo se obtiene cuando: 1 P− = 0, 26 1+ LG ( − ) es la ganancia diagnóstica aportada por una respuesta negativa: su valor máximo se obtienecuando: 1 P− = 0, 26 1+ LΓ es la suma de las dos ganancias, su valor máximo se obtiene cuando: 1 P− = 0, 43 1+ L7. ComentariosGeneralmente, sensibilidad y especificidad suelen tener una relación inversa, es decir, si la sensibilidad deuna prueba es muy alta, es a costa de perder especificidad y viceversa.Cuando para el diagnóstico de una enfermedad existen varias pruebas posibles, la utilización de una u otrase hará atendiendo a las necesidades diagnósticas. Así en las pruebas de cribado, detección o screening,se utilizan, en general, pruebas de alta sensibilidad, mientras que en las pruebas de confirmación se utilizantécnicas de alta especificidad. Las pruebas con una alta sensibilidad se utilizan cuando se quierediagnosticar correctamente a los pacientes enfermos. Por ejemplo, en el diagnóstico del cáncer de mama seutiliza un marcador tumoral específico. Si la paciente tiene cáncer pero la prueba diagnóstica no es capazde detectarla, el tumor avanzará rápidamente y provocará un deterioro en la mujer que hará imposible untratamiento posterior. Por esta razón la prueba debe detectar a todos los pacientes enfermos, aun a costade diagnosticar incorrectamente a alguno sano, pues en las exploraciones complementarias que se realicenposteriormente, se detectará que el diagnóstico inicial era erróneo.Las pruebas con una alta especificidad se utilizan cuando se desea diagnosticar correctamente a todos losindividuos sanos. Por ejemplo, en el diagnóstico del embarazo, si la prueba diagnostica incorrectamente amujeres no embarazadas, no pasará nada puesto que en pocos días se verá que el diagnóstico eraincorrecto. 24
  25. 25. 8. Etapas de un estudio de evaluación de pruebas diagnósticasDebido a que una misma prueba diagnóstica puede ser utilizada para el estudio de varias situacionesclínicas (por ejemplo, el diagnóstico por imagen con resonancia magnética puede aplicarse a gran númerode patologías), se tendrá que decidir cuál se va a evaluar. Para guiar esta decisión se deben tener encuenta los siguientes factores:• Frecuencia de la enfermedad o estado. Se priorizarán aquellas aplicaciones que afecten a mayor número de personas;• Coste de la tecnología: las tecnologías más caras deben ser evaluadas con el máximo rigor para evitar gastos innecesarios al sistema sanitario;• Existencia de un criterio de referencia que permita la comparación;• Impacto potencial sobre el manejo del paciente: se debe hacer mayor esfuerzo en mejorar la calidad de las pruebas diagnóstica de las condiciones clínicas para las que hay tratamiento eficaz;• Impacto potencial sobre el resultado clínico. Se dará prioridad a la evaluación de aquellas pruebas, que en definitiva, contribuyan a la mejora del estado de salud de los pacientes;• Existencia de métodos diagnósticos inadecuados para la situación clínica bajo estudio. Una vez decidida la enfermedad o situación clínica que se va a estudiar, el diseño del estudio será similar al de cualquier otro estudio observacional y los pacientes elegidos no deberán diferir substancialmente de aquellos a los que posteriormente se aplicará la prueba. Se deben incluir, por tanto, pacientes con diversos estadios clínicos de la enfermedad, ya que si se escogieran sólo los más graves, por ejemplo, darían mayor número de positivos, aumentando de una forma ficticia la sensibilidad de la prueba.La elección del criterio de referencia resulta, en ocasiones, muy compleja, bien por ser costoso opotencialmente perjudicial para el individuo o porque simplemente no se ha desarrollado un mejor métodode diagnóstico. Sin embargo, utilizar un criterio de referencia de baja calidad puede conducir, a que la nuevamedida sea considerada falsamente de baja calidad. Por ejemplo, con un patrón áureo de baja sensibilidadmuchos resultados positivos de la nueva prueba serán considerados erróneamente falsos positivos,disminuyendo el valor de la prueba.9. Sesgos potenciales de los estudios sobre pruebas diagnósticas modo de producción consecuencias modo de control 1. Sesgo de no se tiene en cuenta el sobrestima Se y Es representar el espectro selección espectro clínico de la si se representan los completo en la muestra; enfermedad o comorbilidad casos graves; describir el espectro en el infraestima Se y Es análisis; análisis de la prueba si se representan los diagnóstica en los subgrupos casos leves 2. Sesgo de la no se dispone de una buena generalmente seguimiento clínicos de los prueba de prueba de referencia y se usa sobrestima Se y Es pacientes para conocer si son referencia la disponible (aunque no pero a veces los enfermos o no; correcciones imperfecta clasifique bien y discrimine infraestima matemáticas si se dispone de correctamente sanos y un subconjunto de pacientes enfermos). con una adscripción definitiva 3. Sesgo de elementos de la prueba sobrestima Se y Es conceptualización adecuada de incorporación diagnóstica forma parte de la la prueba diagnóstica y de la prueba de referencia prueba de referencia. 4. Sesgo de la interpretación de la prueba sobrestima Se y Es enmascaramiento de las revisión o diagnóstica y la prueba de personas que interpretan (y valoración referencia se realiza realizan) la prueba diagnóstica y ciega conociendo el otro resultado, la prueba de referencia es decir, de modo no ciego 5. Sesgo de el resultado de la prueba sobrestima Se e realización estándar en todos secuencia o diagnóstica condiciona la infraestima Es los pacientes del estudio; si no verificación realización de una prueba de es posible hacerlo: seguimiento diagnóstica referencia de las pruebas negativas y correcciones matemáticas 25
  26. 26. modo de producción consecuencias modo de control 6. Sesgo por es una eventualidad que se sobrestima Se y Es repetición de la prueba si es resultados no produce en cualquier prueba posible; Inclusión en el estudio interpretables diagnóstica o de referencia de los casos no interpretables 7. Sesgo por diversos observadores que generalmente estudios previos (piloto) de variabilidad en actúan dentro del estudio infraestima Se y Es consistencia inter e la tienen diferentes Se y Es ; el intraobservadores; correcciones interpretación mismo observador cambia su matemáticas de resultados Se y Es dentro del estudio debido al entrenamiento10. Evaluación diagnóstica: jerarquizaciónNivel 1: Prestaciones técnicas. Las pruebas cumplen los criterios de calidad aceptablesNivel 2: Prestaciones diagnósticas. Los resultados de las pruebas diagnósticas permiten hacer diagnósticosprecisos, es decir permiten identificar enfermos y no enfermos (eficiencia, valor predictivo, sensibilidad,especificidad, razón de verosimilitud, área bajo la curva ROC)Nivel 3 Impacto diagnóstico. Los resultados modifican la confianza que se tiene en el diagnóstico y evitanotros estudiosNivel 4: Impacto terapéutico. Los resultados de las pruebas intervienen en las decisiones terapéuticas y enque proporciónNivel 5: Impacto de los resultados. Los resultados de las pruebas contribuyen a mejorar el estado de saludde los pacientesNivel 6: Impacto en la salud pública. Análisis coste beneficio y coste eficacia desde el punto de vista de lasociedadBibliografía1. Albert A, Harris EK. Multivariate interpretation of clinical laboratory data. New York: Marcel Dekker; 1987.2. Bermejo Fraile B. Epidemiología clínica aplicada a la toma de decisiones en medicina. Departamento de Salud. Gobierno de Navarra; 2001. www.cfnavarra.es/salud/docencia.investigacion/textos/Monograf_1/Epidemiologia_clinica.pdf3. Escrig-Sos J, Martínez-Ramos D, Miralles-Tena JM. Pruebas diagnósticas: nociones básicas para su correcta interpretación y uso. Cir Esp 2006;79(5):267-273.4. Grenier B. Décision médicale. Paris: MASSON; 1993.5. Grimes DA, Schulz KF. Refining clinical diagnosis with likelihood ratios. Lancet. 2005;365(9469):1500-5.6. Hayden SR, Brown MD. Likelihood ratio: A powerful tool for incorporating the results of a diagnostic test into clinical decisionmaking. Ann Emerg Med. 1999;33(5):575-80.7. Redondo Alvaro FL. La lógica en la interpretación de las pruebas diagnósticas. Madrid: Garsi; 1989.www.epiredperu.net/epired/ppts/curso_estadistica-scsf/estadistica-scsf-14.pdfwww.vhebron.es/ac/preventiva/docencia/mastphoenix/t06_pru_diagnosticas_diapos_fx.pdfwww.fisterra.com/mbe/investiga/pruebas_diagnosticas/pruebas_diagnosticas2.pdfhttp://dxsp.sergas.es/ApliEdatos/Epidat/Ayuda/6-Ayuda%20Pruebas%20diagnósticas.pdfwww.uquebec.ca/reglog/chapitre9.htmhttp://www.spieao.uhp-nancy.fr/~kohler/LectureArticle/www.med.univ.montpl.fr/Enseignement/cycle_2/c-ac-2eCR.htm 26

×