Unidad 4 final

  • 115 views
Uploaded on

Capitulo del Libro 3030, reproducido con fines docentes

Capitulo del Libro 3030, reproducido con fines docentes

More in: Education
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
115
On Slideshare
0
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
6
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. 212 Unidad 4 Organización de los datos epidemiológicos Cuando se recogen más datos de los que se puede revisar individualmente, se pueden usar cuadros y gráficas para organizarlos, resumirlos y mostrarlos en forma clara y efectiva. Con cuadros y gráficas se pueden analizar grupos de datos de unas pocas docenas a algunos millones. Estas herramientas permiten identificar, explorar, entender y presentar distribuciones, tendencias y relaciones entre los datos. Los cuadros y las gráficas son herramientas esenciales no sólo en la epidemiología descriptiva y analítica, sino también en la comunicación de los hallazgos de las investigaciones. Objetivos Después de preparar y entender esta lección, y responder a las preguntas de los ejercicios, este módulo, el estudiante será capaz de: • Preparar correctamente cuadros con una, dos o tres variables; • Preparar correctamente las siguientes gráficas: una serie lineal en escala aritmética, una serie lineal en escala semi-logarítmica, histogramas, polígonos de frecuencia y diagramas de dispersión (nube de puntos); • Preparar correctamente gráficas de barras, pasteles, mapas de puntos, mapas de área, y diagramas de cajas y bigotes; • Describir cuando se usa cada tipo de cuadros, gráficas y cartas.
  • 2. 213 Introducción a los cuadros, gráficas y cartas El análisis de los datos es un componente importante en la práctica epidemiológica; para un análisis efectivo de los datos, el trabajador de salud debe primero familiarizarse con ellos y después aplicar técnicas analíticas; es importante empezar por examinar los datos individualmente tal como aparecen en la base de datos, para rápidamente resumirlos en cuadros; algunas veces, las cuadros resultantes son el único análisis necesario, particularmente cuando la cantidad de datos es pequeña y la relaciones son obvias. Por otra parte, las gráficas pueden ayudar a visualizar patrones y tendencias más generales e identificar variaciones de estas tendencias. Las variaciones pueden representar hallazgos nuevos e importantes o pueden ser únicamente errores en la digitación o codificación que necesitan ser corregidos. Por lo tanto, las cuadros y las gráficas son esenciales para la verificación y el análisis de los datos. Una vez que el análisis está completo, las cuadros y las gráficas pueden servir como ayudas visuales útiles para describir los datos; cuando se preparan cuadros y gráficas, el propósito primario es comunicar la información obtenida.
  • 3. 214 Cuadros Una cuadro es la agrupación de datos dispuestos en filas y columnas. Se puede organizar casi cualquier información cuantitativa en un cuadro. Los cuadros son útiles para demostrar patrones, excepciones a un patrón, diferencias y otras relaciones; además sirven habitualmente como base para la preparación de gráficas, que son más visuales pero que pueden perder algunos detalles. Los cuadros diseñadas para presentar los datos deben ser lo más simple posible; dos o tres pequeñas cuadros, cada uno enfocado en un aspecto diferente de los datos, son más fáciles de entender que uno solo que contenga muchos datos. Un cuadro debe entenderse por sí mismo; si se saca de su contexto original, debe conservar la información necesaria para que el lector entienda los datos. Para crear un cuadro que se entienda por si mismo, siga los siguientes pasos: 1. Use un título claro y conciso que describa el que, el cuando y el donde de los datos; 2. Encabece cada fila y cada columna e incluya las unidades de medida (por ejemplo, años, mmHg, mg/dl, tasas por 100.000); 3. Muestre los totales de las filas y las columnas; si se muestran porcentajes, hay que mostrar el total de ellos (siempre 100%); 4. Explique cualquier código, abreviatura, o símbolo en una nota de pie de página; 5. Anote cualquier exclusión en una nota a pie de página; 6. Anote la fuente de los datos en una nota a pie de página, si ellos no son originales.
  • 4. 215 Cuadros de una sola variable El cuadro básico en la epidemiología descriptiva es una distribución de frecuencias simple con una sola variable, como el cuadro 4.1a. en la primera columna del cuadro se despliegan los valores o categorías de la variable representada en los datos, tales como edad o sexo; la segunda columna muestra el número de personas o eventos en cada categoría; con frecuencia, una tercera columna muestra el porcentaje de las personas o los eventos en cada categoría. Con frecuencia, una tercera columna muestra el porcentaje de las personas o de los eventos en cada categoría, como en el cuadro 4.1b. Observe que los porcentajes en el cuadro 4.1b suman 100,1% en vez de 100%, dado que se aproximaron las cifras a una posición decimal. Esto ocurre con frecuencia en las cuadros que muestran porcentajes; sin embargo, hay que mostrar el total de los porcentajes como 100% y explicar la diferencia en una nota de pie de página. Cuadro 4.1 a Morbilidad por sífilis primaria y secundaria por edad, Estados Unidos, 1989 Grupo etario (años) Número de casos ≤ 14 15-19 20-24 25-29 30-34 35-44 45-54 ≥55 Total 230 4,378 10,405 9,610 8,648 6,901 2,631 1,278 44,081 Fuente: 12 Cuadro 4.1 b
  • 5. 216 Morbilidad por sífilis primaria y secundaria por edad, Estados Unidos, 1989 Grupo etario Casos (años) Número Porcentaje ≤ 14 15-19 20-24 25-29 30-34 35-44 45-54 ≥55 Total 230 4,378 10,405 9,610 8,648 6,901 2,631 1,278 44,081 0.5 10.0 23.6 21.8 19.6 15.7 6.0 2.9 100.0* *Los porcentajes no suman a 100% debido a redondeo Fuente: 12 Se puede modificar el cuadro de una sola variable para mostrar la frecuencia acumulada o el porcentaje acumulado, como en el cuadro 4.1c, en el cual es posible ver que 75.5% de los casos de sífilis primaria y secundaria ocurrieron en los menores de 35 años. Cuadro 4.1 b Morbilidad por sífilis primaria y secundaria por edad, Estados Unidos, 1989 Grupo etario Casos (Años) Número Porcentaje % Acumulado ≤ 14 15-19 20-24 25-29 30-34 35-44 45-54 ≥55 Total 230 4,378 10,405 9,610 8,648 6,901 2,631 1,278 44,081 0.5 10.0 23.6 21.8 19.6 15.7 6.0 2.9 100.0* 0.5 10.5 34.1 55.9 75.5 91.2 97.2 100.0 100.0% *Los porcentajes no suman a 100% debido a redondeo Fuente: 12
  • 6. 217 Cuadros de dos o tres variables Se puede hacer una tabulación cruzada para mostrar dos variables a la vez, como en el cuadro 4.2 que muestra sexo y edad; éste cuadro se denomina cuadro de contingencia. El cuadro 4.3 muestra un ejemplo común de una cuadro de contingencia, que se denomina un cuadro de dos-por-dos porque cada una de las dos variables tiene dos categorías. En epidemiología se usan con frecuencia los cuadros de contingencia para mostrar los datos usados en el cálculo de medidas de asociación y pruebas de significaciónestadística. Cuadro 4.2 Casos nuevos de sífilis primaria y secundaria por edad y género, Estados Unidos, 1989 Grupo etario Número de casos por sexo (años) Masculino Femenino Total ≤ 14 15-19 20-24 25-29 30-34 35-44 45-54 ≥55 Total 40 1,710 5,120 5,304 5,537 5,004 2,144 1,147 26,006 190 2,668 5,285 4,306 3,111 1,897 487 131 18,075 230 4,378 10,405 9,610 8,648 6,901 2,631 1,278 44,081 Fuente: 12 Además, los epidemiólogos usan los cuadros de dos por dos en estudios de asociación entre la exposición y la enfermedad. Tales estudios comparan las personas con y sin exposición y las personas con y sin la enfermedad. Una cuadro de dos por dos es una manera conveniente de organizar los datos de estos tipos de estudios. El cuadro 4.4 muestra la forma general de éste tipo de cuadros. Como se demuestra ahí, el estatus de enfermedad (por ej: enfermo vs. sano) es el encabezado de las dos columnas y las dos filas se etiquetan con el estatus de exposición (expuesto o no). Las letras "a", "b", "c" y "d" dentro de las casillas se refieren al número de personas con la enfermedad indicada en las columnas y la exposición indicada en las filas. Por ejemplo, "c" es el número de personas en el estudio que tienen la enfermedad, pero que no tuvieron la exposición. "H" en las totales de las filas (H1 y H2) es la abreviatura para "horizontal"; "V" en
  • 7. 218 los totales de las columnas (V1 y V2) es la abreviación por "vertical". El número total de las personas es representado por "T". Cuadro 4.3 Estatus al seguimiento de un grupo de varones blancos con y sin diabetes, Estudio de seguimiento de la Encuesta de Salud por Examen, 1982-1984 Defunciones Vivos Total % Fallecidos Diabéticos 100 89 189 52.9 No diabéticos 811 2,340 3,151 25.7 Total 911 2,429 3,340 Fuente: 18 Cuadro 4.4 Forma general para un cuadro de dos por dos Enfermo Sanos Total Expuesto a b H1 No expuesto c d H2 Total V1 V2 T Cuando se muestran los datos, es preferible usar un cuadro de una sola variable o de dos variables. A veces, se quiere incluir una tercera variable para mostrar los datos en una forma más completa; el cuadro 4.5 muestra una cuadro de tres variables (raza/etnia, género y edad). Como se puede ver, una cuadro de tres variables está bastante lleno; es bastante recargado; no debe usarse más de tres variables en una solo cuadro.
  • 8. 219 Cuadro 4.5 Morbilidqd por sífilis primaria y secundaria por edad, género y raza, Estados Unidos, 1989 Raza/Etnia Edad (años) Género Blanco Negro Otras Total ≤14 15-19 20-24 25-29 30-34 35-44 45-54 ≥55 Total de todas las edades Masculinos Femeninos Total Masculinos Femeninos Total Masculinos Femeninos Total Masculinos Femeninos Total Masculinos Femeninos Total Masculinos Femeninos Total Masculinos Femeninos Total Masculinos Femeninos Total Masculinos Femeninos Total 2 14 16 88 253 341 407 475 882 550 433 983 564 316 880 654 243 897 323 55 378 216 24 240 2,804 1,813 4,617 31 165 196 1,412 2,257 3,669 4,059 4,503 8,562 4,121 3,590 7,711 4,453 2,628 7,081 3,858 1,505 5,363 1,619 392 2,011 823 92 915 20,376 15,132 35,508 7 11 18 210 158 368 654 307 961 633 283 916 520 167 687 492 149 641 202 40 242 108 15 123 2,826 1,130 3,956 40 190 230 1,710 2,668 4,378 5,120 5,285 10,405 5,304 4,306 9,610 5,537 3,111 8,648 5,004 1,897 6,901 2,144 487 2,631 1,147 131 1,278 26,006 18,075 44,081 Fuente: 12
  • 9. 220 Ejercicio 4.1 Los datos del cuadro 4.6 describen las características de 36 residentes de unn un ancianato durante un brote de una enfermedad diarreica. A. Construya un cuadro de enfermedad (diarrea) por tipo de menú ingerido. Utilice el estatus de diarrea como rótulo de las columnas y los tipos de menú como rótulos de las filas. B. Construya una cuadro 2 x 2 de la emfermedad (diarrea) por exposición al menú A. Las respuestas, en la página 281.
  • 10. 221 Cuadro 4.6 Características de los residents del ancianato A durante un brote de enfermedad diarreica, Enero 1989 Número residente Edad Género Habitación Menú ¿Tuvo diarrea? Fecha de inicio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 71 72 74 86 83 68 69 64 66 68 70 86 73 82 72 70 77 80 71 68 64 73 75 78 72 66 69 75 71 83 84 79 72 77 78 80 F F F F F F F F M M M M M M M M M M F F F F F F F M M M M M M M M M M M 103 105 105 107 107 109 109 111 111 104 106 110 112 219 221 221 227 227 231 231 233 235 235 222 222 224 226 228 230 232 232 234 234 236 236 238 A A A B B A C A A A A B C C B D D A D A A B C A B A E A F D A D A B D Si Si No No No Si No Si Si Si No No No No No No No No Si Si No Si No No No No Si No SI No No Si Si SI No No 15/1 23/1 18/1 16/1 18/1 20/1 14/1 15/1 13/1 16/1 13/1 12/1 14/1 13/1
  • 11. 222 Cuadro de otras medidas estadísticas Las cuadros 4.1 a 4.3 muestran números de casos (frecuencias). Además de mostrar el número de casos, las celdas de una cuadro pueden mostrar promedios, tasas, años de vida potencial perdidos, riesgos relativos y otras medidas estadísticas. Como en cualquier otra cuadro, hay que identificar claramente el título y los encabezamientos de los datos. Por ejemplo, tanto el título como los encabezamientos en la cuadro 4.7 muestran que se están presentando tasas. Cuadro 4.7 Casos nuevos notificados de sífilis primaria y secundaria por cien mil habitantes, tasas específicas por edad y raza, Estados Unidos, 1989 ?. Grupo etario Tasas por cien mil (Años) Blancos Negros Otros Total =14 15-19 20-24 25-29 30-34 35-44 45-54 =55 Total 0.0 2.4 5.8 5.4 4.7 2.9 1.7 0.5 2.2 2.4 131.5 323.0 270.9 256.6 135.0 76.7 19.4 115.8 0.8 51.0 139.2 117.9 83.2 47.8 29.6 10.4 45.8 0.4 24.3 55.9 44.1 38.8 19.0 10.5 2.4 17.7 Fuente:12 Cuadros de salida Aunque no se puede analizar los datos antes de recolectarlos, hay que diseñar los métodos de análisis que se van a emplear con anticipación para facilitar el análisis cuando ya se hayan recolectado. De hecho, la mayoría de los protocolos, escritos antes de empezar el estudio, requieren una descripción de como se van a analizar los datos. Como parte del plan de análisis, se puede desarrollar una "cuadro de salida" para mostrar como se van a organizar y presentar los datos. Una cuadro en blanco es una cuadro completa, con títulos, encabezamientos y categorías, pero sin datos; cuando se desarrolla una cuadro de salida conteniendo variables contínuas, como edad, hay que crear más categorías de las que usualmente se requieren, para poder visualizar cualquier comportamiento o patrón de los datos que sean de interés.
  • 12. 223 Cuadro de salida 1 Características clínicas del síndrome de Kawasaki con fechas de inicio entre octubre y diciembre de 1984 Características clínicas # con característica Porcentaje 1. Fiebre = 5 días 2. Congestión conjuntival bilateral 3. Cambios orales • Labios congestionados • Faringe congestionada • Labios secos y con fisuras • Lengua en fresa 4. Cambios en extremidades periféricas edema eritema 5. Rash 6. Linfadenopatía cervical <1.5 cm Total _____ _____ _____ _____ _____ _____ _____ _____ _____ _____ _____ _____ ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( 100 ) Cuadro de salida 2 Característícas demográficas de los casos del síndrome de Kawasaki con fechas de inicio entre Octubre y Diciembre de?1984 ?. Característícas demográficas Número Porcentaje Edad < 1año 1 año 2 año 3 años 4 años 5 años 6 años Género Masculino Femenino Raza Blanca Negra Asiática Otra Total _____ _____ _____ _____ _____ _____ _____ _____ _____ _____ _____ _____ _____ _____ ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( 100 ) De la misma forma, se pudiera diseñar el cuadro de salida 2 como una cuadro de tres variables con el número de casos por edad, sexo y raza.
  • 13. 224 Figura 4.1 Ilustración de cuadros de salida diseñados antes de conducir un estudio de casos y controles del síndrome de Kawasaki Cuadro de salida 3 Cuadro de salida 7 Municipio de residencia Número % Casos Controles ______ ( ) Característíca demográfica Número % Número % ______ ( ) Edad <1 año ______ ( ) ______ ( ) 1 año ______ ( ) ______ ( ) Cuadro de salida 4 2 años ______ ( ) ______ ( ) Ingreso del Hogar $ Número % 3 años ______ ( ) ______ ( ) =10,000 ______ ( ) 4 años ______ ( ) ______ ( ) 10,001-15,000 ______ ( ) 5 años ______ ( ) ______ ( ) 15,001-20,000 ______ ( ) =6 añ6s ______ ( ) ______ ( ) 20,001-30,000 ______ ( ) Género 30,001-35,000 ______ ( ) Masculino ______ ( ) ______ ( ) =35,000 ______ ( ) Femenino ______ ( ) ______ ( ) Raza Cuadro de salida 5 Blanca ______ ( ) ______ ( ) Número de días de hospitalización Número % Negra ______ ( ) ______ ( ) 0 ______ ( ) Asiática ______ ( ) ______ ( ) 1 ______ ( ) Otra ______ ( ) ______ ( ) 2 ______ ( ) Total ______ 100 ______ 100 3 ______ ( ) 4 ______ ( ) Cuadro de salida 8 5+ ______ ( ) Casos Controles Media= _________ Mediana=_________ Ingreso del Hogar $ Número % Número % Cuadro de salida 6 =10,000 ______ ( ) ______ ( ) Complicaciones graves Número % 10,001-15,000 ______ ( ) ______ ( ) Cardíaca ______ ( ) 15,001-20,000 ______ ( ) ______ ( ) Artritis ______ ( ) 20,001-30,000 ______ ( ) ______ ( ) Defunción ______ ( ) 30,001-35,000 ______ ( ) ______ ( ) Total ______ 100 =35,000 ______ ( ) ______ ( ) Cuadro 3: La distribución de frecuencia por municipio de residencia Cuadro 4: La distribución de frecuencia por los ingresos del hogar. Cuadro 5: Dias de hospitalización (0 a máximo), media aritmética y mediana. Cuadro 6: La distribución de frecuencia de las complicaciones graves (complicaciones cardiacas, artriticas, muerte). Cuadro 7: Las características demográficas (como la cuadro 2), con una comparación entre casos y controles. Cuadro 8. La distribución de frecuencia por los ingresos del hogar entre casos y controles
  • 14. 225 Cuadro de salida 9 Características epidemiológicas de los casos de síndrme de Kawasaki y sus controles con fecha de inicio de Octubre a Diciembre de 1984 Características epidemiológicas Casos Controles Número Porcentaje Número Porcentaje Antecedentes de enfermedad ??Si No ____ ____ ( ) ( ) ____ ____ ( ) ( ) Razón de desigualdades (OR)=___._ Intervalo de Confianza del 95% = ( , ) χ2 = __.__, valor de P= 0.____ Exposición a shampoo de alfombras Si No ____ ____ ( ) ( ) ____ ____ ( ) ( ) Razón de desigualdades (OR)=___._ Intervalo de Confianza del 95% = ( , ) χ2 = __.__, valor de P= 0.______ Esta secuencia de cuadros de salida provee un abordaje lógico y sistemático para el análisis; por supuesto, una vez recogidos los datos y que los números han sido tabulados en estos cuadros, se pensará en nuevos análisis a realizar.
  • 15. 226 Creacion de categorías Algunas variables, tales como "género" o "¿comió ensalada de papas?" tienen un número limitado de respuestas posibles; tales respuestas proveen categorías útiles para incluir en un cuadro. Cuando se estudian variables con un rango de respuestas posibles más amplio, tales como "tiempo" o "presión arterial sistólica", hay que agrupar los datos en un número de categorías más manejable (intervalos de clase); para crear éstas categorías, hay que tener en cuenta lo siguiente: • Elabore intervalos de clase mutuamente excluyentes que incluyan todos los datos. Por ejemplo, si el primer intervalo es 0-5, hay que empezar el siguiente intervalo con 6, no con 5. También hay que considerar los limites verdaderos de las nuevas categorías. El límite superior de 0-5 es 5.4999...para la mayoría de las categorías, pero es 5.9999 para la edad. Los límites verdaderos fueron discutidos en la unidad 3. • Use un número relativamente grande de categorías creadas con intervalos de clase estrechis para el análisis inicial. Es mejor combinar tales categorías posteriormente; en general es ideal empezar con 4-8 categorías. • Use categorías con significación biológica o natural siempre que se pueda. Trate de usar grupos de edad estandarizados o de uso común para el campo de estudio específico. Si va a calcular tasas, el numerador debe coincidir con las categorías de los datos de la población que va a usar. • Cree una categoría de "desconocido" o de "otros". Por ejemplo, en los agrupamientos de edades mostrados en el cuadro 4.8, las categorías que se han creado para ello son "edad no declarada", "desconocido", y "no declarada".
  • 16. 227 Cuadro 4.8 Algunas agrupaciones etarias estándares empleadas en el CDC Enfermedades de notificación obligatoria Mortalidad por neumonía e influenza Tabulaciones finales de estadísticas de mortalidad VIH/SIDA <1 año 1-4 5-9 10-14 15-19 20-24 25-29 30-39 40-49 50-59 60 + Edad no declarada Total <28 días 28 días -<1 año 1-14 15-24 25-44 45-64 65-74 75-84 85+ Desconocida Total <1 año 1-4 5-14 15-24 25-34 35-44 45-54 55-64 65-74 75-84 85+ No declarada Total <5 años 5-12 13-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 ?65+ ?Total Fuente: 3, 4, 21 Si hay un grupo de base natural, se debe m antener como una categoría aparte, aún cuando el resto de la distribución no tenga distinciones naturales; por ejemplo, cuando se crean categorías para "fumadores" en términos de "número de cigarrillos fumados en un día", hay que dejar los no fumadores (0 cigarrillos/día) como una categoría aparte y agrupar los fumadores según cualquier método arbitrario, como se describe más adelante. Si no existen intervalos de clase naturales o estándar, hay varias estrategias para crearlos, como se describe a continuación. Estrategia 1: Dividir los datos en grupos de tamaño similar. Con este sistema, se busca crear un número manejable de intervalos de clase, con más o menos el mismo número de observaciones en cada uno. Al principio se pueden usar 8 intervalos, y después reducirlos a 4 para la presentación de los datos a otras personas. En efecto, los 4 intervalos así creados representan los cuartiles de la distribución de los datos. Este método es especialmente adecuado para crear las categorías de los mapas de áreas. Para aplicar esta estrategia, hay que dividir el número total de observaciones entre el número de intervalos que se quiera crear; luego hay que desarrollar una columna de frecuencias acumuladas de la distribución de los datos ordenados por orden numérico para encontrar dónde se deben ubicar los límites de cada intervalo.
  • 17. 228 Estrategia 2: basar los intervalos en el promedio y la desviación estándar. Con esta estrategia, se pueden crear 3, 4 o 6 intervalos de clase, para lo cual es necesario encontrar la media y la desviación estándar de la distribución; luego, se usa el promedio más o menos los múltiplos correspondientes de la desviación estándar para establecer los límites de los intervalos. Límite superior del intervalo 1 = la media - 2 desviaciones típicas Límite superior del intervalo 2 = la media - 1 desviación típica Límite superior del intervalo 3 = la media Límite superior del intervalo 4 = la media + 1 desviación típica Límite superior del intervalo 5 = la media + 2 desviaciones típica Límite superior del intervalo 6 =valor máximo Por ejemplo, si se quieren establecer 6 intervalos para unos datos con una media de 50, una desviación estándar de 10, un valor mínimo de 19 y un valor máximo de 82, se calcularán los límites superiores de cada intervalo de la siguiente forma: Límite superior del intervalo 1 = 50 - 20 = 30 Límite superior del intervalo 2 = 50 - 10 = 40 Límite superior del intervalo 3 = 50 Límite superior del intervalo 4 = 50 + 10 = 60 Límite superior del intervalo 5 = 50 + 20 = 70 Límite superior del intervalo 6 = 82 Si se añade el límite inferior obvio para cada intervalo, éstos serán: intervalo 1 = 19 - 30 intervalo 2 = 31 - 40 intervalo 3 = 41 - 50 intervalo 4 = 51 - 60 intervalo 5 = 61 - 70 intervalo 6 = 71 - 82 Para crear 3 o 4 intervalos, se pueden combinar algunos de los límites de los adyacentes: Seis categorías Cuatro categorías Tres categorías
  • 18. 229 Seis Intervalos Cuatro Intervalos Tres intervalos Intervalo 1 = 19-30 Intervalo 2 = 31-40 Intervalo 3 = 41-50 Intervalo 4 = 51-60 Intervalo 5 = 61-70 Intervalo 6 = 71-82 Intervalo 1 = 19-40 Intervalo 2 = 41-50 Intervalo 3 = 51-60 Intervalo 4 = 61-82 Intervalo 1 = 19-40 Intervalo 2 = 41-60 Intervalo 3 = 61-82 Estrategia 3: dividir el rango entre intervalos de clase iguales Este es el método más sencillo y común, especialmente apropiado para utilizar en gráficas. Para desarrollarlo es necesario: 1. Encontrar el rango de valores de los datos, i.e. encontrar la diferencia entre el valor máximo (o algún valor conveniente un poco más grande) y cero (o el valor mínimo). 2. Decidir cuántos intervalos de clase (grupos o categorías) se harán. En general, para cuadros se usan de 4 a 8 intervalos de clase y para gráficas y mapas se usan de 3 a 6; los intervalos dependen de las características de los datos que se quiere visualizar. 3. Dividir el rango por el número de intervalos de clase que se decidió usar para encontrar el tamaño de los intervalos. 4. Empezar con el valor mínimo del límite inferior del primer intervalo y especificar los intervalos de clase de cualquier tamaño que se ha calculado hasta que se llegue al valor máximo.
  • 19. 230 Cuadro 4.9 Tasas medias anuales de mortalidad por cáncer cervico uterino por 100,000 habitantes por estados, ordenadas por rango, Estados Unidos, 1984-1986 Rango Estado Tasa por 100,000 Rango Estado Tasa por 100,000 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 SC WV AL LA AK TN ND KY MS NC GA ME VR DE NH IN OK IL MT VA OH MO TX NY NJ 5.6 5.6 5.4 5.4 5.1 4.9 4.9 4.8 4.7 4.6 4.6 4.6 4.3 4.3 4.3 4.1 4.1 4.0 4.0 3.9 3.8 3.8 3.7 3.7 3.7 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 Total KS AR MD IA PA FL HI OR ML CA ID AZ MA NM WA NV CT RI WI CO NE SD MN WY UT U.S. 3.6 3.6 3.5 3.4 3.4 3.4 3.4 3.3 3.3 3.2 3.1 3.1 2.9 2.9 2.8 2.8 2.8 2.8 2.7 2.5 2.4 2.4 2.2 1.9 1.8 3.7 Fuente: 2 Ejemplo En este ejemplo, se demostrará cada estrategía para la creación de intervalos, usando los datos de las tasas de mortalidad por cáncer de cérvix del útero del cuadro 4,9. En cada caso, se crearán 4 intervalos de clase de las tasas.
  • 20. 231 Estrategia 1: Dividir los datos en grupos de similar tamaño (Nota: Si el Cuadro 4.9 ha sido ordenado alfabéticamente, el primer paso sería ordenarlo por rango de tasas. Afortunadamente, ésto ya se ha hecho.) 1. Dividir la lista en cuatro grupos iguales de lugares: 50 estados/4 = 12.5 estados por grupo. Como no podemos cortar un estado en dos, tendremos que usar dos grupos de 12 estados y dos grupos de 13 estados. Como Vermont (#13) podría ir tanto en el primero como en el segundo grupo y Massachusetts (#38) podría ir tanto en el tercero como en el cuarto grupo, crearemos los siguientes grupos: a. Desde Carolina del Sur hasta Maine (del 1 al 12) b. Desde Vermont hasta Nueva Jersey (del 13 al 25) c. Desde Kansas hasta Arizona (del 26 al 37) d. Desde Massachusetts hasta Utah (del 38 al 50) Note que este orden sitúa a Vermont junto a Delaware (ambos tienen tasas de 4.3), y a Massachusetts con Nuevo México (ambos con tasas de 1.8). 2. Identificar la tasa para el premero y el último estado de cada grupo: Estados Tasas por 100,000 a. ME-SC b. NJ-VT c. AZ-KS d. UT-MA 4.6-5.6 3.7-4.3 3.1-3.6 1.8-2.9 3. Ajustar los límites de cada intervalo de forma que no queden huecos entre el final de uno y el comienzo del siguiente (Compare los intervalos de arriba con los de abajo): Estados Tasas por 100,000 Número de estados a. ME-SC b. NJ-VR c. AZ-KS d. UT-MA 4.5-5.6 3.7-4.4 3.0-3.6 1.8-2.9 12 13 12 13
  • 21. 232 Estrategia 2: Basar los intervalos en la media y la desviación estándar 1. Calcular la media y la desviación estándar (en la Unidad 3 se describe cómo calcular estas medidas.): Media = 3.70 Desviación típica = 0.96 2. Encontrar los límites superiores de 4 intervalos (Nota: demostramos cómo crear 4 intervalos estableciendo primero 6 y luego combinando el par más bajo y el más alto. Aquí, no obstante, simplemente usaremos el límite superior apropiado de los pares que serán combinados.) Límite superior del intervalo 1: media - 1 desv. típica = 2.74 Límite superior del intervalo 2: media = 3.70 Límite superior del intervalo 3: media + 1 desv. típica = 4.66 Límite superior del intervalo 4: valor máximo = 5.6 3. Seleccionar el límite inferior para cada límite superior para definir los cuatro intervalos completos. Especificar los estados que caen en cada intervalo de clase (Nota: Para situar los estados con las tasas mayores primero hemos invertido el orden de los intervalos de clase): Estados Tasas por 100,000 Número de estados a. MS-SC b. MO-NC c. RI-TX d. UT-WI 4.67-5.60 3.71-4.66 2.75-3.70 1.80-2.74 9 13 21 7 Estrategia 3: Dividir el rango en cuatro intervalos de clase iguales 1. Dividir el rango desde cero (o el valor mínimo) hasta el máximo, entre cuatro: (5.6 – 1.8)/ 4 = 0.95 2. Usar múltiplos de 0.95 para crear cuatro categorías, comenzando a partir de 1,8: de 1.80 a (1.8 + 0.95) = de 1.8 a 2.75 de 2.76 a (1.8 + 2•0.95) = de 2.76 a 3.70 de 3.71 a (1.8 + 3•0.95) = de 3.71 a 4.65
  • 22. 233 de 4.66 a (1.8 + 4•0.95) = de 4.66 a 5.6 3. Categorías finales: Estados Tasas por 100,000 Número de estados a. MS-SC b. MO-NC c. RI-TX d. UT-WI 4.66-5.60 3.71-4.65 2.76-3.70 1.80-2.75 9 13 21 7 4. Alternativamente, como 0.95 está muy cerca de 1.0, podrían ser usados múltiplos de 1 para crear las cuatro categorías. Comenzando por el valor central (5.6 + 1.8)/ 2 = 3.7, sustraer 1.0 para determinar el límite superior del primer intervalo (2.7). Los límites superiores de los intervalos tercero y cuarto serán 3.7 + 1.0 = 4.7, y 3.7 + 2•1.0 = 5.7. Categorías finales: Estados Tasas por 100,000 Número de estados a. KY-SC c. RI-TX b. MO-MS d. UT-WI 4.71-5.70 3.71-4.70 2.71-3.70 1.71-2.70 8 14 21 7 Ejercicio 4.2 Con los datos de mortalidad por cáncer cervico uterino presentado en el cuadro 4.9 utilice cada estrategia para crear tres intervalos de clase de las tasas. Respuestas en la página 281
  • 23. 234 Cuadro 4.9 (Revisitado) Tasas medias anuales de mortalidad por cáncer cervico uterino por 100,000 habitantes por estados, ordenadas por rango, Estados Unidos, 1984-1986 Rango Estado Tasa por 100,000 Rango Estado Tasa por 100,000 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 SC WV AL LA AK TN ND KY MS NC GA ME VR DE NH IN OK IL MT VA OH MO TX NY NJ 5.6 5.6 5.4 5.4 5.1 4.9 4.9 4.8 4.7 4.6 4.6 4.6 4.3 4.3 4.3 4.1 4.1 4.0 4.0 3.9 3.8 3.8 3.7 3.7 3.7 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 ?? ??? KS AR MD IA PA FL HI OR ML CA ID AZ MA NM WA NV CT RI WI CO NE SD MN WY UT U.S. 3.6 3.6 3.5 3.4 3.4 3.4 3.4 3.3 3.3 3.2 3.1 3.1 2.9 2.9 2.8 2.8 2.8 2.8 2.7 2.5 2.4 2.4 2.2 1.9 1.8 3.7 Fuente: 2
  • 24. 235 Gráficas Una gráfica es una forma de mostrar los datos visualmente, usando un sistema de coordenadas. Es un tipo de fotografía estadística que ayuda a mostrar los patrones, las aberraciones, las similitudes y las diferencias en los datos; es una forma ideal para la presentación de los datos. El público recordará más de los aspectos importantes de los datos cuando se presentan en una gráfica en vez de en una cuadro. En epidemiología es habitual usar una gráfica de coordenadas en ángulo recto que constan de dos ejes lineales, uno horizontal y uno vertical; denominadas el eje horizontal o eje X o abscisas, y el eje vertical o eje Y, u ordenadas. En general, se usa el eje horizontal para mostrar los valores de la variable independiente (X), que es el método de clasificación, como tiempo, por ejemplo, y el eje vertical para mostrar la variable dependiente (Y), que normalmente es una medida de frecuencia, como el número de casos o la tasa de una enfermedad. Se encabeza cada eje para mostrar lo que se representa (tanto el nombre de la variable como sus unidades) y se pone la escala de medida a lo largo de la línea. El cuadro 4.10 muestra el número de casos de sarampión por año de notificación desde 1950 a 1989. Hemos utilizado una porción de los datos para crear la figura 4.2. La variable independiente años se muestra en el eje horizontal. La variable dependiente, el número de casos, se muestra en el eje vertical. Se muestra un cuadriculado en la figura 4.2 para ilustrar como los datos se grafican. Por ejemplo, para el punto de los casos en 1953 en la gráfica desde la intersección con el nivel de 449 hacia la derecha, y así utilice la figura para unir los puntos desde 1955 hasta 1959. Gráficas lineales en escala aritmética Una gráfica lineal en escala aritmética muestra los patrones o tendencias de una variable, generalmente el tiempo. Normalmente en epidemiología se usa este tipo de gráfica para mostrar una serie larga de datos y para comparar varias series. Es el método ideal para elaborar una curva en el tiempo. En una gráfica lineal en escala aritmética, una distancia fija a lo largo de un eje representa la misma cantidad en cualquier parte del eje; esto es cierto tanto en el eje de las X como en el eje de las Y. Se pueden mostrar varias series de datos en la misma gráfica lineal de escala aritmética. La escala que se usa en el eje de las X depende de las categorías usadas para las variables independientes en la recogida de los datos. En general, cuando se inscriben los datos de "tiempo" se usan los mismos intervalos que han sido usados en la recogida de la información, (p. ej.: semanas, años, etc.).
  • 25. 236 Cuadro 4.10 Sarampión por año de notificación, Estados Unidos, 1950-89. Año Casos notificados (x100,000) Año Casos notificados (x100,000) 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 319 530 683 449 683 555 612 487 763 406 442 424 482 385 458 262 204 63 22 26 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 47 75 32 27 22 24 41 57 27 14 13 3 2 1 3 3 6 4 3 18 Fuente: 12 Figura 4.2 Gráfica parcial de sarampión por año de notificación, Estados Unidos, 1950-1959 Fuente: 12 Eje Y Frecuencias (Tasas, casos, razones, proporciones) Intervalos Iguales
  • 26. 237 Figura 4.3 Ejemplo de gráfica en escala artimética: Sarampión por año de notificación, Estados Unidos, 1950-1989 Fuente: 12 Figura 4.4 Ejemplo de gráfica en escala artimética: Rabia, en animales silvestres y domésticos por año de notificación, Estados Unidos, 1955-89 Fuente: 12 Casos por cien mil habs. Licencia de la Vacuna Doméstica Silvestre Casos
  • 27. 238 Sin embargo, si se han usado intervalos muy pequeños en la recogida de los datos, se puede reducir el número y aumentar el tamaño de ellos para mostrar los datos en forma de gráfica. Para seleccionar una escala para el eje Y, es necesario: • Construir el eje Y más corto que el eje X, para que la gráfica quede horizontal (es decir, la longitud horizontal debe ser mayor que la longitud vertical) y mantener una buena proporción entre los dos ejes: en general se recomienda una relación X:Y de 5:3. • Empezar el eje Y siempre con 0. • Identificar el rango de valores que desea mostrar en el eje de las Y, para lo cual encuentre el valor mayor de la variable Y y redondéelo al número inmediato mayor. Por ejemplo, el valor mayo de la figura 4.3 es 763,094 en 1958. Este valor se puede redondear a 1,000,000 para determinar el rango de valores a mostrar en el eje de las Y. • Seleccionar un tamaño de intervalo que nos de suficientes interva • los para mostrar los datos con el detalle que se requiere. En la figura 4.3 los intervalos de 100,000 cada uno se considera adecuado para mostrar los detalles importantes de los datos. • Si el rango de valorespara mostrar el eje de las Y incluye un período o fracción sin datos, se debe anotar una interrupción en el eje correspondiente. Con una interrupción en el eje de las Y la línea se interrumpe también endonde la interrupción empieza y se reanuda donde los datos continúan. Las interrupciones de los ejes solo se pueden usar con gráficas de escala lineal.
  • 28. 239 Ejercicio 4.3 En ambas gráficas, asegúrese de usar los intervalos adecuados para el rango de los datos en el eje de las Y. A. Construya una gráfica lineal en escala aritmética con los datos del sarampión de la cuadro 4.11, mostrando la tasa de 1955-1990 con una sola línea. b. Construya una gráfica lineal en escala aritmética con los datos del sarampión de 1980-1990 Cuadro 4.11 Tasas de sarampión por 100,000 habitantes por año de notificación, Estados Unidos, 1955-90. Año Tasa Año Tasa Año Tasa 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 336.3 364.1 283.4 438.2 229.3 246.3 231.6 259.0 204.2 239.4 135.1 104.2 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 31.7 11.1 12.8 23.2 36.5 15.5 12.7 10.5 11.4 19.2 26.5 12.3 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 6.2 6.0 1.4 0.7 0.6 1.1 1.2 2.6 1.5 1.4 7.3 10.7 Fuente: 12 Respuestas en la página 284.
  • 29. 240 Gráficas lineales en escala semilogarítmica. En una gráfica lineal en escala semilogarítmica (una "gráfica semilog"), las divisiones del eje Y siguen un patrón logarítmico en vez de aritmético como en las gráficas lineales en escala aritmética. El eje X sigue teniendo una escala aritmética, como las gráficas lineales de escala aritmética. La figura 4.5 muestran un ejemplo de una gráfica semilogarítmica. FÍjese que el eje Y tiene las siguientes características: • Hay cinco ciclos, de distancias iguales, a lo largo del eje. • Cada ciclo representa valores diez veces más grandes que el ciclo inmediatamente anterior. Así, la distancia entre 1 y 10 es la misma que la distancia entre 10 y 100. • Dentro de un ciclo hay diez marcas, siendo el espacio entre cada dos marcas cada vez más pequeño al ir subiendo en la escala. Así, la distancia entre 1 y 2 no es la misma que la distancia entre 2 y 3 • El eje cubre un rango de valores de Y que hubiese sido difícil o imposible mostrarlo en una escala aritmética. Las gráficas semilog son útiles cuando se quiere mostrar un rango muy amplio de valores en una sola gráfica. Figura 4.4 Ejemplo de gráfica semilogarítmica:Casos notificados de poliomielitis paralítica de 100,000 por año de ocurrencia, Estados Unidos, 1951-1989 Fuente:12 C A S O S P O R C I E N M I Coordenadas escogidas para facilitar la lectura
  • 30. 241 Con una escala logarítmica, cierta distancia en el eje de las Y representa un porcentaje igual de cambio, no una cantidad igual de cambio como en una escala aritmética. Por eso, una gráfica semilog es especialmente útil para mostrar tasas de cambio. Para interpretar los datos en una gráfica semilog, hay que entender las siguientes características de la gráfica: • Una línea recta inclinada indica una tasa (no cantidad) constante de aumento o disminución de los valores. • Una línea horizontal indica que no hay cambio. • La cantidad de inclinación indica la tasa de aumento o disminución. • Dos o más líneas paralelas muestran tasas de cambio iguales. Cuando se construye una gráfica semilog, se usa el número de ciclos necesarios para mostrar los valores máximos y mínimos de la variable Y. Se puede adquirir papel gráfico semilogarítmico que en general incluye por lo menos tres ciclos. Para hallar el número de ciclos que se necesita, es preciso: 1. Identificar en qué rango de múltiplos de 10 se encuentra el valor mínimo de Y. Así se establece el rango del primer ciclo. Por ejemplo, si el valor mínimo de Y es entre 10 y 100, el primer ciclo comenzará con 10 y terminará con 100; si está entre 100 y 1000, el primer ciclo comenzará con 100 y terminará con 1000. 2. Identificar en qué rango de múltiplos de diez se encuentra el valor máximo de Y. Así se establece el rango del último ciclo. Por ejemplo, si el valor máximo de Y es entre 100.000 y 200.000, el último ciclo empezará con 100.000. Aunque un ciclo completo que comienza con 100.000 debe terminar con 1.000.000, no es necesario mostrar todo el ciclo; es suficiente con mostrar algunos marcadores del último ciclo: 100.000, 200.000 y 300.000. 3. Identificar cuántos ciclos se encuentran entre el primero y el último ciclo; se necesitará este número de ciclos, más dos para incluir el primero y el último ciclo. Por ejemplo, si el valor mínimo de Y está entre 10 y 100 y el valor máximo de Y está entre 100.000 y 200.000, se necesitarán los siguientes ciclos: 10 - 100 100 - 1.000 1.000 - 10.000 10.000 - 100.000 100.000 - 1.000.000 Así, con valores de Y entre 10 y 200.000, se necesitarán 4 ciclos y parte de un quinto.
  • 31. 242 Figura 4.6 Valores posibles pueden ser asignados a valores del eje de las Y en una gráfica en escala-semilogarítmica La figura 4.6 muestra los rangos de los valores que se deben mostrar en el eje de las Y de 4 ciclos de una gráfica semi-log. El tipo de gráfica que se usa depende principalmente de si se quiere mostrar los cambios en sí de una serie de valores o si se quiere más bien enfatizar las tasas de cambio. Para mostrar los cambios en una serie de datos se usa una escala aritmética en el eje de las Y (una gráfica lineal de escala aritmética). Para mostrar las tasas de cambio se usa una escala logarítmica en el eje de las Y (una gráfica lineal de escala logarítmica). Sin embargo, se puede decidir usar una gráfica semilog cuando el rango de valores en el eje de las Y es demasiado grande aún para mostrar cambios en la serie de datos. Valores Posibles C U A T R O C I C L O S Máximo Mínimo Año
  • 32. 243 Ejercicio 4.4 Grafique los datos de sarampión en el cuadro 4.11, de la página 239, en escala semilogarítmica. Respuestaas en la página 285.
  • 33. 244 Histogramas. Un histograma es la gráfica de la distribución de frecuencia de una variable contínua, en la cual se usan columnas adyacentes para representar el número de observaciones para cada intervalo de clase en la distribución. El área de cada columna es proporcional al número de observaciones en éste intervalo. Las figuras 4.7, 4.8 y 4.9 muestran los histogramas de unas distribuciones de frecuencia con intervalos de clase iguales. Dado que el tamaño de todos los intervalos de clase es igual, la altura de la columna es proporcional al número de observaciones. No se recomienda usar histogramas con intervalos de clase de tamaños diferentes, porque son difíciles de construir e interpretar con seguridad. Tampoco se debe interrumpir la escala en el ejeY, porque éste distorsionaría la presentación de las frecuencias relativas. Figura 4.7 Ejemplo de un histograma: Casos notificados de poliomielitis paralítica por mes de ocurrencia, Omán, Enero 1988 a Marzo 1989 Fuente: 24 C a s o s Areas en cada cuadrado son idénticas 1 caso Campañas de vacunación oral contra la polio No hay espacios entre columnas No es esencial mostrar las líneas horizontales entre los casos Ene Mar May Jul Sep Nov Ene Mar 1988 1989
  • 34. 245 Figura 4.8 Ejemplo de histograma: Niveles de colesterol entre 4,462 individuos del Estudio de Salud de Varones, Estados Unidos, 1985-1986 Fuente: 13 La variable mostrada con mas frecuencia en el eje de las X es el tiempo, como se muestra en las figuras 4.7 y 4.8. Sin embargo, se pueden usar otras variables contínuas, como el colesterol o la presión arterial en el eje de las X. La figura 4.8 muestra la frecuencia de las observaciones por intervalos de clase del nivel de colesterol. Se puede mostrar una segunda variable en un histograma sombreando la segunda variable con un color diferente dentro de la misma columna. Por ejemplo, se puede mostrar el número de casos de una enfermedad por el tamaño de cada columna, y la consecuencia de la enfermedad (fatal o no fatal) con diferentes colores. Sin embargo, cuando se muestra los datos en ésta forma es difícil comparar el componente de arriba de una columna con otra porque no tiene una base plana. Una alternativa es crear un histograma separado por cada componente de la segunda variable, como en la figura 4.9. Compare las figuras 4.9 y 4.10: muestran los mismos datos pero en formatos diferentes. ¿Cúal es el mejor formato para la comparación de los patrones de casos entre residentes y no residentes? N ú m e r o d e V a r o n e Nivel de Colesterol
  • 35. 246 Figura 4.9 Ejemplo de histograma: Número de casos notificados de hepatitis A por fecha de inicio y residencia en el municipio de Ogemaw, Abril-Mayo, 1968 Fuente: 22 Figura 4.10 Ejemplo de histograma: Número de casos notificados de hepatitis A por fecha de inicio y residencia en el municipio de Ogemaw, Abril-Mayo, 1968 Fuente: 22 C a s o s Residente Ogemaw Residente municipio vecino Residente otros municipio Caso Residente Ogemaw Residen fuera de Ogemaw Residente municipio vecino Residente otros municipio Abril Mayo C a s o s C a s o s
  • 36. 247 A veces se puede incluir una clave para mostrar cuantos valores de Y hay en un área de la columna. La clave consiste en un cuadro o rectángulo, tan ancho como la columna, con el número de casos representado por el área escrita al lado. Con frecuencia los epidemiólogos desarrollan y discuten "curvas epidémicas". Una curva epidémica no es una curva, sino un histograma que muestra los casos de una enfermedad durante un brote, por su fecha de inicio. Con frecuencia se dibujan las columnas como un cuadrados apilados en las columnas; en el que cada cuadro representa un caso. La figura 4.9 muestra que una persona tuvo su fecha de inicio de síntomas entre el 27 y 28 de abril, otra mas inicio entre el 29 y 30, y cinco casos adicionales iniciaron entre el 1º y 2 de Mayo. Mostramos la duración de la epidemia en el eje de las X en períodos de tiempo equivalentes. En una curva epidémica cada número de las etiquetas debe estar centrado entre las marcas de cada intervalo. Empleamos el intervalo de tiempo que sea adecuado al caso: por ejemplo, para un brote de gastroenteritis por C. perfringens sería de horas, y de 3-5 días para un brote de hepatitis A. Como regla general utilizamos intervalos menores a un cuarto del período de incubación de la enfermedad que se muestra en el histograma. Empezamos a graficar el eje de las X antes de que hubiese ocurrido el primer caso y mostramos cualquier caso de la misma enfermedad que hubiese ocurrido en el período pre-epidémico. Tales casos pueden representar lo mismo casos de fondo o sin relación alguna. ¡Tenga presente que pueden ser la fuente del brote!
  • 37. 248 Ejercicio 4.5 Utilice los datos de la epidemia en el asilo del ejercicio 4.1 para dibujar una curva epidémica. Describa las características de esta gráfica como si estuviera hablando por teléfono con alguien que no puede verla. Ver la respuesta, en la página 286.
  • 38. 249 Polígonos de frecuencia Un polígono de frecuencia, como un histograma, es una gráfica de distribución de frecuencias, en el cual se traza el número de observaciones contra los intervalos del eje de las X con puntos individuales en la mitad de los intervalos y luego se conectan los puntos con una línea recta. La figura 4.11 muestra un ejemplo de un polígono de frecuencia sobre la línea externa de un histograma de los mismos datos. De rutina no se debe mostrar los dos en una sola gráfica. Compare su construcción. Un polígono de frecuencia de una serie de datos debe incluir la misma área que un histograma con los mismos datos. Los polígonos de frecuencia ayudan a mostrar y comparar dos o más distribuciones en la misma serie de ejes. Fíjese que el histograma y la línea del polígono de frecuencia (cuando se mueve del punto central al punto central) crean una serie de pares de triángulos de tamaños iguales (uno dentro del histograma y el otro afuera), lo cual es un rasgoimportante de un polígono de frecuencias ya que un polígono de frecuencia de unos datos debe cubrir la misma área que un histograma de los mismos datos: para cada área que queda afuera del histograma, el polígono tiene que incluir otra área de tamaño igual adentro. Figura 4.11 Casos notificados de enfermedad semejante a influenza por inicio cio C a s o s Primer punto del dato conectado al punto medio del intervalo previo del eje de las X Ultimo punto del dato conectado al punto medio del intervalo siguiente del eje de las X Se conectan los punto medios de los intervalos para crear el polígono Histograma Polígono de frecuencia Semana de inicio de la enfermedad
  • 39. 250 Para mantener un área total igual, hay que fijarse bien en la manera de "cerrar" el histograma. La figura 4.12a muestra el método correcto la figura 4.12b el método incorrecto. Al hacerlo correctamente, la línea de frecuencia empieza antes del primer intervalo (en el centro de éste), afuera del histograma, y continúa con el centro del primer intervalo que contiene datos, creando un área A' dentro del polígono que tiene el mismo tamaño que el área A que está dentro del histograma pero fuera del polígono. Fíjese que en la figura 4.11, se cierra el lado derecho del polígono de la misma forma. Figura 4.12 Izquierda: Método correcto de cerrar un polígono Derecha: Método incorrecto de cerrar un polígono a. Correcto b. Incorrecto En contraste la figura 4.12b muestra el método incorrecto de cerrar el polígono. Se empieza la línea en la base del primer intervalo, dejando el área C fuera del polígono, sin compensarla con otra área dentro; como consecuencia, el área del polígono no es proporcional al número total de observaciones en la serie de datos. Con un polígono de frecuencia, es fácil mostrar una comparación de dos o más distribuciones en los mismos ejes. La figura 4.13 muestra una gráfica de una comparación de tres polígonos de frecuencia y con la curva normal. Un polígono de frecuencia difiere de una gráfica lineal de escala aritmética en varias cosas. Se usa un polígono de frecuencia o un histograma para mostrar toda la distribución de frecuencia de una variable contínua; se usa una gráfica lineal de escala aritmética para mostrar una serie de puntos de observaciones (números absolutos o tasas), usualmente a través del tiempo. Un polígono de frecuencias debe cerrarse en ambos extremos porque el área por debajo de la curva es representativa de los datos; una gráfica lineal de escala ritmética muestra solamente los puntos que representan los datos.
  • 40. 251 Figura 4.13 Antropometría de niños de dos a 4 años de edad de Haití comparados con la población de referencia de los CDC/OMS, departamentos septentrionales de Haití, 1990 Fuente: 9 Curvas de frecuencia acumulada y sobrevida Como su nombre lo indica, una curva de frecuencia acumulada grafica la frecuencia acumulada en vez de la frecuencia individual para cada intervalo de clase de una variable. Se usa éste tipo de gráficas para identificar medias, quartiles y porcentajes. El eje de las X registra los intervalos de clase y el eje de las Y muestra la frecuencia acumulada o una escala absoluta (por ej.: el número de casos) o el porcentaje. Se grafica cada frecuencia acumulada en el límite superior del intervalo que aplica, en vez de al punto medio. Esta práctica permite que la gráfica represente visualmente el número o porcentaje de observaciones por encima o por debajo del valor particular (figura 4.14). Se usa una curva de sobrevida en los estudios de seguimiento, para mostrar la proporción de uno o más grupos que estén todavía vivos (o libres de la condición de interés) en períodos diferentes a lo largo del tiempo. De forma similar a la curva de frecuencia acumulada, el eje de las X registra períodos de tiempo y el eje de las Y muestra porcentajes de cero a cien de los Población de referencia Peso para la talla Talla para la edad Peso para la edad Puntuación de Z de referencia
  • 41. 252 que aún viven. La diferencia más sobresaliente entre las dos curvas es su forma misma: mientras la curva de frecuencia Figura 4.14 Incidencia acumulada de infección por virus de hepatitis B por duración de conducta de alto riesgo Fuente: 1, 17, 19, 23 Figura 4.15 Curvas de sobrevida de una cohorte de pacientes con enfermedad arterial periférica (EAP) (n=482) y sin EAP (n=262), Pittsburgh, Pennsylvania, 1977-1985 Fuente: 20 Usuarios de Drogas IV Homosexuales Trabajadores de la salud en contacto frecuente con sangre Heterosexuales con múltiples parejas Años a riesgo % I n f e c t a d o c o n V H B % s o b r e v i v e n Sin EAP Con EAP Año
  • 42. 253 acumulada empieza en cero y en la parte más baja de la esquina izquierda de la gráfica y va hacía cien en la esquina superior derecha, una curva de sobrevivencia empieza en cien por ciento en la esquina superior izquierda y va disminuyendo hacía la esquina inferior derecha en la medida que los pacientes van muriendo o sufirendo la condición bajo estudio). La curva de sobrevida de la figura 4.15 compara el porcentaje de sobrevivientes entre los pacientes que padecian de enfermedad arterial periférica (EAP) y aquellos que no. ¿Cuál grupo tiene el porcentaje de sobrevida mas alto?. Para el 10 año la experiencia de sobrevida para los pacientes sin EAP era sustancialmente mejor que para aquellos con EAP.
  • 43. 254 Diagramas de dispersión (nube de puntos) Un diagrama de dispersión es una gráfica usada para detectar la relación entre dos variables contínuas representadas una en el eje de las X y la otra en el eje de las Y. Para crear un diagrama de dispersión se debe tener una pareja de valores para cada persona, grupo u otra entidad en nuestra serie de datos, con un valor para cada variable; entonces, se grafica cada par de valores colocando un punto en la gráfica donde los dos valores se interceptan; la figura 4,16 muestra un diagrama de dispersión que grafica los niveles séricos de tetraclordibenzo-p- dioxina (TCDD) por años de exposición para un grupo de trabajadores. Para interpretar un diagrama de dispersión se debe observar el patrón general hecho por los puntos graficados; un patrón compacto indica un alto grado de correlación; puntos muy dispersos indican una pequeña correlación. Si se requiere una medida cuantitativa más exacta de la relación entre las variables en un diagrama de dispersión, se puede usar un método de estadística formal como una regresión lineal. Estos métodos no son cubiertos en este curso. Figura 4.16 Ejemplo de gráfico de dispersión: Niveles séricos de tetra-cloro-dibenzo-p-dioxina (TCDD) ajustado por lípidos en 253 trabajadores de acuerdo a los años de exposición, en 12 plantas químicas de los Estados Unidos, 1987 Fuente: 16 T C D D µ g X g d e g r a s Años de Exposición
  • 44. 255 Gráficas de una sola coordenada Estas gráficas ilustran información estadística usando una sola coordenada; son más apropiadas para comparar las magnitudes de diferentes categorías de un total, pero tienen muchos otros usos. Gráficas de barra La gráfica de barra más simple es usada para mostrar en una forma visual los datos de un cuadro de una sola variable; cada valor o categoría de una variable es representado por una barra; la longitud de la barra es proporcional al número de personas o eventos en ésta categoría; la figura 4.17 muestra el número de muertes infantiles por causa en los EEUU; con ésta presentación, es muy fácil comparar la influencia de las diferentes causas. Las variables que se muestran en una gráfica de barra pueden ser discretas y no continuas (raza o género) o se las trata como si fueran discretas y no continuas (grupos de edad en vez de intervalos de edad en el eje). Se puede presentar las barras en forma horizontal o vertical. La longitud o el tamaño de cada barra es proporcional a la frecuencia del evento en esta categoría; por tal razón, no se debe graficar una interrupción en el eje cuando se usa una gráfica de éste tipo porque puede dar lugar a malas interpretaciones cuando se compara la magnitud de diferentes categorías. Figura 4.11 Ejemplo de gráfica de barras horizontales: Número de muertes infantiles por causas principales, Estados Unidos, 1983 Fuente: 6 Defectos congénitos Bajo peso/Prematurez/Síndrome de dificultad respiratoria Muerte súbita Hipoxia intrauterina/Asfixia neonatal Lesiones no intencionales/Efectos Adversos Infecciones perinatales Complicaciones de placenta/membranas/cordón Complicaciones maternas
  • 45. 256 Una gráfica de barras verticales difiere de un histograma en que las barras de la primera son separadas, mientras que las barras de la segunda son unidas; ésta distinción existe porque en un histograma se muestra la distribución de una variable contínua en el eje de las X (p.ejemplo.colesterol sérico, edad) mientras que en una gráfica de barras, se muestra en éste eje una variable discreta (sexo o raza). Gráficas de barras agrupadas Las gráficas de barras agrupadas se usan para ilustrar los datos de cuadros de dos o tres variables, cuando una variable tiene únicamente dos categorías; las barras en un grupo están generalmente unidas; éstas deben ilustrarse de manera distinta y describirse en una nota a pie de página; es mejor limitar el número de barras en un grupo a no más de tres; como se muestra en la figura 4,18, es difícil interpretar los datos cuando hay muchas barras. La gráfica de barras en la figura 4.19 representa tres variables: edad, género, y hábito de fumar en la actualidad. El hábito de fumar es la variable consecuente y tiene dos categorias:"si" y "no". Las barras representan las 10 categorias de edad/sexo. La altura de cada barra es proporcional al porcentaje de fumadores actuales en cada categoría de edad/ género. Figura 4.18 Causas básicas de defunción entre menores de un año por grupos raciales/étnicos, Estados Unidos, 1983 Fuente: 6 D e f. x m i l n vr Negros Indios Amer. Hispanos Asiat. Blancos Total Raza/Etnia Defectos Cong. Bajo peso/prematurez S dificultad respiratoria S. muerte súbita Otros
  • 46. 257 Figura 4.19 Ejemplo de gráfica de barras verticales con anotación: Porcentaje de adultos que fuman cigarrillos actualmente (personas de =18 años que han fumado alguna vez en su vida al menos cien cigarrillos y que actualmente fuman) por edad y género, Estados Unidos, 1988 Fuente: 10 Gráficas de barras apiladas Es posible también mostrar categorías de una segunda variable como componentes de la barra que representan la primera variable, como en la figura 4.20; éstas barras pueden ser difíciles de interpretar porque, excepto por el componente de la base, los componentes no están sobre la misma línea de base. Gráficas de barras desviadas. También se pueden usar barras para mostrar desviaciones tanto positivas como negativas,en una variable, desde la línea de base. La figura 4.2 muestra una gráfica de barras desviadas para algunas enfermedades de notificación obligatoria en los EEUU. Se utiliza una gráfica similar en el Informe Semanal de Morbilidad y Mortalidad del CDC. En esta gráfica, se compara el número de casos informados en las 4 semanas anteriores con los informados en periodos comparables de los años anteriores. La desviación a la derecha para la rubeóla indica un aumento por encima de los niveles históricos; las desviaciones a la izquierda indican una reducción en comparación con niveles anteriores. En ésta gráfica en particular, el eje de las X tiene una escala logarítmica, que significa que una reducción o un aumento del 50% será % Una celda Cada celda separada por un espacio Una celda puede tener mas de una barra Masculinos n Femeninos o Grupo Etario (Años) El significado de cada barra es mostrado en una leyenda
  • 47. 258 representado por barras de la misma longitud, pero en direcciones diferentes. Se resaltan los valores más allá de los limites históricos (que son equivalentes a intervalos de confianza del 95%). Figura 4.20 Causas básicas de defunción entre menores de un año por grupos raciales/étnicos, Estados Unidos, 1983 Fuente: 6 Figura 4.21:Enfermedades de notificación, comparaciones de períodos cuatrisemanales que terminaron el 26 de enero de 1991 con datos históricos, Estados Unidos, 1991 D e f. x m i l n v r Negros Indios Amer. Hispanos Asiat. Blancos Total Raza/Etnia Otras S. de Muerte Súbita Prematurez/Bajo Peso/ S. de dificultad respiratoria Defectos congénitos Decremento Incremento Casos 4 semanas actuales Enfermedad Meningitis aséptica Encefalitis primaria Hepatitis A Hepatitis B Hepatitis no A no B Hepatitis sin especificar Legionelosis Malaria Total de Sarampión Infecciones meningocóccicas Parotiditis Tosferina Rabia Animal Razón en escala LogPor arriba de límites históricos Fuente: 8
  • 48. 259 Gráficas de barra de componente 100% Como variante de las barras apiladas, es posible construir todas las barras de la misma altura y mostrar los componentes como un porcentaje del total en vez de mostrar sus valores reales; éste tipo de gráfica es útil para comparar la contribución de los diferentes componentes de cada categoría de la variable principal. La figura 4.22 muestra una gráfica de componente 100%; fíjese que ella no es útil para comparar el tamaño relativo de varias categorías de la variable principal; únicamente los totales dados arriba de las barras indican que las categorías difieren en tamaño. Figura 4.22 Causas básicas de defunción entre menores de un año por grupos raciales/étnicos, Estados Unidos, 1983 Otras S. de Muerte Súbita Prematurez/Bajo Peso/ S. de dificultad respiratorias Defectos congénitos Negros Indios Amer. Hispanos Asiat. Blancos Total Raza/Etnia % d e l a d i s t r i b u c i
  • 49. 260 Cómo construir una gráfica de barras Para construir una gráfica de barras siga las siguientes instrucciones: • Organice las categorías que definen las barras o grupo de barras en orden, ya sea alfabético, por edad, o en un orden que produzca barras de altura que aumenten o disminuyan. • Elija la posición de las barras,(horizontal o vertical), como prefiera, excepto en las barras de desviación que usualmente son horizontales. • Haga todas las barras del mismo ancho. • Haga la longitud de las barras en proporción con la frecuencia del evento; no rompa la escala para no distorsionar la comparación del tamaño de las diferentes categorías. • No muestre más de tres barras en un grupo de barras. • Deje espacios entre los grupos de barras adyacentes, pero no entre las barras de un grupo. • Codifique las variables por diferentes colores, matices etc. e incluya la leyenda que interprete ésta codificación.
  • 50. 261 Ejercicio 4.6 Utilice los datos del cuadro 4.12 para dibujar una gráfica de barras apiladas, otra de barras agrupadas y otra mas de barras componentes de 100% para ilustrar la distribución etaria de los casos de sífilis primaria entre hombres y mujeres blancos y negros en los Estados Unidos. ¿Qué información es presentada mejor por cada tipo de gráfica? Blanca NegraGrupo etario (Años) Masculinos Femeninos Masculinos Femeninos Total < 20 20-29 30-39 40+ Total 90 957 931 826 2804 267 908 478 160 1813 1443 8180 6893 3860 20376 2422 8093 3676 941 15132 4222 18138 11978 5787 40125 Fuente: 12 Respuesta en la página 287
  • 51. 262 Gráficas de pasteles (tartas) Una gráfica de pastel es simple, fácil de entender, ya que el tamaño de las rebanadas es proporcional a la contribución de cada componente; los pasteles son útiles para mostrar los componentes de un solo grupo o variable. Para hacer un pastel, hay que dibujar un círculo, después empezar en las 12 del reloj y organizar los componentes desde el más grande hacía el más pequeño en el sentido de las manecillas del reloj, generalmente se ponen las categorías de "otro" y "desconocido" al final. Se pueden usar diferentes matices para distinguir entre los pedazos; hay que mostrar, (en alguna parte de la gráfica), los porcentajes representados por cada pedazo, porque no es fácil identificarlos a simple vista. No se recomienda el uso de múltiples pasteles, como los de la figura 4.23 para comparar los mismos componentes en más de un grupo de variables, porque la comparación es difícil; cuando se quiere comparar los componentes de más de un grupo o variable, hay que usar unas gráfica de barras de componente 100%. Figura 4.23 Manera de muerte traumática entre trabajadores según género, Estados Unidos, 1980-1985 Fuente: 11 Masculinos Femeninos Lesiones no intencionales Homicidio Suicidio Otros
  • 52. 263 Mapas (gráficas con coordenadas geográficas) Los mapas o las gráficas con coordenadas geográficas son usadas para mostrar la localización de eventos o atributos. Los mapas de puntos y los mapas de área son ejemplos comúnmente usados por este tipo de gráficas. Los mapas de puntos usan cualquier símbolo para mostrar donde ocurre un evento o existe la enfermedad. La figura 4.24 es un ejemplo de un mapa de puntos. Para hacer un mapa de puntos se coloca un símbolo en el sitio en donde el evento ocurríó o existía la condición. Si los eventos están agrupados en una localización, puede ser difícil distinguir entre puntos, entonces, es posible utilizar símbolos codificados (.l= 1 caso, n= 2 casos, s = 3 casos etc.) que indican la ocurrencia de más de un evento. Figura 4.24 Ejemplo de un mapa de puntos: Casos de histoplasmosis por lugar de residencia, Austin, Minnesota, Cotubre-Noviembre 1984 Fuente: CDC, datos sin publicar, 1984 Noroeste Noreste Suroeste Sureste Río Cedro Calle Oakland Aviario Alberca Camino a la planta de carnes Ciudad de Austin Límites de la ciudad Cuadrante Ríos y arroyos Vivienda caso índice
  • 53. 264 Un mapa de puntos es útil para mostrar la distribución geográfica de un evento pero (como es difícil tomar en consideración el tamaño de la población en riesgo) no se muestra el riesgo de la ocurrencia del evento en este sitio particular, por ejemplo, el riesgo de adquirir una enfermedad. Aún cuando un mapa de puntos muestre un gran número de símbolos en la misma área, el riesgo de adquirir la enfermedad puede no ser importante si el área es densamente poblada. Un mapa de área usa áreas colocadas o codificadas para mostrar la incidencia del evento en partes de ésta o la distribución de alguna condición en una región geográfica. Figura 4.25 Casos presuntivos y confirmados de encefalitis de San Luis por municipio de residencia, Florida, Julio-Octubre 1990 Fuente: 7 Se puede mostrar las tasas o la distribución en un mapa de área (figura 4.25); como con el mapa de puntos, no se muestra el riesgo de un individuo de adquirir el evento; sin embargo, si se muestran las tasas en un mapa de área, se puede ilustrar las diferencias en el riesgo de Sin casos 1-5 casos 6-10 casos >10 casos
  • 54. 265 presentar un evento en cada área. Por ejemplo, la figura 4.25 muestra el número de casos de encefalitis de San Luis en 1990 en Florida según municipio, pero no se pueden relacionar con la población a riesgo. Cuando se usan tasas se debe calcular la tasa especifica, es decir, hay que dividir el número de casos en cada área por la población en riesgo en ésta misma. Ejercicio 4.7 Utilizando los datos de mortalidad por cáncer cervico-uterino del cuadro 4.9 en la página 230, construye dos mapas de área basados en las dos primeras estrategias para categorizar los datos en cuatro intervalos de clase como se describe en las páginas 231-233. Respuesta en la página 290-291
  • 55. 266 Diagramas de puntos y de caja (cajas y bigotes) Un diagrama de puntos es similar a una gráfica de dispersión porque confronta una variable contra otra; sin embargo, en un diagrama de punto, la variable del eje de las X no es contínua, sino que representa las categorías discretas de una variable no continua. Como se muestra en la figura 4.26, para ubicar una observación, hay que poner un punto sobre la categoría apropiada de las X al nivel apropiado de las Y; hay que mostrar tantos puntos en ésta posición como el número de observaciones con los mismos valores. Se usa un diagrama de puntos para hacer una comparación visual de los puntos reales de los datos de dos variables no continuas. Figura 4.26 Ejemplo de diagrama de puntos: Resultados de anticuerpos (Ac) inhibidores de la hemaglutinación (IH) contra el virus de la influenza porcina (VIP) entre ganaderos asistentes a una feria, expuestos y no expuestos, Wisconsin, 1988 Fuente: 26 Para comparar las distribuciones de dos variables no continuas se usa un diagrama o gráfica de caja, también llamado de cajas y bigotes. Como se muestra en la figura 4,27; la "caja" representa el rango interquartílico de los datos y "los bigotes" se extienden hacía los valores máximos y mínimos. Se marca la posición mediana con una línea vertical adentro de la caja; así, se puede mostrar (y comparar) el punto central (la mediana), la dispersión (los cuartiles) y A c I H V I P No expuestos Expuestos
  • 56. 267 cualquier tendencia de desviación, como se indica cuando la línea de la mediana no está centrada en la caja. Figura 4.27 Ejemplo de diagrama de caja: Resultados de pruebas de ELISA indirecta para anticuerpos IgG de virus parainfluenza tipo I en suero de pacientes en fase convaleciente de casos y controles, Condado de Baltimore, Maryland, Enero 1990 Fuente: CDC, datos sin publicar, 1990. Mediana Casos (n=24) Primer Piso No Casos (n=26)
  • 57. 268 Un comentario sobre el uso de la tecnología informática Existe un amplio número de paquetes de software para computadoras personales que pueden ayudarnos a hacer cuadros, gráficos, y diagramas. La mayoría de estos paquetes son muy útiles, especialmente a la hora de permitirnos redibujar un gráfico sólo tecleando algunas órdenes. Con estos paquetes, hallar la curva epidémica más adecuada ya no es una tarea tan ardua y tediosa: podemos dibujar gran número de curvas rápida y fácilmente con diferentes intervalos de clase en el eje de las X. Por otra parte, a veces caemos en la tentación de que el software dicte el gráfico. Por ejemplo, muchos paquetes pueden dibujar diagramas de barras o de "tartas" que parecen tridimensionales. ¿Quiere esto decir que deberíamos elaborar diagramas tridimensionales? No debemos perder de vista nuestro propósito: comunicar información a otras personas. ¿Comunicarán de mejor manera esa información los diagramas tridimensionales que los bidimensionales? Decida usted mismo: ¿Ofrece más información el diagrama tridimensional de la figura 4.28b que el diagrama bidimensional de barras de la figura 4.28a? ¿Cuál es más fácil de interpretar? Si quisiéramos dirigir nuestra atención a la tendencia temporal de los casos confirmados y los notificados, tal vez el diagrama tridimensional sea preferible. No obstante, una gráfica lineal en escala aritmética, con dos líneas podría ser la mejor de todas. Un problema común de los gráficos de barras tridimensionales es que una barra de la línea de delante puede ocultar a otra de la línea posterior. Suponga que estamos interesados en la relación de los casos confirmados y los casos declarados cada año. En el diagrama de barras bidimensional vemos inmediatamente que el número de casos confirmados en 1985 es aproximadamente dos tercios del número de casos declarados en ese año. ¿Cuánto tiempo necesitaría observar el gráfico tridimensional para llegar a la misma conclusión? Ahora compare la relación de los casos confirmados y los casos declarados en los cinco años. Si necesitase comunicar esta información conuna diapositiva en 20 segundos durante una presentación oral, ¿qué figura preferiría mostrar?
  • 58. 269 Figura 4.28a Ejemplo de diagrama de barras bidimensional: Casos notificados y confirmados de polio en las Américas, 1985-1989 Fuente: 5 Figura 4.28b Ejemplo de diagrama de barras bidimensional: Casos notificados y confirmados de polio en las Américas, 1985-1989 Fuente: 5 C a s o s Año C a s o s Año confirmados notificados confirmados notificados
  • 59. 270 Aporta el gráfico de pastel tridimensional de la figura 4.29b alguna información más que el gráfico bidimensional de la figura 4.29a? ¿Puede Vd. juzgar los tamaños relativos de los componentes también en la versión tridimensional? Observe el pastel tridimensional y borre o tape los porcentajes de los hispanos y de los asiáticos/isleños del pacífico. ¿Realmente podría decir qué porción es mayor y en qué medida? Creemos que no podría. ¿Podría decir esa información a partir del pastel bidimensional? Recuerde que el único propósito del diagrama tipo pastel es poner de relieve el tamaño. La adición de características llamativas que no añaden información alguna a una figura, y que, incluso, pueden conducir a interpretaciones erróneas, se ha denominado gráfico-chatarra (25). Figura 4.29a Ejemplo de gráfica pastel bidimensional: Porcentaje de casos de tuberculosis por etnias, Estados Unidos, 1989 (n=23,495) Fuente: 12 Indios Americanos/Nativos de Alaska Asiáticos/Isleños del Pacífico Negros no Hispanos Blancos no Hispanos 32.6 Hispanos
  • 60. 271 Figura 4.29b Ejemplo de gráfica pastel bidimensional: Porcentaje de casos de tuberculosis por etnias, Estados Unidos, 1989 (n=23,495) Fuente: 12 Muchas personas utilizan arbitrariamente la tecnología al seleccionar el color, especialmente en diapositivas que acompañan exposiciones orales. Si usted usa colores o piensa hacerlo, siga estas recomendaciones: • * Seleccione los colores de forma que todos los componentes del gráfico -título, ejes, datos, leyendas- resalten claramente sobre el fondo, y de forma que cada serie de datos enumerados se distinga con claridad de las demás. • Evite contrastar el rojo y el verde, ya que hasta un 10% de los varones entre el público puede tener cierto grado de ceguera para los colores. • * Si es posible, seleccione los colores de forma que comuniquen información. Por ejemplo, consideremos un mapa en el que los estados están divididos en cuatro grupos según las tasas de una determinada enfermedad. Más que elegir los colores únicamente por razones estéticas, debería escoger un color suave para los estados con las tasas más bajas e ir usando colores más oscuros a la par que las tasas sean mayores. De esta forma, los colores contribuirán, más que a distorsionar o distraer, a facilitar la información que desea transmitir. Indios Americanos/Nativos de AlaskaAsiáticos/Isleños del Pacífico Negros no Hispanos Blancos no Hispanos 32.6 Hispanos
  • 61. 272 Finalmente, con algunos paquetes de software, no podrá producir algunos de los tipos de gráficos descritos en este manual. Especialmente, algunos paquetes informáticos no pueden crear histogramas; en lugar de éstos, producen diagramas de barras. Sus gráficas deberán estar determinadas por sus datos y las relaciones que desee comunicar visualmente, no por la tecnología que tenga disponible. Si el software que tiene no es capaz de ajustarse a sus datos, no comprometa la integridad de éstos o su presentación. ¡Use otro software! Selección y construcción de cuadros, gráficos, diagramas y mapas Para comunicar los hallazgos epidemiológicos, debe seleccionarse en primer lugar la mejor forma de ilustrarlos. Sin embargo, incluso el mejor método debe elaborarse de forma adecuada o el mensaje se perdería. Las cuadros de esta sección proporcionan una guía a la hora de elegir los métodos de ilustración y de construcción de cuadros, gráficas y diagramas/mapas.
  • 62. 273 Cuadro 4.13 Guia para seleccionar una gráfica o diagrama/mapa para ilustrar datos epidemiológicos Tipo de gráfico o diagrama/mapa Cuando emplearlo Gráfica lineal en escala aritmética Gráfica lineal en escala semilogarítmica Histograma Polígono de frecuencias Frecuencia acumulada Diagrama de dispersion Gráfica o diagrama de barras simples Gráfica o diagrama de barras agrupadas Gráfica o diagrama de barras apiladas Gráfica o diagrama de barras de desviación Gráfica o diagrama de barras componentes de 100% Diagrama o gráfica de pastel Mapa de puntos Mapa de áreas Diagrama de cajas y bigotes Tendencias en cifras absolutas o tasas en el tiempo 1. Enfattizar tasa de cambio en el tiempo 2. Desplegaar valores que varían en un orden de magnitud de mas de dos veces 1. Distribución de frecuencia en escala contínua 2. Número de casos durante una epidemia (curva epidémica) o a lo largo del tiempo Distribución de frecuencias de una variable en escala continua, especialmente para mostrar componentes Frecuencia acumulada de una variable continua Graficar la asociación entre dos variables continuas Comparar el tamaño o frecuencia de diferentes categories de una sola variable Comparar el tamaño o frecuencia de diferentes categories de 2-4 series de datos Comparar totales e ilustrar las partes componentes del total en diferentes grupos Ilustrar diferencias, tanto positivas como negativas con respecto a un nivel basal Comparar como las partes componentes contribuyen a un total en grupos deiferentes Mostrar los componentes de un total Mostrar la localización de casos o eventos Desplegar eventos o tasas geográficamente Visualizar las características estadísticas de dispersion (mediana, rango, sesgo) de una variable
  • 63. 274 Cuadro 4.14 Seleccione un método para ilustrar datos epidemiológicos Si los datos son: Y las siguientes condiciones aplican: Entonces, escoga: Series de tiempo Número de casos (epidemia o tendencia secular) 1-2 series? Histograma 2 o mas series Polígono de frecuencias Tasas Rango de valores =2 ordenes de magnitud Gráfica lineal en escala artimética Rango de valores = 2 ordenes de magnitud Gráfrica lineal en escala semi logarítmica Datos en escala continua que no sean series de tiempo Distribución de frecuencias Histograma o polígono de frecuenicas Datos en categories discretas (que no sea lugar) Gráfica de barras o pastel Lugar Número de casos No identificable en un mapa Gráfica de barras Identificable en un mapa Sitio específico es importante Mapa de puntos Sitio específico no es importante Mapa de área Tasas Mapa de área
  • 64. 275 Cuadro 4.15 Lista para la construcción de cuadros, gráficas, y representaciones visuales. Lista para los cuadros. 1. Título. • ¿Tiene el cuadro un título? • ¿ Describe el título el contenido, incluyendo el tema, persona, lugar y tiempo ? • ¿ Está el título precedido por una designación " Cuadro # " ? ( " Cuadro " se utiliza para presentar textos, " Figura " para gráficas, diagramas y mapas. Las secuencias numéricas separadas se utilizan para tablas y figuras en el mismo documento [ por ejemplo, Cuadro 1, Cuadro 2, Figura 1, figura 2 ]). 2. Filas y columnas. • ¿ Está cada fila y columna rotulada de forma clara y concisa ? • ¿ Se muestran las unidades específicas de medida ? (por ejemplo, años, mm Hg, mg/dl, tanto por 100.000, etc). • ¿ Son las categorías apropiadas para los datos ? • *¿ Se proporcionan los totales de las filas y de las columnas ? 3. Notas de pie de página. • ¿ Están todos los códigos, abreviaciones o símbolos explicados ? • ¿ Están todas las exclusiones anotadas ? • ¿ Si los datos no son originales se proporciona la fuente ? Lista para gráficas, diagramas y mapas. 1. Título. • ¿ Tiene la gráfica o diagrama un título ? • ¿ Describe el título el contenido, incluyendo el tema, persona, lugar y tiempo ? • ¿ Está el título precedido por una designación " Figura # " ? ( " Cuadro" se utiliza para presentar textos, " Figura " para gráficas, diagramas y mapas. Las secuencias numéricas separadas se utilizan para los cuadros y figuras en el mismo documento [ por ejemplo, Cuadro 1, Cuadro 2, Figura 1, Figura 2 ]). 2. Ejes. • ¿ Está cada eje rotulado de forma clara y concisa ? • ¿ Están las unidades específicas de medida incluidas como parte del rótulo ? ( Por ejemplo, años, mm Hg, mg/dl, tantos por 100.000, etc).
  • 65. 276 • ¿ Están las divisiones de la escala indicadas en los ejes de forma clara ? • ¿ Son las escalas de cada eje apropiadas para los datos ? • ¿ Comienza el eje en cero ? • Si se utiliza una interrupción en una gráfica de líneas de escala, ¿Se identifica fácilmente ? • ¿ Se ha utilizado una interrupción en un histograma, polígono de frecuencia, o diagrama de barras ? ( La respuesta debería ser NO). • ¿ Están los ejes dibujados de forma más acentuada que el resto de las líneas de coordenadas? 3. Líneas de coordenadas. • ¿ Incluye la figura únicamente tantas líneas de coordenadas como son necesarias para guiar la vista ? (A menudo éstas son innecesarias). 4. Trazado de los datos. • ¿ Está el trazado dibujado de forma clara ? • Si se muestra más de una serie de datos o componentes, ¿ Se distinguen claramente sobre el mapa ? • ¿ Está cada serie o componente rotulado en el mapa o en una leyenda o clave ? • Si se utiliza color o sombreado en un mapa de superficie,¿ Corresponde un incremento de color o de sombreado con un incremento en la variable que se está mostrando ? 5. Notas de pie de página. • ¿ Están todos los códigos, abreviaturas o símbolos explicados ? • ¿ Están todas las exclusiones anotadas ? • Si los datos no son originales, ¿ Se proporciona la fuente ? 6. Representación visual. • ¿ Incluye la figura alguna representación que no es necesaria ? • ¿ Está la figura colocada en la página para una óptima lectura ? • ¿ La combinación de tamaños y colores mejora la lectura ?
  • 66. 277 Cuadro 4.15 (continuación) Lista para la construcción de cuadros, gráficas, y representaciones visuales. Lista para unas representaciones visuales efectivas. 1. Legibilidad (asegúrese de que su audiencia puede leer fácilmente sus representaciones). • ¿ Pueden leerse los encabezados de sus transparencias desde una distancia de 6 pies (1,8 metros) cuando no están proyectadas ?. • ¿ Puede una diapositiva de 35 mm leerse desde una distancia de 1 pie (30,48 cm) cuando no está proyectada? • ¿ Cuando se proyectan pueden sus visuales leerse desde los lugares más lejanos de la habitación ? 2. Simplicidad (mantenga un mensaje simple). • ¿ Ha utilizado palabras sencillas ? • ¿ Se presenta la información en el lenguaje de la audiencia ? • ¿ Ha utilizado únicamente palabras claves ? • ¿ Ha omitido conjunciones, preposiciones, etc? • ¿ Se limita cada representación solamente a una idea, concepto o tema principal ? • ¿ Tiene cada visual no más de tres colores ? • ¿ Hay no más de 35 letras y números en cada visual ? • ¿ Hay no más de 6 líneas de narración y no más de 6 palabras por línea ?
  • 67. 278 Cuadro 4.15 (continuación) Lista para la construcción de cuadros, gráficas, y representaciones visuales. 3. Multitud de colores. • Los colores que elija tendrán un impacto sobre el efecto de sus representaciones. Debería utilizar colores cálidos/calientes para enfatizar, destacar, enfocar o para reforzar los conceptos claves. Debería utilizar colores fríos en el fondo o para separar los párrafos. Utilice la siguiente tabla para seleccionar el color apropiado para el efecto que desea. Caliente Cálido Fresco Frío Colores Rojos Naranja brillante Amarillo brillante Dorado brillante Naranja ligero Amarillo ligero Dorado ligero Marrones Azul ligero Verde ligero Púrpura ligero Gris ligero Azul oscuro Verde oscuro Púrpura oscuro Gris oscuro Efecto Excitante Moderado Apagado Sombrío • ¿ Está utilizando la mejor combinación de colores? El párrafo más importante debería estar en el color más relevante y tener mayor contraste con respecto al fondo. La combinación de colores más legible es: Negro sobre Amarillo. Negro sobre Blanco. Verde oscuro sobre Blanco. Azul oscuro sobre Blanco. Blanco sobre Azul oscuro. 4. Precisión. Las representaciones se convierten en distracciones cuando se advierten los errores. Cuente con alguien que no haya visto las representaciones para que compruebe si no hay incorrecciones y errores en general. 5. Durabilidad. Las transparencias y diapositivas de 35 mm son las ayudas visuales más duraderas. Sin embargo, ambas requieren una protección contra los arañazos. Una lámina de acetato protegerá la transparencia. Mantenga las diapositivas de 35 mm en un lugar frío y seco. Si se dejan a la luz, los colores se estropearán.
  • 68. 279 Resumen Las cuadros, gráficos, diagramas y mapas son herramientas eficaces para resumir y comunicar datos. Las cuadros se usan comúnmente para expresar números, tasas, proporciones y porcentajes acumulados. Como la finalidad de éstas es precisamente la comunicación de información, la mayoría de ellas no deben tener más que dos variables y no más de ocho categorías (intervalos de clase) por cada variable. Las cuadros se usan en ocasiones fuera de contexto, por lo que deberían ser titulados correctamente y detallar en ellas los datos más importantes como referencia. Las cuadros pueden desplegar tanto datos nominales u ordinales continuos. Las variables nominales como género y residencia tienen unas categorías obvias. Las variables continuas no; deben crearse para ellas intervalos de clase. Para algunas enfermedades se han adoptado unos intervalos de clase estándar como es el caso de la edad. Por otro lado, existe gran variedad de métodos para establecer intervalos razonables para variables contínuas los que incluyen: crear intervalos con un número igual de personas u observaciones en cada uno; intervalos de clase de una extensión constante; e intervalos de clase basados en la media y la desviación estándar. Los gráficos, mapas y diagramas son herramientas incluso más eficaces cuando se trata de comunicar datos rápidamente. A pesar de que muchas personas usan los términos gráfico mapa y diagrama indistintamente, en esta unidad nos referimos con gráfico a una figura con dos coordenadas, un eje x horizontal y un eje y vertical. En otras palabras, ambas variables son continuas. Por ejemplo, en el eje y con frecuencia representamos datos como el número de casos o la tasa de la enfermedad, mientras que en el eje x señalamos el tiempo. Por el contrario, hablamos de diagrama refiriéndonos a una figura con una variable continua y una nominal. Por ejemplo, un diagrama podría representar el número de casos (variable continua) en relación al género (variable nominal). Los gráficos lineales en escala aritmética han sido usados tradicionalmente para mostrar las tendencias temporales de las tasas de las enfermedades. Los gráficos lineales en escala semilogarímica se prefieren cuando las tasas varían entre por encima de dos o más órdenes de magnitud. Los histogramas y polígonos de frecuencia se utilizan para mostrar las distribuciones de frecuencias. Un tipo especial de histograma conocido como curva epidémica muestra el número de casos por tiempo de comienzo de la enfermedad o momento del diagnóstico durante un período epidémico. Los casos pueden representarse por cuadrados que se unen para formar las columnas del histograma; los cuadrados pueden marcarse para distinguir características importantes de los casos, como el desenlace fatal.
  • 69. 280 Los diagramas de barras simples y los de pastel se utilizan para representar la distribución frecuencial de una sola variable. Los diagramas de barras agrupadas pueden representar las frecuencias de dos, o incluso tres variables. Los mapas de puntos señalan la localización de cada sujeto o suceso. Un mapa de áreas usa el sombreado o el coloreado para mostrar los distintos niveles de números o tasas de una enfermedad en las distintas zonas. Cuando se utilizan estas herramientas, es importante recordar su finalidad: resumir y comunicar. Las figuras sobrecargadas y de vistosos colores no son necesariamente mejores; ¡a veces cuanto menos, mejor!
  • 70. 281 Respuesta a los Ejercicios Ejercicio 4.1 (página 220) Ocurrencia de diarreas por menú entre residentes del ancianato A, 1989 Diarrea ?Menú Si No Total A B C D E F ?Total 12 0 0 2 0 0 14 5 7 4 4 1 1 22 17 7 4 6 1 1 36 B. Ocurrencia de diarreas por exposición al menú A, entre residentes del ancianato A, 1989 Diarrea ?Si No Total Menú A Si No Total 12 2 14 5 17 22 17 19 36 Ejercicio 4.2 (página 233) Estrategia 1: Dividir los datos en grupos de tamaño similar Dividir la lista en tres grupos de estados de igual tamaño: 50 estados /3 = 16.67 estados por grupo. Así, dos grupos contendrían 17 estados y un grupo contendría 16 estados. Oklahoma (#17) podría ir tanto en el grupo 1 como en el 2, pero como tiene la misma tasa que Indiana (#16), tiene sentido poner Oklahoma en el grupo 1. Análogamente, como
  • 71. 282 Michigan (#34) podría ir tanto en el grupo 2 como en el 3, y tiene la misma tasa que Oregon (#33), debería incluirse en el grupo 2. Categorías finales: Estados Tasa por cien mil Número de estados 1. OK-SC 2. MI-IL 3. UT-CA 4.1-5.6 3.3-4.0 1.8-3.2 17 17 16 Estrategia 2: Categorías basadas en la media y la desviación estándar Cree 3 categorías basándose en la media (3.70) y la desviación típica (0.96): límite superior de la categoría 1 = media - 1 desviación típica = 3.70-0.96 = 2.74 límite superior de la categoría 2 = media + 1 desviación típica = 3.70+0.96 = 4.66 límite superior de la categoría 3 = valor máximo = 5.6 Categorías finales: Estados Tasa por cien mil Número de estados 1. MS-SC 2. RI-NC 3. UT-WI 4.67-5.60 2.75-4.66 1.80-2.74 9 34 7 Estrategia 3: Dividir el rango en intervalos de clase iguales Divida el rango entre 3: (5.60-1.80) /3 =1.267 Use múltiplos de 1.27 para crear las 3 categorías, comenzando por 1.8: 1.- Desde 1.80 hasta (1.80+1.27)= desde 1.80 hasta 3.07 2.- Desde 3.08 hasta (1.80+ 2•1.27)= desde 3.08 hasta 4.34 3.- Desde 4.35 hasta (1.80+ 3•1.27)= desde 4.35 hasta 5.61
  • 72. 283 Categorías finales: Estados Tasa por cien mil Número de estados 1. ME-SC 2. AZ-VT 3. UT-MA 4.35-5.61 3.08-4.34 1.80-3.07 12 25 13 O bien, redondeando las cifras: Estados Tasa por cien mil Número de estados 1. ME-SC 2. AZ-VT 3. UT-MA 4.4-5.6 3.1-4.3 1.8-3.1 12 25 13
  • 73. 284 Respuesta al ejercicio 4.3 (página 239) A. y B. Figura 4.30 Incidencia anual de sarampión en los Estados Unidos por cien mil habitantes, 1955-1990 con una subserie interior de 1980 a 1990 Fuente: 12 c a s o s x c i e n m i l c a s o s x ci e n m i l Año Año
  • 74. 285 Respuesta al ejercicio 4.4 (página 243) Figura 4.31 Incidencia anual de sarampión en los Estados Unidos por cien mil habitantes, 1955-1990 Fuente: 12 c a s o s x c i e n m i l Año
  • 75. 286 Respuesta al ejercicio 4.5 (página 248) Figura 4.32 Brote de enfermedad diarreica en ancianato A, Enero de 1989 Este brote aparentemente duró apenas dos semanas, de Enero 12 a Enero 23. Después del caso inciial del 12 de Enero, el pico ocurrió el día siguiente con tres casos el 13 de Enero. La curva permaneció relativamente aplanada después con dos casos en cuatro de los cinco dias siguientes y otros dos al sexto día siguiente. Ocurrieron casos únicos los días 20 y 23. C a s o s Fecha de inicio
  • 76. 287 Respuesta al ejercicio 4.6 (página 261) Figura 4.33a Gráfica de barras apiladas: Número de casos de sífilis primaria y secundaria por edad, género y raza, Estados Unidos, 1989 Fuente: 12 M i l e s d e c a s o s Años Hombres Mujeres Hombres Mujeres Blancos blancas negros negras
  • 77. 288 Figura 4.33b Gráfica de barras agrupadas: Número de casos de sífilis primaria y secundaria por edad, género y raza, Estados Unidos, 1989 M i l e s d e c a s o s Hombres Mujeres Hombres Mujeres Blancos blancas negros negras Años
  • 78. 289 Figura 4.33 c Gráfica de barras componentes de 100%: Número de casos de sífilis primaria y secundaria por edad, género y raza, Estados Unidos, 1989 Hombres Mujeres Hombres Mujeres Blancos blancas negros negras Distribu- ción % por edad Años
  • 79. 290 Respuesta al ejercicio 4.7 (página 265) A. Figura 4.34a Estrategia 1: Media anual de tasas de mortalidad ajustadas por edad de cáncer cervico-uterino por estado, Estados Unidos, 1984-1986 Fuente: 2
  • 80. 291 B. Figura 4.34b Estrategia 2: Media anual de tasas de mortalidad ajustadas por edad de cáncer cervico- uterino por estado, Estados Unidos, 1984-1986 Fuente: 2
  • 81. 292 Examen de autoevaluación 4 Ahora que ya ha leído la unidad 4 y ha realizado sus ejercicios, debería estar preparado para responder al examen de autoevaluación. Este examen está diseñado para ayudarle a establecer en qué medida ha asimilado el contenido de esta lección. Podrá volver al texto en cualquier momento que tenga dudas acerca de alguna respuesta, pero recuerde que el examen final deberá realizarlo a libro cerrado. Marque con un círculo TODAS las respuestas correctas a cada pregunta. 1.- ¿Para qué tarea son importantes herramientas para el epidemiólogo los cuadros, diagramas y gráficos? a. Recolección de datos b. Resumen de los datos (epidemiología descriptiva) c. Análisis de los datos d. Presentación de los datos 2.- ¿Cuál de los siguientes cuadros "2x2" está correctamente rotulada? a. Enfermo Sanos Total Expuesto a c H1 No expuesto b d H2 Total V1 V2 T b. Enfermo Sanos Total Expuesto a b V1 No expuesto c d V2 Total H1 H2 T c. Enfermo Sanos Total Expuesto a b H1 No expuesto c d H2 Total V1 V2 T d. Expuesto No expuesto Total Enfermo a b H1 Sano c d H2 Total V1 V2 T
  • 82. 293 Morbilidad por sífilis primaria y secundaria por edad, Estados Unidos, 1989 Casos Años de edad Número Porcentaje Porcentaje Acumulado ≤14 15-19 20-24 25-29 30-34 35-44 45-54 ≥ 55 Total 230 4,378 10,405 9,610 8,648 6,901 2,631 1,278 44,084 0.5% 9.9% 23.6% 21.8% 19.6% 15.7% 6.0% 2.9% 100.0%* 0.5% 10.4% 34.0% 55.9% 75.5% 91.2% 97.2% 100.1% 100.0% *Los porcentjes no suman a 100% por redondeo 3.- El cuadro que se muestra arriba, es un ejemplo de: a. cuadro de una variable b. cuadro de dos variables c. cuadro de tres variables d. cuadro de cuatro variables
  • 83. 294 4.- El número máximo de variables que podrían ser enfrentadas en un cuadro simple es: a. 1 b. 2 c. 3 d. 4 5.- El mejor momento para estructurar los cuadros es: a. antes de planificar el estudio b. como parte de la planificación del estudio c. tras la recolección de los datos d. antes del análisis de los datos e. como parte del análisis de los datos 6.- Entre los métodos recomendados para crear categorías a partir de variables continuas, están: (Rodee con un círculo TODO lo que proceda.) a. basar las categorías en la media y la desviación típica b. dividir los datos en categorías con número similar de observaciones c. dividir el rango en intervalos de clase iguales d. usar las categorías que se consideran estándar en la patología o condición de que se trate e. usar las mismas categorías en las que están agrupados los datos de la población
  • 84. 295 7.- La unidad ilustra tres estrategias para crear intervalos de clase a partir de variables continuas. De los siguientes grupos de intervalos de clase mostrados (A-D), ¿cuáles concuerdan con alguna de las tres estrategias recomendadas? (Pista: desviación típica = 117.6)(Rodee con un círculo TODO lo que proceda.) Casos notificados de enfermedad A por 100,000 habitantes por área del censo, Dixon, 1991 Area del Censo Casos por 100,00 habitantes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Total 170.5 0.0 70.0 40.0 115.5 42.1 453.5 0.0 35.1 50.3 0.0 0.0 186.4 49.9 48.9 1262.2 a. 0.0 0.1-84.1 84.2-201.7 201.8-453.5 b. 0.0-35.1 35.2-50.3 50.4-453.5 c. 0.0-50.0 50.1-100.0 100.0-200.0 200.1-453.5 d. 0.0-113.4 113.5-226.8 226.9-340.2 340.3-453.6
  • 85. 296 8.- La diferencia principal entre un gráfico lineal en escala aritmética y un gráfico en escala semilogarítmica es que la escala aritmética: a. mide el rango del cambio entre puntos sucesivos en un gráfico b. es preferida cuando el rango de valores que deben reflejarse es muy amplio c. usa en cada eje las mismas distancias para reflejar las mismas cantidades d. es el mejor método de mostrar los cambios en la magnitud de los números 9.- ¿Qué tipo de gráfico estaría recomendado para mostrar las tasas anuales de mortalidad por enfermedad Z, de 1940 a 1990? (Rodee con un círculo TODO lo que proceda.) a. gráfico lineal en escala aritmética b. gráfico lineal en escala semilogarítmica c. histograma d. polígono de frecuencias 10.- ¿Cuál de los siguientes grupos de valores sería inapropiado para identificar intervalos equidistantes sobre el eje y de un gráfico lineal en escala semilogarítmica? a. 1, 10, 100, 1000 b. 10, 20, 30, 40 c. 7, 70, 700, 7000 d. 0.003, 0.03, 0.3, 3
  • 86. 297 11.- Los diagramas de barras pueden distinguirse de los histogramas a simple vista, ya que: a. los diagramas de barras no se usan para datos de series temporales b. los histogramas se usan para representar datos discretos c. los diagramas de barras se basan en el área bajo la curva d. los histogramas no tienen espacios entre las columnas consecutivas 12.- ¿Cuáles de las siguientes afirmaciones sobre una curva epidémica son ciertos? (Rodee con un círculo TODO lo que proceda.) a. Una curva epidémica es un histograma b. Una curva epidémica muestra número de casos por fecha de exposición c. Una curva epidémica debería comenzar con el primer caso del brote. d. Una curva epidémica debería utilizar en el eje x intervalos de tiempo de aproximadamente 1/2 del período de incubación.
  • 87. 298 13.- ¿Cuál de los siguientes métodos de cerrar un polígono de frecuencias sobre el eje horizontal es correcto? 14.- ¿Qué tipo de gráfico o diagrama sería apropidado para representar muertes a través del tiempo para una cohorte de 100 alumnos de la Clase de 1907? (Rodee con un círculo TODO lo que proceda.) a. Diagrama de barras b. Curva de frecuencias acumulativas c. Histograma d. Curva de supervivencia
  • 88. 299 Respuestas para las preguntas 15 - 20: a. gráfico lineal en escala aritmética b. diagrama de barras c. series de gráficos de caja (o cajas y bigotes) d. series de diagramas de puntos e. polígono de frecuencias f. diagrama de nube de puntos o de dispersión 15.- Número de casos según una variable continua _________________ 16.- Número de casos según una variable discreta (no continua) _____________ 17.- Valor medio de una variable continua según una variable discreta (no continua) ______________________________ 18.- Valor medio de una variable continua según una variable discreta (no continua) ________________________________ 19.- Cada valor de una variable continua según una segunda variable continua ________________________________ 20.- Cada valor de una variable continua según una variable discreta (no continua) ________________________________ 21.- ¿Qué tipo de gráfico es más adecuado para comparar tasas de cambio de la aparición de una enfermedad a lo largo de algunos años? a. gráfico lineal en escala aritmética b. gráfico lineal en escala semilogarítmica c. histograma d. polígono de frecuencias
  • 89. 300 22.- ¿Qué tipo de gráfica es más adecuado para comparar la magnitud de sucesos que han ocurrido en distintos lugares, sin que se disponga de un plano para ello? a. gráfico lineal en escala aritmética b. diagrama de barras c. polígono de frecuencias d. histograma 23.- ¿Qué tipo de diagrama podría ser utilizado para representar el tamaño relativo de diferentes causas de muerte según el sexo? (Rodee con un círculo TODO lo que proceda.) a. diagrama simple de una sola barra b. diagrama de barras agrupadas c. diagrama de barras apiladas d. diagrama de barras componentes de 100% e. diagrama de pastel 24.- La mejor elección para representar los años potenciales de vida perdidos según diferentes causas de muerte es: a. diagrama simple de una sola barra b. diagrama de barras agrupadas c. diagrama de barras apiladas d. diagrama de barras de 100% componentes (de múltiples barras) 25.- ¿Cuál de las siguientes afirmaciones es cierta respecto de la comparación de un mapa de áreas con un mapa de puntos? (Rodee con un círculo TODO lo que proceda.) a. El mapa de áreas muestra la localización de un caso o suceso más específicamente. b. Sólo el mapa de áreas puede mostrar riesgos o tasas de enfermedad c. Sólo el mapa de áreas puede mostrar dos o más casos en la misma localización d. Un mapa de áreas puede mostrar tasas, pero sólo un mapa de puntos puede mostrar números de casos.
  • 90. 301 Las respuestas, en el Apéndice J Si ha respondido al menos a 20 preguntas correctamente, habrá asimilado la Unidad 4 suficientemente bien para pasar a la Unidad 5.
  • 91. 302 Referencias 1. Alter MJ, Ahtone J, Weisfuse I, Starko K, Vacalis TD, Maynard JE. Hepatitis B virus transmission between heterosexuals. JAMA 1986; 256: 1307-1310. 2. Centers for Disease Control. Chronic Disease Supplement, 1987. Deaths from cervical cancer- U.S., 1984-1986. MMWR 1989; 38: 38. 3. Centers for Disease Control. HIV/AIDS Surveillance Report. November 1990. 4. Centers for Disease Control. Manual of reporting procedures for national morbidity reporting and public health surveillance activities. July 1985. 5. Centers for Disease Control. Progress toward eradicating poliomyelitis from the Americas. MMWR 1989; 39: 33. 6. Centers for Disease Control. Infant mortality among racial/ethnic minority groups, 1983-1984. MMWR 1990; 39: SS- 3. 7. Centers for Disease Control. St. Louis encephalitis -Florida and Texas, 1990. MMWR; 39: 42. 8. Centers for Disease Control. MMWR 1991; 40: 4. 9. Centers for Disease Control. Nutritional assessment of children in drought-affected areas -Haiti, 1990. MMWR 1991; 40: 13. 10. Centers for Disease Control. CIgarette smoking among adults -United States, 1988. MMWR 1988; 40: 44. 11. Centers for Disease Control. National Institute of Occupational Safety and Health. National traumatic Occupational Fatalities Database. 12. Centers for Disease Control. Summary of notifiable diseases, United States, 1989. MMWR 1989; 38 (54). 13. Centers for Disease Control. Health Status of Vietnam veterans. Volume 3: Medical Examination. 1989. 14. Creech JW. Effective oral presentations. Epi in Action Course, Centers for Disease Control, 1988. 15. Dicker RC, Webster LA, Layde PM, Wingo PA, Ory HW. Oral contraceptive use and the risk of ovarian cancer: The Centers for Disease Control Cancer and Hormone Study. JAMA 1983; 249: 1596-1599. 16. Fingerhut MA, et al. Cancer mortality in workers exposed to 2, 3, 7, 8 - tetrachlorodibenzo-p-dioxin. N Engl J Med 1991; 324: 212-218. 17. Hadler SC, et al. Occupational risk of hepatitis B infection in hospital workers. Infect Ctrl 1985; 6: 24-31. 18. Kleinman JC, Donahue RP, Harris MI, Finucane FF, Madans JH, Brock DB. Mortality among diabetics in a national sample. Am J Epidemiol 1988; 128: 389-401.
  • 92. 303 19. Lettau LA, et al. Outbreak of severe hepatitis due to delta and hepatitis F viruses in parenteral drug abusers and their contacts. N Engl J Med 1987; 317: 1256-1262. 20. McKenna M, Wolfson S, Kuller L. The ratio of ankle and arm arterial pressure as an independent predictor of mortality. Athero 1991; 87: 119-128. 21. National Center for Health Statistics. Advance Report of final mortality statistics, 1987. Monthly vital statistics report; vol 38, no. 5 supp. Hyattsville, MD: Public Health Service. 1989. 22. Schoenbaum SC, Baker O, Jezek Z. Common source epidemic of hepatitis due to glazed and iced pastries. Am J Epidemiol 1976; 104: 74-80. 23. Schereeder MT, et al. Hepatitis B in homosexual men: prevalence of infection and factors related to transmission.J Infect Dis 1982; 146: 1. 24. Sutter RW, Patriarca PA, Brogran S et al. Outbreak of paralytic poliomyelitis in Oman. Evidence for widespread transmission among fully vaccinated children. Lancet 1991; 338: 715-20. 25. Tufte ER. The visual display of quantitative information. Cheshire, CT: Graphics Press, 1983. 26. Wells, DL, Hopfensperger DJ, Arden NH, et al. Swine influenza virus infections. JAMA 1991; 265: 478-481. 27. Williamson, DF, Parker RA, Kendrick JS. The box plot: a simple visual method to interpret data. Ann Intern Med 1989; 110: 916-921.