Unidad 4
Organización de los datos epidemiológicos
Cuando se recogen más datos de los que se puede revisar individualmente, se pueden
usar cuadros y gráficas para organizarlos, resumirlos y mostrarlos en forma clara y
efectiva. Con cuadros y gráficas se pueden analizar grupos de datos de unas pocas
docenas a algunos millones. Estas herramientas permiten identificar, explorar,
entender y presentar distribuciones, tendencias y relaciones entre los datos. Los
cuadros y las gráficas son herramientas esenciales no sólo en la epidemiología
descriptiva y analítica, sino también en la comunicación de los hallazgos de las
investigaciones.
Objetivos
Después de preparar y entender esta lección, y responder a las preguntas de los
ejercicios, este módulo, el estudiante será capaz de:
Preparar correctamente cuadros con una, dos o tres variables;
Preparar correctamente las siguientes gráficas: una serie lineal en escala
aritmética, una serie lineal en escala semi-logarítmica, histogramas, polígonos
de frecuencia y diagramas de dispersión (nube de puntos);
Preparar correctamente gráficas de barras, pasteles, mapas de puntos, mapas de
área, y diagramas de cajas y bigotes;
Describir cuando se usa cada tipo de cuadros, gráficas y cartas.
212
Introducción a los cuadros, gráficas y cartas
El análisis de los datos es un componente importante en la práctica epidemiológica; para
un análisis efectivo de los datos, el trabajador de salud debe primero familiarizarse con
ellos y después aplicar técnicas analíticas; es importante empezar por examinar los datos
individualmente tal como aparecen en la base de datos, para rápidamente resumirlos en
cuadros; algunas veces, las cuadros resultantes son el único análisis necesario,
particularmente cuando la cantidad de datos es pequeña y la relaciones son obvias. Por
otra parte, las gráficas pueden ayudar a visualizar patrones y tendencias más generales e
identificar variaciones de estas tendencias. Las variaciones pueden representar
hallazgos nuevos e importantes o pueden ser únicamente errores en la digitación o
codificación que necesitan ser corregidos. Por lo tanto, las cuadros y las gráficas son
esenciales para la verificación y el análisis de los datos.
Una vez que el análisis está completo, las cuadros y las gráficas pueden servir como
ayudas visuales útiles para describir los datos; cuando se preparan cuadros y gráficas, el
propósito primario es comunicar la información obtenida.
213
Cuadros
Una cuadro es la agrupación de datos dispuestos en filas y columnas. Se puede
organizar casi cualquier información cuantitativa en un cuadro. Los cuadros son útiles
para demostrar patrones, excepciones a un patrón, diferencias y otras relaciones; además
sirven habitualmente como base para la preparación de gráficas, que son más visuales
pero que pueden perder algunos detalles.
Los cuadros diseñadas para presentar los datos deben ser lo más simple posible; dos o
tres pequeñas cuadros, cada uno enfocado en un aspecto diferente de los datos, son más
fáciles de entender que uno solo que contenga muchos datos.
Un cuadro debe entenderse por sí mismo; si se saca de su contexto original, debe
conservar la información necesaria para que el lector entienda los datos. Para crear un
cuadro que se entienda por si mismo, siga los siguientes pasos:
1. Use un título claro y conciso que describa el que, el cuando y el donde de los datos;
2. Encabece cada fila y cada columna e incluya las unidades de medida (por
ejemplo, años, mmHg, mg/dl, tasas por 100.000);
3. Muestre los totales de las filas y las columnas; si se muestran porcentajes, hay que
mostrar el total de ellos (siempre 100%);
4. Explique cualquier código, abreviatura, o símbolo en una nota de pie de página;
5. Anote cualquier exclusión en una nota a pie de página;
6. Anote la fuente de los datos en una nota a pie de página, si ellos no son originales.
Cuadros de una sola variable
El cuadro básico en la epidemiología descriptiva es una distribución de frecuencias
simple con una sola variable, como el cuadro 4.1a. en la primera columna del cuadro se
despliegan los valores o categorías de la variable representada en los datos, tales como
edad o sexo; la segunda columna muestra el número de personas o eventos en cada
categoría; con frecuencia, una tercera columna muestra el porcentaje de las personas o
los eventos en cada categoría.
214
Con frecuencia, una tercera columna muestra el porcentaje de las personas o de los
eventos en cada categoría, como en el cuadro 4.1b. Observe que los porcentajes en el
cuadro 4.1b suman 100,1% en vez de 100%, dado que se aproximaron las cifras a una
posición decimal. Esto ocurre con frecuencia en las cuadros que muestran porcentajes;
sin embargo, hay que mostrar el total de los porcentajes como 100% y explicar la
diferencia en una nota de pie de página.
Cuadro 4.1 a
Morbilidad por sífilis primaria y secundaria por edad, Estados Unidos, 1989
Grupo etario (años) Número de casos
14 230
15-19 4,378
20-24 10,405
25-29 9,610
30-34 8,648
35-44 6,901
45-54 2,631
55 1,278
Total 44,081
Fuente: 12
Cuadro 4.1 b
Morbilidad por sífilis primaria y secundaria por edad, Estados Unidos, 1989
Grupo etario Casos
(años) Número Porcentaje
14 230 0.5
15-19 4,378 10.0
20-24 10,405 23.6
25-29 9,610 21.8
30-34 8,648 19.6
35-44 6,901 15.7
45-54 2,631 6.0
55 1,278 2.9
Total 44,081 100.0*
*Los porcentajes no suman a 100% debido a redondeo
Fuente: 12
215
Se puede modificar el cuadro de una sola variable para mostrar la frecuencia acumulada
o el porcentaje acumulado, como en el cuadro 4.1c, en el cual es posible ver que 75.5%
de los casos de sífilis primaria y secundaria ocurrieron en los menores de 35 años.
Cuadro 4.1 b
Morbilidad por sífilis primaria y secundaria por edad, Estados Unidos, 1989
Grupo etario Casos
(Años) Número Porcentaje % Acumulado
14 230 0.5 0.5
15-19 4,378 10.0 10.5
20-24 10,405 23.6 34.1
25-29 9,610 21.8 55.9
30-34 8,648 19.6 75.5
35-44 6,901 15.7 91.2
45-54 2,631 6.0 97.2
55 1,278 2.9 100.0
Total 44,081 100.0* 100.0%
*Los porcentajes no suman a 100% debido a redondeo
Fuente: 12
Cuadros de dos o tres variables
Se puede hacer una tabulación cruzada para mostrar dos variables a la vez, como en el
cuadro 4.2 que muestra sexo y edad; éste cuadro se denomina cuadro de contingencia.
El cuadro 4.3 muestra un ejemplo común de una cuadro de contingencia, que se
denomina un cuadro de dos-por-dos porque cada una de las dos variables tiene dos
categorías. En epidemiología se usan con frecuencia los cuadros de contingencia para
mostrar los datos usados en el cálculo de medidas de asociación y pruebas de
significación estadística.
216
Cuadro 4.2
Casos nuevos de sífilis primaria y secundaria por edad y género,
Estados Unidos, 1989
Grupo etario Número de casos por sexo
(años) Masculino Femenino Total
14 40 190 230
15-19 1,710 2,668 4,378
20-24 5,120 5,285 10,405
25-29 5,304 4,306 9,610
30-34 5,537 3,111 8,648
35-44 5,004 1,897 6,901
45-54 2,144 487 2,631
55 1,147 131 1,278
Total 26,006 18,075 44,081
Fuente: 12
Además, los epidemiólogos usan los cuadros de dos por dos en estudios de asociación
entre la exposición y la enfermedad. Tales estudios comparan las personas con y sin
exposición y las personas con y sin la enfermedad. Una cuadro de dos por dos es una
manera conveniente de organizar los datos de estos tipos de estudios. El cuadro 4.4
muestra la forma general de éste tipo de cuadros.
Como se demuestra ahí, el estatus de enfermedad (por ej: enfermo vs. sano) es el
encabezado de las dos columnas y las dos filas se etiquetan con el estatus de exposición
(expuesto o no). Las letras "a", "b", "c" y "d" dentro de las casillas se refieren al número
de personas con la enfermedad indicada en las columnas y la exposición indicada en las
filas. Por ejemplo, "c" es el número de personas en el estudio que tienen la enfermedad,
pero que no tuvieron la exposición. "H" en las totales de las filas (H1 y H2) es la
abreviatura para "horizontal"; "V" en los totales de las columnas (V1 y V2) es la
abreviación por "vertical". El número total de las personas es representado por "T".
Cuadro 4.3
Estatus al seguimiento de un grupo de varones blancos con y sin diabetes,
Estudio de seguimiento de la Encuesta de Salud por Examen, 1982-1984
Defunciones Vivos Total % Fallecidos
Diabéticos 100 89 189 52.9
No diabéticos 811 2,340 3,151 25.7
Total 911 2,429 3,340
Fuente: 18
217
Cuadro 4.4
Forma general para un cuadro de dos por dos
Enfermo Sanos Total
Expuesto a b H1
No expuesto c d H2
Total V1 V2 T
Cuando se muestran los datos, es preferible usar un cuadro de una sola variable o de dos
variables. A veces, se quiere incluir una tercera variable para mostrar los datos en una
forma más completa; el cuadro 4.5 muestra una cuadro de tres variables (raza/etnia,
género y edad). Como se puede ver, una cuadro de tres variables está bastante lleno; es
bastante recargado; no debe usarse más de tres variables en una solo cuadro.
218
Cuadro 4.5
Morbilidqd por sífilis primaria y secundaria por edad, género y raza, Estados Unidos, 1989
Raza/Etnia
Edad (años) Género Blanco Negro Otras Total
Masculinos 2 31 7 40
14 Femeninos 14 165 11 190
Total 16 196 18 230
Masculinos 88 1,412 210 1,710
15-19 Femeninos 253 2,257 158 2,668
Total 341 3,669 368 4,378
Masculinos 407 4,059 654 5,120
20-24 Femeninos 475 4,503 307 5,285
Total 882 8,562 961 10,405
Masculinos 550 4,121 633 5,304
25-29 Femeninos 433 3,590 283 4,306
Total 983 7,711 916 9,610
Masculinos 564 4,453 520 5,537
30-34 Femeninos 316 2,628 167 3,111
Total 880 7,081 687 8,648
Masculinos 654 3,858 492 5,004
35-44 Femeninos 243 1,505 149 1,897
Total 897 5,363 641 6,901
Masculinos 323 1,619 202 2,144
45-54 Femeninos 55 392 40 487
Total 378 2,011 242 2,631
Masculinos 216 823 108 1,147
55 Femeninos 24 92 15 131
Total 240 915 123 1,278
Total de todas las Masculinos 2,804 20,376 2,826 26,006
edades Femeninos 1,813 15,132 1,130 18,075
Total 4,617 35,508 3,956 44,081
Fuente: 12
219
Ejercicio 4.1
Los datos del cuadro 4.6 describen las características de 36 residentes de unn un
ancianato durante un brote de una enfermedad diarreica.
A. Construya un cuadro de enfermedad (diarrea) por tipo de menú ingerido. Utilice el
estatus de diarrea como rótulo de las columnas y los tipos de menú como rótulos de
las filas.
B. Construya una cuadro 2 x 2 de la emfermedad (diarrea) por exposición al menú A.
Las respuestas, en la página 283.
220
Cuadro 4.6
Características de los residents del ancianato A durante un brote de enfermedad diarreica, Enero 1989
Número Edad Género Habitación Menú ¿Tuvo Fecha de
residente diarrea? inicio
1 71 F 103 A Si 15/1
2 72 F 105 A Si 23/1
3 74 F 105 A No
4 86 F 107 B No
5 83 F 107 B No
6 68 F 109 A Si 18/1
7 69 F 109 C No
8 64 F 111 A Si 16/1
9 66 M 111 A Si 18/1
10 68 M 104 A Si 20/1
11 70 M 106 A No
12 86 M 110 No
13 73 M 112 B No
14 82 M 219 C No
15 72 M 221 C No
16 70 M 221 B No
17 77 M 227 D No
18 80 M 227 D No
19 71 F 231 A Si 14/1
20 68 F 231 D Si 15/1
21 64 F 233 A No
22 73 F 235 A Si 13/1
23 75 F 235 B No
24 78 F 222 C No
25 72 F 222 A No
26 66 M 224 B No
27 69 M 226 A Si 16/1
28 75 M 228 E No
29 71 M 230 A SI 13/1
30 83 M 232 F No
31 84 M 232 D No
32 79 M 234 A Si 12/1
33 72 M 234 D Si 14/1
34 77 M 236 A SI 13/1
35 78 M 236 B No
36 80 M 238 D No
221
Cuadro de otras medidas estadísticas
Las cuadros 4.1 a 4.3 muestran números de casos (frecuencias). Además de mostrar el
número de casos, las celdas de una cuadro pueden mostrar promedios, tasas, años de
vida potencial perdidos, riesgos relativos y otras medidas estadísticas. Como en
cualquier otra cuadro, hay que identificar claramente el título y los encabezamientos de
los datos. Por ejemplo, tanto el título como los encabezamientos en la cuadro 4.7
muestran que se están presentando tasas.
Cuadro 4.7
Casos nuevos notificados de sífilis primaria y secundaria por cien mil habitantes,
tasas específicas por edad y raza, Estados Unidos
Grupo etario Tasas por cien mil
(Años) Blancos Negros Otros Total
≤14 0.0 2.4 0.8 0.4
15-19 2.4 131.5 51.0 24.3
20-24 5.8 323.0 139.2 55.9
25-29 5.4 270.9 117.9 44.1
30-34 4.7 256.6 83.2 38.8
35-44 2.9 135.0 47.8 19.0
45-54 1.7 76.7 29.6 10.5
≥55 0.5 19.4 10.4 2.4
Total 2.2 115.8 45.8 17.7
Fuente:12
Cuadros de salida
Aunque no se puede analizar los datos antes de recolectarlos, hay que diseñar los
métodos de análisis que se van a emplear con anticipación para facilitar el análisis
cuando ya se hayan recolectado. De hecho, la mayoría de los protocolos, escritos antes
de empezar el estudio, requieren una descripción de como se van a analizar los datos.
Como parte del plan de análisis, se puede desarrollar una "cuadro de salida" para
mostrar como se van a organizar y presentar los datos. Una cuadro en blanco es una
cuadro completa, con títulos, encabezamientos y categorías, pero sin datos; cuando se
desarrolla una cuadro de salida conteniendo variables contínuas, como edad, hay que
crear más categorías de las que usualmente se requieren, para poder visualizar cualquier
comportamiento o patrón de los datos que sean de interés.
222
Cuadro de salida 1
Características clínicas del síndrome de Kawasaki con
fechas de inicio entre octubre y diciembre de 1984
Características clínicas # con Porcentaje
característica
1. Fiebre ≥ 5 días _____ ( )
2. Congestión conjuntival bilateral _____ ( )
3. Cambios orales
Labios congestionados _____ ( )
Faringe congestionada _____ ( )
Labios secos y con fisuras _____ ( )
Lengua en fresa _____ ( )
4. Cambios en extremidades periféricas
edema _____ ( )
eritema _____ ( )
5. Rash _____ ( )
6. Linfadenopatía cervical <1.5 cm _____ ( )
_____ ( )
Total
_____ ( 100 )
Cuadro de salida 2
Característícas demográficas de los casos del síndrome de Kawasaki con fechas de
inicio entre Octubre y Diciembre de
Característícas demográficas Número Porcentaje
Edad
< 1año _____ ( )
1 año _____ ( )
2 año _____ ( )
3 años _____ ( )
4 años _____ ( )
5 años _____ ( )
6 años _____ ( )
Género
Masculino _____ ( )
Femenino _____ ( )
Raza
Blanca _____ ( )
Negra _____ ( )
Asiática _____ ( )
Otra _____ ( )
Total _____ ( 100 )
De la misma forma, se pudiera diseñar el cuadro de salida 2 como una cuadro de tres
variables con el número de casos por edad, sexo y raza.
223
Figura 4.1
Ilustración de cuadros de salida diseñados antes de conducir un estudio de casos y
controles del síndrome de Kawasaki
Cuadro de salida 3 Cuadro de salida 7
Municipio de Número % Característíca Casos Controles
residencia demográfica
______ ( ) Número % Número %
______ ( ) Edad <1 año ______ ( ) ______ ( )
1 año ______ ( ) ______ ( )
Cuadro de salida 4 2 años ______ ( ) ______ ( )
Ingreso del Hogar $ Número % 3 años ______ ( ) ______ ( )
≤10,000 ______ ( ) 4 años ______ ( ) ______ ( )
10,001-15,000 ______ ( ) 5 años ______ ( ) ______ ( )
15,001-20,000 ______ ( ) ≥6 añ6s ______ ( ) ______ ( )
20,001-30,000 ______ ( ) Género
30,001-35,000 ______ ( ) ______ ( ) ______ ( )
Masculino
≥35,000 ______ ( ) ______ ( ) ______ ( )
Femenino
Raza
Cuadro de salida 5 Blanca ______ ( ) ______ ( )
Número de días de Número % Negra ______ ( ) ______ ( )
hospitalización
0 ______ ( ) Asiática ______ ( ) ______ ( )
1 ______ ( ) Otra ______ ( ) ______ ( )
2 ______ ( ) Total ______ 100 ______ 100
3 ______ ( )
4 ______ ( ) Cuadro de salida 8
5+ ______ ( ) Casos Controles
Ingreso del Hogar
Media= _________ Número % Número %
$
Mediana=_________
Cuadro de salida 6 ≤10,000 ______ ( ) ______ ( )
Complicaciones Número % 10,001-15,000 ______ ( ) ______ ( )
graves
Cardíaca ______ ( ) 15,001-20,000 ______ ( ) ______ ( )
Artritis ______ ( ) 20,001-30,000 ______ ( ) ______ ( )
Defunción ______ ( ) 30,001-35,000 ______ ( ) ______ ( )
Total ______ 100 ≥35,000 ______ ( ) ______ ( )
Cuadro 3: La distribución de frecuencia por municipio de residencia
Cuadro 4: La distribución de frecuencia por los ingresos del hogar.
Cuadro 5: Dias de hospitalización (0 a máximo), media aritmética y mediana.
Cuadro 6: La distribución de frecuencia de las complicaciones graves (complicaciones cardiacas,
artriticas, muerte).
Cuadro 7: Las características demográficas (como la cuadro 2), con una comparación entre casos y
controles.
Cuadro 8. La distribución de frecuencia por los ingresos del hogar entre casos y controles
224
Cuadro de salida 9
Características epidemiológicas de los casos de síndrme de Kawasaki y sus controles
con fecha de inicio de Octubre a Diciembre de 1984
Características epidemiológicas Casos Controles
Número Porcentaje Número Porcentaje
Antecedentes de enfermedad Si ____ ( ) ____ ( )
No ____ ( ) ____ ( )
Razón de desigualdades (OR)=___._ Intervalo de Confianza del 95% = ( , )
2= __.__, valor de P= 0.____
Exposición a shampoo de Si ____ ( ) ____ ( )
alfombras
No ____ ( ) ____ ( )
Razón de desigualdades (OR)=___._ Intervalo de Confianza del 95% = ( , )
2= __.__, valor de P= 0.______
Esta secuencia de cuadros de salida provee un abordaje lógico y sistemático para el
análisis; por supuesto, una vez recogidos los datos y que los números han sido tabulados
en estos cuadros, se pensará en nuevos análisis a realizar.
225
Creacion de categorías
Algunas variables, tales como "género" o "¿comió ensalada de papas?" tienen un
número limitado de respuestas posibles; tales respuestas proveen categorías útiles para
incluir en un cuadro. Cuando se estudian variables con un rango de respuestas posibles
más amplio, tales como "tiempo" o "presión arterial sistólica", hay que agrupar los datos
en un número de categorías más manejable (intervalos de clase); para crear éstas
categorías, hay que tener en cuenta lo siguiente:
Elabore intervalos de clase mutuamente excluyentes que incluyan todos los
datos. Por ejemplo, si el primer intervalo es 0-5, hay que empezar el siguiente
intervalo con 6, no con 5. También hay que considerar los limites verdaderos de
las nuevas categorías. El límite superior de 0-5 es 5.4999...para la mayoría de
las categorías, pero es 5.9999 para la edad. Los límites verdaderos fueron
discutidos en la unidad 3.
Use un número relativamente grande de categorías creadas con intervalos de
clase estrechis para el análisis inicial. Es mejor combinar tales categorías
posteriormente; en general es ideal empezar con 4-8 categorías.
Use categorías con significación biológica o natural siempre que se pueda.
Trate de usar grupos de edad estandarizados o de uso común para el campo de
estudio específico. Si va a calcular tasas, el numerador debe coincidir con las
categorías de los datos de la población que va a usar.
Cree una categoría de "desconocido" o de "otros". Por ejemplo, en los
agrupamientos de edades mostrados en el cuadro 4.8, las categorías que se han
creado para ello son "edad no declarada", "desconocido", y "no declarada".
226
Cuadro 4.8
Algunas agrupaciones etarias estándares empleadas en el CDC
Enfermedades de Mortalidad por neumonía Tabulaciones finales de VIH/SIDA
notificación obligatoria e influenza estadísticas de mortalidad
<1 año <28 días <1 año <5 años
1-4 28 días -<1 año 1-4 5-12
5-9 1-14 5-14 13-19
10-14 15-24 15-24 20-24
15-19 25-44 25-34 25-29
20-24 45-64 35-44 30-34
25-29 65-74 45-54 35-39
30-39 75-84 55-64 40-44
40-49 85+ 65-74 45-49
50-59 Desconocida 75-84 50-54
60 + 85+ 55-59
Edad no declarada No declarada 60-64
+
Total Total Total
Fuente: 3, 4, 21
Si hay un grupo de base natural, se debe m antener como una categoría aparte, aún
cuando el resto de la distribución no tenga distinciones naturales; por ejemplo, cuando
se crean categorías para "fumadores" en términos de "número de cigarrillos fumados en
un día", hay que dejar los no fumadores (0 cigarrillos/día) como una categoría aparte y
agrupar los fumadores según cualquier método arbitrario, como se describe más
adelante.
Si no existen intervalos de clase naturales o estándar, hay varias estrategias para
crearlos, como se describe a continuación.
Estrategia 1: Dividir los datos en grupos de tamaño similar.
Con este sistema, se busca crear un número manejable de intervalos de clase, con más
o menos el mismo número de observaciones en cada uno. Al principio se pueden usar
8 intervalos, y después reducirlos a 4 para la presentación de los datos a otras
personas. En efecto, los 4 intervalos así creados representan los cuartiles de la
distribución de los datos. Este método es especialmente adecuado para crear las
categorías de los mapas de áreas.
Para aplicar esta estrategia, hay que dividir el número total de observaciones entre el
número de intervalos que se quiera crear; luego hay que desarrollar una columna de
frecuencias acumuladas de la distribución de los datos ordenados por orden numérico
para encontrar dónde se deben ubicar los límites de cada intervalo.
227
Estrategia 2: basar los intervalos en el promedio y la desviación estándar.
Con esta estrategia, se pueden crear 3, 4 o 6 intervalos de clase, para lo cual es
necesario encontrar la media y la desviación estándar de la distribución; luego, se usa
el promedio más o menos los múltiplos correspondientes de la desviación estándar
para establecer los límites de los intervalos.
Límite superior del intervalo 1 = la media - 2 desviaciones típicas
Límite superior del intervalo 2 = la media - 1 desviación típica
Límite superior del intervalo 3 = la media
Límite superior del intervalo 4 = la media + 1 desviación típica
Límite superior del intervalo 5 = la media + 2 desviaciones típica
Límite superior del intervalo 6 =valor máximo
Por ejemplo, si se quieren establecer 6 intervalos para unos datos con una media de
50, una desviación estándar de 10, un valor mínimo de 19 y un valor máximo de 82,
se calcularán los límites superiores de cada intervalo de la siguiente forma:
Límite superior del intervalo 1 = 50 - 20 = 30
Límite superior del intervalo 2 = 50 - 10 = 40
Límite superior del intervalo 3 = 50
Límite superior del intervalo 4 = 50 + 10 = 60
Límite superior del intervalo 5 = 50 + 20 = 70
Límite superior del intervalo 6 = 82
Si se añade el límite inferior obvio para cada intervalo, éstos serán:
intervalo 1 = 19 - 30
intervalo 2 = 31 - 40
intervalo 3 = 41 - 50
intervalo 4 = 51 - 60
intervalo 5 = 61 - 70
intervalo 6 = 71 - 82
Para crear 3 o 4 intervalos, se pueden combinar algunos de los límites de los
adyacentes:
Seis categorías Cuatro categorías Tres categorías
228
Seis Intervalos Cuatro Intervalos Tres intervalos
Intervalo 1 = 19-30
Intervalo 1 = 19-40 Intervalo 1 = 19-40
Intervalo 2 = 31-40
Intervalo 3 = 41-50 Intervalo 2 = 41-50
Intervalo 2 = 41-60
Intervalo 4 = 51-60 Intervalo 3 = 51-60
Intervalo 5 = 61-70
Intervalo 4 = 61-82 Intervalo 3 = 61-82
Intervalo 6 = 71-82
Estrategia 3: dividir el rango entre intervalos de clase iguales
Este es el método más sencillo y común, especialmente apropiado para utilizar en
gráficas. Para desarrollarlo es necesario:
1. Encontrar el rango de valores de los datos, i.e. encontrar la diferencia entre el valor
máximo (o algún valor conveniente un poco más grande) y cero (o el valor mínimo).
2. Decidir cuántos intervalos de clase (grupos o categorías) se harán. En general, para
cuadros se usan de 4 a 8 intervalos de clase y para gráficas y mapas se usan de 3 a 6; los
intervalos dependen de las características de los datos que se quiere visualizar.
3. Dividir el rango por el número de intervalos de clase que se decidió usar para
encontrar el tamaño de los intervalos.
4. Empezar con el valor mínimo del límite inferior del primer intervalo y especificar los
intervalos de clase de cualquier tamaño que se ha calculado hasta que se llegue al valor
máximo.
229
Cuadro 4.9
Tasas medias anuales de mortalidad por cáncer cervico uterino por 100,000 habitantes
por estados, ordenadas por rango, Estados Unidos, 1984-1986
Rango Estado Tasa por Rango Estado Tasa por
100,000 100,000
1 SC 5.6 26 KS 3.6
2 WV 5.6 27 AR 3.6
3 AL 5.4 28 MD 3.5
4 LA 5.4 29 IA 3.4
5 AK 5.1 30 PA 3.4
6 TN 4.9 31 FL 3.4
7 ND 4.9 32 HI 3.4
8 KY 4.8 33 OR 3.3
9 MS 4.7 34 ML 3.3
10 NC 4.6 35 CA 3.2
11 GA 4.6 36 ID 3.1
12 ME 4.6 37 AZ 3.1
13 VR 4.3 38 MA 2.9
14 DE 4.3 39 NM 2.9
15 NH 4.3 40 WA 2.8
16 IN 4.1 41 NV 2.8
17 OK 4.1 42 CT 2.8
18 IL 4.0 43 RI 2.8
19 MT 4.0 44 WI 2.7
20 VA 3.9 45 CO 2.5
21 OH 3.8 46 NE 2.4
22 MO 3.8 47 SD 2.4
23 TX 3.7 48 MN 2.2
24 NY 3.7 49 WY 1.9
25 NJ 3.7 50 UT 1.8
Total U.S. 3.7
Fuente: 2
Ejemplo
En este ejemplo, se demostrará cada estrategía para la creación de intervalos, usando los
datos de las tasas de mortalidad por cáncer de cérvix del útero del cuadro 4,9. En cada
caso, se crearán 4 intervalos de clase de las tasas.
230
Estrategia 1: Dividir los datos en grupos de similar tamaño
(Nota: Si el Cuadro 4.9 ha sido ordenado alfabéticamente, el primer paso sería
ordenarlo por rango de tasas. Afortunadamente, ésto ya se ha hecho.)
1. Dividir la lista en cuatro grupos iguales de lugares:
50 estados/4 = 12.5 estados por grupo. Como no podemos cortar un estado en dos,
tendremos que usar dos grupos de 12 estados y dos grupos de 13 estados. Como
Vermont (#13) podría ir tanto en el primero como en el segundo grupo y
Massachusetts (#38) podría ir tanto en el tercero como en el cuarto grupo, crearemos
los siguientes grupos:
a. Desde Carolina del Sur hasta Maine (del 1 al 12)
b. Desde Vermont hasta Nueva Jersey (del 13 al 25)
c. Desde Kansas hasta Arizona (del 26 al 37)
d. Desde Massachusetts hasta Utah (del 38 al 50)
Note que este orden sitúa a Vermont junto a Delaware (ambos tienen tasas de 4.3), y a
Massachusetts con Nuevo México (ambos con tasas de 1.8).
2. Identificar la tasa para el premero y el último estado de cada grupo:
Estados Tasas por 100,000
a. ME-SC 4.6-5.6
b. NJ-VT 3.7-4.3
c. AZ-KS 3.1-3.6
d. UT-MA 1.8-2.9
3. Ajustar los límites de cada intervalo de forma que no queden huecos entre el
final de uno y el comienzo del siguiente (Compare los intervalos de arriba con los de
abajo):
Estados Tasas por 100,000 Número de estados
a. ME-SC 4.5-5.6 12
b. NJ-VR 3.7-4.4 13
c. AZ-KS 3.0-3.6 12
d. UT-MA 1.8-2.9 13
231
Estrategia 2: Basar los intervalos en la media y la desviación estándar
1. Calcular la media y la desviación estándar (en la Unidad 3 se describe cómo
calcular estas medidas.):
Media = 3.70
Desviación típica = 0.96
2. Encontrar los límites superiores de 4 intervalos (Nota: demostramos cómo
crear 4 intervalos estableciendo primero 6 y luego combinando el par más bajo y el
más alto. Aquí, no obstante, simplemente usaremos el límite superior apropiado de
los pares que serán combinados.)
Límite superior del intervalo 1: media - 1 desv. típica = 2.74
Límite superior del intervalo 2: media = 3.70
Límite superior del intervalo 3: media + 1 desv. típica = 4.66
Límite superior del intervalo 4: valor máximo = 5.6
3. Seleccionar el límite inferior para cada límite superior para definir los cuatro
intervalos completos. Especificar los estados que caen en cada intervalo de clase
(Nota: Para situar los estados con las tasas mayores primero hemos invertido el orden
de los intervalos de clase):
Estados Tasas por 100,000 Número de estados
a. MS-SC 4.67-5.60 9
b. MO-NC 3.71-4.66 13
c. RI-TX 2.75-3.70 21
d. UT-WI 1.80-2.74 7
Estrategia 3: Dividir el rango en cuatro intervalos de clase iguales
1. Dividir el rango desde cero (o el valor mínimo) hasta el máximo, entre cuatro:
(5.6 – 1.8)/ 4 = 0.95
2. Usar múltiplos de 0.95 para crear cuatro categorías, comenzando a partir de
1,8:
de 1.80 a (1.8 + 0.95) = de 1.8 a 2.75
de 2.76 a (1.8 + 2•0.95) = de 2.76 a 3.70
de 3.71 a (1.8 + 3•0.95) = de 3.71 a 4.65
de 4.66 a (1.8 + 4•0.95) = de 4.66 a 5.6
232
3. Categorías finales:
Estados Tasas por 100,000 Número de estados
a. MS-SC 4.66-5.60 9
b. MO-NC 3.71-4.65 13
c. RI-TX 2.76-3.70 21
d. UT-WI 1.80-2.75 7
4. Alternativamente, como 0.95 está muy cerca de 1.0, podrían ser usados
múltiplos de 1 para crear las cuatro categorías. Comenzando por el valor central (5.6
+ 1.8)/ 2 = 3.7, sustraer 1.0 para determinar el límite superior del primer intervalo
(2.7). Los límites superiores de los intervalos tercero y cuarto serán 3.7 + 1.0 = 4.7, y
3.7 + 2•1.0 = 5.7.
Categorías finales:
Estados Tasas por 100,000 Número de estados
a. KY-SC 4.71-5.70 8
c. RI-TX 3.71-4.70 14
b. MO-MS 2.71-3.70 21
d. UT-WI 1.71-2.70 7
233
Ejercicio 4.2
Con los datos de mortalidad por cáncer cervico uterino presentado en el cuadro 4.9
utilice cada estrategia para crear tres intervalos de clase de las tasas.
Respuestas en la página 283
234
Cuadro 4.9 (Revisitado)
Tasas medias anuales de mortalidad por cáncer cervico uterino por 100,000 habitantes
por estados, ordenadas por rango, Estados Unidos, 1984-1986
Rango Estado Tasa por Rango Estado Tasa por
100,000 100,000
1 SC 5.6 26 KS 3.6
2 WV 5.6 27 AR 3.6
3 AL 5.4 28 MD 3.5
4 LA 5.4 29 IA 3.4
5 AK 5.1 30 PA 3.4
6 TN 4.9 31 FL 3.4
7 ND 4.9 32 HI 3.4
8 KY 4.8 33 OR 3.3
9 MS 4.7 34 ML 3.3
10 NC 4.6 35 CA 3.2
11 GA 4.6 36 ID 3.1
12 ME 4.6 37 AZ 3.1
13 VR 4.3 38 MA 2.9
14 DE 4.3 39 NM 2.9
15 NH 4.3 40 WA 2.8
16 IN 4.1 41 NV 2.8
17 OK 4.1 42 CT 2.8
18 IL 4.0 43 RI 2.8
19 MT 4.0 44 WI 2.7
20 VA 3.9 45 CO 2.5
21 OH 3.8 46 NE 2.4
22 MO 3.8 47 SD 2.4
23 TX 3.7 48 MN 2.2
24 NY 3.7 49 WY 1.9
25 NJ 3.7 50 UT 1.8
U.S. 3.7
Fuente: 2
235
Gráficas
Una gráfica es una forma de mostrar los datos visualmente, usando un sistema de
coordenadas. Es un tipo de fotografía estadística que ayuda a mostrar los patrones, las
aberraciones, las similitudes y las diferencias en los datos; es una forma ideal para la
presentación de los datos. El público recordará más de los aspectos importantes de los
datos cuando se presentan en una gráfica en vez de en una cuadro.
En epidemiología es habitual usar una gráfica de coordenadas en ángulo recto que
constan de dos ejes lineales, uno horizontal y uno vertical; denominadas el eje
horizontal o eje X o abscisas, y el eje vertical o eje Y, u ordenadas. En general, se usa el
eje horizontal para mostrar los valores de la variable independiente (X), que es el
método de clasificación, como tiempo, por ejemplo, y el eje vertical para mostrar la
variable dependiente (Y), que normalmente es una medida de frecuencia, como el
número de casos o la tasa de una enfermedad. Se encabeza cada eje para mostrar lo que
se representa (tanto el nombre de la variable como sus unidades) y se pone la escala de
medida a lo largo de la línea.
El cuadro 4.10 muestra el número de casos de sarampión por año de notificación desde
1950 a 1989. Hemos utilizado una porción de los datos para crear la figura 4.2. La
variable independiente años se muestra en el eje horizontal. La variable dependiente, el
número de casos, se muestra en el eje vertical. Se muestra un cuadriculado en la figura
4.2 para ilustrar como los datos se grafican. Por ejemplo, para el punto de los casos en
1953 en la gráfica desde la intersección con el nivel de 449 hacia la derecha, y así utilice
la figura para unir los puntos desde 1955 hasta 1959.
Gráficas lineales en escala aritmética
Una gráfica lineal en escala aritmética muestra los patrones o tendencias de una
variable, generalmente el tiempo. Normalmente en epidemiología se usa este tipo de
gráfica para mostrar una serie larga de datos y para comparar varias series. Es el
método ideal para elaborar una curva en el tiempo.
En una gráfica lineal en escala aritmética, una distancia fija a lo largo de un eje
representa la misma cantidad en cualquier parte del eje; esto es cierto tanto en el eje
de las X como en el eje de las Y. Se pueden mostrar varias series de datos en la misma
gráfica lineal de escala aritmética. La escala que se usa en el eje de las X depende de
las categorías usadas para las variables independientes en la recogida de los datos. En
general, cuando se inscriben los datos de "tiempo" se usan los mismos intervalos que
han sido usados en la recogida de la información, (p. ej.: semanas, años, etc.).
236
Cuadro 4.10
Sarampión por año de notificación, Estados Unidos, 1950-89.
Año Casos notificados (x100,000) Año Casos notificados (x100,000)
1950 319 1970 47
1951 530 1971 75
1952 683 1972 32
1953 449 1973 27
1954 683 1974 22
1955 555 1975 24
1956 612 1976 41
1957 487 1977 57
1958 763 1978 27
1959 406 1979 14
1960 442 1980 13
1961 424 1981 3
1962 482 1982 2
1963 385 1983 1
1964 458 1984 3
1965 262 1985 3
1966 204 1986 6
1967 63 1987 4
1968 22 1988 3
1969 26 1989 18
Fuente: 12
Figura 4.2
Gráfica parcial de sarampión por año de notificación, Estados Unidos, 1950-1959
Eje Y
Frecuencias
(Tasas, casos,
razones,
proporciones)
Intervalos
Iguales
Intervalos
Iguales
Fuente: 12
237
Figura 4.3
Ejemplo de gráfica en escala artimética:
Sarampión por año de notificación, Estados Unidos, 1950-1989
Casos
por
Licencia
de la
cien Vacuna
mil
habs.
Fuente: 12
Figura 4.4
Ejemplo de gráfica en escala artimética:
Rabia, en animales silvestres y domésticos por año de notificación, Estados Unidos,
1955-1989
Doméstica
Silvestre
Fuente: 12
238
Sin embargo, si se han usado intervalos muy pequeños en la recogida de los datos, se
puede reducir el número y aumentar el tamaño de ellos para mostrar los datos en
forma de gráfica.
Para seleccionar una escala para el eje Y, es necesario:
Construir el eje Y más corto que el eje X, para que la gráfica quede horizontal
(es decir, la longitud horizontal debe ser mayor que la longitud vertical) y
mantener una buena proporción entre los dos ejes: en general se recomienda
una relación X:Y de 5:3.
Empezar el eje Y siempre con 0.
Identificar el rango de valores que desea mostrar en el eje de las Y, para lo
cual encuentre el valor mayor de la variable Y y redondéelo al número
inmediato mayor. Por ejemplo, el valor mayo de la figura 4.3 es 763,094 en
1958. Este valor se puede redondear a 1,000,000 para determinar el rango de
valores a mostrar en el eje de las Y.
Seleccionar un tamaño de intervalo que nos de suficientes interva
los para mostrar los datos con el detalle que se requiere. En la figura 4.3 los
intervalos de 100,000 cada uno se considera adecuado para mostrar los
detalles importantes de los datos.
Si el rango de valorespara mostrar el eje de las Y incluye un período o
fracción sin datos, se debe anotar una interrupción en el eje correspondiente.
Con una interrupción en el eje de las Y la línea se interrumpe también en
donde la interrupción empieza y se reanuda donde los datos continúan. Las
interrupciones de los ejes solo se pueden usar con gráficas de escala lineal.
239
Ejercicio 4.3
En ambas gráficas, asegúrese de usar los intervalos adecuados para el rango de los
datos en el eje de las Y.
A. Construya una gráfica lineal en escala aritmética con los datos del sarampión de la
cuadro 4.11, mostrando la tasa de 1955-1990 con una sola línea.
b. Construya una gráfica lineal en escala aritmética con los datos del sarampión de
1980-
Cuadro 4.11
Tasas de sarampión por 100,000 habitantes por año de notificación, Estados Unidos, 1955-
90.
Año Tasa Año Tasa Año Tasa
1955 336.3 1967 31.7 1979 6.2
1956 364.1 1968 11.1 1980 6.0
1957 283.4 1969 12.8 1981 1.4
1958 438.2 1970 23.2 1982 0.7
1959 229.3 1971 36.5 1983 0.6
1960 246.3 1972 15.5 1984 1.1
1961 231.6 1973 12.7 1985 1.2
1962 259.0 1974 10.5 1986 2.6
1963 204.2 1975 11.4 1987 1.5
1964 239.4 1976 19.2 1988 1.4
1965 135.1 1977 26.5 1989 7.3
1966 104.2 1978 12.3 1990 10.7
Fuente: 12
Respuestas en la página 286.
240
Gráficas lineales en escala semilogarítmica.
En una gráfica lineal en escala semilogarítmica (una "gráfica semilog"), las divisiones
del eje Y siguen un patrón logarítmico en vez de aritmético como en las gráficas
lineales en escala aritmética. El eje X sigue teniendo una escala aritmética, como las
gráficas lineales de escala aritmética.
La figura 4.5 muestran un ejemplo de una gráfica semilogarítmica. FÍjese que el eje Y
tiene las siguientes características:
Hay cinco ciclos, de distancias iguales, a lo largo del eje.
Cada ciclo representa valores diez veces más grandes que el ciclo
inmediatamente anterior. Así, la distancia entre 1 y 10 es la misma que la
distancia entre 10 y 100.
Dentro de un ciclo hay diez marcas, siendo el espacio entre cada dos marcas
cada vez más pequeño al ir subiendo en la escala. Así, la distancia entre 1 y 2 no
es la misma que la distancia entre 2 y 3
El eje cubre un rango de valores de Y que hubiese sido difícil o imposible
mostrarlo en una escala aritmética. Las gráficas semilog son útiles cuando se
quiere mostrar un rango muy amplio de valores en una sola gráfica.
Figura 4.4
Ejemplo de gráfica semilogarítmica:Casos notificados de poliomielitis paralítica de
100,000 por año de ocurrencia, Estados Unidos, 1951-1989
Coordenadas escogidas para facilitar
la lectura
C
A
S
O
S
P
O
R
C
I
E
N
M
I
L
Fuente:12
241
Con una escala logarítmica, cierta distancia en el eje de las Y representa un porcentaje
igual de cambio, no una cantidad igual de cambio como en una escala aritmética. Por
eso, una gráfica semilog es especialmente útil para mostrar tasas de cambio.
Para interpretar los datos en una gráfica semilog, hay que entender las siguientes
características de la gráfica:
Una línea recta inclinada indica una tasa (no cantidad) constante de aumento o
disminución de los valores.
Una línea horizontal indica que no hay cambio.
La cantidad de inclinación indica la tasa de aumento o disminución.
Dos o más líneas paralelas muestran tasas de cambio iguales.
Cuando se construye una gráfica semilog, se usa el número de ciclos necesarios para
mostrar los valores máximos y mínimos de la variable Y. Se puede adquirir papel
gráfico semilogarítmico que en general incluye por lo menos tres ciclos. Para hallar el
número de ciclos que se necesita, es preciso:
1. Identificar en qué rango de múltiplos de 10 se encuentra el valor mínimo de Y.
Así se establece el rango del primer ciclo.
Por ejemplo, si el valor mínimo de Y es entre 10 y 100, el primer ciclo comenzará con
10 y terminará con 100; si está entre 100 y 1000, el primer ciclo comenzará con 100 y
terminará con 1000.
2. Identificar en qué rango de múltiplos de diez se encuentra el valor máximo de
Y. Así se establece el rango del último ciclo.
Por ejemplo, si el valor máximo de Y es entre 100.000 y 200.000, el último ciclo
empezará con 100.000. Aunque un ciclo completo que comienza con 100.000 debe
terminar con 1.000.000, no es necesario mostrar todo el ciclo; es suficiente con
mostrar algunos marcadores del último ciclo: 100.000, 200.000 y 300.000.
3. Identificar cuántos ciclos se encuentran entre el primero y el último ciclo; se
necesitará este número de ciclos, más dos para incluir el primero y el último ciclo.
Por ejemplo, si el valor mínimo de Y está entre 10 y 100 y el valor máximo de Y está
entre 100.000 y 200.000, se necesitarán los siguientes ciclos:
10 - 100
100 - 1.000
1.000 - 10.000
10.000 - 100.000
100.000 - 1.000.000
Así, con valores de Y entre 10 y 200.000, se necesitarán 4 ciclos y parte de un quinto.
242
Figura 4.6
Valores posibles pueden ser asignados a valores del eje de las Y
en una gráfica en escala-semilogarítmica
Valores Posibles
Máximo
C
U
A
T
R
O
C
I
Mínimo
C
L
O
S
Año
La figura 4.6 muestra los rangos de los valores que se deben mostrar en el eje de las Y
de 4 ciclos de una gráfica semi-log.
El tipo de gráfica que se usa depende principalmente de si se quiere mostrar los cambios
en sí de una serie de valores o si se quiere más bien enfatizar las tasas de cambio. Para
mostrar los cambios en una serie de datos se usa una escala aritmética en el eje de las Y
(una gráfica lineal de escala aritmética). Para mostrar las tasas de cambio se usa una
escala logarítmica en el eje de las Y (una gráfica lineal de escala logarítmica). Sin
embargo, se puede decidir usar una gráfica semilog cuando el rango de valores en el eje
de las Y es demasiado grande aún para mostrar cambios en la serie de datos.
243
Ejercicio 4.4
Grafique los datos de sarampión en el cuadro 4.11, de la página 279, en escala
semilogarítmica.
Respuestaas en la página 287.
244
Histogramas.
Un histograma es la gráfica de la distribución de frecuencia de una variable contínua, en
la cual se usan columnas adyacentes para representar el número de observaciones para
cada intervalo de clase en la distribución. El área de cada columna es proporcional al
número de observaciones en éste intervalo.
Las figuras 4.7, 4.8 y 4.9 muestran los histogramas de unas distribuciones de frecuencia
con intervalos de clase iguales. Dado que el tamaño de todos los intervalos de clase es
igual, la altura de la columna es proporcional al número de observaciones. No se
recomienda usar histogramas con intervalos de clase de tamaños diferentes, porque
son difíciles de construir e interpretar con seguridad. Tampoco se debe interrumpir la
escala en el ejeY, porque éste distorsionaría la presentación de las frecuencias
relativas.
Figura 4.7
Ejemplo de un histograma: Casos notificados de poliomielitis paralítica por mes de
ocurrencia, Omán, Enero 1988 a Marzo 1989
1 caso
Campañas de
vacunación oral
Areas en cada contra la polio
cuadrado son
idénticas
C
a
s
o No hay
s espacios
entre
columnas
No es esencial mostrar las líneas horizontales entre los casos
Ene Mar May Jul Sep Nov Ene Mar
1988 1989
Fuente: 24
245
Figura 4.8
Ejemplo de histograma: Niveles de colesterol entre 4,462 individuos del Estudio de
Salud de Varones, Estados Unidos, 1985-1986
N
ú
m
e
r
o
d
e
V
a
r
o
n
e
s
Nivel de Colesterol
Fuente: 13
La variable mostrada con mas frecuencia en el eje de las X es el tiempo, como se
muestra en las figuras 4.7 y 4.8. Sin embargo, se pueden usar otras variables contínuas,
como el colesterol o la presión arterial en el eje de las X. La figura 4.8 muestra la
frecuencia de las observaciones por intervalos de clase del nivel de colesterol.
Se puede mostrar una segunda variable en un histograma sombreando la segunda
variable con un color diferente dentro de la misma columna. Por ejemplo, se puede
mostrar el número de casos de una enfermedad por el tamaño de cada columna, y la
consecuencia de la enfermedad (fatal o no fatal) con diferentes colores. Sin embargo,
cuando se muestra los datos en ésta forma es difícil comparar el componente de arriba
de una columna con otra porque no tiene una base plana. Una alternativa es crear un
histograma separado por cada componente de la segunda variable, como en la figura
4.9.
Compare las figuras 4.9 y 4.10: muestran los mismos datos pero en formatos diferentes.
¿Cúal es el mejor formato para la comparación de los patrones de casos entre residentes
y no residentes?
246
Figura 4.9
Ejemplo de histograma:
Número de casos notificados de hepatitis A por fecha de inicio
y residencia en el municipio de Ogemaw, Abril-Mayo, 1968
Residente Ogemaw
C Residente municipio vecino
Residente otros municipio
a
s
o
s
Fuente: 22
Figura 4.10
Ejemplo de histograma: Número de casos notificados de hepatitis A por fecha de
inicio y residencia en el municipio de Ogemaw, Abril-Mayo, 1968
Residente Ogemaw
C Caso
a
s
o
s
Abril Mayo
C Residente municipio vecino
Residen fuera de Ogemaw Residente otros municipio
a
s
o
s
Fuente: 22
247
A veces se puede incluir una clave para mostrar cuantos valores de Y hay en un área
de la columna. La clave consiste en un cuadro o rectángulo, tan ancho como la
columna, con el número de casos representado por el área escrita al lado.
Con frecuencia los epidemiólogos desarrollan y discuten "curvas epidémicas". Una
curva epidémica no es una curva, sino un histograma que muestra los casos de una
enfermedad durante un brote, por su fecha de inicio. Con frecuencia se dibujan las
columnas como un cuadrados apilados en las columnas; en el que cada cuadro
representa un caso. La figura 4.9 muestra que una persona tuvo su fecha de inicio de
síntomas entre el 27 y 28 de abril, otra mas inicio entre el 29 y 30, y cinco casos
adicionales iniciaron entre el 1º y 2 de Mayo. Mostramos la duración de la epidemia en
el eje de las X en períodos de tiempo equivalentes. En una curva epidémica cada
número de las etiquetas debe estar centrado entre las marcas de cada intervalo.
Empleamos el intervalo de tiempo que sea adecuado al caso: por ejemplo, para un brote
de gastroenteritis por C. perfringens sería de horas, y de 3-5 días para un brote de
hepatitis A. Como regla general utilizamos intervalos menores a un cuarto del período
de incubación de la enfermedad que se muestra en el histograma. Empezamos a
graficar el eje de las X antes de que hubiese ocurrido el primer caso y mostramos
cualquier caso de la misma enfermedad que hubiese ocurrido en el período pre-
epidémico. Tales casos pueden representar lo mismo casos de fondo o sin relación
alguna. ¡Tenga presente que pueden ser la fuente del brote!
248
Ejercicio 4.5
Utilice los datos de la epidemia en el asilo del ejercicio 4.1 para dibujar una curva
epidémica. Describa las características de esta gráfica como si estuviera hablando por
teléfono con alguien que no puede verla.
Ver la respuesta, en la página 288.
249
Polígonos de frecuencia
Un polígono de frecuencia, como un histograma, es una gráfica de distribución de
frecuencias, en el cual se traza el número de observaciones contra los intervalos del eje
de las X con puntos individuales en la mitad de los intervalos y luego se conectan los
puntos con una línea recta. La figura 4.11 muestra un ejemplo de un polígono de
frecuencia sobre la línea externa de un histograma de los mismos datos. De rutina no se
debe mostrar los dos en una sola gráfica. Compare su construcción. Un polígono de
frecuencia de una serie de datos debe incluir la misma área que un histograma con los
mismos datos. Los polígonos de frecuencia ayudan a mostrar y comparar dos o más
distribuciones en la misma serie de ejes.
Fíjese que el histograma y la línea del polígono de frecuencia (cuando se mueve del
punto central al punto central) crean una serie de pares de triángulos de tamaños iguales
(uno dentro del histograma y el otro afuera), lo cual es un rasgoimportante de un
polígono de frecuencias ya que un polígono de frecuencia de unos datos debe cubrir la
misma área que un histograma de los mismos datos: para cada área que queda afuera del
histograma, el polígono tiene que incluir otra área de tamaño igual adentro.
Figura 4.11
Casos notificados de enfermedad semejante a influenza por inicio
Histograma
Polígono de
frecuencia
C
a
s
o Se conectan los punto
s medios de los intervalos
para crear el polígono
Semana de inicio de la enfermedad
Primer punto del dato Ultimo punto del dato
conectado al punto conectado al punto medio
medio del intervalo del intervalo siguiente del
cio
previo del eje de las X eje de las X
250
Para mantener un área total igual, hay que fijarse bien en la manera de "cerrar" el
histograma. La figura 4.12a muestra el método correcto la figura 4.12b el método
incorrecto. Al hacerlo correctamente, la línea de frecuencia empieza antes del primer
intervalo (en el centro de éste), afuera del histograma, y continúa con el centro del
primer intervalo que contiene datos, creando un área A' dentro del polígono que tiene el
mismo tamaño que el área A que está dentro del histograma pero fuera del polígono.
Fíjese que en la figura 4.11, se cierra el lado derecho del polígono de la misma forma.
Figura 4.12
Izquierda: Método correcto de cerrar un polígono
Derecha: Método incorrecto de cerrar un polígono
a. Correcto b. Incorrecto
En contraste la figura 4.12b muestra el método incorrecto de cerrar el polígono. Se
empieza la línea en la base del primer intervalo, dejando el área C fuera del polígono,
sin compensarla con otra área dentro; como consecuencia, el área del polígono no es
proporcional al número total de observaciones en la serie de datos.
Con un polígono de frecuencia, es fácil mostrar una comparación de dos o más
distribuciones en los mismos ejes. La figura 4.13 muestra una gráfica de una
comparación de tres polígonos de frecuencia y con la curva normal.
Un polígono de frecuencia difiere de una gráfica lineal de escala aritmética en varias
cosas. Se usa un polígono de frecuencia o un histograma para mostrar toda la
distribución de frecuencia de una variable contínua; se usa una gráfica lineal de escala
aritmética para mostrar una serie de puntos de observaciones (números absolutos o
tasas), usualmente a través del tiempo. Un polígono de frecuencias debe cerrarse en
ambos extremos porque el área por debajo de la curva es representativa de los datos;
una gráfica lineal de escala ritmética muestra solamente los puntos que representan los
datos.
251
Figura 4.13
Antropometría de niños de dos a 4 años de edad de Haití comparados con la población
de referencia de los CDC/OMS, departamentos septentrionales de Haití, 1990
Población de referencia
Peso para la talla
Talla para la edad
Peso para la edad
Puntuación de Z de referencia
Fuente: 9
Curvas de frecuencia acumulada y sobrevida
Como su nombre lo indica, una curva de frecuencia acumulada grafica la frecuencia
acumulada en vez de la frecuencia individual para cada intervalo de clase de una
variable. Se usa éste tipo de gráficas para identificar medias, quartiles y porcentajes. El
eje de las X registra los intervalos de clase y el eje de las Y muestra la frecuencia
acumulada o una escala absoluta (por ej.: el número de casos) o el porcentaje. Se
grafica cada frecuencia acumulada en el límite superior del intervalo que aplica, en vez
de al punto medio. Esta práctica permite que la gráfica represente visualmente el
número o porcentaje de observaciones por encima o por debajo del valor particular
(figura 4.14).
Se usa una curva de sobrevida en los estudios de seguimiento, para mostrar la
proporción de uno o más grupos que estén todavía vivos (o libres de la condición de
interés) en períodos diferentes a lo largo del tiempo. De forma similar a la curva de
frecuencia acumulada, el eje de las X registra períodos de tiempo y el eje de las Y
muestra porcentajes de cero a cien de los que aún viven. La diferencia más sobresaliente
entre las dos curvas es su forma misma: mientras la curva de frecuencia
252
Figura 4.14
Incidencia acumulada de infección por virus de hepatitis B por duración de
conducta de alto riesgo
% Usuariosde Drogas IV
I
n
f
e
c Homosexuales
t
a
d
o
c Trabajadores de la salud en
o
contacto frecuente con sangre
n
V
H Heterosexuales con
B múltiples parejas
Años a riesgo
Fuente: 1, 17, 19, 23
Figura 4.15
Curvas de sobrevida de una cohorte de pacientes con enfermedad arterial periférica
(EAP) (n=482) y sin EAP (n=262), Pittsburgh, Pennsylvania, 1977-1985
%
s
o
b
r Sin EAP
e
v
i
v
e
n Con EAP
Fuente: 20
Año
253
acumulada empieza en cero y en la parte más baja de la esquina izquierda de la gráfica y
va hacía cien en la esquina superior derecha, una curva de sobrevivencia empieza en
cien por ciento en la esquina superior izquierda y va disminuyendo hacía la esquina
inferior derecha en la medida que los pacientes van muriendo o sufirendo la condición
bajo estudio). La curva de sobrevida de la figura 4.15 compara el porcentaje de
sobrevivientes entre los pacientes que padecian de enfermedad arterial periférica (EAP)
y aquellos que no. ¿Cuál grupo tiene el porcentaje de sobrevida mas alto?. Para el 10
año la experiencia de sobrevida para los pacientes sin EAP era sustancialmente mejor
que para aquellos con EAP.
254
Diagramas de dispersión (nube de puntos)
Un diagrama de dispersión es una gráfica usada para detectar la relación entre dos
variables contínuas representadas una en el eje de las X y la otra en el eje de las Y. Para
crear un diagrama de dispersión se debe tener una pareja de valores para cada persona,
grupo u otra entidad en nuestra serie de datos, con un valor para cada variable; entonces,
se grafica cada par de valores colocando un punto en la gráfica donde los dos valores se
interceptan; la figura 4,16 muestra un diagrama de dispersión que grafica los niveles
séricos de tetraclordibenzo-p-dioxina (TCDD) por años de exposición para un grupo de
trabajadores.
Para interpretar un diagrama de dispersión se debe observar el patrón general hecho por
los puntos graficados; un patrón compacto indica un alto grado de correlación; puntos
muy dispersos indican una pequeña correlación. Si se requiere una medida cuantitativa
más exacta de la relación entre las variables en un diagrama de dispersión, se puede usar
un método de estadística formal como una regresión lineal. Estos métodos no son
cubiertos en este curso.
Figura 4.16
Ejemplo de gráfico de dispersión: Niveles séricos de tetra-cloro-dibenzo-p-dioxina (TCDD) ajustado
por lípidos en 253 trabajadores de acuerdo a los años de exposición, en 12 plantas químicas de los
Estados Unidos, 1987
T
C
D
D
g
X
g
d
e
g
r
a
s
a
Años de Exposición
Fuente: 16
255
Gráficas de una sola coordenada
Estas gráficas ilustran información estadística usando una sola coordenada; son más
apropiadas para comparar las magnitudes de diferentes categorías de un total, pero
tienen muchos otros usos.
Gráficas de barra
La gráfica de barra más simple es usada para mostrar en una forma visual los datos de
un cuadro de una sola variable; cada valor o categoría de una variable es representado
por una barra; la longitud de la barra es proporcional al número de personas o eventos
en ésta categoría; la figura 4.17 muestra el número de muertes infantiles por causa en
los EEUU; con ésta presentación, es muy fácil comparar la influencia de las diferentes
causas.
Las variables que se muestran en una gráfica de barra pueden ser discretas y no
continuas (raza o género) o se las trata como si fueran discretas y no continuas (grupos
de edad en vez de intervalos de edad en el eje). Se puede presentar las barras en forma
horizontal o vertical. La longitud o el tamaño de cada barra es proporcional a la
frecuencia del evento en esta categoría; por tal razón, no se debe graficar una
interrupción en el eje cuando se usa una gráfica de éste tipo porque puede dar lugar a
malas interpretaciones cuando se compara la magnitud de diferentes categorías.
Figura 4.11
Ejemplo de gráfica de barras horizontales:Número de muertes infantiles por causas
principales, Estados Unidos, 1983
Defectos congénitos
Bajo peso/Prematurez/Síndrome de
dificultad respiratoria
Muerte súbita
Hipoxia intrauterina/Asfixia neonatal
Lesiones no intencionales/Efectos
Adversos
Infecciones perinatales
Complicaciones de
placenta/membranas/cordón
Neumonía e influenza
Complicaciones maternas
Fuente: 6
256
Una gráfica de barras verticales difiere de un histograma en que las barras de la primera
son separadas, mientras que las barras de la segunda son unidas; ésta distinción existe
porque en un histograma se muestra la distribución de una variable contínua en el eje de
las X (p.ejemplo.colesterol sérico, edad) mientras que en una gráfica de barras, se
muestra en éste eje una variable discreta (sexo o raza).
Gráficas de barras agrupadas
Las gráficas de barras agrupadas se usan para ilustrar los datos de cuadros de dos o tres
variables, cuando una variable tiene únicamente dos categorías; las barras en un grupo
están generalmente unidas; éstas deben ilustrarse de manera distinta y describirse en una
nota a pie de página; es mejor limitar el número de barras en un grupo a no más de tres;
como se muestra en la figura 4,18, es difícil interpretar los datos cuando hay muchas
barras.
La gráfica de barras en la figura 4.19 representa tres variables: edad, género, y hábito de
fumar en la actualidad. El hábito de fumar es la variable consecuente y tiene dos
categorias:"si" y "no". Las barras representan las 10 categorias de edad/sexo. La altura
de cada barra es proporcional al porcentaje de fumadores actuales en cada categoría de
edad/ género.
Figura 4.18
Causas básicas de defunción entre menores de un año por
grupos raciales/étnicos, Estados Unidos, 1983
D
e
f.
x
m
i
l
n
v
r
Negros Indios Amer. Hispanos Asiat. Blancos Total
Raza/Etnia
Defectos Bajo peso/prematurez S. muerte súbita Otros
Cong. S dificultad respiratoria
Fuente: 6
257
Figura 4.19
Ejemplo de gráfica de barras verticales con anotación: Porcentaje de adultos que
fuman cigarrillos actualmente (personas de ≥18 años que han fumado alguna vez en
su vida al menos cien cigarrillos y que actualmente fuman) por edad y género,
Estados Unidos, 1988
Masculions
Una celda
Femeninos
separado por un
espacio
El significado de cada barra
es mostrado en una leyenda
Una
celda
Una celda puede
tener mas de una
% barra
Grupo Etario (Años)
Fuente: 10
Gráficas de barras apiladas
Es posible también mostrar categorías de una segunda variable como componentes de la
barra que representan la primera variable, como en la figura 4.20; éstas barras pueden
ser difíciles de interpretar porque, excepto por el componente de la base, los
componentes no están sobre la misma línea de base.
Gráficas de barras desviadas.
También se pueden usar barras para mostrar desviaciones tanto positivas como
negativas,en una variable, desde la línea de base. La figura 4.2 muestra una gráfica de
barras desviadas para algunas enfermedades de notificación obligatoria en los EEUU.
Se utiliza una gráfica similar en el Informe Semanal de Morbilidad y Mortalidad del
CDC. En esta gráfica, se compara el número de casos informados en las 4 semanas
anteriores con los informados en periodos comparables de los años anteriores. La
desviación a la derecha para la rubeóla indica un aumento por encima de los niveles
históricos; las desviaciones a la izquierda indican una reducción en comparación con
niveles anteriores. En ésta gráfica en particular, el eje de las X tiene una escala
logarítmica, que significa que una reducción o un aumento del 50% será representado
258
por barras de la misma longitud, pero en direcciones diferentes. Se resaltan los valores
más allá de los limites históricos (que son equivalentes a intervalos de confianza del
95%).
Figura 4.20
Causas básicas de defunción entre menores de un año por
grupos raciales/étnicos, Estados Unidos, 1983
Otras
S. de Muerte Súbita
D Prematurez/Bajo Peso/ S. de dificultad respiratorias
e
f. Defectos congénitos
x
m
i
l
n
v
Negros Indios Amer. Hispanos Asiat. Blancos Total
r Raza/Etnia
Fuente: 6
Casos 4 semanas
Enfermedad Decremento Incremento actuales
Meningitis aséptica
Encefalitis primaria
Hepatitis A
Hepatitis B
Hepatitis no A no B
Hepatitis sin especificar
Legionelosis
Malaria
Total de Sarampión
Infecciones
meningocóccicas
Parotiditis
Tosferina
Rabia Animal
Rubeóla
Por arriba de límites Razón en escala Log
históricos
Figura 4.21:Enfermedades de notificación, comparaciones de períodos cuatrisemanales que
terminaron el 26 de enero de 1991 con datos históricos, Estados Unidos, 1991
Fuente: 8
259
Gráficas de barra de componente 100%
Como variante de las barras apiladas, es posible construir todas las barras de la misma
altura y mostrar los componentes como un porcentaje del total en vez de mostrar sus
valores reales; éste tipo de gráfica es útil para comparar la contribución de los diferentes
componentes de cada categoría de la variable principal. La figura 4.22 muestra una
gráfica de componente 100%; fíjese que ella no es útil para comparar el tamaño relativo
de varias categorías de la variable principal; únicamente los totales dados arriba de las
barras indican que las categorías difieren en tamaño.
Figura 4.22
Causas básicas de defunción entre menores de un año por
grupos raciales/étnicos, Estados Unidos, 1983
Otras
S. de Muerte Súbita
Prematurez/Bajo Peso/ S. de dificultad respiratorias
Defectos congénitos
%
d
e
l
a
d
i
s
t
r
i
b
u
c
i
ó
n
Negros Indios Amer. Hispanos Asiat. Blancos Total
Raza/Etnia
260
Cómo construir una gráfica de barras
Para construir una gráfica de barras siga las siguientes instrucciones:
Organice las categorías que definen las barras o grupo de barras en orden, ya sea
alfabético, por edad, o en un orden que produzca barras de altura que aumenten
o disminuyan.
Elija la posición de las barras,(horizontal o vertical), como prefiera, excepto en
las barras de desviación que usualmente son horizontales.
Haga todas las barras del mismo ancho.
Haga la longitud de las barras en proporción con la frecuencia del evento; no
rompa la escala para no distorsionar la comparación del tamaño de las diferentes
categorías.
No muestre más de tres barras en un grupo de barras.
Deje espacios entre los grupos de barras adyacentes, pero no entre las barras de
un grupo.
Codifique las variables por diferentes colores, matices etc. e incluya la leyenda
que interprete ésta codificación.
261
Ejercicio 4.6
Utilice los datos del cuadro 4.12 para dibujar una gráfica de barras apiladas, otra de
barras agrupadas y otra mas de barras componentes de 100% para ilustrar la distribución
etaria de los casos de sífilis primaria entre hombres y mujeres blancos y negros en los
Estados Unidos. ¿Qué información es presentada mejor por cada tipo de gráfica?
Grupo etario Blanca Negra
(Años) Total
Masculinos Femeninos Masculinos Femeninos
< 20 90 267 1443 2422 4222
20-29 957 908 8180 8093 18138
30-39 931 478 6893 3676 11978
40+ 826 160 3860 941 5787
Total 2804 1813 20376 15132 40125
Fuente: 12
Respuestas en las páginas 289
262
Gráficas de pasteles (tartas)
Una gráfica de pastel es simple, fácil de entender, ya que el tamaño de las rebanadas es
proporcional a la contribución de cada componente; los pasteles son útiles para mostrar
los componentes de un solo grupo o variable.
Para hacer un pastel, hay que dibujar un círculo, después empezar en las 12 del reloj y
organizar los componentes desde el más grande hacía el más pequeño en el sentido de
las manecillas del reloj, generalmente se ponen las categorías de "otro" y "desconocido"
al final. Se pueden usar diferentes matices para distinguir entre los pedazos; hay que
mostrar, (en alguna parte de la gráfica), los porcentajes representados por cada pedazo,
porque no es fácil identificarlos a simple vista.
No se recomienda el uso de múltiples pasteles, como los de la figura 4.23 para comparar
los mismos componentes en más de un grupo de variables, porque la comparación es
difícil; cuando se quiere comparar los componentes de más de un grupo o variable, hay
que usar unas gráfica de barras de componente 100%.
Figura 4.23
Manera de muerte traumática entre trabajadores según género,
Estados Unidos, 1980-1985
Masculinos Femeninos
Lesiones no intencionales
Homicidio
Suicidio
Otros
Fuente: 11
263
Mapas (gráficas con coordenadas geográficas)
Los mapas o las gráficas con coordenadas geográficas son usadas para mostrar la
localización de eventos o atributos. Los mapas de puntos y los mapas de área son
ejemplos comúnmente usados por este tipo de gráficas. Los mapas de puntos usan
cualquier símbolo para mostrar donde ocurre un evento o existe la enfermedad. La
figura 4.24 es un ejemplo de un mapa de puntos.
Para hacer un mapa de puntos se coloca un símbolo en el sitio en donde el evento
ocurríó o existía la condición. Si los eventos están agrupados en una localización, puede
ser difícil distinguir entre puntos, entonces, es posible utilizar símbolos codificados (.=
1 caso, = 2 casos, = 3 casos etc.) que indican la ocurrencia de más de un evento.
Figura 4.24
Ejemplo de un mapa de puntos: Casos de histoplasmosis
por lugar de residencia, Austin, Minnesota, Cotubre-Noviembre 1984
Río Cedro
Noreste
Noroeste
Calle Oakland
Suroeste
Sureste
Aviario
Alberca Ciudad de Austin
Camino a la planta de carnes
Límites de la ciudad
Cuadrante
Ríos y arroyos
Vivienda caso índice
Fuente: CDC, datos sin publicar, 1984
264
Un mapa de puntos es útil para mostrar la distribución geográfica de un evento pero
(como es difícil tomar en consideración el tamaño de la población en riesgo) no se
muestra el riesgo de la ocurrencia del evento en este sitio particular, por ejemplo, el
riesgo de adquirir una enfermedad. Aún cuando un mapa de puntos muestre un gran
número de símbolos en la misma área, el riesgo de adquirir la enfermedad puede no ser
importante si el área es densamente poblada. Un mapa de área usa áreas colocadas o
codificadas para mostrar la incidencia del evento en partes de ésta o la distribución de
alguna condición en una región geográfica.
Figura 4.25
Casos presuntivos y confirmados de encefalitis de San Luis por
municipio de residencia, Florida, Julio-Octubre 1990
Fuente: 7
Se puede mostrar las tasas o la distribución en un mapa de área (figura 4.25); como con
el mapa de puntos, no se muestra el riesgo de un individuo de adquirir el evento; sin
embargo, si se muestran las tasas en un mapa de área, se puede ilustrar las diferencias en
265
el riesgo de presentar un evento en cada área. Por ejemplo, la figura 4.25 muestra el
número de casos de encefalitis de San Luis en 1990 en Florida según municipio, pero no
se pueden relacionar con la población a riesgo. Cuando se usan tasas se debe calcular la
tasa especifica, es decir, hay que dividir el número de casos en cada área por la
población en riesgo en ésta misma.
266
Ejercicio 4.7
Utilizando los datos de mortalidad por cáncer cervico-uterino del cuadro 4.9 en la
página 230, construye dos mapas de área basados en las dos primeras estrategias para
categorizar los datos en cuatro intervalos de clase como se describe en las páginas 231-
233.
Respuesta en la página 292
267
Diagramas de puntos y de caja (cajas y bigotes)
Un diagrama de puntos es similar a una gráfica de dispersión porque confronta una
variable contra otra; sin embargo, en un diagrama de punto, la variable del eje de las X
no es contínua, sino que representa las categorías discretas de una variable no continua.
Como se muestra en la figura 4.26, para ubicar una observación, hay que poner un punto
sobre la categoría apropiada de las X al nivel apropiado de las Y; hay que mostrar tantos
puntos en ésta posición como el número de observaciones con los mismos valores. Se
usa un diagrama de puntos para hacer una comparación visual de los puntos reales de
los datos de dos variables no continuas.
Figura 4.26
Ejemplo de diagrama de puntos: Resultados de anticuerpos (Ac) inhibidores de la
hemaglutinación (IH) contra el virus de la influenza porcina (VIP) entre ganaderos
asistentes a una feria, expuestos y no expuestos, Wisconsin, 1988
A
c
I
H
V
I
P
No expuestos Expuestos
Fuente: 26
Para comparar las distribuciones de dos variables no continuas se usa un diagrama o
gráfica de caja, también llamado de cajas y bigotes. Como se muestra en la figura 4,27;
la "caja" representa el rango interquartílico de los datos y "los bigotes" se extienden
hacía los valores máximos y mínimos. Se marca la posición mediana con una línea
vertical adentro de la caja; así, se puede mostrar (y comparar) el punto central (la
268
mediana), la dispersión (los cuartiles) y cualquier tendencia de desviación, como se
indica cuando la línea de la mediana no está centrada en la caja.
Figura 4.27
Ejemplo de diagrama de caja: Resultados de pruebas de ELISA indirecta para
anticuerpos IgG de virus parainfluenza tipo I en suero de pacientes en fase
convaleciente de casos y controles, Condado de Baltimore, Maryland, Enero 1990
Mediana
Casos (n=24)
Primer Piso
No Casos (n=26)
Fuente: CDC, datos sin publicar, 1990.
269
Un comentario sobre el uso de la tecnología informática
Existe un amplio número de paquetes de software para computadoras personales que
pueden ayudarnos a hacer cuadros, gráficos, y diagramas. La mayoría de estos
paquetes son muy útiles, especialmente a la hora de permitirnos redibujar un gráfico
sólo tecleando algunas órdenes. Con estos paquetes, hallar la curva epidémica más
adecuada ya no es una tarea tan ardua y tediosa: podemos dibujar gran número de
curvas rápida y fácilmente con diferentes intervalos de clase en el eje de las X.
Por otra parte, a veces caemos en la tentación de que el software dicte el gráfico. Por
ejemplo, muchos paquetes pueden dibujar diagramas de barras o de "tartas" que
parecen tridimensionales. ¿Quiere esto decir que deberíamos elaborar diagramas
tridimensionales? No debemos perder de vista nuestro propósito: comunicar
información a otras personas. ¿Comunicarán de mejor manera esa información los
diagramas tridimensionales que los bidimensionales?
Decida usted mismo: ¿Ofrece más información el diagrama tridimensional de la
figura 4.28b que el diagrama bidimensional de barras de la figura 4.28a? ¿Cuál es
más fácil de interpretar?
Si quisiéramos dirigir nuestra atención a la tendencia temporal de los casos
confirmados y los notificados, tal vez el diagrama tridimensional sea preferible. No
obstante, una gráfica
Figura 4.28a
Ejemplo de diagrama de barras bidimensional: Casos notificados y
confirmados de polio en las Américas, 1985-1989
confirmados
notificados
C
a
s
o
s
Año
Fuente: 5
270
Figura 4.28b
Ejemplo de diagrama de barras bidimensional: Casos notificados y
confirmados de polio en las Américas, 1985-1989
confirmados
notificados
C
a
s
o
s
Año
Fuente: 5
lineal en escala aritmética, con dos líneas podría ser la mejor de todas. Un problema
común de los gráficos de barras tridimensionales es que una barra de la línea de
delante puede ocultar a otra de la línea posterior. Suponga que estamos interesados en
la relación de los casos confirmados y los casos declarados cada año. En el diagrama
de barras bidimensional vemos inmediatamente que el número de casos confirmados
en 1985 es aproximadamente dos tercios del número de casos declarados en ese año.
¿Cuánto tiempo necesitaría observar el gráfico tridimensional para llegar a la misma
conclusión? Ahora compare la relación de los casos confirmados y los casos
declarados en los cinco años. Si necesitase comunicar esta información conuna
diapositiva en 20 segundos durante una presentación oral, ¿qué figura preferiría
mostrar?
271
¿Aporta el gráfico de pastel tridimensional de la figura 4.29b alguna información más
que el gráfico bidimensional de la figura 4.29a? ¿Puede Vd. juzgar los tamaños
relativos de los componentes también en la versión tridimensional? Observe el pastel
tridimensional y borre o tape los porcentajes de los hispanos y de los asiáticos/isleños
del pacífico. ¿Realmente podría decir qué porción es mayor y en qué medida?
Creemos que no podría. ¿Podría decir esa información a partir del pastel
bidimensional? Recuerde que el único propósito del diagrama tipo pastel es poner de
relieve el tamaño.
La adición de características llamativas que no añaden información alguna a una
figura, y que, incluso, pueden conducir a interpretaciones erróneas, se ha denominado
gráfico-chatarra (25).
Figura 4.29a
Ejemplo de gráfica pastel bidimensional: Porcentaje de casos de tuberculosis por
etnias, Estados Unidos, 1989 (n=23,495)
Indios Americanos/Nativos de Alaska
Asiáticos/Isleños del Pacífico
Negros no Hispanos
Hispanos
Blancos no Hispanos
Fuente: 12
272
Figura 4.29b
Ejemplo de gráfica pastel bidimensional: Porcentaje de casos de tuberculosis por
etnias, Estados Unidos, 1989 (n=23,495)
Indios Americanos/Nativos de Alaska
Asiáticos/Isleños del Pacífico
Negros no Hispanos
Hispanos
Blancos no Hispanos
Fuente: 12
Muchas personas utilizan arbitrariamente la tecnología al seleccionar el color,
especialmente en diapositivas que acompañan exposiciones orales. Si usted usa
colores o piensa hacerlo, siga estas recomendaciones:
* Seleccione los colores de forma que todos los componentes del gráfico -
título, ejes, datos, leyendas- resalten claramente sobre el fondo, y de forma
que cada serie de datos enumerados se distinga con claridad de las demás.
Evite contrastar el rojo y el verde, ya que hasta un 10% de los varones entre el
público puede tener cierto grado de ceguera para los colores.
* Si es posible, seleccione los colores de forma que comuniquen información.
Por ejemplo, consideremos un mapa en el que los estados están divididos en
cuatro grupos según las tasas de una determinada enfermedad. Más que elegir
los colores únicamente por razones estéticas, debería escoger un color
suave para los estados con las tasas más bajas e ir usando colores más oscuros
a la par que las tasas sean mayores. De esta forma, los colores contribuirán,
más que a distorsionar o distraer, a facilitar la información que desea
transmitir.
273
Finalmente, con algunos paquetes de software, no podrá producir algunos de los tipos
de gráficos descritos en este manual. Especialmente, algunos paquetes informáticos
no pueden crear histogramas; en lugar de éstos, producen diagramas de barras. Sus
gráficas deberán estar determinadas por sus datos y las relaciones que desee
comunicar visualmente, no por la tecnología que tenga disponible. Si el software que
tiene no es capaz de ajustarse a sus datos, no comprometa la integridad de éstos o su
presentación. ¡Use otro software!
Selección y construcción de cuadros, gráficos, diagramas y mapas
Para comunicar los hallazgos epidemiológicos, debe seleccionarse en primer lugar la
mejor forma de ilustrarlos. Sin embargo, incluso el mejor método debe elaborarse de
forma adecuada o el mensaje se perdería. Las cuadros de esta sección proporcionan
una guía a la hora de elegir los métodos de ilustración y de construcción de cuadros,
gráficas y diagramas/mapas.
274
Cuadro 4.13
Guia para seleccionar una gráfica o diagrama/mapa para ilustrar datos
epidemiológicos
Tipo de gráfico o diagrama/mapa Cuando emplearlo
Gráfica lineal en escala aritmética Tendencias en cifras absolutas o tasas en el tiempo
Gráfica lineal en escala semilogarítmica 1. Enfattizar tasa de cambio en el tiempo
2. Desplegaar valores que varían en un orden de magnitud de
mas de dos veces
Histograma 1. Distribución de frecuencia en escala contínua
2. Número de casos durante una epidemia (curva epidémica)
o a lo largo del tiempo
Polígono de frecuencias Distribución de frecuencias de una variable en escala
continua, especialmente para mostrar componentes
Frecuencia acumulada Frecuencia acumulada de una variable continua
Diagrama de dispersion Graficar la asociación entre dos variables continuas
Gráfica o diagrama de barras simples Comparar el tamaño o frecuencia de diferentes categories de
una sola variable
Gráfica o diagrama de barras agrupadas Comparar el tamaño o frecuencia de diferentes categories de
2-4 series de datos
Gráfica o diagrama de barras apiladas Comparar totales e ilustrar las partes componentes del total
en diferentes grupos
Gráfica o diagrama de barras de desviación Ilustrar diferencias, tanto positivas como negativas con
respecto a un nivel basal
Gráfica o diagrama de barras componentes de Comparar como las partes componentes contribuyen a un
100% total en grupos deiferentes
Diagrama o gráfica de pastel Mostrar los componentes de un total
Mapa de puntos Mostrar la localización de casos o eventos
Mapa de áreas Desplegar eventos o tasas geográficamente
Diagrama de cajas y bigotes Visualizar las características estadísticas de dispersion
(mediana, rango, sesgo) de una variable
275
Cuadro 4.14
Seleccione un meotod para ilustrar datos epidemiológicos
Si los datos son: Y las siguientes condiciones aplican: Entonces, escoga:
Series de tiempo Número de casos 1-2 series Histograma
(epidemia o tendencia
secular)
2 o mas series Polígono de frecuencias
Tasas Rango de valores ≤2 Gráfica lineal en escala
ordenes de magnitud artimética
Rango de valores ≥ 2 Gráfrica lineal en escala
ordenes de magnitud semi logarítmica
Datos en escala continua que Distribución de frecuencias Histograma o polígono
no sean series de tiempo de frecuenicas
Datos en categories discretas Gráfica de barras o
(que no sea lugar) pastel
Lugar Número de No identificable en un mapa Gráfica de barras
casos
Identificable en un Sitio específico es Mapa de puntos
mapa importante
Sitio específico no es Mapa de área
importante
Tasas Mapa de área
276
Cuadro 4.15
Lista para la construcción de cuadros, gráficas, y representaciones visuales.
Lista para los cuadros.
1. Título.
¿Tiene el cuadro un título?
¿ Describe el título el contenido, incluyendo el tema, persona, lugar y tiempo ?
¿ Está el título precedido por una designación " Cuadro # " ? ( " Cuadro " se
utiliza para presentar textos, " Figura " para gráficas, diagramas y mapas. Las
secuencias numéricas separadas se utilizan para tablas y figuras en el mismo
documento [ por ejemplo, Cuadro 1, Cuadro 2, Figura 1, figura 2 ]).
2. Filas y columnas.
¿ Está cada fila y columna rotulada de forma clara y concisa ?
¿ Se muestran las unidades específicas de medida ? (por ejemplo, años, mm
Hg, mg/dl, tanto por 100.000, etc).
¿ Son las categorías apropiadas para los datos ?
*¿ Se proporcionan los totales de las filas y de las columnas ?
3. Notas de pie de página.
¿ Están todos los códigos, abreviaciones o símbolos explicados ?
¿ Están todas las exclusiones anotadas ?
¿ Si los datos no son originales se proporciona la fuente ?
Lista para gráficas, diagramas y mapas.
1. Título.
¿ Tiene la gráfica o diagrama un título ?
¿ Describe el título el contenido, incluyendo el tema, persona, lugar y tiempo ?
¿ Está el título precedido por una designación " Figura # " ? ( " Cuadro" se
utiliza para presentar textos, " Figura " para gráficas, diagramas y mapas. Las
secuencias numéricas separadas se utilizan para los cuadros y figuras en el
mismo documento [ por ejemplo, Cuadro 1, Cuadro 2, Figura 1, Figura 2 ]).
2. Ejes.
¿ Está cada eje rotulado de forma clara y concisa ?
¿ Están las unidades específicas de medida incluidas como parte del rótulo ? (
Por ejemplo, años, mm Hg, mg/dl, tantos por 100.000, etc).
277
¿ Están las divisiones de la escala indicadas en los ejes de forma clara ?
¿ Son las escalas de cada eje apropiadas para los datos ?
¿ Comienza el eje en cero ?
Si se utiliza una interrupción en una gráfica de líneas de escala, ¿Se identifica
fácilmente ?
¿ Se ha utilizado una interrupción en un histograma, polígono de frecuencia, o
diagrama de barras ? ( La respuesta debería ser NO).
¿ Están los ejes dibujados de forma más acentuada que el resto de las líneas
de coordenadas?
3. Líneas de coordenadas.
¿ Incluye la figura únicamente tantas líneas de coordenadas como son
necesarias para guiar la vista ? (A menudo éstas son innecesarias).
4. Trazado de los datos.
¿ Está el trazado dibujado de forma clara ?
Si se muestra más de una serie de datos o componentes, ¿ Se distinguen
claramente sobre el mapa ?
¿ Está cada serie o componente rotulado en el mapa o en una leyenda o clave
?
Si se utiliza color o sombreado en un mapa de superficie,¿ Corresponde un
incremento de color o de sombreado con un incremento en la variable que se
está mostrando ?
5. Notas de pie de página.
¿ Están todos los códigos, abreviaturas o símbolos explicados ?
¿ Están todas las exclusiones anotadas ?
Si los datos no son originales, ¿ Se proporciona la fuente ?
6. Representación visual.
¿ Incluye la figura alguna representación que no es necesaria ?
¿ Está la figura colocada en la página para una óptima lectura ?
¿ La combinación de tamaños y colores mejora la lectura ?
278
Cuadro 4.15 (continuación)
Lista para la construcción de cuadros, gráficas, y representaciones visuales.
Lista para unas representaciones visuales efectivas.
1. Legibilidad (asegúrese de que su audiencia puede leer fácilmente sus
representaciones).
¿ Pueden leerse los encabezados de sus transparencias desde una distancia de
6 pies (1,8 metros) cuando no están proyectadas ?.
¿ Puede una diapositiva de 35 mm leerse desde una distancia de 1 pie (30,48
cm) cuando no está proyectada?
¿ Cuando se proyectan pueden sus visuales leerse desde los lugares más
lejanos de la habitación ?
2. Simplicidad (mantenga un mensaje simple).
¿ Ha utilizado palabras sencillas ?
¿ Se presenta la información en el lenguaje de la audiencia ?
¿ Ha utilizado únicamente palabras claves ?
¿ Ha omitido conjunciones, preposiciones, etc?
¿ Se limita cada representación solamente a una idea, concepto o tema
principal ?
¿ Tiene cada visual no más de tres colores ?
¿ Hay no más de 35 letras y números en cada visual ?
¿ Hay no más de 6 líneas de narración y no más de 6 palabras por línea ?
279
Cuadro 4.15 (continuación)
Lista para la construcción de cuadros, gráficas, y representaciones visuales.
3. Multitud de colores.
Los colores que elija tendrán un impacto sobre el efecto de sus
representaciones. Debería utilizar colores cálidos/calientes para enfatizar,
destacar, enfocar o para reforzar los conceptos claves. Debería utilizar colores
fríos en el fondo o para separar los párrafos. Utilice la siguiente tabla para
seleccionar el color apropiado para el efecto que desea.
Caliente Cálido Fresco Frío
Colores Rojos Naranja ligero Azul ligero Azul oscuro
Naranja brillante Amarillo ligero Verde ligero Verde oscuro
Amarillo brillante Dorado ligero Púrpura ligero Púrpura oscuro
Dorado brillante Marrones Gris ligero Gris oscuro
Efecto Excitante Moderado Apagado Sombrío
¿ Está utilizando la mejor combinación de colores?
El párrafo más importante debería estar en el color más relevante y tener mayor
contraste con respecto al fondo. La combinación de colores más legible es:
Negro sobre Amarillo.
Negro sobre Blanco.
Verde oscuro sobre Blanco.
Azul oscuro sobre Blanco.
Blanco sobre Azul oscuro.
4. Precisión.
Las representaciones se convierten en distracciones cuando se
advierten los errores. Cuente con alguien que no haya visto las
representaciones para que compruebe si no hay incorrecciones y errores en
general.
5. Durabilidad.
Las transparencias y diapositivas de 35 mm son las ayudas visuales
más duraderas. Sin embargo, ambas requieren una protección contra los
arañazos. Una lámina de acetato protegerá la transparencia. Mantenga las
diapositivas de 35 mm en un lugar frío y seco. Si se dejan a la luz, los colores
se estropearán.
280
Resumen
Las cuadros, gráficos, diagramas y mapas son herramientas eficaces para resumir y
comunicar datos. Las cuadros se usan comúnmente para expresar números, tasas,
proporciones y porcentajes acumulados. Como la finalidad de éstas es precisamente la
comunicación de información, la mayoría de ellas no deben tener más que dos
variables y no más de ocho categorías (intervalos de clase) por cada variable. Las
cuadros se usan en ocasiones fuera de contexto, por lo que deberían ser titulados
correctamente y detallar en ellas los datos más importantes como referencia.
Las cuadros pueden desplegar tanto datos nominales u ordinales continuos. Las
variables nominales como género y residencia tienen unas categorías obvias. Las
variables continuas no; deben crearse para ellas intervalos de clase. Para algunas
enfermedades se han adoptado unos intervalos de clase estándar como es el caso de la
edad. Por otro lado, existe gran variedad de métodos para establecer intervalos
razonables para variables contínuas los que incluyen: crear intervalos con un número
igual de personas u observaciones en cada uno; intervalos de clase de una extensión
constante; e intervalos de clase basados en la media y la desviación estándar.
Los gráficos, mapas y diagramas son herramientas incluso más eficaces cuando se
trata de comunicar datos rápidamente. A pesar de que muchas personas usan los
términos gráfico mapa y diagrama indistintamente, en esta unidad nos referimos con
gráfico a una figura con dos coordenadas, un eje x horizontal y un eje y vertical. En
otras palabras, ambas variables son continuas. Por ejemplo, en el eje y con frecuencia
representamos datos como el número de casos o la tasa de la enfermedad, mientras
que en el eje x señalamos el tiempo. Por el contrario, hablamos de diagrama
refiriéndonos a una figura con una variable continua y una nominal. Por ejemplo, un
diagrama podría representar el número de casos (variable continua) en relación al
género (variable nominal).
Los gráficos lineales en escala aritmética han sido usados tradicionalmente para
mostrar las tendencias temporales de las tasas de las enfermedades. Los gráficos
lineales en escala semilogarímica se prefieren cuando las tasas varían entre por
encima de dos o más órdenes de magnitud. Los histogramas y polígonos de frecuencia
se utilizan para mostrar las distribuciones de frecuencias. Un tipo especial de
histograma conocido como curva epidémica muestra el número de casos por tiempo
de comienzo de la enfermedad o momento del diagnóstico durante un período
epidémico. Los casos pueden representarse por cuadrados que se unen para formar las
columnas del histograma; los cuadrados pueden marcarse para distinguir
características importantes de los casos, como el desenlace fatal.
281
Los diagramas de barras simples y los de pastel se utilizan para representar la
distribución frecuencial de una sola variable. Los diagramas de barras agrupadas
pueden representar las frecuencias de dos, o incluso tres variables. Los mapas de
puntos señalan la localización de cada sujeto o suceso. Un mapa de áreas usa el
sombreado o el coloreado para mostrar los distintos niveles de números o tasas de una
enfermedad en las distintas zonas. Cuando se utilizan estas herramientas, es
importante recordar su finalidad: resumir y comunicar. Las figuras sobrecargadas y de
vistosos colores no son necesariamente mejores; ¡a veces cuanto menos, mejor!
282
Respuesta a los Ejercicios
Ejercicio 4.1 (página 220)
Ocurrencia de diarreas por menú entre residentes del ancianato A, 1989
Diarrea
Menú Si No Total
A 12 5 17
B 0 7 7
C 0 4 4
D 2 4 6
E 0 1 1
F 0 1 1
Total 14 22 36
B.
Ocurrencia de diarreas por exposición al menú A, entre residentes del ancianato A, 1989
Diarrea
Si No Total
Si 12 5 17
Menú A No 2 17 19
Total 14 22 36
Ejercicio 4.2 (página 234)
Estrategia 1: Dividir los datos en grupos de tamaño similar
Dividir la lista en tres grupos de estados de igual tamaño:
50 estados /3 = 16.67 estados por grupo. Así, dos grupos contendrían 17 estados y un
grupo contendría 16 estados.
Oklahoma (#17) podría ir tanto en el grupo 1 como en el 2, pero como tiene la misma
tasa que Indiana (#16), tiene sentido poner Oklahoma en el grupo 1. Análogamente,
como Michigan (#34) podría ir tanto en el grupo 2 como en el 3, y tiene la misma tasa
que Oregon (#33), debería incluirse en el grupo 2.
283
Categorías finales:
Estados Tasa por cien mil Número de estados
1. OK-SC 4.1-5.6 17
2. MI-IL 3.3-4.0 17
3. UT-CA 1.8-3.2 16
Estrategia 2: Categorías basadas en la media y la desviación estándar
Cree 3 categorías basándose en la media (3.70) y la desviación típica (0.96):
límite superior de la categoría 1 = media - 1 desviación típica = 3.70-0.96 = 2.74
límite superior de la categoría 2 = media + 1 desviación típica = 3.70+0.96 = 4.66
límite superior de la categoría 3 = valor máximo = 5.6
Categorías finales:
Estados Tasa por cien mil Número de estados
1. MS-SC 4.67-5.60 9
2. RI-NC 2.75-4.66 34
3. UT-WI 1.80-2.74 7
Estrategia 3: Dividir el rango en intervalos de clase iguales
Divida el rango entre 3: (5.60-1.80) /3 =1.267
Use múltiplos de 1.27 para crear las 3 categorías, comenzando por 1.8:
1.- Desde 1.80 hasta (1.80+1.27)= desde 1.80 hasta 3.07
2.- Desde 3.08 hasta (1.80+ 2•1.27)= desde 3.08 hasta 4.34
3.- Desde 4.35 hasta (1.80+ 3•1.27)= desde 4.35 hasta 5.61
Categorías finales:
Estados Tasa por cien mil Número de estados
1. ME-SC 4.35-5.61 12
2. AZ-VT 3.08-4.34 25
3. UT-MA 1.80-3.07 13
284
O bien, redondeando las cifras:
Estados Tasa por cien mil Número de estados
1. ME-SC 4.4-5.6 12
2. AZ-VT 3.1-4.3 25
3. UT-MA 1.8-3.1 13
285
Respuesta al ejercicio 4.3 (página 240)
A. y B.
Figura 4.30
Incidencia anual de sarampión en los Estados Unidos por cien mil habitantes, 1955-
1990 con una subserie interior de 1980 a 1990
c
a
s
o
s
c
x
a
s ci
e
o n
s
m
i
x l
c
i
e Año
n
m
il
Año
Fuente: 12
286
Respuesta al ejercicio 4.4 (página 244)
Figura 4.31
Incidencia anual de sarampión en los Estados Unidos por
cien mil habitantes, 1955-1990
c
a
s
o
s
x
c
i
e
n
m
il
Año
Fuente: 12
287
Respuesta al ejercicio 4.5 (página 249)
Figura 4.32
Brote de enfermedad diarreica en ancianato A, Enero de 1989
C
a
s
o
s
Fecha de inicio
Este brote aparentemente duró apenas dos semanas, de Enero 12 a Enero 23. Después
del caso inciial del 12 de Enero, el pico ocurrió el día siguiente con tres casos el 13 de
Enero. La curva permaneció relativamente aplanada después con dos casos en cuatro
de los cinco dias siguientes y otros dos al sexto día siguiente. Ocurrieron casos únicos
los días 20 y 23.
288
Respuesta al ejercicio 4.6 (página 262)
Figura 4.33a
Gráfica de barras apiladas: Número de casos de sífilis primaria y secundaria por edad,
género y raza, Estados Unidos, 1989
Años
M
i
l
e
s
d
e
c
a
s
o
s
Hombres Mujeres Hombres Mujeres
Blancos blancas negros negras
Fuente: 12
289
Figura 4.33b
Gráfica de barras agrupadas: Número de casos de sífilis primaria y secundaria por
edad, género y raza, Estados Unidos, 1989
M
i
l
e
s
d
e
c
a
s
o
s
Hombres Mujeres Hombres Mujeres
Blancos blancas negros negras
Años
290
Figura 4.33 c
Gráfica de barras componentes de 100%: Número de casos de sífilis primaria y secundaria por edad,
género y raza, Estados Unidos, 1989
Distribu-
ción
% Años
por
edad
Hombres Mujeres Hombres Mujeres
Blancos blancas negros negras
291
Respuesta al ejercicio 4.7 (página 267)
A.
Figura 4.34a
Estrategia 1: Media anual de tasas de mortalidad ajustadas por edad de cáncer
cervico-uterino por estado, Estados Unidos, 1984-1986
Fuente: 2
292
B.
Figura 4.34b
Estrategia 2: Media anual de tasas de mortalidad ajustadas por edad de cáncer
cervico-uterino por estado, Estados Unidos, 1984-1986
Fuente: 2
293
Examen de autoevaluación 4
Ahora que ya ha leído la unidad 4 y ha realizado sus ejercicios, debería estar
preparado para responder al examen de autoevaluación. Este examen está diseñado
para ayudarle a establecer en qué medida ha asimilado el contenido de esta lección.
Podrá volver al texto en cualquier momento que tenga dudas acerca de alguna
respuesta, pero recuerde que el examen final deberá realizarlo a libro cerrado.
Marque con un círculo TODAS las respuestas correctas a cada pregunta.
1.- ¿Para qué tarea son importantes herramientas para el epidemiólogo los cuadros,
diagramas y gráficos?
a. Recolección de datos
b. Resumen de los datos (epidemiología descriptiva)
c. Análisis de los datos
d. Presentación de los datos
2.- ¿Cuál de los siguientes cuadros "2x2" está correctamente rotulada?
a.
Enfermo Sanos Total
Expuesto a c H1
No expuesto b d H2
Total V1 V2 T
b.
Enfermo Sanos Total
Expuesto a b V1
No expuesto c d V2
Total H1 H2 T
c.
Enfermo Sanos Total
Expuesto a b H1
No expuesto c d H2
Total V1 V2 T
d.
Expuesto No expuesto Total
Enfermo a b H1
Sano c d H2
Total V1 V2 T
294
Morbilidad por sífilis primaria y secundaria por edad, Estados Unidos, 1989
Casos
Años de edad Número Porcentaje Porcentaje Acumulado
14 230 0.5% 0.5%
15-19 4,378 9.9% 10.4%
20-24 10,405 23.6% 34.0%
25-29 9,610 21.8% 55.9%
30-34 8,648 19.6% 75.5%
35-44 6,901 15.7% 91.2%
45-54 2,631 6.0% 97.2%
55 1,278 2.9% 100.1%
Total 44,084 100.0%* 100.0%
*Los porcentjes no suman a 100% por redondeo
3.- El cuadro que se muestra arriba, es un ejemplo de:
a. cuadro de una variable
b. cuadro de dos variables
c. cuadro de tres variables
d. cuadro de cuatro variables
4.- El número máximo de variables que podrían ser enfrentadas en un cuadro simple
es:
a. 1
b. 2
c. 3
d. 4
295
5.- El mejor momento para estructurar los cuadros es:
a. antes de planificar el estudio
b. como parte de la planificación del estudio
c. tras la recolección de los datos
d. antes del análisis de los datos
e. como parte del análisis de los datos
6.- Entre los métodos recomendados para crear categorías a partir de variables
continuas, están: (Rodee con un círculo TODO lo que proceda.)
a. basar las categorías en la media y la desviación típica
b. dividir los datos en categorías con número similar de observaciones
c. dividir el rango en intervalos de clase iguales
d. usar las categorías que se consideran estándar en la patología o condición de
que se trate
e. usar las mismas categorías en las que están agrupados los datos de la
población
296
7.- La unidad ilustra tres estrategias para crear intervalos de clase a partir de variables
continuas. De los siguientes grupos de intervalos de clase mostrados (A-D), ¿cuáles
concuerdan con alguna de las tres estrategias recomendadas? (Pista: desviación típica
= 117.6)(Rodee con un círculo TODO lo que proceda.)
Casos notificados de enfermedad A por 100,000 habitantes por tracto del censo,
Dixon, 1991
Tracto Censo Casos por 100,00 habitantes
1 170.5
2 0.0
3 70.0
4 40.0
5 115.5
6 42.1
7 453.5
8 0.0
9 35.1
10 50.3
11 0.0
12 0.0
13 186.4
14 49.9
15 48.9
Total 1262.2
a. b. c. d.
0.0 0.0-35.1 0.0-50.0 0.0-113.4
0.1-84.1 35.2-50.3 50.1-100.0 113.5-226.8
84.2-201.7 50.4-453.5 100.0-200.0 226.9-340.2
201.8-453.5 200.1-453.5 340.3-453.6
8.- La diferencia principal entre un gráfico lineal en escala aritmética y un gráfico en
escala semilogarítmica es que la escala aritmética:
a. mide el rango del cambio entre puntos sucesivos en un gráfico
b. es preferida cuando el rango de valores que deben reflejarse es muy amplio
c. usa en cada eje las mismas distancias para reflejar las mismas cantidades
d. es el mejor método de mostrar los cambios en la magnitud de los números
297
9.- ¿Qué tipo de gráfico estaría recomendado para mostrar las tasas anuales de
mortalidad por enfermedad Z, de 1940 a 1990? (Rodee con un círculo TODO lo que
proceda.)
a. gráfico lineal en escala aritmética
b. gráfico lineal en escala semilogarítmica
c. histograma
d. polígono de frecuencias
10.- ¿Cuál de los siguientes grupos de valores sería inapropiado para identificar
intervalos equidistantes sobre el eje y de un gráfico lineal en escala semilogarítmica?
a. 1, 10, 100, 1000
b. 10, 20, 30, 40
c. 7, 70, 700, 7000
d. 0.003, 0.03, 0.3, 3
11.- Los diagramas de barras pueden distinguirse de los histogramas a simple vista, ya
que:
a. los diagramas de barras no se usan para datos de series temporales
b. los histogramas se usan para representar datos discretos
c. los diagramas de barras se basan en el área bajo la curva
d. los histogramas no tienen espacios entre las columnas consecutivas
298
12.- ¿Cuáles de las siguientes afirmaciones sobre una curva epidémica son ciertos?
(Rodee con un círculo TODO lo que proceda.)
a. Una curva epidémica es un histograma
b. Una curva epidémica muestra número de casos por fecha de exposición
c. Una curva epidémica debería comenzar con el primer caso del brote.
d. Una curva epidémica debería utilizar en el eje x intervalos de tiempo de
aproximadamente 1/2 del período de incubación.
13.- ¿Cuál de los siguientes métodos de cerrar un polígono de frecuencias sobre el eje
horizontal es correcto?
14.- ¿Qué tipo de gráfico o diagrama sería apropidado para representar muertes a
través del tiempo para una cohorte de 100 alumnos de la Clase de 1907? (Rodee con
un círculo TODO lo que proceda.)
a. Diagrama de barras
b. Curva de frecuencias acumulativas
c. Histograma
d. Curva de supervivencia
299
Respuestas para las preguntas 15 - 20:
a. gráfico lineal en escala aritmética
b. diagrama de barras
c. series de gráficos de caja (o cajas y bigotes)
d. series de diagramas de puntos
e. polígono de frecuencias
f. diagrama de nube de puntos o de dispersión
15.- Número de casos según una variable continua _________________
16.- Número de casos según una variable discreta (no continua) _____________
17.- Valor medio de una variable continua según una variable discreta (no continua)
______________________________
18.- Valor medio de una variable continua según una variable discreta (no continua)
________________________________
19.- Cada valor de una variable continua según una segunda variable continua
________________________________
20.- Cada valor de una variable continua según una variable discreta (no continua)
________________________________
21.- ¿Qué tipo de gráfico es más adecuado para comparar tasas de cambio de la
aparición de una enfermedad a lo largo de algunos años?
a. gráfico lineal en escala aritmética
b. gráfico lineal en escala semilogarítmica
c. histograma
d. polígono de frecuencias
300
22.- ¿Qué tipo de gráfica es más adecuado para comparar la magnitud de sucesos que
han ocurrido en distintos lugares, sin que se disponga de un plano para ello?
a. gráfico lineal en escala aritmética
b. diagrama de barras
c. polígono de frecuencias
d. histograma
23.- ¿Qué tipo de diagrama podría ser utilizado para representar el tamaño relativo de
diferentes causas de muerte según el sexo? (Rodee con un círculo TODO lo que
proceda.)
a. diagrama simple de una sola barra
b. diagrama de barras agrupadas
c. diagrama de barras apiladas
d. diagrama de barras componentes de 100%
e. diagrama de pastel
24.- La mejor elección para representar los años potenciales de vida perdidos según
diferentes causas de muerte es:
a. diagrama simple de una sola barra
b. diagrama de barras agrupadas
c. diagrama de barras apiladas
d. diagrama de barras de 100% componentes (de múltiples barras)
25.- ¿Cuál de las siguientes afirmaciones es cierta respecto de la comparación de un
mapa de áreas con un mapa de puntos? (Rodee con un círculo TODO lo que proceda.)
a. El mapa de áreas muestra la localización de un caso o suceso más
específicamente.
b. Sólo el mapa de áreas puede mostrar riesgos o tasas de enfermedad
c. Sólo el mapa de áreas puede mostrar dos o más casos en la misma
localización
d. Un mapa de áreas puede mostrar tasas, pero sólo un mapa de puntos puede
mostrar números de casos.
Las respuestas, en el Apéndice J
Si ha respondido al menos a 20 preguntas correctamente, habrá asimilado la Unidad 4
suficientemente bien para pasar a la Unidad 5.
301
Referencias
1. Alter MJ, Ahtone J, Weisfuse I, Starko K, Vacalis TD, Maynard JE. Hepatitis
B virus transmission between heterosexuals. JAMA 1986; 256: 1307-1310.
2. Centers for Disease Control. Chronic Disease Supplement, 1987. Deaths from
cervical cancer- U.S., 1984-1986. MMWR 1989; 38: 38.
3. Centers for Disease Control. HIV/AIDS Surveillance Report. November 1990.
4. Centers for Disease Control. Manual of reporting procedures for national
morbidity reporting and public health surveillance activities. July 1985.
5. Centers for Disease Control. Progress toward eradicating poliomyelitis from
the Americas. MMWR 1989; 39: 33.
6. Centers for Disease Control. Infant mortality among racial/ethnic minority
groups, 1983-1984. MMWR 1990; 39: SS- 3.
7. Centers for Disease Control. St. Louis encephalitis -Florida and Texas, 1990.
MMWR; 39: 42.
8. Centers for Disease Control. MMWR 1991; 40: 4.
9. Centers for Disease Control. Nutritional assessment of children in drought-
affected areas -Haiti, 1990. MMWR 1991; 40: 13.
10. Centers for Disease Control. CIgarette smoking among adults -United States,
1988. MMWR 1988; 40: 44.
11. Centers for Disease Control. National Institute of Occupational Safety and
Health. National traumatic Occupational Fatalities Database.
12. Centers for Disease Control. Summary of notifiable diseases, United States,
1989. MMWR 1989; 38 (54).
13. Centers for Disease Control. Health Status of Vietnam veterans. Volume 3:
Medical Examination. 1989.
14. Creech JW. Effective oral presentations. Epi in Action Course, Centers for
Disease Control, 1988.
15. Dicker RC, Webster LA, Layde PM, Wingo PA, Ory HW. Oral contraceptive
use and the risk of ovarian cancer: The Centers for Disease Control Cancer and
Hormone Study. JAMA 1983; 249: 1596-1599.
16. Fingerhut MA, et al. Cancer mortality in workers exposed to 2, 3, 7, 8 -
tetrachlorodibenzo-p-dioxin. N Engl J Med 1991; 324: 212-218.
17. Hadler SC, et al. Occupational risk of hepatitis B infection in hospital
workers. Infect Ctrl 1985; 6: 24-31.
18. Kleinman JC, Donahue RP, Harris MI, Finucane FF, Madans JH, Brock DB.
Mortality among diabetics in a national sample. Am J Epidemiol 1988; 128: 389-401.
19. Lettau LA, et al. Outbreak of severe hepatitis due to delta and hepatitis F
viruses in parenteral drug abusers and their contacts. N Engl J Med 1987; 317: 1256-
1262.
302
20. McKenna M, Wolfson S, Kuller L. The ratio of ankle and arm arterial pressure
as an independent predictor of mortality. Athero 1991; 87: 119-128.
21. National Center for Health Statistics. Advance Report of final mortality
statistics, 1987. Monthly vital statistics report; vol 38, no. 5 supp. Hyattsville, MD:
Public Health Service. 1989.
22. Schoenbaum SC, Baker O, Jezek Z. Common source epidemic of hepatitis
due to glazed and iced pastries. Am J Epidemiol 1976; 104: 74-80.
23. Schereeder MT, et al. Hepatitis B in homosexual men: prevalence of infection
and factors related to transmission.J Infect Dis 1982; 146: 1.
24. Sutter RW, Patriarca PA, Brogran S et al. Outbreak of paralytic poliomyelitis
in Oman. Evidence for widespread transmission among fully vaccinated children.
Lancet 1991; 338: 715-20.
25. Tufte ER. The visual display of quantitative information. Cheshire, CT:
Graphics Press, 1983.
26. Wells, DL, Hopfensperger DJ, Arden NH, et al. Swine influenza virus
infections. JAMA 1991; 265: 478-481.
27. Williamson, DF, Parker RA, Kendrick JS. The box plot: a simple visual
method to interpret data. Ann Intern Med 1989; 110: 916-921.
303