Embed
Email

_ORGANIZACION DE DATOS EPIDEMIOLOGICOS

Document Sample
_ORGANIZACION DE DATOS EPIDEMIOLOGICOS
Shared by: HC111215035153
Categories
Tags
Stats
views:
4
posted:
12/14/2011
language:
pages:
92
Unidad 4



Organización de los datos epidemiológicos



Cuando se recogen más datos de los que se puede revisar individualmente, se pueden

usar cuadros y gráficas para organizarlos, resumirlos y mostrarlos en forma clara y

efectiva. Con cuadros y gráficas se pueden analizar grupos de datos de unas pocas

docenas a algunos millones. Estas herramientas permiten identificar, explorar,

entender y presentar distribuciones, tendencias y relaciones entre los datos. Los

cuadros y las gráficas son herramientas esenciales no sólo en la epidemiología

descriptiva y analítica, sino también en la comunicación de los hallazgos de las

investigaciones.



Objetivos

Después de preparar y entender esta lección, y responder a las preguntas de los

ejercicios, este módulo, el estudiante será capaz de:



 Preparar correctamente cuadros con una, dos o tres variables;



 Preparar correctamente las siguientes gráficas: una serie lineal en escala

aritmética, una serie lineal en escala semi-logarítmica, histogramas, polígonos

de frecuencia y diagramas de dispersión (nube de puntos);



 Preparar correctamente gráficas de barras, pasteles, mapas de puntos, mapas de

área, y diagramas de cajas y bigotes;



 Describir cuando se usa cada tipo de cuadros, gráficas y cartas.









212

Introducción a los cuadros, gráficas y cartas

El análisis de los datos es un componente importante en la práctica epidemiológica; para

un análisis efectivo de los datos, el trabajador de salud debe primero familiarizarse con

ellos y después aplicar técnicas analíticas; es importante empezar por examinar los datos

individualmente tal como aparecen en la base de datos, para rápidamente resumirlos en

cuadros; algunas veces, las cuadros resultantes son el único análisis necesario,

particularmente cuando la cantidad de datos es pequeña y la relaciones son obvias. Por

otra parte, las gráficas pueden ayudar a visualizar patrones y tendencias más generales e

identificar variaciones de estas tendencias. Las variaciones pueden representar

hallazgos nuevos e importantes o pueden ser únicamente errores en la digitación o

codificación que necesitan ser corregidos. Por lo tanto, las cuadros y las gráficas son

esenciales para la verificación y el análisis de los datos.



Una vez que el análisis está completo, las cuadros y las gráficas pueden servir como

ayudas visuales útiles para describir los datos; cuando se preparan cuadros y gráficas, el

propósito primario es comunicar la información obtenida.









213

Cuadros

Una cuadro es la agrupación de datos dispuestos en filas y columnas. Se puede

organizar casi cualquier información cuantitativa en un cuadro. Los cuadros son útiles

para demostrar patrones, excepciones a un patrón, diferencias y otras relaciones; además

sirven habitualmente como base para la preparación de gráficas, que son más visuales

pero que pueden perder algunos detalles.



Los cuadros diseñadas para presentar los datos deben ser lo más simple posible; dos o

tres pequeñas cuadros, cada uno enfocado en un aspecto diferente de los datos, son más

fáciles de entender que uno solo que contenga muchos datos.



Un cuadro debe entenderse por sí mismo; si se saca de su contexto original, debe

conservar la información necesaria para que el lector entienda los datos. Para crear un

cuadro que se entienda por si mismo, siga los siguientes pasos:



1. Use un título claro y conciso que describa el que, el cuando y el donde de los datos;



2. Encabece cada fila y cada columna e incluya las unidades de medida (por

ejemplo, años, mmHg, mg/dl, tasas por 100.000);



3. Muestre los totales de las filas y las columnas; si se muestran porcentajes, hay que

mostrar el total de ellos (siempre 100%);



4. Explique cualquier código, abreviatura, o símbolo en una nota de pie de página;



5. Anote cualquier exclusión en una nota a pie de página;



6. Anote la fuente de los datos en una nota a pie de página, si ellos no son originales.



Cuadros de una sola variable

El cuadro básico en la epidemiología descriptiva es una distribución de frecuencias

simple con una sola variable, como el cuadro 4.1a. en la primera columna del cuadro se

despliegan los valores o categorías de la variable representada en los datos, tales como

edad o sexo; la segunda columna muestra el número de personas o eventos en cada

categoría; con frecuencia, una tercera columna muestra el porcentaje de las personas o

los eventos en cada categoría.





214

Con frecuencia, una tercera columna muestra el porcentaje de las personas o de los

eventos en cada categoría, como en el cuadro 4.1b. Observe que los porcentajes en el

cuadro 4.1b suman 100,1% en vez de 100%, dado que se aproximaron las cifras a una

posición decimal. Esto ocurre con frecuencia en las cuadros que muestran porcentajes;

sin embargo, hay que mostrar el total de los porcentajes como 100% y explicar la

diferencia en una nota de pie de página.



Cuadro 4.1 a

Morbilidad por sífilis primaria y secundaria por edad, Estados Unidos, 1989



Grupo etario (años) Número de casos



 14 230

15-19 4,378

20-24 10,405

25-29 9,610

30-34 8,648

35-44 6,901

45-54 2,631

55 1,278

Total 44,081

Fuente: 12







Cuadro 4.1 b

Morbilidad por sífilis primaria y secundaria por edad, Estados Unidos, 1989



Grupo etario Casos

(años) Número Porcentaje



 14 230 0.5

15-19 4,378 10.0

20-24 10,405 23.6

25-29 9,610 21.8

30-34 8,648 19.6

35-44 6,901 15.7

45-54 2,631 6.0

55 1,278 2.9

Total 44,081 100.0*

*Los porcentajes no suman a 100% debido a redondeo

Fuente: 12









215

Se puede modificar el cuadro de una sola variable para mostrar la frecuencia acumulada

o el porcentaje acumulado, como en el cuadro 4.1c, en el cual es posible ver que 75.5%

de los casos de sífilis primaria y secundaria ocurrieron en los menores de 35 años.



Cuadro 4.1 b

Morbilidad por sífilis primaria y secundaria por edad, Estados Unidos, 1989

Grupo etario Casos

(Años) Número Porcentaje % Acumulado



 14 230 0.5 0.5

15-19 4,378 10.0 10.5

20-24 10,405 23.6 34.1

25-29 9,610 21.8 55.9

30-34 8,648 19.6 75.5

35-44 6,901 15.7 91.2

45-54 2,631 6.0 97.2

55 1,278 2.9 100.0

Total 44,081 100.0* 100.0%

*Los porcentajes no suman a 100% debido a redondeo

Fuente: 12







Cuadros de dos o tres variables

Se puede hacer una tabulación cruzada para mostrar dos variables a la vez, como en el

cuadro 4.2 que muestra sexo y edad; éste cuadro se denomina cuadro de contingencia.

El cuadro 4.3 muestra un ejemplo común de una cuadro de contingencia, que se

denomina un cuadro de dos-por-dos porque cada una de las dos variables tiene dos

categorías. En epidemiología se usan con frecuencia los cuadros de contingencia para

mostrar los datos usados en el cálculo de medidas de asociación y pruebas de

significación estadística.









216

Cuadro 4.2

Casos nuevos de sífilis primaria y secundaria por edad y género,

Estados Unidos, 1989

Grupo etario Número de casos por sexo

(años) Masculino Femenino Total

 14 40 190 230

15-19 1,710 2,668 4,378

20-24 5,120 5,285 10,405

25-29 5,304 4,306 9,610

30-34 5,537 3,111 8,648

35-44 5,004 1,897 6,901

45-54 2,144 487 2,631

55 1,147 131 1,278

Total 26,006 18,075 44,081

Fuente: 12



Además, los epidemiólogos usan los cuadros de dos por dos en estudios de asociación

entre la exposición y la enfermedad. Tales estudios comparan las personas con y sin

exposición y las personas con y sin la enfermedad. Una cuadro de dos por dos es una

manera conveniente de organizar los datos de estos tipos de estudios. El cuadro 4.4

muestra la forma general de éste tipo de cuadros.



Como se demuestra ahí, el estatus de enfermedad (por ej: enfermo vs. sano) es el

encabezado de las dos columnas y las dos filas se etiquetan con el estatus de exposición

(expuesto o no). Las letras "a", "b", "c" y "d" dentro de las casillas se refieren al número

de personas con la enfermedad indicada en las columnas y la exposición indicada en las

filas. Por ejemplo, "c" es el número de personas en el estudio que tienen la enfermedad,

pero que no tuvieron la exposición. "H" en las totales de las filas (H1 y H2) es la

abreviatura para "horizontal"; "V" en los totales de las columnas (V1 y V2) es la

abreviación por "vertical". El número total de las personas es representado por "T".



Cuadro 4.3

Estatus al seguimiento de un grupo de varones blancos con y sin diabetes,

Estudio de seguimiento de la Encuesta de Salud por Examen, 1982-1984

Defunciones Vivos Total % Fallecidos

Diabéticos 100 89 189 52.9

No diabéticos 811 2,340 3,151 25.7

Total 911 2,429 3,340

Fuente: 18



217

Cuadro 4.4

Forma general para un cuadro de dos por dos



Enfermo Sanos Total

Expuesto a b H1

No expuesto c d H2

Total V1 V2 T





Cuando se muestran los datos, es preferible usar un cuadro de una sola variable o de dos

variables. A veces, se quiere incluir una tercera variable para mostrar los datos en una

forma más completa; el cuadro 4.5 muestra una cuadro de tres variables (raza/etnia,

género y edad). Como se puede ver, una cuadro de tres variables está bastante lleno; es

bastante recargado; no debe usarse más de tres variables en una solo cuadro.









218

Cuadro 4.5

Morbilidqd por sífilis primaria y secundaria por edad, género y raza, Estados Unidos, 1989



Raza/Etnia

Edad (años) Género Blanco Negro Otras Total

Masculinos 2 31 7 40

14 Femeninos 14 165 11 190

Total 16 196 18 230



Masculinos 88 1,412 210 1,710

15-19 Femeninos 253 2,257 158 2,668

Total 341 3,669 368 4,378



Masculinos 407 4,059 654 5,120

20-24 Femeninos 475 4,503 307 5,285

Total 882 8,562 961 10,405



Masculinos 550 4,121 633 5,304

25-29 Femeninos 433 3,590 283 4,306

Total 983 7,711 916 9,610



Masculinos 564 4,453 520 5,537

30-34 Femeninos 316 2,628 167 3,111

Total 880 7,081 687 8,648



Masculinos 654 3,858 492 5,004

35-44 Femeninos 243 1,505 149 1,897

Total 897 5,363 641 6,901



Masculinos 323 1,619 202 2,144

45-54 Femeninos 55 392 40 487

Total 378 2,011 242 2,631



Masculinos 216 823 108 1,147

55 Femeninos 24 92 15 131

Total 240 915 123 1,278



Total de todas las Masculinos 2,804 20,376 2,826 26,006

edades Femeninos 1,813 15,132 1,130 18,075

Total 4,617 35,508 3,956 44,081

Fuente: 12









219

Ejercicio 4.1



Los datos del cuadro 4.6 describen las características de 36 residentes de unn un

ancianato durante un brote de una enfermedad diarreica.







A. Construya un cuadro de enfermedad (diarrea) por tipo de menú ingerido. Utilice el

estatus de diarrea como rótulo de las columnas y los tipos de menú como rótulos de

las filas.









B. Construya una cuadro 2 x 2 de la emfermedad (diarrea) por exposición al menú A.









Las respuestas, en la página 283.









220

Cuadro 4.6

Características de los residents del ancianato A durante un brote de enfermedad diarreica, Enero 1989

Número Edad Género Habitación Menú ¿Tuvo Fecha de

residente diarrea? inicio

1 71 F 103 A Si 15/1

2 72 F 105 A Si 23/1

3 74 F 105 A No

4 86 F 107 B No

5 83 F 107 B No

6 68 F 109 A Si 18/1



7 69 F 109 C No

8 64 F 111 A Si 16/1

9 66 M 111 A Si 18/1

10 68 M 104 A Si 20/1

11 70 M 106 A No

12 86 M 110 No



13 73 M 112 B No

14 82 M 219 C No

15 72 M 221 C No

16 70 M 221 B No

17 77 M 227 D No

18 80 M 227 D No



19 71 F 231 A Si 14/1

20 68 F 231 D Si 15/1

21 64 F 233 A No

22 73 F 235 A Si 13/1

23 75 F 235 B No

24 78 F 222 C No



25 72 F 222 A No

26 66 M 224 B No

27 69 M 226 A Si 16/1

28 75 M 228 E No

29 71 M 230 A SI 13/1

30 83 M 232 F No



31 84 M 232 D No

32 79 M 234 A Si 12/1

33 72 M 234 D Si 14/1

34 77 M 236 A SI 13/1

35 78 M 236 B No

36 80 M 238 D No









221

Cuadro de otras medidas estadísticas

Las cuadros 4.1 a 4.3 muestran números de casos (frecuencias). Además de mostrar el

número de casos, las celdas de una cuadro pueden mostrar promedios, tasas, años de

vida potencial perdidos, riesgos relativos y otras medidas estadísticas. Como en

cualquier otra cuadro, hay que identificar claramente el título y los encabezamientos de

los datos. Por ejemplo, tanto el título como los encabezamientos en la cuadro 4.7

muestran que se están presentando tasas.

Cuadro 4.7

Casos nuevos notificados de sífilis primaria y secundaria por cien mil habitantes,

tasas específicas por edad y raza, Estados Unidos

Grupo etario Tasas por cien mil

(Años) Blancos Negros Otros Total

≤14 0.0 2.4 0.8 0.4

15-19 2.4 131.5 51.0 24.3

20-24 5.8 323.0 139.2 55.9

25-29 5.4 270.9 117.9 44.1

30-34 4.7 256.6 83.2 38.8

35-44 2.9 135.0 47.8 19.0

45-54 1.7 76.7 29.6 10.5

≥55 0.5 19.4 10.4 2.4

Total 2.2 115.8 45.8 17.7

Fuente:12



Cuadros de salida

Aunque no se puede analizar los datos antes de recolectarlos, hay que diseñar los

métodos de análisis que se van a emplear con anticipación para facilitar el análisis

cuando ya se hayan recolectado. De hecho, la mayoría de los protocolos, escritos antes

de empezar el estudio, requieren una descripción de como se van a analizar los datos.

Como parte del plan de análisis, se puede desarrollar una "cuadro de salida" para

mostrar como se van a organizar y presentar los datos. Una cuadro en blanco es una

cuadro completa, con títulos, encabezamientos y categorías, pero sin datos; cuando se

desarrolla una cuadro de salida conteniendo variables contínuas, como edad, hay que

crear más categorías de las que usualmente se requieren, para poder visualizar cualquier

comportamiento o patrón de los datos que sean de interés.









222

Cuadro de salida 1

Características clínicas del síndrome de Kawasaki con

fechas de inicio entre octubre y diciembre de 1984

Características clínicas # con Porcentaje

característica

1. Fiebre ≥ 5 días _____ ( )

2. Congestión conjuntival bilateral _____ ( )

3. Cambios orales

 Labios congestionados _____ ( )

 Faringe congestionada _____ ( )

 Labios secos y con fisuras _____ ( )

 Lengua en fresa _____ ( )

4. Cambios en extremidades periféricas

edema _____ ( )

eritema _____ ( )

5. Rash _____ ( )

6. Linfadenopatía cervical <1.5 cm _____ ( )

_____ ( )

Total

_____ ( 100 )



Cuadro de salida 2

Característícas demográficas de los casos del síndrome de Kawasaki con fechas de

inicio entre Octubre y Diciembre de

Característícas demográficas Número Porcentaje



Edad

< 1año _____ ( )

1 año _____ ( )

2 año _____ ( )

3 años _____ ( )

4 años _____ ( )

5 años _____ ( )

6 años _____ ( )

Género

Masculino _____ ( )

Femenino _____ ( )

Raza

Blanca _____ ( )

Negra _____ ( )

Asiática _____ ( )

Otra _____ ( )



Total _____ ( 100 )



De la misma forma, se pudiera diseñar el cuadro de salida 2 como una cuadro de tres

variables con el número de casos por edad, sexo y raza.



223

Figura 4.1

Ilustración de cuadros de salida diseñados antes de conducir un estudio de casos y

controles del síndrome de Kawasaki

Cuadro de salida 3 Cuadro de salida 7

Municipio de Número % Característíca Casos Controles

residencia demográfica

______ ( ) Número % Número %

______ ( ) Edad <1 año ______ ( ) ______ ( )

1 año ______ ( ) ______ ( )

Cuadro de salida 4 2 años ______ ( ) ______ ( )

Ingreso del Hogar $ Número % 3 años ______ ( ) ______ ( )

≤10,000 ______ ( ) 4 años ______ ( ) ______ ( )

10,001-15,000 ______ ( ) 5 años ______ ( ) ______ ( )

15,001-20,000 ______ ( ) ≥6 añ6s ______ ( ) ______ ( )

20,001-30,000 ______ ( ) Género

30,001-35,000 ______ ( ) ______ ( ) ______ ( )

Masculino

≥35,000 ______ ( ) ______ ( ) ______ ( )

Femenino

Raza

Cuadro de salida 5 Blanca ______ ( ) ______ ( )

Número de días de Número % Negra ______ ( ) ______ ( )

hospitalización

0 ______ ( ) Asiática ______ ( ) ______ ( )

1 ______ ( ) Otra ______ ( ) ______ ( )

2 ______ ( ) Total ______ 100 ______ 100

3 ______ ( )

4 ______ ( ) Cuadro de salida 8

5+ ______ ( ) Casos Controles

Ingreso del Hogar

Media= _________ Número % Número %

$

Mediana=_________

Cuadro de salida 6 ≤10,000 ______ ( ) ______ ( )

Complicaciones Número % 10,001-15,000 ______ ( ) ______ ( )

graves

Cardíaca ______ ( ) 15,001-20,000 ______ ( ) ______ ( )

Artritis ______ ( ) 20,001-30,000 ______ ( ) ______ ( )

Defunción ______ ( ) 30,001-35,000 ______ ( ) ______ ( )

Total ______ 100 ≥35,000 ______ ( ) ______ ( )



Cuadro 3: La distribución de frecuencia por municipio de residencia

Cuadro 4: La distribución de frecuencia por los ingresos del hogar.

Cuadro 5: Dias de hospitalización (0 a máximo), media aritmética y mediana.

Cuadro 6: La distribución de frecuencia de las complicaciones graves (complicaciones cardiacas,

artriticas, muerte).

Cuadro 7: Las características demográficas (como la cuadro 2), con una comparación entre casos y

controles.

Cuadro 8. La distribución de frecuencia por los ingresos del hogar entre casos y controles









224

Cuadro de salida 9

Características epidemiológicas de los casos de síndrme de Kawasaki y sus controles

con fecha de inicio de Octubre a Diciembre de 1984

Características epidemiológicas Casos Controles

Número Porcentaje Número Porcentaje

Antecedentes de enfermedad Si ____ ( ) ____ ( )



No ____ ( ) ____ ( )

Razón de desigualdades (OR)=___._ Intervalo de Confianza del 95% = ( , )



2= __.__, valor de P= 0.____

Exposición a shampoo de Si ____ ( ) ____ ( )

alfombras

No ____ ( ) ____ ( )

Razón de desigualdades (OR)=___._ Intervalo de Confianza del 95% = ( , )



2= __.__, valor de P= 0.______





Esta secuencia de cuadros de salida provee un abordaje lógico y sistemático para el

análisis; por supuesto, una vez recogidos los datos y que los números han sido tabulados

en estos cuadros, se pensará en nuevos análisis a realizar.









225

Creacion de categorías

Algunas variables, tales como "género" o "¿comió ensalada de papas?" tienen un

número limitado de respuestas posibles; tales respuestas proveen categorías útiles para

incluir en un cuadro. Cuando se estudian variables con un rango de respuestas posibles

más amplio, tales como "tiempo" o "presión arterial sistólica", hay que agrupar los datos

en un número de categorías más manejable (intervalos de clase); para crear éstas

categorías, hay que tener en cuenta lo siguiente:



 Elabore intervalos de clase mutuamente excluyentes que incluyan todos los

datos. Por ejemplo, si el primer intervalo es 0-5, hay que empezar el siguiente

intervalo con 6, no con 5. También hay que considerar los limites verdaderos de

las nuevas categorías. El límite superior de 0-5 es 5.4999...para la mayoría de

las categorías, pero es 5.9999 para la edad. Los límites verdaderos fueron

discutidos en la unidad 3.

 Use un número relativamente grande de categorías creadas con intervalos de

clase estrechis para el análisis inicial. Es mejor combinar tales categorías

posteriormente; en general es ideal empezar con 4-8 categorías.

 Use categorías con significación biológica o natural siempre que se pueda.

Trate de usar grupos de edad estandarizados o de uso común para el campo de

estudio específico. Si va a calcular tasas, el numerador debe coincidir con las

categorías de los datos de la población que va a usar.

 Cree una categoría de "desconocido" o de "otros". Por ejemplo, en los

agrupamientos de edades mostrados en el cuadro 4.8, las categorías que se han

creado para ello son "edad no declarada", "desconocido", y "no declarada".









226

Cuadro 4.8

Algunas agrupaciones etarias estándares empleadas en el CDC

Enfermedades de Mortalidad por neumonía Tabulaciones finales de VIH/SIDA

notificación obligatoria e influenza estadísticas de mortalidad

<1 año <28 días <1 año <5 años

1-4 28 días -<1 año 1-4 5-12

5-9 1-14 5-14 13-19

10-14 15-24 15-24 20-24

15-19 25-44 25-34 25-29

20-24 45-64 35-44 30-34

25-29 65-74 45-54 35-39

30-39 75-84 55-64 40-44

40-49 85+ 65-74 45-49

50-59 Desconocida 75-84 50-54

60 + 85+ 55-59

Edad no declarada No declarada 60-64

+

Total Total Total

Fuente: 3, 4, 21



Si hay un grupo de base natural, se debe m antener como una categoría aparte, aún

cuando el resto de la distribución no tenga distinciones naturales; por ejemplo, cuando

se crean categorías para "fumadores" en términos de "número de cigarrillos fumados en

un día", hay que dejar los no fumadores (0 cigarrillos/día) como una categoría aparte y

agrupar los fumadores según cualquier método arbitrario, como se describe más

adelante.



Si no existen intervalos de clase naturales o estándar, hay varias estrategias para

crearlos, como se describe a continuación.



Estrategia 1: Dividir los datos en grupos de tamaño similar.



Con este sistema, se busca crear un número manejable de intervalos de clase, con más

o menos el mismo número de observaciones en cada uno. Al principio se pueden usar

8 intervalos, y después reducirlos a 4 para la presentación de los datos a otras

personas. En efecto, los 4 intervalos así creados representan los cuartiles de la

distribución de los datos. Este método es especialmente adecuado para crear las

categorías de los mapas de áreas.



Para aplicar esta estrategia, hay que dividir el número total de observaciones entre el

número de intervalos que se quiera crear; luego hay que desarrollar una columna de

frecuencias acumuladas de la distribución de los datos ordenados por orden numérico

para encontrar dónde se deben ubicar los límites de cada intervalo.

227

Estrategia 2: basar los intervalos en el promedio y la desviación estándar.



Con esta estrategia, se pueden crear 3, 4 o 6 intervalos de clase, para lo cual es

necesario encontrar la media y la desviación estándar de la distribución; luego, se usa

el promedio más o menos los múltiplos correspondientes de la desviación estándar

para establecer los límites de los intervalos.



Límite superior del intervalo 1 = la media - 2 desviaciones típicas

Límite superior del intervalo 2 = la media - 1 desviación típica

Límite superior del intervalo 3 = la media

Límite superior del intervalo 4 = la media + 1 desviación típica

Límite superior del intervalo 5 = la media + 2 desviaciones típica

Límite superior del intervalo 6 =valor máximo



Por ejemplo, si se quieren establecer 6 intervalos para unos datos con una media de

50, una desviación estándar de 10, un valor mínimo de 19 y un valor máximo de 82,

se calcularán los límites superiores de cada intervalo de la siguiente forma:



Límite superior del intervalo 1 = 50 - 20 = 30

Límite superior del intervalo 2 = 50 - 10 = 40

Límite superior del intervalo 3 = 50

Límite superior del intervalo 4 = 50 + 10 = 60

Límite superior del intervalo 5 = 50 + 20 = 70

Límite superior del intervalo 6 = 82



Si se añade el límite inferior obvio para cada intervalo, éstos serán:



intervalo 1 = 19 - 30

intervalo 2 = 31 - 40

intervalo 3 = 41 - 50

intervalo 4 = 51 - 60

intervalo 5 = 61 - 70

intervalo 6 = 71 - 82









Para crear 3 o 4 intervalos, se pueden combinar algunos de los límites de los

adyacentes:

Seis categorías Cuatro categorías Tres categorías

228

Seis Intervalos Cuatro Intervalos Tres intervalos



Intervalo 1 = 19-30

Intervalo 1 = 19-40 Intervalo 1 = 19-40

Intervalo 2 = 31-40

Intervalo 3 = 41-50 Intervalo 2 = 41-50

Intervalo 2 = 41-60

Intervalo 4 = 51-60 Intervalo 3 = 51-60

Intervalo 5 = 61-70

Intervalo 4 = 61-82 Intervalo 3 = 61-82

Intervalo 6 = 71-82



Estrategia 3: dividir el rango entre intervalos de clase iguales



Este es el método más sencillo y común, especialmente apropiado para utilizar en

gráficas. Para desarrollarlo es necesario:



1. Encontrar el rango de valores de los datos, i.e. encontrar la diferencia entre el valor

máximo (o algún valor conveniente un poco más grande) y cero (o el valor mínimo).



2. Decidir cuántos intervalos de clase (grupos o categorías) se harán. En general, para

cuadros se usan de 4 a 8 intervalos de clase y para gráficas y mapas se usan de 3 a 6; los

intervalos dependen de las características de los datos que se quiere visualizar.



3. Dividir el rango por el número de intervalos de clase que se decidió usar para

encontrar el tamaño de los intervalos.



4. Empezar con el valor mínimo del límite inferior del primer intervalo y especificar los

intervalos de clase de cualquier tamaño que se ha calculado hasta que se llegue al valor

máximo.









229

Cuadro 4.9

Tasas medias anuales de mortalidad por cáncer cervico uterino por 100,000 habitantes

por estados, ordenadas por rango, Estados Unidos, 1984-1986

Rango Estado Tasa por Rango Estado Tasa por

100,000 100,000



1 SC 5.6 26 KS 3.6

2 WV 5.6 27 AR 3.6

3 AL 5.4 28 MD 3.5

4 LA 5.4 29 IA 3.4

5 AK 5.1 30 PA 3.4

6 TN 4.9 31 FL 3.4

7 ND 4.9 32 HI 3.4

8 KY 4.8 33 OR 3.3

9 MS 4.7 34 ML 3.3

10 NC 4.6 35 CA 3.2

11 GA 4.6 36 ID 3.1

12 ME 4.6 37 AZ 3.1

13 VR 4.3 38 MA 2.9

14 DE 4.3 39 NM 2.9

15 NH 4.3 40 WA 2.8

16 IN 4.1 41 NV 2.8

17 OK 4.1 42 CT 2.8

18 IL 4.0 43 RI 2.8

19 MT 4.0 44 WI 2.7

20 VA 3.9 45 CO 2.5

21 OH 3.8 46 NE 2.4

22 MO 3.8 47 SD 2.4

23 TX 3.7 48 MN 2.2

24 NY 3.7 49 WY 1.9

25 NJ 3.7 50 UT 1.8

Total U.S. 3.7

Fuente: 2





Ejemplo



En este ejemplo, se demostrará cada estrategía para la creación de intervalos, usando los

datos de las tasas de mortalidad por cáncer de cérvix del útero del cuadro 4,9. En cada

caso, se crearán 4 intervalos de clase de las tasas.









230

Estrategia 1: Dividir los datos en grupos de similar tamaño



(Nota: Si el Cuadro 4.9 ha sido ordenado alfabéticamente, el primer paso sería

ordenarlo por rango de tasas. Afortunadamente, ésto ya se ha hecho.)



1. Dividir la lista en cuatro grupos iguales de lugares:



50 estados/4 = 12.5 estados por grupo. Como no podemos cortar un estado en dos,

tendremos que usar dos grupos de 12 estados y dos grupos de 13 estados. Como

Vermont (#13) podría ir tanto en el primero como en el segundo grupo y

Massachusetts (#38) podría ir tanto en el tercero como en el cuarto grupo, crearemos

los siguientes grupos:



a. Desde Carolina del Sur hasta Maine (del 1 al 12)

b. Desde Vermont hasta Nueva Jersey (del 13 al 25)

c. Desde Kansas hasta Arizona (del 26 al 37)

d. Desde Massachusetts hasta Utah (del 38 al 50)



Note que este orden sitúa a Vermont junto a Delaware (ambos tienen tasas de 4.3), y a

Massachusetts con Nuevo México (ambos con tasas de 1.8).



2. Identificar la tasa para el premero y el último estado de cada grupo:



Estados Tasas por 100,000

a. ME-SC 4.6-5.6

b. NJ-VT 3.7-4.3

c. AZ-KS 3.1-3.6

d. UT-MA 1.8-2.9



3. Ajustar los límites de cada intervalo de forma que no queden huecos entre el

final de uno y el comienzo del siguiente (Compare los intervalos de arriba con los de

abajo):



Estados Tasas por 100,000 Número de estados

a. ME-SC 4.5-5.6 12

b. NJ-VR 3.7-4.4 13

c. AZ-KS 3.0-3.6 12

d. UT-MA 1.8-2.9 13







231

Estrategia 2: Basar los intervalos en la media y la desviación estándar



1. Calcular la media y la desviación estándar (en la Unidad 3 se describe cómo

calcular estas medidas.):



Media = 3.70

Desviación típica = 0.96



2. Encontrar los límites superiores de 4 intervalos (Nota: demostramos cómo

crear 4 intervalos estableciendo primero 6 y luego combinando el par más bajo y el

más alto. Aquí, no obstante, simplemente usaremos el límite superior apropiado de

los pares que serán combinados.)



Límite superior del intervalo 1: media - 1 desv. típica = 2.74

Límite superior del intervalo 2: media = 3.70

Límite superior del intervalo 3: media + 1 desv. típica = 4.66

Límite superior del intervalo 4: valor máximo = 5.6



3. Seleccionar el límite inferior para cada límite superior para definir los cuatro

intervalos completos. Especificar los estados que caen en cada intervalo de clase

(Nota: Para situar los estados con las tasas mayores primero hemos invertido el orden

de los intervalos de clase):



Estados Tasas por 100,000 Número de estados

a. MS-SC 4.67-5.60 9

b. MO-NC 3.71-4.66 13

c. RI-TX 2.75-3.70 21

d. UT-WI 1.80-2.74 7



Estrategia 3: Dividir el rango en cuatro intervalos de clase iguales



1. Dividir el rango desde cero (o el valor mínimo) hasta el máximo, entre cuatro:



(5.6 – 1.8)/ 4 = 0.95



2. Usar múltiplos de 0.95 para crear cuatro categorías, comenzando a partir de

1,8:

de 1.80 a (1.8 + 0.95) = de 1.8 a 2.75

de 2.76 a (1.8 + 2•0.95) = de 2.76 a 3.70

de 3.71 a (1.8 + 3•0.95) = de 3.71 a 4.65

de 4.66 a (1.8 + 4•0.95) = de 4.66 a 5.6

232

3. Categorías finales:

Estados Tasas por 100,000 Número de estados

a. MS-SC 4.66-5.60 9

b. MO-NC 3.71-4.65 13

c. RI-TX 2.76-3.70 21

d. UT-WI 1.80-2.75 7



4. Alternativamente, como 0.95 está muy cerca de 1.0, podrían ser usados

múltiplos de 1 para crear las cuatro categorías. Comenzando por el valor central (5.6

+ 1.8)/ 2 = 3.7, sustraer 1.0 para determinar el límite superior del primer intervalo

(2.7). Los límites superiores de los intervalos tercero y cuarto serán 3.7 + 1.0 = 4.7, y

3.7 + 2•1.0 = 5.7.



Categorías finales:



Estados Tasas por 100,000 Número de estados

a. KY-SC 4.71-5.70 8



c. RI-TX 3.71-4.70 14



b. MO-MS 2.71-3.70 21



d. UT-WI 1.71-2.70 7









233

Ejercicio 4.2



Con los datos de mortalidad por cáncer cervico uterino presentado en el cuadro 4.9

utilice cada estrategia para crear tres intervalos de clase de las tasas.









Respuestas en la página 283









234

Cuadro 4.9 (Revisitado)

Tasas medias anuales de mortalidad por cáncer cervico uterino por 100,000 habitantes

por estados, ordenadas por rango, Estados Unidos, 1984-1986

Rango Estado Tasa por Rango Estado Tasa por

100,000 100,000



1 SC 5.6 26 KS 3.6

2 WV 5.6 27 AR 3.6

3 AL 5.4 28 MD 3.5

4 LA 5.4 29 IA 3.4

5 AK 5.1 30 PA 3.4

6 TN 4.9 31 FL 3.4

7 ND 4.9 32 HI 3.4

8 KY 4.8 33 OR 3.3

9 MS 4.7 34 ML 3.3

10 NC 4.6 35 CA 3.2

11 GA 4.6 36 ID 3.1

12 ME 4.6 37 AZ 3.1

13 VR 4.3 38 MA 2.9

14 DE 4.3 39 NM 2.9

15 NH 4.3 40 WA 2.8

16 IN 4.1 41 NV 2.8

17 OK 4.1 42 CT 2.8

18 IL 4.0 43 RI 2.8

19 MT 4.0 44 WI 2.7

20 VA 3.9 45 CO 2.5

21 OH 3.8 46 NE 2.4

22 MO 3.8 47 SD 2.4

23 TX 3.7 48 MN 2.2

24 NY 3.7 49 WY 1.9

25 NJ 3.7 50 UT 1.8

U.S. 3.7

Fuente: 2









235

Gráficas

Una gráfica es una forma de mostrar los datos visualmente, usando un sistema de

coordenadas. Es un tipo de fotografía estadística que ayuda a mostrar los patrones, las

aberraciones, las similitudes y las diferencias en los datos; es una forma ideal para la

presentación de los datos. El público recordará más de los aspectos importantes de los

datos cuando se presentan en una gráfica en vez de en una cuadro.



En epidemiología es habitual usar una gráfica de coordenadas en ángulo recto que

constan de dos ejes lineales, uno horizontal y uno vertical; denominadas el eje

horizontal o eje X o abscisas, y el eje vertical o eje Y, u ordenadas. En general, se usa el

eje horizontal para mostrar los valores de la variable independiente (X), que es el

método de clasificación, como tiempo, por ejemplo, y el eje vertical para mostrar la

variable dependiente (Y), que normalmente es una medida de frecuencia, como el

número de casos o la tasa de una enfermedad. Se encabeza cada eje para mostrar lo que

se representa (tanto el nombre de la variable como sus unidades) y se pone la escala de

medida a lo largo de la línea.



El cuadro 4.10 muestra el número de casos de sarampión por año de notificación desde

1950 a 1989. Hemos utilizado una porción de los datos para crear la figura 4.2. La

variable independiente años se muestra en el eje horizontal. La variable dependiente, el

número de casos, se muestra en el eje vertical. Se muestra un cuadriculado en la figura

4.2 para ilustrar como los datos se grafican. Por ejemplo, para el punto de los casos en

1953 en la gráfica desde la intersección con el nivel de 449 hacia la derecha, y así utilice

la figura para unir los puntos desde 1955 hasta 1959.



Gráficas lineales en escala aritmética

Una gráfica lineal en escala aritmética muestra los patrones o tendencias de una

variable, generalmente el tiempo. Normalmente en epidemiología se usa este tipo de

gráfica para mostrar una serie larga de datos y para comparar varias series. Es el

método ideal para elaborar una curva en el tiempo.



En una gráfica lineal en escala aritmética, una distancia fija a lo largo de un eje

representa la misma cantidad en cualquier parte del eje; esto es cierto tanto en el eje

de las X como en el eje de las Y. Se pueden mostrar varias series de datos en la misma

gráfica lineal de escala aritmética. La escala que se usa en el eje de las X depende de

las categorías usadas para las variables independientes en la recogida de los datos. En

general, cuando se inscriben los datos de "tiempo" se usan los mismos intervalos que

han sido usados en la recogida de la información, (p. ej.: semanas, años, etc.).





236

Cuadro 4.10

Sarampión por año de notificación, Estados Unidos, 1950-89.

Año Casos notificados (x100,000) Año Casos notificados (x100,000)

1950 319 1970 47

1951 530 1971 75

1952 683 1972 32

1953 449 1973 27

1954 683 1974 22

1955 555 1975 24

1956 612 1976 41

1957 487 1977 57

1958 763 1978 27

1959 406 1979 14

1960 442 1980 13

1961 424 1981 3

1962 482 1982 2

1963 385 1983 1

1964 458 1984 3

1965 262 1985 3

1966 204 1986 6

1967 63 1987 4

1968 22 1988 3

1969 26 1989 18

Fuente: 12

Figura 4.2

Gráfica parcial de sarampión por año de notificación, Estados Unidos, 1950-1959









Eje Y

Frecuencias

(Tasas, casos,

razones,

proporciones)







Intervalos

Iguales









Intervalos

Iguales

Fuente: 12

237

Figura 4.3

Ejemplo de gráfica en escala artimética:

Sarampión por año de notificación, Estados Unidos, 1950-1989





Casos



por

Licencia

de la

cien Vacuna

mil



habs.









Fuente: 12

Figura 4.4

Ejemplo de gráfica en escala artimética:

Rabia, en animales silvestres y domésticos por año de notificación, Estados Unidos,

1955-1989





Doméstica

Silvestre









Fuente: 12

238

Sin embargo, si se han usado intervalos muy pequeños en la recogida de los datos, se

puede reducir el número y aumentar el tamaño de ellos para mostrar los datos en

forma de gráfica.



Para seleccionar una escala para el eje Y, es necesario:



 Construir el eje Y más corto que el eje X, para que la gráfica quede horizontal

(es decir, la longitud horizontal debe ser mayor que la longitud vertical) y

mantener una buena proporción entre los dos ejes: en general se recomienda

una relación X:Y de 5:3.



 Empezar el eje Y siempre con 0.



 Identificar el rango de valores que desea mostrar en el eje de las Y, para lo

cual encuentre el valor mayor de la variable Y y redondéelo al número

inmediato mayor. Por ejemplo, el valor mayo de la figura 4.3 es 763,094 en

1958. Este valor se puede redondear a 1,000,000 para determinar el rango de

valores a mostrar en el eje de las Y.



 Seleccionar un tamaño de intervalo que nos de suficientes interva



 los para mostrar los datos con el detalle que se requiere. En la figura 4.3 los

intervalos de 100,000 cada uno se considera adecuado para mostrar los

detalles importantes de los datos.



 Si el rango de valorespara mostrar el eje de las Y incluye un período o

fracción sin datos, se debe anotar una interrupción en el eje correspondiente.

Con una interrupción en el eje de las Y la línea se interrumpe también en

donde la interrupción empieza y se reanuda donde los datos continúan. Las

interrupciones de los ejes solo se pueden usar con gráficas de escala lineal.









239

Ejercicio 4.3



En ambas gráficas, asegúrese de usar los intervalos adecuados para el rango de los

datos en el eje de las Y.



A. Construya una gráfica lineal en escala aritmética con los datos del sarampión de la

cuadro 4.11, mostrando la tasa de 1955-1990 con una sola línea.









b. Construya una gráfica lineal en escala aritmética con los datos del sarampión de

1980-





Cuadro 4.11

Tasas de sarampión por 100,000 habitantes por año de notificación, Estados Unidos, 1955-

90.



Año Tasa Año Tasa Año Tasa

1955 336.3 1967 31.7 1979 6.2

1956 364.1 1968 11.1 1980 6.0

1957 283.4 1969 12.8 1981 1.4

1958 438.2 1970 23.2 1982 0.7

1959 229.3 1971 36.5 1983 0.6

1960 246.3 1972 15.5 1984 1.1

1961 231.6 1973 12.7 1985 1.2

1962 259.0 1974 10.5 1986 2.6

1963 204.2 1975 11.4 1987 1.5

1964 239.4 1976 19.2 1988 1.4

1965 135.1 1977 26.5 1989 7.3

1966 104.2 1978 12.3 1990 10.7

Fuente: 12









Respuestas en la página 286.





240

Gráficas lineales en escala semilogarítmica.

En una gráfica lineal en escala semilogarítmica (una "gráfica semilog"), las divisiones

del eje Y siguen un patrón logarítmico en vez de aritmético como en las gráficas

lineales en escala aritmética. El eje X sigue teniendo una escala aritmética, como las

gráficas lineales de escala aritmética.



La figura 4.5 muestran un ejemplo de una gráfica semilogarítmica. FÍjese que el eje Y

tiene las siguientes características:

 Hay cinco ciclos, de distancias iguales, a lo largo del eje.

 Cada ciclo representa valores diez veces más grandes que el ciclo

inmediatamente anterior. Así, la distancia entre 1 y 10 es la misma que la

distancia entre 10 y 100.

 Dentro de un ciclo hay diez marcas, siendo el espacio entre cada dos marcas

cada vez más pequeño al ir subiendo en la escala. Así, la distancia entre 1 y 2 no

es la misma que la distancia entre 2 y 3

 El eje cubre un rango de valores de Y que hubiese sido difícil o imposible

mostrarlo en una escala aritmética. Las gráficas semilog son útiles cuando se

quiere mostrar un rango muy amplio de valores en una sola gráfica.



Figura 4.4

Ejemplo de gráfica semilogarítmica:Casos notificados de poliomielitis paralítica de

100,000 por año de ocurrencia, Estados Unidos, 1951-1989

Coordenadas escogidas para facilitar

la lectura

C

A

S

O

S



P

O

R



C

I

E

N



M

I

L







Fuente:12



241

Con una escala logarítmica, cierta distancia en el eje de las Y representa un porcentaje

igual de cambio, no una cantidad igual de cambio como en una escala aritmética. Por

eso, una gráfica semilog es especialmente útil para mostrar tasas de cambio.



Para interpretar los datos en una gráfica semilog, hay que entender las siguientes

características de la gráfica:

 Una línea recta inclinada indica una tasa (no cantidad) constante de aumento o

disminución de los valores.

 Una línea horizontal indica que no hay cambio.

 La cantidad de inclinación indica la tasa de aumento o disminución.

 Dos o más líneas paralelas muestran tasas de cambio iguales.



Cuando se construye una gráfica semilog, se usa el número de ciclos necesarios para

mostrar los valores máximos y mínimos de la variable Y. Se puede adquirir papel

gráfico semilogarítmico que en general incluye por lo menos tres ciclos. Para hallar el

número de ciclos que se necesita, es preciso:



1. Identificar en qué rango de múltiplos de 10 se encuentra el valor mínimo de Y.

Así se establece el rango del primer ciclo.

Por ejemplo, si el valor mínimo de Y es entre 10 y 100, el primer ciclo comenzará con

10 y terminará con 100; si está entre 100 y 1000, el primer ciclo comenzará con 100 y

terminará con 1000.



2. Identificar en qué rango de múltiplos de diez se encuentra el valor máximo de

Y. Así se establece el rango del último ciclo.

Por ejemplo, si el valor máximo de Y es entre 100.000 y 200.000, el último ciclo

empezará con 100.000. Aunque un ciclo completo que comienza con 100.000 debe

terminar con 1.000.000, no es necesario mostrar todo el ciclo; es suficiente con

mostrar algunos marcadores del último ciclo: 100.000, 200.000 y 300.000.



3. Identificar cuántos ciclos se encuentran entre el primero y el último ciclo; se

necesitará este número de ciclos, más dos para incluir el primero y el último ciclo.

Por ejemplo, si el valor mínimo de Y está entre 10 y 100 y el valor máximo de Y está

entre 100.000 y 200.000, se necesitarán los siguientes ciclos:

10 - 100

100 - 1.000

1.000 - 10.000

10.000 - 100.000

100.000 - 1.000.000

Así, con valores de Y entre 10 y 200.000, se necesitarán 4 ciclos y parte de un quinto.



242

Figura 4.6

Valores posibles pueden ser asignados a valores del eje de las Y

en una gráfica en escala-semilogarítmica



Valores Posibles





Máximo









C

U

A

T

R

O



C

I

Mínimo

C

L

O

S









Año

La figura 4.6 muestra los rangos de los valores que se deben mostrar en el eje de las Y

de 4 ciclos de una gráfica semi-log.



El tipo de gráfica que se usa depende principalmente de si se quiere mostrar los cambios

en sí de una serie de valores o si se quiere más bien enfatizar las tasas de cambio. Para

mostrar los cambios en una serie de datos se usa una escala aritmética en el eje de las Y

(una gráfica lineal de escala aritmética). Para mostrar las tasas de cambio se usa una

escala logarítmica en el eje de las Y (una gráfica lineal de escala logarítmica). Sin

embargo, se puede decidir usar una gráfica semilog cuando el rango de valores en el eje

de las Y es demasiado grande aún para mostrar cambios en la serie de datos.









243

Ejercicio 4.4



Grafique los datos de sarampión en el cuadro 4.11, de la página 279, en escala

semilogarítmica.









Respuestaas en la página 287.









244

Histogramas.

Un histograma es la gráfica de la distribución de frecuencia de una variable contínua, en

la cual se usan columnas adyacentes para representar el número de observaciones para

cada intervalo de clase en la distribución. El área de cada columna es proporcional al

número de observaciones en éste intervalo.



Las figuras 4.7, 4.8 y 4.9 muestran los histogramas de unas distribuciones de frecuencia

con intervalos de clase iguales. Dado que el tamaño de todos los intervalos de clase es

igual, la altura de la columna es proporcional al número de observaciones. No se

recomienda usar histogramas con intervalos de clase de tamaños diferentes, porque

son difíciles de construir e interpretar con seguridad. Tampoco se debe interrumpir la

escala en el ejeY, porque éste distorsionaría la presentación de las frecuencias

relativas.

Figura 4.7

Ejemplo de un histograma: Casos notificados de poliomielitis paralítica por mes de

ocurrencia, Omán, Enero 1988 a Marzo 1989





1 caso





Campañas de

vacunación oral

Areas en cada contra la polio

cuadrado son

idénticas









C

a

s

o No hay

s espacios

entre

columnas







No es esencial mostrar las líneas horizontales entre los casos









Ene Mar May Jul Sep Nov Ene Mar

1988 1989



Fuente: 24

245

Figura 4.8

Ejemplo de histograma: Niveles de colesterol entre 4,462 individuos del Estudio de

Salud de Varones, Estados Unidos, 1985-1986





N

ú

m

e

r

o



d

e



V

a

r

o

n

e

s









Nivel de Colesterol





Fuente: 13



La variable mostrada con mas frecuencia en el eje de las X es el tiempo, como se

muestra en las figuras 4.7 y 4.8. Sin embargo, se pueden usar otras variables contínuas,

como el colesterol o la presión arterial en el eje de las X. La figura 4.8 muestra la

frecuencia de las observaciones por intervalos de clase del nivel de colesterol.



Se puede mostrar una segunda variable en un histograma sombreando la segunda

variable con un color diferente dentro de la misma columna. Por ejemplo, se puede

mostrar el número de casos de una enfermedad por el tamaño de cada columna, y la

consecuencia de la enfermedad (fatal o no fatal) con diferentes colores. Sin embargo,

cuando se muestra los datos en ésta forma es difícil comparar el componente de arriba

de una columna con otra porque no tiene una base plana. Una alternativa es crear un

histograma separado por cada componente de la segunda variable, como en la figura

4.9.

Compare las figuras 4.9 y 4.10: muestran los mismos datos pero en formatos diferentes.

¿Cúal es el mejor formato para la comparación de los patrones de casos entre residentes

y no residentes?



246

Figura 4.9

Ejemplo de histograma:

Número de casos notificados de hepatitis A por fecha de inicio

y residencia en el municipio de Ogemaw, Abril-Mayo, 1968







Residente Ogemaw

C Residente municipio vecino

Residente otros municipio

a

s

o

s







Fuente: 22

Figura 4.10

Ejemplo de histograma: Número de casos notificados de hepatitis A por fecha de

inicio y residencia en el municipio de Ogemaw, Abril-Mayo, 1968

Residente Ogemaw



C Caso

a

s

o

s









Abril Mayo

C Residente municipio vecino

Residen fuera de Ogemaw Residente otros municipio

a

s

o

s





Fuente: 22









247

A veces se puede incluir una clave para mostrar cuantos valores de Y hay en un área

de la columna. La clave consiste en un cuadro o rectángulo, tan ancho como la

columna, con el número de casos representado por el área escrita al lado.



Con frecuencia los epidemiólogos desarrollan y discuten "curvas epidémicas". Una

curva epidémica no es una curva, sino un histograma que muestra los casos de una

enfermedad durante un brote, por su fecha de inicio. Con frecuencia se dibujan las

columnas como un cuadrados apilados en las columnas; en el que cada cuadro

representa un caso. La figura 4.9 muestra que una persona tuvo su fecha de inicio de

síntomas entre el 27 y 28 de abril, otra mas inicio entre el 29 y 30, y cinco casos

adicionales iniciaron entre el 1º y 2 de Mayo. Mostramos la duración de la epidemia en

el eje de las X en períodos de tiempo equivalentes. En una curva epidémica cada

número de las etiquetas debe estar centrado entre las marcas de cada intervalo.

Empleamos el intervalo de tiempo que sea adecuado al caso: por ejemplo, para un brote

de gastroenteritis por C. perfringens sería de horas, y de 3-5 días para un brote de

hepatitis A. Como regla general utilizamos intervalos menores a un cuarto del período

de incubación de la enfermedad que se muestra en el histograma. Empezamos a

graficar el eje de las X antes de que hubiese ocurrido el primer caso y mostramos

cualquier caso de la misma enfermedad que hubiese ocurrido en el período pre-

epidémico. Tales casos pueden representar lo mismo casos de fondo o sin relación

alguna. ¡Tenga presente que pueden ser la fuente del brote!









248

Ejercicio 4.5



Utilice los datos de la epidemia en el asilo del ejercicio 4.1 para dibujar una curva

epidémica. Describa las características de esta gráfica como si estuviera hablando por

teléfono con alguien que no puede verla.









Ver la respuesta, en la página 288.









249

Polígonos de frecuencia

Un polígono de frecuencia, como un histograma, es una gráfica de distribución de

frecuencias, en el cual se traza el número de observaciones contra los intervalos del eje

de las X con puntos individuales en la mitad de los intervalos y luego se conectan los

puntos con una línea recta. La figura 4.11 muestra un ejemplo de un polígono de

frecuencia sobre la línea externa de un histograma de los mismos datos. De rutina no se

debe mostrar los dos en una sola gráfica. Compare su construcción. Un polígono de

frecuencia de una serie de datos debe incluir la misma área que un histograma con los

mismos datos. Los polígonos de frecuencia ayudan a mostrar y comparar dos o más

distribuciones en la misma serie de ejes.



Fíjese que el histograma y la línea del polígono de frecuencia (cuando se mueve del

punto central al punto central) crean una serie de pares de triángulos de tamaños iguales

(uno dentro del histograma y el otro afuera), lo cual es un rasgoimportante de un

polígono de frecuencias ya que un polígono de frecuencia de unos datos debe cubrir la

misma área que un histograma de los mismos datos: para cada área que queda afuera del

histograma, el polígono tiene que incluir otra área de tamaño igual adentro.

Figura 4.11

Casos notificados de enfermedad semejante a influenza por inicio



Histograma



Polígono de

frecuencia



C

a

s

o Se conectan los punto

s medios de los intervalos

para crear el polígono









Semana de inicio de la enfermedad

Primer punto del dato Ultimo punto del dato

conectado al punto conectado al punto medio

medio del intervalo del intervalo siguiente del

cio

previo del eje de las X eje de las X

250

Para mantener un área total igual, hay que fijarse bien en la manera de "cerrar" el

histograma. La figura 4.12a muestra el método correcto la figura 4.12b el método

incorrecto. Al hacerlo correctamente, la línea de frecuencia empieza antes del primer

intervalo (en el centro de éste), afuera del histograma, y continúa con el centro del

primer intervalo que contiene datos, creando un área A' dentro del polígono que tiene el

mismo tamaño que el área A que está dentro del histograma pero fuera del polígono.

Fíjese que en la figura 4.11, se cierra el lado derecho del polígono de la misma forma.





Figura 4.12

Izquierda: Método correcto de cerrar un polígono

Derecha: Método incorrecto de cerrar un polígono









a. Correcto b. Incorrecto

En contraste la figura 4.12b muestra el método incorrecto de cerrar el polígono. Se

empieza la línea en la base del primer intervalo, dejando el área C fuera del polígono,

sin compensarla con otra área dentro; como consecuencia, el área del polígono no es

proporcional al número total de observaciones en la serie de datos.



Con un polígono de frecuencia, es fácil mostrar una comparación de dos o más

distribuciones en los mismos ejes. La figura 4.13 muestra una gráfica de una

comparación de tres polígonos de frecuencia y con la curva normal.



Un polígono de frecuencia difiere de una gráfica lineal de escala aritmética en varias

cosas. Se usa un polígono de frecuencia o un histograma para mostrar toda la

distribución de frecuencia de una variable contínua; se usa una gráfica lineal de escala

aritmética para mostrar una serie de puntos de observaciones (números absolutos o

tasas), usualmente a través del tiempo. Un polígono de frecuencias debe cerrarse en

ambos extremos porque el área por debajo de la curva es representativa de los datos;

una gráfica lineal de escala ritmética muestra solamente los puntos que representan los

datos.





251

Figura 4.13

Antropometría de niños de dos a 4 años de edad de Haití comparados con la población

de referencia de los CDC/OMS, departamentos septentrionales de Haití, 1990



Población de referencia

Peso para la talla

Talla para la edad

Peso para la edad









Puntuación de Z de referencia

Fuente: 9



Curvas de frecuencia acumulada y sobrevida

Como su nombre lo indica, una curva de frecuencia acumulada grafica la frecuencia

acumulada en vez de la frecuencia individual para cada intervalo de clase de una

variable. Se usa éste tipo de gráficas para identificar medias, quartiles y porcentajes. El

eje de las X registra los intervalos de clase y el eje de las Y muestra la frecuencia

acumulada o una escala absoluta (por ej.: el número de casos) o el porcentaje. Se

grafica cada frecuencia acumulada en el límite superior del intervalo que aplica, en vez

de al punto medio. Esta práctica permite que la gráfica represente visualmente el

número o porcentaje de observaciones por encima o por debajo del valor particular

(figura 4.14).



Se usa una curva de sobrevida en los estudios de seguimiento, para mostrar la

proporción de uno o más grupos que estén todavía vivos (o libres de la condición de

interés) en períodos diferentes a lo largo del tiempo. De forma similar a la curva de

frecuencia acumulada, el eje de las X registra períodos de tiempo y el eje de las Y

muestra porcentajes de cero a cien de los que aún viven. La diferencia más sobresaliente

entre las dos curvas es su forma misma: mientras la curva de frecuencia

252

Figura 4.14

Incidencia acumulada de infección por virus de hepatitis B por duración de

conducta de alto riesgo



% Usuariosde Drogas IV

I

n

f

e

c Homosexuales

t

a

d

o



c Trabajadores de la salud en

o

contacto frecuente con sangre

n



V

H Heterosexuales con

B múltiples parejas









Años a riesgo

Fuente: 1, 17, 19, 23



Figura 4.15

Curvas de sobrevida de una cohorte de pacientes con enfermedad arterial periférica

(EAP) (n=482) y sin EAP (n=262), Pittsburgh, Pennsylvania, 1977-1985



%



s

o

b

r Sin EAP

e

v

i

v

e

n Con EAP









Fuente: 20



Año

253

acumulada empieza en cero y en la parte más baja de la esquina izquierda de la gráfica y

va hacía cien en la esquina superior derecha, una curva de sobrevivencia empieza en

cien por ciento en la esquina superior izquierda y va disminuyendo hacía la esquina

inferior derecha en la medida que los pacientes van muriendo o sufirendo la condición

bajo estudio). La curva de sobrevida de la figura 4.15 compara el porcentaje de

sobrevivientes entre los pacientes que padecian de enfermedad arterial periférica (EAP)

y aquellos que no. ¿Cuál grupo tiene el porcentaje de sobrevida mas alto?. Para el 10

año la experiencia de sobrevida para los pacientes sin EAP era sustancialmente mejor

que para aquellos con EAP.









254

Diagramas de dispersión (nube de puntos)



Un diagrama de dispersión es una gráfica usada para detectar la relación entre dos

variables contínuas representadas una en el eje de las X y la otra en el eje de las Y. Para

crear un diagrama de dispersión se debe tener una pareja de valores para cada persona,

grupo u otra entidad en nuestra serie de datos, con un valor para cada variable; entonces,

se grafica cada par de valores colocando un punto en la gráfica donde los dos valores se

interceptan; la figura 4,16 muestra un diagrama de dispersión que grafica los niveles

séricos de tetraclordibenzo-p-dioxina (TCDD) por años de exposición para un grupo de

trabajadores.



Para interpretar un diagrama de dispersión se debe observar el patrón general hecho por

los puntos graficados; un patrón compacto indica un alto grado de correlación; puntos

muy dispersos indican una pequeña correlación. Si se requiere una medida cuantitativa

más exacta de la relación entre las variables en un diagrama de dispersión, se puede usar

un método de estadística formal como una regresión lineal. Estos métodos no son

cubiertos en este curso.



Figura 4.16

Ejemplo de gráfico de dispersión: Niveles séricos de tetra-cloro-dibenzo-p-dioxina (TCDD) ajustado

por lípidos en 253 trabajadores de acuerdo a los años de exposición, en 12 plantas químicas de los

Estados Unidos, 1987





T

C

D

D





g



X



g



d

e



g

r

a

s

a









Años de Exposición

Fuente: 16



255

Gráficas de una sola coordenada

Estas gráficas ilustran información estadística usando una sola coordenada; son más

apropiadas para comparar las magnitudes de diferentes categorías de un total, pero

tienen muchos otros usos.



Gráficas de barra

La gráfica de barra más simple es usada para mostrar en una forma visual los datos de

un cuadro de una sola variable; cada valor o categoría de una variable es representado

por una barra; la longitud de la barra es proporcional al número de personas o eventos

en ésta categoría; la figura 4.17 muestra el número de muertes infantiles por causa en

los EEUU; con ésta presentación, es muy fácil comparar la influencia de las diferentes

causas.



Las variables que se muestran en una gráfica de barra pueden ser discretas y no

continuas (raza o género) o se las trata como si fueran discretas y no continuas (grupos

de edad en vez de intervalos de edad en el eje). Se puede presentar las barras en forma

horizontal o vertical. La longitud o el tamaño de cada barra es proporcional a la

frecuencia del evento en esta categoría; por tal razón, no se debe graficar una

interrupción en el eje cuando se usa una gráfica de éste tipo porque puede dar lugar a

malas interpretaciones cuando se compara la magnitud de diferentes categorías.

Figura 4.11

Ejemplo de gráfica de barras horizontales:Número de muertes infantiles por causas

principales, Estados Unidos, 1983

Defectos congénitos



Bajo peso/Prematurez/Síndrome de

dificultad respiratoria



Muerte súbita





Hipoxia intrauterina/Asfixia neonatal



Lesiones no intencionales/Efectos

Adversos



Infecciones perinatales



Complicaciones de

placenta/membranas/cordón



Neumonía e influenza



Complicaciones maternas



Fuente: 6

256

Una gráfica de barras verticales difiere de un histograma en que las barras de la primera

son separadas, mientras que las barras de la segunda son unidas; ésta distinción existe

porque en un histograma se muestra la distribución de una variable contínua en el eje de

las X (p.ejemplo.colesterol sérico, edad) mientras que en una gráfica de barras, se

muestra en éste eje una variable discreta (sexo o raza).



Gráficas de barras agrupadas

Las gráficas de barras agrupadas se usan para ilustrar los datos de cuadros de dos o tres

variables, cuando una variable tiene únicamente dos categorías; las barras en un grupo

están generalmente unidas; éstas deben ilustrarse de manera distinta y describirse en una

nota a pie de página; es mejor limitar el número de barras en un grupo a no más de tres;

como se muestra en la figura 4,18, es difícil interpretar los datos cuando hay muchas

barras.



La gráfica de barras en la figura 4.19 representa tres variables: edad, género, y hábito de

fumar en la actualidad. El hábito de fumar es la variable consecuente y tiene dos

categorias:"si" y "no". Las barras representan las 10 categorias de edad/sexo. La altura

de cada barra es proporcional al porcentaje de fumadores actuales en cada categoría de

edad/ género.

Figura 4.18

Causas básicas de defunción entre menores de un año por

grupos raciales/étnicos, Estados Unidos, 1983

D

e

f.



x



m

i

l



n

v

r

Negros Indios Amer. Hispanos Asiat. Blancos Total

Raza/Etnia

Defectos Bajo peso/prematurez S. muerte súbita Otros

Cong. S dificultad respiratoria





Fuente: 6

257

Figura 4.19

Ejemplo de gráfica de barras verticales con anotación: Porcentaje de adultos que

fuman cigarrillos actualmente (personas de ≥18 años que han fumado alguna vez en

su vida al menos cien cigarrillos y que actualmente fuman) por edad y género,

Estados Unidos, 1988

Masculions 

Una celda

Femeninos 

separado por un

espacio

El significado de cada barra

es mostrado en una leyenda

Una

celda





Una celda puede

tener mas de una

% barra









Grupo Etario (Años)

Fuente: 10



Gráficas de barras apiladas



Es posible también mostrar categorías de una segunda variable como componentes de la

barra que representan la primera variable, como en la figura 4.20; éstas barras pueden

ser difíciles de interpretar porque, excepto por el componente de la base, los

componentes no están sobre la misma línea de base.



Gráficas de barras desviadas.



También se pueden usar barras para mostrar desviaciones tanto positivas como

negativas,en una variable, desde la línea de base. La figura 4.2 muestra una gráfica de

barras desviadas para algunas enfermedades de notificación obligatoria en los EEUU.

Se utiliza una gráfica similar en el Informe Semanal de Morbilidad y Mortalidad del

CDC. En esta gráfica, se compara el número de casos informados en las 4 semanas

anteriores con los informados en periodos comparables de los años anteriores. La

desviación a la derecha para la rubeóla indica un aumento por encima de los niveles

históricos; las desviaciones a la izquierda indican una reducción en comparación con

niveles anteriores. En ésta gráfica en particular, el eje de las X tiene una escala

logarítmica, que significa que una reducción o un aumento del 50% será representado

258

por barras de la misma longitud, pero en direcciones diferentes. Se resaltan los valores

más allá de los limites históricos (que son equivalentes a intervalos de confianza del

95%).

Figura 4.20

Causas básicas de defunción entre menores de un año por

grupos raciales/étnicos, Estados Unidos, 1983

Otras



S. de Muerte Súbita

D Prematurez/Bajo Peso/ S. de dificultad respiratorias

e

f. Defectos congénitos



x



m

i

l



n

v

Negros Indios Amer. Hispanos Asiat. Blancos Total

r Raza/Etnia

Fuente: 6

Casos 4 semanas

Enfermedad Decremento Incremento actuales



Meningitis aséptica

Encefalitis primaria

Hepatitis A

Hepatitis B

Hepatitis no A no B

Hepatitis sin especificar

Legionelosis

Malaria

Total de Sarampión

Infecciones

meningocóccicas

Parotiditis

Tosferina

Rabia Animal

Rubeóla



Por arriba de límites Razón en escala Log

históricos



Figura 4.21:Enfermedades de notificación, comparaciones de períodos cuatrisemanales que

terminaron el 26 de enero de 1991 con datos históricos, Estados Unidos, 1991

Fuente: 8

259

Gráficas de barra de componente 100%



Como variante de las barras apiladas, es posible construir todas las barras de la misma

altura y mostrar los componentes como un porcentaje del total en vez de mostrar sus

valores reales; éste tipo de gráfica es útil para comparar la contribución de los diferentes

componentes de cada categoría de la variable principal. La figura 4.22 muestra una

gráfica de componente 100%; fíjese que ella no es útil para comparar el tamaño relativo

de varias categorías de la variable principal; únicamente los totales dados arriba de las

barras indican que las categorías difieren en tamaño.



Figura 4.22

Causas básicas de defunción entre menores de un año por

grupos raciales/étnicos, Estados Unidos, 1983



Otras



S. de Muerte Súbita



Prematurez/Bajo Peso/ S. de dificultad respiratorias



Defectos congénitos

%



d

e



l

a



d

i

s

t

r

i

b

u

c

i

ó

n

Negros Indios Amer. Hispanos Asiat. Blancos Total

Raza/Etnia









260

Cómo construir una gráfica de barras



Para construir una gráfica de barras siga las siguientes instrucciones:



 Organice las categorías que definen las barras o grupo de barras en orden, ya sea

alfabético, por edad, o en un orden que produzca barras de altura que aumenten

o disminuyan.

 Elija la posición de las barras,(horizontal o vertical), como prefiera, excepto en

las barras de desviación que usualmente son horizontales.

 Haga todas las barras del mismo ancho.

 Haga la longitud de las barras en proporción con la frecuencia del evento; no

rompa la escala para no distorsionar la comparación del tamaño de las diferentes

categorías.

 No muestre más de tres barras en un grupo de barras.

 Deje espacios entre los grupos de barras adyacentes, pero no entre las barras de

un grupo.

 Codifique las variables por diferentes colores, matices etc. e incluya la leyenda

que interprete ésta codificación.









261

Ejercicio 4.6



Utilice los datos del cuadro 4.12 para dibujar una gráfica de barras apiladas, otra de

barras agrupadas y otra mas de barras componentes de 100% para ilustrar la distribución

etaria de los casos de sífilis primaria entre hombres y mujeres blancos y negros en los

Estados Unidos. ¿Qué información es presentada mejor por cada tipo de gráfica?







Grupo etario Blanca Negra

(Años) Total

Masculinos Femeninos Masculinos Femeninos



< 20 90 267 1443 2422 4222

20-29 957 908 8180 8093 18138

30-39 931 478 6893 3676 11978

40+ 826 160 3860 941 5787

Total 2804 1813 20376 15132 40125



Fuente: 12









Respuestas en las páginas 289









262

Gráficas de pasteles (tartas)



Una gráfica de pastel es simple, fácil de entender, ya que el tamaño de las rebanadas es

proporcional a la contribución de cada componente; los pasteles son útiles para mostrar

los componentes de un solo grupo o variable.



Para hacer un pastel, hay que dibujar un círculo, después empezar en las 12 del reloj y

organizar los componentes desde el más grande hacía el más pequeño en el sentido de

las manecillas del reloj, generalmente se ponen las categorías de "otro" y "desconocido"

al final. Se pueden usar diferentes matices para distinguir entre los pedazos; hay que

mostrar, (en alguna parte de la gráfica), los porcentajes representados por cada pedazo,

porque no es fácil identificarlos a simple vista.



No se recomienda el uso de múltiples pasteles, como los de la figura 4.23 para comparar

los mismos componentes en más de un grupo de variables, porque la comparación es

difícil; cuando se quiere comparar los componentes de más de un grupo o variable, hay

que usar unas gráfica de barras de componente 100%.



Figura 4.23

Manera de muerte traumática entre trabajadores según género,

Estados Unidos, 1980-1985









Masculinos Femeninos





Lesiones no intencionales



Homicidio



Suicidio



Otros



Fuente: 11



263

Mapas (gráficas con coordenadas geográficas)

Los mapas o las gráficas con coordenadas geográficas son usadas para mostrar la

localización de eventos o atributos. Los mapas de puntos y los mapas de área son

ejemplos comúnmente usados por este tipo de gráficas. Los mapas de puntos usan

cualquier símbolo para mostrar donde ocurre un evento o existe la enfermedad. La

figura 4.24 es un ejemplo de un mapa de puntos.



Para hacer un mapa de puntos se coloca un símbolo en el sitio en donde el evento

ocurríó o existía la condición. Si los eventos están agrupados en una localización, puede

ser difícil distinguir entre puntos, entonces, es posible utilizar símbolos codificados (.=

1 caso, = 2 casos,  = 3 casos etc.) que indican la ocurrencia de más de un evento.



Figura 4.24

Ejemplo de un mapa de puntos: Casos de histoplasmosis

por lugar de residencia, Austin, Minnesota, Cotubre-Noviembre 1984





Río Cedro



Noreste



Noroeste





Calle Oakland







Suroeste

Sureste



Aviario

Alberca Ciudad de Austin

Camino a la planta de carnes

Límites de la ciudad

Cuadrante

Ríos y arroyos

Vivienda caso índice





Fuente: CDC, datos sin publicar, 1984









264

Un mapa de puntos es útil para mostrar la distribución geográfica de un evento pero

(como es difícil tomar en consideración el tamaño de la población en riesgo) no se

muestra el riesgo de la ocurrencia del evento en este sitio particular, por ejemplo, el

riesgo de adquirir una enfermedad. Aún cuando un mapa de puntos muestre un gran

número de símbolos en la misma área, el riesgo de adquirir la enfermedad puede no ser

importante si el área es densamente poblada. Un mapa de área usa áreas colocadas o

codificadas para mostrar la incidencia del evento en partes de ésta o la distribución de

alguna condición en una región geográfica.



Figura 4.25

Casos presuntivos y confirmados de encefalitis de San Luis por

municipio de residencia, Florida, Julio-Octubre 1990









Fuente: 7



Se puede mostrar las tasas o la distribución en un mapa de área (figura 4.25); como con

el mapa de puntos, no se muestra el riesgo de un individuo de adquirir el evento; sin

embargo, si se muestran las tasas en un mapa de área, se puede ilustrar las diferencias en

265

el riesgo de presentar un evento en cada área. Por ejemplo, la figura 4.25 muestra el

número de casos de encefalitis de San Luis en 1990 en Florida según municipio, pero no

se pueden relacionar con la población a riesgo. Cuando se usan tasas se debe calcular la

tasa especifica, es decir, hay que dividir el número de casos en cada área por la

población en riesgo en ésta misma.









266

Ejercicio 4.7



Utilizando los datos de mortalidad por cáncer cervico-uterino del cuadro 4.9 en la

página 230, construye dos mapas de área basados en las dos primeras estrategias para

categorizar los datos en cuatro intervalos de clase como se describe en las páginas 231-

233.









Respuesta en la página 292









267

Diagramas de puntos y de caja (cajas y bigotes)



Un diagrama de puntos es similar a una gráfica de dispersión porque confronta una

variable contra otra; sin embargo, en un diagrama de punto, la variable del eje de las X

no es contínua, sino que representa las categorías discretas de una variable no continua.

Como se muestra en la figura 4.26, para ubicar una observación, hay que poner un punto

sobre la categoría apropiada de las X al nivel apropiado de las Y; hay que mostrar tantos

puntos en ésta posición como el número de observaciones con los mismos valores. Se

usa un diagrama de puntos para hacer una comparación visual de los puntos reales de

los datos de dos variables no continuas.



Figura 4.26

Ejemplo de diagrama de puntos: Resultados de anticuerpos (Ac) inhibidores de la

hemaglutinación (IH) contra el virus de la influenza porcina (VIP) entre ganaderos

asistentes a una feria, expuestos y no expuestos, Wisconsin, 1988









A

c



I

H



V

I

P









No expuestos Expuestos





Fuente: 26



Para comparar las distribuciones de dos variables no continuas se usa un diagrama o

gráfica de caja, también llamado de cajas y bigotes. Como se muestra en la figura 4,27;

la "caja" representa el rango interquartílico de los datos y "los bigotes" se extienden

hacía los valores máximos y mínimos. Se marca la posición mediana con una línea

vertical adentro de la caja; así, se puede mostrar (y comparar) el punto central (la



268

mediana), la dispersión (los cuartiles) y cualquier tendencia de desviación, como se

indica cuando la línea de la mediana no está centrada en la caja.





Figura 4.27

Ejemplo de diagrama de caja: Resultados de pruebas de ELISA indirecta para

anticuerpos IgG de virus parainfluenza tipo I en suero de pacientes en fase

convaleciente de casos y controles, Condado de Baltimore, Maryland, Enero 1990



Mediana









Casos (n=24)



Primer Piso



No Casos (n=26)









Fuente: CDC, datos sin publicar, 1990.









269

Un comentario sobre el uso de la tecnología informática

Existe un amplio número de paquetes de software para computadoras personales que

pueden ayudarnos a hacer cuadros, gráficos, y diagramas. La mayoría de estos

paquetes son muy útiles, especialmente a la hora de permitirnos redibujar un gráfico

sólo tecleando algunas órdenes. Con estos paquetes, hallar la curva epidémica más

adecuada ya no es una tarea tan ardua y tediosa: podemos dibujar gran número de

curvas rápida y fácilmente con diferentes intervalos de clase en el eje de las X.



Por otra parte, a veces caemos en la tentación de que el software dicte el gráfico. Por

ejemplo, muchos paquetes pueden dibujar diagramas de barras o de "tartas" que

parecen tridimensionales. ¿Quiere esto decir que deberíamos elaborar diagramas

tridimensionales? No debemos perder de vista nuestro propósito: comunicar

información a otras personas. ¿Comunicarán de mejor manera esa información los

diagramas tridimensionales que los bidimensionales?



Decida usted mismo: ¿Ofrece más información el diagrama tridimensional de la

figura 4.28b que el diagrama bidimensional de barras de la figura 4.28a? ¿Cuál es

más fácil de interpretar?



Si quisiéramos dirigir nuestra atención a la tendencia temporal de los casos

confirmados y los notificados, tal vez el diagrama tridimensional sea preferible. No

obstante, una gráfica

Figura 4.28a

Ejemplo de diagrama de barras bidimensional: Casos notificados y

confirmados de polio en las Américas, 1985-1989

confirmados

notificados









C

a

s

o

s









Año

Fuente: 5

270

Figura 4.28b

Ejemplo de diagrama de barras bidimensional: Casos notificados y

confirmados de polio en las Américas, 1985-1989





confirmados

notificados









C

a

s

o

s









Año

Fuente: 5



lineal en escala aritmética, con dos líneas podría ser la mejor de todas. Un problema

común de los gráficos de barras tridimensionales es que una barra de la línea de

delante puede ocultar a otra de la línea posterior. Suponga que estamos interesados en

la relación de los casos confirmados y los casos declarados cada año. En el diagrama

de barras bidimensional vemos inmediatamente que el número de casos confirmados

en 1985 es aproximadamente dos tercios del número de casos declarados en ese año.

¿Cuánto tiempo necesitaría observar el gráfico tridimensional para llegar a la misma

conclusión? Ahora compare la relación de los casos confirmados y los casos

declarados en los cinco años. Si necesitase comunicar esta información conuna

diapositiva en 20 segundos durante una presentación oral, ¿qué figura preferiría

mostrar?







271

¿Aporta el gráfico de pastel tridimensional de la figura 4.29b alguna información más

que el gráfico bidimensional de la figura 4.29a? ¿Puede Vd. juzgar los tamaños

relativos de los componentes también en la versión tridimensional? Observe el pastel

tridimensional y borre o tape los porcentajes de los hispanos y de los asiáticos/isleños

del pacífico. ¿Realmente podría decir qué porción es mayor y en qué medida?

Creemos que no podría. ¿Podría decir esa información a partir del pastel

bidimensional? Recuerde que el único propósito del diagrama tipo pastel es poner de

relieve el tamaño.



La adición de características llamativas que no añaden información alguna a una

figura, y que, incluso, pueden conducir a interpretaciones erróneas, se ha denominado

gráfico-chatarra (25).

Figura 4.29a

Ejemplo de gráfica pastel bidimensional: Porcentaje de casos de tuberculosis por

etnias, Estados Unidos, 1989 (n=23,495)

Indios Americanos/Nativos de Alaska



Asiáticos/Isleños del Pacífico





Negros no Hispanos









Hispanos









Blancos no Hispanos







Fuente: 12









272

Figura 4.29b

Ejemplo de gráfica pastel bidimensional: Porcentaje de casos de tuberculosis por

etnias, Estados Unidos, 1989 (n=23,495)

Indios Americanos/Nativos de Alaska

Asiáticos/Isleños del Pacífico

Negros no Hispanos







Hispanos









Blancos no Hispanos







Fuente: 12



Muchas personas utilizan arbitrariamente la tecnología al seleccionar el color,

especialmente en diapositivas que acompañan exposiciones orales. Si usted usa

colores o piensa hacerlo, siga estas recomendaciones:



 * Seleccione los colores de forma que todos los componentes del gráfico -

título, ejes, datos, leyendas- resalten claramente sobre el fondo, y de forma

que cada serie de datos enumerados se distinga con claridad de las demás.



 Evite contrastar el rojo y el verde, ya que hasta un 10% de los varones entre el

público puede tener cierto grado de ceguera para los colores.



 * Si es posible, seleccione los colores de forma que comuniquen información.

Por ejemplo, consideremos un mapa en el que los estados están divididos en

cuatro grupos según las tasas de una determinada enfermedad. Más que elegir

los colores únicamente por razones estéticas, debería escoger un color

suave para los estados con las tasas más bajas e ir usando colores más oscuros

a la par que las tasas sean mayores. De esta forma, los colores contribuirán,

más que a distorsionar o distraer, a facilitar la información que desea

transmitir.







273

Finalmente, con algunos paquetes de software, no podrá producir algunos de los tipos

de gráficos descritos en este manual. Especialmente, algunos paquetes informáticos

no pueden crear histogramas; en lugar de éstos, producen diagramas de barras. Sus

gráficas deberán estar determinadas por sus datos y las relaciones que desee

comunicar visualmente, no por la tecnología que tenga disponible. Si el software que

tiene no es capaz de ajustarse a sus datos, no comprometa la integridad de éstos o su

presentación. ¡Use otro software!



Selección y construcción de cuadros, gráficos, diagramas y mapas



Para comunicar los hallazgos epidemiológicos, debe seleccionarse en primer lugar la

mejor forma de ilustrarlos. Sin embargo, incluso el mejor método debe elaborarse de

forma adecuada o el mensaje se perdería. Las cuadros de esta sección proporcionan

una guía a la hora de elegir los métodos de ilustración y de construcción de cuadros,

gráficas y diagramas/mapas.









274

Cuadro 4.13

Guia para seleccionar una gráfica o diagrama/mapa para ilustrar datos

epidemiológicos



Tipo de gráfico o diagrama/mapa Cuando emplearlo



Gráfica lineal en escala aritmética Tendencias en cifras absolutas o tasas en el tiempo



Gráfica lineal en escala semilogarítmica 1. Enfattizar tasa de cambio en el tiempo

2. Desplegaar valores que varían en un orden de magnitud de

mas de dos veces



Histograma 1. Distribución de frecuencia en escala contínua

2. Número de casos durante una epidemia (curva epidémica)

o a lo largo del tiempo



Polígono de frecuencias Distribución de frecuencias de una variable en escala

continua, especialmente para mostrar componentes



Frecuencia acumulada Frecuencia acumulada de una variable continua



Diagrama de dispersion Graficar la asociación entre dos variables continuas



Gráfica o diagrama de barras simples Comparar el tamaño o frecuencia de diferentes categories de

una sola variable



Gráfica o diagrama de barras agrupadas Comparar el tamaño o frecuencia de diferentes categories de

2-4 series de datos



Gráfica o diagrama de barras apiladas Comparar totales e ilustrar las partes componentes del total

en diferentes grupos



Gráfica o diagrama de barras de desviación Ilustrar diferencias, tanto positivas como negativas con

respecto a un nivel basal



Gráfica o diagrama de barras componentes de Comparar como las partes componentes contribuyen a un

100% total en grupos deiferentes



Diagrama o gráfica de pastel Mostrar los componentes de un total



Mapa de puntos Mostrar la localización de casos o eventos



Mapa de áreas Desplegar eventos o tasas geográficamente



Diagrama de cajas y bigotes Visualizar las características estadísticas de dispersion

(mediana, rango, sesgo) de una variable







275

Cuadro 4.14

Seleccione un meotod para ilustrar datos epidemiológicos



Si los datos son: Y las siguientes condiciones aplican: Entonces, escoga:





Series de tiempo Número de casos 1-2 series Histograma

(epidemia o tendencia

secular)

2 o mas series Polígono de frecuencias





Tasas Rango de valores ≤2 Gráfica lineal en escala

ordenes de magnitud artimética







Rango de valores ≥ 2 Gráfrica lineal en escala

ordenes de magnitud semi logarítmica







Datos en escala continua que Distribución de frecuencias Histograma o polígono

no sean series de tiempo de frecuenicas

Datos en categories discretas Gráfica de barras o

(que no sea lugar) pastel





Lugar Número de No identificable en un mapa Gráfica de barras

casos



Identificable en un Sitio específico es Mapa de puntos

mapa importante

Sitio específico no es Mapa de área

importante

Tasas Mapa de área









276

Cuadro 4.15

Lista para la construcción de cuadros, gráficas, y representaciones visuales.



Lista para los cuadros.



1. Título.

 ¿Tiene el cuadro un título?

 ¿ Describe el título el contenido, incluyendo el tema, persona, lugar y tiempo ?



 ¿ Está el título precedido por una designación " Cuadro # " ? ( " Cuadro " se

utiliza para presentar textos, " Figura " para gráficas, diagramas y mapas. Las

secuencias numéricas separadas se utilizan para tablas y figuras en el mismo

documento [ por ejemplo, Cuadro 1, Cuadro 2, Figura 1, figura 2 ]).



2. Filas y columnas.

 ¿ Está cada fila y columna rotulada de forma clara y concisa ?

 ¿ Se muestran las unidades específicas de medida ? (por ejemplo, años, mm

Hg, mg/dl, tanto por 100.000, etc).

 ¿ Son las categorías apropiadas para los datos ?

 *¿ Se proporcionan los totales de las filas y de las columnas ?



3. Notas de pie de página.

 ¿ Están todos los códigos, abreviaciones o símbolos explicados ?

 ¿ Están todas las exclusiones anotadas ?

 ¿ Si los datos no son originales se proporciona la fuente ?



Lista para gráficas, diagramas y mapas.



1. Título.

 ¿ Tiene la gráfica o diagrama un título ?

 ¿ Describe el título el contenido, incluyendo el tema, persona, lugar y tiempo ?

 ¿ Está el título precedido por una designación " Figura # " ? ( " Cuadro" se

utiliza para presentar textos, " Figura " para gráficas, diagramas y mapas. Las

secuencias numéricas separadas se utilizan para los cuadros y figuras en el

mismo documento [ por ejemplo, Cuadro 1, Cuadro 2, Figura 1, Figura 2 ]).



2. Ejes.

 ¿ Está cada eje rotulado de forma clara y concisa ?

 ¿ Están las unidades específicas de medida incluidas como parte del rótulo ? (

Por ejemplo, años, mm Hg, mg/dl, tantos por 100.000, etc).

277

 ¿ Están las divisiones de la escala indicadas en los ejes de forma clara ?

 ¿ Son las escalas de cada eje apropiadas para los datos ?

 ¿ Comienza el eje en cero ?

 Si se utiliza una interrupción en una gráfica de líneas de escala, ¿Se identifica

fácilmente ?

 ¿ Se ha utilizado una interrupción en un histograma, polígono de frecuencia, o

diagrama de barras ? ( La respuesta debería ser NO).

 ¿ Están los ejes dibujados de forma más acentuada que el resto de las líneas

de coordenadas?



3. Líneas de coordenadas.

 ¿ Incluye la figura únicamente tantas líneas de coordenadas como son

necesarias para guiar la vista ? (A menudo éstas son innecesarias).



4. Trazado de los datos.

 ¿ Está el trazado dibujado de forma clara ?

 Si se muestra más de una serie de datos o componentes, ¿ Se distinguen

claramente sobre el mapa ?

 ¿ Está cada serie o componente rotulado en el mapa o en una leyenda o clave

?

 Si se utiliza color o sombreado en un mapa de superficie,¿ Corresponde un

incremento de color o de sombreado con un incremento en la variable que se

está mostrando ?



5. Notas de pie de página.

 ¿ Están todos los códigos, abreviaturas o símbolos explicados ?

 ¿ Están todas las exclusiones anotadas ?

 Si los datos no son originales, ¿ Se proporciona la fuente ?



6. Representación visual.

 ¿ Incluye la figura alguna representación que no es necesaria ?

 ¿ Está la figura colocada en la página para una óptima lectura ?

 ¿ La combinación de tamaños y colores mejora la lectura ?









278

Cuadro 4.15 (continuación)

Lista para la construcción de cuadros, gráficas, y representaciones visuales.





Lista para unas representaciones visuales efectivas.



1. Legibilidad (asegúrese de que su audiencia puede leer fácilmente sus

representaciones).

 ¿ Pueden leerse los encabezados de sus transparencias desde una distancia de

6 pies (1,8 metros) cuando no están proyectadas ?.

 ¿ Puede una diapositiva de 35 mm leerse desde una distancia de 1 pie (30,48

cm) cuando no está proyectada?

 ¿ Cuando se proyectan pueden sus visuales leerse desde los lugares más

lejanos de la habitación ?



2. Simplicidad (mantenga un mensaje simple).

 ¿ Ha utilizado palabras sencillas ?

 ¿ Se presenta la información en el lenguaje de la audiencia ?

 ¿ Ha utilizado únicamente palabras claves ?

 ¿ Ha omitido conjunciones, preposiciones, etc?

 ¿ Se limita cada representación solamente a una idea, concepto o tema

principal ?

 ¿ Tiene cada visual no más de tres colores ?

 ¿ Hay no más de 35 letras y números en cada visual ?

 ¿ Hay no más de 6 líneas de narración y no más de 6 palabras por línea ?









279

Cuadro 4.15 (continuación)

Lista para la construcción de cuadros, gráficas, y representaciones visuales.



3. Multitud de colores.

 Los colores que elija tendrán un impacto sobre el efecto de sus

representaciones. Debería utilizar colores cálidos/calientes para enfatizar,

destacar, enfocar o para reforzar los conceptos claves. Debería utilizar colores

fríos en el fondo o para separar los párrafos. Utilice la siguiente tabla para

seleccionar el color apropiado para el efecto que desea.





Caliente Cálido Fresco Frío

Colores Rojos Naranja ligero Azul ligero Azul oscuro

Naranja brillante Amarillo ligero Verde ligero Verde oscuro

Amarillo brillante Dorado ligero Púrpura ligero Púrpura oscuro

Dorado brillante Marrones Gris ligero Gris oscuro

Efecto Excitante Moderado Apagado Sombrío





 ¿ Está utilizando la mejor combinación de colores?

El párrafo más importante debería estar en el color más relevante y tener mayor

contraste con respecto al fondo. La combinación de colores más legible es:

Negro sobre Amarillo.

Negro sobre Blanco.

Verde oscuro sobre Blanco.

Azul oscuro sobre Blanco.

Blanco sobre Azul oscuro.



4. Precisión.

Las representaciones se convierten en distracciones cuando se

advierten los errores. Cuente con alguien que no haya visto las

representaciones para que compruebe si no hay incorrecciones y errores en

general.



5. Durabilidad.

Las transparencias y diapositivas de 35 mm son las ayudas visuales

más duraderas. Sin embargo, ambas requieren una protección contra los

arañazos. Una lámina de acetato protegerá la transparencia. Mantenga las

diapositivas de 35 mm en un lugar frío y seco. Si se dejan a la luz, los colores

se estropearán.







280

Resumen

Las cuadros, gráficos, diagramas y mapas son herramientas eficaces para resumir y

comunicar datos. Las cuadros se usan comúnmente para expresar números, tasas,

proporciones y porcentajes acumulados. Como la finalidad de éstas es precisamente la

comunicación de información, la mayoría de ellas no deben tener más que dos

variables y no más de ocho categorías (intervalos de clase) por cada variable. Las

cuadros se usan en ocasiones fuera de contexto, por lo que deberían ser titulados

correctamente y detallar en ellas los datos más importantes como referencia.



Las cuadros pueden desplegar tanto datos nominales u ordinales continuos. Las

variables nominales como género y residencia tienen unas categorías obvias. Las

variables continuas no; deben crearse para ellas intervalos de clase. Para algunas

enfermedades se han adoptado unos intervalos de clase estándar como es el caso de la

edad. Por otro lado, existe gran variedad de métodos para establecer intervalos

razonables para variables contínuas los que incluyen: crear intervalos con un número

igual de personas u observaciones en cada uno; intervalos de clase de una extensión

constante; e intervalos de clase basados en la media y la desviación estándar.



Los gráficos, mapas y diagramas son herramientas incluso más eficaces cuando se

trata de comunicar datos rápidamente. A pesar de que muchas personas usan los

términos gráfico mapa y diagrama indistintamente, en esta unidad nos referimos con

gráfico a una figura con dos coordenadas, un eje x horizontal y un eje y vertical. En

otras palabras, ambas variables son continuas. Por ejemplo, en el eje y con frecuencia

representamos datos como el número de casos o la tasa de la enfermedad, mientras

que en el eje x señalamos el tiempo. Por el contrario, hablamos de diagrama

refiriéndonos a una figura con una variable continua y una nominal. Por ejemplo, un

diagrama podría representar el número de casos (variable continua) en relación al

género (variable nominal).



Los gráficos lineales en escala aritmética han sido usados tradicionalmente para

mostrar las tendencias temporales de las tasas de las enfermedades. Los gráficos

lineales en escala semilogarímica se prefieren cuando las tasas varían entre por

encima de dos o más órdenes de magnitud. Los histogramas y polígonos de frecuencia

se utilizan para mostrar las distribuciones de frecuencias. Un tipo especial de

histograma conocido como curva epidémica muestra el número de casos por tiempo

de comienzo de la enfermedad o momento del diagnóstico durante un período

epidémico. Los casos pueden representarse por cuadrados que se unen para formar las

columnas del histograma; los cuadrados pueden marcarse para distinguir

características importantes de los casos, como el desenlace fatal.



281

Los diagramas de barras simples y los de pastel se utilizan para representar la

distribución frecuencial de una sola variable. Los diagramas de barras agrupadas

pueden representar las frecuencias de dos, o incluso tres variables. Los mapas de

puntos señalan la localización de cada sujeto o suceso. Un mapa de áreas usa el

sombreado o el coloreado para mostrar los distintos niveles de números o tasas de una

enfermedad en las distintas zonas. Cuando se utilizan estas herramientas, es

importante recordar su finalidad: resumir y comunicar. Las figuras sobrecargadas y de

vistosos colores no son necesariamente mejores; ¡a veces cuanto menos, mejor!









282

Respuesta a los Ejercicios



Ejercicio 4.1 (página 220)



Ocurrencia de diarreas por menú entre residentes del ancianato A, 1989



Diarrea

Menú Si No Total

A 12 5 17

B 0 7 7

C 0 4 4

D 2 4 6

E 0 1 1

F 0 1 1

Total 14 22 36





B.



Ocurrencia de diarreas por exposición al menú A, entre residentes del ancianato A, 1989

Diarrea

Si No Total

Si 12 5 17

Menú A No 2 17 19

Total 14 22 36



Ejercicio 4.2 (página 234)



Estrategia 1: Dividir los datos en grupos de tamaño similar



Dividir la lista en tres grupos de estados de igual tamaño:



50 estados /3 = 16.67 estados por grupo. Así, dos grupos contendrían 17 estados y un

grupo contendría 16 estados.



Oklahoma (#17) podría ir tanto en el grupo 1 como en el 2, pero como tiene la misma

tasa que Indiana (#16), tiene sentido poner Oklahoma en el grupo 1. Análogamente,

como Michigan (#34) podría ir tanto en el grupo 2 como en el 3, y tiene la misma tasa

que Oregon (#33), debería incluirse en el grupo 2.

283

Categorías finales:





Estados Tasa por cien mil Número de estados

1. OK-SC 4.1-5.6 17

2. MI-IL 3.3-4.0 17

3. UT-CA 1.8-3.2 16



Estrategia 2: Categorías basadas en la media y la desviación estándar



Cree 3 categorías basándose en la media (3.70) y la desviación típica (0.96):



límite superior de la categoría 1 = media - 1 desviación típica = 3.70-0.96 = 2.74

límite superior de la categoría 2 = media + 1 desviación típica = 3.70+0.96 = 4.66

límite superior de la categoría 3 = valor máximo = 5.6



Categorías finales:



Estados Tasa por cien mil Número de estados

1. MS-SC 4.67-5.60 9

2. RI-NC 2.75-4.66 34

3. UT-WI 1.80-2.74 7



Estrategia 3: Dividir el rango en intervalos de clase iguales



Divida el rango entre 3: (5.60-1.80) /3 =1.267



Use múltiplos de 1.27 para crear las 3 categorías, comenzando por 1.8:



1.- Desde 1.80 hasta (1.80+1.27)= desde 1.80 hasta 3.07

2.- Desde 3.08 hasta (1.80+ 2•1.27)= desde 3.08 hasta 4.34

3.- Desde 4.35 hasta (1.80+ 3•1.27)= desde 4.35 hasta 5.61



Categorías finales:



Estados Tasa por cien mil Número de estados

1. ME-SC 4.35-5.61 12

2. AZ-VT 3.08-4.34 25

3. UT-MA 1.80-3.07 13

284

O bien, redondeando las cifras:



Estados Tasa por cien mil Número de estados

1. ME-SC 4.4-5.6 12

2. AZ-VT 3.1-4.3 25

3. UT-MA 1.8-3.1 13









285

Respuesta al ejercicio 4.3 (página 240)



A. y B.



Figura 4.30

Incidencia anual de sarampión en los Estados Unidos por cien mil habitantes, 1955-

1990 con una subserie interior de 1980 a 1990







c

a

s

o

s

c

x

a

s ci

e

o n

s

m

i

x l



c

i

e Año

n

m

il









Año

Fuente: 12









286

Respuesta al ejercicio 4.4 (página 244)







Figura 4.31

Incidencia anual de sarampión en los Estados Unidos por

cien mil habitantes, 1955-1990









c

a

s

o

s



x



c

i

e

n

m

il









Año







Fuente: 12









287

Respuesta al ejercicio 4.5 (página 249)



Figura 4.32

Brote de enfermedad diarreica en ancianato A, Enero de 1989





C

a

s

o

s









Fecha de inicio







Este brote aparentemente duró apenas dos semanas, de Enero 12 a Enero 23. Después

del caso inciial del 12 de Enero, el pico ocurrió el día siguiente con tres casos el 13 de

Enero. La curva permaneció relativamente aplanada después con dos casos en cuatro

de los cinco dias siguientes y otros dos al sexto día siguiente. Ocurrieron casos únicos

los días 20 y 23.









288

Respuesta al ejercicio 4.6 (página 262)

Figura 4.33a

Gráfica de barras apiladas: Número de casos de sífilis primaria y secundaria por edad,

género y raza, Estados Unidos, 1989

Años







M

i

l

e

s



d

e

c

a

s

o

s









Hombres Mujeres Hombres Mujeres

Blancos blancas negros negras



Fuente: 12









289

Figura 4.33b

Gráfica de barras agrupadas: Número de casos de sífilis primaria y secundaria por

edad, género y raza, Estados Unidos, 1989





M

i

l

e

s



d

e

c

a

s

o

s









Hombres Mujeres Hombres Mujeres

Blancos blancas negros negras



Años









290

Figura 4.33 c

Gráfica de barras componentes de 100%: Número de casos de sífilis primaria y secundaria por edad,

género y raza, Estados Unidos, 1989









Distribu-



ción



% Años



por



edad









Hombres Mujeres Hombres Mujeres

Blancos blancas negros negras









291

Respuesta al ejercicio 4.7 (página 267)



A.



Figura 4.34a

Estrategia 1: Media anual de tasas de mortalidad ajustadas por edad de cáncer

cervico-uterino por estado, Estados Unidos, 1984-1986









Fuente: 2









292

B.



Figura 4.34b

Estrategia 2: Media anual de tasas de mortalidad ajustadas por edad de cáncer

cervico-uterino por estado, Estados Unidos, 1984-1986









Fuente: 2









293

Examen de autoevaluación 4



Ahora que ya ha leído la unidad 4 y ha realizado sus ejercicios, debería estar

preparado para responder al examen de autoevaluación. Este examen está diseñado

para ayudarle a establecer en qué medida ha asimilado el contenido de esta lección.

Podrá volver al texto en cualquier momento que tenga dudas acerca de alguna

respuesta, pero recuerde que el examen final deberá realizarlo a libro cerrado.

Marque con un círculo TODAS las respuestas correctas a cada pregunta.





1.- ¿Para qué tarea son importantes herramientas para el epidemiólogo los cuadros,

diagramas y gráficos?



a. Recolección de datos

b. Resumen de los datos (epidemiología descriptiva)

c. Análisis de los datos

d. Presentación de los datos



2.- ¿Cuál de los siguientes cuadros "2x2" está correctamente rotulada?

a.

Enfermo Sanos Total

Expuesto a c H1

No expuesto b d H2

Total V1 V2 T

b.

Enfermo Sanos Total

Expuesto a b V1

No expuesto c d V2

Total H1 H2 T

c.

Enfermo Sanos Total

Expuesto a b H1

No expuesto c d H2

Total V1 V2 T

d.

Expuesto No expuesto Total

Enfermo a b H1

Sano c d H2

Total V1 V2 T



294

Morbilidad por sífilis primaria y secundaria por edad, Estados Unidos, 1989



Casos

Años de edad Número Porcentaje Porcentaje Acumulado



14 230 0.5% 0.5%

15-19 4,378 9.9% 10.4%

20-24 10,405 23.6% 34.0%

25-29 9,610 21.8% 55.9%

30-34 8,648 19.6% 75.5%

35-44 6,901 15.7% 91.2%

45-54 2,631 6.0% 97.2%

 55 1,278 2.9% 100.1%

Total 44,084 100.0%* 100.0%

*Los porcentjes no suman a 100% por redondeo





3.- El cuadro que se muestra arriba, es un ejemplo de:



a. cuadro de una variable



b. cuadro de dos variables



c. cuadro de tres variables



d. cuadro de cuatro variables





4.- El número máximo de variables que podrían ser enfrentadas en un cuadro simple

es:



a. 1



b. 2



c. 3



d. 4



295

5.- El mejor momento para estructurar los cuadros es:



a. antes de planificar el estudio



b. como parte de la planificación del estudio



c. tras la recolección de los datos



d. antes del análisis de los datos



e. como parte del análisis de los datos

6.- Entre los métodos recomendados para crear categorías a partir de variables

continuas, están: (Rodee con un círculo TODO lo que proceda.)



a. basar las categorías en la media y la desviación típica



b. dividir los datos en categorías con número similar de observaciones



c. dividir el rango en intervalos de clase iguales



d. usar las categorías que se consideran estándar en la patología o condición de

que se trate



e. usar las mismas categorías en las que están agrupados los datos de la

población









296

7.- La unidad ilustra tres estrategias para crear intervalos de clase a partir de variables

continuas. De los siguientes grupos de intervalos de clase mostrados (A-D), ¿cuáles

concuerdan con alguna de las tres estrategias recomendadas? (Pista: desviación típica

= 117.6)(Rodee con un círculo TODO lo que proceda.)



Casos notificados de enfermedad A por 100,000 habitantes por tracto del censo,

Dixon, 1991



Tracto Censo Casos por 100,00 habitantes

1 170.5

2 0.0

3 70.0

4 40.0

5 115.5

6 42.1

7 453.5

8 0.0

9 35.1

10 50.3

11 0.0

12 0.0

13 186.4

14 49.9

15 48.9

Total 1262.2



a. b. c. d.

0.0 0.0-35.1 0.0-50.0 0.0-113.4

0.1-84.1 35.2-50.3 50.1-100.0 113.5-226.8

84.2-201.7 50.4-453.5 100.0-200.0 226.9-340.2

201.8-453.5 200.1-453.5 340.3-453.6



8.- La diferencia principal entre un gráfico lineal en escala aritmética y un gráfico en

escala semilogarítmica es que la escala aritmética:



a. mide el rango del cambio entre puntos sucesivos en un gráfico



b. es preferida cuando el rango de valores que deben reflejarse es muy amplio



c. usa en cada eje las mismas distancias para reflejar las mismas cantidades



d. es el mejor método de mostrar los cambios en la magnitud de los números

297

9.- ¿Qué tipo de gráfico estaría recomendado para mostrar las tasas anuales de

mortalidad por enfermedad Z, de 1940 a 1990? (Rodee con un círculo TODO lo que

proceda.)



a. gráfico lineal en escala aritmética



b. gráfico lineal en escala semilogarítmica



c. histograma



d. polígono de frecuencias





10.- ¿Cuál de los siguientes grupos de valores sería inapropiado para identificar

intervalos equidistantes sobre el eje y de un gráfico lineal en escala semilogarítmica?



a. 1, 10, 100, 1000



b. 10, 20, 30, 40



c. 7, 70, 700, 7000



d. 0.003, 0.03, 0.3, 3





11.- Los diagramas de barras pueden distinguirse de los histogramas a simple vista, ya

que:



a. los diagramas de barras no se usan para datos de series temporales



b. los histogramas se usan para representar datos discretos



c. los diagramas de barras se basan en el área bajo la curva



d. los histogramas no tienen espacios entre las columnas consecutivas









298

12.- ¿Cuáles de las siguientes afirmaciones sobre una curva epidémica son ciertos?

(Rodee con un círculo TODO lo que proceda.)



a. Una curva epidémica es un histograma

b. Una curva epidémica muestra número de casos por fecha de exposición

c. Una curva epidémica debería comenzar con el primer caso del brote.

d. Una curva epidémica debería utilizar en el eje x intervalos de tiempo de

aproximadamente 1/2 del período de incubación.





13.- ¿Cuál de los siguientes métodos de cerrar un polígono de frecuencias sobre el eje

horizontal es correcto?









14.- ¿Qué tipo de gráfico o diagrama sería apropidado para representar muertes a

través del tiempo para una cohorte de 100 alumnos de la Clase de 1907? (Rodee con

un círculo TODO lo que proceda.)



a. Diagrama de barras

b. Curva de frecuencias acumulativas

c. Histograma

d. Curva de supervivencia





299

Respuestas para las preguntas 15 - 20:



a. gráfico lineal en escala aritmética

b. diagrama de barras

c. series de gráficos de caja (o cajas y bigotes)

d. series de diagramas de puntos

e. polígono de frecuencias

f. diagrama de nube de puntos o de dispersión





15.- Número de casos según una variable continua _________________



16.- Número de casos según una variable discreta (no continua) _____________



17.- Valor medio de una variable continua según una variable discreta (no continua)

______________________________



18.- Valor medio de una variable continua según una variable discreta (no continua)



________________________________



19.- Cada valor de una variable continua según una segunda variable continua



________________________________



20.- Cada valor de una variable continua según una variable discreta (no continua)



________________________________



21.- ¿Qué tipo de gráfico es más adecuado para comparar tasas de cambio de la

aparición de una enfermedad a lo largo de algunos años?



a. gráfico lineal en escala aritmética

b. gráfico lineal en escala semilogarítmica

c. histograma

d. polígono de frecuencias









300

22.- ¿Qué tipo de gráfica es más adecuado para comparar la magnitud de sucesos que

han ocurrido en distintos lugares, sin que se disponga de un plano para ello?



a. gráfico lineal en escala aritmética

b. diagrama de barras

c. polígono de frecuencias

d. histograma



23.- ¿Qué tipo de diagrama podría ser utilizado para representar el tamaño relativo de

diferentes causas de muerte según el sexo? (Rodee con un círculo TODO lo que

proceda.)



a. diagrama simple de una sola barra

b. diagrama de barras agrupadas

c. diagrama de barras apiladas

d. diagrama de barras componentes de 100%

e. diagrama de pastel





24.- La mejor elección para representar los años potenciales de vida perdidos según

diferentes causas de muerte es:



a. diagrama simple de una sola barra

b. diagrama de barras agrupadas

c. diagrama de barras apiladas

d. diagrama de barras de 100% componentes (de múltiples barras)



25.- ¿Cuál de las siguientes afirmaciones es cierta respecto de la comparación de un

mapa de áreas con un mapa de puntos? (Rodee con un círculo TODO lo que proceda.)



a. El mapa de áreas muestra la localización de un caso o suceso más

específicamente.

b. Sólo el mapa de áreas puede mostrar riesgos o tasas de enfermedad

c. Sólo el mapa de áreas puede mostrar dos o más casos en la misma

localización

d. Un mapa de áreas puede mostrar tasas, pero sólo un mapa de puntos puede

mostrar números de casos.

Las respuestas, en el Apéndice J

Si ha respondido al menos a 20 preguntas correctamente, habrá asimilado la Unidad 4

suficientemente bien para pasar a la Unidad 5.

301

Referencias



1. Alter MJ, Ahtone J, Weisfuse I, Starko K, Vacalis TD, Maynard JE. Hepatitis

B virus transmission between heterosexuals. JAMA 1986; 256: 1307-1310.

2. Centers for Disease Control. Chronic Disease Supplement, 1987. Deaths from

cervical cancer- U.S., 1984-1986. MMWR 1989; 38: 38.

3. Centers for Disease Control. HIV/AIDS Surveillance Report. November 1990.

4. Centers for Disease Control. Manual of reporting procedures for national

morbidity reporting and public health surveillance activities. July 1985.

5. Centers for Disease Control. Progress toward eradicating poliomyelitis from

the Americas. MMWR 1989; 39: 33.

6. Centers for Disease Control. Infant mortality among racial/ethnic minority

groups, 1983-1984. MMWR 1990; 39: SS- 3.

7. Centers for Disease Control. St. Louis encephalitis -Florida and Texas, 1990.

MMWR; 39: 42.

8. Centers for Disease Control. MMWR 1991; 40: 4.

9. Centers for Disease Control. Nutritional assessment of children in drought-

affected areas -Haiti, 1990. MMWR 1991; 40: 13.

10. Centers for Disease Control. CIgarette smoking among adults -United States,

1988. MMWR 1988; 40: 44.

11. Centers for Disease Control. National Institute of Occupational Safety and

Health. National traumatic Occupational Fatalities Database.

12. Centers for Disease Control. Summary of notifiable diseases, United States,

1989. MMWR 1989; 38 (54).

13. Centers for Disease Control. Health Status of Vietnam veterans. Volume 3:

Medical Examination. 1989.

14. Creech JW. Effective oral presentations. Epi in Action Course, Centers for

Disease Control, 1988.

15. Dicker RC, Webster LA, Layde PM, Wingo PA, Ory HW. Oral contraceptive

use and the risk of ovarian cancer: The Centers for Disease Control Cancer and

Hormone Study. JAMA 1983; 249: 1596-1599.

16. Fingerhut MA, et al. Cancer mortality in workers exposed to 2, 3, 7, 8 -

tetrachlorodibenzo-p-dioxin. N Engl J Med 1991; 324: 212-218.

17. Hadler SC, et al. Occupational risk of hepatitis B infection in hospital

workers. Infect Ctrl 1985; 6: 24-31.

18. Kleinman JC, Donahue RP, Harris MI, Finucane FF, Madans JH, Brock DB.

Mortality among diabetics in a national sample. Am J Epidemiol 1988; 128: 389-401.

19. Lettau LA, et al. Outbreak of severe hepatitis due to delta and hepatitis F

viruses in parenteral drug abusers and their contacts. N Engl J Med 1987; 317: 1256-

1262.



302

20. McKenna M, Wolfson S, Kuller L. The ratio of ankle and arm arterial pressure

as an independent predictor of mortality. Athero 1991; 87: 119-128.

21. National Center for Health Statistics. Advance Report of final mortality

statistics, 1987. Monthly vital statistics report; vol 38, no. 5 supp. Hyattsville, MD:

Public Health Service. 1989.

22. Schoenbaum SC, Baker O, Jezek Z. Common source epidemic of hepatitis

due to glazed and iced pastries. Am J Epidemiol 1976; 104: 74-80.

23. Schereeder MT, et al. Hepatitis B in homosexual men: prevalence of infection

and factors related to transmission.J Infect Dis 1982; 146: 1.

24. Sutter RW, Patriarca PA, Brogran S et al. Outbreak of paralytic poliomyelitis

in Oman. Evidence for widespread transmission among fully vaccinated children.

Lancet 1991; 338: 715-20.

25. Tufte ER. The visual display of quantitative information. Cheshire, CT:

Graphics Press, 1983.

26. Wells, DL, Hopfensperger DJ, Arden NH, et al. Swine influenza virus

infections. JAMA 1991; 265: 478-481.

27. Williamson, DF, Parker RA, Kendrick JS. The box plot: a simple visual

method to interpret data. Ann Intern Med 1989; 110: 916-921.









303


Related docs
Other docs by HC111215035153
PowerPoint Presentation
Views: 0  |  Downloads: 0
Resume Etude Clinique For Him
Views: 1  |  Downloads: 0
CIRCULAR INFORMATIVA No
Views: 0  |  Downloads: 0
BAB
Views: 58  |  Downloads: 0
????? 3
Views: 3  |  Downloads: 0
Sheet1
Views: 0  |  Downloads: 0
3 SM3
Views: 19  |  Downloads: 0
?????????????????????? ...
Views: 0  |  Downloads: 0
By registering with docstoc.com you agree to our
privacy policy

You are almost ready to download!

You are almost ready to download!