Está en la página 1de 106

INE.

Desde 1893 al servicio de la Salud

EPIDEMIOLOGIA. NIVEL BÁSICO


UNIDAD 2. Nociones básicas de Estadística. Capítulos 4. 5.
Nociones Básicas de Estadística

UNIDAD 2

Índice
Capítulo IV: ................................................................................................................................. 4
Nociones básicas de estadística ................................................................................................. 4
Definición ................................................................................................................................ 4
La estadística y las estadísticas ............................................................................................... 4
Un poco de historia ................................................................................................................ 5
Los campos de aplicación ....................................................................................................... 6
Áreas de la Estadística ............................................................................................................ 6
La Estadística descriptiva ............................................................................................................ 7
Conceptos preliminares .......................................................................................................... 7
Población ................................................................................................................................ 7
Muestra .................................................................................................................................. 7
Individuo, unidad de observación o unidad estadística ......................................................... 8
Variable ................................................................................................................................... 8
Datos ....................................................................................................................................... 8
Variables ..................................................................................................................................... 9
Clasificación de las variables .................................................................................................. 9
Variables cualitativas ........................................................................................................ 10
Variables cuantitativas ..................................................................................................... 10
Nivel de medición de las variables ....................................................................................... 11
Nivel nominal .................................................................................................................... 11
Nivel ordinal...................................................................................................................... 11
Nivel de intervalo.............................................................................................................. 12
Nivel de razón ................................................................................................................... 12
Relación entre variables ................................................................................................... 12
Organización de los datos......................................................................................................... 13
Tablas de frecuencias ........................................................................................................... 15
Frecuencia......................................................................................................................... 15
Distribución de frecuencias .............................................................................................. 16

1
Nociones Básicas de Estadística

UNIDAD 2

Intervalo de clase ............................................................................................................. 18


Presentación de los datos ........................................................................................................ 22
Tablas ................................................................................................................................... 22
Tipos de tablas ................................................................................................................. 24
Gráficos ................................................................................................................................ 31
Tipos de gráficos .............................................................................................................. 35
Series de tiempo o cronológicas ...................................................................................... 40
Gráfico semilogarítmico ................................................................................................... 42
Gráficos de sectores, circular o pastel ............................................................................. 44
Histograma ....................................................................................................................... 45
Polígono de frecuencias ................................................................................................... 46
Gráfico de cajas y bigotes (Box plot) ................................................................................ 47
Errores más comunes en la construcción de gráficos...................................................... 51
Bibliografía ............................................................................................................................... 54
Capítulo V: ................................................................................................................................ 56
Medición de los eventos de salud ............................................................................................ 56
Introducción ............................................................................................................................. 56
Métodos para resumir datos: clasificados en escala cualitativa ............................................. 59
Razón .................................................................................................................................... 59
Proporción............................................................................................................................ 60
Tasa ...................................................................................................................................... 61
Uso de las cifras relativas ................................................................................................. 62
Tasas de uso más frecuente en salud .................................................................................. 64
Mortalidad........................................................................................................................ 64
Natalidad .......................................................................................................................... 68
Morbilidad ........................................................................................................................ 69
Métodos para resumir datos clasificados en escala cuantitativa ............................................ 82
Medidas de posición ............................................................................................................ 82
Medidas de posición central ............................................................................................ 83
Medidas de posición no central ....................................................................................... 93

2
Nociones Básicas de Estadística

UNIDAD 2

Medidas de dispersión o Variabilidad .................................................................................. 96


Medidas de forma .......................................................................................................... 100
Bibliografía .............................................................................................................................. 105

3
Nociones Básicas de Estadística

UNIDAD 2

Capítulo IV:
Nociones básicas de estadística

Definición
La estadística es comúnmente considerada como una colección de hechos numéricos
expresados en términos de una relación sumisa, y que han sido recopilados a partir de otros
datos numéricos.

Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la estadística
como un valor resumido, calculado, como base en una muestra de observaciones que
generalmente, aunque no por necesidad, se considera como una estimación de parámetro
de determinada población; es decir, una función de valores de muestra.

"La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de
masa o colectivos, cuya mediación requiere una masa de observaciones de otros fenómenos
más simples llamados individuales o particulares" (Gini, 1953).

Murray R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para recoger,
organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar
decisiones razonables basadas en tal análisis.

"La estadística es la ciencia que trata de la recolección, clasificación y presentación de los


hechos sujetos a una apreciación numérica como base a la explicación, descripción y
comparación de los fenómenos". (Yale y Kendal, 1954).

Cualquiera sea el punto de vista, lo fundamental es la importancia científica que tiene la


estadística, debido al gran campo de aplicación que posee.

La estadística y las estadísticas


El objeto de estudio de la Estadística, que es una rama de las matemáticas, es el
conjunto de los métodos que permiten el análisis y la comprensión de los fenómenos más
diversos, a partir de una recolección y de un procesamiento de datos.
Las Estadísticas se refieren al resultado de la aplicación de la Estadística a los datos.

4
Nociones Básicas de Estadística

UNIDAD 2

Un poco de historia
No existe un acuerdo explícito sobre el origen de la palabra estadística, pero aún así
se mencionan tres orígenes posibles.

Es el origen que más han aceptado los entendidos, status, vocablo en latín
cuyo significado es estado en el sentido estrictamente político, ya que en la antigüedad lso
gobiernos la utilizaban para recolectar datos.

Statera, vocablo de origen griego que significa balanza. Esto se debe a la


función que cumple la estadísitica en la medición o peso de los eventos que son objeto de
estudio; de allí se desprende el término ponderar, tan utilizado en estadística.

Staat, vocablo de origen alemán que significa estado como organización


política.

En la Antigüedad ya existían estadísticas rudimentarias vinculadas con los registros y censos


del campo, enfocado a lo social, económico y educacional.
Aproximadamente 2000 años AC, se hacían recuentos de población, cultivos, propiedades,
fortunas y otras; esto fue una incipiente aparición de la estadística fundamentada en el
conteo.
Simultáneamente en otros pueblos como Siria, Persia y Egipto, realizaban
empadronamientos o censos de población y catastros de territorios, como así también la
renta del país.
En la Biblia también se encuentran indicios de recuentos estadísticos, Moisés habla del
registro de los israelitas y de los trabajadores (agrícolas y dedicados al pastoreo). El
nacimiento de Cristo coincide con el empadronamiento o censo de los israelitas.
En el Imperio romano fue empleada por los gobernantes que querían obtener información
sobre las diferentes provincias en que se encontraba dividido el Estado, como así también
para realizar el conteo de los integrantes de sus ejércitos.
En el mundo de habla hispana europeo, se registra el uso de la estadística desde el año 720.

La Estadística, tal como se acaba de definir, se fundamenta en el cálculo de las probabilidades


y se desarrolló a partir del inicio del siglo XX. A veces se denomina Estadística matemática en
oposición a la Estadística estatal, cuya misión es el registro de las estadísticas de los estados:
población, empleo, consumo, etc. La Estadística estatal remonta a las primeras civilizaciones
conocidas (5000 años A.C., Sumer, Mesopotamia, Egipto).

5
Nociones Básicas de Estadística

UNIDAD 2

Los campos de aplicación


 La investigación en ciencias físicas y médicas.
Física (mecánica, cuántica), Agronomía, Biología, Farmacia (pruebas farmacéuticas y
clínicas), Medicina y Epidemiología.
 La industria.
 La Investigación industrial, Marketing, Comercio, Administración de empresas, Gestión de
los stocks, de la Producción, Mejoramiento de la Calidad.
 Las Ciencias Económicas y las Ciencias Humanas. Administración de las colectividades y
de los paises. Bancos y Seguros, Demografía, Ciencias políticas, Geografía física o
humana, Urbanismo, Transportes, medio ambiente, Arqueología, Sociología, Psicología,
Lingüística, etc.

Áreas de la Estadística

 Estadística descriptiva
Es una de las ramas de la estadística que recolecta, caracteriza y presenta un conjunto de
datos, obteniendo un resumen de los mismos y una visión general del fenómeno que se está
observando. Se construyen tablas y gráficos que permiten simplificar la complejidad de los
datos.

 Estadística inferencial
Es una técnica mediante la cual se obtienen generalizaciones o se toman decisiones en base
a una información parcial (muestras), utiliza resultados obtenidos mediante la estadística
descriptiva y tiene un sustento muy importante en el cálculo de probabilidades. Permite a
partir del estudio de una muestra de la población, inferir lo que ocurre en la totalidad de esa
población.

También permite establecer si la presencia de un evento particular fue solo causal.

6
Nociones Básicas de Estadística

UNIDAD 2

La Estadística descriptiva
Conceptos preliminares
Antes de avanzar en el estudio de los métodos de la estadística, es necesario definir algunos
conceptos preliminares.

Población
Es el conjunto de individuos, animales u objetos que son de interés o estudio estadístico y de
los cuales queremos obtener un resultado. La especificación no es trivial, porque es
imprescindible que no haya ambigüedad respecto a quienes pertenecen o no a ese conjunto,
para lo cual deben estar claramente definidos los criterios de inclusión y exclusión, en los que
se debe establecer la ubicación espacial y temporal.
Por ejemplo, si el interés es el estudio del “hábito de fumar” de los “niños entre 10 y 14 años” de
“Tucumán”, en el año “2014”, la población es "todos los niños de Tucumán entre 10 y 14 años en
2014". Si el interés es evaluar diferentes tratamientos de la diabetes, la población es "todos los
diabéticos".

Tamaño de la población:
Es el número de individuos que la componen. Su cardinal se denomina con N.

Población finita:
Es aquella en la que el número de individuos que la componen puede contarse en forma
física.

Población infinita:
Es aquella en la que el número de individuos no es posible de enumerar en forma física.

Parámetro:
Es una medida de resumen que se calcula para describir una característica de toda la
población.

Muestra
Si la población a estudiar es muy grande, es decir que contiene un número de individuos que
hace imposible analizarlos en su totalidad, entonces, en lugar de observar a todos los
elementos de esa población, se realiza una selección de un subconjunto de ella ,y se usa la
información de este subconjunto para conocer algo sobre la población. Este subconjunto se
denomina muestra y deberá ser “representativa” de la población de origen en el sentido de
tratar de reproducir lo más idénticamente posible las características de la población de la

7
Nociones Básicas de Estadística

UNIDAD 2

cual fue seleccionada. La representatividad de la muestra puede obtenerse si cualquier


individuo de la población tiene la misma probabilidad de ser seleccionado.
En síntesis es un conjunto de individuos representativo de la población de referencia; en el
cual los individuos fueron seleccionados en forma aleatoria.

Tamaño muestral
Es el número de elementos que se seleccionan, siempre es menor que el de la población y se
lo denomina con n.

Muestreo
Es el conjunto de técnicas para obtener estas muestras y el procedimiento que reúne los
datos que se desean estudiar, obteniéndolos en una proporción reducida, y representativa
de la población.

Estadístico
Magnitud correspondiente a una muestra aleatoria extraída de la población. Es una medida
de resumen que se calcula para describir una característica de una muestra de la población.

Individuo, unidad de observación o unidad estadística


Son las personas, animales u objetos, o conjuntos de ellos que pertenecen a una población y
que contienen información sobre el fenómeno que se estudia.
Continuando con el ejemplo de la población, son unidades de observación “cada niño de
Tucumán entre 10 y 14 años” y para el ejemplo de la población “todos los diabéticos”, la
unidad de observación es “cada uno de los diabéticos”.

Variable
Característica observada en los individuos de una población, susceptible de ser medida.
Propiedades, rasgos o cualidades que poseen las unidades de observación.
Para el ejemplo anterior, las variables observadas en las unidades de observación pueden ser:
el hábito de fumar y la edad de los niños de Tucumán entre 10 y 14 años.

Datos
Valores observados o medidos en una variable, en el ejemplo del hábito de fumar en niños
de Tucumán entre 10 y 14 años, los datos para las variables son las edades de los niños y las
observaciones del hábito de fumar para cada niño.

8
Nociones Básicas de Estadística

UNIDAD 2

Variables
Definir las variables permitirá dar respuestas a lo que se quiera estudiar.
Establecer el tipo de variable a estudiar y la forma en que serán medidas, es un aspecto clave
de cualquier estudio.
Una inadecuada identificación de las variables puede dar lugar a sesgos importantes que
afectarán la validez del estudio.
Las variables pueden definirse como:

“Aquellos atributos o características de los eventos, de las personas o de los grupos de estudio
que cambian de una situación a otra o de un tiempo a otro y que por lo tanto, pueden tomar
diversos valores. Para su estudio es necesario medirlas en el objeto investigado y es en el
marco del problema y de las hipótesis planteadas donde adquieren carácter de variables.”
Una vez identificadas las variables el investigador debe definirlas de manera operativa,
especificando el método y la escala con las cuales se llevará a cabo su medición.

Medir:
Consiste en asignar un número o una calificación a alguna propiedad específica de un
individuo, una población o un evento, usando ciertas reglas.
Solo puede medirse lo que antes se ha concebido teóricamente.

Clasificación de las variables


Cuadro I. Clasificación de variables según criterios de definición.

9
Nociones Básicas de Estadística

UNIDAD 2

Variables cualitativas
Son aquellas que son expresadas en forma de cualidades o atributos y no pueden medirse en
escala numérica, aunque si puede contarse el número de individuos pertenecientes a cada
una de sus categorías o modalidades.

Nominales:
Datos correspondientes a una variable cualitativa que se agrupan sin ninguna jerarquía de
una categoría o modalidad sobre otra.
Por ejemplo: Estado civil, etnia, religión, etc.

Ordinales:
Las categorías o modalidades que adopta la variable cualitativa poseen un orden entre ellas.
En ellas existe un orden jerárquico, pero no puede obtenerse valoración numérica lógica
entre las categorías.

Por ejemplo: Grado de desnutrición, nivel socioeconómico, intensidad de consumo de


alcohol, nivel de instrucción, etc.

Según el número de categorías o modalidades que contemple una variable cualitativa puede
ser:

Dicotómica: tiene solo dos categorías o modalidades posibles de adoptar.


Condición de infectado si/no; Condición vital: vivo/muerto.

Politómica: tiene más de dos categorías o modalidades posibles de adoptar.


Por ejemplo: Estado civil, nivel de instrucción, nivel socioeconómico, condición de alta etc.

Variables cuantitativas
Son aquellas que se pueden medir, expresar y cuantificar en forma numérica.

Continuas:
Son aquellas variables cuantitativas para las que entre dos valores cualquiera que adopten
existen infinitos valores posibles de asumir por la variable, es decir que la escala de medición
es el conjunto de los números reales.
Por ejemplo: Peso, talla, tensión arterial, glucemia, edad, etc.

Discretas:
Son aquellas variables cuantitativas que al medirlas solo pueden tomar valores numéricos
enteros, no existen valores intermedios entre dos valores ENTEROS consecutivos cualquiera
Por ejemplo: Número de hijos, Nº de cigarrillos que fuma por día, etc.
10
Nociones Básicas de Estadística

UNIDAD 2

Nivel de medición de las variables


El nivel de medición de las variables en general, es de suma importancia debido a
que indica el tipo de operaciones que pueden realizarse con las variables, es decir cada uno
de ellos tienen métodos estadísticos específicos. Existen cuatro niveles de medición:

Nivel nominal
Si dos o más valores de una variable sólo permiten percibir las diferencias o semejanzas de
las unidades estadísticas que se miden, su nivel de medición es nominal. Tales valores son
como etiquetas que identifican a las unidades estadísticas y las hacen iguales o diferentes
entre sí. Es el nivel más simple de observación, clasifica a los individuos en categorías
designadas con un nombre o código.
Si se asignan números a estos valores cualitativos (modalidades), con estos no se pueden
realizar operaciones aritméticas. Sólo son válidas las relaciones de igualdad (=) y no igualdad
(≠). Por ejemplo, la variable área de residencia asigna a las unidades de observación dos
valores: “urbana” y “rural”, en tal caso con los valores de esta variable las personas se
encuentran en una misma modalidad o en modalidades diferentes, si se le asignara 1 a la
modalidad “urbana” y 2 a la modalidad “rural”, solo puede decirse que el símbolo 1 es
diferente al símbolo 2, no se puede decir que 1 es menor que 2 o que dos es mayor que 1

Las variables estadísticas: "estado civil", "religión", entre otras, tienen modalidades que son
de nivel nominal.

Nivel ordinal
El nivel de medición de una variable es ordinal cuando los valores que adopta se pueden
ordenar en forma ascendente (o descendente), pero no es posible determinar diferencias
entre los valores de los datos, o tales diferencias carecen de significado. En una escala
ordinal los valores o modalidades reflejan el orden de las unidades estadísticas. Si se asignan
números a tales modalidades, con estos, no se pueden realizar operaciones aritméticas. Sólo
son válidas las relaciones de igualdad (=), de no igualdad (≠) y de orden (≤). Este nivel se
utiliza de manera nominal pero para jerarquizar las modalidades que adopte la variable. El
nivel de medición ordinal puede observarse por ejemplo en el “estatus socioeconómico”,
variable cualitativa; que puede adoptar las modalidades bajo, medio y alto;
En el caso de este tipo de variables, en ocasiones, pueden medirse en escalas numéricas,
como por ejemplo, puntuar el dolor en una escala de 1 a 5. Debemos evitar sin embargo
realizar operaciones matemáticas con estas cantidades. ¡Un dolor de intensidad 4 no duele
el doble que otro de intensidad 2!

11
Nociones Básicas de Estadística

UNIDAD 2

Nivel de intervalo
Este nivel de medición permite clasificar y ordenar a los individuos, posee todas las
características del nivel ordinal, y además, permite cuantificar la diferencia entre dos clases.
y el valor cero no representa ausencia de una característica, es lo que puede decirse un
“cero relativo”. El ejemplo clásico es la temperatura: cero grado no indica ausencia de
temperatura. 10° no indica la mitad de frío de 20°, pero sí me indica 10 grados menos de
temperatura. Por lo tanto vemos que el cero es relativo o convencional. En este nivel se
pueden hacer comparaciones por diferencia entre los valores que adopte la variable.
Con los valores de esta escala son válidas las relaciones de igualdad, de no igualdad y de
orden.

Nivel de razón
Es similar al nivel de intervalo pero además existe un cero absoluto o natural, es decir hay
ausencia real de la propiedad. Es el mayor nivel de medición, todas las operaciones son
válidas y permite mayor número de técnicas y precisión.
Por ejemplo, “ingresos”, “edad”, “nivel de glucosa”, son comparables por cociente (doble,
mitad). Alguien que gana $12.000 de sueldo, gana el doble que otro que gana $6.000 y por
supuesto, también puedo decir que gana $6.000 menos.
Un aspecto interesante a destacar es que estos niveles forman ellos mismos una escala
"acumulada". Por ejemplo el nivel ordinal posee todas las propiedades del nivel nominal más
aquellas que le son propias. El nivel de intervalo posee todas las propiedades de los dos
anteriores más las propias y de la misma forma el nivel de razón también posee las
propiedades de los otros tres, siendo el nivel más elevado donde el cero es absoluto y son
posibles todas las operaciones. Cada una de estos niveles puede descender a sus niveles de
menor grado, lo que a veces nos vemos obligados a hacer, sabiendo que se pierde
información, según las técnicas estadísticas de que dispongamos o que utilicemos.

Relación entre variables


Si atendemos a la relación existente entre las variables, estas pueden ser:

Independientes: Es una característica estable en función de la cual varían los valores de otras
variables. En estudios experimentales es la variable que manipula el investigador.
Dependientes: también llamadas de resultado o efecto, son aquellas características que
varían en función de los cambios experimentados por la variable independiente. Es el factor
que es observado y medido para determinar el efecto de la variable independiente.

12
Nociones Básicas de Estadística

UNIDAD 2

Nunca debemos olvidar a la hora de hablar de variables, las categorías o


modalidades que adopten cada una de ellas independientemente de lo que midan
deben ser:
Mutuamente excluyentes: cada dato pertenece a un único intervalo, categoría. O
modalidad.
Exhaustivas: todos los datos pueden ser clasificados o incluidos en alguna de las
categorías, modalidades o intervalos.

En un estudio las variables son los eventos o características que se van a observar en las
personas, lugares o tiempos, susceptibles de ser descriptas o medidas en alguna escala, que
varía o puede hacerlo en alguna dimensión
Lo que se tiene como información de una variable en una muestra es un número n de datos,
es decir, de valores o anotaciones sobre que modalidad (cualitativas) o qué valor
(cuantitativas), tiene cada elemento de la muestra; a este conjunto de datos se le llama
distribución y excepto cuando el tamaño n de la muestra sea demasiado pequeño, se debe
resumir para que la lectura de los resultados sea comprensible.
La organización y el resumen de la información son dos procesos distintos y los mismos se
desarrollan por separado.
La organización de los datos hace referencia al arreglo de ellos en un formato lógico para su
interpretación.
El resumen de la información implica la condensación de varias mediciones en una forma
compacta, ya sea gráfica o numéricamente.

Organización de los datos


La información estadística puede organizarse de diversas maneras: ordenando el
conjunto de datos como una combinación ordenada o en un arreglo denominado tallo y
hojas, otro de los métodos usados es el uso de tablas y más específicamente la tabla de
frecuencias.
Combinación o arreglo ordenado: consiste en el ordenamiento de menor a mayor o de mayor
a menor de los datos correspondientes a una variable observada. Sin esta mínima
organización de los datos, los mismos arrojan muy poca información.
Por ej: ante ésta colección de datos que representan el peso en kilogramos de 30 personas.

82 95 92 62 85 92
82 95 70 85 84 95
91 82 94 76 88 91
87 80 68 58 76 85
110 60 75 88 64 74

13
Nociones Básicas de Estadística

UNIDAD 2

Podemos observar que estos datos organizados de este modo no aportan mayor información
acerca del comportamiento de la variable observada. Pero si estos datos los ordenamos de
menor a mayor.

58 70 80 85 88 94
60 74 82 85 91 95
62 75 82 85 91 95
64 76 82 87 92 95
68 76 84 88 92 110

La información que proporciona, comienza a ser más interesante porque podemos concluir
que:
 El peso más bajo es 58 kg.
 El más alto 110 kg.
Hay un vacío entre los 65 kg. y los 110 kg., es decir que hay una cierta continuidad desde el
peso más bajo (58 Kg.) y los 95 kg, y el 110 se encuentra un poco más alejado del grupo de
datos.

Arreglo de tallo y hojas: es una técnica que resume de manera simultánea los datos en forma
numérica y presenta una ilustración gráfica de la distribución.

Se trata de organizar los datos numéricos en dos columnas divididas por una línea vertical.
La primera de las columnas, denominada tallo, corresponderá a las decenas, centenas o
unidades superiores que representan el grupo de datos y en la segunda, llamada hojas, irán
las correspondientes unidades. Para construir el correspondiente arreglo de tallo y hojas.
para el peso en kilogramos de las 30 personas que se mencionan anteriormente pensaremos
en cada uno de los datos separando las decenas y centenas de las unidades, colocando en la
primera columna las centenas y decenas, en este ejemplo de 5 a 11, estos números
representarán el tallo y luego en la siguiente columna se listan las unidades, que
representarán las hojas, de manera ordenada, de cada uno de los datos registrados y
correspondientes con su respectiva decena.

Tallo Hojas
5 8
6 0248
7 04566
8 02224555788
9 11224555
10
11 0

14
Nociones Básicas de Estadística

UNIDAD 2

Al mismo tiempo que se ordenan los datos en forma ascendente, también se puede
visualizar como es el comportamiento de los mismos, puede observarse que entre los 80 y
los 90 kg. se concentran la mayor parte de las mediciones obtenidas y se ve claramente el
vacío que se produce entre los 95 y los 110 kg.

Para entenderle un poco más, hemos de decir que el segundo renglón que dice:
6 | 0 2 4 8 quiere decir que entre la lista de datos se encuentran los valores 60, 62,64 y 68.

En realidad una representación de tronco y hojas presenta la misma información que la lista
original de datos, pero de una manera mucho más compacta (especialmente si la lista de
datos es más grande) y manejable.
Sin embargo, información más compleja resulta un poco más difícil de manejar, por lo que en
ocasiones conviene redondear los datos, ignorar sus partes decimales o utilizar las centenas u
otras posiciones de los números para las troncos. En cada uno de esos casos conviene hacer
alguna anotación, o poner una nota, a fin que los lectores puedan identificar las
adecuaciones realizadas y así poder interpretar lo que se quiere transmitir.

Tablas de frecuencias
El primer paso para realizar el resumen de datos es siempre el recuento de las repeticiones
de un mismo valor o modalidad; ello nos conduce al concepto fundamental de frecuencia.

Frecuencia
Es el número de veces que se repite una misma observación.
Una frecuencia puede expresarse en dos formas: en términos absolutos o en términos
relativos.

Frecuencia absoluta: Es específicamente el número de repeticiones de una misma


observación en números absolutos
Por ejemplo:
5 casos de rubéola
1 caso de meningitis
130 casos de bronquitis
Frecuencia relativa: es la expresión en términos de porcentajes de la frecuencia absoluta.
La misma se obtiene como el cociente entre la frecuencia absoluta y el número total de
observaciones. La frecuencia relativa debe acompañarse siempre por una cifra absoluta para
su correcta interpretación
10% de niños con diarrea (n=150)

15
Nociones Básicas de Estadística

UNIDAD 2

Cuadro II – Tipo de frecuencias

ABSOLUTAS SIMPLE (ni) Nº de repeticiones que presenta una ni


observación
T
I
ACUMULADA Suma de los distintos valores de las f(a)
P (fi) frecuencias absolutas tomando como
O referencia un individuo dado. La
D
última frecuencia acumulada es el
E total del número de observaciones
F RELATIVAS SIMPLE (fa) Frecuencia absoluta dividida por el f(i)
R número total de observaciones y suele
E
C
expresarse en %. La suma total es igual
U al 100%.-
E
N ACUMULADA Frecuencia absoluta acumulada F(i)
C (Fi) dividida por el total de observaciones.
I
A
También puede definirse a partir de la
S suma de la frecuencia relativa
tomando como referencia a un
individuo dado. La última frecuencia
relativa acumulada es 100%

Las frecuencias son aplicables a cualquier tipo de variables y de ahí su importancia, además
pese a ser muy simples introducen a conceptos importantes como el de proporción y son
base para la construcción de cualquier resumen de datos.

Distribución de frecuencias
Según los datos que muestre puede clasificarse en:

Distribución de frecuencias simple:


Se utilizan cuando el número posible de valores o categorías que puede asumir la variable
(sea cuantitativa discreta o cualitativa) es relativamente reducido
Por ejemplo;
Se tiene el siguiente número de respuestas correctas en un examen:
6,4,5,4,0,2,8,5,7,3,1,9,6,4,6,0,9,1,3,10

Construir una distribución de frecuencias


 Ordenar los datos de menor a mayor
0,0,1,1,2,3,3,4,4,4,5,5,6,6,6,7,8,9,9,10

16
Nociones Básicas de Estadística

UNIDAD 2

Nº de respuestas Frecuencia Frecuencia Frecuencia Frecuencia relativa


correctas absoluta relativa acumulada acumulada
xi ni fi fa Fi

0 2 0,1 = 10% 2 0,1 = 10%


1 2 0,1 = 10% 4 0,2 = 20%
2 1 0,05 = 5% 5 0,25 = 25%
3 2 0,1 = 10% 7 0,35 = 35%
4 3 0,15 = 15% 10 0,50 = 50%
5 2 0,1 = 10% 12 0,60 = 60%
6 3 0,15 = 15% 15 0,75 = 75%
7 1 0,05 = 5% 16 0,80 = 80%
8 1 0,05 =5% 17 0,85 = 85%
9 2 0,1 = 10% 19 0,95 = 95%
10 1 0,05 = 5% 20 1 = 100%
Total 20 1 = 100%

También pueden ser utilizadas las distribuciones de frecuencias simples para describir
ordenadamente datos cualitativos, en este caso las xi son las modalidades o categorías que
asume la variable cualitativa.

Por ejemplo
Distribución de frecuencia del estado civil de empleados del
Hospital “Estrella de Mar” - Ciudad Sueño del Mar - Enero 2014

Estado civil ni fi (%) fa Fi (%)


Soltero 30 30,0 30 30,0
Casado 40 40,0 70 70,0
Viudo 10 10,0 80 80,0
Divorciado 15 15,0 95 95,0
Otros 5 5,0 100 100,0
Total 100 100

Distribución de frecuencias para datos agrupados


Este tipo de distribución de frecuencias se utiliza solo para describir y presentar datos
cuantitativos.

17
Nociones Básicas de Estadística

UNIDAD 2

La elaboración de una distribución de frecuencias para datos agrupados requiere de alguna


preparación previa de los mismos que no solo consiste en el ordenamiento de menor a
mayor únicamente, sino que también deben tenerse en cuenta algunas condiciones
necesarias para poder agrupar adecuadamente los valores que asume la variable, entre los
que encontramos:
Rango: es la diferencia entre el valor máximo y el mínimo que asume la variable a describir.

Intervalo de clase
Llamamos intervalo de clase a cada uno de los intervalos contiguos en que pueden agruparse
los valores que adopta una variable cuantitativa, cuando se trabaja con gran cantidad de
valores.
Los intervalos se definen para tener una idea más concreta de la realidad.
Siempre que se agrupa una variable por intervalos se produce una pérdida de información,
pues lo que se tiene en cuenta es la pertenencia o no de cada dato al intervalo y no su valor
exacto; se considera que la distribución dentro del intervalo es homogénea.
Los intervalos de clase seleccionados, al igual que las categorías de una variable cualitativa
deben ser: exhaustivos y mutuamente excluyentes. (Ver pág. 9).
No existe un criterio claro de cuál debe ser el número de intervalos que debemos escoger, se
suele fijar entre 5 y 15, de tal manera que cada clase contenga al menos 5 valores distintos.
Entre los criterios para decidir el número de intervalos (k) destacamos:

Regla de Sturges: k debe ser el número entero mayor más próximo a k=1+3,322*log n,
Regla de Norcliffe: k debe ser aproximadamente igual a la raíz cuadrada positiva del número
de datos (N).

Amplitud del intervalo de clase (ai): es el cociente entre el rango (R) y el número de intervalos
(k). Si este cociente no es entero, entonces debe redondearse al entero superior.

Límites de clase: todo intervalo de clase tiene dos límites uno inferior y otro superior.

Límite inferior: es el valor más pequeño que pueden tomar los datos que se encuentran en
un intervalo.

Límite superior: es el valor más grande que pueden tomar los datos que se encuentran en un
intervalo.

Es necesario definir con claridad los límites de estos grupos o intervalos de clase, de modo
que sepamos bien a que intervalo pertenece una observación individual.
Por ejemplo: para la variable edad.

18
Nociones Básicas de Estadística

UNIDAD 2

Se pueden establecer intervalos de clase como los siguientes:

A B
0-4 0-5
5-9 5-10
10-14 10-15
15-19 15-20
20-24 20-25

También podemos mencionar otro elemento de los intervalos que son los límites reales (LR),
en realidad cada intervalo de clase tiene dos límites reales, el límite real inferior (LRI) y el
límite real superior (LRS), la particularidad de estos límites reales consiste en que el LRS de
una clase es igual al LRI de la siguiente, estos se calculan como la semisuma de los límites de
clase superior e inferior de intervalos contiguos.
En el ejemplo (A) anterior:
Los límites reales del segundo intervalo son LRI = 4+5/2= 4,5 LRS= 9+10/2=9,5
Marca de clase: es el punto medio de un intervalo de clase ( c )
Se obtiene como cálculo de la semisuma de los extremos del intervalo
L Ls
c i
2
Donde Li es el límite inferior del intervalo y Ls es el límite superior del mismo intervalo
Una vez que hemos preparado los datos recién estaremos en condiciones de comenzar a
confeccionar la tabla de frecuencias para datos agrupados.

En resumen los pasos para la confección de dicha tabla son:

 Calcular el número de intervalos a establecer, a partir de la raíz cuadrada del número


de datos u otro método del cálculo.

Si N es el número de datos → el número de intervalos  N

 Calcular el Rango de los datos, localizando el valor mínimo y máximo que adoptan los
datos de la distribución, y efectuando la diferencia entre ellos.

Rango = Máx - Min

19
Nociones Básicas de Estadística

UNIDAD 2

 Calcular el tamaño o amplitud del intervalo de clase.- (ai)

rango ( R)
ai 
N º de int ervalos de clase (k )

Si el rango es un número divisible entre el número de intervalos, entonces el cociente da su


amplitud.
Si el rango es un número que no es divisible por el número de intervalos, se busca el primer
número entero por exceso, ahora el cociente entre este número y el número de intervalos,
será la amplitud de los mismos.
Cuando esto ocurre y es necesario redondear la amplitud del intervalo, también es necesario
recalcular el rango (R), multiplicando la cantidad de intervalos que se van a definir por la
amplitud de modo que:
R*= k X ai

Una vez realizado el cálculo del R* se plantea una diferencia por exceso del tipo
R* - R, si el resultado de esa diferencia es par se divide en dos y el valor obtenido se resta al
valor mínimo de la distribución y se suma al valor máximo de la misma
Min-R*/2
Max + R*/2

Si en el cálculo del exceso se hubiera obtenido un número impar, la distribución de los


excesos entre los límites se calcula considerando hacia dónde se agrupan más los datos.
Luego para obtener los límites de los intervalos, el método consistirá en:
Delimitar los límites inferiores (LI) de los intervalos, partiendo del valor mínimo de la serie,
se suma la amplitud y se obtiene el LI del intervalo siguiente, a este se le suma la amplitud y
se obtiene el subsiguiente, y así hasta llegar al último LI de la escala.
Delimitar los límites superiores (LS) de los intervalos: se hará sustrayendo una unidad al LI
siguiente. En el caso del LS del último intervalo, se obtiene sumándole la amplitud al último
LI, y luego restando al resultado una unidad.
Se sugiere redondear el tamaño de la amplitud a un número entero
Por ejemplo:
Se obtienen los siguientes valores de la medición de una variable continua

204,4 239,1 249,0 250,8 240,3 315,5 197,7


226,8 186,5 233,0 237,9 254,0 239,0 240,2
238,9 290,3 247,4 244,4 234,6 309,2 276,0
241,0 211,7 257,3 288,3 286,0 302,0 184,5
243,0 282,9 217,4 229,3 199,3 194,6 220,7

Rango = 315,5-184,5= 131

20
Nociones Básicas de Estadística

UNIDAD 2

Númerode int ervalos  35  5,9161  6

Amplitud de los intervalos


131
ai   21,6  22
6
Recalcular el rango
R*  k * ai  6 * 22  132

Diferencia por exceso


R*  R  132  131  1

Estos valores obtenidos de los cálculos pueden ser orientativos, por lo cual si
atendiéramos a estas sugerencias obtendríamos:

184-205
206-227
228-249
250-271
272-293
294-315
316-337

Luego una vez que hemos establecido los intervalos de clase ya estamos en condiciones
de construir la distribución de frecuencias de la siguiente forma:

Intervalo Frecuencia Marca de Clase Fa Fr. Fra


184-205 6 194,5 6 0,17 0,17
206-227 4 216,5 10 0,11 0,29
228-249 14 238,5 24 0,40 0,69
250-271 3 260,5 27 0,09 0,77
272-293 5 282,5 32 0,14 0,91
294-315 3 304,5 35 0,09 1,00
316-337 0 326,5 0 0 1
Total 35

21
Nociones Básicas de Estadística

UNIDAD 2

Presentación de los datos


Tablas
Una tabla es una forma de presentación de los datos estadísticos ordenados
sistemáticamente para facilitar la descripción y análisis de los hechos.
La tabla es una herramienta para mostrar información y para analizarla.
En una investigación o en cualquier actividad que se trabaja con datos, cada tabla que se
construye tiene como fin contestar alguna pregunta precisa, las cuales han sido formuladas al
definir los objetivos.
Existen diferentes tipos de tablas, dependiendo de lo que se quiera mostrar. Aun así entre
ellas hay elementos comunes como:

ASEGURADOS EN LA COMPAÑIA Z de Ciudad Sueño del Mar


A SEGÚN SECTOR Y DIVISION DE ACTIVIDAD ECONÓMICA
2003-2013-EN MILES DE PERSONAS Tabla I

Sector Servicios Otros Eventuales del


grupos(1) campo en
general(2)
Año Comercio Transporte y Servicios para Servicios
B1 comunicaciones empresas y el sociales y
hogar comunales
1995 1676 483 1672 993 1614 ND

1997 1919 551 2020 1084 1962 203


1998 2070 586 2185 1039 2111 159
1999 2676 619 2328 1159 2360 146
2000 2322 654 2415 1259 2518 152
B2 2001 2380 654 2424 1329 2768 166 B3
2002 2436 659 2471 1376 3103 156
2003 2427 660 2539 1444 3424 100
2004 2454 674 2669 1500 3707 85
2005 2599 706 2895 1480 3881 99
2006 2769 740 3190 1546 4217 115

D1 Nota: Los años 1995 y 1996, no registran datos de asegurados eventuales del campo en general.
(1) Comprende: seguro individual y colectivo, continuación voluntaria, trabajadores independientes y no
D2 especificados, estudiantes.-
(2) Comprende: eventuales del campo no distribuidos por actividad económica hasta 2003
D3 ND: cifra no disponible
Fuente: Compañía Z- Memoria estadística – Ciudad Soñada
D4
22
Nociones Básicas de Estadística

UNIDAD 2

A. Título
Describe el contenido haciendo referencia a algunos aspectos como:
 Expresar el nombre de las variables, indicadores o categorías observadas.
 Indicar el espacio territorial donde se produjeron los datos.
 Indicar la fecha o período de tiempo al que se refieren los datos estadísticos.
 Indicar la referencia de la unidad de medidas adoptadas.

Debe ser breve, completo y preciso. Se ubica preferentemente en la parte superior de la


tabla para que sea más visible.
Por ejemplo: Total de nacimientos por provincia – Argentina – Año 2014.

B1. Encabezado en columna de la matriz


En esta parte se enuncian las categorías, variables o indicadores que se muestran en las filas
de la matriz.

B2.- Descriptor de filas


Enuncian los conceptos a los que se refieren los datos de cada fila.

B3·.- Matriz de cifras


Espacio en el cual se incorporan los valores cuantitativos de los datos o los símbolos que
representen la ausencia de los mismos.

C.- Indicador de orden


Expresan el número de tabla y la secuencia de las partes si la misma se encuentra
fraccionada.

D1.-Nota
Información general sobre definiciones o referencias técnicas o metodológicas de los datos
presentados.

D2.- Llamada
Información específica referida a algún elemento de la tabla

D3.- Símbolos aclaratorios


Signos convencionales que indicados mediante una letra o abreviatura

D4.- Fuente
Indica la procedencia de la información

23
Nociones Básicas de Estadística

UNIDAD 2

Tipos de tablas
Se pueden tener distintos tipos de tablas según se presenten datos clasificados de acuerdo
con una o más características, las cuales pueden tener a su vez diferente naturaleza.
Observemos:

Tablas de una sola entrada:

Son aquellas en las que se presentan los datos clasificados de acuerdo con una única
característica o variable.
Esta característica mencionada puede ser de diferente naturaleza o medida en distinta
escala, por lo que tendremos:

A.1.- Tablas Con una escala cualitativa

CUADRO 1. Distribución de los residentes de pediatría encuestados, por hospital. Argentina 2014

Hospital Ciudad Nº de residentes %


encuestados
Elizalde Buenos Aires 96 27,5
Gutierrez Buenos Aires 66 18,9
Santísima Trinidad Córdoba 44 12,6
Ludovica La Plata 38 10,9
Infantil Córdoba 35 10
Garrahan Buenos Aires 33 9,5
Notti Mendoza 26 7,4
Castro Rendón Neuquén 11 3,2
Total 349 100

24
Nociones Básicas de Estadística

UNIDAD 2

Distribución por sustancias y/o sus metabolitos encontradas en los fallecidos por reacción
aguda a sustancias psicoactivas – Ciudad Sueño del Mar - 2014

DROGA NÚMERO % (Sobre el total de sujetos)


A. OPIÁCEOS
Heroína-Morfina 18 17
Metadona 31 29,2
Otros Opiáceos 14 13,2
B. ESTIMULANTES
Cocaína 45 42,4
C. HIPNÓTICOS Y SEDANTES
Benzodiacepinas 56 52,8
Antipsicóticos 18 17
Otros 6 5,7
E. ANTIDEPRESIVOS 23 21,7
F. CANNABIS 4 3,8
G. ALCOHOL 23 21,7
Fuente: dirección de Estadísticas de Salud – ciudad Sueño del Mar - 2014

A.2.- TABLAS CON UNA ESCALA CUANTITATIVA DISCRETA

Distribución del número de hijos de empleados del


Hospital Estrella de Mar- Ciudad Sueño del Mar – Año 2014

Hijos Empleados %
0 60 20,0
1 50 16,7
2 80 26,6
3 50 16,7
4 30 10,0
5 15 5,0
6 8 2,7
7 6 2,0
8 1 0,3
Total 300 100,0
Fuente: SIE – Hospital Estrella de Mar – Ciudad Sueño del Mar

25
Nociones Básicas de Estadística

UNIDAD 2

Número de hijos por hogar del Barrio Los Calamares


Ciudad Sueño del Mar – 2014

Número de hijos Número de hogares Porcentaje


1 16 32,00
2 11 22,00
3 11 22,00
4 6 12,00
5 6 12,00
Total 50 100,00
Fuente: Dirección de Estadística – Ciudad Sueño del Mar – 2015

A.3.- TABLA CON UNA ESCALA CUANTITATIVA CONTINUA

Distribución por grupos de edad de los fallecidos por reacción aguda a sustancias psicoactivas –
Hospital Estrella de Mar – Ciudad Sueño del Mar – 2014

Grupos de edad Frecuencia Porcentaje


15-19 1 0,94
20-24 2 1,89
25-29 6 5,66
30-34 11 10,38
35-39 14 13,21
40-44 25 23,58
45-49 19 17,92
50-54 15 14,15
55-59 6 5,66
60-64 5 4,72
SD 2 1,89
Total 106 100,00
Fuente: Dirección de Estadística – Ciudad Sueño del Mar 2015

26
Nociones Básicas de Estadística

UNIDAD 2

Tabla Nº 4: Recién Nacidos según peso al nacer. Instituto de Maternidad e Infancia. Ciudad
Sueño del Mar. Año 2014

Peso al nacer Nº %
Menos de 500 91 1
500-999 92 1
1000-1499 152 1
1500-1999 274 3
2000-2499 601 5
2500 y más 9958 89
Total 11168 100
Fuente: SIE - Instituto de Maternidad e Infancia – Ciudad Sueño del Mar -2015

Tablas de doble entrada


Son aquellas en las que se presentan datos clasificados de acuerdo con dos variables, es
decir que los individuos son observados bajo dos características, e interesa analizar la
relación entre ambas. Esto da origen a las tablas de asociación si las dos variables son
cualitativas o una es cualitativa y la otra cuantitativa. En caso de dos variables cuantitativas
las tablas son de correlación.

B.1. TABLAS CON DOS ESCALAS CUALITATIVAS

Tabla Nº 9. Peso al Nacer según alfabetismo de la madre. Instituto de Maternidad e Infancia


Ciudad Sueño de Mar – Año 2014

Peso al nacer Alfabetas Analfabetas Total


Nº % Nº % Nº %
Bajo 914 9 296 22 1210 11
Normal 8915 91 1043 78 9958 89
Total 9829 100 1339 100 11168 100
Fuente: SIE – Instituto de Maternidad e Infancia – Ciudad Sueño del Mar

27
Nociones Básicas de Estadística

UNIDAD 2

B.2. TABLAS CON UNA ESCALA CUALITATIVA Y OTRA CUANTITATIVA


Tabla Nº 5. Distribución de Recién nacidos según peso al nacer y sexo. Instituto de
Maternidad e Infancia – Ciudad Sueño del Mar – Año 2014

Peso al nacer Masculino Femenino Total


Nº % Nº % Nº %
Menos de 500 47 1 44 1 91 1
500-999 48 1 44 1 92 1
1000-1499 79 1 73 1 152 1
1500-1999 142 2 132 2 274 3
2000-2499 313 5 288 5 601 5
2500 y más 5178 89 4780 89 9958 89
Total 5807 100 5361 100 11168 100
Fuente: SIE – Instituto de Maternidad e Infancia – Ciudad Sueño del Mar

Tabla Nº 1. Distribución por sexo y edad de 1.859 casos de Tuberculosis denunciados en la


ciudad Sueño del Mar .2010-2014

Sexo 0-4 5-14 15-24 25-34 35-44 45-54 55-64 65 y más

Hombres 1.326 72 57 109 364 263 225 94 142

(71,3%)

Mujeres 533 52 47 99 134 64 37 24 76

(28,7%)

Total 1.859 124 104 208 498 327 262 118 218

(100%) (6,7%) (5,6%) (11,2%) (26,8%) (17,6%) (14,1%) (6,3%) (11,7%)


Fuente: Departamento de Estadísticas de Salud – Ciudad Sueño del Mar

28
Nociones Básicas de Estadística

UNIDAD 2

B.3. TABLAS CON DOS ESCALAS CUANTITATIVAS (TABLAS DE CORRELACION)

Madres consultantes al Servicio de Ginecología del Hospital Estrella de Mar


según edad materna y número de hijos – Ciudad Sueño del Mar 2014

Nro de < 20 > 20 Total


Hijos Nro % Nro % Nro %
0 8 16,00 14 26,92 22 21,57
1-2 20 40,00 6 11,54 26 25,49
3-4 10 20,00 19 36,54 29 28,43
5-6 10 20,00 6 11,54 16 15,69
más de 6 2 4,00 7 13,46 9 8,82
Total 50 52 102
Fuente: encuesta

C. Casos especiales
C.1. Cronológicas - Series de Tiempo
Definición

“Una serie en el tiempo es un conjunto de observaciones tomadas en instantes específicos,


generalmente a intervalos iguales.”
Matemáticamente, una serie en el tiempo está definida por valores Y1, Y2, ... de una
variable, en tiempos t1, t2, ... Así pues, Y es una función de t; Y = F(t), donde t es la variable
independiente : tiempo.
“Y" es la variable cuyo comportamiento a través del tiempo se desea estudiar o sea que la
serie de tiempo es una serie estadística (información cuantitativa) cuyos valores han sido
observados en el tiempo.
Las variables que intervienen pueden ser: años, meses, días, horas, quinquenios, etc (t).
Trabajando generalmente con intervalos iguales e " y": totales, promedios índices, etc.

Aplicación
La teoría y análisis de las series de tiempo pueden ser aplicados a múltiples campos,
pudiendo afirmarse que todo hecho representable cuantitativamente y que sucede a lo largo
de un período de tiempo puede estudiarse como una serie de tiempo: podemos mencionar
como ejemplo:
Temperatura ambiente, temperatura de pacientes, electrocardiogramas-movimiento
demográfico- accidentes de trabajo- cantidad de pasajeros transportados- series

29
Nociones Básicas de Estadística

UNIDAD 2

meteorológicas- monto de ventas - precios minoristas - mayoristas- montos de producción


agrícola, ganadero o industrial - volumen de exportaciones e importaciones - crecimiento -
población, etc.

Ejemplo: Esperanza de vida en años de Argentina – 1960-2012

Año EV/ en años


1960 65,18
1965 65,63
1970 66,55
1975 68
1980 69,47
1985 70,59
1985 70,59
1990 71,5
1995 72,62
2000 73,72
2005 74,74
2010 75,63
2011 75,85
2012 76,92

Fuente: Banco Mundial - 2015

C.2. TABLAS DE 2X2 O TETRACÓRICAS.

Es muy usual que en Epidemiología se analice la distribución de una variable en relación con
otra, buscando generalmente un patrón que indique la relación existente o no, entre ellas.
Este análisis suele ser clave en la identificación de las posibles causas de los problemas de
salud, y también de factores que, aun cuando no puedan ser finalmente considerados
causales, resulten estar asociados a estos daños y constituyan importantes elementos
prácticos para la identificación de grupos con mayores riesgos de padecer el mencionado
daño. El estudio de la influencia de una variable (variable independiente) sobre la forma en
que se modifica otra (variable dependiente) es conocido como análisis bivariado.
Las tablas de contingencia (tablas de doble entrada) son una herramienta fundamental para
este tipo de análisis. En su expresión más elemental, las tablas tienen solo 2 filas y 2
columnas (tablas de 2x2), donde las filas identifican la exposición a la variable en estudio y
las columnas la presencia o no del efecto (daño-enfermedad)

30
Nociones Básicas de Estadística

UNIDAD 2

Para examinar este problema, un primer paso puede ser calcular la frecuencia relativa de
cada celda, Sin embargo, el análisis de la relación entre las variables estudiadas es más
directo cuando se computan medidas de asociación. Estas medidas, basadas en la
comparación entre las frecuencias del daño en diferentes grupos (expuestos y no expuestos),
pueden realizarse a través de razones.

Tabla 2. Tabla de contingencia para el sexo femenino: Ecografía Versus diagnóstico


anatomopatológico – Ciudad Sueño del Mar – 2014

ECO Anatomía patológica (+) Anatomía patológica (-)

Ecografía (+) 25 5

Ecografía(-) 16 4
Fuente: Servicio de Ginecología – Hospital de Maternidad e Infancia – Ciudad Sueño del Mar

Gráficos
En estadística denominamos gráficos a aquellas imágenes que combinando la utilización de
elementos como sombreado, colores, puntos, líneas, símbolos, números, texto y un sistema
de referencia (coordenadas), permiten presentar información.
Los gráficos sirven para sustituir las tablas como herramienta para el análisis de datos.
Las gráficas son una herramienta poderosa y eficaz para comunicar visualmente diversos
tipos de información numérica de manera que facilite tanto la comprensión de conjuntos de
datos complejos, como evidenciar relaciones, patrones y tendencias.

Propósitos de un gráfico
 Representar la realidad.
 No generar realidades inexistentes fuera de la propia imagen.
 Permitir una rápida impresión visual de la información que resume.

Para que los propósitos enunciados puedan cumplirse, los gráficos deben:
 Ser auto explicativos.
 Ser sencillos.
 Justificarse.
 Contener la cantidad de información suficiente.
 Inducir a pensar en el contenido y no en la apariencia.
 Favorecer la comparación.
 Ser adecuados para el soporte al que van a ser destinados

31
Nociones Básicas de Estadística

UNIDAD 2

Una presentación gráfica de información estadística se compone de tres partes


fundamentales.

Título:
Describe el contenido de la información presentada, en relación con los siguientes aspectos:
características del fenómeno bajo estudio, nombre de las variables observadas, espacio
territorial al que se refieren los datos, momento, fecha o período en el que ocurren y una
magnitud constante que es adoptada como referencia (unidad de medida).

Cuerpo o ilustración gráfica:


Es la ilustración de los valores asociados a los datos presentados, compuesta por:
Figura: conjuntos de puntos, líneas o figuras que representan los datos.
Referencia del concepto: descripción del nombre de las categorías o indicadores que se
están representando.
Referencia escalar: línea recta que representa la escala de medición de las variables
representadas, no todos los gráficos la requieren y no siempre es explícita.

32
Nociones Básicas de Estadística

UNIDAD 2

Leyenda: descripción de la simbología, que puede utilizarse como, colores, sombreados,


texturados, o tipos de líneas que permiten diferenciar los datos estadísticos.
Etiquetas de datos: expresión específica de los valores estadísticos.

Pie de gráfica
Se utiliza para realizar aclaraciones referentes al contenido conceptual, técnico o
metodológico general del gráfico y está compuesto por:

Nota: Información general sobre definiciones o referencias técnicas o metodológicas de los


datos.
Llamadas y símbolos: Información sobre elementos específicos de los componentes título y
cuerpo de la gráfica; incluye descripciones del significado convencional de letras aplicadas
para indicar particularidades o acotaciones en determinados valores o conceptos de
referencia de los datos.
Enunciado de fuentes: Indica la procedencia de la información.
Número de Gráfica: Elemento de identificación necesario para ordenar y distinguir a cada
gráfico en un documento, no es obligatorio su uso ya que se reserva para aquellos
documentos que contengan más de un gráfico.

Debido a la necesidad de analizar en detalle la información estadística, se ha creado una


variedad muy amplia de representaciones gráficas, dentro de las cuales encontramos:

 Gráficos de ejes coordenados


 Gráficos de área
 Gráficos Radiales o de Radar
 Cartogramas
 Combinación de tipos de gráficos.

Gráficos de ejes coordenados


Consisten en la intersección de líneas rectas ortogonales, una de las cuales se selecciona
para indicar la escala de valores de los datos estadísticos, y, la otra, para indicar los
conceptos a los que se refieren los datos estadísticos objeto de representación.

Eje vertical: se llama eje de ordenadas, corrientemente conocido como eje de las “y”, y sobre
él se representan las frecuencias que pueden expresarse en cifras absolutas o relativas (%).
La escala se inicia en 0 y hasta la máxima frecuencia.

33
Nociones Básicas de Estadística

UNIDAD 2

35
40

30 35

30
25

25
20

%
20
15
15

10
10

5 5

0
0

Si las frecuencias son muy diferentes de 0 se hace un corte a una distancia pequeña del
origen del eje iniciando la graduación del mismo con un valor cercano al menor observado.
Igual sucede cuando las observaciones están muy concentradas entre cierto rango de
valores.
Eje horizontal: es llamado de abscisas o eje de las “x” y en él se coloca la escala (valores o
categorías de una variable).
En el eje de ordenadas se debe indicar si se mide en números absolutos o en porcentajes.
En el eje de las abscisas se indica cada una de las categorías o modalidades que adopta la
variable observada.

Gráficos de áreas
Consisten en la presentación de un área en forma circular (pay) o rectangular (barra
seccionada), que corresponde al valor total de una categoría, la cual es segmentada, en los
valores de las clases en que se distribuye la categoría, de acuerdo con determinada variable.
La diferenciación de las secciones y su correspondencia con las clases requiere el uso de lo
que en este documento denominamos simbología (colores y leyenda). Para este tipo de
gráfico se presentan dos modalidades: circular o rectangular.

Gráficos radiales
Sistema de ejes radiales, con origen común en cero y escalas estandarizadas. En cada eje se
representan los valores de una variable distinta, que básicamente sean comparables entre sí.

Cartogramas
Sistema basado en la utilización de mapas territoriales, para referenciar cada uno de los
valores de una variable en las diferentes unidades territoriales o también para representar
valores de un indicador de movimiento o flujo entre unidades territoriales distintas.

34
Nociones Básicas de Estadística

UNIDAD 2

Tipos de gráficos
Los gráficos al igual que las tablas pueden ser seleccionados según la naturaleza de los datos
que se deseen analizar y/o presentar, como también del número de variables que se
involucren en el análisis. En el siguiente cuadro se indica cual será la forma de tabular los
datos más adecuados como así también el tipo de gráficos que pueden seleccionarse según
se observen una o dos variables.

Nro. de variables Tipo de variable Tabulación Gráfico


a observar
Cualitativa Frecuencia Barras
Proporción Áreas
porcentaje Pictogramas- Cartogramas
Cuantitativa discreta Frecuencia Barras
1 variable

Proporción Áreas
Porcentaje
Simples y acumulados
Cuantitativa continua Frecuencia Histograma
Proporción Polígono de frecuencias
Simples y acumuladas
Cualitativa + cualitativa Frecuencia Barras
Proporción Barras 100%
porcentaje Barras segmentadas
2 variables

Cualitativa + Frecuencia Barras


cuantitativa Proporción Barras segmentadas
Porcentaje Cajas y bigotes
Simples y acumulados
Cuantitativa + Correlación
cuantitativa

Gráficos de barras
Los datos clasificados en escala cualitativa y cuantitativa discreta se representan en el gráfico
de barras o columnas; son rectángulos de igual base, sobre el eje en que se represente la /s
variable/s observada/s , en tanto que la altura del rectángulo indica la magnitud o frecuencia
de cada grupo. Cuando el gráfico presenta varias barras, las mismas deben ordenarse de
menor a mayor o inversamente. El orden depende del objetivo.
Las barras pueden representarse tanto en forma horizontal como vertical. Una norma para
determinar la orientación de las barras es que éstas se tracen verticalmente, si ello no impide
escribir debajo de las mismas la leyenda correspondiente a cada una, caso contrario se
representarán horizontalmente.

35
Nociones Básicas de Estadística

UNIDAD 2

La leyenda explicativa no debe ser escrita en los extremos finales de las barras ni dentro de
ellas, pues esto dificultaría la comparación. El ancho de las barras, debe ser mayor que los
espacios dejados entre ellas.
Cuando se grafica más de una categoría existen diferentes variedades de presentación.

Gráficos de barras simples


Caso de una variable cualitativa

36
Nociones Básicas de Estadística

UNIDAD 2

Caso de dos variables cualitativas

Caso de una variable cualitativa y una cuantitativa

37
Nociones Básicas de Estadística

UNIDAD 2

Gráfico de Barras Segmentadas o Proporcionales


Además de las barras simples podemos usar un gráfico de barras segmentadas en que una
sola de estas representa el total de observaciones ó 100% y se divide proporcionalmente en
el número de grupos que exista.

Caso de dos variables cualitativas

Caso de una variable cualitativa y una cuantitativa

38
Nociones Básicas de Estadística

UNIDAD 2

Gráfico de barras agrupadas


Este tipo de gráfico representa tablas donde se presenta la relación entre dos variables. Se
utiliza para mostrar la distribución de dos variables cualitativas y en algunos casos
cuantitativas discretas o continuas cuando la cantidad de valores o intervalos de clases
considerado es pequeño, y para representar la distribución de una variable cualitativa en dos
o más grupos.

Gráficos de puntos
Es un tipo de representación que suele utilizarse para sustituir a la gráfica de barras, si se
pretende representar una sola variable. El diagrama de puntos es una representación de
datos útil para muestras pequeñas, hasta (digamos) unas 20 observaciones (Douglas C.
Montgomery, 2009).
Si en cambio se necesita representar y/o analizar la relación de dos variables cuantitativas, el
gráfico de puntos del que estaremos hablando es un gráfico de correlación, en el que cada
uno de los puntos se ubica según un par de coordenadas que le corresponden. En este tipo
de gráficos los dos ejes representan las escalas, a diferencia de los casos anteriores que solo
el eje de abscisas estaba graduado con su escala.

Gráficos de correlación
Dadas dos variables cuantitativas X y Y tomadas sobre el mismo elemento de la población, el
diagrama de dispersión o correlación es simplemente un gráfico de puntos, de coordenadas
(x,y) , donde en el eje x (la abscisa) se grafica la variable independiente, y en el otro eje, y (la
ordenada) se grafica la variable dependiente.

39
Nociones Básicas de Estadística

UNIDAD 2

Ambos ejes representan las escalas a diferencia de los casos anteriores en que solo la abscisa
estaba graduada con la escala.
Aquí cada individuo está representado por un punto determinado por las perpendiculares
levantadas en los ejes en los valores correspondientes.
Es importante resaltar que los puntos de un gráfico de correlación no se unen.

NOTA:
Si las variables están correlacionadas, el gráfico mostraría algún nivel de correlación
(tendencia) entre las dos variables. Si no hay ninguna correlación, el gráfico presentaría una
figura sin forma, una nube de puntos dispersos en el gráfico.

Ejemplo:

Gráficos de líneas
En estos gráficos los valores se representan con puntos, los que se unen con líneas para
facilitar la visualización de la variación de una variable continua. Se utilizan generalmente
cuando se desean representar series de tiempo.

Series de tiempo o cronológicas


Una serie en el tiempo que involucra a una variable Y se representa por un gráfico de Y
respecto de t (tiempo)
Se usan para mostrar la evolución o magnitud de un fenómeno a través del tiempo (Series de
tiempo o cronológicas).
Se construyen uniendo los puntos cuyas coordenadas son la frecuencia (ordenada) y la
unidad de tiempo de observación (abscisa). En este tipo de gráfico es particularmente
importante la relación de proporcionalidad entre los ejes para evitar malas interpretaciones
del fenómeno que se presenta.

40
Nociones Básicas de Estadística

UNIDAD 2

Caso de una variable cuantitativa

Caso de una variable cuantitativa y una cualitativa

Fuente: Dirección Nacional de Estadísticas e Información en Salud

Movimientos característicos de series en el tiempo


Es interesante pensar en el gráfico de una serie en el tiempo como un gráfico que describe
un punto moviéndose con el paso del tiempo, análogo en muchos aspectos a la trayectoria
de una partícula física que se mueve bajo la influencia de fuerzas físicas. Claro está que en
lugar de fuerzas físicas, aquí cabe pensar en el resultado de una combinación de fuerzas,
económicas, sociológicas, psicológicas o de otros tipos.

41
Nociones Básicas de Estadística

UNIDAD 2

La experiencia con muchos ejemplos de series en el tiempo ha revelado ciertos movimientos


y variaciones características que aparecen a menudo, y cuyo análisis es de gran interés por
muchas razones, una de ellas el problema de predicción de futuros movimientos.

Movimientos de series en el tiempo


1. Movimientos a largo plazo o seculares. Se refieren a la dirección general en la que el
gráfico de una serie en el tiempo parece progresar en un largo período de tiempo.
este movimiento secular (o variación secular o tendencia secular, como se llama a
veces) se indica por una curva de tendencia, en trazo discontinuo. Para algunas series
en el tiempo puede ser apropiada una recta de tendencia.
2. Movimientos característicos o variaciones cíclicas. Estas se refieren a las oscilaciones
a largo término en torno a una recta o curva de tendencia. Estos ciclos, como se les
llama, pueden ser periódicos o no; es decir, pueden seguir o no esquemas repetidos
en intervalos iguales de tiempo. Un importante ejemplo de movimientos
característicos lo constituyen los llamados ciclos económicos, que representan
intervalos de prosperidad, recesión, depresión y recuperación.
3. Movimientos estacionales o variaciones estacionales. Estos se refieren a los
esquemas idénticos o casi idénticos que una serie en el tiempo parece seguir durante
meses correspondientes en años sucesivos. Tales movimientos se deben a sucesos
recurrentes que tienen lugar anualmente. Aunque los movimientos estacionales se
refieren generalmente en teoría de periodicidad anual, las ideas en juego admiten
extensión a intervalos cualesquiera de periodicidad (días, horas o semanas), según el
tipo de datos de que disponemos.
4. Movimientos irregulares o aleatorios. Estos se refieren a los movimientos
esporádicos series en el tiempo debidos a sucesos de azar, tales como inundaciones,
huelgas o elecciones. Si bien se suele suponer que tales sucesos producen variaciones
que pierden su influencia tras poco tiempo, cabe la posibilidad de que sean tan
intensos que den lugar a movimientos cíclicos o de otro tipo.

Gráfico semilogarítmico
En este tipo de gráficos, en el eje de las ordenadas se utiliza una escala logarítmica y en el
eje de las abscisas una escala aritmética.
Si se examina el papel semilogarítmico podrá notarse que la distancia entre las marcas no es
uniforme, va decreciendo de 1 a 10. Además la distancia entre 1 y 10, es la misma que entre
10 y 100 o entre 100 y 1.000.
Recordemos:
Log 1 = 0
Log 10 = 1
Log 100 = 2
Log 1.000 = 3

42
Nociones Básicas de Estadística

UNIDAD 2

Esta característica permite representar conjuntamente cantidades pequeñas y muy grandes


en el mismo dibujo.

Sin embargo, este tipo de gráfico es especialmente útil cuando se examinan series de datos
en un período de tiempo y estamos más interesados en los cambios relativos (tasas) que en
los valores absolutos.
Las ventajas del gráfico semilogarítmico son:
a) Una línea recta indica una tasa que se ha mantenido constante en el tiempo (-.-.-.-.-)
b) La pendiente de la línea indica la tasa de incremento o de decrecimiento (________)
c) Dos o más líneas paralelas indican idénticas tasas de incremento o decrecimiento.

Una ilustración de este tipo de gráfico se muestra a continuación:

Fuente: Departamento de Estadística Ciudad Ficticia

43
Nociones Básicas de Estadística

UNIDAD 2

Gráficos de sectores, circular o pastel


Se usa, fundamentalmente, para representar distribuciones de frecuencias relativas (%) de
una variable cualitativa o cuantitativa discreta. En este gráfico se hace corresponder la
medida del ángulo de cada sector con la frecuencia correspondiente a la clase en cuestión. Si
los 360º del círculo representan el 100 % de los datos clasificados, a cada 1% le
corresponderán 3,6º. Luego, para obtener el tamaño del ángulo para un sector dado bastaría
con multiplicar el por ciento correspondiente por 3,6º (por simple regla de tres).
Mediante un sector circular se representan las medidas angulares correspondientes a las
diferentes categorías, respetando el orden establecido en la tabla, partiendo de un punto
dado de la circunferencia. Ese punto dado generalmente es el punto más alto de la
circunferencia (12hs. en el reloj). Si lo que se representa en cada sector no puede colocarse
dentro del mismo, se elabora una leyenda o se coloca fuera, adyacente al mismo. Se
acostumbra a diferenciar los sectores con tramas o colores diferentes, lo que hace que
resulte un gráfico más vistoso que el de barras simples.
Este tipo de gráficos son apropiados para representar estructuras, ya que permiten visualizar
la participación de cada una de las partes dentro del total al que pertenecen.

Caso de una variable cualitativa

44
Nociones Básicas de Estadística

UNIDAD 2

Histograma
El histograma es el más conocido de los gráficos para resumir un conjunto de datos
numéricos y pretende responder a las mismas preguntas que un gráfico de tallo-hojas. Una
ventaja del gráfico de tallo-hojas es que retiene los valores de las observaciones, sin
embargo, esta característica puede ser una desventaja al momento de tratar gran cantidad
de datos. Construir manualmente un histograma es más laborioso que construir un gráfico
de tallo-hojas, pero la mayoría de los paquetes estadísticos producen histogramas
Para construir un histograma es necesario previamente construir una tabla de frecuencias.

Construcción del histograma


a) Intervalos de clase todos de la misma longitud.
Se trazan dos ejes de coordenadas cartesianas, sobre el eje horizontal (x) se representan los
valores de la variable y en el eje vertical (y) una medida de frecuencia (frecuencia absoluta,
frecuencia relativa o frecuencia relativa porcentual. Indicamos en el eje horizontal los límites
de los intervalos de clase. Asociamos a cada clase una columna cuya base cubre el intervalo
de clase y cuya altura indica cuantos datos “caen” en un intervalo a través de la frecuencia o
la frecuencia relativa de la clase. El gráfico se construye sin dejar espacio horizontal entre
categorías, a menos que una clase esté vacía (es decir tenga altura cero).
El propósito de un histograma es mostrar la forma de la distribución de los datos, por lo que
debemos estar atentos a los aspectos visuales de la representación.
El histograma debería representar la frecuencia asociada a cada clase en el área de la barra y
no en su altura. Cuando las clases son todas de la misma longitud representar la frecuencia
en la altura es equivalente a representarla en el área, ya que en todas las barras el área y la
altura son proporcionales,
En ocasiones es necesario construir histogramas con intervalos de clase de distinto tamaño,
por ejemplo, cuando se toma información de datos sociales o económicos publicados por el
estado. En estos casos, la altura de la barra debe ser tal que el área de la barra sea
proporcional a la frecuencia.
b) Intervalos de clase de distinta longitud.
¿Cómo construimos el histograma teniendo en cuenta que los intervalos de clase son de
distinta longitud?
La barra debe tener una altura tal que el área (base x altura) sea igual a la frecuencia (o a la
frecuencia relativa).
Es decir, frecuencia observada = amplitud del intervalo* altura de la barra
altura de la barra = frecuencia observada / amplitud del intervalo
La altura de la barra definida de este modo se denomina escala densidad porque indica el
número de datos por unidad de la variable.

Debido a la forma de obtención de esas alturas, el eje de las frecuencias debe rotularse
como número de individuos por unidad de medida de la variable en cuestión, por ejemplo:
'defunciones por año de edad'; 'número de individuos por kg de peso´; etc.

45
Nociones Básicas de Estadística

UNIDAD 2

Polígono de frecuencias

Se utiliza, al igual que el histograma, para representar distribuciones de frecuencias de


variables cuantitativas continuas, pero como no se utilizan barras en su confección sino
segmentos de recta, de ahí el nombre de polígono. Habitualmente se usa cuando se quiere
mostrar en el mismo gráfico más de una distribución o una clasificación cruzada de una
variable cuantitativa continua con una cualitativa o cuantitativa discreta, ya que por la forma
de construcción del histograma sólo se puede representar una distribución.
Para su confección, una vez construidas y rotuladas las escalas, de manera similar a como se
realiza para un histograma, los valores de alturas obtenidos se plotean sobre el punto medio
o marca de clase de los intervalos correspondientes y luego se procede a unir esos puntos
con segmentos de recta. El polígono se cierra uniendo su primero y último punto con la línea
base del gráfico. De esta manera el área del polígono resulta aproximadamente igual al área
del histograma que se obtendría si para los datos se adoptara tal tipo de representación.

46
Nociones Básicas de Estadística

UNIDAD 2

Veamos un ejemplo de polígono de frecuencias

Gráfico de cajas y bigotes (Box plot)


El gráfico de caja es una técnica estadística que se construye para cumplir con dos objetivos
principales:

• visualizar las características o propiedades que tienen un conjunto dado de datos


• detectar la presencia de valores "outliers", o sea valores que resultan ser sospechosos.

Permite representar datos correspondientes a variables cuantitativas o a una variable


cuantitativa y una o más cualitativa.
Los elementos necesarios para realizar la construcción de un gráfico de cajas y bigotes (BOX
PLOT) serán desarrollados más adelante, por lo que en este caso solo se mostrarán
ejemplos.

47
Nociones Básicas de Estadística

UNIDAD 2

Para el caso de una variable cuantitativa

Para el caso de una variable cuantitativa y una cualitativa

Otras formas de representación gráfica

 Mapas
 pirámides de población
 pictogramas

Los mapas se utilizan para mostrar la distribución geográfica de una característica. Su


repetición para distintos períodos permite visualizar si han ocurrido modificaciones a través
del tiempo.
La confección de este gráfico es muy sencilla y consiste en sombrear o colorear distintas
áreas de un mapa de acuerdo con la magnitud de las características.
Como regla se debe tener en cuenta que cuando se utiliza sombreado, el más oscuro
corresponde a los valores más altos.

48
Nociones Básicas de Estadística

UNIDAD 2

Ejemplos:

Cuando deseamos representar la composición de una población por sexo y edad usamos la
pirámide de población que permite la comparación de cada grupo de edad para ambos sexos.
La Pirámide se construye sobre dos ejes perpendiculares. A la izquierda del eje vertical se
representan los datos correspondientes a la población masculina y a la derecha los
correspondientes a la femenina. Es un histograma confeccionado a partir de barras
horizontales donde la altura de cada una de ellas expresará la cantidad de individuos que
pertenecen a un grupo de edad específico y según si encuentren a la derecha o la izquierda
del eje central serán se sexo masculino o femenino
En el eje vertical se marcan los distintos grupos de edades, en forma creciente hacia arriba, y
sobre el horizontal figuran las escalas de frecuencia, una para los varones y otra para las
mujeres; haciendo coincidir el cero con la intersección de los dos ejes resultan una serie de
rectángulos horizontales que van disminuyendo su longitud a medida que correspondan a
edades avanzadas.

49
Nociones Básicas de Estadística

UNIDAD 2

En ciertas ocasiones se desean presentar datos en forma simple y agradable, por ejemplo,
para representar la producción se utilizan dibujos de bolsas de distintos tamaños, etc., estos
gráficos son llamados Pictogramas.

Población del Partido de General Pueyrredón


en los Años 1960 – 2010.
1960 224.824

1970 323.350

1980 434.160

1991 532.845

2001 564.056

2010 618.989

50
Fuente: Instituto Nacional de Estadísticas y
Censos.
Nociones Básicas de Estadística

UNIDAD 2

Resumen de los gráficos comúnmente utilizados

Resumen de los gráficos comúnmente utilizados para representar los diferentes tipos de
datos:

NATURALEZA DE LA
TIPO DE DATOS TIPO DE DIAGRAMA
VARIABLE

Barras Segmentadas
Barras Simples
CUALITATIVA
Área
Pictogramas

DISTRIBUCIONES CUANTITATIVA Barras


DE DISCRETA O Área
FRECUENCIA DISCONTINUA Pictogramas

Histograma
CUANTITATIVA Polígono de frecuencia
CONTINUA Gráfico de correlación
(caso doble entrada)

TENDENCIA (o Series de tiempo


VARIACION CON EL CONTINUA Curvas
TIEMPO Y LA EDAD) Semilogarítmicos

Errores más comunes en la construcción de gráficos


En la confección de un gráfico se pueden cometer dos tipos de errores: errores de forma y
errores de contenido. Aquí mencionaremos los que se han observado con más frecuencia en
las publicaciones científicas.

De forma:
· No uso de la identificación.
· No aparición de título o títulos extremadamente extensos.
· Títulos que no responden a las preguntas básicas.

51
Nociones Básicas de Estadística

UNIDAD 2

· Gráficos muy cargados y/o sumamente complejos de interpretar.


· Desproporción notable entre las longitudes de los ejes.
· Omisión de los rótulos de los ejes y/o las unidades de medida.

De contenido:
 Uso de gráficos inadecuados dada la naturaleza de lo que se representa.
 Omisión de la leyenda donde se han usado claves o símbolos.
 No respetar alguna de las reglas establecidas para la construcción del gráfico en
particular.
Por ejemplo, barras unidas cuando se trabaja con variable cualitativa o discreta.

El énfasis, en la presentación gráfica, debe ser la facilidad para comparar e identificar


comportamientos en los datos, por lo cual se recomienda evitar el uso de elementos ajenos
que distraigan la atención del usuario y dificulten la consulta de la información, como
perspectivas, terceras dimensiones, fotografías, dibujos de fondo, pictogramas y colores
llamativos.

52
Nociones Básicas de Estadística

UNIDAD 2

Evitar en una gráfica la inclusión de distintas líneas de datos que impliquen la intersección en
varios puntos y esto dificulte su consulta.

No presentar gráficas de sectores si se dificulta la identificación de cada sección, ya sea por


el número de ellas o por la concentración de la mayor parte de éstas en una porción
pequeña del área. Se recomienda un máximo de 7 secciones en este tipo de gráfica.

53
Nociones Básicas de Estadística

UNIDAD 2

Bibliografía
 Armijo R.R. Epidemiología básica en Atención primaria de salud. Madrid: Díaz de Santos;
1993.
 Rothman K.J. Epidemiología Moderna. Madrid: Ediciones Días de Santos; 1987.
 Kelsey JL., Thompson WD., Evans AS. Methods in Observational Epidemiology. New York:
Oxford University Press; 1986. [Amazon]
 Hennekens CH., Buring JE. Epidemiology in Medicine Boston: Litte, Brown and Company;
1987.
 Sackett DL., Haynes RB., Guyatt GH., Tugwell P. Epidemiología clínica. Ciencia básica para
la medicina clínica. 2ª ed. Madrid: Editorial Médica Panamericana; 1994.
 Fletcher RH., Fletcher SW., Wagner EH. Epidemiología clínica. 2ª ed. Barcelona: Masson-
Williams & Wilkins; 1998.
 Kleinbaum DG., Kupper LL., Morggenstern H. Epidemiologic Research. Principles and
Quantitative Methods. Belmont, California: John Wiley & Sons; 1982.
 Miettinem OS. Theoretical Epidemiology. New York: Jhon Wiley & Sons; 1985.
 Rothman KJ. (ed). Causal Inference. Chesnut Hill: Epidemiology Resources Inc; 1988.
 Susser M. Conceptos y estrategias en epidemiología. El pensamiento causal en ciencias
de la salud. México: Biblioteca de la Salud; 1991.
 Pita Fernandez, S.; Unidad de Epidemiología Clínica y Bioestadística. Complexo
Hospitalario Juan Canalejo. A Coruña.
 Pita Fernández, S. Epidemiología. Conceptos básicos. En: Tratado de Epidemiología
Clínica. Madrid; DuPont Pharma, S.A.; Unidad de Epidemiología Clínica, Departamento de
Medicina y Psiquiatría. Universidad de Alicante: 1995. p. 25-47. (Actualizado
28/02/2001).
 Diseño de estudios Epidemiológicos, Mauricio Hernandez-Avila Ph.D., Centro de
Investigación en Salud Poblacional, Instituto Nacional de Salud Pública (INSP), México.
Francisco Garrido Latorre, M en C, Centro de Investigación en Sistemas de Salud, INSP,
México.; Sergio Lopez Moreno, MC, Centro de Investigación en Sistemas de Salud, INSP,
México. Salud Pública de México / vol.42, no.2, marzo-abril de 2000.
 Presentación de datos estadísticos en cuadros y gráficos- Instituto Nacional de Estadística
y Geografía (México); 2011.
 Pértega Díaz S., Pita Fernández S. Representación gráfica en el Análisis de Datos. Unidad
de Epidemiología Clínica y Bioestadística. Complexo Hospitalario Juan Canalejo. A
Coruña. Actualización 02/04/2001.
 Referencias : Walker AM. Observation and inference. An introduction to the methods of
epidemiology. Chestnut Hill, MA: Epidemiology Resources Inc, 1991.
 Kelsey JL, Thompson WD, Evans AS. Methods in observational epidemiology. Nueva York:
Oxford University Press, 1986.
 Kleinbaum DG, Kupper LL, Morgenstern H. Epidemiologic research. Principles and
quantitative methods. Belmont, CA: Lifetime Learning Publications, 1982.

54
Nociones Básicas de Estadística

UNIDAD 2

 Rothman KJ, Greenland S. Modern epidemiology. 2a. edition. East Washington Square,
PA: Lippincott-Raven Publishers, 1998.
 Miettinnen OS. Theoretical epidemiology. Principles of occurrence research medicine.
Nueva York: A Wiley Medical Publication, 1985.
 Cocco P, Blair A, Congia P, Saba G, Ecca AR, Palmas C. Long-term health effects of the
occupational exposure to DDT. A preliminary report. Ann NY Acad Sci 1997;837:246-256.
 Hunter DJ. Hankinson SE. Laden F. Colditz GA. Manson JE. Willett WC et al.
Plasmaorganochlorine levels and the risk of breast cancer [see comments]. N Engl J Med
1997;337(18):1253-1258.
 Romieu I, Hernández M, Lazcano E, Weber JP, Dewali E. Breast cancer, lactation history
and serum organochlorines. Am J Epidemiol 2000. En prensa.
 Wang XQ. Gao PY. Lin YZ. Chen CM. Studies on hexachlorocyclohexane and DDT contents
in human cerumen and their relationships to cancer mortality. Biomed Environ Sci
1988;1(2):138-151.

55
Nociones Básicas de Estadística

UNIDAD 2

Capítulo V:
Medición de los eventos de salud

Introducción
La Epidemiología tiene como uno de sus objetivos primordiales, el estudio de la
distribución y los determinantes de los diferentes eventos de salud. La cuantificación y la
medida de los eventos de interés, son elementos fundamentales para formular y probar
hipótesis, así como para permitir la comparación de las frecuencias de los mismos entre
diferentes poblaciones o entre personas, con o sin una exposición o característica dentro de
una población determinada.
La medida más elemental de frecuencia de un evento en general, es el número de personas
que lo padecen o lo presentan (por ejemplo, el número de pacientes con hipertensión
arterial, el número de personas fallecidas por accidentes de tránsito o el número de
pacientes con algún tipo de cáncer en los que se ha registrado una recidiva). Sin embargo,
dicha medida por sí sola carece de utilidad para determinar la importancia de un problema
de salud determinado, pues debe referirse siempre al tamaño de la población de donde
provienen los casos, y al periodo de tiempo en el cual estos fueron identificados. Para este
propósito, en epidemiología suele trabajarse con diferentes tipos de expresiones
fraccionarias que permiten cuantificar correctamente la magnitud de un determinado
evento.
La información que se maneja en Epidemiología frecuentemente está constituida por cifras
absolutas: número de afectados por determinada enfermedad, número de muertes, total de
individuos expuestos a riesgo, etc.
Pero a pesar de la utilidad de estas cifras, que ya llamamos anteriormente frecuencias
absolutas (número de repeticiones de una misma observación en números absolutos);
generalmente es necesario disponer de medidas de resumen, que permitan cuantificar
correctamente la relevancia de un determinada evento epidemiológico.

Cuando se hace el recuento del número de veces que se presenta un hecho en una
población, como por ejemplo: 20 casos de tétanos, 10 personas intoxicadas, 400 muertos
por tumores; los números obtenidos se denominan "cifras absolutas" o también "frecuencias
absolutas".

56
Nociones Básicas de Estadística

UNIDAD 2

Algunas veces las cifras absolutas son suficientes para analizar un problema, por ejemplo:
6 casos de poliomielitis
1 caso de viruela

Debido a que en estas patologías no se espera ningún caso, por lo tanto, cualquier número
adquiere importancia y permite un análisis sobre el problema.
Pero...
¿Qué pasa si se dice que en una provincia(A) se notificaron 8 .183 casos de diarrea
durante el año 2015?
¿Es éste un número de casos alto o bajo?

Para contestar la pregunta se deben hacer comparaciones con otra u otras provincias o con
la ocurrencia de casos de diarrea en la misma provincia pero en años distintos.
En el mismo año en otra provincia (B) se notificaron 14.754 casos de diarrea.
Ahora se tiene un punto de referencia. Pero, ¿son suficientes estas dos cifras absolutas para
sacar conclusiones?
Provincia A : 8.183 casos
Provincia B :14.754 casos

¿Es correcto decir que en la provincia A el problema causado por las diarreas es menor que
en la provincia B?
Absolutamente NO

Es necesario conocer el número de habitantes y relacionar los casos con la población de las
provincias.
La población varía día a día; será necesario utilizar un dato promedio para el período de
tiempo estudiado. Para esto se estima la población en el punto medio del período.
Siguiendo con el ejemplo, los datos de población estimados a mitad del año x para ambas
provincias son:
Provincia A: 280.500 habitantes
Provincia B: 2.304.000 habitantes
Se debe relacionar el número de casos y la población de la siguiente manera:

Ahora sí, los resultados de estos dos cocientes permitirán comparar la magnitud del
problema en uno y otro lugar. Pero los resultados de estas divisiones son:

0,029173 caso por habitante y 0,006406 caso por habitante


aunque se redondee en: 0,029 caso por habitante y 0,006 caso por habitante

57
Nociones Básicas de Estadística

UNIDAD 2

Estos números son difíciles de manejar para descubrir el problema y sacar conclusiones.
Mucho mejor será ponerse de acuerdo y multiplicar el resultado por un factor de
amplificación.
En este caso se multiplicará por 100.000 y el resultado expresará el número de casos que
ocurrieron cada 100.000 habitantes.

Entonces se tendrá:

Ahora es posible realizar un análisis correcto. El problema causado por diarrea es mucho más
importante en la Provincia A que en la Provincia B.

Los resultados obtenidos no son cifras absolutas. Han surgido de relacionar un número con
otro, razón por la cual reciben el nombre genérico de cifras relativas, y específicamente por
la forma en que se han calculado, se denominan Tasas.

Medidas de resumen:

Son aquellas que permiten sintetizar a través de algunas cifras


toda la información obtenida, facilitando de este modo la
descripción y comparación de las observaciones.
El tipo de medida de resumen varía según el tipo de variable que
se observe.

58
Nociones Básicas de Estadística

UNIDAD 2

Métodos para resumir datos: clasificados en escala


cualitativa
Razón

ES Un cociente en el que el numerador no forma parte


del denominador

La relación aritmética existente entre dos eventos en


una misma población, dos categorías de un mismo
evento o un solo evento en dos poblaciones distintas
-La comparación mediante un cociente entre dos
EXPRESA cifras de diferente o similar naturaleza.
-El comportamiento de un suceso en una población a
lo largo del tiempo.
Estas se enuncian señalando el número de elementos
del numerador que existe por cada elemento del
denominador.

Supongamos que de 400 alumnos de una universidad, 300 tienen ojos oscuros y el resto
tienen ojos claros, empleando el concepto de razón se tiene:

¿Cómo se interpreta este resultado?


El resultado expresa que hay 3 alumnos con ojos oscuros por cada alumno con ojos claros,
referido al lugar y tiempo en que se calcula la medida.

Observación: el numerador y el denominador no tienen elementos en común (son


disjuntos), no se encuentran contenidos uno en el otro.

Si a esta razón la multiplicamos por 100 el nuevo número obtenido se denomina INDICE.

59
Nociones Básicas de Estadística

UNIDAD 2

Nota Importante:
Cuando la razón se calcula entre la probabilidad de que ocurra un evento y la
probabilidad que este no ocurra, entonces la razón recibe el nombre de odds.
Proporción

ES Un cociente en el que el numerador está incluido en


el denominador.

EXPRESA La relación de una parte con el total al que pertenece

Los valores que pueden adoptar las proporciones pueden variar entre 0 y 1 debido a que el
numerador siempre está incluido en el denominador, por lo tanto es un número menor o a
lo sumo igual a él. Las proporciones suelen expresarse en términos de porcentajes, los que
se obtienen al multiplicar el resultado del cociente 100, por lo que corrientemente se lo
denomina porcentaje.
Continuando el ejemplo anterior, ahora intentemos determinar la proporción de alumnos
con ojos oscuros, en la población de estudiantes de la universidad.

En términos de porcentaje

¿Cómo se interpreta este resultado?


El resultado expresa que 3 de cada 4 alumnos tienen ojos oscuros, o lo que es lo mismo que
el 75% de los alumnos tienen ojos oscuros.

Nota
El porcentaje nos permite analizar el aporte; peso específico o importancia de
una categoría sobre el total al que pertenece.

60
Nociones Básicas de Estadística

UNIDAD 2

Si se está observando una variable dicotómica, entonces pueden utilizarse tanto razones
como proporciones; en el caso de variables politómicas, se utilizarán solo proporciones.

Tasa
Siempre que sea necesario medir el riesgo de ocurrencia de un fenómeno, en determinada
población se dispone de una medida sumamente valiosa: las tasas.

ES La magnitud de cambio de una variable (evento de


salud) por unidad de cambio de otro (tiempo) en
relación con el tamaño de la población en riesgo de
experimentar el suceso.
La expresión numérica de un riesgo al que estuvo
sometida una población.

EXPRESA La fuerza con que se produce un evento determinado


en una población, y esto es igual a riesgo.

MIDE Un riesgo de salud (enfermedad o muerte) en


términos probabilísticos.

El concepto de tasa es similar al de proporción, con la diferencia de que las tasas llevan
incorporado el concepto del tiempo.
Las tasas consideran todos los casos de un evento de salud ocurridos en una población en un
lugar y período determinado.
Dado que las tasas incorporan el concepto de tiempo y lugar, es decir que numerador y
denominador deben estar referidos al mismo tiempo y lugar de ocurrencia, se pueden hacer
pronósticos en base a las mismas que hayan sido calculadas en períodos inmediatamente
anteriores.

K=100,1.000,10.000,100.000

Las tasas están compuestas por tres elementos:


-Numerador: número de veces que ocurre el evento observado en un lugar y período de
tiempo determinados.
-Denominador: número de habitantes de la población en el cual puede ocurrir el fenómeno.
-K: factor de ampliación, es un múltiplo de 10 .

61
Nociones Básicas de Estadística

UNIDAD 2

Debido a que las tasas son proporciones, el numerador está incluido en el denominador; por
lo tanto es menor que él; como consecuencia ese cociente será menor que 1, por eso suele
multiplicarse por un factor de ampliación para que la relación mencionada adquiera
significado

Advertencia:
Excepcionalmente algunas tasas no son proporciones por cómo se
construyen y esto se debe generalmente a la imposibilidad de obtener el
denominador adecuado. Este concepto será ampliado más adelante con los
ejemplos concretos de esta situación.

Uso de las cifras relativas

La elección de las cifras que se utilizan para analizar un conjunto de datos, depende del
análisis que se desea realizar de ellos.
Para analizar la siguiente información:

Muertes por accidentes de tránsito de conductores de vehículos según sexo


Ciudad X – Año 2012

Sexo Nº Muertes
Mujeres 21
Hombres 51
Total 72

¿Qué cifra relativa se debe emplear para analizar esta información?


Si calculamos proporciones…
51
Varones  72,4%
72
21
Mujeres  29,6%
72
Interpretación: por cada 100 muertes por accidentes de tránsito de conductores en la
Ciudad X en el año 2012, 70 corresponden a varones y 30 a mujeres.
Si calculamos una razón …
Varones 51
  2,429
Mujeres 21

Interpretación: por cada muerte en accidentes de tránsito de conductores del sexo femenino
en la Ciudad X, en el año 2012 murieron más de 2 varones.

62
Nociones Básicas de Estadística

UNIDAD 2

Observemos que tanto los resultados del porcentaje (proporción) y de la razón muestran que
son más frecuentes las muertes por accidentes de tránsito de conductores del sexo
masculino que las del sexo femenino.

¿Esto significa que los hombres tienen mayor riesgo de morir por accidentes de tránsito que
las mujeres?
NO
Para establecer el riesgo que corren tanto hombres como mujeres y compararlos, habría que
relacionar las muertes con la población expuesta bajo riesgo.
Deberíamos considerar para esta estimación de riesgo la población expuesta, que en este
caso serían los conductores de sexo femenino y masculino.
En tal caso se deberían calcular las siguientes tasas:

Nº de muertes de conductores en accidentes de tránsito del sexo


masculino X 1.000
Nº de hombres que conducen vehículos

Nº de muertes de conductores en accidentes de tránsito del sexo


femenino X 1.000
Nº de mujeres que conducen vehículos

Recomendaciones para la construcción de cifras relativas

 Expresar el resultado con – por lo menos – un decimal para no confundirlas con las cifras
absolutas.
 El valor de la cifra relativa muestra la magnitud de la relación que existe entre los datos
que intervienen en el cálculo.
 La publicación de toda cifra relativa debe ir acompañado de por lo menos una de las
frecuencias absolutas con que fue calculada.
 No deben calcularse cifras relativas cuando el denominador es un número muy pequeño,
porque las mismas pueden volverse inestables.
 Regla aproximada: no se calculan cifras relativas cuando el denominador es menor de 20.
 En Salud Pública las tasas se expresan por 100,1.000, 10.000 ó 100.000 según la
magnitud de la relación entre el numerador y el denominador.
 El uso de estos factores de amplificación ha determinado la utilización de cada uno de
ellos para las principales tasas.

63
Nociones Básicas de Estadística

UNIDAD 2

Tasas de uso más frecuente en salud


Las tasas son las cifras relativas de mayor importancia en el análisis de problemas de salud.
Las tasas más frecuentemente usadas son las tasas de mortalidad, natalidad y morbilidad.

Mortalidad

ES Es una categoría de naturaleza estrictamente


poblacional, a diferencia de los conceptos de muerte
y defunción que reflejan la pérdida de la vida
biológica en forma individual.

EXPRESA La magnitud con la que se presenta la muerte en una


población en un momento determinado.

En consecuencia la mortalidad expresa la dinámica de las muertes acaecidas en las


poblaciones a través del tiempo y el espacio; y solo admite comparaciones en ese nivel de
análisis.
La mortalidad se clasifica de la siguiente forma:

La Tasa de Mortalidad General

ES El volumen de muertes ocurridas por una o todas las


causas de enfermedad, en el total de la población.

EXPRESA El riesgo que tienen todos los habitantes de una


población, en un momento determinado de morir por
cualquier causa.

Son tasas de mortalidad general o brutas.

64
Nociones Básicas de Estadística

UNIDAD 2

Tasa bruta de mortalidad general

Total de muertes ocurridas por todas las causas en un


área determinada durante un período de tiempo
* 1.000
Población del área a la mitad del período considerado

Tasa bruta de mortalidad por una causa determinada (pe: cáncer)

Total de muertes ocurridas por cáncer en un


área determinada durante un período de tiempo
* 1.000
Población del área a la mitad del período considerado

La tasa de Mortalidad específica

ES La que se calcula cuando existen razones para


suponer que la mortalidad puede variar entre
distintos subgrupos de la población.

EXPRESA Riesgo para subgrupos de población.

Las tasas obtenidas de esa forma adoptan su nombre según la fracción poblacional que se
reporte.
Son tasas de mortalidad específica.

65
Nociones Básicas de Estadística

UNIDAD 2

En algunos casos no es posible obtener el dato exacto de la población expuesta a riesgo y se


utiliza por convención un dato aproximado, este es el caso de la tasa de mortalidad materna.

La tasa de mortalidad materna por su construcción es una razón, pero esta se utiliza para
medir el riesgo de morir por complicaciones del embarazo, parto o puerperio.
En este caso el denominador tampoco es el exacto ya que muchos nacidos vivos del año
anterior estuvieron expuestos al riesgo de morir con menos de un año durante el período
estudiado.

En realidad a pesar que llamamos tasas a aquellas que tienen a nacidos vivos en el
denominador, por su construcción son Razones.

En este caso el denominador correcto sería el número de mujeres que estuvieron


embarazadas durante el período considerado, pero ese dato es imposible de obtener.

66
Nociones Básicas de Estadística

UNIDAD 2

Mortalidad Proporcional

ES la medida empleada para mostrar la proporción de la


mortalidad por una causa específica.

EXPRESA el porcentaje de muertes que se deban a una causa


específica.

Suele usarse para establecer la importancia de la contribución de la mortalidad específica


para una causa, a la mortalidad general.
Por ejemplo, la mortalidad proporcional según sexo para un área en un tiempo determinado.

Si hiciéramos el mismo cálculo para los varones la suma dará el 100% de las muertes en el
área y tiempo establecidos.

Si bien a este indicador se lo suele denominar Tasa de Mortalidad Proporcional,


en realidad no cumple el requisito de relacionar un evento con la población
expuesta al riesgo de que ese evento ocurra, sino que expresa el PESO del
numerador sobre el total (denominador), por lo que no mide riesgo de morir.

Este es un indicador de uso muy difundido, que prescinde del dato de población, siendo por
su construcción un simple porcentaje.

67
Nociones Básicas de Estadística

UNIDAD 2

La Tasa de Letalidad

ES una medida de la gravedad de una enfermedad


considerada desde el punto de vista poblacional, que
se define como proporción de casos de una
enfermedad que resultan mortales con respecto al
total de casos en un período y área determinados.

EXPRESA la importancia de la enfermedad en términos de su


capacidad para producir la muerte.

La letalidad en sentido estricto es una proporción ya que expresa el número de defunciones


entre el número de casos del cual las defunciones forman parte. No obstante generalmente
se expresa como tasa de letalidad y se reporta como el porcentaje de muertes de una causa
específica con respecto al total de enfermos de esa causa.

La tasa de letalidad no es de fácil construcción debido a la inexistencia de registros de


morbilidad, es difícil obtener los denominadores, por lo cual se estima de la forma
mencionada.

Natalidad

Tasa Bruta de Natalidad

ES Un índice que relaciona todos los nacimientos


acaecidos en una población dada con la población
total.

EXPRESA La velocidad relativa con que aumenta la población


mediante los nacimientos.

68
Nociones Básicas de Estadística

UNIDAD 2

Influyen sobre la natalidad factores tales como la composición por edad (cuanto más joven
es la población mayor es la tasa de natalidad), el nivel socio-económico (a menor nivel
mayor tasa de natalidad) y la fecundidad propiamente dicha, con los que se puede evaluar
en forma indirecta el mayor riesgo de una población. En general las altas tasas de natalidad
se acompañan de otros factores de riesgo.
La tasa bruta de natalidad sola, no debe usarse para comparar el nivel de fecundidad de dos
poblaciones, por cuanto no toma en cuenta las diferencias en la estructura de las mismas,
especialmente con respecto a la composición por edad de la población.
La natalidad es el factor de mayor peso en la conformación de la estructura poblacional.
Cuanto mayor sea la natalidad, tanto mayor será la proporción de los grupos etarios jóvenes,
característica de países con escaso grado de desarrollo. De no cambiar los patrones
culturales al llegar estos grupos a la edad reproductiva, continuarán o acentuarán el
fenómeno descripto. Este factor se mide por la Tasa de Natalidad:

Se consideran nacidos vivos registrados a los ocurridos en el año de registro y en el año


inmediato anterior.

Morbilidad

El estudio de la morbilidad tiene serias dificultades. Desde luego, a diferencia de las


muertes que ocurren una sola vez y en un momento bien definido, y es un hecho
permanente. La enfermedad puede ocurrir varias veces en la vida de un mismo individuo, ya
se trate de una misma enfermedad o de enfermedades distintas y por último, ellas pueden
tener una duración variable.
La morbilidad es la ocurrencia de enfermedad y puede medirse en términos de tasas.

Las unidades que se pueden medir en cuanto a la morbilidad son:


a) las personas enfermas
b) las enfermedades
c) los episodios de enfermedad
Por eso se recomienda que, en las estadísticas de morbilidad, se especifique claramente a
cuál de estos tres criterios se refiere.
En la medición de la morbilidad interesa fundamentalmente medir la frecuencia de la
enfermedad en la población, su duración y gravedad.
En cuanto a la medición de la frecuencia de la enfermedad esta puede hacerse mediante:

69
Nociones Básicas de Estadística

UNIDAD 2

Prevalencia

ES Es una proporción que indica la frecuencia con que


ocurre un evento.

El número de personas de una población que tienen


una enfermedad en un momento dado.
La proporción de individuos de una población que
EXPRESA
padecen una enfermedad en un momento o período
de tiempo determinado.
RIESGO DE ESTAR ENFERMO

MIDE la probabilidad que un individuo sea un caso o


presente el evento observado en un momento dado.

No tiene dimensión y toma valores mayores que 0 y menores que 1

Se expresa como casos por 100 o 1000 habitantes y es frecuente expresarla en términos de
porcentajes.

La prevalencia puede calcularse como:

Prevalencia de punto
Se emplea para determinar la prevalencia de un evento en la población en un momento en
el tiempo, sin contemplar cuando se ha originado. En este caso la medición se realiza en un
período de tiempo corto.

Prevalencia de período
 Determina la cantidad de casos existentes durante un período.
 Resuelve el problema de la aparición de nuevos casos mientras se está ejecutando el
estudio.

70
Nociones Básicas de Estadística

UNIDAD 2

 Lo que ocurre en caso de enfermedad de elevada frecuencia de aparición o porque el


estudio requiere un período de tiempo mayor para su realización.
 Identifica el número de personas que presentan la enfermedad o atributo a lo largo de
un período determinado.
 Medida cada vez menos empleado debido a las confusiones que origina.

Construcción de la tasa de prevalencia de período

Numerador: Todos los casos existentes (incluyendo los casos nuevos diagnosticados durante
el estudio).

Denominador: Población estimada a mitad de período considerado.

El cálculo de la prevalencia es especialmente apropiado para la medición de procesos


o eventos de carácter prolongado, y perderá sentido para evaluar fenómenos de
carácter más momentáneo (diabetes vs. Gripe.)

Incidencia

ES El número de casos nuevos de un evento que se


desarrollan en una población durante un período de
tiempo determinado.

el flujo que se establece entre la salud y la


enfermedad, es decir la aparición de casos nuevos.
la aparición de enfermedad, y refleja el ritmo de
EXPRESA
aparición.
RIESGO DE ENFERMAR

MIDE los cambios de estado (salud/enfermedad), indicando


la frecuencia con que aparecen casos nuevos.

71
Nociones Básicas de Estadística

UNIDAD 2

La incidencia puede medirse de dos maneras diferentes:


 Tasa de incidencia o densidad de incidencia
 Incidencia Acumulada

Tasa de incidencia o densidad de incidencia


Esta tasa como medida epidemiológica mide la velocidad de aparición de una enfermedad,
pero el desarrollo del mismo lo reservaremos para un estudio más avanzado de la
epidemiología.

Incidencia
una medida basada en el número de individuos en
riesgo.
ES
el riesgo medio de los miembros de una población de
sufrir un evento en un período dado.

Acumulada
la probabilidad de que un individuo desarrolle el
evento en estudio por lo que también se lo denomina
EXPRESA
riesgo.

MIDE únicamente el volúmen de casos nuevos ocurridos en


una población durante un período de tiempo.

Por ser una proporción la Incidencia Acumulada toma valores mayores que 0 y menores que
1 y es adimensional.
Las cifras obtenidas al calcular la incidencia acumulada proporcionan una medida
sumamente útil para comparar los diferentes riesgos de las distintas poblaciones.
Proporciona una estimación de la probabilidad o riesgo de que un individuo libre de una
determinada enfermedad la desarrolle dentro de un período especificado de tiempo, lo que
implica asumir que la población entera expuesta a riesgo al principio del estudio es seguida
durante todo el período de tiempo para observar si se desarrollaba la enfermedad objeto del
estudio, pero lo que en realidad sucede es que las personas objeto de la investigación
ingresan al estudio en diferentes momentos en el tiempo, el seguimiento de los mismos no
es uniforme, y por otra parte algunos abandonan el estudio y solo proporcionan seguimiento
durante un periodo limitado de tiempo.

72
Nociones Básicas de Estadística

UNIDAD 2

Construcción de la Incidencia acumulada


Numerador: número de personas que desarrollan una enfermedad en un período de estudio
(casos nuevos).

Denominador: Número de individuos libres de la enfermedad al comienzo del período y que


por lo tanto estaban en riesgo de padecerla.

Nota: la duración del período de observación influye directamente sobre la Incidencia


Acumulada, por lo que debe considerarse siempre que se interprete esta medida.

Para tener en consideración estas variaciones de seguimiento existentes en el tiempo, una


primera aproximación sería la limitación del cálculo de la incidencia acumulada al período de
tiempo durante el cual la población entera proporcione información.

En síntesis:

INCIDENCIA significa CASOS NUEVOS Mide riesgo de enfermar

PREVALENCIA significa TODOS LOS


Mide riesgo de estar enfermo
CASOS

73
Nociones Básicas de Estadística

UNIDAD 2

Diferencias entre incidencia y prevalencia

INCIDENCIA PREVALENCIA

NUMERADOR Número de casos nuevos Número de casos


de enfermedad durante un existentes de una
período de tiempo enfermedad en un
especificado. momento dado.
DENOMINADOR Población expuesta a Población expuesta a
riesgo. riesgo.
ENFASIS Que el evento sea un caso Presencia o ausencia de
nuevo. enfermedad.
El momento de inicio de la El período de tiempo es
enfermedad. arbitrario, ya que es como
una “foto” en un momento
dado.
USOS Expresar el riesgo de pasar Estimar la probabilidad de
del estado sano al estado enfermedad en la
de enfermedad. población en el período de
Es la principal medida de tiempo que se estudia.
frecuencia de Es útil para el estudio de
enfermedades o procesos carga de enfermedad en
agudos, aunque en algunos procesos crónicos y sus
casos puede usarse para implicaciones en los
enfermedades crónicas. servicios de salud.
Es más útil que la
prevalencia en los estudios
de causa.

Adaptado de Epidemiología Básica. Segunda Edición – R. Bonita, R Beaglehole, T. Kjellstrom - OPS

Un cambio en la incidencia significa que hay cambio en el equilibrio de factores etiológicos,


ya sea por motivos naturales o por la aplicación de un programa preventivo eficaz.

La prevalencia en cambio, depende de dos factores:


 la incidencia, y
 la duración de la enfermedad

74
Nociones Básicas de Estadística

UNIDAD 2

La prevalencia cambia como consecuencia de:


 una mayor duración de la enfermedad,
 la prolongación de la vida sin que el enfermo se cure,
 el aumento de los casos nuevos (incidencia),
 inmigración de casos,
 la emigración de personas sanas
 la mejoría de posibilidades diagnósticas
 inmigración de susceptibles

Factores que influyen sobre la tasa de prevalencia

Aumenta Disminuye

Mayor duración de la Menor duración de la


enfermedad enfermedad

Prolongación de la vida de Elevada tasa de letalidad


los pacientes sin curación por la enfermedad

Aumento de la incidencia Disminución de la


(casos nuevos) incidencia (casos nuevos)

Inmigración de personas
Inmigración de casos
sanas

Emigración de personas
Emigración de casos
sanas

Mejora de las posibilidades


Aumento de la tasa de
diagnosticadas
curación
(mejor información)
Adaptado de Epidemiología Básica. Segunda Edición – R. Bonita, R Beaglehole, T. Kjellstrom - OPS

75
Nociones Básicas de Estadística

UNIDAD 2

La figura siguiente representa la relación entre la Incidencia y la Prevalencia

Caldero de Prevalencia

Restablecimiento
Incidencia
MuerteP =
P I=xI dx d
Muerte

La prevalencia es el producto de la incidencia por la duración de la enfermedad. Esta relación


es más patente en una enfermedad estable y crónica. En este caso se puede deducir la
incidencia, siempre que se conozcan prevalencia y la duración.
En el planeamiento de acciones de salud se emplea la prevalencia porque mide la necesidad
de tratamiento, de camas hospitalarias, instalaciones y necesidades de potencial humano.
Por otro lado, la prevalencia es más fácil medir, (se la puede estimar mediante una sola
encuesta), en cambio la incidencia es más trabajosa. Para ello se necesita contar con una
población sana, bien definida, que pueda ser seguida durante un cierto período de tiempo a
fin de precisar la cifra de casos nuevos.

Tasas de Ataque

En algunos casos es posible que se presente el problema planteado por la aparición


inesperada de casos de una determinada patología, ya sea por una epidemia o episodio de
breve duración, en toda una comunidad o en un sector pequeño de la población como ser:
asistentes a un banquete, empleados de una fábrica, vecinos de un barrio, etc.

76
Nociones Básicas de Estadística

UNIDAD 2

Se conoce como tasa de ataque al cociente entre el número de casos y la población expuesta
a riesgo:

Otra medición posible e interesante de hacer es la de la morbilidad entre los contactos de


cada uno de los individuos considerados “casos” del brote, para lo que se debe relacionar:

Ambas tasas de ataque expresan la contagiosidad y patogenicidad del agente responsable


del brote o epidemia.

Medidas de asociación

Son indicadores epidemiológicos que evalúan la fuerza con la que una determinada
enfermedad o evento de salud (que se presume como efecto) se asocia con un determinado
factor (que se presume como su causa)

Epidemiológicamente:

Las medidas de asociación son comparaciones de incidencia, la


incidencia de la enfermedad en individuos que se expusieron al factor
estudiado (o incidencia entre los expuestos), contra la incidencia de la
enfermedad en los que no se expusieron a dicho factor.

Estadísticamente:

Miden la magnitud de la diferencia observada, establecen la fuerza


con la que la exposición se asocia a la enfermedad.

Las medidas de asociación más sólidas se calculan utilizando la incidencia, con el fin de medir
la influencia que pueden tener los factores de riesgo sobre la ocurrencia del evento.

77
Nociones Básicas de Estadística

UNIDAD 2

Entre las medidas de asociación encontramos al Riesgo Relativo (RR) y se calcula como una
razón:

El riesgo relativo, expresa el riesgo de un grupo que tiene un factor de riesgo o exposición,
en comparación con el riesgo de un grupo de referencia sin ese factor.
Mide la fortaleza de una asociación entre un factor de riesgo o exposición y cierto resultado
final, cuantifica la importancia de la asociación entre ellos.
Es un indicador que responde a la pregunta ¿Cuánto riesgo tienen aquellos sujetos
expuestos a un factor en relación con aquellos que no lo están?, nos indicará cuanto más
probable es que ocurra el suceso en el grupo expuesto al factor de riesgo frente al grupo no
expuesto.
El RR puede utilizarse solo en aquellos estudios en los que puede medirse la incidencia, por
lo que NO es apropiado como medida de asociación en los estudios que no arrojan datos de
casos nuevos (por ejemplo: casos y controles, transversales, etc.); pues por las características
de estos de diseño, no se puede conocer las tasas de incidencia del resultado.
Por ejemplo:
Un grupo de investigadores estudia el efecto de una nueva droga para el tratamiento
del Infarto Agudo de Miocardio, participaron del estudio 1740 pacientes, de los cuales 150
murieron. Del total de los participantes, 725 fueron tratados con la nueva droga, y de
aquellos que no recibieron el nuevo tratamiento murieron 80 pacientes.

¿Cuál es el RR de mortalidad?, ¿Podemos considerar como beneficiosa a la nueva droga?

Murieron No murieron Total


Expuestos 70 655 725
No Expuestos 80 935 1015
Total 150 1590 1740

No, con un RR>1 los tratados con la droga tendrían 1,23 veces el riesgo de morir que
aquellos que no han recibido el nuevo tratamiento.

78
Nociones Básicas de Estadística

UNIDAD 2

Actualmente el concepto de incidencia es tan amplio que CASOS NUEVOS pueden referirse a
enfermedad o muerte.
En síntesis:
 Las medidas de resumen para datos cualitativos más frecuentemente utilizadas son: las
razones, las proporciones y las tasas
 Cada uno de ellas tiene diferente interpretación. Los más refinados son las tasas, pues
expresan el riesgo de ocurrencia del evento consignado en su numerador.
 Se debe tener cuidado con el cálculo de las tasas para poblaciones pequeñas, porque
suelen ser inestables.
 Las tasas pueden dividirse en generales y específicas.
 En el ámbito sanitario, las tasas más usadas son las de natalidad, mortalidad y
morbilidad.
 Las medidas de asociación más sólidas son aquellas que se calculan utilizando los datos
de incidencia, como el Riesgo Relativo.

Por eso decimos que la tasa de mortalidad es una tasa de incidencia.

Ambas tasas de ataque expresan la contagiosidad y patogenicidad del agente responsable


del brote o epidemia.

Tasas de uso más frecuente en salud referidas a unidades de tiempo y lugar:

NUMERADOR DENOMINADOR
Por OBSERVACIONES
AREA TASA DE (Número de ) (Poblaci6n)

M Población
Personas que
A NUPCIALIDAD estimada a 1.000
se casan
T mitad del período
E NATALIDAD Población
Nacidos vivos
R estimada a 1.000
en un año
N mitad del período
O
Defunción fetal: muerte del
producto de la concepción que
I MORTALIDAD Defunciones ocurre antes de su expulsión o
Número de nacidos vivos 1.000
N FETAL Fetales extracción completa del cuerpo de
F la madre, independientemente de
A la duración del embarazo
N
Defunciones
T
fetales de menos
I TEMPRANA Número de nacidos vivos 1.000
de 20 semanas de
L
gestación

79
Nociones Básicas de Estadística

UNIDAD 2

Defunciones
fetales de 20 a 27
INTERMEDIA Número de nacidos vivos 1.000
semanas de
gestación
Defunciones
TARDIA (o fetales de más de
Número de nacidos vivos 1.000
Mortinatalidad) 27 semanas de
gestación
Suma de:
Los ingleses usan como
defunciones
numerador la suma de la
MORTALIDAD fetales tardías
Número de nacidos vivos 1.000 mortalidad de la primera semana
PERINATAL más defunciones
y como denominador el número
de menores de 7
total de nacidos (vivos o muerto)
días de vida
MORTALIDAD Muertos menores
Número de nacidos vivos 1.000
INFANTIL de 1 año
Defunciones de Tiene valor la relación porcentual
MORTALIDAD
menores de 28 Número de nacidos vivos 1.000 que la mortalidad neonatal guarda
NEONATAL
días con la mortalidad infantil
Defunciones de
MORTALIDAD Refleja mejor el peso de los
niños de 11 meses Número de nacidos vivos 1.000
INFANTIL TARDIA factores ambientales
y 28 días.
Muerte materna: aquella por
MORTALIDAD
Muertes maternas Números de nacidos vivos 1.000 complicaciones del embarazo,
MATERNA
parto o puerperio

BRUTA DE Muertes por todas


Población estimada a mitad
MORTALIDAD las causas 1.000
del período
GENERAL ocurridas en 1 año

M MORTALIDAD Población estimada en ese


Muertes en grupo
O ESPECIFICA POR mismo grupo de edad a 1.000
de edad específico
R EDAD mitad de período
T
Muertes por una
A MORTALIDAD POR Población estimada en ese
causa determinada
L CAUSA ESPECIFICA mismo grupo de edad a 100.000
en un grupo de
I POR EDAD mitad de período
edad especifico
D
A
D Mide riesgo de morir entre
enfermos. Es más bien una
Muertes por causa Número de enfermos por la 100 razón porcentual entre
LETALIDAD
determinada misma causa 1.000 muertos y enfermos. No
debe confundirse con una
tasa de mortalidad

80
Nociones Básicas de Estadística

UNIDAD 2

Casos nuevos en la
1.000
unidad de tiempo Población estimada a mitad
INCIDENCIA 10.000
(1 año del período
M 100.000
habitualmente)
O
Número total de 100
R
casos existentes en Población estimada para el 1.000
B PREVALENCIA
un período o fecha mismo período o fecha 10.000
I
determinada 100.000
L
Usada en epidemias o
I Total de casos de 100
ATAQUE Población expuesta a riesgo episodios de breve
D un brote localizado 1.000
duración
A
D Usada en epidemias. El
ATAQUE Número de casos Población expuesta al 100 denominador puede
SECUNDARIO secundarios riesgo (contactos) 1.000 circunscribirse a contactos
susceptibles.

81
Nociones Básicas de Estadística

UNIDAD 2

Métodos para resumir datos clasificados en escala


cuantitativa

Al trabajar con histogramas y polígonos de frecuencias, vimos que las distribuciones


de los datos pueden adoptar varias formas. En algunas distribuciones los datos tienden a
agruparse más en una parte de la distribución que en otra. Comenzaremos a analizar las
distribuciones con el objeto de obtener medidas descriptivas numéricas, que nos ayuden en
el análisis de las características de los datos.

Parámetros: cantidad numérica calculada sobre una población


Por ejemplo: la altura de las personas de un país

Estadísticos: cantidad numérica calculada sobre una muestra de la población.


Por ejemplo: la altura del alumnado de este curso

Habitualmente interesa conocer un parámetro, pero por la dificultad que conlleva estudiar a
TODA la población, se tiende a calcular un estimador sobre una muestra, y confiar en que
sean próximos, si es representativa de la población.
Cuando se ha reunido un conjunto de datos clasificados en escala cuantitativa, es necesario
condensarlos para que aparezcan claramente las características principales de dicho
conjunto. En lugar de trabajar con toda la tabla de frecuencias, los estadísticos o parámetros
resumen los valores que separan a los datos en grupos significativos.
Si se comparan dos o más variables, la condensación es aún más necesaria.
Para resumir datos clasificados en escala cuantitativa se dispone de varios parámetros,
estadísticos o medidas en general:

 De posición
 De dispersión
 De forma

Medidas de posición
Las medidas de posición nos aportan la información de dónde se encuentran los datos, pero
no nos permite saber cómo se distribuyen.

¿ALREDEDOR DE QUÉ VALORES SE AGRUPAN LOS DATOS?

82
Nociones Básicas de Estadística

UNIDAD 2

Medidas de posición central

Las medidas de posición central son valores típicos o representativos de un conjunto de


datos, que nos ayudan a saber dónde están los datos, pero impiden saber cómo se
distribuyen. Son valores alrededor de los que las observaciones tienden a agruparse y
permiten ubicar lo que en algún sentido puede llamarse el “centro” de la distribución.
Las medidas que aportan esta información son:

Media aritmética o promedio


La suma de todos los valores de las observaciones dividido entre el número total de
observaciones (n) ó tamaño muestral.

Propiedades
 Es el centro de gravedad de los datos
 Puede hallarse en todo conjunto de datos
 Incluye a todos los valores de la distribución
 Cada conjunto de valores tiene una sola media
 La cantidad de datos a evaluar no la afecta
 Es un concepto familiar e intuitivamente claro
 Es conveniente cuando los datos se distribuyen simétricamente con
respecto a ese valor
 Puede malinterpretarse si los datos no forman un conjunto homogéneo
 Es muy sensible a valores extremos
 No puede calcularse si la distribución tiene clases abiertas

Cálculo:
Media para datos sin agrupar

x
n= tamaño de la muestra
x1  x2  ........ xn i
∑= sumatoria
X   i 1
n n xi =cada uno de los valores que toma
Por ejemplo: si se desea calcular la media la variable observada
aritmética de las siguientes mediciones de
Mantoux:
5, 10, 0, 0, 2, 3 mm
5  10  0  0  2  3 20
X    3,3mm.
6 6

83
Nociones Básicas de Estadística

UNIDAD 2

Media para una serie simple de frecuencias


Nos referimos al caso donde cada uno de los valores que toma la variable de observación se
repite más de una vez, en ese caso nos encontramos ante una distribución de frecuencias y
el cálculo de la media consiste en obtener el cociente entre la sumatoria de los productos de
cada valor de la variable por la frecuencia con que se presenta y el tamaño de la muestra.
n

x  f  x 2  f 2  ........ x n  f n x i  fi
X  1 1  i 1 n tamaño de la muestra
n n ∑= sumatoria
xi =cada uno de los valores que toma
la variable observada
fi= número de veces que se presenta
cada valor de la variable

RESULTADO DE LA REACCION DE MANTOUX CON PPD 20 UT 2 MESES DESPUÉS DE APLICADA LA VACUNA BCG -
ESTUDIANTES SECUNDARIOS - CIUDAD X - AÑO X

Tamaño de la reacción de Mantoux Nº de examinados Producto del valor de la variable


después de la vacunación en mm (Frecuencia absoluta) por la frecuencia absoluta
xi fi xi . fi

14 2 14 x 2= 28
15 4 15 x 4= 60
16 7 16 x 7= 112
17 4 17 x 4 = 68
18 7 18 x 7= 126
19 6 19 x 6= 114
20 12 20 x 12 = 240
21 5 21 x 5= 105
22 1 22 x 1 = 22
23 - -
24 2 24 x 2= 48
25 - -
26 - -
27 1 27
Total 51 950
950
X   18,6mm
51

84
Nociones Básicas de Estadística

UNIDAD 2

Media para datos agrupados

Los valores que toma la variable observada pueden ser demasiados como para
mencionarlos uno a uno, por lo que en tales casos puede recurrirse a agruparlos en
intervalos.
Si tenemos los datos agrupados en intervalos el procedimiento varía en algunos aspectos:

 Hay que calcular el punto medio de cada intervalo (marca de clase)


 Hay que multiplicar este punto medio por la frecuencia correspondiente a cada intervalo
 El resultado de la suma de todos los productos anteriores se divide por el tamaño de la
muestra

n tamaño de la muestra
∑= sumatoria
n

X  f  X 2  f 2  ........  X n  f n X i  fi X i = marca de clase (punto


X  1 1  i 1
medio de cada uno de los
n n intervalos de clase)
fi= número de veces que se
presenta cada valor de la
variable
Ls= Extremo superior del
intervalo
Li = Extremo inferior del
intervalo

Nota: la marca de clase se obtiene como semi suma de los extremos del intervalo
L  Li
X s
2

Mediana
Es el valor que está ubicado en el centro de la distribución, es decir, el valor que supera a la
mitad de los de la muestra y se ve superado por la otra mitad.
Se calcula buscando el valor de la muestra que ocupa el lugar (n+1)/2, con los datos
ordenados.
No busca el valor central del recorrido de la variable según la cantidad de observaciones,
sino que busca determinar el valor que tiene aquella observación que divide la cantidad de
observaciones en dos mitades iguales. Por lo tanto es necesario atender a la ordenación de

85
Nociones Básicas de Estadística

UNIDAD 2

los datos y debido a ello, este cálculo depende de la posición relativa de los valores
obtenidos.
Es necesario, antes que nada, ordenar los valores y se denota por Me.
Propiedades
 La mediana es única para cada conjunto de datos.
 No se ve afectada por los valores extremos (muy grandes o muy
pequeños).
 Puede obtenerse para datos cualitativos ordinales y cuantitativos.
 Puede utilizarse cuando la distribución de frecuencias tiene clases
abiertas, a menos que la mediana caiga en una clase abierta.

Cálculo
Mediana para datos sin agrupar
La mediana es el valor del dato central si hay un número impar de observaciones o el valor
de la semisuma de los valores de los dos datos centrales si se tiene un número par de datos.

 x((n 1) / 2 ) si n es impar (1)



Me   x( n )  x( n 1)
 2 2
si n es par (2)
 2

Ejemplo
Calcular la mediana de las siguientes mediciones de Mantoux:

TAMAÑO DE LA REACCION DE MANTOUX EN MM DESPUES DE LA VACUNACIÓN BCG

14 16 17 18 19 20 21 24
14 16 17 18 19 20 21 27
15 16 17 18 20 20 21
15 16 18 19 20 20 21
15 16 18 19 20 20 21
15 16 18 19 20 20 22
16 17 18 19 20 20 24

Me == 19
Me 19 mm
mm

En este ejemplo el número de mediciones es impar por lo que:


Me = 19 mm.
Si aplicamos (1) Me= x(51+1/2)= x26= 19 mm.

86
Nociones Básicas de Estadística

UNIDAD 2

Si se hubiesen tomado solo 50 mediciones

TAMAÑO DE LA REACCION DE MANTOUX EN MM DESPUESDE LA VACUNACIÓN BCG


14 16 17 18 19 20 21 24
14 16 17 18 19 20 21
15 16 17 18 20 20 21
15 16 18 18 20 20 21
15 16 18 19 20 20 21
15 16 18 19 20 20 22
16 17 18 19 20 20 24

x 50  x 50
Aplicando (2) Me 
( ) ( 1) x 25  x 26 18  19
2 2
   18,5mm.
2 2 2

Mediana para series de frecuencias


Para el caso de los datos agrupados en series de frecuencias debemos observar la
frecuencia relativa acumulada, la mediana será el valor donde la frecuencia relativa
acumuladas alcanzan el valor 0,50 o el 50%.

87
Nociones Básicas de Estadística

UNIDAD 2

RESULTADO DE LA REACCION DE MANTOUX CON PPD 20 UT 2 MESES DESPUÉS DE APLICADA LA VACUNA BCG -
ESTUDIANTES SECUNDARIOS - CIUDAD X - AÑO X

TAMAÑO DE LA REACCION Nº DE % %
DE MANTOUX DESPUES EXAMINADOS Frecuencia Frecuencia
DE LA VACUNACION EN (Frecuencia relativa relativa
mm absoluta) acumulada
xi Fi
14 2 2/51*100= 3,9 3,9
15 4 4/51*100=7,8 11,7
16 7 7/51*100=13,7 25,4
17 4 4/51*100=7,8 33,2
18 7 7/51*100=13,7 46,9

19 6 6/51*100= 11,8 58,7


20 12 12/51*100=23,5 82,2
21 5 5/51*100=9,8 92,0
22 1 1/51*100=1,96 93,96
23 - 0 93,96
24 2 2/51*100=3,9 97,86
25 - 0 97,86
26 - 0 97,86
27 1 1/51*100=1,96 100,0
Total 51 100

Me = 19

Interpretación: el 50% de los resultados de la reacción de Mantoux con PPD UT 2 meses


después de aplicada la vacuna BCG, en estudiantes secundarios de Ciudad X, en el Año X es
de hasta 19 mm.

Mediana para datos agrupados en intervalos

En el caso de variables discretas donde cada categoría es el valor de la variable, se puede


tomar como un caso de intervalo de amplitud 1 y en ese caso el cálculo de la mediana
funciona exactamente como lo visto para datos sin agrupar o para series de frecuencias.
Cuando trabajamos con variables agrupadas por intervalos es imposible determinar con
precisión los valores que toman los datos, ya que esa información se ha perdido en privilegio
del agrupamiento por clases. Por lo tanto, en este caso, debemos buscar otro método para
determinar el valor de la mediana.
88
Nociones Básicas de Estadística

UNIDAD 2

De la misma forma que en el caso de las series de frecuencias la mediana corresponderá en


este caso a la clase donde la frecuencia relativa acumulada alcanza el 50%. La diferencia para
los datos agrupados en intervalos es que mediante este mecanismo conocemos a que clase
o intervalo pertenece la mediana, pero no conocemos el valor que toma exactamente, para
lo que debemos emplear la siguiente fórmula:

n  n = nº de observaciones – tamaño de la muestra.-


  Fi 1 
Me   2 ai  l i Fi-1= frecuencia acumulada de la clase anterior a la
 fi  clase donde está la mediana.
 
  fi= es la frecuencia de la clase donde está la
mediana.
ai= es la amplitud de la clase
li= es el límite inferior del intervalo de la clase donde
está la mediana.

Ejemplo
TAMAÑO DE LA REACCION DE Nº DE EXAMINADOS Fi(a) % %
MANTOUX DESPUES DE LA (Frecuencia absoluta) Frecuencia Frecuencia
VACUNACION EN mm Fi relativa relativa
xi acumulada
14-15 6 6 11,8 11,8
16-17 11 17 21,5 33,3
18-19 13 30 25,5 58,8
20-21 17 47 33,3 92,1
22-23 1 48 1,96 94,06
24-25 2 50 3,92 97,98
26-27 1 51 1,96 100,0
Total 51 100,0

 51 
  17 
Me   2 1  18  18,65mm
 13 
 
 
Moda
Es aquel valor de la variable que más se repite, es decir aquel valor de la variable (que
puede ser o no un único valor) con mayor frecuencia.

89
Nociones Básicas de Estadística

UNIDAD 2

Propiedades:
 Es la medida de tendencia central más fácil de calcular.
 No se ve afectada por valores extremos.
 Puede utilizarse cuando los intervalos de clase sean abiertos.
 Su interpretación tiene sentido en variables con pocas categorías o valores.
 Es la medida que se relaciona con la frecuencia con que se presentan los datos
con mayor incidencia, con lo que se considera la posibilidad de que exista más de
una moda para un conjunto de datos.
 Puede observarse en variables cuantitativas y cualitativas.
 Si un conjunto de datos contiene dos categorías adyacentes con la misma
frecuencia común (mayor que cualquier otra), la moda es el promedio del valor
de las dos.
 Según el número de valores más frecuentes que tenga una distribución es:
Unimodal: aquella en la que hay una categoría que tiene mayor frecuencia que
todo el resto de ellas.
Bimodal: cuando 2 categorías no adyacentes de la variable observada tienen igual
y la mayor frecuencia.
Amodal: es cuando todas las categorías tienen la misma frecuencia.

Nota: Conjuntos muy numerosos que presenten un polígono de frecuencias con dos
lomos, aun cuando las frecuencia de cada uno de los picos no sean exactamente
iguales pueden denominarse bimodales (distorsiones de la definición permitidas), en
este caso podrán distinguirse entre moda mayor y moda menor.

Moda para variables cualitativas


Se ha realizado un estudio para valorar el grupo sanguíneo de un grupo de mujeres
embarazadas y obtenemos los siguientes datos:

Grupo sanguíneo Nº de mujeres


A 14
B 11
AB 5
0 10
Total 40

En este ejemplo la moda se corresponde con el valor A, ya que es el que presenta mayor
frecuencia.

90
Nociones Básicas de Estadística

UNIDAD 2

Moda para series de frecuencias


Dada la siguiente serie de frecuencias
Edad Frecuencia
24 0
25 1
26 3
27 1
28 1
29 3
30 5
31 2
32 3
33 2
34 10
35 1
36 7
37 1

Se observa que la moda es 34 años, ya que es la edad que más se repite. Hay 10 mujeres que
tienen 34 años.

Moda para datos agrupados en intervalos


Cuando los datos están agrupados en intervalos la moda corresponde con el punto medio
del intervalo de mayor frecuencia.
Para la siguiente distribución:

24-26 4
27-29 5
30-32 10
33-35 13
36-38 8
40

35  33
X  34 M o  34
2

Es importante observar si la distribución presenta 1 ó más modas. Si posee una sola moda se
la denomina unimodal, y si tiene dos es bimodal y en su defecto será multimodal.

91
Nociones Básicas de Estadística

UNIDAD 2

Posiciones relativas de la media, mediana y modo

La posición relativa de las medidas de posición central permite conocer el tipo de


distribución que tienen los datos y de ello dependerá cuál de las medidas sea la más
representativa de esa distribución.

Distribución de frecuencias simétrica

Simétrica Asimétrica o sesgadas


 Medidas: Me  X  Modo (o sus  Medidas: Me  X  Modo
valores son muy cercanos entre  Representación gráfica: se
sí). encuentra desplazada a la
 Representación gráfica: curva de derecho o la izquierda de la
Gauss. curva de Gauss.
 Solo contienen un modo.  El valor que mejor representa la
 El valor que mejor representa la distribución es la mediana.
distribución es la media aritmética  No es simétrica respecto de
o promedio. ninguna medida de posición
Es simétrica respecto del promedio central.

Distribución sesgada a derecha o con sesgo positivo

 Medidas: Modo  Me  X
 Representación gráfica: curva sesgada
a la derecha.
 El parámetro más adecuado para
representar la distribución es la
mediana ya que se encuentra entre el
Modo y el promedio y no se encuentra
influenciada por valores extremos.
 El Modo se encuentra en el punto mas
alto de la distribución.

92
Nociones Básicas de Estadística

UNIDAD 2

Distribución sesgada a izquierda o con sesgo negativo

 Medidas: X  Me  Mo
 Representación gráfica: curva sesgada
a la izquierda.
 El parámetro más adecuado para
representar la distribución es la
mediana ya que se encuentra entre el
Modo y el promedio y no se encuentra
influenciada por valores extremos.

Consideraciones importantes sobre las distribuciones simétricas


Usualmente se plantea la discusión sobre si una distribución es simétrica o no, en relación a
los resultados obtenidos en el cálculo de las medidas de tendencia central, debido a que en
los eventos referidos a unidades biológicas es poco probable que ocurra la estricta igualdad
entre los mencionados valores.

¿CÓMO SE DISTRIBUYEN LOS DATOS?

Medidas de posición no central

Las medidas de posición no centrales permiten conocer otros puntos característicos de la


distribución que no son los valores centrales. Entre otros indicadores, se suelen utilizar una
serie de valores que dividen la muestra en tramos iguales, mismo número de valores.

Cuantiles
Son aquellos valores de la variable que dividen a la distribución en partes, de tal manera que
cada una de las partes tiene el mismo número de frecuencias, entre los cuantiles más
conocidos se encuentran:

Percentileso Centiles (Pi)


Son los valores de la variable que dividen al conjunto de datos (ordenados de menor a
mayor) en cien partes iguales, (1% por cada una de las partes), dejando por debajo de ellos
determinados porcentajes. Se los identifica como Pi por ejemplo P30, P66

Deciles( Di)
Son las nueve partes iguales en las que se divide una distribución ordenada de menor a
mayor, conteniendo cada una de ellas el 10 % de la distribución. Se los identifica como Di por
ejemplo D5, D9

93
Nociones Básicas de Estadística

UNIDAD 2

Cuartiles (Qi)
Son los valores de la variable que dividen al conjunto de datos (ordenados de menor a
mayor) en cuatro partes iguales, (25% por cada una de las partes), dejando por debajo de
ellos determinados porcentajes. Se los identifica con Q1, Q2, Q3 de manera tal que Q1 = P25,
Q2 = P50= Me y Q3 = P75

Cuartiles y percentiles para datos sin agrupar

Cálculo
Sea Lq ó L p la posición del cuartil o percentil deseado

p q
Lp  n  Lq  n 
100 4 n = nº de datos
p= percentil
q = cuartil

Lq ó L p indican la posición del p-ésimo percentil y del q-ésimo cuartil, luego una vez
establecida la posición del parámetro ocurre:

 Si Lq ó L p no es entero, este número se redondea al valor inmediato superior, luego


el valor ubicado en esa posición es el p-ésimo percentil ó el q-ésimo cuartil.
 Si Lq ó L p es entero, el p-ésimo percentil ó el q-ésimo cuartil es el promedio de los
valores de los datos ubicados en L p  L p 1 o Lq  Lq 1

Por ejemplo:

Calcular el percentil 80 para:


0-1-2-3-3-3-5-5-6-7-7-9
80 48
L p 80  12    9,6  10 , en este caso el percentil 80 corresponde al número 7
100 5

94
Nociones Básicas de Estadística

UNIDAD 2

Cuartiles y percentiles para datos agrupados


El cálculo de los percentiles y cuartiles para datos agrupados es similar al de la mediana.

n n = nº de observaciones – tamaño de la muestra.


 N i 1
100 Ni-1= frecuencia acumulada de la clase anterior a la
Pi  Li 1   ai clase donde esta el percentil/cuartel.
ni
ni= es la frecuencia de la clase donde esta el
n
 N i 1 percentil/cuartil.
Qi  Li  1  4  ai ai= es la amplitud de la clase.
ni
li= es el limite inferior del intervalo de la clase
anterior donde está el percentil/cuartil.

Uso de los cuartiles y percentiles

Los cuartiles se usan para:


 Indicar el porcentaje igual o menor que el valor de un cuartil.
 Construir una curva epidémica.
 Describir el 50% central de la distribución.
 Elaborar el gráfico de caja.
 Establecerle rango intercuartílico.

Los percentiles se usan para:


 Comparar un valor individual con un conjunto de normas.
 Determinar rangos normales de análisis de laboratorio. Los límites normales de
muchas determinaciones de laboratorio se ubican entre los percentiles 2,5 y 97,5.

95
Nociones Básicas de Estadística

UNIDAD 2

¿CÓMO SE PRESENTAN LOS DATOS?


Medidas de dispersión o Variabilidad
Las medidas de posición no informan de la totalidad de la distribución. Dos conjuntos de
datos pueden tener una media idéntica y sin embargo ser diferentes en cuanto a la forma
que el resto de los datos se distribuyen en torno a ella.
Hasta el momento las preguntas planteadas han sido: ¿Alrededor de qué valor se agrupan los
datos? Y en ese caso la respuesta se encontraría atada a las medidas de posición central
(media, mediana, modo), cuando la preguntas es: ¿Cómo se distribuyen los datos?, la
respuesta las otorgan las medidas de posición no central, si en cambio la pregunta es ¿Cómo
se presentan esos datos?,¿muy concentrados?, ¿muy dispersos?, las medidas de dispersión
son quienes responden a esta pregunta.
Por ejemplo:
Las calificaciones de 15 alumnos de un curso dictado en la Facultad de la ciudad Sueño del
Mar son:

Area de estudio Calificaciones Promedio Mediana Moda

Eje Temático 1 5,6,8,5,5,7,9,8,10,4,3,6,7,4,8 6,33 6 8


Eje Temático 2 3,5,10,8,8,6,2,3,6,2,8,10,8,10,6 6,33 8 8

Observemos que en ambos casos los valores del promedio y la moda en los dos grupos son
iguales, pero las calificaciones obtenidas no los son, es por eso que para describir
adecuadamente una distribución de datos, no basta con conocer las medidas de posición
central, sino es necesario conocer en qué medida cada dato de la misma se aleja del punto
central que se ha calculado.
Para establecer estos valores utilizamos las medidas de dispersión.

Rango
Tal y como se expuso en el anteriormente, el rango es la distancia entre el mayor y el menor
de los valores que adquiere la variable. Se lo indica con R.

Desventajas:
 No utiliza todas las observaciones.
 Esta afectado por observaciones extremas (máximo y mínimo valor que asume la
variable).
 No tiende a disminuir a medida que aumenta el número de observaciones.

Continuando con el ejemplo de los alumnos del curso dictado en la Facultad de la Ciudad
Sueño del Mar

96
Nociones Básicas de Estadística

UNIDAD 2

Rango Intercuartílico
Es la distancia entre el tercer y el primer cuartil.
Ri  Q3  Q1
Es una medida similar al rango pero elimina las observaciones extremas inferiores y
superiores, por lo tanto no es tan sensible a esos valores extremos.

Varianza
Se la define como la media de los cuadrados de las diferencias entre cada valor de la variable
en estudio y la media de la distribución de datos de la misma. y se la indica con S2, (en
publicaciones científicas puede encontrársela como VAR).
Mide el promedio de las distancias (al cuadrado) de las observaciones con respecto de la
media.
Es sensible a los valores extremos (alejados de la media).
Sus unidades son diferentes a las unidades de la variable del conjunto original de datos, son
el cuadrado de las unidades de la variable, por ejemplo si se está observando la variable que
mide el tiempo de espera de una persona en minutos, las unidades de la varianza están
dadas en minutos al cuadrado (min2) ¿Qué es un minuto al cuadrado?, esto provoca que su
interpretación sea difícil.
Es una expresión de gran belleza “natural” ya que contiene la información geométrica
relevante de muchas situaciones donde la energía interna de un sistema depende de la
posición de sus partículas.

Se calcula:
n

(X i  X )2 Xi= valores que asume la variable

S2  i 1 X= media o promedio
N N = total de datos de la muestra
en estudio
Varianza para datos no agrupados
Se limita a aplicar la fórmula anterior:
 Calcular la media de la distribución
 Aplicar la fórmula
 Su unidad de medida es el cuadrado de las unidades de medida en que se midió la
variable

Varianza para datos agrupados

Se calcula mediante: xi= punto medio de cada intervalo


n de clase
f i  ( xi  X ) 2 X= media o promedio
S2  i 1
N = total de datos de la muestra
N
en estudio
fi= frecuencia de cada intervalo de
clase 97
Nociones Básicas de Estadística

UNIDAD 2

Debido a las dificultades para su comprensión, cuando se la relaciona con los datos que se
están observando, para comprender la variación del conjunto de datos, se calcula desviación
estándar.

Desviación típica ó estándar


El desvío estándar es el valor que se obtiene de calcular la raíz cuadrada de la varianza y se lo
indica con Sx .En publicaciones científicas puede encontrarse indicado con DE o SD.
Sx  Sx
2

Se expresa en las mismas unidades que las variables.


Para poder interpretar el desvío estándar como una medida de variabilidad o fluctuación de
los datos, debe partirse de la siguiente premisa:

En el intervalo , por
lo menos se encuentra el por ciento de las
observaciones, donde es el promedio, kes una constante y DE es el valor del desvío
estándar.

En el caso de distribuciones simétricas, el 68 % de las observaciones se encuentran en el


intervalo , el 95% de las observaciones se encuentra en el intervalo
y el 99 % de las observaciones se encuentra en el
intervalo , tal como se observa en la gráfica siguiente.

Características de la Varianza y el Desvío estándar


 Siempre toman valores positivos.
 Si los valores de una distribución son iguales entre sí la varianza es igual al desvío
estándar y a 0.
 Índices muy sensibles a la variación de cualquier valor que adquiera la variable.
 Solo se utilizan para variables cuantitativas.

98
Nociones Básicas de Estadística

UNIDAD 2

 No es recomendable su cálculo cuando tampoco lo es el de la media.


 Cuando los datos se alejan mucho de la media (dispersos) el numerador de la fórmula
será muy grande y por lo tanto ambas medidas serán grandes.

Usos
 Se utilizan en inferencia estadística.
 Para el cálculo del tamaño de la muestra.

En muchas ocasiones es necesario comparar la dispersión entre distintos conjuntos de datos,


y las variables observadas tienen diferentes unidades de medida, en estos casos, con la
desviación estándar y la varianza no se podrá obtener una conclusión válida referida a la
desviación de los datos. Aun cuando las variables tuvieran la misma unidad de medida, las
mediciones pueden variar considerablemente.
Por ejemplo:
Si se intenta compara el desvío estándar de la altura de los niños de 5 a 14 años de una
comunidad, con el mismo desvío pero de la de los estudiantes ingresantes a la universidad,
es altamente probable que este último sea mayor, solo porque las tallas de los ingresantes
universitarios son mayores con respecto a las de los niños entre 5 y 14 años y no porque la
variabilidad sea mayor.

Coeficiente de variación
El coeficiente de variación de un conjunto de datos muestrales o poblacionales, expresado
en términos de porcentaje, describe el desvío estándar relativo a la media, este se indica con
CV.

Por Ejemplo:
Si se observan la talla y el peso de 40 individuos pertenecientes a una muestra de la
población de estudiantes universitarios de la Ciudad Sueño del Mar y se obtiene las
siguientes medidas.

Media Desvío estándar (DE)

Talla 173.5 cm. 7,7 cm.


Peso 78.3 kg. 11,9 kg.

Entonces los correspondientes coeficientes de variación para la talla y el peso son:

99
Nociones Básicas de Estadística

UNIDAD 2

En este caso la diferencia de las unidades de las variables observadas imposibilitaría


comparar los desvíos estándar, pero si es posible comparar los coeficientes de variación
debido a que carecen de unidad y están expresados en términos de porcentajes, lo que nos
permite observar que la variación en el peso es sensiblemente superior a la de la talla. Estos
resultados tienen sentido, ya que es bastante común que entre los individuos exista
variación importante de peso y no de talla, es decir no es común que encontremos un adulto
que mida la mitad que otro, pero si podríamos dar más frecuentemente con uno que pese la
mitad que otro.

¿Cómo se ven los datos?

Medidas de forma

Anteriormente se abordó el tema del análisis de la forma de la distribución de


frecuencias desde su aproximación gráfica. Dicha aproximación es la forma más directa e
intuitiva de tener una idea en cuanto a la forma de la distribución de una variable.
Es notoria la importancia de conocer la forma de la distribución, para decidir qué medidas
son más convenientes utilizar en el caso de las variables cuantitativas.
A partir de ahora esta parte, analizaremos las medidas de forma, es decir, que información
nos aporta según la forma que tengan la disposición gráfica de los datos.
Las medidas de forma de una distribución se pueden clasificar en dos grandes grupos o
bloques: medidas de asimetría y medidas de curtosis.

Medidas de asimetría
La simetría de una distribución de frecuencias refiere al grado en que valores que toma la
variable, equidistantes a un valor que se considere centro de la distribución, poseen
frecuencias similares.
Es un concepto más intuitivo a nivel visual, especialmente, si se observa una representación
gráfica (diagrama de barras, histograma…) de la distribución de frecuencias. Ésta será
simétrica si la mitad izquierda de la distribución es la imagen especular de la mitad derecha.
Para saber si una distribución de frecuencias es simétrica hay que precisar con respecto a
qué: media, mediana o modo?
Para las variables cuantitativas continuas es con respecto a la mediana, ya que esta divide a
la distribución en dos partes iguales, en cambio para las variables discretas la medida de
referencia será el promedio.- Parecería que existe una arbitrariedad en los conceptos
anteriores, pero en realidad no hay tal, pues si una variable es continua, coinciden ambos

100
Nociones Básicas de Estadística

UNIDAD 2

criterios de simetría (con respecto a la media y a la mediana). Es más, se tiene que media y
mediana coinciden para distribuciones continuas simétricas. Por otro lado, en el caso de
variables discretas, la distribución es simétrica si el lado derecho del diagrama se obtiene por
imagen especular desde la media. En este caso coincide la media con la mediana si el
número de observaciones es impar.

Si la variable es continua simétrica y unimodal, coinciden la media, la mediana y la moda.


Cuando al trazar una vertical, en el gráfico de barras o histograma, de una variable, según
sea esta discreta o continua, por el valor de referencia, si esta vertical, se transforma en eje
de simetría, decimos que la distribución es simétrica. En caso contrario, dicha distribución
será asimétrica o diremos que presenta asimetría.

IMPORTANTE:
Cuando realizamos un estudio descriptivo es altamente improbable que la distribución
de frecuencias sea totalmente simétrica. En la práctica diremos que la distribución de
frecuencias es simétrica si lo es de un modo aproximado.

Una distribución es simétrica cuando:


sesgo = 0

moda =
media =
mediana
(o los
valores
son muy
cercanos
entre
sí).-
Una distribución es asimétrica cuando tiene algún tipo de sesgo
Moda ≠ Mediana ≠ Media

Tipos de asimetría
La asimetría de un conjunto de datos puede ser, positiva o negativa:
Asimetría Positiva: Tiene sesgo a la derecha y las medidas de posición central se relacionan
de manera que: Moda < mediana < media

101
Nociones Básicas de Estadística

UNIDAD 2

Asimetría Negativa: Tiene sesgo a la izquierda y las medidas de posición central se relacionan
de manera que: Moda> mediana > media

Existen Índices estadísticos que permiten cuantificar el nivel de asimetría de una variable
cuantitativa o cualitativa ordinal.
Cabe destacar que para variables cualitativas nominales no tiene sentido el plantear este
tipo de índices, dado que no existe un orden intrínseco a los valores de la variable.

Medidas de apuntamiento o curtosis

El apuntamiento o curtosis de una distribución de frecuencias no tiene un referente


natural propio, como en el caso de la simetría, sino que se sustenta en la comparación
respecto a una distribución de referencia, en concreto, la distribución normal o campana de
Gauss, es el parámetro de comparación En consecuencia, su obtención sólo tendrá sentido
en variables cuya distribución de frecuencias sea similar a la de la curva normal –en la
práctica ello se reduce, básicamente, a que sea unimodal y “más o menos” simétrica.
El apuntamiento, expresa el grado en que una distribución acumula casos en sus colas en
comparación con los casos acumulados en las colas de una distribución normal cuya
dispersión sea equivalente (Pardo y Ruiz, 2002).

102
Nociones Básicas de Estadística

UNIDAD 2

Así, de forma análoga a la asimetría, se diferencian 3 grandes categorías de apuntamiento:

Distribución platicúrtica (apuntamiento negativo): indica que en las colas hay más casos
acumulados que en las colas de una distribución normal.

Distribución leptocúrtica (apuntamiento positivo): en las colas de la distribución hay menos


casos acumulados que en las colas de la distribución normal.

Distribución mesocúrtica (apuntamiento normal): la acumulación de casos en las colas de la


distribución es como en la distribución normal (Curva de Gauss).

Leptocúrtica Mesocúrtica Platicúrtica

Curva de Gauss

103
Nociones Básicas de Estadística

UNIDAD 2

En síntesis:

 Las medidas de resumen para variables cuantitativas suelen dividirse en: de posición, de
dispersión y de forma; resultando conveniente no utilizar las primeras de forma aislada, sino
acompañadas de alguna medida de la dispersión.

 La media aritmética es la medida de posición central más utilizada.

 La desviación estándar sobresale por su uso entre las medidas de variabilidad.

 Cuando las distribuciones son asimétricas o hay intervalos abiertos, se prefiere el cálculo de
la mediana al de la media.

 Cuando las distribuciones son simétricas, coinciden la media, la mediana, la moda, el


segundo cuartil, el quinto decil y el percentil cincuenta.

 Se prefiere utilizar como medida de dispersión a la desviación estándar cuando se selecciona


como mejor medida de posición central al promedio.

 El Rango Intercuartílico es una medida de dispersión adecuada cuando la medida de posición


central que mejor representa la distribución es la mediana.

104
Nociones Básicas de Estadística

UNIDAD 2

Bibliografía

 Barón-López, J. (2005). Bioestadística: métodos y aplicaciones. Apuntes y material


disponible en http://www.bioestadistica.uma.es/baron/apuntes/

 Rius, F., Barón-López, F. J., Sánchez, E. y Parras, L. (2006). Bioestadística: métodos y


aplicaciones. Disponible en www.bioestadistica.uma.es/libro/

 Pardo, A. y Ruiz, M. A. (2002). SPSS: Guía para el análisis de datos. Madrid: McGraw-Hill.

 J. Gabriel Molina y María F. Rodrigo Estadística descriptiva en Psicología Curso 2009-


2010.

 Morton, R- Hebel, J -Mc. Carter, R. Bioestadística y Epidemiología. Tercera Edición. (1996)


Mexico DF. Interamericana – Mc. Graw –Hill.

 Bonita, R. - Beaglehole, R. – Kjelstrom, T. (2008). Estadística Básica. Segunda edición

105

También podría gustarte