Medidas Descriptivas

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA Ejemplo:
FACULTAD DE CIENCIAS MÉDICAS

ESCUELA DE ESTUDIOS DE POSTGRADO Las notas del tercer examen parcial de los Estudios de
ÁREA DE EDUCACIÓN CONTINUA EN CIENCIAS DE LA SALUD Especialización en Epidemiología obtenidas por los 20
ESTUDIOS DE ESPECIALIZACIÓN EN EPIDEMIOLOGÍA
estudiantes fueron las siguientes: 5.5, 7.1, 6.1, 6.7, 0.3, 3.3, 3.6,
6.1, 5.1, 3.6, 5.8, 6.9, 3.6, 6.5, 6.4, 4.4, 5.1, 4.8, 5.7, 4.2
1 Se procede al ordenamiento de la información del dato

MEDIDAS DESCRIPTIVAS EN EPIDEMIOLOGIA
menor al dato mayor:
Los problemas o eventos relacionados con la salud y su
comportamiento dentro del contexto, son situaciones que Tabla 1
requieren de un resumen de datos para conocer, analizar e Notas del Tercer Examen Parcial
interpretar lo que sucede. Las medidas descriptivas se pueden Estudios de Especialización en Epidemiología
calcular a partir de datos de una muestra o de la población, por lo Cohorte 2014
que hablaremos de estadística cuando la medida descriptiva se
calcule a partir de una muestra y de parámetro cuando la medida Nota sobre10 puntos
descriptiva se calcule a partir de la población.
0.3 5.5
Unas de las medidas descriptivas que se utilizan con más 3.3 5.7
frecuencia son las medidas de tendencia central y las medidas de 3.6 5.8
dispersión. 3.6 6.1
3.6 6.1
Para poder elaborar las medidas de tendencia central y de 4.2 6.4
dispersión, es importante saber como ordenar la información 4.4 6.5
previamente y para ello, existen tres formas posibles: 4.8 6.7
5.1 6.9
a) Arreglo o serie simple. 5.1 7.1
b) Distribución simple de frecuencias
c) Distribución de frecuencias agrupadas en intervalos de clase. Fuente: archivo AECCS
La serie simple se utiliza cuando la cantidad de datos es La ventaja de este ordenamiento, es que se tiene por separado
poca (menor o igual a 30 datos) y consiste en el ordenamiento de las características de cada uno de los elementos (en este caso,
los datos de menor a mayor o viceversa. Puede hacerse con una las notas individuales), pudiendo hacer cálculos y análisis en
cantidad de datos mayor, pero se debe tomar en cuenta la forma directa.
inconveniencia de trabajar con cada uno de los datos cuando son
demasiados. La distribución simple de frecuencias se utiliza
cuando la cantidad de datos es grande (mayor de 30) y consiste
1 en ordenar la información en dos columnas. En una se coloca la
Compilado con fines docentes
Dr. Jorge Barillas Aráuz categoría de la variable y en la otra las veces que cada una de
Estudios de Especialización en Epidemiología estas se repite, o sea la frecuencia.
1
Ejemplo:
Ejemplos:
Tabla 2
EDAD DE 54 ESTUDIANTES DE LOS ESTUDIOS DE • Si en una clínica de salud mental durante un período de
ESPECIALIZACIÓN EN EPIDEMIOLOGÍA tiempo, se recibieron pacientes con diagnóstico de: retardo
COHORTES 2012-2014 mental, psicosis, neurosis y trastornos de personalidad. El
diagnóstico que ocurriera con mayor frecuencia en el grupo de
pacientes se denominaría diagnóstico modal.
EDAD (en años) Frecuencia
17 4 • En la tabla 1, la moda sería la nota de 3.6 puntos. Su
19 8 interpretación sería: la nota que más se repite en el tercer
20 8 examen parcial de los Estudios de Especialización en
21 12 Epidemiología, Cohorte 2014 es de 3.6 puntos.
22 12
24 6 • En la tabla 2, se encuentran dos modas y estas son 21 y 22
25 3 años (cada una con una frecuencia de 12). Su interpretación
26 1 sería: las edades que más se repiten entre los estudiantes de
los Estudios de Especialización en Epidemiología son las de
TOTAL 54 21 y 22 años.
Fuente: archivo AECCS.
Media aritmética
MEDIDAS DE TENDENCIA CENTRAL
Es el valor promedio de una serie de observaciones y se
También llamadas de centralización, indican el punto calcula dividiendo la suma de los valores individuales del grupo
medio de la distribución. Son muy útiles para resumir una de observaciones entre el número total de observaciones. Toda
distribución de frecuencias. Entre ellas están: la información disponible se utiliza para obtener una sola cifra
que describa la característica estudiada en la población
Moda (asumiendo que esta característica tiene una distribución normal
en la población).
Es el valor que ocurre con más frecuencia. Puede existir
más de una moda si se observan varios valores que tienen la Una de las limitaciones de la media, es que puede verse
máxima frecuencia; pero si todos los valores son diferentes, se afectada por la presencia en el grupo, de valores extremos, ya
dice que no hay moda. La moda, también se puede utilizar para sea pequeños o grandes. Además, pueden obtenerse valores
describir datos cualitativos. similares o idénticos en grupos de observaciones que fuesen
muy dispersos o muy agrupados.
2
La fórmula para la obtención de la media cuando se utiliza la media = _1141_ = 21.13
serie simple es la siguiente: 54
media = ∑x Mediana
n
También llamada valor medio de una serie de
x = valor de la categoría de la variable n
observaciones, es aquel valor que divide el total de
= tamaño de la muestra
observaciones (ordenadas de menor a mayor) en dos grupos de
Ejemplo A: igual tamaño; es decir, que el 50% de la población está por
encima y el 50% debajo de la mediana. Esto ofrece una medida
Tomando los datos de la tabla 1, encontramos que el promedio de tendencia central que evita la distorsión que introducen en la
de la nota obtenida por los 20 estudiantes de los Estudios de media los valores extremos.
Especialización en Epidemiología es:
Cuando el número de valores en el conjunto es par, existen dos
x = 100.8_ = 5.04 puntos valores medios, por lo que la mediana se obtiene de la media de
20 esos dos valores.
En la distribución simple de frecuencias, la fórmula es:
La posición de la mediana se obtiene utilizando la
media = ∑x.f siguiente fórmula:
n Mediana = n + 1
donde f = frecuencia de la categoría de la variable. 2
Ejemplo:
Ejemplo B:
Según los datos de la tabla 1 (serie simple) la posición de la
Tomando los datos de la tabla 2, encontramos que el promedio mediana sería 20 + 1/2 = 10.5
de edad de los 54 estudiantes de los Estudios de
Especialización en Epidemiología es de 21 años.
1) 0.3 11) 5.5 *
EDAD (en años) Frecuencia f.x 2) 3.3 12) 5.7
x f
17 4 68 3) 3.6 13) 5.8
19 8 152 4) 3.6 14) 6.1
20 8 160 5) 3.6 15) 6.1
21 12 252 6) 4.2 16) 6.4
22 12 264 7) 4.4 17) 6.5
24 6 144 8) 4.8 18) 6.7
25 3 75 9) 5.1 19) 6.9
26 1 26 10) 5.1 * 20) 7.1
TOTAL 54 1141
3
Como la mediana debe dejar el mismo número de observaciones MEDIDAS DE DISPERSIÓN
por debajo y por arriba, los dos valores medios corresponden a
los estudiantes número 10 y 11, cuyos valores de la nota del La dispersión de un conjunto de observaciones se refiere
tercer examen parcial son 5.1 y 5.5 respectivamente, por lo que a la variedad que muestran éstas. Si todos los valores de las
la mediana es 5.1 + 5.5/2 = 5.3 puntos. observaciones son iguales, no hay dispersión; pero si no todos
son iguales, entonces existe dispersión de los datos. La magnitud
Según los datos de la tabla 2 (distribución simple de de la dispersión depende de la cercanía de los valores entre sí.
frecuencias), la posición de la mediana es 54 + 1/2 = 27.5 y
viendo la frecuencia acumulada, esta posición se encuentra en la
edad de 21 años, que sería el valor de la mediana.
EDAD (en años) Frecuencia Frecuencia

x f acumulada
17 4 4
19 8 12
20 8 20
21 12 32 *
22 12 44
24 6 50
25 3 53
26 1 54
TOTAL 54
Figura 1. Se observan dos distribuciones de frecuencias con

igual media pero diferente dispersión.
La media y la mediana son también conocidas como
parámetros de localización, pues se pueden utilizar para Las medidas de dispersión más utilizadas son las
designar ciertas posiciones sobre el eje horizontal cuando se siguientes:
elabora una gráfica de la distribución de una variable.
Amplitud
También llamada rango o recorrido; es la diferencia entre
el valor mayor y el valor menor en un conjunto de observaciones.
En la tabla 1, sería 7.1 - 0.3 = 6.8, o sea que la dispersión en las
notas obtenidas por los estudiantes de los Estudios de
Especialización en Epidemiología en el tercer examen parcial fue
de 6.8 puntos, tomando en cuenta que la nota mayor fue de 7.1 y
la menor de 0.3 puntos.
4
Varianza s2 = 53.4405 = 2.81
20 - 1
La dispersión de las observaciones se puede medir en
función del esparcimiento alrededor de la media, para ello se
utiliza la varianza. Esta se obtiene restando a cada uno de los Fórmula en distribución simple de frecuencias:
valores la media, las diferencias se elevan al cuadrado y
después se suman, éste resultado se divide el tamaño de la s2 = ∑(x - x)2. f
muestra menos 1. n-1
Fórmula en serie simple: Ejemplo:
s2 = ∑(x - x)2 Utilizando los datos de la tabla 2, tenemos:

n-1
Ejemplo. x = 21 años
Utilizando los datos de la tabla 1, tenemos:
EDAD
x = 5.04 puntos
(en años)
Frecuencia (x - x) (x - x)2 (x - x)2 f
X (x - x) (x - x)2 17 4 -4 16 64
1) 0.3 -5.01 25.1001 19 8 -2 4 32
2) 3.3 -1.74 3.0276 20 8 -1 1 8
3) 3.6 -1.44 2.0736 21 12 0 0 0
4) 3.6 -1.44 2.0736 22 12 1 1 12
5) 3.6 -1.44 2.0736 24 6 3 9 54
6) 4.2 -0.84 0.7056 25 3 4 16 48
7) 4.4 -0.64 0.4096 26 1 5 25 25
8) 4.8 -0.24 0.0576
9) 5.1 0.06 0.0036 TOTAL 54 243
10) 5.1 0.06 0.0036
11) 5.5 0.46 0.2116
12) 5.7 0.66 0.4356 S2 = 243 = 4.58
13) 5.8 0.76 0.5776 54 - 1
14) 6.1 1.06 1.1236
15) 6.1 1.06 1.1236 La varianza representa unidades al cuadrado, por lo que
16) 6.4 1.36 1.8496 no es una medida adecuada de dispersión si se pretende
17) 6.5 1.46 2.1316 expresar este concepto en términos de medidas originales. Para
18) 6.7 1.66 2.7556 ello se utiliza la desviación estándar.
19) 6.9 1.86 3.4596
20) 7.1 2.06 4.2436
TOTAL 53.4405
5
Desviación estándar Bibliografía:
Mide la dispersión de las observaciones alrededor de la

media, expresada en unidades originales. Su fórmula es la raíz 1. Daniel, Wayne W. Bioestadística. 4ª. Edición. Editorial
cuadrada de la varianza. Limusa, S.A. México, D.F. 2002.
s = √s2 2. Bonita, R., R. Beaglehole y T. Kjellström. Epidemiología

Básica. Publicación científica No. 551. 2ª. Ed. OPS,
Tomando los datos de los dos ejemplos de la varianza, se Washington, D.C. 2008.
obtiene:
3. Castillo-Salgado, Carlos. Manual sobre enfoque de riesgo en
s = √2.81 = 1.68 la atención materno-infantil. Serie Paltex No. 7. 2ª. Edición.
OPS, Washington, D.C. 1999.
s = √4.58 = 2.14
4. Centro para el control y prevención de enfermedades.
Uso de la media y la desviación estándar Principios de Epidemiología. CDC, Atlanta, Giorgia. 2ª.
Edición. 1992.
La media y la desviación estándar nos permiten describir
la distribución de la característica estudiada en la muestra, de 5. Guerrero González, R. et al Epidemiología. Fondo Educativo
forma que la media ± 1 desviación estándar cubre el 68.2% de Interamericano, S.A.1981.
las observaciones; la media ± 2 desviaciones estándar el 95.6% y
la media ± 3 desviaciones estándar el 99.8%.
Figura 2. Curva de distribución normal (Bonita 2008)
6
DISTRIBUCIÓN AGRUPADA EN MEDIDAS DE TENDENCIA CENTRAL
INTERVALOS DE CLASE EN DATOS AGRUPADOS
Este tipo de presentación es aconsejable utilizarla a partir de 60

datos, aunque algunos autores lo hacen a partir d 15 ó 30. La x = ∑ mi fi
presentación consiste en agrupar los valores observados en fi
intervalos de clase. Los pasos son los siguientes: Md = Lri + [ n/2 - fa(i-1) ] (i)
fi
1. Calcular la amplitud de la variable.
Lri = Límite real inferior
2. Calcular el número de clases mediante la fórmula de
Sturgess. n = tamaño de la muestra
fa(i-1) = frecuencia acumulada del intervalo anterior
No. Cl = 1 + 3.3 x log (N) fi = frecuencia del intervalo que contiene la mediana
i = amplitud del intervalo de clase
3. Calcular la amplitud del intervalo de clase.
Mo = Lri + [ ∆1 ] (i)
4. Elaborar la tabla con los intervalos de clase (iniciar con el ∆1 + ∆2
valor menor y sumarle la amplitud del intervalo de clase),
∆1 = Moda menos la frecuencia del intervalo anterior
y agregar la frecuencia de los valores observados en
cada intervalo de clase. ∆2 = Moda menos la frecuencia del intervalo siguiente
5. Determinar los límites reales.
LR = Lim Sup(i) + Lim Inf (i) MEDIDAS DE DISPERSIÓN
2
VARIANZA
6. Calcular la marca de clase de cada intervalo.
s2 = ∑(mi – x)2.fi
7. Determinar la frecuencia acumulada. fi – 1
∂2 = ∑ (mi – x)2 .fi

fi
7
DESVIACIÓN ESTÁNDAR Percentiles
s = √ ∑ (mi – x)2 .fi Los percentiles son los valores que dividen la serie de datos en
fi – 1 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y

al 99% de los datos.
∂ = √ ∑ (mi – x)2 .fi El percentil “n” es el valor que tiene el “n%” de las observaciones
fi por debajo.
P50 coincide con la mediana.

MEDIDAS DE POSICIÓN
Para el cálculo de los deciles, cuartiles y percentiles, el primer
Las medidas de posición dividen un conjunto de datos en grupos paso es ordenar los datos de menor a mayor.
con el mismo número de individuos.
En serie simple y distribución simple de frecuencias:
Para calcular las medidas de posición es necesario que
los datos estén ordenados de menor a mayor. Cuartil:
Las medidas de posición son: QK = k(n + 1)
4
Cuartiles
Decil:
Los cuartiles son los tres valores de la variable que dividen a
un conjunto de datos ordenados en cuatro partes iguales. DK = k(n + 1)
10
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al
Percentil:
50% y al 75% de los datos.
PK = k(n + 1)
Q2 coincide con la mediana. 100
Deciles En distribución agrupada en intervalos de clase:
Los deciles son los valores que dividen la serie de datos en diez Qk = Lri + [k.n/4 - fa(I -1) ] (i)
partes iguales. fi
Los deciles dan los valores correspondientes al 10%, al 20%... y al

90% de los datos.
Pk = Lri + [k.n/100 - fa(i -1) ] (i)
fi
D5 coincide con la mediana.
8
MEDIDAS DE FORMA
RANGO INTERCUARTÍLICO
ASIMETRÍA
Representa la porción central de una distribución, y se calcula
como la diferencia entre el primer y tercer cuartil. El rango incluye El concepto se refiere a si la curva que forman los valores de la
serie de datos presenta la misma forma a la derecha y a la
aproximadamente la mitad de las observaciones en la serie, izquierda de un valor central (media aritmética).
dejando por aproximadamente el 25% de las observaciones por
debajo o por encima.
Pasos:
1. Ordenar las observaciones en orden ascendente.
2. Encontrar las posiciones del primer y tercer cuartil e
identificar los valores.
3. Calcular el rango intercuartílico entre Q 3 y Q1
Para medir el coeficiente de asimetría, se utiliza el Coeficiente de

Asimetría de Fisher.
Los resultados pueden ser los siguientes:
g1 = 0 (distribución simétrica; existe la misma concentración de

valores a la derecha y a la izquierda de la media)
g1 > 0 (distribución asimétrica positiva; existe menor

concentración de valores a la derecha de la media)
g1 < 0 (distribución asimétrica negativa; existe menor

concentración de valores a la izquierda de la media)
9
Si existe simetría, entonces g1 = 0, y ; si además la CURTOSIS
distribución es unimodal, también podemos afirmar
que: La curtosis (o apuntamiento) mide la mayor o menor
concentración de datos alrededor de la media y es una medida
- Asimetría Positiva, si g1 > 0, entonces : de forma que mide cuán escarpada o achatada está una curva o
distribución.
- Asimetría Negativa, si g1 < 0, entonces : Este coeficiente indica la cantidad de datos que hay cercanos a
la media; de manera que a mayor grado de curtosis, más
escarpada (o apuntada) será la forma de la curva.
Tipos de curtosis:
Leptocúrtica: la Curtosis >0. Los datos están muy concentrados

en la media, siendo una curva muy apuntada.
Mesocúrtica: la Curtosis =0. Distribución normal.
Platicúrtica: la Curtosis <0. Muy poca concentración de datos en

la media, presentando una forma muy achatada.
*1
JBA/jba2017
10
GLOSARIO MARCA DE CLASE
También llamada Punto Medio, es el valor que

DATOS AGRUPADOS representa a cada intervalo de clase y se
encuentra en el centro.
Es el resumen de la información (en intervalos de clase)
mi = Li(i) + Ls(i)
de una forma sencilla para determinar su naturaleza y que
facilita el cálculo de medidas descriptivas. 2
AMPLITUD DE LA VARIABLE LIMITES REALES
Se obtiene de restar el valor más bajo del valor más alto Son los límites de una clase que no permiten espacio
observado en la variable de estudio. entre un límite y otro. Ejemplo:
R = Valor mayor – valor menor ESTATURA (cms.)

150 – 155
AMPLITUD DEL INTERVALO DE CLASE 155 – 160
160 – 165
Es el número de valores en cada intervalo de clase. 165 – 170
LIMITES APARENTES
i = Ls - Li
FRECUENCIA ACUMULADA Son los que permiten espacios entre un límite y otro y
evidencian la discreción de la variable. Ejemplo:
Es la sumatoria de las frecuencias de 2 o más categorías
EDAD (años)
o intervalos de clase.
15 –19
20 – 24
25 – 29
30 - 34
11

Medidas Descriptivas

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Medidas Descriptivas

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA Ejemplo:

FACULTAD DE CIENCIAS MÉDICAS

1 Se procede al ordenamiento de la información del dato

Fuente: archivo AECCS.

EDAD (en años) Frecuencia Frecuencia

Figura 1. Se observan dos distribuciones de frecuencias con

Fórmula en serie simple: Ejemplo:

s2 = ∑(x - x)2 Utilizando los datos de la tabla 2, tenemos:

Mide la dispersión de las observaciones alrededor de la

s = √s2 2. Bonita, R., R. Beaglehole y T. Kjellström. Epidemiología

Figura 2. Curva de distribución normal (Bonita 2008)

Este tipo de presentación es aconsejable utilizarla a partir de 60

∂2 = ∑ (mi – x)2 .fi

Los percentiles dan los valores correspondientes al 1%, al 2%... y

P50 coincide con la mediana.

Deciles En distribución agrupada en intervalos de clase:

Los deciles dan los valores correspondientes al 10%, al 20%... y al

Para medir el coeficiente de asimetría, se utiliza el Coeficiente de

Los resultados pueden ser los siguientes:

g1 = 0 (distribución simétrica; existe la misma concentración de

g1 > 0 (distribución asimétrica positiva; existe menor

g1 < 0 (distribución asimétrica negativa; existe menor

Leptocúrtica: la Curtosis >0. Los datos están muy concentrados

Mesocúrtica: la Curtosis =0. Distribución normal.

Platicúrtica: la Curtosis <0. Muy poca concentración de datos en

También llamada Punto Medio, es el valor que

AMPLITUD DE LA VARIABLE LIMITES REALES

R = Valor mayor – valor menor ESTATURA (cms.)

También podría gustarte