Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La serie simple se utiliza cuando la cantidad de datos es La ventaja de este ordenamiento, es que se tiene por separado
poca (menor o igual a 30 datos) y consiste en el ordenamiento de las características de cada uno de los elementos (en este caso,
los datos de menor a mayor o viceversa. Puede hacerse con una las notas individuales), pudiendo hacer cálculos y análisis en
cantidad de datos mayor, pero se debe tomar en cuenta la forma directa.
inconveniencia de trabajar con cada uno de los datos cuando son
demasiados. La distribución simple de frecuencias se utiliza
cuando la cantidad de datos es grande (mayor de 30) y consiste
1 en ordenar la información en dos columnas. En una se coloca la
Compilado con fines docentes
Dr. Jorge Barillas Aráuz categoría de la variable y en la otra las veces que cada una de
Estudios de Especialización en Epidemiología estas se repite, o sea la frecuencia.
1
Ejemplo:
Ejemplos:
Tabla 2
EDAD DE 54 ESTUDIANTES DE LOS ESTUDIOS DE • Si en una clínica de salud mental durante un período de
ESPECIALIZACIÓN EN EPIDEMIOLOGÍA tiempo, se recibieron pacientes con diagnóstico de: retardo
COHORTES 2012-2014 mental, psicosis, neurosis y trastornos de personalidad. El
diagnóstico que ocurriera con mayor frecuencia en el grupo de
pacientes se denominaría diagnóstico modal.
EDAD (en años) Frecuencia
17 4 • En la tabla 1, la moda sería la nota de 3.6 puntos. Su
19 8 interpretación sería: la nota que más se repite en el tercer
20 8 examen parcial de los Estudios de Especialización en
21 12 Epidemiología, Cohorte 2014 es de 3.6 puntos.
22 12
24 6 • En la tabla 2, se encuentran dos modas y estas son 21 y 22
25 3 años (cada una con una frecuencia de 12). Su interpretación
26 1 sería: las edades que más se repiten entre los estudiantes de
los Estudios de Especialización en Epidemiología son las de
TOTAL 54 21 y 22 años.
Media aritmética
MEDIDAS DE TENDENCIA CENTRAL
Es el valor promedio de una serie de observaciones y se
También llamadas de centralización, indican el punto calcula dividiendo la suma de los valores individuales del grupo
medio de la distribución. Son muy útiles para resumir una de observaciones entre el número total de observaciones. Toda
distribución de frecuencias. Entre ellas están: la información disponible se utiliza para obtener una sola cifra
que describa la característica estudiada en la población
Moda (asumiendo que esta característica tiene una distribución normal
en la población).
Es el valor que ocurre con más frecuencia. Puede existir
más de una moda si se observan varios valores que tienen la Una de las limitaciones de la media, es que puede verse
máxima frecuencia; pero si todos los valores son diferentes, se afectada por la presencia en el grupo, de valores extremos, ya
dice que no hay moda. La moda, también se puede utilizar para sea pequeños o grandes. Además, pueden obtenerse valores
describir datos cualitativos. similares o idénticos en grupos de observaciones que fuesen
muy dispersos o muy agrupados.
2
La fórmula para la obtención de la media cuando se utiliza la media = _1141_ = 21.13
serie simple es la siguiente: 54
media = ∑x Mediana
n
También llamada valor medio de una serie de
x = valor de la categoría de la variable n
observaciones, es aquel valor que divide el total de
= tamaño de la muestra
observaciones (ordenadas de menor a mayor) en dos grupos de
Ejemplo A: igual tamaño; es decir, que el 50% de la población está por
encima y el 50% debajo de la mediana. Esto ofrece una medida
Tomando los datos de la tabla 1, encontramos que el promedio de tendencia central que evita la distorsión que introducen en la
de la nota obtenida por los 20 estudiantes de los Estudios de media los valores extremos.
Especialización en Epidemiología es:
Cuando el número de valores en el conjunto es par, existen dos
x = 100.8_ = 5.04 puntos valores medios, por lo que la mediana se obtiene de la media de
20 esos dos valores.
En la distribución simple de frecuencias, la fórmula es:
La posición de la mediana se obtiene utilizando la
media = ∑x.f siguiente fórmula:
n Mediana = n + 1
donde f = frecuencia de la categoría de la variable. 2
Ejemplo:
Ejemplo B:
Según los datos de la tabla 1 (serie simple) la posición de la
Tomando los datos de la tabla 2, encontramos que el promedio mediana sería 20 + 1/2 = 10.5
de edad de los 54 estudiantes de los Estudios de
Especialización en Epidemiología es de 21 años.
1) 0.3 11) 5.5 *
EDAD (en años) Frecuencia f.x 2) 3.3 12) 5.7
x f
17 4 68 3) 3.6 13) 5.8
19 8 152 4) 3.6 14) 6.1
20 8 160 5) 3.6 15) 6.1
21 12 252 6) 4.2 16) 6.4
22 12 264 7) 4.4 17) 6.5
24 6 144 8) 4.8 18) 6.7
25 3 75 9) 5.1 19) 6.9
26 1 26 10) 5.1 * 20) 7.1
TOTAL 54 1141
3
Como la mediana debe dejar el mismo número de observaciones MEDIDAS DE DISPERSIÓN
por debajo y por arriba, los dos valores medios corresponden a
los estudiantes número 10 y 11, cuyos valores de la nota del La dispersión de un conjunto de observaciones se refiere
tercer examen parcial son 5.1 y 5.5 respectivamente, por lo que a la variedad que muestran éstas. Si todos los valores de las
la mediana es 5.1 + 5.5/2 = 5.3 puntos. observaciones son iguales, no hay dispersión; pero si no todos
son iguales, entonces existe dispersión de los datos. La magnitud
Según los datos de la tabla 2 (distribución simple de de la dispersión depende de la cercanía de los valores entre sí.
frecuencias), la posición de la mediana es 54 + 1/2 = 27.5 y
viendo la frecuencia acumulada, esta posición se encuentra en la
edad de 21 años, que sería el valor de la mediana.
TOTAL 54
4
Varianza s2 = 53.4405 = 2.81
20 - 1
La dispersión de las observaciones se puede medir en
función del esparcimiento alrededor de la media, para ello se
utiliza la varianza. Esta se obtiene restando a cada uno de los Fórmula en distribución simple de frecuencias:
valores la media, las diferencias se elevan al cuadrado y
después se suman, éste resultado se divide el tamaño de la s2 = ∑(x - x)2. f
muestra menos 1. n-1
X (x - x) (x - x)2 17 4 -4 16 64
1) 0.3 -5.01 25.1001 19 8 -2 4 32
2) 3.3 -1.74 3.0276 20 8 -1 1 8
3) 3.6 -1.44 2.0736 21 12 0 0 0
4) 3.6 -1.44 2.0736 22 12 1 1 12
5) 3.6 -1.44 2.0736 24 6 3 9 54
6) 4.2 -0.84 0.7056 25 3 4 16 48
7) 4.4 -0.64 0.4096 26 1 5 25 25
8) 4.8 -0.24 0.0576
9) 5.1 0.06 0.0036 TOTAL 54 243
10) 5.1 0.06 0.0036
11) 5.5 0.46 0.2116
12) 5.7 0.66 0.4356 S2 = 243 = 4.58
13) 5.8 0.76 0.5776 54 - 1
14) 6.1 1.06 1.1236
15) 6.1 1.06 1.1236 La varianza representa unidades al cuadrado, por lo que
16) 6.4 1.36 1.8496 no es una medida adecuada de dispersión si se pretende
17) 6.5 1.46 2.1316 expresar este concepto en términos de medidas originales. Para
18) 6.7 1.66 2.7556 ello se utiliza la desviación estándar.
19) 6.9 1.86 3.4596
20) 7.1 2.06 4.2436
TOTAL 53.4405
5
Desviación estándar Bibliografía:
6
DISTRIBUCIÓN AGRUPADA EN MEDIDAS DE TENDENCIA CENTRAL
INTERVALOS DE CLASE EN DATOS AGRUPADOS
7
DESVIACIÓN ESTÁNDAR Percentiles
s = √ ∑ (mi – x)2 .fi Los percentiles son los valores que dividen la serie de datos en
fi – 1 100 partes iguales.
∂ = √ ∑ (mi – x)2 .fi El percentil “n” es el valor que tiene el “n%” de las observaciones
fi por debajo.
Los deciles son los valores que dividen la serie de datos en diez Qk = Lri + [k.n/4 - fa(I -1) ] (i)
partes iguales. fi
Pasos:
1. Ordenar las observaciones en orden ascendente.
2. Encontrar las posiciones del primer y tercer cuartil e
identificar los valores.
3. Calcular el rango intercuartílico entre Q 3 y Q1
9
Si existe simetría, entonces g1 = 0, y ; si además la CURTOSIS
distribución es unimodal, también podemos afirmar
que: La curtosis (o apuntamiento) mide la mayor o menor
concentración de datos alrededor de la media y es una medida
- Asimetría Positiva, si g1 > 0, entonces : de forma que mide cuán escarpada o achatada está una curva o
distribución.
- Asimetría Negativa, si g1 < 0, entonces : Este coeficiente indica la cantidad de datos que hay cercanos a
la media; de manera que a mayor grado de curtosis, más
escarpada (o apuntada) será la forma de la curva.
Tipos de curtosis:
*1
JBA/jba2017
10
GLOSARIO MARCA DE CLASE
Se obtiene de restar el valor más bajo del valor más alto Son los límites de una clase que no permiten espacio
observado en la variable de estudio. entre un límite y otro. Ejemplo:
LIMITES APARENTES
i = Ls - Li
FRECUENCIA ACUMULADA Son los que permiten espacios entre un límite y otro y
evidencian la discreción de la variable. Ejemplo:
Es la sumatoria de las frecuencias de 2 o más categorías
EDAD (años)
o intervalos de clase.
15 –19
20 – 24
25 – 29
30 - 34
11