Está en la página 1de 46

MEDIDAS DE CENTRALIZACIÓN,

DE DISPERSIÓN Y DE POSICIÓN
La estadística de resumen

Después de construir tablas y gráficos, a


partir de una colección de datos, se
requieren medidas más exactas.
La estadística de resumen, proporciona
medidas para describir un conjunto de
datos.
Existen tres tipos de medidas de resumen:
• De tendencia central.
• De dispersión.
• De posición.
A) MEDIDAS DE
CENTRALIZACIÓN
Nos dan un centro de la distribución de
frecuencias, es un valor que se puede
tomar como representativo de todos los
datos. Hay diferentes modos para definir el
"centro" de las observaciones en un
conjunto de datos.

En general se denominan promedios.

Los más importantes son la media, la


mediana y la moda.
¿POR QUÉ SON IMPORTANTES LAS
MEDIDAS DE TENDENCIA CENTRAL?
Porque la mayor parte de los conjuntos
de datos muestran una tendencia a
agruparse alrededor de un dato central.
Las medidas de tendencia central son
puntos en una distribución, los valores
medios o centrales de ésta y nos ayudan
a ubicarla dentro de la escala de
medición.
A) LA MEDIA

a) Obtención: (Para datos simples) Se obtiene


sumando los valores registrados y dividiéndolos
entre el número de datos.
Ejemplo:
La siguiente tabla muestra el número de
reclamos y quejas presentadas por
pacientes en el Servicio de Emergencias a
lo largo de una semana. Calcule e interprete
la media.
Día/Semana Lun Mar Mier Jue Vier Sab
Reclamos/día 8 10 5 12 10 15
8 + 10 + 5 + 12 + 10 + 15 60
x= = = 10
6 6

b) Interpretación: Si se elige al azar un día de


la semana, se espera que los pacientes del
servicio de emergencia realicen 10
reclamos en ese día.
c) Simbología:
Tamaño Media aritmética
Muestra n x (equis barra)
Población N  (mu)
d) Cálculos: a partir de datos simples, se utilizan las
siguientes formulas.
Para una muestra
donde: x : media muestral

x=
X
 X : suma de todos los datos
n n : número de datos

Para una población


donde:  : media poblacional
 X : suma de todos los datos
X N : número de datos (población)
=
N
e) Cálculo a partir de datos agrupados.
El cálculo de la media aritmética, cuando
los datos disponibles se encuentran en
tablas de distribución de frecuencias, se
realiza utilizando la formula siguiente

σ 𝑓. 𝑥
𝑥ҧ =
𝑛
donde: 𝑥ҧ :media muestral
𝑓 :frecuencia absoluta de la
clase
𝑥 :marca de la clase
Ejemplo:
La distribución de frecuencias siguiente, representa los puntajes
obtenidos en una evaluación del desempeño, aplicado al
personal técnico de un Centro de Salud. El puntaje máximo en la
prueba es 50. Calcule e interprete la media.

Desempeño Número de
(puntos) técnicos
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60
Primero se calcularán las marcas de clase (x); es
decir, el valor intermedio de cada clase
Intervalos – Marca de Frecuencia
Clases Clase (x) Absoluta (f)
12 – 16 14 4
17 – 21 19 8
22 – 26 24 15
27 – 31 29 23
32 - 36 34 10
Total - 60

14 4 + 19 8 + 24 15 + 29 23 + 34(10)
𝑥ҧ =
60
1575
𝑥ҧ = 𝑥ҧ = 26,25
60
Interpretación: Si se elige al azar a un trabajador técnico
de este hospital, se espera que tenga un puntaje de 26,25
en su evaluación de desempeño.
g)Ventajas y desventajas de la media aritmética

Ventajas:
Concepto familiar para muchas personas
Es única para cada conjunto de datos
Es posible comparar medias de diferentes
muestras
Desventajas:
Se ve afectada por los datos extremos
Si la muestra es grande y los datos no están
agrupados, su cálculo es tedioso
B) LA MEDIANA

Es la medida que divide en dos subconjuntos


iguales a los datos, de tal manera que 50% de
los datos es menor a la mediana y el otro 50% es
mayor a la mediana.

a) Obtención: (Para datos simples) Se obtiene


ordenando la serie de datos (en forma
ascendente o descendente) y ubicando el dato
central.
Ejemplo:
Los siguientes datos se refieren al número de pacientes
que llegaron a su cita, después de la hora programada
durante los últimos 11 días en el Servicio de Pediatría.
Calcule e interprete la mediana.
12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16

Primero se ordenan lo datos:

5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17

5 datos menores 5 datos mayores

Mediana
b) Interpretación: Durante 5 días llegaron menos de 11
pacientes tarde a su cita y durante 5 días, más de 11
pacientes llegaron tarde a su cita.

c) Reglas
1º Si la serie es impar, la mediana ocupa el lugar central
de la serie previamente ordenada.
Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24
2º Si la serie es par, la mediana se obtiene de la
semisuma de los dos valores centrales de la
serie previamente ordenada.

Ejemplo:
8, 10, 14, 18, 23, 24, 32, 34

18 + 23
mediana = = 20.5
2
d) Cálculo a partir de datos agrupados.

n 
 − fac ant c
Me= Lri +  2 
f
dónde:
 Lri: es el límite inferior del intervalo de clase que contiene a la
mediana
 fac.ant: es la frecuencia acumulada del intervalo anterior al de la
mediana
 n: es la cantidad de datos o total de frecuencias
 f: frecuencia absoluta del intervalo de clase que contiene a la
mediana
 c: es el tamaño o ancho del intervalo de clase que contiene a la
mediana
Ejemplo: La tabla siguiente muestra la experiencia laboral
(años) del personal de seguridad que trabaja en un gran
hospital. Calcule e interprete la mediana.
Experiencia Número de
n 69
laboral
(años)
trabajadores
de seguridad
= = 34,5
2 2
0-3 4
4-7 12
Clase n 
8 - 11 24  − fac.ant c
Mediana
Me= Lri +  2 
12 - 15 16
16 - 19 10 f
(69 / 2 − 16 )
20 - 23 3
69
= 7,5 + .4
24
Me = 10,5 años
= 7,5 + 3,08  10,58
Interpretación:
La mitad del personal de seguridad que trabaja
en este hospital tienen una experiencia laboral
igual o menor a 10 años 6 meses. La otra mitad
de este personal tiene una experiencia laboral
igual o mayor a 10 años y 6 meses.
e) Ventajas y desventajas

Ventajas:
Los valores extremos no afectan a la
mediana como en el caso de la media
aritmética.
Es fácil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos,
registrados bajo una escala ordinal.
Desventajas:
Como valor central, se debe ordenar primero
la serie de datos.
Para una serie amplia de datos no
agrupados, el proceso de ordenamiento de
los datos demanda tiempo y usualmente
provoca equivocaciones.
C) LA MODA
La moda es el valor que más se repite dentro de un
conjunto de datos.
a) Obtención: se obtiene organizando la serie de datos
y seleccionando el o los datos que más se repiten.

Ejemplos:

4, 5, 7, 8, 8 , 10, 12, 15

4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

7, 12, 15, 18, 25, 30, 31, 38


b) Cálculo a partir de datos agrupados

 1 
Mo = L +   c
 +
 1 2
ri

donde:

Mo: moda
L : limite real (o frontera) inferior de la clase modal (la de
ri
mayor frecuencia)
 : frecuencia de la clase modal menos la frecuencia de
1
la clase anterior
 : frecuencia de la clase modal menos la frecuencia de
2
la clase siguiente
c : amplitud de clase
Las clases mediana y modal pueden coincidir pero
conceptualmente son diferentes.
Ejemplo: La tabla siguiente muestra los errores de
facturación durante un mes, en una Clínica. Calcule e
interprete la moda.
Errores de Clase modal : (4 - 7)
facturación Días  =6
0-3 6
1
 6 
Mo = 3.5 +   4
6+4
Clase
4-7 12
Modal
8 - 11 8
12 - 15 3
 =4
2
Mo = 5,9
16 - 19 1
Total 30

Interpretación: Durante un mes, el número más frecuente


de errores de facturación en esta clínica es 6.
e) Ventajas y desventajas de la moda.
Ventajas:
Se puede utilizar tanto para datos cualitativos como
cuantitativos.
No se ve afectada por los valores extremos.
Se puede calcular, a pesar de que existan una o
más clases abiertas.
Desventajas:
No tiene un uso tan frecuente como la media.
Muchas veces no existe moda (distribución
amodal).
En otros casos la distribución tiene varias modas, lo
que dificulta su interpretación.
B) MEDIDAS DE DISPERSION
A) Rango
El rango se define como la diferencia entre
el valor máximo y mínimo de un conjunto
de datos.
Rango = Valor máximo – Valor mínimo

El rango no mide la variabilidad de los


datos intermedios.
B) Desviación Media

 La desviación media es la media aritmética


de los valores absolutos de las desviaciones
respecto a la media.
 La desviación media se representa por DM

Datos Simples Datos Agrupados


σ 𝒙−𝒙ഥ σ 𝒙− 𝒙
ഥ .𝒇
𝑫𝑴 = 𝑫𝑴 =
𝒏 𝒏
C) Varianza
 La varianza es la media del cuadrado de las
desviaciones de los datos con respecto al promedio.
 Esta medida tiene las unidades de los datos pero
elevadas al cuadrado lo que dificulta su
interpretación.

Datos Agrupados Datos Simples


σ 𝒙𝟐. 𝒇 σ 𝒙−𝒙ഥ 𝟐
𝑺𝟐 = ഥ𝟐
−𝒙 𝟐
𝑺 =
𝒏 𝒏
D) DESVIACIÓN TÍPICA
 La desviación típica es la raíz cuadrada de la
varianza.
 Es decir, la raíz cuadrada de la media de los
cuadrados de las puntuaciones de desviación.
 La desviación típica se representa por S

𝑺= 𝑺𝟐
Ejemplo para Datos Simples:

Hallar la desviación media, la varianza y la desviación típica de la


siguiente serie de datos: 12, 6, 7, 3, 15, 10, 18, 5
σ 𝒙−𝒙ഥ
𝑫𝑴 =
Calculamos la media: 𝒏
12+6+7+3+15+10+18+5
𝑥ҧ = = 9,5
8

Y ahora la desviación media:

12 − 9,5 + 6 − 9,5 + 7 − 9,5 + 3 − 9,5 + 15 − 9,5 + 10 − 9,5 + 18 − 9,5 + 5 − 9,5


𝐷𝑀 =
8

𝐷𝑀 = 4,25
Varianza:
σ 𝒙−𝒙ഥ 𝟐
𝑺𝟐 =
𝒏

(12 − 9,5)2 +(6 − 9,5)2 + ⋯ + (18 − 9,5)2 +(5 − 9,5)2


𝑆2 =
8

𝑆 2 = 23,75

Desviación Típica:

𝑺= 𝑺𝟐 𝑺= 𝟐𝟑, 𝟕𝟓

𝑺 = 𝟒, 𝟖𝟕
Ejemplo para Datos Agrupados:
La distribución de frecuencias siguiente, representa los
puntajes obtenidos en una evaluación del desempeño,
aplicado al personal técnico de un Centro de Salud. El
puntaje máximo en la prueba es 50. Calcule la
desviación media, varianza y desviación típica.

Desempeño Número de
(puntos) técnicos
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60
Intervalos – Marca de Frecuencia f*x ഥ .𝒇
𝒙− 𝒙 𝒙𝟐 . 𝒇
Clases Clase (x) Absoluta (f)
12 – 16 14 4 56 49 784
17 – 21 19 8 152 58 2888
22 – 26 24 15 360 33.75 8640
27 – 31 29 23 667 63.25 19343
32 - 36 34 10 340 77.5 11560
Total - 60 1575 281.5 43215
σ 𝒙− 𝒙
ഥ .𝒇
𝑫𝑴 = 281.5 σ 𝒙𝟐. 𝒇
𝒏 𝐷𝑀 = 𝑺𝟐 = ഥ𝟐
−𝒙 𝑺= 𝑺𝟐
σ 𝑓. 𝑥 60 𝒏
𝑥ҧ =
𝑛 𝑆= 31.1875
1575 𝐷𝑀 = 4.691 2
43215
𝑥ҧ = 𝑆 = − 26,252
60 60 𝑆 = 5.58
𝑥ҧ = 26,25 𝑆 2 = 31.1875
Coeficiente de variabilidad
No tiene unidades de medida.
Es una medida relativa de variabilidad y permite
realizar comparaciones entre conjuntos de
observaciones con distintas unidades o medias
diferentes.
A veces se considera que un CV mayor a 50%
indica alta dispersión en los datos .

CV poblacional CV muestral
 S
CV = 100% CV = 100%
 x
c) MEDIDAS DE POSICIÓN
 En el caso de las medidas de posición sólo
estudiaremos para datos agrupados, pues tienen
mayor significación que los datos sueltos.
1. CUARTILES
 Los cuartiles son los tres valores de la variable que
dividen a un conjunto de datos ordenados en cuatro
partes iguales.
 Q1, Q2 y Q3 determinan los valores correspondientes
al 25%, al 50% y al 75% de los datos.

𝒌. 𝒏
− 𝒇𝒂𝒄𝒂𝒏𝒕
𝑸𝒌 = 𝑳𝒓𝒊 + 𝟒 .𝒄
𝒇
2. DECILES
Los deciles son los nueve valores que dividen
la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes
al 10%, al 20%... y al 90% de los datos.

𝒌. 𝒏
− 𝒇𝒂𝒄𝒂𝒏𝒕
𝑫𝒌 = 𝑳𝒓𝒊 + 𝟏𝟎 .𝒄
𝒇
3. PERCENTILES
Los percentiles son los 99 valores que dividen
la serie de datos en 100 partes iguales.
Los percentiles dan los valores
correspondientes al 1%, al 2%... y al 99% de los
datos.

𝒌. 𝒏
− 𝒇𝒂𝒄𝒂𝒏𝒕
𝑷𝒌 = 𝑳𝒓𝒊 + 𝟏𝟎𝟎 .𝒄
𝒇
Ejemplo:
La tabla muestra la experiencia (en años) de las
enfermeras de un gran centro hospitalario

Experiencia Trabajadores
(años)
0-3 18
4-7 42
8 - 11 68
12 - 15 120
16 - 19 40
20 - 23 34
24 - 27 12
Total 334
¿Sobre qué edad se ubica el 25% de las
enfermeras de mayor experiencia?

75 % 25 %

P75
Menor Mayor
Experiencia Experiencia

K = 75
Kn 75(334)
Lugar del P75 = = = 250,5o (de los números ordenados)
100 100

Para saber en cuál clase se halla este dato, se


calculó la frecuencia acumulada.
Experiencia Nº Trabajadores Frec. Acumulada
(años) fi Fi
0-3 18 18
4-7 42 60 F=248
8 - 11 68 128
12 - 15 120 248 En esta clase
16 - 19 40 288 se localizan del
20 - 23 34 322 249º - 288º
24 - 27 12 334
334

 75(334) − (248 + 1)


 100  P = 15.65 años
P = 15.5 + 4
75  40  75
 

Interpretación: Para que una enfermera esté


comprendida dentro del 25% de mayor experiencia
laboral debe tener al menos 15 años, 7 meses y 24 días.
Ejemplo 2:
La presión arterial sistólica (PAS), medida en 96 recién
nacidos, en sus primeras 24 horas de vida están
registradas en la tabla a continuación.
PAS f Se pide:
55 - 59 3 a) Calcular e interpretar los resultados
59 - 63 5 siguientes: a.1. El cuartil 2
63 - 67 40 a.2. El percentil 80
67 - 71 24 a.3. El decil 6
71 - 75 15
75 - 79 8
b) Verificar cuál es la presión arterial
79 - 83 1
Total 96
máxima del 75% de los recién nacidos.
Intervalos – a.1. El cuartil 2
f fac
Clases 𝒌. 𝒏
− 𝒇𝒂𝒄𝒂𝒏𝒕
55 – 59 3 3 𝑸𝒌 = 𝑳𝒓𝒊 + 𝟒 .𝒄
𝑐=4 𝒇
59 – 63 5 8
𝑘.𝑛 2.96
62,5 63 – 67 40 48 𝑘=2 = = 48
4 4
67 – 71 24 72 𝟒𝟖 − 𝟖
𝑸𝟐 = 𝟔𝟐, 𝟓 + .𝟒
70,5 71 - 75 15 87 𝟒𝟎
75 – 79 8 95 𝑸𝟐 = 𝟔𝟔, 𝟓

79 - 83 1 96
Total 96
𝑘.𝑛 80.96
a.2. El percentil 80 𝑘 = 80 = = 76,8
100 100
𝒌. 𝒏
− 𝒇𝒂𝒄𝒂𝒏𝒕 𝟕𝟔, 𝟖 − 𝟕𝟐 𝑷𝟖𝟎 = 𝟕𝟏, 𝟕𝟖
𝑷𝒌 = 𝑳𝒓𝒊 + 𝟏𝟎𝟎 .𝒄 𝑷𝟖𝟎 = 𝟕𝟎, 𝟓 + .𝟒
𝒇 𝟏𝟓
Intervalos – a.3. El decil 6
f fac
Clases 𝒌. 𝒏
− 𝒇𝒂𝒄𝒂𝒏𝒕
55 – 59 3 3 𝑫𝒌 = 𝑳𝒓𝒊 + 𝟏𝟎 .𝒄
𝑐=4 𝒇
59 – 63 5 8
𝑘.𝑛 6.96
63 – 67 40 48 𝑘=6 = = 57,6
10 10
66,5
66,5 67 – 71 24 72 𝟓𝟕, 𝟔 − 𝟒𝟖
𝑫𝟔 = 𝟔𝟔, 𝟓 + .𝟒
71 - 75 15 87 𝟐𝟒
75 – 79 8 95 𝑫𝟔 = 𝟔𝟖, 𝟏

79 - 83 1 96
Total 96
b) Verificar cuál es la presión arterial máxima del 75% de los recién nacidos.
𝑘.𝑛 3.96
𝒌. 𝒏
− 𝒇𝒂𝒄𝒂𝒏𝒕
𝑘=3 = = 72
𝟒 4 4
𝑸𝒌 = 𝑳𝒓𝒊 + .𝒄
𝒇 𝑸𝟑 = 𝟕𝟎, 𝟓
𝟕𝟐 − 𝟒𝟖
𝑸𝟑 = 𝟔𝟔, 𝟓 + .𝟒
𝟐𝟒
a) Interpretar los
resultados:
𝑸𝟐 = 𝟔𝟔, 𝟓 a.1. El cuartil 2: El 50% de los recién nacidos tienen una
PAS menor que 66,5.
𝑷𝟖𝟎 = 𝟕𝟏, 𝟕𝟖 a.2. El percentil 80: El 80% de los recién nacidos tienen
una PAS entre 55 y 71,78.
𝑫𝟔 = 𝟔𝟖, 𝟏 a.3. El decil 6: El 60% de los recién nacidos tienen una
PAS como máximo de 68,1.

b) Verificar cuál es la presión arterial máxima del 75% de


los recién nacidos.
La presión arterial máxima del 75% de los
𝑸𝟑 = 𝟕𝟎, 𝟓 recién nacidos es 70,5.

También podría gustarte