Está en la página 1de 40

MEDIDAS DE CENTRALIZACIÓN,

DE DISPERSIÓN Y DE POSICIÓN
La estadística de resumen
Después de construir tablas y gráficos, a partir de
una colección de datos, se requieren medidas más
exactas.
La estadística de resumen, proporciona medidas
para describir un conjunto de datos.
Existen tres tipos de medidas de resumen:
• De tendencia central.
• De dispersión.
• De posición.
A) MEDIDAS DE CENTRALIZACIÓN
• Nos dan un centro de la distribución de frecuencias,
es un valor que se puede tomar como
representativo de todos los datos. Hay diferentes
modos para definir el "centro" de las observaciones
en un conjunto de datos.

• En general se denominan promedios.


• Los más importantes son la media, la mediana y la
moda.
¿POR QUÉ SON IMPORTANTES LAS
MEDIDAS DE TENDENCIA CENTRAL?
Porque la mayor parte de los conjuntos de datos
muestran una tendencia a agruparse alrededor
de un dato central.
Las medidas de tendencia central son puntos en
una distribución, los valores medios o centrales
de ésta y nos ayudan a ubicarla dentro de la
escala de medición.
A) LA MEDIA

a) Obtención: (Para datos simples) Se obtiene sumando


los valores registrados y dividiéndolos entre el número
de datos.
Ejemplo:
La siguiente tabla muestra el número de reclamos y
quejas presentadas por pacientes en el Servicio de
Emergencias a lo largo de una semana. Calcule e
interprete la media.

Día/Semana Lun Mar Mier Jue Vier Sab


Reclamos/día 8 10 5 12 10 15
8  10  5  12  10  15 60
x   10
6 6

b) Interpretación: Si se elige al azar un día de la


semana, se espera que los pacientes del servicio de
emergencia realicen 10 reclamos en ese día.
c) Simbología:
Tamaño Media aritmética
Muestra n x (equis barra)
Población N  (mu)
d) Cálculos: a partir de datos simples, se utilizan las
siguientes formulas.
Para una muestra
 X donde: x : media muestral
x
n  X : suma de todos los datos
n : número de datos
Para una población
donde:  : media poblacional
X  X : suma de todos los datos
 N : número de datos (población)
N
e) Cálculo a partir de datos agrupados.
El cálculo de la media aritmética, cuando los
datos disponibles se encuentran en tablas de
distribución de frecuencias, se realiza utilizando
la formula siguiente

𝑓. 𝑥
𝑥=
𝑛
donde: 𝑥 :media muestral
𝑓 :frecuencia absoluta de la clase
𝑥 :marca de la clase
Ejemplo:
La distribución de frecuencias siguiente, representa los
puntajes obtenidos en una evaluación del desempeño,
aplicado al personal técnico de un Centro de Salud. El
puntaje máximo en la prueba es 50. Calcule e interprete
la media.

Desempeño Número de
(puntos) técnicos
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60
Primero se calcularán las marcas de clase (x); es decir, el
valor intermedio de cada clase
Intervalos – Marca de Frecuencia
Clases Clase (x) Absoluta (f)
12 – 16 14 4
17 – 21 19 8
22 – 26 24 15
27 – 31 29 23
32 - 36 34 10
Total - 60

14 4 + 19 8 + 24 15 + 29 23 + 34(10)
𝑥=
60
1575
𝑥= 𝑥 = 26,25
60
Interpretación: Si se elige al azar a un trabajador
técnico de este hospital, se espera que tenga un
puntaje de 26,25 en su evaluación de desempeño.
g)Ventajas y desventajas de la media aritmética

Ventajas:
Concepto familiar para muchas personas
Es única para cada conjunto de datos
Es posible comparar medias de diferentes
muestras
Desventajas:
Se ve afectada por los datos extremos
Si la muestra es grande y los datos no están
agrupados, su cálculo es tedioso
B) LA MEDIANA

Es la medida que divide en dos subconjuntos


iguales a los datos, de tal manera que 50% de los
datos es menor a la mediana y el otro 50% es
mayor a la mediana.

a) Obtención: (Para datos simples) Se obtiene


ordenando la serie de datos (en forma ascendente
o descendente) y ubicando el dato central.
Ejemplo:
Los siguientes datos se refieren al número de pacientes
que llegaron a su cita, después de la hora programada
durante los últimos 11 días en el Servicio de Pediatría.
Calcule e interprete la mediana.
12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16

Primero se ordenan lo datos:

5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17

5 datos mayores 5 datos menores

Mediana
b) Interpretación: Durante 5 días llegaron menos de 11
pacientes tarde a su cita y durante 5 días, más de 11
pacientes llegaron tarde a su cita.

c) Reglas
1º Si la serie es impar, la mediana ocupa el lugar
central de la serie previamente ordenada.
Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24
2º Si la serie es par, la mediana se obtiene de la semisuma
de los dos valores centrales de la serie previamente
ordenada.

Ejemplo:
8, 10, 14, 18, 23, 24, 32, 34

18  23
mediana   20.5
2
d) Cálculo a partir de datos agrupados.

n 
  fac ant c
Me Lri   2 
f

dónde:
• Lri: es el límite inferior del intervalo de clase que contiene a la mediana
• fac.ant: es la frecuencia acumulada del intervalo anterior al de la mediana
• n: es la cantidad de datos o total de frecuencias
• f: frecuencia absoluta del intervalo de clase que contiene a la mediana
• c: es el tamaño o ancho del intervalo de clase que contiene a la mediana
Ejemplo: La tabla siguiente muestra la experiencia
laboral (años) del personal de seguridad que trabaja en
un gran hospital. Calcule e interprete la mediana.
Experiencia Número de
n 69
laboral
(años)
trabajadores
de seguridad
  34,5
2 2
0-3 4
4-7 12
n 
Clase
  fac.ant c
Me Lri   
8 - 11 24
Mediana
2
12 - 15 16 f
69 / 2  16 .4
16 - 19 10
20 - 23 3
69
 7,5 
24
 7,5  3,08  10,58
Me = 10,5 años
Interpretación:
La mitad del personal de seguridad que trabaja en este
hospital tienen una experiencia laboral igual o menor a 10
años 6 meses. La otra mitad de este personal tiene una
experiencia laboral igual o mayor a 10 años y 6 meses.
e) Ventajas y desventajas

Ventajas:
Los valores extremos no afectan a la mediana como
en el caso de la media aritmética.
Es fácil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos,
registrados bajo una escala ordinal.

Desventajas:
Como valor central, se debe ordenar primero la serie
de datos.
Para una serie amplia de datos no agrupados, el
proceso de ordenamiento de los datos demanda
tiempo y usualmente provoca equivocaciones.
C) LA MODA

La moda es el valor que más se repite dentro de un


conjunto de datos.
a) Obtención: se obtiene organizando la serie de datos y
seleccionando el o los datos que más se repiten.
Ejemplos:

4, 5, 7, 8, 8 , 10, 12, 15

4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

7, 12, 15, 18, 25, 30, 31, 38


b) Cálculo a partir de datos agrupados

 1 
Mo  L    c
 
 1 2
ri

donde:

Mo : moda
L : limite real (o frontera) inferior de la clase modal (la de
ri
mayor frecuencia)
 : frecuencia de la clase modal menos la frecuencia de la
1
clase anterior
 : frecuencia de la clase modal menos la frecuencia de la
2
clase siguiente
c : amplitud de clase
Las clases mediana y modal pueden coincidir pero
conceptualmente son diferentes.
Ejemplo: La tabla siguiente muestra los errores de
facturación durante un mes, en una Clínica. Calcule e
interprete la moda.
Errores de Clase modal : (4 - 7)
facturación Días  6
0-3 6
1
 6 
Mo  3.5    4
64
Clase
4-7 12
Modal
8 - 11 8
 4 Mo = 5,9
12 - 15 3 2

16 - 19 1
Total 30

Interpretación: Durante un mes, el número más


frecuente de errores de facturación en esta clínica es 6.
e) Ventajas y desventajas de la moda.
Ventajas:
Se puede utilizar tanto para datos cualitativos como
cuantitativos.
No se ve afectada por los valores extremos.
Se puede calcular, a pesar de que existan una o más
clases abiertas.
Desventajas:
No tiene un uso tan frecuente como la media.
Muchas veces no existe moda (distribución amodal).
En otros casos la distribución tiene varias modas, lo
que dificulta su interpretación.
B) MEDIDAS DE DISPERSION
A) Rango

• El rango se define como la diferencia entre el valor


máximo y mínimo de un conjunto de datos.
Rango = Valor máximo – Valor mínimo

• El rango no mide la variabilidad de los datos


intermedios.
B) Desviación Media
• La desviación media es la media aritmética de los
valores absolutos de las desviaciones respecto a la
media.
• La desviación media se representa por DM

Datos Simples Datos Agrupados

𝒙−𝒙 𝒙 − 𝒙 .𝒇
𝑫𝑴 = 𝑫𝑴 =
𝒏 𝒏
C) Varianza

• La varianza es la media del cuadrado de las desviaciones


de los datos con respecto al promedio.
• Esta medida tiene las unidades de los datos pero elevadas
al cuadrado lo que dificulta su interpretación.

Datos Agrupados Datos Simples


𝒙𝟐 . 𝒇 𝒙−𝒙 𝟐
𝑺𝟐 = − 𝒙𝟐 𝑺𝟐 =
𝒏 𝒏
D) DESVIACIÓN TÍPICA

• La desviación típica es la raíz cuadrada de la varianza.


• Es decir, la raíz cuadrada de la media de los cuadrados de
las puntuaciones de desviación.
• La desviación típica se representa por S

𝑺= 𝑺𝟐
Ejemplo para Datos Simples:
Hallar la desviación media, la varianza y la
desviación típica de la siguiente serie de
datos: 12, 6, 7, 3, 15, 10, 18, 5 𝒙−𝒙
𝑫𝑴 =
𝒏

Calculamos la media:
12+6+7+3+15+10+18+5
𝑥= = 9,5
8
Y ahora la desviación media:
12 − 9,5 + 6 − 9,5 + 7 − 9,5 + 3 − 9,5 + 15 − 9,5 + 10 − 9,5 + 18 − 9,5 + 5 − 9,5
𝐷𝑀 =
8

𝐷𝑀 = 4,25
Varianza:
𝒙−𝒙 𝟐
𝑺𝟐 =
𝒏

(12 − 9,5)2 +(6 − 9,5)2 + ⋯ + (18 − 9,5)2 +(5 − 9,5)2


𝑆2 =
8

𝑆 2 = 23,75

Desviación Típica:

𝑺= 𝑺𝟐 𝑺= 𝟐𝟑, 𝟕𝟓

𝑺 = 𝟒, 𝟖𝟕
Coeficiente de variabilidad

• No tiene unidades de medida.


• Es una medida relativa de variabilidad y permite
realizar comparaciones entre conjuntos de
observaciones con distintas unidades o medias
diferentes.
• A veces se considera que un CV mayor a 50% indica
alta dispersión en los datos .

CV poblacional CV muestral
 S
CV  100% CV  100%
 x
c) MEDIDAS DE POSICIÓN
• En el caso de las medidas de posición sólo estudiaremos
para datos agrupados, pues tienen mayor significación que
los datos sueltos.
1. CUARTILES
• Los cuartiles son los tres valores de la variable que dividen
a un conjunto de datos ordenados en cuatro partes iguales.
• Q1, Q2 y Q3 determinan los valores correspondientes al
25%, al 50% y al 75% de los datos.

𝒌. 𝒏
− 𝒇𝒂𝒄𝒂𝒏𝒕
𝑸𝒌 = 𝑳𝒓𝒊 + 𝟒 .𝒄
𝒇
2. DECILES
• Los deciles son los nueve valores que dividen la
serie de datos en diez partes iguales.
• Los deciles dan los valores correspondientes al
10%, al 20%... y al 90% de los datos.

𝒌. 𝒏
− 𝒇𝒂𝒄𝒂𝒏𝒕
𝑫𝒌 = 𝑳𝒓𝒊 + 𝟏𝟎 .𝒄
𝒇
3. PERCENTILES
• Los percentiles son los 99 valores que dividen la serie de
datos en 100 partes iguales.
• Los percentiles dan los valores correspondientes al 1%,
al 2%... y al 99% de los datos.

𝒌. 𝒏
− 𝒇𝒂𝒄𝒂𝒏𝒕
𝑷𝒌 = 𝑳𝒓𝒊 + 𝟏𝟎𝟎 .𝒄
𝒇
Ejemplo:
La tabla muestra la experiencia (en años) de las
enfermeras de un gran centro hospitalario

Experiencia Trabajadores
(años)
0-3 18
4-7 42
8 - 11 68
12 - 15 120
16 - 19 40
20 - 23 34
24 - 27 12
Total 334
¿Sobre qué edad se ubica el 25% de las
enfermeras de mayor experiencia?

75 % 25 %

P75
Menor Mayor
Experiencia Experiencia
K = 75

Kn 75(334)
Lugar del P7 5    250,5o (de los números ordenados)
100 100

Para saber en cuál clase se halla este


dato, se calculó la frecuencia acumulada.
Experiencia Nº Trabajadores Frec. Acumulada
(años) fi Fi
0-3 18 18
4-7 42 60 F=248
8 - 11 68 128
12 - 15 120 248 En esta clase
16 - 19 40 288 se localizan del
20 - 23 34 322 249º - 288º
24 - 27 12 334
334

 75(334) 248 1


 100  P  15.65 años
P  15.5 
75  40  4 75
 

Interpretación: Para que una enfermera esté


comprendida dentro del 25% de mayor
experiencia laboral debe tener al menos 15 años,
7 meses y 24 días.

También podría gustarte