Está en la página 1de 57

Unidad Académica de

Estudios Generales

Estadística Básica

Profesores: Equipo docente de Estadística


Unidad II
Semana 05

Medidas de tendencia central y posición


¿Cuánto es el consumo promedio de
agua en Lima Metropolitana?
La Superintendencia Nacional de Servicios de Saneamiento
(SUNASS) en febrero de 2017, publicó el consumo promedio
de agua es 130 litros por persona al día.

Según la Organización Mundial de la Salud (OMS), una


persona debe consumir al día alrededor de 100 litros de
agua para atender todas sus necesidades.

Los vecinos de San Isidro son los que más consumen agua,
una persona gasta en promedio 447 litros al día; en
Miraflores 395 litros y en La Molina 258 litros. Mientras que,
en Lurigancho-Chosica, son los que menos gastan, una
persona gasta, en promedio, 15 litros al día.

Tomado de
https://www.facebook.com/Sunass.Regulador
LOGRO DE LA SESIÓN

Al finalizar la sesión, el estudiante interpreta medidas de


tendencia central y posición calculados a partir de datos sin
agrupar y agrupados en problemas reales.
Sesión 5: Medidas de tendencia central y posición

1. Medidas descriptivas de tendencia central


• Media aritmética (promedio)
• Mediana
• Moda
2. Medidas descriptivas de posición
• Cuartiles
• Percentiles
MEDIDAS DE RESUMEN DESCRIPTIVAS
1. Medidas de Tendencia Central 3. Medidas de Dispersión
2. Medidas de Posición 4. Medidas de Forma

1 3

2 4
MEDIDAS DE TENDENCIA CENTRAL
5.1. MEDIDAS DE TENDENCIA CENTRAL

Valores calculados que describen el


centro de una distribución de
datos, las mas utilizadas son:

 Media aritmética
 Mediana
 Moda
Ejemplo 1:
Una persona que trabaja en forma independiente durante 6 meses generó los
siguientes ingresos de 200, 600, 500, 400, 260, 350. ¿Cuánto es el ingreso promedio?

Desarrollo:
200  600  400  500  260  350
X   385
6
Interpretación.- El ingreso promedio del trabajador independiente fue de
385 soles mensuales.
MEDIA ARITMÉTICA (PROMEDIO)

• Se calcula para variables medidas


en escala de intervalo o razón.
• Suma de todos los datos numéricos
y se divide entre el total de datos
de una muestra o población.

Media para datos sin agrupar Media para datos agrupados


k

x
n
xi
X   n
i fi
i 1
X  i 1

n
Ejemplo 2:
La siguiente tabla muestra la distribución de las edades de niños hospitalizados con
alguna intervención quirúrgica en el Hospital del niño.
Se pide calcular e interpretar la media de las edades.

9 12 9 12 9 10 10 11 11 10
9 12 12 9 9 11 10 10 11 10
9 11 10 10 9 10 10 10 10 10
12 12 10 9 9 11 10 10 10 10
12 12 10 9 9 10 11 10 10 10
10 10 11 12 12 10 11 11 10 11
12 10 11 12 12 10 10 11 11 11
11 10 11 12 12 10 10 11 10 11
Desarrollo:
Xi = edades fi Xi.fi
9 12 108
10 30 300
11 23 253
12 15 180
Total 80 841
Observa n=80 niños
Reemplazamos en la fórmula: La fórmula es:

108  300  253  180


X
80 Recuerda: X
 x .f i i

n
X  10.512

Interpretación.- La edad promedio de los niños hospitalizados con alguna intervención


quirúrgica es de 11 años aproximadamente.
Cálculo de un promedio para datos agrupados (tabulados):
Ejemplo 3:
La siguiente tabla de frecuencias muestra el gasto en compra de recetas médicas de
los pacientes que fueron atendidos en Dermatología. En promedio ¿Cuánto gastaron
en medicamentos?
Gasto en medicamentos Marca de clase
(soles) (Xi)
fi hi Xi.fi
[ 29.8 - 48.2 > 2 0.0571
[ 48.2 - 66.6 > 8 0.2286
[ 66.6 - 85.0 > 10 0.2857
[ 85.0 - 103.4 > 7 0.2000
[ 103.4 – 121.8 > 5 0.1429
[ 121.8 – 140.2> 3 0.0857
Total 35 1.0000

Recuerda: X 
 x .fi i

n
Desarrollo:
Gasto en medicamentos
Marca de clase (Xi) fi hi Xi.fi
(soles)
[ 29.8 - 48.2 > 39 2 0.057 78
[ 48.2 - 66.6 > 57.4 8 0.228 459.2
[ 66.6 - 85.0 > 75.8 10 0.286 758
[ 85.0 - 103.4 > 94.2 7 0.200 659.4
[ 103.4 – 121.8 > 112.6 5 0.143 563
[ 121.8 – 140.2> 131 3 0.086 393
Total 35 1.000 2911

Reemplazando:
X   x .f i i

2911
 83.16
n 35
Interpretación.- Los 35 pacientes de dermatología, en promedio gastaron la suma de 83.16 soles
en compra de sus medicamentos.
MEDIANA (Me)
Valor central que divide en 2 un conjunto de datos
ordenados con la misma cantidad de datos, donde el
50% de los datos son menores a dicho valor y el otro
50% serán mayores.
Se calcula para variables medida en escala ordinal, Altura
intervalo y razón. mediana

Si la variable Xi es cuantitativa, i= 1,2,3,…,n


- Si “n” es impar se tomará el valor central como
mediana.
- Si “n” es par, habrá dos términos centrales y la
mediana será la semisuma de dichos valores.
Ejemplo 4
Se ha registrado la talla de 5 alumnos: 1.60, 1.50, 1.55, 1.80, 1.65. Calcular e
interpretar la estatura mediana.

Desarrollo:
El tamaño de muestra: n = 5, es un número impar

Primer paso: Ordenar los datos de menor a mayor


1° 2° 3° 4° 5°
1.50 1.55 1.60 1.65 1.80
Segundo paso: Ubicar el dato de posición central:
Posición de la mediana = (n+1)/2
Posición: (5+1)/2 = 3°
Tercer paso: Me = 1.60
50%
50%

Estatura mediana
es 1.60

Interpretación.- El 50% de 5 alumnos tienen una talla máxima de 1.60 cm, y


el otro 50% tienen una talla mayor a 1.60 cm.
Ejemplo 5
Las edades de 6 alumnos ingresantes a la escuela de Farmacia en una universidad son: 20, 21,
25, 20, 18, 27.
Calcula e interpreta la mediana de las edades
Desarrollo:
El tamaño de muestra: n = 6, es un número par
1º Ordenar los datos de menor a mayor
1° 2° 3° 4° 5° 6°
18 20 20 21 23 25
50% Me 50%
2º Posición del valor mediano está entre la posición 3° y 4°
3º Calcular la mediana:
Me = (20+21)/2 = 20.5

Interpretación.- El 50% de 6 alumnos tienen una edad menor a 20.5 años y el otro 50% restante
tiene más de 20.5 años.
Mediana para datos agrupados es:
 n 
 F 
i 1
Me  LI  C  2 
 f 
 Me 
 

Donde:
LI : Límite inferior de la posición de la clase mediana
C : Amplitud de clase mediana
Fi-1: Frecuencia absoluta acumulada anterior a la clase mediana
fMe: Frecuencia absoluta simple de la posición de la clase mediana
n : Tamaño de la muestra
Ejemplo 6:
De la muestra seleccionada se registró las edades de jubilados que recibieron atención de salud en
un policlínico del seguro, cuyos datos están en la siguiente tabla de distribución de frecuencias:

Edades de jubilados Xi fi Fi
[ 60 – 63 > 2
[ 63 – 66 > 6
[ 66 – 69 > 4
[ 69 – 72 > 6
[ 72 – 75 ] 2
Total

¿Cuál es la edad máxima del 50% de jubilados atendidos en el policlínico?


Desarrollo:
Edades de Xi fi Fi
jubilados
De 20 datos, la mitad es 10 y
[60 - 63> 61.5 2 2
corresponde al intervalo
[63 - 66> 64.5 6 8
[66;69> que seria la clase
[66 - 69> 67.5 4 12
mediana.
[69 - 72> 70.5 6 18
[72 - 75> 73.5 2 20
Total 20

Formula:  n
 F
i 1


Me  LI  C  2 
 f 
 Me 
 

Reemplazamos
 20
8 Interpretación:
Me  66  3

2


 4  El 50% de jubilados tiene una edad máxima
Me  67.5 de 67 años.
MODA (Mo)
Es el dato que más veces se repite en una muestra o
población.
Se calcula para variables medidas en escala nominal,
ordinal, intervalo o razón.

• Si no se repite ningún valor la moda no existe. No hay Moda


8

• Cuando se repite un solo valor existe una sola


6
6
4 4
4
2 2
2

moda, es una distribución UNIMODAL. 0


1 2 3 4 5

• Cuando se repiten dos valores, hay dos modas 6

4
5

3
5
4

y la distribución es BIMODAL. 2

0
1 2 3 4 5

• Cuando se repite más de dos valores presenta 6 5 5 5

varias modas, la distribución es 4

2
2
3

MULTIMODAL. 0
1 2 3 4 5
Moda para datos no agrupados:
Ejemplo 7: En cada uno de los casos calcule e interprete la moda:

1. Se ha registrado el peso de conservas en gramos del lote producido en una semana


para hacer un control de calidad respecto a la exactitud de su peso en la etiqueta.
200.3, 199.8, 201.1, 199.3, 200.1, 199.7, 198.9

2. Edades de gestantes adolescentes en una comunidad.


14, 15, 16,15,16, 13, 15, 17

3. Se registró diariamente el número de nacimientos en un hospital durante 15 días:


4, 8, 7, 6, 7, 8, 9, 8, 8, 7, 8, 7, 6, 7, 3

4. La bebida gaseosa preferida de 10 estudiantes universitarios son:


Coca cola, Inka kola, Coca cola, Guaraná, Coca cola, Inka kola, Coca cola, Sprite, Inka
kola, Coca cola
Moda para datos agrupados:
Si los datos son cuantitativos continuos y están agrupados en intervalos de clase, el
intervalo que contiene a la moda es aquella que tiene la mayor frecuencia absoluta
(se llama clase modal o intervalo modal).
La fórmula para calcular la moda estará dado por:

 d1  d1 = fmo -fi-1
Mo  LI  C  
 d1  d 2  d2= fmo -fi+1

donde: LI : límite inferior del intervalo modal


C : amplitud del intervalo
fmo : frecuencia absoluta del intervalo modal
fi-1 : frecuencia absoluta del intervalo anterior a la fmo
fi+1 : frecuencia absoluta del intervalo siguiente a la fmo
Moda para datos agrupados:
Ejemplo 8:
La siguiente tabla de frecuencias muestra el gasto en compra de recetas médicas de
los pacientes que fueron atendidos en Dermatología. ¿Cuánto es el gasto frecuente
en compra de sus medicamentos?

Gasto en medicamentos Marca de clase (Xi) fi


[ 29.8 - 48.2 > 39 2
[ 48.2 - 66.6 > 57.4 8
[ 66.6 - 85.0 > 75.8 10
[ 85.0 - 103.4 > 94.2 7
[ 103.4 – 121.8 > 112.6 5
[ 121.8 – 140.2> 131 3
Total 35
Desarrollo:

Gasto en medicamentos fi La mayor frecuencia está en el


[ 29.8 - 48.2 > 2 tercer intervalo [66.6;85.0> , para
[ 48.2 - 66.6 > 8 f3 = 10 y es la frecuencia modal.
[ 66.6 - 85.0 > 10 Reemplazar en la fórmula:
[ 85.0 - 103.4 > 7  d1 
Mo  LI  C  
 d1  d 2 
[ 103.4 – 121.8 > 5
[ 121.8 – 140.2> 3
Total 35  2 
Mo  66.6  18.4 
 2  3 
Mo  73.96
Interpretación:
Con frecuencia los pacientes de dermatología gastan en medicamentos la suma
de 73.96 soles.
LA UBICACIÓN DE LAS MEDIDAS DE TENDENCIA CENTRAL DETERMINAN
LA FORMA DE DISTRIBUCIÓN
Procesamiento de medidas de tendencia central con SPSS
1. Analizar / Estadísticos descriptivos / Frecuencias
1 2. Selecciona la variable y traslada a la casilla:
3. Click el botón ESTADÍSTICOS: Media, mediana, moda
4. Continuar y aceptar

2
Ingresos

4
De la base de datos Credisa Philco. Se ha procesado la variable ingreso semanal

7. Interpretación
6. Resultados
Interpretación de Promedio:
El ingreso promedio de los empleados es de
315.10 soles semanales.

Interpretación de la mediana:
El 50% de los empleados tienen ingresos inferiores
a 270,5 soles semanales.

Interpretación de la moda:
El ingreso más frecuente de los empleados es de
252 soles semanales.
ACTIVIDAD 1

Del archivo ejemplos


sesión 5 resolver el
ejercicio 1.
Ejercicio 1:
Del Centro Nacional de Epidemiología del MINSA, se obtuvo el número de muertes maternas directa e
indirecta ocurridas hasta los 42 días de culminada la gestación. Estas muertes maternas corresponde
a cada departamento del Perú en el año 2020. Calcular e interpretar el promedio, mediana y moda.

59 22 17 12 8
40 21 17 11 6
25 21 17 10 5
25 21 13 9 3
23 20 13 9 3
MEDIDAS DE TENDENCIA NO CENTRAL (POSICIÓN)
5.2. MEDIDAS DE TENDENCIA NO CENTRAL (POSICIÓN)
Las medidas de posición son valores que
determinan la posición de un dato respecto a
todos los demás datos previamente ordenados,
se conoce también como cuantiles. Algunos de
estos son:
• Los cuartiles son 3 valores y dividen a la
muestra en 4 partes iguales.
• Los deciles son 9 valores y dividen a la muestra
en 10 partes iguales
• Los percentiles son 99 valores que dividen en
100 partes iguales.
Cuartiles (Qk)
Son 3 valores calculados que dividen a la muestra en cuatro partes
iguales y se denotan por Qk , k = 1, 2, 3.

Donde:

Q1 : Primer Cuartil
Q2 : Segundo Cuartil
Q3 : Tercer Cuartil
Cuartiles con datos sin agrupar
Ejemplo 1:
Se ha recopilado los gastos de mano de obra (en miles de soles) de 7
fábricas durante el último mes, cuyos datos son:

14 15 16 18 7 8 15

Calcular e interpretar:
a. El cuartil uno ( Q1 )
b. El cuartil tres ( Q3 )
Cálculo del Cuartil Uno (Q1 )
Los datos son: 14 15 16 18 7 8 15
Procedimiento
Primero : Ordenamos los datos en forma ascendente
1º 2º 3º 4º 5º 6º 7º
7 8 14 15 15 16 18

Segundo : Determinamos la posición de Q1:


Tercero : Como la posición de Q1 es 2°, tomamos la segunda observación ordenada

Entonces Q1 = 8
Interpretación.- El 25% de las fábricas tuvieron un gasto máximo de 8 000 soles
en mano de obra en el último mes.
Cálculo del Cuartil Tres (Q3 )

Los datos son: 14 15 16 18 7 8 15


Primero : Ordenamos los datos en forma ascendente
1º 2º 3º 4º 5º 6º 7º
7 8 14 15 15 16 18

Segundo : Determinamos la posición de Q3

Tercero : Como la posición de Q3 es 6°, tomamos la 6º observación ordenada


Entonces Q3 = 16

Interpretación.- El 75% de las fábricas tuvieron un gasto máximo de 16 000


soles en mano de obra en el último mes.
EJEMPLO 2:
Se tiene los sueldos diarios de cada trabajador de diferentes ocupaciones

S/.30 S/. 22 S/. 22 S/. 25 S/. 20

¿Cuánto gana como máximo el 25% de los trabajadores por día?


Se debe calcular el cuartil uno (Q1 ) con los datos:
30 22 22 25 20
Primero : Ordenamos los datos de menor a mayor
1º 2º 3º 4º 5º
20 22 22 25 30

Segundo : Determinamos la posición de Q1 , cuyo valor es:

Esto significa que el valor de Q1 es el primer dato (1°) más 50% de la diferencia
entre los valores de las observaciones 2º y 1º posición.
Entonces: Q1 = 20 +0.5 ( 22 – 20) = 21

Interpretación.- El 25% de los trabajadores ganan como máximo 21 soles diarios.


Cuartiles de datos agrupados
Los cuartiles para datos agrupados se calcula usando la siguiente formula:

 n 
 K ( )  Fi 1 
 LI  C  4
Qk
f 
 Q K 
 

Donde:
LI : Limite inferior de la clase que contiene al k-ésimo cuartil
c : Amplitud interválica de la clase que contiene al k-ésimo cuartil
Fi-1 : Frecuencia absoluta acumulada del intervalo inmediatamente anterior a la
clase que contiene al k-ésimo cuartil
fQK : Frecuencia absoluta simple de la clase que contiene al k-ésimo cuartil
Ejemplo 3:
Se ha registrado la estatura de 100 personas del sexo masculino que participaron
en una maratón de 10k, cuyos datos se muestran en la tabla de frecuencias
agrupada.

Estatura fi hi Fi
150 - 155 5 0.5 5
156 - 162 9 0.9 14
163 - 169 22 0.22 36
170 - 176 32 0.32 68
177 - 183 15 0.15 83
184 - 190 13 0.13 96
191 - 196 4 0.4 100
Total 100 1.0
¿Entre qué estaturas se encuentra el 50% de maratonistas con una estatura
estándar?
Desarrollo
•Se debe calcular el quartil1 y cuartil 3 (percentil 25 y percentil 75)
•Primero se calculará el Q1
1.- Calculando la posición del Q1: k(n/4) = 1(100/4)= 25
2.- Ubicar la posición 25 en la columna de frecuencias absolutas acumuladas, Fi = 36
3.- Para reemplazar en la fórmula se necesita: C = 6, LI= 163, fQk = 22

Reemplazando para Q1:

Para Q3

Interpretación.- El 50% de maratonistas con estatura estándar


tienen miden más de 166 cm y menos de 179 cm.
PERCENTILES (Pk)
Son 99 valores ordenados que dividen a la muestra en cien partes iguales y se
denotan por Pk , k = 1, 2,….99.

Primer Percentil ( P1)


Es un valor que estudia el 1% de las observaciones
Segundo Percentil ( P2)
Es un valor que estudia el 2% de las observaciones
Tercer Percentil ( P3)
Es un valor que estudia el 3% de las observaciones
.
.
Noventa y nueve ( P99)
Es un valor que estudia el 99% de las observaciones
Ejemplo 4:

Se ha recopilado las notas de 11 estudiantes los cuales son:


13 15 16 18 7 8 15 10 5 15 7
Calcular e interpretar el Percentil setenta ( P70 )
Desarrollo

Los datos son: 13 15 16 18 7 8 15 10 5 15 7

Primero : Ordenamos los datos en forma ascendente

1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º
5 7 7 8 10 13 15 15 15 16 18

Segundo : Determinamos la posición de P70 , se usa el valor

Esto significa que el valor de P70 es el octavo dato más 40% de la diferencia entre los valores
de las observaciones 9º y 8º .
Entonces: P70 = 15 + 0.4 ( 15 – 15) = 15

Interpretación.- El 70% de estudiantes tienen como nota máxima 15.


Percentiles de datos Agrupados
Los Percentiles se calculan utilizando la siguiente formula:
 n 
 k ( )  Fi 1 
 LI  C  100
Pk
f  k = 1, 2, …99
 Pk 
 

Donde:
LI : Limite inferior de la clase percentil
C : Amplitud de la clase percentil
Fi-1 : Frecuencia absoluta acumulada del intervalo anterior a la clase percentil
fPk : Frecuencia absoluta simple de la clase percentil
Ejemplo 5
Con los datos del ejemplo 3 ¿Cuál es la estatura mínima del 30% de
maratonistas con mayor estatura?

Se debe calcular el percentil 70


Interpretación
P70: El percentil de orden 70 deja por debajo al 70% de las observaciones y por
encima el 30%.
Desarrollo
1.- Calculando la posición del P70: k(n/100) = 70(100/100)= 70
2.- Ubicar la posición 70 en la columna de frecuencias absolutas acumuladas, Fi = 83
3.- Para reemplazar en la fórmula se necesita: C = 6, LI= 177, fPk = 15

Estatura fi hi Fi
150 - 155 5 0.5 5
156 - 162 9 0.9 14
163 - 169 22 0.22 36
170 - 176 32 0.32 68
177 - 183 15 0.15 83
184 - 190 13 0.13 96
191 - 196 4 0.4 100
Total 100 1.0
Reemplazando en la fórmula de percentiles tenemos:

Interpretación
El 30% de maratonistas con mayor estatura miden más de 177.8 cm.
Procesamiento de medidas de posición con SPSS
1. Analizar / Estadísticos descriptivos / Frecuencias
2. Selecciona variable y traslada a la casilla:
1 3. Click el botón ESTADÍSTICOS
4. Percentiles/ colocar el percentil: 20 / añadir
5. Continuar y aceptar

2 3 20

Ingresos

5
De la base de datos Credisa Philco. Se ha procesado la variable ingreso semanal

6. Resultados 7. Interpretación

Interpretación percentil 20:


El 20% de los empleados tienen ingresos inferiores
a 171,40 soles semanales.

Cuartiles Interpretación del cuartil 1:


El 25% de los empleados tienen ingresos inferiores
a 179,75 soles semanales.
Ejercicio 2:

Se investiga el rendimiento de los estudiantes de odontología en la asignatura de


matemática Básica y se ha seleccionado una muestra aleatoria de 30 estudiantes
cuyas notas finales son:
13 15 10 14 18 12 11 13 16 12
17 14 16 10 9 15 16 14 17 11
15 16 18 7 8 15 10 5 15 7

a. Calcular e interpretar el Percentil 15


b. ¿Cuál es la nota mínima y nota máxima para el 50% central?
c. Se quiere exonerar de la práctica 4 al 20% de estudiantes con mejores notas.
¿Cuánto es la nota mínima para ser exonerado?
d. ¿Cuánto es la nota máxima del 10% de la notas mas bajas?
TRABAJO EN SALA

Resolver en equipos
colaborativos el ejercicio 3 y 4
de la semana 5.
CONCLUSIONES
1. La media a o promedio se calcula para datos numéricos.

2. Una distribución de datos es simétrica cuando la media,


mediana y moda similares.

3. La moda se calcula para datos numéricos y categóricos.

4. Los cuartiles y deciles se pueden calcular como percentiles.


REFERENCIAS BIBLIOGRÁFICAS

1. Córdova M. (2003). Estadística Descriptiva e Inferencial.


Aplicaciones. 5ª ed. Lima: Moshera.

2. Nel, L. (2012). Estadística con SPSS 20. 1ª ed. Lima: Macro.

3. Daniel W. (2002). Bioestadística. Base para el Análisis de las


Ciencias de la Salud. México: Editorial Limusa S.A.

También podría gustarte