Está en la página 1de 10

Estadística I

Cuadernillo N°3

MEDIDAS DE
TENDENCIA
CENTRAL
Medidas de Tendencia Central

Ejercicio #16
MEDIDAS DE TENDENCIA CENTRAL Para el ejercicio #3, determine el rango intercuartílico y el rango interdecílico del
ingreso mensual de los trabajadores de la empresa.

En un trabajo estadístico, luego de recopilar y organizar la información, es necesario Rpta. RIQ  1144,231 soles; RID  1865,556 soles.

obtener algunos indicadores que resuman la información recopilada. Estos indicadores se


denominan medidas estadísticas. Características de los Percentiles

Las medidas estadísticas obtenidas con datos poblacionales se denominan parámetros, 1. Tienen la misma unidad de medida que las observaciones.

mientras que las medidas estadísticas que se obtienen con datos muestrales se 2. Su valor se encuentra dentro del rango de valores de la variable.

denominan estadísticos o estimadores. 3. No se ven afectados por los valores extremos de las observaciones.

Las medidas estadísticas más importantes las agruparemos de la siguiente manera: 4. A cada percentil, decil o cuartil le corresponde un único valor de observación.

* Medidas de Tendencia Central 5. Para cualquier distribución se tiene que: Me  P50  D5  Q2 .

* Medidas de Variabilidad 6. Solo es aplicable para datos cuantitativos.


* Medidas de Forma

1. MEDIA ARITMÉTICA (Promedio Aritmético) PROPIEDAD


Para un conjunto de datos cuantitativos, la media aritmética se determina como la Se ven afectados en la misma medida y proporción si se le suma y/o multiplica una
división entre la suma de todos los datos y el número total de datos sumados, es constante al conjunto de datos, esto es: Pp (y)  a  Pp (x)  b

decir:
Suma de todos los datos
Media Aritmética 
Número total de datos

Características de la media aritmética:


1. Es el valor más representativo de un conjunto de datos, debido a que es el
centro de gravedad o punto de equilibrio de dicho conjunto de datos.
2. Se ve afectada por los valores extremos. Es decir, los valores extremos influyen
en el valor de la media y por lo tanto pueden no reflejar una tendencia real del
grupo.
3. Es un indicador eficiente cuando no existen valores extremos que la afecten.
4. Sólo es aplicable a datos cuantitativos.
5. Tiene la misma unidad de medida que los datos.
6. Puede tomar cualquier valor real (positivo, negativo o cero).
7. Su valor se encuentre dentro del rango de valores de la variable.

-2- www.grupolamatriz.com www.grupolamatriz.com -19-


Medidas de Tendencia Central Medidas de Tendencia Central

Ejercicio #15 La media aritmética, según el peso o la importancia de cada dato dentro del conjunto de
Para el ejercicio #3, estime el P10, P40 y el P75 de la distribución del ingreso mensual datos, se puede clasificar como simple o ponderada.
de los trabajadores de la empresa.
Rpta. P10=850 soles; P40=1576,842 soles; P75=2369,231 soles. 1.1 MEDIA ARITMÉTICA SIMPLE
Se utiliza cuando todos los datos tienen la misma proporción, peso o importancia
DECIL dentro del conjunto de datos.
Los deciles son cuantiles agrupados cada 10%. Existen desde el decil 1 (D1 = P10)
hasta el decil 9 (D9 = P90). ¿Cómo se determina la media aritmética de un conjunto de datos?
Depende de la forma como estén agrupados los datos o si no lo están.

i. Si los datos NO están agrupados en tablas de frecuencia, la media aritmética


se determina de la siguiente manera:
N
1
Media Poblacional: 
N
 xi (N: tamaño de la población)
i 1

1 n
Media Muestral: x 
n

xi (n: tamaño de la muestra)
A la distancia entre el decil 1 y el decil 9 se le denomina Rango Interdecílico, y i 1

agrupa el 80% central de la distribución. RID = D9 – D1.

Ejercicio #1
CUARTIL Suponga que una empresa fabricante de condimentos realiza un muestreo en un lote
Los cuartiles son cuantiles agrupados cada 25%. Son tres cuartiles: Q1 = P25, Q2 de bolsas de pimienta molida para evaluar el peso en gramos del contenido. Los
= P50 = Me, Q3 = P75. pesos obtenidos se muestran en el cuadro:

20,3 20,4 20,5 21,0 21,4 21,8 21,9 22,1 22,2

22,5 22,6 22,6 22,6 22,7 22,8 22,9 22,9 23,2


25% 25% 25% 25%

Q1 Q2 Q3 23,3 23,3 23,4 23,5 23,8 24,3 24,5 24,5 24,6

Espacio Intercuartílico 24,6 25,2 25,3 25,6 25,7 26,1 26,2 26,3 27,4

A la distancia entre el cuartil 1 y el cuartil 3 se le denomina Rango Intercuartílico, y


Determine el peso promedio del contenido de las bolsas de pimienta.
agrupa el 50% central de la distribución. RIQ = Q3 – Q1.
Rpta. 23,4 gramos.

Nota: La mediana es el percentil 50 de una distribución, esto es:


Me = P50 = D5 = Q2

-18- www.grupolamatriz.com www.grupolamatriz.com -3-


Medidas de Tendencia Central Medidas de Tendencia Central

ii. Si los datos corresponden a una variable discreta y están agrupados en Para datos cuantitativos discretos NO agrupados, pero ordenados de acuerdo
tablas de frecuencias, la media aritmética se determina de la siguiente manera: a su magnitud, un percentil se determina de la siguiente manera:
1° Halle la posición: k = (n+1).p
Siendo: n= número de datos.

1 k k p= Porcentaje acumulado del percentil.


Media Poblacional:  
N
 fi xi  
fri.xi (k: número de valores de la variable)
i 1 i 1 k= Posición del percentil.
2° Identifique los elementos mediante la siguiente expresión: K = e.d

1 k k Siendo: e= Parte entera de k


Media Muestral: x  f x   fri .xi (k: número de valores de la variable)
n i 1 i i i 1 d= Parte decimal de k
3° Calcule el percentil con la siguiente fórmula: Pp= Xe + 0.d [Xe+1 – Xe ]
Ejercicio #2 Siendo: Xe = el dato de posición “e”
Se supone que cada caja de cereales debe contener 200 pasas. Sin embargo, una
muestra de 60 cajas, mostró el siguiente número de pasas en cada caja. Ejercicio # 14
Es un estudio sobre los tiempos de espera en caja (en minutos), de los pacientes de
Numero de Numero de un hospital, se obtuvo los siguientes resultados para una muestra de 30 pacientes:
pasas cajas 7,8 8,4 8,6 8,8 9,2 9,3 9,3 9,5 9,6 9,8 9,8 10,0
195 3 10,1 10,1 10,3 10,4 10,4 10,6 10,7 11,2 11,2 11,4 11,5 11,7
196 4
11,9 12,0 12,1 12,3 12,5 13,2
197 4
Determine: P10; P25; P40; P75; P80, de la distribución de los tiempos de espera.
198 5
Interprete cada uno de ellos.
199 6
Rpta. P10=8,62min; P25=9,45min; P40=10,04min; P75=11,55min; P80=11,86min.
200 11
201 4
NOTA: Este procedimiento también se puede emplear para datos cuantitativos
202 6
discretos agrupados. En este caso es recomendable obtener las frecuencias
203 4
204 4
acumuladas Fi o Pi para encontrar la posición “e”.

205 4 Para datos cuantitativos continuos organizados en cuadros de frecuencia

206 5 (intervalos de clase), se utilizan las siguientes fórmulas:


np  Fk 1
i. Para frecuencias absolutas: Pp  LIk  TICk Pp porcentaje acumulado
fk
Determine el número promedio de pasas que podemos encontrar por caja.
Rpta. 201 pasas aproximadamente
p  Frk 1
ii. Para frecuencias relativas: Pp  LIk  TICk Pp porcentaje acumulado
frk

-4- www.grupolamatriz.com www.grupolamatriz.com -17-


Medidas de Tendencia Central Medidas de Tendencia Central

Donde el valor futuro es el valor del período que se quiere predecir o estimar y el iii. Si los datos corresponden a una variable continua y están agrupados en
valor actual puede ser el valor inicial del período (Xo) o el valor final del período tablas de frecuencias, la media aritmética se obtiene de la siguiente manera:
(XF).
k k
1
Ejercicio #13
Media Poblacional: 
N  Mi fi   Mi fri (Mi: marca de clase)
i 1 i 1

Suponga que una fábrica ha registrado los siguientes incrementos en su producción,


para el período 2008-2014. k k
1
Media Muestral: x 
n  mi fi   mi fri (mi: marca de clase)
i 1 i 1

Año 2009 2010 2011 2012 2013 2014


Variación (k = número de intervalos de clase)
12% -8% 6,4% 3,6% 10% 1,2%
porcentual

Nota: En este caso la media tiene un valor aproximado debido al uso de las marcas
Basados en esta información, estime la producción en abril del año 2016, si se sabe de clase. Como sabemos las marcas de clase no necesariamente son iguales al
que la producción del año 2014 fue aproximadamente 10,8 TM. promedio de las observaciones.
Rpta. 0,948 TM.
Ejercicio #3
6. OTRAS MEDIDAS DE TENDENCIA En un estudio acerca de los ingresos mensuales (en soles) de los 420 trabajadores
CUANTILES de una empresa, se obtuvo los siguientes resultados:
Son valores de la variable que dividen a una distribución de datos, en dos partes.
Los cuantiles también se usan cuando la distribución se divide en varios grupos; así INGRESOS MENSUALES NÚMERO DE
por ejemplo tenemos los percentiles, los deciles, los cuartiles, los quintiles, etc. (soles) TRABAJADORES

De 500 a menos de 1000 60


PERCENTIL De 1000 a menos de 1400 80
El percentil de orden p (Pp), es el valor de la variable que divide a la distribución
De 1400 a menos de 2000 95
en dos partes, de modo que el p% de la distribución se encuentre antes del
De 2000 a menos de 2600 130
percentil p y el resto, el otro (100-p)% de la distribución se encuentre después
De 2600 a menos de 3000 45
del percentil p.
De 3000 a más. 10

Estime el ingreso promedio mensual por trabajador.


p% (100 – p)%
Rpta. 1808,33 soles.
x min Pp xmáx

-16- www.grupolamatriz.com www.grupolamatriz.com -5-


Medidas de Tendencia Central Medidas de Tendencia Central

PROPIEDADES DE LA MEDIA ARITMÉTICA Ejercicio #11


1. Si se sustituye el valor de cada observación por el valor de su media aritmética, Suponga que las utilidades anuales de una empresa en miles de millones de dólares
la suma total de los datos no varía. están dadas por:

Año 2001 2002 2003 2004 2005 2006


2. La suma de las desviaciones de las observaciones con respecto a su media
Utilidades 100 120 150 75 90 120
aritmética, es cero:

Determine la tasa de crecimiento promedio anual de dicha empresa. Interprete.


n N
 (x i  x )  0 ,  (x i  )  0 Rpta. 3,71%
i 1 i 1

Cambio de tasa de crecimiento:


3. La suma de los cuadrados de las desviaciones de las observaciones con
Para cambiar de tasa de crecimiento entre períodos de evaluación, debemos tener en
respecto a la media aritmética es menor o igual que la suma de los cuadrados
cuenta que:
de las desviaciones de las observaciones con respecto a cualquier otro valor
1  t a  (1  t m )12 (m: mensual); 1  t a  (1  t b )6 (b: bimestral)
constante.
1  t a  (1  t T )4 (T: trimestral); 1  t a  (1  t s )2 (s: semestral)

n 2 n 2
1  t Q  (1  t a ) 5 (Q: quinquenal); 1  t B  (1  t a ) 2 (B: bienal)
 (x i  x)   (xi  r) rR
i 1 i 1

Ejercicio #12
N N
2 2
 (xi  μ)   (xi  r) rR Las utilidades anuales (unidades monetarias) generadas por un paquete de acciones
i 1 i 1
de la compañía DDK durante los últimos años han sido los siguientes:

Esto también significa que la suma de los cuadrados de las desviaciones de las
2000 2001 2002 2003 2004 2005 2006 2007 2008
observaciones con respecto a la media aritmética es mínima.
5 9 8 12 18 16 14 21 20

4. Si se tienen varias muestras, la media aritmética del total de datos está dada
Determine la tasa trimestral de crecimiento de las utilidades durante dicho período.
por:
Interpretar el valor hallado.
k
 ni x i Rpta. 4,43%
n1 x 1  n 2 x 2  n 3 x 3  ......  n k x k
x  i 1
n1  n 2  n 3  .......  n k k
Nota: La siguiente expresión nos permite estimar o proyectar un valor futuro en
 ni
i 1
base al comportamiento promedio de los datos en determinado período:

Esta propiedad se aplica de igual manera cuando se promedian los datos de


X futuro  X actual (1  tasa del periodo ) número de períodos
varias poblaciones.

-6- www.grupolamatriz.com www.grupolamatriz.com -15-


Medidas de Tendencia Central Medidas de Tendencia Central

4. MEDIA GEOMÉTRICA 5. Si a todas las observaciones de un conjunto de datos se les suma y/o multiplica
Se utiliza para la elaboración de números índices y para la obtención de tasas de una cantidad constante, la media del nuevo conjunto de datos es igual a la
crecimiento promedio. media anterior sumada y/o multiplicada por dicha cantidad constante, es decir:
La media geométrica de un conjunto de “n” datos positivos se determina de la
siguiente manera: Yi  Xi  k Yi  Xi * k Yi  aX i  b

MG  n a1 . a2 . a3 ........ an Muestra Yi  Xi  k Yi  Xi * k Y i  aXi  b

Población  yi   xi  k  yi   xi * k  yi  a xi  b

Uso de la media geométrica


Para un conjunto de datos de los cuales se quiere conocer su crecimiento por
6. Si X, Y y W son variables tales que W = aX  bY, se cumple:  W  a X  b Y
períodos y además su crecimiento promedio, primero se determina el índice de
crecimiento por período.
El índice de crecimiento por período ij se obtiene dividiendo el valor actual de la
1.2. MEDIA PONDERADA
observación entre el valor de la observación del período anterior:
xj
Se usa para determinar el promedio de las observaciones que tienen pesos o
ij  (índice del período)
x j 1 importancias diferentes, es decir se usa para promediar datos cuya frecuencia no es
la misma.

Luego, el índice promedio de crecimiento o razón promedio de crecimiento Estos pesos Wi pueden ser números enteros, decimales, fracciones, porcentajes, etc.

geométrico está dado por: Sea un conjunto de observaciones Xi con sus respectivos pesos Wi, la media
ponderada de los datos Xi está dada por:

iprom .  MG (i)  k i1 . i 2 . i 3 ...........ik (k = número de índices)


k
 w ix i
w 1 x 1  w 2 x 2  .......... .  w k x k
xp  i 1 
k w 1  w 2  .......... ...  w k
x1 x2 x3 xk xk X Final  wi
Además, dado que: MG  k . . .........  MG(i)  k  k
i 1
x0 x1 x2 x k 1 xo X Inicial

Nota: La media ponderada es un caso particular de la media aritmética, por tanto,


Siendo: X0 = dato del período inicial y Xk = dato del período final. se ve afectada por los valores extremos.

Dado que la MG de los índices, por ser una media, tiene la propiedad de representar
a cada uno de los índices, podemos afirmar que el crecimiento geométrico promedio
o variación promedio porcentual de los datos, se obtiene a partir de:

MG(i)  1  tasa de crecimiento promedio (%)

-14- www.grupolamatriz.com www.grupolamatriz.com -7-


Medidas de Tendencia Central Medidas de Tendencia Central

Ejercicio #4 Ejercicio #10


Suponga que las notas promedio de un alumno matriculado el ciclo anterior en los Para el ejercicio #3, estime el ingreso mensual más frecuente de los trabajadores de
siguientes cursos, son: la empresa.
Rpta. 2175 soles.
Curso Créditos Nota
Estadística I 3 14 Características de la Moda
C.C.P.P. 3 18 1. Un conjunto de datos puede no tener moda o puede tener más de una moda.
Conta II 4 12 Si tiene una sola moda se llama UNIMODAL, si tiene dos modas, se llama
Macro I 5 13 BIMODAL, si tiene más modas se llama MULTIMODAL.
2. Se puede observar tanto en datos cualitativos como en datos cuantitativos.

Determine el promedio ponderado del ciclo para dicho alumno. 3. La moda muestral es muy inestable (variable) y por lo tanto es poco confiable.

Rpta. 13,93 Para datos cuantitativos:


4. La moda no se ve afectada por los valores extremos de las observaciones.
5. Tiene la misma unidad de medida que las observaciones.

Ejercicio #5 6. Su valor se encuentre dentro del rango de valores de la variable.

Suponga las notas de un curso son:

PROPIEDAD DE LA MODA
Evaluación Notas Proporción
Cuando a un conjunto de datos cuantitativos se les suma y/o se les multiplica una
del curso por evaluación
cantidad constante el valor de su moda se ve afectado en la misma medida, es decir:
PC 18, 16, 08, 14 50%
si yi = axi + b  Mo(y) = aMo(x) + b
EP 12 20%
EF 10 30%

Determine la nota promedio del curso si el promedio de las PC es simple.


Rpta.: 12,4

Nota: Para todo conjunto de datos cuantitativos continuos agrupados en intervalos


de clase, las medidas estadísticas son solo valores aproximados del
verdadero valor, debido a que se ha perdido la identidad de los datos.

-8- www.grupolamatriz.com www.grupolamatriz.com -13-


Medidas de Tendencia Central Medidas de Tendencia Central

3. MODA 2. MEDIANA
Es el valor, dato, registro, observación, clase o categoría que aparece con mayor Es el valor de la variable que ocupa la posición central de un conjunto de datos que
frecuencia dentro de un conjunto de datos. han sido previamente ordenados de acuerdo a su magnitud.

Moda = dato u observación con mayor frecuencia


50% 50%
Nota: Esta definición es aplicable para cualquier tipo de datos, es decir, cualitativos o
xmin Me xmáx
cuantitativos. En todos los casos, basta con observar el dato con mayor frecuencia.
Sin embargo, para datos cuantitativos continuos agrupados en un cuadro de
Cálculo de la mediana: (me: muestra; Me: Población)
frecuencias, donde se ha perdido la identidad de los datos, el valor de la
mediana solo se aproximará, es decir, solo podremos tener un valor estimado de la
i. Para datos No Agrupados o para datos discretos agrupados en tablas de
mediana.
frecuencia:
Para datos cuantitativos continuos agrupados en tablas de frecuencia, la mediana
se estima con la siguiente fórmula:
* Si la cantidad de datos "n" es impar: me  X n  1
d1 2
mo  LIk  TICk
d1  d2
X n X n
[ ] [ 1]
me  2 2
* Si la cantidad de datos "n" es par:
2
Nota: La fórmula es la misma para Población y para Muestra. Sin embargo, para
Población usaremos el símbolo Mo y para Muestra usaremos mo.
Siendo: LIk = Límite inferior del intervalo donde se encuentra la moda. Ejercicio #6

TICk = Tamaño del intervalo de clase donde se encuentra la moda. Determine la edad promedio y la mediana de la edad en cada caso:

d1 = frecuencia máxima – frecuencia anterior


d2 = frecuencia máxima – frecuencia siguiente Datos Media Mediana
4, 5, 5, 6, 7, 7, 8, 10, 12, 12, 12, 13, 14

Ejercicio #9 10, 11, 11, 12, 13, 15, 16, 17, 17, 18, 18, 19, 20, 20

Determine la moda en cada uno de los siguientes casos. 8, 8, 9, 9, 9, 10, 11, 12, 12, 12, 13, 13, 14, 15, 17, 18

Datos Moda(s) 36, 38, 38, 39, 40, 41, 41, 42, 43, 43, 45, 46, 48, 50, 51

3, 5, 5, 6, 7, 7, 8, 10, 12, 12, 12, 13, 14, 15, 18


9, 11, 11, 11, 13, 15, 16, 17, 17, 18, 18, 19, 19, 20 Ejercicio #7

7, 8, 9, 9, 9, 10, 11, 12, 12, 12, 13, 13, 14, 15, 17, 17 Para los datos del ejercicio #2, determine el valor mediano del número de

35, 38, 38, 39, 40, 41, 41, 42, 43, 43, 45, 46, 48, 50, 51 pasas que contienen las cajas.

19, 20, 21, 22, 24, 25, 26, 27, 29, 30, 31, 33, 34, 35 Rpta. 200 pasas/caja

-12- www.grupolamatriz.com www.grupolamatriz.com -9-


Medidas de Tendencia Central Medidas de Tendencia Central

Nota: Para hallar la mediana de un conjunto de datos discretos o continuos Características de la Mediana
agrupados en tabla de frecuencias es conveniente encontrar alguna de
las frecuencias acumuladas para poder ubicar rápidamente donde se 1. Divide a un conjunto de datos en dos partes iguales; el 50% de datos con
encuentra la mitad de la información. valores superiores a la mediana y el otro 50% de datos con valores inferiores a
la mediana.
2. Tiene la misma unidad de medida que las observaciones.
ii. Para datos continuos agrupados en tablas de frecuencia:
3. Es influenciada por el número de observaciones y no por los valores de éstas;
es decir, no le afectan los valores extremos de las observaciones.
n / 2  Fk 1 0,5  Frk 1
me  LIk  TICk me  LIk  TICk 4. Es un indicador eficiente cuando existen valores extremos que afecten a la
fk frk
media aritmética.
5. Es el valor de equilibrio de la cantidad de observaciones.
Nota: La fórmula es la misma para Población y para Muestra. Sin embargo, para 6. Es aplicable solo para datos cuantitativos.
Población usaremos el símbolo Me y para Muestra usaremos me. 7. Su valor se encuentre dentro del rango de valores de la variable.

Siendo: LIk = Límite inferior del intervalo donde se encuentra la mediana.


Fk-1 = Frecuencia absoluta acumulada del intervalo anterior al de la mediana. PROPIEDADES DE LA MEDIANA
fk = frecuencia absoluta no acumulada del intervalo de la mediana. 1. La suma de las desviaciones absolutas (distancias) de las observaciones con
TICk = Tamaño del intervalo de clase donde se encuentra la mediana. respecto a la mediana es menor o igual a la suma de las desviaciones absolutas
(distancias) de las observaciones con respecto a cualquier otro valor real.
Nota: La mediana se encuentra en el intervalo donde se acumula la mitad de
los datos, puede ser en forma absoluta (Fi = n/2 ó N/2), relativa (Fri = 0,5) ó n n
 xi  me   xi  k , k  R
porcentual (Pi = 50%). i 1 i 1

Ejercicio #8 Esto significa que la suma de las desviaciones absolutas de las observaciones
Para el ejercicio #3, estime el ingreso mensual mediano de los trabajadores de con respecto a la mediana es mínima.
la empresa.
Rpta. 1842,11 soles. 2. Cuando a un conjunto de datos se le multiplica y/o se le suma una cantidad
constante su mediana se ve afectada en la misma medida, es decir:

Si Yi = a Xi + b  Me(Y) = a Me(X) + b

-10- www.grupolamatriz.com www.grupolamatriz.com -11-

También podría gustarte