Está en la página 1de 41

Estadı́stica Aplicada a la Ingenierı́a

Semana 2: Medidas de tendencia central

Vladimiro Contreras Tito

Universidad Nacional del Callao


Facultad de Ingenierı́a Mecánica y de Energı́a
Departamento Académico Ingenierı́a Mecánica

Abril del 2023

V. Contreras T. (UNAC) 1 / 41 2023 1 / 41


Medidas de tendencia central

Medidas de tendencia central

Son estadı́grafos de posición que son interpretados como valores que


permiten resumir a un conjunto de datos dispersos, podrı́a asumirse que
estas medidas equivalen a un centro de gravedad que adoptan un valor
representativo para todo un conjunto de datos predeterminados. Estas
medidas son:
1. Promedio Aritmético (Media o simplemente promedio)
2. Mediana
3. Moda
4. Promedio Geométrico
5. Promedio Ponderado
6. Promedio Total
7. Media Armónica
Otras medidas de posición son: Cuartiles, Deciles y Percentiles

V. Contreras T. (UNAC) 2 / 41 2023 2 / 41


Medidas de tendencia central

La media aritmética

Para datos no agrupados


El promedio aritmético de un conjunto de valores x1 , x2 , ..., xn es:
Pn
xi
X = i=1
n
Para datos . agrupados
Pn
i=1 fi Xi
X=
n
donde
fi : frecuencia de la clase k-ésima.
Xi : Marca de clase en el k-ésimo intervalo.

V. Contreras T. (UNAC) 3 / 41 2023 3 / 41


Medidas de tendencia central

Ejemplo 1.1.
Durante los últimos 32 dı́as el valor de las compras en periódicos fue:
5.2 10.2 7.0 7.1 10.2 8.3 9.4 9.2 6.5 7.1 6.6
7.8 6.8 7.1 8.4 9.6 8.5 5.7 6.4 10.1 8.2 9.0
7.8 8.2 5.3 6.2 9.1 8.6 7.0 7.7 8.3 7.5
Halle el gasto promedio en periódicos.

Solución

V. Contreras T. (UNAC) 4 / 41 2023 4 / 41


Medidas de tendencia central

Ventajas e Inconvenientes de la Media Aritmética


Como ventajas de utilizar la media aritmética como un promedio para
sintetizar los valores de la variable podemos citar las siguientes:
- Considera todos los valores de la distribución.
- Es siempre calculable (en variable cuantitativa).
- Es única.
Como inconvenientes de la utilización de la media aritmética cabe
citar que, a veces, puede dar lugar a conclusiones erróneas, cuando la
variable presenta valores muy extremos, que influyen mucho en la
media, haciéndola poco representativa.

V. Contreras T. (UNAC) 5 / 41 2023 5 / 41


Medidas de tendencia central

La Mediana
Es el valor que ocupa la posición central de un conjunto de observaciones
ordenadas. El 50% de las observaciones son mayores que este valor y el
otro 50% son menores.

Donde:
Li = Lı́mite Inferior del intervalo que contiene a la Mediana
Fi−1 = Frecuencia Acumulada en la clase anterior i-ésima
V. Contreras T. (UNAC) 6 / 41 2023 6 / 41
Medidas de tendencia central

fi = Frecuencia en la clase que contiene a la mediana


Hi−1 = Frecuencia Relativa Acumulada en la clase anterior i-ésima
hi = Frecuencia Relativa en la clase que contiene a la mediana
c =Tamaño del intervalo de clase.
i= El menor intervalo i tal que se cumpla Fi ≥ n/2
Ventajas e inconvenientes
Como ventajas de la mediana podemos citar que no está influida por
los valores extremos como en el caso de la media, y además tiene
sentido en casos de distribuciones en escala ordinal (datos que pueden
ser ordenados), siendo la medida más representativa de estos por
describir la tendencia central de los mismos.
Como inconvenientes puede ser la determinación de ésta en los casos
de variables agrupadas en intervalos.

V. Contreras T. (UNAC) 7 / 41 2023 7 / 41


Medidas de tendencia central

V. Contreras T. (UNAC) 8 / 41 2023 8 / 41


Medidas de tendencia central

La Moda
Es el valor, clase o categorı́a que ocurre con mayor frecuencia y sus carac-
terı́sticas son:
- Puede no existir o existir más de una moda
- Su valor no se ve afectado por los valores extremos en los datos
- Se utiliza para analizar tanto la información cualitativa como la cuantitativa
- Es una medida “inestable” cuando en número de datos es reducido.

V. Contreras T. (UNAC) 9 / 41 2023 9 / 41


Medidas de tendencia central

V. Contreras T. (UNAC) 10 / 41 2023 10 / 41


Medidas de tendencia central

Media geométrica

Corresponde al valor representativo central de observaciones secuenciales


y estrechamente relacionadas entre sı́ tales como tasas de: interés, in-
flación, devaluación, variación, crecimiento, disminución. El promedio
geométrico de los valores: (Xi , X2 ....Xf ) es:
s
p Xf
XG = t F C1 F C2 ... F Ct , XG = t
Xi

donde
Xi =Valor inicial
Xf = Valor final

V. Contreras T. (UNAC) 11 / 41 2023 11 / 41


Medidas de tendencia central

V. Contreras T. (UNAC) 12 / 41 2023 12 / 41


Medidas de tendencia central

Promedio Ponderado

V. Contreras T. (UNAC) 13 / 41 2023 13 / 41


Medidas de tendencia central

Promedio Total

V. Contreras T. (UNAC) 14 / 41 2023 14 / 41


Medidas de tendencia central

Media armónica

V. Contreras T. (UNAC) 15 / 41 2023 15 / 41


Medidas de tendencia central

Percentiles cuartiles y deciles

V. Contreras T. (UNAC) 16 / 41 2023 16 / 41


Medidas de tendencia central

V. Contreras T. (UNAC) 17 / 41 2023 17 / 41


Medidas de tendencia central

V. Contreras T. (UNAC) 18 / 41 2023 18 / 41


Medidas de tendencia central

V. Contreras T. (UNAC) 19 / 41 2023 19 / 41


Medidas de tendencia central

V. Contreras T. (UNAC) 20 / 41 2023 20 / 41


Medidas de tendencia central

Medidas de Variabilidad

V. Contreras T. (UNAC) 21 / 41 2023 21 / 41


Medidas de tendencia central

V. Contreras T. (UNAC) 22 / 41 2023 22 / 41


Medidas de tendencia central

V. Contreras T. (UNAC) 23 / 41 2023 23 / 41


Medidas de tendencia central

Medidas de forma: Asimetrı́a o sesgo

V. Contreras T. (UNAC) 24 / 41 2023 24 / 41


Medidas de tendencia central

Medidas de forma: Curtosis

V. Contreras T. (UNAC) 25 / 41 2023 25 / 41


Medidas de tendencia central

Gráfico de Cajas

El diagrama de caja se construye de la siguiente manera:


Dibujar la caja que empieza en el primer cuartil y termina en el
tercer cuartil.
Dibujar la mediana con una lı́nea dentro de la caja
Localizar los dos valores adyacentes por medio de la escala a lo
largo del eje horizontal, y unamos a la caja con lı́neas horizontales
llamados Bigotes.
Cualquier valor atı́pico sospechoso se marca en el gráfico con un
circunferencia (◦) y está entre los bordes internos y externos los
valores atı́picos extremos se marcan con un (*) y están fuera del
borde externo

V. Contreras T. (UNAC) 26 / 41 2023 26 / 41


Medidas de tendencia central

NOTA 1.1.
Los valores adyacentes son las últimas observaciones en el
conjunto ordenado antes del borde interno.
Los bordes internos también son llamados limite inferior y
limite superior y están dadas por: Q1 − 1.5(IQR) y
Q3 + 1.5(IQR)
Los bordes externos están dadas por: Q1 − 3(IQR) y
Q3 + 3(IQR)
Si la distancia entre la mediana y los cuartiles es
aproximadamente la misma podemos deducir que la distribución de
los datos es más o menos simétrica como como se ve en el
histograma y en el diagrama de tallo y hoja.

V. Contreras T. (UNAC) 27 / 41 2023 27 / 41


Medidas de tendencia central

V. Contreras T. (UNAC) 28 / 41 2023 28 / 41


Medidas de tendencia central

Ejemplo 1.2.
Del ejemplo, valores de compras en periódicos en los últimos 32 dı́as
del Hotel AAA, fueron:
5.2 10.2 7.0 7.1 10.2 8.3 9.4 9.2 6.5 7.1 6.6
7.8 6.8 7.1 8.4 9.6 8.5 5.7 6.4 10.1 8.2 9.0 Halle la
7.8 8.2 5.3 6.2 9.1 8.6 7.0 7.7 8.3 7.5
gráfica de cajas.

V. Contreras T. (UNAC) 29 / 41 2023 29 / 41


Medidas de tendencia central

V. Contreras T. (UNAC) 30 / 41 2023 30 / 41


Medidas de tendencia central

La mitad (50%) de los datos son menores a 7,8


La mitad (50%) de los datos toman valores entre 6,85 y 8,90
La cuarta parte (25%) de los datos son menores a 6,85 (antes del
primer cuartil)
La cuarta parte (25%) de los datos toman valores entre 6,85 y 7,80
La cuarta parte (25%) de los datos toman valores entre 7,80 y 8,90
La cuarta parte (25%) de los datos son mayores a 8,90 (después
del tercer cuartil)
Los datos tienen mayor variabilidad en 7,8 y 8,90
Los datos superiores a 11,98 y los datos inferiores a 3,78 se
denominan ATÍPICOS.

V. Contreras T. (UNAC) 31 / 41 2023 31 / 41


Medidas de tendencia central

Interpretación del diagrama de cajas y bigotes


El diagrama de cajas y bigotes muestra la distribución de los datos.

El diagrama de cajas tambien muestra la dispersióm de los datos. La


dispersion se puede medir por la longitud o rango del diagrama. Si el
rango es grande los datos están dispersos, caso contrario estan concen-
trados. La dispersión dentro de la caja se mide por el rango intercualtil.

Rango=Valor máximo-valormı́nimo
Rango Inter cuartil (IQR) = Q3 − Q1

V. Contreras T. (UNAC) 32 / 41 2023 32 / 41


Medidas de tendencia central

La posición de la mediana indica, si la distribución de los datos es simétrica o


asimétrica.
Distribución simétrica
La mediana está en el centro de la caja y los bigotes son iguales. Se cumple
que: Media=mediana=moda
Asimetria Positiva
La mediana está más cerca del primer cuartil Q1 .
( M edia > mediana > moda)
Asimetria Negativa
La mediana está más cerca del tercer cuartil Q3
( M edia < mediana < moda)

V. Contreras T. (UNAC) 33 / 41 2023 33 / 41


Medidas de tendencia central

Ejemplo 1.3.
Se mide el tiempo de espera en 3 restaurantes de comida rápidas como
muestran los diagrámas de cajas. Responda a las siguientes preguntas:

V. Contreras T. (UNAC) 34 / 41 2023 34 / 41


Medidas de tendencia central

V. Contreras T. (UNAC) 35 / 41 2023 35 / 41


Medidas de tendencia central

V. Contreras T. (UNAC) 36 / 41 2023 36 / 41


Medidas de tendencia central

V. Contreras T. (UNAC) 37 / 41 2023 37 / 41


Medidas de tendencia central

Ejemplo

V. Contreras T. (UNAC) 38 / 41 2023 38 / 41


Medidas de tendencia central

V. Contreras T. (UNAC) 39 / 41 2023 39 / 41


Medidas de tendencia central

Ejercicios

1. A continuación se muestran las millas por galón (mpg), para cada


uno de los 20 autos de tamaño medio seleccionados de una lı́nea de
producción durante el mes de marzo.
23.1 21.3 23.6 23.7
20.2 24.4 25.3 27.0
24.7 22.7 26.2 23.2
25.9 24.7 24.4 24.2
24.9 22.2 22.9 24.6
a. Calcule el coeficiente de variabilidad de los datos.
b. Calcule el grado de distorsión que adopta la distribución de datos
respecto a su valor promedio tomado como centro de gravedad.
c. Construya un diagrama de tallos y hojas para estos datos.
d. Construya una gráfica de caja para los datos y úsela para describir
la distribución de datos. ¿Hay algún resultado atı́pico?.

V. Contreras T. (UNAC) 40 / 41 2023 40 / 41


Medidas de tendencia central

2 Los estudiantes de Mecatrónica realizan un experimento: el


tiempo de respuesta en milisegundos de tres tipos diferentes de
circuitos de computadoras personales, del que obtuvieron los
siguientes resultados:
A 19 22 20 18 25 19 24 21 23
B 20 21 33 27 40 21 39 22 38
C 16 15 18 26 17 16 18 25 24
a. Halle la media, mediana y moda.
b. ¿Cuál de los tipos de circuitos tiene su media más representativa?
c. Halle el coeficiente de asimetrı́a para cada circuito.
d. Construya un diagrama de cajas para cada uno de los circuitos.

V. Contreras T. (UNAC) 41 / 41 2023 41 / 41

También podría gustarte