Está en la página 1de 36

MEDIDAS DE DISPERSIÓN:

 Estudia la distribución, analizando si los datos se encuentran más o menos


concentrados o más o menos dispersos.
 Proporciona información extra que permite juzgar la confiabilidad de las medidas de
tendencia central, debido a que cuando los datos están muy dispersos, la posición
central es menos representativa de la serie de datos.
 La dispersión se puede medir desde tres enfoques: la distancia, la dispersión
promedio y la dispersión relativa.
INDICADORES DE DISPERSIÓN:

 En dos oficinas de un banco A y B, la distribución de los tiempos que tardan en


gestionar una hipoteca es distinta. El banco A, se tarda en promedio 3 meses,
mientras que el banco B, se tarda en promedio 4 meses. ¿Es preferible el
banco A, en cuanto al tiempo de gestión de una hipoteca?
Banco A 5 1 1 1 7 4 2 Media: 3 meses
Banco B 4 4 4 4 4 3 5 Media: 4 meses
 ¿Cuál banco prefiere?
MEDIDAS DE DISTANCIA:

 Nos permiten medir la dispersión en términos de la diferencia entre dos valores seleccionados del
conjunto de datos.
 Rango: Es fácil de entender y calcular, pero su utilidad es limitada, pues sólo toma en cuenta el valor
más grande y el valor más pequeño y ninguna otra observación del conjunto de datos.
 Rango Intercuartílico: Mide qué tan lejos de la mediana se debe ir en cualquiera de las dos
direcciones, antes de recorrer una mitad de los valores del conjunto de datos. (Percentil 75 y
percentil 25)
 Rango Interpercentílico: Medida de dispersión que calcula la diferencia en los extremos de la
distribución (percentil 90 y percentil 10) .
MEDIDAS DE DESVIACIÓN PROMEDIO:

 Al realizar su cálculo, nos proporcionan una descripción más completa de la


dispersión respecto a alguna medida de tendencia central (promedio o media
aritmética).
 Varianza: Medida del cuadrado de la distancia promedio entre la media y cada
observación de la población
 Desviación Estándar: Es la raíz cuadrada positiva de la varianza. Tiene las mismas
dimensionales que los datos originales, a diferencia de la varianza en la cual las
dimensionales están expresadas por los cuadrados de las unidades.
FÓRMULAS

Función en Excel:
Desviación: desvest.m
Varianza: var.s
VARIANZA Y DESVIACIÓN ESTÁNDAR
xi f
0 8
𝑥ҧ = 0,99
0.5 12

1 8

1.5 7

2 10
8(0.99−0)2 +12(0.99−0.5)2 +8(0.99−1)2 +7(0.99−1.5)2 +10(0.99−2)2
 𝑆2 = = 0.5170
45−1

8(0.99−0)2 +12(0.99−0.5)2 +8(0.99−1)2 +7(0.99−1.5)2 +10(0.99−2)2


 𝑆= = 0.7190
45−1
VARIANZA Y DESVIACIÓN ESTÁNDAR

 Edad (años): 22,24,25,26,27,28,28,29,30,31,33,34 𝑥ҧ = 28,08

(28.08−22)2 +(28.08−24)2 +(28.08−25)2 +(28.08−26)2 + ⋯(28.08−34)2


 𝑆2 = = 12.8106
12−1

(28.08−22)2 +(28.08−24)2 +(28.08−25)2 +(28.08−26)2 + ⋯(28.08−34)2


 𝑆= = 3.5792
12−1
VARIANZA Y DESVIACIÓN ESTÁNDAR (DATOS AGRUPADOS)

 𝑥ҧ = 97.75
3(84−97.75)2 +7(89−97.75)2 +8(94−97.75)2 +8(99−97.75)2 + ⋯7(109−99.75)2
 𝑆2 = = 61.2179
40−1

3(84−97.75)2 +7(89−97.75)2 +8(94−97.75)2 +8(99−97.75)2 + ⋯7(109−99.75)2 fi Xi


 𝑆= = 7.8242
40−1 3 84
7 89
8 94
8 99
7 104
7 109
 Para medir la dispersión relativa utilizamos el
coeficiente de variación, el cual relaciona la
desviación estándar y la media, expresando
la desviación estándar como porcentaje de
la media.
 La unidad de medida del coeficiente de variación
es porcentaje, en lugar de las dimensionales
DISPERSIÓN originales de la serie de datos .
RELATIVA (CV)
EJEMPLO:
 En la siguiente tabla se muestra los estadísticos de la producción diaria de litros de yogurt elaboradas por
dos líneas de producción:A y B de la empresa Enigma.
 ¿En cuál línea la producción fue más homogénea?
 CVa= (153.73/449.05)*100 = 34.23%
 CVb= (167.94/561.43)*100 = 29.91%
 La línea más homogénea (menos dispersión) es la línea B
INTERPRETACIÓN

Valor del coeficiente de variabilidad Grado en que la media representa a la serie


De 0 a menos del 10% La media es altamente representativa.
De 10 a menos del 20% La media tiene representatividad.
De 20 a menos del 30% La media tiene poca representatividad.
De 30 a menos del 40% La media tiene representación dudosa.
De 40% o más La media carece de representatividad.
MEDIDAS DE FORMA

 Características
La forma es la manera en que los datos se distribuyen, es decir, la forma
de la curva que representa a la serie de datos.

La forma se mide en dos aspectos: Sesgo o Asimetría y Curtosis o


Apuntamiento
SESGO O ASIMETRÍA

 Mide si la curva de la gráfica que representa a los datos es simétrica respecto al


eje vertical
 Si en la curva hay simetría, entonces la distribución es Simétrica o Insesgada
 Si en la curva no hay simetría, entonces la distribución es Asimétrica o Sesgada
El signo en los coeficientes de sesgo determina la asimetría:
+ Distribución asimétrica positiva
- Distribución asimétrica negativa
0 Distribución simétrica
FÓRMULAS
CURTOSIS, AGUDEZ O APUNTAMIENTO

 Mide la altura o grado de apuntamiento de la curva que representa a los datos.


 Según su grado de curtosis, se definen 3 tipos de distribuciones:
 1. Mesocúrtica: Grado de concentración medio alrededor de los valores
centrales de la variable (distribución normal).
 2. Leptocúrtica: Grado de concentración elevado alrededor de los valores
centrales de la variable.
 3. Platicúrtica: Grado de concentración reducido alrededor de los valores
centrales de la variable.
 El signo en el coeficiente de curtosis determina el
grado de concentración:
OTRAS MEDIDAS DE TENDENCIA CENTRAL Y
GRÁFICOS
MEDIA PONDERADA (DATOS SIMPLES)

 Se utiliza cuando algunos de los valores por promediar son más importantes que
otros, por lo que a cada uno de los valores de frecuencia se le asigna un valor de
peso, el cual depende de la importancia que el investigador quiera darle.
 Donde:
 w_ son las ponderaciones de cada valor X
 X_ son los valores observados 𝑤𝑖 𝑥𝑖
𝑋𝑝 =
𝑤𝑖
EJEMPLO 1:
 Al seleccionar a su personal, una empresa considera que los conocimientos tienen una importancia
relativa de 50, la puntualidad 30 y la presentación 20. Cinco solicitantes de empleo obtuvieron las
calificaciones que se presentan en la tabla siguiente:
¿Cuál de ellos obtuvo la mejor calificación global?

Solicitante Calificación Calificación Calificación por Promedio simple.


por por presentación.
conocimientos puntualidad.
1 10 6 7 7.667
2 6 10 8 8.000
3 8 9 8 8.333
4 9 8 6 7.667
5 7 9 10 8.667
SOLUCIÓN
 Xi= Valor de la variable
 Wi= Ponderación
50 10 + 6 30 + 7(20)
ഥ𝒑𝟏 =
𝒙 = 8.2 puntos
50 + 30 + 20
6(50) + 10 30 + 8(20)
ഥ𝒑𝟐 =
𝒙 = 7.6 puntos
50 + 30 + 20
8(50) + 9 30 + 8(20)
ഥ𝒑𝟑 =
𝒙 = 𝟖. 𝟑 𝐩𝐮𝐧𝐭𝐨𝐬
50 + 30 + 20
9(50) + 8 30 + 6(20)
ഥ𝒑𝟒 =
𝒙 = 8.1 puntos
50 + 30 + 20
7(50) + 9 30 + 10(20)
ഥ𝒑𝟓 =
𝒙 = 8.2 puntos
50 + 30 + 20
EJEMPLO 2:

 Mario el fontanero vende cinco tipos de limpiadores para desagües. En la tabla


adjunta se muestra la utilidad y el número de latas vendidas por cada limpiador.
 ¿Cuál es el promedio de la utilidad recibida?
SOLUCIÓN

3 2 + 7 3.5 + 15 5 + 12 7.5 + 15(6)


ഥ𝒑 =
𝒙 = $5.49
3 + 7 + 15 + 12 + 15
MEDIA GEOMÉTRICA:

 Proporciona una medida precisa de un cambio porcentual promedio en una serie de


números.
 Para determinar el incremento porcentual promedio en ventas, producción, u otras
actividades o series económicas de un período a otro.

𝑛
𝑋𝑔 = 𝑥1 . 𝑥2 … 𝑥𝑛
EJEMPLO 3:

 Si el crecimiento de las ventas en un negocio fue en los últimos tres años


de 3%, 18% y 25%. ¿Cuál ha sido el aumento anual de sus ventas?
 Realice un gráfico que represente a los datos.
SOLUCIÓN

3
ഥ𝒈 =
𝒙 1.03(1.18)(1.25) = 1.1496

ഥ𝒈 = 1.1496
𝒙
Incremento promedio de 14.96%
GRÁFICO LINEAL

Incremento en ventas
30%
25% 25%

20%  Sirven para representar las series de tiempo,


Porcentaje

18% porque reflejan la dirección del cambio.


15%
 Eje horizontal: escala de tiempo
10%
5%
3%
0%
2017 2018 2019
Año
DIAGRAMA DE PARETO (80/20)

 Constituye un sencillo y gráfico método de análisis que permite ver entre las causas
más importantes de un problema (pocos vitales) y las que no lo son (muchos
triviales).
 Entre sus ventajas es que permite centrarse en los aspectos cuya mejora tendrá más
impacto, optimizando por tanto los esfuerzos.
 Es decir, este diagrama establece que un 20% de las fuentes causan el 80% de
cualquier problema.
EJEMPLO 4:

 El hotel Brisas del mar, ha recibido en el último semestre numerosas quejas sobre el
servicio. Esto está afectando negativamente al desempeño del sistema de gestión de
calidad, repercutiendo negativamente en la satisfacción del cliente. Las quejas son
variadas, así que los responsables de procesos se reúnen y deciden hacer un diagrama
de Pareto para determinar la causa predominante y trabajar sobre ella.
 El equipo de trabajo recopila las posibles causas del problema a través de listas de
verificación, resultados de encuestas, quejas, etc. y también la frecuencia con la que
ocurren.
TABLA DE DATOS:

Posibles causas del problema Frecuencia con la que ocurre


Mala calidad del servicio de 10
recepción.
La comida está fría. 4
Las sábanas están sucias. 2
El personal del restaurante es 1
grosero.
La información sobre la 20
excursiones es insuficiente.
Subieron los precios. 5
GRÁFICO DE PARETO
GRÁFICO DE PARETO
EJEMPLO 5: GRÁFICO DE CAJA Y BIGOTES

Realice el diagrama de caja y bigotes para encontrar los valores atípicos.

X 47 52 57 58 60 65 66 71 72 73 96
f 1 2 1 2 1 1 2 2 1 1 1
F 1 3 4 6 7 8 10 12 13 14 15
 Calcular Mediana, Cuartil 1, Cuartil 3, Rango Intercuartilico, P1 y P3
 𝑃1 = 𝑄1 − 1.5 𝑅𝐼 𝑃3 = 𝑄3 + 1.5 𝑅𝐼
GRÁFICO DE
CAJA Y
BIGOTES
(EXCEL)
GRÁFICO DE CAJA Y BIGOTES

También podría gustarte