Está en la página 1de 31

En unos minutos iniciamos

la sesión
Estadística Descriptiva y
Probabilidades
Semana 5
Temario

1. Medidas de dispersión para datos no agrupados.

2. Medidas de dispersión para datos agrupados.


Logro de la sesión

Al finalizar la sesión de clase, el estudiante calcula e


interpreta las medidas de dispersión para analizar la
variabilidad en datos no agrupados y agrupados .
Utilidad
NÚMERO DE DÍAS REQUERIDOS PARA COMPLETAR UNA ORDEN
POR DOS PROVEEDORES

¿Cuánto es el promedio de cada proveedor?


¿Qué proveedor preferirías?
Medidas de dispersión
La importancia que tienen es porque proporcionan más información que permite juzgar la
confiabilidad de las medidas de tendencia central. Si los datos están muy dispersos, las medidas de
tendencia central son menos representativas de los datos que cuando están más agrupadas
alrededor de la media.
Rango o recorrido de la
variable
PRINCIPALES MEDIDAS DE
DISPERSIÓN Varianza

Desviación estándar

Coeficiente de variación
Medidas de dispersión
Definiciones de estadígrafos:
 Varianza: (S2)
Es el promedio aritmético de las desviaciones estándar respecto a su media elevadas
al cuadrado, por lo tanto esta expresado en las unidades al cuadrado de la variable
inicial.
 Desviación estándar: (S)
Representa el grado de dispersión de los valores de una variable, con respecto a su
media. Su cálculo se obtiene al extraer la raíz cuadrada de la varianza.
 Coeficiente de variación: (CV)
Indica el porcentaje de variabilidad de los datos respecto a la media. Su cálculo es
mediante la razón entre la desviación estándar y la media. Presenta un rango de
valores para evaluar la variabilidad
Medidas de dispersión

Rango o recorrido: Es la diferencia entre el valor máximo y el valor mínimo de la variable


para un conjunto de datos.

Sea la variable representada por X:

Rango (R) = X max – X min

Donde:
Xmax: valor máximo de la variable
Xmin: valor mínimo de la variable
Medidas de dispersión

Varianza para datos no agrupados (


Se define como la media aritmética del cuadrado de las desviaciones de las observaciones con
respecto a su media.

Muestra Población
𝑛 𝑁

∑ ( 𝑋𝑖− 𝑋 ) 2
∑ ( 𝑋 𝑖 − 𝝁 )2
2 1
𝑆 2= 1
𝝈 =
𝑛 −1 𝑁

Desviación estándar para datos no agrupados (


Representa el grado de dispersión de los valores de una variable, con respecto a su media.
Para su cálculo se define como la raíz cuadrada de la varianza.

𝑆=√ 𝑆 2
𝝈 =√ 𝝈 2
Medidas de dispersión
Coeficiente de variación (CV) para datos no agrupados
Es una medida de dispersión relativa ( no tiene unidades), se define como el cociente entre la
desviación estándar y la media. Permite comparar dos a más conjuntos de datos.

Muestra Población
El coeficiente de
% 𝝈 variación es aplicable
𝐶𝑉 = ∗100   % para comparar
𝜇
conjuntos de datos
expresado en
Rango de valores CV diferentes unidades.

CV < 10% -> Implica DATOS HOMOGÉNEOS


10% ≤ CV ≤ 30% -> Implica DATOS CON VARIABILIDAD ACEPTABLE
CV > 30% -> Implica DATOS HETEROGÉNEOS
Medidas de dispersión

CASO 1: Sea la utilidad (millones de soles) de una muestra de cinco medianas empresas del Perú
2 4 6 8 10
Halle la varianza, la desviación estándar y el coeficiente de variación
Medidas de dispersión

CASO 1: Sea la utilidad (millones de soles) de una muestra de cinco medianas empresas del Perú
2 4 6 8 10
Halle la varianza, la desviación estándar y el coeficiente de variación

Solución: 𝑛

∑ 𝑋𝑖
Media: 𝑋=
𝑖
=
2 +4 +6 + 8 +10
=6 M Soles
𝑛 5
5

∑ ( 𝑋 𝑖 − 𝑋 )2 2 ( 2− 6 ) 2
+ ( 4 −6 ) 2
+ ( 6 −6 ) 2
+ ( 8 −6 ) 2
+ ( 10 −6 ) 2
2
Varianza: 𝑆 2= 1 𝑆 = =10 M soles  
𝑛−1 5−1

Desviación estándar S =√ 𝑆2 =√ 10 M soles  2 ≅ 3.16 Msoles


Interpretación: Existe una dispersión o variación en el promedio de 3.16
millones de soles con respecto al valor central que es 6 millones de soles.
Medidas de dispersión

CASO 1: Coeficiente de variación:


%

Recuerda:
𝐶𝑉 ≅ 52.67 %
CV < 10% -> Implica DATOS HOMOGÉNEOS
10% ≤ CV ≤ 30% -> Implica DATOS CON VARIABILIDAD ACEPTABLE
CV > 30% -> Implica DATOS HETEROGÉNEOS
Interpretación:

Se observa que el coeficiente de variación, cae en el 3er rango, es decir la utilidad de las
empresas medianas tiene un comportamiento heterogéneo.
Medidas de dispersión

CASO 2: Suponga que las notas de la 1era práctica de una muestra de 3 secciones del curso de
estadística descriptiva y probabilidades fueron.

SECCIONES NOTAS Media:


Sección A 14 14 14 14 14 14 14 14 14 14 14
Sección B 14 13 15 14 12 15 16 13 12 16 14
Sección C 19 8 19 11 16 18 6 13 10 20 14

Analice las notas promedio de las 3 secciones del curso:

Solución  De manera visual, que está pasando con los datos y su promedio respectivo?
 En la vida real, se encontrará con tamaños de muestra pequeña?
Medidas de dispersión

CASO 2: SECCIONES NOTAS Media Rango


Sección A 14 14 14 14 14 14 14 14 14 14 14 0
Sección B 14 13 15 14 12 15 16 13 12 16 14 4
Sección C 19 8 19 11 16 18 6 13 10 20 14 14
Calculemos la varianzas (Desviación estándar ( coeficiente de variación
Sección A 10

∑ ( 𝑋 𝑖 − 𝑋 )2 0
2
𝑆 =
1
𝑛 −1
=
( 14 − 𝟏𝟒 ) 2 + ( 1 4 − 𝟏𝟒 ) 2 +…+ ( 1 4 − 14 )2
10 − 1
=0 𝑆=√ 0 =0    𝐶𝑉 = 14
∗ 100=0

Sección B
( 14 −𝟏𝟒 )2 + ( 13 −𝟏𝟒 )2+ …+ ( 16 − 14 ) 2 1.49

2
𝑆 = =2.22 𝑆= 2.22 ≅1.49   𝐶𝑉 = ∗100 ≅ 10.6 %
10 −1 14
Sección C
( 19− 𝟏𝟒 )2 + ( 8 − 𝟏𝟒 )2 +…+ ( 20− 14 )2 5.08

2
𝑆 = = 25.78𝑆= 25.78 ≅5.08    𝐶𝑉 = ∗100 ≅ 36.3 %
10 −1 14
Medidas de dispersión

CASO 2: resumen de los resultados notas primera práctica estadística

Secciones Media() RANGO Varianza () Desviación estándar ) Coeficiente de variación ()


Sección A  14 0 0  0  0
Sección B  14 4 2.22  1.49  10.6%
Sección C  14 14 25.78  5.08  36.3%

¿A que conclusiones llegamos?


Medidas de dispersión
Medidas de dispersión para datos agrupados:

Varianza para datos agrupados ()


Equivalente:

→𝑆 =∑ ¿¿¿¿¿
(∑ 𝑥 𝑖 𝑓 𝑖 )
2

∑ 𝑥𝑖 2
𝑓 𝑖−
𝑛
2
→𝑆 =
∑ 𝑖 𝑖
𝑥 2
𝑓 −𝑛 𝑋 2
2
𝑆 2= =¿
𝑛 −1 𝑛 −1
Desviación estándar datos agrupados ()

𝑆=√ 𝑠2

Coeficiente de variación datos agrupados ()


𝑆
𝐶 .𝑉 .= .100 %
𝑋
Medidas de dispersión

CASO 3: Sea X las inversiones (millones de soles) en marketing que una muestra de 20 empresas
grandes incurren en el Perú,

X (inversion) fi (empresas)
[0 – 2> 10
[2 – 4> 4
[4 – 6> 3
[6 – 8] 3

Halle la varianza, desviación estándar y el coeficiente de variación.


CASO 1: Sea X las inversiones en marketing (en millones de soles) 2
𝑆=
∑ 𝑥 𝑖
2
𝑓 𝑖 −𝑛 𝑋 2

que una muestra de 20 empresas grandes realizan en Perú. 𝑛 −1

X (inversión) fi (empresas) Halle la varianza, desviación


[0 – 2> 10 estándar y el coeficiente de
[2 – 4> 4 variación.
[4 – 6> 3
[6 – 8> 3
Medidas de dispersión
Marca de clase
CASO 3: Desviación estandar:
[0 – 2> 10 1 10 10
[2 – 4> 4 3 12 36
[4 – 6> 3 5 15 75 Msoles
[6 – 8> 3 7 21 147
Total n=20 Interpretación: Existe una
dispersión o variación en el
Varianza: promedio de 2.29 millones
soles con respecto al valor
Paso1: Hallar la media ) central que es 2.9 millones
de soles.
Msoles

Paso2: Reemplazar en la fórmula varianza


2 ∑ 𝑖
2 2 2
𝑥 𝑓 𝑖 −𝑛 𝑋 2 2 68− 20( 2.9) 2
𝑆= 𝑆 = =5.25 𝑀𝑠𝑜𝑙𝑒𝑠
𝑛 −1 20 −1
Medidas de dispersión

CASO 3:
Coeficiente variación: CV
𝑆 2.29
𝐶𝑉 = .100 %   𝐶𝑉 = .100 % ≅ 79.96 %
𝑋 2.9
CV < 10% -> Implica DATOS HOMOGÉNEOS
10% ≤ CV ≤ 30% -> Implica DATOS VARIABILIDAD ACEPTABLE
CV > 30% -> Implica DATOS HETEROGÉNEOS

Se observa que el coeficiente de variación cae en el 3er rango, es decir los montos de la
inversión en marketing tienen un comportamiento heterogéneo, esto significa que la
media aritmética no es un valor representativo de la muestra.
Comprobemos lo aprendido…

1. Desarrolla el problema del foro semanal


2. Practica en línea
Comprobemos lo aprendido…
1. Desarrolla el problema del foro semanal
2. Practica en línea

Ingresa a: https://b.socrative.com/login/student/
Medidas de dispersión
CASO 4: En 2 ciudades de diferentes continentes (Europa y Sudamérica) se ha pesado a un grupo
de niños de 10 años de los cuales se tiene los siguiente registros(kg):
Peso niños Sudamérica Peso niños Europa
Peso (kg) (Xi) fi (alumnos) Peso (kg) (Xi) fi (alumnos)
[40 ; 42> 12 [40 ; 43> 7
[42 ; 44> 10 [43 ; 46> 6
[44 ; 46 > 14 [46 ; 49 > 8
[46 ; 48> 8 [49 ; 52> 9
[48 ; 50> 7 [52 ; 55> 10
[50 ; 52> 6 [55 ; 58> 16
[52 ; 54> 5 [58 ; 61> 15
Total 62 Total 71
Analice el peso de los niños en ambos grupos mediante las medidas de dispersión
Medidas de dispersión
CASO 2:
Solución: comprueba tus resultados de manera similar al ejercicio anterior!!

Origen Media Varianza Desviación Estándar Coeficiente variación


() (CV)
Peso niños kg 14.2355 kg 8.23%
Sudamérica
Peso niños 52.4436 kg 35.2539 5.9375 kg 11.32%
Europa

¿A que conclusiones llegamos? Compare los resultados


Ejercicios propuestos
Ejercicio 1

En un almacén de abarrotes, se pesaron 125


sacos de arroz, obteniendo un promedio en peso
de 42kg. Un chequeo posterior mostró que en
lugar del peso de 12.4 kg, se había introducido el
peso de 124 kg. ¿Haciendo la corrección cual
sería el nuevo peso promedio de los sacos de
arroz?
Ejercicio 2
Una prueba de conocimiento A se calificó sobre 20 puntos dando una media de 12 y
una desviación estándar de 2 puntos. Mientras que una prueba de aptitud B se calificó
sobre 100 puntos, dando una media de 70 y una desviación estándar de 5. ¿En cuál de
las dos pruebas los puntajes son más homogéneos?
Cierre

¿Qué hemos aprendido?

1.¿Para qué sirven las medidas de dispersión?

2.¿Cuál es la relación entre el coeficiente de


variación y la homogeneidad de un conjunto
de datos.
Taller N° 2

Grupos de 5 estudiantes

Que comience el
2do Taller !

También podría gustarte