Está en la página 1de 23

SESIÓN 5

ESTADÍSTICA DESCRIPTIVA Y PROBABILIDADES


TEMARIO

1. Medidas de dispersión para datos no agrupados.

2. Medidas de dispersión para datos agrupados.


LOGRO DE LA SESIÓN

Al finalizar la sesión de clase, el estudiante calcula e


interpreta las medidas de dispersión para analizar la
variabilidad en datos no agrupados y agrupados .
MEDIDAS DE DISPERSIÓN
Estas medias indican el grado de variabilidad en un conjunto de datos respecto a un
valor medio ( medida de tendencia central), por ende, mide la representatividad de
este valor central.
MEDIDAS DE DISPERSIÓN
La importancia que tienen es porque proporcionan más información que permite juzgar la
confiabilidad de las medidas de tendencia central. Si los datos están muy dispersos, las medidas de
tendencia central son menos representativas de los datos que cuando están más agrupadas
alrededor de la media.
MEDIDAS DE DISPERSIÓN
Definiciones de Estadígrafos
 Varianza: (S2)
Es el promedio aritmético de las desviaciones estándar respecto a su media elevadas
al cuadrado, por lo tanto esta expresado en las unidades al cuadrado de la variable
inicial.
 Desviación estándar: (S)
Representa el grado de dispersión de los valores de una variable, con respecto a su
media. Su cálculo se obtiene al extraer la raíz cuadrada de la varianza.
 Coeficiente de variación: (CV)
Indica el porcentaje de variabilidad de los datos respecto a la media: se cálculo es
Mediante la razón entre la media y la desviación estándar. Presenta un rango de
valores para evaluar la variabilidad
MEDIDAS DE DISPERSIÓN
Rango o recorrido de la variable: Es la diferencia entre el valor máximo y el valor mínimo de
la variable para un conjunto de datos.

Sea la variable representada por X:

Rango (R) = X max – X min

Donde:
Xmax: valor máximo de la variable
Xmin: valor mínimo de la variable
MEDIDAS DE DISPERSIÓN
Varianza para datos no agrupados (𝑺𝟐, 𝝈𝟐)
Se define como la media aritmética del cuadrado de las desviaciones de las observaciones con
respecto a su media.

Muestra Población

Desviación estándar para datos no agrupados (𝑺, 𝝈)


Representa el grado de dispersión de los valores de una variable, con respecto a su media.
Para su cálculo se define como la raíz cuadrada de la varianza.
MEDIDAS DE DISPERSIÓN
Coeficiente de variación (CV) para datos no agrupados
Es una medida de dispersión relativa ( no tiene unidades), se define como el cociente entre la desviación
estándar y la media. Permite comparar dos a más conjuntos de datos.

Muestra Población

El coeficiente de
variación es aplicable
para comparar
conjuntos de datos
En general consideraremos los rangos de valores CV: expresado en
diferentes unidades.
CV < 10% -> Implica DATOS HOMOGÉNEOS
10% ≤ CV ≤ 30% -> Implica DATOS VARIABLES
CV > 30% -> Implica DATOS HETEROGÉNEOS
MEDIDAS DE DISPERSIÓN
CASO 1: Sea la utilidad (millones de soles) de una muestra de cinco medianas empresas del Perú
2 4 6 8 10
Halle la varianza, la desviación estándar y el coeficiente de variación

Solución:

𝝈𝟐 𝑿𝒊 𝟐+𝟒+𝟔+𝟖+𝟏𝟎
Media: ഥ=
𝑿 = = 𝟔 𝒔𝒐𝒍𝒆𝒔
𝒏 𝟓
2 (2−6)2 +(4−6)2 +(6−6)2 +(8−6)2 + (10−6)2
= 𝑠 = 10 soles
Varianza: 5−1

Desviación estándar
s= 𝑠 2 = 10 = 3.16 𝑠𝑜𝑙𝑒𝑠
Interpretación: Existe una dispersión o variación en el promedio de 3.16
millones de soles con respecto al valor central que es 6 millones de soles.
MEDIDAS DE DISPERSIÓN
CASO 1: Coeficiente de variación:
𝑆 3.16
𝐶. 𝑉 = ∗ 100% → 𝐶. 𝑉 = ∗ 100%
𝑋ത 6
Recuerda:
𝐶𝑉 = 52.67%
CV < 10% -> Implica DATOS HOMOGÉNEOS
10% ≤ CV ≤ 30% -> Implica DATOS CON VARIABILIDAD ACEPTABLE
CV > 30% -> Implica DATOS HETEROGÉNEOS
Interpretación:
Se observa que el coeficiente de variación, cae en el 3er rango, es decir la utilidad de
las empresas mediadas tiene un comportamiento heterogéneo.
MEDIDAS DE DISPERSIÓN
CASO 2: Suponga que las notas de la 1era práctica de una muestra de 3 secciones del curso de
estadística descriptiva y probabilidades fueron.

SECCIONES NOTAS Media:


Sección A 14 14 14 14 14 14 14 14 14 14 14
Sección B 14 13 15 14 12 15 16 13 12 16 14
Sección C 19 8 19 11 16 18 6 13 10 20 14

Analice las notas promedio de las 3 secciones del curso:

Solución
 De manera visual, que está pasando con los datos
y su promedio respectivo?

 En la vida real, se encontrará con tamaños de muestra


pequeña?
MEDIDAS DE DISPERSIÓN
SECCIONES NOTAS
CASO 2:
Sección A 14 14 14 14 14 14 14 14 14 14 14
Sección B 14 13 15 14 12 15 16 13 12 16 14
Sección C 19 8 19 11 16 18 6 13 10 20 14
Calculemos la varianzas (𝑆2), Desviación estándar (𝑆), coeficiente de variación (𝐶𝑉)
Sección A

2 (14−14)2 +(14−14)2 +.…………….+ (10−14)2 0


𝑠 = 0 → 𝑆 = 0 = 0 → 𝐶𝑉 = ∗ 100% = 0
10−1 14
Sección B
2 (14−14)2 +(13−14)2 +.……….+ (16−14)2 1.49
𝑠 = 2.22 → 𝑆 = 2.22 = 1.49 → 𝐶𝑉 = ∗ 100% = 10.6%
10−1 14
Sección C
2 (19−14)2 +(8−14)2 +.….+ (20−14)2
𝑠 = 25.78 → 𝑆 = 25.78 = 5.08
10−1
5.08
→ 𝐶𝑉 = ∗ 100% = 36.3%
14
MEDIDAS DE DISPERSIÓN
CASO 2: resumen de los resultados notas primera práctica estadística

Secciones Media(𝑋 ) Varianza (𝑆2) Desviación estándar (𝑆) Coeficiente de variación (𝐶𝑉)
Sección A 14 0 0 0
Sección B 14 2.22 1.49 10.6%
Sección C 14 25.78 5.08 36.3%

¿A que conclusiones llegamos?


MEDIDAS DE DISPERSIÓN
Medidas de dispersión para datos agrupados:

Varianza para datos agrupados (𝑺𝟐, 𝝈𝟐)


Equivalente:

Desviación estándar datos agrupados (𝑺, 𝝈)

Coeficiente de variación datos agrupados (𝑪𝑽)


MEDIDAS DE DISPERSIÓN
CASO 3: Sea X las inversiones (millones de soles) en marketing que una muestra de 20 empresas
grandes incurren en el Perú,

X (inversion) fi (empresas)
[0 – 2> 10
[2 – 4> 4
[4 – 6> 3
[6 – 8> 3

Halle la varianza, desviación estándar y el coeficiente de variación.


MEDIDAS DE DISPERSIÓN
Marca de clase
CASO 3: 𝑿 𝒇𝒊 𝑿𝒊 𝑿𝒊𝒇𝒊 𝒙𝒊𝟐𝑿𝒇𝒊𝒊 Desviación estandar: 𝑺
[0 – 2> 10 1 10 10
[2 – 4> 4 3 36 𝑆= 𝑆2
12
[4 – 6> 3 5 15 75 𝑆 = 5.25 = 2.29
[6 – 8> 3 7 21 147
Total n=20 58 268 Interpretación: Existe una
dispersión o variación en el
Varianza: 𝑺𝟐 promedio de 2.29 millones
soles con respecto al valor
Paso1: Hallar la media central que es 2.9 millones
58 de soles.
𝑋ത = = 2.9 𝑆𝑜𝑙𝑒𝑠
20
Paso2: Reemplazar en la fórmula varianza
268 − 20 (2.9)2
𝑆2 = = 5.25 𝑆𝑜𝑙𝑒𝑠
20 − 1
MEDIDAS DE DISPERSIÓN
CASO 3:

Coeficiente variación: cv
2.29
𝐶𝑉 = ∗ 100% =79.96%
14
CV < 10% -> Implica DATOS HOMOGÉNEOS
10% ≤ CV ≤ 30% -> Implica DATOS VARIABILIDAD ACEPTABLE
CV > 30% -> Implica DATOS HETEROGÉNEOS

Se observa que el coeficiente de variación cae en el 3er rango, es decir los montos de la
inversión en marketing tiene un comportamiento heterogéneo.
MEDIDAS DE DISPERSIÓN
CASO 4: En 2 ciudades de diferentes continentes (Europa y Sudamérica) se ha pesado a un grupo
de niños de 10 años de los cuales se tiene los siguiente registros(kg):

Peso niños Sudamérica Peso niños Europa


Peso (kg) (X) fi (alumnos) Peso (kg) (X) fi (alumnos)
[40 42> 12 [40 43> 7
[42 44> 10 [43 46> 6
[44 46 > 14 [46 49 > 8
[ 46 48> 8 [49 52> 9
[48 50> 7 [52 55> 10
[50 52> 6 [55 58> 16
[52 54> 5 [58 61> 15
Total 62 Total 71

Analice el peso de los niños en ambos grupos mediante las medidas de dispersión
MEDIDAS DE DISPERSIÓN
CASO 2:
Solución: comprueba tus resultados de manera similar al ejercicio anterior!!
Origen Media Varianza Desviación Estándar Coeficiente variación
(𝑿) (𝑺𝟐) (𝑺) (CV)
Peso niños 45.8387kg 14.2355 kg2 3.7730 kg 8.23%
Sudamérica
Peso niños 52.4436 kg 35.2539 kg2 5.9375 kg 11.32%
Europa

¿A que conclusiones llegamos? Compare los resultados


TALLER N° 2
Grupos de 4 Estudiantes

Que comience el
2do Taller !
CIERRE
¿Qué hemos aprendido?

1. ¿Para qué sirven las medidas de dispersión?

2. ¿Cuál es la relación entre el coeficiente de


variación y la homogeneidad de un conjunto
de datos.

También podría gustarte