Está en la página 1de 28

°






Estadística y Análisis de Datos
Estadística y Análisis de Datos

También llamadas medidas de variabilidad, nos


indican si los valores de una variable están
próximos entre sí o dispersos.

Si el grado de variabilidad es mayor, menor


uniformidad tendrán los datos (heterogéneos), por
el contrario, si el grado de variabilidad es pequeño,
entonces hay más uniformidad entre los datos
(homogéneos).

Cuando la variabilidad es 0, quiere decir que todos


los datos son iguales.
Estadística y Análisis de Datos

Las medidas estadísticas de


variabilidad se clasifican en
absolutas o relativas.
Estadística y Análisis de Datos

Es la medida de variabilidad o dispersión más simple.


Se calcula tomando la diferencia entre el valor máximo
y el mínimo observado.

R = Max − Min
El rango o amplitud total es la medida de dispersión
muy fácilmente calculable, pero es muy inestable, ya
que depende únicamente de los dos valores extremos.
Su valor puede cambiar grandemente si se añade o
elimina un sólo dato. Por tanto su uso es muy limitado.
Estadística y Análisis de Datos

Es la diferencia entre el tercer


cuartil (Q3) y el primer cuartil
𝐼𝑄𝑅 = 𝑄3 − 𝑄1
(Q1). En otras palabras, el
rango intercuartil es la amplitud
o rango del 50% central de los
datos.
Estadística y Análisis de Datos

25% 50% 25%

Mín. Máx.
Q1 IRQ Q3

R
Estadística y Análisis de Datos

La varianza, es una medida que


cuantifica el grado de dispersión o k
− x)2
i=1(x i
de variación de los valores de una S2 =
variable cuantitativa con respecto a n−1
su media aritmética.

Si los valores tienden a concentrarse k


− x)2 ∙ fi
i=1(x i
alrededor de su media, la varianza S2 =
será pequeña. Si los valores tienden n−1
a distribuirse lejos de la media, la
varianza será grande.
Estadística y Análisis de Datos

También llamada desviación típica, es una medida de


dispersión usada en estadística que nos dice cuánto
tienden a alejarse los valores puntuales del promedio
en una distribución.
S= S2
Una desviación estándar grande indica que los puntos
están lejos de la media, y una desviación pequeño
indica que los datos están agrupados cerca de la
media.

La desviación es la raíz cuadrada de la varianza.


Estadística y Análisis de Datos

Es una medida de dispersión relativa (libre de unidades de


medidas), que se define como la desviación estándar dividido por la
media aritmética.

El coeficiente de variación mide el grado de variabilidad de un


conjunto de datos, además compara el grado de variabilidad entre
dos o más distribuciones. S
CV = ∙ 100%
Cuando la desviación estándar es muy pequeña, el coeficiente de x
variación también es pequeño (los valores se encuentran muy
concentrados respecto a la media); en cambio, cuando el valor de
la desviación estándar es muy grande, el coeficiente de variación
es grande, hasta superar el 100% (los valores se encuentran muy
dispersos).
Estadística y Análisis de Datos

Una escala que nos permite la interpretación del coeficiente de variación es fenómenos no
controlados como los naturales, sociales, deportivos, entre otros, se tiene:

Rango del CV Interpretación Nivel de variabilidad


0% < CV < 5% Datos muy homogéneos
Baja variabilidad
5% < CV < 10% Datos homogéneos
Datos regularmente
10% < CV < 15%
homogéneos
Moderada variabilidad
Datos regularmente
15% < CV < 20%
heterogéneos
20% < CV < 25% Datos heterogéneos
Alta variabilidad
CV ≥ 25% Datos muy heterogéneos
Estadística y Análisis de Datos

Ejemplo: Hallar las medidas de posición central


El número de operaciones bancarias que realizan 50 clientes de un banco durante una
semana viene dado a continuación:

Hallar las medidas de dispersión e interpretar.


Estadística y Análisis de Datos

Solución:

# de Frecuencia
Frecuencia
operaciones Absoluta
Absoluta
por cliente Acumulada
(fi)
(xi) (Fi)

0 2 2

1 4 6

2 21 27

3 15 42

4 6 48
𝐼𝑄𝑅 = 𝑄3 − 𝑄1
5 1 49 𝐼𝑄𝑅 = 3 − 2 = 1
6 1 50
Estadística y Análisis de Datos

# de Frecuencia
Frecuencia
operaciones Absoluta
Absoluta
por cliente Acumulada
(fi)
(xi) (Fi)
2
62.48
0 2 2 12.7008
𝑆 =
50 − 1
1 4 6 9.2416
2 21 27 5.6784 𝑆 2 = 1.2751 ≅ 1.28
3 15 42 3.456
4 6 48 13.1424
5 1 49 6.1504
6 1 50 12.1104 𝑆 = 1.2751
k
𝑆 = 1.1292 ≅ 1.13
෍(xi −x)2 ∙ 𝑓𝑖 = 62.48
i=1
Estadística y Análisis de Datos

# de Frecuencia
Frecuencia
operaciones Absoluta
Absoluta
por cliente Acumulada
(fi)
(xi) (Fi)
0 2 2 12.7008 1.1292
𝐶𝑉 = ∙ 100%
1 4 6 9.2416 2.52
2 21 27 5.6784
3 15 42 3.456 𝐶𝑉 = 44.8095% ≅ 44.80%
4 6 48 13.1424
5 1 49 6.1504

6 1 50 12.1104
Estadística y Análisis de Datos
Estadística y Análisis de Datos
Estadística y Análisis de Datos
Estadística y Análisis de Datos
Estadística y Análisis de Datos
Estadística y Análisis de Datos
Estadística y Análisis de Datos

52.7
𝐶𝑉𝑁 = ∙ 100% = 13.16%
400

40.2
𝐶𝑉𝑆 = ∙ 100% = 6.7%
600

Sucursal 45
400 52.7 𝐶𝑉𝐸 = ∙ 100% = 5.84%
Norte 770
Sucursal
600 40.2
Sur
Sucursal
770 45
Este
Estadística y Análisis de Datos

Se dispone de datos sobre el número de créditos acumulados de 50 estudiantes de la


Escuela de Negocios del IDAT. Los datos obtenidos son los siguientes:

Halle las medidas de dispersión e interprete. Validar sus resultados con el PSPP.
Estadística y Análisis de Datos

En una encuesta realizada por la empresa de estudio de mercado MAS S.A. a una muestra
de 36 personas de entre 16 y 24 años de edad, seleccionados probabilísticamente en el
distrito de SJM, se indagó acerca de los gastos en soles que realizaron en ropas la semana
anterior. Se obtuvieron los siguientes resultados:

Luego de construir la tabla de distribución de frecuencias usando la regla de Sturges, halle


las medidas de dispersión e interprete. Validar sus resultados con el PSPP.
Estadística y Análisis de Datos

• ¿Por qué se le llama medidas dispersión?


• ¿ Qué mide rango?
• ¿ Qué mide varianza?
• ¿ Qué mide desviación estándar?
• ¿ Qué mide coeficiente de variación?
• ¿ Cómo sería un ejemplo de esta mediciones?

También podría gustarte