Está en la página 1de 30

VARIANZA Y DESVIACIÓN ESTÁNDAR

Esto quiere decir que, si tengo


grupos de datos con el mismo
promedio, para analizar la
variabilidad, solo es necesario
utilizar la varianza o desviación
estándar

https://www.youtube.com/watch?v=cg4kUsbjQms
3.5 Varianza

La varianza es el promedio de los cuadrados de las desviaciones de los datos con


respecto a su media.
La varianza presenta el inconveniente de no tener la misma dimensión que los
datos, debido a que se expresa en unidades cuadradas (por ejemplo, si los datos
se miden en metros, la varianza lo hace en metros al cuadrado) lo que dificulta su
interpretación.
3.5.1 Cálculo de la varianza muestral con datos no agrupados

Si tenemos datos de una variable obtenidos de una muestra de tamaño ,


representados por: entonces la varianza de dichos datos se calcula con la fórmula:

𝑛
1
2
∑ 2
( 𝑥𝑖− 𝑋 ) ⟺
𝒏

𝑆=𝑥
∑ 𝒙𝟐
𝒊 − 𝒏 𝑿 𝟐

𝑛−1 𝑖=1 𝑺𝟐
𝒙=
𝒊=𝟏
𝒏 −𝟏
Ejemplo 1

A continuación, se presentan los tiempos de espera (en minutos) de una


muestra de 11 clientes para ser atendidos en la ventanilla de un Banco
1 2 3 4 5 6 7 8 9 10 11

15 10 20 11 8 15 9 12 18 11 14
15+10 +…+14
La media aritmética de estos datos es 𝑋= =13
11
Luego, la varianza de los datos es
𝒏

∑ 𝒙𝟐
𝒊 − 𝒏 𝑿
𝟐
2001 − 11(13 ) 2
2 𝒊=𝟏
𝑆 =
𝑥 = = 14 , 2
𝒏−𝟏 10

La varianza de los tiempos de espera de la muestra resulta 14,2 minutos al


cuadrado. No tiene interpretación práctica.
3.5.2 Calculo de la varianza muestral con datos agrupados:

Si tenemos datos obtenidos de una muestra de tamaño resumidos en una tabla de


frecuencias, entonces la varianza se calcula con la fórmula
𝑘
1
𝑆 = ∑ ( 𝑥𝑖− 𝑋 ) 𝑓 𝑖 ⟺
𝒌

2 2 ∑ 𝒙𝟐
𝒊 𝒇 𝒊− 𝒏 𝑿
𝟐

𝑺𝟐
𝒙=
𝒊=𝟏
𝑥
𝑛−1 𝑖=1 𝒏− 𝟏
Ejemplo 2
Se ha tomado una muestra de 30 alumnos de la Escuela de Negocios y se les ha
preguntado por el número de asignaturas desaprobadas () en el semestre anterior. Los
datos recolectados se resumieron en la tabla 4.2 y con estos datos resumidos se requiere
calcular la varianza.
6

∑ 𝑥𝑖 𝑓 𝑖 92
Tabla N° 4.2 Distribución de alumnos Se calcula la media aritmética 𝑖=1
𝑋= = =3,067
según asignaturas desaprobadas 30 30

Luego, se calcula la varianza:


0 1 0 0 6

1 2 2 2 ∑ 𝑥 2𝑖 𝑓 𝑖 − 𝑛 𝑋 2
𝑖 =1
2 4 8 16
𝑆2
𝑥= =320 − 30 ¿ ¿
𝑛 −1
3 12 36 108
4 9 36 144 La varianza del número de cursos desaprobados resulta
1,3036 unidades cuadradas. No tiene interpretación
5 2 10 50
práctica.
Total 30 92 320
Ejemplo 3

Con la finalidad de conocer la varianza de los gastos semanales (en soles) del
personal administrativo de una empresa de cemento en Lima, en el mes de enero del
2016, se seleccionó una muestra de 30 personas. Los datos resumidos y los cálculos
necesarios se presentan en la siguiente tabla 4.3.
Tabla N° 4.3 Distribución de empleados según gasto semanal Se calcula
5 la media aritmética
Gasto
∑ 𝑥𝑖 𝑓 𝑖 29 000
𝑋 = 𝑖=1 = = 966,667
[200 ; 400) 300 0 0 0 30 30 5
∑ 𝑥2 𝑖 𝑓 𝑖 − 𝑛 𝑥
2

[400 ; 600) 500 1 500 250 000 Luego, la varianza


2
𝑆 =
𝑥
𝑖 =1
𝑛 −1

[600 ; 800) 700 4 2 800 1 960 000 2


[800 ; 1000) 900 9 8 100 7 290 000 𝑆 =28860000− 30¿¿
𝑥
[1000 ; 1200) 1 100 16 17 600 19 360 000
La varianza del gasto del personal
administrativo seleccionado resulta 28 505,08
Total ----- 30 29 000 28 860 000 soles al cuadrado. No tiene interpretación
práctica.
3.5.3 Propiedades de la varianza

a) Para cualquier conjunto de datos la varianza es siempre una cantidad no negativa.

b) Si las observaciones tienen valores iguales, entonces la varianza es 0; es decir, la


varianza de una constante es 0. Si entonces:

c) La varianza del producto de una constante por una variable es igual al


cuadrado de la constante por la varianza de la variable.
Es decir, si , entonces:
d) La varianza de la suma de una variable más o menos una constante, es igual a
la varianza de la variable. (La varianza no cambia, se mantiene)
Es decir, si , entonces:

e) En general, la varianza cumple con la siguiente propiedad:


si , entonces
3.6 DESVIACIÓN ESTÁNDAR O TÍPICA

El problema de la varianza es que no tiene interpretación práctica por sus


unidades cuadráticas. Si queremos que la medida de dispersión sea de la misma
dimensión que las observaciones bastará tomar su raíz cuadrada. Por ello se
define la desviación estándar, como la raíz cuadrada positiva de la varianza, es


decir: 𝑛

∑ ( 𝑥 𝑖 − 𝑋 )2
𝑖 =1
𝑆 𝑥= , para datos no agrupados
𝑛 −1


𝑘

∑ ( 𝑥𝑖− 𝑋 ) 2
𝑓𝑖
𝑖 =1
𝑆 𝑥= , para datos agrupados
𝑛 −1
Nota: La desviación estándar también se puede calcular directamente con cualquier paquete estadístico
o con calculadora usando el modo estadístico
Ejemplo 4

En el ejemplo 3, se calculó la varianza de los gastos semanales (en soles) de


una muestra del personal administrativo de una empresa de cemento en
Lima. En ese caso la desviación estándar resulta

𝑆 𝑥= √ 28505,08=168,83
INTERPRETACIÓN:

Se puede decir que la cantidad típica en que los gastos semanales de los
trabajadores difieren del gasto semanal promedio es 168,83 soles.
3.6.1 Propiedades de la desviación estándar

a) Para cualquier conjunto de datos la desviación estándar es siempre una


cantidad no negativa.

b) Si las observaciones tienen valores iguales, entonces la desviación


estándar es 0; es decir, la desviación estándar de una constante es 0; .
Si entonces:.
c) La desviación estándar del producto de una constante por una variable es igual
al valor absoluto de la constante por la desviación estándar de la variable. Es
decir, si , entonces
d) La desviación estándar de la suma de una variable más o menos una
constante, es igual a la desviación estándar de la variable.
Es decir, si , entonces

e) En general, la desviación estándar cumple con lo siguiente:


si , entonces

f) La desviación estándar tiene la propiedad de que en el intervalo se encuentra al


menos el 75% de los datos. Incluso si tenemos muchos datos y estos provienen de
una distribución simétrica, podremos llegar al 95% o más.
Ejemplo 5

En un centro comercial de venta de partes de computadora, se seleccionó una muestra de


25 agentes de venta, a quienes se les preguntó cuánto habían ganado de comisiones () la
semana pasada. Los datos recolectados, en nuevos soles, son:

300 420 300 170 230 130 260 170 300 260 260 170 300

420 70 80 260 440 80 300 420 230 130 230 300

a) Si las comisiones de los agentes se incrementaron en 10% más una bonificación de


20 soles, calcule e interprete la desviación estándar.

b) ¿Qué porcentaje de datos como mínimo se concentra en el intervalo


Solución 25

∑ 𝑥𝑖 300+ 420+ …+230+ 300 6230


𝑖=1
a) La media aritmética de los datos es𝑋 = = = = 249 ,20
𝑛 25 25

La varianza y desviación estándar de los datos son respectivamente

𝑆 𝑥 = √11566=107 , 55
25

∑ 𝑥2
𝑖 − 𝑛 𝑋
2

𝑖 =1
𝑆2
𝑥= =1830100 − 25 ¿ ¿
𝑛 −1

Se define la variable , entonces se tiene 𝒀 =𝟏,𝟏 𝑿 +𝟐𝟎


𝑆 𝑦=𝑆 ( 1,1 𝑋+20 ) =1,1𝑆 𝑥=1,1×107,55=118,31
Interpretación: Se puede decir que después del aumento, la cantidad típica en que las
comisiones difieren de la comisión promedio es 118,31 soles.

b) Con estos datos el intervalo ( 𝑋 −2𝑆 𝑥 ;𝑋+2 𝑆𝑥 )=( 249,2−2×107,55;249,2+2×107 ,55 )=(34 ,1;464 ,3)
es Por lo tanto, observamos que en este caso el 100% de los datos están en el intervalo , tal como
indica la propiedad “f” de la desviación estándar.
3.7 COEFICIENTE DE VARIACIÓN
Es la medida relativa de variabilidad que se define como la relación entre la
desviación estándar y la media aritmética. Dicho concepto se utiliza para
calcular el nivel de desviación de una serie de datos respecto al valor promedio
o media aritmética y está dado por:
%

El coeficiente de variación (ya que no tiene unidades) se expresa en porcentaje y


se utiliza para:

 Medir el grado de variabilidad de un conjunto de datos.


 Comparar el grado de variabilidad entre dos o más distribuciones aun
cuando las unidades de medida de las variables están expresadas en
diferentes unidades o escalas de medición.
3.7.1 Interpretación del coeficiente de variación

Rango del Interpretación Nivel de variabilidad

0%< <5% Datos muy homogéneos


Baja

5 %≤ < 10 % Datos homogéneos variabilidad

10 % ≤ < 15 % Datos regularmente homogéneos


Moderada

15 % ≤ < 20 % Datos regularmente heterogéneos variabilidad

20 % ≤ < 25 % Datos heterogéneos


Alta

≥ 25 % Datos muy heterogéneos variabilidad


Ejemplo 6
Con la finalidad de conocer el nivel de variabilidad de los gastos semanales (en soles) del
personal administrativo de una empresa de cemento en Lima, en el mes de enero del 2016, se
seleccionó una muestra de 30 personas. Los datos resumidos y los cálculos correspondientes
se presentan en la tabla 4.4.
=
Tabla N° 4.4 Distribución de empleados según gasto semanal
Gasto 𝑆 𝑥 = √ 28 505 , 08=168 , 83
[200 ; 400) 300 0 0 0
[400 ; 600) 500 1 500 250 000 Luego, el coeficiente de variación es
[600 ; 800) 700 4 2 800 196 000 168 , 83
𝐶𝑉 𝑥 = ×100 %=17 , 47 %
[800 ; 1 000) 900 9 8 100 729 000 966,667
[1 000 ; 1 200) 1 100 16 17 600 1 936 000 Interpretación: La variabilidad de los
Total ----- 30 29 000 28 860 000 gastos semanales del personal
5
administrativo de la empresa de cemento
∑ 𝑥𝑖 𝑓 𝑖 29 000
es moderada, son gastos regularmente
𝑋=
𝑖=1
= = 966,667 heterogéneos.
30 30
Ejemplo 7
Con el propósito de comparar la homogeneidad de las utilidades mensuales (en
nuevos soles) de las pequeñas empresas frente a las grandes empresas del sector
transporte, se han seleccionado 2 muestras de este tipo de empresas, cuyos
resultados se resumen a continuación:

Tipo de empresa

Pequeña empresa 40 6 500 430

Gran empresa 25 68 700 14 500


El coeficiente de variación para las pequeñas empresas es
430
𝐶𝑉 1 = ×100 %=6 , 62 %
6 500
El coeficiente de variación para las grandes empresas es
14 500
𝐶𝑉 2= × 100 %=21 , 11%
68 700
Como , se concluye que las pequeñas empresas generan utilidades más
homogéneas entre ellas (sólo 6,62 % de variabilidad) en comparación con las
grandes empresas (con 21,11 % de variabilidad).
SONDEO 2

Respuesta
Es la medida estadística de variabilidad
absoluta que no utiliza todas las
observaciones (solo dos de ellas):
Es la única medida estadística de
variabilidad absoluta que no tiene
interpretación práctica:
Es la medida estadística de variabilidad
relativa que permite comparar el grado
de variabilidad entre dos o más
distribuciones:
Pregunta Respuesta
Es la medida estadística de variabilidad
Rango o amplitud
absoluta que no utiliza todas las
total
observaciones (solo dos de ellas):
Es la única medida estadística de
variabilidad absoluta que no tiene Varianza
interpretación práctica:
Es la medida estadística de variabilidad
relativa que permite comparar el grado Coeficiente de
de variabilidad entre dos o más variación
distribuciones:
Ejercicio 1

•Las siguientes son las notas


de una sección del curso
6 9 10 11 11 20
Cálculo II del ciclo anterior de
una universidad de Lima. La 6 9 10 11 12 20
sección es del turno de la
mañana y tiene 30 alumnos.
8 9 11 11 12 20
8 10 11 11 12 20
8 10 11 11 12 20
Resuma la información con las siguientes medidas estadísticas de tendencia central y
posición completando el siguiente cuadro de medidas de resumen:

Medida Valor Valor Promedio Mediana Moda Primer Tercer


mínimo máximo cuartil cuartil

Con los resultados obtenidos determine e interprete el rango , el rango intercuartil ,


la desviación estándar y el coeficiente de variación .
SOLUCIÓN

Medida Valor Valor Promedio Mediana Moda Primer Tercer


mínimo máximo cuartil cuartil

6 20 11,67 11,00 11.00 9 12

el rango o amplitud total, es decir la diferencia entre la nota más alta y la más baja, es 14
puntos.
, el 50% central de las notas de Cálculo II tienen notas que se encuentran entre 9 y 12, que
equivale a un rango intercuartil de 3 puntos.
SOLUCIÓN

Medida Promedio Varianza Desviación Coeficiente de


estándar variación
(%)
11,67 16,851 4,105 35,18

la cantidad típica en que las notas difieren de la nota promedio es de 4,105


puntos.
, la variabilidad de las notas es alta y, por tanto, las notas son muy
heterogéneas.
Ejercicio 2

•Las siguientes son las


notas de una sección del
curso Cálculo II del ciclo
anterior de una universidad
de Lima. La sección es del
turno de la mañana y tiene
40 alumnos. Los datos se
presentan en la siguiente
tabla de frecuencia.
Resuma la información con las siguientes medidas estadísticas de tendencia
central y posición completando el siguiente cuadro de medidas de resumen:

Medida Promedio Mediana Moda Primer Tercer


cuartil
cuartil

Con los resultados obtenidos determine e interprete: el rango intercuartil ,


la desviación estándar y el coeficiente de variación .
SOLUCIÓN

Medida Promedio Mediana Moda Primer Tercer


cuartil cuartil

12,90 13,40 13,92 11,44 14,73

, el 50% central de las notas de Cálculo II tienen notas que se encuentran


entre 9 y 12, que equivale a un rango intercuartil de 3,29 puntos.
SOLUCIÓN

Medida Promedio Varianza Desviación Coeficiente de


estándar variación (%)

12,90 6,554 2,56 19,85

la cantidad típica en que las notas difieren de la nota promedio es de 2,56 puntos.
, la variabilidad de las notas es moderada y, por tanto, las notas son regularmente
heterogéneas.

También podría gustarte