Está en la página 1de 31

MEDIDAS DE VARIABILIDAD

PROFESOR: ROLAND
ALCANTARA R.

 Rango
 Rango intercuartil
 Variancia
 Desviación estándar
 Coeficiente de variabilidad

1
Introduccion

Cuando se dispone de
información de una 

variable es necesario   
     
conocer si los datos
     
recopilados muestran    
una variabilidad
significativa.

2
Idea de dispersión
Si los datos son muy semejantes entre si, se
observará que no se encuentran muy dispersos con
respecto a la media; sin embargo, cuando los datos
presentan diferencias importantes entre si, se
apreciara que los datos son muy dispersos.

A B
3
Importancia de una medida
de dispersión

En todo análisis estadístico el grado de


variabilidad es importante pues de esto
depende el grado de confiabilidad de las
estimaciones que se realicen.

4
 Rango
Es la diferencia entre el valor máximo de
las observaciones y el valor mínimo de las
observaciones.
R= Obs. Mayor – Obs. Menor
Nos da una idea muy rápida de dispersión.

 Rango intercuartil
RIC=Q3-Q1
también nos da idea de dispersión pero en
el 50% central de los datos. 5
 Varianza

Es el promedio de las desviaciones de las


observaciones con respeto a su media, es
una medida de variabilidad absoluta.
N

 iX   2
Varianza
  2 i 1
und 2
poblacional
N

n

 i  2


X X
X 2
 n X 2
Varianza
s 
2 i 1
u 2
muestral
n 1 n 1 6
Desviación estándar

Se define como la raíz cuadrada de la


varianza. Tiene las mismas unidades que los
datos.

s  Varianza

7
Ejemplo:
Las notas de dos estudiantes X e y en cierto curso son:
X: 12, 13 y 14; Y: 10, 13 y 16
di  X i  X desviación (muestra)
di  X i   desviación (población)

(12  13) 2
 (13  13) 2
 (14  13) 2
2 2
X 
2
 puntos2 ;  X  puntos
3 3 3

(10  13) 2
 (13  13) 2
 (16  13) 2
 Y2   6 puntos 2 ;  Y  6 puntos
3 8
Coeficiente de Variación

Es una medida de dispersión relativa que es


fácilmente comparable con otro coeficiente de
variación de otro conjunto de observaciones. El
resultado se expresa en porcentaje. Mientras
menor es el cv, menor es la dispersión de los
datos.


Población: CV=  100%

S
Muestra: CV= 100%
x 9
 Ejemplo

Sueldo de los Sueldo de los


empleados de la gerentes de la
compañía ABC compañía ABC

Media 2350 6890


Desv Est 655 1050
Coef Var 27,87% 15,24%

10
¿Cuando se considera que una
observación es un outliers?
Un xi es considerado un outliers si no
pertenece al intervalo [A,B], donde
A= Q1-1,5 RIC
B= Q3+1,5 RIC

11
MEDIDAS DE FORMA

Asimetría y Curtosis

12
Simetría y Asimetría

13
MEDIDA DE ASIMETRÍA
 Distribución simétrica: Cuando su curva de frecuencia es
simétrica con respecto al centro de los datos, en este caso
=Me=Mo.

14
Distribución asimétrica positiva >Me>Mo

Distribución asimétrica negativa <Me<Mo

15
 Coeficiente de asimetría de Pearson
3(   Me)   Mo Poblacional
As  
 

3( x  me) x  mO Muestral
aS  
s s

Observación:
1. Si as= 0 distribución simétrica
2. Si as< 0 distribución asimétrica negativa
3. Si as> 0 distribución asimétrica positiva 16
Curtosis
El Coeficiente de Curtosis analiza el grado de
concentración que presentan los valores alrededor
de la zona central de la distribución.

Q3  Q1 P75  P25
KU  
2( D9  D1 ) 2( P90  P10 )

Leptocúrtica Platicúrtica Mesocúrtica


Ku > 0,263 Ku = 0,263 Ku < 0,263
17
Curtosis
Se definen 3 tipos de distribuciones según su grado de curtosis:

Distribución mesocúrtica: presenta un grado de concentración


medio alrededor de los valores centrales de la variable (el mismo
que presenta una distribución normal).

Distribución leptocúrtica : presenta un elevado grado de


concentración alrededor de los valores centrales de la variable.

Distribución platicúrtica: presenta un reducido grado de


concentración alrededor de los valores centrales de la variable.
18
Diagrama de caja

Un diagrama de caja es una gráfica que describe la


distribución de un conjunto de datos tomando como
referencia los valores de los cuartiles como medida
de posición y el valor del rango intercuartil como
medida de referencia de dispersión.

Diagrama de caja de la Resistencia

20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39

Resistencia 19
Diagramas de cajas
Permite:
Comparar las
medianas de dos o mas
conjuntos de datos.
Observar el tipo de
distribución de los datos
(simétrica o
asimétrica).
Determinar la
dispersión en el 50%
central de los datos.
Identificar la presencia
de valores extremos
(datos atípicos)

20
Construcción de un diagrama de caja

1. Se calcula: Q1, Q2 , Q3 , RIC y 1,5RIC.


2. Se traza una línea de referencia horizontal o vertical (para la
escala)
3. Se traza un rectángulo con los extremos en el primer y tercer
cuartil y se traza una recta vertical en la mediana.
4. Se dibujan los límites a 1,5 rango intercuartil de los cuartiles 1 y
3, Se considera que los datos fuera de estos límites son atípicos.
Li =Q1-(1,5)RIC; Ls=Q3 +(1,5)RIC.
5. Las líneas antes y después de las cajas se llaman bigotes, se
traza desde los extremos de la caja hasta el mínimo y máximo
dentro de los límites inferior y superior.
6. Se marcan con un asterisco los valores fuera de los límites
(valores atípicos).

21
bigot
e
Ejemplo

Se desea analizar el consumo de gas natural en los hogares de


un distrito limeño, el gasto mensual en este combustible, en
nuevos soles de 36 hogares se muestra a continuación.

20,6 21,2 21,8 23,5 24 24,3 24,5 24,6 24,6

24,6 24,8 24,9 25 25,2 25,4 26,3 27,1 27,3

27,5 28,3 28,4 28,6 29,3 29,4 29,5 29,5 29,5

29,6 30,4 30,4 30,9 31,5 32,4 32,5 32,7 37,6

Realice un diagrama de caja con esta información. Comente el


resultado. 22
Solución
Después de ordenar los datos:
1. Cálculos: Q1=24,60; Q2 = 27,40 Q3 = 29,53
RIC = 4,93 1,5RIC = 7,395
 LI = 24,60 – 7,395 = 17,205
 LS = 29,53+7,395 = 36,925
2. Construcción de la escala:

23
Construcción
 Trazamos la caja con los extremos en Q1 y
Q3 y ubicamos la mediana (Q2)

24
Trazado de los límites

 Se ubican y trazan los límites en los


puntos 17,205 y 36,925.

25
Ubicación y trazado de los bigotes
 El dato más pequeño entre el límite inferior y Q1 es
20,6
 El dato más grande entre el límite superior y Q3 es
32,7
 Ubicamos estos valores y los bigotes se extienden
hasta estos puntos.

26
Valores atípicos
37, 6 es un valor atípico, pues es mayor al
valor del límite superior y se marca con un
asterisco.

27
Finalmente:

28
Ejercicio

Dos modos que usan los empleados para ir a


trabajar diariamente son el transporte público y
privado (automóvil), A continuación vemos unas
muestras de tiempos en minutos de cada modo:

Público 28 29 32 37 33 25 29 32 41 34
privado 29 31 33 32 34 30 31 32 35 33

Trace un diagrama de caja para cada modo y en


base a los resultados obtenidos, ¿Qué modo de
trasporte debe preferirse?, Explique sus razones.
29
Solución

30
Ejercicios propuestos
 Resuelva los ejercicios de las páginas 107
a 109 del libro “Estadística para
Administración y Economía” de Anderson,
David R 10ª edición.

31

También podría gustarte