Está en la página 1de 11

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD DE INGENIERIA DE SISTEMAS E INFORMATICA


E. A. P. DE INGENIERIA DE SOFTWARE

Semana 5
Medidas de dispersin: Rango, varianza y sus propiedades, desviacin estndar.
Coeficiente de variacin. Medidas de asimetra y apuntamiento.

MEDIDAS DE DISPERSION
Son indicadores estadsticos que representan cuan dispersas se encuentran los datos
de la variable, sealndonos el grado de concentracin de los mismos con respecto al
promedio de la distribucin.
Las medidas de dispersin ms usuales son:

Rango
Rango intercuartilico
Varianza
Desviacin Estndar
Coeficiente de Variacin

Las medidas de dispersin se usan para:


a) Verificar la confiabilidad de los promedios.
b) Establecer como base para el control de la variable. As tenemos:
Alta dispersin (medida de dispersin alta) --- baja concentracin alrededor del
promedio. DATOS HETEROGENEOS
Baja dispersin (medida de dispersin baja) -- Alta concentracin alrededor del
promedio. DATOS HOMOGENEOS
RANGO.El rango de una variable es la diferencia entre el valor mximo y su valor mnimo y se
define como:
R = Xmax - Xmin
Su uso es muy limitado, pues solo toma en cuenta los valores extremos.
Ejemplo:

La edad de 10 alumnos en un aula de clase, es segn se muestra a continuacin. Se


pide hallar el rango.
23

18

28

18

16

26

19

20

21

18

Solucin.
Rango = 28 16 = 12
Luego, existe una dispersin de 12

aos.

RANGO INTERCUARTILICO
Se le llama rango intercuartlico o rango intercuartil, a la diferencia entre el tercer y el
primer cuartil de una distribucin. A diferencia del rango, se trata de un estadstico
robusto.
El rango intercuartlico es una medida de variabilidad adecuada cuando la medida de
posicin central empleada ha sido la mediana.

RI =Q3 Q1

Ejemplo: Calcular e interpretar el RI para el siguiente conjunto de edades:


20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48
Q1 = 22
Q3 = 51
RI = 5122 = 29 aos
Interpretacin:
29 aos es la distancia existente en el 50% central de la distribucin.

VARIANZA Y DESVIACION ESTANDAR

Son medidas de dispersin o variabilidad de los datos. La variancia se define como


las desviaciones al cuadrado con respecto al promedio (
o S2). As tambin se
le conoce como el promedio de la dispersin en la distribucin de una variable.

La desviacin estndar, es la raz cuadrada de la variancia y se representa por


es poblacional y por S si es muestral.
o

A) DATOS SIN AGRUPAR.VARIANCIA:

Donde:
Xi
N
n

valores de la variable X
tamao de la poblacin
tamao de la muestra

S2

Varianza poblacional
Varianza muestral

DESVIACION STANDARD:

Donde:
S

Desviacin estndar poblacional


Desviacin estndar muestral

S= S2

si

Ejemplo 1
En una de las fbricas de Motor Per, se producen autos de diversas marcas, desde
enero a agosto de 2010
Meses:
Produccin:

Ene
100

Feb
130

Mar
90

Abr
120

May
100

Jun
140

Jul
110

Agos
98

Defina la variable en estudio y halle la varianza y Desviacin Standard.


Variable:
Varianza:
Desviacin estndar:
B.- DATOS AGRUPADOS.Cuando los datos estn en una tabla de distribucin de frecuencia, la varianza se halla
segn la frmula:

donde:
fi = frecuencia absoluta simple de cada clase o grupo
mi = marcas de clase de cada clase o grupo.
N = tamao de la poblacin.
n = tamao de la muestra
= Varianza poblacional
S2 = varianza muestral

Nota.- No olvidar que la Desviacin estndar es la raz cuadrada de la


varianza.
Ejemplo.Se tiene informacin para 2007 de la edad de los alumnos ingresantes a la Facultad de
Sistemas de la UNMSM. Se pide:
Calcular la varianza y la desviacin estndar
Grupo de Edad
[15 - 17>

fi
27

[17 - 19>
[19 - 21>
[21 23]
Total

7
0
1
35

Calculando la varianza (cuadro auxiliar)


Grupo de
Edad
[15 - 17>
[17 - 19>
[19 - 21>
[21 23]

xi

fi

(xi

)2

27
7
0
1
35

(xi

)2 . fi

Observacin: la frmula de la varianza en forma abreviada quedara del siguiente


modo:
Datos no agrupados
Datos agrupados
x i2n x 2

S=
2

n1

x i2 f in x 2

S=
2

n1

Propiedades:

La varianza es nica y siempre existe.


La varianza es afectada por valores extremos.
El mayor inconveniente de la varianza es que su unidad de medida es el

cuadrado de la unidad de medida de los datos originales.


Si la varianza es cero, todas las mediciones deben tener el mismo valor.
Tan grande como sea el valor de la varianza lo ser tambin la variabilidad del

conjunto de datos.
Si z=x a
entonces
Si z=a . x
entonces

COEFICIENTE DE VARIACION.Es el grado de desviacin con relacin a la media. Este coeficiente se usa para
comparar las medias aritmticas o promedio de diferentes muestras.

Nota.- Cuanto menor es el C.V. mejor ser la estimacin del promedio y el proyecto
ser mejor.

Donde:
C.V.

coeficiente de variacin de la poblacin

c.v

coeficiente de variacin muestral

Desviacin estndar poblacional

Media aritmtica poblacional

Desviacin estndar muestral

Media aritmtica muestral

Ejemplo.Considerar dos proyectos de inversin A y B. Ambos tienen una ganancia promedio


igual a $ 500. La Desviacin estndar es 63.25 y 516.20 respectivamente. Halle cul
de los dos proyectos es mejor.
Solucin:

C.V.

500

500

63.25

516.20

MEDIDAS DE FORMA
Comparan la forma que tiene la representacin grfica, bien sea el histograma o el
diagrama de barras de la distribucin, con la distribucin normal.
MEDIDA DE ASIMETRA
Diremos que una distribucin es simtrica cuando su mediana, su moda y su media
aritmtica coinciden.
Diremos que una distribucin es asimtrica a la derecha si las frecuencias (absolutas o
relativas) descienden ms lentamente por la derecha que por la izquierda.
Si las frecuencias descienden ms lentamente por la izquierda que por la derecha
diremos que la distribucin es asimtrica a la izquierda.
Existen varias medidas de la asimetra de una distribucin de frecuencias.

Primer Coeficiente de Asimetra de Pearson:

Segundo Coeficiente de Asimetra de Pearson:


As=

3( X Me)

El Coeficiente de Pearson vara entre -3 y 3


Si As < 0

la distribucin ser asimtrica negativa.

Si As = 0

la distribucin ser simtrica.

Si As > 0

la distribucin ser asimtrica positiva.

Medida de Yule Bowley o Medida Cuartlica

La Medida de Bowley vara entre -1 y 1

Si As < 0

la distribucin ser asimtrica negativa.

Si As = 0

la distribucin ser simtrica.

Si As > 0

la distribucin ser asimtrica positiva.

Leptocrtica.- Existe una gran concentracin.


Mesocrtica.- Existe una concentracin normal.
Platicrtica.- Existe una baja concentracin.

MEDIDA DE APUNTAMIENTO O CURTOSIS


Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se
definen 3 tipos de distribuciones segn su grado de curtosis:
Distribucin mesocrtica:
Presenta un grado de concentracin medio alrededor de los valores centrales de la
variable (el mismo que presenta una distribucin normal).
Distribucin leptocrtica:
Presenta un elevado grado de concentracin alrededor de los valores centrales de la
variable.
Distribucin platicrtica:
Presenta un reducido grado de concentracin alrededor de los valores centrales de la
variable.

CALCULO DE LA CURTOSIS:
Ap=

m4
S4

4 fi
(Xi X)

=
n S4

Ejemplo: Calcular el grado de apuntamiento del siguiente conjunto de datos:

Polgono
Histograma
de
Orientaci
Hombre
14
25
18
29
Sexo
1
9
No
Mujer
Derecha
Izquierda
OBJETIV
2 Ojiva
0
saben/No
OBJETI
Representacione
Distribucin
Variables
frecuencia
Circulares
sLineales
Barras
graficas
n
opinan
OS
Poltica
VOS
Cualitativas
Cuantitativa
de
2de la
Importanci
Clasificaci
Definicion
Rol
frecuencias
s discretas
Al
es
Estadstic
bsicas
Al
n
a
Variabl
Al
terminar
atermin
en

TAB
LAS
DE
es
terminar

Medida basada en Cuartiles y Percentiles

K=

Q 3Q1
2( P 90P 10)

Nota:
Si K < 0,263

la distribucin es platicrtica

Si K = 0,263

la distribucin es normal o mesocrtica

Si K > 0,263

la distribucin es leptocrtica