4
Universidad
Nacional Mayor de
San Marcos
ESTADISTICA Y
PROBABILIDADES
Medidas de
DISPERSIN
William Jaime Len Velsquez
wjleonv@yahoo.com
MEDIDAS
DE
DISPERSION
Ing. William Len Velsquez
MEDIDAS DE DISPERSIN
Las Medidas de Dispersin, son
indicadores de variabilidad y cuya
importancia reside en la necesidad
de tomar decisiones, basadas en
estadsticas bsicas.
DEFINICIN
ING.
WILLIAM
LEON V.
MEDIDAS DE DISPERSIN
Ejemplo:
Se tiene una produccin de franelas y se sabe
que semanalmente se producen un promedio
de 500 franelas, se puede decir que todos los
das se producen 100 franelas
Nada nos garantiza eso porque podran
producirse en slo dos das 250 franelas y el
promedio semanal nos dara un valor idntico,
DEFINICIN
ING.
WILLIAM
LEON V.
MEDIDAS DE DISPERSIN
Si adicionalmente nos informan que tiene
una variacin de 5 franelas, tendremos
entonces una mejor comprensin del
proceso, pues este ltimo nmero nos
indica que semanalmente se producen
entre 495 y 505 franelas, es decir, que
diariamente s se deben producir
aproximadamente 100 franelas.
DEFINICIN
ING.
WILLIAM
LEON V.
MEDIDAS DE DISPERSIN
La Dispersin se refiere a la variabilidad
entre los valores, es decir, qu tan
grandes son las diferencias entre los
valores.
La idea de dispersin se relaciona con la
mayor o menor concentracin de los
datos en torno a un valor central,
generalmente la media aritmtica.
DEFINICIN
ING.
WILLIAM
LEON V.
MEDIDAS DE DISPERSIN
Ejemplos:
Observe las dos figuras. La primera presenta una distribucin con
datos ms concentrados alrededor de su promedio 400 que la otra
figura con respecto a su promedio 800, es decir la primera figura es
una distribucin con menos dispersin.
DEFINICIN
ING.
WILLIAM
LEON V.
MEDIDAS DE DISPERSIN
Ejemplos:
Las figuras siguientes muestran a tres distribuciones
con promedio 70, sin embargo las tres difieren en
cuanto a su variabilidad alrededor de la media.
poca variabilidad
alguna variabilidad
DEFINICIN
gran variabilidad
ING.
WILLIAM
LEON V.
MEDIDAS DE DISPERSIN. EJEMPLO
Se tienen dos grupos de estudiantes que sometidos a una prueba arrojaron
los siguientes puntajes:
GRUPO A
GRUPO B
Puntaje
N
estudiantes
Puntaje
N estudiantes
11
10
12
10
11
13
13
Total
20
15
17
Total
20
9
EJEMPLO
ING.
WILLIAM
LEON V.
MEDIDAS DE DISPERSIN
Al calcular el promedio aritmtico para ambos grupos se
obtiene:
xB
12
Este resultado puede conducir a conclusiones equivocadas
cuando se est comparando distribuciones,
Pues se podra pensar que ambas secciones son idnticas en su
rendimiento,
ING. WILLIAM LEON V.
EJEMPLO
10
MEDIDAS DE DISPERSIN
Siendo esta conclusin falsa ya que observando
los datos se aprecia que la seccin B es ms
homognea.
Por lo tanto
En este caso el promedio no tiene suficiente
grado de representatividad por lo tanto poco
podr describirnos acerca de los datos en
estudio.
11
EJEMPLO
ING.
WILLIAM
LEON V.
MEDIDAS DE DISPERSIN
Xi
Es necesario entonces calcular otras
medidas estadsticas para mostrar
cmo varan los datos alrededor del
promedio y esto se logra mediante las
medidas de dispersin.
12
EJEMPLO
ING.
WILLIAM
LEON V.
FUNCIONES DE LAS MEDIDAS DE DISPERSIN
1.- Para evaluar la confiabilidad del promedio que se
est utilizando:
Una dispersin pequea indica que los datos se
encuentran acumulados muy cerca, alrededor de la
medida de tendencia central establecida.
Por tanto, la medida de tendencia central se considera confiable o bastante
representativa de los datos.
Por el contrario, una dispersin grande indica que la medida escogida para
representar los datos no es muy confiable, es decir, no es muy representativa de
los datos.
Es necesario estudiar las medidas de dispersin:
13
ING.
WILLIAM
LEON V.
FUNCIONES DE LAS MEDIDAS DE DISPERSIN
2.- Para apreciar cun dispersas estn dos o ms
distribuciones:
Para poder comparar dos distribuciones de
frecuencias entre s, no slo necesitamos la medida
de tendencia central, sino tambin la dispersin
entre las observaciones para no elaborar
conclusiones errneas.
A mayor medida de dispersin
heterogneo.
A menor medida de dispersin
homogneo o uniforme.
Es necesario estudiar las medidas de dispersin:
el grupo es ms
el grupo es ms
14
ING.
WILLIAM
LEON V.
MEDIDAS DE DISPERSIN ABSOLUTA
Cuantifican
el
grado
de
concentracin o de dispersin de
los valores de la variable en torno
de un promedio de la distribucin.
15
MEDIDAS DE DISPERSIN ABSOLUTA
ING.
WILLIAM
LEON V.
MEDIDAS DE DISPERSIN ABSOLUTA
Principales medidas de dispersin absoluta:
Rango
o Recorrido
Varianza
Desviacin
: S2
Estndar : S
16
MEDIDAS DE DISPERSIN ABSOLUTA
: R
ING.
WILLIAM
LEON V.
RANGO O RECORRIDO:
Es la diferencia entre los valores mximo y
mnimo de los datos.
X mx
X mn
Esta medida es muy fcil de calcular sin
embargo no es muy recomendable porque slo
toma en cuenta los valores extremos, sin
considerar los dems valores.
17
MEDIDAS DE DISPERSIN ABSOLUTA
ING.
WILLIAM
LEON V.
RANGO O RECORRIDO:
Interpretacin de Rango:
El Rango se puede interpretar como la
amplitud existente entre una serie de datos,
Es decir,
mide cun lejos est el valor ms pequeo
y el valor ms grande de la muestra o
poblacin.
18
MEDIDAS DE DISPERSIN ABSOLUTA
ING.
WILLIAM
LEON V.
RANGO O RECORRIDO:
Ejemplo
Se tiene una produccin de franelas y se sabe que
diariamente se producen un promedio de 500
franelas. Si un da se produce un mnimo de 415
franelas y otro da se produce un mximo de 573
franelas entonces el RANGO de produccin estar
entre 158 franelas, es decir,
Podemos tener una produccin de 158 franelas a
partir del valor mnimo.
19
MEDIDAS DE DISPERSIN ABSOLUTA
ING.
WILLIAM
LEON V.
VARIANZA S2 , V X
Es un valor numrico que cuantifica el
grado de dispersin de los valores de una
variable respecto a su media aritmtica.
Es el promedio de los cuadrados de las
desviaciones de la variable respecto a su
media aritmtica.
Xi
x
20
MEDIDAS DE DISPERSIN ABSOLUTA
2
ING.
WILLIAM
LEON V.
VARIANZA S2 , V X
Notacin:
Varianza muestral.
Varianza poblacional.
21
MEDIDAS DE DISPERSIN ABSOLUTA
ING.
WILLIAM
LEON V.
VARIANZA S2 , V X
Nota:
La varianza nunca es negativa.
Cuando la variable toma un nico valor; es
decir cuando es constante entonces la
varianza es cero.
Mientras ms se aproxima a cero, ms
concentrados estn los valores de la serie
alrededor de la media. Por el contrario,
mientras mayor sea la varianza, ms
dispersos estn.
22
MEDIDAS DE DISPERSIN ABSOLUTA
ING.
WILLIAM
LEON V.
2
S
para datos no agrupados:
V( x )
1
n
2
X
i
23
MEDIDAS DE DISPERSIN ABSOLUTA
Xi
n
ING.
WILLIAM
LEON V.
2
S
para datos no agrupados:
Ejemplo:
Calcular e interpretar la varianza de los pesos de un grupo de personas.
Los datos son los siguientes:
56 65 68 70 72 76 78 80
24
MEDIDAS DE DISPERSIN ABSOLUTA
ING.
WILLIAM
LEON V.
S2 para datos no agrupados:
Ejemplo:
Xi
i 1
n=8
S2
X
1
7
40 329
565
X2
i
i 1
565
2
60,84
25
MEDIDAS DE DISPERSIN ABSOLUTA
40 329
61 kilos 2
ING.
WILLIAM
LEON V.
2
S
para datos no agrupados:
Ejemplo:
En promedio los pesos del
grupo de personas, se alejan
con respecto al promedio
aritmtico
en
aproximadamente 61 kilos al
cuadrado.
26
MEDIDAS DE DISPERSIN ABSOLUTA
ING.
WILLIAM
LEON V.
S2 para datos agrupados
a) Si n < 30 :
S2
X
1
n
1 i 1
fi X 2
i
27
MEDIDAS DE DISPERSIN ABSOLUTA
fi X i
i 1
n
ING.
WILLIAM
LEON V.
S2
para datos agrupados
28
Ejemplo:
1.- Calcular e interpretar la varianza para la siguiente tabla de
frecuencias.
Edad
Ii
4- 6
6 - 10
10 - 16
16 - 20
20 - 30
Total
N de
personas
n = 20
fi
4
5
7
3
1
n = 20
MEDIDAS DE DISPERSIN ABSOLUTA
n < 30
ING.
WILLIAM
LEON V.
S2 para datos agrupados
Ejemplo:
k
V( X )
1
n
k
1 i 1
fi X 2
i
fi X i
i 1
n
2
1
19
3200
20
230
20
V ( X ) = 29,21
29 aos2
En promedio la edad de estas personas se aleja con
respecto a su promedio aritmtico en aproximadamente
29 aos al cuadrado.
29
MEDIDAS DE DISPERSIN ABSOLUTA
ING.
WILLIAM
LEON V.
S2 para datos agrupados
b) Si n
30 :
Usando
absolutas:
k
S2
i 1
fi X 2
i
n
Usando frecuencias
relativas:
frecuencias
k
fi X i
i 1
n
S2
hi X2
i
i 1
30
MEDIDAS DE DISPERSIN ABSOLUTA
hi Xi
i 1
ING.
WILLIAM
LEON V.
S2 para datos agrupados
Ejemplo:
Calcular e interpretar la varianza de la siguiente tabla.
Peso
Ii
N de
ingenieros
fi
50 - 60
60 - 70
70 - 80
10
80 - 90
90 -100
Total
n = 40
MEDIDAS DE DISPERSIN ABSOLUTA
n = 40
n > 30
31
ING.
WILLIAM
LEON V.
S2 para datos agrupados
Ejemplo:
k
S2
i 1
fi X 2
i
n
fi X i
i 1
n
236 400
40
3030
40
2
171,94
En promedio el peso de los ingenieros se aleja con
respecto al peso promedio en aproximadamente 172 kilos
al cuadrado.
32
MEDIDAS DE DISPERSIN ABSOLUTA
ING.
WILLIAM
LEON V.
VARIANZA TOTAL O GLOBAL
Si una muestra de tamao n se particiona en k muestras de
tamao
cada una con su correspondiente promedio
aritmtico,
su varianza
..
nk
x2
xk
S22
..
S k2
n1
n2
x1
S12
MEDIDAS DE DISPERSIN ABSOLUTA
33
ING. WILLIAM LEON V.
VARIANZA TOTAL O GLOBAL
La varianza para los k grupos juntos se calcula mediante la
frmula:
S2
i 1
ni ( x i
n
S2
i )
ni x i
i 1
donde
ni
i 1
34
MEDIDAS DE DISPERSIN ABSOLUTA
ING.
WILLIAM
LEON V.
VARIANZA TOTAL O GLOBAL
Ejemplo:
Se tienen tres grupos, de seis, nueve y siete
estudiantes respectivamente. Si las notas
correspondientes a cada uno de ellos son:
Grupo 1: 12
16
08
11
10
12
Grupo 2: 17
14
07
13
11
18
13
Grupo 3: 10
13
11
08
12
09
12
35
MEDIDAS DE DISPERSIN ABSOLUTA
15
ING.
WILLIAM
LEON V.
14
VARIANZA TOTAL O GLOBAL
Ejemplo:
k
6 (11,52
S T2
7,1 )
9 ( 13,562
10,53 )
7 ( 10,712
3,24)
i 1
12,09
22
S T= 2,98
En promedio las notas de los estudiantes de los tres grupos se alejan con
respecto al promedio total en aproximadamente 3 puntos.
36
MEDIDAS DE DISPERSIN ABSOLUTA
ING.
WILLIAM
LEON V.
8,89
DESVIACIN ESTNDAR
Es la raz cuadrada positiva de la varianza
y posee las mismas unidades que la media
aritmtica,
Estas unidades ya no estn elevadas al
cuadrado como en la varianza.
V ( X)
37
MEDIDAS DE DISPERSIN ABSOLUTA
ING.
WILLIAM
LEON V.
DESVIACIN ESTNDAR
La desviacin estndar o desviacin tpica se obtiene para
simplificar la interpretacin de la varianza.
Cuando se calcula la varianza, se basa en datos elevados al
cuadrado, por lo que, el resultado obtenido debe
interpretarse en unidades al cuadrado;
por esta razn se obtiene la desviacin estndar como la raz
cuadrada de la variancia.
38
MEDIDAS DE DISPERSIN ABSOLUTA
ING.
WILLIAM
LEON V.
DESVIACIN ESTNDAR
Interpretacin de la Desviacin Estndar:
Es una medida que muestra la distancia
promedio de los valores observados con
respecto a su media.
La distancia de cada valor con su media se
mide tomando el valor absoluto de la
diferencia entre ese valor y la media, es
decir, es la distancia de cada dato respecto
a su promedio.
39
MEDIDAS DE DISPERSIN ABSOLUTA
ING.
WILLIAM
LEON V.
DESVIACIN ESTNDAR
Ejemplo :
Si se tiene una produccin de franelas y
sabemos que diariamente se producen un
promedio de 500 franelas, adicionalmente
tenemos tambin que la desviacin es de 25
franelas, tendremos entonces una mejor
comprensin del proceso pues este ltimo
nmero nos indica que diariamente se
producen entre 475 y 525 franelas
40
MEDIDAS DE DISPERSIN ABSOLUTA
ING.
WILLIAM
LEON V.
DESVIACIN ESTNDAR
Distribuciones con igual promedio aritmtico y
diferente desviacin estndar
=52
S=6
=52
S=24
=52
S=12
=52
S=12
ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIN ABSOLUTA
41
DESVIACIN ESTNDAR
Ejemplos:
1.- Si la desviacin tpica del salario de
los ingenieros de sistemas es
$1,000 y la media aritmtica es
$3,000,
Entonces los salarios de los
ingenieros fluctan entre $2,000 y
$4,000 dlares.
ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIN ABSOLUTA
42
DESVIACIN ESTNDAR
Ejemplos:
2.- Calcular la desviacin estndar de las notas
obtenidas por un grupo de alumnos del cuarto
ciclo de la Facultad de Ingeniera Industrial de
la UNMSM en la primera evaluacin de
estadstica.
12 07 14 11 16 18 09 14 10
ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIN ABSOLUTA
43
DESVIACIN ESTNDAR
Ejemplos:
n=9
Xi
i 1
X2
i
i 1
111
1 467
Por lo tanto:
VX
1
8
1 467
111
12,25
SX
12,25
ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIN ABSOLUTA
3,5 puntos
44
DESVIACIN ESTNDAR
Nota:
La varianza y la desviacin estndar se utilizan
para comparar grupos cuya variable est
expresada en las mismas unidades.
As, el grupo ms homogneo, ms uniforme o
en el que la media aritmtica es ms
representativa ser aquel en el cual la
varianza o la desviacin estndar es menor.
ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIN ABSOLUTA
45
DESVIACIN ESTNDAR
Ejemplo:
En varias semanas consecutivas, los
oficiales de polica: Martnez y Castro
aplicaron las siguientes infracciones por
exceso de velocidad:
Martnez : 31
Castro
: 35
38
43
42
38
32
37
39
33
26
28
27
Cul de los oficiales es ms homogneo con respecto al nmero de
infracciones?
ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIN ABSOLUTA
46
DESVIACIN ESTNDAR
Ejemplo:
Solucin:
S2
M
1
7 390
5
S2
C
208
6
2
35,87
S2
C
1
8 489
6
241
7
2
31,95
S2
M
El oficial Castro es ms homogneo en aplicar infracciones por
exceso de velocidad porque su varianza es menor.
ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIN ABSOLUTA
47
PROPIEDADES DE LA DESVIACIN ESTNDAR
PROPIEDADES DE LA DESVIACIN ESTNDAR
PROPIEDADES DE LA DESVIACIN ESTNDAR
PROPIEDADES DE LA DESVIACIN ESTNDAR
1.
La desviacin estndar ser siempre un valor positivo o
cero, en el caso de que las puntuaciones sean iguales.
ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIN ABSOLUTA
51
PROPIEDADES DE LA DESVIACIN ESTNDAR
2.- Si a todos los valores de la variable se les suma un nmero la desviacin
estndar no vara.
ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIN ABSOLUTA
52
PROPIEDADES DE LA DESVIACIN ESTNDAR
3.- Si todos los valores de la variable se multiplican por un nmero la
desviacin estndar queda multiplicada por dicho nmero.
ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIN ABSOLUTA
53
PROPIEDADES DE LA DESVIACIN ESTNDAR
4.
Si tenemos varias distribuciones con la misma media y conocemos sus
respectivas desviaciones estndar se puede calcular la desviacin
estndar total.
Si todas las muestras tienen el mismo tamao:
Si las muestras tienen distinto tamao:
ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIN ABSOLUTA
54
MEDIDAS DE DISPERSIN RELATIVA
La variancia y la desviacin tpica tambin tienen sus
limitaciones.
Es similar a la media aritmtica que es vulnerable a la
influencia de casos extremos.
Adems, cuando las medias aritmticas no son
iguales o cuando las unidades de medicin son
distintas, la comparacin de desviaciones tpicas
puede no ser significativa.
55
MEDIDAS DE DISPERSIN RELATIVA
ING.
WILLIAM
LEON V.
COEFICIENTE DE VARIACIN
Es la desviacin estndar dividida sobre la
media aritmtica multiplicada por 100. El
mismo nos permite comparar desviaciones
tpicas de variables con unidades de
medicin distintas.
S
CV
100
x
El coeficiente de variacin se expresa en unidades
independientes de la naturaleza de la variable.
56
MEDIDAS DE DISPERSIN RELATIVA
ING.
WILLIAM
LEON V.
COEFICIENTE DE VARIACIN
Interpretacin del Coeficiente de Variacin:
El Coeficiente de Variacin, mide la
variabilidad relativa a la Media. Expresa la
proporcin de variabilidad de una
caracterstica por cada unidad de la Media.
57
MEDIDAS DE DISPERSIN RELATIVA
ING.
WILLIAM
LEON V.
COEFICIENTE DE VARIACIN
Sabemos que la fbrica de textiles
produce 500 franelas diarias con una
desviacin tpica de ms o menos ( )
25 franelas, entonces, el Coeficiente de
Variacin ser 25/500 = 0,05, es decir,
tenemos una variacin de 5% en la
produccin diaria de franelas.
58
MEDIDAS DE DISPERSIN RELATIVA
ING.
WILLIAM
LEON V.
COEFICIENTE DE VARIACIN
En la prctica, se acostumbra considerar que un coeficiente de
variacin segn la tabla.
Valor del coeficiente
De variacin (%)
Igual a cero
Mayor de 0 hasta 20
Mayor de 20 hasta 60
Mayor de 60hata 90
Mayor de 90
Interpretacin del coeficiente
Variabilidad
Estabilidad
Nula
Muy alta
Baja
Alta
Moderada
Moderada
Alta
Baja
Muy alta
Nula
59
MEDIDAS DE DISPERSIN RELATIVA
ING.
WILLIAM
LEON V.
COEFICIENTE DE VARIACIN
Ejemplo:
Se desea comparar los sueldos de los
trabajadores de dos empresas A y B. Para
tal efecto se tienen los datos de la tabla
siguiente :
Se puede afirmar que los sueldos de los
trabajadores de la empresa A son ms
uniformes? Por qu?
60
MEDIDAS DE DISPERSIN RELATIVA
ING.
WILLIAM
LEON V.
COEFICIENTE DE VARIACIN
Empresa A
Empresa B
Sueldos
($)
N trabajadores
Sueldos
( S/.)
N trabajadores
380
10
600-650
410
650-700
450
12
700-750
14
480
750-800
500
800-850
61
MEDIDAS DE DISPERSIN RELATIVA
ING.
WILLIAM
LEON V.
COEFICIENTE DE VARIACIN
xA
439,78
SA
42,55
42,55
439,78
CVA
100
xB
713,75
59,67
59,67
713,75
9,68% CVA
100
8,36%
Por lo tanto, los sueldos de los trabajadores de la empresa A no
son ms uniformes; sino los sueldos de la empresa B porque
presenta menor coeficiente de variacin.
62
MEDIDAS DE DISPERSIN RELATIVA
ING.
WILLIAM
LEON V.
Tipificacin. Valor Z
La tipificacin es el proceso de restar la media y dividir entre su
desviacin tpica a una variable X.
De este modo se obtiene una nueva variable
de media 0 y desviacin estndar z = 1, que se denomina variable
tipificada.
ING. WILLIAM LEON V.
63
Tipificacin. Valor Z
Esta nueva variable carece de unidades y permite hacer comparables dos
medidas que en un principio no lo son, por aludir a conceptos diferentes.
Ejemplo:
Podemos preguntar si un elefante es ms
grueso que una hormiga determinada, cada
uno en relacin con su poblacin.
ING. WILLIAM LEON V.
64
Ejemplo. Tipificacin. Valor Z
Tambin es aplicable al caso en que se quieran comparar individuos
semejantes de poblaciones diferentes.
Ejemplo: Comparar el nivel acadmico de dos
estudiantes de diferentes Universidades para la
concesin de una beca de estudios.
En principio sera injusto concederla
directamente al que posea una nota media ms
elevada, ya que la dificultad para conseguir una
buena calificacin puede ser mucho mayor en un
centro que en el otro, lo que limita las
posibilidades de uno de los estudiante y favorece
al otro.
ING. WILLIAM LEON V.
65
Ejemplo: Tipificacin
Se desea dar una beca a uno de dos estudiantes de sistemas educativos
diferentes. Se asignar al que tenga mejor expediente acadmico.
La
estudiante A tiene una calificacin de 8 en un sistema donde la
calificacin de los alumnos se comporta como N(6,1).
La
estudiante B tiene una calificacin de 80 en un sistema donde la
calificacin de los alumnos se comporta como N(70,10).
Bioestadstica. U. Mlaga.
Tema 5: Modelos probabilsticos
66
Ejemplo: Tipificacin
Solucin
No se puede comparar directamente 8 puntos de A frente a los
80 de B,
Pero como ambas poblaciones se comportan de modo normal,
Entonces se puede tipificar y observar las puntuaciones sobre
una distribucin de referencia N(0,1 )
Bioestadstica. U. Mlaga.
Tema 5: Modelos probabilsticos
67
Ejemplo: Tipificacin
zA
xA
zB
B
B
6
1
xB
80 70
10
Como ZA>ZB, se puede decir que el porcentaje
de compaeros del mismo sistema de estudios
que ha superado en calificacin el estudiante A
es mayor que el que ha superado el estudiante
B.
Se puede concluir que el estudiante A es
mejor candidato para la beca.
68
Teorema de Chebyshev.
La desigualdad de Chebyshev es un resultado estadstico que ofrece
una cota inferior a la probabilidad de que el valor de una variable
aleatoria con varianza finita est a una cierta distancia de su
esperanza matemtica o de su media;
Equivalentemente, el teorema proporciona una cota superior a la
probabilidad de que los valores caigan fuera de esa distancia respecto
de la media.
El teorema es aplicable incluso en distribuciones que no tienen forma
de "curva de campana" y acota la cantidad de datos que estn o no
"en medio".
Ing. William Jaime Len Velsquez
15/04/2015
69
Teorema de Chebyshev.
Teorema: Sea X una variable aleatoria de media y varianza
finita s.
Entonces, para todo nmero real k > 0,
Slo los casos con k > 1 proporcionan informacin til.
Ing. William Jaime Len Velsquez
15/04/2015
70
Teorema de Chebyshev. Ejemplo
El nmero de artculos producidos en una fbrica
durante una semana es una variable aleatoria con
media 50.
Si la varianza de una semana de produccin se sabe
que es igual a 25, entonces
Qu se puede decir acerca de la probabilidad de
que en esta semana la produccin difiera en ms de
10 a la media?
Ing. William Jaime Len Velsquez
15/04/2015
71
Teorema de Chebyshev. Ejemplo
Solucin:
Por la desigualdad de Chebyshev
=50, 2=25, K=10, Reemplazando:
entonces la probabilidad de que en la semana de produccin
el nmero de artculos exceda en mas de 10 a la media es a
lo ms 0.25.
Ing. William Jaime Len Velsquez
15/04/2015
72
Teorema de Chebyshev.
Otra consecuencia del teorema es que para cada distribucin de media
y desviacin tpica finita s, al menos la mitad de los valores caern
en el intervalo
Ing. William Jaime Len Velsquez
15/04/2015
73
Teorema de Chebyshev.
En una clnica infantil se ha ido anotando, durante un mes, el nmero
de metros que cada nio anda, seguido y sin caerse, el primer da que
comienza a caminar, obtenindose la tabla de informacin adjunta:
nmero de metros 1 2 3 4 5 6 7 8
nmero de nios
2 6 10 5 10 3 2 2
Se pide:.
a)Calcular la media aritmtica,
b) Varianza y desviacin tpica.
c) Entre qu dos valores se encuentra, como mnimo, el 75% de las
observaciones?
Ing. William Jaime Len Velsquez
15/04/2015
74
Teorema de Chebyshev.
a)La media x viene dada por:
b) Ahora determina las medidas de dispersin.
Utilizar la relacin
Ing. William Jaime Len Velsquez
15/04/2015
75
Teorema de Chebyshev.
Consecuentemente, la desviacin tpica es
Ing. William Jaime Len Velsquez
15/04/2015
76
Teorema de Chebyshev.
c) El Teorema de Chebyshev garantiza que, como mnimo,
el (1
) 100% de los datos se concentran en el intervalo
( k, +k) y, por tanto, fuera de dicho intervalo se encuentra,
a lo sumo, el
100% de ellos.
Conforme a este teorema, imponemos que
De donde
y
Ing. William Jaime Len Velsquez
15/04/2015
77
Teorema de Chebyshev.
Por lo tanto, k = 2.
Podemos as garantizar que, al menos, el 75% de los datos se
encuentran entre los valores
Ing. William Jaime Len Velsquez
15/04/2015
78
MEDIDAS
DE
FORMA
Ing. William Len Velsquez
MEDIDAS DE FORMA
80
MEDIDAS DE FORMA
ING.
WILLIAM
LEON V.
ASIMETRA O SESGO
Una distribucin es asimtrica
cuando sus datos tienden a
agruparse hacia uno de los extremos
de la distribucin.
Cuando una curva es asimtrica,
tiene un sesgo.
81
MEDIDAS DE FORMA
ING.
WILLIAM
LEON V.
ASIMETRA O SESGO
El sesgo puede ser de dos tipos:
Si los datos tienden a agruparse en las primeras clases, se
dice que el distribucin tiene un sesgo positivo o que es
asimtrica positiva.
Si los datos tienden a agruparse en las ltimas clases de la
distribucin, se dice que esta tiene sesgo negativo o que es
asimtrica negativa.
82
MEDIDAS DE FORMA
ING.
WILLIAM
LEON V.
El coeficiente de asimetra
COEFICIENTE DE KARL PEARSON
Si una distribucin es simtrica, entonces:
X ms asimtrica es la
Entre ms diferencia halla entre la y la Mo,
distribucin. El coeficiente de Karl Pearson que simbolizamos como SK,
mide sta diferencia en unidades de desviacin estndar as:
83
MEDIDAS DE FORMA
= Me = Mo.X
ING.
WILLIAM
LEON V.
El coeficiente de asimetra
COEFICIENTE DE KARL PEARSON
Si la media es mayor que la moda, entonces, SK es positivo. Es decir, el
sesgo es positivo.
Si la media es menor que la moda, SK es negativo, es decir el sesgo es
negativo.
Si la media es igual a la moda, SK=0 y la distribucin es simtrica.
84
MEDIDAS DE FORMA
ING.
WILLIAM
LEON V.
El coeficiente de asimetra (CA)
Segn es grado de asimetra una distribucin puede
ser:
Simtrica
sk = 0
Asimtrica positiva
sk > 0
85
MEDIDAS DE FORMA
Asimtrica negativa
sk< 0
ING.
WILLIAM
LEON V.
EJEMPLO
Se ha recopilado la informacin del contenido de
grasa(expresado en libras) de 200 frascos de
Yogur en presentacin de 2.5 libras, referidos a
una muestra aleatoria extrada de un lote de
3.600 frascos correspondientes a la produccin
de un mes de la compaa LCTEOS S.A.
El valor de la media es 0.2608, el valor de la
moda es 0.258 y el valor de la desviacin
estndar es 0.0408. Calcular el el coeficiente de
karl Pearson
EJEMPLO
Aplicando la formula:
SK = (0.2608 - 0.258)/0.0408 = 0.069.
Lo anterior significa que la asimetra es positiva.
Significa adems, que la diferencia entre la
y la Mo equivale
X a 0.069 veces la desviacin
estndar.
CURTOSIS O APUNTAMIENTO
Mide el grado de elevacin o
de
agudeza
de
una
distribucin comparada con la
curva normal.
88
MEDIDAS DE FORMA
ING.
WILLIAM
LEON V.
CURTOSIS O APUNTAMIENTO
Segn su grado de curtosis, una distribucin puede ser:
89
MEDIDAS DE FORMA
ING. WILLIAM LEON V.
PLATICRTICA O ACHATADA
a) En la medida en que los diferentes tramos
de la variable presenten frecuencias muy
similares en todo su recorrido, entonces
podemos afirmar que existe poca curtosis o
concentracin de los datos. Esta situacin
contribuye a que la dispersin sea alta. Una
distribucin con stas caractersticas, se
denomina PLATICRTICA O ACHATADA
90
MEDIDAS DE FORMA
ING. WILLIAM LEON V.
LEPTOCRTICA O APUNTADA
b) Por el contrario, si existe una cantidad
muy significativa de datos que se encuentran
concentrados en algn tramo de la variable,
entonces decimos que la distribucin es
altamente concentrada o que tiene alta
curtosis.
Una
distribucin
de
stas
caractersticas se denomina LEPTOCRTICA O
APUNTADA.
91
MEDIDAS DE FORMA
ING. WILLIAM LEON V.
MESOCRTICA o MODERADA
c) Si la concentracin es intermedia entre
las dos situaciones anteriores, se dice que
la
distribucin
es
MESOCRTICA o
MODERADA CONCENTRACIN DE LOS DATOS.
Una distribucin con esta caracterstica es
propia de la distribucin normal,
92
MEDIDAS DE FORMA
ING. WILLIAM LEON V.
Coeficiente de Curtosis
93
MEDIDAS DE FORMA
ING.
WILLIAM
LEON V.
COEFICIENTE DE CURTOSIS A4
ste coeficiente, resulta del cociente existente entre
el momento de orden cuatro respecto a la media y la
desviacin estndar elevada a la cuarta.
94
MEDIDAS DE FORMA
ING.
WILLIAM
LEON V.
COEFICIENTE DE CURTOSIS A4
La mayora de los autores consideran que:
a) Si A4 - 3 = 0, la distribucin es mesocrtica o moderada
concentracin de los datos. Tal es el caso de la distribucin
normal
b) Si A4 - 3 > 0, la distribucin es apuntada o leptocrtica o alta
concentracin de los datos.
Si A4 - 3 < 0, la distribucin es achatada o platicrtica o baja
concentracin de los datos.
95
MEDIDAS DE FORMA
ING.
WILLIAM
LEON V.
COEFICIENTE DE CURTOSIS A4
Las tablas siguientes, nos permiten aclarar an ms el concepto de concentracin de los
datos.
La tabla (a) es una distribucin platicrtica, puesto que las frecuencias son ms o menos
similares.
La tabla (b), es una distribucin leptocrtica, puesto que la cuarta categora, se destaca por
tener una frecuencia muy alta frente a las dems.
La tabla (c), es una distribucin intermedia entre la (a) y la (b), por lo cual es muy posible
que se acerque a una distribucin mesocrtica.
96
MEDIDAS DE FORMA
ING.
WILLIAM
LEON V.
COEFICIENTE DE CURTOSIS A4
Se ha recopilado la informacin del contenido de
grasa(expresado en libras) de 200 frascos de Yogur en
presentacin de 2.5 libras, referidos a una muestra aleatoria
extrada de un lote de 3.600 frascos correspondientes a la
produccin de un mes de la compaa LCTEOS S.A.
Se tiene el siguiente cuadro
97
MEDIDAS DE FORMA
ING.
WILLIAM
LEON V.
COEFICIENTE DE CURTOSIS A4
Reemplazando en la frmula
En ste caso, la distribucin es achatada o platicrtica o poca
concentracin de los datos. No obstante observemos, que el valor 0.47, es muy cercano a cero, lo cual quiere decir, que la distribucin
98
es casi una distribucin mesocrtica.
ING.
WILLIAM
LEON V.
MEDIDAS DE FORMA
FIN
wjleonv@yahoo.com