Está en la página 1de 100

4

Universidad
Nacional Mayor de
San Marcos

ESTADISTICA Y
PROBABILIDADES

Medidas de
DISPERSIN
William Jaime Len Velsquez
wjleonv@yahoo.com

MEDIDAS
DE
DISPERSION
Ing. William Len Velsquez

MEDIDAS DE DISPERSIN

Las Medidas de Dispersin, son


indicadores de variabilidad y cuya
importancia reside en la necesidad
de tomar decisiones, basadas en
estadsticas bsicas.

DEFINICIN

ING.
WILLIAM
LEON V.

MEDIDAS DE DISPERSIN
Ejemplo:

Se tiene una produccin de franelas y se sabe


que semanalmente se producen un promedio
de 500 franelas, se puede decir que todos los
das se producen 100 franelas

Nada nos garantiza eso porque podran


producirse en slo dos das 250 franelas y el
promedio semanal nos dara un valor idntico,

DEFINICIN

ING.
WILLIAM
LEON V.

MEDIDAS DE DISPERSIN

Si adicionalmente nos informan que tiene


una variacin de 5 franelas, tendremos
entonces una mejor comprensin del
proceso, pues este ltimo nmero nos
indica que semanalmente se producen
entre 495 y 505 franelas, es decir, que
diariamente s se deben producir
aproximadamente 100 franelas.

DEFINICIN

ING.
WILLIAM
LEON V.

MEDIDAS DE DISPERSIN
La Dispersin se refiere a la variabilidad
entre los valores, es decir, qu tan
grandes son las diferencias entre los
valores.
La idea de dispersin se relaciona con la
mayor o menor concentracin de los
datos en torno a un valor central,
generalmente la media aritmtica.

DEFINICIN

ING.
WILLIAM
LEON V.

MEDIDAS DE DISPERSIN
Ejemplos:

Observe las dos figuras. La primera presenta una distribucin con


datos ms concentrados alrededor de su promedio 400 que la otra
figura con respecto a su promedio 800, es decir la primera figura es
una distribucin con menos dispersin.

DEFINICIN

ING.
WILLIAM
LEON V.

MEDIDAS DE DISPERSIN
Ejemplos:

Las figuras siguientes muestran a tres distribuciones


con promedio 70, sin embargo las tres difieren en
cuanto a su variabilidad alrededor de la media.

poca variabilidad

alguna variabilidad

DEFINICIN

gran variabilidad
ING.
WILLIAM
LEON V.

MEDIDAS DE DISPERSIN. EJEMPLO

Se tienen dos grupos de estudiantes que sometidos a una prueba arrojaron


los siguientes puntajes:
GRUPO A

GRUPO B

Puntaje

N
estudiantes

Puntaje

N estudiantes

11

10

12

10

11

13

13

Total

20

15

17

Total

20
9

EJEMPLO

ING.
WILLIAM
LEON V.

MEDIDAS DE DISPERSIN
Al calcular el promedio aritmtico para ambos grupos se
obtiene:

xB

12

Este resultado puede conducir a conclusiones equivocadas


cuando se est comparando distribuciones,
Pues se podra pensar que ambas secciones son idnticas en su
rendimiento,
ING. WILLIAM LEON V.

EJEMPLO

10

MEDIDAS DE DISPERSIN
Siendo esta conclusin falsa ya que observando
los datos se aprecia que la seccin B es ms
homognea.
Por lo tanto

En este caso el promedio no tiene suficiente


grado de representatividad por lo tanto poco
podr describirnos acerca de los datos en
estudio.
11

EJEMPLO

ING.
WILLIAM
LEON V.

MEDIDAS DE DISPERSIN

Xi

Es necesario entonces calcular otras


medidas estadsticas para mostrar
cmo varan los datos alrededor del
promedio y esto se logra mediante las
medidas de dispersin.

12

EJEMPLO

ING.
WILLIAM
LEON V.

FUNCIONES DE LAS MEDIDAS DE DISPERSIN


1.- Para evaluar la confiabilidad del promedio que se
est utilizando:

Una dispersin pequea indica que los datos se


encuentran acumulados muy cerca, alrededor de la
medida de tendencia central establecida.
Por tanto, la medida de tendencia central se considera confiable o bastante
representativa de los datos.
Por el contrario, una dispersin grande indica que la medida escogida para
representar los datos no es muy confiable, es decir, no es muy representativa de
los datos.

Es necesario estudiar las medidas de dispersin:

13

ING.
WILLIAM
LEON V.

FUNCIONES DE LAS MEDIDAS DE DISPERSIN


2.- Para apreciar cun dispersas estn dos o ms
distribuciones:
Para poder comparar dos distribuciones de
frecuencias entre s, no slo necesitamos la medida
de tendencia central, sino tambin la dispersin
entre las observaciones para no elaborar
conclusiones errneas.
A mayor medida de dispersin
heterogneo.
A menor medida de dispersin
homogneo o uniforme.

Es necesario estudiar las medidas de dispersin:

el grupo es ms
el grupo es ms

14

ING.
WILLIAM
LEON V.

MEDIDAS DE DISPERSIN ABSOLUTA


Cuantifican
el
grado
de
concentracin o de dispersin de
los valores de la variable en torno
de un promedio de la distribucin.

15

MEDIDAS DE DISPERSIN ABSOLUTA

ING.
WILLIAM
LEON V.

MEDIDAS DE DISPERSIN ABSOLUTA

Principales medidas de dispersin absoluta:


Rango

o Recorrido

Varianza
Desviacin

: S2

Estndar : S

16

MEDIDAS DE DISPERSIN ABSOLUTA

: R

ING.
WILLIAM
LEON V.

RANGO O RECORRIDO:

Es la diferencia entre los valores mximo y


mnimo de los datos.

X mx

X mn

Esta medida es muy fcil de calcular sin


embargo no es muy recomendable porque slo
toma en cuenta los valores extremos, sin
considerar los dems valores.
17

MEDIDAS DE DISPERSIN ABSOLUTA

ING.
WILLIAM
LEON V.

RANGO O RECORRIDO:

Interpretacin de Rango:
El Rango se puede interpretar como la
amplitud existente entre una serie de datos,
Es decir,
mide cun lejos est el valor ms pequeo
y el valor ms grande de la muestra o
poblacin.

18

MEDIDAS DE DISPERSIN ABSOLUTA

ING.
WILLIAM
LEON V.

RANGO O RECORRIDO:

Ejemplo
Se tiene una produccin de franelas y se sabe que
diariamente se producen un promedio de 500
franelas. Si un da se produce un mnimo de 415
franelas y otro da se produce un mximo de 573
franelas entonces el RANGO de produccin estar
entre 158 franelas, es decir,
Podemos tener una produccin de 158 franelas a

partir del valor mnimo.

19

MEDIDAS DE DISPERSIN ABSOLUTA

ING.
WILLIAM
LEON V.

VARIANZA S2 , V X

Es un valor numrico que cuantifica el


grado de dispersin de los valores de una
variable respecto a su media aritmtica.

Es el promedio de los cuadrados de las


desviaciones de la variable respecto a su
media aritmtica.

Xi

x
20

MEDIDAS DE DISPERSIN ABSOLUTA

2
ING.
WILLIAM
LEON V.

VARIANZA S2 , V X
Notacin:

Varianza muestral.

Varianza poblacional.

21

MEDIDAS DE DISPERSIN ABSOLUTA

ING.
WILLIAM
LEON V.

VARIANZA S2 , V X

Nota:

La varianza nunca es negativa.

Cuando la variable toma un nico valor; es


decir cuando es constante entonces la
varianza es cero.

Mientras ms se aproxima a cero, ms


concentrados estn los valores de la serie
alrededor de la media. Por el contrario,
mientras mayor sea la varianza, ms
dispersos estn.
22

MEDIDAS DE DISPERSIN ABSOLUTA

ING.
WILLIAM
LEON V.

2
S

para datos no agrupados:

V( x )

1
n

2
X
i

23

MEDIDAS DE DISPERSIN ABSOLUTA

Xi
n

ING.
WILLIAM
LEON V.

2
S

para datos no agrupados:

Ejemplo:

Calcular e interpretar la varianza de los pesos de un grupo de personas.


Los datos son los siguientes:
56 65 68 70 72 76 78 80

24

MEDIDAS DE DISPERSIN ABSOLUTA

ING.
WILLIAM
LEON V.

S2 para datos no agrupados:


Ejemplo:

Xi
i 1

n=8

S2
X

1
7

40 329

565

X2
i
i 1

565

2
60,84

25

MEDIDAS DE DISPERSIN ABSOLUTA

40 329

61 kilos 2

ING.
WILLIAM
LEON V.

2
S

para datos no agrupados:

Ejemplo:
En promedio los pesos del
grupo de personas, se alejan
con respecto al promedio
aritmtico
en
aproximadamente 61 kilos al
cuadrado.

26

MEDIDAS DE DISPERSIN ABSOLUTA

ING.
WILLIAM
LEON V.

S2 para datos agrupados

a) Si n < 30 :

S2
X

1
n

1 i 1

fi X 2
i

27

MEDIDAS DE DISPERSIN ABSOLUTA

fi X i
i 1
n

ING.
WILLIAM
LEON V.

S2

para datos agrupados

28

Ejemplo:
1.- Calcular e interpretar la varianza para la siguiente tabla de
frecuencias.

Edad
Ii

4- 6
6 - 10
10 - 16
16 - 20
20 - 30
Total

N de
personas

n = 20

fi

4
5
7
3
1
n = 20

MEDIDAS DE DISPERSIN ABSOLUTA

n < 30

ING.
WILLIAM
LEON V.

S2 para datos agrupados


Ejemplo:
k

V( X )

1
n

k
1 i 1

fi X 2
i

fi X i
i 1
n

2
1
19

3200

20

230
20

V ( X ) = 29,21
29 aos2
En promedio la edad de estas personas se aleja con
respecto a su promedio aritmtico en aproximadamente
29 aos al cuadrado.
29

MEDIDAS DE DISPERSIN ABSOLUTA

ING.
WILLIAM
LEON V.

S2 para datos agrupados


b) Si n

30 :

Usando
absolutas:
k
S2

i 1

fi X 2
i
n

Usando frecuencias
relativas:

frecuencias
k

fi X i

i 1
n

S2

hi X2
i
i 1

30

MEDIDAS DE DISPERSIN ABSOLUTA

hi Xi
i 1

ING.
WILLIAM
LEON V.

S2 para datos agrupados


Ejemplo:
Calcular e interpretar la varianza de la siguiente tabla.

Peso
Ii

N de
ingenieros
fi

50 - 60

60 - 70

70 - 80

10

80 - 90

90 -100

Total

n = 40

MEDIDAS DE DISPERSIN ABSOLUTA

n = 40

n > 30

31

ING.
WILLIAM
LEON V.

S2 para datos agrupados


Ejemplo:
k
S2

i 1

fi X 2
i
n

fi X i

i 1
n

236 400
40

3030
40

2
171,94

En promedio el peso de los ingenieros se aleja con

respecto al peso promedio en aproximadamente 172 kilos


al cuadrado.
32

MEDIDAS DE DISPERSIN ABSOLUTA

ING.
WILLIAM
LEON V.

VARIANZA TOTAL O GLOBAL


Si una muestra de tamao n se particiona en k muestras de
tamao
cada una con su correspondiente promedio
aritmtico,

su varianza

..

nk

x2

xk

S22

..

S k2

n1

n2

x1
S12
MEDIDAS DE DISPERSIN ABSOLUTA

33

ING. WILLIAM LEON V.

VARIANZA TOTAL O GLOBAL


La varianza para los k grupos juntos se calcula mediante la

frmula:

S2

i 1

ni ( x i
n

S2
i )

ni x i
i 1

donde

ni
i 1

34

MEDIDAS DE DISPERSIN ABSOLUTA

ING.
WILLIAM
LEON V.

VARIANZA TOTAL O GLOBAL


Ejemplo:

Se tienen tres grupos, de seis, nueve y siete


estudiantes respectivamente. Si las notas
correspondientes a cada uno de ellos son:

Grupo 1: 12

16

08

11

10

12

Grupo 2: 17

14

07

13

11

18

13

Grupo 3: 10

13

11

08

12

09

12

35

MEDIDAS DE DISPERSIN ABSOLUTA

15
ING.
WILLIAM
LEON V.

14

VARIANZA TOTAL O GLOBAL


Ejemplo:
k

6 (11,52
S T2

7,1 )

9 ( 13,562

10,53 )

7 ( 10,712

3,24)

i 1

12,09

22

S T= 2,98
En promedio las notas de los estudiantes de los tres grupos se alejan con
respecto al promedio total en aproximadamente 3 puntos.

36

MEDIDAS DE DISPERSIN ABSOLUTA

ING.
WILLIAM
LEON V.

8,89

DESVIACIN ESTNDAR
Es la raz cuadrada positiva de la varianza
y posee las mismas unidades que la media
aritmtica,
Estas unidades ya no estn elevadas al
cuadrado como en la varianza.

V ( X)
37

MEDIDAS DE DISPERSIN ABSOLUTA

ING.
WILLIAM
LEON V.

DESVIACIN ESTNDAR
La desviacin estndar o desviacin tpica se obtiene para
simplificar la interpretacin de la varianza.

Cuando se calcula la varianza, se basa en datos elevados al


cuadrado, por lo que, el resultado obtenido debe
interpretarse en unidades al cuadrado;
por esta razn se obtiene la desviacin estndar como la raz
cuadrada de la variancia.

38

MEDIDAS DE DISPERSIN ABSOLUTA

ING.
WILLIAM
LEON V.

DESVIACIN ESTNDAR
Interpretacin de la Desviacin Estndar:
Es una medida que muestra la distancia
promedio de los valores observados con
respecto a su media.
La distancia de cada valor con su media se
mide tomando el valor absoluto de la
diferencia entre ese valor y la media, es
decir, es la distancia de cada dato respecto
a su promedio.
39

MEDIDAS DE DISPERSIN ABSOLUTA

ING.
WILLIAM
LEON V.

DESVIACIN ESTNDAR

Ejemplo :

Si se tiene una produccin de franelas y


sabemos que diariamente se producen un
promedio de 500 franelas, adicionalmente
tenemos tambin que la desviacin es de 25
franelas, tendremos entonces una mejor
comprensin del proceso pues este ltimo
nmero nos indica que diariamente se
producen entre 475 y 525 franelas

40

MEDIDAS DE DISPERSIN ABSOLUTA

ING.
WILLIAM
LEON V.

DESVIACIN ESTNDAR
Distribuciones con igual promedio aritmtico y
diferente desviacin estndar
=52
S=6
=52
S=24

=52
S=12

=52
S=12

ING. WILLIAM LEON V.

MEDIDAS DE DISPERSIN ABSOLUTA

41

DESVIACIN ESTNDAR
Ejemplos:
1.- Si la desviacin tpica del salario de

los ingenieros de sistemas es


$1,000 y la media aritmtica es
$3,000,
Entonces los salarios de los
ingenieros fluctan entre $2,000 y
$4,000 dlares.

ING. WILLIAM LEON V.

MEDIDAS DE DISPERSIN ABSOLUTA

42

DESVIACIN ESTNDAR
Ejemplos:
2.- Calcular la desviacin estndar de las notas
obtenidas por un grupo de alumnos del cuarto
ciclo de la Facultad de Ingeniera Industrial de
la UNMSM en la primera evaluacin de
estadstica.
12 07 14 11 16 18 09 14 10

ING. WILLIAM LEON V.

MEDIDAS DE DISPERSIN ABSOLUTA

43

DESVIACIN ESTNDAR
Ejemplos:

n=9

Xi
i 1

X2
i
i 1

111

1 467

Por lo tanto:
VX

1
8

1 467

111

12,25

SX

12,25

ING. WILLIAM LEON V.

MEDIDAS DE DISPERSIN ABSOLUTA

3,5 puntos

44

DESVIACIN ESTNDAR

Nota:

La varianza y la desviacin estndar se utilizan


para comparar grupos cuya variable est
expresada en las mismas unidades.

As, el grupo ms homogneo, ms uniforme o


en el que la media aritmtica es ms
representativa ser aquel en el cual la
varianza o la desviacin estndar es menor.

ING. WILLIAM LEON V.

MEDIDAS DE DISPERSIN ABSOLUTA

45

DESVIACIN ESTNDAR
Ejemplo:
En varias semanas consecutivas, los
oficiales de polica: Martnez y Castro
aplicaron las siguientes infracciones por
exceso de velocidad:
Martnez : 31
Castro
: 35

38
43

42
38

32
37

39
33

26
28

27

Cul de los oficiales es ms homogneo con respecto al nmero de


infracciones?
ING. WILLIAM LEON V.

MEDIDAS DE DISPERSIN ABSOLUTA

46

DESVIACIN ESTNDAR
Ejemplo:
Solucin:

S2
M

1
7 390
5

S2
C

208
6

2
35,87

S2
C

1
8 489
6

241
7

2
31,95

S2
M

El oficial Castro es ms homogneo en aplicar infracciones por


exceso de velocidad porque su varianza es menor.
ING. WILLIAM LEON V.

MEDIDAS DE DISPERSIN ABSOLUTA

47

PROPIEDADES DE LA DESVIACIN ESTNDAR

PROPIEDADES DE LA DESVIACIN ESTNDAR

PROPIEDADES DE LA DESVIACIN ESTNDAR

PROPIEDADES DE LA DESVIACIN ESTNDAR


1.

La desviacin estndar ser siempre un valor positivo o


cero, en el caso de que las puntuaciones sean iguales.

ING. WILLIAM LEON V.

MEDIDAS DE DISPERSIN ABSOLUTA

51

PROPIEDADES DE LA DESVIACIN ESTNDAR


2.- Si a todos los valores de la variable se les suma un nmero la desviacin
estndar no vara.

ING. WILLIAM LEON V.

MEDIDAS DE DISPERSIN ABSOLUTA

52

PROPIEDADES DE LA DESVIACIN ESTNDAR


3.- Si todos los valores de la variable se multiplican por un nmero la
desviacin estndar queda multiplicada por dicho nmero.

ING. WILLIAM LEON V.

MEDIDAS DE DISPERSIN ABSOLUTA

53

PROPIEDADES DE LA DESVIACIN ESTNDAR


4.

Si tenemos varias distribuciones con la misma media y conocemos sus


respectivas desviaciones estndar se puede calcular la desviacin
estndar total.

Si todas las muestras tienen el mismo tamao:

Si las muestras tienen distinto tamao:

ING. WILLIAM LEON V.

MEDIDAS DE DISPERSIN ABSOLUTA

54

MEDIDAS DE DISPERSIN RELATIVA

La variancia y la desviacin tpica tambin tienen sus


limitaciones.

Es similar a la media aritmtica que es vulnerable a la


influencia de casos extremos.

Adems, cuando las medias aritmticas no son


iguales o cuando las unidades de medicin son
distintas, la comparacin de desviaciones tpicas
puede no ser significativa.

55

MEDIDAS DE DISPERSIN RELATIVA

ING.
WILLIAM
LEON V.

COEFICIENTE DE VARIACIN

Es la desviacin estndar dividida sobre la


media aritmtica multiplicada por 100. El
mismo nos permite comparar desviaciones
tpicas de variables con unidades de
medicin distintas.

S
CV
100
x
El coeficiente de variacin se expresa en unidades
independientes de la naturaleza de la variable.
56

MEDIDAS DE DISPERSIN RELATIVA

ING.
WILLIAM
LEON V.

COEFICIENTE DE VARIACIN

Interpretacin del Coeficiente de Variacin:


El Coeficiente de Variacin, mide la
variabilidad relativa a la Media. Expresa la
proporcin de variabilidad de una
caracterstica por cada unidad de la Media.

57

MEDIDAS DE DISPERSIN RELATIVA

ING.
WILLIAM
LEON V.

COEFICIENTE DE VARIACIN

Sabemos que la fbrica de textiles


produce 500 franelas diarias con una
desviacin tpica de ms o menos ( )
25 franelas, entonces, el Coeficiente de
Variacin ser 25/500 = 0,05, es decir,
tenemos una variacin de 5% en la
produccin diaria de franelas.

58

MEDIDAS DE DISPERSIN RELATIVA

ING.
WILLIAM
LEON V.

COEFICIENTE DE VARIACIN

En la prctica, se acostumbra considerar que un coeficiente de


variacin segn la tabla.
Valor del coeficiente
De variacin (%)
Igual a cero
Mayor de 0 hasta 20
Mayor de 20 hasta 60
Mayor de 60hata 90
Mayor de 90

Interpretacin del coeficiente


Variabilidad
Estabilidad
Nula
Muy alta
Baja
Alta
Moderada
Moderada
Alta
Baja
Muy alta
Nula

59

MEDIDAS DE DISPERSIN RELATIVA

ING.
WILLIAM
LEON V.

COEFICIENTE DE VARIACIN
Ejemplo:

Se desea comparar los sueldos de los


trabajadores de dos empresas A y B. Para
tal efecto se tienen los datos de la tabla
siguiente :

Se puede afirmar que los sueldos de los


trabajadores de la empresa A son ms
uniformes? Por qu?

60

MEDIDAS DE DISPERSIN RELATIVA

ING.
WILLIAM
LEON V.

COEFICIENTE DE VARIACIN
Empresa A

Empresa B

Sueldos
($)

N trabajadores

Sueldos
( S/.)

N trabajadores

380

10

600-650

410

650-700

450

12

700-750

14

480

750-800

500

800-850

61

MEDIDAS DE DISPERSIN RELATIVA

ING.
WILLIAM
LEON V.

COEFICIENTE DE VARIACIN
xA

439,78

SA

42,55
42,55
439,78

CVA

100

xB

713,75

59,67

59,67
713,75

9,68% CVA

100

8,36%

Por lo tanto, los sueldos de los trabajadores de la empresa A no


son ms uniformes; sino los sueldos de la empresa B porque
presenta menor coeficiente de variacin.
62

MEDIDAS DE DISPERSIN RELATIVA

ING.
WILLIAM
LEON V.

Tipificacin. Valor Z

La tipificacin es el proceso de restar la media y dividir entre su


desviacin tpica a una variable X.

De este modo se obtiene una nueva variable

de media 0 y desviacin estndar z = 1, que se denomina variable


tipificada.
ING. WILLIAM LEON V.

63

Tipificacin. Valor Z
Esta nueva variable carece de unidades y permite hacer comparables dos
medidas que en un principio no lo son, por aludir a conceptos diferentes.

Ejemplo:

Podemos preguntar si un elefante es ms


grueso que una hormiga determinada, cada
uno en relacin con su poblacin.

ING. WILLIAM LEON V.

64

Ejemplo. Tipificacin. Valor Z


Tambin es aplicable al caso en que se quieran comparar individuos
semejantes de poblaciones diferentes.

Ejemplo: Comparar el nivel acadmico de dos


estudiantes de diferentes Universidades para la
concesin de una beca de estudios.
En principio sera injusto concederla
directamente al que posea una nota media ms
elevada, ya que la dificultad para conseguir una
buena calificacin puede ser mucho mayor en un
centro que en el otro, lo que limita las
posibilidades de uno de los estudiante y favorece
al otro.
ING. WILLIAM LEON V.

65

Ejemplo: Tipificacin

Se desea dar una beca a uno de dos estudiantes de sistemas educativos


diferentes. Se asignar al que tenga mejor expediente acadmico.
La

estudiante A tiene una calificacin de 8 en un sistema donde la


calificacin de los alumnos se comporta como N(6,1).

La

estudiante B tiene una calificacin de 80 en un sistema donde la


calificacin de los alumnos se comporta como N(70,10).

Bioestadstica. U. Mlaga.

Tema 5: Modelos probabilsticos

66

Ejemplo: Tipificacin

Solucin
No se puede comparar directamente 8 puntos de A frente a los
80 de B,
Pero como ambas poblaciones se comportan de modo normal,
Entonces se puede tipificar y observar las puntuaciones sobre
una distribucin de referencia N(0,1 )

Bioestadstica. U. Mlaga.

Tema 5: Modelos probabilsticos

67

Ejemplo: Tipificacin
zA

xA

zB

B
B

6
1

xB

80 70
10

Como ZA>ZB, se puede decir que el porcentaje


de compaeros del mismo sistema de estudios
que ha superado en calificacin el estudiante A
es mayor que el que ha superado el estudiante
B.
Se puede concluir que el estudiante A es
mejor candidato para la beca.
68

Teorema de Chebyshev.

La desigualdad de Chebyshev es un resultado estadstico que ofrece


una cota inferior a la probabilidad de que el valor de una variable
aleatoria con varianza finita est a una cierta distancia de su
esperanza matemtica o de su media;

Equivalentemente, el teorema proporciona una cota superior a la


probabilidad de que los valores caigan fuera de esa distancia respecto
de la media.

El teorema es aplicable incluso en distribuciones que no tienen forma


de "curva de campana" y acota la cantidad de datos que estn o no
"en medio".

Ing. William Jaime Len Velsquez

15/04/2015

69

Teorema de Chebyshev.
Teorema: Sea X una variable aleatoria de media y varianza
finita s.

Entonces, para todo nmero real k > 0,

Slo los casos con k > 1 proporcionan informacin til.

Ing. William Jaime Len Velsquez

15/04/2015

70

Teorema de Chebyshev. Ejemplo

El nmero de artculos producidos en una fbrica


durante una semana es una variable aleatoria con
media 50.

Si la varianza de una semana de produccin se sabe


que es igual a 25, entonces

Qu se puede decir acerca de la probabilidad de


que en esta semana la produccin difiera en ms de
10 a la media?

Ing. William Jaime Len Velsquez

15/04/2015

71

Teorema de Chebyshev. Ejemplo


Solucin:

Por la desigualdad de Chebyshev

=50, 2=25, K=10, Reemplazando:

entonces la probabilidad de que en la semana de produccin


el nmero de artculos exceda en mas de 10 a la media es a
lo ms 0.25.
Ing. William Jaime Len Velsquez

15/04/2015

72

Teorema de Chebyshev.

Otra consecuencia del teorema es que para cada distribucin de media


y desviacin tpica finita s, al menos la mitad de los valores caern
en el intervalo

Ing. William Jaime Len Velsquez

15/04/2015

73

Teorema de Chebyshev.

En una clnica infantil se ha ido anotando, durante un mes, el nmero


de metros que cada nio anda, seguido y sin caerse, el primer da que
comienza a caminar, obtenindose la tabla de informacin adjunta:

nmero de metros 1 2 3 4 5 6 7 8
nmero de nios

2 6 10 5 10 3 2 2

Se pide:.
a)Calcular la media aritmtica,
b) Varianza y desviacin tpica.
c) Entre qu dos valores se encuentra, como mnimo, el 75% de las
observaciones?
Ing. William Jaime Len Velsquez

15/04/2015

74

Teorema de Chebyshev.
a)La media x viene dada por:

b) Ahora determina las medidas de dispersin.

Utilizar la relacin

Ing. William Jaime Len Velsquez

15/04/2015

75

Teorema de Chebyshev.

Consecuentemente, la desviacin tpica es

Ing. William Jaime Len Velsquez

15/04/2015

76

Teorema de Chebyshev.

c) El Teorema de Chebyshev garantiza que, como mnimo,


el (1

) 100% de los datos se concentran en el intervalo

( k, +k) y, por tanto, fuera de dicho intervalo se encuentra,


a lo sumo, el
100% de ellos.

Conforme a este teorema, imponemos que


De donde
y
Ing. William Jaime Len Velsquez

15/04/2015

77

Teorema de Chebyshev.

Por lo tanto, k = 2.

Podemos as garantizar que, al menos, el 75% de los datos se


encuentran entre los valores

Ing. William Jaime Len Velsquez

15/04/2015

78

MEDIDAS
DE
FORMA
Ing. William Len Velsquez

MEDIDAS DE FORMA

80

MEDIDAS DE FORMA

ING.
WILLIAM
LEON V.

ASIMETRA O SESGO

Una distribucin es asimtrica


cuando sus datos tienden a
agruparse hacia uno de los extremos
de la distribucin.

Cuando una curva es asimtrica,


tiene un sesgo.

81

MEDIDAS DE FORMA

ING.
WILLIAM
LEON V.

ASIMETRA O SESGO
El sesgo puede ser de dos tipos:

Si los datos tienden a agruparse en las primeras clases, se


dice que el distribucin tiene un sesgo positivo o que es
asimtrica positiva.

Si los datos tienden a agruparse en las ltimas clases de la


distribucin, se dice que esta tiene sesgo negativo o que es
asimtrica negativa.

82

MEDIDAS DE FORMA

ING.
WILLIAM
LEON V.

El coeficiente de asimetra
COEFICIENTE DE KARL PEARSON

Si una distribucin es simtrica, entonces:

X ms asimtrica es la
Entre ms diferencia halla entre la y la Mo,
distribucin. El coeficiente de Karl Pearson que simbolizamos como SK,
mide sta diferencia en unidades de desviacin estndar as:

83

MEDIDAS DE FORMA

= Me = Mo.X

ING.
WILLIAM
LEON V.

El coeficiente de asimetra
COEFICIENTE DE KARL PEARSON

Si la media es mayor que la moda, entonces, SK es positivo. Es decir, el


sesgo es positivo.

Si la media es menor que la moda, SK es negativo, es decir el sesgo es


negativo.

Si la media es igual a la moda, SK=0 y la distribucin es simtrica.

84

MEDIDAS DE FORMA

ING.
WILLIAM
LEON V.

El coeficiente de asimetra (CA)


Segn es grado de asimetra una distribucin puede
ser:

Simtrica
sk = 0

Asimtrica positiva
sk > 0

85

MEDIDAS DE FORMA

Asimtrica negativa
sk< 0

ING.
WILLIAM
LEON V.

EJEMPLO

Se ha recopilado la informacin del contenido de


grasa(expresado en libras) de 200 frascos de
Yogur en presentacin de 2.5 libras, referidos a
una muestra aleatoria extrada de un lote de
3.600 frascos correspondientes a la produccin
de un mes de la compaa LCTEOS S.A.

El valor de la media es 0.2608, el valor de la


moda es 0.258 y el valor de la desviacin
estndar es 0.0408. Calcular el el coeficiente de
karl Pearson

EJEMPLO
Aplicando la formula:

SK = (0.2608 - 0.258)/0.0408 = 0.069.

Lo anterior significa que la asimetra es positiva.

Significa adems, que la diferencia entre la


y la Mo equivale
X a 0.069 veces la desviacin
estndar.

CURTOSIS O APUNTAMIENTO

Mide el grado de elevacin o


de
agudeza
de
una
distribucin comparada con la
curva normal.

88

MEDIDAS DE FORMA

ING.
WILLIAM
LEON V.

CURTOSIS O APUNTAMIENTO
Segn su grado de curtosis, una distribucin puede ser:

89

MEDIDAS DE FORMA

ING. WILLIAM LEON V.

PLATICRTICA O ACHATADA
a) En la medida en que los diferentes tramos
de la variable presenten frecuencias muy
similares en todo su recorrido, entonces
podemos afirmar que existe poca curtosis o
concentracin de los datos. Esta situacin
contribuye a que la dispersin sea alta. Una
distribucin con stas caractersticas, se
denomina PLATICRTICA O ACHATADA

90

MEDIDAS DE FORMA

ING. WILLIAM LEON V.

LEPTOCRTICA O APUNTADA
b) Por el contrario, si existe una cantidad
muy significativa de datos que se encuentran
concentrados en algn tramo de la variable,
entonces decimos que la distribucin es
altamente concentrada o que tiene alta
curtosis.
Una
distribucin
de
stas
caractersticas se denomina LEPTOCRTICA O
APUNTADA.

91

MEDIDAS DE FORMA

ING. WILLIAM LEON V.

MESOCRTICA o MODERADA

c) Si la concentracin es intermedia entre


las dos situaciones anteriores, se dice que
la
distribucin
es
MESOCRTICA o
MODERADA CONCENTRACIN DE LOS DATOS.
Una distribucin con esta caracterstica es
propia de la distribucin normal,

92

MEDIDAS DE FORMA

ING. WILLIAM LEON V.

Coeficiente de Curtosis

93

MEDIDAS DE FORMA

ING.
WILLIAM
LEON V.

COEFICIENTE DE CURTOSIS A4
ste coeficiente, resulta del cociente existente entre
el momento de orden cuatro respecto a la media y la
desviacin estndar elevada a la cuarta.

94

MEDIDAS DE FORMA

ING.
WILLIAM
LEON V.

COEFICIENTE DE CURTOSIS A4

La mayora de los autores consideran que:

a) Si A4 - 3 = 0, la distribucin es mesocrtica o moderada


concentracin de los datos. Tal es el caso de la distribucin
normal

b) Si A4 - 3 > 0, la distribucin es apuntada o leptocrtica o alta


concentracin de los datos.

Si A4 - 3 < 0, la distribucin es achatada o platicrtica o baja


concentracin de los datos.
95

MEDIDAS DE FORMA

ING.
WILLIAM
LEON V.

COEFICIENTE DE CURTOSIS A4

Las tablas siguientes, nos permiten aclarar an ms el concepto de concentracin de los


datos.
La tabla (a) es una distribucin platicrtica, puesto que las frecuencias son ms o menos
similares.
La tabla (b), es una distribucin leptocrtica, puesto que la cuarta categora, se destaca por
tener una frecuencia muy alta frente a las dems.
La tabla (c), es una distribucin intermedia entre la (a) y la (b), por lo cual es muy posible
que se acerque a una distribucin mesocrtica.

96

MEDIDAS DE FORMA

ING.
WILLIAM
LEON V.

COEFICIENTE DE CURTOSIS A4

Se ha recopilado la informacin del contenido de


grasa(expresado en libras) de 200 frascos de Yogur en
presentacin de 2.5 libras, referidos a una muestra aleatoria
extrada de un lote de 3.600 frascos correspondientes a la
produccin de un mes de la compaa LCTEOS S.A.

Se tiene el siguiente cuadro

97

MEDIDAS DE FORMA

ING.
WILLIAM
LEON V.

COEFICIENTE DE CURTOSIS A4

Reemplazando en la frmula

En ste caso, la distribucin es achatada o platicrtica o poca


concentracin de los datos. No obstante observemos, que el valor 0.47, es muy cercano a cero, lo cual quiere decir, que la distribucin
98
es casi una distribucin mesocrtica.
ING.
WILLIAM
LEON V.

MEDIDAS DE FORMA

FIN
wjleonv@yahoo.com