Documentos de Académico
Documentos de Profesional
Documentos de Cultura
SEMANA 2
MUESTRALES
[ ESTADSTICA INFERENCIAL ]
DISTRIBUCIONES
MUESTRALES
Palabras
clave:
Distribucin
muestral,
error
estndar
de
la
media,
error
estndar
de
la
proporcin,
factor
de
correccin.
INTRODUCCIN
El
propsito
del
muestreo
es
indagar
algo
sobre
la
poblacin
de
estudio.
Cuando
se
disea
una
muestra,
es
importante
considerar
la
informacin
que
se
va
a
obtener
y
el
grado
de
exactitud
de
lo
que
se
encuentre
acerca
de
la
poblacin.
Con
este
propsito
es
importante
que
se
analice
claramente
la
obtencin
de
la
muestra
y
los
resultados
obtenidos
a
partir
de
ella,
utilizando
los
conceptos
probabilsticos
ya
vistos.
Su
forma
funcional
Su
media
Su
desviacin
estndar.
2
[ POLITCNICO GRANCOLOMBIANO ]
Consideremos
una
poblacin
conformada
por
cuatro
personas
(N=4).
La
variable
de
inters
es
el
gasto
mensual
en
transporte
(en
miles
de
pesos).
Los
datos
de
la
poblacin
son:
{78,
67,
83,
56}
y
vamos
a
responder
a
cada
literal
teniendo
en
cuenta
la
notacin
utilizada:
!" 78 + 67 + 83 + 56 284
!= = = = 71
! 4 4
(!!!)!
Y
la
desviacin
estndar
es:! = !
[ ESTADSTICA INFERENCIAL ] 3
4 4!
= = 6
2 2!(4 2)!
Es
decir
que
podemos
formar
seis
grupos
de
dos
elementos
cada
uno.
Observmoslos:
c. Dichas
muestras
son
de
tipo
aleatorio
simple
para
poblacin
finita
o
infinita?
Como
cada
una
de
estas
muestras
tiene
la
misma
probabilidad
de
ser
elegida
entonces
la
probabilidad
de
escoger
una
muestra
estara
dada
por:
Muestra
X 1
X 2
X 3
X 4
X 5
X 6
Probabilidad
1 1 1 1 1 1
6 6 6 6 6 6
Y
por
ende
estamos
en
presencia
de
muestreo
aleatorio
simple
para
poblacin
finita.
Como
X
es
una
variable
aleatoria,
vamos
a
calcular
la
media
en
cada
muestra,
entonces
X 1 :
el
promedio
de
la
primera
muestra, X 2 :
el
promedio
de
la
segunda
muestra,
etc.,
Veamos:
78 + 67 78 + 83 78 + 56
X1 = = 72.5 X2 = = 80.5 X3 = = 67
2 2 2
67 + 83 67 + 56 83 + 56
X4 = = 75 X5 = = 61.5 X6 = = 69.5
2 2 2
d. Ahora
vamos
a
calcular
la
media
de
estas
medias
es
decir:
1 1 1 1 1 1
E ( X ) = X1 + X 2 + X 3 + X 4 + X 5 + X 6
6 6 6 6 6 6
X 1 + X 2 + X 3 + X 4 + X 5 + X 6 72.5 + 80.5 + 67 + 75 + 61.5 + 69.5 426
= = = = 71
6 6 6
Ntese
que
el
promedio
de
las
medias
muestrales
es
igual
a
la
media
poblacional,
entonces
podemos
decir
que
!
es
una
buena
estimacin
de
.
! ! =!
4
[ POLITCNICO GRANCOLOMBIANO ]
(72.5 71) 2 + (80.5 71) 2 + (67 71) 2 + (75 71) 2 + (61.5 71) 2 + (69.5 71) 2
X =
6
6.013
!! ! !
!!! =
! !1
Con
los
datos
del
ejemplo
se
tiene
que:
(10,4163)! 4 2
!!! =
2 41
!!! = 36,1664
!! = 6,013
Podemos
decir
entonces
que
si
se
seleccionan
todas
las
muestras
posibles
de
tamao
n
de
una
poblacin
dada
entonces
se
tiene:
!! ! !
!(!)=
!!! =
y
!
! 1
!!!
El
factor
!!!
se
denomina
factor
de
correccin
por
finitud
y
en
los
casos
de
poblaciones
!!
infinitas
este
factor
se
hace
igual
a
1
es
decir
que
queda
como:
!!! = !
.
[ ESTADSTICA INFERENCIAL ] 5
Al
seleccionar
muestras
simples
de
tamao
de
una
poblacin,
la
distribucin
muestral
de
la
media
muestral
se
puede
aproximar
con
una
distribucin
de
probabilidad
normal,
cuando
el
tamao
de
la
muestra
es
grande:
de
tamao
mayor
que
treinta.
Otra
manera
de
presentar
el
teorema
es
la
siguiente:
Si
son
un
conjunto
de
variables
aleatorias
independientes
que
se
distribuyen
idnticamente
con
media
y
varianza
,
entonces
la
variable
aleatoria:
!!
!! = !!
!
Para
la
cual
es
la
suma
de
dichas
variables
aleatorias
y
es
el
promedio
de
las
mismas,
se
distribuye
normal
estndar
cuando
n
tiende
a
aumentar
significativamente.
Con
lo
anterior
estamos
preparados
para
estudiar
las
distribuciones
muestrales
y
las
caractersticas
de
los
estimadores
puntuales
ms
usados
en
la
inferencia
estadstica.
A
continuacin
se
expondrn
las
variables
aleatorias
(con
sus
distribuciones
de
probabilidad)
que
ms
se
utilizan
para
estimar
los
parmetros
poblacionales
media,
varianza
y
proporcin
y
hacer
inferencias
de
los
mismos.
Distribucin
muestral
de
!
en
una
poblacin
normal
Si
es
la
media
de
una
muestra
aleatoria
de
tamao
n
sacada
de
una
X
poblacin
distribuida
normalmente
con
media
y
desviacin
X =
y
por
lo
tanto
la
n
estandarizacin
!!
es:
X !!
!! = !!
6
[ POLITCNICO GRANCOLOMBIANO ]
Ejemplo:
b. Con
base
al
enunciado
debemos
calcular
P ( X > 280)
y
esto
lo
logramos
estandarizando
la
variable
aleatoria
X :
X 280 280 280 300 20
P
>
= P Z >
= P Z > = P Z > = P ( Z > 4 )
X X X 5 5
Cabe
resaltar
que
como
la
normal
estndar
es
una
distribucin
para
la
cual
los
valores
de
la
probabilidad
de
una
cantidad
negativa
son
igual
al
valor
de
la
probabilidad
de
la
cantidad
pero
positiva,
es
decir:
[ ESTADSTICA INFERENCIAL ] 7
Con
lo
cual
decimos
que
la
probabilidad
de
que
la
media
muestral
sea
superior
a
280
en
una
muestra
de
tamao
16
es
casi
nula.
En
otras
palabras
no
es
muy
probable
que
en
una
muestra
de
diez
y
seis
calificaciones
la
media
muestral
sea
mayor
a
280
puntos.
Ejemplo
En
cierta
ciudad
los
gastos
semanales
en
transporte
para
los
habitantes,
estn
distribuidos
normalmente
con
media
de
$16.500
y
una
desviacin
estndar
de
$1.500.
Cul
es
la
probabilidad
de
que
una
muestra
de
veinticinco
personas
tengan
un
gasto
promedio
semanal
superior
a
$15.750.
Vamos a identificar los datos que nos dan en el problema y a plantear la probabilidad
=$16.500 =$1.500 n = 25
!! ! !"#$%!!"#$$
P
(!>15760)
=
P ! > !"##
! !"
= 1-0.0068
=0.9832
La
diferencia
entre
este
enunciado
y
el
anterior
est
en
que
no
se
requiere
que
la
poblacin
de
origen
tenga
distribucin
normal
cuando
n
es
grande
(n
se
considera
grande
si
es
mayor
o
igual
a
treinta).
8
[ POLITCNICO GRANCOLOMBIANO ]
Ejemplo:
La
duracin
de
cierta
marca
de
bombillas
tiene
una
media
de
900
horas
y
la
desviacin
estndar
de
setenta
horas.
Si
se
selecciona
una
muestra
de
36
bombillas,
determine
la
probabilidad
de
que
dure
entre
870
y
925
horas.
Observe
que
no
se
hace
ninguna
mencin
de
la
forma
funcional
de
la
distribucin,
pero
como
el
tamao
de
muestra
es
grande
(n30),
por
el
teorema
del
lmite
central
entonces
la
distribucin
es
aproximadamente
normal:
=900 = 70 n = 36
!"#!!"" !! ! !"#!!""
P
(870! 925)
=
P !" ! !"
!" ! !"
[ ESTADSTICA INFERENCIAL ] 9
El
rea
total
bajo
la
distribucin
t
es
igual
a
1
y
esta
distribucin
se
encuentra
tabulada
para
cada
valor
(n-1)
o
grados
de
libertad
denominados
gl:
Distribucin
de
la
proporcin
de
una
muestra
En
la
prctica,
son
muy
utilizadas
las
inferencias
sobre
proporciones
poblacionales.
Por
lo
tanto
la
distribucin
muestral
de
una
proporcin
es
de
gran
inters.
En
un
estudio
de
mercados
se
puede
estar
interesado
en
la
proporcin
o
porcentaje
de
consumidores
que
estaran
dispuestos
a
comprar
algn
producto
nuevo
que
se
piensa
lanzar
al
mercado.
El
jefe
de
personal
puede
estar
interesado
en
conocer
el
porcentaje
de
empleados
que
se
ausentan
en
horas
de
trabajo.
10
[ POLITCNICO GRANCOLOMBIANO ]
Sea
A
el
nmero
total
de
elementos
que
presentan
cierta
caracterstica
en
una
poblacin,
entonces
la
proporcin
de
aquellos
que
cumplen
y
no
cumplen
con
dicha
caracterstica
est
A NA
dada
por
la
expresin
P =
y
1 P =
respectivamente.
N N
!(1 !)
!~! !!, ! !
!
!(!!!)
proporcin
poblacional
y
! !
es
el
error
estndar
de
la
proporcin.
Obsrvese
que
cada
observacin
de
este
experimento
es
de
tipo
Bernoulli
xito
(cumple
con
la
caracterstica)
y
fracaso
(no
cumple
con
la
caracterstica)
y
como
se
repite
cierto
nmero
de
veces
se
convierte
en
una
Binomial
para
la
cual
el
valor
esperado
de
la
variable
aleatoria
proporcin
de
individuos
con
la
caracterstica
es
P
y
la
varianza
es
P (1 P ) .
Si
el
tamao
de
muestra
es
grande
por
el
teorema
del
lmite
central
esta
binomial
puede
aproximarse
a
una
normal
con
media
P
y
varianza
P (1 P ) .
Para
tamao
de
muestra
pequeo
es
decir
que
cumpla
que
np < 5
o
n(1 p ) < 5
se
tiene
que
la
varianza
y
desviacin
estndar
estn
definidas
de
la
siguiente
manera
) = N n P(1 P)
respectivamente
a
N n
se
le
) = N n P(1 P)
y
Var ( P
Var ( P
N 1 n N 1 n N 1
conoce
como
factor
de
correccin
de
poblaciones
finitas:
Ejemplo
Se
sabe
que
el
60%
de
los
adultos
de
una
zona
del
pas
compran
determinado
producto.
Se
obtiene
una
muestra
de
150
adultos
de
esta
rea.
Cul
es
la
probabilidad
de
que
la
proporcin
muestral
este
entre
el
50%
y
el
70%?
[ ESTADSTICA INFERENCIAL ] 11
(!,!)(!,!)
!! = ! = 0,6
!! = !"#
= 0,04
Muchas
veces
el
inters
se
centra
en
dos
poblaciones
de
las
cuales
vamos
a
ver
si
las
medias
poblacionales
no
son
iguales,
o
podemos
estar
interesados
en
la
magnitud
de
cualquier
diferencia
que
se
pueda
presentar,
por
ejemplo
se
podra
estar
interesado
en
conocer
si
dos
lneas
de
produccin
sacan
en
promedio
el
mismo
nmero
de
unidades,
o
si
son
diferentes
dos
mtodos
de
entrenamiento
utilizados
en
el
personal
de
produccin.
1.
La
diferencia
muestral
para
la
diferencia
entre
dos
medias
muestrales
a
partir
de
muestras
independientes
de
tamao
n1
y
n2,
extradas
de
dos
poblaciones
distribuidas
normalmente,
estar
distribuida
normalmente
y
tendr
una
media
igual
a
(1
-
2)
y
una
varianza
igual
a
!! !!
(!! + !! ).
! !
2.
Si
n1y
n2
son
grandes
la
distribucin
muestral
de
la
diferencia
entre
las
dos
medias
muestrales
ser
aproximadamente
normal
sin
tener
en
cuenta
la
forma
funcional
de
las
poblaciones
originales.
Para
encontrar
las
posibilidades
asociadas
a
(!! !! )
se
deben
transformar
los
valores
de
(!! !! )
en
los
valores
de
la
distribucin
normal
estandarizada,
mediante
la
frmula:
!! !! (! ! )
!=
!!! !!!
!! + !!
12
[ POLITCNICO GRANCOLOMBIANO ]
EJEMPLOS:
1.
La
produccin
diaria
de
una
primera
fbrica
de
envases
de
plstico
tiene
una
distribucin
normal
con
una
media
de
50
unidades
y
una
desviacin
estndar
de
8
unidades.
La
produccin
de
una
segunda
fbrica
esta
distribuida
normalmente
con
una
media
de
cuarenta
unidades
y
una
desviacin
estndar
de
doce.
Para
comparar
el
rendimiento
en
el
trabajo
en
dos
fbricas
de
envases
plsticos
se
saca
de
la
primera
fbrica,
una
muestra
aleatoria
de
100
obreros
y
de
la
segunda
una
muestra
de
400.
Encontrar
la
probabilidad
de
que
los
obreros
de
la
primera
fbrica
produzcan
ocho
unidades
ms
que
los
de
la
segunda.
Solucin:
Primera
n1
=
10
! =
50
!! = !
Fbrica.
Segunda
n2
=
400
! =
40
!! = !"
Fbrica.
! !! !! > 8 =?
!! !! (! ! ) 8 (50 40 )
!= != ! = 2
64 144
!!! !!!
100 + 400
!! + !!
[ ESTADSTICA INFERENCIAL ] 13
MARCA A MARCA B
Muestra.
n1
=
10
n2
=
9
Media.
1
=
20
2
=
25
Desviacin
Estndar.
1
=
6
2
=
5,5
! !! !! > 0 =?
!! !! (! ! ) 0 (20 25 )
!= != ! = 1,81
!!! !!! 36 30,25
10 + 9
!! + !!
14
[ POLITCNICO GRANCOLOMBIANO ]
La
probabilidad
de
que
el
rendimiento
medio
para
10
autos
de
la
marca
A
sea
mayor
que
el
de
9
autos
de
la
marca
B
es
de
0,0351
BIBLIOGRAFA
FREUND,
John
E.,
MILLER,
Irwin
y
MILLER,
Marylees.
Estadstica
Matemtica
con
aplicaciones.
6ed.
Madrid
Prentice
Hall,
2000.
KENNET,
Ron
S.,
y
ZACKS,
Shelemyahu.
Estadstica
Industrial
Moderna.
Barcelona,
Thomson,
2000.
NEWBOLD. Paul. Estadstica para los Negocios y la Economa. 4ed. Madrid Prentice Hall, 1988.
WALPOLE
Ronal,
E.,
MYERS,
Raymond
H.
y
MYERS,
Sharon
L.
Probabilidad
y
Estadstica
para
Ingenieros.
6ed.
Madrid
Prentice
Hall,
1998.
[ ESTADSTICA INFERENCIAL ] 15