Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Cartilla - S2 PDF
Cartilla - S2 PDF
ESTADÍSTICA II
AUTOR: Rogelio Alvarado Martinez
ÍNDICE
ÍNDICE
• Introducción
Acceso rápido
4. Distribución
muestral
de
X
cuando
se
desconoce
la
distribución
de
la
población
5. Distribución muestral de X en una población normal con varianza poblacional desconocida
GENERALIDADES DESARROLLO
7. Distribución
muestral
para
la
diferencia
entre
dos
medidas
muestrales
X1-‐X2
GLOSARIO REFERENCIAS
Antes
de
comprender
la
inferencia
estadística,
tenemos
que
entender
claramente
el
concepto
de
distribución
muestral.
Con
esto
se
pretende
dar
a
conocer
la
naturaleza
de
tales
distribuciones
y
Proporción o probabilidad
π P
su
papel
en
la
inferencia
estadística,
sin
detenernos
mucho
en
este
tema,
ya
que
por
regla
general
de éxito
en
las
aplicaciones
estadísticas
no
se
construyen
distribuciones
muéstrales.
Para
emplear
los
métodos
de
la
inferencia
estadística,
necesitamos
conocer
solamente
las
características
de
la
distribución
muestral
del
estadístico
apropiado
al
problema
que
se
está
resolviendo.
Tabla 1: Elementos de una distribución
Ejemplo 1
Consideremos
una
población
conformada
por
4
personas
(N=4).
La
variable
de
interés
es
el
gasto
mensual
en
transporte
(en
miles
de
pesos).
Los
datos
de
la
población
son:
{78,
67,
83,
56}
y
vamos
a
responder
a
cada
literal
teniendo
en
cuenta
la
notación
utilizada.
a. Calcular
la
media
y
la
desviación
estándar
de
la
población
78 + 67 + 83 + 56 284 c. ¿Dichas
muestras
son
de
tipo
aleatorio
simple
para
población
finita
o
infinita?
&' µ= = = 71
µμ =
,
4 4
(
Y
la
desviación
estándar
es
Como
cada
una
de
estas
muestras
tiene
la
misma
probabilidad
de
ser
elegida,
entonces
la
probabilidad
de
escoger
una
muestra
estaría
dada
por:
(X − µμ).
σ=
N
b. De
la
población
vamos
a
seleccionar
todas
las
muestras
posibles
de
tamaño
n
=2
sin
orden
y
sin
repetición.
¿Cuántas
muestras
de
dos
elementos
de
la
población
pueden
formarse?
Y,
por
ende,
estamos
en
presencia
de
muestreo
aleatorio
simple
para
población
finita.
Como
hay
4
elementos
en
la
población
y
queremos
formar
grupos
de
dos
sin
importar
su
orden
Como
X
es
una
variable
aleatoria,
vamos
a
calcular
la
media
en
cada
muestra,
entonces
X 1 :
el
tenernos
que
calcular
una
combinación:
promedio
de
la
primera
muestra,
X 2 :
el
promedio
de
la
segunda
muestra,
etc.
Veamos:
⎛ 4 ⎞ 4!
⎜ ⎟ = =6
⎝ 2 ⎠ 2!(4 − 2)!
78 + 67 78 + 83 78 + 56
X1 = = 72.5 X2 = = 80.5 X3 = = 67
2 2 2
Es
decir,
que
podemos
formar
6
grupos
de
dos
elementos
cada
uno.
Observémoslos
67 + 83 67 + 56 83 + 56
X4 = = 75 X5 = = 61.5 X6 = = 69.5
2 2 2
X 1 : (78, 67) X 2 : (78,83) X 3 : (78,56)
X 4 : (67,83) X 5 : (67,56) X 6 : (83,56)
d. Ahora vamos a calcular la media de estas medias, es decir
1 1 1 1 1 1
E (µ X ) = X1 + X 2 + X 3 + X 4 + X 5 + X 6
6 6 6 6 6 6
(10,4163). 4 − 2
X + X 2 + X 3 + X 4 + X 5 + X 6 72.5 + 80.5 + 67 + 75 + 61.5 + 69.5 426 σ.9 =
= 1 = = = 71 2 4−1
6 6 6
σ.9 = 36,1664
σ9 = 6,013
Nótese
que
el
promedio
de
las
medias
muestrales
es
igual
a
la
media
poblacional,
entonces
podemos
decir
que
X
es
una
buena
estimación
de
µ.
Podemos
decir
entonces,
que
si
se
seleccionan
todas
las
muestras
posibles
de
tamaño
n
de
una
población
dada
entonces
se
tiene:
𝑬𝑬 𝑿𝑿 = 𝝁𝝁
𝑬𝑬 𝑿𝑿 = 𝝁𝝁
Calculamos
ahora
la
desviación
estándar
de
𝑋𝑋
para
las
seis
muestras
posibles:
y
(72.5 − 71) 2 + (80.5 − 71) 2 + (67 − 71) 2 + (75 − 71) 2 + (61.5 − 71) 2 + (69.5 − 71) 2 𝝈𝝈𝟐𝟐 𝑵𝑵 − 𝒏𝒏
σX = 𝝈𝝈𝟐𝟐
𝒙𝒙
=
6 𝒏𝒏 𝑵𝑵 − 𝟏𝟏
≈ 6.013
Observamos
que
la
varianza
poblacional
es
diferente
a
la
varianza
de
𝑋𝑋,
por
lo
tanto,
es
necesario
trabajar
con
una
varianza
corregida,
esto
se
logra
de
la
siguiente
forma:
(DE
El
factor
se
denomina
factor
de
corrección
por
finitud
y
en
los
casos
de
poblaciones
infinitas
(DF
GH
este
factor
se
hace
igual
a
1,
es
decir
que
queda
como:
σ.9 =
𝜎𝜎 . 𝑁𝑁 − 𝑛𝑛 E
𝜎𝜎5.
=
𝑛𝑛 𝑁𝑁 − 1
Se
realizó
una
prueba
a
un
grupo
de
80
aspirantes
al
cargo
de
administrador
de
cierta
empresa
y
se
obtuvo
que
las
calificaciones
siguen
una
distribución
normal
con
calificación
promedio
de
300
Al
seleccionar
muestras
simples
de
tamaño
n
de
una
población,
la
distribución
puntos
y
desviación
estándar
de
20.
Cuando
se
toma
una
muestra
de
16
calificaciones
de
las
muestral
de
la
media
muestral
se
puede
aproximar
con
una
distribución
de
pruebas.
probabilidad
normal,
cuando
el
tamaño
de
la
muestra
es
grande:
de
tamaño
mayor
que
30.
a. Cuál
es
el
error
típico
de
la
media
de
muestral.
Otra manera de presentar el teorema es la siguiente: b. Cuál es la probabilidad de que la media muestral sea superior a 280 puntos.
LP DQ
𝑍𝑍5̅ =
IR
S
a. La
varianza
muestral
es
(σ X )2 ,
luego
el
error
típico
de
la
media
muestral
es.
Para
la
cual
∑JUVF 𝑋𝑋U
es
la
suma
de
dichas
variables
aleatorias
y
𝑋𝑋P
es
el
promedio
de
las
mismas,
se
distribuye
normal
estándar
cuando
n
tiende
a
aumentar
𝜎𝜎
𝜎𝜎L =
𝑛𝑛
Con
lo
anterior,
estamos
preparados
para
estudiar
las
distribuciones
muestrales
y
las
20
𝜎𝜎L = =5
características
de
los
estimadores
puntuales
más
usados
en
la
inferencia
estadística.
A
16
continuación,
se
expondrán
las
variables
aleatorias
(con
sus
distribuciones
de
probabilidad)
que
más
se
utilizan
para
estimar
los
parámetros
poblacionales
media,
varianza
y
proporción
y
hacer
b. Con
base
al
enunciado
debemos
calcular
P ( X > 280)
y
esto
lo
logramos
estandarizando
la
inferencias
de
los
mismos.
variable
aleatoria
X .
3. Distribución
muestral
de
𝑋𝑋
en
una
población
normal
⎛ X − µ 280 − µ ⎞ ⎛ 280 − µ ⎞ ⎛ 280 − 300 ⎞ ⎛ −20 ⎞
P ⎜ > ⎟ = P ⎜ Z > ⎟ = P ⎜ Z > ⎟ = P ⎜ Z > ⎟ = P ( Z > −4 )
Si
X
es
la
media
de
una
muestra
aleatoria
de
tamaño
n
sacada
de
una
población
distribuida
⎜ σ σ ⎟ ⎜ σ ⎟ ⎝ 5 ⎠ ⎝ 5 ⎠
⎝ X X ⎠ ⎝ X ⎠
I
normalmente
con
media
µ
y
desviación
𝜎𝜎5 = ;
y
por
lo
tanto
la
estandarización
𝑍𝑍L
es:
J
Veamos
la
representación
gráfica
de
la
probabilidad
solicitada:
𝑋𝑋 − 𝜇𝜇
𝑍𝑍5 =
𝜎𝜎5
µ=$16500
σ=$1500
n
=
25
LD
X F[\]^DF][^^
P
(𝑋𝑋>15760)
=
P >
I/ J F[^^/ .[
Cabe
resaltar
que
como
la
normal
estándar
es
una
distribución
para
la
cual
los
valores
de
la
probabilidad
de
una
cantidad
negativa
son
igual
al
valor
de
la
probabilidad
de
la
cantidad,
pero
positiva,
es
decir,
4. Distribución
muestral
de
𝑋𝑋
cuando
se
desconoce
la
distribución
de
la
población
Cuando
la
muestra
no
proviene
de
una
distribución
normal,
el
tamaño
de
la
muestra
desempeña
un
papel
muy
importante.
Cuando
n
es
pequeña,
la
forma
de
la
distribución
depende
P( Z > −4) = 1 − P( Z < −4) ≈ 1 − 0.9999 = 0.0001
principalmente
de
la
forma
de
la
población.
Sin
embargo,
cuando
n
crece,
uno
de
los
teoremas
más
importantes
de
la
inferencia
estadística
establece
que
la
forma
de
la
distribución
muestral
se
aproxima
a
una
distribución
normal,
independientemente
de
la
distribución
que
tenga
la
Con
lo
cual
decimos
que
la
probabilidad
de
que
la
media
muestral
sea
superior
a
280
en
una
población
de
origen.
(Teorema
del
límite
central).
muestra
de
tamaño
16
es
casi
nula.
En
otras
palabras,
no
es
muy
probable
que
en
una
muestra
de
16
calificaciones
la
media
muestral
sea
mayor
a
280
puntos.
La
diferencia
entre
este
enunciado
y
el
anterior
está
en
que
no
se
requiere
que
la
población
de
origen
tenga
distribución
normal
cuando
n
es
grande
(n
se
considera
grande
si
es
mayor
o
igual
que
30).
Ejemplo 3
Ejemplo 4
En
cierta
ciudad
los
gastos
semanales
en
transporte
para
los
habitantes,
están
distribuidos
normalmente
con
media
de
$16500
y
una
desviación
estándar
de
$1500.
¿Cuál
es
la
probabilidad
de
que
una
muestra
de
25
personas,
tengan
un
gasto
promedio
semanal
superior
a
$15750.
La
duración
de
cierta
marca
de
bombillas
tiene
una
media
de
900
horas
y
la
desviación
estándar
de
70
horas.
Si
se
selecciona
una
muestra
de
36
bombillas,
determine
la
probabilidad
de
que
dure
entre
870
y
925
horas.
c\^Dd^^ LD
X d.[Dd^^
P
(870≤
𝑋𝑋 ≤ 925)
=
P ef ≤ i ≤ ef
gh j gh
5. Distribución
muestral
de
𝑋𝑋
en
una
población
normal
con
varianza
poblacional
desconocida
𝒙𝒙 − 𝝁𝝁
𝑇𝑇 =
𝑆𝑆/ 𝑛𝑛
Figura
2.
Tabla
t
Studente
Conocida
como
la
distribución
t
Student
o
simplemente
con
el
nombre
de
la
distribución
t.
Esto
quiere
decir,
que
para
hacer
inferencias
sobre
medias
poblacionales
cuando
no
se
conoce
la
Fuente: Elaboración propia
varianza
de
la
población,
se
utiliza
la
distribución
t
en
lugar
de
la
distribución
normal.
La
distribución
t,
de
la
misma
manera
que
la
distribución
normal
estandarizada,
tiene
forma
de
campana
y
tiene
media
igual
a
0,
alrededor
de
la
cual
es
simétrica.
La
varianza
de
la
distribución
La
columna
de
la
izquierda
de
la
tabla
contiene
diversos
valores
de
(n
–
1)
grados
de
libertad.
Cada
t,
en
cambio,
es
mayor
que
1,
es
por
esto
que
la
distribución
es
más
aguda
en
el
centro
y
más
alta
encabezamiento
en
las
columnas
indica
la
proporción
del
área
superior
bajo
la
curva
de
la
en
las
colas,
como
lo
muestra
la
siguiente
figura.
distribución
t.
Si
estamos
interesados,
por
ejemplo,
en
la
distribución
t
para
10
grados
de
libertad,
para
un
área
superior
de
0,05
el
valor
es
t
=
1,8125.
El
área
total
bajo
la
distribución
t
es
igual
a
1
y
esta
distribución
se
encuentra
tabulada
para
cada
valor
(n-‐1)
o
grados
de
libertad
denominados
gl.
Sea
A
el
número
total
de
elementos
que
presentan
cierta
característica
en
una
población,
entonces
la
proporción
de
aquellos
que
cumplen
y
no
cumplen
con
dicha
característica
está
dada
A N−A Ejemplo 5
por
la
expresión
P =
y
1 − P =
respectivamente.
N N
Se
sabe
que
el
60%
de
los
adultos
de
una
zona
del
país
compran
determinado
producto.
Se
obtiene
Obsérvese
que
cada
observación
de
este
experimento
es
de
tipo
Bernoulli
éxito
(cumple
con
la
una
muestra
de
150
adultos
de
esta
área.
¿Cuál
es
la
probabilidad
de
que
la
proporción
muestral
característica)
y
fracaso
(no
cumple
con
la
característica)
y
como
se
repite
cierto
número
de
veces
esté
entre
el
50%
y
el
70%?
se
convierte
en
una
Binomial
para
la
cual
el
valor
esperado
de
la
variable
aleatoria
proporción
de
individuos
con
la
característica
es
P
y
la
varianza
es
P (1 − P ) .
Si
el
tamaño
de
muestra
es
grande
𝜇𝜇u = 𝜋𝜋 = 0,6 𝜎𝜎v
=
(^,])(^,w)
= 0,04
F[^
por
el
teorema
del
límite
central,
esta
binomial
puede
aproximarse
a
una
normal
con
media
P
y
varianza
P (1 − P ) .
Recordemos
que
como
P
es
aproximadamente
normal,
se
requiere
estandarizar
la
variable
aleatoria
para
poder
utilizar
las
tablas
de
probabilidades.
^,[^D^,] vDt ^,\D^,]
P(0,5
<
P
<
0,7)
=
𝑃𝑃 < < = 𝑃𝑃 −2,5 < 𝑍𝑍v
< 2,5
^,^w Iz ^,^w
Si P es la variable aleatoria proporción de individuos de una población que presentan
determinada característica, entonces la proporción muestral se distribuye de la = 0,9938 − 0,0062 = 0,9876
siguiente manera:
𝜋𝜋(1 − 𝜋𝜋)
𝑝𝑝~𝑁𝑁 o𝜋𝜋, q r
𝑛𝑛
t(FDt)
π
proporción
poblacional
y
s J
es
el
e rror
estándar
de
la
proporción.
Para
tamaño
de
muestra
pequeño,
es
decir,
que
cumpla
que
np < 5
o
n(1 − p ) < 5
se
tiene
que
la
N − n P(1 − P)
varianza
y
desviación
estándar
están
definidas
de
la
siguiente
manera
Var ( P) =
y
N −1 n
Muchas
veces
el
interés
se
centra
en
dos
poblaciones
de
las
cuales
vamos
a
ver
si
las
medias
La
producción
diaria
de
una
primera
fábrica
de
envases
de
plástico
tiene
una
distribución
normal
poblacionales
no
son
iguales
o
podemos
estar
interesados
en
la
magnitud
de
cualquier
diferencia
con
una
media
de
50
unidades
y
una
desviación
estándar
de
8
unidades.
La
producción
de
una
que
se
pueda
presentar,
por
ejemplo,
se
podría
estar
interesado
en
conocer
si
dos
líneas
de
segunda
fábrica
está
distribuida
normalmente
con
una
media
de
40
unidades
y
una
desviación
producción
sacan
en
promedio
el
mismo
número
de
unidades
o
si
son
diferentes
dos
métodos
de
estándar
de
12.
Para
comparar
el
rendimiento
en
el
trabajo
en
dos
fábricas
de
envases
plásticos,
entrenamiento
utilizados
en
el
personal
de
producción.
se
saca
de
la
primera
fábrica
una
muestra
aleatoria
de
100
obreros
y
de
la
segunda
una
muestra
de
400.
Encontrar
la
probabilidad
de
que
los
obreros
de
la
primera
fábrica
produzcan
8
unidades
Como
una
generalización
de
la
distribución
muestral
para
la
media
se
puede
decir
lo
siguiente:
más
que
los
de
la
segunda.
1.
La
diferencia
muestral
para
la
diferencia
entre
dos
medias
muestrales
a
partir
de
muestras
independientes
de
tamaño
n1
y
n2,
extraídas
de
dos
poblaciones
distribuidas
normalmente,
estará
distribuida
normalmente
y
tendrá
una
media
igual
a
(µ1
-‐
µ2)
y
una
varianza
igual
a:
Solución:
I|H IH
( +
H )
Primera fábrica n1 = 100 µμ𝟏𝟏 = 50 𝝈𝝈𝟏𝟏 = 𝟖𝟖
J| JH
2.
Si
n1
y
n2
son
grandes,
la
distribución
muestral
de
la
diferencia
entre
las
dos
medias
muestrales
Segunda fábrica n2 = 400
µμ. = 40 𝝈𝝈𝟐𝟐 = 𝟏𝟏𝟏𝟏
será
aproximadamente
normal
sin
tener
en
cuenta
la
forma
funcional
de
las
poblaciones
originales.
Para
encontrar
las
posibilidades
asociadas
a
(𝑋𝑋F − 𝑋𝑋.
)
se
deben
transformar
los
valores
de
(𝑋𝑋F −
𝑋𝑋.
)
en
los
valores
de
la
distribución
normal
estandarizada,
mediante
la
fórmula:
𝑃𝑃 𝑋𝑋F − 𝑋𝑋. > 8 =?
𝜎𝜎F. 𝜎𝜎..
+
P
[Z
>
-‐2]
=
1
–
P
[Z
≤
-‐2]
=
1
–
0,0228
=
0,9772
𝑛𝑛F
𝑛𝑛.
ESTADISTICA:
Un
estadístico
es
un
número
determinado
que
describe
un
aspecto
de
la
muestra
y
para
encontrar
su
valor
es
necesario
utilizar
la
información
muestral.
En
los
ejemplos
enunciados
en
la
definición
de
parámetros,
los
estadísticos
correspondientes
son:
puntaje
medio
obtenido
en
la
prueba
de
aptitud
en
las
muestras
seleccionadas
de
hombres
y
mujeres
y
porcentaje
de
productos
defectuosos
en
una
muestra
seleccionada
de
la
producción
diaria.
CENSO:
Es
una
técnica
para
obtener
los
datos
por
medio
de
la
cual
se
cuentan
todos
los
elementos
que
conforman
la
población
y
se
registran
sus
características.
Figura
4.
Represantación
grafica
ejemplo
7
Fuente: Elaboración propia
La
probabilidad
de
que
el
rendimiento
medio
para
10
autos
de
la
marca
A
sea
mayor
que
el
de
9
autos
de
la
marca
B
es
de
0,0351
• GUTIERREZ, H. y. (2005). Control estadístico de Calidad y Seis Sigma. McGrawHill.
• FREUND
John
E.,
M.
I.
(2000).
Estadística
Matemática
con
aplicaciones
(6
ed.).
Prentice
Hall.
• Paul, N. (1988). Estadística para los Negocios y la Economía (4 ed.). Prentice Hall.
• C
MONTGOMERY,
D.
C.
(2002).
Probabilidad
y
Estadística
aplicadas
a
la
Ingeniería
(2
ed.).
Limusa
Wiley.
• Suárez
Ibujés,
M.
O.
(2012).
Interaprendizaje
de
Probabilidades
y
Estadistica
Inferencial
con
Excel,
WinStats,
Graph.
Ecuador,
South
America:
Figura 1. Representación grafica de la probabilidad ejemplo 2. .................................................................................. 10
Tabla 1: Elementos de una distribución .......................................................................... ¡Error! Marcador no definido.
Tabla 2: Probabilidad de los grupos observados ............................................................. ¡Error! Marcador no definido.