Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INTRODUCCIÓN A LA
INFERENCIA ESTADÍSTICA
6.1. Introducción
6.2. Conceptos básicos
6.3. Muestreo aleatorio simple
6.4. Distribuciones asociadas al muestreo
6.4.1. Distribución Chi-Cuadrado
6.4.2. Distribución t de Student
6.4.3. Distribución F de Snedecor
6.5. Distribución de estadísticos muestrales
6.5.1. Concepto de estadístico y distribución
muestral
6.5.2. Distribución de la media muestral de
una población Normal
6.5.3. Distribución de la varianza muestral
de una población Normal
6.5.4. Distribución de la diferencia de
medias muestrales de dos poblaciones
Normales independientes
6.5.5. Distribución del cociente de varianzas
muestrales de dos poblaciones Normales
independientes
6.5.6. Distribución de la proporción muestral
6.5.7. Distribución de la diferencia de
proporciones muestrales
145
6.1. Introducción
Análisis Descriptivo
Inferencia Estadística
Cálculo de Probabilidades
Estimación Contraste de
Hipótesis
Describir
Población Parámetros
Poblacionales
Características
Se extrae Estimación
Contraste
Muestra Estadísticos
Genera Utilizados
Datos numéricos
para obtener
146
6.2 Conceptos básicos
147
La inferencia estadística esta basada en el
estudio de las muestras
148
6.3 Muestreo aleatorio simple
149
Muestreo aleatorio simple
150
Pasos de un muestreo
Población
Muestra
151
♦ Ejemplo en poblaciones finitas
152
♦ Ejemplo en poblaciones infinitas
153
6.4 Distribuciones asociadas al muestreo
X = X 12 + X 22 + .... + X n2
X χ n2
Distribución Chi-Cuadrado
0.12 G. Libertad
10
0.08
f(x)
0.04
0
0 10 20 30 40
x
154
9 Esperanza matemática
2
E χn = n
9 Varianza
2
Var χ n = n
9 Para valores grandes de n, la distribución Chi-
Cuadrado se aproxima a la distribución Normal. La
aproximación se considera aceptable para n > 30
Distribución Chi-Cuadrado
0.12 G. Libertad
10
20
0.08 30
f(x)
0.04
0
0 20 40 60 80
155
6.4.2 Distribución t de Student
Z N ( 0; 1 )
Independientes
Y χ n2
Z
X=
Y
n
X → tn
Contraste Distribuciones
0.4
Normal
t-Student
f(x) 0.2
0
-6 -4 -2 0 2 4 6
156
9 Esperanza matemática
E tn = 0
9 Varianza
n
Var t n =
n−2
Distribución t-Student
0.4 G. Libertad
10
0.3
20
30
f(x) 0.2
0.1
0
-8 -4 0 4 8
157
6.4.3 Distribución F de Snedecor
Y χ n2
2 Independientes
W χm
Y
X= n
W
m
X Fn, m
Distribución F de Snedecor
0.8 G. Libertad
10,10
0.6
f(x) 0.4
0.2
0
0 1 2 3 4 5
158
9 Para valores grandes de n y m, la distribución F de
Snedecor se aproxima a la distribución Normal.
Distribución F de Snedecor
1.2 G. Libertad
5,10
10,20
0.8 30,30
f(x)
0.4
0
0 1 2 3 4 5
159
6.5 Distribución de estadísticos muestrales
Estadísticos muestrales
Inferencia
Parámetros poblacionales
160
¾ Sea una población donde se observa la variable aleatoria X
E [X ] = µ ; Var [X ] = σ 2
¾ Consideramos una muestra aleatoria simple, m.a.s., de
tamaño n, formada por las v.a. X1, X2,....Xn
9 Varianza muestral:
n
(
∑ Xi − X 0
i =1
)
2
σ̂ 2 =
n
n 2
9 Cuasi-Varianza muestral:
∑ ( Xi − X )
S 2 = i =1
n −1
161
¾ Consideramos todas las posibles muestras de tamaño n
X 11 X 12 X 1j
X.21 X 22 X.2j
. . .
. . .
.
X i1 X i2 X ij
. . .
. . .
. . .
X n1 X n2 X nj
x1 x2 K xj K
9 Esperanza matemática: E X = µX
9 Varianza: Var X = σ X2
162
¾ Los estadísticos muestrales, media, varianza y cuasi-
varianza verifican las siguientes propiedades:
9 Media muestral:
E X = µX = µ
σ 2
2
Var X = σ X =
n
9 Varianza muestral:
[ ]
E σˆ 2 =
n −1 2
n
σ
9 Cuasivarianza muestral:
E S 2 = σ 2
163
♦ Ejemplo en poblaciones infinitas
1.-
X P( X )
1 1 1 9
µ = E [ X ] = 1× + 3 × + 5 × = = 3
3 3 3 3
σ 2 = E X 2 − E [ X ] 2 =
1 1 1 8
= 12 × + 32 × + 52 × − 32 =
3 3 3 3
164
2.-
x1 x2 x X P( X )
1 1 1 1 1/9
1 3 2 2 2/9
1 5 3 3 3/9
3 1 2
4 2/9
3 3 3
5 1/9
3 5 4
5 1 3
5 3 4
E X = 3 = µ
5 5 5
4 8 3 σ2
Var X = = =
3 2 n
1 2 1
µ X = E X = 1 × + 2 × + ... + 5 × = 3
9 9 9
2 2 2
Var [ X ] = σ X = E X − E X =
2 1 2 1 2 4
= 1 × + ... + 5 × − 3 =
9 9 3
165
6.5.2. Distribución de la media muestral
de una población Normal
X 1, X 2 ,..., X n
Independientes entre si
Xi N (µ, σ )
166
Distribución de la media muestral
1 n
X = ∑ Xi
n i =1
σ
X → N µ,
n
Por lo tanto
X −µ
Z = → N ( 0; 1 )
σ
n
167
♦ Caso B. Varianza poblacional, σ2 , desconocida
X −µ
T=
S
→ tn − 1
n
X −µ
El estadístico T, definido como: T=
S
n
168
Teorema Central del Limite
X −µ
Z=
σ
n
169
♦ Ejemplo: Distribución de la media muestral
Varianza poblacional conocida
X −µ X −6 X −6
Z= = = → N ( 0; 1)
σ 2 0.4
n 25
X − 6 6.3 − 6
P ( X ≤ 6.3) = P ≤ = P ( Z ≤ 0.75) =
0.4 0.4
170
♦ Ejemplo: Distribución de la media muestral
Varianza poblacional desconocida
X −µ X −µ X −µ
T=
S
=
14
= → tn − 1 = t15
3.5
n 16
( ) (
P X − µ ≤ 8 = P −8 ≤ X − µ ≤ 8 = )
−8 8
= P ≤ X −µ ≤ = P(− 2.947 ≤ t15 ≤ 2.947) =
10.8585 10.8585
16 16
= 1 − 2 P(t15 ≥ 2.947 ) = 1 − 2 × 0.005 = 1 − 0.01 = 0.99
171
2. Se hacen 36 mediciones en las que se obtiene una
cuasidesviación típica de 12 unidades. Obtener la
probabilidad de que la media muestral no difiera de la
media poblacional en más de 5 unidades.
X −µ X −µ X −µ
T= = = → t35 ≅ N (0; 1)
S 12 2
n 36
( ) (
P X − µ ≤ 5 = P −5 ≤ X − µ ≤ 5 = )
−5 X −5 5
= P ≤ ≤ = P(− 2.5 ≤ Z ≤ 2.5) =
2 2 2
= 1 − 2 × 0.00621 = 0.98758
172
♦ Ejemplo: Teorema central del límite
M
X 64 : " Nº de barriles el día 64"
∑ Xi σ
n = 64 > 30 ⇒ X = → N µ;
n n
16
X → N µ; = N (µ ; 2 )
64
173
σ 16
X → N µ; = N µ; = N ( µ ; 2)
n 64
X −µ X −µ
Z= = → N (0; 1)
σ 2
n
P( X − µ ≤ 4 ) = P(− 4 ≤ X − µ ≤ 4) =
− 4 X − µ 4
= P ≤ ≤ = P (− 2 ≤ Z ≤ 2 ) =
2 2 2
174
6.5.3. Distribución de la varianza muestral
de una población Normal
X 1, X 2 ,..., X n
Independientes entre si
Xi N (µ, σ )
175
Distribución de la varianza muestral
χ2 =
nσˆ 2
=
(n − 1)S 2
σ2 σ2
χ2 =
nσˆ 2
=
(n − 1)S 2
→ χ2 n −1
σ2 σ2
176
♦ Ejemplo: Distribución de la varianza muestral
X i : " Medición"→ N (µ ; 4)
n = 25
χ2 =
nσˆ 2
=
(n − 1)S 2
→ χ2 n −1
σ2 σ2
( ) n σ 2 n 12.16
ˆ
P σˆ 2 ≥ 12.16 = P ≥ =
σ2 σ 2
2
= P χ n −1 ≥
25 × 12.16
16
(2 )
= P χ n−1 ≥ 19 = 0.75
177
6.5.4. Distribución de la diferencia de
medias muestrales de dos poblaciones
Normales independientes
X N ( µX , σ X )
Independientes
Y N ( µ Y , σY )
Consideramos:
m.a.s. de tamaño n X de X
X , S X2
X1, X 2 ,..., X n
x
m.a.s. de tamaño n Y de Y
Y , S Y2
Y1, Y2 ,..., YnY
1 nX 1 nX
∑ (X i − X )
2
X= ∑ Xi S X2 =
n X i =1 n X − 1 i =1
1 nY 1 nY
∑ (Yi − Y )
2
Y= ∑ Yi SY2 =
nY i =1 nY − 1 i =1
178
Distribución de la diferencia de medias
179
Distribución de la diferencia de medias
2 2
σX σY
N ( µ X − µ Y ), +
nX nY
Por lo tanto
(X − Y ) − ( µX − µ Y )
Z= → N ( 0 ;1)
σ X2 σ Y2
+
nX nY
180
♦ Caso B. Varianzas poblacionales
desconocidas, pero iguales
2 2
σ X = σY
T=
( X −Y ) − ( µX − µ Y )
1 1
Sp +
n X nY
( n X − 1 ) S X2 + ( n Y − 1) S 2Y
donde: S 2p =
nX + n Y − 2
T=
( X − Y ) − ( µX − µ Y )
→ tn X + n Y − 2
1 1
Sp +
n X nY
181
♦ Caso C. Varianzas poblacionales desconocidas
distintas o no, con n X, n Y > 30
Z=
( X −Y ) − ( µX − µ Y )
S X2 S Y2
+
n X nY
Z=
( X −Y ) − ( µX − µ Y )
→ N ( 0;1 )
S X2 S Y2
+
n X nY
182
♦ Ejemplo: Distribución de la diferencia de medias
Varianzas poblacionales conocidas
X → N (0.48; 0.2 ); n X = 25
Y → N (0.4663; 0.01); nY = 100
X − Y − (µ X − µY )
Z= → N (0; 1)
2
σX σ Y2
+
nX nY
183
X − Y − (µ X − µY )
Z= → N (0; 1)
2
σX σ Y2
+
nX nY
P( X ≤ Y + 0.2 ) = P( X − Y ≤ 0.2 ) =
X − Y − (µ X − µY ) 0.2 − (µ X − µY )
= P ≤ =
2 2 2 2
σ X + Yσ σ σ
X + Y
n n n n
X Y X Y
0.2 − 0.0137
= P Z ≤ =
0.008 + 0.0001
= 1 − 0.0192 = 0.9808
184
♦ Ejemplo: Distribución de la diferencia de medias.
Varianzas poblacionales desconocidas,
pero iguales
• Se está realizando un estudio sobre la calidad del aire
en dos zonas A y B. Un indicador de la calidad es el
número de microgr. de partículas en suspensión por m3 de
aire, que suponemos siguen distribuciones Normales
independientes de media 62.237 en A, 61.022 en B y
varianzas iguales. En la zona A se realizan 12 mediciones,
obteniéndose una cuasi-varianza de 8.44 microgr2 y en la
B 15 mediciones, con una cuasi-varianza de 9.44
microgr2. Obtener la probabilidad de que la media
muestral de A sea como mínimo tres unidades superior a
la media muestral de B.
n X = 12; s 2X = 8.44
nY = 15; sY2 = 9.44
185
X : " Calidad del aire en A"; X → N (62.237; σ )
Y : " Calidad del aire en B"; Y → N (61.022; σ )
n X = 12; s 2X = 8.44
nY = 15; sY2 = 9.44
(
S 2p = X
n − 1)S 2 (
X + nY − 1)S 2
Y =9
(n X + nY − 2)
P ( X − Y ≥ 3) =
X − Y − (µ X − µY ) 3 − (µ X − µY )
=P ≥ =
1 1 1 1
Sp + Sp +
n X nY n X nY
3 − 1. 015 = P(t25 ≥ 1.708) = 0.05
= P t25 ≥
1 1
3 +
12 15
186
♦ Ejemplo: Distribución de la diferencia de medias
Varianzas poblacionales desconocidas.
Muestras grandes
n X = 35 ; X = 1.9 ; S X = 0.4
nY = 40 Y = 1.7 ; SY = 0.7
( X − Y ) − ( µ X − µY )
Z= → N ( 0; 1)
S 2X S Y2
+
n X nY
187
X : " I.B - D antes del vertido"→ N (µ X ;σ X )
Y : " I.B - D después del vertido"→ N (µY ;σ Y )
n X = 35 ; X = 1.9 ; S X = 0.4
nY = 40 Y = 1.7 ; SY = 0.7
P( X − Y ≤ 0.2 ) =
X − Y − (µ X − µY ) 0.5 − (µ X − µY )
= P ≤ =
2 2 2 2
S X SY S X SY
+ +
n X nY n X nY
0.5 − (1.9 − 1.7 )
= P Z ≤ =
0.4 2 2
0.7
+
35 40
= 1 − 0.0104 = 0.9896
188
6.5.5. Distribución del cociente de varianzas
muestrales de dos poblaciones
Normales independientes
X N ( µX , σ X )
Independientes
Y N ( µ Y , σY )
Consideramos:
m.a.s. de tamaño n X de X
X , S X2
X1, X 2 ,..., X n
x
m.a.s. de tamaño n Y de Y
Y , S Y2
Y1, Y2 ,..., YnY
n nX
1 X 1
X = ∑ Xi S X2 = ∑ (X − X )2
nX
i =1 n X − 1 i =1 i
n n
Y
1 Y 2 1
Y= ∑ Yj SY = ∑ (Y j − Y ) 2
nY n Y − 1 j =1
j =1
189
Distribución del cociente de
varianzas muestrales
S X2 σ X2 S X2 × σ Y2
F= =
S Y2 σ Y2 S Y2 × σ X2
S X2 × σ Y2
F= → Fn , nY − 1
−1
S Y2 × σ X2 X
190
♦ Ejemplo: Distribución del cociente de varianzas
muestrales
S X2 × σ Y2
F= → Fn , nY − 1
−1
S Y2 × σ X2 X
( ) σ Y2 S X2 σ Y2
2
S
P σ Y ≥ 2σ X = P
2 2
≥ 2 = P ≥2 X =
σ 2 S 2σ 2 SY2
X Y X
191
6.5.6. Distribución de la proporción muestral
X → N (np ; npq )
X
pˆ =
n
192
Distribución de la proporción muestral
X
pˆ =
n
Verifica que:
pq
pˆ → N p;
n
Por lo tanto:
pˆ − p
Z= → N (0; 1)
pq
n
193
♦ Ejemplo: Distribución de la proporción muestral
pq 0.38 × 0.62
pˆ → N p ; = N 0.38 ; = N (0.38 ; 0.068)
n 50
pˆ − p pˆ − 0.38
Z= = → N (0 ; 1)
pq 0.068
n
pˆ − 0.38 0.19 − 0.38
P ( pˆ ≥ 0.19 ) = P ≥ = P(Z ≥ −2.769 ) =
0.0686 0.0686
194
6.5.7. Distribución de la diferencia de
proporciones muestrales
X → B(n X ; p X )
Independientes
Y → B(nY ; pY )
X (
N n X pX ; nX p X q X )
Y N ( n Y pY ; nY p Y q Y )
Definimos las proporciones muestrales como:
X
pˆ X =
nX
Y
pˆ Y =
nY
195
Distribución de la diferencia de proporciones
muestrales
X
pˆ X = n
X
pˆ X - pˆ Y ; donde :
ˆp X − ˆp Y ;
Y
pˆ Y =
nY
Se verifica que:
Z=
( pˆ X − pˆ Y ) − ( p X − pY )
→ N (0; 1)
p X q X pY qY
+
nX nY
196
♦ Ejemplo: Distribución de la diferencia de
proporciones muestrales
• Se sabe que en una población el 28% de las mujeres y
el 25% de los hombres son fumadores. Se extraen
muestras de 42 mujeres y 40 hombres. Determinar la
probabilidad de que las mujeres fumadoras superen a los
hombres fumadores en al menos el 4%.
pX: “Proporción de mujeres fumadoras en la población
pY: “Proporción de mujeres fumadoras en la población
p̂ X :“Proporción de mujeres fumadoras en la muestra
p̂Y : “Proporción de mujeres fumadoras en la muestra
Z=
( pˆ X − pˆY ) − ( pX − pY ) ( pˆ X − pˆY ) −(0.28− 0.25)
=
pX qX pY qY 0.28×0.72 0.25×0.75
+ +
nX nY 42 40
=
( pˆ X − pˆ Y ) − 0.03
→ N (0 ; 1)
0.0974
P( pˆ X ≥ pˆ Y + 0.04 ) = P( pˆ X − pˆ Y ≥ 0.04 ) =
0.04 − 0.03
= P Z ≥ = P(Z ≥ 0.0103) = 0.4602
0.974
197