Está en la página 1de 53

TEMA 6.

INTRODUCCIN A LA
INFERENCIA ESTADSTICA
6.1. Introduccin
6.2. Conceptos bsicos
6.3. Muestreo aleatorio simple
6.4. Distribuciones asociadas al muestreo
6.4.1. Distribucin Chi-Cuadrado
6.4.2. Distribucin t de Student
6.4.3. Distribucin F de Snedecor
6.5. Distribucin de estadsticos muestrales
6.5.1. Concepto de estadstico y distribucin
muestral
6.5.2. Distribucin de la media muestral de
una poblacin Normal
6.5.3. Distribucin de la varianza muestral
de una poblacin Normal
6.5.4. Distribucin de la diferencia de
medias muestrales de dos poblaciones
Normales independientes
6.5.5. Distribucin del cociente de varianzas
muestrales de dos poblaciones Normales
independientes
6.5.6. Distribucin de la proporcin muestral
6.5.7. Distribucin de la diferencia de
proporciones muestrales
145

6.1. Introduccin

Anlisis Descriptivo
Inferencia Estadstica
Clculo de Probabilidades

Estimacin

Describir

Poblacin

Se extrae

Parmetros
Poblacionales
Caractersticas
Estimacin
Contraste

Estadsticos

Muestra
Genera

Contraste de
Hiptesis

Datos numricos

Utilizados
para obtener

146

6.2 Conceptos bsicos

Poblacin: Conjunto de elementos en los que se

observa alguna caracterstica comn

Observaciones: Valores que toma la caracterstica

observada en cada elemento de la poblacin

Parmetro: Caracterstica numrica que describe una

variable observada en la poblacin

Muestra: Conjunto de unidades representativas de

una poblacin

Estadstico: Funcin de los valores de la muestra

147

La inferencia estadstica esta basada en el

estudio de las muestras

La muestra debe ser representativa de la


poblacin para extraer conclusiones validas sobre
esta poblacin

La muestra debe ser aleatoria

148

6.3 Muestreo aleatorio simple

Cada elemento de la poblacin tiene la misma

probabilidad de ser elegido para formar parte de la


muestra y cada muestra del mismo tamao tiene la misma
probabilidad de ser seleccionada

Muestra aleatoria simple de tamao n:

Sea una poblacin donde observamos la variable


aleatoria X.
Una muestra aleatoria simple, m.a.s., de tamao n, es un
conjunto de n variables aleatorias X 1, X 2 ,..., X n , que
verifican:

Independientes entre s
X1, X 2 ,K, X n
Cada Xi con idnticas caractersticas que X

149

Muestreo aleatorio simple

El muestreo aleatorio simple en poblaciones finitas se


realiza con reemplazamiento, es decir:
Se selecciona un elemento de la poblacin al azar, se
observa el valor de la variable aleatoria X, se devuelve a
la poblacin y se vuelve a seleccionar otro elemento. As
hasta obtener los n elementos. Este procedimiento
garantiza la independencia de las observaciones

La seleccin aleatoria de los elementos se realiza con

una tabla de nmeros aleatorios,


procedimiento informtico

con

algn

150

Pasos de un muestreo
Poblacin en la que se observa la variable X

Poblacin

Se decide extraer una muestra aleatoria simple de tamao


n, compuesta por las variables aleatorias X1, X2,....,Xn
Se seleccionan n elementos de la poblacin

Muestra

Los elementos seleccionados generan n nmeros

x1, x2,....,xn, valores observados de


las variables aleatorias X1, X2,...,Xn

151

Ejemplo en poblaciones finitas


En un instituto se quiere realizar un estudio sobre el
nivel de colesterol de los alumnos. Para ello, se decide
extraer una muestra aleatoria simple de tamao 10
9 Poblacin

Alumnos del instituto

9 Variable aleatoria, X

Nivel de colesterol

9 Muestra aleatoria simple, de tamao 10

Variables aleatorias X1, X2,....,X10


X i , nivel de colesterol del i-simo alumno seleccionado

Se seleccionan 10 alumnos y sus niveles de colesterol son:


129, 170, 135, 140, 225, 163, 131, 203, 187, 149
9 Valores observados de las variables aleatorias

X1, X2,...., X10

x1 = 129 ;

x2 = 170 ; x3 = 135 ;

x6 = 163; x7 = 131;

x4 = 140 ; x5 = 225 ;

x8 = 203; x9 = 187 ; x10 = 149.

152

Ejemplo en poblaciones infinitas


Se analizan muestras de agua de un ro para estudiar el
ndice de diversidad de especies. Este ndice se utiliza para
medir el efecto de una perturbacin, como la
contaminacin del agua, en seres vivos. Puede
determinarse la diversidad de la poblacin antes y despus
de la perturbacin. Si el ndice tras la perturbacin es
mucho mas pequeo indica que la perturbacin ha tenido
efectos negativos. Para esto, se decide extraer una muestra
aleatoria simple de tamao 8
9 Poblacin

Posibles anlisis del agua


9 Variable aleatoria, X
ndice de diversidad
9 Muestra aleatoria simple

Variables aleatorias X1, X2,...., X8


Xi :ndice de diversidad del i-simo anlisis realizado

Se realizan 8 anlisis y sus ndices de diversidad son:


1.92; 1.87; 1.35; 1.48; 2.13; 1.85; 2.07; 1.98
9 Valores observados de las variables aleatorias

X1, X2,...., X8
x1 = 1,92; x 2 = 1,87; x3 = 1,35; x 4 = 1, 48;
x5 = 2,13; x 6 = 1,85, x 7 = 2,07; x8 = 1,98
153

6.4 Distribuciones asociadas al muestreo


6.4.1

Distribucin Chi-Cuadrado

Sean n variables aleatorias, X1, X2,....Xn, que verifican:

Independientes entre s
Xi
N ( 0; 1 )
Definimos la variable aleatoria X como:

X = X 12 + X 22 + .... + X n2
La variable aleatoria X sigue una distribucin Chi-

Cuadrado con n grados de libertad

n2

Distribucin Chi-Cuadrado
G. Libertad
10

0.12

0.08

f(x)
0.04

0
0

10

20

30

40

x
154

9 Esperanza matemtica

E n = n

9 Varianza

Var n = n

9 Para valores grandes de n, la distribucin Chi-

Cuadrado se aproxima a la distribucin Normal. La


aproximacin se considera aceptable para n > 30

Distribucin Chi-Cuadrado
G. Libertad
10
20
30

0.12

0.08

f(x)
0.04

0
0

20

40

60

80

155

6.4.2

Distribucin t de Student

Sean las variables aleatorias, Y y Z, que verifican:

N ( 0; 1 )

Independientes

n2

Definimos la variable aleatoria X como:

X=

La variable aleatoria X sigue una distribucin t de

Student con n grados de libertad

X tn
Contraste Distribuciones
0.4

Normal
t-Student

f(x)

0.2

0
-6

-4

-2

156

9 Esperanza matemtica

E tn = 0

9 Varianza

Var t n =
n2
9 Para valores grandes de n, la distribucin t de Student

se aproxima a la distribucin Normal. La aproximacin


se considera aceptable para n > 30

Distribucin t-Student
G. Libertad
10
20
30

0.4
0.3

f(x) 0.2
0.1
0
-8

-4

157

6.4.3

Distribucin F de Snedecor

Sean las variables aleatorias, Y y W, que verifican:

n2

Independientes

2
m

Definimos la variable aleatoria X como:

X=

Y
W

n
m

La variable aleatoria X sigue una distribucin F de

Snedecor con n y m grados de libertad

Fn, m

Distribucin F de Snedecor
G. Libertad
10,10

0.8
0.6

f(x)

0.4
0.2
0
0

158

9 Para valores grandes de n y m, la distribucin F de

Snedecor se aproxima a la distribucin Normal.

Distribucin F de Snedecor
G. Libertad
5,10
10,20
30,30

1.2

0.8

f(x)
0.4

0
0

159

6.5 Distribucin de estadsticos muestrales


6.5.1

Concepto de estadstico y
distribucin muestral

Estadstico: Una funcin de los valores de la

muestra. Es una variable aleatoria, cuyos valores


dependen de la muestra seleccionada. Su distribucin de
probabilidad, se conoce como Distribucin muestral del
estadstico

Sea una poblacin donde se observa la variable

aleatoria X. Esta variable X, tendr una distribucin de


probabilidad, que puede ser conocida o desconocida, y
ciertas caractersticas o parmetros poblacionales

Estadsticos muestrales

Inferencia

Parmetros poblacionales
160

Sea una poblacin donde se observa la variable aleatoria X

E [X ] = ;

Var [X ] = 2

Consideramos una muestra aleatoria simple, m.a.s., de

tamao n, formada por las v.a. X1, X2,....Xn

Independie ntes entre s

X 1 , X 2 ,K , X n E [ X ] =
Var [X ] = 2

Definimos los siguientes estadsticos muestrales:

9 Media muestral:

X1 + X 2 + .... + X n
X =

(
i =1
n

9 Varianza muestral:

2 =

Xi X 0

9 Cuasi-Varianza muestral:

( Xi X

S 2 = i =1

n 1

161

Consideramos todas las posibles muestras de tamao n

Muestra
1

Muestra
2

Muestra
j

X 11

X 12

X 1j

X.21

X 22

X.2j

X i1

X i2

X ij

X n1

X n2

X nj

.
.

.
.
.

x1

.
.
.

.
.

.
.
.

.
.
.

x2

xj K

La variable aleatoria X toma los valores:

x1 , x 2 ,.., x j ..

9 Su distribucin de probabilidad

Distribucin de la media muestral

9 Esperanza matemtica:

E X =

9 Varianza:

Var X = X2
162

Los estadsticos muestrales, media, varianza y cuasi-

varianza verifican las siguientes propiedades:


9 Media muestral:

E X =

X =

2
Var X = X =
n
9 Varianza muestral:

[ ]

E 2 =

n 1 2

9 Cuasivarianza muestral:

E S 2 = 2

Estas propiedades se verifican siempre, cualquiera

que sea la distribucin de la variable X

163

Ejemplo en poblaciones infinitas


Sea una v.a. X con valores: 1, 3, 5. Consideramos una
m.a.s. de tamao 2. Obtener:
1.- Media y varianza de la v.a. X
2.- Media y varianza de la v.a. X
1.-

P( X )

1/3

1/3

1/3

= E[X ]=3
8
=
3
2

1
1
1 9
= E [ X ] = 1 + 3 + 5 = = 3
3
3
3 3

2 = E X 2 E [ X ] 2 =

1
1
1
8
= 12 + 32 + 52 32 =
3
3
3
3

164

2.-

x1

x2

P( X )

1/9

2/9

3/9

2/9

1/9

E X = 3 =

4 8 3 2
Var X = =
=
3
2
n

1
1
2

X = E X = 1 + 2 + ... + 5 = 3
9
9
9
2

Var [ X ] = X

2
2

= E X E X =

1
1 2 4
2
2
= 1 + ... + 5 3 =
9

3
165

6.5.2.

Distribucin de la media muestral


de una poblacin Normal

Sea una poblacin donde se observa la variable

aleatoria X . Supongamos que X

N ( , )

Consideramos una muestra aleatoria simple, m.a.s.,


de tamao n, formada por las v.a., X 1 , X 2 ,..., X n
X 1, X 2 ,..., X n

Independientes entre si
Xi

N (, )

Distribucin de la media muestral

Caso A. Varianza poblacional, 2 , conocida


Caso B. Varianza poblacional, 2 , desconocida
Caso C. Varianza poblacional, 2 , desconocida.
Muestras grandes

166

Distribucin de la media muestral

Caso A. Varianza poblacional, 2 , conocida


La variable aleatoria media muestral:

1 n
X = Xi
n i =1

Tiene distribucin Normal



X N ,

Por lo tanto

Z =

N ( 0; 1 )

167

Caso B. Varianza poblacional, 2 , desconocida


X
T=
S
n

El estadstico T, definido como:

tiene una distribucin t de Student con n 1 g. l.

T=

S
n

tn 1

Caso C. Varianza poblacional, 2 , desconocida.


Muestras grandes, n > 30

El estadstico T, definido como:

tiene una distribucin Normal, T

X
T=
S
n
N(0; 1)

168

Teorema Central del Limite


Sea X1, X 2 ,..., X n , una m.a.s., de tamao n de una

poblacin

con

distribucin

de

probabilidad

no

especificada, con media y desviacin tpica


La variable aleatoria Z, definida como:

Z=

tiene una distribucin, aproximadamente, N ( 0, 1 )


9 La aproximacin es aceptable para n > 30

169

Ejemplo: Distribucin de la media muestral


Varianza poblacional conocida
Se est estudiando el tiempo transcurrido entre la
polinizacin y la fertilizacin, X, en una especie de
conferas. Supongamos que la variable X est
normalmente distribuida con una media de 6 meses y una
desviacin tpica de 2 meses. Consideramos una m.a.s. de
tamao 25.
Obtener la probabilidad de que el tiempo medio
transcurrido en la muestra entre la polinizacin y la
fertilizacin sea como mximo de 6,3 meses

X :" Tiempo transcurrido" N ( ; ) = N (6 ;2 )


Z=

X 6 X 6
=
N ( 0; 1)
2
0.4
25

X 6 6.3 6
= P ( Z 0.75) =

0
.
4
0
.
4

P ( X 6.3) = P

= 1 P ( Z 0.75) = 1 0.2266 = 0.7734

170

Ejemplo: Distribucin de la media muestral


Varianza poblacional desconocida
Se est realizando un estudio sobre la calidad del aire
en una zona. Uno de los indicadores de la calidad del aire
es el nmero medio de microgramos de partculas en
suspensin por metro cbico. Supongamos que la
variable X: Nmero de microgramos de partculas, est
normalmente distribuida.
Se hacen 16 mediciones, en las que se obtiene una
cuasidesviacin tpica de 10.8585 unidades. Obtener la
probabilidad de que la media muestral no difiera de la
media poblacional en ms de 8 unidades.

X X X
T=
=
=

S
14
3.5
16
n

) (

tn 1 = t15

P X 8 = P 8 X 8 =

8
8
= P( 2.947 t15 2.947) =
= P
X
10
.
8585
10
.
8585

16
16

= 1 2 P(t15 2.947 ) = 1 2 0.005 = 1 0.01 = 0.99


171

2. Se hacen 36 mediciones en las que se obtiene una


cuasidesviacin tpica de 12 unidades. Obtener la
probabilidad de que la media muestral no difiera de la
media poblacional en ms de 5 unidades.

X X X
T=
=
=
t35 N (0; 1)
12
S
2
36
n

) (

P X 5 = P 5 X 5 =
5 X 5 5
= P

= P( 2.5 Z 2.5) =
2
2
2
= 1 2 0.00621 = 0.98758

172

Ejemplo: Teorema central del lmite


Supongamos que el n de barriles de petrleo que
produce un pozo al da es una v.a. con distribucin no
especificada. Si se observa la produccin en 64 das y se
sabe que la desviacin tpica del n de barriles por da es
16, obtener la probabilidad de que la media muestral se
encuentre a no ms de 4 barriles del verdadero valor de
la produccin media diaria

X 2 : " N de barriles el da 2"

M
X = 16
i
X i : " N de barriles el da i"

X 64 : " N de barriles el da 64"


X1 : " N de barriles el da 1"

Xi

n = 64 > 30 X =
N ;

n
n

16

X N ;
= N ( ; 2 )
64

173


16

X N ;
= N ;
= N ( ; 2)
n
64

Z=

X
=
N (0; 1)
2

P( X 4 ) = P( 4 X 4) =
4 X 4
= P

= P ( 2 Z 2 ) =
2
2
2
= 1 2 P(Z 2 ) = 1 2 0.0228 = 0.9544

174

6.5.3.

Distribucin de la varianza muestral


de una poblacin Normal

Sea una poblacin donde se observa la variable

aleatoria X . Supongamos que X

N ( , )

Consideramos una muestra aleatoria simple, m.a.s.,


de tamao n, formada por las v.a., X 1 , X 2 ,..., X n
X 1, X 2 ,..., X n

Independientes entre si
Xi

N (, )

Distribucin de la varianza muestral

Caso A. Media poblacional, , conocida (*)

Caso B. Varianza poblacional, , desconocida

(*) Este caso no se incluye en los contenidos del curso


175

Distribucin de la varianza muestral

Media poblacional, , desconocida

El estadstico

2, definido como:

2 =

n 2

(
n 1)S 2
=
2

tiene una distribucin Chi-Cuadrado con n 1 grados de


libertad

2 =

n 2

(
n 1)S 2
=
2
2

n 1

176

Ejemplo: Distribucin de la varianza muestral

Se considera una medicin fsica realizada con un


instrumento de precisin, donde el inters se centra en la
variabilidad de la lectura. Se sabe que la medicin es una
v.a. con distribucin Normal y desviacin tpica 4
unidades. Se toma una m.a.s. de tamao 25.
Obtener la probabilidad de que el valor de la varianza
muestral sea mayor de 12.16 unidades cuadradas.

X i : " Medicin" N ( ; 4)
n = 25

2 =

n 2

(
n 1)S 2
=
2

n 1

2 n 12.16

=
P 2 12.16 = P

2
2

25 12.16
2
2
= P n 1
= P n1 19 = 0.75
16

177

6.5.4. Distribucin de la diferencia de


medias muestrales de dos poblaciones
Normales independientes

Sean las variables aleatorias X e Y tales que

N ( X , X )

N ( Y , Y )

Independientes

Consideramos:
m.a.s. de tamao n X de X
X1, X 2 ,..., X n

X , S X2

m.a.s. de tamao n Y de Y

Y , S Y2

Y1, Y2 ,..., YnY

1 nX
X=
Xi
n X i =1
1 nY
Y=
Yi
nY i =1

S X2 =

1 nX
2
(X i X )
n X 1 i =1

SY2 =

1 nY
2
(Yi Y )
nY 1 i =1
178

Distribucin de la diferencia de medias

Caso A. Varianzas poblacionales conocidas


Caso B. Varianzas poblacionales
desconocidas, pero iguales

Caso C. Varianzas poblacionales


desconocidas, distintas o no, con
n X, n Y > 30

179

Distribucin de la diferencia de medias

Caso A. Varianzas poblacionales conocidas


La variable aleatoria, X Y , tiene distribucin Normal

N ( X Y ),

2
Y
+
nX
nY

Por lo tanto

Z=

(X Y ) ( X Y )
X2
nX

N ( 0 ;1)

Y2
nY

180

Caso B. Varianzas poblacionales


desconocidas, pero iguales
2
2
X = Y
El estadstico T, definido como:

X Y ) ( X Y )
(
T=
1
1
Sp
+
n X nY

donde:

S 2p =

( n X 1 ) S X2 + ( n Y 1) S 2Y
nX + n Y 2

tiene una distribucin t de Student con n X + n Y 2


grados de libertad

X Y ) ( X Y )
(
T=
1
1
Sp
+
n X nY

tn X + n Y 2

181

Caso C. Varianzas poblacionales desconocidas


distintas o no, con n X, n Y > 30
El estadstico Z, definido como:

X Y ) ( X Y )
(
Z=
S X2 S Y2
+
n X nY

tiene distribucin Normal

X Y ) ( X Y )
(
Z=
S X2 S Y2
+
n X nY

N ( 0;1 )

182

Ejemplo: Distribucin de la diferencia de medias


Varianzas poblacionales conocidas
Los niveles de radiacin latente en dos regiones A y B
siguen distribuciones Normales independientes de medias
0.48 y 0.4663 y varianzas 0.2 y 0.01 rem por ao,
respectivamente. Se realizan 25 mediciones en la regin A y
100 en la B. Obtener la probabilidad de que la media de la
muestra A sea como mximo 0.2 rem superior a la media de
la muestra B.

X : " Nivel radiacin latente en A"


Y : " Nivel radiacin latente en B"
X N (0.48; 0.2 ); n X = 25
Y N (0.4663; 0.01); nY = 100

X Y ( X Y )
Z=
N (0; 1)
2
X

nX

Y2
nY

183

X Y ( X Y )
Z=
N (0; 1)
2
X

nX

Y2
nY

P( X Y + 0.2 ) = P( X Y 0.2 ) =

X Y ( X Y ) 0.2 ( X Y )
=

= P

2
2
2
2

X + Y
X + Y

n
n
n
n
X
Y
X
Y

0.2 0.0137

= P Z
=
0.008 + 0.0001

= P(Z 2.07 ) = 1 P(Z 2.07 ) =


= 1 0.0192 = 0.9808
184

Ejemplo: Distribucin de la diferencia de medias.


Varianzas poblacionales desconocidas,
pero iguales
Se est realizando un estudio sobre la calidad del aire
en dos zonas A y B. Un indicador de la calidad es el
nmero de microgr. de partculas en suspensin por m3 de
aire, que suponemos siguen distribuciones Normales
independientes de media 62.237 en A, 61.022 en B y
varianzas iguales. En la zona A se realizan 12 mediciones,
obtenindose una cuasi-varianza de 8.44 microgr2 y en la
B 15 mediciones, con una cuasi-varianza de 9.44
microgr2. Obtener la probabilidad de que la media
muestral de A sea como mnimo tres unidades superior a
la media muestral de B.

X : " Calidad del aire en A"; X N (62.237; )

Y : " Calidad del aire en B"; Y N (61.022; )

n X = 12;
nY = 15;

s 2X = 8.44

sY2 = 9.44

185

X : " Calidad del aire en A"; X N (62.237; )

Y : " Calidad del aire en B"; Y N (61.022; )

n X = 12;
nY = 15;

s 2X = 8.44

sY2 = 9.44

2 (
2
(
)
)

1
+

1
n
S
n
S
X
Y
Y =9
S 2p = X
(n X + nY 2)

P ( X Y 3) =

X Y ( X Y ) 3 ( X Y )

=P

1
1
1
1
Sp
+
+
Sp

n
n
n
n
X
Y
X
Y

3
1
.
015

= P(t25 1.708) = 0.05


= P t25
1 1

3
+

12 15

186

Ejemplo: Distribucin de la diferencia de medias


Varianzas poblacionales desconocidas.
Muestras grandes
Se estudia el efecto de un vertido txico en un ro,
comparando el ndice de biodiversidad I.B-D. antes y
despus del vertido.
Supongamos que los I.B-D. siguen distribuciones
Normales. Antes del vertido se haban realizado 35
pruebas y se obtuvo una media de 1.9 y una cuasidesviacin tpica de 0.4. Despus del vertido se realizan
40 pruebas y se obtiene una media de 1.7 y una cuasidesviacin tpica de 0.7.
Obtener la probabilidad de que la media poblacional
antes del vertido sea como mximo 0.5 unidades inferior
a la media poblacional despus del vertido.
X : " I.B - D antes del vertido" N ( X ; X )

Y : " I.B - D despus del vertido" N (Y ; Y )

n X = 35 ; X = 1.9 ; S X = 0.4
nY = 40 Y = 1.7 ; SY = 0.7
X Y ) ( X Y )
(
Z=
S 2X S Y2
+
n X nY

N ( 0; 1)

187

X : " I.B - D antes del vertido" N ( X ; X )

Y : " I.B - D despus del vertido" N (Y ; Y )

n X = 35 ; X = 1.9 ; S X = 0.4
nY = 40 Y = 1.7 ; SY = 0.7

P( X Y 0.2 ) =

X Y ( X Y ) 0.5 ( X Y )
=
= P

2
2
2
2
S X SY
S X SY

+
+

n X nY
n X nY

0.5 (1.9 1.7 )

= P Z
=
2
2
0.4
0.7

35
40

= P(Z 2.313) = 1 P(Z 2.313) =


= 1 0.0104 = 0.9896
188

6.5.5. Distribucin del cociente de varianzas

muestrales de dos poblaciones


Normales independientes

Sean las variables aleatorias X e Y tales que

N ( X , X )

N ( Y , Y )

Independientes

Consideramos:
m.a.s. de tamao n X de X
X1, X 2 ,..., X n

X , S X2

m.a.s. de tamao n Y de Y

Y , S Y2

Y1, Y2 ,..., YnY

1 X
X =
Xi
nX
i =1
n

1 Y
Y=
Yj
nY
j =1

S X2 =

nX

1
(X X
n X 1 i =1 i

)2

Y
1
2
SY =
(Y j Y ) 2

n Y 1 j =1

189

Distribucin del cociente de

varianzas muestrales
El estadstico F, definido como:

F=

S X2 X2
S Y2

Y2

S X2 Y2
S Y2 X2

tiene una distribucin F de Snedecor con n X 1, nY 1 ,


grados de libertad

F=

S X2 Y2
S Y2 X2

Fn

, nY 1

190

Ejemplo: Distribucin del cociente de varianzas


muestrales
Se est comparando la variabilidad de los I.B-D de dos
ros A y B, que suponemos siguen distribuciones
Normales. Se realizan 16 mediciones en el ro A y se
obtiene una cuasi-varianza de 9.52, y 18 mediciones en el
ro B y se obtiene una cuasivarianza de 7.
Obtener la probabilidad de que la varianza en el ro B
sea como mnimo el doble de la varianza en el ro A.
X : " I.B - D en el ro A" N ( X ; X )

Y : " I.B - D en el ro B" N (Y ; Y )

F=

S X2 Y2
S Y2 X2

Fn

, nY 1

2
Y2

S X2 Y2
S
2
2
X
P Y 2 X = P
2 = P
2
2

S 2 2
SY2
X

Y X

9.52

= P F15 ,17 2
= P (F15 ,17 2.72 ) = 0.025
7

191

6.5.6.

Distribucin de la proporcin muestral

Consideramos una variable aleatoria X

B ( n ; p ),
donde p es la proporcin de xitos en la poblacin
Para tamaos grandes de n, n > 30, la distribucin
Binomial se aproxima a una distribucin Normal :

X N (np ; npq )

Definimos el estadstico proporcin muestral como:

X
p =
n

192

Distribucin de la proporcin muestral

El estadstico proporcin muestral :

X
p =
n
Verifica que:

pq
p N p;

Por lo tanto:

Z=

p p
N (0; 1)
pq
n

193

Ejemplo: Distribucin de la proporcin muestral


Se quiere probar una terapia de grupo para dejar de
fumar. Para ello se toma una m.a.s. de 50 fumadores. Se
sabe que las personas que llevan al menos 10 aos
fumando tienen ms dificultades para dejar de fumar, y
que el 38% de los fumadores llevan al menos 10 aos
fumando. Por ello, se decide separar unos de otros si
entre los fumadores elegidos ms de un 19% llevan ms
de 10 aos fumando. Obtener la probabilidad de que se
decida separarlos.

p : " Proporcin de fumadores con 10 aos, en la poblacin


p : " Proporcin de fumadores con 10 aos, en la muestra

p N p ;

0.38 0.62
pq
= N 0.38 ;
= N (0.38 ; 0.068)
50
n

Z=

p p p 0.38
=
N (0 ; 1)
pq
0.068
n

p 0.38 0.19 0.38


P ( p 0.19 ) = P

= P(Z 2.769 ) =
0.0686
0.0686

= 1 P ( Z 2.769 ) = 1 P ( Z 2.769 ) = 1 0.0028 = 0.9972


194

6.5.7.

Distribucin de la diferencia de
proporciones muestrales

Sean las variables aleatorias X e Y tales que

X B(n X ; p X )
Independientes
Y B(nY ; pY )
Para n X y n Y grandes, se verifica:

X
Y

(
N ( n Y pY ;

N n X pX ;

nX p X q X

nY p Y q Y

Definimos las proporciones muestrales como:

X
p X =
nX
p Y =

Y
nY
195

Distribucin de la diferencia de proporciones


muestrales

Definimos el estadstico diferencia de proporciones

muestrales:

p X

p Y ;

p X = n
X

p X - p Y ; donde :

Y
p Y =
nY

Se verifica que:

Z=

( p X

p Y ) ( p X pY )
N (0; 1)
p X q X pY qY
+
nX
nY

196

Ejemplo: Distribucin de la diferencia de


proporciones muestrales
Se sabe que en una poblacin el 28% de las mujeres y
el 25% de los hombres son fumadores. Se extraen
muestras de 42 mujeres y 40 hombres. Determinar la
probabilidad de que las mujeres fumadoras superen a los
hombres fumadores en al menos el 4%.
pX: Proporcin de mujeres fumadoras en la poblacin
pY: Proporcin de mujeres fumadoras en la poblacin
p X :Proporcin de mujeres fumadoras en la muestra
p Y : Proporcin de mujeres fumadoras en la muestra

(
p X pY ) ( pX pY ) ( p X pY ) (0.28 0.25)
Z=
=
pX qX pY qY
+
nX
nY

(
p X
=

0.280.72 0.250.75
+
42
40

p Y ) 0.03
N (0 ; 1)
0.0974

P( p X p Y + 0.04 ) = P( p X p Y 0.04 ) =
( p p Y ) 0.03 0.04 0.03
= P X

=
0.0974
0.0974

0.04 0.03

= P Z
= P(Z 0.0103) = 0.4602
0.974

197

También podría gustarte