Está en la página 1de 10

Omar Radhames Urqudez Calvo

Metodos Estadsticos - Contraste de Hip otesis


Viernes 6 de Junio de 2014
Problema 1. En enero el partido A gano el 53 % de un gran n umero de votos en una eleccion. Seis meses
despues, una encuesta de 200 votantes seleccionados aleatoriamente mostro que solo 48 % votara por el
partido A. Podra pensarse razonablemente que estos resultados fueron casualidad o hay evidencia de un
cambio real en la preferencia del partido A?
Sea X el n umero de simpatizantes del partido A y consideremos la hipotesis H:=El partido A mantiene
la misma cantidad de simpatizantes tras transcurrir seis meses (53 %); entonces para nuestro problema
X | H Bin(200, 0.53). Sea D = |XE[X]| =|X(200)(0.53)| =|X106|, nuestra medida de discrepancia.
Procedamos a calcular el nivel de signicancia con respecto a H.
= P[D D
obs
| H] = P[|X 106| |106 96| | H] ,
= P[|X 106| 10 | H] ,
= P
_
|X 106|
sd(X)

10
sd(X)

H
_
= P
_
|X 106|
_
(200)(0.47)(0.53)

10
_
(200)(0.47)(0.53)

H
_
,
P
_
|X 106|
7.0583

10
7.0583

H
_
, luego, por el teorema del lmite central se sigue que
P[|N(0, 1)| 1.416766] ,
= P[N(0, 1) 1.416766] +P[N(0, 1) 11.416766] ,
= 2P[N(0, 1) 1.416766] = 2(1 P[N(0, 1) < 1.416766]),
2(1 0.9215) = 0.157 > 0.05.
Por lo que los datos no sustentan evidencia sucientemente fuerte para rechazar H.
1
Omar Radhames Urqudez Calvo
Metodos Estadsticos - Contraste de Hip otesis
Viernes 6 de Junio de 2014
Problema 2.
a) A cada uno de 25 individuos se le da dos vasos similares, uno de Pepsi y uno de Coca-Cola, y les
preguntaron cual preferan. 60 % de ellos eligieron Coca-Cola. Este resultado es consistente con la
hipotesis de que no se distingue entre Pepsi y Coca-Cola?
b) Repite el inciso a si 250 individuos fueron encuestados y 60 % de ello eligieron Coca-Cola.
a) Denamos a X como el n umero de individuos que prerieron Coca-Cola y H := No se distingue entre Pepsi y Coca-Cola;
entonces X | H Bin(25, 0.5). Sea D = |X E[X]| = |X (25)(0.5)| = |X 12.5|, nuestra medida de
discrepancia.
Procedamos a calcular el nivel de signicancia con respecto a H.
= P[D D
obs
| H] = P[|X 12.5| |15 12.5| | H] ,
= P[|X 12.5| 2.5 | H] ,
= P
_
|X 12.5|
sd(X)

2.5
sd(X)

H
_
= P
_
|X 12.5|
_
(25)(0.5)
2

2.5
_
(25)(0.5)
2

H
_
,
P
_
|X 12.5|
2.5

2.5
2.5

H
_
,
P[|N(0, 1)| 1] ,
= P[N(0, 1) 1] +P[N(0, 1) 1] , por el teorema del lmite central. Ademas
= 2P[N(0, 1) 1] = 2(1 P[N(0, 1) < 1]),
2(1 0.8413) = 0.3174 > 0.05.
Por lo que los datos no sustentan evidencia sucientemente fuerte para rechazar H.
b) Denamos a X y H de la misma manera; tenemos para este caso que X | H Bin(250, 0.5). Sea
D = |X E[X]| = |X (250)(0.5)| = |X 125|.
Procedamos a calcular el nivel de signicancia con respecto a H.
= P[D D
obs
| H] = P[|X 125| |150 125| | H] ,
= P[|X 125| 25 | H] ,
= P
_
|X 125|
sd(X)

25
sd(X)

H
_
= P
_
|X 125|
_
(250)(0.5)
2

25
_
(250)(0.5)
2

H
_
,
P
_
|X 125|
7.90569

25
7.90569

H
_
, luego, por el teorema del lmite central tenemos
P[|N(0, 1)| 3.162278] ,
= P[N(0, 1) 3.162278] +P[N(0, 1) 3.162278] ,
= 2P[N(0, 1) 3.162278] = 2(1 P[N(0, 1) < 3.162278]),
2(1 0.9992) = 0.0016 < 0.05.
Por lo que los datos sustentan evidencia sucientemente fuerte en contra de H,i.e., la gente no distingue
entre Pepsi y Coca-Cola.
2
Omar Radhames Urqudez Calvo
Metodos Estadsticos - Contraste de Hip otesis
Viernes 6 de Junio de 2014
Problema 3. Determinar el nivel de signicancia aproximado de cada una de las siguientes observaciones
en relacion con la hipotesis de que p, la probabilidad de que nazca un ni no, es igual a 0.5. Encuentra un
intervalo de conanza de aproximadamente 95 % para p en cada caso.
a) 293 ni nas y 299 ni nos en 592 nacimientos.
b) 2930 ni nas y 2990 ni nos en 5920 nacimientos.
c) 29300 ni nas y 29900 ni nos en 59200 nacimientos.
a) Sean X el n umero de nacimientos de ni nos y H := La probabilidad de que nazca un ni no y una ni na es la misma;
entonces vemos que X | H Bin(592, 0.5). Sea D = |X E[X]| = |X (592)(0.5)| = |X 296|.
Procedamos a calcular el nivel de signicancia con respecto a H.
= P[D D
obs
| H] = P[|X 296| |299 296| | H] ,
= P[|X 296| 3 | H] ,
= P
_
|X 296|
sd(X)

3
sd(X)

H
_
= P
_
|X 296|
_
(592)(0.5)
2

3
_
(592)(0.5)
2

H
_
,
P
_
|X 296|
12.165525

3
12.165525

H
_
, por Teorema del Lmite Central. Luego
P[|N(0, 1)| 0.246598] ,
= P[N(0, 1) 0.246598] +P[N(0, 1) 0.246598] ,
= 2P[N(0, 1) 0.246598] = 2(1 P[N(0, 1) < 0.246598]),
2(1 0.5961) = 0.8078 > 0.05.
Por lo que los datos no sustentan evidencia sucientemente fuerte para rechazar H.
Luego, para las hipotesis provistas podemos calcular p =
299
592
y R(p) =
p
299
(1p)
293
(
299
592
)
299
(
293
592
)
293
, donde R(0.465)
0.148 0.1465 y R(0.5452) 0.147 0.1465, de donde obtenemos que un intervalo de conanza, del 95 %
es (0.465,0.5452).
b) Denamos a X y H de la misma manera; tenemos para este caso que X | H Bin(5920, 0.5). Sea
D = |X E[X]| = |X (5920)(0.5)| = |X 2960|.
Procedamos a calcular el nivel de signicancia con respecto a H.
3
Omar Radhames Urqudez Calvo
Metodos Estadsticos - Contraste de Hip otesis
Viernes 6 de Junio de 2014
= P[D D
obs
| H] = P[|X 2960| |2990 2960| | H] ,
= P[|X 2960| 30 | H] ,
= P
_
|X 2960|
sd(X)

30
sd(X)

H
_
= P
_
|X 2960|
_
(5920)(0.5)
2

30
_
(5920)(0.5)
2

H
_
,
P
_
|X 2960|
38.47077

30
38.47077

H
_
, entonces, por el Teorema del Lmite Central obtenemos
P[|N(0, 1)| 0.7798] ,
= P[N(0, 1) 0.7798] +P[N(0, 1) 0.7798] ,
= 2P[N(0, 1) 0.7798] = 2(1 P[N(0, 1) < 0.7798]),
2(1 0.7823) = 0.4354 > 0.05.
Por lo que los datos no sustentan evidencia sucientemente fuerte para rechazar H.
Luego, para las hipotesis provistas podemos calcular p =
2990
5920
y R(p) =
p
2990
(1p)
2930
(
2990
5920
)
2990
(
2930
5920
)
2930
, donde R(0.4923)
0.145 0.1465 y R(0.5178) 0.1465, de donde obtenemos que un intervalo de conanza, del 95 % es
(0.4923,0.5178).
c) Denamos a X y H de la misma manera; tenemos para este caso que X | H Bin(59200, 0.5). Sea
D = |X E[X]| = |X (59200)(0.5)| = |X 29600|.
Procedamos a calcular el nivel de signicancia con respecto a H.
= P[D D
obs
| H] = P[|X 29600| |29900 29600| | H] ,
= P[|X 29600| 300 | H] ,
= P
_
|X 29600|
sd(X)

300
sd(X)

H
_
= P
_
|X 29600|
_
(59200)(0.5)
2

300
_
(59200)(0.5)
2

H
_
,
P
_
|X 29600|
121.65525

300
121.65525

H
_
, por el Teorema del Lmite Central se sigue que
P[|N(0, 1)| 2.46598] ,
= P[N(0, 1) 2.46598] +P[N(0, 1) 2.46598] ,
= 2P[N(0, 1) 2.46598] = 2(1 P[N(0, 1) < 2.46598]),
2(1 0.9931) = 0.0138 < 0.05.
Por lo que los datos sustentan evidencia sucientemente fuerte en contra de H,i.e., la cantidad de ni nos no
es necesariamente la misma que de ni nas.
Luego, para las hipotesis provistas podemos calcular p =
29900
59200
y R(p) =
p
29900
(1p)
29300
(
29900
59200
)
29900
(
29300
59200
)
29300
, donde
R(0.501) 0.141 0.1465 y R(0.5091) 0.1457 0.1465, de donde obtenemos que un intervalo de
conanza, del 95 % es (0.501,0.5091).
4
Omar Radhames Urqudez Calvo
Metodos Estadsticos - Contraste de Hip otesis
Viernes 6 de Junio de 2014
Problema 4. En un experimento estudiando la relacion entre la percepcion del color y el orden, un psicologo
le pide a un ni no colocar 6 bloques similares en una la. Cuatro son rojos y 2 son verdes, pero en lo demas
son identicos. El n umero de bloques rojos entre los 2 verdes es registrado, y las frecuencias observadas en
100 repeticiones del experimento son las siguientes:
N umero de bloques rojos 0 1 2 3 4 Total
Frecuencia observada 28 22 22 18 10 100
a) Supon que los bloques son puestos en un orden aleatorio. Tabula la funcion de probabilidad de X, el
n umero de bloques rojos situados entre los dos bloques verdes, y encuentra as la media y la varianza de
X.
b) Sea

X =
X1+X2+...+X100
100
el n umero promedio de bloques rojos entre los 2 bloques verdes en las 100
repeticiones del experimento. El valor de

X observado es signicativamente diferente del valor esperado
bajo la hipotesis de orden aleatorio?
a) Sean X el n umero de bloques rojos entre verdes. Notemos que
Bloques rojos entre verdes 0 1 2 3 4
Maneras en que puede ocurrir
_
5
1
_
= 5
_
4
1
_
= 4
_
3
1
_
= 3
_
2
1
_
= 2 1
puesto que es equivalente a buscar acomodar las siguientes guras en los 6 posibles lugares (recordando
que, salvo color, las piezas son identicas).
Entonces tenemos que E[X] =
4

k=0
kP[X = k] =
4

k=0
k
5k
15
=
4
15
+ 2
_
3
15
_
+ 3
_
2
15
_
+ 4
_
1
15
_
=
20
15
=
4
3
.
Similarmente, sabemos que V ar(X) = E[X
2
] (E[X])
2
, i.e.,
V ar(X) = E[X
2
] (E[X])
2
=
4

k=0
k
2
P[X = k]
_
4
3
_
2
=
4

k=0
k
2
5 k
15

16
9
=
4 + 12 + 18 + 16
15

16
9
=
30 16
9
=
14
9
.
b) Sea H :=Los ladrillos fueron colocados de manera aleatoria, tomemos como estadstica de prueba a

X
y a D = |

X E[

X]|, donde E[

X] = E[
X1+X2+...+X100
100
] =
1
100
100

k=1
E[X
k
] =
3
4
, i.e., D = |

X
3
4
|.
Luego, veamos que

X =
[22+2(22)+3(18)+4(10)]
100
=
8
5
, de donde D
obs
=
_
4
3

8
5
_
=
4
15
y podemos proceder a
calcular el nivel de signicancia.
5
Omar Radhames Urqudez Calvo
Metodos Estadsticos - Contraste de Hip otesis
Viernes 6 de Junio de 2014
= P[D D
obs
| H] = P
_
|

X
3
4
|
4
15
| H
_
,
= P
_
|

X 75|
sd(

X)

4
15
sd(

X)

H
_
,
= 1 P
_


X
4
3

<
4
15
_
,
= 1 P
_
16
15
<

X <
24
15
_
, y por el Teorema del Lmite Central

X N(
4
3
,
14
900
)
1 P
_

X <
24
15
_
+P
_

X <
16
15
_
0.0325095.
Por lo que los datos sustentan evidencia sucientemente fuerte en contra de H.
6
Omar Radhames Urqudez Calvo
Metodos Estadsticos - Contraste de Hip otesis
Viernes 6 de Junio de 2014
Problema 5. En condiciones normales, el n umero promedio de llamadas personales hechas por los em-
pleados de una compa na fue de 7.2 por hora. El gerente envio una carta a todos los empleados pidiendo
la reduccion de llamadas personales. Durante 5 periodos de una hora en la semana siguiente, el n umero de
llamadas personales fueron 4, 2, 7, 5 y 3. Estas observaciones dan evidencia fuerte de que el n umero de
llamadas por hora se haya reducido?
Denamos la hipotesis H := El n umero de llamadas no cambi o y a X como el n umero total de lla-
madas. Tras los cinco periodos de una hora, si suponemos H como cierta entonces podemos ver que
X Poisson(5), con = 7.2 y E[X] = 5 = 36.
Tomemos como medida de discrepancia a D = |XE[X]| = |X36| y recordemos que el total de llamadas
observadas D
obs
= |36 (4 + 2 + 7 + 5 + 3)| = |36 21|.
= P[D D
obs
| H] = P[|X 36| |36 21| | H] ,
= P[|X 36| 15 | H] = 1 P[|X 36| < 15|H] ,
= 1
50

k=22
P[X = j|H] ,
= 1
50

k=22
e
5
(5)
k
k!
, = 1
50

k=22
e
36
(36)
k
k!
,
1 0.984480896681 = 0.01551910331 > 0.05.
Lo cual nos dice que tenemos evidencia sucientemente fuerte para rechazar H.
7
Omar Radhames Urqudez Calvo
Metodos Estadsticos - Contraste de Hip otesis
Viernes 6 de Junio de 2014
Problema 6. Un vendedor de semillas clama que el 80 % de sus semillas germina. Cada uno de 4 consu-
midores compra un paquete de semillas de 100 cada uno. El n umero de germinaciones fueron 73, 76, 74 y
77 respectivamente.
a) Cuales de estos consumidores, en base a su observacion solamente, tiene evidencia sucientemente fuerte
para decir que lo que dice el vendedor es mentira?
b) Si los 4 paquetes son tomados juntos, el total de germinaciones muestra evidencia fuerte en contra de
lo que clama el vendedor?
a) Denamos a X como el n umero de semillas que germinan y a H := El vendedor de semillas clama lo correcto.
Entonces podemos ver que X | H Bin(100, 0.8). Sea D = |X E[X]| = |X (80)|, nuestra medida de
discrepancia.
Procedamos a calcular el nivel de signicancia con respecto a H para cada una de las distintas observaciones.

0
= P[D D
obs
| H] = P[|X 80| |80 73| | H] ,
= P[|X 80| 7 | H] = 1 P[|X 80| < 7|H] ,
= 1
86

j=74
P[X = j|H] ,
= 1
86

j=74
_
100
j
_
(0.8)
j
(0.2)
100j
,
1 0.897255 = 0.102745 > 0.05.

1
= P[D D
obs
| H] = P[|X 80| |80 76| | H] ,
= P[|X 80| 4 | H] = 1 P[|X 80| < 4|H] ,
= 1
83

j=77
P[X = j|H] ,
= 1
83

j=77
_
100
j
_
(0.8)
j
(0.2)
100j
,
1 0.618575 = 0.381425 > 0.05.

2
= P[D D
obs
| H] = P[|X 80| |80 74| | H] ,
= P[|X 80| 6 | H] = 1 P[|X 80| < 6|H] ,
= 1
85

j=75
P[X = j|H] ,
= 1
85

j=75
_
100
j
_
(0.8)
j
(0.2)
100j
,
1 0.832081 = 0.167919 > 0.05.
8
Omar Radhames Urqudez Calvo
Metodos Estadsticos - Contraste de Hip otesis
Viernes 6 de Junio de 2014

3
= P[D D
obs
| H] = P[|X 80| |80 77| | H] ,
= P[|X 80| 3 | H] = 1 P[|X 80| < 3|H] ,
= 1
82

j=78
P[X = j|H] ,
= 1
82

j=78
_
100
j
_
(0.8)
j
(0.2)
100j
,
1 0.467744 = 0.532256 > 0.05.
Por lo que el nivel de signicancia de cada uno de los consumidores no es sucientemente fuerte en contra
de H.
b) Sean X y H denidas de la misma manera; tenemos para este caso que X | H Bin(400, 0.8). Sea
D = |X E[X]| = |X (400)(0.8)| = |X 320|, nuestra nueva medida de discrepancia.
Procederemos ahora a calcular el nivel de signicancia en base a H.
= P[D D
obs
| H] = P[|X 320| |320 (73 + 76 + 74 + 77)| | H] ,
= P[|X 320| 20 | H] = 1 P[|X 320| < 20|H] ,
= 1
339

j=301
P[X = j|H] ,
= 1
339

j=301
_
400
j
_
(0.8)
j
(0.2)
400j
,
1 0.985339 = 0.014661 < 0.05.
Por lo que los datos sustentan evidencia sucientemente fuerte en contra de H,i.e., lo que clama el vendedor
es falso.
9
Omar Radhames Urqudez Calvo
Metodos Estadsticos - Contraste de Hip otesis
Viernes 6 de Junio de 2014
Problema 7. En un experimento genetico de 100 chcharos plantados, 65 producen plantas altas y 35
producen plantas cortas. De acuerdo a la teora genetica, las plantas son independientes y la probabilidad
de una planta alta es de 0.75. Realiza una prueba de signicancia para decir si la teora genetica es consistente
con los datos.
Denamos a X como el n umero de plantas altas y a la hipotesis H := La teora genetica es consistente;
entonces X | H Bin(100, 0.75). Sea D = |X E[X]| = |X (100)(0.75)| = |X 75|, nuestra medida de
discrepancia.
Procedamos a calcular el nivel de signicancia con respecto a H.
= P[D D
obs
| H] = P[|X 75| |65 75| | H] ,
= P[|X 75| 10 | H] ,
= P
_
|X 75|
sd(X)

10
sd(X)

H
_
= P
_
|X 75|
_
(75)(0.25)

10
_
(75)(0.25)

H
_
,
P
_
|X 75|
4.33013

10
4.33013

H
_
,
P[|N(0, 1)| 2.3094] ,
= P[N(0, 1) 2.3094] +P[N(0, 1) 2.3094] ,
= 2P[N(0, 1) 2.3094] = 2(1 P[N(0, 1) < 2.3094]),
2(1 0.9896) = 0.0208 < 0.05.
Por lo que los datos sustentan evidencia sucientemente fuerte en contra de H,i.e., la teora genetica no es
consistente con los datos.
10

También podría gustarte