Está en la página 1de 155

Bioestadstica

Problemas resueltos
Manuel Angel Barea Gmez
16 de febrero de 2013
Usted es libre de:
copiar, distribuir y comunicar pblicamente la obra
Remezclar transformar la obra
Bajo las siguientes condiciones:
b Reconocimiento Debe reconocer los crditos de la obra de la manera especicada
por el autor o el licenciador (pero no de una manera que sugiera que tiene su apoyo o
apoyan el uso que hace de su obra).
e No comercial No puede utilizar esta obra para nes comerciales.
a Compartir bajo la misma licencia Si altera o transforma esta obra, o genera una
obra derivada, slo puede distribuir la obra generada bajo una licencia idntica a sta.
Este obra est bajo una licencia de Creative Commons Reconocimiento-NoComercial-CompartirIgual 3.0 Unported.
Manuel Angel Barea Gmez 2
ndice general
Pgina
ndice general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Captulo 1 Estadstica Descriptiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Captulo 2 Variables Bidimensionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Captulo 3 Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Captulo 4 Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
Captulo 5 Intervalos de conanza y contrastes de hiptesis paramtricas de una poblacin. . . . . . . . . . . . . . . . . . . 97
Captulo 6 Intervalos de conanza y constrates de hiptesis paramtricos en dos o ms poblaciones. . . . . . . . . . . . . . 108
Captulo 7 Contrastes de hiptesis no paramtricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
3
CAPTULO
1
Estadstica Descriptiva
Problema 1.1. En el siguiente conjunto de nmeros, se proporcionan los pesos (redondeados a la libra ms prxima) de los bebs
nacidos durante un cierto intervalo de tiempo en un hospital:
4 8 4 6 8 6 7 7 7 8
10 9 7 6 10 8 5 9 6 3
7 6 4 7 6 9 7 4 7 6
8 8 9 11 8 7 10 8 5 7
7 6 5 10 8 9 7 5 6 5
(a) Construir una distribucin de frecuencias de estos pesos.
(b) Encontrar las frecuencias relativas.
(c) Encontrar las frecuencias acumuladas.
(d) Encontrar las frecuencias relativas acumuladas.
(e) Dibujar un histograma con los datos.
(f) Calcular las medidas de tendencia central.
(g) Encontrar el percentil 24.
x
i
n
i
N
i
f
i
F
i
x
i
n
i
x
2
i
n
i
3 1 1 0,02 0,02 3 9
4 4 5 0,08 0,1 16 64
5 5 10 0,1 0,2 25 125
6 9 19 0,18 0,38 54 324
7 12 31 0,24 0,62 84 588
8 9 40 0,18 0,8 72 576
9 5 45 0,1 0,9 45 405
10 4 49 0,08 0,98 40 400
11 1 1 0,02 1 11 121
50 350 2612
Los apartados a,b,c y d se encuentran resueltos en la tabla proporcionada
4
CAPTULO 1. ESTADSTICA DESCRIPTIVA
Peso
F
r
e
c
u
e
n
c
i
a
4 6 8 10
0
2
4
6
8
1
0
1
2
x =
(x
i
n
i
)
n
=
350
50
= 7
M
o
= 7 y M
e
= 7
R = x
max
x
min
= 11 3 = 8
s
2
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
2612
50
7
2
= 3, 24
s =

3, 24 = 1, 8
CV =
s
x
=
1,8
7
= 0, 257
Para el clculo del P
24

nk
100
=
5024
100
= 12 que se corresponde con P
24
= 6
Problema 1.2. A continuacin se dan los resultados obtenidos con una muestra de 50 universitarios. la caracterstica es el tiempo
de reaccin ante un estmulo auditivo:
0,110 0,110 0,110 0,112 0,117 0,113 0,135 0,107 0,122
0,113 0,098 0,098 0,105 0,103 0,119 0,100 0,117 0,113
0,124 0,118 0,118 0,108 0,115 0,120 0,107 0,123 0,109
0,117 0,111 0,111 0,101 0,112 0,111 0,119 0,103 0,100
0,108 0,120 0,120 0,102 0,129 0,115 0,121 0,130 0,134
0,118 0,106 0,106 0,094 0,1114
(a) Cul es la amplitud total de la distribucin de los datos?
(b) Obtenga la distribucin de frecuencias absolutas y relativas.
(c) Obtenga la distribucin de frecuencias acumuladas, absolutas y relativas.
(d) Calcular la media, varianza y coeciente de variacin.
(e) Dibuje el polgono de frecuencias relativas.
(f) Dibuje el polgono de frecuencias relativas acumuladas.
Manuel Angel Barea Gmez 5
CAPTULO 1. ESTADSTICA DESCRIPTIVA
Intervalo x
i
n
i
N
i
f
i
F
i
x
i
n
i
x
2
i
n
i
[0, 0900 0, 0950] 0,0925 1 1 0,02 0,02 0,0925 0,0086
[0, 0950 0, 1000] 0,0975 4 5 0,08 0,1 0,3900 0,0380
[0, 1000 0, 1050] 0,1025 5 10 0,1 0,2 0,5125 0,0525
[0, 1050 0, 1100] 0,1075 8 18 0,16 0,36 0,8600 0,0925
[0, 1100 0, 1150] 0,1125 11 29 0,22 0,58 1,2375 0,1392
[0, 1150 0, 1200] 0,1075 9 38 0,18 0,76 0,9675 0,1040
[0, 1200 0, 1250] 0,1225 5 43 0,1 0,86 0,6125 0,0750
[0, 1250 0, 1300] 0,1275 4 47 0,08 0,94 0,5100 0,0650
[0, 1300 0, 1350] 0,1325 3 50 0,06 1 0,3975 0,0527
50 5,58 0,63
R = x
max
x
min
= 0, 134 0, 094 = 0, 04
x =
(x
i
n
i
)
n
=
5,58
50
= 0, 11
s
2
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
0,63
50
0, 11
2
= 0, 0005
s =

0, 0005 = 0, 022
CV =
s
x
=
0,022
0,11
= 0, 203
0.10 0.11 0.12 0.13
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
Poligono de frecuencias relativas
X
f
0.10 0.11 0.12 0.13
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
Poligono de frecuencias relativas acumulada
X
F
Problema 1.3. Con el n de observar la relacin entre la inteligencia y el nivel socioeconmico (medido por el salario mensual
familiar) se tomaron dos grupos, uno formado con sujetos de cociente intelectual inferior a 95 y otro formado por los dems; De
cada sujeto se anot el salario mensual familiar. Teniendo en cuenta los resultados que se indican en la tabla:
Nivel socioeconmico Sujetos con CI < 95 Sujetos con CI 95
Intervalos Frecuencia Frecuencia
10 o menos (4, 10] 75 19
10 16 35 26
16 22 20 25
22 28 30 30
28 34 25 54
ms de 34(34, 40] 15 46
Manuel Angel Barea Gmez 6
CAPTULO 1. ESTADSTICA DESCRIPTIVA
(a) Dibuje un grco que permita comparar ambos grupos.
(b) Calcule las medidas de tendencia central para aquellos sujetos con CI < 95.
(c) Calcular las medidas de dispersin para aquellos sujetos con CI 95.
Nivel
C
I

+

I
n
t
e
l
i
g
e
n
c
i
a
20
30
40
50
60
70
10 15 20 25 30 35
Nivel socioeconmico Marca de clase CI < 95 CI 95
Intervalos x
1
n
i
N
i
x
i
n
i
x
2
i
n
i
n
i
N
i
x
i
n
i
x
2
i
n
i
10 o menos (4, 10] 7 75 75 525 3675 19 19 133 931
10 16 13 35 110 455 5915 26 45 338 4394
16 22 19 20 130 380 7220 25 70 475 9025
22 28 25 30 160 750 18750 30 100 750 18750
28 34 31 25 185 775 24025 54 154 1674 51894
ms de 34(34, 40] 37 15 200 555 20535 46 200 1702 62974
200 3440 80120 200 5072 147968
x
CI<95
=
(x
i
n
i
)
n
=
3440
200
= 17, 2
El intervalo mediano es
n
2
=
200
2
= 100 [10 16]
M
e
= L
in f
+
nk
100
N
i1
n
i
a
i
= 10 +
10075
35
6 = 14, 28
x
CI95
=
(x
i
n
i
)
n
=
5072
200
= 25, 36
s
2
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
147968
200
25, 36
2
= 96, 71
s =

96, 71 = 9, 83
CV =
s
x
=
9,83
25,36
= 0, 387
Problema 1.4. Un estudio consisti en anotar el nmero de palabras ledas en 15seg por un grupo de 120 sujetos dislxicos y 120
individuos normales. Teniendo en cuenta los resultados de la tabla:
Manuel Angel Barea Gmez 7
CAPTULO 1. ESTADSTICA DESCRIPTIVA
N de palabras leidas Dislxicos n
d
Normales n
n
25 o menos 25 56 1
26 24 9
27 16 21
28 12 29
29 10 28
30 o ms 30 2 32
Calcule:
(a) Las medias aritmticas de ambos grupos.
(b) Las medianas de ambos grupos.
(c) El porcentaje de sujetos dislxicos que superaron la mediana de los normales.
(d) Compare la variabilidad relativa de ambos grupos.
N de palabras leidas n
d
N
d
x
i
n
di
x
2
i
n
di
n
n
N
n
x
i
n
ni
x
2
i
n
ni
25 o menos 25 56 56 1400 35000 1 1 25 625
26 24 80 624 16224 9 10 234 6084
27 16 96 432 11664 21 31 567 15309
28 12 108 336 9408 29 60 812 22736
29 10 118 290 8410 28 88 812 23548
30 o ms 30 2 120 60 1800 32 120 960 28800
120 3142 82506 3410 97102
x
d
=
(x
i
n
i
)
n
=
3142
120
= 26, 18
x
d
=
(x
i
n
i
)
n
=
3410
120
= 28, 41
La mediana se encuentra en
n
2
=
120
2
= 60 para los dislxicos M
e
= 26 y para los normales M
en
= 28.
El grupo de dislxicos superaron la mediana son 16 +12 +10 +2 = 40 El porcentaje de dislxicos que superan la mediana son es
40
120
= 0, 33
s
2
d
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
d
2
=
82506
120
26, 18
2
= 1, 98
s
d
=

1, 98 = 1, 407
CV =
s
d
x
d
=
1,406
26,18
= 0, 05
s
2
n
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
n
2
=
97102
120
28, 41
2
= 1, 67
s
d
=

1, 67 = 1, 29
CV =
s
d
x
d
=
129
28,41
= 0, 045
Problema 1.5. La tabla siguiente muestra la composicin por edad, sexo y trabajo de un grupo de personas con tuberculosis
pulmonar en la provincia de Vizcaya en el ao 1979:
Manuel Angel Barea Gmez 8
CAPTULO 1. ESTADSTICA DESCRIPTIVA
Edad
Trabajadores No trabajadores Totales
Varn Mujer Total Varn Mujer Total Varn Mujer Total
1419 2 1 3 25 40 65 27 41 68
1924 10 4 14 20 36 56 30 40 70
2429 32 10 42 15 50 65 47 60 107
2934 47 12 59 13 34 47 60 46 106
3439 38 8 46 10 25 35 48 33 81
3944 22 4 26 7 18 25 29 22 51
(a) Representar grcamente la distribucin de frecuencias de aquellas personas trabajadoras que padecen tuberculosis.
(b) Representar grcamente la distribucin de frecuencias de los varones no trabajadores que padecen tuberculosis.
(c) Representar grcamente la distribucin de frecuencias del nmero total de mujeres que padecen tuberculosis.
(d) Por debajo de qu edad est el 50% de los varones?
(e) Por encima de qu edad se encuentra el 80% de las mujeres?
(f) Obtener la media, mediana y desviacin tpica de la distribucin de las edades de la muestra total.
1
1
1
1
1
1
20 25 30 35 40
0
1
0
2
0
3
0
4
0
Trabajadores con tuberculsis
Edad
P
o
b
l
a
c
i

n
2
2
2
2
2
2
1
2
Mujer
Varn
20 25 30 35 40
1
0
1
5
2
0
2
5
No trabajadores varones con tuberclisis
Edad
V
a
r

n
20 25 30 35 40
3
0
4
0
5
0
6
0
Total de mujeres con tuberculsis
Edad
M
u
j
e
r
e
s
Manuel Angel Barea Gmez 9
CAPTULO 1. ESTADSTICA DESCRIPTIVA
Edad Varn N
i
1419 27 27
1924 30 57
2429 47 104
2934 60 164
3439 48 212
3944 29 241
n
2
=
241
2
= 120, 5 Luego est en el intervalo [29 34]
M
e
= L
in f
+
nk
100
N
i1
n
i
a
i
= 29 +
120,5104
60
5 = 30, 375
Edad Mujer N
i
1419 41 41
1924 40 81
2429 60 141
2934 46 187
3439 33 220
3944 22 242
Las mujeres que se encuentran por encima el 80% de las mujeres, es lo mimo que hallar P
20
, el intervalo para este percentil es
nk
100
=
24220
100
= 48, 4 Luego el intervalo es [19 24]
M
e
= L
in f
+
nk
100
N
i1
n
i
a
i
= 19 +
48,441
40
5 = 19, 925
Edad x
i
n
i
N
i
x
i
n
i
x
2
i
n
i
1419 16,5 68 68 1122 18513
1924 21,5 70 138 1505 32358
2429 26,5 107 245 2836 75141
2934 31,5 106 351 3339 105179
3439 36,5 81 432 2957 107912
3944 41,5 51 483 2117 87835
483 13874,50 426936,75
x =
(x
i
n
i
)
n
=
13874,50
483
= 28, 72
s
2
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
426936,75
483
28, 72
2
= 58, 76
s =

59, 76 = 7, 66.
n
2
=
483
2
= 241, 5 Luego est en el intervalo [24 29]
M
e
= L
in f
+
nk
100
N
i1
n
i
a
i
= 24 +
241,5138
107
5 = 28, 83
Problema 1.6. En una epidemia de escarlatina, se ha recogido el nmero de muertos en 40 ciudades de un pas, obtenindose la
siguiente tabla:
Manuel Angel Barea Gmez 10
CAPTULO 1. ESTADSTICA DESCRIPTIVA
N de muertos 0 1 2 3 4 5 6 7
Ciudades 7 11 10 7 1 2 1 1
(a) Representar grcamente estos datos.
(b) Obtener la distribucin acumulada y representarla.
(c) Calcular media, mediana y moda.
(d) Calcular la varianza y la desviacin tpica.
(e) Porcentaje de ciudades con al menos 2 muertos.
(f) Porcentaje de ciudades con ms de 3 muertos.
(g) Porcentaje de ciudades con a lo sumo 5 muertos.
0 1 2 3 4 5 6 7
2
4
6
8
1
0
N de muertos por ciudad
Muertes
C
i
u
d
a
d
e
s
Muertes n
i
N
i
f
i
F
i
x
i
n
i
x
2
i
n
i
0 7 7 0,18 0,18 0 0
1 11 18 0,28 0,45 11 11
2 10 28 0,25 0,70 20 40
3 7 35 0,18 0,88 21 63
4 1 36 0,03 0,90 4 16
5 2 38 0,05 0,95 10 50
6 1 39 0,03 0,98 6 36
7 1 40 0,03 1,00 7 49
40 79 265
Manuel Angel Barea Gmez 11
CAPTULO 1. ESTADSTICA DESCRIPTIVA
0 2 4 6 8
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
Distribucion de frecuencia acumulada
Edad
F
r
e
c
u
e
n
c
i
a
x =
(x
i
n
i
)
n
=
79
40
= 1, 97, M
e
= 2 y M
0
= 1
s
2
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
265
40
1, 97
2
= 2, 72
s =

2, 72 = 1, 6
El porcentaje de ciudades con al menos 2 muertos es igual 1 P(X < 2) = 1 0, 45 = 0, 55.
El porcentaje de ciudades con al menos 2 muertos es igual 1 P(X 3) = 1 0, 88 = 0, 12. El porcentaje con a lo sumo 5 muertes
0, 95
Problema 1.7. Se le ha tomado la temperatura corporal a un grupo de pacientes afectados de gripe, con los resultados siguientes:
Temperatura C 37 37,2 37,5 38 38,1 38,5 39
N pacientes 1 5 15 6 10 5 2
Calcule:
(a) Media aritmtica.
(b) Moda y mediana.
(c) Coeciente de variacin de Pearson.
x
i
n
i
N
i
x
i
n
i
x
2
i
n
i
37,00 1 1 37 1369
37,20 5 6 186 6919
37,50 15 21 563 21094
38,00 6 27 228 8664
38,10 10 37 381 14516
38,50 5 42 193 7411
39,00 2 44 78 3042
44 1665 63015,30
x =
(x
i
n
i
)
n
=
1665
44
= 37, 82
Manuel Angel Barea Gmez 12
CAPTULO 1. ESTADSTICA DESCRIPTIVA
M
0
= 37, 5 y
n
2
=
44
2
= 22as que M
e
= 38
s
2
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
6305,305
44
37, 82
2
= 0, 2471
s =

0, 2471 = 0, 4971
CV =
s
x
=
0,2471
37,92
= 0, 013
Problema 1.8. Un eclogo est interesado en el tamao de la hoja de una determinada especie vegetal. Para ello recoge una muestra
con los siguientes resultados:
Longitud cm 2,5 3,2 4 5,5 5,8 6,1
N hojas 2 4 9 6 6 3
Determine los valores de:
(a) Primer y tercer cuartiles.
(b) Moda y mediana.
(c) Percentiles 42 y 86
x
i
n
i
N
i
x
i
n
i
x
2
i
n
i
2,50 2 2 5 13
3,20 4 6 13 41
4,00 9 15 36 144
5,50 6 21 33 182
5,80 6 27 35 202
6,10 3 30 18 112
30 139,90 692,43
30
4
= 7, 5 as que Q
1
= 4
303
4
= 22, 5 as que Q
3
= 5, 80
M
0
= 4 y M
e
= 4
3042
100
= 12, 6 P
42
= 6 y
3086
100
= 25, 8 P
86
= 5, 80
Problema 1.9. La siguiente distribucin de frecuencias se reere a las edades de los empleados de una empresa:
Intervalos Frecuencia
16-22 11
22-28 15
28-34 32
34-40 28
40-46 16
46-52 25
52-58 14
58-64 10
64-70 6
Manuel Angel Barea Gmez 13
CAPTULO 1. ESTADSTICA DESCRIPTIVA
Calcule:
(a) Media aritmtica, intervalo mediano, mediana, intervalo modal, cuartiles de primer y tercer orden, percentiles 32 y 81.
(b) Desviacin tpica, coeciente de variacin de Pearson y recorrido semiintercuartlico.
Intervalos x
i
n
i
N
i
x
i
n
i
x
2
i
n
i
16-22 19 11 11 209 3971
22-28 25 15 26 375 9375
28-34 31 32 58 992 30752
34-40 37 28 86 1036 38332
40-46 43 16 102 688 29584
46-52 49 25 127 1225 60025
52-58 55 14 141 770 42350
58-64 61 10 151 610 37210
64-70 67 6 157 402 26934
157 6307 278533
x =
(x
i
n
i
)
n
=
6307
157
= 40, 17
El intervalo mediano
n
2
=
157
2
= 78, 5 ser [34 40]
M
e
= L
in f
+
nk
100
N
i1
n
i
a
i
= 34 +
78,558
37
6 = 37, 32
El intervalo modal es [28 34]
El primer cuartil
n
4
=
157
4
= 39, 25 luego se encuentra en el intervalo [28 34]
Q
1
= L
in f
+
nk
100
N
i1
n
i
a
i
= 28 +
39,2526
32
6 = 30, 48
El tercer cuartil
3n
4
=
3157
4
= 117, 75 luego se encuentra en el intervalo [46 52]
Q
3
= L
in f
+
nk
100
N
i1
n
i
a
i
= 46 +
117,75102
25
6 = 49, 78
El percentil 32
kn
100
=
32157
100
= 50, 24 luego se encuentra en el intervalo [28 34]
P
32
= L
in f
+
nk
100
N
i1
n
i
a
i
= 28 +
50,2426
32
6 = 32, 54
El percentil 81
kn
100
=
81157
100
= 127, 17 luego se encuentra en el intervalo [52 58]
P
81
= L
in f
+
nk
100
N
i1
n
i
a
i
= 52 +
127,17127
10
6 = 52, 10
s
2
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
278533
157
40, 17
2
= 160, 30
s =

160, 30 = 12, 66
CV =
s
x
=
12,66
40,17
= 0, 315
R
si
=
Q
3
Q
1
2
=
49,7830,48
2
= 0, 65
Manuel Angel Barea Gmez 14
CAPTULO 1. ESTADSTICA DESCRIPTIVA
Problema 1.10. Dadas las observaciones siguientes:
11 23 26 20 20 27 15 26 21 31
15 13 20 24 10 33 29 25 16 27
19 25 27 22 28 29 29 20 18 20
(a) Agrupe los datos en cinco intervalos de longitud constante, comenzando por el valor 10.
(b) Utilizando los intervalos anteriores, calcule: media, intervalo mediano, mediana, intervalo modal,
(c) cuartiles de primer y tercer orden y el percentil 82.
(d) desviacin tpica, coeciente de variacin y recorrido intercuartlico.
Intervalos x
i
n
i
N
i
x
i
n
i
x
2
i
n
i
10-15 12,5 3 3 37,5 468,75
15-20 17,5 5 8 87,5 1531,25
20-25 22,5 9 17 202,5 4556,25
25-30 27,5 11 28 302,5 8318,75
30-35 32,5 2 30 65 2112,5
30 695 16987,5
x =
(x
i
n
i
)
n
=
695
30
= 23, 2
El intervalo mediano
n
2
=
30
2
= 15 ser [20 25]
M
e
= L
in f
+
nk
100
N
i1
n
i
a
i
= 20 +
158
9
5 = 23, 8
El intervalo modal es [25 30]
El primer cuartil
n
4
=
15
4
= 3, 75 luego se encuentra en el intervalo [15 204]
Q
1
= L
in f
+
nk
100
N
i1
n
i
a
i
= 14 +
3,7536
5
5 = 19, 5
El tercer cuartil
3n
4
=
330
4
= 11, 25 luego se encuentra en el intervalo [20 25]
Q
3
= L
in f
+
nk
100
N
i1
n
i
a
i
= 20 +
11,259
5
5 = 27, 5
El percentil 82
kn
100
=
8230
100
= 24, 6 luego se encuentra en el intervalo [25 30]
P
82
= L
in f
+
nk
100
N
i1
n
i
a
i
= 25 +
24,617
11
5 = 28, 5
s
2
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
16987,5
30
23, 2
2
= 29, 16
s =

29, 16 = 5, 4
CV =
s
x
=
5,4
23,2
= 0, 2346
RI = Q
3
Q
1
= 27, 5 19, 5 = 8
Problema 1.11. En un estudio acerca del comportamiento de la mosca del vinagre Drosophila melanogaster, un bilogo midi el
tiempo en segundos que una mosca pasaba asendose en un determinado periodo de 6 minutos de duracin. Los tiempos de aseo
observados para 20 moscas distintas fueron:
Manuel Angel Barea Gmez 15
CAPTULO 1. ESTADSTICA DESCRIPTIVA
34 24 10 16 52 76 33 31 46 24
18 26 57 32 25 48 22 48 29 19
(a) Construya un diagrama de tallo y hojas para este conjunto de datos.
(b) Calcule el valor del coeciente de variacin de Pearson.
1 0689
2 244569
3 1234
4 688
5 27
6
7 6
x =
(x
i
n
i
)
n
=
34+24+..+29+19
20
= 32, 55
s
2
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
27141
20
32, 55
2
= 297, 54
s =

297, 54 = 17, 25
CV =
s
x
=
17,25
32,55
= 0, 53
Problema 1.12. Al examinar 158 casos de parlisis de Bell se anotaron las diferentes terapias seguidas por estos pacientes, resul-
tando el conjunto de datos:
_

_
C Corticoides
DQ Descomprensi onquir urgica
ET Electroterapia
NT Ning untratamiento
OT Otrasmodalidades
Tratamiento C DQ ET NT OT
N de pacientes 73 36 19 21 9
(a) Obtenga la tabla de frecuencias e indique qu porcentaje de pacientes toma corticoides.
(b) Construya el diagrama de sectores.
x
i
n
i
N
i
f
i
F
i
C 73 73 0,46 0,46
DQ 36 109 0,23 0,69
ET 19 128 0,12 0,81
NT 21 149 0,13 0,94
OT 9 158 0,06 1,00
158
Toman corticoides el 46% de los pacientes.
Manuel Angel Barea Gmez 16
CAPTULO 1. ESTADSTICA DESCRIPTIVA
C
DQ
ET
NT
OT
Terapias
Problema 1.13. Los siguientes datos representan el nmero de das de hospitalizacin por una apendicectoma:
N de das 3 4 5 6 7 8 ms de 8
N de casos 15 58 43 22 8 3 1
(a) Obtener la media y la varianza, as como los coecientes de asimetra, curtosis y variacin.
(b) Representar el correspondiente diagrama de barras.
N de das x
i
n
i
N
i
x
i
n
i
x
2
i
n
i
(x
i
x)
3
n
i
(x
i
x)
4
n
i
3 3 15 15 0,10 0,10 -80,85 141,76
4 4 58 73 0,39 0,49 -24,80 18,68
5 5 43 116 0,29 0,77 0,65 0,16
6 6 22 138 0,15 0,92 42,63 53,14
7 7 8 146 0,05 0,97 90,72 203,82
8 8 3 149 0,02 0,99 102,67 333,33
ms de 8 9 1 150 0,01 1,00 76,59 325,23
150 713 3595 207,60 1076,12
x =
(x
i
n
i
)
n
=
713
150
= 4, 75
s
2
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
3539
150
4, 75
2
= 1, 37
s =

1, 37 = 1, 17
CV =
s
x
=
1,17
4,75
= 0, 25
C.A. =
(x
i
x)
3
n
i
ns
3
=
297,60
1501,17
3
= 0, 864
K =
(x
i
x)
4
n
i
ns
4
3 =
1076,12
1501,17
4
3 = 0, 8085
Manuel Angel Barea Gmez 17
CAPTULO 1. ESTADSTICA DESCRIPTIVA
3 4 5 6 7 8 9
Dias de hospitalizacion
Dias
n
0
1
0
2
0
3
0
4
0
5
0
Problema 1.14. La siguiente tabla muestra la distribucin de edades de 75 casos de una determinada enfermedad durante un ao y
en un hospital determinado:
Edad N de casos
5-15 5
15-25 10
25-35 20
35-45 22
45-55 13
55-65 5
(a) Calcular la media, mediana, varianza, desviacin tpica y coeciente de variacin.
Edad x
i
n
i
N
i
x
i
n
i
x
2
i
n
i
5-15 10 5 5 50 500
15-25 20 10 15 200 4000
25-35 30 20 35 600 18000
35-45 40 22 57 880 35200
45-55 50 13 70 650 32500
55-65 60 5 75 300 18000
75 2680 108200
x =
(x
i
n
i
)
n
=
2680
75
= 35, 73
s
2
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
108200
75
35, 735
2
= 165, 80
s =

165, 80 = 12, 887


CV =
s
x
=
12,88
35,73
= 0, 36
El intervalo mediano
n
2
=
75
2
= 37, 5 ser [35 45]
M
e
= L
in f
+
nk
100
N
i1
n
i
a
i
= 35 +
37,535
22
10 = 36, 14
Manuel Angel Barea Gmez 18
CAPTULO 1. ESTADSTICA DESCRIPTIVA
Problema 1.15. Como parte de un proyecto de investigacin, cierto investigador obtuvo los siguientes niveles de SLP de una muestra
de 10 individuos adultos bajo tratamiento de Diabetes Mellitus:
5,85 6,17 6,09 7,70 3,17 3,83 5,17 4,31 3,09 5,24
(a) Calcular la media, mediana, varianza y desviacin tpica.
(b) Si el investigador se da cuenta de que el aparato utilizado para medir los niveles de SLP est defectuoso y ha medido sis-
temticamente 2 unidades por debajo de su valor real, tiene que volver a realizar las mediciones?. Cul es el valor de la
media y la desviacin tpica de los nuevos datos?
Nivel SLP x
i
n
i
N
i
x
i
n
i
x
2
i
n
i
5,85 1 1 6 34
6,17 1 2 6 38
6,09 1 3 6 37
7,70 1 4 8 59
3,17 1 5 3 10
3,83 1 6 4 15
5,17 1 7 5 27
4,31 1 8 4 19
3,09 1 9 3 10
5,24 1 10 5 27
10 50,62 275,70
x =
(x
i
n
i
)
n
=
50,62
10
= 5, 06
s
2
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
275,70
10
5, 06
2
= 1, 95
s =

1, 95 = 1, 39
La mediana se encuentra en
n
2
=
10
2
= 5 que le corresponde M
e
= 3, 17
Teorema. Si a cada observacin de una distribucin Xse le suma una constante k (traslacin), se tiene una nueva variable
Y = X +k con media igual a la de X ms la constante k.
Si se le suma una constante a una variable, la varianza de la nueva variable no cambia.
Por las anteriores propiedades de la media y la varianza, los nuevos estadsticos sern x = 7, 06 y s
2
= 1, 95
Problema 1.16. Se ha realizado con 100 mujeres un estudio sobre la edad en la que comenzaron a utilizar anticonceptivos orales.
Los datos, agrupados en clases, estn en el siguiente cuadro:
Clases n
i
N
i
f
i
13-25 23
25-37 33
37-49 72
49-61 90
61-73 10
(a) Completar las columnas de frecuencias absolutas n
i
, frecuencias acumuladas N
i
y frecuencias relativas f
i
.
(b) Calcular la media y desviacin tpica de la distribucin de frecuencias. Es la edad media un buen representante de los datos?
Manuel Angel Barea Gmez 19
CAPTULO 1. ESTADSTICA DESCRIPTIVA
(c) Calcular la mediana y el percentil 70.
Clases x
i
n
i
N
i
f
i
x
i
n
i
x
2
i
n
i
13-25 19 23 23 0,23 437 8303
25-37 31 33 56 0,33 1023 31713
37-49 43 16 72 0,16 688 29584
49-61 55 18 90 0,18 990 54450
61-73 67 10 100 0,10 670 44890
100 3808 168940
x =
(x
i
n
i
)
n
=
3808
100
= 38, 08
s
2
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
168940
100
38, 08
2
= 239, 31
s =

239, 31 = 15, 47.


La media no es una buena representacin de los datos ya que CV =
s
x
=
15,47
38,05
= 0, 41 y no est prximo al cero.
El intervalo mediano
n
2
=
100
2
= 50 ser [25 37]
M
e
= L
in f
+
nk
100
N
i1
n
i
a
i
= 25 +
5023
33
12 = 34, 82
El percentil 70
kn
100
=
70100
100
= 70 luego se encuentra en el intervalo [37 49]
P
70
= L
in f
+
nk
100
N
i1
n
i
a
i
= 37 +
7056
16
12 = 47, 5
Problema 1.17. Se ha realizado un estudio para valorar el efecto del alcohol sobre los niveles de colesterol en suero. Para ello, se
ha recogido la cantidad de alcohol consumido por semana (en gr.) de 100 sujetos, obtenindose la siguiente tabla de frecuencias
absolutas acumuladas:
Consumo [0, 50) [50 100) [100, 150) [150, 200) [200, 250)
N
i
25 60 90 98 100
(a) Calcular el porcentaje de sujetos que consumen entre 100 y 200 gr. de alcohol a la semana.
(b) Calcular el consumo medio.
(c) Calcular el nmero de sujetos que hay entre el percentil 15 y el cuartil tercero.
(d) Obtener la mediana de la distribucin de frecuencias.
Clases x
i
n
i
N
i
f
i
x
i
n
i
x
2
i
n
i
[0, 50) 25 25 25 0,25 625 15625
[50 100) 75 35 60 0,35 2625 196875
[100, 150) 125 30 90 0,30 3750 468750
[150, 200) 175 8 98 0,08 1400 245000
[200, 250) 225 2 100 0,02 450 101250
100 8850 1027500
El porcentaje de sujetos que consumen [100, 200) = 0, 30 +0, 08 = 0, 38
x =
(x
i
n
i
)
n
=
8850
100
= 88, 5gr
Manuel Angel Barea Gmez 20
CAPTULO 1. ESTADSTICA DESCRIPTIVA
Como tenemos que n = 100 Q
3
P
15
= 0, 75 0, 15 = 0, 60 luego el nmero de individuos ser 60.
El intervalo mediano
n
2
=
100
2
= 50 ser [50 100]
M
e
= L
in f
+
nk
100
N
i1
n
i
a
i
= 50 +
5025
35
50 = 85, 71gr
Problema 1.18. Se ha medido la tasa de glucosa en sangre a un grupo de 350 individuos. Los datos agrupados en 7 intervalos de
amplitud 10
mg
/100ml se presentan en la siguiente tabla:
Intervalos n
i
65-75 14
75-85 42
85-95 63
95-105 84
105-115 70
115-125
125-135
(a) Calcular la desviacin tpica de los datos, sabiendo que la media es 101, 6
mg
/100ml.
(b) Qu valor de tasa de glucosa es superado por el 40% de los datos?
Clases x
i
n
i
N
i
x
i
n
i
x
2
i
n
i
65-75 70 14 14 980 68600
75-85 80 42 56 3360 268800
85-95 90 63 119 5670 510300
95-105 100 84 203 8400 840000
105-115 110 70 273 7700 847000
115-125 120 56 329 6720 806400
125-135 130 21 350 2730 354900
350 35560 3696000
Llamamos a y b a los valores desconocidos n
i
de los intervalos [115 125] y [125 135] respectivamente. x =
(x
i
n
i
)
n
= 101, 6 y
n = 350, por lo que podemos extraer un sistema de dos ecuaciones con dos incgnitas:
a +b = 77
120 a +130 b = 9450
_
Resolviendo
_
a = 56
b = 21
s
2
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
3696000
350
101, 6
2
= 237, 441
s =

237, 44 = 15, 42
mg
/100ml.
Superan el 40% de los datos aquellos que estn por encima del percentil 60.
El percentil 60
kn
100
=
60350
100
= 210 luego se encuentra en el intervalo [105 115]
P
60
= L
in f
+
nk
100
N
i1
n
i
a
i
= 105 +
210203
70
10 = 106
Problema 1.19. Para realizar un estudio que pretende valorar el proceso de crecimiento en 250 nios de edad similar, se ha utilizado
el ndice de masa corporal (IMC) o ndice de Quetelet (Peso en
kg
/m
2
). Los datos agrupados en 6 intervalos junto con la mayora de
sus frecuencias relativas ( f
i
), se presentan en la siguiente tabla:
Manuel Angel Barea Gmez 21
CAPTULO 1. ESTADSTICA DESCRIPTIVA
Peso Intervalos f
i
Bajo [15 18) 0,04
Normal-Bajo [18 20) 0,12
Normal [20 25) 0,40
Normal-Alto [25 27)
Sobrepeso [27 30) 0,16
Obesidad [30 35] 0,12
(a) Cul es el IMC que superan el 50% de los nios de este estudio?
(b) Qu% de nios tienen un IMC superior a 22
kg
/m
2
?
Peso Intervalos n
i
N
i
f
i
F
i
Bajo [15 18) 10 10 0,04 0,04
Normal-Bajo [18 20) 30 40 0,12 0,16
Normal [20 25) 100 140 0,40 0,56
Normal-Alto [25 27) 40 180 0,16 0,72
Sobrepeso [27 30) 40 220 0,16 0,82
Obesidad [30 35] 30 250 0,12 1
Para hallar el IMC qu supera el 50% debemos hallar la mediana.
El intervalo mediano
n
2
=
250
2
= 125 ser [20 25]
M
e
= L
in f
+
nk
100
N
i1
n
i
a
i
= 20 +
12540
100
5 = 24, 25
gr
/dl
Para conocer el IMC superior a 22
kg
/m
2
. Sabemos que el intervalo ser [20 25]
P = L
in f
+
nk
100
N
i1
n
i
a
i
= 20 +
nk
100
40
100
5 = 22, despejando
nk
100
=
(2220)100
5
+40 = 80 luego k =
80100
250
= 0, 32
Como lo que nos piden son los que estn por encima de P
32
= 1 0, 32 = 0, 68
Problema 1.20. Con el objetivo de determinar la presencia de anemia en mujeres embaraza- das, se midieron los valores de
hemoglobina (
gr
/dl) al nal del primer trimestre en un grupo de 200 embarazadas que no seguan ningn tratamiento paralelo.
La siguiente tabla presenta los porcentajes de embarazadas que se incluyeron en cada una de las categoras:
Hemoglobina
gr
/dl f
i
[9, 09, 8) 10%
[9, 810, 6) 40%
[10, 611, 4) 30%
[11, 412, 2) 15%
[12, 213, 0) 5%
A partir de estos datos:
(a) El porcentaje de mujeres que presentaban anemia es decir, que tenan valores de hemoglobina por debajo de 11
gr
/dl
(b) Determinar la media, la mediana y la desviacin tpica de los datos. Es la media un buen representante de los datos?
Manuel Angel Barea Gmez 22
CAPTULO 1. ESTADSTICA DESCRIPTIVA
Hemoglobina
gr
/dl x
i
n
i
N
i
f
i
F
i
x
i
n
i
x
2
i
n
i
[9, 09, 8) 9,4 20 20 0,10 0,10 188 1767
[9, 810, 6) 80 80 100 0,40 0,50 816 8323
[10, 611, 4) 90 60 160 0,30 0,80 660 7260
[11, 412, 2) 100 30 190 0,15 0,95 354 4177
[12, 213, 0) 110 10 200 0,05 1,00 126 1588
200 2144 23115,20
Para conocer el porcentaje de mujeres con anemia es decir inferior a 11
gr
/dl. Sabemos que el intervalo ser [10, 6 11, 4]
P = L
in f
+
nk
100
N
i1
n
i
a
i
= 10, 6 +
nk
100
100
60
0, 8 = 11, despejando
nk
100
=
(10,611)60
0,8
+100 = 130 luego k =
130100
200
= 0, 65
x =
(x
i
n
i
)
n
=
2144
200
= 10, 72
s
2
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
23115,20
200
10, 72
2
= 0, 66
s =

0, 66 = 0, 81.
La media es una buena representacin de los datos ya que CV =
s
x
=
0,81
10,72
= 0, 08 y est prximo al cero.
El intervalo mediano
n
2
=
200
2
= 100 ser [9, 8 10, 6]
M
e
= 10, 6 ya que coincide con el limite superior.
Problema 1.21. La siguiente tabla nos muestra (en miles) el nmero de embarazos registrados en Espaa a lo largo del ao 1996,
segn los diferentes grupos de edad:
Edad <20 [2025) [2530) [3035) [3540) [4045)
n
i
12 34 84 92 37 8
(a) Calcular la edad media de los embarazos as como los cuartiles.
(b) Que% qued embarazada con ms de 28 aos de edad?
Edad x
i
n
i
N
i
f
i
F
i
x
i
n
i
x
2
i
n
i
<20 17,5 12 12 0,04 0,04 210 3675
[2025) 22,5 34 46 0,13 0,17 765 17213
[2530) 27,5 84 130 0,31 0,49 2310 63525
[3035) 32,5 92 222 0,34 0,83 2990 97175
[3540) 37,5 37 259 0,14 0,97 1388 52031
[4045) 42,5 8 267 0,03 1,00 340 14450
267 8002,50 248068,75
x =
(x
i
n
i
)
n
=
8002,50
267
= 29, 97
Para hallar Q
1
kn
100
=
25267
100
= 66, 75 el intervalo que lo contiene es [2530)
Q
1
= L
in f
+
nk
100
N
i1
n
i
a
i
= 25 +
66,7546
84
5 = 26, 23
Para hallar Q
3
kn
100
=
75267
100
= 200, 25 el intervalo que lo contiene es [3035)
Manuel Angel Barea Gmez 23
CAPTULO 1. ESTADSTICA DESCRIPTIVA
Q
3
= L
in f
+
nk
100
N
i1
n
i
a
i
= 30 +
200,25130
92
5 = 33, 82
El intervalo mediano
n
2
=
267
2
= 133, 5 ser [30 35]
M
e
= L
in f
+
nk
100
N
i1
n
i
a
i
= 30 +
133,5130
92
5 = 30, 19
Para conocer el porcentaje de mujeres mayores de 28 aos que se quedaron embarazadas. Sabemos que el intervalo ser [25 30]
P = L
in f
+
nk
100
N
i1
n
i
a
i
= 25 +
nk
100
46
84
5 = 28, despejando
nk
100
=
(2825)92
5
+46 = 96 luego k =
96100
267
= 36, 10
Como lo que nos piden son los que estn por encima de P
28
= 1 0, 361 = 0, 6398
Problema 1.22. En un reconocimiento mdico realizado a los 1000 trabajadores de una factora industrial, se ha medido la tensin
arterial sistlica (mm.Hg) obteniendo la siguiente distribucin de frecuencias. Completar la tabla sabiendo que la mediana de los
datos es 138mm.Hg
Categora Intervalo n
i
ptima [110 120]
Normal (120 130] 120
Normal-Elevada (130 140] 350
HTA-Leve (140 160] 260
HTA-Moderada (160 180] 120
HTA-Severa (180 220]
Llamamos a y b a las incgnitas del primer y ltimo intervalo y construimos nuestra tabla.
Categora Intervalo n
i
N
i
ptima [110 120] a a
Normal (120 130] 120 120+a
Normal-Elevada (130 140] 350 470+a
HTA-Leve (140 160] 260 730+a
HTA-Moderada (160 180] 120 850+a
HTA-Severa (180 220] b 850+a+b
Del enunciado 1000 = a +b +850 150 = a +b.
De la mediana M
e
= L
in f
+
nk
100
N
i1
n
i
a
i
= 130 +
500(470+a)
350
10 = 138 luego 470 +a =
_
(138130)350
10
500
_
a = 100 y susti-
tuyendo en la primera ecuacin b = 150 100 = 50
Problema 1.23. La siguiente tabla recoge la distribucin de frecuencias de triglicridos (en
mg
/dl) en el suero de un grupo de nios
con 6 aos. Completar la tabla sabiendo que el percentil 20 de esta distribucin es 32
mg
/dl.
Nivel de triglicridos 10-20 20-30 30-40 40-50 50-60 60-70 70-80 80-90
n
i
10 15 24 18 12 4 2
Manuel Angel Barea Gmez 24
CAPTULO 1. ESTADSTICA DESCRIPTIVA
Nivel de triglicridos n
i
N
i
10-20 a a
20-30 10 10+a
30-40 15 25+a
40-50 24 49+a
50-60 18 67+a
60-70 12 79+a
70-80 4 83+a
80-90 2 85+a
85+a
P
20
= L
in f
+
nk
100
N
i1
n
i
a
i
= 10 +
nk
100
(10+a)
10
10 = 32, despejando
nk
100
=
(3210)10
105
+10 +a = 13 +a luego n =
(13+a)100
20
= 85 +a resolviendo a = 5
Problema 1.24. Uno de los medicamentos antivirales que se utilizan para combatir el virus de la gripe es la Amantadina. En un
estudio sobre este medicamento se han administrado por va oral dosis nicas de 100mg a 60 individuos adultos sanos. La variable
estudiada (T
max
) es el tiempo requerido en minutos para alcanzar la concentracin mxima de plasma. La siguiente tabla recoge
frecuencia relativas acumuladas (F
i
) de los datos del estudio:
T
max
F
i
[100 120] 0,25
[120 140] 0,75
[140 160] 0,90
[160 180] 0,95
[180 200]
(a) Determinar media, mediana y desviacin tpica de esta distribucin.
(b) Qu transformacin lineal debemos realizar sobre estos datos para que los datos transformados tengan media 0 y desviacin
tpica 5?
T
max
x
i
n
i
N
i
f
i
F
i
x
i
n
i
x
2
i
n
i
[100 120] 110 15 15 0,25 0,25 1650 181500
[120 140] 130 30 45 0,50 0,75 3900 507000
[140 160] 150 9 54 0,15 0,90 1350 202500
[160 180] 170 3 57 0,05 0,95 510 86700
[180 200] 190 3 60 0,05 1,00 570 108300
60 7980 1086000
x =
(x
i
n
i
)
n
=
7980
60
= 133
s
2
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
1086000
60
133
2
= 411
s =

411 = 20, 27.


El intervalo mediano
n
2
=
60
2
= 30 ser [120 140]
M
e
= L
in f
+
nk
100
N
i1
n
i
a
i
= 120 +
3015
30
20 = 130
Manuel Angel Barea Gmez 25
CAPTULO 1. ESTADSTICA DESCRIPTIVA
Teorema. Si a cada observacin de una distribucin X se le suma una constante k (traslacin), se tiene una nueva variable Y = X +k
con media igual a la de X ms la constante k.
Si se multiplica una variable X por una constante k (homotecia), la variable resultante Y = kX tendr media igual a k por la media de
X.
Si se le suma una constante a una variable, la varianza de la nueva variable no cambia.
Si se multiplica una variable por una constante, la varianza de la nueva variable es igual a la de la antigua multiplicada por la constante
al cuadrado.
A la vista de las propiedades anteriores
_
y = a x +b
s
2
y
= a
2
s
2
_
0 = a 133 +b
5 = a
2
411
Resolviendo
_
a =0, 246
b =32, 8
Problema 1.25. La ictericia neonatal es un fenmeno biolgico complejo, resultado de un desequilibrio transitorio entre la pro-
duccin y eliminacin de la bilirrubina. En el curso de una investigacin, se determinaron los niveles de bilirrubina a travs de
bilirrubinometra transcutnea (BTc) de una muestra de neonatos con ictericia, obtenindose los siguientes resultados:
BTc (
md
/dl) n
i
< 5 3
[5 6) 4
[6 7) 2
[7 8) 8
[8 9) 12
[9 10) 18
10 33
(a) Entre qu valores se encuentran el 30% central de los datos de esta distribucin?
(b) Calcular el coeciente de asimetra y el de apuntamiento
BTc (
md
/dl) x
i
n
i
N
i
x
i
n
i
x
2
i
n
i
(x
i
x)
3
n
i
(x
i
x)
4
n
i
< 5 4,5 3 3 14 61 -292,01 1343,24
[5 6) 5,5 4 7 22 121 -186,62 671,85
[6 7) 6,5 2 9 13 85 -35,15 91,40
[7 8) 7,5 8 17 60 450 -32,77 52,43
[8 9) 8,5 12 29 102 867 -2,59 1,56
[9 10) 9,5 18 47 171 1625 1,15 0,46
10 10,5 33 80 347 3638 90,55 126,77
80 728 6846 -457,44 2287,70
El 30% del valor central se encuentra entre P
35
P
65
.
El percentil 35
kn
100
=
3580
100
= 28 luego se encuentra en el intervalo [8 9]
P
35
= L
in f
+
nk
100
N
i1
n
i
a
i
= 8 +
2817
12
1 = 8, 92
El percentil 65
kn
100
=
6580
100
= 52 luego se encuentra en el intervalo 10
P
65
= L
in f
+
nk
100
N
i1
n
i
a
i
= 10 +
5247
33
1 = 10, 15
x =
(x
i
n
i
)
n
=
728
80
= 9, 10
s
2
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
6846
80
9, 10
2
= 2, 76
Manuel Angel Barea Gmez 26
CAPTULO 1. ESTADSTICA DESCRIPTIVA
s =

2, 76 = 1, 66
C.A. =
(x
i
x)
3
n
i
ns
3
=
457,44
801,66
3
=1, 25
K =
(x
i
x)
4
n
i
ns
4
3 =
2287,70
801,66
4
3 = 0, 74
Problema 1.26. En 50 nios de 12 aos de edad se anot el nmero de dientes permanentes cariados u obturados, obtenindose que
8, 12, 10, 6, 4, 4, 4, 0 y 2 nios tenan 0, 1, 2, . . ., 7 y 8 dientes en esas condiciones. Calcular la media, mediana y desviacin tpica
de la distribucin.
Dientes sanos x
i
n
i
N
i
x
i
n
i
x
2
i
n
i
0 0 8 8 0 0
1 1 12 20 12 12
2 2 10 30 20 40
3 3 6 36 18 54
4 4 4 40 16 64
5 5 4 44 20 100
6 6 4 48 24 144
7 7 0 48 0 0
8 8 2 50 16 128
50 126 542
x =
(x
i
n
i
)
n
=
126
50
= 2, 52
s
2
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
542
50
2, 52
2
= 4, 49
s =

4, 49 = 2, 12
M
e
= 2
Problema 1.27. Se determin 20 veces el contenido de glucosa en sangre de una misma muestra por medio de dos mtodos, A y B,
de determinacin rpida de la misma. Comparar la dispersin de ambos mtodos.
Mtodo A 140 141 142 127 138 136 135 142 126 148 139 142 141 151 144 146 145 148 147 136
Mtodo B 130 132 146 138 145 148 147 135 136 137 141 146 138 131 134 146 139 140 148 146
Para el mtodo A
Manuel Angel Barea Gmez 27
CAPTULO 1. ESTADSTICA DESCRIPTIVA
x
i
n
i
x
i
n
i
x
2
i
n
i
140 1 140 19600
141 1 141 19881
142 1 142 20164
127 1 127 16129
138 1 138 19044
136 1 136 18496
135 1 135 18225
142 1 142 20164
126 1 126 15876
148 1 148 21904
139 1 139 19321
142 1 142 20164
141 1 141 19881
151 1 151 22801
144 1 144 20736
146 1 146 21316
145 1 145 21025
148 1 148 21904
147 1 147 21609
136 1 136 18496
20 2814 396736
x =
(x
i
n
i
)
n
=
2814
20
= 140, 70
s
2
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
396736
20
140, 70
2
= 40, 31
s =

40, 31 = 6, 35
CV =
s
x
=
6,35
140,70
= 0, 05
Para el mtodo B
Manuel Angel Barea Gmez 28
CAPTULO 1. ESTADSTICA DESCRIPTIVA
x
i
n
i
x
i
n
i
x
2
i
n
i
130 1 132 17424
132 1 146 21316
146 1 138 19044
138 1 145 21025
145 1 148 21904
148 1 147 21609
147 1 135 18225
135 1 136 18496
136 1 137 18769
137 1 141 19881
141 1 146 21316
146 1 138 19044
138 1 131 17161
131 1 134 17956
134 1 146 21316
146 1 139 19321
139 1 140 19600
140 1 148 21904
148 1 146 21316
146 1 146 21316
20 2819 397943
x =
(x
i
n
i
)
n
=
2819
20
= 140, 95
s
2
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
397943
20
140, 95
2
= 30, 25
s =

30, 25 = 5, 50
CV =
s
x
=
5,50
140,95
= 0, 04
Por tanto estar ms dispersa el mtodo A.
Manuel Angel Barea Gmez 29
CAPTULO
2
Variables Bidimensionales
Problema 2.1. Se realiza un estudio para establecer una ecuacin mediante la cual se pueda utilizar la concentracin de estrona en
saliva(X) para predecir la concentracin del esteroide en plasma libre (Y). Se extrajeron los siguientes datos de 14 varones sanos:
X 1,4 7,5 8,5 9 9 11 13 14 14,5 16 17 18 20 23
Y 30 25 31,5 27,5 39,5 38 43 49 55 48,5 51 64,5 63 68
(a) Estdiese la posible relacin lineal entre ambas variables.
(b) Obtener la ecuacin que se menciona en el enunciado del problema.
(c) Determinar la variacin de la concentracin de estrona en plasma por unidad de estrona en saliva.
5 10 15 20
3
0
4
0
5
0
6
0
x
y
A la vista de la grca del diagrama de dispersin se puede comprobar que la distribucin es idnea para utilizar la regresin lineal.
30
CAPTULO 2. VARIABLES BIDIMENSIONALES
X Y n
i
x
i
n
i
x
2
i
n
i
y
i
n
i
y
2
i
n
i
x
i
y
i
n
i
1,4 30 1 1,4 1,96 30 900 42
7,5 25 1 7,5 56,25 25 625 187,5
8,5 31,5 1 8,5 72,25 31,5 992,25 267,75
9 27,5 1 9 81 27,5 756,25 247,5
9 39,5 1 9 81 39,5 1560,25 355,5
11 38 1 11 121 38 1444 418
13 43 1 13 169 43 1849 559
14 49 1 14 196 49 2401 686
14,5 55 1 14,5 210,25 55 3025 797,5
16 48,5 1 16 256 48,5 2352,25 776
17 51 1 17 289 51 2601 867
18 64,5 1 18 324 64,5 4160,25 1161
20 63 1 20 400 63 3969 1260
23 68 1 23 529 68 4624 1564
14 181,9 2786,71 633,5 31259,25 9188,75
x =
(x
i
n
i
)
n
=
180,9
14
= 13
s
2
x
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
2786,71
14
13
2
= 30, 23
s
x
=

30, 23 = 5, 50
y =
(y
i
n
i
)
n
=
633,5
14
= 45, 25
s
2
y
=
(y
i
y)n
i
n
=
n
i
y
2
i
n
y
2
=
31259,25
14
45, 25
2
= 185, 24
s
y
=

185, 24 = 13, 61
s
xy
=
(x
i
x)(y
i
y)n
i
n
=
n
i
x
i
y
i
n
(x y) =
9188,75
14
(13 45, 25) = 68, 41
La recta de regresin es de la forma y = b x +a
_
b =
s
xy
s
2
x
=
68,41
5,50
= 2, 26
a = y b x = 45, 25 2, 26 13 = 15, 85
y = 15, 85 x +2, 26.
Para conocer la variacin de la concentracin de estrona en plasma por unidad de estrona en saliva, sustimuimos en la anterior recta
x = 1 y obtenemos y = 15, 85 1 +2, 26 = 18, 11
Problema 2.2. Los investigadores estn estudiando la correlacin entre obesidad y la respuesta individual al dolor. La obesidad se
mide como porcentaje sobre el peso ideal (X). La respuesta al dolor se mide utilizando el umbral de reejo de exin nociceptiva
(Y), que es una medida de sensacin de punzada. Se obtienen los siguientes datos:
X 89 90 75 30 51 75 62 45 90 20
Y 2 3 4 4,5 5,5 7 9 13 15 14
(a) Qu porcentaje de la varianza del peso es explicada mediante un modelo de regresin lineal por la variacin del umbral de
reejo?
(b) Estdiese la posible relacin lineal entre ambas variables, obteniendo su grado de ajuste.
(c) Qu porcentaje de sobrepeso podemos esperar para un umbral de reejo de 10?
Manuel Angel Barea Gmez 31
CAPTULO 2. VARIABLES BIDIMENSIONALES
X Y n
i
x
i
n
i
x
2
i
n
i
y
i
n
i
y
2
i
n
i
x
i
y
i
n
i
89 2 1 89 7921 2 4 178
90 3 1 90 8100 3 9 270
75 4 1 75 5625 4 16 300
30 4,5 1 30 900 4,5 20,25 135
51 5,5 1 51 2601 5,5 30,25 280,5
75 7 1 75 5625 7 49 525
62 9 1 62 3844 9 81 558
45 13 1 45 2025 13 169 585
90 15 1 90 8100 15 225 1350
20 14 1 20 400 14 196 280
10 627 45141 77 799,5 4461,5
x =
(x
i
n
i
)
n
=
627
10
= 62, 7
s
2
x
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
45141
10
62, 7
2
= 582, 81
s
x
=

582, 81 = 24, 14
y =
(y
i
n
i
)
n
=
77
10
= 7, 7
s
2
y
=
(y
i
y)n
i
n
=
n
i
y
2
i
n
y
2
=
799,5
10
7, 7
2
= 20, 66
s
y
=

20, 664 = 4, 54
s
xy
=
(x
i
x)(y
i
y)n
i
n
=
n
i
x
i
y
i
n
(x y) =
4461,5
10
(62, 7 7, 7) =36, 64
r =
s
xy
s
x
s
y
=
36,64
62,77,7
=0, 3339
R
2
= r
2
=0, 3339 = 0, 1115
El porcentaje de la varianza del peso es explicada por un 11,15%.
La recta de regresin x = b y +a
_
b =
s
xy
s
2
y
=
36,64
20,66
=0, 0665
a = x b y = 62, 7 +0, 0665 7, 7 = 15, 85
x =0, 0665 y +15, 85.
Para un valor y = 10
x =0, 0665 10 +15, 85 = 15, 185.
Problema 2.3. Se lleva a cabo un estudio, por medio de detectores radioactivos, de la capacidad corporal para absorber hierro y
plomo. Participan en el estudio 10 sujetos. A cada uno se le da una dosis oral idntica de hierro y plomo. Despus de 12 das se
mide la cantidad de cada componente retenida en el sistema corporal y, a partir de sta, se determina el porcentaje absorbido por el
cuerpo. Se obtuvieron los siguientes datos:
Porcenta jedehierro X 17 22 35 43 80 85 91 92 96 100
Porcenta jede plomo Y 8 17 18 25 58 59 41 30 43 58
(a) Comprobar la idoneidad del modelo lineal de regresin.
Manuel Angel Barea Gmez 32
CAPTULO 2. VARIABLES BIDIMENSIONALES
(b) Obtener la recta de regresin, si el modelo lineal es adecuado.
(c) Predecir el porcentaje de hierro absorbido por un individuo cuyo sistema corporal absorbe el 15% del plomo ingerido.
20 40 60 80 100
1
0
2
0
3
0
4
0
5
0
6
0
x
y
X Y n
i
x
i
n
i
x
2
i
n
i
y
i
n
i
y
2
i
n
i
x
i
y
i
n
i
17 8 1 17 289 8 64 136
22 17 1 22 484 17 289 374
35 18 1 35 1225 18 324 630
43 25 1 43 1849 25 625 1075
80 58 1 80 6400 58 3364 4640
85 59 1 85 7225 59 3481 5015
91 41 1 91 8281 41 1681 3731
92 30 1 92 8464 30 900 2760
96 43 1 96 9216 43 1849 4128
100 58 1 100 10000 58 3364 5800
10 661 53433 357 15941 28289
x =
(x
i
n
i
)
n
=
661
10
= 6, 61
s
2
x
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
53433
10
6, 61
2
= 974, 09
s
x
=

974, 09 = 31, 21
y =
(y
i
n
i
)
n
=
357
10
= 35, 7
s
2
y
=
(y
i
y)n
i
n
=
n
i
y
2
i
n
y
2
=
15941
10
35, 7
2
= 319, 61
s
y
=

319, 61 = 17, 87
s
xy
=
(x
i
x)(y
i
y)n
i
n
=
n
i
x
i
y
i
n
(x y) =
28289
10
(6, 61 35, 7) = 469, 13
La recta de regresin x = b x +a
Manuel Angel Barea Gmez 33
CAPTULO 2. VARIABLES BIDIMENSIONALES
_
b =
s
xy
s
2
y
=
469,13
319,61
= 1, 467
a = x b y = 6, 61 +1, 467 35, 7 = 58, 98
x = 1, 467 y +58, 98.
Para un valor y = 15
x = 1, 467 15 +58, 98 = 80, 98.
Problema 2.4. Para estudiar el efecto de las aguas residuales de las alcantarillas que auyen a un lago, se toman medidas de
la concentracin de nitrato en el agua. Para monitorizar la variable se ha utilizado un antiguo mtodo manual. Se idea un nuevo
mtodo automtico. Si se pone de maniesto una alta correlacin positiva entre las medidas tomadas empleando los dos mtodos,
entonces se har uso habitual del mtodo automtico. Los datos obtenidos son los siguientes:
Manual X 25 40 120 75 150 300 270 400 450 575
Autom atico Y 30 80 150 80 200 350 240 320 470 583
(a) Hallar el coeciente de determinacin para ambas variables.
(b) Comprobar la idoneidad del modelo lineal de regresin. Si el modelo es apropiado, hallar la recta de regresin de Y sobre X
y utilizarla para predecir la lectura que se obtendra empleando la tcnica automtica con una muestra de agua cuya lectura
manual es de 100.
X Y n
i
x
i
n
i
x
2
i
n
i
y
i
n
i
y
2
i
n
i
x
i
y
i
n
i
25 30 1 25 625 30 900 750
40 80 1 40 1600 80 6400 3200
120 150 1 120 14400 150 22500 18000
75 80 1 75 5625 80 6400 6000
150 200 1 150 22500 200 40000 30000
300 350 1 300 90000 350 122500 105000
270 240 1 270 72900 240 57600 64800
400 320 1 400 160000 320 102400 128000
450 470 1 450 202500 470 220900 211500
575 583 1 575 330625 583 339889 335225
10 2405 900775 2503 919489 902475
x =
(x
i
n
i
)
n
=
2405
10
= 240, 5
s
2
x
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
900775
10
240, 5
2
= 32237, 25
s
x
=

32237, 25 = 179, 54
y =
(y
i
n
i
)
n
=
2503
10
= 250, 3
s
2
y
=
(y
i
y)n
i
n
=
n
i
y
2
i
n
y
2
=
919489
10
250, 3
2
= 29298, 81
s
y
=

29298, 81 = 171, 17
s
xy
=
(x
i
x)(y
i
y)n
i
n
=
n
i
x
i
y
i
n
(x y) =
902475
10
(240, 5 230, 4) = 30050, 35
r =
s
xy
s
x
s
y
=
30050,35
179,54171,17
= 0, 9778
R
2
= r
2
= 0, 9778 = 0, 9561
Manuel Angel Barea Gmez 34
CAPTULO 2. VARIABLES BIDIMENSIONALES
La recta de regresin y = b x +a
_
b =
s
xy
s
2
x
=
30050,35
32237,25
= 0, 9322
a = y b x = 250, 3 0, 9322 240, 5 = 26, 11
y = 0, 9322 x +26, 11.
con una muestra de agua cuya lectura manual x = 100 obtenemos y = 0, 9322 100 +26, 11 = 119, 33
Problema 2.5. Se ha medido el aclaramiento de creatinina en pacientes tratados con Captopril tras la suspensin del tratamiento
con dilisis, resultando la siguiente tabla:
D astr asel an alisis X 1 5 10 15 20 25 35
Creatinina
mg
/dl Y 5,7 5,2 4,8 4,5 4,2 4 3,8
(a) Hllese la expresin de la ecuacin lineal que mejor exprese la variacin de la creatinina, en funcin de los dias transcurridos
tras la dilisis, as como el grado de bondad de ajuste.
(b) En qu porcentaje la variacin de la creatinina es explicada por el tiempo transcurrido desde la dilisis?
(c) Si un individuo presenta 4, 1
mg
/dl de creatinina, cunto tiempo es de esperar que haya transcurrido desde la suspensin de la
dilisis?
X Y n
i
x
i
n
i
x
2
i
n
i
y
i
n
i
y
2
i
n
i
x
i
y
i
n
i
1 5,7 1 1 1 5,7 32,49 5,7
5 5,2 1 5 25 5,2 27,04 26
10 4,8 1 10 100 4,8 23,04 48
15 4,5 1 15 225 4,5 20,25 67,5
20 4,2 1 20 400 4,2 17,64 84
25 4 1 25 625 4 16 100
35 3,8 1 35 1225 3,8 14,44 133
7 111 2601 32,2 150,9 464,2
x =
(x
i
n
i
)
n
=
111
7
= 15, 86
s
2
x
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
2601
7
15, 81
2
= 120, 12
s
x
=

120, 12 = 10, 96
y =
(y
i
n
i
)
n
=
32,2
7
= 4, 60
s
2
y
=
(y
i
y)n
i
n
=
n
i
y
2
i
n
y
2
=
150,9
7
4, 6
2
= 0, 39
s
y
=

0, 39 = 0, 6302
s
xy
=
(x
i
x)(y
i
y)n
i
n
=
n
i
x
i
y
i
n
(x y) =
464,2
7
(15, 86 4, 60) =6, 63
r =
s
xy
s
x
s
y
=
6,63
10,960,6302
=0, 9597
R
2
= r
2
=0, 9597 = 0, 9210
La recta de regresin y = b x +a
Manuel Angel Barea Gmez 35
CAPTULO 2. VARIABLES BIDIMENSIONALES
_
b =
s
xy
s
2
x
=
6,63
120,12
=0, 0552
a = y b x = 4, 60 +0, 0552 15, 86 = 5, 475
Luego la recta de regresin es y =0, 0552 x +5, 475.
La recta de regresin x = b y +a
_
b =
s
xy
s
2
y
=
6,63
0,39
=16, 96
a = x b y = 15, 86 +16, 96 4, 6 = 92, 63
y =16, 96 x +92, 63.
Con un nivel de creatinina y = 4, 1 obtenemos y =16, 96 4, 1 +92, 63 = 23, 094
Problema 2.6. En un ensayo clnico realizado tras el posible efecto hipotensor de un frmaco, se evala la tensin arterial diastlica
(TAD) en condiciones basales (X), y tras 4 semanas de tratamiento (Y), en un total de 14 pacientes hipertensos. Se obtienen los
siguiente valores de TAD:
X 25 40 120 75 150 300 270 400 450 575
Y 30 80 150 80 200 350 240 320 470 583
(a) Existe relacin lineal entre la TAD basal y la que se observa tras el tratamiento?
(b) Cul es el valor de TAD esperado tras el tratamiento, en un paciente que present una TAD basal de 95mm.Hg?
95 100 105 110
7
5
8
0
8
5
9
0
9
5
1
0
0
x
y
Manuel Angel Barea Gmez 36
CAPTULO 2. VARIABLES BIDIMENSIONALES
X Y n
i
x
i
n
i
x
2
i
n
i
y
i
n
i
y
2
i
n
i
x
i
y
i
n
i
95 85 1 95 9025 85 7225 8075
100 94 1 100 10000 94 8836 9400
102 84 1 102 10404 84 7056 8568
104 88 1 104 10816 88 7744 9152
100 85 1 100 10000 85 7225 8500
95 80 1 95 9025 80 6400 7600
95 80 1 95 9025 80 6400 7600
98 92 1 98 9604 92 8464 9016
102 90 1 102 10404 90 8100 9180
96 76 1 96 9216 76 5776 7296
100 90 1 100 10000 90 8100 9000
96 87 1 96 9216 87 7569 8352
110 102 1 110 12100 102 10404 11220
99 89 1 99 9801 89 7921 8811
14 1392 138636 1222 107220 121770
x =
(x
i
n
i
)
n
=
1392
14
= 99, 42
s
2
x
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
138636
14
99, 42
2
= 16, 53
s
x
=

16, 53 = 4, 06
y =
(y
i
n
i
)
n
=
1222
14
= 87, 28
s
2
y
=
(y
i
y)n
i
n
=
n
i
y
2
i
n
y
2
=
107220
14
87, 28
2
= 39, 77
s
y
=

39, 77 = 6, 30
s
xy
=
(x
i
x)(y
i
y)n
i
n
=
n
i
x
i
y
i
n
(x y) =
121770
14
(99, 42 87, 28) = 19, 16
La recta de regresin y = b x +a
_
b =
s
xy
s
2
x
=
19,16
16,53
= 1, 16
a = y b x = 87, 28 1, 16 99, 42 =27, 98
y = 1, 16 x 27, 98.
Para una x = 95 y = 1, 16 95 27, 98 = 82, 22
Problema 2.7. Se han realizado 9 tomas de presin intracraneal en animales de laboratorio, por un mtodo estndar directo y por
una nueva tcnica experimental indirecta, obtenindose los resultados siguientes en mm.Hg:
M etodoest andard X 9 12 28 72 30 38 76 26 52
M etodoexperimental Y 6 10 27 67 25 35 75 27 53
(a) Hallar la ecuacin lineal que exprese la relacin existente entre las presiones intracraneales, determinadas por los dos mto-
dos.
(b) Qu tanto por ciento de la variabilidad de Y es explicada por la regresin? Hllese el grado de dependencia entre las dos
variables.
Manuel Angel Barea Gmez 37
CAPTULO 2. VARIABLES BIDIMENSIONALES
X Y n
i
x
i
n
i
x
2
i
n
i
y
i
n
i
y
2
i
n
i
x
i
y
i
n
i
9 6 1 9 81 6 36 54
12 10 1 12 144 10 100 120
28 27 1 28 784 27 729 756
72 67 1 72 5184 67 4489 4824
30 25 1 30 900 25 625 750
38 35 1 38 1444 35 1225 1330
76 75 1 76 5776 75 5625 5700
26 27 1 26 676 27 729 702
52 53 1 52 2704 53 2809 2756
9 343 17693 325 16367 16992
x =
(x
i
n
i
)
n
=
343
9
= 38, 11
s
2
x
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
17693
9
38, 11
2
= 513, 43
s
x
=

513, 43 = 22, 66
y =
(y
i
n
i
)
n
=
325
9
= 36, 11
s
2
y
=
(y
i
y)n
i
n
=
n
i
y
2
i
n
y
2
=
16367
9
36, 11
2
= 514, 54
s
y
=

514, 54 = 22, 68
s
xy
=
(x
i
x)(y
i
y)n
i
n
=
n
i
x
i
y
i
n
(x y) =
16992
14
(38, 11 36, 11) = 511, 76
r =
s
xy
s
x
s
y
=
511,76
22,6622,68
= 0, 9957
R
2
= r
2
= 0, 9957 = 0, 9914
Problema 2.8. Durante una hora se administra por perfusin endovenosa continua un medicamento. Al nalizar la perfusin se
determinan las concentraciones plasmticas de medicamento y los resultados son los siguientes:
Tiempoh 1 1,5 2 3 6 15
Concentraci on
g
/ml 11,8 11,0 10,9 10,1 9,6 5,7
(a) Dibuje el diagrama de dispersin (nube de puntos) de los datos anteriores.
(b) Determine, a partir de la forma de la nube, si el modelo de regresin lineal es adecuado. En caso positivo, d la expresin
matemtica que relaciona la concentracin con el tiempo.
(c) Estime el valor de la concentracin a las 9 horas.
(d) Calcule el coeciente de correlacin e interprtelo.
Manuel Angel Barea Gmez 38
CAPTULO 2. VARIABLES BIDIMENSIONALES
2 4 6 8 10 12 14
6
7
8
9
1
0
1
1
1
2
x
y
A la vista de la grca la distribucin se ajusta una regresin lineal.
X Y n
i
x
i
n
i
x
2
i
n
i
y
i
n
i
y
2
i
n
i
x
i
y
i
n
i
1 11,8 1 1,5 2,25 11 121 16,5
1,5 11 1 2 4 10,9 118,81 21,8
2 10,9 1 3 9 10,1 102,01 30,3
3 10,1 1 6 36 9,6 92,16 57,6
6 9,6 1 15 225 5,7 32,49 85,5
15 5,7 1 15 225 5,7 32,49 85,5
6 42,5 501,25 53 498,96 297,2
x =
(x
i
n
i
)
n
=
42,5
6
= 7, 08
s
2
x
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
501,25
6
7, 08
2
= 33, 36
s
x
=

33, 36 = 5, 77
y =
(y
i
n
i
)
n
=
53
6
= 8, 83
s
2
y
=
(y
i
y)n
i
n
=
n
i
y
2
i
n
y
2
=
498,96
6
8, 83
2
= 5, 13
s
y
=

5, 13 = 2, 26
s
xy
=
(x
i
x)(y
i
y)n
i
n
=
n
i
x
i
y
i
n
(x y) =
297,2
6
(7, 08 8, 83) =13, 03
La recta de regresin y = b x +a
_
b =
s
xy
s
2
x
=
13,03
33,36
=0, 39
a = y b x = 8, 83 +0, 39 7, 08 = 11, 60
y =0, 39 x +11, 60.
Para una x = 9 y =0, 39 9 +11, 60 = 8, 09
r =
s
xy
s
x
s
y
=
13,03
5,772,26
=0, 9962
Manuel Angel Barea Gmez 39
CAPTULO 2. VARIABLES BIDIMENSIONALES
Este coeciente indica una alta correlacin inversa entre las variables
Problema 2.9. Se quiere estudiar la asociacin entre el consumo de sal (gr) y la tensin arterial (mm. Hg). A una serie de voluntarios
se les administra distintas dosis de sal en su dieta y se mide su tensin arterial un tiempo despus.
X (sal) Y (tensi on)
1,8 100
2,2 98
3,5 110
4,0 110
4,3 112
5,0 120
(a) Compruebe la idoneidad del modelo lineal de regresin.
(b) Obtenga la recta de regresin que exprese la tensin arterial en funcin de la cantidad de sal ingerida.
(c) Prediga la tensin arterial de un individuo cuya dieta contiene 2,7 g de sal.
2.0 2.5 3.0 3.5 4.0 4.5 5.0
1
0
0
1
0
5
1
1
0
1
1
5
1
2
0
x
y
X Y n
i
x
i
n
i
x
2
i
n
i
y
i
n
i
y
2
i
n
i
x
i
y
i
n
i
1,8 100 1 1,8 3,24 100 10000 180
2,2 98 1 2,2 4,84 98 9604 215,6
3,5 110 1 3,5 12,25 110 12100 385
4 110 1 4 16 110 12100 440
4,3 112 1 4,3 18,49 112 12544 481,6
5 120 1 5 25 120 14400 600
6 20,8 79,82 650 70748 2302,2
x =
(x
i
n
i
)
n
=
20,8
6
= 3, 47
s
2
x
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
79,82
6
3, 42
2
= 1, 28
s
x
=

1, 28 = 1, 13
Manuel Angel Barea Gmez 40
CAPTULO 2. VARIABLES BIDIMENSIONALES
y =
(y
i
n
i
)
n
=
650
6
= 108, 33
s
2
y
=
(y
i
y)n
i
n
=
n
i
y
2
i
n
y
2
=
70748
6
108, 33
2
= 55, 22
s
y
=

55, 22 = 7, 43
s
xy
=
(x
i
x)(y
i
y)n
i
n
=
n
i
x
i
y
i
n
(x y) =
2302,2
6
(3, 47 108, 33) = 8, 14
La recta de regresin y = b x +a
_
b =
s
xy
s
2
x
=
8,14
1,28
= 0, 9666
a = y b x = 108, 33 0, 9666 3, 47 = 86, 37
y = 0, 966 x +86, 37.
Para una x = 2, 7 y = 0, 966 2, 7 +86, 37 = 88, 97
Problema 2.10. Se ha medido a un grupo de 15 pacientes el nivel de carboxihemoglobina en sangre antes y despus de respirar un
ambiente cargado de humo, obteniendo los siguientes resultados:
X 5,70 4,40 4,90 0,70 1,60 2,10 1,50 2,90 3,80 5,20 3,20 1,30 1,00 6,80 0,50
Y 6,10 4,80 5,30 2,20 3,10 4,00 3,20 5,20 3,80 5,40 3,00 3,10 2,60 6,90 2,40
(a) Construir el diagrama de dispersin y calcular el coeciente de correlacin de Pearson.
(b) Obtener la recta de regresin de X sobre Y.
1 2 3 4 5 6 7
3
4
5
6
7
x
y
Manuel Angel Barea Gmez 41
CAPTULO 2. VARIABLES BIDIMENSIONALES
X Y n
i
x
i
n
i
x
2
i
n
i
y
i
n
i
y
2
i
n
i
x
i
y
i
n
i
5,7 6,1 1 4,4 19,36 4,8 23,04 21,12
4,4 4,8 1 4,9 24,01 5,3 28,09 25,97
4,9 5,3 1 0,7 0,49 2,2 4,84 1,54
0,7 2,2 1 1,6 2,56 3,1 9,61 4,96
1,6 3,1 1 2,1 4,41 4 16 8,4
2,1 4 1 1,5 2,25 3,2 10,24 4,8
1,5 3,2 1 2,9 8,41 5,2 27,04 15,08
2,9 5,2 1 3,8 14,44 3,8 14,44 14,44
3,8 3,8 1 5,2 27,04 5,4 29,16 28,08
5,2 5,4 1 3,2 10,24 3 9 9,6
3,2 3 1 1,3 1,69 3,1 9,61 4,03
1,3 3,1 1 1 1 2,6 6,76 2,6
1 2,6 1 6,8 46,24 6,9 47,61 46,92
6,8 6,9 1 0,5 0,25 2,4 5,76 1,2
0,5 2,4 1 0,5 0,25 2,4 5,76 1,2
15 40,4 162,64 57,4 246,96 189,94
x =
(x
i
n
i
)
n
=
40,4
15
= 2, 69
s
2
x
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
162,64
15
2, 69
2
= 3, 588
s
x
=

3, 58 = 1, 89
y =
(y
i
n
i
)
n
=
57,4
15
= 3, 83
s
2
y
=
(y
i
y)n
i
n
=
n
i
y
2
i
n
y
2
=
246,96
15
3, 83
2
= 1, 82
s
y
=

1, 82 = 1, 35
s
xy
=
(x
i
x)(y
i
y)n
i
n
=
n
i
x
i
y
i
n
(x y) =
189,94
15
(2, 69 3, 83) = 2, 35
r =
s
xy
s
x
s
y
=
2,35
1,891,35
= 0, 9218
La recta de regresin x = b y +a
_
b =
s
xy
s
2
y
=
2,35
1,82
= 1, 29
a = x b y = 2, 69 1, 29 3, 83 =2, 25
y = 1, 29 x 2, 25.
Problema 2.11. Se ha medido el peso y la talla a un grupo de individuos obteniendo la siguiente clasicacin
Peso/Talla 1,50-1,55 1,55-1,60 1,60-1,65 1,65-1,70 1,70-1,75 1,75-1,80
50-55 6 7 4 1 0 0
55-60 2 7 6 3 0 0
60-65 1 3 9 12 5 0
65-70 0 0 2 8 10 4
70-75 0 0 1 3 15 10
75-80 0 0 1 5 9 16
(a) Obtener las distribuciones marginales del peso y la talla.
(b) Obtener la distribucin del peso de los individuos que miden entre 1,75 y 1,80 m.
Manuel Angel Barea Gmez 42
CAPTULO 2. VARIABLES BIDIMENSIONALES
(c) Estudiar la independencia de las variables.
Peso/Talla 1,50-1,55 1,55-1,60 1,60-1,65 1,65-1,70 1,70-1,75 1,75-1,80 Total
50-55 6 7 4 1 0 0 18
55-60 2 7 6 3 0 0 18
60-65 1 3 9 12 5 0 30
65-70 0 0 2 8 10 4 24
70-75 0 0 1 3 15 10 29
75-80 0 0 1 5 9 16 41
Total 9 17 23 32 39 30 150
Peso
50-55
18
/150
55-60
18
/150
60-65
30
/150
65-70
24
/150
70-75
29
/150
75-80
41
/150
Talla
1,50-1,55
9
/150
1,55-1,60
17
/150
1,60-1,65
23
/150
1,65-1,70
32
/150
1,70-1,75
39
/150
1,75-1,80
30
/150
Peso Talla 1,75-1,80
50-55
0
/150
55-60
0
/150
60-65
0
/150
65-70
4
/150
70-75
10
/150
75-80
16
/150
Para que sean independientes se debe cumplir que P(AB) =P(A) P(B), en nuestro caso nos basta con evaluar f
i, j
= f
i
f
j6/150=9/15018/150
hemos tomado la celda de la primera la-primera columna, por tanto no son independientes.
Problema 2.12. Consideremos la variable aleatoria bidimensional dada por la tabla siguiente:
X
Y
0 1 2
-1
1
/10
1
/20
3
/20
0
1
/5
1
/50
4
/50
0,5
1
/10
1
/20
1
/50
1
2
/25
1
/10
1
/20
(a) Determinar las distribuciones marginales de X e Y.
(b) Calcular las medias y varianzas marginales.
(c) Obtener el valor de la covarianza entre X e Y. Son independientes?.
X
-1
3
/10
0
3
/10
0,5
17
/100
1
23
/100
Y
0
12
/25
1
11
/50
2
3
/10
De las tablas anteriores observamons que el denominador mayor es 100, luego esa ser nuestra n
x
i
n
i
x
i
n
i
x
2
i
n
i
-1 30 -30 30
0 30 0 0
0,5 17 9 4
1 23 23 23
100 1,50 57,25
y
i
n
i
y
i
n
i
y
2
i
n
i
-1 48 0 0
0 22 22 22
0,5 30 60 120
100 82 142
Manuel Angel Barea Gmez 43
CAPTULO 2. VARIABLES BIDIMENSIONALES
x =
(x
i
n
i
)
n
=
1,50
100
= 0, 015
s
2
x
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
57,25
100
0, 015
2
= 0, 5723
y =
(y
i
n
i
)
n
=
82
100
= 0, 82
s
2
y
=
(y
i
y)n
i
n
=
n
i
y
2
i
n
y
2
=
142
100
0, 82
2
= 0, 75
Para que sean independientes se debe cumplir que P(AB) =P(A) P(B), en nuestro caso nos basta con evaluar f
i, j
= f
i
f
j1/10 =3/10012/25
hemos tomado la celda de la primera la-primera columna, por tanto no son independientes.
Problema 2.13. Los siguientes datos representan lecturas de la presin sistlica, en mm.Hg., de 12 mujeres, en las edades que se
indican:
Edad 22 27 29 32 35 40 48 50 51 57 67 71
Presi on 131 106 123 122 121 147 115 163 138 141 176 172
(a) Calcular el coeciente de correlacin lineal y la recta de regresin mnimo cuadrtica de la presin sobre la edad. Qu
porcentaje de variabilidad es explicada por el modelo?
X Y n
i
x
i
n
i
x
2
i
n
i
y
i
n
i
y
2
i
n
i
x
i
y
i
n
i
22 131 1 22 484 131 17161 2882
27 106 1 27 729 106 11236 2862
29 123 1 29 841 123 15129 3567
32 122 1 32 1024 122 14884 3904
35 121 1 35 1225 121 14641 4235
40 147 1 40 1600 147 21609 5880
48 115 1 48 2304 115 13225 5520
50 163 1 50 2500 163 26569 8150
51 138 1 51 2601 138 19044 7038
57 141 1 57 3249 141 19881 8037
67 176 1 67 4489 176 30976 11792
71 172 1 71 5041 172 29584 12212
12 529 26087 1655 233939 76079
x =
(x
i
n
i
)
n
=
529
12
= 44, 08
s
2
x
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
26087
12
44, 08
2
= 230, 57
s
x
=

230, 57 = 15, 18
y =
(y
i
n
i
)
n
=
1655
12
= 137, 91
s
2
y
=
(y
i
y)n
i
n
=
n
i
y
2
i
n
y
2
=
233939
12
137, 91
2
= 473, 90
s
y
=

473, 90 = 21, 77
s
xy
=
(x
i
x)(y
i
y)n
i
n
=
n
i
x
i
y
i
n
(x y) =
75079
12
(44, 09 137, 91) = 260, 09
r =
s
xy
s
x
s
y
=
260,09
15,1821,77
= 0, 7868
Manuel Angel Barea Gmez 44
CAPTULO 2. VARIABLES BIDIMENSIONALES
La recta de regresin y = b x +a
_
b =
s
xy
s
2
x
=
260,09
230,57
= 1, 12
a = y b x = 44, 08 1, 12 137, 91 = 88, 19
y = 1, 12 x +88, 19.
R
2
= r
2
= 0, 7868
2
= 0, 6190
Problema 2.14. Los siguientes datos representan las calicaciones de 10 alumnos elegidos al azar en las asignaturas de Matemticas
y Fsica:
Matem aticas(X) 5 8 7 3 4 4 9 8 2 7
F sica(Y) 6 8 6 5 5 4 9 6 5 6
(a) Dibujar un diagrama de dispersin.
(b) Hallar el coeciente de correlacin.
(c) Obtener las rectas de regresin mnimo cuadrticas de la calicacin en Matemticas sobre la calicacin en Fsica, y recp-
rocamente.
(d) Predecir la nota en Fsica de un alumno que haya obtenido una calicacin de 6 en Matemticas.
2 3 4 5 6 7 8 9
4
5
6
7
8
9
x
y
X Y n
i
x
i
n
i
x
2
i
n
i
y
i
n
i
y
2
i
n
i
x
i
y
i
n
i
5 6 1 5 25 6 36 30
8 8 1 8 64 8 64 64
7 6 1 7 49 6 36 42
3 5 1 3 9 5 25 15
4 5 1 4 16 5 25 20
4 4 1 4 16 4 16 16
9 9 1 9 81 9 81 81
8 6 1 8 64 6 36 48
2 5 1 2 4 5 25 10
7 6 1 7 49 6 36 42
10 57 377 60 380 368
Manuel Angel Barea Gmez 45
CAPTULO 2. VARIABLES BIDIMENSIONALES
x =
(x
i
n
i
)
n
=
57
10
= 5, 7
s
2
x
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
377
10
5, 7
2
= 5, 21
s
x
=

5, 21 = 2, 28
y =
(y
i
n
i
)
n
=
60
10
= 6
s
2
y
=
(y
i
y)n
i
n
=
n
i
y
2
i
n
y
2
=
380
10
6
2
= 2
s
y
=

2 = 1, 41
s
xy
=
(x
i
x)(y
i
y)n
i
n
=
n
i
x
i
y
i
n
(x y) =
368
10
(5, 7 6) = 2, 60
r =
s
xy
s
x
s
y
=
2,60
2,281,41
= 0, 8055
La recta de regresin y = b x +a
_
b =
s
xy
s
2
x
=
2,69
5,21
= 0, 5
a = y b x = 6 0, 5 5, 7 = 3, 15
y = 0, 5 x +3, 15.
La recta de regresin x = b y +a
_
b =
s
xy
s
2
y
=
2,69
2
= 1, 30
a = x b y = 6 1, 30 5, 70 =2, 10
y = 1, 30 x 2, 10
Para un x = 6 y = 0, 5 6 +3, 15 = 6, 15
Problema 2.15. Los siguientes datos representan la edad y concentracin de colesterol en suero sanguneo en 15 mujeres:
Edad (X) 46 52 38 65 54 33 49 76 71 41 57 18 44 33 78
Colesterol (Y) 181 228 182 249 259 201 121 339 225 110 188 137 170 173 243
(a) Obtener el coeciente de correlacin lineal y la recta de regresin mnimos cuadrados de Y sobre X.
(b) Qu porcentaje de variabilidad queda explicada por el modelo?.
(c) A la vista del estudio anterior, cul debe ser la concentracin de colesterol en suero sanguneo en una mujer de 50 aos?.
X Y n
i
x
i
n
i
x
2
i
n
i
y
i
n
i
y
2
i
n
i
x
i
y
i
n
i
46 181 1 46 2116 181 32761 8326
52 228 1 52 2704 228 51984 11856
38 182 1 38 1444 182 33124 6916
65 249 1 65 4225 249 62001 16185
54 259 1 54 2916 259 67081 13986
33 201 1 33 1089 201 40401 6633
49 121 1 49 2401 121 14641 5929
76 339 1 76 5776 339 114921 25764
71 225 1 71 5041 225 50625 15975
41 110 1 41 1681 110 12100 4510
57 188 1 57 3249 188 35344 10716
18 137 1 18 324 137 18769 2466
44 170 1 44 1936 170 28900 7480
33 173 1 33 1089 173 29929 5709
78 243 1 78 6084 243 59049 18954
15 755 42075 3006 651630 161405
Manuel Angel Barea Gmez 46
CAPTULO 2. VARIABLES BIDIMENSIONALES
x =
(x
i
n
i
)
n
=
775
15
= 50, 33
s
2
x
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
42075
15
50, 33
2
= 271, 55
s
x
=

271, 55 = 16, 48
y =
(y
i
n
i
)
n
=
3006
15
= 200, 40
s
2
y
=
(y
i
y)n
i
n
=
n
i
y
2
i
n
y
2
=
651630
15
200, 40
2
= 3281, 84
s
y
=

3281, 84 = 57, 28
s
xy
=
(x
i
x)(y
i
y)n
i
n
=
n
i
x
i
y
i
n
(x y) =
161405
15
(50, 33 200, 40) = 673, 53
r =
s
xy
s
x
s
y
=
673,53
16,4857,28
= 0, 7135
R
2
= r
2
= 0, 7135
2
= 0, 5090
La recta de regresin y = b x +a
_
b =
s
xy
s
2
x
=
673,53
271,55
= 2, 48
a = y b x = 200, 40 2, 48 50, 33 = 75, 56
y = 2, 48 x +75, 56.
Para un x = 50 y = 2, 48 50 +75, 56 = 199, 56
Problema 2.16. Los siguientes datos representan las puntuaciones en un test de capacidad memorstica y un test de inteligencia
obtenida por 10 individuos estudiados:
Memoria(X) 17 23 25 36 38 40 42 46 55 62
Inteligencia(Y) 37 58 14 43 27 60 25 33 19 49
(a) Representar el diagrama de dispersin correspondiente. A la vista de ste, puede sacarse alguna conclusin?.
(b) Obtener el coeciente de correlacin lineal.
20 30 40 50 60
2
0
3
0
4
0
5
0
6
0
x
y
Manuel Angel Barea Gmez 47
CAPTULO 2. VARIABLES BIDIMENSIONALES
A la vista de la grca se observa que la distribucin no es candidata a una regresin lineal.
X Y n
i
x
i
n
i
x
2
i
n
i
y
i
n
i
y
2
i
n
i
x
i
y
i
n
i
17 37 1 17 289 37 1369 629
23 58 1 23 529 58 3364 1334
25 14 1 25 625 14 196 350
36 43 1 36 1296 43 1849 1548
38 27 1 38 1444 27 729 1026
40 60 1 40 1600 60 3600 2400
42 25 1 42 1764 25 625 1050
46 33 1 46 2116 33 1089 1518
55 19 1 55 3025 19 361 1045
62 49 1 62 3844 49 2401 3038
10 384 16532 365 15583 13938
x =
(x
i
n
i
)
n
=
384
10
= 38, 43
s
2
x
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
16532
10
38, 43
2
= 178, 64
s
x
=

178, 64 = 13, 56
y =
(y
i
n
i
)
n
=
365
10
= 36, 5
s
2
y
=
(y
i
y)n
i
n
=
n
i
y
2
i
n
y
2
=
15583
10
36, 5
2
= 226, 05
s
y
=

226, 05 = 15, 03
s
xy
=
(x
i
x)(y
i
y)n
i
n
=
n
i
x
i
y
i
n
(x y) =
13938
10
(38, 43 36, 5) =7, 8
r =
s
xy
s
x
s
y
=
7,8
13,5515,038
=0, 0388
Problema 2.17. Los datos siguientes son las medidas de las concentraciones de Calcio, en
mg
/100ml, y de la hormona paratiroides
en plasma de 12 individuos sanos, medida esta ltima en
mg
/ml.
Calcio(X) 11 11 10,6 10,5 10,6 10,4 10,2 9,5 8,2 7,5 6 5
PTH(Y) 0,3 0,5 1,12 1,23 1,24 1,31 1,33 2,1 2,15 2,43 3,7 4,27
(a) Existe relacin lineal entre ambas variables?
(b) Calcular el nivel de PTH que le correspondera a un nivel de 10
mg
/100ml de Ca.
(c) Calcular el nivel de Ca que correspondera a una PTH de 1, 5
mg
/ml
Manuel Angel Barea Gmez 48
CAPTULO 2. VARIABLES BIDIMENSIONALES
X Y n
i
x
i
n
i
x
2
i
n
i
y
i
n
i
y
2
i
n
i
x
i
y
i
n
i
11 0,3 1 11 121 0,3 0,09 3,3
11 0,5 1 11 121 0,5 0,25 5,5
10,6 1,12 1 10,6 112,36 1,12 1,2544 11,872
10,5 1,23 1 10,5 110,25 1,23 1,5129 12,915
10,6 1,24 1 10,6 112,36 1,24 1,5376 13,144
10,4 1,31 1 10,4 108,16 1,31 1,7161 13,624
10,2 1,33 1 10,2 104,04 1,33 1,7689 13,566
9,5 2,1 1 9,5 90,25 2,1 4,41 19,95
8,2 2,15 1 8,2 67,24 2,15 4,6225 17,63
7,5 2,43 1 7,5 56,25 2,43 5,9049 18,225
6 3,7 1 6 36 3,7 13,69 22,2
5 4,27 1 5 25 4,27 18,2329 21,35
12 110,5 1063,91 21,68 54,99 173,27
x =
(x
i
n
i
)
n
=
1063,91
12
= 9, 20
s
2
x
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
16532
12
9, 20
2
= 3, 86
s
x
=

3, 86 = 1, 96
y =
(y
i
n
i
)
n
=
21,68
12
= 1, 80
s
2
y
=
(y
i
y)n
i
n
=
n
i
y
2
i
n
y
2
=
54,99
12
1, 80
2
= 1, 32
s
y
=

1, 32 = 1, 15
s
xy
=
(x
i
x)(y
i
y)n
i
n
=
n
i
x
i
y
i
n
(x y) =
173,27
12
(9, 20 1, 80) =2, 19
r =
s
xy
s
x
s
y
=
2,19
1,961,15
=0, 9037
La recta de regresin y = b x +a
_
b =
s
xy
s
2
x
=
2,19
3,86
=0, 5683
a = y b x = 1, 80 +0, 5683 9, 20 = 7, 04
y =0, 5683 x +7, 04.
Para una x = 10 y =0, 5683 10 +7, 04 = 1, 34
mg
/ml
La recta de regresin x = b y +a
_
b =
s
xy
s
2
y
=
2,19
1,32
=1, 66
a = x b y = 9, 20 +1, 66 1, 80 = 12, 22
x =1, 66 y +12, 22
Para una y = 1, 5 x =1, 66 1, 80 +12, 22 = 9, 715
Problema 2.18. Queremos estudiar la relacin entre los niveles de hematocrito de recin nacidos de madres diabticas y su peso
obteniendo los siguientes resultados:
Madresdiab eticas%(X) 63 60 58 61 65 60 57 58 55 56
Pesokg(Y) 3,2 3,1 2,8 2,9 3,2 2,8 2,7 2,9 2,6 2,5
Manuel Angel Barea Gmez 49
CAPTULO 2. VARIABLES BIDIMENSIONALES
(a) Qu nivel de hematocrito podemos esperar para un recin nacido de madre diabtica con un peso de 3kg?
X Y n
i
x
i
n
i
x
2
i
n
i
y
i
n
i
y
2
i
n
i
x
i
y
i
n
i
63 3,2 1 63 3969 3,2 10,24 201,6
60 3,1 1 60 3600 3,1 9,61 186
58 2,8 1 58 3364 2,8 7,84 162,4
61 2,9 1 61 3721 2,9 8,41 176,9
65 3,2 1 65 4225 3,2 10,24 208
60 2,8 1 60 3600 2,8 7,84 168
57 2,7 1 57 3249 2,7 7,29 153,9
58 2,9 1 58 3364 2,9 8,41 168,2
55 2,6 1 55 3025 2,6 6,76 143
56 2,5 1 56 3136 2,5 6,25 140
10 593 35253 28,7 82,89 1708
x =
(x
i
n
i
)
n
=
593
10
= 59, 3
s
2
x
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
35253
10
59, 3
2
= 8, 81
s
x
=

8, 81 = 2, 97
y =
(y
i
n
i
)
n
=
28,7
10
= 2, 87
s
2
y
=
(y
i
y)n
i
n
=
n
i
y
2
i
n
y
2
=
82,89
10
2, 87
2
= 0, 052
s
y
=

0, 052 = 1, 15
s
xy
=
(x
i
x)(y
i
y)n
i
n
=
n
i
x
i
y
i
n
(x y) =
1708
10
(59, 30 2, 87) = 0, 61
La recta de regresin x = b y +a
_
b =
s
xy
s
2
y
=
0,61
0,052
= 11, 69
a = x b y = 59, 30 11, 69 2, 87 = 25, 75
x = 11, 69 y +25, 75
Para una y = 3 x = 11, 69 2, 87 +25, 75 = 60, 82
Problema 2.19. Se lleva a cabo un estudio, por medio de detectores radioactivos, de la capacidad corporal para absorber hierro.
Participan en el estudio 10 sujetos. A cada uno se le da una dosis oral idntica de hierro. Transcurridos 6 y 12 das se mide la cantidad
de hierro retenida en el sistema corporal y, a partir de sta, se determina el porcentaje absorbido por el cuerpo. Se obtuvieron los
siguientes datos:
6d as (X) 8 17 18 25 58 59 41 30 43 58
12d as(Y) 17 22 35 43 80 85 91 92 96 100
(a) Obtener el coeciente de correlacin lineal.
(b) Qu% de hierro se estima que absorbe un individuo a los 12 das si la absorcin a los 6 das fue del 50%?
Manuel Angel Barea Gmez 50
CAPTULO 2. VARIABLES BIDIMENSIONALES
X Y n
i
x
i
n
i
x
2
i
n
i
y
i
n
i
y
2
i
n
i
x
i
y
i
n
i
8 17 1 8 64 17 289 136
17 22 1 17 289 22 484 374
18 35 1 18 324 35 1225 630
25 43 1 25 625 43 1849 1075
58 80 1 58 3364 80 6400 4640
59 85 1 59 3481 85 7225 5015
41 91 1 41 1681 91 8281 3731
30 92 1 30 900 92 8464 2760
43 96 1 43 1849 96 9216 4128
58 100 1 58 3364 100 10000 5800
10 357 15941 661 53433 28289
x =
(x
i
n
i
)
n
=
357
10
= 35, 7
s
2
x
=
(x
i
x)n
i
n
=
n
i
x
2
i
n
x
2
=
15941
10
35, 7
2
= 319, 61
s
x
=

319, 61 = 17, 87
y =
(y
i
n
i
)
n
=
661
10
= 66, 1
s
2
y
=
(y
i
y)n
i
n
=
n
i
y
2
i
n
y
2
=
53433
10
66, 1
2
= 974, 09
s
y
=

974, 09 = 31, 21
s
xy
=
(x
i
x)(y
i
y)n
i
n
=
n
i
x
i
y
i
n
(x y) =
28289
10
(35, 7 6, 61) = 469, 13
r =
s
xy
s
x
s
y
=
469,13
35,76,61
= 0, 8408
La recta de regresin y = b x +a
_
b =
s
xy
s
2
x
=
469,13
319,61
= 1, 47
a = y b x = 66, 1 1, 47 35, 7 = 13, 7
y = 1, 47 x +13, 7.
Para una x = 50 y = 1, 47 50 +13, 7 = 87, 21
Problema 2.20. Se est investigando la relacin entre la hipertensin intraocular y el sexo de los individuos. Entre los hombres
sometidos al estudio encontramos 35 normales, 34 sospechosos y 32 con hipertensin intraocular. Entre las mujeres se encontraron
60 normales, 16 sospechosas y 27 con hipertensin intraocular. Calcular el coeciente de contingencia asociado.
Normales Sospechosos Hipetensin Total
Hombre
95101
204
= 47, 03
35
50101
204
= 24, 75
34
59101
204
= 29, 21
32
101
Mujer
95103
204
= 47, 96
60
50103
204
= 25, 24
16
59103
204
= 29, 78
27
103
Total 95 50 59 204
C =
_

2

2
+n

2
=
(OE)
2
E
=
(3547,03)
2
47,03
+
(3424,75)
2
24,75
+
(3229,21)
2
29,21
+
(6047,96)
2
47,96
+
(1625,24)
2
25,24
+
(2729,78)
2
29,78
= 13, 46
Manuel Angel Barea Gmez 51
CAPTULO 2. VARIABLES BIDIMENSIONALES
C =
_

2

2
+n
=
_
13,46
13,46+204
= 0, 248
Problema 2.21. Se est investigando la relacin que hay entre dos escalas para medir la presencia de Burnout (Sndrome de estar
quemado en espaol). Para ello, a 10 individuos se les pasan ambos test obteniendo los siguientes resultados:
test 1 154 170 165 160 163 159 168 167 162 158
test 2 67 80 73 70 78 71 82 74 77 68
(a) Estudiar dicha relacin con el coeciente de correlacin por rangos de Spearman.
X Y x
i
y
i
D D
2
154 67 1 1 0 0
170 80 10 9 1 1
165 73 7 5 2 4
160 70 4 3 1 1
163 78 6 8 -2 4
159 71 3 4 -1 1
168 82 9 10 -1 1
167 74 7 6 1 1
162 77 5 7 -2 4
158 68 2 2 0 0
17
= 1
6D
2
N(N
2
1)
= 1
617
10(10
2
1)
= 0, 896
Problema 2.22. Se desea saber el grado de asociacin entre el valor del test de Apgar realizado a los recin nacidos al minuto de
vida y la utilizacin de anestesia epidural. Para ello se recogieron los siguientes datos:
epidural
test
7 8 9
Si 5 374 275
No 1 43 33
(a) Estudiar dicha asociacin a travs del coeciente de contingencia.
epidural
test
7 8 9 Total
Si
5,36
5
373,07
374
275,55
275
654
No
0,63
1
43,92
43
32,44
33
77
Total 6 417 308 731
C =
_

2

2
+n

2
=
(OE)
2
E
=
(55,36)
2
5,36
+
(374373,07)
2
373,07
+
(27529,21)
2
29,21
+
(10,63)
2
0,63
+
(4343,92)
2
43,92
+
(3332,44)
2
32,44
= 0, 272
C =
_

2

2
+n
=
_
0,272
0,272+731
= 0, 01928
Manuel Angel Barea Gmez 52
CAPTULO 2. VARIABLES BIDIMENSIONALES
Problema 2.23. Se desea saber la relacin que hay entre la nota de selectividad y el nmero de asignaturas aprobadas el primer
ao de carrera. Para ello, se seleccionan 10 individuos aleatoriamente obteniendo los siguientes resultados:
test 1 154 170 165 160 163 159 168 167 162 158
test 2 67 80 73 70 78 71 82 74 77 68
(a) Estudiar dicha relacin con el coeciente de correlacin por rangos de Spearman.
X Y x
i
y
i
D D
2
9 6 1 1,5 -0,5 0,25
10,5 8 2 8,5 -6,5 42,25
11,2 7 5 5 0 0
12,4 7 9 5 4 16
13,1 7 10 5 5 25
10,7 7 4 5 -1 1
12,2 8 8 8,5 -0,5 0,25
11,5 9 6 10 -4 16
12 7 7 5 2 4
10,6 6 3 1,5 1,5 2,25
107
= 1
6D
2
N(N
2
1)
= 1
6107
10(10
2
1)
= 0, 3515
Manuel Angel Barea Gmez 53
CAPTULO
3
Probabilidad
Problema 3.1. El 60% de los individuos de una poblacin estn vacunados contra una cierta enfermedad. Durante una epidemia
se sabe que el 20% la ha contrado y que 2 de cada 100 individuos estn vacunados y son enfermos.
(a) Calcular el porcentaje de vacunados que enferma y el de vacunados entre los que estn enfermos.
_
_
_
P(V) = 0, 6
P(E) = 0, 2
P(V E) = 0, 02
_
P(
E
/V) =
P(VE)
P(V)
=
0,02
0,6
= 0, 033
P(
V
/E) =
P(VE)
P(E)
=
0,02
0,2
= 0, 1
Problema 3.2. La proporcin de alcohlicos que existe en la poblacin de Mlaga es, aproximadamente, un 10%; no obstante, en
las bajas que dan los mdicos de la Seguridad Social difcilmente se encuentra el diagnstico de alcoholismo. Aparecen sin embargo
diagnosticados de hepatopatas, lumbalgias, etc., que pueden hacer sospechar alcoholismo subyacente. Se realiz un estudio que
puso de maniesto que el 85% de los individuos alcohlicos y el 7% de los no alcohlicos sufran tales patologas. Se desea saber:
(a) Cul es la probabilidad de que un individuo con esas patologas sea realmente alcohlico.
_

_
E Tener patolog a
A Ser alcoh olico P(A) = 0, 1
P(
E
/A) = 0, 85
P(
E
/A) = 0, 07
P(A) = 0, 1
P(
E
/A) = 0, 85
P(
E
/A) = 0, 15
P
_
A
_
= 0, 9
P(
E
/A) = 0, 07
P(
E
/A) = 0, 93
P(
A
/E) =
P(A)P(E/A)
P(A)P(E/A)+P(A)P(E/A)
=
0,10,85
0,10,85+0,90,07
= 0, 5743
54
CAPTULO 3. PROBABILIDAD
Problema 3.3. Dos tratamientos A y B curan una determinada enfermedad en el 20% y 30% de los casos, respectivamente.
Suponiendo que ambos actan de modo independiente, cul de las dos siguientes estrategias utilizara para curar a un individ-
uo con tal enfermedad:
(a) Aplicar ambos tratamientos a la vez.
(b) Aplicar primero el tratamiento B y, si no surte efecto, aplicar el A.
_
A TratamientoA P(A) = 0, 2
B TratamientoB P(b) = 0, 3
Cmo son sucesos independientes
_
P(AB) = P(A) +P(B) = 0, 2 +0, 3 = 0, 5
P(AB) P(A) P(B) = 0, 2 0, 3 = 0, 06
Luego P(AB) = 0, 06
_
_
_
P
_
AB
_
= P(A) P(AB) = 0, 2 0, 06 = 0, 14
P(
A
/B) =
P(AB)
P(B)
=
0,14
0,7
= 0, 2
Problema 3.4. Se eligen al azar 3 deportistas de un equipo de 10 integrantes para realizar un control antidopaje; Se sabe que 2
de los jugadores del equipo han tomado sustancias prohibidas. Cul es la probabilidad de elegir para el anlisis a alguno de los
infractores?
_

_
A Notomar sustancias proh bidas
P(A) =
_
8
3
_
_
10
3
_ =
56
120
= 0, 46
La probabilidad de elegir uno de los infractores es el suceso contrario P
_
A
_
= 1 0, 46 = 0, 54
Problema 3.5. Estamos interesados en saber cul de dos anlisis A y B es mejor para el diagnstico de una determinada enfermedad,
de la cual sabemos que la presentan un 10% de individuos de la poblacin. El porcentaje de resultados falsos positivos del anlisis
A es del 15% y el de B es del 22%. El porcentaje de falsos negativos de A es del 7% y de B es del 3 . Cul es la probabilidad de
acertar en el diagnstico con cada mtodo?
Para el tratamiento A
P(E) = 0, 1
P(
T
+
/E) = 0, 93
P(
T

/E) = 0, 07
P
_
E
_
= 0, 9
P(
T
+
/E) = 0, 15
P(
T

/E) = 0, 85
Manuel Angel Barea Gmez 55
CAPTULO 3. PROBABILIDAD
P(
T
+
/E) P(E) +P(
T

/E) P
_
E
_
= 0, 93 0, 1 +0, 9 0, 85 = 0, 858
Para el tratamiento B
P(E) = 0, 1
P(
T
+
/E) = 0, 97
P(
T

/E) = 0, 03
P
_
E
_
= 0, 9
P(
T
+
/E) = 0, 22
P(
T

/E) = 0, 78
P(
T
+
/E) P(E) +P(
T

/E) P
_
E
_
= 0, 97 0, 1 +0, 9 0, 78 = 0, 799
Problema 3.6. Con objeto de diagnosticar la colelitiasis se usan los ultrasonidos. Tal tcnica tiene una sensibilidad del 91% y una
especicidad del 98%. En la poblacin que nos ocupa la probabilidad de colelitiasis es del 20%.
(a) Si a un individuo de tal poblacin se le aplican los ultrasonidos y dan positivos, cul es la probabilidad de que sufra la
colelitiasis?
(b) Si el resultado fuese negativo, cul es la probabilidad de que no tenga la enfermedad?
Lema.
Sensibilidad, es la probabilidad de el test de positivo sobre una persona que sabemos que padece la enfermedad P(
T
+
/E).
Especicidad, es la probabilidad que el test de negativo sobre una persona que no la padece, P(
T

/E)
P(E) = 0, 2
P(
T
+
/E) = 0, 91
P(
T

/E) = 0, 09
P
_
E
_
= 0, 8
P(
T
+
/E) = 0, 02
P(
T

/E) = 0, 98
P(
E
/T
+
) =
P(E)P(
T
+
/E)
P(E)P(
T
+
/E)+P(E)P(
T
+
/E)
=
0,20,91
0,20,91+0,80,02
= 0, 9191
P(
E
/T

) =
P(E)P(
T

/E)
P(E)P(
T

/E)+P(E)P(
T

/E)
=
0,80,98
0,20,09+0,80,98
= 0, 9775
Problema 3.7. Entre los estudiantes de una Facultad de Filosofa y Letras se dan las siguientes proporciones: el 40% son hombres.
El 70% de los varones fuman, mientras que entre las mujeres slo fuman el 20%. Escogido un estudiante al azar, calclese la
probabilidad de que fume.
_

_
H Hombre P(H) = 0, 4
F Fumador
P(
F
/H) = 0, 7
P(
F
/H) = 0, 2
Manuel Angel Barea Gmez 56
CAPTULO 3. PROBABILIDAD
P(H) = 0, 4
P(
F
/H) = 0, 7
P(
F
/H) = 0, 3
P
_
H
_
= 0, 6
P(
F
/H) = 0, 2
P(
F
/H) = 0, 8
P(F) = P(H) P(
F
/H) +P
_
H
_
P(
F
/H) = 0, 4 0, 7 +0, 6 0, 2 = 0, 4
Problema 3.8. Los estudios epidemiolgicos indican que el 20% de los ancianos sufren un deterioro neuropsicolgico. Sabemos
que la tomografa axial computerizada (TAC) es capaz de detectar este trastorno en el 80% de los que lo sufren, pero que tambin
da un 3% de falsos positivos entre personas sanas. Si tomamos un anciano al azar y da positivo en el TAC, cul es la probabilidad
de que est realmente enfermo?
P(E) = 0, 2
P(
T
+
/E) = 0, 8
P(
T

/E) = 0, 2
P
_
E
_
= 0, 8
P(
T
+
/E) = 0, 03
P(
T

/E) = 0, 97
P(
E
/T
+
) =
P(E)P(
T
+
/E)
P(E)P(
T
+
/E)+P(E)P(
T
+
/E)
=
0,20,8
0,20,8+0,80,03
= 0, 8695
Problema 3.9. Sabemos que tiene estudios superiores el 15% de la poblacin espaola, estudios medios el 40%, estudios primarios
el 35% y no tiene estudios el 10%. Los desempleados no se distribuyen proporcionalmente entre esas categoras, dado que de entre
los de estudios superiores estn sin trabajo el 10%, entre los de estudios medios el 35%, entre los de estudios primarios el 18%, y
entre los que no tienen estudios el 37%. Obtenga las probabilidades de que extrado uno al azar, ste sea:
(a) Titulado superior, sabiendo que est parado.
(b) Un sujeto sin estudios que est en paro.
(c) Un sujeto con estudios primarios o que est trabajando.
_

_
S TituladoSuperior P(S) = 0, 15 P(
D
/S) = 0, 10
M EstudiosMedios P(M) = 0, 40 P(
D
/M) = 0, 35
P EstudiosPrimarios P(P) = 0, 35 P(
D
/P) = 0, 18
N SinEstudios P(N) = 0, 10 P(
D
/N) = 0, 37
Manuel Angel Barea Gmez 57
CAPTULO 3. PROBABILIDAD
P(S) = 0, 15
P(
D
/S) = 0, 10
P(
D
/S) = 0, 90
P(M) = 0, 40
P(
D
/M) = 0, 35
P(
D
/M) = 0, 65
P(P) = 0, 35
P(
D
/P) = 0, 18
P(
D
/P) = 0, 82
P(N) = 0, 10
P(
D
/N) = 0, 37
P(
D
/N) = 0, 63
P(
S
/D) =
P(S)P(D/S)
P(S)P(D/S)+P(M)P(D/M)+P(P)P(D/P)+P(N)P(D/N)
=
0,150,10
0,150,10+0,40,35+0,350,18+0,10,37
= 0, 06
P(
N
/D) =
P(N)P(D/S)
P(S)P(D/S)+P(M)P(D/M)+P(P)P(D/P)+P(N)P(D/N)
=
0,100,37
0,150,10+0,40,35+0,350,18+0,10,37
= 0, 145
Para poder resolver el tercer apartado debemos desarrollar unos clculos previos:
P
_
D
_
=P(S) P(
D
/S)+P(M) P(
D
/M)+P(P) P(
D
/P)+P(N) P(
D
/N) =0, 15 0, 9+0, 40 0, 65+0, 35 0, 82+0, 10 0, 63=0, 745
P
_
PD
_
= P(
D
/P) P(P) = 0, 82 0, 35 = 0, 287
P(P

D) = P(P) +P
_
D
_
P
_
PD
_
= 0, 35 +0, 745 0, 287 = 0, 808
Problema 3.10. Una enfermedad puede estar producida por tres virus A, B, y C. En el laboratorio hay 3 tubos de ensayo con el
virus A, 2 tubos con el virus B y 5 tubos con el virus C. La probabilidad de que el virus A produzca la enfermedad es de
1
/3, que la
produzca B es de
2
/3 y que la produzca el virus C es de
1
/7. Se inocula un virus a un animal y contrae la enfermedad. Cul es la
probabilidad de que el virus que se inocule sea el C?
_
_
_
A VirusA P(A) = 0, 3 P(
V
/A) =
1
/3
B VirusB P(B) = 0, 2 P(
V
/B) =
2
/3
C VirusC P(C) = 0, 5 P(
V
/C) =
1
/7
P(A) = 0, 3
P(
V
/A) =
1
/3
P(
V
/A) =
2
/3
P(B) = 0, 2
P(
V
/B) =
2
/3
P(
V
/B) =
1
/3
P(C) = 0, 5
P(
V
/C) =
1
/7
P(
V
/C) =
6
/7
Manuel Angel Barea Gmez 58
CAPTULO 3. PROBABILIDAD
P(
C
/V) =
P(C)P(V/C)
P(A)P(V/A)+P(B)P(V/B)+P(C)P(V/C)
=
0,51/7
0,31/3+0,22/3+0,51/7
= 0, 231
Problema 3.11. El 70% de los estudiantes aprueba una asignatura A y un 60% aprueba otra asignatura B. Sabemos, adems, que
un 35% del total aprueba ambas. Elegido un estudiante al azar, calcular las probabilidades de las siguientes situaciones:
(a) Haya aprobado la asignatura B, sabiendo que ha aprobado la A.
(b) Haya aprobado la asignatura B, sabiendo que no ha aprobado la A.
(c) No haya aprobado la asignatura B, sabiendo que ha aprobado la A.
(d) No haya aprobado la asignatura B, sabiendo que no ha aprobado la A.
P(
B
/A) =
P(AB)
P(A)
=
0,35
0,7
= 0, 5
Para el segundo apartado debemos calcular previamente
P
_
AB
_
= P(BA) = P(B) P(AB) = 0, 6 0, 35 = 0, 25
P(
B
/A) =
P(AB)
P(A)
=
0,25
0,3
= 0, 833
Para el tercer apartado debemos calcular previamente
P
_
BA
_
= P(AB) = P(A) P(AB) = 0, 7 0, 35 = 0, 35
P(
B
/A) =
P(BA)
P(A)
=
0,35
0,7
= 0, 5
Para el cuarto apartado debemos calcular previamente
_
P
_
BA
_
= P
_
AB
_
= 1 0, 95 = 0, 05
P(AB) = P(A) +P(B) P(AB) = 0, 7 +0, 6 0, 35 = 0, 95
P(
B
/A) =
P(BA)
P(A)
=
0,05
0,3
= 0, 167
Problema 3.12. La cuarta parte de los conductores de coche son mujeres. La probabilidad de que una mujer sufra un accidente en
un ao es de
5
/10000, y para los hombres es de
1
/10000. Calclese la probabilidad de que si acaece un accidente, el accidentado sea
hombre.
P(H) = 0, 75
P(
A
/H) = 0, 0001
P(
A
/H) = 0, 9999
P
_
M
_
= 0, 6
P(
A
/M) = 0, 0005
P(
A
/M) = 0, 9995
P(
H
/A) =
P(H)P(A/H)
P(H)P(A/H)+P(M)P(A/M)
=
0,751/10000
0,751/100001/3+0,255/10000
= 0, 375
Manuel Angel Barea Gmez 59
CAPTULO 3. PROBABILIDAD
Problema 3.13. En un campus universitario existen 3 carreras sanitarias. Se sabe que el 50% cursan estudios de Enfermera, el
30% Medicina y el 20% Veterinaria. Los que nalizaron sus estudios son el 20, 10 y 5% respectivamente. Elegido un estudiante al
azar, hllese la probabilidad de que haya acabado la carrera.
P(E) = 0, 5
P(
F
/E) = 0, 20
P(
F
/E) = 0, 8
P(M) = 0, 3
P(
F
/M) = 0, 10
P(
F
/M) = 0, 90
P(V) = 0, 2
P(
F
/V) = 0, 05
P(
F
/V) = 0, 95
P(F) = P(E) P(
F
/E) +P(M) P(
F
/M) +P(V) P(
F
/V) = 0, 5 0, 2 +0, 3 0, 1+0, 2 0, 05 = 0, 135
Problema 3.14. La probabilidad de que una mujer viva dentro de 30 aos es 0,25 y la probabilidad de que viva su hijo es 0,9.
Calcule la probabilidad de que al cabo de ese tiempo:
(a) Ambos vivan.
(b) Slo viva la madre.
(c) Slo viva el hijo.
(d) Al menos viva uno de los dos.
_
M Mu jer vivir 30a nos P(M) = 0, 25
H Hi jovivir 30a nos P(H) = 0, 9
Cmo ambos sucesos son independientes:
P(MH) = P(M) P(H) = 0, 25 0, 8 = 0, 2
P
_
MH
_
= P(MH) = P(M) P(MH) = 0, 25 0, 2 = 0, 05
P
_
MH
_
= P(HM) = P(H) P(MH) = 0, 9 0, 2 = 0, 7
P(MH) = P(M) +P(H) P(MH) = 0, 25 +0, 9 0, 2 = 0, 95
Problema 3.15. Los quinientos individuos de una muestra se distribuyen en vacunados y no vacunados, y enfermos y no enfermos,
de acuerdo con la tabla:
Enfermos No enfermos Total
Vacunados 42 243 285
No Vacunados 96 119 215
Total 138 362 500
Si se elige un individuo de la muestra al azar
Manuel Angel Barea Gmez 60
CAPTULO 3. PROBABILIDAD
(a) Cul es la probabilidad de que est enfermo o haya sido vacunado?
(b) Si el individuo elegido est enfermo, cul es la probabilidad de que no haya sido vacunado?
_
E En f ermo
V Vacunado
_

_
P(E) =
138
500
P(V) =
285
500
P(E V) =
42
500
P(E V) = P(E) +P(V) P(E V) =
138
500
+
285
500

42
500
= 0, 762
_
P(E) =
138
500
P
_
E V
_
=
96
500
P(
V
/E) =
P(EV)
P(E)
=
96/500
138/500
= 0, 695
Problema 3.16. De un grupo de nios considerados de alto riesgo, el 60% tiene bronquitis, el 70% tiene infeccin de garganta y el
40% tiene ambas dolencias.
Se escoge un nio al azar:
(a) Cul es la probabilidad de que tenga bronquitis o infeccin de garganta?
(b) Cul es la probabilidad de que no tenga bronquitis y no tenga infeccin de garganta?
(c) Si tiene los bronquitis, Cul es la probabilidad de que tenga infeccin de garganta?
(d) Si tiene infeccin de garganta, Cul es la probabilidad de que no tenga bronquitis?
_
_
_
I In f ecci ongarganta P(I) = 0, 7
B Bronquitis P(B) = 0, 6
P(I B) = 0, 4
P(BI) = P(B) +P(I) P(BI) = 0, 6 +0, 7 0, 4 = 0, 9
P
_
BI
_
= P
_
BI
_
= 1 0, 9 = 0, 1
P(
I
/B) =
P(BI)
P(B)
=
0,4
0,6
= 0, 66
_
P
_
BI
_
= P(I B) = P(I) P(BI) = 0, 7 0, 4 = 0, 3
P(
B
/I) =
P(BI)
P(I)
=
0,4
0,7
= 0, 57
Problema 3.17. Los resultados de un estudio realizado en mil mujeres se recogen en la tabla siguiente:
Clasicacin OMS
Menopausia
Total
Si No
Normal 189 280 469
Osteopenia 108 359 467
Osteoporosis 6 58 64
Total 303 697 1000
Se elige una mujer al azar. Calcule la probabilidad de que:
Manuel Angel Barea Gmez 61
CAPTULO 3. PROBABILIDAD
(a) Tenga osteopenia o tenga osteoporosis.
(b) Tenga osteoporosis o menopausia.
(c) Pueda clasicarse como normal.
(d) Siendo menopusica, tenga osteoporosis.
(e) Son independientes los sucesos tener menopausia y tener osteoporosis?
_

_
N Normal
M Menop ausica
Os Osteoporosis
O Osteopenia
_

_
P(O) =
467
1000
P(Os) =
64
1000
P(OOs) Sucesoincompatible
P(OOs) = P(O) +P(Os) =
467
1000
+
64
1000
= 0, 531
_

_
P(Os) =
64
1000
P(M) =
303
1000
P(MOs) =
6
1000
P(MOs) = P(M) +P(Os) P(MOs) =
303
1000
+
64
1000

6
1000
= 0, 361
P(N) =
469
1000
= 0, 469
_

_
P(M) =
303
1000
P(MOs) =
6
1000
P(
Os
/M) =
P(MOs)
P(M)
=
6/1000
303/1000
= 0, 0198
No son independientes porque P(MOs) = P(M) P(Os)
Problema 3.18. En un estudio sobre alcohlicos se informa de que el 40% de los mismos tiene padre alcohlico y el 6%, madre
alcohlica. El 42% tiene al menos uno de los padres alcohlicos. Cul es la probabilidad de que elegido uno al azar:
(a) Tenga el padre y la madre alcohlicos.
(b) Tenga madre alcohlica si lo es el padre.
(c) Tenga la madre alcohlica pero no el padre alcohlico.
(d) Tenga la madre alcohlica si el padre no es alcohlico.
_
_
_
P Padrealcoh olico P(P) = 0, 4
M Madrealcoh olico P(M) = 0, 06
P(PM) = 0, 42
P(PM) = P(P) +P(M) P(PM) = 0, 4 +0, 06 0, 42 = 0, 04
P(
M
/P) =
P(PM)
P(P)
=
0,04
0,4
= 0, 1
P
_
MP
_
= P(M) P(MP) = 0, 06 0, 04 = 0, 02
Manuel Angel Barea Gmez 62
CAPTULO 3. PROBABILIDAD
P(
M
/P) =
P(PM)
P(P)
=
0,02
0,6
= 0, 033
Problema 3.19. De los sucesos dependientes A y B, se sabe que:
_
_
_
P(AB) = 0, 2
P(
B
/A) = 0, 5
P(
A
/B) = 0, 54
Calcule:
(a) P(A), P(B) y P(AB).
(b) P(AB)y P(AB).
_

_
P(A) =
P(AB)
P(B/A)
=
0,2
0,5
= 0, 4
P(B) =
P(AB)
P(A/B)
=
0,2
0,54
= 0, 37
P(AB) = P(A) +P(B) P(AB) = 0, 4 +0, 37 0, 2 = 0, 57
_
P
_
AB
_
= P(A) P(AB) = 0, 4 0, 2 = 0, 2
P
_
AB
_
= P(A) +P
_
B
_
P
_
AB
_
= 0, 4 +0, 63 0, 2 = 0, 83
Problema 3.20. Un laboratorio farmacutico proyecta fabricar un frmaco, del cual ya existen en el mercado dos marcas A y B. Se
sabe que a la hora de comprar ese frmaco la marca A es elegida por el 30% de los consumidores, la marca B por el 50% y el 10%
compran A y B. Para decidir si compensa el nuevo proyecto el laboratorio necesita conocer, para un comprador elegido al azar, la
probabilidad de que:
(a) Compre al menos una de las dos marcas, A o B.
(b) No compre ni A ni B.
(c) Compre A, supuesto que tambin compra B.
(d) No compre A, supuesto que tampoco compra B.
P(AB) = P(A) +P(B) P(AB) = 0, 3 +0, 5 0, 1 = 0, 7
P
_
AB
_
= P
_
AB
_
= 1 0, 7 = 0, 3P(
A
/B) =
P(AB)
P(B)
=
0,1
0,5
= 0, 2
P
_
A
/B
_
=
P(AB)
P(B)
=
0,3
0,5
= 0, 6
Problema 3.21. El 1% de los individuos de una determinada poblacin padece cierta enfermedad. Una prueba para diagnosticarla
da positiva en el 90% de los que la padecen y en el 5% de los que no la padecen. Se elige al azar un individuo de la poblacin:
(a) Si se le somete a la prueba de diagnstico, calcule la probabilidad de que sta sea positiva.
(b) Supuesto que la prueba ha sido positiva, halle la probabilidad de que el individuo tenga la enfermedad.
Manuel Angel Barea Gmez 63
CAPTULO 3. PROBABILIDAD
P(E) = 0, 01
P(
T
+
/E) = 0, 9
P(
T

/E) = 0, 1
P
_
E
_
= 0, 99
P(
T
+
/E) = 0, 05
P(
T

/E) = 0, 95
P(T
+
) = P(E) P(
T
+
/E) +P
_
E
_
P(
T
+
/E) = 0, 01 0, 9 +0, 99 0, 05 = 0, 1395
P(
E
/T
+
) =
P(E)P(
T
+
/E)
P(E)P(
T
+
/E)+P(E)P(
T
+
/E)
=
0,010,9
0,010,9+0,990,05
= 0, 0796
Problema 3.22. El 20% de los frmacos depositados en el almacn de un laboratorio estn en el lmite de su caducidad. La
probabilidad de que un frmaco de este tipo produzca los efectos deseados es del 40%, y la de que los produzca un frmaco que no
est en dicho lmite es del 80%.
(a) Se toma al azar un frmaco del almacn. Calcule la probabilidad de que produzca los efectos deseados.
(b) Si un frmaco elegido al azar no produce los efectos deseados, cul es la probabilidad de que no se encuentre en el lmite de
su caducidad?
_
L L mitecaducidad
D E f ectosdeseados
P(L) = 0, 2
P(
D
/L) = 0, 4
P(
D
/L) = 0, 6
P
_
L
_
= 0, 8
P(
D
/L) = 0, 8
P(
D
/L) = 0, 2
P(L) = P(L) P(
D
/L) +P
_
L
_
P(
D
/L) = 0, 2 0, 4 +0, 8 0, 8 = 0, 72
P(
L
/D) =
P(L)P(D/L)
P(L)P(D/L)+P(L)P(D/L)
=
0,20,4
0,20,4+0,80,8
= 0, 22
Problema 3.23. Dados dos sucesos aleatorios A y B se sabe que:
_
P
_
B
_
=
3
4
P(A) = P(
A
/B) =
1
3
(a) Razonar si los sucesos A y B son independientes.
(b) Razonar si los sucesos A y B son incompatibles.
(c) Calcular la P(AB)
(d) Calcular las siguientes probabilidades:P(AB), P(AB) y P(AB).
Manuel Angel Barea Gmez 64
CAPTULO 3. PROBABILIDAD
Para saber si son independientes debe cumplirse P(AB) = P(A) P(B)
_
_
_
P(B) = 1 P
_
B
_
= 1
3
4
=
1
4
P(AB) = P(
A
/B) P(B) =
1
3

1
4
=
1
12
P(AB) = P(A) P(B) =
1
3

1
4
=
1
12
Por tanto son independientes
Para saber si son incompatibles debe cumplirse P(AB) = 0, luego no son incompatibles.
P(AB) = P(A) +P(B) P(AB) =
1
3
+
1
4

1
3
=
1
2
P(AB) = P(AB) = P(A) P(AB) =
1
3

1
12
=
1
4
P(AB) = P(BA) = P(B) P(AB) =
1
4

1
12
=
1
6
P(AB) = P
_
AB
_
= 1
1
2
=
1
2
Problema 3.24. En una Universidad de determinada poblacin se pueden estudiar dos titulaciones, Medicina y Enfermera. Se ha
realizado una encuesta sobre las preferencias de los estudiantes de segundo de bachillerato de la ciudad, que ha dado los siguientes
resultados: al 30% les gustara estudiar nicamente Medicina; al 10% nicamente Enfermera y al 20% ninguna de las dos. Elegido
al azar un estudiante de esta ciudad, determinar razonadamente:
(a) La probabilidad de que le guste estudiar ambas carreras.
(b) La probabilidad de que, sabiendo que siente preferencia por Medicina, tambin le guste Enfermera.
(c) La probabilidad de que, sabiendo que no le gusta Medicina, si le guste Enfermera.
_
E En f ermer a
M Medicina
Por el diagrama se llega a la conclusin
P(ME) = 1
_
P(M) +P(E) +P
_
ME
_
= 1 (0, 3 +0, 1 +0, 2) = 0, 4
P(
E
/M) =
P(ME)
P(M)
=
0,4
0,7
=
4
7
_
_
_
P
_
ME
_
= P(E) (ME) = 0, 5 0, 4 = 0, 1
P(
E
/M) =
P(ME)
P(M)
=
1/10
3/10
=
1
3
Problema 3.25. Se ha realizado un examen mdico a los trabajadores de tres empresas (E
1
,E
2
y E
3
) y han sido declarados no aptos
5 de los 125 trabajadores de E
1
, 18 de los 180 trabajadores de E
2
y 19 de los 95 trabajadores de E
3
.
Manuel Angel Barea Gmez 65
CAPTULO 3. PROBABILIDAD
(a) Si un trabajador elegido al azar ha sido declarado apto para el trabajo, Cul es la probabilidad de que no pertenezca a E
1
?
(b) Cul es la probabilidad de que un trabajador elegido al azar pertenezca a E
2
y halla sido declarado apto para el trabajo?
_
_
_
P(E
1
) =
125
400
= 0, 3125 P
_
A
/E
1
_
=
5
125
= 0, 04
P(E
2
) =
180
400
= 0, 45 P
_
A
/E
2
_
=
18
180
= 0, 14
P(E
3
) =
95
400
= 0, 2375 P
_
A
/E
3
_
=
19
95
= 0, 2
P(E
1
) = 0, 3125
P(
A
/E
1
) = 0, 96
P(
A
/E
1
) = 0, 04
P(E
2
) = 0, 45
P(
A
/E
2
) = 0, 86
P(
A
/E
2
) = 0, 14
P(E
3
) = 0, 2375
P(
A
/E
3
) = 0, 80
P(
A
/E
3
) = 0, 20
Para resolver el primer apartado hallamos P(
E
1/A)para posteriormente hallar el suceso contrario que es en realidad lo que nos piden.
P(
E
1/A) =
P(E
1
)P(A/E
1
)
P(E
1
)P(A/E
1
)+P(E
2
)P(A/E
2
)+P(E
3
)P(A/E
3
)
=
0,31250,96
0,31250,96+0,450,86+0,23750,8
= 0, 3598
El suceso contrario es 1 0, 3598 = 0, 6401
P(
E
2/A) =
P(E
2
)P(A/E
2
)
P(E
1
)P(A/E
1
)+P(E
2
)P(A/E
2
)+P(E
3
)P(A/E
3
)
=
0,450,86
0,31250,96+0,450,86+0,23750,8
= 0, 405
Problema 3.26. En la revista Journal of Tropical Pediatrics de enero de 2006 se presenta un test serolgico rpido para el diagnstico
de infeccin por Helicobacter Pylori. Se ha probado en 81 nios, a los que se hacen tambin las pruebas microbiolgicas habituales
para saber si estn o no infectados. He aqu los resultados:
I
n
f
e
c
c
i

nTest rpido
+ -
+ 24 1
- 3 53
(a) Calcular los siguientes ndices de valoracin de una prueba diagnstica : sensibilidad, especicidad y valor predictivo de
resultados positivos y negativos.
_

_
Sensibilidad =
24
25
Especi f icidad =
53
56
VPP =
24
27
VPN =
53
54
Problema 3.27. La prevalencia del carcinoma de pulmn y bronquios en fumadores de ms de 50 aos es de un 5%. Una de las
pruebas diagnsticas preliminares para la deteccin de esta enfermedad es la citologa de esputo, que tiene una probabilidad 0,03
de falso positivo y una probabilidad 0,16 de falso negativo. Cul es la probabilidad de que una persona fumadora con ms de 50
aos que ha dado positivo en el test, presente algn carcinoma de este tipo?
Manuel Angel Barea Gmez 66
CAPTULO 3. PROBABILIDAD
P(E) = 0, 05
P(
T
+
/E) = 0, 84
P(
T

/E) = 0, 16
P
_
E
_
= 0, 95
P(
T
+
/E) = 0, 03
P(
T

/E) = 0, 97
P(
E
/T
+
) =
P(E)P(
T
+
/E)
P(E)P(
T
+
/E)+P(E)P(
T
+
/E)
=
0,050,84
0,050,849+0,950,03
= 0, 5957
Problema 3.28. Un mtodo simple y econmico para el diagnstico de la infeccin urinaria es la tincin directa de la orina con
azul de metileno que permite distinguir bacterias de leucocitos. Hemos utilizado esta prueba con 1125 pacientes dando positivo en
100 de ellos. Sabiendo que este mtodo tiene una sensibilidad del 64% y una especicidad del 98% calcular:
(a) El nmero de pacientes que padecen bacteriuria.
(b) De los 100 pacientes que han dado positivo en la prueba, cuntos no padecen bacteriuria?
P(E)
P(
T
+
/E) = 0, 64
P(
T

/E) = 0, 36
P
_
E
_
P(
T
+
/E) = 0, 02
P(
T

/E) = 0, 98
P(T
+
) = P(E) P(
T
+
/E) +P
_
E
_
P(
T
+
/E) = P(E) 0, 64 +[1 P(E)] 0, 02 =
100
1125
P(E) (0, 64 0, 02) = 0, 088 0, 02 P(E) =
0,068
0,62
= 0, 11
n = 1125 0, 11 = 125
Nuestro rbol completo ser ahora
P(E) = 0, 11
P(
T
+
/E) = 0, 64
P(
T

/E) = 0, 36
P
_
E
_
= 0, 89
P(
T
+
/E) = 0, 02
P(
T

/E) = 0, 98
P(
E
/T
+
) =
P(E)P(
T
+
/E)
P(E)P(
T
+
/E)+P(E)P(
T
+
/E)
=
0,890,02
0,110,64+0,890,02
= 0, 20
n = 100 0, 20 = 20
Manuel Angel Barea Gmez 67
CAPTULO 3. PROBABILIDAD
Problema 3.29. Para el tratamiento de una determinada enfermedad existen tres frmacos (F
1
, F
2
, F
3
), y sabemos que el porcentaje
de enfermos que utilizan F
1
es el mismo porcentaje que utilizan F
2
, y este ltimo porcentaje es el doble del que utilizan F
3
. Estudios
previos realizados en diversos laboratorios han detectado que F
1
produce un 3% de reacciones adversas, F
2
un 5% y F
3
un 12%.
(a) Si un paciente ha tenido una reaccin adversa, cul es el frmaco que ha tomado con mayor probabilidad?
(b) Si un paciente no ha tenido una reaccin adversa, cul es la probabilidad de que no haya tomado F
1
?
_
_
_
F
1
= F
2
F
2
= 2 F
3
1 = F
1
+F
2
+F
3
Resolviendo
_
_
_
F
1
=
2
5
F
2
=
2
5
F
3
=
1
5
P(F
1
) = 0, 4
P(
A
/F
1
) = 0, 03
P(
A
/E
1
) = 0, 97
P(F
2
) = 0, 4
P(
A
/F
2
) = 0, 05
P(
A
/E
2
) = 0, 97
P(F
3
) = 0, 2
P(
A
/F
3
) = 0, 12
P(
A
/F
3
) = 0, 82
P(
F
1/A) =
P(F
1
)P(A/F
1
)
P(F
1
)P(A/F
1
)+P(F
2
)P(A/F
2
)+P(F
3
)P(A/F
3
)
=
0,40,03
0,40,03+0,40,05+0,20,12
= 0, 214
P(
F
2/A) =
P(F
2
)P(A/F
2
)
P(F
1
)P(A/F
1
)+P(F
2
)P(A/F
2
)+P(F
3
)P(A/F
3
)
=
0,40,05
0,40,03+0,40,05+0,20,12
= 0, 357
P(
F
3/A) =
P(F
3
)P(A/F
3
)
P(F
1
)P(A/F
1
)+P(F
2
)P(A/F
2
)+P(F
3
)P(A/F
3
)
=
0,20,12
0,40,03+0,40,05+0,20,12
= 0, 428
P(
F
1/A) =
P(F
1
)P(
A/F
1
)
P(F
1
)P(
A/F
1
)+P(F
2
)P(
A/F
2
)+P(F
3
)P(
A/F
3
)
=
0,40,97
0,40,97+0,40,95+0,20,88
= 0, 411
Sin embargo nos solicitan los que no han tomado F
1
luego es el suceso inverso con valor 1 0, 411 = 0, 588
Problema 3.30. Una determinada enfermedad es siempre tratada con uno de estos dos frmacos (F
1
y F
2
). Uno de los efectos
secundarios caractersticos de estos medicamentos es el insomnio, que se produce en el 20% de los pacientes tratados con F
1
y en
el 8% de los tratados con F
2
. Se sabe, por otra parte, que entre los pacientes que maniestan padecer insomnio, el consumo de F
1
triplica al de F
2
. A partir de estos datos:
(a) Calcular el porcentaje de pacientes tratados con F
1
y el porcentaje de pacientes tratados con F
2
.
(b) Que porcentaje de pacientes padece insomnio en general?
Manuel Angel Barea Gmez 68
CAPTULO 3. PROBABILIDAD
P(F
1
)
P(
I
/F
1
) = 0, 2
P(
I
/E
1
) = 0, 8
P(F
2
)
P(
I
/F
2
) = 0, 08
P(
I
/E
2
) = 0, 92
_
P(
I
/F
1
) =
P(IF
1
)
P(F
1
)
P(
I
/F
2
) =
P(IF
2
)
P(F
2
)
_
P(
F
1/I) =
P(IF
1
)
P(I)
P(
F
2/I) =
P(IF
2
)
P(I)
P(I/F
1
)P(F
1
)
P(I)
= 3
P(I/F
2
)P(F
2
)
P(I)
P(
I
/F
1
) P(F
1
) = 3 P(
I
/F
2
) P(F
2
)
P(
I
/F
1
) P(F
1
) = 3 P(
I
/F
2
) [1 P(F
1
)] 0, 2 P(F
1
) = 3 0, 08 [1 P(F
1
)]
0, 44 P(F
1
) = 0, 24
_
P(F
1
) = 0, 5455
P(F
2
) = 0, 4545
P(F
1
) = 0, 5455
P(
I
/F
1
) = 0, 2
P(
I
/E
1
) = 0, 8
P(F
2
) = 0, 4545
P(
I
/F
2
) = 0, 08
P(
I
/E
2
) = 0, 92
P(I) = P(F
1
) P(
I
/F
1
) +P(F
2
) P(
I
/F
2
) = 0, 5455 0, 2 +0, 4555 0, 08 = 0, 1454
Problema 3.31. La ecografa abdominal es la prueba diagnstica que suele utilizarse durante la infancia para la deteccin de
apendicitis aguda. Se sabe que entre los pacientes sospechosos de padecer esta patologa, dicha prueba genera un 4% de falsos
positivos y un 8% de falsos negativos. Para el diagnstico de apendicitis aguda, el servicio de pediatra de un determinado hospital
realiz a lo largo del ltimo ao ecografa abdominal a un total de 400 pacientes, resultando la prueba positiva en el 37% de los
casos.
(a) De entre los 400 pacientes examinados cuntos no padecan apendicitis aguda?
(b) Entre los pacientes que dieron positivo en esta prueba, cuntos de ellos realmente padecan apendicitis aguda?
P(E)
P(
T
+
/E) = 0, 92
P(
T

/E) = 0, 08
P
_
E
_
P(
T
+
/E) = 0, 04
P(
T

/E) = 0, 96
Manuel Angel Barea Gmez 69
CAPTULO 3. PROBABILIDAD
P(T
+
) = P(E) P(
T
+
/E) +P
_
E
_
P(
T
+
/E) =
_
1 P
_
E
_
0, 92 +P
_
E
_
0, 04 = 0, 37
P(E) (0, 04 0, 92) = 0, 37 0, 92 P(E) =
0,55
0,88
= 0, 625
P
_
E
_
= 0, 625 n = 400 0, 625 = 250
P(E) = 0, 375
P(
T
+
/E) = 0, 92
P(
T

/E) = 0, 08
P
_
E
_
= 0, 625
P(
T
+
/E) = 0, 04
P(
T

/E) = 0, 96
P(
E
/T
+
) =
P(E)P(
T
+
/E)
P(E)P(
T
+
/E)+P(E)P(
T
+
/E)
=
0,3750,92
0,3750,92+0,6250,04
= 0, 932
n = 150 0, 932 139
Problema 3.32. Tenemos cinco frascos con pldoras sedantes. Las de un frasco A son gravemente txicas. Las de los cuatro restantes
son ligeramente txicas. Antes de dormir tomamos una pastilla, eligiendo aleatoriamente el frasco, pues creemos que las pldoras de
los cinco frascos son del mismo tipo. Al cabo de un rato sentimos gran malestar y caemos en la cuenta de que el frasco A contiene
pldoras gravemente txicas. Segn un manual de Medicina que consultamos, las pldoras de A causan el malestar que sentimos
en un 90% de los casos, mientras que las pldoras de los otros cuatro slo lo causan en un 15%. Con qu probabilidad podemos
armar que la pldora tomada perteneca al frasco A? Y de que perteneca a uno de los otros cuatro?.
P(A) = 0, 2
P(
M
/A) = 0, 9
P(
M
/A) = 0, 1
P
_
A
_
= 0, 8
P(
M
/A) = 0, 15
P(
M
/A) = 0, 85
P(
A
/M) =
P(A)P(M/A)
P(A)P(M/A)+P(A)P(M/A)
=
0,20,9
0,20,9+0,80,15
= 0, 6
Para la segunda cuestin se trata del suceso contrario anterior, por tanto, 0, 4
Problema 3.33. En una cierta poblacin, se sabe que el ao pasado acudi al menos una vez al mdico de cabecera el 80%. Adems,
el 40% de los que acudieron lo hizo porque estaban resfriados, mientras que el 30% de los que no acudieron se curaron el resfriado
en casa.
(a) Calcular la probabilidad de que un individuo se resfriara.
(b) Calcular la probabilidad de que un individuo que se resfri, acudiera al mdico por lo menos una vez.
(c) Calcular la probabilidad de que un individuo que no se resfri no acudiera al mdico por lo menos una vez.
Manuel Angel Barea Gmez 70
CAPTULO 3. PROBABILIDAD
P(M) = 0, 8
P(
R
/M) = 0, 4
P(
R
/M) = 0, 6
P
_
M
_
= 0, 2
P(
R
/M) = 0, 3
P(
R
/M) = 0, 7
P(R) = P(M) P(
R
/M) +P
_
M
_
P(
R
/M) = 0, 8 0, 4 +0, 2 0, 3 = 0, 38
P(
M
/R) =
P(M)P(R/M)
P(R)
=
0,80,4
0,38
= 0, 84
P(
M
/R) =
P(M)P(
R/M)
P(R)
=
0,70,2
0,62
= 0, 225
Problema 3.34. El porcentaje de personas de una poblacin que maniestan un sntoma clsico de una cierta enfermedad es del
20%, y el porcentaje de enfermos es del 23%. Se sabe que el 70% de las personas que tienen el sntoma, no estn enfermas.
(a) Un individuo elegido al azar no tiene el sntoma, cul es la probabilidad de que tenga la enfermedad?
(b) Un individuo elegido al azar no est enfermo, qu es ms probable, que tenga el sntoma o que no lo tenga?
P(S) = 0, 2
P(
E
/S) = 0, 3
P(
E
/S) = 0, 7
P
_
S
_
= 0, 8
P(
E
/S)
P(
E
/S)
P(E) = P(S) P(
E
/S) +P
_
S
_
P(
E
/S)
P(
E
/S) =
P(E)P(S)P(E/S)
P(S)
=
0,23(0,20,3)
0,8
= 0, 2125
P(S) = 0, 2
P(
E
/S) = 0, 3
P(
E
/S) = 0, 7
P
_
S
_
= 0, 8
P(
E
/S) = 0, 2125
P(
E
/S) = 0, 7875
P(
E
/S) = 1 0, 2125 = 0, 7875
P(
S
/E) =
P(S)P(
E/S)
P(S)P(
E/S)+P(S)P(
E/S)
=
0,207
0,207+0,807875
= 0, 1818
Manuel Angel Barea Gmez 71
CAPTULO 3. PROBABILIDAD
Problema 3.35. La prueba de cribado del segundo trimestre de embarazo, tambin conocida como triple screening, se realiza
habitualmente entre las semanas 15 y 20 de la gestacin y trata de evaluar el riesgo de diversas alteraciones fetales. Esta prueba
presenta un 3% de positivos, de los cules slo el 10% se corresponden con bebs que tendrn realmente problemas. Si suponemos
que en la poblacin este grupo de patologas afecta al 1% de los bebs:
(a) Determina la sensibilidad y especicidad de esta prueba.
(b) De todos los resultados negativos de esta prueba, qu porcentaje se conrman posteriormente como bebs sin ningn tipo de
problemas?
P(E T
+
) = P(
E
/T
+
) P(T
+
) = 0, 1 0, 03 = 0, 003
P(
T
+
/E) =
P(ET
+
)
P(E)
=
0,003
0,01
= 0, 3
P(T
+
) = P(E) P(
T
+
/E) +P
_
E
_
P(
T
+
/E) P(
T
+
/E) =
P(T
+
)P(E)P(
T
+
/E)
P(E)
=
0,03(0,010,3)
0,99
= 0, 0272
P(
T

/E) = 1 P(
T
+
/E) = 1 0, 0272 = 0, 9727
P(E) = 0, 01
P(
T
+
/E) = 0, 3
P(
T

/E) = 0, 97
P
_
E
_
= 0, 99
P(
T
+
/E) = 0, 0272
P(
T

/E) = 0, 9727
P(
E
/T

) =
P(E)P(
T

/E)
P(E)P(
T

/E)+P(E)P(
T

/E)
=
0,990,9727
0,010,3+0,990,9727
= 0, 9968
Problema 3.36. Se ha realizado recientemente un ensayo clnico tipo dosis-respuesta para evaluar la ecacia de un determinado
tratamiento farmacolgico. Para ello se han seleccionado aleatoriamente 90 pacientes que se han dividido en 4 grupos (A, B, C y D)
siguiendo el siguiente criterio: el grupo A, formado por 18 pacientes, recibi el tratamiento a dosis de 50
mg
/24h; el grupo B con el
30% de los pacientes recibi el tratamiento a dosis de 75
mg
/24h; el grupo C, formado por 20 pacientes, recibi el tratamiento a dosis
de 150
mg
/24h; el resto de los pacientes form el grupo D, recibiendo el tratamiento a dosis de 200
mg
/24h. La respuesta al tratamiento
fue ecaz para el 35% de los pacientes del grupo A, el 55% de los pacientes del grupo B, el 60% de los pacientes del grupo C y el
75% de los pacientes del grupo D.
(a) Si seleccionarnos aleatoriamente un paciente para el que no ha sido ecaz el tratamiento, cul es la probabilidad de que la
dosis recibida haya sido inferior a 100
mg
/24h?
(b) Si seleccionarnos aleatoriamente un paciente para el que s ha sido ecaz el tratamiento, ordenar de mayor a menor las
probabilidades de que el paciente haya recibido las 4 dosis prescritas.
Manuel Angel Barea Gmez 72
CAPTULO 3. PROBABILIDAD
P(A) = 0, 2
P(
E
/A) = 0, 35
P(
E
/A) = 0, 65
P(B) = 0, 3
P(
E
/B) = 0, 55
P(
E
/B) = 0, 45
P(C) = 0, 22
P(
E
/C) = 0, 60
P(
E
/C) = 0, 40
P(D) = 0, 28
P(
E
/D) = 0, 75
P(
E
/D) = 0, 25
P(
A
/E) =
P(A)P(
E/A)
P(A)P(
E/A)+P(B)P(
E/B)+P(C)P(
E/C)+P(D)P(
E/D)
=
0,20,65
0,20,65+0,30,45+0,220,40+0,280,25
= 0, 3073
P(
B
/E) =
P(B)P(
E/B)
P(A)P(
E/A)+P(B)P(
E/B)+P(C)P(
E/C)+P(D)P(
E/D)
=
0,30,45
0,20,65+0,30,45+0,220,40+0,280,25
= 0, 3193
La probabilidad pedida es la suma de ambas 0, 626
P(
A
/E) =
P(A)P(E/A)
P(A)P(E/A)+P(B)P(E/B)+P(C)P(E/C)+P(D)P(E/D)
=
0,20,35
0,20,35+0,30,55+0,220,60+0,280,75
= 0, 1213
P(
B
/E) =
P(B)P(E/B)
P(A)P(E/A)+P(B)P(E/B)+P(C)P(E/C)+P(D)P(E/D)
=
0,30,55
0,20,35+0,30,55+0,220,60+0,280,75
= 0, 2859
P(
C
/E) =
P(C)P(E/C)
P(A)P(E/A)+P(B)P(E/B)+P(C)P(E/C)+P(D)P(E/D)
=
0,220,60
0,20,35+0,30,55+0,220,60+0,280,75
= 0, 2287
P(
D
/E) =
P(D)P(E/D)
P(A)P(E/A)+P(B)P(E/B)+P(C)P(E/C)+P(D)P(E/D)
=
0,280,75
0,20,35+0,30,55+0,220,60+0,280,75
= 0, 3639
Problema 3.37. Un centro de salud recibe pacientes de tres distritos de una gran ciudad (D
1
; D
2
; D
3
). El nmero de residentes
en D
2
y D
3
es el mismo, en cambio D
1
tiene tantos residentes como D
2
y D
3
juntos. El centro de salud comenz hace 3 meses un
programa de vacunacin voluntaria para prevenir el virus de la gripe y hasta el momento se han vacunado el 30% de los residentes
en D
1
, el 20% de los residentes en D
2
y el 60% de los residentes en D
3
.
(a) Sabiendo que una persona no reside en D
1
, cul es la probabilidad de que est vacunada?
(b) Sabiendo que una persona no se ha vacunado, cul es la probabilidad de que no sea residente en D
2
?
_
D
2
= D
3
D
1
= D
2
+D
3
_
_
_
P(D
1
) = 0, 50
P(D
2
) = 0, 25
P(D
3
) = 0, 25
Manuel Angel Barea Gmez 73
CAPTULO 3. PROBABILIDAD
P(D
1
) = 0, 25
P(
V
/D
1
) = 0, 30
P(
V
/D
1
) = 0, 70
P(D
2
) = 0, 25
P(
V
/D
2
) = 0, 20
P(
V
/D
2
) = 0, 80
P(D
3
) = 0, 50
P(
V
/D
3
) = 0, 60
P(
V
/D
3
) = 0, 40
P(D
2
V) +P(D
3
V) = P(D
2
) P(
V
/D
2
) +P(D
3
) P(
V
/D
3
) = 0, 25 0, 2 +0, 25 0, 6 = 0, 2
P(
D
2/V) =
P(D
2
)P(
V/D
2
)
P(D
1
)P(
V/D
1
)+P(D
2
)P(
V/D
2
)+P(D
3
)P(
V/D
3
)
=
0,250,7
0,50,7+0,250,8+0,250,4
= 0, 28
La probabilidad solicitada es el suceso contrario al anterior por tanto ser 0, 69.
Problema 3.38. El sndrome de Burnout o sndrome de desgaste o de agotamiento personal es un resultante especco del estrs
laboral crnico que se suele producir entre profesionales que mantienen una relacin de ayuda constante y directa con otras personas
(profesionales sanitarios, trabajadores sociales, profesores, etc.). Se ha realizado un estudio de este sndrome entre los mdicos de
una ciudad, encontrando una prevalencia del 33% en los mdicos de Atencin Hospitalaria (AH) y del 44% en los mdicos de
Atencin Primaria (AP). Por otro lado se sabe que, existen 3 veces ms mdicos de AH que de AP entre todos los que presentan este
sndrome. Con estos datos, determina los porcentajes de mdicos de AP y AH de esta ciudad.
_
_
_
AH = AP+3 AP = 4 AP
P(
E
/AH) = 0, 33
P(
E
/AP) = 0, 44
_
P(
E
/AH) =
P(EAH)
P(AH)
P(
E
/AP) =
P(EAP)
P(AP)
_
P(
AH
/E) =
P(EAH)
P(E)
P(
AP
/E) =
P(EAP)
P(E)
P(E/AH)P(AH)
P(E)
= 4
P(E/AH)P(AH)
P(E)
P(
E
/AH) P(AH) = 4 P(
E
/AP) P(AP)
P(
E
/AH) P(AH) = 4 P(
E
/AP) [1 P(AH)] 0, 33 P(AH) = 4 0, 44 [1 P(AH)]
2, 09 P(AH) = 1, 76
_
P(AH) = 0, 84
P(AP) = 0, 16
Problema 3.39. Se denominan algias vertebrales a todos aquellos dolores de origen mecnico, no traumticos, que afectan a
cualquiera de las estructuras del aparato locomotor de la columna vertebral. Se ha podido demostrar que la higiene postural tiene
importantes repercusiones sobre la predisposicin, desencadenamiento y agudizacin de las algias vertebrales. Estudios recientes
han conrmado que no tienen una buena higiene postural el 85% de los pacientes con algia vertebral y el 20% de los pacientes que
no presentan algia vertebral. Sabiendo que la prevalencia de esta dolencia el del 10%:
(a) Cul es la probabilidad de que una persona elegida al azar no tenga una buena higiene postural?
(b) Si observamos que una persona no tiene buena higiene postural, cul es la probabilidad de que presente algias vertebrales?
Manuel Angel Barea Gmez 74
CAPTULO 3. PROBABILIDAD
P(A) = 0, 1
P(
H
/A) = 0, 3
P(
H
/A) = 0, 7
P
_
A
_
= 0, 9
P(
H
/A) = 0, 8
P(
H
/A) = 0, 2
P
_
H
_
= P(A) P(
H
/A) +P
_
A
_
P(
H
/A) = 0, 1 0, 85 +0, 9 0, 2 = 0, 265
P(
A
/H) =
P(A)P(
H/A)
P(H)
=
0,10,85
0,265
= 0, 321
Manuel Angel Barea Gmez 75
CAPTULO
4
Variables aleatorias
Problema 4.1. La variable aleatoria X se dene como el nmero de trasplantes de rin que se realizan en un gran hospital cada
mes. La funcin de probabilidad de X viene dada por la tabla:
x
i
0 1 2 3 4 5
p
i
a a b b 0,3 0,1
(a) Calcular a y b sabiendo que E(X) = 2, 8.
(b) Obtener y representar grcamente la Funcin de distribucin acumulativa.
(c) Calcular la moda, la mediana y la varianza de X.
_
2 a +2 b +0, 3+0, 1 = 1
E (X) = x
i
p
i
2, 8 = a +5 b +4 0, 3+5 0, 1
=
_
2 a +2 b = 0, 6
a +5 b = 1, 1
=
_
a = 0, 1
b = 0, 2
F (x) =
_

_
0 x < 0
0, 1 0 x < 1
0, 2 1 x < 2
0, 4 2 x < 3
0, 6 3 x < 4
0, 9 4 x < 5
1 x 5
76
CAPTULO 4. VARIABLES ALEATORIAS
1 0 1 2 3 4 5 6
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
Funcin de distribucion
x
y
x
i
p
i
P
i
x
i
p
i
(x
i
E(X))
2
p
i
0 0,1 0,1 0 0,78
1 0,1 0,2 0,2 0,32
2 0,2 0,4 0,4 0,13
3 0,2 0,6 0,6 0,01
4 0,3 0,9 1,2 0,43
5 0,1 1 0,5 0,48
2,8 2,16
_
_
_
M
o
= 4
M
e
= 3
V (X)) = 2, 16
Problema 4.2. La variable aleatoria X representa el nmero de casos nuevos de SIDA diagnosticados en un hospital durante un da.
Su funcin de distribucin es:
F (x) =
_

_
0 x < 0
0, 1 0 x < 1
0, 2 1 x < 2
0, 3 2 x < 3
0, 6 3 x < 4
0, 8 4 x < 5
0, 9 5 x < 6
1 x 6
(a) Hallar la probabilidad de que en un da cualquiera sean diagnosticados por lo menos tres casos nuevos.
(b) Hallar la media de casos diagnosticados al da.
(c) HallarP[
X>1
/X<5].
La probabilidad de que diagnostiquen menos de 3 casos es del 0,3 segn la tabla de distribucin, por tanto, para al menos tres casos
nuevos ser P[X 3] = 1 0, 3 = 0, 7.
Manuel Angel Barea Gmez 77
CAPTULO 4. VARIABLES ALEATORIAS
E (X) = x
i
p
i
= 0 0, 1 +1 0, 1 +2 0, 1+3 0, 3+4 0, 2 +5 0, 1+6 0, 1 = 3, 1
P[
X>1
/X<5] =
Problema 4.3. Un centro de salud dispone de 8 aparatos para la medicin de la glucosa en sangre de los cuales 3 estn defectuosos.
(a) Si un enfermero va probando los aparatos hasta que encuentra uno que funciona bien, Cul es el nmero medio de aparatos
que debe probar?
(b) Si otro enfermero selecciona aleatoriamente 4 de los aparatos, cul es la probabilidad de que funcionen bien al menos 3 de
ellos?
El primer apartado se resuelve con una distribucin geomtrica donde E (X) =
1
p
=
1
5/8
=
8
5
= 1, 6
B(4; 0, 625) P[X 3] = P[X = 3] +P[X = 4] =
_
4
3
_
0, 625
3
0, 375
1
+
_
4
3
_
0, 625
4
0, 375
0
= 0, 5
Problema 4.4. La variable aleatoria X mide el nmero de das que necesita un paciente para recibir el alta hospitalaria, despus
de realizarle una colecistectomia (extirpacin quirrgica de la vescula biliar) mediante abordaje lamparoscpico. La funcin de
probabilidad de X (incompleta) se muestra en la siguiente tabla:
x
i
2 3 4 5 6 7
p
i
0,34 0,46 0,06 0,04
Sabiendo que el valor medio de X es de 3,66 das:
(a) Determina y representa grcamente la funcin de distribucin de X.
(b) Sabemos que tras la operacin un paciente lleva ya hospitalizado 3 das, cul es la probabilidad de que reciba el alta antes
del 6 da.
x
i
2 3 4 5 6 7
p
i
a 0,34 0,46 0,06 0,04 b
_
a +0, 34 +0, 46 +0, 01+0, 05+b = 1
E (X) = x
i
p
i
3, 66 = 2 a +3 0, 34 +4 0, 46+5 0, 06 +7 b
=
_
a +b = 0, 1
2 a +7 b = 0, 26
=
_
a = 0, 088
b = 0, 012
La variable
aleatoria X representa el nmero de cesreas de urgencia que se realizan en un centro hospitalario a lo largo de un mes. Su funcin
de distribucin vienen dada por:
1 2 3 4 5 6 7 8
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
Funcin de distribucin
X
Y
Manuel Angel Barea Gmez 78
CAPTULO 4. VARIABLES ALEATORIAS
P[3 < X 6] = P[X 6] P[3 < X] = 0, 988 0, 088 = 0, 9
Problema 4.5. En los seres humanos, se producen mutaciones por la enfermedad de Huntington en aproximadamente 3 de cada
10
6
gametos.
(a) Cul es la probabilidad de que en 2 millones de gametos haya al menos una mutacin?.
(b) Y la probabilidad de que en un milln de gametos haya entre 2 y 5 mutaciones, inclusives?.
Podemos usar una distribucin de Poisson X P(6).
P(X 1) = P(X = 0) +P(X = 1) =
e
6
6
0
0!
+
e
6
6
1
1!
= 0, 9975
Podemos usar una distribucin de Poisson X P(3).
P(2 X 5) = P(X = 2) +P(X = 3) +P(X = 4) +P(X = 5) =
e
3
3
2
2!
+
e
3
3
3
3!
+
e
3
3
4
4!
+
e
3
3
5
5!
= 0, 7169
Problema 4.6. El nmero de visitas que recibe cada da un paciente enfermo que permanece ingresado en planta en un centro
hospitalario, se ajusta a una distribucin de Poisson, cuya media es 4
visitas
/d a los lunes, martes, mircoles y jueves, y de 2
visitas
/d a
los viernes, sbados y domingos.
(a) Si elegimos un da al azar, cul es la probabilidad de que dicho enfermo reciba al menos 3 visitas?
(b) Si suponemos independencia entre un da y otro, cul es la probabilidad de que dicho enfermo reciba durante el n de semana
(sbado y domingo) ms de 3 visitas?
Para los das laborales, X P(4)
P(X 3) = 1 [P(X = 0) +P(X = 1) +P(X = 2)] = 1 (0, 01832 +0, 07326 +0, 14653) = 0, 76189
Para los nes de semana
X P(2) P(X 3) = 1 [P(X = 0) +P(X = 1) +P(X = 2)] = 1 (0, 13534 +027067+0, 27067) = 0, 32339
Como todos los das tienen la misma oportunidad
P(X 3) =
4
7
0, 76189 +
3
7
0, 32339 = 0, 5739
el segundo apartado es una probabilidad condicional, como son independientes, llamamos
_
L laboral
F Findesemana
P(L)
P(X3)
=
0,32339
0,5739
= 0, 5665
Problema 4.7. En cierto centro hospitalario, el nmero de das que permanecen ingresados los pacientes tras una intervencin
quirrgica se ajusta a una distribucin de Poisson de media 2, 5d as . La siguiente tabla recoge el coste de hospitalizacin de los
pacientes en funcin del nmero de das de ingreso:
das 0 1 2 3 4 o ms
C 100 175 235 275 300
(a) Determinar el coste medio de la estancia postquirgica en este hospital.
Manuel Angel Barea Gmez 79
CAPTULO 4. VARIABLES ALEATORIAS
(b) Qu porcentaje de pacientes gastan 300?
Construimos nuestra funcin de distribucin X P(2, 5)
_

_
P(X = 0) = 0, 08208
P(X = 1) = 0, 20521
P(X = 2) = 0, 25651
P(X = 3) = 0, 21376
P(X = 4) = 0, 13360
P(X = 5) = 0, 06680
P(X = 6) = 0, 02783
P(X = 7) = 0, 00994
P(X = 8) = 0, 00310
P(X = 9) = 0, 00862
P(X = 10) = 0, 00022
P(X = 11) = 0, 00005
P(X = 12) = 0, 00001
Para hallar el coste medio Coste = 0 0, 08208 +1 0, 20521+... +11 0, 00005+12 0, 00001 = 235, 91
P(X 4) = 1 [P(X = 0) +P(X = 1) +P(X = 2) +P(X = 3)] = 1 (0, 08208 +0, 20521 +0, 25651+0, 21376) = 0, 2424
Problema 4.8. El Servicio de Vigilancia Epidemiolgica (SVE) registra anualmente los nuevos casos de aquellas enfermedades
que requieren control epidemiolgico, denominadas Enfermedades de Declaracin Obligatoria. Segn datos del SVE, los casos de
Legionelosis en Andaluca se ajustan a una distribucin de Poisson de media 8 casos al mes. A partir de estos datos responder a las
siguientes cuestiones:
(a) Cul es la probabilidad de que durante los prximos 10 meses encontremos que en ms de 2 meses el nmero de casos de
legionelosis sea inferior a 5?
(b) Cul es la probabilidad de que en el cmputo global de los prximos 5 aos encontremos que el nmero de casos de le-
gionelosis es superior a 450 e inferior a 500?
X P(8)
P(X < 5) = P(X = 0) +P(X = 1) +P(X = 2) +P(X = 3) +P(X = 4) = 0, 00268 +0, 01073+0, 02862+0, 05725+0, 09160 =
0, 19088
400 450 500 550
0
.0
0
0
0
.0
0
5
0
.0
1
0
0
.0
1
5
x
y
Aproximamos a una distribucin Normal, con = 5 12 8 = 480
_
= = 480
=

480 = 21, 9
P(450 < X < 500) = P
_
450480
21,9
< Z <
500480
21,9
_
P(1, 37 < Z < 0, 91) = P(Z < 0, 91) P(1, 37 < Z) = 0, 8186 0, 0853 = 0, 7333
Problema 4.9. La variable aleatoria X representa el nmero de cesreas de urgencia que se realizan en un centro hospitalario a lo
largo de un mes. Su funcin de distribucin vienen dada por:
Manuel Angel Barea Gmez 80
CAPTULO 4. VARIABLES ALEATORIAS
F
x
(t) =
_

_
0 t < 0
0, 1 0 t < 1
0, 4 1 t < 2
0, 65 2 t < 3
0, 85 3 t < 4
0, 94 4 t < 5
1 t 5
(a) Determinar la moda, media y varianza de X. Interpreta los resultados obtenidos.
(b) Cul es la probabilidad de que a lo largo de los prximos 10 aos, transcurran al menos 20 meses sin necesidad de realizar
ninguna cesrea de urgencia?
x
i
p
i
P
i
x
i
p
i
(x
i
E(X))
2
p
i
0 0,1 0,1 0 0,42
1 0,3 0,4 0,3 0,34
2 0,25 0,65 0,5 0,00
3 0,2 0,85 0,6 0,18
4 0,09 0,94 0,36 0,34
5 0,06 1 0,3 0,52
2,06 1,80
_
_
_
M
o
= 1
E (X) = 2, 06
V (X)) = 1, 80
0 5 10 15 20
0
.0
0
0
.0
2
0
.0
4
0
.0
6
0
.0
8
0
.1
0
0
.1
2
x
y
Para la segunda parte del problema aproximamos a una normal
_
= n p = 120 0, 1 = 12
=

n p q =

120 0, 1 0, 9 = 3, 28
P(X > 20) = P
_
Z >
2012
3,28
_
= P(Z > 2, 44) = 1 P(2, 44 < Z) = 1 0, 99266 = 0, 00734
Problema 4.10. Se sabe que la citastina sigue una N(0, 8; 0, 3) en los sanos y una N(2; 0, 4) en los individuos con insuciencia renal.
Si consideramos 1, 4 como punto de corte para diagnosticar la insuciencia renal:
(a) A qu percentil de cada distribucin corresponde este punto de corte? Es el test ms sensible que especco?
(b) En una poblacin que tiene un 3%de individuos con insuciencia renal, obtener el valor predictivo positivo del test diagnstico
que considera enfermos a los individuos que tienen citastina por encima de 1,4.
Para los individuos sanos P(X < 1, 4) = P
_
Z <
1,40,8
0,3
_
= P(Z < 2) = 0, 9772
Para los individuos con insuciencia renal P(X < 1, 4) = P
_
Z <
1,42
0,4
_
= P(Z <1, 5) = 0, 0668.
Por los resultados anteriores es ms especco.
Manuel Angel Barea Gmez 81
CAPTULO 4. VARIABLES ALEATORIAS
P(E) = 0, 03
P(
T
+
/E) = 0, 93
P(
T

/E) = 0, 07
P
_
E
_
= 0, 97
P(
T
+
/E) = 0, 02
P(
T

/E) = 0, 98
P(
E
/T
+
) =
P(E)P(
T
+
/E)
P(E)P(
T
+
/E)+P(E)P(
T
+
/E)
=
0,030,93
0,030,93+0,970,02
= 0, 5898
Problema 4.11. La concentracin de urea en sangre en una determinada enfermedad sigue una distribucin normal de media
24
mg
/100cc y desviacin tpica desconocida. En un grupo de 100 enfermos se seleccionan aqullos cuya concentracin de urea est
comprendida entre 24
mg
/100cc y 28
mg
/100cc , resultando rechazados 66.
(a) Calcular el valor de la desviacin tpica de la distribucin.
(b) Si establecemos como nuevos lmites de seleccin las concentraciones de 22
mg
/100cc y 30
mg
/100cc, calcule ahora el porcentaje
de enfermos rechazados.
Del enunciado se establece que P(24 < X < 28) = 1
66
100
= 0, 44.
P
_
2424

< Z <
2824

_
= P
_
Z <
4

_
P(0 < Z) =P
_
Z <
4

_
= 0, 34 +P(Z < 0) = 0, 84
Dicha probabilidad se corresponde con una Z 1, por tanto = 4
P
_
2224
4
< Z <
3024
4
_
= P(Z < 1, 5) P(0, 5 < Z) = 0, 9332 0, 3085 = 0, 6247
Dicha probabilidad no es la de los rechazados, est ser 1-0,6247=0,3753
Problema 4.12. Una empresa ha realizado un estudio para valorar la calidad del agua que abastece a una poblacin. En el citado
estudio ha encontrado un promedio de 2 microorganismos por ml. de agua. Si extraemos al azar una muestra de agua en esta
poblacin:
(a) cul es la probabilidad de que al tomar 3ml de agua, encontremos al menos 4 microorganismos?
(b) cul es la probabilidad de que al tomar 100ml de agua, encontremos ms de 190 y menos de 220 microorganismos?
Utilizamos una distribucin de Poisson X P(6)
P(X 4) = 1 [P(X = 0) +P(X = 1) +P(X = 2) +P(X = 3)] = 1 (0, 0025 +0, 0149 +0, 0446+0, 0892) = 0, 8488
Aproximamos a una distribucin normal con
_
= n = 100 2 = 200
=

n =

200 = 14, 14
P
_
190200
14,14
< Z <
220200
14,14
_
= P(0, 7 < Z < 1, 41) = P(Z < 1, 41) P(0, 7 < Z) = 0, 9207 0, 242 = 06787
Problema 4.13. La diuresis (ujo de orina) sigue una distribucin normal de media 105
cl
/d a en los hombres y de media 125
cl
/d aen
las mujeres, teniendo en ambos casos la misma desviacin tpica . Sabiendo que el percentil 90 de la distribucin de los hombres
coincide con el percentil 23 de la distribucin de las mujeres, puedes encontrar el valor de y el del percentil en el que coinciden
ambas distribuciones?
Manuel Angel Barea Gmez 82
CAPTULO 4. VARIABLES ALEATORIAS
Para la distribucin de los hombres P
90
se corresponde con una z = 1, 28
Para las mujeres P
23
se corresponde con una z =0, 74
_
1, 28 =
x105

0, 74 =
x125

=
_
x = 1, 28 +105
x =0, 74 +125
Resolviendo 10
El percentil donde coinciden son los dos anteriores.
Problema 4.14. La albmina es la protena que tiene mayor concentracin en el plasma. Dado que se produce en el hgado, la
disminucin de la albmina srica puede ser producto de alguna enfermedad heptica. Sabiendo que la determinacin de albmina
en plasma (medida en
g
/dl) sigue en individuos sanos una distribucin N(4,4;
1
) y en los pacientes con patologa heptica una
distribucin N(2,8;
2
), hemos construido una prueba diagnostica con el siguiente criterio: Considerar como positivas las determi-
naciones de albmina inferiores a 3, 4
gr
/dl . Teniendo en cuenta que el 2% de la poblacin presenta alguna patologa heptica y que
nuestra prueba diagnstica tiene una sensibilidad del 80% y una especicidad del 90% determinar:
(a) Los valores
1
y
2
que aparecen en el enunciado.
(b) La probabilidad de que un individuo seleccionado al azar tenga una determinacin de albmina inferior a 4
gr
/dl
(c) El nmero ms probable de enfermos que encontraremos dentro de un grupo de 8 individuos, seleccionados al azar entre todos
los que han dado positivo en esta prueba.
P(E) = 0, 02
P(
T
+
/E) = 0, 8
P(
T

/E) = 0, 2
P
_
E
_
= 0, 98
P(
T
+
/E) = 0, 01
P(
T

/E) = 0, 9
Las personas sanas presentan un porcentaje de padecer la enfermedad del 10%.
0, 1 = P
_
3,44,4

2
< Z
_
, por las tablas le corresponde una Z =1, 28

2
=
3,44,4
1,28
= 0, 78125
gr
/dl
De igual modo, para los enfermos, presentan la enfermedad el 80%.
0, 8 = P
_
3,42,8

1
< Z
_
, por las tablas le corresponde una Z = 0, 84

1
=
3,42,8
0,84
= 0, 714
gr
/dl
Si cambiamos el criterio de determinacin:
Para los sanos
P(X < 4) = P
_
Z <
44,4
0,781
_
= P(Z <0, 512) = 0, 3050
Para los enfermos
P(X < 4) = P
_
Z <
42,8
0,714
_
= P(Z < 1, 68) = 0, 9535, esta ser su sensibilidad.
Manuel Angel Barea Gmez 83
CAPTULO 4. VARIABLES ALEATORIAS
P(E) = 0, 02
P(
T
+
/E) = 0, 9535
P(
T

/E) = 0, 0465
P
_
E
_
= 0, 98
P(
T
+
/E) = 0, 3050
P(
T

/E) = 0, 6950
P(T
+
) = P(E) P(
T
+
/E) +P
_
E
_
P(
T
+
/E) = 0, 02 0, 9535 +0, 98 0, 3050 = 0, 31797
Para el tercer apartado:
P(
E
/T
+
) =
P(E)P(
T
+
/E)
P(E)P(
T
+
/E)+P(E)P(
T
+
/E)
=
0,020,8
0,020,8+0,980,1
= 0, 14
n = 8 0, 14 1
Problema 4.15. Casi la mitad del magnesio corporal est presente en el hueso, donde juega un papel estructural (al igual que el
calcio, el fosfato y varias protenas). Sabemos que en poblacin general la concentracin de magnesio srico (medida en
mg
/dl) se
distribuye segn una ley Normal, donde el 80% central de los valores se encuentran en el intervalo (2, 08
mg
/dl; 2, 72
mg
/dl).
(a) Determinar el valor de los parmetros y de la citada distribucin normal.
(b) Si seleccionamos aleatoriamente 10 individuos, cul es la probabilidad de que como mnimo 3 de ellos tengan una concen-
tracin de magnesio inferior a 2, 3
mg
/dl?
(c) Si seleccionamos aleatoriamente 1200 individuos todos con una concentracin de potasio dentro del intervalo (2, 08
mg
/dl
;2, 72
mg
/dl), cul es la probabilidad de que ms de 350 tengan un nivel de magnesio superior a 2, 5
mg
/dl?
Como la probabilidad est distribuida centralmente, quiere decir que tanto por encima como por debajo tenemos un 10%, segn las
tablas esto les corresponde los siguientes valores de Z.
_
1, 28 =
2,08

1, 28 =
2,72

Resolviendo
_
= 2, 4
mg
/dl
= 0, 25
mg
/dl
La probabilidad
P(X < 2, 3) = P
_
Z <
2,32,4
0,25
_
= P(Z <0, 4) = 0, 3446
Para 10 individuos que presentan al menos 3
X B(10; 0, 3446)
P(X 3) = 1 [P(X = 0) +P(X = 1) +P(X = 2)]
1
__
10
0
_
0, 3446
0
0, 6554
4
+
_
10
1
_
0, 3446
1
0, 6554
3
+
_
10
0
_
0, 3446
2
0, 6554
2
_
= 0, 7266
La probabilidad de tener ms de 2, 5
mg
/dl es
P(X > 2, 5) = P
_
Z >
2,52,4
0,25
_
= P(Z > 0, 4) = 0, 3446
Manuel Angel Barea Gmez 84
CAPTULO 4. VARIABLES ALEATORIAS
Para 1200 individuos
_
= n p = 1200 0, 3446 = 413, 52
=

n p q =

1200 0, 3446 0, 6554 = 16, 44


P(X > 350) = P
_
Z >
350413,52
16,44
_
= P(Z >3, 86) = 0, 9994
Problema 4.16. La longitud del fmur del feto hacia la semana 20 del embarazo, obtenida mediante ecografa abdominal, sigue una
distribucin Normal de media 32mm. Sabiendo que el percentil 67 dicha distribucin se encuentra en el valor 33, 5mm:
(a) Entre qu valores se encuentra el 80% central de la distribucin?
(b) Si se programan 20 ecografas de este tipo, en cuntas de ellas cabe esperar que la longitud del fmur del feto se encuentre
entre 28mm. y 38mm.?
P
60
Z = 0, 25 0, 25 =
X

=
33,532
0,25
= 3, 41
El 80% central se encuentra en valores |Z| = 1, 28
_
1, 28 =
X32
3,41
X = 27, 62
1, 28 =
X32
3,41
X = 36, 37
P(28 < X < 38) = P
_
2832
3,41
< Z <
3832
3,41
_
= P(1, 17 < Z < 1, 75) = 0, 8389
n p = 20 0, 8389 = 16, 7
Problema 4.17. La tensin arterial sistlica (TAS) de los pacientes ingresados en UCI se ajusta a una distribucin Normal de media
= 130mmHg y sabemos que el 95% de estos pacientes mantiene unas cifras de TAS entre 110mmHg y 150mmHg.
(a) Qu porcentaje de pacientes presentan una cifra de TAS superiores a 120mmHg?
(b) Si seleccionamos aleatoriamente 20 pacientes, cul es la probabilidad de que todos presenten una TAS por debajo de
150mmHg?
Como la probabilidad est distribuida centralmente, quiere decir que tanto por encima como por debajo tenemos un 2,5%, segn las
tablas esto les corresponde los siguientes valores de Z.
_
1, 96 =
110130

1, 96 =
150130

Resolviendo
_
= 10, 2mmHg
P(X > 120) = P
_
Z >
120130
10,2
_
= P(Z >0, 98) = 0, 8365 P(X < 150) = P
_
Z <
150130
10,2
_
= P(Z < 1, 96) = 0, 975
Para todos los pacientes, 20 en nuestro caso, ser dicha probabilidad multiplicada 20 veces, es decir 0, 975
20
= 0, 6026
Problema 4.18. Una determinada enfermedad suele generar en los pacientes 2 sntomas que denominaremos S
1
y S
2
. Sabemos que
el 20% de los pacientes presentan nicamente S
1
, el 10% presentan nicamenteS
2
y el 40% presentan ambos sntomas al mismo
tiempo.
(a) Cul es la probabilidad de que un paciente elegido al azar presente al menos uno de los 2 sntomas?
Manuel Angel Barea Gmez 85
CAPTULO 4. VARIABLES ALEATORIAS
(b) Si elegimos aleatoriamente 5 pacientes Cul es la probabilidad de que alguno de ellos presente uno y slo uno de los 2
sntomas?
P(S
1
S
2
) = P(S
1
) +P(S
2
) P(S
1
S
2
) = 0, 6 +0, 5 0, 4 = 0, 7
Para que se produzca tan slo uno de los sintomas tenemos 0, 2 +0, 1 = 0, 3, usando una binomial X B(5; 0, 3)
P(X > 0) = 1 P(X = 0) = 1 0, 16807 = 0, 8319
Problema 4.19. El tiempo de vida, T (en das) de una bacteria tiene la funcin de densidad
f (t) =
_
1
10
e

t
k
s t > 0
0 enel resto
dondek es una constante positiva. Calclense:
(a) el valor de k
(b) la esperanza de vida de dicha bacteria.
Como es una distribucin exponencial k = 10.
E (X) =
1

= 10
Problema 4.20. El 75% de los alumnos matriculados en la asignatura de Bioestadstica suele entregar cha. De los que entregan
cha, aprueba habitualmente el 80% y de los que no, el 40%. Se supone que cada uno estudia por su cuenta y que no consulta a
nadie a la hora de entregar cha. Adems, todos se suelen presentar al examen.
(a) Cul es la probabilidad de que una persona, elegida al azar entre las matriculadas en la asignatura, apruebe el examen?
(b) Habiendo 150 alumnos matriculados, calcular el nmero esperado de aprobados entre ellos.
(c) Hallar la probabilidad de que, entre los 150 matriculados, aprueben el examen ms de 110. Cul es la probabilidad de que
aprueben entre 100 y 110 alumnos?
P(F) = 0, 75
P(
A
/F) = 0, 8
P(
A
/F) = 0, 2
P
_
F
_
= 0, 25
P(
A
/F) = 0, 4
P(
A
/F) = 0, 6
Manuel Angel Barea Gmez 86
CAPTULO 4. VARIABLES ALEATORIAS
P(A) = P(F) P(
A
/F) +P
_
F
_
P(
A
/F) = 0, 75 0, 8 +0, 25 0, 4 = 0, 65
De 150 alumnos aprueban 150 0, 65 = 97, 5.
_
= n p = 150 0, 65 = 97, 5
=

n p q =

150 0, 65 0, 35 = 5, 84
Aproximamos a una normal X N(97, 5; 5, 84)
P(X > 110) = P
_
Z >
11097,5
5,84
_
= P(Z > 2, 14) = 0, 0162
P(100 < X < 110) = P
_
10097,5
5,84
< Z <
11097,5
5,84
_
= P(0, 42 < Z < 2, 14) = 0, 321
Problema 4.21. Suponiendo que la probabilidad de que un nio que nace sea varn es 0, 51, hallar la probabilidad de que una
familia de 6 hijos tenga
(a) por lo menos una nia.
(b) por lo menos un nio.
X B(6; 0, 49)
P(X 1) = 1 P(X = 0) = 1
__
6
0
_
0, 49
0
0, 51
6
_
= 0, 9824
X B(6; 0, 51)
P(X 1) = 1 P(X = 0) = 1
__
6
0
_
0, 51
0
0, 49
6
_
= 0, 9861
Problema 4.22. La anchura en mm de una poblacin de colepteros sigue una distribucin N(, ). Se estima que el 77% de la
poblacin mide menos de 12mm. y que el 84% mide ms de 7mm.
(a) Cul es la anchura media de la poblacin?
(b) Hallar .
Por las tablas se establece que el 77% por debajo le corresponde una Z = 0, 74 por encima del 84% Z = 1, podemos plantear un
sistema de ecuaciones:
_
0, 74 =
12

1 =
7

Resolviendo
_
= 9, 87
= 2, 87
Problema 4.23. En una gran ciudad, el 60% de la poblacin fuma, el 6% tiene bronquitis crnica, y el 4% fuma y padece bronquitis
crnica.
(a) Hallar la probabilidad de que un fumador tenga bronquitis crnica.
(b) Hallar la probabilidad de que un no fumador tenga bronquitis crnica.
(c) Elegimos al azar 120 personas de la ciudad. Hallar la probabilidad de que ms de 80 de ellas sean fumadores.
P(
B
/F) =
P(BF)
P(F)
=
0,04
0,6
= 0, 066
Manuel Angel Barea Gmez 87
CAPTULO 4. VARIABLES ALEATORIAS
P(B) = P(F) P(
B
/F) +P
_
F
_
P(
B
/F) P(
B
/F) =
P(B)[P(F)P(B/F)]
P(F)
=
0,06(0,60,066)
0,4
= 0, 051
Aproximamos a una normal X N(72; 5, 36)
P(X > 80) = P
_
Z >
8072,5
5,36
_
= P(Z > 1, 4) = 0, 0808
Problema 4.24. La probabilidad de que un individuo sufra una reaccin por una inyeccin de un determinado suero es de 0,001.
Determine la probabilidad de que de un total de 2000 individuos tengan reaccin:
(a) Exactamente tres.
(b) Ms de dos individuos.
Aproximamos a una distribucin de Poisson X P(2), ya que = 0, 001 2000 = 2.
P(X = 3) =
e
2
2
3
3!
= 0, 1804
P(X > 2) = 1 [P(X = 0) +P(X = 1) +P(X = 2)] = 1 (0, 1353 +0, 2707 +0, 2707) = 0, 3233
Problema 4.25. Una asociacin de cardiologa arma que solo el 10% de los adultos mayores de 30 aos logran completar una
prueba de esfuerzo fsico especialmente diseada para ellos. Se toman al azar cuatro personas mayores de 30 aos y se someten a
la prueba de esfuerzo. Calcule la probabilidad de que:
(a) Dos personas pasen la prueba.
(b) Ninguna persona pase la prueba.
(c) Una sola persona no pase la prueba.
(d) Ms de una pero menos de cuatro personas pasen la prueba.
(e) Una o ms pero tres o menos, no pasen la prueba.
(f) Si se toma una muestra de 50 personas, cul es la probabilidad de que al menos dos personas pasen la prueba.
Se trata de una distribucin binomial X B(4; 0, 1)
P(X = 2) =
_
4
2
_
0, 1
2
0, 9
2
= 0, 0486
P(X = 0) =
_
4
0
_
0, 1
0
0, 9
4
= 0, 6561
P(X = 3) =
_
4
3
_
0, 1
3
0, 9
1
= 0, 0036
P(1 < X < 4) = P(X = 2) +P(X = 3) =
_
4
2
_
0, 1
2
0, 9
2
+
_
4
3
_
0, 1
3
0, 9
1
= 0, 0522
En el apartado e, la distribucin ser X B(4; 0, 9)
P(1 X 3) = P(X = 1) +P(X = 2) +P(X = 3) =
_
4
1
_
0, 9
1
0, 1
3
+
_
4
2
_
0, 9
2
0, 1
2
+
_
4
3
_
0, 9
3
0, 1
1
= 0, 6512
Manuel Angel Barea Gmez 88
CAPTULO 4. VARIABLES ALEATORIAS
El ltimo apartado se puede aproximar a una normal X N(5; 2, 12)
P(X > 1) = P
_
Z >
15
2,12
_
= P(Z >1, 88) = 0, 9699
Problema 4.26. La diabetes mellitus tipo 1 y la enfermedad celaca (EC) son alteraciones crnicas que comparten susceptibilidad
gentica, presencia de anticuerpos rgano especcos e inuencia de factores ambientales. Un estudio sobre este tipo de pacientes
dio como resultado que el 6,4% de los diabticos tienen EC. Se desea saber:
(a) Si se eligen ocho diabticos al azar, cul es la probabilidad de que ms de uno de ellos sea celaco?
(b) Si se eligen cinco diabticos al azar, cul es la probabilidad de que exactamente el primero y el ltimo sean celacos y los
dems no?
Es una distribucin binomial X B(8; 0, 064)
P(X > 1) = 1 [P(X = 0) +P(X = 1)] = 1
__
8
0
_
0, 064
0
0, 936
8
+
_
8
1
_
0, 064
1
0, 936
7
_
= 0, 089
El apartado b su probabilidad ser 0, 064 0, 936 0, 936 0, 936 0, 064 = 0, 00336
Problema 4.27. Al secuenciar una protena sintetizada in vitro se encuentra que est compuesta de alanina y leucina. Sabiendo
que la alanina supone el 60% de los aminocidos que la componen, cul es la probabilidad de que:
(a) Al menos cuatro de los cinco primeros aminocidos de la cadena sean leucina.
(b) Exactamente tres de los cinco primeros aminocidos de la cadena sean alanina.
Es una distribucin binomial X B(5; 0, 6)
P(X 4) = P(X = 4) +P(X = 5) =
_
5
4
_
0, 6
4
0, 4
1
+
_
5
5
_
0, 6
5
0, 4
0
= 0, 087
P(AAALL) = 0, 6
3
0, 4
2
= 0, 03456
Problema 4.28. Se supone que la probabilidad de tener un hijo albino en matrimonios normales portadores del gen para el albinismo
es
1
/4. Calcule la probabilidad de que en una de estas familias, compuesta por cinco hijo:
(a) Ninguno sea albino.
(b) Al menos uno sea albino.
(c) Exactamente el primero y el tercero sean albinos y los dems no.
(d) No ms de dos sean albinos.
X B(5; 0, 25)
P(X = 0) =
_
5
0
_
0, 25
0
0, 75
5
= 0, 2373
P(X 0) = 1 P(X = 0) = 1
_
5
0
_
0, 25
0
0, 75
5
= 0, 7627
Manuel Angel Barea Gmez 89
CAPTULO 4. VARIABLES ALEATORIAS
P
_
AAAAA
_
= 0, 25
2
0, 75
3
= 0, 02636
P(X < 3) = P(X = 0) +P(X = 1) +P(X = 2) =
_
5
0
_
0, 25
0
0, 75
5
+
_
5
1
_
0, 25
1
0, 75
4
+
_
5
2
_
0, 25
2
0, 75
3
= 0, 8965
Problema 4.29. Una determinada planta nuclear desprende una cantidad detectable de gases radiactivos, un promedio de dos veces
al mes.
(a) Halle la probabilidad de que no se produzcan tales emisiones durante un perodo de tres meses.
(b) Halle la probabilidad de que haya, como mximo, cuatro de tales emisiones durante ese perodo.
(c) Cul es el nmero esperado de emisiones durante tres meses? Si han sido detectadas 12 o ms emisiones, puede pensarse
que habra que dudar del promedio de dos al mes?
X P(6)
P(X = 0) =
e
6
6
0
0!
= 0, 00247
P(X 4) = P(X = 0) +P(X = 1) +P(X = 2) +P(X = 3) +P(X = 4) = 0, 0025+0, 0149+0, 0446+0, 0892+0, 1339= 0, 2851
E (X) = = 6
P(X 12) = 0, 020092
Al ser una probabilidad pequea es razonable dudar del promedio.
Problema 4.30. Tras una serie de anlisis se determin que el nmero medio por cm
3
de una cierta especie de bacterias contenidas
en el agua de un embalse es de 4.
(a) Cul es la distribucin de probabilidad del nmero de bacterias de esa especie en una gota de agua que mide
1
/10cm
3
?
(b) Cul es la probabilidad de no encontrar ninguna bacteria de esa especie en una gota de agua?
(c) Y la de encontrar al menos 2 bacterias?
X P(0, 4)
P(X = 0) =
e
0,4
0,4
0
0!
= 0, 6703
P(X 2) = 1 [P(X = 0) +P(X = 1)] = 1
_
e
0,4
0,4
0
0!
+
e
0,4
0,4
1
1!
_
= 1 [0, 6703 +0, 2681] = 0, 0616
Problema 4.31. Un agente de seguros vende plizas individuales contra cierto tipo de accidentes. Una encuesta estima que a lo
largo de un ao cada persona tiene una posibilidad de cada mil de ser vctima de un accidente del tipo que cubre la pliza y que el
agente podr vender una media de cuatro mil plizas de seguros de este tipo al ao. Se pide:
(a) Probabilidad de que el nmero de accidentes no pase de cuatro.
(b) Nmero de accidentes esperados por ao.
(c) Probabilidad de que ocurran ms de dos accidentes por ao.
(d) Probabilidad de que ocurran doce accidentes por ao.
Manuel Angel Barea Gmez 90
CAPTULO 4. VARIABLES ALEATORIAS
X P(4)
E (X) = = n p = 4000 0, 001 = 4
P(X 4) = P(X = 0) +P(X = 1) +P(X = 2) +P(X = 3) +P(X = 4) = (0, 0183 +0, 0733 +0, 1465+0, 1954+0, 1954) =
0, 6289
P(X > 2) = 1 [P(X = 0) +P(X = 1) +P(X = 2)] = 1 [0, 0183 +0, 0733 +0, 1465] = 0, 7619
P(X = 12) =
e
12
4
12
12!
= 0, 00064
Problema 4.32. Una especie de ranas pone entre 0 y 100 huevos en cada puesta. Se tiene una poblacin de 380 ranas hembras y
se sabe que la puesta de huevos sigue una distribucin normal de media 55 y desviacin tpica 10.
(a) Calcule la probabilidad de que una rana ponga ms de 50 huevos.
(b) Cuntas ranas de las 380 cabe esperar que pongan entre 65 y 80 huevos?
(c) Si se decide seleccionar al 5% de las ranas ms ponedoras para la investigacin, cul es el mnimo nmero de huevos que
debe poner una rana para ser seleccionada?
X N(55; 10)
30 40 50 60 70 80
0
.0
0
0
.0
1
0
.0
2
0
.0
3
0
.0
4
x
yP(X > 50) = P
_
Z >
5055
10
_
= P(Z >0, 5) = 0, 6915
30 40 50 60 70 80
0
.0
0
0
.0
1
0
.0
2
0
.0
3
0
.0
4
x
yP(65 < X < 80) = P
_
6555
10
< Z <
8055
10
_
= P(1 < Z < 2, 5) = 0, 1525
El 5% de las ranas ms ponedores le corresponde una Z = 1, 645 por tanto 1, 645 =
x

x = 1, 645 10 +55 71huevos


Problema 4.33. En la observacin del nmero de glbulos rojos (en millones) de los habitantes de una gran ciudad se observ que
seguan aproximadamente una distribucin normal de media 4,5 y desviacin tpica 0,5. Se pide:
(a) Probabilidad de que un habitante tomado al azar tenga ms de cinco millones de glbulos rojos.
(b) Tanto por ciento de habitantes con menos de 3,75 millones.
(c) Nmero mnimo de glbulos rojos del 20% ms alto de la ciudad.
Manuel Angel Barea Gmez 91
CAPTULO 4. VARIABLES ALEATORIAS
(d) Nmero mximo de glbulos rojos del 10% ms bajo de la ciudad.
X N(4, 5; 0, 5)
3.0 3.5 4.0 4.5 5.0 5.5 6.0
0
.0
0
.2
0
.4
0
.6
0
.8
x
yP(X > 5) = P
_
Z >
54,5
0,5
_
= P(Z > 1) = 0, 1587
3.0 3.5 4.0 4.5 5.0 5.5 6.0
0
.0
0
.2
0
.4
0
.6
0
.8
x
yP(X < 3, 75) = P
_
3,754,5
0,5
< Z
_
= P(1, 5 < Z) = 0, 0668
3.0 3.5 4.0 4.5 5.0 5.5 6.0
0
.0
0
.2
0
.4
0
.6
0
.8
x
y
Se trata de una Z = 0, 84
0, 84 =
x4,5
0,5
x = 4, 92
3.0 3.5 4.0 4.5 5.0 5.5 6.0
0
.0
0
.2
0
.4
0
.6
0
.8
x
y
Se trata de una Z =1, 28
1, 28 =
x4,5
0,5
x = 3, 86
Problema 4.34. Un bilogo comprob que la probabilidad de que al inyectar a una rata un determinado producto sobreviviera
despus de una semana era de 0,5. Si el bilogo inyecta el producto a un lote de cien ratas, se pide calcular la probabilidad de que
vivan:
(a) Ms de sesenta y cinco.
(b) Entre cuarenta y sesenta.
(c) Menos de treinta.
(d) Ms de cuarenta y cinco.
Manuel Angel Barea Gmez 92
CAPTULO 4. VARIABLES ALEATORIAS
Aproximamos a una normal con
_
= n p = 0, 5 100 = 50
=

n p q =

0, 5 100 0, 5 = 5
X N(50; 5)
30 40 50 60 70
0
.0
0
0
.0
2
0
.0
4
0
.0
6
0
.0
8
x
yP(X > 65) = P
_
Z >
6550
5
_
= P(Z > 3) = 0, 00135
30 40 50 60 70
0
.0
0
0
.0
2
0
.0
4
0
.0
6
0
.0
8
x
yP(40 < X < 60) = P
_
4050
5
< Z <
6050
5
_
= P(2 < Z < 2) = 0, 9544
30 40 50 60 70
0
.0
0
0
.0
2
0
.0
4
0
.0
6
0
.0
8
x
yP(X < 30) = P
_
3050
5
< Z
_
= P(4 < Z) = 0, 00003
3.0 3.5 4.0 4.5 5.0 5.5 6.0
0
.0
0
.2
0
.4
0
.6
0
.8
x
yP(X > 45) = P
_
Z >
4550
5
_
= P(Z >1) = 0, 8413
Problema 4.35. En una cierta prueba, el 35% de la poblacin examinada obtuvo una nota superior a 6; el 25%, entre 4 y 6, y
el 40%, inferior a 4. Suponiendo que las notas siguen una distribucin normal, halle la nota media y la desviacin tpica. Qu
porcentaje de la poblacin tiene una nota que se diferencie de la media en menos de dos unidades?
Para X = 6 Z = 0, 385 y X = 4 Z =0, 255
_
0, 385 =
6

0, 255 =
4

Resolviendo
_
= 4, 796
= 3, 125
X N(4, 796; 3, 125)
Manuel Angel Barea Gmez 93
CAPTULO 4. VARIABLES ALEATORIAS
0 2 4 6 8 10
0
.0
4
0
.0
6
0
.0
8
0
.1
0
0
.1
2
x
yP(2, 796 < X < 6, 796) = P
_
2,7964,796
3,125
< Z <
6,7964,796
3,1255
_
= P(0, 64 < Z < 0, 64) = 0, 4778
Problema 4.36. Cul sera la probabilidad de que en 1000 tiradas de un dado salga el nmero 5, ms de 150 veces y menos de
200?
Aproximamos a una normal con
_
= n p =
1
6
1000 = 166, 67
=

n p q =
_
1
6
1000
5
6
= 11, 78
X N(166, 67; 11, 78)
120 140 160 180 200
0
.0
0
0
0
.0
0
5
0
.0
1
0
0
.0
1
5
0
.0
2
0
0
.0
2
5
0
.0
3
0
0
.0
3
5
x
yP(150 < X < 200) = P
_
150166,67
11,78
< Z <
200166,67
11,78
_
= P(1, 41 < Z < 2, 83) = 0, 9184
Problema 4.37. El dimetro de una vlvula cardaca en una especie animal se distribuye normalmente con media de 3, 5mm y una
desviacin tpica de 0, 04mm.
(a) Cul es la proporcin de vlvulas con un dimetro mayor de 3,425?
(b) Cul es la probabilidad de que una vlvula tenga un dimetro entre 3,4 y 3,6 mm?
(c) Cul es el valor del dimetro mnimo por debajo del cual se encuentra el 20% de las vlvulas?
X N(3, 5; 0, 04)
Manuel Angel Barea Gmez 94
CAPTULO 4. VARIABLES ALEATORIAS
3.3 3.4 3.5 3.6 3.7
0
2
4
6
8
1
0
x
yP(X > 3, 425) = P
_
Z >
3,4253,5
0,04
_
= P(Z >1, 875) = 0, 9696
3.3 3.4 3.5 3.6 3.7
0
2
4
6
8
1
0
x
yP(3, 4 < X < 3, 6) = P
_
3,43,5
0,04
< Z <
3,63,5
0,04
_
= P(2, 5 < Z < 2, 5) = 0, 9876
3.3 3.4 3.5 3.6 3.7
0
2
4
6
8
1
0
x
y
Se trata de una Z = 0, 2
0, 2 =
x3,5
0,04
x = 3, 47
Problema 4.38. Durante cierta epidemia de gripe, enferma el 30% de la poblacin. En un aula con 120 estudiantes, cul es la
probabilidad de que:
(a) Al menos 40 estudiantes padezcan la enfermedad.
(b) Haya exactamente 50 estudiantes con gripe.
Aproximamos a una normal con
_
= n p = 0, 3 120 = 36
=

n p q =

0, 3 120 0, 7 = 5, 02
X N(36; 5, 02)
20 30 40 50 60
0
.0
0
0
.0
2
0
.0
4
0
.0
6
0
.0
8
x
yP(X 40) = P
_
Z >
4036
5,02
_
= P(Z 0, 69) = 0, 2451
P(X = 50) =
_
120
50
_
0, 3
50
0, 7
70
= 0, 0018
Manuel Angel Barea Gmez 95
CAPTULO 4. VARIABLES ALEATORIAS
Problema 4.39. Se fumiga una plantacin de zanahorias con un producto txico. Se sabe que la cantidad de producto que absorbe
una zanahoria (en mg) es una variable aleatoria con distribucin normal de media 4 y desviacin tpica 1,5. Se considera que una
zanahoria est contaminada si ha absorbido ms de 6mg del producto txico.
(a) Calcule la probabilidad de que una zanahoria seleccionada al azar haya sido contaminada en el proceso de fumigacin.
(b) Si se seleccionan al azar 5 zanahorias, cul es la probabilidad de que al menos dos de ellas estn contaminadas?
La probabilidad de que una zanahoria est contaminada es:
0 2 4 6 8
0
.0
0
0
.0
5
0
.1
0
0
.1
5
0
.2
0
0
.2
5
x
yP(X > 6) = P
_
Z >
64
1,5
_
= P(Z > 1, 33) = 0, 0918
P(X 2) = 1 [P(X = 0) +P(X = 1)] = 1
__
5
0
_
0, 0918
0
0, 9082
5
+
_
5
1
_
0, 0918
1
0, 9082
4
_
= 0, 0698
Manuel Angel Barea Gmez 96
CAPTULO
5
Intervalos de conanza y contrastes de hiptesis
paramtricas de una poblacin.
Problema 5.1. Los valores de LH, obtenidos en una muestra aleatoria, de mujeres en estado de gestacin son los siguientes: 154,
220, 206, 187, 182, 173, 169, 207, 215, 211, 165, 194, 199, 184, 177, 213, 189, 180, 191, 146. Los valores estn expresados en
mlU
/ml. y se consideran distribuidos Normalmente.
(a) Construir un intervalo de conanza para el valor medio de LH, para unos niveles de conanza del 95%y 99%respectivamente.
(b) Para los mismos niveles de conanza, obtener un intervalo de conanza para la varianza poblacional de los valores de LH.
Para la poblacin dada tenemos
_

_
x =
x
i
n
=
154+220+...+191+146
20
= 188, 10
s
2
=
(x
i
x)
2
(n1)
=
(152188,10)
2
+(220188,10)
2
+...+(191188,10)
2
+(146188,10)
2
(201)
= 422, 73
s = 20, 56
IC
95%
() =
_
x t
n1;/2

n
_
= 188, 10 2, 093
20,56

20
= 188, 10 9, 62 IC
95%
= [178, 41; 197, 72]
IC
99%
() =
_
x t
n1;/2

n
_
= 188, 10 2, 861
20,56

20
= 188, 10 13, 15 IC
99%
= [174, 95; 201, 25]
IC
95%
_

2
_
=
_
(n1)s
2

2
(n1);/2
;
(n1)s
2

2
(n1);(1/2)
_
=
_
19422,72
32,85
;
19422,72
8,91
_
=
2
[244, 50; 901, 44]
IC
99%
_

2
_
=
_
(n1)s
2

2
(n1);/2
;
(n1)s
2

2
(n1);(1/2)
_
=
_
19422,72
38,58
;
19422,72
6,84
_
=
2
[208, 18; 1172, 42]
Problema 5.2. La presin arterial diastlica para mujeres de 18 a 74 aos de edad sigue una distribucin normal, donde conocemos
que el percentil 5 es 57mmHg y que el percentil 95 es 97mmHg.
(a) Si tomamos al azar un sujeto de esta poblacin, cul es la probabilidad de que tenga una presin arterial diastlica superior
a 70mmHg?
(b) Si tomamos al azar una muestra de 25 sujetos en esta poblacin, cul es la probabilidad de que su media muestral sea inferior
a 80mmHg?
Para P
5
Z =1, 645 y P
95
Z = 1, 645
97
CAPTULO 5. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARAMTRICAS DE UNA POBLACIN.
_
1, 645 =
97

1, 645 =
57

Resolviendo
_
= 83, 55
= 8, 20
X N(77, 01; 12, 15)
40 60 80 100 120
0
.0
0
0
0
.0
0
5
0
.0
1
0
0
.0
1
5
0
.0
2
0
0
.0
2
5
0
.0
3
0
x
yP(X > 70) = P
_
Z >
7077,01
12,15
_
= P(Z >0, 57) = 0, 7157
Al ser para una media muestral:
P(X < 80) = P
_
Z <
x
/

n
_
= P
_
8077,01
12,15/

25
_
= P(Z < 1, 23) = 0, 8907
Problema 5.3. Los siguientes datos representan los porcentajes de mejoras en el nmero de lesiones por acn despus de 16
semanas de tratamiento, de 10 individuos con este problema:
48,6 49,4 50,1 49,8 50,6 50,8 47,1 52,5 49,0 46,7
(a) Calcular un intervalo de conanza del 90% para el porcentaje medio.
(b) Calcular un intervalo de conanza del 99% para la desviacin tpica de los porcentajes.
_

_
x =
x
i
n
=
48,6+49,4+...+49,0+46,7
10
= 49, 46
s
2
=
(x
i
x)
2
(n1)
=
(48,649,46)
2
+(49,449,46)
2
+...+(49,0188,10)
2
+(46,7188,10)
2
(101)
= 3
s = 1, 73
IC
90%
() =
_
x t
n1;/2

n
_
= 49, 46 1, 833
1,73

10
= 49, 46 1 IC
90%
() = [48, 46; 50, 46]
IC
99%
_

2
_
=
_
(n1)s
2

2
(n1);/2
;
(n1)s
2

2
(n1);(1/2)
_
=
_
93
23,59
;
93
1,73
_
=
2
[1, 14; 15, 6]
IC
99%
() = [1, 06; 3, 94]
Problema 5.4. Se desea precisar el porcentaje de individuos que sufren incontinencia urinaria de entre los internados en un hospital
y, para ello, se tom una muestra de 120 pacientes de los cuales 28 presentaron ese problema.
(a) Entre qu valores est tal porcentaje (95%)?.
(b) Se ha conseguido una precisin del 2% en la estimacin?.
(c) Si no se ha conseguido, cuntos individuos se necesitan para ello?.
_
p =
28
120
= 0, 23
q = 0, 77
IC
95%
() =
_
p z
/2

_
p(1p)
n
_
= 0, 23 1, 96
_
0,230,77
120
= 0, 23 0, 07 = [0, 16; 0, 30]
Manuel Angel Barea Gmez 98
CAPTULO 5. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARAMTRICAS DE UNA POBLACIN.
No se ha conseguido una precisin del 2% sino del 7%.
= z
/2

_
p(1p)
n
n =
z
2
/2
p(1p)

2
=
1,96
2
0,230,77
0,02
2
1701
Problema 5.5. Se ha realizado un estudio sobre nios que padecen dolor de pecho. Se ha hallado que de 137 nios que tenan dolor
de pecho, 100 daban radiografas de trax Normales.
(a) Obtener un intervalo de conanza del 95% de la proporcin de nios con dolor de pecho que dan radiografas Normales.
(b) Obtener el tamao muestral que se debe emplear para estimar la verdadera proporcin de nios con radiografas Normales
con un error de 0,03 dentro de un intervalo de conanza del 99%.
_
p =
100
137
= 0, 729
q = 0, 271
IC
95%
() =
_
p z
/2

_
p(1p)
n
_
= 0, 729 1, 96
_
0,7290,271
137
= 0, 729 0, 074 = [0, 654; 0, 803]
= z
/2

_
p(1p)
n
n =
z
2
/2
p(1p)

2
=
2,575
2
0,7290,271
0,03
2
1456
Problema 5.6. En un estudio para establecer un patrn de lectura "Normal"de Ca en personas adultas aparentemente sanas, se ha
obtenido una primera muestra de 25 individuos en la que se ha medido los miligramos de calcio por decilitro de sangre, obteniendo
un intervalo de conanza del 95% para la media de [9, 294; 9, 706]
(a) Cul sera el intervalo de conanza para la media al 99%?
(b) Cul sera un intervalo de conanza para la desviacin tpica al 95%?
_
9, 294 = x t
n1,/2

n
= x 2, 064
s

25
9, 706 = x +t
n1,/2

n
= x +2, 064
s

25
Resolviendo
_
x = 9, 5
s = 0, 5
IC
99%
() =
_
x t
n1;/2

n
_
= 9, 5 2, 797
0,5

25
= 9, 5 0, 279 IC
99%
() = [9, 221; 9, 779]
IC
95%
_

2
_
=
_
(n1)s
2

2
(n1);/2
;
(n1)s
2

2
(n1);(1/2)
_
=
_
240,25
39,36
;
240,25
12,40
_
=
2
[0, 152; 0, 483]
IC
95%
() = [0, 39; 0, 69]
Problema 5.7. Para estudiar el nmero de pulsaciones por minuto despus de realizar un esfuerzo fsico concreto, se toma una
muestra de 240 individuos, que dieron una media de 90 con una desviacin tpica de 16 pulsaciones. Suponiendo normalidad en los
datos:
(a) Con qu nivel de conanza puede asegurarse que la media poblacional est dentro del intervalo [90 1, 7]?
(b) Construya el intervalo de conanza de con un nivel de conanza del 98%. Calcule el error de estimacin. Obtenga el valor
de n para que el error de estimacin sea inferior a 2
Manuel Angel Barea Gmez 99
CAPTULO 5. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARAMTRICAS DE UNA POBLACIN.
1, 7 =t
n1;/2

n
t
239;/2
=
1,7

240
16
= 1, 64 Por las tablas = 0, 90
IC
98%
() =
_
x t
n1;/2

n
_
= 90 2, 326
16

240
= 90 2, 40 IC
98%
() = [87, 60; 92, 40]
= 2, 4
=t
n1;/2

n
n =
_
t
n1;/2
s

_
2
=
_
2,32616
2
_
2
347
Problema 5.8. La concentracin de cido rico en sangre
mg
/dl sigue una distribucin normal. Se ha estudiado una muestra de 150
individuos y hemos obtenido como intervalo de conanza para la media al 95%: [5, 52; 6, 48].
(a) Qu tamao muestral sera necesario para que el error de estimacin sea inferior a 0, 1
mg
/dl?
(b) Podemos armar con un 2% de signicacin, que la concentracin media en sangre de cido rico es superior a 5, 5
mg
/dl?
_
5, 52 = x t
n1,/2

n
= x 1, 96
s

150
6, 48 = x +t
n1,/2

n
= x +1, 96
s

150
Resolviendo
_
x = 6
s = 3
=t
n1;/2

n
n =
_
t
n1;/2
s

_
2
=
_
1,963
0,1
_
2
3458
El apartado b es un contraste de hiptesis:
_
H
0
= 5, 5
H
1
> 5, 5
El valor crtico es t
149;0,01
= 2, 326, el criterio de rechazo ser t > 2, 396
t =
|xx|
s/

n
=
65,5
3/

150
= 2, 04
Por tanto pertenece no pertenece a la regin de rechazo y no podemos validar H
1
Problema 5.9. Se cree que ms del 85% de todos los nios con dolor torcico presentar, a pesar del dolor, un ecocardiograma
normal. Una muestra de 139 de estos nios ha dado 123 con ecocardiogramas normales.
(a) Hallar un intervalo de conanza al 99% para la proporcin de nios con dolor torcico que presentan ecocardiogramas
normales.
(b) Realizar un contraste de hiptesis para aceptar o rechazar la hiptesis del enunciado con = 0, 1
_
p =
123
139
= 0, 885
q = 0, 115
IC
99%
() =
_
p z
/2

_
p(1p)
n
_
= 0, 885 2, 575
_
0,8850,115
139
= 0, 885 0, 069 = [0, 816; 0, 954]
_
H
0
= 0, 85
H
1
> 0, 85
El valor crtico es z
/2
= 1, 64, el criterio de rechazo ser z
/2
> 1, 64
Manuel Angel Barea Gmez 100
CAPTULO 5. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARAMTRICAS DE UNA POBLACIN.
z
/2
=
|pp|
_
p(1p)
n
=
0,8850,8
_
0,8850,115
139
= 3, 14
Por tanto pertenece a la regin de rechazo y podemos rechazar H
0
y si dar por vlida H
1
aceptando la hiptesis
Problema 5.10. Para determinar el aumento de peso que produce en las ratas hembras una dieta con alto contenido en protenas,
se toman 12 ratas y se determina el aumento de peso (medido en grs.) entre los das 28 y 84 . Sabiendo que la suma de estos datos
es 1440, que la suma de sus cuadrados es 177832 y que los datos siguen una ley Normal, encontrar un intervalo de conanza para
.
_
_
_
x =
x
i
n
=
1440
12
= 120
s
2
=
n
n1

2
=
12
11

_
177832
12
120
2
_
= 457, 45
s = 21, 38
IC
95%
_

2
_
=
_
(n1)s
2

2
(n1);/2
;
(n1)s
2

2
(n1);(1/2)
_
=
_
11457,45
21,92
;
11457,45
3,82
_
=
2
[229, 56; 1317, 26]
IC
95%
() = [15, 15; 36, 29]
Problema 5.11. El servicio pblico de salud recomienda la vacunacin contra la gripe para personas de ms de sesenta aos. Se ha
tomado una muestra aleatoria de 100 personas que pertenecen a este grupo de edad, para estimar el porcentaje de individuos que
tienen intencin de vacunarse.
(a) Con qu nivel de conanza puede asegurarse que la proporcin de individuos que se vacunarn se encuentra en el intervalo
[0, 725; 0, 875]
(b) Se han previsto vacunas para el 75% de la poblacin formada por este grupo de edad, sern sucientes?
Como el intervalo de conanza se distribuye sobre la media p =
x
inf
+x
sup
2
=
0,725+0,875
2
= 0, 8
0, 875 = 0, 8 +z
/2

_
0,80,2
100
z
/2=1,875
z

= 1, 54 = 0, 9386
_
H
0
= 0, 75
H
1
> 0, 75
El valor crtico para una = 95% es z
/2
= 1, 96, el criterio de rechazo ser z > 1, 54
z =
pp
_
p(1p)
n
=
0,80,75
_
0,80,2
100
= 1, 25
Por tanto H
0
es cierta.
Problema 5.12. Para conocer la ecacia de un programa de entrenamiento deportivo se evala la frecuencia cardaca de 40 sujetos
antes y despus del mismo. Con estos datos se obtiene que la diferencia de frecuencia cardaca media (antes - despus) se encuentra
en el intervalo [5 3, 5] con un 95% de conanza. Suponiendo normalidad en los datos y sabiendo que una mejora de la forma
fsica implicara un descenso de la frecuencia cardaca, podemos asegurar la ecacia del tratamiento?
_
H
0
d D
0
= 5
H
1
d D
0
< 5
El valor crtico es t
n1;/2
=t
39;0,975
= 2, 022, el criterio de rechazo ser t < 2, 022
Manuel Angel Barea Gmez 101
CAPTULO 5. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARAMTRICAS DE UNA POBLACIN.
=t
s

n
s =
3,51

40
2,022
= 10, 94
t =
50
10,94/

40
= 2, 89
Por tanto se rechaza H
0
y aceptamos H
1
y la ecacia del tratamiento
Problema 5.13. Se determinaron los porcentajes de peso corporal ideal de 18 diabticos insulinodependientes elegidos al azar. Un
porcentaje de 120% signica que un individuo pesa 20% ms que su peso ideal; un porcentaje de 95% signica que el individuo
pesa 5% menos que su peso ideal. Suponiendo normalidad en la distribucin poblacional de la variable y a partir de los datos
obtenidos:
107 119 99 114 120 104 88 114 124 116 101 121 152 100 125 114 95 117
(a) Podemos armar en promedio, que la poblacin de diabticos insulinodependientes tiene sobrepeso?
(b) Construir un intervalo de conanza al 99% para la desviacin tpica poblacional de la variable porcentaje de peso corporal
ideal.
_

_
x =
x
i
n
=
107+119+...+95+117
18
= 112, 78
s
2
=
(x
i
x)
2
(n1)
=
(107112,78)
2
+(119112,78)
2
+...+(95112,78)
2
+(117112,78)
2
(181)
= 208
s = 14, 42
_
H
0
= 120
H
1
> 120
El valor crtico es t
17;0,05
= 1, 740, el criterio de rechazo ser t > 1, 740
t =
120112,78
14,42/

18
= 2, 124
Por tanto se rechaza H
0
y se conrma que s que tienen sobrepeso.
IC
99%
_

2
_
=
_
(n1)s
2

2
(n1);/2
;
(n1)s
2

2
(n1);(1/2)
_
=
_
17208
35,72
;
17208
5,70
_
=
2
[98, 99; 620, 35]
IC
99%
() = [9, 94; 24, 94]
Problema 5.14. El nmero medio de das de clnica requeridos por determinados pacientes mayores de edad era de 17 das. Se ha
puesto en marcha un nuevo programa de cuidados que se espera que reduzca esta cifra. Los datos recogidos para 16 pacientes que
han seguido el programa son:
3 18 5 9 12 8 7 20
22 15 6 3 2 36 38 43
(a) Prueban los datos anteriores la hiptesis esperada?
(b) Calcular un intervalo de conanza al 99% para la proporcin de pacientes que necesitan ms de 17 das de clnica despus
de seguir el programa.
_

_
x =
x
i
n
=
3+18+...+38+43
16
= 15, 44
s
2
=
(x
i
x)
2
(n1)
=
(315,44)
2
+(1815,44)
2
+...+(3815,44)
2
+(4315,44)
2
(161)
= 175, 3
s = 13, 24
Manuel Angel Barea Gmez 102
CAPTULO 5. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARAMTRICAS DE UNA POBLACIN.
_
H
0
= 17
H
1
< 17
El valor crtico es t
15;0,025
= 2, 326, el criterio de rechazo ser t < 2, 131
t =
xx
s/

n
=
15,4417
13,24/

16
=0, 47
Pertenece a la regin de rechazo y podemos rechazar H
0
y aceptar H
1
La proporcin de los que necesitan ms de 17 das es p =
6
16
= 0, 375
IC
99%
() =
_
p z
/2

_
p(1p)
n
_
= 0, 375 2, 575
_
0,3750,625
16
= 0, 375 0, 312 = [0, 0628; 0, 687]
Problema 5.15. Los neutrlos son leucocitos cuya funcin es la de eliminar agentes infecciosos de la sangre, de forma que en
un individuo normal el porcentaje de neutrlos entre los leucocitos debe ser de al menos el 60%. Al realizar un recuento de 200
leucocitos de un individuo hemos visto que 107 son neutrlos:
(a) A partir de qu nivel de signicacin puede armarse que este individuo tiene un porcentaje de neutrlos por debajo de lo
normal?
(b) Cuntos leucocitos deberamos contar como mnimo en este individuo para obtener un intervalo de conanza al 99 del
porcentaje de neutrlos con una precisin del 5%?
_
p =
107
200
= 0, 535
q = 0, 465
IC() =
_
p +z

_
p(1p)
n
_
0, 6 = 0, 535 z

_
0,5350,465
200
=
0,60,535
_
0,5350,465
200
= 1, 84 = 0, 03
= z
/2

_
p(1p)
n
n =
z
2
/2
p(1p)

2
=
2,58
2
0,5350,465
0,05
2
675
Problema 5.16. En una determinada marca de cigarrillos se efecta un experimento para comprobar el contenido en alquitrn; a tal
n se prueban veinte cigarrillos elegidos al azar de lotes diferentes. Se encuentran los siguientes datos muestrales para el contenido
de alquitrn:
_
x = 22mg
s = 4mg
(a) Encuentre un intervalo de conanza del 90% para el contenido medio de alquitrn en un cigarrillo de la citada marca.
IC
90%
() =
_
x t
n1;/2

n
_
= 22 1, 729
4

20
= 22 1, 546 IC
90%
() = [20, 45; 23, 546]
Problema 5.17. Se quiere conocer la permanencia media de pacientes en un hospital, con el n de estudiar una posible ampliacin
del mismo. Se tienen datos referidos a la estancia expresada en das de ochocientos pacientes, obtenindose los siguientes resultados:
_
x = 8, 1d as
s = 9 d as
Manuel Angel Barea Gmez 103
CAPTULO 5. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARAMTRICAS DE UNA POBLACIN.
(a) Halle un intervalo de conanza del 95% para la estancia media.
IC
95%
() =
_
x t
n1;/2

n
_
= 8, 1 1, 96
9

800
= 8, 1 0, 623 IC
95%
() = [7, 47; 8, 723]
Problema 5.18. El porcentaje de calcio observado en dientes sanos de 10 individuos de una especie animal es:
36,6 35,9 35,6 35,4 34,9 36,5 35,6 35,2 35,6 35,4
(a) Halle el intervalo de conanza del 95% para el porcentaje medio de calcio.
(b) Se podra aceptar que el porcentaje medio de calcio es igual a 36?
(c) Intervalo de conanza del 95% para la varianza de dicho porcentaje.
(d) Se podra aceptar que la varianza de dicho porcentaje es igual a 1,5?
_

_
x =
x
i
n
=
36,6+35,9+...+35,6+35,4
10
= 35, 67
s
2
=
(x
i
x)
2
(n1)
=
(36,635,67)
2
+(35,935,67)
2
+...+(35,635,67)
2
+(35,435,67)
2
(101)
= 0, 28
s = 0, 53
IC
95%
() =
_
x t
n1;/2

n
_
= 35, 67 2, 262
0,53

10
= 35, 67 0, 38 IC
95%
() = [35, 29; 36, 05]
S se puede aceptar un porcentaje medio de 36 por estar incluido en el intervalo.
IC
95%
_

2
_
=
_
(n1)s
2

2
(n1);/2
;
(n1)s
2

2
(n1);(1/2)
_
=
_
90,28
19,02
;
90,28
2,70
_
=
2
[0, 1325; 0, 933]
No est incluido en el intervalo.
Problema 5.19. En una muestra de 28 virus se ha medido, mediante tcnicas de microscopa electrnica, el dimetro de la cpside,
resultando, de media, 12500
o
A con una desviacin tpica de 2100
o
A. El dimetro se distribuye normalmente con media y desviacin
tpica desconocidas.
(a) D una estimacin puntual para la media y la varianza poblacionales.
(b) Construya un intervalo de conanza del 95% para el tamao medio del dimetro de la cpside y otro para la desviacin tipica.
_
x = 12500
s =
_
n
n1
=
_
28
27
2100 = 2138, 5
IC
95%
() =
_
x t
n1;/2

n
_
= 12500 2, 052
2138,5

28
= 12500 829, 3 IC
95%
() = [11670, 7; 13329, 3]
IC
95%
_

2
_
=
_
(n1)s
2

2
(n1);/2
;
(n1)s
2

2
(n1);(1/2)
_
=
_
272138,5
2
43,19
;
272138,5
2
14,57
_
=
2
[2858635, 9; 84729224, 0]
IC
95%
() = [690, 8; 2910, 8]
Manuel Angel Barea Gmez 104
CAPTULO 5. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARAMTRICAS DE UNA POBLACIN.
Problema 5.20. En el estudio del cncer de pulmn se considera que su tamao es una variable aleatoria con distribucin aproxi-
madamente normal. Una muestra de ocho pacientes afectados ha dado, en centmetros, los resultados siguientes:
7,5 2,5 9,0 6,5 3,3 6,5 1,5 6,5
(a) Determine un intervalo de conanza del 95% para el tamao medio de este tipo de cncer.
(b) Calcule un intervalo de conanza del 90% para la desviacin tipica del tamao.
_

_
x =
x
i
n
=
7,5+2,5+...+1,5+6,5
8
= 5, 41
s
2
=
(x
i
x)
2
(n1)
=
(7,55,41)
2
+(2,55,41)
2
+...+(1,55,41)
2
+(6,55,41)
2
(81)
= 7
s = 2, 65
IC
95%
() =
_
x t
n1;/2

n
_
= 5, 41 2, 365
2,65

8
= 5, 41 2, 207 IC
95%
() = [3, 20; 7, 617]
IC
90%
_

2
_
=
_
(n1)s
2

2
(n1);/2
;
(n1)s
2

2
(n1);(1/2)
_
=
_
77
14,07
;
77
2,17
_
=
2
[3, 48; 22, 58]
IC
90%
() = [1, 86; 4, 75]
Problema 5.21. Se desea estimar la proporcin de jvenes que fuman regularmente. De 1000 jvenes entrevistados, 200 fumaban
regularmente.
(a) Calcule una estimacin puntual para p.
(b) Obtenga un intervalo de conanza del 99% para la proporcin de jvenes que fuman regularmente. Le sorprendera leer en
un artculo que esta proporcin es de 0,23? Justifquelo.
p =
200
1000
= 0, 2
IC() =
_
p +z

_
p(1p)
n
_
= 0, 2 2, 575
_
0,20,8
1000
= 0, 2 0, 0325 IC() = [0, 1674; 0, 2325]
No sorprende que la proporcin pueda ser 0,23 ya que pertenece al intervalo de conanza
Problema 5.22. Un avance en el tratamiento del acn es el frmaco cido cis-13-retinoico. En un reciente estudio, se prob este
frmaco en 70 pacientes afectados de un acn bastante grave. En 60 de estos pacientes se produjo una limpieza radical de sus
lesiones activas. Se pide:
(a) Construya un intervalo de conanza del 99% para la proporcin de pacientes sobre los que el frmaco sera ecaz.
(b) Se podra aceptar que el frmaco sera ecaz en el 98% de los pacientes sobre los que se aplique?
(c) Qu tamao debera tener la muestra para que la proporcin resultante de ella est dentro de una distancia de 0,04 de la
verdadera proporcin, p, con una conanza del 99%?
p =
60
70
= 0, 857
Manuel Angel Barea Gmez 105
CAPTULO 5. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARAMTRICAS DE UNA POBLACIN.
IC() =
_
p +z

_
p(1p)
n
_
= 0, 857 2, 575
_
0,8570,143
70
= 0, 857 0, 107 IC() = [0, 750; 0, 964]
No se puede aceptar porque no forma parte del intervalo de conanza.
= z
/2

_
p(1p)
n
n =
z
2
/2
p(1p)

2
=
2,575
2
0,8570,143
0,04
2
508
Problema 5.23. Un fabricante garantiza a un laboratorio farmacutico que sus mquinas producen comprimidos con un dimetro
medio de 13mm y una desviacin tpica de 0, 6mm. Una muestra de 100 unidades dio como media de los dimetros 13, 12mm.
Cabe esperar, a partir de este dato, que el fabricante dice la verdad, a un nivel de signicacin del 5%?
_
H
0

0
= 13
H
1

0
= 13
El valor crtico es z
/2
= 1, 96, el criterio de rechazo de H
0
ser |z| > 1, 96
z =

0

n
=
13,1213
0,6

100
= 2
Al estar en la regin de rechazo, no se puede armar con un 95% de probabilidad que el fabricante tiene razn.
Problema 5.24. Normalmente las hojas de la mimosa pdica son horizontales. Si se toca ligeramente una de ellas, las hojas se
pliegan. Se arma que el tiempo medio de contacto hasta el cierre completo es de 2,5 segundos. Se realiza un experimento midiendo
el tiempo transcurrido, en segundos, entre el contacto y el cierre completo con los siguientes resultados:
3,0 2,9 2,8 2,7 2,6 2,4 2,5 2,4 2,6 2,7
(a) Puede aceptarse la hiptesis del enunciado con un nivel de signicacin de 0,10?
_

_
x =
x
i
n
=
3,0+2,9+...+2,6+2,7
10
= 2, 66
s
2
=
(x
i
x)
2
(n1)
=
(3,02,66)
2
+(2,92,66)
2
+...+(2,62,66)
2
+(2,72,66)
2
(101)
= 0, 04
s = 0, 20
_
H
0

0
= 2, 5
H
1

0
= 2, 5
El valor crtico es t
9;0,05
= 2, 262, el criterio de rechazo de H
0
ser |t| > 1, 8332
t =

0

n
2,662,5
0,2

10
= 2, 52
Al estar en la regin de rechazo, no se puede armar con un 90% de probabilidad que el tiempo de cierre completo sea de 2,5 seg.
Problema 5.25. Un frmaco alivia cierta dolencia en el 60% de los casos. Se toma una muestra de 144 personas que sufren esa
dolencia y se les hace tomar un nuevo frmaco, encontrando alivio 100 de ellas.
(a) Se puede armar al nivel del 5% que el nuevo medicamento es ms efectivo que el antiguo?
=
100
144
= 0, 694
Manuel Angel Barea Gmez 106
CAPTULO 5. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS PARAMTRICAS DE UNA POBLACIN.
_
H
0

0
= 0, 6
H
1

0
> 0, 6
El valor crtico es z
0,95
= 1, 645, el criterio de rechazo de H
0
ser z > 1, 645
z =

0
_
(1)
n
=
0,6940,6
_
0,6940,305
144
= 2, 45
Por tanto, aceptamos H
1
que certica que el nuevo medicamento es ms efectivo con un 95% de abilidad.
Problema 5.26. Un microbilogo quiere obtener placas para preparaciones microscpicas de espesor uniforme. Un proveedor
arma que sus placas tienen una varianza menor de 0, 0158micron
2
. Utilizando un micrmetro sensible, el laboratorio toma al azar
una muestra de 30 placas con una cuasivarianza muestral resultante de s
2
= 0, 0213micron
2
.
(a) Es compatible con dicho resultado la pretensin del proveedor a un nivel de signicacin del 5%?
_
H
0

2
0
= 0, 0158
H
1

2
0
< 0, 0158
El valor crtico es
2
29;0,95
= 17, 71, el criterio de rechazo de H
0
ser
2
< 17, 71

2
=
(n1)s
2

2
0
=
290,0213
0,0158
= 39, 09
Por tanto se acepta H
0
y no puede aceptarse lo que indica el proveedor en H
1
Problema 5.27. En la leucemia mieloblstica, usualmente se trata al paciente intensamente con quimioterapia en el momento del
diagnstico. Esto ha producido una tasa de remisin del 70%. Probando un nuevo mtodo de tratamiento se utilizaron 50 voluntarios.
(a) Cuntos de los pacientes deberan haber remitido para que los investigadores pudiesen armar al nivel de signicacin 0,025
que el nuevo mtodo produce remisiones ms altas que el antiguo?
_
H
0

0
= 0, 7
H
1

0
> 0, 7
El valor crtico es z
0,975
= 1, 96, el criterio de rechazo de H
0
ser z > 1, 96
Para poder aceptar H
1
1, 96 <

0
_
(1)
n
=
n
50
0,7
_
0,70,3
50
n (1, 96 0, 065 +0, 7) 50 42
Manuel Angel Barea Gmez 107
CAPTULO
6
Intervalos de conanza y constrates de hiptesis
paramtricos en dos o ms poblaciones.
Problema 6.1. Se ha analizado el contenido de bra diettica en dos grupos de vegetarianos, uno con enfermedad diverticular y
otro sin ella. Los resultados obtenidos aparecen en la siguiente tabla:
Sin enfermedad Con enfermedad
n
1
= 18 n
2
= 18
x
1
= 42, 7gr. x
2
= 27, 7gr.
s
1
= 9, 9gr. s
2
= 9, 5gr.
Suponiendo normalidad en los datos:
(a) Decidir si puede armarse ( = 0, 05) que la media de contenido de bra diettica en las dietas de los que no tienen la
enfermedad es ms alta que en la de aquellos que la tienen.
(b) Evaluar la diferencia de contenidos medios mediante un intervalo de conanza al 99%.
Hay que contrastar primero si las varianzas poblacionales son iguales:
_
H
0

1
=
2
H
1

1
=
2
F =
s
2
1
s
2
2
=
9,9
2
9,5
2
= 1, 08
Se rechaza H
0
si F no pertenece al intervalo de nuestro estadstico.
Para una = 0, 05
_
F
0,975;17;17
= 2, 673
F
0,025;17;17
=
1
2,673
= 0, 374
como 1, 08 (0, 374; 2, 673), no se rechaza H
0
y por tanto
1
=
2
_
H
0

1
=
2
H
1

1
>
2
108
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
El valor crtico es t
34;0,05
= 1, 690, el criterio de rechazo de H
0
ser t > 1, 690
t =
x
1
x
2
_
s
2
1
n
1
+
s
2
2
n
2
=
42,727,7
_
9,9
2
18
+
9,5
2
18
=
15
3,23
= 4, 63
Por tanto se rechaza H
0
y se acepta que la media de contenido de bra diettica en las dietas de los que no tienen la enfermedad es
ms alta que en la de aquellos que la tienen.
s =
_
(n
1
1)s
2
1
+(n
2
1)s
2
2
(n
1
+n
2
2)
=
_
179,9
2
+179,5
2
34
= 9, 7
IC
99%
(
1

2
) =
_
(x
1
x
2
) t
n1;/2

_
s
2
n
1
+
s
2
n
2
_
= 15 2, 724
_
9,7
2
18
+
9,7
2
18
= 15 8, 80 IC
99%
(
1

2
) = (
1

2
)
[6, 20; 23, 80]
Problema 6.2. Se tiene un grupo control y otro experimental, cada uno con 100 individuos, para contrastar el efecto de una vacuna
contra determinado tipo de alergia. Del grupo experimental 8 sufrieron alergia, mientras que del control la sufrieron 25.
(a) Contrastar si existe diferencia entre ambos grupos ( = 0, 05)
(b) Evaluar la diferencia existente entre ambos grupos mediante un intervalo de conanza al 99%.
_
p
1
=
8
100
= 0, 08
p
2
=
25
100
= 0, 25
_
H
0

1
=
2
H
1

1
=
2
El valor crtico es z
0,025
= 1, 96 el criterio de rechazo de H
0
ser |z| > 1, 96
p =
n
1
p
1
+n
2
p
2
n
1
+n
2
=
1000,08+1000,25
100+100
= 0, 165
z =
p
1
p
2
_
p(1p)
n
1
+
p(1p)
n
2
=
0,080,25
_
0,1650,835
100
+
0,1650,835
100
=
0,17
0,05
=3, 4
Como |3, 4| > 1, 96 se rechaza H
0
y por tanto existen diferencias entre ambos grupos.
IC
99%
(
1

2
) =
_
(p
1
p
2
) z
/2

_
p(1p)
n
1
+
p(1p)
n
2
_
=0, 17 2, 575
_
01650,835
100
+
0,1650,835
100
=0, 17 0, 12
IC
99%
(
1

2
) = (
1

2
) [0, 29; 0, 05]
Problema 6.3. Dos investigadores de dos ciudades distintas, A y B, se conocen en un congreso mdico porque han presentado
dos trabajos sobre el mismo tema, la diabetes infantil. El investigador de la ciudad A, partiendo de una muestra de tamao 13, ha
presentado como intervalo de conanza al 95% para la media de azcar en sangre (medida en
mg
/100ml) el siguiente: (89, 1; 90, 9).
El investigador de la ciudad B, partiendo de otra muestra de tamao 16, ha presentado como intervalo de conanza al 99% para la
media de azcar en sangre el siguiente: (93, 2; 98, 8).
Manuel Angel Barea Gmez 109
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
(a) Podemos armar con un nivel de signicacin del 1% que el nivel medio de azcar en la poblacin infantil de la ciudad A es
inferior al de la ciudad B?
Ciudad A
_
x
1
=
89,1+90,9
2
= 90
=t
12;0,025

s
1

n
s
1
=

n
t
12;0,025
=
0,9

13
2,179
= 1, 49
Ciudad B
_
x
2
=
93,2+98,8
2
= 96
=t
15;0,005

s
2

n
s
2
=

n
t
15;0,005
=
2,8

16
2,861
= 3, 91
Hay que contrastar primero si las varianzas poblacionales son iguales:
_
H
0

1
=
2
H
1

1
=
2
F =
s
2
1
s
2
2
=
1,49
2
3,91
2
= 0, 14
Se rechaza H
0
si F no pertenece al intervalo de nuestro estadstico.
Para una = 0, 05
_
F
0,975;12;15
= 2, 963
F
0,025;12;15
=
1
3,177
= 0, 314
como 0, 14 / (0, 314; 2, 963), se rechaza H
0
y por tanto
1
=
2
_
H
0

1
=
2
H
1

1
<
2
Por ser las varianzas distintas el grado de libertad de nuestro estadstico sera:
v =
(s
2
1
n
1
+s
2
2
n
2)
2
(s
2
1
n
1)
2
n
1
1
+
(s
2
2
n
2)
2
n
2
1
=
(1,49
2
13+3,91
2
16)
2
(1,49
2
13)
2
131
+
(3,91
2
16)
2
161
=
273,47
2
69,41+3988,92
18
El valor crtico es t
18;0,01
= 2, 522, el criterio de rechazo de H
0
ser t < 2, 522
t =
x
1
x
2
_
s
2
1
n
1
+
s
2
2
n
2
=
9096
_
1,49
2
13
+
3,91
2
16
=
6
1,06
=5, 65
Como 5, 65 < 2, 467 se rechaza H
0
y se acepta H
1
que indica que el nivel medio de azcar en la poblacin infantil de la ciudad A es
inferior al de la ciudad B
Problema 6.4. Se ha realizado un estudio para cerciorarse de si las diferencias inmunolgicas entre hemoflicos e individuos sanos
podan detectarse fcilmente. Los resultados de una prueba inmunolgicas realizada sobre 13 hemoflicos y otros 13 controles sanos
son:
Hemoflicos 11 9,8 61,2 63,4 11,1 8 40,9 47,7 19,3 18 24,6 24,4 11,3
Sanos 13,5 16,9 38,3 23,2 27,6 22,1 33,4 55 66,9 78,6 66,6 53 49,7
Suponiendo normalidad en los datos y a partir de ellos:
(a) Existen en promedio diferencias inmunolgicas entre hemoflicos e individuos sanos?
Manuel Angel Barea Gmez 110
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
(b) Realizar una estimacin de esta diferencia por medio de un intervalo de conanza.
(c) Estimar mediante un intervalo la probabilidad de que un hemoflico tenga un nivel de inmunidad superior a 30.
Hemo f licos
_
_
_
x
1
= 26, 97
s
1
= 19, 75
n
1
= 13
Sanos
_
_
_
x
2
= 41, 90
s
2
= 21, 21
n
2
= 13
Contrastamos primero si las varianzas poblacionales son iguales:
_
H
0

1
=
2
H
1

1
=
2
F =
s
2
1
s
2
2
=
19,75
2
21,21
2
= 0, 86
Se rechaza H
0
si F no pertenece al intervalo de nuestro estadstico.
Para una = 0, 05
_
F
0,975;12;12
= 3, 277
F
0,025;12;12
=
1
3,277
= 0, 305
como 0, 86 (0, 305; 3, 277), se acepta H
0
y por tanto
1
=
2
_
H
0

1
=
2
H
1

1
=
2
Por tener las varianzas poblacionales iguales v = n
1
+n
2
2
El valor crtico es t
24;0,025
= 2, 060, el criterio de rechazo de H
0
ser |t| > 2, 064
s =
_
(n
1
1)s
2
1
+(n
2
1)s
2
2
(n
1
+n
2
2)
=
_
1219,75
2
+1221,21
2
24
= 20, 5
t =
x
1
x
2
_
s
2
1
n
1
+
s
2
2
n
2
=
26,9741,90
_
20,5
2
13
+
20,5
2
13
=
14,93
8,038
=1, 85
|1, 85| < 2, 064 por tanto se acepta la H
0
que indica que no existen diferencias entre hemoflicos e individuos sanos.
s =
_
(n
1
1)s
2
1
+(n
2
1)s
2
2
(n
1
+n
2
2)
=
_
1219,75
2
+1221,21
2
24
= 20, 5
IC
95%
(
1

2
) =
_
(x
1
x
2
) t
n1;/2

_
s
2
n
1
+
s
2
n
2
_
=14, 93 2, 064
_
20,5
2
13
+
20,5
2
13
=14, 93 16, 59
IC
95%
(
1

2
) = (
1

2
) [31, 52; 1, 66]
p =
4
13
= 0, 307
IC
95%
() =
_
p +z

_
p(1p)
n
_
= 0, 307 1, 96
_
0,3070,693
13
= 0, 307 0, 25 IC
95%
() = [0, 056; 0, 557]
Manuel Angel Barea Gmez 111
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
Problema 6.5. Tras la inyeccin intravenosa de digoxina en 10 varones adultos sanos, se realizaron mediciones en el suero a las
cuatro y ocho horas.
Sujeto 1 2 3 4 5 6 7 8 9 10
4 horas 1,0 1,3 0,9 1,0 1,0 0,9 1,3 1,1 1,0 1,3
8 horas 1,0 1,2 0,7 1,0 0,9 0,9 1,2 1,0 1,0 1,2
Suponiendo normalidad en los datos:
(a) Existe diferencia estadsticamente signicativa entre las concentraciones de digoxina a las 4 y 8 horas?
(b) Estimar mediante un intervalo de conanza, la diferencia media real de la concentracin de digoxina entre las 4 y 8 horas.
(c) Qu tamao muestral es necesario para que el error de estimacin sea inferior a 0,01?
Como se tratan de datos pareados, creamos nuestra tabla para analizar nuestro estadstico:
Sujeto 1 2 3 4 5 6 7 8 9 10
4 horas Y 1,0 1,3 0,9 1,0 1,0 0,9 1,3 1,1 1,0 1,3
8 horas X 1,0 1,2 0,7 1,0 0,9 0,9 1,2 1,0 1,0 1,2
d
i
=Y
i
X
i
0 0,1 0,2 0 0,1 0 0,1 0,1 0 0,1
_
_
_
D = 0, 07
s
D
= 0, 07
n = 10
_
H
0

1
=
2
H
1

1
=
2
El valor crtico es t
9;0,025
= 2, 262, el criterio de rechazo de H
0
ser |t| > 2, 262
t =

D
s
D

n
=
0,07
0,07

10
=
0,07
0,02
= 3, 5
|3, 5| > 2, 261 por tanto se rechaza la H
0
lo que indica que existen diferencias.
IC
95%
(
1

2
) =
_
Dt
n1;/2

s
D

n
_
= 0, 07 2, 262
0,07

10
= 0, 07 0, 05
IC
95%
(
1

2
) = (
1

2
) [0, 02; 0, 12]
=t
n1;/2

s
D

n
n =
(t
n1;/2
)
2
s
2
D

2
=
1,96
2
0,07
2
0,01
2
189
Problema 6.6. En un estudio realizado para determinar el desarrollo de recin nacidos de madres fumadoras, se ha determinado el
peso al nacer (en Kgs) de una muestra de 15 bebs:
2,6 2,8 2,5 3,2 3,5 2,6 2,9 3 3,1 2,8 3,6 2,5 2,4 2,8 3,2
Suponiendo normalidad en los datos:
Manuel Angel Barea Gmez 112
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
(a) Estimar mediante intervalos de conanza la media y la desviacin tpica de la distribucin del peso de los recin nacidos de
madres fumadoras.
(b) Podemos admitir que ms del 50% de los recin nacidos de madres fumadoras no alcanzan los 3 kg al nacer?
(c) Los bebs de la muestra han sido incluidos en un programa de recuperacin de peso, de modo que a los tres meses han pesado
respectivamente:
5,1 5,5 5,3 5,2 6,2 5,6 5,5 6,1 5,1 4,8 5,9 5,5 5,2 5,9 6,6
Podemos armar que el programa de recuperacin de peso permite incrementar el peso medio en ms de 2 kgs?
_
_
_
x = 2, 9
s = 0, 36
n = 15
IC
95%
() =
_
x t
n1;/2

n
_
= 2, 9 2, 145
0,36

15
= 2, 9 0, 2 IC
95%
() = [2, 7; 3, 1]
IC
95%
_

2
_
=
_
(n1)s
2

2
(n1);/2
;
(n1)s
2

2
(n1);(1/2)
_
=
_
140,36
2
26,12
;
140,36
2
5,63
_
=
2
[0, 069; 0, 32]
IC
95%
() = [0, 26; 0, 56]
La proporcin de nios con menos de 3kg es:
p =
9
15
= 0, 6
_
H
0

0
= 0, 5
H
1

0
> 0, 5
El valor crtico es z
0,95
= 1, 645, el criterio de rechazo de H
0
ser z > 1, 645
z =

0
_
(1)
n
=
0,60,5
_
0,60,4
15
= 0, 78
Como 0, 78 < 1, 645 no podemos admitir la hiptesis H
1
Pesos al nacer X 2,6 2,8 2,5 3,2 3,5 2,6 2,9 3 3,1 2,8 3,6 2,5 2,4 2,8 3,2
Pesos a los 3 meses Y 5,1 5,5 5,3 5,2 6,2 5,6 5,5 6,1 5,1 4,8 5,9 5,5 5,2 5,9 6,6
d
i
=Y
i
X
i
2,5 2,7 2,8 2 2,7 3 2,6 3,1 2 2 2,3 3 2,8 3,1 3,4
_
_
_
D = 2, 66
s
D
= 0, 47
n = 15
_
H
0

1

2
= 2
H
1

1

2
> 2
El valor crtico es t
14;0,05
= 1, 761, el criterio de rechazo de H
0
ser t > 1, 761
Manuel Angel Barea Gmez 113
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
t =

Dd
s
D

n
=
2,662
0,47

15
=
0,66
0,04
= 5, 43
Al ser 5, 43 > 1, 761 rechazamos la hiptesis nula y admitimos H
1
que indica un incremento de peso por encima de los 2kg
Problema 6.7. Se piensa que un programa regular de ejercicios moderados puede beneciar a los pacientes que han sufrido un
infarto de miocardio. En un estudio han intervenido 11 pacientes a los que se midi antes de comenzar el programa de ejercicios el
tiempo (en min.) que tardaban en alcanzar 160
pulsaciones
/min. en una prueba de esfuerzo, obtenindose los resultados:
Individuo 1 2 3 4 5 6 7 8 9 10 11
Tiempo 7,6 9,9 8,6 9,5 8,4 9,2 6,4 9,9 8,7 10,3 8,3
Despus de 25 semanas de ejercicios controlados, volvi a medirse dicho tiempo con la misma prueba de esfuerzo, obtenindose los
siguientes resultados:
Individuo 1 2 3 4 5 6 7 8 9 10 11
Tiempo 14,7 14,1 11,8 16,1 14,7 14,1 13,2 14,9 12,2 13,4 14,0
Suponiendo normalidad en los datos:
(a) Avalan estos datos ( = 0, 01) la hiptesis de que el programa regular de ejercicios benecia a estos pacientes?.
(b) Obtener un intervalo de conanza al 95% para la media y otro para la desviacin tpica del tiempo que tardan en alcanzar
las 160
pulsaciones
/min despus del programa de ejercicios.
Primeramedici on
_
_
_
x
1
= 8, 8
s
1
= 1, 14
n
1
= 11
25semanasdespu es
_
_
_
x
2
= 13, 93
s
2
= 1, 23
n
2
= 11
Como son datos pareados realizamos nuestra tabla:
Individuo 1 2 3 4 5 6 7 8 9 10 11
Tiempo 1 X 7,6 9,9 8,6 9,5 8,4 9,2 6,4 9,9 8,7 10,3 8,3
Tiempo2 Y 14,7 14,1 11,8 16,1 14,7 14,1 13,2 14,9 12,2 13,4 14,0
d
i
=Y
i
X
i
7,1 4,2 3,2 6,6 6,3 4,9 6,8 5 3,5 3,1 5,7
_
_
_
D = 5, 13
s
D
= 1, 48
n = 11
_
H
0

1
=
2
H
1

1
=
2
El valor crtico es t
10;0,025
= 2, 228, el criterio de rechazo de H
0
ser |t| > 2, 228
t =
0

D
s
D

n
=
5,13
1,48

11
=11, 49
Como |11, 49| > 2, 228 se rechaza H
0
y se admite que el programa regular de ejercicios benecia a estos pacientes.
Manuel Angel Barea Gmez 114
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
IC
95%
() =
_
x t
n1;/2

n
_
= 13, 93 2, 228
1,23

11
= 13, 93 0, 83 IC
95%
() = [13, 1; 14, 76]
IC
95%
_

2
_
=
_
(n1)s
2

2
(n1);/2
;
(n1)s
2

2
(n1);(1/2)
_
=
_
101,23
2
20,48
;
101,23
2
3,25
_
=
2
[0, 738; 4, 65]
IC
95%
() = [0, 859; 2, 15]
Problema 6.8. Para comprobar si la tolerancia a la glucosa en sujetos sanos tiende a decrecer con la edad se realiz un test oral
de glucosa a dos muestras de pacientes sanos, unos jvenes y otros adultos. El test consisti en medir el nivel de glucosa en sangre
antes de la ingestin (nivel basal) de 100grs. de glucosa y a los 60 minutos de la toma. Los resultados fueron los siguientes:
Jovenes
Basal 81 89 80 75 74 97 76 89 83 77
60 minutos 136 150 149 141 138 154 141 155 145 147
Adultos
Basal 98 94 93 88 79 90 86 89 81 90
60 minutos 196 190 191 189 159 185 182 190 170 197
(a) Se detecta una variacin signicativa del nivel de glucosa en sangre en cada grupo?
(b) Es mayor la concentracin de glucosa en sangre a los 60 minutos, en adultos que en jvenes?
(c) El contenido basal de glucosa en sangre, es menor en jvenes que en adultos?
(d) Pueden considerarse iguales en ambos grupos (jvenes y adultos) las variaciones que provocan la ingestin de glucosa?
Como son datos pareados realizamos nuestras tablas:
Jvenes
Basal X 81 89 80 75 74 97 76 89 83 77
60 minutos Y 136 150 149 141 138 154 141 155 145 147
d
i
=Y
i
X
i
55 61 69 66 64 57 65 66 62 70
Adultos
Basal X 98 94 93 88 79 90 86 89 81 90
60 minutos Y 196 190 191 189 159 185 182 190 170 197
d
i
=Y
i
X
i
98 96 98 101 80 95 96 101 89 107
J ovenes
_
_
_
D =63, 5
s
D
= 4, 84
n = 10
Adultos
_
_
_
D =96, 1
s
D
= 7, 34
n = 10
Para los datos de los jvenes:
_
H
0

1
=
2
H
1

1
=
2
El valor crtico es t
9;0,025
= 2, 263, el criterio de rechazo de H
0
ser |t| > 2, 262
t =
0D
s
D

n
=
63,5
4,84

10
= 41, 48
Manuel Angel Barea Gmez 115
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
Como |41, 48| > 2, 262 se rechaza H
0
y se admite H
1
que indica la variacin del nivel de glucosa en los jvenes.
Para los datos de los adultos:
_
H
0

1
=
2
H
1

1
=
2
El valor crtico es t
9;0,025
= 2, 263, el criterio de rechazo de H
0
ser |t| > 2, 262
t =
0D
s
D

n
=
96,1
7,34

10
= 41, 40
Como |41, 40| > 2, 262 se rechaza H
0
y se admite H
1
que indica la variacin del nivel de glucosa en los adultos.
Para comprobar s la concentracin de glucosa a los 60 minutos es mayor en adultos,
J ovenes60min
_
_
_
x
1
= 88, 8
s
1
= 6, 54
n
1
= 10
Adultos60min
_
_
_
x
2
= 184, 9
s
2
= 11, 91
n
2
= 10
_
H
0

1
=
2
H
1

1
<
2
Contrastamos en primer lugar la igualdad entre las varianzas. considerando muestras independientes.
_
H
0

1
=
2
H
1

1
=
2
F =
s
2
1
s
2
2
=
6,54
2
11,91
2
= 0, 30
Se rechaza H
0
si F no pertenece al intervalo de nuestro estadstico.
Para una = 0, 05
_
F
0,975;9;9
= 4, 026
F
0,025;9;9
=
1
4,026
= 0, 248
como 0, 30 (0, 248; 4, 026), se acepta H
0
y por tanto
1
=
2
Por tener las varianzas poblacionales iguales v = n
1
+n
2
2 = 10 +10 2 = 18
El valor crtico es t
18;0,95
= 1, 734, el criterio de rechazo de H
0
ser t < 1, 734
s =
_
(n
1
1)s
2
1
+(n
2
1)s
2
2
(n
1
+n
2
2)
=
_
96,54
2
+911,91
2
18
= 9, 60
t =
x
1
x
2
_
s
2
n
1
+
s
2
n
2
=
145,6184,9
_
9,60
2
10
+
9,60
2
10
=
39,3
4,29
=9, 15
9, 15 < 1, 734 por tanto se rechaza H
0
y se acepta H
1
que indica que la concentracin de glucosa en sangre a los 60 minutos, es
mayor en adultos que en jvenes
Para el apartado (c)
Manuel Angel Barea Gmez 116
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
J ovenesbasal
_
_
_
x
1
= 82, 1
s
1
= 7, 48
n
1
= 10
Adultosbasal
_
_
_
x
2
= 88, 8
s
2
= 5, 74
n
2
= 10
_
H
0

1
=
2
H
1

1
<
2
Contrastamos en primer lugar la igualdad entre las varianzas. considerando muestras independientes.
_
H
0

1
=
2
H
1

1
=
2
F =
s
2
1
s
2
2
=
7,48
2
5,74
2
= 1, 69
Se rechaza H
0
si F no pertenece al intervalo de nuestro estadstico.
Para una = 0, 05
_
F
0,975;10;10
= 3, 717
F
0,025;10;10
=
1
3,115
= 0, 269
como 1, 69 (0, 269; 3, 717), se acepta H
0
y por tanto
1
=
2
Por tener las varianzas poblacionales iguales v = n
1
+n
2
2 = 10 +10 2 = 18
El valor crtico es t
18;0,95
= 1, 734, el criterio de rechazo de H
0
ser t < 1, 734
s =
_
(n
1
1)s
2
1
+(n
2
1)s
2
2
(n
1
+n
2
2)
=
_
97,48
2
+95,74
2
18
= 6, 66
t =
x
1
x
2
_
s
2
n
1
+
s
2
n
2
=
82,188,8
_
6,66
2
10
+
6,66
2
10
=
6,7
2,97
=2, 25
2, 25 < 1, 734 por tanto se rechaza H
0
y se acepta H
1
que indica que la concentracin de glucosa en sangre a los 60 minutos, es
menor en jvenes que en adultos.
Para el apartado (d)
J ovenes
_
_
_
x
1
=63, 5
s
1
= 4, 84
n
1
= 10
Adultos
_
_
_
x
2
=96, 1
s
2
= 7, 34
n
2
= 10
_
H
0

1
=
2
H
1

1
=
2
Contrastamos en primer lugar la igualdad entre las varianzas. considerando muestras independientes.
_
H
0

1
=
2
H
1

1
=
2
Manuel Angel Barea Gmez 117
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
F =
s
2
1
s
2
2
=
4,84
2
7,34
2
= 0, 43
Se rechaza H
0
si F no pertenece al intervalo de nuestro estadstico.
Para una = 0, 05
_
F
0,975;9;9
= 4, 026
F
0,025;9;9
=
1
4,026
= 0, 248
como 0, 43 (0, 248; 4, 026), se acepta H
0
y por tanto
1
=
2
Por tener las varianzas poblacionales iguales v = n
1
+n
2
2 = 10 +10 2 = 18
El valor crtico es t
18;0,975
= 2, 101, el criterio de rechazo de H
0
ser |t| > 2, 101
s =
_
(n
1
1)s
2
1
+(n
2
1)s
2
2
(n
1
+n
2
2)
=
_
94,84
2
+97,34
2
18
= 6, 21
t =
x
1
x
2
_
s
2
n
1
+
s
2
n
2
=
63,5(96,1)
_
6,21
2
10
+
6,21
2
10
=
32,6
2,77
= 11, 73
11, 73 > 2, 101 por tanto se rechaza H
0
y se acepta H
1
que indica que no son iguales la concentracin de glucosa en sangre de jvenes
y adultos.
Problema 6.9. Se ha realizado un estudio para analizar el efecto del ejercicio fsico en el nivel de colesterol en plasma, en el que
participaron 16 sujetos (7 hombres y 9 mujeres). Antes del ejercicio, se tomaron muestras de sangre para determinar el nivel de
colesterol de cada participante. Despus, los individuos fueron sometidos a un programa de ejercicios, al nal del cual se tomaron
nuevas muestras de sangre y se obtuvo una segunda lectura del nivel de colesterol en plasma. Los datos recogidos aparecen en la
tabla:
Sexo M M M M M M M M M H H H H H H H
Nivel previo 182 232 191 200 148 249 276 213 241 480 262 256 300 190 225 330
Nivel posterior 198 210 194 220 138 220 219 161 210 313 226 200 194 210 190 250
Suponiendo normalidad en los datos:
(a) Se puede concluir que en general el nivel medio de colesterol se reduce haciendo ejercicio fsico?
(b) Estimar por medio de un intervalo de conanza, la proporcin de sujetos donde el nivel de colesterol se reduce.
(c) Se puede concluir que la variacin del nivel de colesterol al realizar ejercicio fsico, es la misma en hombres y mujeres?
Nivel previo X 182 232 191 200 148 249 276 213 241 480 262 256 300 190 225 330
Nivel posterior Y 198 210 194 220 138 220 219 161 210 313 226 200 194 210 190 250
d
i
= X
i
Y
i
-16 22 -3 -20 10 29 57 52 31 167 36 56 106 -20 35 80
_
_
_
D = 38, 875
s
D
= 49, 265
n = 16
_
H
0

1
=
2
H
1

1
>
2
Manuel Angel Barea Gmez 118
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
El valor crtico es t
15;0,05
= 1, 753, el criterio de rechazo de H
0
ser t > 1, 753
t =
D
s
D

n
=
38,875
49,265

16
= 3, 13
Como 3, 13 >1, 753 se rechaza H
0
y se admite H
1
que indica que en general el nivel medio de colesterol se reduce haciendo ejercicio
fsico
La proporcin donde se reduce es:
p =
12
16
= 0, 75
IC
95%
() =
_
p +z

_
p(1p)
n
_
= 0, 75 1, 96
_
0,750,25
16
= 0, 75 0, 21 IC
95%
() = [0, 54; 0, 96]
Para comparar la variacin entre hombre y mujeres da las tablas se obtienen los siguientes resultados:
Hombres
_
_
_
x
1
= 18
s
1
= 27, 58
n = 9
Mu jeres
_
_
_
x
2
= 65, 71
s
2
= 59, 65
n = 7
_
H
0

1
=
2
H
1

1
=
2
Contrastamos en primer lugar la igualdad entre las varianzas. considerando muestras independientes.
_
H
0

1
=
2
H
1

1
=
2
F =
s
2
1
s
2
2
=
27,58
2
59,65
2
= 0, 21
Se rechaza H
0
si F no pertenece al intervalo de nuestro estadstico.
Para una = 0, 05
_
F
0,975;8;7
= 4, 899
F
0,025;8;7
=
1
4,995
= 0, 200
como 0, 21 (0, 200; 4, 899), se acepta H
0
y por tanto
1
=
2
Por tener las varianzas poblacionales iguales v = n
1
+n
2
2 = 9 +7 2 = 14
El valor crtico es t
14;0,975
= 2, 145, el criterio de rechazo de H
0
ser |t| > 2, 145
s =
_
(n
1
1)s
2
1
+(n
2
1)s
2
2
(n
1
+n
2
2)
=
_
927,58
2
+759,65
2
14
= 47, 62
t =
x
1
x
2
_
s
2
n
1
+
s
2
n
2
=
1865,71
_
47,62
2
9
+
47,62
2
7
=
47,71
24
=1, 98
|1, 98| < 2, 145 por tanto se acepta H
0
y se rechaza H
1
Manuel Angel Barea Gmez 119
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
Problema 6.10. En un estudio sobre los factores de riesgo que inuyen en la aparicin de tuberculosis entre usuarios de drogas
administradas por va intravenosa, se tom un grupo de 97 individuos que compartan jeringa, obteniendo un 27,4% de resultados
positivos a la prueba de la tuberculina, mientras que de los 161 individuos que negaron compartirlas, el 17,4% obtuvo resultado
positivo en la prueba.
(a) Puede admitirse que hay diferencias entre ambos grupos ( = 0, 01)?.
(b) Construir un intervalo de conanza al 98% para la proporcin de usuarios de drogas administradas por va intravenosa que
dan resultados positivos a la prueba de la tuberculina (compartiendo o no la jeringa).
_
p
1
= 0, 274
n
1
= 97
_
p
2
= 0, 174
n
2
= 161
_
H
0

1
=
2
H
1

1
=
2
El valor crtico es z
0,005
= 1, 96 el criterio de rechazo de H
0
ser |z| > 2, 575
p =
n
1
p
1
+n
2
p
2
n
1
+n
2
=
970,274+1610,174
97+161
= 0, 211
z =
p
1
p
2
_
p(1p)
n
1
+
p(1p)
n
2
=
0,2740,174
_
0,2740,726
97
+
0,1740,876
161
=
0,1
0,055
= 1, 82
Como |1, 82| < 2, 575 se acepta H
0
y por tanto no existen diferencias entre ambos grupos.
Para el apartado (b)
p =
n
1
p
1
+n
2
p
2
n
1
+n
2
=
970,274+1610,174
97+161
= 0, 211
IC
98%
() =
_
(p
1
p
2
) z
/2

_
p(1p)
n
_
= 0, 211 2, 33
_
0,2110,789
258
= 0, 211 0, 059
IC
98%
() = () [0, 152; 0, 27]
Problema 6.11. A la hora de probar si dos medicamentos actan de la misma forma contra una enfermedad grave, se sabe que al
tratar 10 animales de laboratorio con el primero de ellos se ha obtenido un intervalo de conanza al 80% de [1165, 89; 1234, 11]
del nmero medio de horas que sobreviven. Por otra parte, al tratar a 16 animales de laboratorio con el segundo medicamento, el
nmero medio de horas que sobreviven es 1400, con una cuasivarianza de 4356.
(a) Puede aceptarse la igualdad de las varianzas poblacionales( = 0, 10)?.
(b) Es ms efectivo el segundo medicamento?.
(c) Construir un Intervalo de Conanza al 99% para la diferencia del nmero medio de horas que sobreviven.
_
x
in f
= x t
n1,/2

n
1165, 89 = x 2, 262
s

10
x
sup
= x +t
n1,/2

n
1234, 11 = x +2, 262
s

10
Resolviendo
_
x = 1200
s = 60, 26
Por tanto tenemos dos muestras con los siguientes estadsticos:
Manuel Angel Barea Gmez 120
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
_
_
_
x
1
= 1200
s
1
= 60, 26
n
1
= 10
_
_
_
x
2
= 1400
s
2
= 66
n
2
= 16
_
H
0

1
=
2
H
1

1
=
2
F =
s
2
1
s
2
2
=
60,26
2
66
2
= 0, 83
Se rechaza H
0
si F no pertenece al intervalo de nuestro estadstico.
Para una = 0, 10
_
F
0,95;9;15
= 2, 544
F
0,15;9;15
=
1
3,006
= 0, 332
como 0, 83 (0, 332; 2, 544), se acepta H
0
y por tanto
1
=
2
Para comprobar si es ms efectivo el medicamento, formulamos la hiptesis y calculamos para una = 0, 05
_
H
0

1
=
2
H
1

1
<
2
Por tener las varianzas poblacionales iguales v = n
1
+n
2
2 = 10 +16 2 = 24
El valor crtico es t
24;0,975
= 2, 064, el criterio de rechazo de H
0
ser t < 2, 0, 64
s =
_
(n
1
1)s
2
1
+(n
2
1)s
2
2
(n
1
+n
2
2)
=
_
960,26
2
+1566
2
24
= 63, 90
t =
x
1
x
2
_
s
2
n
1
+
s
2
n
2
=
12001400
_
63,90
2
10
+
63,90
2
16
=
200
25,75
=1, 98
|1, 98| < 2, 145 por tanto se acepta H
0
y se rechaza H
1
IC
99%
(
2

1
) = (x
2
x
1
) t
24;0,995

_
s
2
n
1
+
s
2
n
2
= 200 2, 797
_
63,90
2
10
+
63,90
2
16
= 200 72, 04
IC
99%
(
2

1
) [127, 96; 272, 04]
Problema 6.12. Se quiere averiguar si tres tipos de complejos vitamnicos (V
1
,V
2
,V
3
) producen los mismos efectos en el aumento
de peso de los conejos. Tomamos 15 conejos y le asignamos al azar un complejo vitamnico a cada uno. Despus de un tiempo, el
aumento de peso (grs.) ha sido:
Conejo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Complejo Vitamnico V
1
V
2
V
3
V
1
V
2
V
3
V
3
V
2
V
1
V
1
V
2
V
1
V
3
V
3
V
1
Aumento en grs. 81 91 75 75 92 83 80 97 69 77 88 71 72 60 71
(a) Suponiendo normalidad en los datos, podemos armar que los 3 complejos vitamnicos inuyen del mismo modo en el
aumento de peso? ( = 0, 05)
Manuel Angel Barea Gmez 121
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
Problema 6.13. En el curso de un estudio para determinar los efectos de poner n a un bloqueo renal en pacientes cuya funcin
renal est deteriorada a causa de una metstasis maligna avanzada, se midi la tensin arterial de cada paciente antes y despus de
la operacin. Los resultados son los siguientes (considere que la distribucin de la tensin arterial es Normal):
Paciente 1 2 3 4 5 6 7 8 9 10
Antes de la intervencin 150 132 130 116 107 100 101 96 90 78
Despus de la intervencin 90 102 80 82 90 94 84 98 89 85
(a) Puede concluirse que la operacin quirrgica tiende a disminuir la tensin arterial?
(b) Estimar mediante un IC la diferencia de medias de tensiones arteriales.
(c) Estimar mediante un IC del 99% la varianza de la tensin despus de la intervencin.
Paciente 1 2 3 4 5 6 7 8 9 10
Antes de la intervencin X 150 132 130 116 107 100 101 96 90 78
Despus de la intervencin Y 90 102 80 82 90 94 84 98 89 85
d
i
= X
i
Y
i
60 30 50 34 17 6 17 -2 1 -7
Con una = 0, 05 tenemos:
_
_
_
D = 20, 6
s
D
= 22, 56
n = 10
_
H
0

1
=
2
H
1

1
<
2
El valor crtico es t
9;0,05
= 1, 383, el criterio de rechazo de H
0
ser t < 1, 383
t =
D
s
D

n
=
20,6
22,56

10
= 0, 28
Como 0, 28 > 1, 383 se rechaza H
0
y se admite H
1
que indica que la operacin quirrgica tiende a disminuir la tensin arterial
Contrastamos en primer lugar la igualdad entre las varianzas. considerando muestras independientes.
Antes
_
_
_
x
1
= 110
s
1
= 21, 93
n
1
= 10
Despu es
_
_
_
x
2
= 89, 40
s
2
= 7, 04
n
2
= 10
_
H
0

1
=
2
H
1

1
=
2
F =
s
2
1
s
2
2
=
21,93
2
7,04
2
= 9, 70
Se rechaza H
0
si F no pertenece al intervalo de nuestro estadstico.
Manuel Angel Barea Gmez 122
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
Para una = 0, 05
_
F
0,975;9;9
= 4, 026
F
0,025;9;9
=
1
3,717
= 0, 248
como 9, 70 / (0, 248; 4, 026), se rechaza H
0
y por tanto
1
=
2
Por tener las varianzas poblacionales distintas v =
(n
1
s
2
1
+n
2
s
2
2
)
2
(n
1
s
2
1
)
2
n
1
1
+
(n
2
s
2
2
)
2
n
2
1
=
(1021,93
2
+107,04
2
)
(1021,93
2
)
2
9
+
(107,04
2
)
2
9
=
28141592,67
2597167,91
= 10, 8 11
IC
95%
= (
1

2
) t
v;/2

_
s
2
1
n
1
+
s
2
2
n
2
= (110 89, 40)2, 201
_
21,93
2
10
+
7,04
2
10
= 20, 6 16, 03
IC
95%
(
1

2
) [4, 57; 36, 63]
IC
99%
_

2
_
=
_
(n1)s
2

2
(n1);/2
;
(n1)s
2

2
(n1);(1/2)
_
=
_
97,04
2
23,59
;
97,04
2
1,73
_
= IC
99%
_

2
_
[18, 90; 257, 83]
Problema 6.14. Una compaa farmacutica investiga los efectos producidos por tres compuestos. La investigacin consiste en
aplicar los compuestos a 26 ratones de caractersticas similares y anotar los tiempos de reaccin. Los animales se clasican aleato-
riamente en 3 grupos de 8, 6 y 12 ratones respectivamente. A cada grupo se le administra un compuesto diferente, obtenindose los
siguientes resultados:
Tiempo de reaccin medido en min.
Grupo 1 6 7 5 6 5 8 4 7
Grupo 2 10 9 9 10 10 6
Grupo 3 3 4 8 3 7 6 3 6 4 7 6 3
(a) Suponiendo normalidad en los datos, podemos armar que los tres compuestos producen los mismos efectos( = 0, 05)?
Para evaluar el ejercicio se realizar un ANOVA para ello en primer lugar se obtienen los datos estadsticos de los distintos grupos:
Grupo1
_
_
_
x
1
= 6
s
1
= 1, 309
n
1
= 8
Grupo2
_
_
_
x
2
= 9
s
2
= 1, 549
n
2
= 6
Grupo3
_
_
_
x
2
= 5
s
2
= 1, 859
n
2
= 12
Nuestra hiptesis es:
_
H
0

1
=
2
=
3
H
1
= alasdem as
Llamando K al nmero de grupos,en nuestro caso 3 y N al nmero total de muestras, es decir, N =8+6+12=26, nuestro estadstico
se hallar con la F de Snedecor, donde es F
;K1:NK
El valor crtico es F
0,05;2,23
= 3, 439, el criterio de rechazo de H
0
ser F > 3, 439
En primer lugar hallamos la media de los grupos
x
T
=
x
i
K
=
6+9+5
3
= 6, 67
Llamamos SCE ,Suma de los cuadrados entre grupos, a la expresin
SCE = (x
i
x
T
)
2
n
i
= (6 6, 67)
2
8 +(9 6, 67)
2
6 +(5 6, 67)
2
12 = 69, 63
Manuel Angel Barea Gmez 123
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
Llamamos SCD ,Suma de los cuadrados dentro de los grupos o intragrupos, a la expresin
SCD = (n
i
1) s
2
i
= 7 1, 309
2
+5 1, 549
2
+11 1, 859
2
= 62
Por ltimo, hallamos nuestro estadstico
F =
SCE
K1
SCD
NK
=
69,83
2
62
23
= 12, 9
Como 12, 9 > 3, 439 se rechaza H
0
y se puede armar que los tres compuestos no producen los mismos efectos.
Problema 6.15. En un hospital de la ciudad es relativamente frecuente que los pacientes no acudan el da en el que fueron citados.
Para comprobar si una llamada telefnica el da anterior a la cita incrementa el cumplimiento, de los 45 pacientes citados un da se
telefone a 25 pacientes, de los cuales cumplieron con su cita 20. Por otra parte, de los 20 que no fueron telefoneados, acudieron
slo 8 a su cita.
(a) Puede armarse el efecto de la llamada telefnica?
(b) Calcule un intervalo de conanza al 98% de la diferencia de porcentajes de cumplimiento.
Llamadad aanterior
_
p
1
= 0, 8
n
1
= 25
Sinllamadad aanterior
_
p
1
= 0, 4
n
1
= 20
p =
n
1
p
1
+n
2
p
2
n
1
+n
2
=
250,8+200,4
25+20
= 0, 622
_
H
0

1
=
2
H
1

1
=
2
El valor crtico es z
0,975
= 1, 96, el criterio de rechazo de H
0
ser |z| > 1, 96
z =
p
1
p
2
_
p(1p)
n
1
+
p(1p)
n
2
=
0,80,4
_
0,6220,378
25
+
0,6220,378
20
=
0,4
0,14
= 2, 75
Se rechaza de H
0
porque 2, 75 > 1, 96, por tanto existen efectos de la llamada telefnica.
IC
99%
(
1

2
) = (p
1
p
2
) z
0,99

_
p(1p)
n
1
+
p(1p)
n
2
= 0, 4 2, 33 0, 14 = 0, 4 0, 32
IC
99%
(
1

2
) [0, 08; 0, 78]
Problema 6.16. Una de las variables que se utiliza para comparar las caractersticas fsicas de las nadadoras olmpicas con las de
las corredoras es la circunferencia de la parte superior del brazo, en cm., mientras estn relajadas. Un investigador obtuvo con una
muestra de 10 nadadoras para esta variable un intervalo de conanza al 99% para la media de (25, 35; 29, 25), mientras que con
una muestra de 12 corredoras obtuvo una media de 23, 5cm y una desviacin tpica de 1, 7cm. Suponiendo normalidad en los datos:
Manuel Angel Barea Gmez 124
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
(a) Obtener un intervalo de conanza al 90% para la desviacin tpica de esta variable en la poblacin de nadadoras.
(b) Decidir si puede armarse que la media de la circunferencia de la parte superior del brazo es mayor en las nadadoras que en
las corredoras.
_
x
in f
= x t
n1,/2

n
25, 35 = x 3, 250
s

10
x
sup
= x +t
n1,/2

n
29, 25 = x +3, 250
s

10
Resolviendo
_
x
1
= 27, 3
s
1
= 1, 89
IC
90%
_

2
_
=
_
(n1)s
2

2
(n1);/2
;
(n1)s
2

2
(n1);(1/2)
_
=
_
91,89
2
16,92
;
91,89
2
3,33
_
= IC
90%
_

2
_
[1, 9; 9, 65]
IC
90%
() [1, 378; 3, 107]
_
H
0

1
=
2
H
1

1
=
2
F =
s
2
1
s
2
2
=
1,89
2
1,7
2
= 1, 23
Se rechaza H
0
si F no pertenece al intervalo de nuestro estadstico.
Para una = 0, 05
_
F
0,975;9;11
= 3, 588
F
0,025;9;11
=
1
3,912
= 0, 255
como 1, 23 (0, 255; 3, 588), se acepta H
0
y por tanto
1
=
2
_
H
0

1
=
2
H
1

1
>
2
Por tener las varianzas poblacionales iguales v = n
1
+n
2
2 = 10 +12 2 = 20
El valor crtico es t
20;0,05
= 1, 725, el criterio de rechazo de H
0
ser t > 1, 725
s =
(n
1
1)s
2
1
+(n
2
1)s
2
2
n
1
+n
2
2
=
91,89
2
+111,7
2
20
= 3, 19
t =
x
1
x
2
_
s
2
n
1
+
s
2
n
2
=
27,323,5
_
3,19
2
10
+
3,19
2
12
=
3,8
1,36
= 2, 79
Por tanto, como 2, 79 >1, 720 se rechaza H
0
y se acepta H
1
que indica que la media de la circunferencia de la parte superior del brazo
es mayor en las nadadoras que en las corredoras.
Problema 6.17. En un tratamiento contra la hipertensin se seleccionaron 21 enfermos de caractersticas similares. A cada enfermo
se le administr uno de los frmacos P, A, B, al azar, formando 3 grupos. El grupo P tom placebo (frmaco inocuo) y los otros dos
tomaron A y B respectivamente. Para valorar la ecacia de los tratamientos, se registr el descenso de la presin diastlica desde el
estado basal (inicio del tratamiento) hasta el estado al cabo de una semana de tratamiento. Los resultados fueron:
Manuel Angel Barea Gmez 125
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
P 10 0 15 -20 0 -5
A 20 25 33 25 30 18 0
B 15 10 25 30 15 35 25 22
Para un nivel de signicacin del 5% y suponiendo normalidad, se pide:
(a) Estudiar si existen diferencias signicativas entre los tres tratamientos.
(b) Estudiar si existen diferencias signicativas entre los tratamientos A y B.
Grupo1
_
_
_
x
1
= 0
s
1
= 12, 247
n
1
= 6
Grupo2
_
_
_
x
2
= 21, 571
s
2
= 10, 845
n
2
= 7
Grupo3
_
_
_
x
2
= 22, 125
s
2
= 8, 391
n
2
= 8
Nuestra hiptesis es:
_
H
0

1
=
2
=
3
H
1
= alasdem as
Llamando K al nmero de grupos,en nuestro caso 3 y N al nmero total de muestras, es decir, N =6+7+8 = 21, nuestro estadstico
se hallar con la F de Snedecor, donde es F
;K1:NK
El valor crtico es F
0,05;2,18
= 3, 555, el criterio de rechazo de H
0
ser F > 3, 555
En primer lugar hallamos la media de los grupos
x
T
=
x
i
K
=
0+21,571+6,25
3
= 9, 27
Llamamos SCE ,Suma de los cuadrados entre grupos, a la expresin
SCE = (x
i
x
T
)
2
n
i
= (0 9, 27)
2
6 +(21, 571 9, 27)
2
7 +(22, 125 9, 27)
2
8 = 2370
Llamamos SCD ,Suma de los cuadrados dentro de los grupos o intragrupos, a la expresin
SCD = (n
i
1) s
2
i
= 5 12, 247
2
+6 10, 845
2
+7 8, 391
2
= 1948, 5
Por ltimo, hallamos nuestro estadstico
F =
SCE
K1
SCD
NK
=
2370
2
1948,5
18
= 10, 94
Como 10, 94 > 3, 439 se rechaza H
0
y se puede armar que los tres frmacos no tienen la misma ecacia.
El segundo apartado compara los tratamientos A y B. En primer lugar comparamos las varianzas poblacionales
_
H
0

2
=
3
H
1

2
=
3
F =
s
2
2
s
2
3
=
10,845
2
8,391
2
= 1, 67
Se rechaza H
0
si F no pertenece al intervalo de nuestro estadstico.
Manuel Angel Barea Gmez 126
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
Para una = 0, 05
_
F
0,975;6;7
= 5, 119
F
0,025;6;7
=
1
5,119
= 0, 195
como 1, 63 (0, 195; 5, 119), se acepta H
0
y por tanto
2
=
3
Para comprobar si es ms efectivo el medicamento, formulamos la hiptesis y calculamos para una = 0, 05
_
H
0

1
=
2
H
1

1
=
2
Por tener las varianzas poblacionales iguales v = n
1
+n
2
2 = 7 +8 2 = 13
El valor crtico es t
13;0,975
= 2, 160, el criterio de rechazo de H
0
ser |t| > 2, 160
s =
_
(n
1
1)s
2
1
+(n
2
1)s
2
2
(n
1
+n
2
2)
=
_
610,845
2
+78,391
2
13
= 7, 66
t =
x
1
x
2
_
s
2
n
1
+
s
2
n
2
=
21,75122,125
_
7,66
2
7
+
7,66
2
8
=
0,375
3,96
=0, 09
|0, 09| < 2, 160 por tanto se acepta H
0
que arma que no existen diferencias entre los tratamientos A y B.
Problema 6.18. Es conocido que la falta de oxgeno que se respira en alta montaa es la causa de todos los males de los escaladores.
Se ha realizado un estudio para analizar la saturacin de oxgeno en sangre de los alpinistas, recogiendo para ello una muestra
formada por 9 mujeres y 8 hombres alpinistas en la que se ha obtenido el nivel de saturacin de oxgeno en sangre, medido en una
escala de porcentaje de 0% a 100%:
Sexo M M M M M M M M M H H H H H H H H
Nivel O
2
61 73 67 70 70 75 69 69 71 63 67 62 79 65 68 68 61
Suponiendo normalidad en los datos:
(a) Estimar mediante un intervalo de conanza con un nivel de signicacin de 0,02 la media de saturacin en el grupo de las
mujeres alpinistas.
(b) Niveles de oxgeno inferiores o iguales al 67% provocan mareos y desorientacin, puede armarse, con un nivel de signi-
cacin de 0,05, que ms del 50% de los alpinistas sufren mareos o desorientacin?
(c) Puede armarse que los niveles medios de oxgeno son distintos para ambos sexos?
Datos estadsticos por sexo:
Mu jeres
_
_
_
x
1
= 68, 58
s
1
= 4, 67
n
1
= 9
Hombre
_
_
_
x
2
= 69, 44
s
2
= 3, 94
n
2
= 8
IC
98%
() = x
1
t
n
1
1;/2

s
1
n
1
= 68, 58 2, 306
4,67

9
= 68, 58 3, 59 IC
98%
() [64, 99; 72, 17]
El apartado (b) es un contraste de hiptesis de proporciones
p =
7
17
= 0, 41
Manuel Angel Barea Gmez 127
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
_
H
0
= 0, 5
H
1
> 0, 5
El valor crtico para una = 5% es z
/2
= 1, 96, el criterio de rechazo ser z > 1, 54
z =
p
_
(1)
n
=
0,410,5
_
0,50,5
17
=0, 742
Por tanto H
0
y no ms del 50% de los alpinistas sufren mareos o desorientacin.
El apartado (c) es un contraste de hiptesis de diferencias de medias
En primer lugar comparamos las varianzas poblacionales
_
H
0

1
=
2
H
1

1
=
2
F =
s
2
1
s
2
2
=
4,67
2
3,95
2
= 1, 39
Se rechaza H
0
si F no pertenece al intervalo de nuestro estadstico.
Para una = 0, 05
_
F
0,975;8;7
= 4, 899
F
0,025;8;7
=
1
4,357
= 0, 204
como 1, 39 (0, 204; 4, 899), se acepta H
0
y por tanto
1
=
2
Para comprobar si es ms efectivo el medicamento, formulamos la hiptesis y calculamos para una = 0, 05
_
H
0

1
=
2
H
1

1
=
2
Por tener las varianzas poblacionales iguales v = n
1
+n
2
2 = 9 +8 2 = 15
El valor crtico es t
15;0,975
= 2, 131, el criterio de rechazo de H
0
ser |t| > 2, 131
s =
_
(n
1
1)s
2
1
+(n
2
1)s
2
2
(n
1
+n
2
2)
=
_
84,67
2
+73,95
2
15
= 4, 34
t =
x
1
x
2
_
s
2
n
1
+
s
2
n
2
=
68,5869,44
_
4,34
2
9
+
4,34
2
8
=
0,86
2,10
=0, 409
|0, 409| < 2, 133 por tanto se acepta H
0
que arma que no existen diferencias entre ambos sexos
Problema 6.19. Un equipo mdico asegura que la metformina rebaja los niveles de glucosa en sangre. Para comprobarlo, selec-
cionan un grupo de 10 pacientes con diabetes Mellitus II, a los que se le mide la cantidad de azcar en sangre en ayunas, antes del
tratamiento y despus de un mes de tratamiento obteniendo los siguientes resultados:
Nivel glucosa antes 125 160 110,00 135 125 129 148 140 169 145
Nivel glucosa despus 100 129 89 105 116 105 122 113 125 99
Manuel Angel Barea Gmez 128
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
Suponiendo que los datos son normales:
(a) Podemos admitir con un nivel de signicacin de ( = 0, 02) la armacin del equipo mdico.
(b) Calcule un intervalo al 95% de conanza para la media del nivel de glucosa despus del tratamiento.
Nivel glucosa antes X 125 160 110,00 135 125 129 148 140 169 145
Nivel glucosa despus Y 100 129 89 105 116 105 122 113 125 99
d
i
= X
i
Y
i
25 31 21 30 9 24 26 27 44 46
_
_
_

D = 28, 30
s
D
= 10, 71
n = 10
_
H
0

1
=
2
H
1

1
>
2
El valor crtico es z
0,98
= 2, 055, el criterio de rechazo de H
0
ser t > 2, 055
z =
|

D|
s
D

n
=
28,30
10,71

10
= 8, 35
Al ser 8, 35 > 2, 055 admite H
1
que indica que el nivel de glucosa disminuye despus del tratamiento.
Para el apartado (b) los datos son:
_
_
_
x
1
= 110, 30
s
1
= 12, 85
n = 10
IC
95%
() = x
1
t
n
1
1;/2

s
1
n
1
= 110, 30 2, 262
12,85

10
= 110, 30 9, 19 IC
95%
() [101, 10; 119, 49]
Problema 6.20. Un dietista toma dos muestras formadas por 50 y 60 personas, respectivamente. Propone a los primeros seguir la
dieta A y a los segundos las dieta B. En ambos casos, el nmero de personas que consiguen reducir el peso de forma signicativa es
40. Se pide:
(a) Calcular el intervalo de conanza del 95% para la diferencia de las correspondientes proporciones.
(b) Se podra concluir que la proporcin de personas que consiguen reducir el peso de forma signicativa es mayor con la dieta
A?
A
_
p
1
=
40
50
= 0, 8
n
1
= 50
B
_
p
2
=
40
60
= 0, 67
n
2
= 60
Manuel Angel Barea Gmez 129
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
IC
95%
(
1

2
) = (p
1
p
2
) z
/2

_
p
1
(1p
1
)
n
1
+
p
2
(1p
2
)
n
2
= (0, 8 0, 67)1, 96
_
0,80,2
50
+
0,670,23
60
= 0, 13 0, 148
IC
95%
(
1

2
) [0, 018; 0, 278]
p =
n
1
p
1
+n
2
p
2
n
1
+n
2
=
500,8+600,67
50+60
= 0, 727
_
H
0

1
=
2
H
1

1
>
2
El valor crtico es z
0,95
= 1, 645, el criterio de rechazo de H
0
ser z > 1, 645
z =
p
1
p
2
_
p(1p)
n
1
+
p(1p)
n
2
=
0,80,677
_
0,7270,273
50
+
0,7270,273
60
=
0,123
0,085
= 1, 44
Se acepta H
0
porque 1, 44 < 1, 645, por tanto no se puede concluir la hiptesis formulada respecto a la dieta A.
Problema 6.21. En un estudio de angina de pecho en ratas, se dividi aleatoriamente a 18 animales afectados, en dos grupos de
9 individuos cada uno. A un grupo se le suministr un placebo y al otro el frmaco experimental FL113. Despus de un ejercicio
controlado sobre una rueda de andar, se determin el tiempo de recuperacin de cada rata. Se piensa que el FL113 reducir el
tiempo medio de recuperacin. Se dispone de la siguiente informacin:
Placebo
_
_
_
x
1
= 329seg.
s
1
= 45seg.
n
1
= 9
FL113
_
_
_
x
2
= 238seg.
s
2
= 43seg.
n
2
= 9
(a) Construya un intervalo de conanza del 95% para la diferencia de los tiempos medios de recuperacin de las ratas que
recibieron placebo y las que recibieron el FL113.
(b) Es cierta la suposicin de que el FL113 reducir el tiempo medio de recuperacin? .
En primer lugar debemos averiguar si las varianzas poblacionales son iguales:
_
H
0

1
=
2
H
1

1
=
2
F =
s
2
1
s
2
2
=
45
2
43
2
= 1, 09
Se rechaza H
0
si F no pertenece al intervalo de nuestro estadstico.
Para una = 0, 05
_
F
0,975;8;8
= 4, 433
F
0,025;8;8
=
1
4,433
= 0, 225
como 1, 09 (0, 225; 4, 433), se acepta H
0
y por tanto
1
=
2
Por tener las varianzas poblacionales iguales v = n
1
+n
2
2 =
9 +9 2 = 16
Manuel Angel Barea Gmez 130
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
IC
95%
(
1

2
) t
v;/2

_
s
2
1
n
1
+
s
2
2
n
2
= (329 238)2, 120
_
45
2
9
+
43
2
9
= 90 43, 9
IC
95%
(
1

2
) [46, 71; 133, 29]
Formulamos la hiptesis y calculamos para una = 0, 05
_
H
0

1
=
2
H
1

1
>
2
El valor crtico es t
16;0,95
= 2, 120, el criterio de rechazo de H
0
ser t > 2, 120
s =
_
(n
1
1)s
2
1
+(n
2
1)s
2
2
(n
1
+n
2
2)
=
_
845
2
+843
2
16
= 44, 01
t =
x
1
x
2
_
s
2
n
1
+
s
2
n
2
=
329238
_
44
2
9
+
44
2
9
=
90
20,74
= 4, 33
44, 201 > 2, 120 por tanto se rechaza H
0
y se contrasta que el frmaco FL113 reduce el tiempo de recuperacin.
Problema 6.22. Se inoculan dos organismos aislados durante dos epidemias distintas, a dos muestras diferentes obtenidas de la
misma poblacin. A las dos semanas enferma el 68,5% de las 200 pruebas realizadas con el primer organismo, y el 65,3% de
las 150 pruebas efectuadas para el segundo caso. Halle un intervalo de conanza del 95% de esta diferencia de proporciones
encontradas.
A
_
p
1
= 68, 5
n
1
= 200
B
_
p
2
= 65, 3
n
2
= 150
IC
95%
(
1

2
) = (p
1
p
2
) z
/2

_
p
1
(1p
1
)
n
1
+
p
2
(1p
2
)
n
2
= (0, 685 0, 653)1, 96
_
0,6850,315
200
+
0,6530,347
150
= 0, 032 0, 1
IC
95%
(
1

2
) [0, 068; 0, 132]
Problema 6.23. Se est haciendo un estudio sobre hipertensin. De una ciudad se toma una muestra de trece pacientes y de otra
ciudad se toma otra muestra de diecisis pacientes. Los datos obtenidos son los siguientes:
_
_
_
x
1
= 166mm
s
1
= 28mm
n
1
= 13
FL113
_
_
_
x
2
= 164, 7mm
s
2
= 7mm
n
2
= 16
(a) Determine un intervalo de conanza del 95% para la diferencia de medias, bajo la hiptesis de normalidad de los datos.
En primer lugar debemos averiguar si las varianzas poblacionales son iguales:
_
H
0

1
=
2
H
1

1
=
2
Manuel Angel Barea Gmez 131
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
F =
s
2
1
s
2
2
=
28
2
7
2
= 16
Se rechaza H
0
si F no pertenece al intervalo de nuestro estadstico.
Para una = 0, 05
_
F
0,975;12;15
= 2, 963
F
0,025;12;15
=
1
3,177
= 0, 314
como 16 / (0, 314; 2, 963), se rechaza H
0
y por tanto
1
=
2
Por tener las varianzas poblacionales distintas v =
(n
1
s
2
1
+n
2
s
2
2
)
2
(n
1
s
2
1
)
2
n
1
1
+
(n
2
s
2
2
)
2
n
2
1
=
(1328
2
+167
2
)
(1328
2
)
2
12
+
(167
2
)
2
15
=
10976
898,33
= 12, 26 13
IC
95%
(
1

2
) t
v;/2

_
s
2
1
n
1
+
s
2
2
n
2
= (166 164, 7)2, 16
_
28
2
13
+
7
2
16
= 1, 3 17, 12
IC
95%
(
1

2
) [15, 89; 18, 42]
Problema 6.24. Se supone que en una determinada raza de ganado vacuno los terneros aumentan 12kg de peso por cada dos
semanas, en los primeros meses de vida. Para comprobarlo se midi el peso de ocho terneros al cumplir las cuatro semanas, y
posteriormente dos semanas ms tarde, con el siguiente resultado:
Ternero 1 2 3 4 5 6 7 8
Peso (4 semanas) 130 125 128 127 129 123 131 130
Peso (6 semanas) 138 140 139 141 137 137 142 142
(a) Compruebe si la suposicin es cierta calculando un intervalo de conanza del 95% para la diferencia media de peso. Se
considera que el peso se distribuye de forma aproximadamente normal.
Ternero 1 2 3 4 5 6 7 8
Peso (4 semanas) X 130 125 128 127 129 123 131 130
Peso (6 semanas) Y 138 140 139 141 137 137 142 142
d
1
=Y
i
X
i
8 15 11 14 8 14 11 12
_
_
_

D = 11, 625
s
D
= 2, 67
n = 8
IC
95%
(
2

1
) =

Dt
n1;/2

S
d

n
= 11, 625 2, 365
2,67

8
= 11, 625 2, 232 IC
95%
(
2

1
) [9, 393; 13, 857]
Problema 6.25. El tratamiento anticoagulante por va oral se realiza con dicumarnicos. Se midi el porcentaje de nivel de protrom-
bina (que determina el grado de coagulacin) a nueve pacientes, antes y despus del tratamiento con dicho frmaco y se obtuvieron
los siguientes resultados:
Antes 95 85 77 100 92 67 81 94 99
Despus 40 37 28 49 37 21 45 52 37
Manuel Angel Barea Gmez 132
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
(a) Calcule un intervalo del 95% para la diferencia entre los porcentajes medios de actividad de protrombina antes y despus del
tratamiento.
(b) Se puede armar que con este tratamiento el porcentaje medio puede llegar a disminuir en 53 puntos?
(c) Cuntos pacientes deben ser estudiados para que la amplitud del intervalo de conanza se reduzca a la tercera parte?
Antes X 95 85 77 100 92 67 81 94 99
Despus Y 40 37 28 49 37 21 45 52 37
d
1
= X
i
Y
i
55 48 49 51 55 46 36 42 62
_
_
_

D = 49, 33
s
D
= 7, 68
n = 9
IC
95%
(
2

1
) =

Dt
n1;/2

S
d

n
= 49, 33 2, 306
7,68

9
= 49, 33 5, 90 IC
95%
(
2

1
) [43, 43; 55, 23]
Si se puede armar ya que 53 [43, 43; 55, 23]
Para reducir al amplitud del intervalo a la tercera parte:
l = 55, 23 43, 43 = 11, 8
l
3
=
11,8
3
= 3, 93
3, 93 = 2 z
/2

s
D

n
n =
_
21,96
3,93
_
2
59
Problema 6.26. Se sospecha que la concentracin de sulfonato de peruorooctano (PFOS) en la sangre de las personas de una
cierta regin est aumentando con el tiempo. A ocho personas del lugar, elegidas aleatoriamente, se les midi la concentracin de
PFOS en el plasma en 1979 y en 1986, con los siguientes resultados:
Sujeto 1 2 3 4 5 6 7 8
PFOS
ng
/ml 1979 28,2 31,6 30,1 27,9 28,8 30,1 32,1 30,9
PFOS
ng
/ml 1986 30,6 31,9 32,8 30,8 33,7 29,8 33,6 30,4
(a) Calcule un intervalo de conanza del 95% para la diferencia entre las concentraciones medias de PFOS en sangre entre 1986
y 1979.
(b) Sera admisible armar, al nivel de conanza anterior, que la concentracin de PFOS en sangre ha aumentado en el perodo
de tiempo estudiado?
Sujeto 1 2 3 4 5 6 7 8
PFOS
ng
/ml 1979 X 28,2 31,6 30,1 27,9 28,8 30,1 32,1 30,9
PFOS
ng
/ml 1986 Y 30,6 31,9 32,8 30,8 33,7 29,8 33,6 30,4
d
1
=Y
i
X
i
2,4 0,3 2,7 2,9 4,9 -0,3 1,5 -0,5
_
_
_

D = 1, 74
s
D
= 1, 85
n = 8
Manuel Angel Barea Gmez 133
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
IC
95%
(
2

1
) =

Dt
n1;/2

S
d

n
= 1, 74 2, 365
1,85

8
= 1, 74 1, 54 IC
95%
(
2

1
) [0, 20; 3, 28]
Si se puede armar ya que el intervalo es positivo lo cul quiere decir que el nivel medio en 1986 es mayor que en 1979.
Problema 6.27. Se hizo un muestreo en dos municipios para averiguar su opinin sobre la uoracin del agua potable antes de
iniciar la campaa. Los resultados de estas encuestas (siendo p la proporcin favorable) fueron
Municipio1
_
p
1
= 0, 52
n
1
= 110
Municipio2
_
p
2
= 0, 55
n
2
= 75
(a) Podra armarse que los dos municipios tienen iguales proporciones de partidarios de la uoracin?
p =
n
1
p
1
+n
2
p
2
n
1
+n
2
=
1100,52+750,55
110+75
= 0, 532
_
H
0

1
=
2
H
1

1
=
2
El valor crtico es z
0,975
= 1, 96, el criterio de rechazo de H
0
ser |z| > 1, 96
z =
p
1
p
2
_
p(1p)
n
1
+
p(1p)
n
2
=
0,520,55
_
0,5320,468
110
+
0,5320,468
75
=
0,03
0,07
=0, 42
Se acepta H
0
porque |0, 42| < 1, 96
Problema 6.28. Se desea averiguar si la aspirina y un producto de comparacin son igualmente ecaces para el alivio de los
sntomas de inuenza. Se registran los tiempos, en minutos, desde la toma de la medicina hasta cuando el paciente declara sentirse
mejor, y los resultados son:
Aspirina
_
_
_
x
1
= 15, 2
s
1
= 8, 7
n
1
= 10
Productode comparaci on
_
_
_
x
2
= 13, 4
s
2
= 6, 9
n
2
= 20
(a) Contraste la hiptesis al nivel del 5%
En primer lugar debemos averiguar si las varianzas poblacionales son iguales:
_
H
0

1
=
2
H
1

1
=
2
F =
s
2
1
s
2
2
=
8,7
2
6,9
2
= 1, 59
Se rechaza H
0
si F no pertenece al intervalo de nuestro estadstico.
Manuel Angel Barea Gmez 134
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
Para una = 0, 05
_
F
0,975;9;19
= 2, 880
F
0,025;9;19
=
1
3,68
= 0, 271
como 1, 59 (0, 271; 2, 880), se acepta H
0
y por tanto
1
=
2
v = n
1
+n
2
2 = 10 +20 2 = 18
Formulamos la hiptesis y calculamos para una = 0, 05
_
H
0

1
=
2
H
1

1
=
2
El valor crtico es t
18;0,975
= 2, 101, el criterio de rechazo de H
0
ser |t| > 2, 101
s =
_
(n
1
1)s
2
1
+(n
2
1)s
2
2
(n
1
+n
2
2)
=
_
98,7
2
+196,9
2
28
= 7, 53
t =
x
1
x
2
_
s
2
n
1
+
s
2
n
2
=
15,213,4
_
7,53
2
10
+
7,53
2
20
= 0, 6176
0, 6176 < 2, 101 por tanto se acepta H
0
y se contrasta que ambos frmacos son igualmente de ecaces.
Problema 6.29. Las velocidades de difusin del bixido de carbono a travs de suelos de porosidades diferentes son:
Suelo no 20 27 22 23 23 28 23 26 22 26 20 19 22
Suelo poroso 19 30 32 28 15 26 35 18 25 35
(a) Compruebe si puede armarse que son diferentes al nivel de signicacin del 5% (Se supone que la distribucin es normal).
Suelo f ino
_
_
_
x
1
= 23, 15
s
1
= 2, 82
n
1
= 13
Suelo poroso
_
_
_
x
2
= 26, 30
s
2
= 7, 08
n
2
= 10
_
H
0

1
=
2
H
1

1
=
2
F =
s
2
1
s
2
2
=
2,82
2
7,08
2
= 0, 16
Se rechaza H
0
si F no pertenece al intervalo de nuestro estadstico.
Para una = 0, 05
_
F
0,975;12;9
= 3, 868
F
0,025;12;9
=
1
3,436
= 0, 291
como 0, 16 / (0, 291; 3, 868), se rechaza H
0
y por tanto
1
=
2
v = n
1
+n
2
2 = 10 +20 2 = 18
Manuel Angel Barea Gmez 135
CAPTULO 6. INTERVALOS DE CONFIANZA Y CONSTRATES DE HIPTESIS PARAMTRICOS EN DOS O MS
POBLACIONES.
Formulamos la hiptesis y calculamos para una = 0, 05
_
H
0

1
=
2
H
1

1
=
2
Por tener las varianzas poblacionales distintas v =
(n
1
s
2
1
+n
2
s
2
2
)
2
(n
1
s
2
1
)
2
n
1
1
+
(n
2
s
2
2
)
2
n
2
1
=
(132,82
2
+107,08
2
)
(1328
2
)
2
12
+
(107
2
)
2
19
11
El valor crtico es t
11;0,975
= 2, 201, el criterio de rechazo de H
0
ser |t| > 2, 201
t =
x
1
x
2
_
s
2
1
n
1
+
s
2
2
n
2
=
23,1526,30
_
2,82
2
13
+
7,08
2
10
=1, 32
|1, 32| < 2, 201 por tanto se acepta H
0
y se contrasta que las velocidades de difusin del bixido de carbono en suelos diferentes
son iguales.
Problema 6.30. En un reciente estudio de lesiones de rodilla entre jugadores de ftbol que juegan sobre csped, se compararon dos
tipos de calzados. En 266 jugadores que calzaban zapatos de ftbol multiabrazados, se presentaron 14 lesiones de rodilla. De 2055
jugadores que calzaban botas de ftbol convencionales, se encontraron 162 de tales lesiones.
(a) Se puede armar al nivel del 0,05 que la probabilidad de sufrir una lesin de rodilla cuando se calzan botas convencionales
es ms alta que la de sufrirla con zapatos multiabrazados?
(b) Y al nivel de 0,01?
Multiabrazados
_
p
1
=
14
266
= 0, 052
n
1
= 266
Convencionales
_
p
2
=
162
2055
= 0, 078
n
2
= 2055
(a) Podra armarse que los dos municipios tienen iguales proporciones de partidarios de la uoracin?
p =
n
1
p
1
+n
2
p
2
n
1
+n
2
=
2660,052+20550,078
266+2055
= 0, 075
_
H
0

1
=
2
H
1

1
<
2
El valor crtico es z
0,95
= 1, 645, el criterio de rechazo de H
0
ser z > 1, 645
z =
p
2
p
1
_
p(1p)
n
1
+
p(1p)
n
2
=
0,0780,052
_
0,0750,925
266
+
0,0750,925
2055
= 1, 7552
Se rechaza H
0
porque 1, 755 >1, 645, por tanto, la probabilidad de sufrir una lesin de rodilla cuando se calzan botas convencionales
es ms alta que la de sufrirla con zapatos multiabrazados.
Para una = 0, 01
El valor crtico es z
0,99
= 2, 32, el criterio de rechazo de H
0
ser z > 2, 32
z =
p
2
p
1
_
p(1p)
n
1
+
p(1p)
n
2
=
0,0780,052
_
0,0750,925
266
+
0,0750,925
2055
= 1, 7552
Se acepta H
0
porque 1, 755 < 2, 32.
Manuel Angel Barea Gmez 136
CAPTULO
7
Contrastes de hiptesis no paramtricos
Problema 7.1. Queremos saber si las causas de muerte se distribuyen de la misma forma en los pases desarrollados y en los subde-
sarrollados. Del primer grupo de pases tomamos aleatoriamente una muestra de tamao 200, encontrando las siguientes causas de
muerte: Enfermedades cardiovasculares (90), Cncer (36), Enfermedades infecciosas (10), Accidentes (12), Resto de enfermedades
(52). Del segundo grupo de pases tomamos aleatoriamente otra muestra de tamao 200, encontrando las siguientes causas de
muerte: Enfermedades cardiovasculares (35), Cncer (15), Enfermedades infecciosas (80), Accidentes (6), Resto de enfermedades
(64).
(a) Podemos armar con un 1% de signicacin que las causas de muerte se distribuyen de la misma forma en ambos grupos de
pases?
Frecuencias
observadas
Enfermedades
Cardiovasculares
Cncer
Enfermedades
Infecciosas
Accidentes
Resto
Enfermedades
Total
Primer Grupo 90 36 10 12 52 200
Segundo Grupo 35 15 80 6 64 200
Total 125 51 90 18 116 400
Completamos nuestra tabla con las frecuencias esperadas
(a)
Frecuencias
esperadas
Enfermedades
Cardiovasculares
Cncer
Enfermedades
Infecciosas
Accidentes
Resto
Enfermedades
Primer Grupo 62,5 25,5 45 9 58
Segundo Grupo 62,5 25,5 45 9 68
_
H
0

2
=
2
c
H
1

2
=
2
c
Sigue una distribucin
2
con v = (2 1) (5 1) = 4gradosdelibertad
Nuestro estadstico es
2
4;0,005
;
2
4;0,995
= [0, 21; 14, 86] dicho intervalo ser nuestra regin de aceptacin
137
CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

2
=
(OE)
2
E
=
(9062,5)
2
62,5
+... +
(649)
2
9
= 90, 53
Por tanto, se rechaza H
0
y se acepta H
1
que indica que no se distribuyen de la misma forma ambas poblaciones.
Problema 7.2. En una campaa preventiva de deteccin precoz del glaucoma realizada en una poblacin se pretende estudiar si
el grado de tal enfermedad est o no condicionado por el sexo de los sujetos explorados. Entre los varones sometidos a la prueba
resultaron 4724 normales, 193 sospechosos de la enfermedad y 39 glaucomatosos, mientras que entre las mujeres resultaron 2979
normales, 55 sospechosas y 12 glaucomatosas.
(a) Que podemos deducir del test?
Frecuencias
observadas
Normales Sospechosos Glaucomatosos Total
Hombres 4724 193 39 4956
Mujeres 2979 55 12 3046
Total 7703 248 51 8002
Completamos nuestra tabla con las frecuencias esperadas
(a)
Frecuencias
esperadas
Normales Sospechosos Glaucomatosos
Hombres 4770,81 153,59 31,57
Mujeres 2932,18 94,40 19,41
_
H
0

2
=
2
c
H
1

2
=
2
c
Sigue una distribucin
2
con v = (2 1) (3 1) = 2gradosdelibertad para una = 0, 05
Nuestro estadstico es
2
2;0,025
;
2
2;0,975
= [0, 22; 7, 38] dicho intervalo ser nuestra regin de aceptacin

2
c
=
(OE)
2
E
=
(47244770,81)
2
4770,81
+... +
(1219,41)
2
19,41
= 32, 33
Por tanto, se rechaza H
0
y se acepta H
1
que indica que no se distribuyen de la misma los hombres y mujeres con respecto al test.
Problema 7.3. En general, se sabe que de los pacientes con leucemia mieloblstica aguda con los que se logra una remisin
completa, a partir de un tratamiento convencional, el 50% sobreviven ms de 21 meses. Se est estudiando un nuevo procedimiento
con el que se espera que aumente este nmero de meses de supervivencia. Este tiempo para 10 pacientes con el nuevo tratamiento
ha sido:
25,8 20,5 20,9 27,3 21,5 20,1 28,9 19,2 26,3 24,1
(a) Mediante el contraste de los signos, decidir si el nuevo procedimiento ha aumentado la mediana del tiempo de supervivencia.
(b) Mediante el contraste de DAgostino, estudiar si los datos son normales.
Manuel Angel Barea Gmez 138
CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS
Contamos los valores por encima de 21 T
exp
= 6 no existe en nuestra muestra ningn valor 21, por tanto, n

= 10, aproximamos
T B(10; 0, 05), por lo que para un nivel de signicacin = 0, 05 hay que encontrar P(X = k) 0, 05.
Nuestra regin de convergencia es R
c
:
_
T
exp
n

k
_
Las probabilidades B(10; 0, 05) que tienen valores menores de 0,05, es para para k = 1, por tanto R
c
:
_
T
exp
9
_
como 6 9 la
hiptesis de que aumentado la mediana el tiempo de supervivencia, no es signicativa
El apartado (b)
_
H
0
La poblaci onesnormal
H
1
La poblaci onnoesnormal
Rechazamos H
0
si el valor de D
exp
est fuera del intervalo de la tabla de los puntos crticos del test de DAgostino.
Los puntos crticos son [0, 2513; 0, 2849]
En primer lugar para calcular nuestro estadstico ordenamos los datos de menor a mayor.
_
_
_
x
i
= 234, 6
i x
i
= 1382, 3
X
2
i
= 5610, 6
D
exp
=
iX
i

n+1
2
X
i
n

n
_
X
2
i

(X
i
)
2
n
_
=
1382,35,5234,6
10
_
10
_
5610,6
234,6
2
10
_
=
92
326,9
= 0, 2814
Como 0, 2814 [0, 2513; 0, 2849] H
0
es aceptada y la poblacin sigue una distribucin normal.
Problema 7.4. Se ha realizado un recuento acerca del nmero de ingresos hospitalarios que han tenido un grupo de 200 pacientes
que padecen insuciencia cardaca. Ajustar los datos recogidos en la siguiente tabla a una distribucin binomial y estudiar la bondad
del ajuste.
Ingresos 0 1 2 3 4 5 6
Frecuencia 10 30 65 58 28 8 1
_
H
0
Losdatossea justanaunadistribuci onbinomial
H
1
Losdatosnosea justanaunadistribuci onbinomial
Para obtener los valores esperados se tiene que utilizar la formula de la distribucin binomial
_
n
m
_
p
m
(1 p)
nm
, en nuestro
caso n = 6. Sabemos que = n p = 6 p.
Tambin podemos hallar =
f
i
x
i
f
1
=
010+130+265+358+428+58+61
200
=
492
200
= 2, 46
Manuel Angel Barea Gmez 139
CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS
2, 46 = 6 p p =
2,46
6
= 0, 41
As pues, la distribucin binomial ajustada viene dada por B(6; 0, 41). Sus probabilidades son:
X P[k = X]
0 0,04218
1 0,17587
2 0,30553
3 0,28309
4 0,14754
5 0,04101
6 0,00475
Obtenemos la frecuencia esperada y rellenamos nuestra tabla
Ingresos 0 1 2 3 4 5 6
Frecuencia 10 30 65 58 28 8 1
Esperada 8,40 35,16 61,11 56,60 29,50 8,20 0,94
Para los grados de libertad el valor de m ser 1, ya que se tuvo que estimar la media de la poblacin para poder obtener el valor de p
y as poder calcular los valores esperados.
v : k 1 m= 7 1 1 = 5
_
H
0

2

2
c
H
1

2
<
2
c

2
5;0,05
= 11, 07 Este ser nuestro punto critico. Aceptaremos H
0
si
2

2
c

2
c
=
(OE)
2
E
=
(108,40)
2
8,40
+
(3035,16)
2
35,16
+
(6561,11)
2
61,11
+
(5856,60)
2
56,60
+
(2829,50)
2
29,50
+
(88,20)
2
8,20
+
(10,94)
2
0,94
= 1, 43
Como 1, 47 < 11, 7 se acepta H
0
Problema 7.5. Realizamos un juego de azar que consiste en lanzar un par de dados y anotar la suma obtenida. Las tabla de recuentos
obtenida tras 200 lanzamientos es:
Resultado 2 3 4 5 6 7 8 9 10 11 12
Recuentos 2 8 16 28 32 34 30 24 14 8 4
(a) Se ajustan las frecuencias empricas a la distribucin que les corresponde en teora?
Manuel Angel Barea Gmez 140
CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS
Teniendo en cuenta frecuencia emprica es un sinnimo de frecuencia observada. Podemos ajustarla a una distribucin de Poisson,
por ser n grande.
_
H
0
Losdatossea justanaunadistribuci ondePoisson
H
1
Losdatosnosea justanaunadistribuci ondePoisson
Para obtener los valores esperados se tiene que utilizar la formula de la distribucin binomial P(k = X) =
e

k
k!
, sabemos = .
Tambin podemos hallar =
f
i
x
i
f
1
=
22+...+124
200
=
13962
200
7
= 7
As pues, la distribucin de Poisson ajustada viene dada por P(7). Sus probabilidades son:
X P[k = X]
2 0,02234
3 0,05212
4 0,09122
5 0,12771
6 0,14900
7 0,14900
8 0,13037
9 0,10140
10 0,07098
11 0,04517
12 0,02634
Obtenemos la frecuencia esperada y rellenamos nuestra tabla
Ingresos 0 1 2 3 4 5 6
Frecuencia 10 30 65 58 28 8 1
_
H
0
Losdatossea justanaunadistribuci onbinomial
H
1
Losdatosnosea justanaunadistribuci onbinomial
Para obtener los valores esperados se tiene que utilizar la formula de la distribucin binomial
_
n
m
_
p
m
(1 p)
nm
, en nuestro
caso n = 6. Sabemos que = n p = 6 p.
Tambin podemos hallar =
f
i
x
i
f
1
=
010+130+265+358+428+58+61
200
=
492
200
= 2, 46
Manuel Angel Barea Gmez 141
CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS
2, 46 = 6 p p =
2,46
6
= 0, 41
As pues, la distribucin binomial ajustada viene dada por B(6; 0, 41). Sus probabilidades son:
X P[k = X]
0 0,04218
1 0,17587
2 0,30553
3 0,28309
4 0,14754
5 0,04101
6 0,00475
Obtenemos la frecuencia esperada y rellenamos nuestra tabla
Ingresos 0 1 2 3 4 5 6
Frecuencia 10 30 65 58 28 8 1
Esperada 8,40 35,16 61,11 56,60 29,50 8,20 0,94
Para los grados de libertad el valor de m ser 1, ya que se tuvo que estimar la media de la poblacin para poder obtener el valor de p
y as poder calcular los valores esperados.
v : k 1 m= 7 1 1 = 5
_
H
0

2

2
c
H
1

2
<
2
c

2
5;0,05
= 11, 07 Este ser nuestro punto critico. Aceptaremos H
0
si
2

2
c

2
c
=
(OE)
2
E
=
(108,40)
2
8,40
+
(3035,16)
2
35,16
+
(6561,11)
2
61,11
+
(5856,60)
2
56,60
+
(2829,50)
2
29,50
+
(88,20)
2
8,20
+
(10,94)
2
0,94
= 1, 43
Como 1, 47 < 11, 7 se acepta H
0
Resultado 2 3 4 5 6 7 8 9 10 11 12
Observada 2 8 16 28 32 34 30 24 14 8 4
Esperada 4,47 10,42 18,24 25,54 29,80 29,80 26,07 20,28 14,19 9,03 5,27
Utilizaremos como grados de libertad v = 11 1 1 = 9, por haber usado la media de la distribucin estimada a partir de los datos.
_
H
0

2

2
c
H
1

2
<
2
c

2
9;0,05
= 16, 92 Este ser nuestro punto critico. Aceptaremos H
0
si
2

2
c
Manuel Angel Barea Gmez 142
CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

2
c
=
(OE)
2
E
=
(24,47)
2
4,47
+... +
(4,5,27)
2
5,27
= 4, 89
Como 4, 89 < 16, 92 se acepta H
0
Problema 7.6. Los datos referentes al nmero de partos asistidos por da en un centro hospitalario, vienen recogidos en la siguiente
tabla:
N de partos por da 0 1 2 3 4 5 o ms
Frecuencia 6 15 20 12 8 4
(a) Ajustar a la distribucin de Poisson adecuada y estudiar la bondad del ajuste. (Nota: Tomar como marca de la ltima clase el
valor 5)
_
H
0
Losdatossea justanaunadistribuci ondePoisson
H
1
Losdatosnosea justanaunadistribuci ondePoisson
Para obtener los valores esperados se tiene que utilizar la formula de la distribucin binomial P(k = X) =
e

k
k!
, sabemos = .
Tambin podemos hallar =
f
i
x
i
f
1
=
06+115+220+312+48+54
65
=
143
65
= 2, 2
= 2, 2
As pues, la distribucin de Poisson ajustada viene dada por P(2, 2). Sus probabilidades son:
X P[k = X]
0 0,11080
1 0,24376
2 0,26814
3 0,19663
4 0,10815
5 0,07202
N de partos por da 0 1 2 3 4 5 o ms
Frecuencia observada 6 15 20 12 8 4
Frecuencia esperada 7,20 15,84 17,43 12,78 7,03 4,68
Utilizaremos como grados de libertad v = 6 1 1 = 4, por haber usado la media de la distribucin estimada a partir de los datos.
_
H
0

2

2
c
H
1

2
<
2
c

2
4;0,05
= 9, 49 Este ser nuestro punto critico. Aceptaremos H
0
si
2

2
c
Manuel Angel Barea Gmez 143
CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS

2
c
=
(OE)
2
E
=
(67,20)
2
7,20
+... +
(87,03)
2
7,03
= 0, 90
Como 0, 90 < 9, 49 se acepta H
0
Problema 7.7. Cierta enfermedad puede presentarse en 5 estadios diferentes, segn la gravedad. Las probabilidades de que un
individuo con la enfermedad se encuentre en cada uno de los 4 primeros estadios son, respectivamente, 0,01; 0,12; 0,3 y 0,17. Segn
el estadio, el individuo sobrevive 10, 8, 6, 4 y 1 aos, respectivamente.
(a) Hallar la probabilidad de que un individuo que tenga esta enfermedad se encuentre en el 5 estadio.
(b) En una muestra de 100 individuos con la enfermedad, el nmero de enfermos encontrados en cada estadio ha sido, respecti-
vamente, 3, 10, 25, 24 y 38. Se ajustan estos datos a la distribucin anterior?.
Como tenemos los datos de 4 de los cinco estadios, el quinto tendr una probabilidad
P(X) = 1 [0, 01 +0, 12 +0, 3 +0, 17] = 0, 4
Estadios 1 2 3 4 5
Frecuencia Observada 3 10 25 24 38
_
H
0
Losdatossea justanaunadistribuci onbinomial
H
1
Losdatosnosea justanaunadistribuci onbinomial
Obtenemos la frecuencia esperada y rellenamos nuestra tabla con los 100 pacientes y la distribucin aportada en el enunciad0
Estadios 1 2 3 4 5
Frecuencia 3 10 25 24 38
Esperada 1 12 30 17 40
Para los grados de libertad el valor de m ser 0.
v : k 1 m= 5 1 0 = 4
_
H
0

2

2
c
H
1

2
<
2
c

2
4;0,05
= 9, 49 Este ser nuestro punto critico. Aceptaremos H
0
si
2

2
c

2
c
=
(OE)
2
E
=
(31)
2
1
+
(1012)
2
12
+
(2530)
2
30
+
(2417)
2
17
+
(3840)
2
40
= 8, 15
Como 8, 15 < 9, 49 se acepta H
0
Manuel Angel Barea Gmez 144
CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS
Problema 7.8. Para comprobar empricamente la teora sobre la herencia gentica de Mendel, se han clasicado guisantes de una
determinada variedad, atendiendo a su color y forma, en cuatro clases: E
1
: lisos y amarillos, E
2
: lisos y verdes, E
3
: rugosos y
amarillos y E
4
: rugosos y verdes. Seleccionados al azar 556 guisantes de la variedad en estudio, se obtienen 315 de E
1
, 108 de E
2
, 101 de E
3
y 32 de E
4
. Segn el modelo terico de Mendel, los datos deberan estar en la proporcin 9:3:3:1.
(a) Los datos conrman la teora sobre la herencia gentica de Mendel?
_
H
0
LateoriadeMendel esacertada
H
1
LateoriadeMendel noesacertada
El nmero total de guisantes n = 315 +108 +101+32 = 556
El total de la proporcin p = 9 +3 +3 +1 = 16 podemos calcular los valores esperados para cada clase:
Clase E
1
E
2
E
3
E
4
Valor Esperado
5569
16
= 312, 75
5563
16
= 104, 25
5563
16
= 104, 25
5561
16
= 34, 75
Construimos nuestra tabla:
Clase E
1
E
2
E
3
E
4
Valor observado 315 108 101 32
Valor Esperado 312,75 104,25 104,25 34,75
Para los grados de libertad el valor de m ser 0.
v : k 1 m= 4 1 0 = 3
_
H
0

2

2
c
H
1

2
<
2
c

2
3;0,05
= 7, 81 Este ser nuestro punto critico. Aceptaremos H
0
si
2

2
c

2
c
=
(OE)
2
E
=
(315312,75)
2
312,75
+
(108104,25)
2
104,25
+
(101104,25)
2
104,25
+
(3234,75)
2
34,75
= 0, 470
Como 0, 470 < 7, 81 se acepta H
0
Problema 7.9. Se ha realizado un estudio sobre nutricin en pacientes con insuciencia respiratoria que requieren ventilacin
asistida. Una variable considerada es el ndice de creatinina, que es una medida del nivel proteico del paciente. El hecho de que el
ndice tenga un valor inferior a 6 es indicativo de un grave dcit proteico. Si la mediana de los valores del ndice en este tipo de
pacientes est por debajo de 6 se pondr en funcionamiento un nuevo programa diettico para corregir el problema. A partir de una
muestra aleatoria de 15 pacientes se obtuvieron los siguientes valores:
5,7 4,2 4,7 4,6 5,3 5,4 6,8 4,9 4,9 5,8 4,1 5,5 6,4 5,1 4,7
(a) Mediante el contraste de los signos, hay pruebas de que la mediana de los ndices est por debajo de 6?
(b) Mediante el contraste de DAgostino, estudiar si los datos pueden considerarse de una poblacin Normal.
Manuel Angel Barea Gmez 145
CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS
Contamos los valores por debajo de 6 T
exp
= 13 no existe en nuestra muestra ningn valor 6, por tanto, n

= 15, aproximamos
T B(15; 0, 05), por lo que para un nivel de signicacin = 0, 05 hay que encontrar valores P(X = k) 0, 05.
Nuestra regin de convergencia es R
c
:
_
T
exp
n

k
_
Las probabilidades B(15; 0, 05) que tienen valores menores de 0,05, es para para k = 5, por tanto R
c
:
_
T
exp
10
_
como 10 6 la
hiptesis de que disminuido la mediana de los ndices, no es signicativa
El apartado (b)
_
H
0
La poblaci onesnormal
H
1
La poblaci onnoesnormal
Rechazamos H
0
si el valor de D
exp
est fuera del intervalo de la tabla de los puntos crticos del test de DAgostino.
Los puntos crticos son [0, 2568; 0, 2858]
En primer lugar para calcular nuestro estadstico ordenamos los datos de menor a mayor.
_
_
_
x
i
= 78, 1
i x
i
= 670, 7
X
2
i
= 414, 65
_
x = 5, 20
s = 0, 75
_
T = i x
i

n(n+1)
2
x = 670, 7
15145,20
2
= 124, 7
D
exp
=
T
n
2
s
=
124,7
15
2
0,75
= 0, 738
Como 0, 738 / [0, 2568; 0, 2858] H
0
es rechazada y la poblacin no sigue una distribucin normal.
Problema 7.10. Los das de estancia en dos hospitales, de dos muestras de tamao 5 y 10, respectivamente, de pacientes intervenidos
quirrgicamente por el mismo tipo de operacin, son los siguientes:
Hospital Datos
Hospital A 10 15 12 23 17
Hospital B 14 16 23 25 17 23 20 17 26 30
(a) Suponiendo que los datos no son normales, puede considerarse que la duracin de la estancia es distinta en ambos hospi-
tales?.
_
H
0

0
=
1
H
1

0
=
1
Se realiza el test de Wilcoxon. En primer lugar le damos una valor ordinal a nuestros datos:
Manuel Angel Barea Gmez 146
CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS
Ordinal 1 4 2 11 7
Hospital A 10 15 12 23 17
Hospital B 14 16 23 25 17 23 20 17 26 30
Ordinal 3 5 11 13 7 11 9 7 14 15
Nuestros valores estadsticos R
1
y R
2
son respectivamente:
_
R
1
= 1 +4 +2 +11+7 = 25
R
2
= 3 +5 +11 +13+7+11+9+7+14+15 = 95
Tomamos el valor mnimo de los estadsticos hallados, en este caso R
1
y observamos en la tabla que el intervalo para una = 0, 05
es 23; 57 Por tanto no pueden considerarse distintas.
Problema 7.11. La ictericia neonatal es un fenmeno biolgico complejo, resultado de un desequilibrio transitorio entre la pro-
duccin y eliminacin de la bilirrubina. En el curso de una investigacin, se determinaron los niveles de bilirrubina a travs de
bilirrubinometra transcutnea (BTc) de una muestra de neonatos con ictericia, obtenindose los siguientes resultados:
BTc (
mg
/dl) n
i
< 5 3
[5 6) 4
[6 7) 2
[7 8) 8
[8 9) 12
[9 10) 18
10 33
(a) Entre qu valores se encuentran el 30% central de los datos de esta distribucin?
(b) Podemos armar que la concentracin media poblacional de bilirrubina es superior a 9
mg
/dl?
(c) Puede armarse que la concentracin de bilirrubina en neonatos con ictericia se ajusta a una distribucin normal?
BTc (
mg
/dl) x
i
n
i
N
i
x
i
n
i
x
2
i
n
i
< 5 4,5 3 3 14 61
[5 6) 5,5 4 7 22 121
[6 7) 6,5 2 9 13 87
[7 8) 7,5 8 17 60 450
[8 9) 8,5 12 29 102 867
[9 10) 9,5 18 47 171 1625
10 10,5 33 80 347 3638
80 728 6848,62
_
x = 9, 10
s = 1, 66
Debemos hallar los percentiles P
35
y P
65
Manuel Angel Barea Gmez 147
CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS
Para P
35
el intervalo ser [8 9) ya que
8035
100
= 28
P
35
= L
in f
+
nk
100
N
i1
n
i
a
i
= 8 +
2817
12
1 = 8, 75
Para P
65
el intervalo ser 10 ya que
8065
100
= 52
P
65
= L
in f
+
nk
100
N
i1
n
i
a
i
= 10 +
5247
33
1 = 10, 15
Luego el 30% se encuentra en el intervalo [8, 75; 10, 15]
Para el apartado (b) con una signicacin de = 0, 05
_
H
0
=
0
H
1
>
0
Nuestro estadstico es z
0,95
= 1, 645 rechazaremos H
0
s z
exp
> z
z
exp
=
9,19
1,66

80
= 0, 53
Por tanto no podemos rechazar H
0
_
H
0
La poblaci onesnormal
H
1
La poblaci onnoesnormal
Rechazamos H
0
si el valor de D
exp
est fuera del intervalo de la tabla de los puntos crticos del test de DAgostino, para una =0, 05
Los puntos crticos son [0, 2734; 0, 2863]
En primer lugar para calcular nuestro estadstico ordenamos los datos de menor a mayor.
_
x = 9, 10
s = 1, 66
_
T = i x
i

n(n+1)
2
x = 32294, 2
80819,10
2
= 2810, 2
D
exp
=
T
n
2
s
=
2810,2
80
2
1,66
= 0, 2645
Como 0, 2645 / [0, 2734; 0, 2863] H
0
es rechazada y la poblacin sigue no una distribucin normal.
Manuel Angel Barea Gmez 148
CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS
Problema 7.12. Aplquese el test de Kruskal y Wallis al siguiente problema: La ureasa es una enzima productora de amonaco en
el tracto gastrointestinal. Es conocido que el amonaco es perjudicial en pacientes con enfermedades hepticas. Se ha realizado un
estudio cuyo objeto es comparar la concentracin de ureasa en los jugos gstricos en tres poblaciones :
I) grupo control
II) pacientes con obstruccin en la vena porta extraheptica;
III) pacientes con hepatitis viral.
Los datos obtenidos, en miligramos por mililitro son los siguientes:
I 261,1 186,2 239,1 243,3 296,8 270,5 222,5 267,3 230,6 244,8
II 221,9 188,7 167,6 224,9 178,8 147,9 175,3 214,3 159,5 230,0
III 600,9 301,2 607,0 283,3 193,3 159,4 540,3 355,1 265,3 512,4
Valor 147,9 159,4 159,5 167,6 175,3 178,8 186,2 188,7 193,3 214,3 221,9 222,5 224,9 230,0 230,6
Ordinal 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Valor 239,1 243,3 244,8 261,1 265,3 267,3 270,5 283,3 296,8 301,2 355,1 512,4 540,3 600,9 607,0
Ordinal 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Rehacemos nuestra tabla para poder sumar los rangos de cada grupo
I Rangos II Rangos II Rangos
261,1 19 221,9 11 600,9 29
186,2 7 188,7 8 301,2 25
239,1 16 167,6 4 607 30
243,3 17 224,9 13 283,3 23
296,8 24 178,8 6 193,3 9
270,5 22 147,9 1 159,4 2
222,5 12 175,3 5 540,3 28
267,3 21 214,3 10 355,1 26
230,6 15 159,5 3 265,3 20
244,8 18 230 14 512,4 27
Rc 171 75 219
Rc
2
29241 5625 47961
_
H
0
Lasdi f erenciasobservadasenlosgrupossedebenal azar.
H
1
Lasdi f erenciasobservadasenlosgruposnosedebenal azar.
Nuestro estadstico es comparado con una = 0, 05 . Los grados de libertad son v = 3 1 = 2. Luego los valores crticos en una

2
2,0,05
= 5, 99, esta ser nuestra H
a
_
H
0
H H
a
H
1
H > H
a
_
_
_
H =
12
N(N+1)

R
2
c
n
i
L
3 (N+1)
L = 1
(L
3
i
L
i)
N
3
N
Donde L
i
son el valor de nmero de empates de un rango
H =
12
3031
(
29241
10
+
5625
10
+
47961
10
)
1
3 (30 +1) =
1282827
303110
93 = 106, 87 93 = 13, 87
Como 13, 87 > 5, 99 se acepta H
1
con una p < 0, 001
Manuel Angel Barea Gmez 149
CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS
Problema 7.13. Se administr un cierto frmaco a una muestra representativa de enfermos de hepatitis alcohlica. Para estudiar
sus consecuencias, se valoraron ciertos parmetros siolgicos inicialmente y al cabo de un mes de tratamiento. Para el parmetro
SGOT se obtuvo:
Paciente 1 2 3 4 5 6 7 8 9 10
Inicial 56 56 147 58 121 57 49 118 63 75
Al mes 47 63 125 26 99 36 34 90 50 59
(a) Indique qu procedimiento(s) estadstico(s) podra emplear para analizar tal variacin en el caso de que no pudiera suponer
Normalidad en los datos.
Al ser dos muestras dependientes, puede utilizarse el test de los signos para dos muestras dependientes o el de Wilcoxon de los rangos
signados para las diferencias.
Inicial Al mes D Rango
56 47 9 2
56 63 -7 -1
147 125 22 7,5
58 26 32 10
121 99 22 7,5
57 36 21 6
49 34 14 4
118 90 28 9
63 50 13 3
75 59 16 5
W(+) 54
_
H
0
La poblaci onesnormal
H
1
La poblaci onnoesnormal
En nuestra tablas W
10;0,05
= [8 47] Como 54 > 47 y aceptamos H
1
Problema 7.14. Se ha realizado una encuesta a 125 individuos que son usuarios al mismo tiempo de Centros de Salud y Ambulatorios
donde se ha recogido su opinin favorable (SI) o desfavorable (NO) a dichos sistemas de asistencia. Los datos recogidos aparecen
en la siguiente tabla:
Centro de salud
Ambulatorio Si No
Si 27 35
No 43 20
Frecuencias Observadas Centro de salud
Ambulatorio Si No Total
Si 27 35 62
No 43 20 63
Total 70 55 125
Frecuencias Esperadas Centro de salud
Ambulatorio Si No
Si 34,72 27,28
No 35,28 27,72
Manuel Angel Barea Gmez 150
CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS
_
H
0

2
=
2
c
H
1

2
=
2
c
Sigue una distribucin
2
con v = (2 1) (2 1) = 1gradosdelibertad para una = 0, 05
Nuestro estadstico es
2
1;0,025
;
2
1;0,975
= [0, 001; 5, 02] dicho intervalo ser nuestra regin de aceptacin

2
c
=
(OE)
2
E
=
(2734,72)
2
34,72
+
(3527,28)
2
27,28
+
(7035,28)
2
35,28
+
(5527,72)
2
27,72
= 7, 74
Por tanto, se rechaza H
0
y se acepta H
1
que indica que no se distribuyen de la misma forma.
Problema 7.15. Utilizar el mtodo no paramtrico ms apropiado para ver si hay diferencias entre los niveles de protoporrina en
las tres poblaciones compuestas por:
(I) individuos sanos
(II) alcohlicos con anillos sideroblsticos en mdula sea
(III) alcohlicos sin dichos anillos
de las que se han extrado las muestras:
Poblacin I 22 27 47 30 38 78 28 58 72 56 30 39 53 50 36
Poblacin II 78 172 286 82 453 513 174 915 84 153 780
Poblacin III 37 28 38 45 47 29 34 20 68 12 37 8 76 148 11
Aplicamos el test de Kruskal y Wallis, primer lugar ordenamos nuestra tabla:
Problema 7.16.
Poblacin I Rango I Poblacin II Rango II Poblacin III Rango III
22 5 78 29,5 37 14,5
27 6 172 35 28 7,5
47 20,5 286 37 38 15,5
30 10,5 82 31 45 19
38 15,5 453 38 47 20,5
78 29,5 513 39 29 9
28 7,5 174 36 34 12
58 25 915 41 20 4
72 27 84 32 68 26
56 24 153 34 12 3
30 10,5 780 40 37 14,5
39 18 8 1
53 23 76 28
50 22 148 33
36 13 11 2
R
c
257 392,5 209,5
R
2
c
66049 154056,25 43890,25
Los nmero de empates son 6 de 2 elementos cada uno:
_
H
0
Lasdi f erenciasobservadasenlosgrupossedebenal azar.
H
1
Lasdi f erenciasobservadasenlosgruposnosedebenal azar.
Manuel Angel Barea Gmez 151
CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS
Nuestro estadstico es comparado con una = 0, 05 . Los grados de libertad son v = 3 1 = 2. Luego los valores crticos en una

2
2,0,05
= 5, 99, esta ser nuestra H
a
_
H
0
H H
a
H
1
H > H
a
_
_
_
H =
12
N(N+1)

R
2
c
n
i
L
3 (N+1)
L = 1
(L
3
i
L
i)
N
3
N
Donde L
i
son el valor de nmero de empates de un rango
L = 1
(2
3
2)+(2
3
2)+(2
3
2)+(2
3
2)+(2
3
2)+(2
3
2)
41
3
41
= 0, 99
H =
12
4142
(
66049
15
+
154056,25
11
+
43890,25
15
)
0,99
3 (41 +1) =
148,67
0,99
126 == 24, 17
Como 24, 17 > 5, 99 se acepta H
1
con una = 0, 005
Problema 7.17. En un estudio sobre el hbito de fumar y sus efectos sobre las pautas del sueo, una de las variables importantes es
el tiempo que se tarda en quedarse dormido. Se extrae una muestra de tamao 12 de la poblacin de fumadores, y otra independiente
de tamao 15 de la poblacin de no fumadores, obtenindose los siguientes datos:
Fumadores 69,3 56,0 22,1 47,6 53,2 48,1 23,2 13,8 52,7 34,4 60,2 43,8
No Fumadores 28,6 25,1 26,4 34,9 29,8 28,4 38,5 30,2 30,6 31,8 41,6 21,1 36.0 37,9 13,9
(a) Indican estos datos que los fumadores tienden a tardar ms tiempo en quedarse dormido que los no fumadores?
_
H
0

0
=
1
H
1

0
>
1
Se realiza el test de Wilcoxon. En primer lugar le damos una valor ordinal a nuestros datos:
Fumadores 69,3 56 22,1 47,6 53,2 48,1 23,2 13,8 52,7 34,4 60,2 43,8
Rango S 27 25 4 21 24 22 5 1 23 14 26 20
No Fumadores 28,6 25,1 26,4 34,9 29,8 28,4 38,5 30,2 30,6 31,8 41,6 21,1 36,0 37,9 13,9
Rango N 9 6 7 15 10 8 18 11 12 13 19 3 16 17 2
Nuestros valores estadsticos R
1
y R
2
son respectivamente:
_
R
1
= 27 +25 +4 +21+24+22+5+1+23+14+26+20 = 212
R
2
= 9 +6 +7 +15+10+8+18+11+12+13+19+3+16+17+2 = 166
Tomamos el valor estadsticos hallado, en este caso R
1
y observamos en la tabla que el intervalo para una = 0, 05 es [127; 209] Por
tanto, al no pertenecer al intervalo se acepta H
1
que arma que los fumadores tienden a tardar ms tiempo en quedarse dormido que
los no fumadores.
Problema 7.18. En un tratamiento contra la hipertensin se seleccionaron 21 enfermos de caractersticas similares. A cada enfermo
se le administr uno de los frmacos P, A, B, al azar, formando 3 grupos. El grupo P tom placebo (frmaco inocuo) y los otros dos
tomaron A y B respectivamente. Para valorar la ecacia de los tratamientos, se registr el descenso de la presin diastlica desde el
estado basal (inicio del tratamiento) hasta el estado al cabo de una semana de tratamiento. Los resultados fueron:
Manuel Angel Barea Gmez 152
CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS
P 10 0 15 -20 0 -5
A 20 25 33 25 30 18 0
B 15 10 25 30 15 35 25 22
Aplicamos el test de Kruskal y Wallis, primer lugar ordenamos nuestra tabla:
Problema 7.19.
Poblacin I Rango I Poblacin II Rango II Poblacin III Rango III
10 6,5 20 12 15 8,5
0 4 25 15,5 10 6,5
15 8,5 33 20 25 15,5
-20 1 25 15,5 30 18,5
0 4 30 18,5 15 8,5
-5 2 18 11 35 21
0 4 25 15,5
22 13
R
c
26 96,5 107
R
2
c
676 9312,25 11449
Los nmero de empates son 5 elementos:
Nuestro estadstico es comparado con una = 0, 05 . Los grados de libertad son v = 3 1 = 2. Luego los valores crticos en una

2
2,0,025
= 0, 05,
2
2,0,975
= 7, 38, esta ser nuestra H
a
_
H
0
H = H
a
H
1
H = H
a
_
_
_
H =
12
N(N+1)

R
2
c
n
i
L
3 (N+1)
L = 1
(L
3
i
L
i)
N
3
N
Donde L
i
son el valor de nmero de empates de un rango
L = 1
(3
3
3)+(2
3
2)+(3
3
3)+(4
3
4)+(2
3
2)
21
3
21
= 0, 987
H =
12
2122
(
676
6
+
9312,25
7
+
11449
8
)
0,987
3 (21 +1) =
74,65
0,987
126 == 9, 63
Como 9, 63 / [0, 05; 7, 38] se acepta H
1
con una = 0, 05 que indica que los tres frmacos no tienen la misma ecacia
Problema 7.20. la falta de oxgeno que se respira en alta montaa es la causa de todos los males de los escaladores. Se ha realizado
un estudio para analizar la saturacin de oxgeno en sangre de los alpinistas, recogindose para ello una muestra formada por
9 mujeres y 8 hombres alpinistas en la que se ha obtenido el nivel de saturacin de oxgeno en sangre, medido en una escala de
porcentaje de 0% a 100%:
Sexo M M M M M M M M M H H H H H H H H
Nivel O
2
61 73 67 70 70 75 69 69 71 63 67 62 79 65 68 68 61
Manuel Angel Barea Gmez 153
CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS
(a) Suponiendo que los datos anteriores no son normales, Puede armarse que los niveles de oxgeno son distintos para ambos
sexos?
_
H
0

0
=
1
H
1

0
=
1
Se realiza el test de Wilcoxon. En primer lugar le damos una valor ordinal a nuestros datos:
Mujeres 61 73 67 70 70 75 69 69 71
Rango M 1,5 15 6,5 12,5 12,5 16 10,5 10,5 14
Hombre 63 67 62 79 65 68 68 61
Rango H 4 6,5 3 17 5 8,5 8,5 1,5
Nuestros valores estadsticos R
1
y R
2
son respectivamente:
_
R
1
= 1, 5 +15 +6, 5 +12, 5+12, 5 +16+10, 5 +10, 5+14 = 99
R
2
= 4 +6, 5 +3 +17+5+8, 5+8, 5+1, 5 = 54
Tomamos el valor estadsticos hallado ms pequeos, en este caso R
2
y observamos en la tabla que el intervalo para una = 0, 01 es
[45; 99] Por tanto, al pertenecer al intervalo se acepta H
0
que indica que los niveles de oxigeno no son distintos para ambos sexos.
Problema 7.21. Un equipo mdico asegura que la metformina rebaja los niveles de glucosa en sangre. Para comprobarlo, selec-
cionan un grupo de 10 pacientes con diabetes Mellitus II, a los que se le mide la cantidad de azcar en sangre en ayunas, antes del
tratamiento y despus de un mes de tratamiento obteniendo los siguientes resultados:
Nivel glucosa antes 125 160 110 135 125 129 148 140 169 145
Nivel glucosa despus 100 129 89 105 116 105 122 113 125 99
(a) Suponiendo que los datos anteriores no son normales, y utilizando el contraste de los rangos con signos Puede armarse que
los niveles de oxgeno son distintos antes y despus del tratamiento?
Antes Despus D Rango
125 100 25 4
160 129 31 8
110 89 21 2
135 105 30 7
125 116 9 1
129 105 24 3
148 122 26 5
140 113 27 6
169 125 44 9
145 99 46 10
W(+) 55
_
H
0
= 0
H
1
= 0
Manuel Angel Barea Gmez 154
CAPTULO 7. CONTRASTES DE HIPTESIS NO PARAMTRICOS
En nuestra tablas W
10;0,01
= [3 52] Como 55 > 52 y aceptamos H
1
con una = 0, 01
Problema 7.22. Para comprobar si un tratamiento con cidos grasos es ecaz en pacientes con eczema atpico, se tomaron 10
pacientes con eczema de ms de 9 meses y se les someti durante 3 semanas a un tratamiento cticio (placebo) y durante las tres
siguientes a un tratamiento con cidos grasos. Tras cada periodo, un mdico ajeno al proyecto evalu la importancia del eczema en
una escala de 0 (no eczema) a 10 (tamao mximo de eczema). Los datos fueron los siguientes:
Placebo 6 8 4 8 5 6 5 6 4 5
Tratamiento 5 6 4 5 3 6 6 2 2 6
Placebo Tratamiento D Rango
6 5 1 4
8 6 2 7
4 4 0 -
8 5 3 9
5 3 2 7
6 6 0 -
5 6 -1 -4
6 2 4 10
4 2 2 7
5 6 -1 -4
W(+) 36
_
H
0
= 0
H
1
= 0
En nuestra tablas W
10;0,05
= [847] Como 36 < 47 aceptamos H
0
con una = 0, 05, por tanto, ambos son iguales lo que quiere decir
que el tratamiento no es ecaz
Manuel Angel Barea Gmez 155

También podría gustarte