Está en la página 1de 25

EJERCICIOS DE BIOESTADISTICA

Asignatura: Bioestadstica
Curso: 1o de Grado en Enfermera
Universidad San Pablo CEU

Santiago Angulo Daz-Parre


no
Anselmo Romero Limon

Jose Miguel Cardenas Rebollo


Alfredo Sanchez Alberca

Curso 2013-2014

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

Estadstica Descriptiva
1. Se realizo una encuesta a 40 personas de mas de 70 a
nos sobre el n
umero de medicamentos distintos
que tomaban habitualmente. El resultado de dicha encuesta fue el siguiente:
31220142351323142432
35012023011534230123
Se pide:
a) Obtener la distribucion de frecuencias de la muestra.
b) Dibujar el diagrama de barras de las frecuencias absolutas y su correspondiente polgono de
frecuencias.
c) Dibujar el diagrama de barras de las frecuencias relativas acumuladas.
d ) Calcular la media aritmetica, la mediana y la moda.
e) Calcular la varianza y la desviacion tpica.
f ) Calcular el coeficiente de variacion de Pearson.
2. La siguiente tabla expresa la distribucion de las puntuaciones obtenidas por un grupo de alumnos.
0-10
7

10-20
8

20-30
13

30-40
6

40-50
7

50-60
6

60-70
6

70-80
5

80-90
6

90-100
2

Se pide:
a) Dibujar el histograma y polgono de frecuencias.
b) Calcular la media aritmetica, la mediana y la moda.
c) Calcular el percentil 92.
d ) Calcular la desviacion tpica.
e) Calcular el coeficiente de asimetra.
f ) Calcular del coeficiente de curtosis.
3. Dada la grafica correspondiente a un polgono acumulativo de frecuencias relativas de una variable
estadstica agrupada en intervalos de una muestra de tama
no 20
Fi
1
0.85

0.45

0.15
X
0

20

40

60

se pide:
a) Construir la tabla de frecuencias.
b) Dibujar el histograma correspondiente.
c) Calcular la mediana y la moda.
1

80

100

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

d ) Calcular la media aritmetica y la desviacion tpica.


*4. El n
umero de lesiones padecidas durante una temporada por cada jugador de un equipo de f
utbol
fue el siguiente:
012130101201
112013212101
Se pide:
a) Construir la tabla de frecuencias.
b) Dibujar el polgono de frecuencias.
c) Calcular los cuartiles y el rango intercuartlico e interpretarlo.
d ) Calcular el coeficiente de asimetra e interpretarlo.
*5. En un estudio sobre el crecimiento se tomaron dos muestras, una de ni
nos recien nacidos y otra de
ni
nos con un a
no de edad. Las estaturas observadas en cada muestra fueron:
Recien nacidos: 51-50-51-53-49-50-53-50-47-50.
Ni
nos de un a
no: 62-65-69-71-65-66-68-69.
Seg
un el coeficiente de variacion, en cual de las dos muestras es mas representativa la media?
*6. El siguiente diagrama refleja el porcentaje de calificaciones obtenidas en un examen realizado a 80
alumnos:
Suspensos 40%

Sobresalientes 5%
Aprobados 30%

Notables 25%

Se pide:
a) Construir la tabla de frecuencias para las calificaciones.
b) Dibujar el polgono de frecuencias acumuladas.
c) Calcular todos los estadsticos de tendencia central que sean posibles.
d ) A partir de la variable calificacion, construir la variable nota con los siguientes intervalos:
Suspenso [0, 5), Aprobado [5, 7), Notable [7, 9) y Sobresaliente [9, 10], y calcular la nota media
y estudiar su representatividad.
Nota: En los tres primeros apartados se debe trabajar con la variable calificacion, mientras que en
el u
ltimo debe utilizarse la variable nota.
*7. Sea la variable estadstica agrupada en intervalos
la siguiente tabla:
Intervalos ni
[0, 10)
10
[10, 20)
[20, 30)
[30, 40)

cuya distribucion de frecuencias viene dada por


fi
0.25

22
0.30

a) Completar la tabla y hallar la desviacion tpica.


2

Ni

Fi

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

b) Calcular la mediana.
*8. Dada la siguiente tabla de frecuencias:
Intervalos
[0, 5)
[5, 10)
[10, 15)
[15, 20)

ni
2

fi

Ni

Fi

8
0.7
6

a) Completar la tabla.
b) Calcular el coeficiente de variacion y el rango intercuartlico e interpretar los resultados.
*9. Si a todos los datos de una muestra se les suma una misma cantidad positiva, como se ve afectada
la representatividad de la media? Y si se multiplican por un mismo n
umero distinto de 0? Razonar
la respuesta.
*10. Se ha llevado a cabo un estudio sobre el n
umero de radiografas realizadas durante el u
ltimo a
no a
un grupo de 200 personas, y la informacion se presenta en la siguiente tabla incompleta:
Radiografas
0
1
2
3
4
5

Personas

fi
0,2

Fi

84
0,72
24
0,02

a) Completar tabla.
b) Calcular media, mediana, desviacion tpica y coeficiente de variacion e interpretar los resultados.
*11. Al realizar un estudio sobre el peso de las mujeres mayores de 30 a
nos en una determinada poblacion,
se obtuvieron los siguientes datos:
72 66 51 87 65 57 73 84 67 78
58 62 75 56 68 74 57 65 73 67
Realizar un estudio descriptivo agrupando los datos en 4 clases de amplitud 10 comenzando en el
50, que incluya:
a) Histograma de frecuencias absolutas y frecuencias absolutas acumuladas y los correspondientes
polgonos.
b) Rango intercuartlico e interpretacion.
c) Estudiar la representatividad de la media.
*12. En un estudio estadstico realizado en la comunidad valenciana, aparece la siguiente tabla con los
datos referidos al n
umero de embarazos, abortos e hijos en una muestra de 999 mujeres:
n
0
1
2
3
4
5
6
7
8
Total

Embarazos
61
64
328
301
122
81
29
11
2
999
3

Abortos
751
183
51
10
2
2

Hijos nacidos
67
80
400
300
90
62

999

999

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

a) En que variable de las tres estudiadas es mas representativa la media?


b) Calcular la mediana del n
umero de hijos nacidos.
c) Que valor es relativamente mas alto, el de una mujer que ha tenido 4 abortos, o el de otra
que ha tenido 7 embarazos?. Justificar adecuadamente la respuesta.
*13. En un estudio sobre la relacion entre la curacion de la Hepatitis B mediante cierta terapia y la
edad de los pacientes, al cabo de dos meses de aplicacion se obtuvieron los siguientes datos que
muestran el total de pacientes analizados y los que curaron en cada uno de los intervalos de edad
considerados:
Edad Pacientes Curados
[0, 5)
80
4
[5, 10)
72
4
[10, 15)
116
20
[15, 20)
64
16
[20, 25)
68
20
a) Representar el polgono de frecuencias relativas acumuladas de los pacientes que no curaron.
b) Que media de edad es mas representativa, la de los pacientes que curaron o la de los que no
curaron? Justificar adecuadamente la respuesta.
c) Calcular el rango intercuartlico y el decil 8 de la edad para el total de pacientes e interpretarlos.
d ) Calcular el coeficiente de asimetra de la edad para el total de pacientes e interpretarlo.
e) Que porcentaje de pacientes no curados tendran una edad superior a 18 a
nos?
*14. Se ha sometido a dos grupos de 1o de enfermera, a un test de 90 preguntas de estadstica para
saber si dominan la materia, correspondiente al primer parcial de la asignatura. Los resultados
obtenidos fueron:
No de respuestas acertadas
[0, 15)
[15, 30)
[30, 45)
[45, 60)
[60, 75)
[75, 90)

Grupo 01
2
6
10
7
10
5

Grupo 02
5
12
15
18
8
2

a) En cual de los dos grupos podemos afirmar que es mas representativa la media del n
umero
de respuestas acertadas? Justificar adecuadamente la respuesta.
b) Calcular el rango intercuartlico del numero de respuestas acertadas del grupo 01 e interpretarlo.
c) De que alumno podramos afirmar que tiene un n
umero de aciertos relativamente mas alto,
uno del grupo 01 que ha acertado 66 preguntas o uno del grupo 02 que ha acertado 59?
Justificar adecuadamente la respuesta.
d ) Considerando en conjunto a los alumnos de ambos grupos, que tipo de asimetra presentara
el n
umero de respuestas acertadas? Justificar adecuadamente la respuesta.
e) Si se considera que un alumno tiene dominada la materia cuando responde correctamente al
menos a 70 preguntas, que porcentaje de los alumnos del grupo 01 podemos afirmar que tiene
dominada la materia?
*15. En una ciudad espa
nola se esta realizando un estudio de la edad de la madre en el momento del
primer parto segmentando seg
un si la madre es espa
nola o extranjera. Los datos obtenidos fueron:

Universidad San Pablo CEU

Edad (a
nos)
[15, 20)
[20, 25)
[25, 30)
[30, 35)
[35, 40)
[40, 45)

Departamento de Metodos Cuantitativos e Informaticos

Frecuencia Espa
nolas
8
65
253
362
125
41

Frecuencia Extranjeras
6
30
21
16
4

a) En que colectivo es mas representativa la media de edad en el momento del primer parto?
Justificar adecuadamente la respuesta.
b) Calcular la mediana de la edad en el momento del primer parto en el grupo de espa
nolas.
c) Calcular la media de edad global en el momento del primer parto considerando conjuntamente
espa
nolas y extranjeras.
d ) Teniendo en cuenta solo las espa
nolas, en que percentil de edad se encuentra una mujer que
ha tenido su primer parto a los 32 a
nos?
*16. Se desea realizar un estudio sobre los das de hospitalizacion necesarios para tratar una lesion
hepatica. Se utilizan para ello dos tratamiento diferentes y se obtuvieron los siguientes resultados:
Das de Hospitalizacion
[10, 20)
[20, 30)
[30, 40)
[40, 50)
[50, 60)

Pacientes A
25
15
12
10

Pacientes B
14
18
25
10
5

a) En que tratamiento es mas representativa la media del n


umero de das de hospitalizacion?
Justificar adecuadamente la respuesta.
b) Calcular e interpretar el apuntamiento de la distribucion de das de hospitalizacion con el
tratamiento A.
c) Cuantos das de hospitalizacion tienen que transcurrir para que sean dados de alta el 75 %
de los pacientes que siguen el tratamiento B?
d ) Que porcentaje de lesiones se tratan en menos de 36 das con el tratamiento A?
e) Que tiempo de recuperacion es relativamente mas alto, el de un individuo que habiendo
seguido el tratamiento A ha tardado 25 das u otro que habiendo seguido el tratamiento B ha
tardado 34? Justificar adecuadamente la respuesta.
*17. La siguiente tabla expresa la edad, en a
nos, a la que fue diagnosticada cirrosis hepatica en 1000
pacientes de los hospitales de Madrid, anotando tambien en los que la enfermedad ha sido producida
por consumo abusivo de alcohol:
Edad
[0 , 20)
[20 , 40)
[40 , 60)
[60 , 80)
[80 , 100)

nAlcohol
55
130
203
162
40

ntotal
76
195
307
292
130

a) En que colectivo es mas representativa la media, en los que la cirrosis proviene del cosumo
excesivo de alcohol o de otras causas? Justificar adecuadamente la respuesta.
b) Considerando los 1000 individuos, calcular el valor de la edad de diagnostico tal que solo un
30 % estan por arriba de dicha edad.
c) Considerando los 1000 individuos, cuanto vale el coeficiente de asimetra de la edad de
diagnostico?
d ) En cada una de las 6 clases de edad consideradas, cuanto vale la proporcion de individuos
con cirrosis que no se debe al consumo de alcohol? Cual es la proporcion media de individuos
con cirrosis que no se debe al consumo de alcohol?
5

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

Regresi
on y Correlaci
on
18. Dada la siguiente tabla de correlacion:
X \Y
[2, 2)
[2, 6)
[6, 10)

1
3
4
5

2
6
7
3

3
1
3
0

Determinar:
a) Las distribuciones marginales. Media, Moda y Mediana.
b) Rectas de Regresion.
c) Coeficiente de correlacion lineal. Interpretar el resultado.
19. Se ha realizado un estudio comparativo de las puntuaciones obtenidas por los alumnos en un test
de ingreso en la universidad (X), y el n
umero de asignaturas aprobadas en el primer curso (Y ).
Los resultados obtenidos se expresan en la siguiente tabla:
X \Y
[0, 10)
[10, 20)
[20, 30)
[30, 40)

0
2
1
0
0

1
2
1
1
0

2
1
2
3
2

3
0
2
4
2

4
0
0
1
6

Se desea calcular:
a) Recta de regresion de X sobre Y.
b) Coeficiente de correlacion e interpretacion del mismo.
c) Si la universidad en cuestion solo contara con alumnos que al menos logren aprobar dos
asignaturas, que n
umero de preguntas respondidas correctamente exigira en el test?.
*20. En una poblacion se ha realizado un estudio sobre el nivel de colesterol en sangre (X) y la tension
arterial maxima (Y ) obteniendo. Para ello se ha tomado una muestra de 80 individuos que ha dado
lugar a la siguiente tabla de frecuencias:
X \Y
[170, 190)
[190, 210)
[210, 230)
[230, 250)
ny

[110, 130) [130, 150) [150, 170)


4
10
12
4
7
8
1
30
24

nx
12

18

Se pide:
a) Completar la tabla.
b) Recta de regresion del nivel de colesterol sobre la tension.
c) Coeficiente de determinacion e interpretacion.
d ) La tension arterial maxima esperada para una persona cuyo nivel de colesterol es 270.
*21. Al realizar un estudio sobre la dosificacion de un cierto medicamento, se trataron 6 pacientes con
dosis diarias de 2 mg, 7 pacientes con 3 mg y otros 7 pacientes con 4 mg. De los pacientes tratados
con 2 mg, 2 curaron al cabo de 5 das, y 4 al cabo de 6 das. De los pacientes tratados con 3 mg
diarios, 2 curaron al cabo de 3 das, 4 al cabo de 5 das y 1 al cabo de 6 das. Y de los pacientes
tratados con 4 mg diarios, 5 curaron al cabo de 3 das y 2 al cabo de 5 das. Se pide:
6

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

a) Dar el coeficiente de correlacion e interpretacion.


b) Determinar el tiempo esperado de curacion para una dosis de 5 mg diarios.
22. Se consideran dos variables aleatorias X e Y tales que:
La recta de regresion de Y sobre X viene dada por la ecuacion: y x 2 = 0.
La recta de regresion de X sobre Y viene dada por la ecuacion: y 4x + 22 = 0.
Calcular:
a) Valores de x e y.
b) Coeficiente de correlacion lineal.
23. En el ajuste rectilneo a una distribucion bidimensional se sabe que x = 2, y = 1, y el coeficiente
de correlacion lineal es 0 (r = 0).
a) Si x = 10, cual sera el valor interpolado para y?.
b) Si y = 5, cual sera el valor interpolado para x?.
c) Dibuja las rectas de regresion de Y sobreX, y la de X sobre Y .
*24. Despues de tomar un litro de vino se ha medido la concentracion de alcohol en la sangre en distintos
instantes, obteniendo:
Tiempo despues (minutos)
Concentracion (gramos/litro)

30
1.6

60
1.7

90
1.5

120
1.1

150
0.7

180
0.2

Se pide:
a) Calcular la recta de regresion de la concentracion en funcion del tiempo.
b) Que concentracion de alcohol habra a los 100 minutos?
c) Si la concentracion maxima de alcohol en la sangre que permite la ley para poder conducir
es 0.8 g/l, cuanto tiempo habra que esperar despues de tomarse un litro de vino para poder
conducir sin infringir la ley?
*25. En un estudio para relacionar la longitud de la lnea de la vida de la mano izquierda y la duracion
de la vida de una persona se han obtenido datos de 50 personas con los siguientes resultados
(X=longitud de la lnea en cm, Y =edad al morir en a
nos):
X
X
X
X
X
y = 3333
y 2 = 231933
x = 459,9
x2 = 4308,57
xy = 30949.
A la vista de estos resultados, cuanto vivira, por termino medio, una persona con una lnea de
longitud 7.5 cm? Es fiable esta estimacion?
*26. Se han medido dos variables S y T en 10 individuos, obteniendose los siguientes resultados:
(-1.5 , 2.25), (0.8 , 0.64), (-0.2 , 0.04), (-0.8 , 0.64), (0.4 , 0.16),
(0.2 , 0.04), (-2.1 , 4.41), (-0.4 , 0.16), (1.5 , 2.25), (2.1 , 4.41).
Se pide:
a) Calcular la covarianza de S y T .
b) Se puede afirmar que S y T son independientes? Justificar la respuesta.
c) Que valor predice la correspondiente recta de regresion para t = 2?
*27. En un estudio medico se afirma que existe una fuerte relacion lineal entre la presion sistolica
sangunea media durante una intervencion quir
urgica, P en milmetros Hg, y el volumen de sangre
perdido en la intervencion, S en mililitros. Para ver si es cierto, otro equipo medico mide ambas
variables en una muestra de 10 pacientes obteniendo:
7

Universidad San Pablo CEU

P (mm Hg)
S (ml)

90
250

Departamento de Metodos Cuantitativos e Informaticos

105
350

110
320

95
280

80
170

110
290

100
300

90
240

95
280

105
310

Se pide:
a) Calcular la recta de regresion de la perdida de sangre en funcion de la presion sistolica.
b) Calcular el coeficiente de determinacion e interpretarlo.
c) Cual es el valor de la presion sistolica que esperamos que tenga un paciente cuya perdida de
sangre ha sido de 0,5 litros? Es fiable dicha prediccion? Por que?.
*28. Al realizar un estudio de las calificaciones de Estadstica Aplicada (EA) y Biofsica (BF) de un
grupo de alumnos de la Diplomatura de Fisioterapia, se obtuvieron los siguientes resultados:
EA \ BF
SS
AP
NT
SB

SS
6
3
1
0

AP
2
5
3
0

NT
0
2
3
1

SB
0
0
1
1

donde SS representa la calificacion de suspenso, cuya nota correspondiente esta en el intervalo [0, 5);
AP aprobado, con nota en [5, 7); NT notable, con nota en [7, 9); y SB sobresaliente, con nota en
[9, 10].
a) Calcular el rango intercuartlico de la nota de Estadstica Aplicada.
b) Calcular el coeficiente de asimetra de la nota de Estadstica Aplicada e interpretarlo.
c) En que asignatura es mas representativa la media? Razonar la respuesta.
d ) Si un alumno tiene un 4 en Biofsica, que nota se espera que tenga en Estadstica Aplicada?.
e) Razonar si es fiable la prediccion anterior.
*29. La artrosis reumatoide es una enfermedad reumatica que aparece con frecuencia en las personas
mayores. Uno de los ndices mas utilizados para ver el grado de actividad de la enfermedad es el
RADAI (Rheumatoid Arthritis Disease Activity Index), que mide el grado de actividad en una
escala de 0 (mnima actividad) a 3 (maxima actividad). Para ver de que manera influye la edad en
el grado de actividad de la enfermedad se ha seleccionado un grupo de personas mayores y se ha
medido el ndice RADAI en ellos, obteniendo la siguiente tabla de frecuencias:
RADAI\Edad
0-1
1-2
2-3

40-50
8
4
0

50-60
6
7
2

60-70
2
5
6

70-80
1
2
7

Se pide:
a) Estudiar si existe relacion lineal entre la edad y el RADAI.
b) Calcular la recta de regresion del RADAI sobre la edad. Seg
un la recta, cuanto aumentara
el grado de actividad de la enfermedad por cada a
no que pasa?
c) Si se considera que los pacientes don un RADAI de 2 o superior necesitan ayuda en sus
actividades diarias, a que edad se empezara a necesitar esta ayuda?
*30. Se realiza un estudio para establecer una ecuacion mediante la cual se pueda utilizar la concentracion de estrona en saliva para predecir la concentracion del esteroide en plasma libre. Se extrajeron
los siguientes datos de 10 varones sanos:
Estrona
Esteroide

1,4
30

7,5
25

8,5
31,5

9
27,5
8

9
39,5

11
38

13
43

14
49

14,5
55

16
48,5

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

a) Comprobar la idoneidad del modelo lineal de regresion. Si el modelo es apropiado, hallar la


recta de regresion de la concentracion de estrona en funcion de la concentracion de esteroide.
b) Si un individuo presenta una concentracion de estrona en saliva de 10, que concentracion de
esteroide en plasma libre predecira el modelo de regresion lineal?
c) Para los dos primeros individuos, calcular los errores que se comenten al utilizar el modelo
de regresion lineal para predecir la concentracion de estrona. Razonar a que se deben estos
errores.
*31. En un experimento se ha medido el n
umero de bacterias por unidad de volumen en un cultivo,
cada hora transcurrida, obteniendo los siguientes resultados:
Horas
No de Bacterias

0
25

1
28

2
47

3
65

4
86

5
121

6
190

7
290

8
362

Se pide:
a) Dibujar el diagrama de dispersion. Seg
un este diagrama, que tipo de modelo explicara mejor
la relacion entre el numero de bacterias y las horas transcurridas?
b) Seg
un el modelo anterior, cuantas bacterias tendramos al cabo de 3 horas y media? Y al
cabo de 10 horas? Son fiables estas predicciones?
c) Cuanto tiempo tendra que transcurrir para que en el cultivo hubiese 100 bacterias?
*32. La concentracion de un farmaco en sangre, C en mg/dl, es funcion del tiempo, t en horas, y viene
dada por la siguiente tabla:
t
C

2
25

3
36

4
48

5
64

6
86

7
114

8
168

a) Seg
un el modelo exponencial, que concentracion de farmaco habra a las 4, 8 horas? Es fiable
la prediccion? Justificar adecuadamente la respuesta.
b) Seg
un el modelo lineal, que tiempo tendra que transcurrir para que la concentracion de
farmaco fuese de 100 mg/de? Es fiable la prediccion? Justificar adecuadamente la respuesta.
*33. En un estudio se pretende ver si existe o no relacion entre la cantidad total inyectada de una
determinada sustancia durante un mes, en cm3 , y el aumento de peso provocado en las personas
sometidas al tratamiento, en kg. Para el estudio se tomaron paciente de unas caractersticas similares en edad, peso y altura, y los resultados obtenidos en una muestra de 6 personas fueron los
siguientes:
Aumento Peso (kg)
Sustancia (cm3 )

1,9
15

2,4
20

2,8
25

3,1
30

3,3
35

3,4
40

a) Calcular el modelo logartmico del Aumento de Peso en funcion de la Cantidad de Sustancia


administrada.
b) Es bueno o malo el modelo logartmico calculado? Justificar adecuadamente la respuesta.
c) Que cantidad de sustancia tendramos que administrar a una persona que queremos que
aumente su peso en 3, 2 kg?
*34. Supongamos dos variables biologicas, X e Y , que se piensa que estan relacionadas. Para comprobarlo se miden las 2 variables en 10 individuos y se obtienen los siguientes sumatorios:
10
P
i=1

xi = 55 ,

10
P
i=1

yi = 478 ,

10
P
i=1

ln xi = 15,104 ,

10
P
i=1

ln yi = 36,028 ,

10
P
i=1

x2i = 385 ,

10
P
i=1

yi2 = 33148

Universidad San Pablo CEU

10
P
i=1

(ln xi )2 = 27,650 ,

10
P
i=1

(ln yi )2 = 135,667 ,

Departamento de Metodos Cuantitativos e Informaticos

10
P
i=1

xi yi = 3527 ,

10
P
i=1

xi ln yi = 220,055 ,

10
P
i=1

yi ln xi = 914,932

Con ello:
a) Calcular la ecuacion de la recta de regresion de Y como funcion de X.
b) Calcular la ecuacion del modelo exponencial de Y como funcion de X.
c) Calcular la ecuacion del modelo logartmico de Y como funcion de X.
d ) Que tanto por ciento de la variabilidad de la nube de puntos se explica con cada uno de los
modelos anteriores? Cual de ellos sera mejor para realizar el ajuste? Justificar la respuesta.
35. En un estudio en el que participaron las 8 universidades de una region se ha valorado la excelencia
docente e investigadora, estableciendo los siguientes rankings (de mejor a peor):
Ranking Docencia
Ranking Investigacion

3
6

4
5

8
4

5
3

2
7

1
8

6
1

7
2

Se puede decir que existe relacion entre la excelencia docente y la investigadora? Justificar la
respuesta.

C
alculo de Probabilidades
36. En un laboratorio hay 4 frascos de acido sulf
urico y 2 de acido ntrico, y en otro hay 1 frascos
de acido sulf
urico y 3 de acido ntrico. Se saca al azar un frasco de cada laboratorio. Hallar la
probabilidad de que:
a) Los dos frascos sean de acido sulf
urico.
b) Los dos sean de acido ntrico.
c) Uno sea de acido sulf
urico y otro de acido ntrico.
37. Sean A y B sucesos de un mismo espacio muestral tales que: P(A)=3/8, P(B)=1/2, P(A B)=1/4.
Calcular:
a) P(A B).
b) P(A) y P(B).
c) P(A B).
d ) P(A B).
e) P(A/B).
f ) P(A/B).
38. La probabilidad de contraer hepatitis a partir de una unidad de sangre es 001. Un paciente recibe
dos unidades de sangre durante su estancia en el hospital. Cual es la probabilidad de que contraiga
hepatitis como consecuencia de ello?
39. Sean A y B sucesos de un mismo espacio muestral, tales que P(A)=06 y P(A B)=09. Calcular
P(B) si:
a) A y B son independientes.
b) A y B son incompatibles.
40. El tetanos es mortal en el 70 % de los casos. Si tres personas contraen el tetanos, Cual es la
probabilidad de que mueran al menos dos de los tres?
10

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

*41. El 60 % de los individuos de una poblacion estan vacunados contra una cierta enfermedad. Durante
una epidemia se sabe que el 20 % la ha contrado y que 2 de cada 100 individuos estan vacunados
y son enfermos. Calcular el porcentaje de vacunados que enferma y el de vacunados entre los que
est
an enfermos.
42. A partir de una investigacion realizada, se sabe que el 10 % de las personas de 50 a
nos sufren un
tipo particular de artritis. Se ha desarrollado un procedimiento para detectar esta enfermedad, y
por las pruebas realizadas se observa que si se aplica el procedimiento a individuos que padecen la
enfermedad, da positivo en el 85 % de los casos, mientras que si se aplica a individuos sanos, da
positivo en el 4 % de los casos. Se pide:
a) Calcular la probabilidad de que realizado el procedimiento a una persona, el resultado sea
positivo.
b) Si el resultado de aplicar el procedimiento a una persona ha sido positivo, Cual es la probabilidad de que padezca la enfermedad?
43. En un servicio clnico digestivo se sabe que, de cada 1000 pacientes con dolor de estomago, 700
presentan gastritis, 200 presentan u
lcera y 100 presentan cancer. En el analisis de la sintomatologa
gastrica, se ha comprobado que las probabilidades de presentar vomitos son 03 en el caso de
gastritis, 06 en el caso de u
lcera y 09 en el caso de cancer. Llega un nuevo paciente con dolor de
est
omago que, ademas, presenta vomitos. Que diagnosticaramos?
*44. En un estudio sobre el tabaco, se informa que el 40 % de los fumadores tiene un padre fumador,
el 25 % tiene una madre fumadora, y el 52 % tiene al menos uno de los dos padres fumadores. Se
elige una persona fumadora al azar. Calcular:
a) Probabilidad de que la madre sea fumadora si lo es el padre.
b) Probabilidad de que la madre sea fumadora si no lo es el padre.
c) Son independientes el tener padre fumador y el tener madre fumadora.
*45. Un equipo de atencion primaria de salud realiza un estudio de la poblacion, para evaluar la incidencia de hipertension e hipercolesterolemia. Para ello analizan a 1000 personas de dicha poblacion,
seleccionadas aleatoriamente, encontrandose que 180 presentan hipertension, 140 hipercolesterolemia y 800 ninguna de ambas. Se pide calcular la probabilidad de que una persona tomada al
azar
a) Presente ambas enfermedades.
b) Presente hipertension si no presenta hipercolesterolemia.
*46. En una poblacion se sabe que hay un 15 % de personas que sufren trastornos de sue
no, un 12 %
que presentan ansiedad, y un 80 % que no presentan ninguna de estas alteraciones. Se pide:
a) Que porcentaje de personas presentan ambas alteraciones?.
b) Que porcentaje de las personas con trastorno de sue
no presentan tambien ansiedad?.
c) Son independientes el trastorno del sue
no y la ansiedad?.
d ) Si se toma una muestra de 20 personas de la poblacion, Cual es la probabilidad de que haya
alguna con trastorno del sue
no? y de que haya alguna con ansiedad?.
*47. Se ha desarrollado un nuevo test diagnostico para detectar el sndrome de Down en ni
nos recien
nacidos, con un sensibilidad del 80 % y una especificidad del 90 %. Si en una determinada poblacion
en la que hay un 1 % de recien nacidos con el sndrome, al aplicarle el test a un ni
no, da positivo,
cual es la probabilidad de que tenga el sndrome? le diagnosticaras la enfermedad? Cual debera
ser la especificidad mnima del test para diagnosticar el sndrome en el caso de dar positivo?
Nota: La sensibilidad de un test diagnostico es la proporcion de personas con la enfermedad que
tienen un resultado positivo en el test, mientras que la especificidad del test es la proporcion de
personas sin la enfermedad que tienen un resultado negativo en el test.
11

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

*48. En un estudio se han probado tres tipos de tratamientos A, B y C contra una determinada enfermedad. De los pacientes participantes en el estudio, el 50 % fueron tratados con el tratamiento A,
el 30 % con el B y el 20 % con el C. Posteriormente se observaron los pacientes que sanaron y los
que tuvieron alg
un efecto secundario, seg
un se muestra en la siguiente tabla:
Tratamiento
A
B
C

Sanados
86 %
92 %
81 %

Con efectos secundarios


12 %
14 %
6%

Se pide:
a) Si se selecciona un enfermo al azar, cual es la probabilidad de que haya sanado? Y de que
haya tenido alg
un efecto secundario?
b) Si un enfermo ha sanado, que tratamiento es mas probable que haya recibido? Y si en vez
de decirnos que ha sanado nos dicen que no ha tenido efectos secundarios?
c) Si en total hay un 8 % pacientes que no sanaron pero que tampoco tuvieron efectos secundarios,
cual es la probabilidad de que un enfermo se haya curado sin tener efectos secundarios?
*49. La sensibilidad de determinar la tuberculosis con una radiografa del torax es del 90 %. Por contra,
la probabilidad de que un individuo sano quede reconocido equivocadamente como tuberculoso es
del 1 %. Se realizan radiografas de un grupo de individuos en el cual el porcentaje de enfermos de
tuberculosis es del 1 %, y se pide:
a) Cual es la probabilidad de que un individuo que sea diagnosticado como tuberculoso a partir
de la radiografa lo sea verdaderamente?.
b) Cual debera ser la fiabilidad mnima en la determinacion de la tuberculosis para que la
probabilidad del apartado anterior fuera superior a 0,5?.
*50. Para comprobar la eficacia de un test diagnostico se lleva a cabo una experiencia cuyos resultados
se recogen en la siguiente tabla:

Enfermos
No Enfermos

Test +
4680
80

Test
120
2020

Calcular para dicho test:


a) Las probabilidades de Verdadero Negativo, Verdadero Positivo, Falso Negativo y Falso Positivo.
b) Los Valores Predictivos, tanto el Positivo como el Negativo.
c) La probabilidad de Diagnostico Acertado.
*51. Supongamos dos test diagnostico, A y B, completamente independientes, que se utilizan para
diagnosticar una misma enfermedad. Si la prevalencia de la enfermedad en una poblacion es de un
2 %, la sensibilidad de A es de un 95 %, la sensibilidad de B es de un 97 %, la especificidad de A es
de un 90 %, y la de B de un 85 %, calcular:
a) El valor predictivo positivo del test A.
b) La probabilidad de que, aplicados ambos a un individuo cualquiera de la poblacion, alguno
de los test de positivo.
c) La probabilidad de que, aplicados ambos a un individuo cualquiera de la poblacion, los dos
den diagnostico erroneo.

12

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

*52. El suero de una mujer embarazada puede ser analizado por medio de un procedimiento llamado
electroforesis en gel de almidon. Este procedimiento permite detectar la presencia de una zona
protenica llamada zona de embarazo, la cual se supone que es un indicador de que el feto es una
hembra. Para investigar las propiedades de este test se seleccionaron a 300 mujeres embarazadas
de una poblacion. Los resultados del test y los sexos de los ni
nos fueron:

Varon
Hembra

Test +
72
78

Test
75
75

Se sabe que en esta poblacion, la probabilidad de nacer hombre es de 0,48.


a) Calcular la sensibilidad y la especificidad del test, basandose en el estudio de las 300 mujeres.
b) Supuesto realizada la prueba a una mujer cuyo resultado ha sido positivo, cual es la probabilidad de que este sea correcto?
c) Se le aplica el test a una mujer embarazada. Calcular la probabilidad de que el test de un
resultado correcto. Que opinas sobre la calidad del test?
d ) Cual debera ser la especificidad mnima del procedimiento para predecir que es hembra en
el caso de dar positivo?
*53. Supongamos una poblacion y una enfermedad en la misma cuya prevalencia es 0, 2. Para detectar
la enfermedad se utilizan 2 test diagnostico independientes, A y B, con sensibilidades respectivas
de 0, 95 y 0, 97, y probabilidades de diagnostico acertado respectivas de 0, 85 y 0, 90. Se pide:
a) Cual es la especificidad del test A?
b) Que probabilidad hay de que el test B de positivo?
c) Cual es el valor predictivo positivo del test A? Y el valor predictivo negativo del B?
d ) Que probabilidad hay de que en un individuo el test A de positivo y negativo el B?
e) Si un individuo esta enfermo, cual es la probabilidad de que los dos tests den resultados
erroneos?
*54. Supongamos una enfermedad que se piensa que es causada por un u
nico gen con dos alelos posibles:
A y B; que se combinan de 4 formas diferentes: AA, AB, BA y BB. Estas formas diferentes
de combinacion de los alelos reciben el nombre de genotipos, y en este caso hay dos genotipos
homocigoticos, formados por dos alelos iguales: AA y BB, y uno heterocigotico, formado por las dos
combinaciones de alelos diferentes, AB y BA. Supongamos ademas que la probabilidad del alelo A
en la poblacion vale 0,95, la del B 0.05, y que se heredan de forma completamente independiente.
Tambien se sabe que la probabilidad de tener la enfermedad si se tiene un doble alelo B en el
genotipo es del 90 %, del 50 % si se tiene un u
nico alelo B y solo del 10 % si no se tiene ning
un alelo
B. Con todo ello:
a) Cual es la probabilidad de cada uno de los 3 genotipos diferentes?
b) Cual es la probabilidad de tener la enfermedad en la poblacion?
c) Si se sabe que un individuo tiene la enfermedad, cual es el genotipo mas probable? Justificar
adecuadamente la respuesta.

Variables Aleatorias
55. Sea X una variable aleatoria discreta cuya ley de probabilidad es
X
P (X = x)

4
0,15

5
0,35

6
0,10

7
0,25

8
0,15

a) Calcular y representar graficamente la funcion de distribucion.


13

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

b) Obtener:
1)
2)
3)
4)

P (X < 7,5).
P (X > 8).
P (4 X 6,5).
P (5 < X < 6).

56. Sea la variable aleatoria X con la siguiente

F (x) =

funcion de distribucion:
0
1/5
3/4
1

si
si
si
si

x<1
1x<4
4x<6
x6

Se pide:
a) Distribucion de probabilidad.
b) Obtener:
1)
2)
3)
4)

P (X = 6).
P (X = 5).
P (2 < X < 5,5).
P (0 X < 4).

57. La probabilidad de curacion de un paciente al ser sometido a un determinado tratamiento es 0,85.


Calcular la probabilidad de que en un grupo de 6 enfermos sometidos a tratamiento:
a) se curen la mitad.
b) se curen al menos 4.
58. Diez individuos entran en contacto con un portador de tuberculosis. La probabilidad de que la
enfermedad se contagie del portador a un sujeto cualquiera es 010.
a) Que probabilidad hay de que ninguno se contagie?
b) Que probabilidad hay de que al menos dos se contagien?
c) Cuantos se espera que contraigan la enfermedad?
59. La probabilidad de que al administrar una vacuna de una determinada reaccion es 0001. Si se
vacunan 2000 personas, Cual es la probabilidad de que aparezca una reaccion adversa?
*60. Se desarrolla un compuesto para aliviar las migra
nas. El fabricante afirma que es efectivo en un
90 % de los casos. Se prueba sobre 4 pacientes. Sea X el n
umero de pacientes que obtiene alivio.
a) Construir la funcion de probabilidad, suponiendo que la afirmacion del fabricante sea correcta.
b) Calcular la probabilidad de que el n
umero de pacientes que obtienen alivio sea como maximo
uno.
c) Si el compuesto no alivia a ninguno de los pacientes. Es esa una razon para poner en duda
la eficacia afirmada por el fabricante? Razonar sobre la base de la probabilidad calculada.
d ) Calcular la media. Que significado tiene la media en este ejemplo?
61. Un examen de tipo test consta de 10 preguntas con tres respuestas posibles para cada una de
ellas. Se obtiene un punto por cada respuesta acertada y se pierde medio punto por cada pregunta
fallada. Un alumno sabe tres de las preguntas del test y las contesta correctamente, pero no sabe
las otras siete y las contesta al azar. Que probabilidad tiene de aprobar el examen?
*62. El n
umero medio de llamadas por minuto que llegan a una centralita telefonica es igual a 120.
Hallar las probabilidades de los sucesos siguientes:
14

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

a) A={durante 2 segundos lleguen a la centralita menos de 4 llamadas}


b) B={durante 3 segundos lleguen a la centralita 3 llamadas como mnimo}
*63. Se realiza un experimento aleatorio consistente en inyectar un virus a tres tipos de ratas y observar
si sobreviven o no. Se comprueba que las probabilidades asociadas a los elementos del espacio
muestral son:
E
P

VVV
0,1

VVM
0,1

V MV
0,1

V MM
0,15

MV V
0,15

MV M
0,1

MMV
0,1

MMM
0,2

donde V es vivir y M es morir. Se pide:


a) Construir la variable aleatoria que mida el n
umero de ratas vivas y su funcion de probabilidad.
b) Calcular la funcion de distribucion.
c) Calcular P (X 1), P (X 2) y P (X = 1,5).
d ) Calcular la media y la desviacion tpica.
*64. En una determinada ciudad, se ha detectado un caso de gripe A por cada 2000 habitantes. Ademas
se sabe que una de cada diez personas afectadas por la gripe A, como consecuencia de la misma,
acaba por padecer una neumona grave:
a) Si tomamos un grupo de 4000 personas, cual es la probabilidad de que haya mas de 3 afectados
por la gripe A? Y de que haya alguno que padezca una neumona grave como consecuencia
de la gripe?
b) En un grupo de 20 personas con gripe A, cual es la probabilidad de que menos de tres acaben
padeciendo la posterior neumona grave?
c) Si queremos hacer una estimacion de los medios con los que deben contar los hospitales, y
sabemos que la ciudad tiene 60000 habitantes, cuantos esperamos que acaben padeciendo
una neumona grave?
*65. Se ha comprobado experimentalmente que una de cada 20 billones de celulas expuestas a un
determinado tipo de radiacion muta volviendose cancergena. Sabiendo que el cuerpo humano tiene
aproximadamente 1 billon de celulas por kilogramo de tejido, calcular la probabilidad de que una
persona de 60 kg expuesta a dicha radiacion desarrolle cancer. Si la radiacion ha afectado a 3
personas de 60 kg, cual es la probabilidad de que desarrolle el cancer mas de una?.
*66. En un servicio de urgencias de cierto hospital se sabe que, en media, llegan 2 pacientes a la hora.
Calcular:
a) Si los turnos en urgencias son de 8 horas, cual sera la probabilidad de que en un turno lleguen
mas de 5 pacientes?.
b) Si el servicio de urgencias tiene capacidad para atender adecuadamente como mucho a 4
pacientes a la hora, cual es la probabilidad de que a lo largo de un turno de 8 horas el
servicio de urgencias se vea desbordado en alguna de las horas del turno?.
*67. En la consulta de un medico se sabe que por termino medio uno de cada 4 pacientes citados no
acude a la consulta. El tiempo del que dispone el medico para utilizar la sala en la que pasa consulta
es de 2 horas y media, y dedica a cada paciente 10 minutos. Si cada da cita a 17 pacientes:
a) Calcular la probabilidad de que un da no pueda atender a todos los que acudan.
b) Si tiene 180 das de consulta al a
no, calcular la probabilidad de que mas de 6 das no pueda
atender a todos los que acudan a su consulta.
*68. La probabilidad de que en un grupo de 5 individuos mayores de 70 a
nos todos padezcan arterioesclerosis cerebral es de 12,5 por mil.
a) Cual es la probabilidad de padecer la enfermedad entre los mayores de 70 a
nos?.
15

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

b) En un grupo de 1000 personas, cual es la probabilidad de que padezcan la enfermedad mas


de 450?.
*69. Un test diagnostico para detectar la adiccion a la nicotina en fumadores tiene una sensibilidad del
98 % y una especificidad del 80 %. Si en la poblacion de fumadores hay un 30 % con adiccion a la
nicotina. Se pide:
a) Si un fumador da positivo en el test, cual es la probabilidad de que tenga adiccion a la
nicotina?.
b) Si un fumador da negativo en el test, cual es la probabilidad de que no tenga adiccion a la
nicotina?.
c) Si se aplica el test a 8 personas cual es la probabilidad de que haya alg
un falso positivo?.
d ) Si se aplica el test a 200 personas cual es la probabilidad de que haya mas de un falso
negativo?.
*70. Se sabe que un individuo ha sufrido los siguientes ataques epilepticos durante los u
ltimos 12 meses
(desglosados mes a mes):
3

Suponiendo que el n
umero de ataques epilepticos que sufre dicho individuo sigue una distribucion
de Poisson, calcular:
a) Probabilidad de que el proximo mes tenga al menos 2 ataques.
b) Probabilidad de que el proximo trimestre tenga 9 ataques.
*71. Durante sus practicas en los hospitales de la Comunidad de Madrid, los estudiantes del Grado en
Enfermera cometen 6 fallos considerados como graves o muy graves al cabo de un mes, en media.
Suponiendo que todos los meses tienen 30 das:
a) Cual es la probabilidad de que al cabo de un mes cometan mas de 4 fallos graves o muy
graves?
b) Cual es la probabilidad de que un da cometan alg
un fallo grave o muy grave?
c) Si habitualmente muere uno de cada 50 pacientes como consecuencia del fallo grave o muy
grave cometido por los estudiantes, cual es la probabilidad de que al cabo de un a
no se hayan
producido al menos 2 muertes de este tipo?
d ) Al cabo de un a
no, cual es la probabilidad de que haya al menos 10 meses con mas de 4 fallos
graves o muy graves?
*72. Recientes estudios sobre la incidencia del cancer de testculo en varones de la poblacion espa
nola
han llegado a la conclusion de que 1 de cada 250 varones acabara padeciendolo a lo largo de su
vida. No obstante, se cura en un 92 % de los casos.
a) Si en un hospital se estan tratando 20 varones con cancer de testculo, que probabilidad hay
de que no curen al menos 3?
b) Si tenemos un grupo 500 varones de la poblacion espa
nola, que probabilidad hay de que
menos de 4 tengan cancer de testculo en alg
un momento de su vida?
c) Si tenemos una ciudad hay 10000 varones, que probabilidad hay de que tengan cancer de
testculo y no cure en mas de 2?
73. Una variable aleatoria continua X tiene una funcion de densidad dada por:

k(6 3x) si
0x2
f (x) =
0
si x < 0 o x > 2

16

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

a) Determinar el valor de k.
b) Hallar P (X 1); P (X > 2); P (X = 1/4); P (1/3 X 2/3).
c) Calcular y .
d ) Hallar la funcion de distribucion F (x).
74. Sea Z una variable aleatoria que sigue una distribucion N (0, 1). Determinar el valor de t en cada
uno de los siguientes casos:
a) El area entre 0 y t es 0,4783.
b) El area a la izquierda de t es 0,6406.
c) El area entre 1,5 y t es 0,2313.
75. Hallar las siguientes probabilidades:
a) P (2,4 Z 1,2) si Z es N (0, 1).
b) P (|Z| > 1,2) si Z es N (0, 1).
c) P (1,3 X 3,3) si X es N (2, 1).
d ) P (|X 3| > 2) si Xes N (3, 4).
76. Entre los diabeticos, el nivel de glucosa en la sangre en ayunas, puede suponerse de distribucion
aproximadamente normal, con media 106 mg/100 ml y desviacion tpica 8 mg/100 ml.
a) Hallar P (X 120 mg/ 100 ml).
b) Que porcentaje de diabeticos tendra niveles entre 90 y 120 mg/100 ml?
c) Encontrar un valor que tenga la propiedad de que el 25 % de los diabeticos tenga un nivel de
glucosa X por debajo de dicho valor.
77. Se sabe que el nivel de colesterol en varones de mas de 30 a
nos sigue una distribucion normal, de
media 220 y desviacion tpica 30. Realizando un estudio sobre 20000 varones mayores de 30 a
nos,
a) Cuantos se espera que tengan su nivel de colesterol entre 210 y 240?
b) Cuantos se espera que tengan su nivel de colesterol por encima de 250?
c) Cual sera el nivel de colesterol, por encima del cual se espera que este el 20 % de la poblacion?
*78. Dada la funcion de densidad dada por la siguiente grafica,
f(x)
1

X
1

3/2

calcular:
a) P (X < 1), P (X > 0), P (X = 1/4), P (1/2 X 3/2).
b) Media y desviacion tpica.

17

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

*79. En una poblacion con 40000 personas, se sabe que 2276 tienen entre 0.80 y 0.84 miligramos de
bilirrubina por decilitro de sangre, y que 11508 tienen mas de 0.84. Suponiendo que la concentracion
de bilirrubina en sangre sigue una distribucion normal, se pide:
a) Calcular su media y su desviacion tpica.
Nota: En caso de no conseguir calcular la media y la desviacion tpica, tomar los valores
= 0,8 y = 0,1 y continuar con el ejercicio.
b) Calcular el n
umero de personas con mas de 1 miligramo de bilirrubina por decilitro de sangre.
*80. Se supone que la tension arterial de los habitantes de una poblacion de 20000 habitantes sigue una
distribucion normal, cuya media es 13 y su rango intercuartlico 4. Se pide:
a) Cuantas personas tienen una tension por encima de 16?.
b) Cuanto tendra que disminuir la tension de una persona que tiene 16 para situarse en el 40 %
de la poblacion con tension mas baja?.
*81. Se consideran las variables aleatorias X1 y X2 . La variable X1 sigue una distribucion normal de
media y desviacion tpica , mientras que la variable X2 sigue tambien una distribucion normal
de media + 1 y desviacion tpica . Si la probabilidad de que X1 tome valores superiores a 14, 2
es 0, 5636, y la de que X2 tome valores inferiores a 17, 4 es 0, 6103:
a) Hallar los valores de y .
b) Si se rechazan los individuos que estan fuera del intervalo (12, 18), hallar los porcentajes de
rechazo correspondientes a X1 y X2 .
c) Si se desea seleccionar el 20 % de individuos que tengan los valores mas altos de X1 , cual
sera el valor de X1 a partir del cual se seleccionaran?.
*82. En un estudio sobre la osteoporosis asociada a la diabetes de tipo I, se selecciono una muestra
de 20000 pacientes, de las que 12856 tienen entre 15 y 18 a
nos y 16482 tienen menos de 18 a
nos,
suponiendo que la edad de los participantes en la muestra sigue una distribucion normal, calcular:
a) La media y la desviacion tpica de la edad de los pacientes.
b) El n
umero de pacientes con una edad comprendida entre 17 y 20 a
nos.
c) La edad por encima de la cual hay 2500 pacientes.
d ) La mediana y el coeficiente de variacion.
*83. El peso de los recien nacidos no prematuros en una ciudad sigue una distribucion normal de media
y desviacion tpica desconocidas. Teniendo en cuenta que, de un total de 200 recien nacidos no
prematuros, 15 han pesado mas de 4 kg y 25 menos de 2, 5 kg:
a) Cuales son la media y la desviacion tpica del peso?.
b) Cuantos ni
nos no prematuros habran nacido con un peso entre 3 y 3, 5 kg?.
c) Si los medicos consideran peligrosos los pesos por debajo del percentil 10, cual sera dicho
peso?, cuantos ni
nos habran nacido con un peso por debajo de dicho percentil?.
*84. De una determinada sustancia producida por el organismo humano se sabe que el percentil 80 de su
concentracion en sangre vale 3,4 microgramos por decilitro y su percentil 30 vale 2,3 microgramos
por decilitro. Suponiendo que la concentracion sigue una distribucion normal:
a) Calcular y .
Nota: Si no se sabe calcular la media y la desviacion tpica, para los siguientes apartados se
puede tomar como alternativa una media de 3 y una desviacion tpica de 0,9
b) Si se considera que dicha sustancia tambien puede utilizarse como dopante si se inyecta por
va intravenosa, y se pone como valor lmite para considerar que un individuo va dopado 4 microgramos por decilitro de sangre, entonces despues de analizar un grupo de 10000 individuos
no dopados, cuantos se concluira que s que lo estan?.
18

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

c) Si la concentracion de la sustancia en los individuos dopados sigue una distribucion normal


de media 4,5 y desviacion tpica 0,3 microgramos por decilitro y se sabe que el 10 % de los
individuos analizados se dopan, cual sera la probabilidad de que se diagnostique adecuadamente a una persona como dopada o no dopada al considerar los 4 microgramos por decilitro
como punto de corte.
*85. Para el estudio de los niveles de hemoglobina en los hombres de una cierta poblacion, se ha seleccionado una muestra de tama
no 15500. Se sabe que niveles bajos de hemoglobina describen una
anemia que puede ser originada por enfermedades renales, hemorragias, cancer, problemas de alimentacion, etc. y que los niveles altos pueden deberse a cardiopatas, deshidratacion, enfermedades
pulmonares cronicas etc.
En el estudio de la muestra se ha visto que 10385 hombres tienen unos niveles de hemoglobina
superiores a 14 gr/dl, mientras que 11005 tienen menos de 17 gr/dl. Suponiendo que los valores de
hemoglobina en los hombres siguen una distribucion normal de media y desviacion tpica , se
pide:
a) Calcular y .
Nota: En caso de no haber podido calcular los valores de y del apartado anterior, continuar
el ejercicio con = 15, 12 y = 3, 47.
b) Sabemos que los niveles mas extremos de hemoglobina pueden ser indicativos de diferentes
enfermedades. Calcular los valores de hemoglobina que marcaran el 30 % de los hombres mas
alejados de la media.
c) Si en un estudio similar con la poblacion de mujeres, se obtiene que la hemoglobina sigue una
distribucion normal de media 13,5 gr/dl y de desviacion tpica 3,6 gr/dl y se consideran niveles
aceptables de hemoglobina entre 13,8 y 17,2 gr/dl para los hombres y entre 12,1 y 15,2 gr/dl
para las mujeres. En que colectivo, hombres o mujeres, hay mas proporcion de personas con
niveles no aceptables de hemoglobina? Razonar la respuesta.
d ) En que colectivo, hombres o mujeres, podemos afirmar que es mas representativa la media?
Razonar la respuesta.
*86. Se tienen datos de los a
nos 2003 y 2004 de los resultados de unos examenes para ingreso en la sanidad
p
ublica de una comunidad autonoma en los que se pide el ttulo de Diplomado en Fisioterapia. En el
a
no 2003 haba 150 plazas y se presentaron 600 aspirantes, de los cuales, el u
ltimo que obtuvo plaza
tena una calificacion de 7,6. En el a
no 2004 haba 100 plazas a las que optaron 500 aspirantes, de
los que el u
ltimo que obtuvo plaza tena una calificacion de 7,4. Si se supone que las calificaciones
de ambos a
nos siguen distribuciones normales de la misma desviacion tpica, y que la media de
2004 es 0,5 puntos menor que la de 2003, se pide, referidas a las calificaciones de 2004:
a) Calcular la media y la desviacion tpica de la distribucion de calificaciones.
b) Cuantas personas obtuvieron una calificacion superior a 5?.
c) Si hubiera habido 200 plazas, que nota hubiera sacado el u
ltimo que obtuviera plaza?.
*87. Los individuos de una poblacion se clasifican como hipertensos si su PAS (presion arterial sistolica
en mm Hg) es mayor que un nivel establecido para cada grupo de edad. Teniendo en cuenta tres
grupos de edad diferentes: A de 0 a 17 a
nos, B de 18 a 55 a
nos y C de 56 o mas a
nos, y considerando
que la PAS sigue una distribucion normal dentro de cada grupo de edad con media y desviacion
tpica las que aparecen en la siguiente tabla:
Grupo de Edad
A
B
C

105
125
140

Se pide:

19

6
9
12

Nivel de hipertension
115
135
155

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

a) En la poblacion considerada, que porcentaje del grupo A seran hipertensos? Y que porcentaje del grupo C no lo seran?
b) Si tenemos 10000 individuos en el grupo A, cual sera la probabilidad de que al menos haya
400 hipertensos?
c) Cual sera el nivel de PAS tal que solo el 10 % de individuos del grupo B esta por arriba de
dicho nivel?
d ) Dentro del grupo C y considerando invariables la media y el nivel de hipertension, cuanto
debera valer la desviacion tpica para que solo hubiese un 8 % de hipertensos?
88. Calcular:
a) P (T 1,476) si T T (5).
b) P (T 0,69) si T T (16).
c) El valor t0 tal que P (T < t0 ) = 0,995, con T T (12).
d ) El valor t0 tal que P (T > t0 ) = 0,01, con T T (8).
89. Calcular:
a) P (X 5,23) si X 2 (12).
b) P (X 1,65) si X 2 (8).
c) El valor x0 tal que P (X < x0 ) = 0,995, con X 2 (18).
d ) El valor x0 tal que P (X > x0 ) = 0,25, con X 2 (7).
90. Calcular:
a) El valor f0 tal que P (F < f0 ) = 0,9, con F F (12, 8).
b) El valor f0 tal que P (F > f0 ) = 0,025, con F F (5, 7).

Intervalos de Confianza
91. Una muestra aleatoria de tama
no 81 extrada de una poblacion normal con 2 = 64, tiene una
x = 78. Calcular el intervalo de confianza del 95 % para .
92. Para determinar si un pescado es o no apto para el consumo por su contenido en Hg (mercurio),
se realizan 15 valoraciones obteniendo una media de 0,44 ppm (partes por millon) de Hg, y una
desviacion tpica de 0,08 ppm. Calcular los lmites de confianza para la media, a un nivel de
significacion = 0,1.
93. Se obtuvieron cinco determinaciones del pH de una solucion con los siguientes resultados: 7.90,
7.85, 7.89, 7.86, 7.87. Hallar unos lmites de confianza de la media de todas las determinaciones del
pH de la misma solucion, al nivel de significacion = 0,01.
94. Se desea saber cual debe ser el tama
no muestral mnimo de una muestra para poder realizar la
estimacion de la tasa media de glucosa plasmatica de una determinada poblacion, con un nivel de
confianza 095 y pretendiendo una amplitud de 25 mg.
NOTA: En una muestra previa de tama
no 10 se obtuvo una desviacion tpica de 10 mg.
95. Para que un farmaco sea efectivo, la concentracion de un determinado principio activo debe ser
20 mg/mm3 . Se recibe un lote de dicho farmaco y se analizan 10 para medir la concentracion del
principio activo, obteniendo los resultados siguientes:
17,6 19,2 21,3 15,1 17,6 18,9 16,2 18,3 19 16,4.
En vista de los resultados, podremos rechazar el lote con una confianza 095 de no equivocarnos?
20

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

96. Para determinar la concentracion media de alb


umina en la sangre se realizaron mediciones sobre un
grupo experimental obteniendose los siguientes resultados, expresados en g/l: 38-42-46-37-49-42-4036. Obtener un intervalo de confianza para la varianza de la poblacion con un nivel de significacion
0.05.
97. Se desea obtener un intervalo de confianza del 95 % para la diferencia de marcas obtenidas por
chicos y chicas en una prueba fsica. Se toma una muestra de 50 chicas y 75 chicos, obteniendo las
chicas una marca media de 76 y los chicos de 82. Ademas, se conocen las desviaciones tpicas de
las marcas obtenidas en las poblaciones de chicas y chicos, que son 6 y 8 respectivamente.
98. Se esta ensayando un nuevo procedimiento de rehabilitacion para una cierta lesion. Para ello se
trataron nueve pacientes con el procedimiento tradicional y otros nueve con el nuevo, y se midieron
los das que tardaron en recuperase, obteniendose los siguientes resultados:
Metodo tradicional: 32-37-35-28-41-44-35-31-34
Metodo nuevo: 35-31-29-25-34-40-27-32-31
Se desea obtener un intervalo de confianza del 95 % para la diferencia de las medias del tiempo
de recuperacion obtenido con ambos procedimientos. Se supone que los tiempos de recuperacion
siguen una distribucion normal, y que las varianzas son aproximadamente iguales para los dos
procedimientos.
99. En un hospital pediatrico se comprobo que de 200 ni
nos con un determinado sndrome, 48 murieron
antes de cumplir un a
no de edad, mientras que solo 25 de 125 ni
nas con el mismo sndrome murieron.
Se puede afirmar con cierta seguridad que el sndrome es mas letal en los ni
nos que en las ni
nas?
100. Se ha realizado un estudio para investigar el efecto del ejercicio fsico en el nivel de colesterol en la
sangre. En el estudio participaron once personas, a las que se les midio el nivel de colesterol antes
y despues de desarrollar un programa de ejercicios. Los resultados obtenidos fueron los siguientes
Persona
1
2
3
4
5
6
7
8
9
10
11

Nivel previo
182
232
191
200
148
249
276
213
241
280
262

Nivel posterior
198
210
194
220
138
220
219
161
210
213
226

Hallar un intervalo de confianza del 90 % para la diferencia del nivel medio de colesterol antes y
despues del ejercicio.
*101. En un estudio sobre el consumo anual de litros de cerveza entre la poblacion de menores de 18 a
nos
de una ciudad se obtuvo la siguiente muestra:
42, 16, 60, 29, 7, 20, 30, 25, 38, 5.
Se pide:
a) Calcular el intervalo de confianza del 95 % para la media. Si se considera que un consumo
medio por encima de 40 litros es peligroso, existen pruebas significativas para afirmar que la
poblacion de partida no esta en peligro?
b) Que tama
no muestral mnimo hubiese sido necesario para conseguir un intervalo de confianza
de amplitud 5?
21

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

*102. Para determinar el nivel medio de colesterol en la sangre de una poblacion, se realizaron analisis
sobre una muestra de 8 personas, obteniendose los siguientes resultados:
196 212 188 206 203 210 201 198
Hallar intervalos de confianza para la media y la varianza de nivel de colesterol con un nivel de
significacion 0.1, suponiendo que el nivel de colesterol en la poblacion sigue una distribucion normal.
*103. Un equipo de investigacion esta interesado en ver si una droga reduce el colesterol en la sangre. Con
tal fin toma una muestra de 10 pacientes y determina el contenido de colesterol antes y despues del
tratamiento. Los resultados expresados en miligramos por cada 100 mililitros son los siguientes:
Paciente
Antes
Despues

1
217
209

2
252
241

3
229
230

4
200
208

5
209
206

6
213
211

7
215
209

8
260
228

9
232
224

10
216
203

Se pide:
a) Construir la variable Diferencia que recoja la diferencia entre los niveles de colesterol antes
y despues del tratamiento, y calcular el intervalo de confianza con 1 = 0,95 para dicha
variable.
b) A la vista del intervalo anterior, se concluye que la aplicacion de la droga ha disminuido el
nivel de colesterol en la sangre?
*104. Se midieron los niveles de colesterol LDL en sangre en dos muestras de personas que siguen unos
regmenes A y B respectivamente, obteniendose los siguientes resultados expresados en mg/dl de
sangre:
A: 113 - 162 - 136 - 128 -150 -122 -142 - 124
B: 106 - 99 - 124 - 112 - 134 - 121
Suponiendo que las concentraciones de colesterol LDL siguen distribuciones normales:
a) Hallar un intervalo de confianza para la concentracion media de colesterol LDL en las personas
que siguen el regimen A con un nivel de confianza del 95 % e interpretar el resultado.
b) Calcular el tama
no muestral mnimo necesario para obtener un intervalo de confianza de
amplitud 8 mg/dl para la concentracion media de colesterol LDL en las personas que siguen
el regimen A con un nivel de confianza del 95 %.
c) Hallar un intervalo de confianza del cociente de varianzas de la concentracion de colesterol
LDL entre las personas que siguen los regmenes A y B con un nivel de confianza del 98 % e
interpretar el resultado.
d ) Podemos afirmar con un 98 % de confianza que existen diferencias de las concentraciones
medias de colesterol LDL entre las personas que siguen los regmenes A y B?. Razonar la
respuesta a partir del intervalo de confianza para la diferencia de medias.
*105. Para comparar los resultados que obtienen las estudiantes de 1o de enfermera en las asignaturas
de Bioestadstica y Biologa se tomo una muestra, en la que de 125 alumnos matriculados en
Bioestadstica aprobaron 44 mientras que de 104 alumnos matriculados en Biologa aprobaron 65.
a) Hallar un intervalo de confianza para la proporcion de aprobados en Bioestadstica con un
nivel de confianza del 92 % e interpretar el resultado.
b) Calcular el tama
no muestral mnimo que sera necesario tomar para que el intervalo de confianza anterior tuviera una amplitud de 0,08.
c) Podemos afirmar con nivel de confianza del 96 % que existen diferencias en la proporcion de
aprobados en ambas asignaturas. Justificar adecuadamente la respuesta.

22

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

d ) Suponiendo que se tomara el mismo tama


no muestral en ambas asignaturas, calcular el tama
no
muestral mnimo en cada asignatura para que el intervalo anterior tuviera una amplitud de
0,10.
*106. Se esta ensayando un nuevo procedimiento de rehabilitacion para una cierta lesion. Se sabe que de
80 deportistas tratados con el procedimiento tradicional, se recuperaron perfectamente 26, mientras
que de los 20 tratados con el nuevo procedimiento se han recuperado 11. Se puede afirmar con
una confianza del 95 % que el nuevo procedimiento es mejor que el tradicional?
*107. Para comparar la eficacia de dos tratamientos A y B en la prevencion de repeticiones de infarto de
miocardio, se aplico el tratamiento A a 80 pacientes y el B a 60. Al cabo de dos a
nos se observo que
haban sufrido un nuevo infarto 14 pacientes de los sometidos al tratamiento A y 15 de los del B.
Se pide:
a) Construir un intervalo de confianza del 95 % para la diferencia entre las proporciones de
personas sometidas a los tratamientos A y B que no vuelven a sufrir un infarto.
b) A la vista del resultado obtenido, razonar si con ese nivel de confianza puede afirmarse que
uno de los tratamientos es mas eficaz que el otro.
*108. En una asignatura hay 2 grupos de clase y se han obtenido los resultados que se recogen en la tabla
siguiente con el n
umero de alumnos, la nota media y la desviacion tpica en cada grupo:
Grupo
01
02

n
15
17

6,3
5,2

s
0,8
1,4

Considerando que las notas en ambos grupos siguen distribuciones normales, se pide:
a) Calcular el intervalo de confianza para la nota media de la asignatura en el grupo 01 con un
nivel de confianza del 90 %.
b) Suponiendo varianzas poblacionales desconocidas pero iguales, calcular el intervalo de confianza para la diferencia de medias entre los 2 grupos con un nivel de confianza del 95 %. A la
vista del intervalo, hay diferencias significativas entre la nota de los 2 grupos? Justificar la
respuesta.
c) Considerando que para aprobar hay que sacar una nota igual o superior a 5 y teniendo en
cuenta medias y desviaciones tpicas poblacionales iguales a las presentes en las muestras,
cuantos alumnos aproximadamente han aprobado la asignatura?
*109. En una poblacion se esta realizando un estudio genetico para analizar si se tiene o no un gen que
puede resultar beneficioso ya que codifica la produccion de protenas que sirven como factores de
proteccion contra el infarto de miocardio. Para ello, se han escogido 500 individuos al azar y se ha
comprobado que 100 presentan el gen que se esta estudiando. Por otra parte, para determinar si ese
gen esta presente se ha dise
nado un test diagnostico mucho mas barato que el metodo tradicional
pero con el que se pueden cometer errores en la determinacion. Los resultados obtenidos mediante
el test diagnostico aparecen en la siguiente tabla:

Tienen el gen
No tienen el gen

Test Positivo
90
20

Test negativo
10
380

Se pide:
a) Con un nivel de significacion 0,01, dar el intervalo de confianza para la sensibilidad de dicho
test.
b) Con un nivel de significacion 0,05, dar el intervalo de confianza para la probabilidad de
diagnostico acertado con el test.
23

Universidad San Pablo CEU

Departamento de Metodos Cuantitativos e Informaticos

c) Con un 95 % de confianza, se puede concluir que hay diferencia significativas entre la sensibilidad y la especificidad del test? Justificar adecuadamente la respuesta.
*110. Se dispone de 2 grupos de personas, unos sanos y otros enfermos de gota, y se les realiza un analisis
de sangre para cuantificar el acido u
rico en mg/dl, obteniendo los resultados que aparecen en la
siguiente tabla:
Grupo
Sanos
Con gota

n
15
27

5,1
6,2

s
0,9
0,5

a) Suponiendo que el contenido de acido u


rico en personas sanas sigue una distribucion normal
y trabajando con un 99 % de confianza, cuanto vale la media poblacional del contenido de
acido u
rico en sangre en las personas sanas? Se puede concluir que dicho contenido es inferior
a 5,8 mg/dl?
b) Con un 95 % de confianza, hay diferencias significativas entre las medias de sanos y enfermos de gota? Suponer que el acido u
rico en sangre sigue distribuciones normales en los dos
colectivos y que las varianzas poblaciones, aunque desconocidas, pueden suponerse iguales.
c) Suponiendo invariables el resto de datos de la tabla del enunciado y de nuevo suponiendo
normalidad e igualdad de varianzas poblacionales, que desviacion tpica muestral mnima
debera haber en el grupo de sanos para que no hubiese diferencias significativas con un 95 %
de confianza?

Nota: Los problemas marcados con un asterisco (*) son problemas de examenes de otros a
nos.

24

También podría gustarte