Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Asignatura: Bioestadstica
Curso: 1o de Grado en Enfermera
Universidad San Pablo CEU
Curso 2013-2014
Estadstica Descriptiva
1. Se realizo una encuesta a 40 personas de mas de 70 a
nos sobre el n
umero de medicamentos distintos
que tomaban habitualmente. El resultado de dicha encuesta fue el siguiente:
31220142351323142432
35012023011534230123
Se pide:
a) Obtener la distribucion de frecuencias de la muestra.
b) Dibujar el diagrama de barras de las frecuencias absolutas y su correspondiente polgono de
frecuencias.
c) Dibujar el diagrama de barras de las frecuencias relativas acumuladas.
d ) Calcular la media aritmetica, la mediana y la moda.
e) Calcular la varianza y la desviacion tpica.
f ) Calcular el coeficiente de variacion de Pearson.
2. La siguiente tabla expresa la distribucion de las puntuaciones obtenidas por un grupo de alumnos.
0-10
7
10-20
8
20-30
13
30-40
6
40-50
7
50-60
6
60-70
6
70-80
5
80-90
6
90-100
2
Se pide:
a) Dibujar el histograma y polgono de frecuencias.
b) Calcular la media aritmetica, la mediana y la moda.
c) Calcular el percentil 92.
d ) Calcular la desviacion tpica.
e) Calcular el coeficiente de asimetra.
f ) Calcular del coeficiente de curtosis.
3. Dada la grafica correspondiente a un polgono acumulativo de frecuencias relativas de una variable
estadstica agrupada en intervalos de una muestra de tama
no 20
Fi
1
0.85
0.45
0.15
X
0
20
40
60
se pide:
a) Construir la tabla de frecuencias.
b) Dibujar el histograma correspondiente.
c) Calcular la mediana y la moda.
1
80
100
Sobresalientes 5%
Aprobados 30%
Notables 25%
Se pide:
a) Construir la tabla de frecuencias para las calificaciones.
b) Dibujar el polgono de frecuencias acumuladas.
c) Calcular todos los estadsticos de tendencia central que sean posibles.
d ) A partir de la variable calificacion, construir la variable nota con los siguientes intervalos:
Suspenso [0, 5), Aprobado [5, 7), Notable [7, 9) y Sobresaliente [9, 10], y calcular la nota media
y estudiar su representatividad.
Nota: En los tres primeros apartados se debe trabajar con la variable calificacion, mientras que en
el u
ltimo debe utilizarse la variable nota.
*7. Sea la variable estadstica agrupada en intervalos
la siguiente tabla:
Intervalos ni
[0, 10)
10
[10, 20)
[20, 30)
[30, 40)
22
0.30
Ni
Fi
b) Calcular la mediana.
*8. Dada la siguiente tabla de frecuencias:
Intervalos
[0, 5)
[5, 10)
[10, 15)
[15, 20)
ni
2
fi
Ni
Fi
8
0.7
6
a) Completar la tabla.
b) Calcular el coeficiente de variacion y el rango intercuartlico e interpretar los resultados.
*9. Si a todos los datos de una muestra se les suma una misma cantidad positiva, como se ve afectada
la representatividad de la media? Y si se multiplican por un mismo n
umero distinto de 0? Razonar
la respuesta.
*10. Se ha llevado a cabo un estudio sobre el n
umero de radiografas realizadas durante el u
ltimo a
no a
un grupo de 200 personas, y la informacion se presenta en la siguiente tabla incompleta:
Radiografas
0
1
2
3
4
5
Personas
fi
0,2
Fi
84
0,72
24
0,02
a) Completar tabla.
b) Calcular media, mediana, desviacion tpica y coeficiente de variacion e interpretar los resultados.
*11. Al realizar un estudio sobre el peso de las mujeres mayores de 30 a
nos en una determinada poblacion,
se obtuvieron los siguientes datos:
72 66 51 87 65 57 73 84 67 78
58 62 75 56 68 74 57 65 73 67
Realizar un estudio descriptivo agrupando los datos en 4 clases de amplitud 10 comenzando en el
50, que incluya:
a) Histograma de frecuencias absolutas y frecuencias absolutas acumuladas y los correspondientes
polgonos.
b) Rango intercuartlico e interpretacion.
c) Estudiar la representatividad de la media.
*12. En un estudio estadstico realizado en la comunidad valenciana, aparece la siguiente tabla con los
datos referidos al n
umero de embarazos, abortos e hijos en una muestra de 999 mujeres:
n
0
1
2
3
4
5
6
7
8
Total
Embarazos
61
64
328
301
122
81
29
11
2
999
3
Abortos
751
183
51
10
2
2
Hijos nacidos
67
80
400
300
90
62
999
999
Grupo 01
2
6
10
7
10
5
Grupo 02
5
12
15
18
8
2
a) En cual de los dos grupos podemos afirmar que es mas representativa la media del n
umero
de respuestas acertadas? Justificar adecuadamente la respuesta.
b) Calcular el rango intercuartlico del numero de respuestas acertadas del grupo 01 e interpretarlo.
c) De que alumno podramos afirmar que tiene un n
umero de aciertos relativamente mas alto,
uno del grupo 01 que ha acertado 66 preguntas o uno del grupo 02 que ha acertado 59?
Justificar adecuadamente la respuesta.
d ) Considerando en conjunto a los alumnos de ambos grupos, que tipo de asimetra presentara
el n
umero de respuestas acertadas? Justificar adecuadamente la respuesta.
e) Si se considera que un alumno tiene dominada la materia cuando responde correctamente al
menos a 70 preguntas, que porcentaje de los alumnos del grupo 01 podemos afirmar que tiene
dominada la materia?
*15. En una ciudad espa
nola se esta realizando un estudio de la edad de la madre en el momento del
primer parto segmentando seg
un si la madre es espa
nola o extranjera. Los datos obtenidos fueron:
Edad (a
nos)
[15, 20)
[20, 25)
[25, 30)
[30, 35)
[35, 40)
[40, 45)
Frecuencia Espa
nolas
8
65
253
362
125
41
Frecuencia Extranjeras
6
30
21
16
4
a) En que colectivo es mas representativa la media de edad en el momento del primer parto?
Justificar adecuadamente la respuesta.
b) Calcular la mediana de la edad en el momento del primer parto en el grupo de espa
nolas.
c) Calcular la media de edad global en el momento del primer parto considerando conjuntamente
espa
nolas y extranjeras.
d ) Teniendo en cuenta solo las espa
nolas, en que percentil de edad se encuentra una mujer que
ha tenido su primer parto a los 32 a
nos?
*16. Se desea realizar un estudio sobre los das de hospitalizacion necesarios para tratar una lesion
hepatica. Se utilizan para ello dos tratamiento diferentes y se obtuvieron los siguientes resultados:
Das de Hospitalizacion
[10, 20)
[20, 30)
[30, 40)
[40, 50)
[50, 60)
Pacientes A
25
15
12
10
Pacientes B
14
18
25
10
5
nAlcohol
55
130
203
162
40
ntotal
76
195
307
292
130
a) En que colectivo es mas representativa la media, en los que la cirrosis proviene del cosumo
excesivo de alcohol o de otras causas? Justificar adecuadamente la respuesta.
b) Considerando los 1000 individuos, calcular el valor de la edad de diagnostico tal que solo un
30 % estan por arriba de dicha edad.
c) Considerando los 1000 individuos, cuanto vale el coeficiente de asimetra de la edad de
diagnostico?
d ) En cada una de las 6 clases de edad consideradas, cuanto vale la proporcion de individuos
con cirrosis que no se debe al consumo de alcohol? Cual es la proporcion media de individuos
con cirrosis que no se debe al consumo de alcohol?
5
Regresi
on y Correlaci
on
18. Dada la siguiente tabla de correlacion:
X \Y
[2, 2)
[2, 6)
[6, 10)
1
3
4
5
2
6
7
3
3
1
3
0
Determinar:
a) Las distribuciones marginales. Media, Moda y Mediana.
b) Rectas de Regresion.
c) Coeficiente de correlacion lineal. Interpretar el resultado.
19. Se ha realizado un estudio comparativo de las puntuaciones obtenidas por los alumnos en un test
de ingreso en la universidad (X), y el n
umero de asignaturas aprobadas en el primer curso (Y ).
Los resultados obtenidos se expresan en la siguiente tabla:
X \Y
[0, 10)
[10, 20)
[20, 30)
[30, 40)
0
2
1
0
0
1
2
1
1
0
2
1
2
3
2
3
0
2
4
2
4
0
0
1
6
Se desea calcular:
a) Recta de regresion de X sobre Y.
b) Coeficiente de correlacion e interpretacion del mismo.
c) Si la universidad en cuestion solo contara con alumnos que al menos logren aprobar dos
asignaturas, que n
umero de preguntas respondidas correctamente exigira en el test?.
*20. En una poblacion se ha realizado un estudio sobre el nivel de colesterol en sangre (X) y la tension
arterial maxima (Y ) obteniendo. Para ello se ha tomado una muestra de 80 individuos que ha dado
lugar a la siguiente tabla de frecuencias:
X \Y
[170, 190)
[190, 210)
[210, 230)
[230, 250)
ny
nx
12
18
Se pide:
a) Completar la tabla.
b) Recta de regresion del nivel de colesterol sobre la tension.
c) Coeficiente de determinacion e interpretacion.
d ) La tension arterial maxima esperada para una persona cuyo nivel de colesterol es 270.
*21. Al realizar un estudio sobre la dosificacion de un cierto medicamento, se trataron 6 pacientes con
dosis diarias de 2 mg, 7 pacientes con 3 mg y otros 7 pacientes con 4 mg. De los pacientes tratados
con 2 mg, 2 curaron al cabo de 5 das, y 4 al cabo de 6 das. De los pacientes tratados con 3 mg
diarios, 2 curaron al cabo de 3 das, 4 al cabo de 5 das y 1 al cabo de 6 das. Y de los pacientes
tratados con 4 mg diarios, 5 curaron al cabo de 3 das y 2 al cabo de 5 das. Se pide:
6
30
1.6
60
1.7
90
1.5
120
1.1
150
0.7
180
0.2
Se pide:
a) Calcular la recta de regresion de la concentracion en funcion del tiempo.
b) Que concentracion de alcohol habra a los 100 minutos?
c) Si la concentracion maxima de alcohol en la sangre que permite la ley para poder conducir
es 0.8 g/l, cuanto tiempo habra que esperar despues de tomarse un litro de vino para poder
conducir sin infringir la ley?
*25. En un estudio para relacionar la longitud de la lnea de la vida de la mano izquierda y la duracion
de la vida de una persona se han obtenido datos de 50 personas con los siguientes resultados
(X=longitud de la lnea en cm, Y =edad al morir en a
nos):
X
X
X
X
X
y = 3333
y 2 = 231933
x = 459,9
x2 = 4308,57
xy = 30949.
A la vista de estos resultados, cuanto vivira, por termino medio, una persona con una lnea de
longitud 7.5 cm? Es fiable esta estimacion?
*26. Se han medido dos variables S y T en 10 individuos, obteniendose los siguientes resultados:
(-1.5 , 2.25), (0.8 , 0.64), (-0.2 , 0.04), (-0.8 , 0.64), (0.4 , 0.16),
(0.2 , 0.04), (-2.1 , 4.41), (-0.4 , 0.16), (1.5 , 2.25), (2.1 , 4.41).
Se pide:
a) Calcular la covarianza de S y T .
b) Se puede afirmar que S y T son independientes? Justificar la respuesta.
c) Que valor predice la correspondiente recta de regresion para t = 2?
*27. En un estudio medico se afirma que existe una fuerte relacion lineal entre la presion sistolica
sangunea media durante una intervencion quir
urgica, P en milmetros Hg, y el volumen de sangre
perdido en la intervencion, S en mililitros. Para ver si es cierto, otro equipo medico mide ambas
variables en una muestra de 10 pacientes obteniendo:
7
P (mm Hg)
S (ml)
90
250
105
350
110
320
95
280
80
170
110
290
100
300
90
240
95
280
105
310
Se pide:
a) Calcular la recta de regresion de la perdida de sangre en funcion de la presion sistolica.
b) Calcular el coeficiente de determinacion e interpretarlo.
c) Cual es el valor de la presion sistolica que esperamos que tenga un paciente cuya perdida de
sangre ha sido de 0,5 litros? Es fiable dicha prediccion? Por que?.
*28. Al realizar un estudio de las calificaciones de Estadstica Aplicada (EA) y Biofsica (BF) de un
grupo de alumnos de la Diplomatura de Fisioterapia, se obtuvieron los siguientes resultados:
EA \ BF
SS
AP
NT
SB
SS
6
3
1
0
AP
2
5
3
0
NT
0
2
3
1
SB
0
0
1
1
donde SS representa la calificacion de suspenso, cuya nota correspondiente esta en el intervalo [0, 5);
AP aprobado, con nota en [5, 7); NT notable, con nota en [7, 9); y SB sobresaliente, con nota en
[9, 10].
a) Calcular el rango intercuartlico de la nota de Estadstica Aplicada.
b) Calcular el coeficiente de asimetra de la nota de Estadstica Aplicada e interpretarlo.
c) En que asignatura es mas representativa la media? Razonar la respuesta.
d ) Si un alumno tiene un 4 en Biofsica, que nota se espera que tenga en Estadstica Aplicada?.
e) Razonar si es fiable la prediccion anterior.
*29. La artrosis reumatoide es una enfermedad reumatica que aparece con frecuencia en las personas
mayores. Uno de los ndices mas utilizados para ver el grado de actividad de la enfermedad es el
RADAI (Rheumatoid Arthritis Disease Activity Index), que mide el grado de actividad en una
escala de 0 (mnima actividad) a 3 (maxima actividad). Para ver de que manera influye la edad en
el grado de actividad de la enfermedad se ha seleccionado un grupo de personas mayores y se ha
medido el ndice RADAI en ellos, obteniendo la siguiente tabla de frecuencias:
RADAI\Edad
0-1
1-2
2-3
40-50
8
4
0
50-60
6
7
2
60-70
2
5
6
70-80
1
2
7
Se pide:
a) Estudiar si existe relacion lineal entre la edad y el RADAI.
b) Calcular la recta de regresion del RADAI sobre la edad. Seg
un la recta, cuanto aumentara
el grado de actividad de la enfermedad por cada a
no que pasa?
c) Si se considera que los pacientes don un RADAI de 2 o superior necesitan ayuda en sus
actividades diarias, a que edad se empezara a necesitar esta ayuda?
*30. Se realiza un estudio para establecer una ecuacion mediante la cual se pueda utilizar la concentracion de estrona en saliva para predecir la concentracion del esteroide en plasma libre. Se extrajeron
los siguientes datos de 10 varones sanos:
Estrona
Esteroide
1,4
30
7,5
25
8,5
31,5
9
27,5
8
9
39,5
11
38
13
43
14
49
14,5
55
16
48,5
0
25
1
28
2
47
3
65
4
86
5
121
6
190
7
290
8
362
Se pide:
a) Dibujar el diagrama de dispersion. Seg
un este diagrama, que tipo de modelo explicara mejor
la relacion entre el numero de bacterias y las horas transcurridas?
b) Seg
un el modelo anterior, cuantas bacterias tendramos al cabo de 3 horas y media? Y al
cabo de 10 horas? Son fiables estas predicciones?
c) Cuanto tiempo tendra que transcurrir para que en el cultivo hubiese 100 bacterias?
*32. La concentracion de un farmaco en sangre, C en mg/dl, es funcion del tiempo, t en horas, y viene
dada por la siguiente tabla:
t
C
2
25
3
36
4
48
5
64
6
86
7
114
8
168
a) Seg
un el modelo exponencial, que concentracion de farmaco habra a las 4, 8 horas? Es fiable
la prediccion? Justificar adecuadamente la respuesta.
b) Seg
un el modelo lineal, que tiempo tendra que transcurrir para que la concentracion de
farmaco fuese de 100 mg/de? Es fiable la prediccion? Justificar adecuadamente la respuesta.
*33. En un estudio se pretende ver si existe o no relacion entre la cantidad total inyectada de una
determinada sustancia durante un mes, en cm3 , y el aumento de peso provocado en las personas
sometidas al tratamiento, en kg. Para el estudio se tomaron paciente de unas caractersticas similares en edad, peso y altura, y los resultados obtenidos en una muestra de 6 personas fueron los
siguientes:
Aumento Peso (kg)
Sustancia (cm3 )
1,9
15
2,4
20
2,8
25
3,1
30
3,3
35
3,4
40
xi = 55 ,
10
P
i=1
yi = 478 ,
10
P
i=1
ln xi = 15,104 ,
10
P
i=1
ln yi = 36,028 ,
10
P
i=1
x2i = 385 ,
10
P
i=1
yi2 = 33148
10
P
i=1
(ln xi )2 = 27,650 ,
10
P
i=1
(ln yi )2 = 135,667 ,
10
P
i=1
xi yi = 3527 ,
10
P
i=1
xi ln yi = 220,055 ,
10
P
i=1
yi ln xi = 914,932
Con ello:
a) Calcular la ecuacion de la recta de regresion de Y como funcion de X.
b) Calcular la ecuacion del modelo exponencial de Y como funcion de X.
c) Calcular la ecuacion del modelo logartmico de Y como funcion de X.
d ) Que tanto por ciento de la variabilidad de la nube de puntos se explica con cada uno de los
modelos anteriores? Cual de ellos sera mejor para realizar el ajuste? Justificar la respuesta.
35. En un estudio en el que participaron las 8 universidades de una region se ha valorado la excelencia
docente e investigadora, estableciendo los siguientes rankings (de mejor a peor):
Ranking Docencia
Ranking Investigacion
3
6
4
5
8
4
5
3
2
7
1
8
6
1
7
2
Se puede decir que existe relacion entre la excelencia docente y la investigadora? Justificar la
respuesta.
C
alculo de Probabilidades
36. En un laboratorio hay 4 frascos de acido sulf
urico y 2 de acido ntrico, y en otro hay 1 frascos
de acido sulf
urico y 3 de acido ntrico. Se saca al azar un frasco de cada laboratorio. Hallar la
probabilidad de que:
a) Los dos frascos sean de acido sulf
urico.
b) Los dos sean de acido ntrico.
c) Uno sea de acido sulf
urico y otro de acido ntrico.
37. Sean A y B sucesos de un mismo espacio muestral tales que: P(A)=3/8, P(B)=1/2, P(A B)=1/4.
Calcular:
a) P(A B).
b) P(A) y P(B).
c) P(A B).
d ) P(A B).
e) P(A/B).
f ) P(A/B).
38. La probabilidad de contraer hepatitis a partir de una unidad de sangre es 001. Un paciente recibe
dos unidades de sangre durante su estancia en el hospital. Cual es la probabilidad de que contraiga
hepatitis como consecuencia de ello?
39. Sean A y B sucesos de un mismo espacio muestral, tales que P(A)=06 y P(A B)=09. Calcular
P(B) si:
a) A y B son independientes.
b) A y B son incompatibles.
40. El tetanos es mortal en el 70 % de los casos. Si tres personas contraen el tetanos, Cual es la
probabilidad de que mueran al menos dos de los tres?
10
*41. El 60 % de los individuos de una poblacion estan vacunados contra una cierta enfermedad. Durante
una epidemia se sabe que el 20 % la ha contrado y que 2 de cada 100 individuos estan vacunados
y son enfermos. Calcular el porcentaje de vacunados que enferma y el de vacunados entre los que
est
an enfermos.
42. A partir de una investigacion realizada, se sabe que el 10 % de las personas de 50 a
nos sufren un
tipo particular de artritis. Se ha desarrollado un procedimiento para detectar esta enfermedad, y
por las pruebas realizadas se observa que si se aplica el procedimiento a individuos que padecen la
enfermedad, da positivo en el 85 % de los casos, mientras que si se aplica a individuos sanos, da
positivo en el 4 % de los casos. Se pide:
a) Calcular la probabilidad de que realizado el procedimiento a una persona, el resultado sea
positivo.
b) Si el resultado de aplicar el procedimiento a una persona ha sido positivo, Cual es la probabilidad de que padezca la enfermedad?
43. En un servicio clnico digestivo se sabe que, de cada 1000 pacientes con dolor de estomago, 700
presentan gastritis, 200 presentan u
lcera y 100 presentan cancer. En el analisis de la sintomatologa
gastrica, se ha comprobado que las probabilidades de presentar vomitos son 03 en el caso de
gastritis, 06 en el caso de u
lcera y 09 en el caso de cancer. Llega un nuevo paciente con dolor de
est
omago que, ademas, presenta vomitos. Que diagnosticaramos?
*44. En un estudio sobre el tabaco, se informa que el 40 % de los fumadores tiene un padre fumador,
el 25 % tiene una madre fumadora, y el 52 % tiene al menos uno de los dos padres fumadores. Se
elige una persona fumadora al azar. Calcular:
a) Probabilidad de que la madre sea fumadora si lo es el padre.
b) Probabilidad de que la madre sea fumadora si no lo es el padre.
c) Son independientes el tener padre fumador y el tener madre fumadora.
*45. Un equipo de atencion primaria de salud realiza un estudio de la poblacion, para evaluar la incidencia de hipertension e hipercolesterolemia. Para ello analizan a 1000 personas de dicha poblacion,
seleccionadas aleatoriamente, encontrandose que 180 presentan hipertension, 140 hipercolesterolemia y 800 ninguna de ambas. Se pide calcular la probabilidad de que una persona tomada al
azar
a) Presente ambas enfermedades.
b) Presente hipertension si no presenta hipercolesterolemia.
*46. En una poblacion se sabe que hay un 15 % de personas que sufren trastornos de sue
no, un 12 %
que presentan ansiedad, y un 80 % que no presentan ninguna de estas alteraciones. Se pide:
a) Que porcentaje de personas presentan ambas alteraciones?.
b) Que porcentaje de las personas con trastorno de sue
no presentan tambien ansiedad?.
c) Son independientes el trastorno del sue
no y la ansiedad?.
d ) Si se toma una muestra de 20 personas de la poblacion, Cual es la probabilidad de que haya
alguna con trastorno del sue
no? y de que haya alguna con ansiedad?.
*47. Se ha desarrollado un nuevo test diagnostico para detectar el sndrome de Down en ni
nos recien
nacidos, con un sensibilidad del 80 % y una especificidad del 90 %. Si en una determinada poblacion
en la que hay un 1 % de recien nacidos con el sndrome, al aplicarle el test a un ni
no, da positivo,
cual es la probabilidad de que tenga el sndrome? le diagnosticaras la enfermedad? Cual debera
ser la especificidad mnima del test para diagnosticar el sndrome en el caso de dar positivo?
Nota: La sensibilidad de un test diagnostico es la proporcion de personas con la enfermedad que
tienen un resultado positivo en el test, mientras que la especificidad del test es la proporcion de
personas sin la enfermedad que tienen un resultado negativo en el test.
11
*48. En un estudio se han probado tres tipos de tratamientos A, B y C contra una determinada enfermedad. De los pacientes participantes en el estudio, el 50 % fueron tratados con el tratamiento A,
el 30 % con el B y el 20 % con el C. Posteriormente se observaron los pacientes que sanaron y los
que tuvieron alg
un efecto secundario, seg
un se muestra en la siguiente tabla:
Tratamiento
A
B
C
Sanados
86 %
92 %
81 %
Se pide:
a) Si se selecciona un enfermo al azar, cual es la probabilidad de que haya sanado? Y de que
haya tenido alg
un efecto secundario?
b) Si un enfermo ha sanado, que tratamiento es mas probable que haya recibido? Y si en vez
de decirnos que ha sanado nos dicen que no ha tenido efectos secundarios?
c) Si en total hay un 8 % pacientes que no sanaron pero que tampoco tuvieron efectos secundarios,
cual es la probabilidad de que un enfermo se haya curado sin tener efectos secundarios?
*49. La sensibilidad de determinar la tuberculosis con una radiografa del torax es del 90 %. Por contra,
la probabilidad de que un individuo sano quede reconocido equivocadamente como tuberculoso es
del 1 %. Se realizan radiografas de un grupo de individuos en el cual el porcentaje de enfermos de
tuberculosis es del 1 %, y se pide:
a) Cual es la probabilidad de que un individuo que sea diagnosticado como tuberculoso a partir
de la radiografa lo sea verdaderamente?.
b) Cual debera ser la fiabilidad mnima en la determinacion de la tuberculosis para que la
probabilidad del apartado anterior fuera superior a 0,5?.
*50. Para comprobar la eficacia de un test diagnostico se lleva a cabo una experiencia cuyos resultados
se recogen en la siguiente tabla:
Enfermos
No Enfermos
Test +
4680
80
Test
120
2020
12
*52. El suero de una mujer embarazada puede ser analizado por medio de un procedimiento llamado
electroforesis en gel de almidon. Este procedimiento permite detectar la presencia de una zona
protenica llamada zona de embarazo, la cual se supone que es un indicador de que el feto es una
hembra. Para investigar las propiedades de este test se seleccionaron a 300 mujeres embarazadas
de una poblacion. Los resultados del test y los sexos de los ni
nos fueron:
Varon
Hembra
Test +
72
78
Test
75
75
Variables Aleatorias
55. Sea X una variable aleatoria discreta cuya ley de probabilidad es
X
P (X = x)
4
0,15
5
0,35
6
0,10
7
0,25
8
0,15
b) Obtener:
1)
2)
3)
4)
P (X < 7,5).
P (X > 8).
P (4 X 6,5).
P (5 < X < 6).
F (x) =
funcion de distribucion:
0
1/5
3/4
1
si
si
si
si
x<1
1x<4
4x<6
x6
Se pide:
a) Distribucion de probabilidad.
b) Obtener:
1)
2)
3)
4)
P (X = 6).
P (X = 5).
P (2 < X < 5,5).
P (0 X < 4).
VVV
0,1
VVM
0,1
V MV
0,1
V MM
0,15
MV V
0,15
MV M
0,1
MMV
0,1
MMM
0,2
Suponiendo que el n
umero de ataques epilepticos que sufre dicho individuo sigue una distribucion
de Poisson, calcular:
a) Probabilidad de que el proximo mes tenga al menos 2 ataques.
b) Probabilidad de que el proximo trimestre tenga 9 ataques.
*71. Durante sus practicas en los hospitales de la Comunidad de Madrid, los estudiantes del Grado en
Enfermera cometen 6 fallos considerados como graves o muy graves al cabo de un mes, en media.
Suponiendo que todos los meses tienen 30 das:
a) Cual es la probabilidad de que al cabo de un mes cometan mas de 4 fallos graves o muy
graves?
b) Cual es la probabilidad de que un da cometan alg
un fallo grave o muy grave?
c) Si habitualmente muere uno de cada 50 pacientes como consecuencia del fallo grave o muy
grave cometido por los estudiantes, cual es la probabilidad de que al cabo de un a
no se hayan
producido al menos 2 muertes de este tipo?
d ) Al cabo de un a
no, cual es la probabilidad de que haya al menos 10 meses con mas de 4 fallos
graves o muy graves?
*72. Recientes estudios sobre la incidencia del cancer de testculo en varones de la poblacion espa
nola
han llegado a la conclusion de que 1 de cada 250 varones acabara padeciendolo a lo largo de su
vida. No obstante, se cura en un 92 % de los casos.
a) Si en un hospital se estan tratando 20 varones con cancer de testculo, que probabilidad hay
de que no curen al menos 3?
b) Si tenemos un grupo 500 varones de la poblacion espa
nola, que probabilidad hay de que
menos de 4 tengan cancer de testculo en alg
un momento de su vida?
c) Si tenemos una ciudad hay 10000 varones, que probabilidad hay de que tengan cancer de
testculo y no cure en mas de 2?
73. Una variable aleatoria continua X tiene una funcion de densidad dada por:
k(6 3x) si
0x2
f (x) =
0
si x < 0 o x > 2
16
a) Determinar el valor de k.
b) Hallar P (X 1); P (X > 2); P (X = 1/4); P (1/3 X 2/3).
c) Calcular y .
d ) Hallar la funcion de distribucion F (x).
74. Sea Z una variable aleatoria que sigue una distribucion N (0, 1). Determinar el valor de t en cada
uno de los siguientes casos:
a) El area entre 0 y t es 0,4783.
b) El area a la izquierda de t es 0,6406.
c) El area entre 1,5 y t es 0,2313.
75. Hallar las siguientes probabilidades:
a) P (2,4 Z 1,2) si Z es N (0, 1).
b) P (|Z| > 1,2) si Z es N (0, 1).
c) P (1,3 X 3,3) si X es N (2, 1).
d ) P (|X 3| > 2) si Xes N (3, 4).
76. Entre los diabeticos, el nivel de glucosa en la sangre en ayunas, puede suponerse de distribucion
aproximadamente normal, con media 106 mg/100 ml y desviacion tpica 8 mg/100 ml.
a) Hallar P (X 120 mg/ 100 ml).
b) Que porcentaje de diabeticos tendra niveles entre 90 y 120 mg/100 ml?
c) Encontrar un valor que tenga la propiedad de que el 25 % de los diabeticos tenga un nivel de
glucosa X por debajo de dicho valor.
77. Se sabe que el nivel de colesterol en varones de mas de 30 a
nos sigue una distribucion normal, de
media 220 y desviacion tpica 30. Realizando un estudio sobre 20000 varones mayores de 30 a
nos,
a) Cuantos se espera que tengan su nivel de colesterol entre 210 y 240?
b) Cuantos se espera que tengan su nivel de colesterol por encima de 250?
c) Cual sera el nivel de colesterol, por encima del cual se espera que este el 20 % de la poblacion?
*78. Dada la funcion de densidad dada por la siguiente grafica,
f(x)
1
X
1
3/2
calcular:
a) P (X < 1), P (X > 0), P (X = 1/4), P (1/2 X 3/2).
b) Media y desviacion tpica.
17
*79. En una poblacion con 40000 personas, se sabe que 2276 tienen entre 0.80 y 0.84 miligramos de
bilirrubina por decilitro de sangre, y que 11508 tienen mas de 0.84. Suponiendo que la concentracion
de bilirrubina en sangre sigue una distribucion normal, se pide:
a) Calcular su media y su desviacion tpica.
Nota: En caso de no conseguir calcular la media y la desviacion tpica, tomar los valores
= 0,8 y = 0,1 y continuar con el ejercicio.
b) Calcular el n
umero de personas con mas de 1 miligramo de bilirrubina por decilitro de sangre.
*80. Se supone que la tension arterial de los habitantes de una poblacion de 20000 habitantes sigue una
distribucion normal, cuya media es 13 y su rango intercuartlico 4. Se pide:
a) Cuantas personas tienen una tension por encima de 16?.
b) Cuanto tendra que disminuir la tension de una persona que tiene 16 para situarse en el 40 %
de la poblacion con tension mas baja?.
*81. Se consideran las variables aleatorias X1 y X2 . La variable X1 sigue una distribucion normal de
media y desviacion tpica , mientras que la variable X2 sigue tambien una distribucion normal
de media + 1 y desviacion tpica . Si la probabilidad de que X1 tome valores superiores a 14, 2
es 0, 5636, y la de que X2 tome valores inferiores a 17, 4 es 0, 6103:
a) Hallar los valores de y .
b) Si se rechazan los individuos que estan fuera del intervalo (12, 18), hallar los porcentajes de
rechazo correspondientes a X1 y X2 .
c) Si se desea seleccionar el 20 % de individuos que tengan los valores mas altos de X1 , cual
sera el valor de X1 a partir del cual se seleccionaran?.
*82. En un estudio sobre la osteoporosis asociada a la diabetes de tipo I, se selecciono una muestra
de 20000 pacientes, de las que 12856 tienen entre 15 y 18 a
nos y 16482 tienen menos de 18 a
nos,
suponiendo que la edad de los participantes en la muestra sigue una distribucion normal, calcular:
a) La media y la desviacion tpica de la edad de los pacientes.
b) El n
umero de pacientes con una edad comprendida entre 17 y 20 a
nos.
c) La edad por encima de la cual hay 2500 pacientes.
d ) La mediana y el coeficiente de variacion.
*83. El peso de los recien nacidos no prematuros en una ciudad sigue una distribucion normal de media
y desviacion tpica desconocidas. Teniendo en cuenta que, de un total de 200 recien nacidos no
prematuros, 15 han pesado mas de 4 kg y 25 menos de 2, 5 kg:
a) Cuales son la media y la desviacion tpica del peso?.
b) Cuantos ni
nos no prematuros habran nacido con un peso entre 3 y 3, 5 kg?.
c) Si los medicos consideran peligrosos los pesos por debajo del percentil 10, cual sera dicho
peso?, cuantos ni
nos habran nacido con un peso por debajo de dicho percentil?.
*84. De una determinada sustancia producida por el organismo humano se sabe que el percentil 80 de su
concentracion en sangre vale 3,4 microgramos por decilitro y su percentil 30 vale 2,3 microgramos
por decilitro. Suponiendo que la concentracion sigue una distribucion normal:
a) Calcular y .
Nota: Si no se sabe calcular la media y la desviacion tpica, para los siguientes apartados se
puede tomar como alternativa una media de 3 y una desviacion tpica de 0,9
b) Si se considera que dicha sustancia tambien puede utilizarse como dopante si se inyecta por
va intravenosa, y se pone como valor lmite para considerar que un individuo va dopado 4 microgramos por decilitro de sangre, entonces despues de analizar un grupo de 10000 individuos
no dopados, cuantos se concluira que s que lo estan?.
18
105
125
140
Se pide:
19
6
9
12
Nivel de hipertension
115
135
155
a) En la poblacion considerada, que porcentaje del grupo A seran hipertensos? Y que porcentaje del grupo C no lo seran?
b) Si tenemos 10000 individuos en el grupo A, cual sera la probabilidad de que al menos haya
400 hipertensos?
c) Cual sera el nivel de PAS tal que solo el 10 % de individuos del grupo B esta por arriba de
dicho nivel?
d ) Dentro del grupo C y considerando invariables la media y el nivel de hipertension, cuanto
debera valer la desviacion tpica para que solo hubiese un 8 % de hipertensos?
88. Calcular:
a) P (T 1,476) si T T (5).
b) P (T 0,69) si T T (16).
c) El valor t0 tal que P (T < t0 ) = 0,995, con T T (12).
d ) El valor t0 tal que P (T > t0 ) = 0,01, con T T (8).
89. Calcular:
a) P (X 5,23) si X 2 (12).
b) P (X 1,65) si X 2 (8).
c) El valor x0 tal que P (X < x0 ) = 0,995, con X 2 (18).
d ) El valor x0 tal que P (X > x0 ) = 0,25, con X 2 (7).
90. Calcular:
a) El valor f0 tal que P (F < f0 ) = 0,9, con F F (12, 8).
b) El valor f0 tal que P (F > f0 ) = 0,025, con F F (5, 7).
Intervalos de Confianza
91. Una muestra aleatoria de tama
no 81 extrada de una poblacion normal con 2 = 64, tiene una
x = 78. Calcular el intervalo de confianza del 95 % para .
92. Para determinar si un pescado es o no apto para el consumo por su contenido en Hg (mercurio),
se realizan 15 valoraciones obteniendo una media de 0,44 ppm (partes por millon) de Hg, y una
desviacion tpica de 0,08 ppm. Calcular los lmites de confianza para la media, a un nivel de
significacion = 0,1.
93. Se obtuvieron cinco determinaciones del pH de una solucion con los siguientes resultados: 7.90,
7.85, 7.89, 7.86, 7.87. Hallar unos lmites de confianza de la media de todas las determinaciones del
pH de la misma solucion, al nivel de significacion = 0,01.
94. Se desea saber cual debe ser el tama
no muestral mnimo de una muestra para poder realizar la
estimacion de la tasa media de glucosa plasmatica de una determinada poblacion, con un nivel de
confianza 095 y pretendiendo una amplitud de 25 mg.
NOTA: En una muestra previa de tama
no 10 se obtuvo una desviacion tpica de 10 mg.
95. Para que un farmaco sea efectivo, la concentracion de un determinado principio activo debe ser
20 mg/mm3 . Se recibe un lote de dicho farmaco y se analizan 10 para medir la concentracion del
principio activo, obteniendo los resultados siguientes:
17,6 19,2 21,3 15,1 17,6 18,9 16,2 18,3 19 16,4.
En vista de los resultados, podremos rechazar el lote con una confianza 095 de no equivocarnos?
20
Nivel previo
182
232
191
200
148
249
276
213
241
280
262
Nivel posterior
198
210
194
220
138
220
219
161
210
213
226
Hallar un intervalo de confianza del 90 % para la diferencia del nivel medio de colesterol antes y
despues del ejercicio.
*101. En un estudio sobre el consumo anual de litros de cerveza entre la poblacion de menores de 18 a
nos
de una ciudad se obtuvo la siguiente muestra:
42, 16, 60, 29, 7, 20, 30, 25, 38, 5.
Se pide:
a) Calcular el intervalo de confianza del 95 % para la media. Si se considera que un consumo
medio por encima de 40 litros es peligroso, existen pruebas significativas para afirmar que la
poblacion de partida no esta en peligro?
b) Que tama
no muestral mnimo hubiese sido necesario para conseguir un intervalo de confianza
de amplitud 5?
21
*102. Para determinar el nivel medio de colesterol en la sangre de una poblacion, se realizaron analisis
sobre una muestra de 8 personas, obteniendose los siguientes resultados:
196 212 188 206 203 210 201 198
Hallar intervalos de confianza para la media y la varianza de nivel de colesterol con un nivel de
significacion 0.1, suponiendo que el nivel de colesterol en la poblacion sigue una distribucion normal.
*103. Un equipo de investigacion esta interesado en ver si una droga reduce el colesterol en la sangre. Con
tal fin toma una muestra de 10 pacientes y determina el contenido de colesterol antes y despues del
tratamiento. Los resultados expresados en miligramos por cada 100 mililitros son los siguientes:
Paciente
Antes
Despues
1
217
209
2
252
241
3
229
230
4
200
208
5
209
206
6
213
211
7
215
209
8
260
228
9
232
224
10
216
203
Se pide:
a) Construir la variable Diferencia que recoja la diferencia entre los niveles de colesterol antes
y despues del tratamiento, y calcular el intervalo de confianza con 1 = 0,95 para dicha
variable.
b) A la vista del intervalo anterior, se concluye que la aplicacion de la droga ha disminuido el
nivel de colesterol en la sangre?
*104. Se midieron los niveles de colesterol LDL en sangre en dos muestras de personas que siguen unos
regmenes A y B respectivamente, obteniendose los siguientes resultados expresados en mg/dl de
sangre:
A: 113 - 162 - 136 - 128 -150 -122 -142 - 124
B: 106 - 99 - 124 - 112 - 134 - 121
Suponiendo que las concentraciones de colesterol LDL siguen distribuciones normales:
a) Hallar un intervalo de confianza para la concentracion media de colesterol LDL en las personas
que siguen el regimen A con un nivel de confianza del 95 % e interpretar el resultado.
b) Calcular el tama
no muestral mnimo necesario para obtener un intervalo de confianza de
amplitud 8 mg/dl para la concentracion media de colesterol LDL en las personas que siguen
el regimen A con un nivel de confianza del 95 %.
c) Hallar un intervalo de confianza del cociente de varianzas de la concentracion de colesterol
LDL entre las personas que siguen los regmenes A y B con un nivel de confianza del 98 % e
interpretar el resultado.
d ) Podemos afirmar con un 98 % de confianza que existen diferencias de las concentraciones
medias de colesterol LDL entre las personas que siguen los regmenes A y B?. Razonar la
respuesta a partir del intervalo de confianza para la diferencia de medias.
*105. Para comparar los resultados que obtienen las estudiantes de 1o de enfermera en las asignaturas
de Bioestadstica y Biologa se tomo una muestra, en la que de 125 alumnos matriculados en
Bioestadstica aprobaron 44 mientras que de 104 alumnos matriculados en Biologa aprobaron 65.
a) Hallar un intervalo de confianza para la proporcion de aprobados en Bioestadstica con un
nivel de confianza del 92 % e interpretar el resultado.
b) Calcular el tama
no muestral mnimo que sera necesario tomar para que el intervalo de confianza anterior tuviera una amplitud de 0,08.
c) Podemos afirmar con nivel de confianza del 96 % que existen diferencias en la proporcion de
aprobados en ambas asignaturas. Justificar adecuadamente la respuesta.
22
n
15
17
6,3
5,2
s
0,8
1,4
Considerando que las notas en ambos grupos siguen distribuciones normales, se pide:
a) Calcular el intervalo de confianza para la nota media de la asignatura en el grupo 01 con un
nivel de confianza del 90 %.
b) Suponiendo varianzas poblacionales desconocidas pero iguales, calcular el intervalo de confianza para la diferencia de medias entre los 2 grupos con un nivel de confianza del 95 %. A la
vista del intervalo, hay diferencias significativas entre la nota de los 2 grupos? Justificar la
respuesta.
c) Considerando que para aprobar hay que sacar una nota igual o superior a 5 y teniendo en
cuenta medias y desviaciones tpicas poblacionales iguales a las presentes en las muestras,
cuantos alumnos aproximadamente han aprobado la asignatura?
*109. En una poblacion se esta realizando un estudio genetico para analizar si se tiene o no un gen que
puede resultar beneficioso ya que codifica la produccion de protenas que sirven como factores de
proteccion contra el infarto de miocardio. Para ello, se han escogido 500 individuos al azar y se ha
comprobado que 100 presentan el gen que se esta estudiando. Por otra parte, para determinar si ese
gen esta presente se ha dise
nado un test diagnostico mucho mas barato que el metodo tradicional
pero con el que se pueden cometer errores en la determinacion. Los resultados obtenidos mediante
el test diagnostico aparecen en la siguiente tabla:
Tienen el gen
No tienen el gen
Test Positivo
90
20
Test negativo
10
380
Se pide:
a) Con un nivel de significacion 0,01, dar el intervalo de confianza para la sensibilidad de dicho
test.
b) Con un nivel de significacion 0,05, dar el intervalo de confianza para la probabilidad de
diagnostico acertado con el test.
23
c) Con un 95 % de confianza, se puede concluir que hay diferencia significativas entre la sensibilidad y la especificidad del test? Justificar adecuadamente la respuesta.
*110. Se dispone de 2 grupos de personas, unos sanos y otros enfermos de gota, y se les realiza un analisis
de sangre para cuantificar el acido u
rico en mg/dl, obteniendo los resultados que aparecen en la
siguiente tabla:
Grupo
Sanos
Con gota
n
15
27
5,1
6,2
s
0,9
0,5
Nota: Los problemas marcados con un asterisco (*) son problemas de examenes de otros a
nos.
24