Está en la página 1de 102

ELEMENTOS DE

ESTADÍSTICA
GUÍA DE
TRABAJOS PRÁCTICOS
Bioestadística
-2023-
Cronograma 2023 – 1er. Cuatrimestre
Sem Martes Contenido Modalidad
Experimentos aleatorios. Teorías de probabilidad. Regla de la Suma.
Probabilidad Condicional. Probabilidades conjuntas. Especificidad y Presencial
1 21/03
Sensibilidad. Ejercitación.

Introducción de Variable aleatoria. Función de probabilidad para variable


2 27/03 aleatoria discreta. Función de probabilidad para variable aleatoria continua. Presencial

Distribución Binomial. Distribución Normal y Normal estándar, Chi cuadrado y


3 03/04 t de Student. Ejercitación. Presencial

4 10/04 Ejercitación. Presencial

Estadística descriptiva: Gráficos. Medidas de posición y dispersión. Box Plot.


5 17/04 Mixta
Ejercitación. Estadística Descriptiva: Ejercitación.

6 24/04 Integración Presencial

1er. Parcial: Martes 02/05 18 hs.


7 02/05 Presencial

Distribución de la media, la varianza y la proporción. Teorema Central del


Límite. Estimadores. Estimación puntual y por intervalos de confianza para la Presencial
8 09/05
media de una población con Z. Ejercitación.

Estimación puntual y por intervalos de confianza para la media de una


población con t. Ejercitación. Estimación puntual y por intervalos de confianza Presencial
9 16/05
para: varianza y proporción, de una población. Ejercitación.
.
Pruebas de hipótesis: Marco teórico. Caso de la media de una variable
10 23/05 Presencial
aleatoria y Test de normalidad. Ejercitación
Prueba de hipótesis para la proporción y varianza. Test de Wilcoxon.
11 30/05 Ejercitación. Mixta

12 05/06 Integración Presencial

2do. Parcial: Martes 13/06 18 hs.


13 13/06 Presencial

14 20/06 Sin actividad

Recuperatorio: Martes 27/06 18 hs.


15 27/06 Presencial
Guía de Trabajos Prácticos
2023 · Bioestadística

PROBABILIDAD

OBJETIVO ESPECIFICO
 Comprender, analizar y aplicar a la resolución de problemas los conceptos de probabilidad, experi-
mento.

CONTENIDOS TEMATICOS
Probabilidad: Nociones de probabilidad basadas en la teoría clásica, del límite de frecuencia relativa, y la
definición axiomática. Características de cada una de las teorías. Experimento y suceso aleatorio. Reglas de
la suma y del producto, y sus aplicaciones. Probabilidad condicional. Aplicaciones.

GLOSARIO
Experimento aleatorio. Espacio muestral. Punto muestral. Sucesos. Casos especiales: sucesos imposibles,
ciertos o seguros, mutuamente excluyentes o incompatibles, complementarios. Definición clásica de
probabilidad, la probabilidad como límite de la frecuencia relativa, teoría axiomática de probabilidad.
Propiedades derivadas de la definición axiomática. Teoremas de la suma y del producto de probabilidades.
Probabilidad condicional. Probabilidad conjunta. Independencia de sucesos.

PROBLEMAS RESUELTOS

EJERCICIO 1) Se tiene una urna que contiene tres bolillas verdes y dos rojas numeradas del 1 al 5.
1.1) Hallar el espacio muestral correspondiente a los siguientes experimentos aleatorios, asignando la
probabilidad correspondiente a cada uno de sus elementos, si el experimento consiste en elegir una bolilla al
azar y
a) se observa y registra el color;
b) se observa y registra el número.
1.2) Hallar el espacio muestral correspondiente a los siguientes experimentos aleatorios, asignando la
probabilidad correspondiente a cada uno de sus elementos si
1.2.1) El experimento consiste en elegir dos bolillas al azar, una y luego la otra con reposición y
a) se observa y registra el color de cada una;
b) se observa y registra el número de cada una
1.2.2) El experimento consiste en elegir dos bolillas al azar, una y luego la otra, sin reposición
a) se observa y registra el color de cada una;
b) se observa y registra el número de cada una
1.3) Indicar las probabilidades (si ya están calculadas) o calcularlas, de los siguientes sucesos de los
diferentes espacios muestrales definidos:
a) la bolilla extraída es verde, considerando que el espacio muestral corresponde a 1.1.a)
b) la bolilla es la número 1, considerando que el espacio muestral corresponde a 1.1.b)
c) la bolilla tiene un número par, considerando que el espacio muestral corresponde a 1.1.b)
d) las dos bolillas son verdes, considerando que los espacios muestrales corresponden a
1.2.1.a) y a 1.2.2.a)
e) la primera bolilla es verde y la segunda es roja, considerando que los espacios muestrales
corresponden a 1.2.1.a) y a 1.2.2.a)
f) al menos una bolilla es verde, considerando que los espacios muestrales corresponden a
1.2.1.A) y a 1.2.2.A)
g) una bolilla es la número 1 y la otra es la número 5, considerando que los espacios muestrales
corresponden a 1.2.1.b) y a 1.2.2.b)
h) las dos bolillas tienen números mayores o iguales que 2, considerando que los espacios
muestrales corresponden a 1.2.1.b) y a 1.2.2.b)

1
-PROBABILIDAD-
Guía de Trabajos Prácticos
2023 · Bioestadística

SOLUCIÓN
1.1) Hallar el espacio muestral correspondiente a los siguientes experimentos aleatorios, asignando la
probabilidad correspondiente a cada uno de sus elementos si el experimento consiste en elegir una bolilla al
azar y
a) se observa y registra el color
Si interesa el color, sólo se distinguen dos situaciones que llamaremos puntos muestrales y que
simbolizamos así:
V: “el color de la bolilla elegida es verde”
R: “el color de la bolilla elegida es rojo”
Por lo tanto el Espacio Muestral (S) será: S = { V , R }
3 2
Las probabilidades correspondientes a cada elemento de S son: p(V)= ;p(R)= . Por lo tanto, se observa
5 5
que S no es un espacio equiprobable o equiposible porque las probabilidades de cada punto muestral son
distintas.
b) se observa y registra el número.
Si interesa el número, se distinguen cinco situaciones o puntos muestrales que simbolizamos de la siguiente
manera:

1: "número de la bolilla extraída, es 1“,


2: “el número de la bolilla extraída es 2",
y así sucesivamente

El espacio Muestral (S) será: S = { 1; 2 ; 3 ; 4 ; 5 }


1
Las probabilidades correspondientes a cada punto muestral p(1)=p(2)=⋯=p(5) =
5
Por lo tanto, este espacio es equiprobable ya que las probabilidades de los puntos muestrales son todas
iguales.

1.2) Hallar el espacio muestral correspondiente a los siguientes experimentos aleatorios, asignando la
probabilidad correspondiente a cada uno de sus elementos si

1.2.1) el experimento consiste en elegir dos bolillas al azar, una y luego la otra con reposición y
a) se observa y registra el color de cada una;
Al extraerse 2 bolillas cada punto muestral estará formado por 2 ocurrencias (que podrán ser igual color o
diferente color) quedando determinado un espacio muestral con 4 puntos muestrales.

S = { VV , VR , RV , RR }
Al realizar extracciones con reposición siempre que se realiza una extracción tendremos 5 elementos
para realizar la selección.
3 3 9 3 2 6 2 3 6 2 2 4
p(VV)= . = ;p(VR)= . = ;p(RV)= . = ;p(RR)= . =
5 5 25 5 5 25 5 5 25 5 5 25

Si calculamos la suma de las probabilidades de los puntos muestrales tenemos:


9 6 6 4
p(VV)+p(VR)+p(RV)+p(RR)= + + + =1
25 25 25 25

De lo cual se observa que la suma de las probabilidades de todos los puntos muestrales es 1, es
decir p(S) = 1

1.2.2) el experimento consiste en elegir dos bolillas al azar, una y luego la otra, sin reposición
a) Se observa y registra el color de cada una;
Al realizar extracciones sin reposición siempre que se realiza la primera extracción tendremos 5
elementos para elegir y, cuando realizamos la segunda extracción, sólo hay 4 elementos, pues el que fue

2
-PROBABILIDAD-
Guía de Trabajos Prácticos
2023 · Bioestadística

seleccionado no se vuelve a colocar en la urna (no le damos la oportunidad de volver a salir). La cantidad
de casos favorables puede o no modificarse dependiendo de cuál es la bolilla que quedó afuera.

El espacio muestral es el mismo que en 1.2.1.a) y las probabilidades son:


3 2 6 3 2 6 2 3 6 2 1 2
p(VV)= . = ;p(VR)= . = ;p(RV)= . = ;p(RR)= . =
5 4 20 5 4 20 5 4 20 5 4 20

1.2.1) el experimento consiste en elegir dos bolillas al azar, una y luego la otra con reposición y
b) se observa y registra el número de cada una
El espacio muestral consta de 25 elementos (resultado de 5X5).
S = {(1,1); (1,2); (1,3); (1,4); (1,5); (2,1); (2,2); (2,3); (2,4); (2,5); (3,1); (3,2); (3,3); (3,4); (3,5);
(4,1); (4,2); (4,3); (4,4); (4,5); (5,1); ( 5,2); (5,3); (5,4); (5,5)}
1 1 1
p(1,1)=......=p(5,5)= . =
5 5 25
Todos los puntos muestrales tienen la misma probabilidad de ocurrir.

1.2.2) el experimento consiste en elegir dos bolillas al azar, una y luego la otra, sin reposición
a) se observa y registra el número de cada una

Al realizar extracciones sin reposición, cuando realizamos la segunda extracción sólo hay 4 elementos
y la cantidad de casos favorables puede o no modificarse dependiendo de cuál es la bolilla que quedó
afuera.
El espacio muestral sólo tiene 20 elementos (resultado de 5X4).
S = {(1,2); (1,3); (1,4); (1,5); (2,1); (2,3); (2,4); (2,5); (3,1); (3,2); (3,4); (3,5); (4,1); (4,2); (4,3);
(4,5); (5,1); (5,2); (5,3); (5,4)}
1 1 1
p(1,2)=......=p(5,4)= ∙ =
5 4 20
1.3) Indicar las probabilidades (si ya están calculadas) o calcularlas, de los siguientes sucesos de los
diferentes espacios muestrales definidos.
a) la bolilla extraída es verde, considerando que el espacio muestral corresponde a 1.1.a)
3
p(V)= se obtiene por lectura de lo calculado
5
b) la bolilla es la número 1, considerando que el espacio muestral corresponde a 1.1.b)
1
p(1)= se obtiene por lectura de lo calculado
5
c) la bolilla tiene un número par, considerando que el espacio muestral corresponde a 1.1.b)
Si definimos el suceso D: ”la bolilla extraída tiene un número par”, entonces D={2; 4} y su probabilidad,
debido a que son sucesos mutuamente excluyentes, se calcula como la suma de la probabilidad de obtener
un 2 y la probabilidad de obtener un 4.
1 1 2
p(D)=p(2)+p(4)= + =
5 5 5
o directamente por conteo de casos favorables sobre total de casos a partir del espacio muestral:
2
p(D)=
5
d) las dos bolillas son verdes, considerando que los espacios muestrales corresponden a 1.2.1.a) y a
1.2.2.a)

Utilizando el espacio muestral de 1.2.1.a) por lectura de lo calculado se obtiene:


9
p(VV)=
25
y, utilizando el espacio muestral de 1.2.2.a), por lectura de lo calculado se obtiene:
6
p(VV)=
20
3
-PROBABILIDAD-
Guía de Trabajos Prácticos
2023 · Bioestadística

e) la primera bolilla es verde y la segunda es roja, considerando que los espacios muestrales
corresponden a 1.2.1.a) y a 1.2.2.a)
Utilizando el espacio muestral de 1.2.1.a) por lectura de lo calculado se obtiene
6
p(VR)=
25
y, utilizando el espacio muestral de 1.2.2.a), por lectura de lo calculado se obtiene
6
p(VR)=
20

f) al menos una bolilla es verde, considerando que los espacios muestrales corresponden a 1.2.1.a) y a
1.2.2.a)
Si definimos al suceso H: ”al menos una bolilla extraída es verde”, entonces H = { VR, RV, VV} y su
probabilidad, debido a que son sucesos mutuamente excluyentes, se calcula como la suma de las
probabilidades individuales, por lo que será en el espacio muestral de 1.2.1.a)

6 6 9 21
p(H)=p(VR)+p(RV)+p(VV)= + + =
25 25 25 25
o por sucesos complementarios:
4 21
̅ )=1-p(RR)=1-
p(H)= 1-p(H =
25 25

y, en el espacio muestral de 1.2.2.a)


6 6 6 18
p(H)=p(VR)+p(RV)+p(VV)= + + =
20 20 20 20
o por sucesos complementarios:
2 18
̅ )=1-p(RR)=1-
p(H)= 1-p(H =
20 20

g) una bolilla es la número 1 y la otra es la número 5, considerando que los espacios muestrales
corresponden a 1.2.1.b) y a 1.2.2.b)
Si definimos al suceso como F, será F={(1,5); (5,1)} y se puede calcular como la suma de las
correspondientes probabilidades:
1 1 2
p(F)=p(1,5)+p(5,1)= + = calculado en el espacio muestral de 1.2.1.b) o, como ambas
25 25 25
probabilidades son iguales, se puede pensar en uno de los casos y multiplicar por los posibles cambios de
lugar de los elementos, en este caso 2
1 2
p(F)=2.p(1,5)=2∙ =
25 25

Si se calcula en el espacio muestral de 1.2.2.b) será


1 1 2 1 2
p(F)=p(1,5)+p(5,1)= + = ; o p(F)=2∙p(1,5)=2∙ =
20 20 20 10 20

h) las dos bolillas tienen números mayores o iguales que 2, considerando que los espacios muestrales
corresponden a 1.2.1.b) y a 1.2.2.b)

Si lo definimos como el suceso G, entonces G es:


G ={(2,2); (2,3); (2;4); (2,5); (3,2); (3,3); (3,4); (3,5); (4,2); (4,3); (4,4); (4,5); (5,2); (5,3); (5,4); (5,5)}
y considerando el espacio muestral de 1.2.1.b) la probabilidad se puede calcular como:
 suma de las probabilidades correspondientes a cada punto muestral.
1 1 16
p(G)=p(2,2)+p(2,3)+...+p(5,5)= +...+ =
25 25 25

4
-PROBABILIDAD-
Guía de Trabajos Prácticos
2023 · Bioestadística

 O, como todos los puntos muestrales son igualmente posibles, se puede pensar en uno de ellos y
multiplicar por la cantidad de casos como ese que forman G, es decir
1 16
p(G)=16∙p(2,2)=16∙ =
25 25
 O, utilizando el concepto de sucesos complementarios
̄ ={(1,1);(1,2);(1,3);(1,4);(1,5);(2,1);(3,1);(4,1);(5,1)}
G

̄ )=p(1,1)+p(1,2)+...+p(5,1)= 1 1 9
por lo que p(G +...+ = ; y por lo tanto
25 25 25
9 16
̄ )=1-
p(G)=1-p(G =
25 25

en forma similar considerando el espacio muestral de 1.2.2.b)

G ={(2,3); (2;4); (2,5); (3,2); (3,4); (3,5); (4,2); (4,3); (4,5); (5,2); (5,3); (5,4)}

G ={(1,2); (1,3); (1,4); (1,5); (2,1); (3,1); (4,1); (5,1)}

y la probabilidad se puede calcular como:


1 1 12 1 12
 p(G)=p(2,3)+p(2,4)+…+p(5,4)= +⋯+ = o p(G)=12∙p(2,3)=12∙ =
20 20 20 20 20
1 1 8
 p(G)=p(1,2)+p(1,3)+…+p(5,1)= 20 +⋯+ 20 = 20 y por lo tanto p(G)= 1-p(G) = 1- 12 =
20 20
8

EJERCICIO 2) En una jaula conviven, en igual proporción, dos especies de jilguero, A y B. De la especie
A, el 22% de los ejemplares está parasitado por un protozoo intestinal, mientras que de la especie B, el 35%
de los ejemplares está parasitado por el mismo organismo. Un investigador necesita un jilguero para una
investigación, con lo cual entra a la jaula y captura uno al azar:
a) ¿Cuál es la probabilidad de que el jilguero capturado esté parasitado?
b) Si el jilguero capturado está parasitado, ¿cuál es la probabilidad de que pertenezca a la especie B?

SOLUCIÓN
Simbolizaremos a los sucesos
A = {el jilguero es de la especie A}
B= {el jilguero es de la especie B}
E= {el jilguero está parasitado}
Los datos son:
“.... conviven, en igual proporción, dos especies de jilguero”, lo tanto: p(A) = p(B) = ½

“De la especie A, el 22% de los ejemplares está parasitado por un protozoo intestinal”. Al saber que son de
la especie A se simboliza: p(E/A) = 0,22
“... mientras que de la especie B, el 35% de los ejemplares está parasitado por el mismo organismo”.
En forma similar, dado que se sabe que son de la especie B, se simboliza: p(E/B) = 0,35

Nota: si bien es conveniente que el símbolo seleccionado para cada suceso ayude a su interpretación (como el caso de A
y B) no se debe usar la letra P con más de una finalidad, por lo cual la reservamos para probabilidad, entonces para
“parasitado” utilizaremos el símbolo E (de enfermo).

a) Para la definición del suceso “sea parasitado”, debemos considerar a todos los parasitados, es decir, los
que están parasitados y son de la especie A y a los que están parasitados y son de la especie B, como aparece
en la fórmula: p(E)=p[(E∩A)∪(E∩B)]

5
-PROBABILIDAD-
Guía de Trabajos Prácticos
2023 · Bioestadística

Como son dos sucesos mutuamente excluyentes (si un jilguero es parasitado de la especie A ese jilguero
no es parasitado de la especie B) la probabilidad de parasitado (p(E)) se calcula como la suma de las
probabilidades de los dos sucesos que intervienen en la unión.

p(E)=p[(E∩A)∪(E∩B)]=p(E∩A)+p(E∩B)

Cada uno de los términos es la probabilidad de una intersección de sucesos no independientes por lo tanto
se calcula
p(E)=p[(E∩A)∪(E∩B)]=p(E∩A)+p(E∩B)=p(A).p (E⁄A) +p(B).p (E⁄B)

Sustituyendo los valores de las probabilidades y realizando el cálculo llegamos a

1 1
p(E)= ∙ 0,22 + ∙ 0,35= 0,11 + 0,175 = 0,285
2 2

b) “Si el jilguero capturado está parasitado ... indica que “parasitado” es algo que ocurrió, por lo tanto, lo
solicitado se simboliza: p (B⁄E) y se resuelve:
p(E∩B) 0,175
p (B⁄E) = = = 0,614
p(E) 0,285

EJERCICIO 3) Dos campos con equinos en pastoreo clasificados según su pelaje presentan la siguiente
distribución:
Campo 1 Campo 2
Zaino 9 6
Bayo 11 6
Rosillo 5 13

3.1) Se selecciona un equino al azar. Calcular la probabilidad de que:


a) sea Zaino,
b) sea Zaino y del campo 1,
c) sea Zaino o del campo 1,
d) sea Rosillo, sabiendo que es del campo 1.
3.2) Si se seleccionan dos equinos al azar:
3.2.1) Con reposición
Calcular la probabilidad de que sean:
a) ambos Bayos,
b) el primero Bayo y el segundo Zaino,
c) uno Bayo y el otro Zaino,
d) uno Bayo y del campo 1; y, el otro, Zaino y del campo 2.
3.2.2) Sin reposición
Calcular las probabilidades pedidas en 3.2.1)
SOLUCIÓN
Para facilitar los cálculos agregamos una fila y una columna con los totales de animales que hay en cada
campo y de cada pelaje
Campo 1 (C1) Campo 2 (C2)
Zaino (Z) 9 6 15
Bayo (B) 11 6 17
Rosillo (R) 5 13 18
25 25 50
6
-PROBABILIDAD-
Guía de Trabajos Prácticos
2023 · Bioestadística

15 3
3.1) a) p(Z)= = =0,30
50 10

b) Es la probabilidad de una intersección y se puede calcular directamente observando la tabla y aplicando


la teoría clásica de probabilidades.
9
p(Z∩C1)= =0,18
50
O por definición, considerando a cualquiera de los dos sucesos como el primero. Si primero se observa el
pelaje y luego de qué campo proviene:
15 9
p(Z∩C1)=p(Z)∙ p (C1⁄Z) = . = 0,18
50 15

Nota: Observar que dado que interviene una única vez el azar no se multiplica por dos.

c) Como puede darse que el animal sea Zaino y también del campo 1 los dos sucesos Z y C1 no son
mutuamente excluyentes lo que lleva a la siguiente expresión y correspondiente cálculo

15 25 9 31
p(Z∪C1)=p(Z)+p(C1)-p(Z∩C1)= + - = =0,62
50 50 50 50

d) Lo que se sabe (equivalente a decir que está dado) es que “...es del campo 1” y lo aleatorio es que “...sea
5 1
rosillo”, por lo tanto p (R⁄C1) = = =0,20 (por lectura directa de tabla), tomando en cuenta que la condición
25 5
restringe la cantidad de casos posibles. Por fórmula:
5
p(R∩C1) 50 5
p (R⁄C1) = = = =0,20
p(C1) 25 25
50
3.2) Dos equinos al azar
3.2.1) Con reposición

a) Como la característica Bayo es la misma para los dos animales seleccionados, no se ven diferencias
si se los permuta o cambia de lugar por lo tanto NO multiplicamos por dos.

17 17 289
p(BB)= ∙ = =0,1156
50 50 2500

b) Como indica el orden en que deben ocurrir los sucesos sólo hay una forma de calcularlo
17 15 255
p(BZ)= ∙ = =0,1020
50 50 2500

c) Al no indicar el orden en que deben ocurrir los sucesos, el planteo tiene dos formas de presentarse
17 15
p(BZ)+p(ZB)=2p(BZ)=2∙ ∙ =0,2040
50 50
d) Como no aclara orden puedo plantear un caso y multiplicar por las permutaciones, es decir, por la
cantidad de cambios de lugar diferentes que se pueden dar. En este caso debo multiplicar por 2 debido a que
sólo se pueden dar en dos órdenes: primero BC1 y luego ZC2, o primero ZC2 y luego BC1.
11 6
p(BC1∩ZC2)=2∙ ∙ =0,0528
50 50

7
-PROBABILIDAD-
Guía de Trabajos Prácticos
2023 · Bioestadística

3.2.2) Sin reposición


En este caso debemos recordar que:
- para calcular la probabilidad del primer elemento, se razona de la misma manera que lo que se hizo con
reposición.
- en el cálculo de la probabilidad del segundo elemento que se selecciona, y en los sucesivos, el
denominador (cantidad de elementos que pueden ser seleccionados) siempre va disminuyendo.
a) En este caso cuando se selecciona el segundo elemento y el primero no se repuso vamos a tener
también un caso favorable menos
17 16
p(BB)= ∙ =0,1110
50 49

17 15 255
b) p(BZ)= ∙ = =0,10414
50 49 2450
17 15
c) p(BZ)+p(ZB)=2∙ ∙ =0,2082
50 49
11 6
d) p(BC1∩ZC2)=2∙ ∙ =0,0539
50 49

EJERCICIO 4) Queremos evaluar la calidad del análisis clínico en la detección de cáncer de mama.
Para ello se consideran los 2641 casos de consulta en un servicio de ginecología y patología mamaria de
Capital Federal. Los resultados registrados se han tabulado a continuación:

Resultado del análisis Resultado de la biopsia


clínico Cáncer (E) Patología benigna (Ē) Total
Anormal (+) 635 268 903
Normal (-) 486 1252 1738
Total 1121 1520 2641

Calcular: sensibilidad, especificidad, valor predictivo positivo, y valor predictivo negativo.

SOLUCIÓN
Para cada medida de calidad del análisis clínico se aplican las siguientes fórmulas:
Sensibilidad =
VP 635
p (+⁄E) = = =0,5664
VP+FN 1121
Especificidad =
VN 1252
p (-⁄̅ ) = = =0,8237
E FP+VN 1520
Valor Predictivo Positivo =
VP 635
p (E⁄+) = = =0,7032
VP+FP 903
Valor Predictivo Negativo =
̅ VN 1252
p (E⁄−) = = =0,7204
VN+FN 1738

Notación:
VN: cantidad de casos “verdadero negativo”
VP: cantidad de casos “verdadero positivo”
FN: cantidad de casos “falso negativo”
FR: cantidad de casos “falso positivo”
8
-PROBABILIDAD-
Guía de Trabajos Prácticos
2023 · Bioestadística

EJERCICIO 5) Un test de diagnóstico tiene una probabilidad 0,9 de detectar la presencia de E. coli, en
caso de haberla (sensibilidad del test). Si no está presente, detecta su ausencia con una probabilidad de
0,8 (especificidad del test). La probabilidad de que una muestra de agua contenga E. coli es 0,20 (preva-
lencia).

a) ¿Cuál es la probabilidad de que el test dé un resultado positivo?


b) Suponiendo que el test dio un resultado positivo, ¿cuál es la probabilidad de que realmente la
muestra de agua contenga E. coli? (Valor predictivo positivo del test)
c) Por otro lado, si el test da un resultado negativo, ¿cuál es la probabilidad de que realmente el agua
está libre de bacterias? (Valor predictivo negativo del test)
d) Calcular el coeficiente Falso positivo = P(test positivo cuando la bacteria está ausente)
e) Calcular el coeficiente Falso negativo = P(test negativo cuando la bacteria sí está presente)

SOLUCIÓN
Consideremos una tabla similar a la del ejemplo anterior:

Bacteria Escherichia Coli


Presente Ausente
Resultado del test Positivo VP FP PV
diagnóstico Negativo FN VN PN
0,20 0,80 1,00

Sabemos que la sensibilidad de la prueba es 0,9, lo que indica que: P(+/presente)= 0,9. Es decir que:
VP/0,2 = 0,9 luego VP= 0,2*0,9 = 0,18
Además, sabemos que la especificidad es 0,8, lo que nos indica que: P(-/ausente)=0,8, es decir que:
VN/0,8 = 0,8 luego VN= 0,8*0,8 = 0,64

Volquemos estos resultados en nuestra tabla y despejemos los restantes:

Bacteria Escherichia Coli


Presente Ausente
Resultado del test Positivo 0,18 0,16 0,34
diagnóstico Negativo 0,02 0,64 0,66
0,20 0,80 1,00
a) ¿Cuál es la probabilidad de que el test dé un resultado positivo?
P(+)=0,34

b) Suponiendo que el test dio un resultado positivo, ¿cuál es la probabilidad de que realmente la muestra
de agua contenga E. coli? (Valor predictivo positivo del test)
VPP = P(presente/+) = 0,18/0,34 =0,5294

c) Por otro lado, si el test da un resultado negativo, ¿cuál es la probabilidad de que realmente el agua
esté libre de bacterias? (Valor predictivo negativo del test)
VPN = P(ausente/-) = 0,64/ 0,66= 0,97

d) Calcular el coeficiente Falso positivo = P(test positivo cuando la bacteria está ausente)
P(+/ausente) = 0,16/0,8 =0,2

e) Calcular el coeficiente Falso negativo = P(test negativo cuando la bacteria sí está presente)
P(-/presente) = 0,02/0,20= 0,10
9
-PROBABILIDAD-
Guía de Trabajos Prácticos
2023 · Bioestadística

PROBLEMAS PROPUESTOS
EJERCICIO 1) Un grupo de 60 perros fue clasificado como indica el cuadro:
Cachorro Adulto
Negro 6 9
Marrón 12 23
Blanco 2 8
Calcular:
a) la probabilidad de seleccionar:
a.1) un perro negro del grupo de cachorros;
a.2) un cachorro negro.
Dar un ejemplo de dos eventos mutuamente excluyentes y de uno que no lo sea.
b) si se seleccionan dos perros, ¿cuál es la probabilidad de que:
b.1) uno sea un cachorro marrón y el otro un adulto negro?
b.2) el primero sea adulto blanco y el segundo un perro marrón?

EJERCICIO 2) Se efectuó la Prueba de Tuberculosis en vacas de un tambo y se obtuvieron los siguientes


resultados:
VAQ. VACA-1aP. VACA-2aP. VACA-3aP.
POSITIVAS 1 2 6 15
NEGATIVAS 7 10 13 10
SOSPECHOSAS 2 4 5 5
Antes de responder a las preguntas, clasifique los sucesos definidos en ellas, en mutuamente excluyentes
o no excluyentes, y enumérelos.
a) ¿Cuál es la probabilidad de hallar:
a.1) un animal de primera parición y negativo?
a.2) un animal de tercera parición sospechoso o uno de segunda parición?
a.3) un animal positivo entre las vaquillonas?
b) Si se examinan dos animales, ¿cuál es la probabilidad de que:
b.1) sean, el primero sospechoso y vaquillona y el segundo vaca de tercera parición y negativo?
b.2) sean uno negativo y otro sospechoso?
b.3) el segundo sea negativo sabiendo que el primero es una vaca negativa de tercera parición?

EJERCICIO 3) Un test detecta un cierto tipo de bacteria T con una probabilidad 0,90 en caso de haberla.
Si no la hay, detecta la ausencia, con probabilidad 0,80. Sabiendo que la probabilidad de que una muestra de
agua contenga la bacteria de tipo T es 0,20, calcular la probabilidad de que:
a) realmente haya presencia de bacteria cuando el test haya dado positivo.
b) realmente haya presencia de bacteria cuando el test haya dado negativo.
c) haya bacteria y además el test dé positivo.
d) o haya bacteria o el test dé positivo.

EJERCICIO 4) La esferocitosis es un tipo particular de anemia que se encuentra en 1 cada 2000 pacientes
con anemia. Se conocen dos métodos de detección: CHCM (concentración de hemoglobina corpuscular
media) mayor o igual a 34,5 y ADE (amplitud de distribución eritrocitaria) mayor o igual a 14,5. El test basado
en la CHCM tiene una sensibilidad de 86% y una especificidad de 90%, mientras que en el test basado en la
ADE la sensibilidad es de 94% y la especificidad de 88%.
a) ¿Cuál es la probabilidad de que una persona con anemia cuyo CHCM es mayor o igual a 34,5 tenga
esferocitosis?
b) ¿Cuál es la probabilidad de que una persona con anemia cuyo ADE es mayor o igual a 14,5 no tenga
esferocitosis?

10
-PROBABILIDAD-
Guía de Trabajos Prácticos
2023 · Bioestadística

EJERCICIO 5) Se sabe que uno de cada mil individuos contrae cierta enfermedad en una población de
estudio. Para detectar esta enfermedad se usa un test que da resultado positivo en el 99% de los casos de
personas enfermas, en tanto que da positivo sólo en el 2% de los casos de las personas sanas.
a) Si tomamos un individuo al azar, le realizamos el test y da positivo, ¿cuál es la probabilidad de que
haya contraído la enfermedad?
b) Si ha dado negativo el test, ¿cuál es la probabilidad de que la persona esté sana?
Completar la siguiente tabla:

Presencia de enfermedad
Enfermos Sanos
Resultado del test Positivo
diagnóstico Negativo

Sensibilidad:
Especificidad:
Valor predictivo positivo:
Valor predictivo negativo:

11
-PROBABILIDAD-
Guía de Trabajos Prácticos
2023 · Bioestadística

VARIABLE ALEATORIA
DISTRIBUCIONES EN PROBABILIDAD
* OBJETIVOS ESPECÍFICOS
 Comprender los conceptos de variable aleatoria, funciones de probabilidad y de distribución.
 Aplicar estos conceptos a la interpretación del comportamiento de fenómenos biológicos y conocer algunas
distribuciones de probabilidad que los describen.
 Analizar distintos casos y calcular valores medios y de dispersión.
 Calcular las probabilidades de ocurrencia de resultados experimentales.
* CONTENIDOS TEMÁTICOS
Variable aleatoria: discreta y continua.
Distribución de probabilidad, función de cuantía, densidad y distribución acumulada. Distribuciones de
probabilidad, esperanza y varianza. Propiedades de la esperanza y la varianza. Percentil. Distribuciones
especiales: Bernoulli, Binomial, Normal, Normal estandarizada, t de Student y Ji-Cuadrado.

* GLOSARIO
Variable aleatoria. Funciones de probabilidad: función de cuantía, función de densidad, función de distribución
acumulada. Percentiles. Esperanza matemática. Varianza.
Distribuciones de probabilidad discreta y continua. Distribuciones particulares: Binomial, Normal, t de Student
y Ji-Cuadrado.

PROBLEMAS RESUELTOS
EJERCICIO 1) Si X es una variable aleatoria discreta tal que:
xi 0 1 2 3 4
P(xi) 0,1 0,1 0,35 0,25 .……

a) Completar el valor faltante


b) Expresar la función de distribución acumulada
c) Calcular P(X  2)
d) Graficar la función de cuantía y la función de distribución acumulada
e) Hallar E(X)
f) Hallar E(X+2)
g) Hallar E(2X)

SOLUCIÓN: observemos que la variable en estudio es una variable aleatoria discreta

a) Para resolver este punto debemos recordar una de las condiciones para que una función sea una función
de probabilidad puntual o función de cuantía: la suma de las probabilidades puntuales es igual a uno,
simbólicamente:
n

∑ p(xi )=1
i=0
4
En nuestro caso  p( x )  1, es decir: p(0)+p(1)+p(2)+p(3)+p(4)=1;
xi  0
i

reemplazando por los valores de tabla nos queda: 0,1+ 0,1+ 0,35 + 0,25 + p(4) = 1, despejando obtenemos:
p(4)=1 - 0,1 - 0,1 - 0,35 - 0,25.

Por lo tanto, el valor faltante es: p (4) = 0,2

Nota: observar que el n de la sumatoria, puede ser infinito.

12
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística

b) La función de distribución acumulada (F(xi)).


Por ejemplo si queremos F(2), usamos la función de probabilidad puntual, de la siguiente manera:
F(2)=P(X≤2)=p(X=0)+p(X=1)+p(X=2)=0,1+0,1+0,35=0,55

Repitiendo este procedimiento para cada valor de la variable se obtiene la función de distribución acumulada.

xi 0 1 2 3 4
p(xi) 0,1 0,1 0,35 0,25 0,2
F(xi) 0,1 0,2 0,55 0,80 1,0

c) Nos están preguntando la probabilidad de que la variable tome valores mayores o iguales a dos. Este ítem
se puede resolver de dos formas
1) Utilizando la función de cuantía y sumando cada probabilidad puntual
P(X≥2)=p(X=2)+p(X=3)+p(X=4)=0,35+0,25+0,2=0,8
2) Utilizando la función de distribución y aplicando las propiedades de que la suma de todas las
probabilidades es uno y de sucesos mutuamente excluyentes:
P(X≥2)=1-P(X<2)=1-P(X≤1)=1-0,2=0,8

Obsérvese que la probabilidad P(X<2) = P(X≤1) porque la variable es discreta y no toma valores entre 1
y 2. Por lo tanto P(X≥2)=0,8
Nota: observar que en el caso en que la variable pueda tomar muchos valores, la primera forma de resolución es poco
práctica, ya que podría ser una suma con muchos términos; en cambio la segunda forma siempre va a ser una operación
de, a lo sumo, dos términos.

d) El gráfico de la función de cuantía es un gráfico de bastones que muestra las probabilidades puntuales de
cada valor de la variable. En el eje de las abscisas se ubican los valores de la variable y en el eje de las
ordenadas se ubican los valores de probabilidad puntual.

El gráfico de la función de distribución acumulada es un gráfico de escalones que muestra cuánto acumula
cada valor de la variable, antes del primer valor de la variable la función vale cero ya que no acumula
probabilidad y luego del último valor de la variable la función se mantiene constante en uno ya que no hay más
valores de variable que aporten probabilidad. En el eje de las abscisas se ubican los valores de la variable y
en el eje de las ordenadas los valores de probabilidad acumulada.

Gráfico de Bastones
p(x) 0,40

0,35

0,30

0,25

0,20

0,15

0,10

0,05

0,00
0 1 2 3 4
X

13
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística

e) Para calcular la esperanza de una variable aleatoria discreta se utiliza la siguiente fórmula
n

E(X)= ∑ xi p(xi )
i=o
En nuestro caso:
4

E(X)= ∑ xi p(xi )=0∙0,1+1∙0,1+2∙0,35+3∙0,25 +4∙0,2=2,35


i=0

Por lo tanto E(X)=2,35

f) Para calcular la esperanza que nos están pidiendo hay que utilizar la propiedad que establece que de la
suma de una VA y una constante, se obtienen una nueva variable (que llamaremos Y), entonces:
E(Y) = E(X+a) = E(X) + a.

En nuestro caso la constante es 2, Por lo tanto E(X+2) = 2,35 + 2 = 4,35

g) Para calcular la esperanza pedida hay que utilizar la propiedad que establece si a una V.A. de la
multiplica por una constante, se obtiene una nueva variable (que llamaremos W), entonces:
E (W) = E( aX) = a E(X).
En nuestro caso la constante es 2, por lo que E(W) = E(2X) = 2*2,35 = 4,7

1 2 1
EJERCICIO 2) Dada la función: f (x) 
x 
8 3
a) Verificar que f(x) es función de probabilidad en el intervalo [0;2] y graficar.
b) Hallar la función de distribución acumulada.
c) Calcular E(X)
d) Calcular P(0,5 < X  1,5)

Nota: La resolución del ejercicio que desarrollaremos a continuación, persigue un fin netamente conceptual expositivo. Los
contenidos matemáticos necesarios para su resolución no formarán parte de la evaluación del presente curso.

SOLUCIÓN: observemos que la variable en estudio es una variable aleatoria continua

a) Para verificar que f(x) es una función de probabilidad hay que verificar las dos condiciones:

1)f(x)≥0 ∀ x∈(-∞;∞)

2) ∫ f(x) dx =1
-∞

La primera condición se verifica directamente con el gráfico de la función:

14
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística

f(x)
0.8 Desde menos infinito hasta 0 la función vale cero, desde
0 hasta 2 la función es mayor o igual que cero y desde 2
0.7 hasta más infinito la función vale cero. Por lo tanto la
0.6 primera condición se verifica.
0.5

0.4

0.3

0.2

0.1

0.0 0.5 1.0 1.5 2.0


x

La segunda condición se verifica calculando la integral, es decir verificando que el área bajo la curva es uno.

  
1 1
0 2 0 2

 f  x  dx   f  x  dx   f  x  dx   f  x  dx   0dx    8 x  dx   0dx 
2

3
  0 2  0 2
2 2
 1 x3 1   x3 x   23 2   03 0  
 0  *  x  0           
8 3 3  0  24 3  0  24 3   21 3  
 8 2 1 2
   0     1
 24 3  3 3
Como la integral es igual a 1 se verifica la segunda condición.

Por lo tanto se verifican las dos condiciones es decir que f(x) es una función de probabilidad.

b) La función de distribución acumulada es la función que da las probabilidades acumuladas y se obtiene


integrando la función de probabilidad. La integral es muy parecida a la calculada en el punto “a”.
x
x x
1 1 1 u3 1 1 1
FX (x)= ∫ f(u)du= ∫ ( u2 + ) du= ( + u)| = x3 + x
0 0 8 3 83 3 0
24 3

0 para x < 0
Por lo tanto la función de distribución es: 
1 3 1
FX ( x)   x  x para 0  x  2
 24 3

1 para x > 2

c) Para calcular la esperanza de una variable aleatoria continua se utiliza la siguiente fórmula:

E(X)= ∫ x f(x)dx
-∞

En nuestro caso:
2
2 2
1 1 2
1 1   1 x4 1 x2 
E  x    x * f  x  dx   x  x 2   dx    x3  x  dx     
0 0 8 3 08 3  8 4 3 2 0
2
 1 1  24 22 16 4 7
  x4  x2        1,17
 32 6  0 32 6 32 6 6

Por lo tanto E(X)=1,17.

15
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística

d) Nos están preguntando la probabilidad de que la variable tome valores entre 0,5 y 1,5.
Para calcular esta probabilidad utilizaremos la función de distribución acumulada. Primero calculamos la
probabilidad de que la variable tome valores menores que 1,5 (reemplazando este valor en la función de
distribución acumulada) y a este valor le restamos la probabilidad de que la variable tome valores menores que
0,5 (reemplazando este valor en la función de distribución acumulada). Recordemos que, como la variable es
continua, la probabilidad en un punto es igual a cero, por lo tanto:
P(X<1,5)=P(X≤1,5)=F(1,5), y lo mismo para 0,5.

Nota: Por lo que se puede deducir que no importa si los extremos están o no incluidos, cálculo de probabilidad
se hace de la misma manera.

Nos queda:
1 1 1 1
P(0,5<X≤1,5)=P(X≤1,5)-P(X≤0,5)=F(1,5)-F(0,5)= [ ∙(1,5)3 + ∙1,5] - [ ∙(0,5)3 + ∙0,5] =
24 3 24 3
27 1 1 90
= +0,5 - - = = 0,46987
192 192 6 192

Nota: Los ejercicios de variable aleatoria continua a desarrollar en esta unidad tendrán a la función de distribución
acumulada (F(X)) como dato, por lo que no será necesario el cálculo de ninguna integral.

EJERCICIO 3) Dada la función: f(x)= 2x definida en el intervalo [0;1] y


0 si x  0

F  X    x2 si 0  x  1
1 si x  1

Responder:
a) ¿es f(x) una función de densidad de probabilidad? ¿Por qué?
b) ¿cuál es la probabilidad de (X < ½)?
c) ¿y la P(X 2)?
d) ¿cuál es la probabilidad de (X  ½)?

SOLUCIÓN: Notemos que la variable en estudio es una variable aleatoria continua

a) Para verificar que es función de densidad, o función de probabilidad debemos probar que la función
cumple con dos propiedades (como en el ejercicio anterior).

Estas son:
1) f(x)  0 en todo su recorrido
+∞
2) ∫ f(x) dx=1
-∞

f(x) 2.0

1.5
La primera propiedad la verificamos directamente en
el gráfico de la función donde observamos que el
mismo se encuentra sólo por encima del eje x (de 1.0
abscisas), que corresponde con el eje positivo de
ordenadas, en este caso f(x).
0.5

X 0 1 2

16
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística

La segunda propiedad la verificamos realizando un cálculo sencillo a partir del gráfico para evitar calcular
integrales. Debemos observar que la segunda propiedad corresponde a considerar el área bajo la curva
que queda delimitada por el intervalo de definición o dominio.

En este caso bajo la curva reconocemos una figura geométrica, el triángulo, por lo que debemos calcular
el área del mismo, su base es de 1 unidad y su altura es de 2 unidades, por lo tanto:

b∙h 1∙2
área del triángulo = = = 1
2 2

Como el área bajo la curva de la función es uno, se verifica la segunda condición.

Por lo tanto se verifican las dos condiciones, entonces f(x) es una función de probabilidad o función
de densidad.

b) Nos están preguntando la probabilidad de que la variable tome valores menores a ½, para esto
utilizaremos la expresión de la función de distribución acumulada, que es una función partida, es decir que
hay que prestar especial atención al valor de la variable ya que este nos va a indicar qué parte de la función
utilizar.
En este caso el valor es ½, este valor está entre 0 y 1, por lo tanto utilizamos la parte central de la
función, es decir F(x) = x2

Por lo tanto, P(X < 1/2) = P(X ≤ 1/2) = F(1/2) = (1/2)2 = 0,25

c) Nos están preguntando la probabilidad de que la variable tome valores menores o iguales a 2. En este
caso el valor de la variable es 2, mayor que 1, por lo tanto utilizaremos la última parte de la función, es decir
F(x)=1

Por lo tanto, P(X 2) = F(2)= 1

Nota: observar que el caso continuo es indistinto (a fines prácticos) utilizar los símbolos > o  y < o , ya que la probabilidad
puntual de una variable aleatoria continua es siempre cero. Es decir que:
P(X  a) = P(X < a) + P(X = a) = P(X < a) + 0 = P(X < a), por lo tanto P(X  a) = P(X < a)

d) Nos están preguntando la probabilidad de que la variable tome valores mayores o iguales a ½, a
diferencia de los dos puntos anteriores, no podemos utilizar directamente la función de distribución ya que
esta sirve solamente para probabilidades acumuladas hasta el valor de la variable y, en este caso, es una
probabilidad acumulada a partir de dicho valor de la variable. Por lo tanto tendremos que hacer un paso
más que consiste en escribir la expresión P(X  1/2) como una probabilidad que acumula por menor.
Sabemos que la probabilidad total es uno por lo tanto: P(X  1/2)= 1 - P(X < 1/2).
Ahora estamos en condiciones de utilizar la función de distribución con el valor ½ (esta probabilidad fue
calculada en el punto “b”).

Por lo tanto, P(X  1/2)= 1 - P(X < 1/2) = 1 - P(X ≤ 1/2) = 1 - (1/2)2 = 1 - 0,25 = 0,75

EJERCICIO 4) De acuerdo a las leyes genéticas la inseminación artificial con semen proveniente de machos
Landrace con hembras Duroc Jersey da hijos con las características paternas en un 60% de los casos y el
resto con las características maternas. Si se tomaron 14 crías de este tipo de apareamiento (se tomó una cría
al azar de cada una de las camadas, de las distintas madres que fueron sometidas a este cruzamiento):

a) Calcular la probabilidad de obtener:


a.1) hasta 5 crías con características maternas
a.2) menos de 6 crías con características paternas
a.3) el 50% de las crías con características maternas
b) Hallar V(3X)
c) Hallar V(X+4).

17
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística

SOLUCIÓN: La variable en estudio es una variable aleatoria discreta, pero a diferencia de las variables
discretas de los ejercicios anteriores, parecería tener una distribución conocida, la distribución Binomial, cuyas
probabilidades están tabuladas. Con lo cual, antes de calcular probabilidades debemos verificar los supuestos
de dicha distribución.
En principio, es necesario precisar en qué consiste el experimento aleatorio. En este caso sería inseminar
artificialmente una hembra Duroc Jersey con semen de un macho Landrace, y observar si un hijo tiene
características paternas.
Este experimento se repite 14 veces y, de esta manera, queda definida la variable binomial.
X: “N de hijos de machos Landrace con hembras Duroc Jersey con características paternas, en 14 crías”.
Dado que se verifica que:
1) El experimento aleatorio tiene dos resultados posibles: éxito y fracaso. Cada cría puede tener características
paternas o maternas (por como fue definida la variable el éxito es que tenga características paternas; pero se
podría haber definido de otra forma).
2) Cada repetición del experimento aleatorio es independiente de las demás. Cada cría es independiente de
las demás por haber sido seleccionados de distintas madres
3) Los resultados del experimento aleatorio son mutuamente excluyentes. Si una cría tiene características
paternas no puede tener características maternas.
4) La probabilidad de éxito se mantiene constante a lo largo de todas las repeticiones de este experimento
aleatorio. La probabilidad de características paternas (p=0,6) es la misma a lo largo de los 14 repeticiones.
5) El número de repeticiones es prefijado. Hay 14 crías observadas (n=14).

Una vez verificadas las condiciones de binomialidad se puede decir que XBi (14; 0,6).

Como la probabilidad de éxito es 0,6 es conveniente definir una variable aleatoria binomial auxiliar ya que
la tabla no puede usarse con probabilidades de 0,6 porque solo cuenta con probabilidades de 0 a 0,5. Por esta
razón definimos
Y: “N de hijos de machos Landrace con hembras Duroc Jersey con características maternas, en 14 crías”.

Es una variable aleatoria con distribución binomial con parámetros p=0,4 y n=14: YBi (14;0,4).

a.1) Nos están preguntando sobre las características maternas por lo tanto debemos utilizar la variable aleatoria
Y. “...Hasta 5 crías con características maternas...” quiere decir que la variable aleatoria Y puede tomar valores
menores o iguales que 5. Hay dos formas de resolver este ítem:
1) Por tabla, que da la función de distribución acumulada, entrando con n=14 y p=0,4 y buscando el 5
P(Y  5) = 0,4859

2) Por fórmula:
5
14
P(Y≤5)= ∑ ( ) 0,4y ∙0,614-y
y
i=0

Por lo tanto la probabilidad de obtener hasta 5 crías con características maternas es de 0,4859.

Nota: Por lo general es conveniente utilizar la tabla ya que los cálculos con fórmula son muy trabajosos.

a.2) Nos están preguntando sobre las características paternas por lo tanto debemos utilizar la variable aleatoria
X, pero vamos a tener que hacer un cambio de variable. “Menos de 6 crías con características paternas” quiere
decir que la variable aleatoria X puede tomar valores menores a 6, es decir menores o iguales a 5. Para hacer
el cambio de variable analicemos que sucede con la otra variable, si la variable X puede tomar valores menores
o iguales a 5 quiere decir que la variable Y puede tomar valores mayores o iguales a 9, ya que si hay 5 crías
con características paternas o menos, hay 9 con características maternas o más (recordemos que el total es
14). Este cambio de variable se puede ver más claramente con un esquema en donde se ubican los valores
de ambas variables:

X 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Y 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0

18
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística

Aclarado este punto, existen dos formas de resolver este ítem:


1) Por tabla, haciendo el cambio de variable y luego utilizando la propiedad de la suma de las
probabilidades totales, entrando con n=14 y p=0,4 y buscando el 8.

P(X<6)=P(X≤5)=P(Y≥9)=1-P(Y<9)=1-P(Y≤8)=1-0,9417=0,0583

2) Por fórmula se plantea: (no es necesario hacer el cambio de variable)


5
14
P(X<6)=P(X≤5)= ∑ ( ) 0,6x ∙0,414-x
x
x=0
Por lo tanto la probabilidad de obtener menos de 6 crías con características paternas es 0,0583.

a.3) Nos están preguntando sobre las características maternas, por lo tanto debemos utilizar la variable Y. “El
50% de las crías con características maternas”, es lo mismo que decir “7 crías con características maternas”,
ya que el 50% de 14 es 7, por lo tanto es la probabilidad puntual de que la variable Y tome el valor 7. Hay dos
formas de resolver este ítem
1) Por tabla, restándole a la probabilidad acumulada hasta 7 la probabilidad acumulada hasta 6.

P(Y=7)=P(Y≤7)-P(Y≤6)=0,8499-0,6925=01574
14
2) Por fórmula: P(X=7)= ( ) 0,47 ∙0,67 =0,1574
x
Por lo tanto, la probabilidad de obtener el 50% de las crías con características maternas es 0,1574.
Nota: la fórmula para el cálculo de las probabilidades puntuales no es la misma que la del cálculo de las probabilidades
acumuladas, ya que no tiene la sumatoria.

b) La varianza de toda variable con distribución binomial es: V(X)=np(1-p), por lo tanto en nuestro caso
V(X)=14*0,6*(1-0,6)=14*0,6*0,4=3,36. Aplicando la siguiente propiedad V(aX)=a2 V(X), y reemplazando a por
3, la varianza que nos están pidiendo queda: V(3 X)=3 2*V(X)
Por lo tanto, V(3X)=9*3,36=30,24 crias2

c) Aplicando la siguiente propiedad V(Xa)=V(X) y reemplazando a por 4, la varianza que nos están pidiendo
queda V(X+4) = V(X)
Por lo tanto, V(X+4)= 3,36 crias2

EJERCICIO 5) Un tambero está al borde de la quiebra por lo que sus expectativas están puestas en la
producción futura. Las vacas Holando Argentino de su tambo tienen un rendimiento normal con media 450
litros y desvío estándar de 80 litros de leche, por mes. El tambero superaría la situación actual si en el próximo
mes cada vaca produce más de 510 litros en promedio.

a) ¿Cuál es la probabilidad de que el tambero no llegue a la quiebra?


b) Sabemos además que el tambero pierde todos sus bienes personales si el rendimiento mensual es menor
a 320 litros por vaca, ¿cuál es la probabilidad de que quiebre pero sin llegar a exponer su patrimonio personal?
c) Si el tambero produjera en otro país tendría un 30% de probabilidad de no ir a la quiebra, ¿cuántos litros
tendría que producir para no quebrar?

SOLUCIÓN: La variable en estudio es una variable aleatoria continua, a diferencia de los ejercicios anteriores,
es una variable aleatoria con distribución conocida y tabulada. Por la información que nos dan en el enunciado
sabemos que es una variable aleatoria con distribución normal, con media poblacional 450 litros/mes y varianza
poblacional de 6400 litros2 /mes2 (ya que su desvío estándar es de 80 litros/mes), por lo tanto podemos decir
que:

X: "Rendimiento mensual de leche de una vaca Holando-Argentino en un tambo, en l/mes"


X  N(=450 litros/mes ; 2=6400 litros2/mes2)

Recordemos que sólo contamos con la tabla para la distribución normal estándar por lo tanto tendremos
que estandarizar la variable con la siguiente fórmula:

19
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística
X-μ X - 450
Z= = y sabemos que Z tiene una distribución normal estándar, es decir una distribución normal con
σ 80
media poblacional 0 y varianza poblacional 1, simbólicamente: ZN(0,1)

a) El tambero llega a la quiebra si produce a lo sumo 510 litros/mes por animal, por lo tanto no llega a la quiebra
si produce más de 510 litros/mes, es decir que nos están preguntando: ¿cuál es la probabilidad de que la
variable tome valores mayores que 510?, simbólicamente se escribe: P(X > 510) (tendremos que utilizar la
propiedad de que la probabilidad total es uno, ya que todas las tablas dan probabilidades para valores menores
que un cierto valor, ya que son tablas de funciones de distribución acumulada).

X - μ 510 - 450
P(X>510)=P ( > ) =P(Z>0,75)=1-P(Z≤0,75)=1-0,77337=0,22663
σ 80

Por lo tanto, la probabilidad de que el tambero no llegue


a la quiebra es de 0,22663.

El área sombreada bajo la curva normal es de 0,22663.


0 0,75 Z
Nota: se entra en la tabla de la normal estándar por los márgenes con el valor estandarizado de la variable, y se busca
la probabilidad en el interior de la misma.

b) El tambero llega a la quiebra si produce a lo sumo 510 litros/mes y pierde su patrimonio personal si produce
menos de 320 litros/mes, por lo tanto, no pierde su patrimonio personal si produce más de 320 litros/mes. Es
decir que nos están preguntando: ¿cuál es la probabilidad de que la variable tome valores entre 320 y 510?
Simbólicamente se escribe: P(320≤X≤510)

320-μ 510-μ 320-450 510-450


P(320≤X≤510)=P ( ≤Z≤ ) =P ( ≤Z≤ )=
σ σ 80 80
P(-1,63≤ Z ≤0,75)=P(Z≤0,75)-P(Z<-1,63)=P(Z≤0,75)-P(Z≤-1,63)=
=0,77337-0,05155=0,72182
-1,63 0 0,75 Z

Por lo tanto, la probabilidad de que el tambero llegue a la quiebra sin perder su patrimonio personal
es de 0,72182.

c) Si el tambero, en otro país, tiene una probabilidad de 0,3 de no irse a la quiebra, debemos buscar el
valor de la variable que nos determina esta probabilidad, es decir buscamos el valor de “a” que resuelve:
P(X>a)=0,3, pero debemos estandarizar, es decir que buscamos “b” que resuelva: P(Z>b)=0,30.

P(Z>b)=0,30 ⇒ P(Z≤b)=1-0,3 ⇒ P(Z≤b)=0,7

Entrando por el interior de la tabla con el valor de probabilidad 0,7 (o con el valor más cercano a este),
buscamos el valor de la variable en los márgenes, obtenemos que b = 0,53. Pero nos interesa este valor sin
estandarizar por lo tanto debemos “des-estandarizar”. Para esto debemos despejar el valor de X de la fórmula
de estandarización:
a-μ
b=Z0,7 = ⇒Z0,7 ∙ σ= a - μ⇒Z0,7 ∙ σ+μ= a
σ

En nuestro caso a=0,52∙80+450⇒a=41,6+450⇒a=491,6

Por lo tanto si el tambero produjera en otro país debería producir más de 491,6 litros/mes para no irse a la
quiebra.

EJERCICIO 6) Sea X una variable aleatoria con distribución t-Student, con 16 grados de libertad
a) ¿Cuál es la probabilidad de que X  2,12?
b) ¿Cuál es la probabilidad de que X > 2,921?
c) ¿Cuál es la probabilidad de que X < -2,583?
d) ¿Cual es el valor de “a” que cumple con la siguiente restricción: P(Xa)=0,90?
20
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística

e) ¿Cuál es el valor de “a” que cumple con la siguiente restricción: P(X<a)=0,05?

SOLUCIÓN: La variable en estudio es una variable aleatoria continua con distribución t-Student con 16
grados de libertad por lo tanto podemos escribir: Xt16. Vamos a utilizar la tabla de la distribución t, para
entrar en tabla necesitamos los grados de libertad, que en nuestro caso son 16, por lo tanto, solo
utilizaremos la fila correspondiente a 16 para resolver los diferentes ítem del ejercicio.

a) En la tabla de t, función de distribución, las probabilidades se encuentran en el encabezado de columna,


en el encabezado de las filas figuran los grados de libertad, y los valores de la variable se hallan en el
interior de la tabla. Por lo tanto nos ubicamos en la fila correspondiente a 16 grados de libertad, ubicando
el valor de la variable pedido, que en este caso es 2,12, y buscamos en el encabezado de columna la
correspondiente probabilidad, que es 0,975.

Por lo tanto, P(X  2,12)=0,975.

Nota: si no está exactamente el valor de variable que buscamos se utiliza el valor más próximo.

b) Como nos están pidiendo la probabilidad de que la variable tome un valor mayor que 2,921 tendremos
que utilizar la propiedad de la suma de las probabilidades totales, ya que la tabla sólo contiene
probabilidades de valores menores que un valor de la variable.
Entonces P(X > 2,921) =1-P(X  2,921). Para encontrar P(X  2,921) hacemos lo mismo que en el
punto “a” y obtenemos que P(X  2,921) = 0,995. Con lo cual P(X>2,921)=1-0,995=0,005

Por lo tanto, P(X > 2,921) = 0,005.

c) La tabla de la distribución t sólo cuenta con los valores positivos de la variable, pero como es una
distribución simétrica utilizamos estos valores para encontrar probabilidades de los valores negativos. Por
ser simétrica podemos escribir P(X < -2,583) = P(X > 2,583) y seguir resolviendo como en el punto “b”, con
lo cual P(X < -2,583) = P(X > 2,583) = 1-P(X ≤ 2,583)=1- 0,99 = 0,01

Por lo tanto, P(X < -2,583) = 0,01.

Nota: la simetría nos asegura que el área que queda a la izquierda del valor negativo de la variable es la misma la
que queda a la derecha del valor positivo de la variable.

d) Nos están pidiendo un valor de variable y nos están dando la probabilidad de que los valores de t sean
menores de ese valor de variable (0,90), por lo tanto entramos por el encabezado de columna con este
valor, lo cruzamos con la fila de los 16 grados de libertad y así queda determinado el valor que estamos
buscando: 1,337.
Simbolicamente: P(X<a) = 0,90  a = t16,0.90 = 1,337
Por lo tanto, a =1,337.

e) A diferencia del punto anterior, no podemos entrar directamente a tabla, por que la tabla cuenta solamente
con valores de probabilidad desde 0,6 hasta 0,9995. Por lo tanto, tendremos que utilizar nuevamente la
propiedad de simetría de la distribución.
Por simetría: P(X<a)=0,05 ⇒ P(X>-a)=0,05
Por suma de las probabilidades totales: P(X>-a)=0,05 ⇒1-P(X≤-a)=0,05
Despejando: P(X≤-a)=1-0,05 ⇒ P(X≤-a)=0,95
Ahora podemos buscar el valor en la tabla, cruzando la fila de los 16 grados de libertad con el valor de
probabilidad 0,95, nos da que el valor de la variable es 1,746, es decir que – a =1,746, con lo cual a =-1,746.
Simbólicamente: P(X< a ) = 0,05  a = t16,0,05= - t16,0,95 = -1,746
Por lo tanto, a = -1,746.
EJERCICIO 7) Sea Y una variable aleatoria con distribución Ji-cuadrado, con 22 grados de libertad
a) ¿Cuál es la probabilidad de que Y  26,04?
b) ¿Cuál es la probabilidad de que Y > 33,92?

21
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística

c) ¿Cuál es el valor de “b” que cumple con la siguiente restricción P(Y<b) = 0,25?
d) ¿Cuál es el valor de “b” que cumple con la siguiente restricción P(Y>b) = 0,1?

SOLUCIÓN: La variable en estudio es una variable aleatoria continua con distribución Ji-Cuadrado con 22
grados de libertad por lo tanto podemos escribir: Y  22 . Vamos a utilizar la tabla (de distribución
2

acumulada) de la distribución Ji. Para entrar en tabla necesitamos los grados de libertad, que en nuestro
caso son 22, por lo tanto solo utilizaremos la fila correspondiente a 22 para resolver los diferentes ítem del
ejercicio. La tabla de Ji es parecida a la de la t ya que cuenta con los valores de la variable en la parte
central, los grados de libertad en la primera columna y los valores de probabilidad en la primera fila.

a) Para obtener el valor que nos están pidiendo solo tenemos que buscar en la fila de los 22 grados de
libertad el valor de la variable 26,04, y leer en la fila de encabezados el valor de probabilidad
correspondiente.
Por lo tanto, P(Y  26,04) = 0,75.

Nota: si no está exactamente el valor de variable que buscamos se utiliza el valor más próximo.

b) Una vez más tendremos que utilizar la propiedad de la suma de las probabilidades totales ya que la tabla
sólo da probabilidad para valores menores que un determinado valor de variable y nos están pidiendo una
probabilidad para valores mayores que un determinado valor de variable.
Con lo cual P(Y> 33,92) = 1-P(Y  33,92), solo falta buscar el valor de probabilidad en tabla como en el punto
“ a ”. P(Y>33,92) =1-P(Y  33,92)=1-0,95 = 0,05
Por lo tanto, P(Y > 33,92) = 0,05.

c) Entramos directamente en tabla con los grados de libertad 22 y el valor de probabilidad 0,25, donde se
cruzan la fila de los grados de libertad y la columna del valor de probabilidad queda determinado el valor pedido:
b = 17,24
Simbólicamente: p(Y  b)  0,25  b   22,0, 25  17,24
2

Por lo tanto, b=17,24

d) Una vez más tendremos que utilizar la propiedad de la suma de las probabilidades totales
P(Y>b)=0,1⇒P(Y≤b)=1-0.1⇒P(Y≤b)=0,9. Ahora hacemos lo mismo que en el punto “c”, pero con un valor de
probabilidad de 0,9 y obtenemos que b = 30,81.
Simbólicamente: p(Y  b)  0,1  b   22,0,9  30,81
2

Por lo tanto b=30,81

Nota: la distribución ji-cuadrada no es simétrica.

EJERCICIO 8) Un laboratorio afirma que una droga causa efectos secundarios en una proporción de 5 de
cada 100 pacientes. Para contrastar esta afirmación, otro laboratorio elige al azar a 2 pacientes a los que
aplica la droga. ¿Cuál es la probabilidad de los siguientes sucesos?

1) Resolver los siguientes ítems de dos maneras diferentes, utilizando la distribución correspondiente a la
variable de interés, y también aplicando los conceptos aprendidos en la unidad I.
a) Ningún paciente tenga efectos secundarios.
b) Uno tenga efectos secundarios y el otro no
c) Ambos tengan efecto secundario
SOLUCIÓN
Si aplicamos los conceptos de la unidad 1, debemos considerar los sucesos:
E: que el paciente tenga efectos colaterales provocados por la droga.
NE: que el paciente no tenga efectos colaterales provocados por la droga.
El espacio muestral correspondiente al experimento en el que se extraen 2 individuos, con reposición,
formando el siguiente espacio muestral:

22
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística

S = {(E, E); (E, NE); (NE, E); (NE, NE)}

Si aplicamos los conceptos de la unidad 2, necesitamos considerar la siguiente variable aleatoria: X:”can-
tidad de pacientes con efectos secundarios provocados por la droga, de un conjunto de 2”. Es una variable
aleatoria discreta, con distribución binomial, que tiene como parámetros: n=2 y p=0,05.
En este punto, sería conveniente que usted aplique las condiciones de la binomial a esta situación práctica,
para verificar que se trata de una distribución binomial.
a) Ningún paciente tenga efectos secundarios.
Aplicando la unidad 1, se resuelve como:
P(NE  NE) = 0,95 * 0,95 = 0.9025
Aplicando la unidad 2, se resuelve como:
P(x=0) = 0,9025
b) Uno tenga efectos secundarios y el otro no
Aplicando la unidad 1, se resuelve como:
P[ (NE  E)  (E  NE) ] = (0,95 * 0,05) * 2 = 0,095
Aplicando la unidad 2, se resuelve como:
p(x=1)= p(x≤1) - p(x=0) =0,9975-0,9025=0,095
c) Ambos tengan efecto secundario
Aplicando la unidad 1, se resuelve como:
P(E  E) = 0,05 * 0,05 = 0,0025
Aplicando la unidad 2, se resuelve como:
p(x=2)= p(x≤2) - p(x≤1) =1-0,9975=0,0025

EJERCICIO 9) En una jaula hay 3 cobayos negros y 5 blancos. Se extraen simultáneamente dos cobayos,
se pide:
1. Hallar el espacio muestral si se observa y registra el color.
2. Calcular la probabilidad de que:
2.a- ambos sean negros.
2.b- ambos sean blancos.
2.c- uno sea negro y el otro blanco.
3. Si interesa estudiar la variable X: “número de cobayos negros seleccionados”, se pide:
3.a- A partir de los valores que toma la variable X, ordenarlos en una tabla, y calcular la función de
cuantía y la función de distribución.
3.b- Graficar ambas funciones.
3.c- Calcular esperanza y varianza.
3.d- Calcular la probabilidad de que a lo sumo dos cobayos sean negros.

SOLUCIÓN
1. Hallar el espacio muestral correspondiente a observar y registrar el color, y a la extracción de dos co-
bayos.
S = {NN , NB , BN , BB}
2. Calcular la probabilidad de que:
2.a- ambos sean negros.
3 2 3
P(NN)= ∙ = =0,107
8 7 28
2.b- ambos sean blancos.
5 4 5
P(BB)= ∙ = =0,357
8 7 14

23
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística

2.c- uno sea negro y el otro blanco.


3 5 15
P[(N∩B)∪(B∩N)]=2∙P(N∩B)= ( ∙ ) ∙2= =0,536
8 7 28

3. Si interesa estudiar la variable X: “número de cobayos negros seleccionados”, se pide:


3.a- A partir de los valores que toma la variable X, ordenarlos en una tabla, y calcular la función de
cuantía y la función de distribución.

X p(X) F(X)
0 5/14 5/14
1 15/28 25/28
2 3/28 1

3.b- Graficar ambas funciones.

3.c- Calcular esperanza y varianza.


5 15 3 3
E(X)=0∙ +1∙ +2∙ = =0,75
14 28 28 4

5 15 3 3 2 45
V(X)=02 ∙ +12 ∙ +22 ∙ - ( ) = =0,402
14 28 28 4 112
3.d- Calcular la probabilidad de que a lo sumo dos cobayos sean negros.
P(X≤2)=F(2)=1

EJERCICIO 10) Para un grupo de hombres adultos con una edad de 40 a 50 años, la distribución de lecturas
de colesterolemia, en mg/dl, tiene distribución normal con media de 210mg/dl y una desviación estándar
de 15mg/dl.
a) Hallar la probabilidad de que un hombre adulto de esta población tenga una lectura de colesterol
en sangre que exceda los 250mg/dl.
b) Hallar la probabilidad de que un hombre adulto de esta población tenga una lectura de colesterol
en sangre de a lo sumo 220mg/dl, sabiendo que tiene por lo menos 215mg/dl.
24
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística

c) Hallar la lectura no superada por el 10% de los adultos de esta población.


d) Si se seleccionan cuatro adultos de esta población hallar la probabilidad de que ninguno de ellos
tenga una lectura superior a 250mg/dl

SOLUCIÓN
X: " lecturas de colesterol en sangre, en mg/dl, de un hombre adulto con una edad de 40 a 50 años "

X N(=210 mg/dl; 2=225 (mg/dl)2)


a)
X-μ 250-210
P(X>250)=P ( > ) =P(Z>2,67)=1-P(Z≤2,67)=1-0,99621=0,00379
σ 15

Por lo tanto, P(X > 250) = 0,00379

b)
P(215≤X≤220)
P (X≤220⁄X≥215) =
P(X≥215)

Calculamos numerador y denominador por separado.

215 - 210 220 - 210


P(215≤X≤220) = P ( ≤Z≤ ) = P(0,33≤Z≤0,67)=
15 15
P(Z≤0,67) - P(Z≤0,33)=0,74857 - 0,62930= 0,11927

X-μ 215-210
P(X≥215)=P ( > ) =P(Z>0,33)=1-P(Z≤0,33)=1-0,62930=0,37070
σ 15

Por lo tanto
P(215≤X≤220) 0,11927
P (X≤220⁄X≥215) = = =0,32174
P(X≥215) 0,37070

c) P(Z≤a)=0,10⇒a=-1,28

Pero nos interesa este valor sin estandarizar por lo tanto debemos “des-estandarizar” por lo que despejamos
el valor de X de la fórmula de estandarización:

X0 -μ
-1,28= ⇒-1,28*15+210=X0 ⇒X0 =190,8
σ
Por lo tanto, la lectura de colesterol no superada por el 10% de los adultos de esta población es
190,8 mg/dl

d)
Y: "cantidad de hombres adultos con una edad de 40 a 50 años cuyas lecturas de colesterol en sangre, en
mg/dl, son superiores a 250 mg/dl, en 4 hombres adultos con una edad entre 40 y 50 años."
Es una variable aleatoria con distribución binomial con parámetros p=0,00379 y n=4: YBi (4; 0,00379)

Como el valor de p=0,00379 no esta en tabla lo calculamos con la fórmula:


P(Y=0)=(0,00379)0 ∙(1-0,00379)4 =0,996214 =0,9849258

Por lo tanto, la probabilidad de que ninguno de ellos tenga una lectura superior a 250 mg/dl
es de 0,9849258.

Nota: En este caso, si quisiéramos usar la tabla, deberíamos aproximar p a 0,05.


Se obtendría: P(Y=0)=0,8145, lo que nos generaría un gran error en el cálculo, por lo tanto el único método
recomendable sería el de aplicar la fórmula.

25
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística

PROBLEMAS PROPUESTOS
EJERCICIO 1) La distribución del número de crías nacidas muertas por parición de un lote de 200 cerdas
Duroc Jersey considerado como población es la siguiente:
xi 0 1 2 3 4 5
p(xi) 0,05 0,20 0,30 0,20 0,15 0,10

a) ¿Cuál y de qué tipo es la variable aleatoria en estudio?


b) p(xi) es la función de ..........................................................................................................................
c) Completar la tabla con la función de distribución acumulada.
d) Calcular P(X  2)
e) Calcular P(X < 3)
f) Calcular P(2  X  4)
g) Calcular la E(X)
h) Calcular la E(X - 0,5)

EJERCICIO 2) Considere la función de densidad: f(X)=-2x en [-1;0]

0 para x  -1

con función de distribución acumulada: F ( X )  -x 2  1 para -1  x  0
1 para x  0

Calcular:
a) ¿De qué tipo es la variable en estudio?
b) F(X) es la función de ................................................ y f(x) es la función de ....................................
c) P (-1  X  -0,5)
d) P (-0,5  X  -0,1)
e) P (X  -2)
f) P (X  1)
g) P (X < -0,25)

EJERCICIO 3) Sea X una v. a. con función de distribución dada por:


0 si x  0
0.2 si 0  x  1

F ( x)  0.5 si 1  x  5
0.6 si 5  x  7

1 si 7  x
a) ¿A qué tipo de variable corresponde? Graficar.
b) Calcular y graficar la función de probabilidad de X.
c) Plantear y calcular las siguientes probabilidades:
c.1) P(5 < X < 6.5)
c.2) P(2 ≤ X < 25)
c.3) P(X = 2)
d) Expresar simbólicamente y hallar el valor esperado de X

EJERCICIO 4) Una variable aleatoria se encuentra definida por:

xi 1 2 3 4 5 6
p(xi) 0,05 0,10 0,25 0,30 0,20 ?
26
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística

a) ¿De qué tipo es la variable en estudio? ...........................................................................................


b) p(x) es la función de ........................................................................................................................
c) Completar el valor faltante
d) Calcular la F(x)
e) F(x) es la función de ..........................................................................................................................
f) Graficar las funciones de cuantía y de distribución acumulada
g) Calcular la E(X), E(3X) y E(X - 0,5)
h) Calcular P(X  3)
i) Calcular P(X1)
j) Calcular P(X<1)
k) Calcular P(X  0)

EJERCICIO 5) El exceso de lluvias en ciertos campos bajos produce parasitosis en el ganado. Precipitaciones
anuales mayores a 2000 mm son consideradas, en algunos casos, perjudiciales y provocan infestaciones que
involucran al 20% del ganado bovino destetado. Si se toma una muestra de 12 terneros de un lote de 1000,
a) Definir la variable en estudio
b) Analizar si la variable verifica las condiciones de una distribución Binomial
c) Definir la variable auxiliar y especificar su distribución.
d) ¿Cuál es la probabilidad de que ninguno esté parasitado?
e) ¿Cuál es la probabilidad de que10 o menos estén parasitados?
f) ¿Cuál es la probabilidad de que 5 ó 6 no estén parasitados?
g) Calcular la V(X), V(X+10) y V(3X)

EJERCICIO 6) El siguiente grafico representa a una variable aleatoria:

0,3
0,25
0,2
0,15
0,1
0,05
0
8 10 12 14 16

a) ¿Corresponde a una variable aleatoria continua o a una discreta? ¿Por qué?


b) Verificar el cumplimiento de las condiciones para ser una función de probabilidad.
x
c) Suponiendo que la fórmula de la función de densidad correspondiente es f(X)=- +0,5 y que la función
32
x2
de distribución es F(X)=0,5x-3- , calcular P(6≤X≤15).
64

EJERCICIO 7) El peso de los novillos de la raza Hereford es una variable normalmente distribuida con media
380 kg. y desvío estándar 23 kg.
a) Definir la variable de interés e indicar su distribución
b) ¿Cuál es la probabilidad de que un novillo de la raza en cuestión elegido al azar pese entre
400 y 430 kg?
c) ¿Cuál es la probabilidad de que el peso de un novillo de raza Hereford sea mayor a 390 kg?
d) ¿Cuál es el peso no superado por el 25 % de los novillos de dicha raza?

EJERCICIO 8) Sea X una variable aleatoria con distribución t-Student


a) Con 20 grados de libertad.
1. ¿Cuál es la probabilidad de que X  2,85?
27
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística

¿Cuál es la probabilidad de que X > 2,09?


2.
¿Cuál es la probabilidad de que X < -2,53?
3.
¿Cual es el valor de “a” que cumple con la siguiente restricción: P(Xa)=0,90?
4.
¿Cuál es el valor de “a” que cumple con la siguiente restricción: P(X<a)=0,05?
5.
6.
¿Cuáles son los valores de a y b, tales que: P(aXb) = 0,90, siendo a y b simétricos con respecto
a 0?
b) Con 10 grados de libertad.
1. ¿Cuál es la probabilidad de que X  2,76?
2. ¿Cuál es la probabilidad de que X > -3,17?
3. ¿Cuál es la probabilidad de que X < 2,23?
4. ¿Cual es el valor de “a” que cumple con la siguiente restricción: P(Xa)=0,90?
5. ¿Cuál es el valor de “a” que cumple con la siguiente restricción: P(X<a)=0,05?
6. ¿Cuáles son los valores de a y b, tales que: P(aXb) = 0,90, siendo a y b simétricos con respecto
a 0?
7. Calcule la media y la varianza para dicha distribución.

EJERCICIO 9) Sea Y una variable aleatoria con distribución Ji-cuadrado


a) Con 30 grados de libertad.
1. ¿Cuál es la probabilidad de que Y  43,8?
2. ¿Cuál es la probabilidad de que Y > 34,8?
3. ¿Cuál es el valor de “b” que cumple con la siguiente restricción P(Y<b) = 0,25?
4. ¿Cuál es el valor de “b” que cumple con la siguiente restricción P(Y>b) = 0,1?
5. ¿Cuáles son los valores de a y b, tales que: P(aYb) = 0,90, dejando a y b áreas iguales en las colas?

b) Con 15 grados de libertad.


1. ¿Cuál es la probabilidad de que Y  18,3?
2. ¿Cuál es la probabilidad de que Y > 25?
3. ¿Cuál es el valor de “b” que cumple con la siguiente restricción P(Y<b) = 0,25?
4. ¿Cuál es el valor de “b” que cumple con la siguiente restricción P(Y>b) = 0,1?
5. ¿Cuáles son los valores de a y b, tales que: P(aYb) = 0,90, dejando a y b áreas iguales en las colas?
6. Calcule la media y la varianza para dicha distribución.

EJERCICIO 10) En un criadero de perros se dedican a las razas labrador y Doberman, de pelajes negro y
marrón. Se selecciona una muestra de 20 perros, y se ordenan los datos en la siguiente tabla:

Negro Marrón
Doberman 4 5
Labrador 3 8

Si se extraen dos perros al azar:


a) Definir el espacio muestral del experimento de la variable aleatoria X: ”Número de labradores negros”
b) Encontrar la función de cuantía (sugerencia: calcular la probabilidad de cada punto muestral)
c) Encontrar F(x)
d) Calcular las siguientes probabilidades: P(X>1) y P(X<2)

EJERCICIO 11) En un pensionado canino se encuentran 20 perros que fueron clasificados por tamaño y
edad:
Cachorro Adulto
Grande 2 1
Mediano 4 6
Pequeño 5 2
1. Calcular la probabilidad de seleccionar un perro:
a- mediano del grupo de los adultos.
b- mediano y adulto.
2. Si se seleccionan dos perros ¿Cuál es la probabilidad de que:
28
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística

a- uno sea cachorro pequeño y el otro adulto grande.


b- el primero sea adulto pequeño y el segundo un perro mediano.
3. Si se sabe que el 40% de los perros del pensionado se contagia de pulgas, y también que la capacidad
es de 20 caniles independientes que constantemente permanecen ocupados:
a- Definir la variable en estudio.
b- ¿Cuál es la probabilidad de que haya más de 8 perros con pulgas?
c- ¿Cuál es la probabilidad de que ninguno se haya contagiado de pulgas?

EJERCICIO 12) Se considera que la concentración de ácido úrico en gatos de menos de un año de edad
tiene una distribución normal con media 0,35 mg/dl y varianza 0,04 (mg/dl)2.
a) ¿Cuál es la probabilidad de que un gato presente una concentración de ácido úrico de entre 0,2 y
0,3 mg/dl?
b) Hallar la probabilidad de que un gato tenga en su orina a lo sumo 0,4 mg/dl de ácido úrico, sabiendo
que tiene una concentración superior a 0,3mg/dl.
c) ¿Cuál es la concentración de ácido úrico no superada por el 20% de los gatos?

EJERCICIO 13) Entre los diabéticos, el nivel de glucosa en sangre (X), en ayunas, puede suponerse de
distribución normal, con media 106 mg/100 ml y desviación típica 8 mg/100 ml, entre los pacientes sanos
esta variable (Y) también es normal pero con media 80mg/100ml y una desviación típica de 9mg/100ml, se
clasifica como diabético a un paciente con glucosa igual o superior 110,
a) hallar la probabilidad de:
1- clasificar como diabético a un paciente sano;
2- clasificar como sano a un paciente diabético;
3- detectar la enfermedad de este criterio.
b) Hallar E(X+Y) y Var(X-Y)

29
-VARIABLE ALEATORIA-
Guía de Trabajos Prácticos
2023 · Bioestadística

ESTADÍSTICA DESCRIPTIVA
OBJETIVOS ESPECIFICOS
 Identificar una población o muestra
 Definir la o las variables que caracterizan a una distribución
 Calcular medidas de posición y de dispersión adecuadas para describir cada distribución.
 Comprender la utilidad e importancia del Teorema Central del Límite en estadística.

CONTENIDOS TEMÁTICOS
Población y muestra. Variables cuantitativas continuas y discretas. Variable atributo. Principios y tipos de
muestreo. Distribución de frecuencias discretas y continuas. Gráficos. Medidas de posición y dispersión: media
aritmética, mediana, modo, amplitud, varianza, desvío estándar, coeficiente de variación y distancia intercuar-
tílica. Propiedades de media aritmética y varianza. Esperanza, varianza y caso especial de la distribución de
X.

* GLOSARIO
Estadística. Variable: cuantitativa, cualitativa o atributo. Población. Muestra. Muestreo. Gráficos: barras,
bastones, escalones, histogramas; polígonos de frecuencias, ojiva; Boxplot. Media aritmética, Mediana,
Modo, Varianza, Desvío estándar, Coeficiente de variación, Rango o Amplitud. Variación relativa y absoluta.

El orden que seguimos es:


 Definir la población de la que seleccionaremos la muestra a evaluar
 Definir la variable de interés, donde debe constar la unidad de observación
 Ordenar los datos en una tabla de frecuencias.
 Graficar frecuencias a partir de la tabla.
 Calcular medidas que nos resuman las características de la distribución de la variable en la muestra.

Conceptos de Muestreo

El muestreo es la selección de una parte de la población denominada muestra. A las características de


cada muestra se las denomina estadísticos o estadísticas. A las características de la distribución de la
variable en la población se las denomina parámetros. La varianza poblacional y la esperanza son ejemplos
de parámetros.

Las técnicas de muestreo estadístico comprenden dos aspectos principales:


 el criterio de selección da las reglas mediante las cuales algunos miembros de la población son
incluidos en la muestra.
 la selección y cálculo de estimadores muestrales de los parámetros de la población en función
de sus propiedades y distribución. (SÉ VERA EN LA PROXIMA UNIDAD)

I.-Tipos de muestreo. Criterio de selección de las muestras

ALEATORIO: en el que se utilizan los conceptos aportados por la teoría de probabilidad para seleccionar las
unidades de muestreo. Esta aleatorización se usa para tener una distribución muestral y obtener estimaciones
válidas del error de esa estimación para poder concluir acerca de la población.
a) No restringido o simple
En este método todos los sujetos tienen la misma posibilidad de ser seleccionados para la muestra, indepen-
dientemente uno de otro. Para garantizar esto, cada sujeto debería ser devuelto a la población luego de ser
medido y registrado. Sea N el tamaño de la población:
1
a) Si se trabaja con reposición la probabilidad de que cada elemento sea seleccionado es .
N
1
b) Si se trabaja sin reposición la probabilidad para el primer elemento a elegir es , para el segundo es
N

29
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

1 1
, para el tercero , y así sucesivamente.
N 1 N 2
Puede suceder que:
 El tamaño de la muestra sea menor al 5% de la población y por lo tanto trabajar sin reposición es casi lo mismo
que trabajar con reposición, vale decir que el error cometido es despreciable numéricamente.
 Sea imposible devolverlos a la población porque, por ejemplo, pueden ser destruidos para la investigación, y
no pueden ser repuestos luego de la medición.
b) Restringido
i) Estratificado: la población está dividida en base a una variable estratificadora en grupos homogéneos
o clases llamados “estratos”. Se toma una muestra aleatoria simple de cada grupo y se obtiene una muestra
estratificada. La muestra puede ser “proporcionada” si el número de elementos seleccionado en cada grupo
es proporcional al tamaño del grupo; o “desproporcionada” si se toma igual número de elementos en cada
estrato sin importar su tamaño.
Por ejemplo si estratificamos por género y el 60% de una determinada población corresponde al género
masculino, si tomamos del estrato masculino el 60% de la muestra, esta sería proporcionada; en cambio, si
tomamos igual número de hombres y mujeres sería desproporcionada.
ii) Agrupado o en conglomerados: la población está dividida o se la divide en grupos que presentan
características similares a toda la población y se extrae una muestra de esos grupos heterogéneos llamados
“conglomerados”. Cada grupo es una “unidad primaria de muestreo”; se puede incluir el grupo entero de las
unidades elementales que lo forman en la muestra o tomar una muestra de las unidades primarias más pe-
queñas.
El muestreo para llegar a la muestra final puede ser “monoetápico” (en una sola etapa), “bietápico” o con
“submuestreo” (en dos etapas), o “multietápico” (más de dos etapas).
Por ejemplo, un multietápico seria: en una primera etapa podemos seleccionar las universidades (UNIDAD
PRIMARIA), luego seleccionar las facultades en una segunda etapa, y, por último, los estudiantes en una
tercera etapa.
Cuando no se puede llegar a las unidades de muestreo directamente se divide a la población en grupos.
Se seleccionan algunos al azar y se muestrean solamente los seleccionados en una o varias etapas. Por
ejemplo: barrios, manzanas, viviendas, personas.
Este muestreo por etapas se puede combinar con un muestreo estratificado.
iii) Sistemático: supongamos que las unidades de la población se enumeran en un cierto orden, se
toma una unidad al azar entre las k primeras y luego se toman las subsecuentes en intervalos de k. No se
necesita conocer el tamaño total de la población en estudio ni tener definido el marco de referencia. Para
elegir el valor de k se elige una cifra entera, razonable, generalmente el cociente entre el tamaño de la
población (cuando se conoce) y el tamaño de la muestra, que se establece sobre la base de informaciones
previas.
Este tipo de muestreo suele usarse en control de calidad, y para el caso de sucesiones de elementos,
como por ejemplo, historias clínicas de pacientes, certificados de nacimiento, etc.
Supongamos que se necesita un animal de cada 100, y el primero es seleccionado aleatoriamente de
entre los primeros 100. Si es el animal número 63, entonces la muestra estaría formada por los animales
número 63, 163, 263, y así sucesivamente.
Este tipo de muestreo es un procedimiento fácil, pero insatisfactorio si en la población hay tendencias,
ciclos no reconocidos o periodicidades ocultas. Como ejemplo, tenemos el siguiente caso: Si un ganadero
solamente envía a sus animales al matadero los días martes, y las muestras, en el matadero, se seleccio-
nan sistemáticamente los días miércoles, los animales de este ganadero no estarán representados en la
muestra.
NO ALEATORIO: la elección de la muestra queda en manos del investigador, basado en su juicio experto,
conveniencia u otros criterios. En este caso un riesgo a tener en cuenta es que la estimación obtenida muy
posiblemente sea sesgada.
Por ejemplo, si quiere estimarse la proporción de vacas lecheras rengas (con claudicaciones) en un esta-
blecimiento, y se selecciona como muestra a las 10 primeras vacas que entran a la sala del ordeñe, de un
total de 100 vacas, posiblemente estemos subestimando esta proporción, ya que esas 10 primeras vacas
tendrían menor chance de tener claudicaciones.
30

-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

PROBLEMAS RESUELTOS
EJERCICIO 1) En un estudio sobre la detección de pseudotuberculosis, la Dirección de Bromatología se-
leccionó al azar 28 establecimientos, dedicados a la cría y engorde de ovinos, registrando la cantidad de
animales afectados, por establecimiento, al realizar la faena en el frigorífico:

70 110 135 110 77 82 118 110 82 77 77 82 110 110


75 82 75 82 70 75 118 75 120 77 77 82 82 70

a) Identificar la variable, clasificarla y definir la población en estudio.


b) Construir la tabla de frecuencias.
c) Calcular todas las medidas de posición.
d) Calcular las medidas de dispersión.
e) Si suponemos que en los establecimientos se realizó un tratamiento que disminuye en 10% la cantidad
de animales afectados, ¿cómo se modifican las medidas calculadas en el punto c) y d)?
f) A partir del boxplot analizar la distribución de la variable.
g) Realizar el grafico de frecuencias acumuladas correspondiente.

SOLUCIÓN
a) La variable es aquella característica que nos interesa medir en cada unidad experimental, en este caso:
X: “cantidad de ovinos atacados de pseudotuberculosis en un establecimiento dedicado a la cría y engorde
de ovinos al realizar la faena en el frigorífico”.
Se trata de una V. Cuantitativa Discreta.

En este problema la población en estudio corresponde a los establecimientos dedicados a la cría y engorde
de ovinos; como no se especifica la región en donde están ubicados, solamente con esta descripción nos
alcanza. Entonces, la muestra tomada es de:
n (tamaño de la muestra): 28 establecimientos dedicados a la cría y engorde de ovinos.

b) Tabla de frecuencias: la primera columna contiene los valores de la variable que se registraron en la
muestra, y se simboliza con xi; en la segunda columna se registra cuántas veces se observa cada uno de
los valores de la variable (xi), y corresponde a la frecuencia absoluta simple (fi). En la tercera columna se
registra cuántas veces se observan los valores de la variable menores o iguales a x i, o sea, las frecuencias
absolutas acumuladas (Fi). La cuarta columna corresponde al cociente entre fi y n, o sea la frecuencia
relativa simple (hi). En la última columna, correspondiente a las frecuencias relativas acumuladas (Hi), su-
mamos las frecuencias relativas simples de la misma manera que en la tercera columna, hasta acumular
el total de la muestra. Por las características de las frecuencias relativas siempre obtendremos como valor
1, o 100%, o cercanos a ellos, según se expresen en decimales o como porcentajes.

xi fi Fi hi Hi
70 3 3 0,11 0,11
75 4 7 0,14 0,25
77 5 12 0,18 0,43
82 7 19 0,25 0,68
110 5 24 0,18 0,86
118 2 26 0,07 0,93
120 1 27 0,04 0,96
135 1 28 0,04 1,00
TOTAL 28 1,00

La utilidad de la tabla es que el ordenamiento de los datos permite interpretar la información de la muestra.
Por ejemplo, tomemos la información de la cuarta fila de datos, en donde x 4 = 82:
 f4 = 7, indica que en 7 establecimientos dedicados a la cría y engorde de ovinos se encontraron 82
ovinos atacados de pseudotuberculosis.
 F4 = 19, se interpreta como que en 19 establecimientos dedicados a la cría y engorde de ovinos se
encontraron a lo sumo 82 ovinos atacados de pseudotuberculosis (o hasta 82 ovinos atacados de pseudo-
tuberculosis inclusive).

31
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística
4
NOTA: F4  f
1
i  f1  f 2  f3  f 4  3  4  5  7  19

 h4 = 0,25, expresa que en el 25% de los establecimientos dedicados a la cría y engorde de ovinos se
encontraron 82 ovinos atacados de pseudotuberculosis.
 H4 = 0,68, indica que en el 68% de los establecimientos dedicados a la cría y engorde de ovinos se
encontraron a lo sumo 82 ovinos atacados de pseudotuberculosis (o hasta 82 ovinos atacados de pseudo-
tuberculosis inclusive).
4
NOTA: H 4   h  h h
1
i 1 2  h3  h4  0,11  0,14  0,18  0, 25  0,68
c) Medidas de posición

MEDIA ARITMÉTICA
xi fi xi fi
Para calcular la media aritmética debemos sacar el promedio de
todos los valores de la variable que hemos obtenido en la muestra. En la 70 3 210
fórmula observamos que aparece la expresión xifi, o sea, la sumatoria de 75 4 300
los productos entre cada valor de la variable y su correspondiente frecuen- 77 5 385
cia absoluta simple. Para facilitar los cálculos podemos agregar una co- 82 7 574
lumna a la tabla de frecuencias en donde realizaremos estos productos, 110 5 550
de la siguiente forma: 118 2 236
Σxi fi 2510
x̄ = = =89,64 120 1 120
n 28 135 1 135
Interpretación: aproximadamente 90 ovinos afectados con pseudotu- 28 2510
berculosis

MEDIANA
Para calcular la mediana, primero debemos ordenar los datos de menor xi Fi
a mayor o de mayor a menor. En este ejercicio ya ordenamos los datos al cons-
truir la tabla de frecuencias. Como sabemos, esta medida divide a la muestra en 70 3
dos partes iguales, por lo que en el primer paso debemos encontrar la posición 75 7
de la misma, o sea, encontrar cuál es el valor central de la muestra (en caso de 77 12
que n sea un número impar), o cuáles son los valores centrales (en caso de que 82 19
n sea un número par). 110 24
n+1 118 26
Pos Me = = 14,5 120 27
2
135 28

Entonces los valores centrales ocupan los lugares 14 y 15. Luego los ubicamos en la tabla de Frecuencias
acumuladas (Fi) y observamos: como los valores centrales son x(14)=82 y x(15)=82, debemos realizar el
promedio entre ellos

x(14) +x(15) 82+82


Mex = = = 82
2 2

La interpretación es 82 ovinos afectados con pseudotuberculosis.

32

-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

MODO
xi fi Para calcular el modo tenemos que recurrir nuevamente a la tabla de frecuencias,
70 3 porque en ella vamos a ubicar rápidamente cuál es el valor de la variable que se
repite con mayor frecuencia. Debemos observar cualquiera de las columnas de fre-
75 4
cuencias simples, en este caso tomamos la columna de f i. La mayor frecuencia es
77 5 f4, por lo tanto:
82 7
110 5 f 4 = 7  Mo = 82 ovinos afectados con pseudotuberculosis
118 2
120 1
135 1
TOTAL 28
Observar que también estas medidas verifican la condición de ASIMETRÍA POSITIVA:
Me = Mo = 82 < X = 89,64 ovinos afectados con pseudotuberculosis

CUARTILES
Otra medida de posición para datos ordenados son los CUARTILES. Para calcularlos dividimos la
muestra en cuatro partes iguales, por lo que calculamos 3 cuartiles, C1, C2 (=Me) y C3.
Realizamos el mismo mecanismo que para calcular la Mediana, en cada una de las dos mitades, y
obtenemos:

n+1 n+1 3(n+1)


PosC1 = = 7,25 PosC2 = PosMe = = 14,5 PosC3 = = 21,75
4 2 4

C1 = 75 ovinos afectados con pseudotuberculosis y C3 = 110 ovinos afectados con pseudotuberculosis

d) Medidas de dispersión:
RANGO o AMPLITUD
Esta medida de dispersión es la más sencilla y consiste en conocer cuántas unidades comprende
la totalidad de los valores observados en la muestra. Para calcularlo sólo basta con realizar la resta entre
el xmáx (mayor valor de la variable) y xmín (menor valor de la variable).

Amplitud= xmáx -xmín =135-70=65 ovinos afectados con pseudotuberculosis

DISTANCIA INTERCUARTÍLICA
Es la medida de dispersión asociada a los cuartiles, se simboliza dC, y en ella observamos la dispersión
de los valores centrales, la forma de calcularla es: d C = C3 – C1, e indica el rango o amplitud donde se
encuentra el 50% “central” de las observaciones.

En este caso es: dC= C3-C1 = 110-75 = 35 ovinos afectados con pseudotuberculosis

VARIANZA
Es una medida de dispersión absoluta,
xi fi xi fi xi2fi
que mide el grado de concentración de las ob-
servaciones con respecto a su promedio ( X ) 70 3 210 14700
En la fórmula observamos que aparece 75 4 300 22500
la expresión ∑xifi, que ya habíamos usado al cal- 77 5 385 29645
cular la media aritmética, y aparece una expre- 82 7 574 47068
sión, xi2fi, la sumatoria de los productos entre 110 5 550 60500
el cuadrado de cada valor de la variable y su co- 118 2 236 27848
rrespondiente frecuencia absoluta simple. Para 120 1 120 14400
facilitar los cálculos podemos agregar una co- 135 1 135 18225
lumna a la tabla de frecuencias en donde reali- TOTAL 28 2510 234886
zaremos estos productos, de la siguiente forma:

33
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

1 (Σxi fi )2 1 (2510)2 1
Sx2 = [Σx2i fi - ] = [234886- ] = (234886-225003,57)= 366,02
n-1 n 27 28 27

Sx2 = 366,02 (ovinos afectados con pseudotuberculosis)2

Nota: Debemos recordar que se expresa en la unidad de la variable pero elevada al cuadrado.

DESVÍO ESTÁNDAR
El desvío estándar es la raíz cuadrada de la varianza. Por lo que lo calculamos de la siguiente forma:

S = S2 = 366,02 =19,13 ovinos afectados con pseudotuberculosis

COEFICIENTE DE VARIACIÓN
Es una medida de dispersión relativa en donde se relaciona una medida de dispersión (Sx) con una
medida de posición ( X ), y su resultado se expresa en porcentaje. No tiene unidades de medida.

S 19,13
C.V.= .100 = .100 = 22,1%
̄X 86,5

e) Si cada observación se disminuye en 10%, la variable inicial X se modifica de la siguiente forma:


Yi = Xi - 0,10Xi = Xi (1- 0,10) = 0,90Xi
La media aritmética y la varianza también se modifican, en este caso según la propiedad del producto
entre la variable y una constante:

Y = 0,90.X = 0,90.89,64= 80,676 ≅ 81 ovinos afectados con pseudotuberculosis


Nota: Lo mismo sucedería con la mediana (MeY = 0,90 · Mex = 0,90 · 0,82 = 73,8 74 ovinos infectados)

2 2 2
SY = 0,902 .SX = 0,81∙366,02= 296,74 (ovinos afectados con pseudotuberculosis)

Como consecuencia de esta modificación, el valor del desvío estándar será:

2
SY = √SY = √296,74= 17,22 ovinos afectados con pseudotuberculosis

El CV no se modifica, ya que:
SY 0,90.SX SX
CVY = = = =CVX
Ȳ 0,90.x̄ x̄
f) Boxplot

Para analizar el boxplot debemos prestar atención a la caja. En


este caso vemos que la Me (representada por la línea horizontal
dentro de la caja) está próxima al C1, de manera que el 25% de
los datos centrales inferiores a ella están muy cercanos entre
sí, mientras que el 25% de los datos centrales superiores a la
Me están más alejados entre sí, si comparamos la distancia en-
tre la Me y C3. Además toda la caja está desplazada hacia la
parte inferior del gráfico: el bigote inferior es menor que el su-
perior. Esto nos indica que la distribución es ASIMÉTRICA PO-
SITIVA.

34

-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

g) El gráfico siguiente se denomina de ESCALONES, y sirve para representar frecuencias acumuladas, de


variables aleatorias discretas, ya sean las absolutas o las relativas, pero en este ejercicio sólo necesitamos
graficar estas últimas.

Podemos observar los escalones y relacionarlos con el gráfico de la función de distribución acumulada
F(xi), que ya hemos visto en la unidad anterior (correspondiente a Distribuciones de Probabilidad).

EJERCICIO 2) Los siguientes valores corresponden a la altura, en mm, del complejo QRS de 20 electro-
cardiogramas de galgos de ambos sexos, luego de una competencia:
25,0 29,3 20,0 24,1 22,5 20,5 25,0 24,0 21,0 23,7
17,0 20,5 30,0 20,6 23,2 30,8 27,5 30,3 25,5 33,8
a) ¿Cuál es la variable en estudio y de qué tipo es?
b) Realizar los gráficos correspondientes a los datos ordenados en una tabla de frecuencias.
c) Calcular las medidas de centralidad y de dispersión, indicando las unidades correspondientes.
d) A partir del boxplot analizar la distribución de la variable.

SOLUCIÓN
a) X: “altura del complejo QRS en un electrocardiograma de galgo, luego de una competencia, medida en
mm.”
n = 20 (tamaño de muestra)

La población en estudio puede definirse como:


 el conjunto de todos los galgos, luego de una competencia  Población Biológica
 el conjunto de todos los valores de altura del complejo QRS en electrocardiogramas de galgos, des-
pués de una competencia  Población Estadística.
La unidad de observación es un electrocardiograma de un galgo.
La clasificación de la variable de interés es cuantitativa continua.
La unidad de medida utilizada en esta variable es mm.

b) Tabla de frecuencias:

[ ; ) x'i fi Fi hi Hi
17,0 - 20,4 18,7 2 2 0,10 0,10
20,4 - 23,8 22,1 7 9 0,35 0,45
23,8 - 27,2 25,5 5 14 0,25 0,70
27,2 - 30,6 28,9 4 18 0,20 0,90
30,6 - 34,0 32,3 2 20 0,10 1,00
35
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

TOTAL 20 1,00 x'i = marca de clase (punto medio del inter-


valo)
fi = frecuencia absoluta simple
Fi = frecuencia absoluta acumulada
hi = frecuencia relativa simple
Hi = frecuencia relativa acumulada
[ ; )= intervalo de clase

Ejercitemos la interpretación de los datos que aparecen en la tabla:


Tomemos por ejemplo la información del intervalo de clase que aparece en la cuarta fila: [27,2 – 30,6).
¿Cómo interpretamos “[27,2 – 30,6)”? El intervalo es cerrado en 27,2 y abierto en 30,6, por lo que la altura de
complejo QRS de los electrocardiogramas realizados luego de la competencia de los galgos de la muestra,
está comprendida entre 27,2 mm (inclusive) y 30,6 mm (sin incluir).
Como F4 = 18, podemos decir que 18 electrocardiogramas de galgos, luego de una competencia,

tienen una altura de complejo QRS menor a 30,6 mm.


Como h4 = 0,20, decimos que el 20% de los electrocardiogramas de los galgos muestreados, luego
de una competencia, tiene una altura de complejo QRS comprendida entre 27,2 mm (inclusive) y 30,6 mm
(sin incluir).
f4 = 4, indica que se encontraron 4 galgos, cuyos electrocardiogramas realizados luego de una
competencia muestran una altura del complejo QRS comprendida entre 27,2 mm (inclusive) y 30,6 mm (sin
incluir).
H4 = 0,90, indica que el 90% de los galgos muestreados, luego de la competencia, muestran una
altura en el complejo QRS de hasta 30,6 mm.

Los dos gráficos representan las frecuencias simples (absolutas y relativas), se denominan HIS-
TOGRAMAS y también tienen representado un polígono, llamado POLÍGONO DE FRECUENCIAS, que
pasa por los puntos cuyas abscisas son los puntos medios de los intervalos de clase, o las marcas de
clase, y cuyas ordenadas son las frecuencias correspondientes a dicho intervalo. Se cierra el polígono
uniendo con las marcas de clase de dos intervalos ficticios, uno anterior al 1er. intervalo, y otro posterior al
último intervalo. Ambos gráficos representan la densidad de los valores observados de la variable en esta
muestra, ya que la superficie encerrada dentro del histograma es equivalente a la superficie delimitada por
el polígono de frecuencias. La distribución de la variable en esta muestra presenta una leve asimetría po-
sitiva (cola a derecha).

36

-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

En este caso, se representan las frecuencias acumuladas, absolutas y relativas.


Se denomina HISTOGRAMA (pero para frecuencias acumuladas), y se representa una poligonal, llamada
OJIVA, que marca la acumulación a lo largo del intervalo, uniendo la frecuencia acumulada obtenida en el
límite inferior de cada intervalo con la obtenida en el límite superior del mismo.

c) Medidas de centralidad:

NOTA: Observar que se trata de variables continuas agrupadas en intervalos, por lo tanto, la media y la varianza se calculan
utilizando las marcas de clase.

MEDIA ARITMETICA
Σx'i fi 499,8
x̄ = = = 24,99 mm
n 20
MEDIANA
n + 1 21
Pos Me= = =10,5 ⇒Int Me [23,8 ; 27,2)
2 2

PosMe - F(i-1)
Me= Li + c · [ ]
fi

Donde: c : amplitud del intervalo


Li: límite inferior del intervalo mediana
fi: frecuencia absoluta simple del intervalo mediana
Fi-1: frecuencia absoluta acumulada del intervalo anterior

10,5 - 9 1,5
Me= 23,8+ 3,4 · [ ] = 23,8 + 3,4∙ [ ] = 23,8 + 3,4∙0,3= 23,8 + 1,02= 24,82mm
5 5

Es importante diferenciar POSICIÓN DE MEDIANA y cálculo de la MEDIANA en sí. La primera sólo nos
aporta la ubicación del Intervalo Mediana, es un valor en el rango de las frecuencias absolutas acumuladas,
y la segunda es el valor numérico de la Mediana, es un valor en el rango de la variable.

MODO
Intervalo modal: Intervalo con mayor frecuencia relativa simple ⇒ Int. Mo: [ 20,4 ; 23,8)

∆𝟏
Mo= Li + c · [ ]
∆𝟏 + ∆𝟐
Donde

1  f (Max)  f (ant)
2  f (Max)  f (post)
Li: Límite inferior del intervalo Modal.
c: Amplitud del intervalo Modal.
f(post): Frecuencia absoluta del intervalo posterior al intervalo Modal.
37
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

f(ant): Frecuencia absoluta del intervalo anterior al intervalo Modal.


f(Max): Frecuencia absoluta del intervalo Modal.

5 5
Mo= 20,4+ 3,4 · [ ] = 20,4 + 3,4∙ [ ] = 20,4 + 2,429= 22,829mm
5+2 7

Volvamos a analizar la distribución de la variable en esta muestra utilizando las medidas de posición:
Me= 24,82 mm, Mo = 22,829 mm, x = 24,99 mm. Al ser Mo < Me < x , podemos decir que la distribución
tiene ASIMETRÍA POSITIVA.

Medidas de dispersión:

VARIANZA
2 1 (Σx'i fi )2 1 (499,8)2 1
Sx = [Σx'2i fi - ] = [12796,92- ] = ∙306,918= 16,15mm2
n-1 n 19 20 19

DESVÍO ESTÁNDAR
2
SX = √SX = √16,15mm2 = 4,018mm

COEFICIENTE DE VARIACIÓN

S 4,108
C.V.= .100 = .100 = 16,08%
X̄ 24,99

d) BOX PLOT
El boxplot o diagrama de caja lo utilizaremos para analizar la distribución de la variable en esta muestra.

En la caja, la Mediana (la línea horizontal que subdivide la caja) se


ubica casi en el centro, y el tamaño de los bigotes es distinto, siendo
mayor el bigote superior.

En este caso podemos decir que la distribución es levemente ASIMÉ-


TRICA POSITIVA.

Además, el valor de la media aritmética (señalado en el gráfico con el


puntito) es levemente superior al valor de la mediana; lo que confirma
la asimetría positiva.
X > Me > Mo

En este cuadro presentamos las medidas resumen obtenidas, a partir de los datos de la muestra, apli-
cando el programa estadístico InfoStat®.

Estadística descriptiva
Variable n Media D.E. Var(n-1) CV Mín Máx Mediana
Altura 20 24,99 4,02 16,15 16,08 17,00 33,80 24,82

EJERCICIO 3) Para realizar un determinado experimento se ha medido la anchura interorbital, en mm, de


una muestra de 40 palomas, obteniéndose los siguientes datos:

[ ; ) fi
10,0 – 10,5 3
10,5 – 11,0 4
11,0 – 11,5 14
11,5 – 12,0 10
38

-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

a) Dada la distribución, completar la tabla con todas las frecuencias. 12,0 – 12,5 5
¿Qué frecuencia usaría si necesita valores relativos al tamaño de 12,5 – 13,0 3
muestra? 13,0 – 13,5 1
b) Grafique el histograma y el polígono de frecuencias.
c) Calcule la mediana, la moda, y el coeficiente de variación.
d) ¿Qué puede decir con respecto a la simetría de esta muestra?
e) ¿Cuál es la probabilidad de seleccionar una paloma al azar de este conjunto de palomas, y que su
anchura interorbital mida entre 10 y 10,5 mm?
f) Sabiendo que hemos seleccionado de este conjunto una paloma al azar cuya anchura interorbital
es menor a 11,5 ¿cuál es la probabilidad de que se encuentre entre 10 y 10,5 mm?
g) Sabiendo que hemos seleccionado de este conjunto una paloma al azar cuya anchura interorbital
es menor a 11,5 ¿cuál es la probabilidad de que se encuentre entre 13 y 13,5 mm?

SOLUCIÓN
a)

[ ; ) x’i fi Fi hi Hi x’i* fi x’i2 * fi


10,0 – 10,5 10,25 3 3 3/40 3/40 30,75 315,1875
10,5 – 11,0 10,75 4 7 4/40 7/40 43 462,25
11,0 – 11,5 11,25 14 21 14/40 21/40 157,5 1771,875
11,5 – 12,0 11,75 10 31 10/40 31/40 117,5 1380,625
12,0 – 12,5 12,25 5 36 5/40 36/40 61,25 750,3125
12,5 – 13,0 12,75 3 39 3/40 39/40 38,25 487,6875
13,0 – 13,5 13,25 1 40 1/40 40/40 13,25 175,5625
40 40/40 461,50 5343,5

Si necesitáramos valores relativos al tamaño de muestra, podríamos trabajar tanto con hi como con Hi

b)

c) MEDIANA:
n+1 41
Pos Me= = =20,5 ⇒ Int. Mediana:11,0 ; 11,5)
2 2

Pos Me-Fi-1 20,5-7


Me=Li +c· ( ) =11,0+0,5· ( ) =11,4821mm
fi 14
39
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

MODO: La mayor frecuencia absoluta simple es f 4 = 14, por lo que el intervalo modal es [11,0 ; 11,5), por
lo que
∆1 10
Mo= Li + c · [ ] = 11,0 + 0,5 · [ ] = 11,0 + 0,357= 11,357mm
∆1 +∆2 10 + 4

COEFICIENTE DE VARIACIÓN:
SX 0,6969
CV% = ·100= ·100≅6,04%
X̄ 11,53

d) Como: Mediana = 11,4821 mm ; Modo = 11,357 mm ; X ̅ = 11,53 mm, si ordenamos numéricamente los
resultados tenemos que Media > Mediana > Moda, lo que nos indicaría que es levemente asimétrica posi-
tiva.
Los valores son muy cercanos entre sí, por lo que veremos que sucede con el boxplot:

En el grafico observamos que:


 La mediana se encuentra en el centro de la caja
 Los bigotes superior e inferior tienen el mismo largo

Entonces, podemos decir que la distribución es levemente


simétrica.

3
e) p(10<x<10,5)= =0,075
40
f) p( 10<x<10,5⁄x<11,5 )= =0,1428
3
21

i) p( 13<x<13,5⁄x<11,5 ) = 0 / 21 = 0

EJERCICIO 4) Se quiere estudiar la eficacia de un nuevo insecticida para plantas de interior. Se seleccio-
nan 50 plantas y se cuenta el número de hojas que han sido atacadas por la plaga, después de haber
tratado la planta con el nuevo producto. Los resultados son:

N° de hojas atacadas fi
0 6
1 10
2 12
3 8
4 5
5 4
6 3
8 1

40

-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

10 1

a) Definir la variable en estudio y clasificarla.


b) ¿Cuál es la población en estudio? ¿Y la muestra observada?
c) Encontrar todas las medidas de tendencia central que correspondan.
d) Encontrar todas las medidas de variabilidad que correspondan.
e) ¿Qué porcentaje de plantas observadas fueron atacadas? ¿Qué porcentaje de plantas observadas
tienen a lo sumo 1 sola hoja atacada? ¿qué porcentaje de plantas observadas tienen más de 5 hojas
atacadas?
f) Complete la tabla encontrando las frecuencias relativas y las frecuencias acumuladas (absolutas y re-
lativas).
g) Calcule el percentil 15 e interprete en función del problema. ¿Cuál es la cantidad de hojas atacadas
que supera el 33% de las plantas?
h) Interprete, respecto al problema planteado, los valores de: f3 ; F6 ; h1 ; H4
i) La empresa que comercializa el nuevo insecticida dice que, el número de hojas atacadas por planta
cuando se aplica este insecticida sigue la siguiente distribución de probabilidad:

N° de hojas atacadas p(x)


0 0,12
1 0,20
2 0,25
3 0,15
4 0,10
5 0,08
6 0,06
8 0,03
10 0,01
i.i) Encontrar la esperanza, varianza y desvío estándar de la variable definida.
i.ii) ¿Cuál es la probabilidad de que una planta que ha sido tratada con el nuevo fertilizante tenga por
lo menos 3 hojas atacadas, según la información de la empresa que comercializa el nuevo fertilizante?

SOLUCIÓN
a) Definir la variable en estudio y clasificarla.
X: “número de hojas atacadas por la plaga en una planta tratada con el nuevo insecticida”
Variable cuantitativa discreta
b) ¿Cuál es la población en estudio? ¿Y la muestra observada?
Población: plantas de interior
Muestra: las 50 plantas de interior seleccionadas
c) Encontrar todas las medidas de tendencia central que correspondan.
d) Encontrar todas las medidas de variabilidad que correspondan.
Moda 2 hojas atacadas
Mediana 2 hojas atacadas
Media 2,68 hojas atacadas
Rango 10
Desviación estándar 2,133 hojas atacadas

41
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

Varianza de la muestra 4,549 (hojas atacadas)2


Mínimo 0
Máximo 10
Coeficiente de variación 0,796 o 79,6%
e) ¿Qué porcentaje de plantas observadas fueron atacadas? ¿Qué porcentaje de plantas observadas
tienen a lo sumo 1 sola hoja atacada? ¿qué porcentaje de plantas observadas tienen más de 5 hojas
atacadas?
A partir de la tabla de frecuencia obtenemos los porcentajes pedidos:
 De las 50 plantas observadas, 6 no han sido atacadas, por lo tanto han sido atacadas 50-6=44
plantas. Entonces el porcentaje de plantas de la muestra que han sido atacadas es:
44
∙100=0,88∙100= 88%
50
 De las 50 plantas observadas, la cantidad de plantas que tienen a lo sumo una hoja atacada es
6+10=16. Entonces el porcentaje de plantas de la muestra que tienen a lo sumo una hoja atacada es:
16
∙100=0,32∙100=32%
50
 De las 50 plantas observadas, la cantidad de plantas que tienen más de 5 hojas atacadas es
3+1+1=5. Entonces el porcentaje de plantas de la muestra que tienen más de 5 hojas atacadas es:
5
∙100=0,1∙100=10%
50
Nota: Relacione estos resultados con los que obtendrá a continuación, luego de responder el ítem f)

f) Complete la tabla encontrando las frecuencias relativas y las frecuencias acumuladas (absolutas y re-
lativas).
N° de hojas atacadas fi hi Fi Hi
0 6 0,12 6 0,12
1 10 0,2 16 0,32
2 12 0,24 28 0,56
3 8 0,16 36 0,72
4 5 0,1 41 0,82
5 4 0,08 45 0,9
6 3 0,06 48 0,96
8 1 0,02 49 0,98
10 1 0,02 50 1

g) Calcule el percentil 15 e interprete en función del problema. ¿Cuál es la cantidad de hojas atacadas
que supera el 33% de las plantas?
Para calcular el percentil 15 primero hay que encontrar su posición:
Pos P15 = (n+1)·0,15 = 51·0,15=7,65
A continuación se busca la frecuencia acumulada que contiene a este valor, en nuestro caso F2=16 por lo
tanto, el percentil 15 es igual a 1 hoja atacada, esto significa que el 15% de la las plantas de interiores
tratadas con el nuevo producto tienen a lo sumo una hoja atacada.

Para saber la cantidad de hojas atacadas superadas por el 33% de las plantas, hay que calcular el percentil
67:
Pos P67= 51· 0,67 = 34.17 → P67 = 3 hojas atacadas.
Podríamos decir entonces, que el 33% de las plantas de interior tratadas con el nuevo producto, tiene más
de 3 hojas atacadas por la plaga

h) Interprete, respecto al problema planteado, los valores de: f3 ; F6 ; h1 ; H4


f3=12 12 plantas de interiores tratadas con el nuevo insecticida tienen 2 hojas atacadas.
F6=45 45 plantas de interiores tratadas con el nuevo insecticida tienen a lo sumo 5 hojas atacadas.
h1=0,12 de las 50 plantas observadas tratadas con el nuevo insecticida, la proporción de plantas que
no tienen ninguna hoja atacada por la plaga es 0,12. O también se puede decir que el 12% de las
plantas observadas de la muestra no tienen ninguna hoja atacada por la plaga.

42

-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

H4=0,72 de las 50 plantas observadas tratadas con el nuevo insecticida, la proporción de plantas que
tienen a lo sumo 3 hojas atacadas es 0,72. También podemos decir que, el 72% de las plantas obser-
vadas de la muestra fueron atacadas a lo sumo en 3 hojas.

i) La empresa que comercializa el nuevo insecticida dice que, el número de hojas atacadas por planta
cuando se aplica este insecticida, sigue la siguiente distribución de probabilidad:

N° de hojas atacadas 0 1 2 3 4 5 6 8 10
p(x) 0,12 0,2 0,25 0,15 0,1 0,08 0,06 0,03 0,01
i.i) Encontrar la esperanza, varianza y desvío estándar de la variable definida.

E(X)= 0·0,12 + 1·0,2 + 2·0,25 + 3·0,15 + 4·0,1 + 5·0,08 + 6·0,06 + 8·0,03 + 10·0,01=
= 0 + 0,2 + 0,5 + 0,45 + 0,4 + 0,4 + 0,36 + 0,24 + 0,1 = 2,65 hojas atacadas

Var(X) = E(X2) –[E(X)]2


E(X2)= 02·0,12 + 12·0,2 + 22·0,25 + 32·0,15 + 42·0,1 + 52·0,08 + 62·0,06 + 82·0,03 + 102·0,01=
= 0 + 0,2 + 1 + 1,35 + 1,6 + 2 + 2,16 + 1,92 + 1 = 11,23
Var(X) = E(X2) –[E(X)]2 = 11,23 – 2,652 = 11,23 – 7,02225 = 4,20 (hojas atacadas)2
hojas atacadas
Desvío(X)= √Var(X)=√4,2075=2,0512
i.ii) ¿Cuál es la probabilidad de que una planta que ha sido tratada con el nuevo fertilizante tenga por
lo menos 3 hojas atacadas, según la información de la empresa que comercializa el nuevo fertilizante?
P( X ≥ 3) = 1- P(X<3) = 1- H3 = 1- 0,57 = 0.43

EJERCICIO 5) Asuma que el aumento de peso los cobayos alimentados con un determinado balanceado,
se distribuye normal con media igual a 105 g y desvío estándar igual a 10,5 g.
a) ¿Con qué probabilidad un cobayo tomado al azar tendrá un aumento de peso de al menos 104 g?
b) ¿Qué valor de aumento de peso no será superado por el 95% de los cobayos?
Si se extrae de esta población de cobayos una muestra aleatoria de tamaño 16:
c) ¿Cuál es la probabilidad de que los cobayos de esta muestra tengan un aumento de peso promedio
inferior a 106 g?

d)¿Qué valor del aumento medio de peso no será superado por el 95% de los cobayos en muestras de
este tamaño?

En este tipo de ejercicios, generalmente nos dan información de una variable (aumento de peso, en g, de
un cobayo, X ) y nos piden resolver cálculos de probabilidad para esa variable, o para la variable promedio
(aumento de peso medio o promedio (en g) de 16 cobayos, X16 ). Las distribuciones de estas dos variables
aleatorias son: X ~N 105;110,25 X16 ~N 105;6,89062

En los gráficos siguientes se representa sendas muestras aleatorias de tamaño 10.000 cada una, a la
izquierda la distribución del aumento de peso en un cobayo, y a la derecha la de aumento de peso medio
o promedio de 16 cobayos.

43
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

PESO PESO MEDIO


La distribución de la media muestral tiene una varianza menor que la de la variable original, lo que se ve
reflejado claramente en los gráficos anteriores, aunque coinciden en la media. Entonces, es importante
elegir correctamente la distribución sobre la cual se realizarán los cálculos de probabilidades. Si la pregunta
se refiere a un individuo, el cálculo de probabilidad se realizará con la distribución de la variable
𝑥~𝑁(105; 110,25); en cambio, si la misma se refiere al promedio, entonces se empleará la distribución
del promedio de la muestra, en este caso X16 ~N 105;6,890625 donde el 6,890625 proviene de
σ2x 110,25
σ2x̅ = = .
n 16

SOLUCIÓN
a) En este caso estamos calculando la probabilidad de que un cobayo pese 104 g o más (al menos 104 g),
nos interesa la distribución de X . Entonces se procede:
104-105
P(X≥104)=P (Z≥ ) =P(Z≥-0,095)=1-P(Z<-0,095)
10,5

Entonces, buscamos en la tabla de la distribución normal estándar aproximando –0,095 a –0,1 y obtenemos:
P(X≥104)≅1-P(Z<-0,10)≅1-0,4602≅0,5398

Un cobayo de la muestra tendrá un aumento de peso de al menos 104 g con una probabilidad de 0,54.

b) En este caso nos preguntan sobre el aumento de peso medio (o promedio) de los cobayos de una muestra
de tamaño 16, entonces se debe usar la distribución de X16 .
106 - 105
P(X̄ 16 <106)=P (Z< ) =P(Z<0,38)=0,6480
10,5

√16

La probabilidad de que el promedio de los individuos de una muestra de tamaño 16 sea menor que 106 g es
igual a 0,65.

c) Se quiere saber qué valor no será superado, con una probabilidad 0,95, por un cobayo tomado al azar. En
este caso interesa la distribución X , entonces, por un lado sabemos que:
xi -105
P(X≤xi )=0,95 → P (Z≤ ) =0,95
10,5
Por el otro, en la distribución normal estándar P(Z ≤ z0,95 )=0,95, sabemos que z0,95= 1,64; entonces igualando

z0,95 con
xi -105
10,5
, y despejando xi de dicha igualdad, 1,64=
xi -105
10,5
, se obtiene el valor de xi .
xi =105+1,64⋅10,5=122,22g.

El valor del aumento de peso que no será superado por el 95% de los cobayos, es 122,2 g.
44

-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

d) Esta pregunta, aunque similar a la anterior, se refiere al valor de aumento de peso medio de una muestra
de tamaño 16, entonces, empleamos la distribución de X16 .
xi -105
P(X̄ 16 ≤xi )=0,95→P (Z ≤ ) = 0,95
10,5

√16
x -105
i
Al igual que antes, igualando z0,95 con 10,5 , y despejando xi se obtiene la solución:

√16

xi =105+1,64⋅2,625=109,305g.

El valor del aumento medio de peso que no será superado por el 95% de los cobayos en muestras de
tamaño 16 es 109,3 g.

Nota: la solución en d) está más cerca de la media de su distribución que la solución en b) de la suya, aunque ambas
soluciones representen desde el punto de vista probabilístico lo mismo.

45
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

PROBLEMAS PROPUESTOS
EJERCICIO 1) Clasificar las siguientes variables en CUALITATIVAS (NOMINALES u ORDINALES) o
CUANTITATIVAS (DISCRETAS o CONTINUAS) y nombrar de cada una la unidad de observación
a) Peso, en g, de pelo esquilado a un conejo de Angora.
b) Cantidad de lámparas de 40 W fabricadas en un día de trabajo.
c) Valor calórico de la grasa de la leche de una vaca.
d) Tiempo de incubación del sarampión en una persona, en días.
e) Color de ojos de un niño de 10 años nacido en la Provincia de Córdoba.
f) Color de pelaje en un equino.
g) Número de insectos de Trifolium repens, encontrados por parcela.
h) Cantidad de caninos de raza Bóxer con linfosarcoma multicéntrico por distrito, en la Provincia de
Buenos Aires.
i) Efecto de una droga en un canino.
j) Número de cachorros nacidos por camada.
k) Número de llamados telefónicos que recibe una central telefónica por mes.
l) Alzada de un caballo del haras "La Biznaga".
m) Color de una rosa.
n) Circunferencia torácica de un lechón recién parido, expresado en cm.
o) Cantidad de tornillos producidos en ocho horas de trabajo.
p) Volumen de nafta despachada por una compañía petrolera en una semana.
q) Nivel educacional alcanzado por un individuo.
r) Número de errores cometidos por un estudiante en un examen de elección múltiple.
s) Distancia recorrida por un neumático de un vehículo, hasta el primer pinchazo.
t) Nacionalidad de un individuo.
u) Rendimiento de maíz en un campo determinado en la Provincia de Buenos Aires.
v) Número de niños nacidos en un hospital el primer día del año.

EJERCICIO 2) En veintiséis tambos se registró, en el año 1988, la cantidad de partos distócicos en la raza
Holando Argentino, obteniéndose los siguientes datos:
4 3 5 7 4 2 1 0 6 3 5 6 3
0 3 1 2 1 3 6 0 4 3 2 1 2

a) Ordenar los datos en una tabla de frecuencias.


I. ¿Cuál es la unidad de observación?
II. Interpretar el par (x5 ; f5)
III. Interpretar el par (x3 ; H3)
b)
i) Construir los gráficos para frecuencias absolutas simples y
acumuladas. ¿Es simétrica la distribución de la variable en
esta muestra?
ii) Analizar el gráfico de caja (Box Plot)
c) Calcular media aritmética, mediana y modo. Compare los re-
sultados obtenidos con la asimetría propuesta en b)
d) Calcular el percentil 24 e interpretar en términos del problema.
e) Calcular varianza, desviación estándar y coeficiente de variación.

EJERCICIO 3) Los siguientes datos corresponden a la medición en sangre de GPT (glutámico pirúvico
transaminasa, enzima que demuestra toxicidad hepática) en felinos sometidos a una dosis tóxica mínima
de un nuevo antiparasitario externo:

[ ; ) 16,3-21,5 21,5-26,7 26,7-31,9 31,9-37,1 37,1-42,3


fi 1 5 5 9 5

Utilizando la información dada en la tabla:


a) Interpretar H2 , F4 , y h3.
b) ¿Cuál es la unidad de observación?
46

-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

c) Representar gráficamente. ¿Cómo clasifica la distribución de la variable?


d) Calcular media aritmética, modo y mediana.
e) Calcular varianza, desvío estándar y C.V.

EJERCICIO 4) En un estudio de precios de un grupo de alimentos se obtiene la media aritmética y desvia-


ción estándar para cada uno de ellos, expresados en unidad monetaria por kilogramo de producto.

Alimento Media A. Desvío


Manteca 80 7
Arroz 110 15
Lechuga 50 6
Zanahoria 30 6
Chaucha 350 50
a) Entre todos los alimentos considerados, ¿a cuál le corresponde la mayor variación relativa? ¿Y la
menor variación absoluta?
b) Entre los vegetales considerados, ¿cuál presenta la menor variación relativa? ¿y la mayor variación
absoluta?

EJERCICIO 5) A continuación se presenta la media aritmé- Materias Media A. C. V.%


tica y el coeficiente de variación de las calificaciones obteni-
das por 50 alumnos: Salud Pública 6,5 31
Estadística 5,8 29
a) ¿Qué materia presenta la mayor variación relativa? ¿Cuál
la menor? Anatomía 4,2 74
b) ¿Qué materia presenta la mayor variación absoluta?
Histología 5,3 68

EJERCICIO 6) Luego de aplicar a un grupo de animales


un tratamiento con insulina se midió la glucemia (en mg
%) a cada uno obteniéndose:

a) Indicar cuál es la variable.


b) ¿Cuál es la unidad de observación?
c) ¿Cuál es el tamaño de la muestra?
d) Calcular la media aritmética, la desviación estándar
e) Opinar sobre la distribución de la muestra en términos
del problema.

EJERCICIO 7) Los siguientes datos corresponden a los diámetros cardíacos, en mm, medidos en radio-
grafías de tórax de 100 adultos normales:
Intervalos frecuencias
a) Definir la variable y clasificarla.
80,5 - 90,5 8
b) La población en estudio es ..................................................
c) La unidad de observación es ............................................... 90,5 - 100,5 15
d) Completar la tabla de distribución de frecuencias y realizar los grá- 100,5 - 110,5 21
ficos correspondientes a las fi y Hi. 110,5 - 120,5 23
e) Interpretar f2 , F5 , h4 y H6 120,5 - 130,5 16
f) Calcular la media y la varianza. 130,5 - 140,5 9
g) Determinar los intervalos mediana y modal, y calcular las medidas 140,5 - 150,5 8
correspondientes a cada uno.
h) Comparando los valores de las medidas de posición, ¿podemos concluir que la distribución es simé-
trica?

47
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

EJERCICIO 8) Se evaluaron 4 dosis de Nitrógeno, N, (0, 30, 60 y 90 kg/ha) en parcelas de trigo, en las
que se midió el rendimiento obtenido expresado en kg/ha. A continuación, se presentan los diagramas de
caja correspondientes a cada tratamiento.

a) Para el tratamiento testigo (0 kg N) indique aproximadamente los valores de rendimiento medio y


percentiles 25 %y 75%.
b) ¿En qué tratamiento resultó mayor la variabilidad? Justifique.
c) ¿Puede decir qué dosis de N fue la que arrojó el mayor rendimiento promedio? Justifique.
d) A partir de la comparación de los valores de media y mediana ¿cuál/es de los tratamientos presen-
tan asimetría positiva?

EJERCICIO 9) Para estudiar las palabras usuales, usted necesita una muestra de las páginas tomadas de
un libro dado. Diseñe brevemente un procedimiento de muestreo que pudiera usar. ¿Qué haría usted con
las páginas que tienen grabados sobre ellas o con aquellas que están llenas sólo parcialmente?

EJERCICIO 10) En un estudio sobre parasitismo un grupo de investigadores registra la cantidad de huevos
por nido parasitados en 1700 nidos. Los datos se registran en la siguiente tabla:

N° de huevos N° nidos con x n°


parasitados por nido de huevos parasitados
11 52
12 820
13 572
14 215
15 41

a) Definir la variable en estudio y clasificarla.


b) Calcular media, varianza, modo y cuartiles.
c) Interpretar f4 y H4
d) Realice los gráficos correspondientes
e) ¿Cuál es el número de huevos parasitados por nidos alcanzado por el 66 % de la muestra?
f) ¿Cuál es la probabilidad de seleccionar un nido al azar y que este tenga al menos 13 huevos
parasitados?
g) ¿Cuál es la probabilidad de seleccionar dos nidos al azar y que el primero tenga 13 huevos para-
sitados y el segundo 15?
h) Sabiendo que seleccionamos un nido que se encuentra dentro de los dos primeros cuartiles, ¿cuál
es la probabilidad de que tenga 11 huevos parasitados?

48

-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

EJERCICIO 11) Se conocen los pesos al destete (X) de 15 lechones (en Kg) de cada una de dos granjas
diferentes (granja A y granja B).

Peso al destete de la granja


7,5 6,4 7,1 2,9 4,6 9,4 7,5 6,8 3,9 4,1 4,6 5,2 6,8 5,2 6,4
A(Xa)
Peso al destete de la granja
5,1 3,9 4,3 7,03 4,6 5,7 6,4 4,9 3,8 5,9 6,2 3,8 5,7 4,7 5,3
B(Xb)

a) Definir las variables en estudio y clasificarlas.


b) ¿Cuál es/son la/s poblaciones en estudio? ¿Y la/las muestras observadas?

Con InfoStat® armamos los siguientes histogramas:

Y obtuvimos los siguientes resultados resumen


Estadística descriptiva
Variable n Media D.E. Var(n-1) CV Mín Máx Mediana Q1 Q3
Xa 15 5,89 1,72 2,97 29,22 2,9 9,4 6,4 4,6 7,1
Xb 15 5,16 1 1 19,37 3,8 7,03 5,1 4,3 5,9
c) Indicar, con sus correspondientes unidades, todas las medidas de tendencia central que correspondan
para ambas muestras.
d) Indicar, con sus correspondientes unidades, todas las medidas de variabilidad que correspondan para
ambas muestras.
e) Comparar las dos muestras usando los resultados de c) y d).
f) ¿Qué porcentaje de lechones en la muestra de la granja A tiene un peso al destete superior a 6 Kg?
¿Y de la Granja B? ¿Y si juntamos ambas muestras, qué porcentaje de lechones tienen un peso al
destete superior a 6 Kg?
g) Si se tiene el dato de que el peso al destete de un lechón de la granja A sigue una distribución normal
con media 5,5 Kg y varianza 2,25 Kg2. ¿Cuál es la probabilidad de que un lechón de la granja A tenga
al destete un peso superior a los 6 Kg?
h) Se tiene el dato de que la probabilidad de que un lechón de la granja B tenga un peso mayor a 5,5 Kg
es 0,4. Si se toman 8 lechones al azar de la granja B, ¿cuál es la probabilidad de que todos tengan un
peso mayor a 5,5 Kg? ¿Y la probabilidad de que más de la mitad tenga un peso mayor a 5,5 Kg?

EJERCICIO 12) Se realizó un experimento con lechones híbridos, criados en sistema extensivo ( al aire
libre en piso de tierra) en la provincia de Buenos Aires, para analizar la ganancia diaria de peso, en gramos.
El objetivo final de este experimento es poder comparar esta variable con la correspondiente a lechones
criados en sistema intensivo ( en piso de concreto). De los primeros se obtuvieron los siguientes resultados:
xi [0;50) [50;100) [100;150) [150;200) [200;250]
Fi 1 4 9 15 16

a) Definir y clasificar la variable de interés.


b) Interpretar h3 y F4

49
-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

c) Calcular el modo, la mediana y la media. ¿Se puede decir que la distribución es simétrica?
d) ¿Cuál es el aumento de peso no alcanzado por el 25% de los lechones?
e) Si se espera que dicha ganancia de peso aumente en un 15%, ¿cómo se vería afectada la me-
diana? ¿Y la varianza? Justifique utilizando propiedades.
f) Si se supone que la variable se distribuye normalmente, con media 180 g y desvío estándar 15 g,
¿cuál es la probabilidad que la ganancia de peso medio de los lechones supere los 182 g en una
muestra de 40?

EJERCICIO 13) La distribución del tiempo de respuesta obtenido en la aplicación de prostaglandinas a hem-
bras caninas preñadas entre 35 y 55 días es normal con media 60 horas y con desvío de 15 horas.
a) Definir la variable en estudio
b) Detallar su distribución
c) 1)¿Cuál es la probabilidad de obtener la reacción luego de 50 horas?
2)¿Cuál es la probabilidad de obtener la reacción antes de 30 horas?
3)¿Cuál es la probabilidad de obtener la reacción entre 30 y 60 horas?
4)¿Cuál es la probabilidad de obtener la reacción luego de 90 horas?
5)¿A partir de qué tiempo la probabilidad de obtener reacción es del 30%?
d)Si se toma una muestra de 16 hembras preñadas, ¿cuál es la probabilidad de que, en promedio, tengan
la reacción:
1)luego de 50 horas?
2)antes de 30 horas?
3)entre 30 y 60 horas?
4)luego de 90 horas?
5)¿A partir de qué tiempo medio la probabilidad de obtener reacción es del 30%?

EJERCICIO 14) La altura de las plantas de una población de Trébol Rojo a las 5 semanas de ser plantadas
se distribuye normalmente con media 3,2 cm y desvío estándar 1,8 cm.
a) ¿Cuál es la probabilidad de que una de dichas plantas a las 5 semanas mida más de 3,5cm?
b) ¿Qué altura es alcanzada por el 20% de las plantas?
c) Si se toma una muestra de 3 plantas, ¿cuál es la probabilidad de que las tres tengan altura superior
a 3,5cm?
d) Si se toma una muestra de 20 plantas:
i. ¿Cuál es la probabilidad de que la media sea superior a 3,3cm?
ii. El resultado de la probabilidad calculada en el punto anterior, ¿es exacto o aproximado?
e) Si se toman muestras de 50, ¿qué altura media es superada por el 15% de las muestras?

50

-DESCRIPTIVA-
Guía de Trabajos Prácticos
2023 · Bioestadística

ESTIMACIÓN - TEOREMA CENTRAL DEL LÍMITE


* OBJETIVOS ESPECÍFICOS
 Conocer las características deseables de los estimadores puntuales.
 Aplicar conceptos de inferencia estadística en el contexto de los fenómenos biológicos.
* CONTENIDOS TEMÁTICOS
 Propiedades de los estimadores
 Muestra aleatoria. Muestreo aleatorio simple. Unidad de muestreo. Tamaño de muestra.
 Estimadores usuales para la media, para la varianza y la proporción.
 Distribuciones de X , S2 y p̂ .

* GLOSARIO
Teorema Central del Límite (TCL). Muestra aleatoria. Unidad de muestreo. Tamaño de muestra. Estimador
puntual.

PROBLEMAS RESUELTOS
EJERCICIO 1) Se está investigando el efecto de una droga para reducir el nivel promedio de glucosa en sangre
(glucemia, en mg/ml), en una línea de ratas diabéticas. Para ello se tomó una muestra de 40 ratas y se trató
con la droga, con la suposición de que la probabilidad de que el promedio sea a lo sumo 2 mg/ml (valor
promedio de la glucemia en ratas sin tratar) sea alta (por ejemplo, mayor a 0,8).
Se desconoce la distribución del nivel de glucemia para las ratas tratadas con la droga, pero se sabe que tiene
media 1,7 mg/ml y desvío 0,8 mg/ml. ¿Se cumple la suposición de los investigadores?

SOLUCIÓN
Tenemos:
X: “glucemia de una rata diabética tratada con la droga, medida en mg/ml.” (Con distribución desconocida,
siendo =1,7 mg/ml y  = 0,8 mg/ml).

X : “glucemia media de una muestra de ratas diabéticas tratadas con la droga, medida en mg/ml.”
Nos interesa calcular:

X̄ - μ 2 - 1,7 0,3
P(X̄ ≤2)≅ P (Z ≤ σ ) ≅ P (Z ≤ ) ≅ P (Z ≤ ) ≅ P(Z≤2,31)≅0,98956
⁄ n 0,8 0,13
√ ⁄
√40
Como la probabilidad obtenida es 0,98956, o sea una probabilidad alta, se cumpliría con la suposición de los
investigadores.

EJERCICIO 2) El peso, en gramos, de pollitos blancos de raza Leghorn es una variable aleatoria con función
de probabilidad dada por:
1
   s 
iX2
80
;3
80
fX 
10
0
  

0 siX 2
80
;38
0

0 s
i X2
80

1 280

La función de distribución es: FX x si28
0X38
0
1
0
0 1
00

1
 siX38
0

50
-TEOREMA CENTRAL DEL LÍMITE-
Guía de Trabajos Prácticos
2023 · Bioestadística

a) Se elige un pollito al azar de la población total en estudio. Calcular la probabilidad de que su peso
sea mayor que 330 g.
b) Se eligen al azar 10 pollitos en forma independiente. Calcular la probabilidad de elegir exactamente
6 pollitos cuyo peso sea mayor que 330 g. ¿Y cuál es la probabilidad de que haya menos de 6?
c) Sabiendo que la media de los pesos de los pollitos blancos de raza Leghorn es 330 g y la varianza
de los pesos es 833,33 g2, y se eligen al azar en forma independiente 36 pollitos, calcular la pro-
babilidad de que el peso promedio sea mayor a 330 g. Justificar el cálculo hecho.

SOLUCIÓN
1 280
a) P(X>330)=P(X≥330)=1-F(330)=1- [ ∙330 - ] = 1 - 0,5= 0,5
100 100
La primera igualdad se debe a que la variable es continua.
b) Al elegir 10 pollitos en forma independiente, y considerar como variable Y: “cantidad de pollitos blancos
de raza Leghorn con peso superior a 330g, en 10 pollitos”, se analiza si cumple con los requisitos para ser
considerada binomial. En este punto, sería conveniente que usted escriba los supuestos de la binomial,
aplicándolos a esta situación práctica. Verá que se cumplen, y podemos escribir lo siguiente:
YBi (n=10; p=0,5), por lo que se resuelve:
P(Y=6)=P(Y≤6)-P(Y≤5)=0,8281-0,6230=0,2051

Para responder la siguiente pregunta, hay que plantear P(Y<6)=P(Y≤5), esta igualdad vale porque la va-
riable Y es discreta, por lo tanto, la probabilidad es 0.6230

c) Como X tiene distribución uniforme (la función de densidad es una función constante) con =330 g y 2=
833,33 g2, entonces podemos buscar la distribución del peso promedio aplicando el Teorema Central del
Límite, con lo que nos queda que:
σ2 833,33
X̄ 36 ≈ N (μ=330; σ2X̄ = = =23,148)
n 36

330-330
P(X̄ 36 >330)≅P Z> ≅P(Z>0)≅1-P(Z≤0)≅1-0,5≅0,5
√833,33
( 36 )

EJERCICIO 3) En los últimos años se desarrollan actividades alternativas de cría, basándose en especies
animales autóctonas de la zona. Este es el caso de la cría del lagarto overo, en alguna localidad de la
Mesopotamia argentina.
a) Suponga que, por bibliografía consultada, la longitud de la cola en los lagartos overos hembras juveni-
les es una variable aleatoria con distribución desconocida cuya media es 0,45 m y su varianza es 0,01 m2.
A partir de esta información y considerando que se toma una muestra de 45 ejemplares, ¿puede definir la
distribución de la longitud media de la cola?
b) Si para reproducción se dejan aquellas hembras con longitudes medias de cola superiores a 0,48 m,
¿qué porcentaje de las hembras de la muestra serán seleccionadas para el plantel reproductor?

SOLUCIÓN

a) Sí, porque se puede aplicar el Teorema Central del Límite, quedando:


σ2X 0,01
E(X̄ )=μ=0,45m ; V(X̄ )= = =0,0002m2 ⇒ X̄ ≈N(0,45m;0,0002m2 )
n 45
0,48-0,45
b) P(X̄ >0,48m)=P (Z> ) =P(Z>2,01)= 1 - P(Z≤2,01)= 1 - 0,97778= 0,02222
0,01

45

Es decir, el 2,2% de las hembras.

51
-TEOREMA CENTRAL DEL LÍMITE-
Guía de Trabajos Prácticos
2023 · Bioestadística

PROBLEMAS PROPUESTOS
EJERCICIO 1) El peso de los perros adultos de raza Labrador Retriever es una variable aleatoria con media
30.7 kg y desviación típica de 1.9 kg. Si consideramos muestras de 80 de estos animales:
a) ¿puede decir que distribución exacta tiene la media muestral para una muestra de 80? ¿por qué?
b) ¿cuál es la probabilidad de que el peso promedio de los 80 animales que conforman una muestra sea
a lo sumo 32 kg?

EJERCICIO 2) La proporción de huevos marrones puestos por gallinas hibridas (mezcla de raza Rhode Island
Red y la White Star) es 0.48. Si en un establecimiento se seleccionan 1200 huevos, ¿Cuál es la probabilidad
de que a lo sumo el 45% de los huevos sean marrones?

EJERCICIO 3) La distribución del peso al nacer de los pollitos Camperos del INTA tiene una media de 55g y
desvió estandar de 5g. Se selecciona una muestra aleatoria de 60 pollitos.
a) ¿Cuál es la probabilidad de que el peso medio del lote
a.1) sea superior a 58g?
a.2) Se encuentre entre 52g y 56g?
b) ¿Cuál es el peso medio no alcanzado por el 25% de las muestras de igual tamaño de pollitos?

EJERCICIO 4) Si el peso de los novillos de la raza Aberdeen Angus es una variable con una media de 360
Kg y un desvío estándar de 18 Kg.
a) Calcular la probabilidad de que el promedio de 49 novillos Aberdeen Angus, elegidos al azar, pesen
entre 380 y 390 Kg .
b) Al tomar una muestra al azar de 36 novillos Aberdeen Angus, calcular la probabilidad de que el
promedio de la misma esté entre 365 y 370 Kg.

EJERCICIO 5) En un campo se estudia la producción media de leche de vacas Holando Argentina de 40


días de lactancia alimentadas a base de pastura. Para ello se toma una muestra de 45 vacas, en las cuales
se registra la producción diaria de leche en litros de cada una. Dicha variable tiene media 23 litros y
desviación estándar de 1,5 litros.
a) Indicar la variable en estudio.
b) Definir el parámetro en lenguaje coloquial.
c) Escribir la expresión del estimador del parámetro del ítem b), y realizar la estimación puntual.
d) Calcular la probabilidad de que la producción media de 45 vacas sea de entre 23,2 y 23,6 litros/día.

52
-TEOREMA CENTRAL DEL LÍMITE-
Guía de Trabajos Prácticos
2023 · Bioestadística

ESTIMACIÓN
* OBJETIVOS ESPECÍFICOS
 Conocer las características deseables de los estimadores puntuales.
 Aplicar conceptos de inferencia estadística en el contexto de los fenómenos biológicos.
 Obtener e interpretar estimaciones puntuales y por intervalos de confianza de los parámetros que
caracterizan las distribuciones de probabilidad del fenómeno en estudio.

* CONTENIDOS TEMÁTICOS
 Métodos para encontrar estimadores.
 Propiedades de los estimadores
 Estimación puntual para
a) la media ()
b) la varianza (σ2)
c) la proporción poblacional (p)

 Estimación por intervalo de confianza (IC) para: a)  en poblaciones normales cuando 2 es conocida;
b)  en poblaciones normales cuando 2 es desconocida; c)  en poblaciones grandes; d) 2 e poblaciones
normales; y e) p en poblaciones grandes. Límite superior e inferior del IC. Nivel de confianza 100(1-)%.
Margen de error, relación con el tamaño de la muestra. Aplicaciones.

* GLOSARIO
Estimador. Estimación puntual. Estimación por Intervalo de Confianza. Condiciones para elección de variable
pivotal. Error estándar. Tamaño muestral.

PROBLEMAS RESUELTOS
EJERCICIO 1) Se toma una muestra de 18 caninos de la ciudad de Neuquén. A cada uno se le extrae sangre,
se separa el plasma de la misma; y finalmente se mide la concentración de colesterol libre, que presenta una
distribución normal. Obteniéndose, a partir de los 18 registros de colesterol libre, un promedio de 70 mg/100
cm3 de colesterol libre, y un desvío estándar de 15 mg/100 cm3.

a) Estimar la media poblacional mediante un intervalo de confianza del 99%.


b) Ídem a) pero con una confianza del 90%.
c) Comparar los resultados obtenidos y analizar la similitud o diferencia entre los mismos.

Antes de resolver el problema, vemos que tenemos que estimar intervalos de confianza de nivel 99% y 90%
para la media poblacional, , sin conocer 2 (varianza poblacional), entonces se emplea como la variable pivotal
a la siguiente t de Student:
X̄ - μ
t=  tn-1
S
√n

Esta es una variable auxiliar basada en la distribución de X̄ que nos será de utilidad para obtener los
estimadores del intervalo de confianza para , no depende de ningún parámetro desconocido; sólo es función
de las observaciones de la muestra y de , y, además, tiene distribución conocida.

Para obtener las expresiones de los límites interior (LI) y superior (LS), debemos plantear la siguiente
igualdad:
X̄ - μ
𝑃 (tn-1; α ≤ ≤ tn-1; 1-α ) =1-α
2 S⁄ 2
√n

53
-ESTIMACIÓN-
Guía de Trabajos Prácticos
2023 · Bioestadística

Por conveniencia, ya que la distribución t de Student es simétrica, emplearemos - tn-1; 1-α en lugar de tn-1; α .
2 2
Entonces:
X̄ - μ
P (- tn-1; 1-α ≤ ≤ tn-1; 1-α ) =1-α
2 S⁄ 2
√n

Despejando  desde el término entre paréntesis de la igualdad anterior se obtienen las expresiones de los
límites inferior y superior del IC.

-tn-1;1-α/2 · S⁄ ≤ X
̅ -μ ≤ tn-1;1-α/2 · S⁄  Primero despejamos la diferencia que contiene al parámetro
√n √n

̅ - tn-1;1-α/2 · S⁄ ≤ - µ ≤ - X
-X ̅ + tn-1;1-α/2 · S⁄  Luego la media muestral
√n √n

̅ + tn-1;1-α/2 · S⁄ ≥ µ ≥ X
X ̅ - tn-1;1-α/2 · S⁄
√n √n  Multiplicamos por (-1)

̅ - tn-1;1-α/2· S⁄ ≤ µ ≤ X
X ̅ + tn-1;1-α/2 · S⁄  Reordenamos
√n √n

S S
Entonces, el intervalo de confianza está dado por: [X̄ - tn-1;1-α . ; X̄ + tn-1;1-α . ], cuya expresión puede
2 √n 2 √n
S
resumirse en: X̄ ∓ tn-1; 1-α ⋅ (1)
2 √n

Notemos que tanto el LI como el LS son variables aleatorias ya que dependen de las observaciones de la
muestra (para calcular X y S), del nivel de confianza, y del tamaño de la muestra; lo que permitiría la siguiente
expresión probabilística:
S S
P (X̄ - tn-1; 1-α ⋅ ≤ μ ≤ X̄ + tn-1; 1-α ⋅ ) =1-α
2 √n 2 √n

Sin embargo, cuando X y S se reemplazan por los valores obtenidos a partir de la muestra, el LI y el LS ya no
son variables pues toman un único valor dependiendo de la muestra. Esto es lo que limita, en el momento de
la conclusión, la interpretación probabilística del intervalo de confianza obtenido.
Entonces, siempre la conclusión de los IC se expresa desde el punto de vista del nivel de confianza que se
haya empleado en la estimación del intervalo. Esto debería quedar claro en las conclusiones siguientes.

SOLUCIÓN
a) Un IC99% para  con 2 desconocida. Datos: n = 18 (tamaño de la muestra); x = 70 mg/100 cm3;
S = 15 mg/100 cm3; y nivel de confianza 99%, o sea 1- = 0,99.

Por lo tanto, el valor tabular que emplearemos es tn-1; 1-α = t17; 0,995 = 2,898.
2

Notemos aquí que hay tres formas de expresar el valor tabular 1) simbólico en general: tn-1; 1-α , 2) simbólico
2
en particular (o sea, teniendo en cuenta el tamaño muestral y en nivel de confianza del ejercicio) t17; 0,995 ,
3) mediante su valor numérico: 2,898.
Nota: en el contexto del presente curso de estadística (al resolver ejercicios, parciales o finales), siempre que sea
posible, se debe informar tanto el valor tabular “simbólico en particular” como su “valor numérico”.

15
Reemplazando en (1) tenemos: 70∓ 2,898⋅ .
√18
Entonces, un intervalo de confianza del 99% para  es [59,75 mg/100 cm3; 80,25 mg/100 cm3]

CONCLUSIÓN: Con un nivel de confianza del 99%, se espera que el intervalo [59,75 mg/100 cm3; 80,25
mg/100 cm3] cubra al verdadero valor de la media de la concentración de colesterol libre en el plasma
sanguíneo de la población de caninos de la ciudad de Neuquén.

54

-ESTIMACIÓN-
Guía de Trabajos Prácticos
2023 · Bioestadística

Nota: Debemos observar que se ha concluido empleando el concepto de confianza, y no se ha usado el término
probabilidad. Una forma de interpretar el concepto de confianza (o confiabilidad) aplicado al ejercicio resuelto sería la
siguiente. Supongamos que tomáramos 1000 muestras de tamaño 18, y con cada una estimamos un intervalo de
confianza del 99% para , con lo cual tendríamos 1000 IC99%. Entonces, una confianza del 99% significa que
“esperamos” que 990 de los 1000 IC cubran al parámetro  y sólo 10 no lo cubran.

b) En este caso, 1- = 0,90; entonces tn-1; 1-α = t17; 0,95 = 1,74. Los otros datos son iguales al punto anterior.
2
15
Reemplazando en (1) tenemos, ahora: 70∓ 1,74⋅ .
√18

Entonces, un intervalo de confianza del 90% para  es [63,85 mg/100 cm3; 76,15 mg/100 cm3]

CONCLUSIÓN: Con un nivel de confianza del 90%, se espera que el intervalo [63,85 mg/100 cm 3; 76,15
mg/100 cm3] cubra al verdadero valor de la media de la concentración de colesterol libre en el plasma
sanguíneo de la población de caninos de la ciudad de Neuquén.
c) El IC90% para  es de menor amplitud (diferencia entre el límite superior e inferior, LS – LI) que el IC99%
para , pero también es menos confiable. Eso será una constante para un n fijo, a mayor confianza, mayor
amplitud. Si consideráramos que la amplitud del intervalo se relaciona con su precisión, entonces hay una
relación inversa entre la amplitud del intervalo y la precisión del mismo.

EJERCICIO 2) Se hicieron determinaciones de la concentración de amilasa en suero en individuos de una


muestra aleatoria, de tamaño 15, tomada de una población con individuos aparentemente normales. La
muestra proporcionó una media de 96 UI/ml y una desviación estándar de 35 UI/ml. Suponiendo que la
población se distribuye normalmente, estimar la varianza poblacional puntualmente y mediante un intervalo de
confianza el 95%.

Para hacer una estimación puntual primero hay que recordar que el estimador de la varianza poblacional es
1 n
la varianza muestral calculada a través de la fórmula S 2  ( xi  x )2 que es una variable aleatoria, por lo
n  1 i 1
tanto, la estimación puntual (un número) es el valor que obtengo en la muestra utilizando dicha fórmula, en
este caso, s  1225(Ul / ml )
2 2

Para estimar la varianza poblacional ( 2) mediante un intervalo de confianza, primero debemos observar que
la variable aleatoria  es la indicada para ser usada como variable pivotal.
2

(n-1)⋅S2
𝜒 = 2
  n21
σ2

Como en el caso anterior, para obtener las expresiones de los límites del intervalo de confianza, debemos
plantear la siguiente expresión:
2
(n-1)⋅S
𝑃 (χ2n-1; α ≤ ≤ χ2n-1; 1- α ) =1-α
2 σ2 2
El mecanismo para obtener las expresiones del IC para 2 es bastante sencilla pero requiere cierto cuidado.
Sabemos que esta variable aleatoria no es simétrica, con lo cual no podemos usar un único valor tabular.
Despejando se obtiene el siguiente intervalo:
2 2
(n-1)⋅S 2
(n-1)⋅S
≤ σ ≤ (2)
χ2 α χ2 α
n-1; 1- n-1;
2 2

SOLUCIÓN
Datos: n = 15; x = 96 UI/ml; s = 35 UI/ml ; y 1- = 0,95.

Se necesitan dos valores tabulares: χ2n-1; α = χ214; 0,025 = 5,629 y χ2n-1; 1-


α =χ214; 0,975 = 26,12
2 2

55
-ESTIMACIÓN-
Guía de Trabajos Prácticos
2023 · Bioestadística

Reemplazando en (2) nos queda:


14∙1225
a) LI: =656,58
26,15
14∙1225
b) LS: =3046,72
5,629

CONCLUSIÓN: Se espera con una confianza del 95% que el intervalo [656,58 (UI/ml)2; 3046,72 (U/ml)2] cubra
o abarque a la varianza poblacional de la concentración de amilasa en suero en la población de individuos
aparentemente normales.

¿Qué hubiera ocurrido si en el ejercicio nos hubieran solicitado un intervalo de confianza para el desvío
estándar poblacional ()?
En principio nada muy distinto. Primero se obtiene un intervalo de confianza para  2 y se arma la conclusión
para esta, luego se obtiene la raíz cuadrada de los LI y LS, y finalmente se concluye para el desvío.
Hubiera resultado ser algo así:

Para el ejercicio 2), estime el desvío estándar poblacional mediante un intervalo de confianza el 95%.
Un IC95% para  : a) LI= √656,58=25,62 UI/ml y b) LS= √3046,72=55,20 UI/ml

CONCLUSIÓN: Se espera con una confianza del 95% que el intervalo [25,62 UI/ml; 55,20 U/ml] cubra al
verdadero valor del desvío estándar de la concentración de amilasa en suero en la población de individuos
aparentemente normales.

EJERCICIO 3) Un fabricante de material de laboratorio desea saber qué proporción de sus productos no
contienen fallas. Estimar puntualmente y mediante un intervalo de confianza la proporción de material sin fallas
si se sabe que en una muestra de 100 unidades producidas se contó sólo 4 unidades con fallas. Usar un nivel
de confianza del 90% (1 -  = 0,90).
En este caso, la variable pivotal a emplear es:
p̂ - p
Z= ≈ N(0; 1)
√p ̂ (1-p
̂ )
n
Usando el mismo razonamiento que antes se pueden obtener las expresiones de los límites inferior y
p̂ (1-p̂ )
superior del IC para p, que presentamos en la siguiente expresión: p̂ ∓Z1 - α ⋅√ (3)
2 n

SOLUCIÓN
Datos: n = 100; número de unidades con fallas = 4; 1 -  = 0,90

#casosfavorables 96
Estimación puntual: p̂ = = , o sea p̂ =0,96
tamaño de muestra 100

IC90% para la proporción poblacional (p)


Reemplazando en (3):
0,96∙0,04
0,96∓1,64∙√ ≅ 0,96 ∓ 0,032
100
Con lo cual, un intervalo de confianza para p es: [0,928; 0,992].

CONCLUSIÓN: Con un nivel de confianza del 90%, se espera que el intervalo [0,928; 0,992] cubra al valor de
la proporción poblacional de unidades producidas sin fallas correspondiente al fabricante de material de
laboratorio.

EJERCICIO 4) Se desea estimar la proporción de machos de una población de moscas Drosophila


melanogaster. Calcular el tamaño de la muestra para que la estimación de la proporción poblacional tenga un

56

-ESTIMACIÓN-
Guía de Trabajos Prácticos
2023 · Bioestadística

margen de error no mayor a 5%, con una confiabilidad del 95%. Se sabe, por un muestreo piloto anterior, que
de una muestra de 100 individuos, 35 resultaron machos.

Antes de resolver el ejercicio, veamos algunos conceptos asociados a este problema. Llamamos margen de
error a la semiamplitud del intervalo de confianza y lo simbolizamos con la letra d.
Si la amplitud a = (LS – LI), entonces la semiamplitud d = (LS – LI) / 2. En los casos de los Intervalos de
Confianza expresados en (1) y (3), la semiamplitud coincide con el término a la derecha del signo . Entonces,
nos podemos dar cuenta, analizando la función semiamplitud, de qué factores depende y cómo depende de
estos.
En el presente problema, el parámetro de interés es la proporción poblacional, por lo tanto se trabaja con el
intervalo presentado en (3), del cual se obtiene:
p̂ (1-p̂ )
d= Z1-α ⋅√ (4)
2 n
Observando (4) podemos ver que el nivel de confianza influye en el valor de z. La experiencia piloto nos permite
usar un valor de p̂ ; el margen de error, d, es igual a 0,05. Por lo tanto, sólo se debe despejar n para tener una
respuesta al problema.

SOLUCIÓN
Datos: d = 0,05; 1- = 0,95; xm = 35 (número de machos o #casos favorables); y tamaño de la muestra
piloto np = 100.

Como el enunciado dice: “... un margen de error no mayor a 5%...”, entonces deberíamos plantear que
p̂ (1-p̂ )
d≥ Z1-α ⋅√ (5)
2 n
Despejando n desde (5) obtenemos:
z1-α 2
2
n0 ≥ ( ) ⋅p̂ (1-p̂ ) (6)
d
[Notaremos n0 al tamaño de muestra calculado para satisfacer los requisitos de “margen de error” y “nivel
de confianza” deseados.]
Reemplazando en (6) con los datos, y recordando que z1-α =z0,975 = 1,96, y resolviendo para la igualdad:
2
1,96 2
n0 = ( ) ∙0,35∙0,65= 349,58 ≅ 350 moscas
0,05
Respuesta: el tamaño de la muestra debe ser como mínimo de 350 moscas para tener un margen de error de
a lo sumo 0,05 y una confianza de por lo menos 95%.

[Siempre que sea necesario redondear al buscar el tamaño de muestra, lo haremos redondeando
hacia el entero superior.]
Nota: Muchas veces, antes de realizar un muestreo para estimar con cierto margen de error un parámetro, no se cuenta
con información relativa a la variación de la población. En tal caso, se puede adoptar alguna de las siguientes opciones: a)
hacer un muestreo piloto, b) tomar información de bibliografía, c) consensuar un valor sobre la base de la experiencia del
investigador en el tema o tratando de considerar algún caso extremo.
(Ejemplo: p̂ =0,5 en caso de no contar con información previa)

EJERCICIO 5) Se desea estimar el peso promedio de materia verde por m2 en un campo de 4 ha, sembrado
con alfalfa. Se admite un error en la estimación (sinónimo de margen de error) de 0,5 Kg, con una confianza
del 99%. Dado que no se dispone de información anterior se procedió a seleccionar una muestra piloto de 30
unidades (o sea, 30 m2) y se calculó s = 5,4 kg. Determinar el tamaño de muestra adecuado a las restricciones
enunciadas suponiendo que la variable registrada se distribuye normalmente y definir: a) Variable y población
en estudio; y b) Unidad de muestreo.

En este ejercicio se agrega un concepto que es de utilidad cuando las poblaciones son de tamaño finito.
Generalmente, consideramos que N (el tamaño de la población) es infinito, pero en muchas situaciones, como
en la del ejemplo, la población tiene un tamaño finito. Entonces, para considerar esta situación se debe usar la
siguiente corrección:

57
-ESTIMACIÓN-
Guía de Trabajos Prácticos
2023 · Bioestadística
n0
nf =n
1+ 0
N
Notemos que ahora se denomina nf al tamaño de muestra requerido para satisfacer las restricciones de margen
de error y nivel de confianza cuando el tamaño de la población es finito.
SOLUCIÓN
Datos: N = 4 ha = 40.000 m2 (tamaño de la población); np = 30 m2 (tamaño de la muestra piloto);
s = 5,4 kg2; 1- = 0,99  t29; 0,995  2,756; y d = 0,5 Kg
a) Variable en estudio: peso de materia verde en una parcela de 1 m2 expresado en Kg sembrada con alfalfa.
Población en estudio: 40.000 m2 sembrados con alfalfa de un campo.
b) Unidad de muestreo: una parcela de 1 m2 sembrada con alfalfa.

Debemos estimar un nuevo tamaño muestral, utilizaremos una muestra piloto de 30 unidades para su cálculo:

σ s
d=tn-1;1-α/2 ≅ tn-1;1-α/2
√n √n
2
tn-1;1-α/2 ∙S 2,756⋅5,4 2
n0 = ( ) =( ) =885,94
d 0,5

En este punto sería necesario aproximar hacia el entero superior, pero como emplearemos la fórmula de
corrección por tamaño finito de la población, la aproximación se pospone hasta haber realizado el siguiente
cálculo:
885,94
nf = = 866,74  867 parcelas de 1 m2
885,94
1+
40000

El tamaño de la muestra para una población de tamaño finito debe ser de 867 parcelas de 1m2 para
satisfacer las restricciones (margen de error y confiabilidad) en la estimación.

[Observar que nf es menor que no.]

EJERCICIO 6) En los últimos años se desarrollan actividades alternativas de cría, basándose en especies
animales autóctonas de la zona. Este es el caso de la cría del lagarto overo, en alguna localidad de la
Mesopotamia argentina. En un estudio realizado en un centro de reproducción y cría, de dicha localidad,
se midieron 45 colas de lagartos hembra juveniles, obteniéndose una media de 0,5 m y una varianza de
0,008 m2. La variable de interés se distribuye en forma normal.
a) Estimar, utilizando un nivel del 95%, la longitud media de la cola.
b) Si usted hubiera decidido realizar el intervalo con un nivel de confianza del 90%, ¿qué modificación
hubiera tenido la amplitud del mismo? Justifique su respuesta y realice los cálculos correspondientes.
c) Suponga que, por bibliografía consultada, la longitud de la cola en los lagartos overos hembras juveniles
es una variable aleatoria con distribución desconocida cuya media es 0,45 m y su varianza es 0,01 m 2.
c.1) A partir de esta información y considerando que tiene los mismos elementos en su muestra, ¿puede
definir la distribución de la longitud media de la cola?
c.2) Si para reproducción se dejan aquellas hembras con longitudes medias de cola superiores a 0,48 m,
¿qué porcentaje de las hembras de la muestra serán seleccionadas para el plantel reproductor?
c.3) Si se deseara que la amplitud del intervalo para la estimación de la media poblacional de la longitud
de la cola de lagarto overos resultara la mitad de la lograda en el ítem a), manteniendo el nivel de confianza
utilizado, ¿cuál debería ser el tamaño muestral?

SOLUCIÓN
a) La variable en estudio es X: “Longitud de la cola de un lagarto overo hembra del centro de reproducción
y cría de algún lugar de la Mesopotamia argentina”, y está medida en m. Los datos que tenemos son: n=45;
2
X̄ =0,5m ; S =0,008m2 , por lo que S=0,089m

58

-ESTIMACIÓN-
Guía de Trabajos Prácticos
2023 · Bioestadística

Aplicamos la fórmula correspondiente al Intervalo de Confianza para  con varianza poblacional


desconocida:
S 0,089
̅∓t
X α∙ = 0,5 ∓ 2,015. = 0,5 ∓ 0,027= [0,473 m; 0,525 m]
n-1;1-
2 √n √45

Conclusión: Con un 95% de confianza se espera que el intervalo [0,473 m; 0,525 m] cubra al verdadero
valor medio de la longitud de la cola de la población de lagartos overos hembras juveniles del centro de
cría y reproducción de alguna localidad de la Mesopotamia argentina.

b) La amplitud (simbolizada con a) del intervalo anterior la calculamos restando los valores de los límites
obtenidos: a = LS – LI = 0,525 – 0,473 = 0,052
Veamos qué ocurre si la confianza disminuye como en este caso, ya que pasamos a tener 90%.
Recordemos que la semiamplitud del intervalo corresponde al producto entre el valor tabular de la variable
pivotal y el error estándar de la media, en este caso, dado que estamos armando un intervalo para la media,
quedando así:
s
d= tn-1;1-α ∙
2 √n

Si reemplazamos numéricamente y calculamos:


S 0,089
d= tn-1;1-α ∙ = t44;0,95 ∙ = 1,68∙0,013= 0,022
2 √n √45

Si multiplicamos por 2, obtenemos la amplitud (A): d·2 = 0,022·2 = 0,044


Al compararla con la anterior vemos claramente que es más pequeña, dada la reducción en el nivel de
confianza.

c.1) Sí, porque se puede aplicar el Teorema Central del Límite, quedando:
σ2 0,01
̅ )=μ=0,45m ; V(X
E(X ̅ )= X = =0,0002m2 ⇒ X ̅ ≈ N(0,45m;0,0002m2 )
n 45
0,48-0,45
𝐜.2) P(X̄ >0,48)= P Z> = P(Z>2,01)= 1 - P(Z≤2,01)= 1 - 0,97778= 0,02222
√ 0,01
( 45 )
c.3) La longitud del intervalo utilizado para estimar la media de la longitud de la cola de lagarto overos, con
nivel 95% es: a = 0,525 m - 0,473 m = 0,052m
Si se desea reducir esta amplitud a la mitad, entonces: a’= 0,052m/2 = 0,026m, siendo d’= 0,013m.
Dado que estamos utilizando el Teorema Central del Límite y la variable pivotal es una Z, la fórmula para
calcular el n es la siguiente:
2
Z1-α ∙ S 1,96 ∙ 0,089 2
2
n= ( ) =( ) =180,05 ≅181 lagartos
d 0,013

PROBLEMAS PROPUESTOS
EJERCICIO 1) Se desea estimar el peso promedio de un lote de 500 cerdas, a partir de una muestra de 36.
Los pesos obtenidos se presentan en la siguiente tabla:
PESO (Kg) Cant. animales
40 - 42 3
42 - 44 5
44 - 46 7
46 - 48 10
48 - 50 6
50 - 52 3
52 - 54 2
Proponer una respuesta trabajando con un nivel de confianza del 99%, y suponiendo que la distribución de la
variable es normal.
59
-ESTIMACIÓN-
Guía de Trabajos Prácticos
2023 · Bioestadística

EJERCICIO 2) Se desea estimar el desvío estándar de la alzada de potrillos PSC (Pura Sangre de Carrera)
de la provincia de Entre Ríos, con una confianza del 95%, sabiendo que una muestra de 20 animales presentó
un CV% de 19,03% y un promedio de 1,10 m. Suponga que la variable tiene distribución normal.
a) Definir la variable en estudio y la población de interés.
b) Indicar la variable aleatoria empleada como pivotal expresando su distribución.
c) Indicar los valores tabulares empleados para el LI y el LS.
d) Estimar el desvío estándar poblacional puntualmente y mediante un intervalo de confianza y concluir.

EJERCICIO 3) Al examinar 154 vacas de raza Holando Argentino, en un determinado tambo, el 15%,
aproximadamente, dio reacción positiva de brucelosis.
a) Estimar puntualmente y a través de un intervalo de confianza del 90%:
a.1) la proporción poblacional de vacas en ordeñe sin brucelosis.
a.2) la proporción poblacional de vacas con brucelosis.
b) Definir la variable en estudio y la población de interés
c) Si se toma una muestra aleatoria de 15 vacas, ¿cuál es la probabilidad de detectar
alguna como positiva?

EJERCICIO 4) Un investigador necesita conocer el nivel medio de una enzima en una población. Con los
datos disponibles, correspondientes a determinaciones realizadas en una muestra piloto de 10 individuos, se
obtuvo una media de 22 UI y una varianza de 49 UI2. Suponga que la variable tiene distribución normal.
a) Definir la variable en estudio y la población de interés.
b) Indicar la variable aleatoria empleada como pivotal expresando su distribución.
c) ¿Qué cantidad de determinaciones deberá realizar para estimar la media poblacional con una
confianza del 99% y con un margen de error no mayor a 2 UI?
Asuma que se tomó una muestra del tamaño por Ud. recomendado en el punto c), y que entonces las
estimaciones para  y 2 resultaron ser 23 UI y 48,5 UI2, respectivamente.
a) Indicar los valores tabulares empleados para el LI y el LS.
b) Estimar la media poblacional mediante un intervalo de confianza y concluir.

EJERCICIO 5) Se quiere estimar la proporción de familias del Conurbano Bonaerense que tienen alguna forma
de seguro de salud.
a) Definir la variable en estudio y la población de interés.
b) Considerando que no se dispone de información previa, ¿qué tamaño de muestra se deberá tomar
para asegurar un nivel de confianza del 99% y un margen de error de 0,3?
c) Si se cree que el 70% de las familias tienen seguro, ¿qué tamaño de muestra se deberá tomar para
asegurar un nivel de confianza del 99% y un margen de error de 0,3?

EJERCICIO 6) Se tomó una muestra de 12 llamas pertenecientes a un establecimiento ganadero con el


propósito de evaluar la producción de lana, cuya distribución es aproximadamente normal, y se obtuvo una
media de 2,26 Kg y un desvío de 0,48 Kg. Se estimó, mediante un intervalo de confianza del 90%, la
varianza poblacional de la producción de lana.
a) ¿Qué estadístico y qué dos valores tabulares fueron empleados para obtener dicho intervalo?
b) Tache lo que no corresponde: “El intervalo de confianza fue [SIMÉTRICO] [ASIMÉTRICO] con respecto al
estimador puntual.”

EJERCICIO 7) ¿Cuál sería el tamaño de muestra necesario para que la amplitud de un intervalo de
confianza del 95% para la media poblacional de una variable, medida en mm, con distribución normal sea
igual a 2mm, si la varianza es conocida e igual a 4mm 2?

EJERCICIO 8) Al estimar la media poblacional mediante un intervalo de confianza del 90% se obtuvieron
los siguientes límites: [95; 110]. Sabiendo que se trabajó con una muestra de 26 individuos, dar el valor del
promedio y de la varianza que se utilizó para el cálculo de dicho intervalo si 2 era desconocida. Suponga
que la variable tiene distribución normal.

60

-ESTIMACIÓN-
Guía de Trabajos Prácticos
2023 · Bioestadística

EJERCICIO 9) El administrador de un rodeo está interesado en conocer la edad promedio de las vacas de
cría en un año dado. Decide tomar una muestra de tamaño 25, con la que se obtuvo un promedio de 5,3
años. Si se conoce que esta variable tiene una distribución normal con varianza poblacional de 2,25 años 2.

a) Estimar la edad promedio poblacional mediante un intervalo de confianza del 95%.


b) Si se quiere reducir en un 50% la amplitud del intervalo de confianza ¿Cuál debería ser el tamaño
de la muestra?
c) Si al punto anterior se le agrega la información de que el tamaño poblacional es finito, N = 500.
¿Cuál sería su respuesta?

EJERCICIO 10) Con el fin de analizar el contenido de proteínas del salmón enlatado, medido en %, se
seleccionó una muestra de 15 unidades y se realizó la determinación correspondiente. Los datos obtenidos
son los siguientes:
22,4 24,5 23,0 27,1 24,2 25,7 26,4 28,3 26,4 25,2 24,7 26,3 25,3 24,9 27,4

a) Halle la media y el desvío para la muestra dada.


b) A partir del siguiente boxplot obtenido a partir de la
muestra dada, le parece razonable la condición de
normalidad. Justifique.

Asumiendo que el contenido de proteínas del salmón enlatado


es una variable aleatoria con distribución normal:

c) Halle un intervalo de confianza del 95% para la media


poblacional. Interprete en términos del problema
planteado.

d) Halle un intervalo de confianza del 95% para el desvío


poblacional. Interprete en términos del problema
planteado.

EJERCICIO 11) En la provincia de Misiones se registra un brote de leptospirosis canina. El resultado de un


estudio serológico que se realiza en 94 perros que llegan a una clínica con síntomas compatibles con la
enfermedad, indica que 41 de ellos están infectados.
a) ¿Cuál es la variable de interés? ¿Qué distribución tiene? Justifique su respuesta aplicando los
conceptos adquiridos en la unidad 2 (variable aleatoria).
b) Estimar el parámetro de interés, de manera puntual y por intervalo de confianza, utilizando un nivel del
95%.
c) El colegio de veterinarios de la localidad intenta estimar la proporción de caninos con leptospirosis,
para lo cual recurre a los registros informados por los consultorios, en los que figuran que de 230 perros
que presentaron síntomas compatibles con la enfermedad sólo 85 resultaron positivos. A partir de estos
datos, estime el parámetro de interés y utilice el mismo nivel de confianza que el utilizado en el punto b).
¿Qué puede decir al comparar ambas amplitudes? Justifique su respuesta.
d) En Epidemiología se habla de epidemia cuando se produce un aumento en la proporción de enfermos.
En esta localidad, históricamente, la proporción de caninos enfermos con leptospirosis es 0,28. De acuerdo
a los intervalos que usted calculó e intuitivamente, ¿puede decirse que esta proporción está contenida en
ellos? En la próxima unidad usted aprenderá otro método estadístico que le permitirá hacer otro tipo de
inferencia, para responder a la siguiente pregunta: ¿aumentó la proporción de caninos con leptospirosis?

61
-ESTIMACIÓN-
Guía de Trabajos Prácticos
2023 · Bioestadística

PRUEBA DE HIPÓTESIS
* OBJETIVOS ESPECÍFICOS
 Comprender y analizar la lógica de los ensayos de hipótesis, así como de sus componentes
fundamentales.
 Aplicar correctamente los conceptos de nivel de significación, potencia de una prueba y regla de decisión
estadística a la resolución de problemas.
 Desarrollar espíritu crítico para evaluar la correcta aplicación de una dócima en un determinado contexto.
* CONTENIDOS TEMÁTICOS
Concepto de hipótesis estadística. Errores tipo I y II. Nivel de significación. Concepto de potencia de una prueba
estadística. Esquema para contrastar una hipótesis. Prueba de hipótesis para la media (), la proporción (p) y
la varianza (2). Aplicaciones.

* GLOSARIO
Prueba, dócima, test o contraste de hipótesis. Condiciones para elección de variable pivotal. Hipótesis de
trabajo. Hipótesis estadística. Hipótesis nula y alternativa. Error tipo I y tipo II. Nivel de significación. Región
crítica. Regla de decisión. Potencia. Test exacto. Test aproximado o asíntótico. Test de libre distribución.

PROBLEMAS RESUELTOS
EJERCICIO 1) En una chimenea se ha instalado un sistema de precipitación con el que se cree que la
concentración de sólidos en el humo, que es en promedio de 1,8 g/m3, será menor a la tercera parte. Puesta
en marcha la instalación se efectúa una serie de mediciones, obteniéndose los siguientes valores (g/m3):

0,50 0,52 0,53 0,54 0,55


0,55 0,56 0,56 0,57 0,64

En base a estos valores, ¿cree usted que se ha obtenido el resultado esperado? (=0,05)

SOLUCIÓN
Variable en estudio
X: “concentración de sólidos en el humo de una chimenea luego de instalar un sistema de precipitación (g/m3)”

El investigador expresa su supuesto como una hipótesis de trabajo.

La hipótesis de trabajo (HT) expresa el supuesto o conjetura que motiva al experimentador. Se expresa
siempre como una afirmación y está dada en forma coloquial, no en términos estadísticos, ya que el
investigador no necesita tener conocimientos estadísticos específicos.
Es formulada antes de cualquier estudio estadístico.

En este caso HT es: “el sistema de precipitación instalado en la chimenea disminuye la concentración
de sólidos en el humo a menos de la tercera parte”.
Para poner a prueba la HT se necesita transformar las afirmaciones allí expresadas a términos estadísticos
a los fines de poder aplicarles la técnica adecuada que permita responder sobre la hipótesis formulada. Esta
consta de varios pasos y es importante tener claro en que consiste cada uno de ellos y el orden en que se
presentan.

Se llama hipótesis estadística a una aseveración o especificación acerca de la distribución de la


variable que se está estudiando o de los parámetros de esa distribución, según sea lo necesario acorde a
la hipótesis de trabajo del investigador.
Se formulan dos hipótesis: una hipótesis nula y una hipótesis alternativa, que son disjuntas y
exhaustivas; en caso de referirse a un parámetro abarcan todos los valores posibles que pueda tomar este.
La formulación se realiza entonces de manera tal que si una es verdadera la otra es falsa.
La hipótesis que se pone a prueba es la hipótesis nula, y en ella, a los fines del desarrollo de la
prueba, siempre debe colocarse una igualdad.
62
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística

En este caso: De acuerdo a lo formulado en la hipótesis de trabajo, y teniendo en cuenta que el valor de la
concentración media de sólidos antes de instalar el sistema de precipitación era de 1,8 g/m3, será:

H0 :   0,6 hipótesis nula


H1 :   0,6 hipótesis alternativa

El nivel de significación es 0,05.

Este valor proporciona una medida del riesgo con el que se desarrollará la prueba, consecuencia del
método inductivo. Significa que de cada cien muestras obtenidas, cinco nos pueden llevar a resultados
erróneos; esperamos que la nuestra sea una de las noventa y cinco “buenas”.

En este caso:
 = 0,05 = P(rechazar H0 /H0 es verdadera) = P(suponer   0,6 cuando en realidad es   0,6)
Esto significa que, en cinco de cada cien veces, concluiremos que el sistema disminuye la concentración
de sólidos a menos de la tercera parte cuando en realidad no lo hace.
Antes de elegir el estadístico de prueba, necesitamos tener información sobre la distribución de la
variable en estudio, ya que en este caso no está aclarada en el enunciado del problema.

La condición para elegir la variable pivotal que hacemos sobre la variable en estudio es:

X ~ N ( , 2) ó X  N ( , 2)

Para verificar esta condición se realizó una prueba de Shapiro-Wilks, llegando a la conclusión de que se
puede suponer que la variable se distribuye aproximadamente normal.
Esta prueba es no paramétrica y las hipótesis estadísticas son:

H0 : X ~ N ( , 2)
H1: X no se distribuye N ( , 2)

El estadístico de prueba a utilizar es W para esta dócima, pero en este curso no se verá su distribución,
por lo tanto, se va a trabajar con el p-valor. Este dato va a estar dado por la salida de InfoStat;

Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Sólidos 10 0,55 0,04 0,91 0,4176

El p-valor, p-value o simplemente p, es la probabilidad de que siendo cierta Ho nos encontremos con un
valor como el que nos arrojó la muestra o peor en el sentido de la hipótesis alternativa. Esto significa igual o
mayor al obtenido si la región crítica es unilateral derecha, igual o menor que el obtenido si la región crítica es
unilateral izquierda e igual al doble de la menor de las colas desde el obtenido si la región critica es bilateral.
Lo utilizaremos en el caso de Shapiro Wilks para decidir rechazar o no H0 ya que de lo único que
disponemos es de la salida de computadora y siempre trabajaremos al nivel de significación del 10%,
en este test; dado que no es muy potente.
En los demás test es importante que la decisión se base en el estadístico de contraste su
distribución, el nivel de significación y la región crítica.

La regla de decisión, para este caso particular, la armaremos comparando el p-valor con el valor de
=0,10, para cualquiera de las H1:

o Si el p-valor    rechazo H0
o Si el p-valor >   no rechazo H0

Como p=0,4176 > 0,10 (nivel dado), no rechazo H 0. Por lo tanto, al nivel del 10%, no tengo evidencias
suficientes para rechazar H0 y puedo suponer que la concentración de sólidos en el humo de las chimeneas
luego de instalar un sistema de precipitación (g/m3) se distribuye normalmente con media  y varianza 2.

63
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística

Una vez analizado la condición, podemos hacer la prueba respecto a la media poblacional. El estadístico
de prueba a utilizar en este caso es:
X̄ - μ
t= tn-1
S⁄
√n

El estimador utilizado del parámetro en estudio es la media muestral. Si suponemos que la distri-
bución de la variable es normal, la media muestral también tendrá una distribución normal. Estandarizando
esta variable obtenemos una normal estándar, y como la varianza poblacional es desconocida entonces
utilizamos una t de Student. Así cumplimos con la necesidad de tener una distribución conocida para poder
emplear las tablas estadísticas.

Necesitamos ahora determinar la región crítica. Recordemos que la región crítica está formada por
los valores del estadístico de prueba en los cuales se va a producir el rechazo de la hipótesis nula. Se
determina a partir de la distribución del estadístico de prueba, el nivel de significación de la prueba, la
hipótesis alternativa y a veces, del tamaño de la muestra.
También se puede expresar la región crítica como un subconjunto de valores del estimador del
parámetro, pero no lo usaremos en este curso.

En este caso: la región crítica es unilateral izquierda por lo indicado en H1


Es el conjunto de valores de t  -1,83
(como =0,05 el valor tabulado corresponde a t(9) ; 0,05= -1,83)

Gráficamente:

La regla de decisión es: RECHAZO H0 si t Ho  -1,83


NO RECHAZO H0 si t Ho > -1,83

Tomando una muestra aleatoria de la población en estudio, se estima el parámetro que se está
poniendo a prueba, y teniendo en cuenta toda la información obtenida de la muestra, se calcula el valor del
estadístico de prueba bajo la hipótesis nula y se toma la decisión.

Información muestral: x = 0,552 g/m3; s2 = 0,00139 (g/m3)2; s = 0,037 g/m3; n = 10


Reemplazando en el estadístico de prueba:

0,552 - 0,600
tH0 = = -4,095
0,037
3,16

Como - 4,095 < -1,83 entonces, la decisión es rechazo H0

CONCLUSIÓN: Con un nivel de significación del 5%, tengo evidencias suficientes para rechazar H0:   0,6
por lo tanto consideramos que  < 0,6; es decir, la media poblacional de la concentración de sólidos en el humo
de la población de chimeneas en las que se ha instalado el sistema de precipitación es menor a 0,6 g/m3 ; en
consecuencia se concluye que la disminución producida por la instalación de este nuevo sistema lleva el valor
medio poblacional de concentración de sólidos en la chimenea por debajo de la tercera parte; por lo tanto se
ha obtenido el resultado esperado.

64
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística

EJERCICIO 2) En la situación práctica del problema 1), se sospecha que la varianza no se mantiene en el
valor histórico de 0,0015 (g/m3)2, por lo que se ponen a prueba las siguientes hipótesis estadísticas:
H0: 2=0,0015 vs H1: 2  0,0015 al mismo nivel de significación

SOLUCIÓN

Parámetro en estudio: varianza poblacional de la concentración de sólidos en el humo de las chimeneas en las
que se ha instalado este sistema de precipitación.

Hipótesis de trabajo:
La varianza de la concentración de sólidos en el humo de la chimenea una vez
instalado un sistema de precipitación difiere de 0,0015 (g/m3)2

La condición de normalidad sobre la variable en estudio ya fue verificado; por lo tanto el estadístico de
prueba es:
(n-1)⋅S2
  n1
2
𝜒2=
σ2

y la región crítica de acuerdo con H1 es bilateral, siendo:


2(9);0,025 = 2,70  región izquierda de rechazo 29  2,70
y 2(9);0,975 = 19,02  región derecha de rechazo 29  19,02

O sea, son los valores de 29  2,70 ó 29  19,02


Gráficamente:

La regla de decisión es: RECHAZO H0 si 2H0  2,70 o 2H0  19,02


NO RECHAZO H0 si 2,70 < 2H0 < 19,02

Observación: la región critica o de rechazo del test no puede en este caso escribirse en una sola expresión
matemática.

A partir de la información muestral y reemplazando en el estadístico de prueba utilizado, tenemos:

9∙0,00139
𝜒𝐻20 = =8,34
0,0015

Como 2,70 < 8,34 < 19,02 entonces la decisión es no rechazo H0

Como no rechazo H0 se puede suponer que 2= 0,0015 (g/m3)2, es decir, que, al 5%, la varianza poblacional
de la concentración de sólidos en el humo de la población de chimeneas en las que se ha instalado el sistema
de precipitación no difiere de 0,0015 (g/m3)2.

65
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística

EJERCICIO 3) Un laboratorio está dispuesto a lanzar al mercado un nuevo fármaco si es aceptado al menos
por el 50% de los profesionales. Para ello selecciona una muestra aleatoria de 100 médicos veterinarios a
quienes pregunta si utilizarían el fármaco en cuestión, obteniendo 38 respuestas positivas. ¿Cuál será la
decisión del laboratorio trabajando con un nivel de significación del 5%?

Responda la pregunta indicando: variable en estudio, condición de distribución de la misma, hipótesis de


trabajo, hipótesis estadísticas, estadístico de prueba, regla de decisión, valor calculado del estadístico de
prueba, decisión, población en estudio y conclusión.

SOLUCIÓN

Variable en estudio

X: número de médicos veterinarios que aceptan el nuevo fármaco, en 100 profesionales.


Condición: X ~ Bi(100, p)

Para verificar esta condición no se utilizan pruebas estadísticas. Sólo las condiciones de la distribución
Binomial vistas en la Unidad 2.

Hipótesis de trabajo: al menos el 50% de los médicos veterinarios acepta el nuevo fármaco que propone el
laboratorio

Hipótesis estadísticas
Las expresiones dadas por porcentajes se traducen a proporciones para el estudio estadístico. Se trata
entonces de un caso de una prueba de hipótesis para la proporción poblacional.

En este caso, el 50% indica 50 de cada 100 médicos, por lo tanto p = 0,50.
Pero la hipótesis de trabajo expresa que “al menos el 50%...”, lo cual es equivalente a decir “como mínimo el
50%...”, o también “por lo menos el 50%....”, y esto se expresa entonces como p  0,50.
Teniendo en cuenta además que en la hipótesis nula debe colocarse siempre la igualdad, tenemos:

H0: p  0,50
H1: p  0,50

p̂ - p
El estadístico de prueba es: ZH0 = ≈ N(0,1)
√p∙(1-p)
n

Observación: este test se basa en la aproximación de la distribución binomial a la normal (puede aplicarse
pues n = 100 > 30), es decir es un test de nivel aproximado o asintótico.

Nivel de significación:  = 0,05

Gráfico de región crítica y nivel de significación:

La regla de decisión es: RECHAZO H0 si ZHo  -1,64


NO RECHAZO H0 si ZHo > -1,64

x 38
Información muestral: n= 100 ; x = 38 ; p̂ = = = 0,38
n 100

66
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística

Por lo que sustituyendo en la variable pivotal resulta:

0,38-0,50
Z H0 = = - 2,4 ⟵ valor calculado del estadístico de prueba
√0,5⋅0,5/100

Como -2,4 < -1,64, entonces decidimos rechazar H0.

Población: médicos veterinarios.

Conclusión: Con un nivel de significación del 5%, hay evidencia suficiente para rechazar H0: p  0,50. Por lo
tanto, se puede decir que la proporción poblacional de médicos veterinarios que aceptan el nuevo fármaco es
menor al 50%. En consecuencia, al mismo nivel, se aconseja que el laboratorio no lance al mercado el nuevo
fármaco.

EJERCICIO 4) Se registró la edad de los niños atendidos por quemaduras en la última Navidad en los
hospitales y centros asistenciales de la ciudad “Quemucho” (Argentina) resultando:

Edad frecuencia
3–5 3
5–7 8
7–9 10
9 – 11 7
11 - 13 4
Se solicita:
a) Definir y clasificar la variable
b) Completar la tabla de frecuencias con las columnas de frecuencias relativas y la columna de fre-
cuencias absolutas acumuladas.
c) Interpretar el significado, en términos del problema, del número “10” que figura en la tabla
d) ¿Cuál es la proporción de niños de menos de 7 años que fueron atendidos por quemaduras en
este grupo?
e) Si se considera la ciudad “Quemucho” es representativa de las ciudades de la Argentina respecto
a los casos de niños atendidos por quemadura durante la última Navidad:
e.1) Estimar la proporción de niños menores de 7 años que fueron atendidos por quemaduras durante
la última Navidad en las ciudades de Argentina, con un 95% de confianza.
e.2) ¿Se puede afirmar, con un nivel de significación del 1%, que la edad media de los niños que se
atendieron en la última Navidad en Argentina es superior a 7 años? Suponga que la variable cumple la
condición de normalidad.

SOLUCIÓN
a) X: “edad de un niño atendido, por quemaduras en la última Navidad, en los hospitales y centros asisten-
ciales de la ciudad “Quemucho”. Variable aleatoria cuantitativa discreta.
b)
Edad fi Fi hi Hi
3-5 3 3 0,094 0,094
5-7 8 11 0,250 0,344
7-9 10 21 0,312 0,656
9-11 7 28 0,219 0,875
11-13 4 32 0,125 1,000

c) f3= 10 niños, de entre 7 y menores a 9 años, fueron atendidos por quemaduras en la última Navidad en
los hospitales y centros de asistencia de la ciudad “Quemucho”.

d) Me fijo en la columna Hi, y la que corresponde a lo pedido es H2=0,344, siendo esa la proporción de
niños menores de 7 años que fueron atendidos la última Navidad en los hospitales y centros de atención
sanitaria de “Quemucho”.

67
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística

e)
e.1) Los niños menores de 7 años atendidos por quemaduras, son 11 de los 32 atendidos por quema-
duras en los centros sanitarios de la localidad de “Quemucho”, por lo que la estimación puntual de la pro-
porción es: p̂ =0,344. Como estamos diciendo que dicha localidad es representativa de las ciudades de
Argentina, entonces estimaremos la proporción poblacional de niños menores de 7 años que fueron aten-
didos por quemaduras, la última Navidad, en centros sanitarios y hospitales de Argentina.
El intervalo de confianza del 95% correspondiente es:

p̂ ∙(1-p̂ ) 0,344∙0,656
p̂ ∓ Z1-α √ = 0,344 ∓ 1,96√ = 0,344 ∓ 0,165= [0,179;0,509]
2 n 32

Con un nivel de confianza del 95%, se espera que el intervalo [0,179; 0,509] contenga la verdadera propor-
ción de la población de niños menores de 7 años atendidos por quemaduras en los hospitales y centros de
atención sanitaria de Argentina en la última Navidad.

e.2) La hipótesis de trabajo es: la edad media de los niños que se atendieron en la última Navidad en
Argentina es superior a 7 años

Condición para elegir la variable pivotal: X ~ N(μ, σ2)


Hipótesis estadísticas:
H0 : μ = 7
H1 : μ > 7
Nivel de significación:  = 0,01

Variable pivotal: como se supone que la variable se distribuye normal pero la varianza poblacional es
desconocida se utiliza una t-student.
X̄ - μ
t= tn-1
S
√n

La región crítica está definida por: t31 ≥t31;0,99 ≅t30;0,99 =2,457

Regla de decisión: Rechazo H0 si tobs  2,457 y No Rechazo H0 si tobs < 2,457

2
Los datos a tener en cuenta son: X̄ =8,0625 ; S =5,54 por lo tanto S=2,35

X̄ - μ 8,0625 - 7
tobs = = = 2,55
S⁄ 2,35

√n √32
Decisión: Rechazo H0 pues 2,55>2,457

Conclusión: Con un nivel de significación del 1% hay evidencia suficiente para rechazar la hipótesis nula
(H0 : μ=7), por lo que se puede decir que la edad media poblacional de los niños que se atendieron por
quemaduras en la población de los pacientes de los hospitales y centros de atención sanitaria en la última
Navidad en Argentina es superior a 7 años.

EJERCICIO 5) En un establecimiento dedicado a la cría de llamas se han instaurado prácticas de selección


y mejoramiento durante los últimos tres años. Para estudiar si dichas prácticas han sido productivas, se
seleccionan aleatoriamente 50 animales del rodeo general, y se registra en los mismos el peso del vellón
luego de la esquila. Estos resultados permitirán evaluar si se ha conseguido el objetivo propuesto de au-
mentar la producción en el establecimiento. Por referencias históricas, para esta variable, antes de la im-
plementación de las técnicas de manejo, sabemos que el peso del vellón se distribuye normalmente con
una media de 4,5 kg y un desvío de 1,5 kg.

68
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística

Los datos registrados fueron ordenados en la siguiente tabla:

[ ; ) x’i fi
4,45 - 4,70 4,58 3
4,70 - 4,95 4,83 9
4,95 - 5,20 5,08 7
5,20 - 5,45 5,33 13
5,45 - 5,70 5,58 7
5,70 - 5,95 5,83 9
5,95 - 6,20 6,08 2

a) Presentar los resultados de su investigación gráficamente, comentando lo observado en ellos.


b) Estimar puntualmente el parámetro de interés
c) Verificar, al 5%, si el objetivo de la selección se ha alcanzado
d) Estimar la varianza del peso de los vellones, puntualmente y mediante un intervalo de 95% de
confianza, para responder la siguiente respuesta: ¿se mantiene el mismo valor de varianza luego
de aplicar las prácticas de mejoramiento productivo?

SOLUCIÓN
La variable en estudio es X: “peso del vellón de una llama del establecimiento dedicado a la cría, luego de
la esquila”, medido en Kg.

a) Los resultados se pueden representar mediante el histograma y/o el boxplot. Ambos muestran que la
distribución de la variable es simétrica.

b) El parámetro de interés es la media poblacional del peso del vellón de la población de las llamas,
luego de esquilado, del establecimiento en el que se emplearon técnicas de mejoramiento produc-
tivo.
x'i ∙ fi 265,75
X̄ = ∑ = = 5,315kg
n 50
i

69
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística

Si trabajamos con InfoStat ® obtenemos las medidas resumen:


Estadística descriptiva
Variable n Media D.E. Mín Máx Mediana Q1 Q3
PesoVe 50 5,312 0,419 4,500 6,100 5,350 5,000 5,600

c) El objetivo propuesto, descripto en el enunciado es el de “aumentar la producción en el estableci-


miento”, con lo cual debe considerarse que, para esta variable, es necesario que el peso medio de los
vellones luego de la esquila sea superior a 4,5 Kg.

Condición para elegir la variable pivotal: X ~ N(μ, σ2)


Hipótesis estadísticas:
H0 : μ ≤ 4,5
H1 : μ > 4,5
Nivel de significación:  = 0,05
Variable pivotal: Como X se distribuye normalmente y se conoce la varianza poblacional entonces se
utiliza :
x̄ - μ
Z= σ N(0,1)
√n
La región crítica es: Z  Z0,95 = 1,64
Regla de decisión: Rechazo H0 si Zobs ≥ 1,64
No rechazo H0 si Zobs < 1,64
X̄ - μ 5,315 - 4,5 0,815
Zobs = σ = = = 3,84 > 1,64, por lo que la decisión es Rechazo H0
1,5 0,2121
√n √50
Podemos concluir que, con un nivel de significación del 5%, existen suficientes evidencias para decir que
el verdadero valor del peso medio de la población de los vellones de las llamas, luego de la esquila, es
mayor a 4,5 Kg, en el establecimiento en el que se han implementado prácticas de mejoramiento productivo.
A partir de esto podemos decir que el objetivo se ha cumplido.

d) Para estimar puntualmente la varianza, debemos calcular S2. A partir de la tabla de frecuencias obte-
nemos: ∑i x'i ∙fi =265,75 ; ∑i x'2
i ∙fi =1420,6375

2 1 (Σxi 'fi )2 1 (265,75)2 1


Sx = [Σx'2
i if - ] = [1420,6375- ] = [1420,6375 - 1412,4613]≅ 0,1669(𝑘𝑔)2
n-1 n 49 50 49

El intervalo de confianza del 95% correspondiente es:


2
(n-1)S 49∙0,1669 8,1781
L.I.= 2 = 2 = =0,1378(Kg)2
χ α χ49;0,975 59,342
n-1;1-
2

2
(n-1)S 49*0,1669 8,1781
L.S.= = = =0,3347(Kg)2
χ2 α χ249;0,025 24,433
n-1;
2

[Notar que como 49 no figura en la tabla de Chi cuadrado, se utilizó 40]

Como conclusión, podemos decir que, con un nivel de confianza del 95%, podemos esperar que el intervalo
[0,1378 (Kg)2; 0,3347 (Kg)2] cubra el verdadero valor de la varianza del peso de los vellones esquilados de
la población de las llamas del establecimiento, luego de introducir mejoras a nivel productivo.

A partir de esto podemos comparar con el valor histórico y, sin realizar la prueba de hipótesis correspon-
diente, tomar una decisión al respecto de si la varianza se modificó o no. Para ello, debemos elevar al
cuadrado el desvío informado, quedando la varianza con un valor: 1,52 = 2,25 (Kg)2.
Las hipótesis que se plantean son: H0: 2 = 2,25 vs H1: 2  2,25. El nivel de significación es del 5%, y se
utiliza la misma información muestral que la usada en el intervalo.
70
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística

La región crítica es bilateral, coincidiendo con el tipo de intervalo de confianza, también bilateral (límite
inferior y límite superior).
La pregunta concreta sería: ¿2,25 es un valor cubierto por el intervalo de confianza? Por lo que vemos, no
es así, dado que el intervalo es [0,1378 (Kg)2; 0,3347 (Kg)2]. A partir de esto tomamos como decisión
rechazar la hipótesis nula, al 5%, ya que hay evidencias suficientes para decir que la varianza poblacional
del peso de los vellones, luego de la esquila, de la población de las llamas del establecimiento en el que
se implementaron prácticas de mejoramiento productivo es distinto a 2,25 (Kg)2.
A los fines prácticos, esto indica que en este sentido también se observa la mejora, dado que los pesos
tienen menor dispersión, y se logra mayor homogeneidad en ellos.

EJERCICIO 6) Un grupo de investigadores supone que el peso medio al nacer de lechones de raza Lan-
drace es de 500g, para ello se toma de la población en estudio una muestra aleatoria de 21 lechones al
nacer y se pesan. Las mediciones obtenidas son:

Pesos
529,77 541,08 467,91
462,75 486,04 542,15
464,20 539,94 495,13
489,17 489,07 531,73
531,09 500,65 527,88
502,35 456,89 512,13
523,15 535,15 499,75

Se sabe por estudios previos que la distribución de esta variable en esta población en particular no es
normal, si bien puede considerarse simétrica. Usar α=0,05 para probar la sospecha de los investigadores.

Variable. X:” peso al nacer en gramos de un lechón de raza Landrace”

Hipótesis de trabajo: El peso medio al nacer de lechones de raza Landrace es de 500g

Solución. Debido a la falta de normalidad de la variable respuesta y al tamaño de muestra chico no se


puede realizar un test paramétrico exacto ni asintótico.

Dado que: la variable es cuantitativa, por lo tanto es de escala superior a la ordinal, y al comentario “puede
considerarse simétrica….” se dan las condiciones para realizar el test de Wilcoxon.

Condiciones para elegir la variable pivotal:


1) La variable aleatoria X (peso al nacer en gramos de un lechón de raza Landrace) es de escala por lo
menos ordinal.
2) La distribución de X (peso al nacer en gramos de un lechón de raza Landrace) es simétrica.

Las hipótesis de interés son, entonces:

Ho: θ = 500 vs H1: θ ≠ 500

Denotando con θ a la mediana poblacional de la distribución subyacente.


(θ = mediana poblacional del peso al nacer (en gr) de los lechones raza Landrace)

Restando el valor de la mediana propuesto bajo H0 (500g) a cada observación y ordenando esas diferencias
según sus valores absolutos, se obtienen los siguientes resultados:
Ordenamos los valores absolutos de las observaciones y les asignamos un rango a cada una de ellas en
este ordenamiento.

71
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística

Los rangos obtenidos en este ordenamiento son:

x x- θ Ri
499,75 -0,25 1
500,65 0,65 2 (+)
502,35 2,35 3 (+)
495,13 -4,87 4
489,17 -10,83 5
489,07 -10,93 6
512,13 12,13 7 (+)
486,04 -13,96 8
523,15 23,15 9 (+)
527,88 27,88 10 (+)
529,77 29,77 11 (+)
531,09 31,09 12 (+)
531,73 31,73 13 (+)
467,91 -32,09 14
535,15 35,15 15 (+)
464,2 -35,8 16
462,75 -37,25 17
539,94 39,94 18 (+)
541,08 41,08 19 (+)
542,15 42,15 20 (+)
456,89 -43,11 21

Construimos el estadístico T+, sumando los rangos correspondientes a las diferencias Positivas:

T+ = 2+3+7+9+10+11+12+13+15+18+19+20 = 139

Debemos comparar el valor obtenido de T+ (en este caso 139) con los valores críticos de la distribución
de Wilcoxon. T+ tendrá una distribución exacta T n cuyos valores críticos se encuentra en la tabla de
“Prueba de rangos con signos de Wilcoxon”. En nuestro ejemplo: VP: T + ~ T21

Valores Críticos: la tabla sólo ofrece los valores críticos inferiores para cuando se trabaja a una cola o a
dos colas con ciertos niveles de significación. Si se necesita algún valor crítico superior, se deberá hallar
mediante la fórmula:
n(n+1)
Tn;1-α/2 = - Tn;α/2
2

En nuestro caso, la región crítica es bilateral, por lo que tendremos que usar la fórmula anterior para calcular
el valor crítico superior. Buscamos en la tabla el valor crítico inferior, T 21; 0,025 = 59, y aplicamos la fórmula

n(n+1) 21(21+1)
T21;0.975 = -T21;0.025 = -59=172
2 2

La región crítica, es: (T+  59)  (T+  172)

Regla de decisión: Rechazo H0 si T+  59 ó T+  172


No Rechazo H0 si 59 < T+ < 172

72
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística

Como 59 < 139 < 172, la decisión es no rechazar Ho, es decir que no tenemos evidencia de que el peso
mediano poblacional al nacer de los lechones de la raza Landrace difiera de 500g, con un nivel de signifi-
cación del 5%.

Conclusión: Con un nivel de significación del 5% no existen evidencias suficientes para rechazar H 0 (Ho: θ
= 500), por lo tanto podemos concluir que la mediana poblacional del peso al nacer de los lechones de raza
Landrace es de 500 gramos, en la población de lechones Landrace.

Importante: Si la distribución no es simétrica, la conclusión dada no sería válida. Al no ser simétrica, el


rechazo de Wilcoxon podría indicar simplemente eso.

En caso de tener otro par de hipótesis, la selección del valor crítico correspondiente se realizará según la
siguiente tabla:

H0 H1 Región crítica
H 0 :   0 H1 :   0 nn  1
T   Tn; / 2 ó T    Tn; / 2
2
H 0 :   0 H1 :   0 T   Tn;
H 0 :   0 H1 :   0 nn  1
T   Tn;
2

PROBLEMAS PROPUESTOS
EJERCICIO 1) Un lote de 25 animales recibe una ración durante un período de 60 días. A partir de las
ganancias de peso por animal, se calcula x = 420 g/día y s = 100 g/día. Al nivel de significación del 5%:
a) ¿es sustentable la hipótesis de que el tratamiento produce una ganancia media de peso mayor a 400
g/día?
b) ¿Cuáles son las condiciones que necesitan cumplirse para que la prueba anterior sea válida?
c) Responda el punto a) suponiendo que  = 90 g/día.

EJERCICIO 2) Para estudiar la respuesta de un nuevo método de medición de la concentración de una


sustancia química, se hacen 10 mediciones a una concentración fija. Los resultados son los siguientes:
3,04 3,88 3,53 2,98 3,09
3,38 3,12 3,56 3,71 3,43

Shapiro-Wilks (modificado)
Variable n Media D.E. W* p(una cola)
Concentr 10 3,37 0,31 0,91 0,4330

Considerando que el método anterior tiene varianza 2=1,20, decida si el nuevo método es mejor que el
anterior (=0,05).
Indique:
a) Verificación la condición para la elección de la variable pivotal:.................................................................
b) Hipótesis de trabajo: .....................................................................................................................................
c) Hipótesis estadísticas: ..................................................................................................................................
d) Región crítica: ...............................................................................................................................................
e) Población en estudio: ...................................................................................................................................

EJERCICIO 3) Los investigadores desean probar si la proporción de pacientes cuya úlcera sanó después del
tratamiento con cimetidina supera el 50%. Para ello se administra la droga a 66 enfermos y luego de 6 semanas
resultaron 43 pacientes curados. Probar la hipótesis de interés (=0,05).

73
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística

Indique sólo: variable en estudio, distribución de la misma, región crítica, decisión, interpretación biológica
del nivel de significación de la prueba, parámetro en estudio y su interpretación biológica acorde a la decisión
tomada.

EJERCICIO 4) En un laboratorio se realizaron determinaciones de glucosa en sangre en 11 caninos. Los


valores obtenidos, expresados en mg/dl, son:
63 - 74 - 81 - 92 - 83 - 69 - 82 - 98 - 74 - 80 - 64
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Glucosa 11 78,18 10,88 0,94 0,6732

A partir de estos valores, ¿puede sustentar la hipótesis de que el valor de la desviación estándar poblacional
de la glucosa en sangre no supera el valor 9 mg/dl? ( = 0,05).
Indique: variable en estudio, condiciones para la elección de la variable pivotal, hipótesis estadísticas, regla
de decisión, decisión, parámetro en estudio y su interpretación biológica acorde a la decisión tomada, y
respuesta a la pregunta planteada.
Si posteriormente se informa que el desvió poblacional es de 10 mg/dl ¿qué error se cometió? ¿cuál es la
probabilidad?

EJERCICIO 5) Un profesor de estadística, al final del cuatrimestre, les pregunta a los alumnos si han asis-
tido a clases de consulta, en dicho cuatrimestre, codificando como 0 (no asistió) y 1 (asistió). Las respuestas
codificadas reportadas por cada estudiante son las siguientes:
00001000000000101011001010101000
10001000001000100001100000000001
Se solicita:
a) Definir y clasificar la variable
b) Construir una tabla de frecuencias.
c) Si se define una variable que cuenta la cantidad de alumnos que utilizan los horarios de consulta por
comisión:
c.1) ¿Qué distribución tiene dicha variable? Interprete los parámetros.
c.2) Suponiendo que todas las comisiones tienen cupo de 64 alumnos, y en base a la información
anterior, ¿cuál es la estimación puntual del parámetro “proporción de alumnos que no utilizan el horario de
consulta”?
c.3) Considerando la distribución de la variable con los valores de los parámetros dados por lo obtenido
en c.2), se pide calcular la probabilidad de que, entre 20 alumnos elegidos al azar de esta población, 10 de
ellos NO usen el horario de consulta.
c.4) Suponiendo que se abre una nueva comisión de sólo 20 alumnos y considerando la misma pro-
porción de éxitos que en el inciso anterior, ¿cuál es la probabilidad de que más de 15 no utilicen el horario
de consulta? ¿cuál es la probabilidad que entre 5 y 15 lo utilicen?
c.5) La Docente “My Plantas” afirma que “al menos el 30% de los alumnos utilizan el horario de con-
sulta”, por lo cual propone no suspenderlo. Al nivel de significación del 5%, ¿qué puede decir de dicha
afirmación?

EJERCICIO 6) Un establecimiento pecuario estaría dispuesto a implementar un sistema de inseminación


artificial a tiempo fijo si mediante el mismo puede garantizarse un porcentaje de preñez que supere el 60%
en la primera inseminación. Se realiza un experimento con 25 animales y se obtiene una estimación del
parámetro de interés:
IC90% (0,62; 0,90)
a) Verifique si es válido implementar el sistema de manera tal de poder asegurarle al productor que
la decisión será tomada con una probabilidad de error igual o inferior al 5%. ¿qué error de decisión
se pudo haber cometido en términos del problema?
b) A la luz de estos resultados si se inseminaran 150 animales, ¿cuál sería el número de animales
preñados esperado?

74
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística

EJERCICIO 7) Se midieron los tiempos de coagulación de pacientes con trastornos hepáticos severos (en
seg) de veintidós pacientes para estudios prequirúrgicos y se quiere testear si el valor central de dicho
tiempo en la población de estudio es superior a 11 seg; los datos recogidos se exhiben a continuación:

9,9 12,56 13,71 11,47 9,74 14,72 11 7,99 8,5 12,5 8,96
13 14 10,41 11,77 17,64 23,77 15 11,24 14 8,17 10,15
Plantee las hipótesis adecuadas para el problema sabiendo que los datos son simétricos.
Realice el test correspondiente al nivel del 5%.
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Tpo de Coagulación 22 12,28 3,57 0,88 0,0290

Estadística descriptiva
Variable n Media D.E. Mín Máx Mediana
Tpo de Coagulación 22 12,28 3,57 7,99 23,77 11,62

EJERCICIO 8) La Haemobartonella en caninos es un parásito que se adhiere a la membrana del glóbulo rojo,
provocando una severa anemia hemolítica con pirexia y hemoglobinuria.
Para realizar estudios en la cuidad de Buenos Aires se toman muestras de sangre a 19 caninos y se obtienen
los resultados de hemoglobina. A partir de los mismos se desea saber si el valor central de la concentración
de hemoglobina en los perros parasitados es inferior a 11,5 g, al nivel del 5%. (Suponga que la variable en
estudio tiene distribución simétrica).

Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Hemoglobina 19 11,72 1,89 0,86 0,0196

Prueba de Wilcoxon
Obs.(1) Obs.(2) N Suma(R+)
Hemoglobina Hemoglobina11.5 19 127,50

EJERCICIO 9) Un veterinario dedicado a la nutrición animal, está formulando una nueva ración para equi-
nos deportivos de prueba completa, considerando el tipo de entrenamiento, la composición, cantidad y
forma de suministrar el alimento. Se desea evaluar la Energía Digestible (ED) de la Alfalfa.
El veterinario utilizará dicho forraje sólo si el valor central de la ED es mayor a 2 Mcal/kg MS.
Trabajando con un nivel de significación del 10%, ¿qué decisión tomará el veterinario? Según la decisión
tomada, ¿se justificaría hacer un intervalo de confianza? Explique qué error de decisión pudo haber come-
tido en términos del problema.

Nota: Utilizar la información que considere necesaria.

Shapiro-Wilks (modificado)
Variable n Media D.E. W* p(Unilateral D)
ED 15 2,08 0,35 0,97 0,9304

Medidas resumen
Variable n Media D.E. Var(n-1) Mín Máx Mediana
ED 15 2,08 0,35 0,12 1,45 2,87 2,03

Prueba t para una media


Valor de la media bajo la hipótesis nula: 2
Variable n Media DE LI(95) T p(Unilateral D)
ED 15 2,08 0,35 1,92 0,84 0,2086

75
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística

EJERCICIO 10) En los últimos años se están realizando exámenes de líquido sinovial (LS) como complemento
diagnóstico de artropatías en equinos, mediante los cuales se estudian las propiedades fisicoquímicas del LS,
entre ellas la glucosa, que normalmente toma valores centrados en 0,76 g/l.
La disminución de la glucosa es común en las artritis infectadas, llegando incluso a valores muy pequeños.
Se estudian 24 muestras de LS de equinos que están fuera competencia debido a esta patología y se desea
saber si presentan un nivel de glucosa inferior al normal.

a) Trabajar con un nivel de significación del 5%, suponiendo que la distribución de la variable es si-
métrica. Establecer variable en estudio, hipótesis de trabajo, condiciones para elección de variable pivotal,
hipótesis de interés, Región Crítica, Decisión, Conclusión y responder la pregunta del investigador.
b) Si la distribución de la variable no fuera simétrica, ¿se podría aplicar Wilcoxon?

Los resultados obtenidos son los siguientes

0,437 0,447 0,589 0,448


0,473 0,465 0,726 0,458
0,484 0,462 0,488 0,77
0,457 0,441 0,405 0,49
0,472 0,443 0,599 0,481
0,765 0,423 0,789 0,798

Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Gluc. 24 0,53 0,13 0,72 <0,0001

Prueba T para un parámetro


Valor del parámetro probado: 0,76
Variable n Media DE LS(95) T p(Bilateral)
Gluc. 24 0,53 0,13 0,58 -8,44 <0,0001

Prueba de Wilcoxon (muestras apareadas)


Obs.(1) Obs.(2) N Suma(R+) E(R+) Var(R+) p(2 colas)
Gluc. Gluc. 0.76 24 11,00 150,00 1225,00 0,0016

76
-PRUEBA DE HIPÓTESIS-
Guía de Trabajos Prácticos
2023 · Bioestadística

PROBLEMAS COMPLEMENTARIOS UNIDADES 1, 2 y 3


1.- Para estudiar el efecto teratogénico de los aminoglucósidos se emplearon 15 ratas preñadas. Por estudios
anteriores se conoce que el 5% de los individuos tratados con este grupo de fármacos, tienen crías con
alteraciones neurológicas.

a) Definir la variable en estudio.


b) ¿Verifica la variable las condiciones de Binomialidad?
c) Calcular la probabilidad de que haya 7 ratas con alteraciones en sus crías.
d) Calcular la probabilidad de que haya más de 4 con alteraciones en sus crías.
e) Calcular la probabilidad de que haya 12 ratas sin alteraciones en las crías.
f) Calcular la E(X)

2.- Se tienen dos jaulas con conejos, la primera con 2 blancos y 4 grises, y la segunda con 5 blancos. Se
selecciona un conejo de la primera jaula al azar y se lo coloca en la segunda. Luego se selecciona un conejo
de la segunda jaula. ¿Cuál es la probabilidad de que el conejo de la segunda jaula sea blanco si:
a) el primero fue gris?
b) el primero fue blanco?

3.- Se desea probar el efecto letal de una toxina, que se inyecta a huevos embrionados. Luego del período
considerado suficiente para obtener el efecto tóxico, se hace el recuento de embriones muertos por cada
bandeja de la incubadora:

8 7 7 5 9 10 12 8 6 12 6 5 10 9 5 11 15 16

8 10 6 8 12 10 6 8 15 7 11 12 5 6 7 9 5 15
9 10
14
a) Indicar y clasificar la variable en estudio. 13
b) La unidad de observación es ..............................
Embriones muertos

12
c) Ordenar los datos en una tabla de distribución de
frecuencias. 11

d) Interpretar f4 , h2 , F3 , H6. 10
e) Construir los gráficos correspondientes.
9
f) Calcular las medidas de tendencia central y de disper-
sión. 8

g) Interprete el Boxplot correspondiente a los datos de 7

esta muestra. 6
h) A partir de la información del punto anterior clasifique la
5
distribución de la variable con respecto a la simetría.

4.- a) Clasificar las siguientes distribuciones según sean simétricas o no.

Gráf. A: ........................................... Gráf. B: ................................................

77
-COMPLEMENTARIOS 1, 2 y 3-
Guía de Trabajos Prácticos
2023 · Bioestadística

Gráf. C: ........................................... Gráf. D: ............................................

b) A cada histograma le corresponde un gráfico de caja. De acuerdo a la observación que usted realiza,
¿cuáles son los pares de gráficos correspondientes?
...................................................................................................................................

5.- Un especialista en ictiología tropical está interesado en calcular cuánto tiempo puede vivir cierto tipo de
pez en aguas con determinado porcentaje de toxicidad. Luego de una larga serie de experimentos llega a
concluir que la vida media de este tipo de pez alcanza los 90 días, con una desviación estándar de 20 días. En
apariencia, la distribución de los días sobrevividos es normal.
a) ¿Cuál es la probabilidad de que un pez viva más de 120 días?
b) ¿Cuál es la probabilidad de que un pez viva entre 90 y 125 días?
c) ¿Cuál es la probabilidad de que un pez viva menos que la media de vida?
d) Sin utilizar tabla, ¿entre qué valores de la variable quedan el 68% de los valores centrales?

6.- El 60% de los bovinos de un establecimiento está parasitado con Fasciola hepática. Al revisar una muestra
de 12 animales,
a) Definir la variable en estudio.
b) ¿Verifica la variable las condiciones de Binomialidad?
c) ¿Cuál es la probabilidad de encontrar a lo sumo 8 parasitados?
d) ¿Cuál es la probabilidad de encontrar 10 que no estén parasitados?
e) ¿Cuál es la probabilidad de encontrar 8 animales parasitados?
f) ¿Cuál es la probabilidad de encontrar por lo menos 8 animales parasitados?
g) Calcular la E(X)

7.- El Servicio de Sanidad Ambiental luego de realizar tareas de desinfección y desratización en el área vecina
a una nueva autopista, hizo el recuento de ratas muertas por manzana, en parte del área afectada:
20 15 30 18 15 18 21 27 19 12 19 18 26
18 19 18 19 21 19 19 20 20 20 26 15
a) Definir y clasificar la variable en estudio.
b) Clasifique como Verdadera o Falsa la siguiente oración: “La unidad de observación es una rata.” Justifique
su respuesta.
c) Ordenar los datos en una tabla de distribución de frecuencias.
d) Interpretar f5 , H2
e) Construir los gráficos correspondientes.
f) Calcular las medidas de tendencia central y de dispersión.
g) Interprete el Boxplot correspondiente a los datos de esta muestra.
h) Con toda la información anterior, clasifique la distribución de la variable con respecto a la simetría.

78
-COMPLEMENTARIOS 1, 2 y 3-
Guía de Trabajos Prácticos
2023 · Bioestadística

31

26

Ratas muertas
21

16

11

8.- Al estudiar la influencia de la dieta en el contenido de hemoglobina en sangre, se tomaron tres grupos
de animales y se alimentaron con tres raciones distintas. Si se supone que las dietas tienen distinto
comportamiento en cuanto a la variabilidad del contenido de hemoglobina, ¿qué medida recomendaría para
determinar:
a) la dieta que presenta mayor variación absoluta en el contenido de hemoglobina en sangre?
b) la dieta que presenta mayor variación relativa en el contenido de hemoglobina en sangre?
Justificar la respuesta.

9.- En una población de animales, la presión sistólica en reposo se distribuye normalmente con  = 115 mm
de Hg y 2 = 225 (mm de Hg)2. Hallar la probabilidad de que un animal de esta población tenga:
a) presión sistólica inferior a 140 mm de Hg.
b) presión sistólica entre 110 y 120 mm de Hg.
c) la presión sistólica por debajo de la cual está el 99% de la población.

10.- Un conjunto de vacas está constituido por 2 razas R1 y R2, clasificadas según estén o no vacunadas, V
y NV.
R1 R2 TOTAL
V 80 200 280
Se selecciona un animal al azar. Calcular la probabilidad de
que: NV 120 0 120
a) esté vacunado. c) sea de R2 sabiendo que está vacunado
b) esté vacunado y sea de R2. d) esté vacunado o sea de R2.

11.- Se comprobó que en un establecimiento de cría el 5% de los lechones que nacen son hermafroditas. Si
se extraen 12 animales al azar,

a) Definir la variable en estudio


b) ¿Verifica la variable las condiciones de Binomialidad? ¿Por qué?
c) Calcular la probabilidad de que se encuentren 2 animales normales.
d) Calcular la probabilidad de que se encuentren a lo sumo 3 normales
e) Calcular la probabilidad de que se encuentren por lo menos 4 hermafroditas.
f) Calcular la E(X) y la V(X)
12.- El 10% de los animales de un establecimiento pecuario dedicado a la cría de Aberdeen Angus no está
vacunado contra fiebre aftosa. Si se revisa un lote de 15 animales elegidos al azar,
a) Definir la variable en estudio.
b) ¿Verifica la variable las condiciones de Binomialidad?
c) Calcular la probabilidad de que ninguno de los animales esté vacunado.
d) Calcular la probabilidad de que, como máximo, el 20% no esté vacunado,
e) Calcular la probabilidad de que, como mínimo, 7 animales no estén vacunados,
f) Calcular la probabilidad de que haya entre un 40% y un 80% de animales vacunados.
g) Si se envían 200 animales al frigorífico, ¿cuál es la cantidad esperada de no vacunados?

79
-COMPLEMENTARIOS 1, 2 y 3-
Guía de Trabajos Prácticos
2023 · Bioestadística

13.- Se comprobó que cabras preñadas a partir de cruzamientos consanguíneos tienen un 30% de
probabilidad de parir crías con prognatismo superior, produciendo la consecuente muerte del animal por
imposibilidad de succionar en forma normal. Para 10 hembras preñadas en esas condiciones,
a) Definir la variable en estudio.
b) ¿Verifica la variable las condiciones de Binomialidad?
c) ¿Qué probabilidad hay de que 5 tengan sus crías normales?
d) ¿Qué probabilidad hay de que 4 tengan sus crías no normales?
e) ¿Qué probabilidad hay de que entre 5 y 7, inclusive ambos extremos, tengan sus crías normales?
14.- Si el número de casos favorables al suceso A es 40 y el número de casos favorables al suceso no A es
80, entonces la probabilidad de ocurrencia del suceso A, será (Seleccione la respuesta correcta y argumente
brevemente):
a) p(A) = 0,50 c) p (A) = 0,33
b) p(A) = 0,67 d) p (A) = 0,05
15.- Calcular la probabilidad que corresponde al área comprendida entre los siguientes valores tabulares y
representarla gráficamente:
a) Z = -1,96 y Z = 2,20
b) t20 = -1,725 y t20 = 2,845
c) 302 = 16,79 y 302 = 50,89

16.- La edad en meses en que aparece la parvovirosis tiene distribución normal, siendo la media de 5,5, con
un desvío estándar de 2 meses. Al recibir en consulta un perro enfermo, ¿cuál es la probabilidad de que tenga:
a) entre 2 y 7,5 meses?
b) más de 4 meses?
c) menos de 1 año?
17.- La probabilidad de que Juan Sonrisa se levante malhumorado, en la semana, es 0,1 y cada vez que
comienza un nuevo día es independiente de lo que haya sucedido el día anterior.
a) Definir la variable en estudio.
b) ¿Verifica la variable las condiciones de Binomialidad?
c) ¿Cuál es la probabilidad de que 2 días de la semana se levante malhumorado?
d) ¿Cuál es la probabilidad de que más de la mitad de la semana se levante malhumorado?
e) Calcular la E(X)
18.- Considerando que la variable aleatoria t tiene distribución de Student con 25 grados de libertad,
a) Calcular la probabilidad de que:
a.1) t sea mayor que 2,48
a.2) t esté comprendido entre -1,32 y 1,71
b) Hallar el valor tp, tal que deje el 95% de los valores por debajo de él.
19.- Sea la variable aleatoria Z, definida en el intervalo (0,1), con una función de densidad: f(z) = 3/2(1 - z2 ),
y función de distribución:

Calcular:
a) P (z  0,8) d) P (z > 1/2)
b) P (0,5 < z < 1) e) P (z  0)
c) P (z > 1,5)

20.- En una fábrica de lámparas UV se realiza el control de las partidas antes de que salgan a la venta. Uno
de los controles corresponde a la duración, medida en horas. Un día en particular llegan al laboratorio 25 de
ellas, obteniéndose los siguientes resultados:

80
-COMPLEMENTARIOS 1, 2 y 3-
Guía de Trabajos Prácticos
2023 · Bioestadística

Duración (hs) fi hi
170 - 180 3/25
180 - 190 4/25
190 - 200 8/25
200 - 210 6/25
210 - 220 4/25
a) Definir la variable y clasificarla.
b) La unidad de observación es ................................................................................
c) Completar la distribución de frecuencias y graficar hi y Fi.
d) El “8” de la columna de fi significa que se observaron:
i. 8 lámparas de luz UV con una duración de hasta 200 horas.
ii. Hasta 8 lámparas de luz UV con una duración entre 190 hasta 200 horas.
iii. 8 lámparas de luz UV con una duración entre 190 hasta 200 horas.
e) Calcular la media, la varianza y el C.V.
f) Determinar los intervalos mediana y modal.
g) ¿Cuál es el porcentaje de lámparas con una duración menor a 200 hs?
h) La distribución de la variable es ................................. ¿Por qué?
i) En la última semana el proceso de manufactura sufrió modificaciones que llevarían a un aumento en el
10% de la duración de las lámparas.
i. ¿Qué valor numérico tiene la media luego de la modificación?
ii. ¿Qué valor numérico tiene la varianza luego de la modificación?

21.- Sea X una variable aleatoria que representa el nivel normal de glucosa en sangre. Se supone que esa
variable X tiene una distribución aproximadamente normal, con media  = 95mg/100ml y desviación estándar
 = 6mg/100ml. ¿Para qué nivel de glucosa en sangre se puede tener un 90% de probabilidad de encontrar
un individuo que lo supere?
22.- Se comprobó que el 20% de los perros adultos que llegan a consulta por motivos diversos, dan respuesta
positiva al análisis de materia fecal, sin presentar síntomas clínicos de parasitosis. Calcular, sobre una muestra
de 14 animales atendidos en forma sucesiva durante una jornada,
a) Definir la variable en estudio.
b) ¿Verifica la variable las condiciones de Binomialidad?
c) Calcular la probabilidad de hallar como máximo 7 animales parasitados.
d) Calcular la probabilidad de hallar exactamente 5 animales parasitados.
e) Calcular la probabilidad de hallar que 10 o más no estén parasitados.
23.- Un camión jaula que transporta 10 Shorthorn, 5 Polled Hereford, y 7 Aberdeen Angus para participar en
la Exposición Rural de Palermo, sufre un accidente y queda tumbado en la ruta. Se escapan 2 animales.
Calcular la probabilidad de que:
a) sean de la misma raza,
b) uno de ellos sea Polled Hereford,
c) sean de dos razas distintas.
24.- Un experimentador suministró a un grupo de ovejas una hierba tóxica. Se sabe que el tiempo (en hs.)
que transcurre desde la ingestión hasta su muerte se distribuye aproximadamente normal (=15;2=2).
¿Cuánto tiempo transcurrió hasta que murió el 90% de las ovejas?
25.- Sea la función de densidad: f(x) = 2 (x - 3), en [ 3 , 4 ] y

Encontrar:
a) P(x  3,5) c) P(x < 3) f) P(3,8 < x < 4)
b) P(x > 3,5) d) P(x < 5) g) F(X) es la función de............
e) P(3 < x < 3,5)
81
-COMPLEMENTARIOS 1, 2 y 3-
Guía de Trabajos Prácticos
2023 · Bioestadística

26.- Un criadero industrial de conejos obtiene individuos de raza Neocelandés con un peso que se distribuye
normalmente con media igual a 2020 g y desvío estándar de 78 g.
a) ¿Cuál es la probabilidad de que el promedio de peso de los animales de una muestra de 20 supere
los 2 kg?
b) Si se desea mantener como futuros reproductores a los de peso mayor a 2150 g, ¿Cuál es la
probabilidad de que un individuo supere los 2150 g?
27.- Un veterinario sospecha que una nueva hierba introducida en la región donde él se desempeña produce
toxicidad en ovinos. En la primera parte del estudio decide alimentar a un grupo de 15 ovinos con fardo más el
agregado de cierta cantidad de la hierba, para medir el tiempo
que transcurre desde la ingestión hasta la muerte (en horas). Al Intervalos Frecuencias
terminar el experimento obtiene la siguiente tabla: 7 - 10 2
10 - 13 4
a) ¿Cuál es la variable en estudio? Clasificarla.
b) Calcular: media, mediana, modo y C.V. 13 - 16 3
16 - 19 6
c) El “9/15” de la columna de Hi significa que se observaron:
i. De los 15 ovinos, hasta 9 murieron entre las 13 y las 16 horas de haber ingerido el fardo y la
hierba tóxica.
ii. De los 15 ovinos, 9 murieron entre las 13 y las 16 horas de haber ingerido el fardo y la hierba
tóxica.
iii. De los 15 ovinos, 9 murieron entre las 7 y las 16 horas de haber ingerido el fardo y la hierba
tóxica.
d) El veterinario aplica los conocimientos de fisiología ruminal, por lo que decide cambiar el fardo por una
pastura verde, lo que aumentaría en 45% el tiempo que transcurre desde la ingestión hasta la muerte de los
ovinos.
i. ¿Cuál es el valor numérico de la media?
ii. ¿Cuál es el valor numérico del desvío estándar?

28.- Sea la función de densidad: f(x) = 3x2 – 12x + 12 para 1< x  2, con función de distribución

0 para x  1

F ( x)  x 3  6 x 2  12 x  7 para 1  x  2
1 para x  2

Calcular:
a) P ( 1  x < 2 ) d) P ( 0  x  1,5 )
b) P ( x > 1,5 ) e) P ( 1,5  x < 3 )
c) P ( x  1,75 )
29.- En un lote de 20 animales hay 10 normales, 6 con defectos importantes y 4 con defectos leves. Se
escoge uno al azar. Calcular la probabilidad de que sea:
a) sin defectos;
b) sin defectos o con defectos leves.
Suponga que se escoge un segundo animal sin reposición del primero, calcular la probabilidad de que sea:
c) normal, pero sabiendo que el primero escogido fue normal;
d) con defectos importantes, sabiendo que el primero fue con defectos leves.
30.- Encontrar los valores de la variable en la distribución Ji-cuadrado que satisfagan:
a) P( 15; p1  15 
2 2
15;
2
p
2
) = 0,95 y área equivalente en las colas.

b) P( 18  18; p ) = 0,025


2 2

c) P(  46   46; p ) = 0,95
2 2

31.- Los siguientes datos corresponden al dosaje de urea, en mg%, obtenidos en 25 perros sometidos a
pruebas renales en el período operatorio.
[ ; ) 16,5 – 21,9 21,9 – 27,3 27,3 – 32,7 32,7 – 38,1 38,1 – 43,5
Fi 2 6 12 21 25

82
-COMPLEMENTARIOS 1, 2 y 3-
Guía de Trabajos Prácticos
2023 · Bioestadística

a) Definir la variable en estudio y clasificarla.


b) La unidad de observación es ....................................................................
c) Completar la tabla de frecuencias.
d) Realizar los gráficos correspondientes.
e) Calcular medidas de posición.
f) Calcular medidas de dispersión.
g) Indicar cuál o cuales son las medidas más representativas. ¿Por qué?
h) ¿Qué porcentaje de perros tienen menos de 27,3 mg% de urea? NO UTILIZAR REGLA DE TRES
SIMPLE!
32.- Si X es una variable aleatoria discreta, tal que:
xi 0 1 2 3 4
p(xi) 0,1 0,15 0,35 0,25 ....

a) Completar el valor faltante. e) F(xi) es la función de.................


b) Calcular la F(xi) f) Graficar p(xi) y F(xi)
c) p(xi) es la función de................ g) Hallar E(X).
d) Determinar P(X  2 ).
33.- Se arrojaron mil veces cinco monedas equilibradas, y en cada tirada se contó el número de caras. En
base a los resultados obtenidos se construyó la siguiente tabla:
Núm. de caras 0 1 2 3 4 5
hi 0,038 0,144 0,342 0,287 0,164 …….
a) Definir y clasificar la variable considerada.
b) Completar el dato faltante en la tabla.
c) Hallar la función de distribución acumulada.
d) ¿En cuántas tiradas se obtuvieron más de dos caras?
e) Calcular el valor esperado del número de caras en una tirada.
34.- Se detallan a continuación los pesos de 30 pollos, luego de la aplicación de una nueva formulación de
una dieta comercial, elegidos al azar, expresados en Kg.
[ ; ) 1,3 – 1,9 1,9 – 2,5 2,5 – 3,1 3,1 – 3,7 3,7 – 4,3
hi 3/30 8/30 6/30 6/30 7/30
a) Completar la tabla de frecuencias.
b) Realizar los gráficos de frecuencias absolutas.
c) Calcular la media, la mediana y el modo. ¿Cómo clasifica la distribución de la variable?
d) Calcular el coeficiente de variación.
e) En el establecimiento informan que la balanza no estaba calibrada, por lo que los datos deben
aumentarse 0,5 Kg. ¿Cuánto vale la media del peso de los pollos al hacer esta modificación?
35.- Suponiendo que la altura de los estudiantes de un colegio se distribuye normalmente, con media 1,75
m y desvío estándar 0,25 m.
a) Calcular la probabilidad de que el promedio de altura, para una muestra de 36 individuos, sea:
i. mayor que 1,67 m,
ii. entre 1,65 y 1,80 m.
b) Cuántos individuos de la muestra se espera que tengan:
i. altura mayor a 1,85 m,
ii. entre 1,65 y 1,80 m.
36.- Complete las celdas faltantes asumiendo que:
a) A y B son independientes b) A y B son mutuamente excluyentes
p(A) p (B) p (AB) p (AB) p(A) p (B) p (AB) p (AB)
0,60 0,20 0,60 0,20

83
-COMPLEMENTARIOS 1, 2 y 3-
Guía de Trabajos Prácticos
2023 · Bioestadística

c) A intersección B tiene probabilidad 0,15


p(A) p (B) p (AB) p (AB)
0,60 0,20

37.- En un estudio sobre tumores benignos y malignos en felinos se analizaron todos los casos que se
presentaron en el último año en el Hospital Escuela de la Facultad resultando:
Estado de malignidad
benigno maligno
Lugar Cabeza 64 45
del Cara 21 18
Tumor Cuerpo 36 24

Suponga que se seleccionan 2 felinos del grupo antes citado para realizar ciertos estudios.
¿Cuál es la probabilidad de que:
a) ambos tengan tumores malignos?
b) el segundo tenga tumor maligno sabiendo que el primero tiene tumor benigno?
c) uno tenga el tumor en la cabeza y el otro en la cara?
d) el primero tenga un tumor benigno en la cara y el segundo un tumor maligno en el cuerpo?
Nota: En todos los casos especificar: planteo simbólico, sustitución de valores y resultados.

38.- Al personal técnico y profesional de un hospital se lo clasificó según la tarea que realiza y la edad,
obteniéndose la siguiente tabla:
Edad
Hasta 25 Desde 26 a 35 Mayor a 35 total
Médicos 0 70 120 190
Enfermeros 145 520 195 860
Tarea
Laboratoristas 65 42 33 140
Otras 35 260 15 310
Total 245 892 363 1500
a) Del personal del hospital se elige una persona al azar. Aplicar la teoría clásica de probabilidades para
hallar la probabilidad de que:
i. sea médico y tenga más de 35 años
ii. tenga más de 35 años
iii. sea médico sabiendo que tiene más de 35 años
b) ¿Los sucesos “ser médico” y “tener más de 35 años” son independientes? ¿Por qué?
39.- Investigadores que han conducido un estudio de habitación en una cierta ciudad, examinan todas las casas
ubicadas en manzanas seleccionadas aleatoriamente. ¿Constituye esto una muestra simple aleatoria de las
casas de la ciudad?
40.- Para analizar el estado civil de los habitantes de una gran ciudad se tomó un grupo de 500 familias e
individuos solteros. ¿Le parece correcto seleccionar a esas 500 familias e individuos solteros, sólo de la zona
residencial de la ciudad? ¿Por qué?

41.- Con el objetivo de validar la prueba ELISA (Enzyme-Linked Immunosorbent Assay) comercial para la de-
tección de Brucella ovis en la población ovina de la región de Magallanes (Chile), se realizó un estudio donde
evaluó la presencia/ausencia de Brucella ovis y el diagnostico del test en 500 ejemplares, obteniéndose los
siguientes resultados.
Brucella ovis
Infectados No infectados
ELISA Positivo 68 36
Negativo 14 382

84
-COMPLEMENTARIOS 1, 2 y 3-
Guía de Trabajos Prácticos
2023 · Bioestadística

a) Si se selecciona un ovino al azar, ¿cuál es la probabilidad de que no esté infectado o resulte negativo en
la prueba ELISA?
b) Si se seleccionan dos ovinos al azar, ¿cuál es la probabilidad de que el primero esté infectado y el test
de positivo, y el segundo esté infectado y el test de negativo.
c) Calcular la sensibilidad del test.

42.- En la industria de la leche, el descenso crioscópico es usado principalmente para determinar si fue aña-
dida agua a la misma. El máximo tolerado es de -0,5120C, es decir que a valores superiores a este, se co-
rresponden a muestras adulteradas. Se toma una muestra de leche de diferentes tambos y se mide el des-
censo crioscópico de cada una.

[;) -0,530 ; -0,524 -0,524 ; -0,518 -0,518 ; -0,512 -0,512; -0,506 -0,506 ; -0,500
Fi 5 14 19 24 25

a) Definir variable y unidad experimental.


b) Interpretar la celda sombreada.
c) ¿Qué porcentaje de muestras se encuentran adulteradas?
d) Calcular media y desvío estándar.
e) ¿Cómo clasificaría la distribución de esta variable?

43.- Alcat test, es un test de intolerancia alimentaria. Hay sustancias presentes en ciertos alimentos, coloran-
tes o aditivos de uso común en la industria alimentaria que generan reacciones nocivas o agresivas hacia
nuestro organismo. Este test da positivo en caso de presentar intolerancia a cierta sustancia en un 90% de
los casos. Si no la hay, dará negativo en un 80%. La probabilidad de que un individuo presente intolerancia
es de 0,15. Calcular:

a) La probabilidad de que haya intolerancia alimentaria cuando el test dio positivo.


b) La probabilidad de que haya intolerancia y el test de negativo.
c) La probabilidad de que no haya intolerancia o que el test de negativo.

85
-COMPLEMENTARIOS 1, 2 y 3-
Guía de Trabajos Prácticos
2023 · Bioestadística

PROBLEMAS COMPLEMENTARIOS UNIDADES 4 y 5


1.- Se toma una muestra de 25 cerdos en un núcleo de selección. A cada uno se le mide el volumen del
eyaculado, y con los datos se obtuvieron: x  180 ml y s 2  50 ml2. Estimar la media y la varianza poblacional
mediante intervalos de confianza del 95%, sabiendo que la variable tiene distribución normal.

2.- En un cultivo de mejillón a mar abierto, se eligieron al azar 25 mejillones y se los pesó individualmente.
Esta variable, peso, tiene distribución normal. El peso medio fue de 16 g, y el desvío estándar de 5 g. Con una
confianza del 95%:
a) Indicar la estimación puntual del peso medio de la población cultivada y con una confianza del 95%.
b) Calcular el número de individuos necesarios para estimar el peso medio poblacional con un margen
de error de 1,5 g y con una confianza del 95%.

3.- Se tomó una muestra de 16 quesos de la producción del mes de agosto en el establecimiento CRUP SA,
con el objetivo de estimar el peso medio. Los quesos fueron pesados individualmente, y con los datos obtenidos
se estimó el peso medio en 15 kg y el CV en 10%. Suponga que la variable se distribuye normal.
a) Definir la variable en estudio y la población de interés.
b) Indicar la variable aleatoria empleada como pivotal expresando su distribución.
c) Indicar los valores tabulares empleados para el LI y el LS.
d) Estimar el peso medio poblacional mediante un intervalo de confianza del 95% y concluir.

4.- Con datos de una muestra de 25 pollos se estimó la varianza poblacional del peso individual de pollos,
obteniéndose el siguiente intervalo de confianza del 95%: (0,2342 g2; 0,7432 g2). ¿Cuál es el valor de la
estimación de la varianza?
5.- Se desea estimar la varianza del peso individual en una línea de conejos para carne con un coeficiente de
confianza del 95%. A partir de una muestra de 30 conejos se obtuvo una media de 2,40 kg y un desvío estándar
de 0,37 kg.
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Peso 30 2,40 0,37 0,91 0,6113

a) Estimar la varianza poblacional del peso individual mediante un intervalo de confianza del 95% y
concluir.
b) Indicar la variable aleatoria empleada como pivotal expresando su distribución.
c) Indicar los valores tabulares empleados para el LI y el LS.
d) Definir la variable en estudio y la población de interés.
6.- En una muestra de 31 adolescentes que se prestaron como sujetos para un estudio inmunológico, una
variable de interés fue la prueba del diámetro de reacción de la piel a un antígeno. La media y la desviación
estándar obtenidas fueron, respectivamente, 21 y 11mm. ¿Es posible concluir a partir de estos datos y con un
nivel del 5%, que la media de la población es menor que 30mm?
Indique sólo: variable en estudio, condición de distribución requerido para ésta, hipótesis de trabajo, hipó-
tesis estadísticas, región crítica y población en estudio.
7.- En la estimación de la media poblacional de una variable con distribución normal, mediante un intervalo de
confianza del 95% se obtuvieron los siguientes límites: LI = 450 y LS = 550. Si dichos valores se calcularon
con una muestra de 30 elementos, determinar el valor de la media y de la varianza utilizados para determinar
dicho intervalo si 2 es desconocida.
8.- Se tomó una muestra aleatoria de 16 informes de urgencias de los archivos de un servicio de
ambulancias. De ella se obtuvo que el tiempo medio en que las ambulancias llegaban a destino era de 13
minutos. Suponiendo que los tiempos de llegada de las ambulancias siguen una distribución normal con
varianza 9min2, ¿es posible concluir, a un nivel del 5%, que la media de la población es mayor a 10 min?
Indique sólo: variable en estudio, hipótesis estadísticas, regla de decisión, decisión e interpretación biológica
del parámetro en estudio acorde a la decisión tomada.

86
-COMPLEMENTARIO 4 y 5-
Guía de Trabajos Prácticos
2023 · Bioestadística

9.- Un establecimiento avícola cuenta con 5000 gallinas ponedoras. A los fines de la organización, se desea
saber qué tamaño de muestra será necesario para estimar la media poblacional de huevos puestos por
semana, con un nivel de confianza del 95%, si se desea admitir un error no mayor a 0,8 huevos. En un estudio
previo se analizaron 28 gallinas y se obtuvo un promedio individual de 5,4 huevos por semana con una
desviación estándar de 1,8 huevos por semana. Suponiendo que la variable se distribuye normalmente:
a) Definir la variable en estudio.
b) Hallar el tamaño de muestra necesario para satisfacer el nivel de confianza y el error a tolerar.
10.- Se supone que el nivel de proteínas totales en plasma de bovinos adultos se distribuye
aproximadamente normal. ¿Qué tamaño de muestra se tomará si se desea estimar el nivel medio de proteínas
totales, mediante un intervalo de confianza del 95%; con una semiamplitud de 0,7 g/ml; sabiendo que en una
muestra piloto de 10 bovinos, es obtuvo x  9,7 g/ml y s = 1,303 g/ml?
11.- En una muestra aleatoria de 60 ovejas de una zona de la provincia de Santa Cruz, el 20% manifiesta
signos de "cabeza grande". ¿Cuál sería el margen de error de una estimación del 95% para la proporción de
ovejas con esta característica?
12.- Si en el ejercicio 1 (pág. 30) se deseara disminuir un 50% el margen de error en la estimación de 
manteniendo el nivel de confianza:
a) ¿Cuál debería ser el tamaño de la muestra?
b) ¿Cuál sería el tamaño adecuado si Ud. sabe que el núcleo de selección cuenta con una población de 450
machos?
13.- Se compraron lechones para engorde en condiciones de crianza intensiva. Por compras anteriores,
se sabe que la varianza del peso es de 3600 g2. ¿Cuántos lechones habría que tomar en una muestra para
estimar el peso promedio del lote con una confianza del 95% y un error no mayor a 20 g? Suponga que la
variable se distribuye aproximadamente normal.
14.- En un criadero industrial de conejos de Angora, se quiere saber con qué probabilidad el largo promedio
del pelo es de a lo sumo 5 cm, en muestras de tamaño 30.
Si bien se desconoce la distribución del largo del pelo de un conejo de Angora, se sabe que tiene un
promedio de 4,5 cm y un desvío de 2 cm. Justifique el procedimiento empleado.
15.- Los siguientes datos son los consumos de oxígeno (en ml) durante la incubación, de una muestra de 15
suspensiones celulares:
14,0 14,1 14,5 13,2 11,2 14,0 14,1 12,2
11,1 13,7 13,2 16,0 12,8 14,4 12,9
¿Proporcionan estos datos suficiente evidencia, a un nivel del 5%, de que el valor central es de al menos
12ml? Si bien no se tiene información sobre la distribución de la variable, se sabe que es simétrica.
Indique: verificación de la condición requerido a la variable, hipótesis estadísticas, región crítica, regla de
decisión, decisión y población en estudio.
16.- Un grupo de 31 animales, elegidos al azar, recibe una ración por un período de dos semanas. Con los
aumentos de peso se obtuvo: x = 420g y s = 60g. ¿Qué tamaño de muestra se debe tomar si se desea un
margen de error que sea a lo sumo de 10g, para estimar el aumento medio de peso con una confianza de
95%?
17.- En una granja de pollos se desea experimentar con una nueva dieta de engorde. Si se sabe que el
desvío estándar del aumento de peso individual en un mes es igual a 60 g, ¿qué tamaño de muestra se debe
escoger para que la estimación del aumento medio de peso no contenga un margen de error mayor a 16 g,
con una confianza del 95%? Suponga que la variable se distribuye aproximadamente normal.
18.- De una población de vacas lecheras se obtiene una muestra de 1000 vacas que se someten a la prueba
de tuberculina en la tabla del cuello, resultando 90 vacas con resultado positivo. Se desea estudiar si esta
información concuerda con la hipótesis de que la proporción (P) de positivos es 10%.
a) Interpretar el parámetro en términos del problema.
b) Plantear las hipótesis estadísticas correspondientes a esta situación.
c) Expresar variable pivotal y su distribución.
d) Expresar en forma analítica la región critica.
e) Decidir al 5%, justificando la misma. (No redacte la conclusión)

87
-COMPLEMENTARIO 4 y 5-
Guía de Trabajos Prácticos
2023 · Bioestadística

19.- De una población de bovinos se seleccionó una muestra de 25. Sesenta días después de vacunados
contra la fiebre aftosa, fueron sangrados y se determinó el título de anticuerpos contra esta enfermedad
mediante la técnica de seroneutralización en tubos (cultivo celular), obteniéndose una media de 2,3 y una
varianza de 0,64. ¿Confirman estos valores que el título promedio de anticuerpos poblacionales es de 2,5?
 = 0,05.
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Título de ac 25 2,3 0,8 0,91 0,5429

20.- Por una experiencia se ha determinado que los valores de capacidad de cierto tipo de ampollas para
envasar vacunas sigue una distribución normal con media 10ml y desviación estándar 0,1 ml. Luego de dos
años de uso continuo, se toma una muestra de 25 ampollas, obteniéndose una media de 9 ml y una desviación
estándar de 0,2 ml. ¿Puede considerarse, con un nivel de significación del 5%, que se mantiene la variabilidad
luego de 2 años?
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
volumen 25 9,00 0,2 0,87 0,3416

21.- Se ha establecido que la media y la desviación estándar de la longitud del cráneo humano son de 20,5cm
y 3,61cm, respectivamente. Suponga que un explorador descubre una isla, en donde los nativos han estado
aislados del resto del mundo. Una muestra de 25 de estos nativos indica una longitud media del cráneo de
24,6cm. ¿Tienen los investigadores suficiente evidencia para suponer que la longitud media del cráneo de los
habitantes de la isla es superior? Use  = 0,05
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Longitud 25 24,6 3,3 0,91 0,6728
22.- Se estudió el tiempo al primer amamantamiento en 16 cerdos recién nacidos, obteniéndose los
siguientes resultados(en minutos):
7,8 8,0 9,0 10,0 10,9 8,5 9,5 7,0
6,3 8,7 9,1 10,3 9,3 9,7 9,9 9,8
¿Concuerdan estos resultados con la afirmación de que la desviación estándar del tiempo al primer
amamantamiento es mayor a 1,1 min, con un nivel de significación del 5%?

Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Tiempo 16 8,9906 1,2343 0,9506 0,7130

23.- Por razones económicas sólo se continuará fabricando determinado medicamento si es utilizado por
más del 25% de los establecimientos hospitalarios. Para esto se realizó un estudio sobre 150 establecimientos
de los que 40 respondieron que lo usaban. ¿Qué aconsejaría al fabricante, al nivel del 5%?
24.- Una población de insectos de la especie X tiene una longitud media de sus antenas de 3,2 cm y un desvío
estándar de 1,8 cm. De una muestra aleatoria de 16 insectos tomados de la población se obtuvo un promedio
de 2,72 cm y un desvío de 1,16 cm. ¿Puede suponerse, con un nivel de significación del 5%, que hubo una
disminución en la longitud promedio de la antena? Suponga que la distribución es simétrica.

2,07 3,3 2,83 2,18 1,1 3,5 1,42 1,62


4,27 4,08 1,56 4,43 2,2 4,07 1,41 3,5

Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Longitud 16 2,72 1,16 0,87 0,0483

Prueba de Wilcoxon
variable N Suma(R+) E(R+) Var(R+)

88
-COMPLEMENTARIO 4 y 5-
Guía de Trabajos Prácticos
2023 · Bioestadística
Longitud 16 37,00 68,00 373,88
25.- En una muestra de 50 pollitos tratados con una vacuna, se encontraron 10 muertos, ¿cuál es el número
adecuado de pollitos para estimar la proporción de muertos con un error de hasta 10% y una confianza del
95%?
26.- Al estimar el parámetro poblacional , con un nivel de confianza del 95% y una muestra de tamaño 20,
se tienen las siguientes alternativas:
s x
A 10 100
B 11 110
C 9 90
¿En cuál de ellas se tendrá un mayor margen de error en la estimación? Considere que provienen de variables
con distribución normal. Demuestre su respuesta.
27.- Se realizó un estudio para analizar la efectividad de un nuevo medicamento sobre cierta anomalía en
embriones de pollo. Se inyectaron 50 huevos fertilizados y en el vigésimo día de incubación se observó que 12
de ellos presentaban anomalía.
a) Estimar la proporción poblacional de embriones sanos mediante un intervalo de confianza del 95%.
b) ¿Qué cantidad de huevos habría que haber inyectado para que, con un nivel de confianza del 95%,
se pudiera estimar la proporción poblacional de embriones sanos de modo que el margen de error no
sea mayor que 0,1?
28.- Un laboratorio investiga sobre el consumo diario de aves en crecimiento. Con tal motivo se desea
determinar el tamaño de la muestra a tomar para que la semiamplitud de la estimación del consumo medio
diario no supere 5 g, suponiendo que se decide trabajar con una confianza del 95% y que en una muestra
piloto de 30 aves se obtuvo un promedio de 100 g y una varianza de 490 g2.
29.- Se examinó una muestra de 100 empleados de un hospital que habían estado en contacto con sangre
o sus derivados, para averiguar si presentaban evidencia serológica de hepatitis B. Se encontró que en 23 de
ellos se obtuvieron resultados positivos. ¿Es posible concluir a partir de estos datos que la proporción de
individuos que presentaron resultados positivos es a lo sumo del 15%? (=0.01)
Indique: variable en estudio, condición de distribución requerido para ésta, hipótesis de trabajo, hipótesis
estadísticas, región crítica, decisión, interpretación biológica del parámetro en estudio acorde a la decisión
tomada y población.
30.- Como parte de un proyecto de investigación, se seleccionó una muestra de 25 niños nacidos en los
hospitales de un área metropolitana. La desviación estándar de los pesos de los niños obtenida fue de 150
g. ¿Proporcionan estos datos la evidencia suficiente para afirmar que el desvío poblacional es superior a
100g? Suponga que la variable se distribuye aproximadamente normal y que  = 0,05.
Indique: variable en estudio, hipótesis estadísticas, región crítica, decisión, interpretación biológica del
parámetro en estudio acorde a la decisión tomada y respuesta a la pregunta planteada.
31.- Un establecimiento dedicado a la elaboración de alimentos balanceados para aves, afirma que su
producto, si bien aumenta el peso promedio de las aves, no influye en la variabilidad del mismo. En una
muestra de 16 aves que habían consumido el alimento se obtuvo un peso promedio de 85g con una
varianza de 225g2. ¿Se puede suponer que la afirmación del establecimiento en cuanto a la variabilidad es
correcta, teniendo como dato que la varianza del peso de las aves es de 200g2? (=0.05).

Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Peso 16 85 15 0,94 0,4464
Indique: hipótesis de trabajo, hipótesis estadísticas, región crítica, decisión, interpretación del nivel de
significación y población en estudio.
32.- Antes del inicio de un programa de inmunización contra la rubéola realizado en un área metropolitana,
una encuesta reveló que 150 integrantes de una muestra de 500 niños de primaria habían sido inmunizados
contra esta enfermedad. ¿Son compatibles estos datos con el punto de vista de que el 50% de los niños de
primaria de dicha área habían sido inmunizados contra la rubéola? (=0,10)

89
-COMPLEMENTARIO 4 y 5-
Guía de Trabajos Prácticos
2023 · Bioestadística

RESULTADOS
EJERCICIOS PROPUESTOS

PROBABILIDAD
1.- a1) 0,30; a2) 0,10; b1) 0,061; b2) 0,079
2.- a1) 0,125; a2) 0,363; a3) 0,1; b1) 0,0031; b2) 0,2024; b3) 0,494
3.- a) 0,53; b) 0,03; c) 0,18; d) 0,36
4.- a) 0,00428; b) 0,996
5.- sensibilidad = 0,99; especificidad = 0,98; a) VPP = 0,0476; b) VPN = 0,999

VARIABLE ALEATORIA
1.- d) 0,75; e) 0,55; f) 0,65; g) 2,5; h) 2
2.- c) 0,75; d) 0,24; e) 1; f) 1; g) 0,9375
3.- c1) 0; c2) 0,5; c3) 0; d) 3,6
4.- c) 0,1; g) 3,8; 11,4 y 3,3; h) 0,85; i) 0,05; j) 0; k) 1
5.- d) 0,0687; e) 1; f) 0,0188; g) 1,92, 1,92 y 17,28
6.- c) 0,984
7.- b) 0,17715; c) 0,3336; d) 364,59kg.
8.- a) 1) 0,995; 2) 0,025; 3) 0,01; 4) 1,325; 5) –1,725; 6) a = -1,725 b = 1,725
b) 1) 0,99; 2) 0,995; 3) 0,975; 4) 1,372; 5) –1,812; 6) a = -1,812 b = 1,812; 7) E(t)=0 V(t)=1,25
9.- a) 1) 0,95; 2) 0,25; 3) 24,48; 4) 40,26; 5) a = 18,49 b = 43,77
b) 1) 0,75; 2) 0,05; 3) 11,04; 4) 22,31; 5) a = 7,261 b = 24,996; 6) E(X)= 15 V(X)= 30
10.- b) p(X=0) = 0,7157 ; p(X=1) = 0,268 ; p(X=2) = 0,0157 ; d) P(X>1) = 0,0157 y P(X<2) = 0,984
11.- 1.a) 0,666 ; 1.b) 0,30 ; 2.a) 0,0263 ; 2.b) 0,052 ; 3.b) 0,4044 ; 3.c)  0
12.- a) 0,1746; b) 0,3297; c) 0,182
13.- a1) 0; a2) 0,69146; a3) 0,30857; b) E(X+Y)= 186 y V(X+Y)= 145

ESTADISTICA DESCRIPTIVA
2.- c) X = 2,96; Me = 3; Mo = 3; d) P24= 1e) S2 = 4,03; S = 2,009; C.V.= 67,87%
3.- d) X = 31,79; Me = 33,05; Mo = 34,5; e) S2 = 36,32; S = 6,027; C.V. = 18,96%
4.- a) V.R. = zanahoria, V.A. = lechuga y zanahoria; b) V.R. = lechuga, V.A.= chaucha
5.- a) anatomía, estadística; b) histología
6.- c) n = 23; d) X = 203,04; S = 21,41
7.- f) X = 113,8; S2 = 276,87;
g) int. Me: [110,5 – 120,5)  Me = 113,3; int. Md: [110,5 – 120,5)  Md = 112,72
10.- b) X =12,63 ; S2 =0,692 ; Mo=12 ; C1=12 ; C3=13
e) 13
f) P(X≥13)= 0,487
g) P(1ro: 13 y 2do: 15)= 0,008
h) C1=Me= 12; P(x=11/x є[C1;C2])= 0,0596
11.-c)GRANJA A: X =5,89 ; Me= 6,4 ; Mo= 6,75
GRANJA B: X =5,16 ; Me= 5,1 ; Mo= 4,48
d)GRANJA A: s2= 2,97 ; s= 1,72 ; CV%= 29,2 ; dC= 2,5
GRANJA B: s2= 1; s= 1 ; CV%= 19,38 ; dC= 1,6
f) GRANJA A: 53,3%
GRANJA B: 20%
Granjas A y B: 36,6%
g) 0,3707
h) 0,0007; 0,1737
12.- c) X =134,38; Me=145; Mo=158,33
d)100 gramos; e)Me=166,75; S2=3623,09; f)0,2
13.- c) 1) 0,7454; 2) 0,02275; 3) 0,47725; 4) 0,02275; 5) 67,8 h
d) 1) 0,99609; 2) 0; 3) 0,5; 4) 0; 5) 61,95 h

90
-RESULTADOS-
Guía de Trabajos Prácticos
2023 · Bioestadística

14.- a) 0,43644; b) 4,71cm; c) 0,0911; d)i.- 0,40129; e) 3,46cm

TEOREMA CENTRAL DEL LÍMITE


1.- b)1
2.- 0,01876
3.- a1) 0; a2) 0,93822; b) 54,567gr
4.- a) Planteo  P(380≤ X ≤390); Resultado= 0
b) Planteo  P(365≤ X ≤370); Resultado= 0,04846
5.- d) P(23,2≤ X ≤23,6)= 0,18305

ESTIMACIÓN
1.- [45,11 ; 48,01] kg
2.- c) 2(19,0.025)=8,907 2 (19,0.975)=32,85; d) S=0,2093m; I.C.:[ 0,158 ; 0,307] m
3.- a.1) p̂ = 0,85 I.C.: [0,802 ; 0,898] ; a.2) p̂ = 0,15 I.C.: [0,102 ; 0,198]; c) P(x  1) = 0,9126
4.- c) no = 129,39  130 individuos; d) t 129 ; 0,995 uso t 100 ; 0,995 = 2,626 ; e) [21,4 ; 24,6] UI
5.- b) no=18,49  19 familias; c) no= 15,53  16 familias
6.- a) 2; 211; 0.05 = 4,575 y 211; 0.95 = 19,68
b) El intervalo de confianza fue ASIMÉTRICO con respecto al estimador puntual
7.- no = 15,36  16 unidades
8.- X  102,5 S2 = 501,31
9.- a) I.C.: [4,71 ; 5,89] años; b) no= 100 vacas; c) nf= 83,3  84 vacas
10.- a) X =25,45 ; S=1,6026; c) [24,562 ; 26,338]; d) [1,1733 ; 2,5274]
11.- b) 0,436; I.C.:[03358 ; 0,5362]; c) 0,3696; I.C.:[0,3077 ; 0,4315]
12.- 0,18673

PRUEBA DE HIPÓTESIS
1.- a) H1:  > 400 tHo = 1 No rechazo H0 ; c) zHo = 1,11 No rechazo H0
2.- c) H1: 2 < 1,2 d) R. C. : 2  3,325
3.- R. C. : Z  1,64 ZHo = 2,5 Rechazo H0
4.- H1: 2 > 81 R. C.: 2  18,31; 2Ho = 14,61 No rechazo H0
5.- c2) 0,75 ; c3) 0,01 ; c4) 0,4148 ; 0,5852 ; c5) H 1: p < 0,3 ; ZHo= -0,87 ; No rechazo H0
6.- a) H1: p > 0,6 ; ZHo= 1,63 ; No rechazo H0 ; b) 90
7.- Normalidad: H0: X se distribuye normal vs H1: X no se distribuye normal; S-W: p-valor= 0,0283
Rechazo H0 ; T+=156 ; No Rechazo H0
8.- Normalidad: H0: X se distribuye normal vs H1: X no se distribuye normal; S-W: p-valor= 0,0196
Rechazo H0 ; T+=127,5 ; No Rechazo H0
9.- Normalidad: H0: X se distribuye normal vs H1: X no se distribuye normal; S-W: p-valor= 0,9323
No Rechazo H0; tH0=0,84 No Rechazo H0
10.- Normalidad: H0: X se distribuye normal vs H1: X no se distribuye normal; S-W: p-valor< 0,0001
Rechazo H0 ; <0,76 ; Rechazo H0

91
-RESULTADOS-
Guía de Trabajos Prácticos
2023 · Bioestadística

EJERCICIOS COMPLEMENTARIOS UNIDADES 1, 2 y 3

PROBABILIDAD
2.- a) 0,83; b) 1
10.- a) 0,7; b) 0,5; c) 0,71; d) 0,7
14.- c) p(A)=0,33
23.- a) 0,329; b) 0,411; c) 0,671
29.- a) 0,5; b) 0,7; c) 0,47; d) 0,32
36.- a) 0,68; 0,12; b) 0,8; 0; c) 0,65; 0,15
37.- a) 0,174; b) 0,42; c) 0,197; d) 0,0117
38.- a1) 0,08; a2) 0,242; a3) 0,33 b) No
41.- a) 0,864; b) 0,0038; c) 0,829
43.- a) 0,443; b) 0,015; c) 0,865

VARIABLE ALEATORIA
1.- c) 0; d) 0,0006; e) 0,0307; f) 0,75
5.- a) 0,06681; b) 0,45994; c) 0,5; d) 70; 110 días
6.- c) 0,7747; d) 0,0025; e) 0,2129; f) 0,4382; g) 7,2
9.- a) 0,95254; b) 0,2586; c) 149,89 mmHg
11.- c) 0; d) 0; e) 0,00224; f) E(X) = 0,6 V(X) = 0,57
12.- c) 0; d) 0,9444; e) 0,0003; f) 0,1841; g) 20 animales no vacunados
13.- c) 0,103; d) 0,2001; e) 0,5699
15.- a) 0,9611; b) 0,945; c) 0,965
16.- a) 0,80124; b) 0,7734; c) 1
17.- c) 0,124; d) 0,00273; e) 0,7
18.- a1) 0,01; a2) 0,85; b) 1,708
19.- a) 0,944; b) 0,3125; c) 0; d) 0,3125; e) 0
21.- 87,32 mg/100 ml
22.- c) 0,9976; d) 0,0859; e) 0,8702
24.- 16,82 h
25.- a) 0,25; b) 0,75; c) 0; d) 1; e) 0,25; f) 0,36
28.- a) 1; b) 0,125; c) 0,9844; d) 0,875; e) 0,125
30.- a) 6,262; 27,488 ; b) 8,231; c) 26,51 o 34,76
32.- a) 0,15; d) 0,75; g) 2,2
33.- b) 0,025; d) 476 tiradas ; e) 2,47

ESTADISTICA DESCRIPTIVA
3.- f) X = 8,58; Me = 8; Mo = 5,6,8 y 10; S2= 7,45; S = 2,73; C.V.= 31,8%
7.- f) X = 19,68; Me = 19; Mo = 19; S2 = 16,06; S = 4,007; C.V.= 20,36%
8.- a) S2 o S; b) C.V.
20.- e) X = 196,6; S2 = 155,66; C.V.= 6,345%; f) int. Me [190 – 200); int. Md [190 – 200);
g) 60% ; i1) 216,26 i2) 188,35
26.- a) 0,87286; b) 0,04746
27.- b) X = 14,1; Me = 15; Mo = 17; C.V. = 23,94%; d1) Y = 20,445; d2) SY = 4,90
31.- e) X = 31,944; Me = 33,3; Mo = 34,725; f) S2 = 41,0184; S = 6,404; C.V.= 20,04%; h) 24%
34.- c) X = 2,92; Me = 2,95; Mo = 2,328; d) C.V. = 27,72%; e) Y = 3,42
35.- a1) 0,97193; a2) 0,874344; b1) 13; b2) 9
42.- c) 24%; d) X = -0,5178; S = 0,0069 e) Aprox. simétrica

92
-RESULTADOS-
Guía de Trabajos Prácticos
2023 · Bioestadística

EJERCICIOS COMPLEMENTARIOS UNIDADES 4 y 5

ESTIMACIÓN
1.- a) [177,09 ; 182,91] ml ; b) [30,49 ; 96,77] ml2
2.- a) 16 g e Int. de Conf. [13,936 ; 18,064] g ; b) 47,33  48 mejillones
3.- b) t15 ; c) t15 ; 0,975 = 2,131 t15 ; 0,025 = -2,131 ; d) [14,201 ; 15,799] Kg
4.- S2= 0,384 g2
5.- a) [0,087 ; 0,247] Kg2 ; b) 229 ; c) 229 ; 0,975 = 45,722 229 ; 0,025 = 16,047
7.- S2= 17934,57 (unidades correspondientes) 2 ; X = 500 unidades correspondientes
9.- b) n0 = 21,32  22 gallinas, nf=21,24  22 gallinas
10.- n0 = 17,72  18 bovinos
11.- d = 0,102
12.- a) n0=100,6 101 machos; b) nf = 82,22  83 machos
13.- n0 = 34,57  35 lechones
14.- 0,91466
16.- n0 = 138,29  139 animales
17.- n0 = 54,02  55 pollos
25.- n0 = 61,46  62 pollitos
26.- A = 4,68 B = 5,148 C = 4,212
27.- a) [0,6424 ; 0,8776] ; b) n0 = 70,07  71 huevos
28.- 76 aves
33.- 0,113
34.- 0,025

PRUEBA DE HIPÓTESIS
6.- H1:  < 30 R. C. : z  -1,64 ; zH0= -4,55
8.- H1:  > 10 R. C.: Z  1,64 ZHo = 4 Rechazo Ho
15.- H1:  < 12 R. C.: T  30 THo = 113 No Rechazo Ho
18.- b) H1: p  0,1; e) ZHo = -1,05 No rechazo H0
19.- H1:   2,5 tHo = -1,25 No rechazo H0
20.- H1: 2  0,01 2Ho = 96 Rechazo H0
21.- H1:  > 20,5 ZHo = 6,21 Rechazo H0
22.- H1: 2 > 1,21 2Ho = 18,72 No rechazo H0
23.- H1: p > 0,25 ZHo = 0,57 No rechazo H0
24.- H1: < 3,2 THo = 37 No Rechazo H0
29.- H1: p > 0,15 R.C.: Z  2,33 ZHo = 2,24 No rechazo H0
30.- H1: 2 > 10000 R.C.: 2  36,42 2Ho = 54 Rechazo H0
31.- H1: 2  200 R.C.: 2  6,262 y 2  27,488 2Ho = 16,875 No rechazo H0
32.- H1: p  0,5 R.C.: Z  -1,64 y Z  1,64 ZHo = -8,94 Rechazo

93
-RESULTADOS-
94
-RESULTADOS-
Guía de Trabajos Prácticos
2023 · Bioestadística

MODELO DE 1ER. PARCIAL


1er. Parcial de ELEMENTOS DE ESTADÍSTICA Tema 1422 FECHA: … /…/...
APELLIDO Y NOMBRE:..........................................................................................
COMISIÓN NRO:………………… Cantidad de Hojas (sin incluir éstas):……

Problema 1
Nota: En los casos que haya que calcular probabilidades expresar simbólicamente lo solicitado e indicar
tanto el reemplazo numérico como el resultado.
En un experimento de inmunología, se tomaron 111 ratones que fueron divididos en dos grupos.
Cincuenta y siete de ellos fueron tratados con una dosis estándar de una bacteria patógena y los restantes
fueron tratados además de con la bacteria patógena con un antisuero. Luego de un tiempo de incubación
suficiente para que la enfermedad causada por la bacteria se desarrolle, se contabilizó en cada
tratamiento la cantidad de ratones muertos y vivos. En el grupo que fue tratado solamente con la bacteria
patógena se contaron 29 vivos, mientras que en el grupo de bacteria más antisuero se contabilizó 13
muertos.

MUERTOS VIVOS
BACTERIA MAS ANTISUERO
BACTERIA

1) Si se selecciona un ratón al azar, calcular la probabilidad de que...


i) (2p) ...sea un ratón muerto y tratado con bacteria
ii) (3p) ...sea un ratón vivo o que esté tratado con bacteria
2) Si se seleccionan dos ratones al azar, ¿cuál es la probabilidad de que:
i)(4p) uno haya sido tratado con bacteria y este muerto y el otro haya sido tratado con
bacteria mas antisuero y este muerto?
ii)(4p) el segundo ratón seleccionado este vivo y haya sido tratado con bacteria, sabiendo
que el primero fue un ratón muerto que había sido tratado con bacteria mas antisuero?
3) (6p) Explicitar cuando dos sucesos no mutuamente excluyentes y dar un ejemplo.
4) (6p) Definir en forma coloquial y simbólica el valor predictivo positivo de un test.

Problema 2
0 si x  1

F(x)=  x2 -1 si 1  x  2

1 si x  2

1) (4p) Enunciar y verificar las condiciones para analizar si F(X) es función de distribución.
2) (3p) ¿Cuál es la probabilidad de que el valor de la variable sea a los sumo 1.4?
3) (3p) ¿Cuál es la probabilidad de que el valor de la variable sea mayor a 0,5 y menor o igual a 1,3?
4) (3p) ¿Cuál es la probabilidad de que el valor de la variable sea 1,25?
5) (6p) Enunciar la definición de varianza de una variable aleatoria continua y 3 propiedades de la
misma.
6) (6p) Definir una variable con distribución binomial, explicitar su distribución y verificar las
condiciones que cumple.

95
-MODELO 1er PARCIAL-
Guía de Trabajos Prácticos
2023 · Bioestadística

Problema 3
El registro de la producción bimestral de huevos por gallina de un establecimiento de la
provincia de Buenos Aires con 100 gallinas tiene la siguiente tabla.

xi [35;39) [39;43) [43;47) [47;51) [51;55) [55,59)


0,12 0,16 0,18 0,22 0,17 0,15
…….

1) (3p) Definir la variable en estudio y clasificarla.


2) (3p) Indique el nombre de la frecuencia dada e interpretar la casilla coloreada
3) (3p) Calcular Fi
4) (4p) Calcular la mediana
5) (4p) Calcular el desvío.
6) (5p) Si por un cambio en la dieta suministrada a las gallinas del establecimiento, se produjo una
disminución del 5% de la producción bimestral de huevos. ¿Cuál sería el nuevo valor de la varianza y la
mediana?
7) Teniendo en cuenta los siguientes gráficos indicar la muestra cuya variable tiene:
i) (1,5 p) menor valor.
ii) (1,5 p) mayor dispersión total.

11

10

0
A B c

Problema 4
En un establecimiento de la Provincia de Santa Fe, se seleccionaron 25 cerdas, en las cuales se registro
el tiempo de lactancia de sus camadas. Si la lactancia de los lechones en los sistemas de producción
extensivos tiene distribución normal con una media de 35 días y una varianza de 49 días2.
1) (3p) Cuál es la probabilidad de que el tiempo sea de al menos 34 días?
2) (4p) Explicitar simbólicamente la distribución de la media del tiempo de lactancia. Justificar
3) (3p) ¿Cuál es la probabilidad de que el tiempo medio sea de al menos 33,208 días?
4) (3p) ¿Cuál es el tiempo medio de la lactancia de los lechones superada por el 30% de las cerdas?
5) Si se eligen 9 cerdas en forma aleatoria, calcule la probabilidad de que...
i) (3p)...el tiempo medio de lactancia de 3 de ellas sea de al menos 33,208 días
ii) (3p)...el tiempo medio de lactancia de al menos 2 de ellas sea de cómo máximo 33,208 días
6) (6p) Explique que es un experimento Binomial y enuncie las condiciones de binomialidad en
términos del problema.

96
-MODELO 1er PARCIAL-
Guía de Trabajos Prácticos
2023 · Bioestadística

Modelo de 2do. Parcial


2do. Parcial de ELEMENTOS DE ESTADÍSTICA Tema 1423 FECHA: … /…/...
APELLIDO Y NOMBRE:..........................................................................................
COMISIÓN NRO:………………… Cantidad de Hojas (sin incluir éstas):……

Leer ambas carillas

Problema 1
Se están estudiando las características seminales de la llama (Lama glama), para lo cual se miden varias
variables, entre ellas el volumen espermático que se sabe que tienen una distribución normal con varianza
2,1025 ml2.
a) (3p) Definir la variable en estudio.
b) (7p) Hallar el tamaño de muestra necesario para calcular un intervalo de confianza para la media
poblacional del volumen espermático de la llamas, sabiendo que se pretende una amplitud de 0,7. (Usar
1- = 0,95).
c) (10p) Suponiendo que se extrajo una muestra con el tamaño calculado en el punto anterior y que el
valor medio calculado fue de 3,22 ml, hallar e interpretar el correspondiente intervalo de confianza del
99%
d) (5p) También se quiere estudiar la proporción poblacional de espermatozoides normales. Enunciar y
verificar las condiciones para estimar a este parámetro.
e) (5p) Dar un ejemplo de un intervalo de nivel asintótico, justificar.

Problema 2
El peso del ñandú petiso de la Patagonia, [choique o ñandú overo (Pterocnemia pennata)] es una variable
con desvío estándar poblacional de 3,2 kg. Con un muy buen manejo se sospecha que se pueden
conseguir animales de peso vivo menos variable. Para probar la sospecha se trabaja con un lote de 25
crías en tales condiciones de manejo consiguiendo un peso medio de 28,5 kg y una varianza de 9 kg2.

Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Peso 25 28,5 3 0,93 0,3012

a) (5p) Especificar el parámetro en estudio.


b) (7p) Verificar en forma completa las condiciones para elegir la variable pivotal aplicadas al
problema
c)(15p) Realizar el test completo (hipótesis, estadístico de contraste, distribución del estadístico de
contraste, región critica, regla de decisión y conclusión). (α=0,05)
d) (8p) Si consideramos que la probabilidad de cometer error de tipo II es 0,12 y el nivel de significación
es el considerado en el punto anterior, ¿qué valores toman el resto de las probabilidades involucradas en
esta prueba de hipótesis y a qué situaciones, en el contexto del problema, corresponde cada una de
ellas?

Problema 3
Un tambero de la provincia de Santa Fe está al borde de la quiebra y todas sus esperanzas están puestas
en la producción del próximo mes; por lo cual decide utilizar una dieta más concentrada para aumentar
la producción lechera de sus vacas. Para que el negocio sea rentable, el valor medio de la producción
diaria no debe ser menor a 17,5 litros/vaca.
16,3 18,2 17 16,6 17,2 18
16,2 15,2 17,9 17,3 16,7
a) (5p) Defina la variable en estudio.
b) (10p) Verifique las condiciones para elegir la variable pivotal aplicadas al problema.
c) (5p) Especifique el parámetro en estudio
d) (15p) ¿Es posible afirmar con un nivel de significación del 5% que el tambero salvará su empresa?

97
-MODELO 2do PARCIAL-
Guía de Trabajos Prácticos
2023 · Bioestadística

Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
producción 11 16,96 0,89 0,85 0,0804

Prueba T para un parámetro


Variable n Media DE T
producción 11 16,96 0,89 62,96

Prueba de Wilcoxon
variable N Suma(R+) E(R+) Var(R+)
producción 11 13,50 33,00 126,38

Firma ……………………………

98
-MODELO 2do PARCIAL-

También podría gustarte