Está en la página 1de 87

CENTRO DE ESTUDIANTES DE VETERINARIA UNIVERSIDAD DE BUENOS AIRES

FACULTAD DE CIENCIAS VETERINARIAS

ELEMENTOS DE
ESTADÍSTICA
GUÍA DE TRABAJOS
PRÁCTICOS

2011
SECRETARIA DE PUBLICACIONES
Facultad de Ciencias
Veterinarias

U.B.A.

Elementos de Estadística
Guía de Trabajos Prácticos

Área Bioestadística
2011 – 1er. Cuatrimestre
Cronograma 2011 – 1er. Cuatrimestre
Sem lunes
1 Miér 9/3 Jue: Experimentos aleatorios. Teorías de probabilidad.
2 14/3 Mar: Experimentos aleatorios. Teorías de probabilidad.
Jue: Probabilidad Condicional. Probabilidades conjuntas. Variable
aleatoria
Función de probabilidad, función de densidad y función de
distribución.
3 21/3 Mar: Probabilidad Condicional. Probabilidades conjuntas. Variable
Feriado aleatoria Función de probabilidad, función de densidad y función de
Jue 24
distribución.
4 28/3 Distribuciones especiales: distribución Binomial, distribución Normal
Feriado
Sáb 2/4

5 4/4 Ejercitación integradora.


6 11/4 Estadística descriptiva: escalas de medición y gráficos adecuados
para cada caso. Medidas de posición y tendencia central.
7 18/4 Mar: ejercitación y consulta.
F SSanta
En esta clase no se controlara la asistencia.
21 22 23 24
de Abr
8 25/4 Estadística descriptiva: medidas de dispersión absoluta y relativa.
Distribución de la media muestral.

9 2/5 Integración (sábado 7-5-11 parcial)

10 9/5 Teorema central del Límite Distribuciones χ2 y t. Distribución de S2.


Problemas
11 16/5 Estimación puntual. Estimación por intervalos de confianza, para la
media de una población normal.
12 23/5 Estimación por intervalos de confianza para la varianza de una
Feriado distribución normal. Intervalos de confianza de nivel aproximado o
Mi 25/5 asintótico.
13 30/5 Pruebas de hipótesis. Marco teórico. Caso de la media de una
población normal.
14 6/6 Prueba de hipótesis para la varianza de una población normal y para
el parámetro p de la binomial.
15 13/6 Integración. Revisión y consultas. (sábado 18-6-11 parcial)
16 20/6
Feriado
Lu 20/6

17 27/6 Recuperatorio 29/6

I
Bibliografía
 DeVore, Jay, L.: Probabilidad y Estadística para Ingeniería y Ciencias.
International Thomson Editores. 6ta. Edición. México. Capítulos: 1 a 8.

 Cantatore de Frank, Norma M.: Manual de Estadística Aplicada. Ed.


Hemisferio Sur. 1ra. Edición. Buenos Aires. Capítulos: 1 a 5.

 Cappelletti, Carlos A.: Elementos de estadística. Cesarini Hnos. Editores.


2da. Edición. Bs. As. Capítulos 1 al 9.

 Daniel, Wayne W.: Bioestadística. Base para el análisis de las ciencias de


la salud. 3ra. Edición. Uteha, Noriega Editores. México. Capítulos: 1 al 6.

NOTA IMPORTANTE:

La cátedra publica solamente las


GUIAS DE TRABAJOS PRACTICOS
y de FORMULAS Y TABLAS,
para la cursada de esta materia.
Cualquier otra publicación NO CUENTA
CON LA APROBACION DE LA CATEDRA.

II
Sistema de Evaluación de Elementos de Estadística
Se tomarán dos parciales, que serán calificados en una escala de 0 a 10, en forma
global.

La condición de LIBRE se obtiene si en ambos parciales la calificación obtenida es


inferior a 4 (cuatro), o cuando no se cumpla el requisito del 75% de concurrencia
a las clases teórico-prácticas.

La condición de ASISTENCIA CUMPLIDA se obtiene al cumplir el requisito de


presentismo, correspondiente al 75% de concurrencia a las clases teórico-
prácticas, o sea, como máximo 4 ausentes; y obtener como calificación:
♦ en ambos parciales, mayor o igual a 4 (cuatro) y menor de 6(seis)
♦ en un parcial, mayor o igual a 4 (cuatro) y menor de 6 (seis); y en el
otro, menos de 4 (cuatro).
No se recuperarán parciales para quedar en condición de ASISTENCIA CUMPLIDA.

La condición de REGULAR se obtiene al cumplir el requisito de presentismo,


correspondiente al 75% de concurrencia a las clases teórico-prácticas, o sea,
como máximo 4 ausentes; y obtener como calificación:
♦ en ambos parciales, 6(seis), sin uso del examen recuperatorio.
♦ en un parcial 6 (seis) y en el otro, nota 7 (siete), sin uso del examen
recuperatorio.
♦ en un parcial, inferior a 6 (seis); y en el otro, 6 (seis) o más. En este
caso, deberá recuperar el parcial correspondiente a una calificación inferior a 6
(seis) y aprobarlo. La nota de aprobación del recuperatorio es 6 (seis).

La condición de PROMOCIÓN se obtiene al cumplir el requisito de presentismo,


correspondiente al 80% de concurrencia a las clases teórico-prácticas, o sea,
como máximo 3 ausentes; y obtener como calificación:
♦ de al menos 7(siete) en ambos parciales, de tal forma que la suma de
ambos puntajes sea mayor o igual a 14.
♦ en un parcial, de al menos 7 (siete), y en el otro, un puntaje desde 4
(cuatro) hasta menos de 6 (seis); pero que la suma de ambos sea de al menos 14
puntos. En este caso, se tomará un coloquio oral de los contenidos que involucra
el parcial de menor puntaje para definir su situación, dependiendo ésta de la
aprobación del mismo.

III
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

PROBABILIDAD
OBJETIVO ESPECIFICO
 Comprender, analizar y aplicar a la resolución de problemas los conceptos de probabilidad, experimento
y variable aleatoria.

CONTENIDOS TEMATICOS
Probabilidad: Nociones de probabilidad basadas en la teoría clásica, del límite de frecuencia relativa, y la
definición axiomática. Características de cada una de las teorías. Experimento y suceso aleatorio. Reglas de
la suma y del producto, y sus aplicaciones. Probabilidad condicional. Aplicaciones.

GLOSARIO
Experimento aleatorio. Espacio muestral. Punto muestral. Sucesos. Casos especiales: sucesos imposibles,
ciertos o seguros, mutuamente excluyentes o incompatibles, complementarios. Definición clásica de
probabilidad, la probabilidad como límite de la frecuencia relativa, teoría axiomática de probabilidad.
Propiedades derivadas de la definición axiomática. Teoremas de la suma y del producto de probabilidades.
Probabilidad condicional. Probabilidad conjunta. Independencia de sucesos.

PROBLEMAS RESUELTOS
EJERCICIO 1) Se tiene una urna que contiene tres bolillas verdes y dos rojas numeradas del 1 al 5.
1.1) Hallar el espacio muestral correspondiente a los siguientes experimentos aleatorios, asignando la
probabilidad correspondiente a cada uno de sus elementos, si el experimento consiste en elegir una
bolilla al azar y
A) se observa y registra el color;
B) se observa y registra el número.
1.2) Hallar el espacio muestral correspondiente a los siguientes experimentos aleatorios, asignando la
probabilidad correspondiente a cada uno de sus elementos si
1.2.1) el experimento consiste en elegir dos bolillas al azar, una y luego la otra con reposición y
A) se observa y registra el color de cada una;
B) se observa y registra el número de cada una
1.2.2) el experimento consiste en elegir dos bolillas al azar, una y luego la otra, sin reposición
A) se observa y registra el color de cada una;
B) se observa y registra el número de cada una
1.3) Indicar las probabilidades (si ya están calculadas) o calcularlas, de los siguientes sucesos de los
diferentes espacios muestrales definidos:
i) la bolilla extraída es verde, considerando que el espacio muestral corresponde a 1.1.A)
ii) la bolilla es la número 1, considerando que el espacio muestral corresponde a 1.1.B)
iii) la bolilla tiene un número par, considerando que el espacio muestral corresponde a 1.1.B)
iv) las dos bolillas son verdes, considerando que los espacios muestrales corresponde a 1.2.1.A) y a
1.2.2.A)
v) la primera bolilla es verde y la segunda es roja, considerando que los espacios muestrales
corresponde a 1.2.1.A) y a 1.2.2.A)
vi) al menos una bolilla es verde, considerando que los espacios muestrales corresponde a 1.2.1.A) y
a 1.2.2.A)
vii) una bolilla es la número 1 y la otra es la número 5, considerando que los espacios muestrales
corresponde a 1.2.1.B) y a 1.2.2.B)
viii) las dos bolillas tienen números mayores o iguales que 2, considerando que los espacios
muestrales corresponde a 1.2.1.B) y a 1.2.2.B)

SOLUCIÓN
1.1) Hallar el espacio muestral correspondiente a los siguientes experimentos aleatorios,
asignando la probabilidad correspondiente a cada uno de sus elementos si el experimento
consiste en elegir una bolilla al azar y
A) se observa y registra el color
Si interesa el color, sólo se distinguen dos situaciones que llamaremos puntos muestrales y que
simbolizamos así:

V: “el color de la bolilla elegida es verde”


1
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

R: “el color de la bolilla elegida es rojo”


Por lo tanto el Espacio Muestral ( S ) será: S = { V, R}
3 2
Las probabilidades correspondientes a cada elemento de S son: p(V ) = ; p (R) =
5 5
B) se observa y registra el número.
Si interesa el número, se distinguen cinco situaciones o puntos muestrales que simbolizamos de la
siguiente manera:

1: "número que se obtiene al extraer una bolilla es el 1“,


2: “el número de la bolilla extraída es 2",
y así sucesivamente

El espacio Muestral ( S ) será: S = { 1 ; 2 ; 3 ; 4 ; 5}


1
Las probabilidades correspondientes a cada punto muestral p (1) = p (2) = L = p (5) =
5
1.2) Hallar el espacio muestral correspondiente a los siguientes experimentos aleatorios, asignando la
probabilidad correspondiente a cada uno de sus elementos si

1.2.1) el experimento consiste en elegir dos bolillas al azar, una y luego la otra con reposición y
A) se observa y registra el color de cada una;
Al extraerse 2 bolillas cada punto muestral estará formado por 2 ocurrencias (que podrán ser igual color o
diferente color) quedando determinado un espacio muestral con 4 puntos muestrales.
S = { VV, VR, RV, RR }
Al realizar extracciones con reposición siempre que se realiza una extracción tendremos 5 elementos
para realizar la selección.
3 3 9 3 2 6 23 6 22 4
p(VV) = * = ; p (VR) = * = ; p(RV) = * = ; p(RR) = * =
5* 5 25 5* 5 25 5* 5 25 5* 5 25

1.2.2) el experimento consiste en elegir dos bolillas al azar, una y luego la otra, sin
reposición
A) se observa y registra el color de cada una;
Al realizar extracciones sin reposición siempre que se realiza la primera extracción tendremos 5
elementos para elegir y, cuando realizamos la segunda extracción, sólo hay 4 elementos pues, el que fue
seleccionado no se vuelve a colocar en la urna (no le damos la oportunidad de volver a salir). La cantidad
de casos favorables puede o no modificarse dependiendo de cuál es la bolilla que quedó afuera.

El espacio muestral es el mismo que en 1.2.1.A) y las probabilidades son:


3 2 6 3 2 6 2 3 6 21 2
p (VV) = * = ; p(VR) = * = ; p(RV) = * = ; p(RR) = * =
5 * 4 20 5* 4 20 5* 4 20 5* 4 20
1.2.1) el experimento consiste en elegir dos bolillas al azar, una y luego la otra con reposición y
B) se observa y registra el número de cada una
El espacio muestral consta de 25 elementos (resultado de 5X5).
S = {(1,1); (1,2); (1,3); (1,4); (1,5); (2,1); (2,2); (2,3); (2,4); (2,5); (3,1); (3,2); (3,3); (3,4); (3,5); (4,1);
(4,2); (4,3); (4,4); (4,5); (5,1); ( 5,2); (5,3); (5,4); (5,5)}
1 1
p(1,1) = ........... = p(5,5) = =
5* 5 25
Todos los puntos muestrales tienen la misma probabilidad de ocurrir.

1.2.2) el experimento consiste en elegir dos bolillas al azar, una y luego la otra, sin reposición
B) se observa y registra el número de cada una

2
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

Al realizar extracciones sin reposición, cuando realizamos la segunda extracción sólo hay 4
elementos y la cantidad de casos favorables puede o no modificarse dependiendo de cuál es la bolilla
que quedó afuera.
El espacio muestral sólo tiene 20 elementos (resultado de 5X4).
S = {(1,2); (1,3); (1,4); (1,5); (2,1); (2,3); (2,4); (2,5); (3,1); (3,2); (3,4); (3,5); (4,1); (4,2); (4,3); (4,5);
(5,1); (5,2); (5,3); (5,4)}
1 1
p(1, 2) = K = p(5, 4) = =
5* 4 20
1.3) Indicar las probabilidades (si ya están calculadas) o calcularlas, de los siguientes sucesos de los
diferentes espacios muestrales definidos.
i) la bolilla extraída es verde, considerando que el espacio muestral corresponde a 1.1.A)
3
p(V) = se obtiene por lectura de lo calculado
5

ii) la bolilla es la número 1, considerando que el espacio muestral corresponde a 1.1.B)


1
p(1) = se obtiene por lectura de lo calculado
5
iii) la bolilla tiene un número par, considerando que el espacio muestral corresponde a 1.1.B)
Si definimos D: ”la bolilla extraída tiene un número par”, entonces D={2; 4} y su probabilidad, debido a que
son sucesos mutuamente excluyentes, se calcula como la suma de la probabilidad de obtener un 2 y la
probabilidad de obtener un 4.
1 1 2
p(D) = p(2) + p(4) = + =
5 5 5
o directamente por conteo de casos favorables sobre total de casos a partir del espacio muestral:
2
p=
5
iv) las dos bolillas son verdes, considerando que los espacios muestrales corresponde a 1.2.1.A) y a
1.2.2.A)
Utilizando el espacio muestral de 1.2.1.A) por lectura de lo calculado se obtiene:
9
p(VV) =
25

y, utilizando el espacio muestral de 1.2.2.A), por lectura de lo calculado se obtiene:


6
p(VV) =
20
v) la primera bolilla es verde y la segunda es roja, considerando que los espacios muestrales
corresponden a 1.2.1.A) y a 1.2.2.A)
Utilizando el espacio muestral de 1.2.1.A) por lectura de lo calculado se obtiene
6
p(VR) =
25

y, utilizando el espacio muestral de 1.2.2.A), por lectura de lo calculado se obtiene


6
p(VR) =
20
vi) al menos una bolilla es verde, considerando que los espacios muestrales corresponde a 1.2.1.A) y
a 1.2.2.A)
Si definimos H: ”al menos una bolilla extraída es verde”, entonces H = { VR, RV, VV} y su probabilidad,
debido a que son sucesos mutuamente excluyentes, se calcula como la suma de las probabilidades
individuales, por lo que será en el espacio muestral de 1.2.1.A)

3
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

6 6 9 21
p ( H ) = p ( VR) + p (RV ) + p ( VV ) = + + = o por sucesos complementarios
25 25 25 25
4 21
p( H ) = 1 − p( H ) = 1 − p (RR) = 1 − =
25 25

y, en el espacio muestral de 1.2.2.A)


6 6 6 18
p ( H ) = p ( VR) + p (RV ) + p ( VV ) = + + = o por sucesos complementarios
20 20 20 20
2 18
p( H ) = 1 − p ( H ) = 1 − p (RR) = 1 − =
20 20
vii) una bolilla es la número 1 y la otra es la número 5, considerando que los espacios muestrales
corresponde a 1.2.1.B) y a 1.2.2.B)
Si lo definimos como F, será F={(1,5); (5,1)} y se puede calcular como la suma de las correspondientes
probabilidades:
1 1 2
p (F) = p (1,5) + p (5,1) = + = calculado en el espacio muestral de 1.2.1.B) o, como ambas
25 25 25
probabilidades son iguales, se puede pensar en uno de los casos y multiplicar por los posibles cambios de
lugar de los elementos, en este caso 2
1 2
p (F) = 2. p (1,5) = 2. =
25 25
Si se calcula en el espacio muestral de 1.2.2.B) será
1 1 2 1 2
p (F) = p (1,5) + p (5,1) = + = ó p (F) = 2* p (1,5) = 2* =
20 20 20 20 20
viii) las dos bolillas tienen números mayores o iguales que 2, considerando que los espacios
muestrales corresponde a 1.2.1.B) y a 1.2.2.B)
Si lo definimos como el suceso G, entonces G es:
G ={(2,2); (2,3); (2;4); (2,5); (3,2); (3,3); (3,4); (3,5); (4,2); (4,3); (4,4); (4,5); ( 5,2); (5,3); (5,4); (5,5)}
y considerando el espacio muestral de 1.2.1.B) la probabilidad se puede calcular como:
• suma de las probabilidades correspondientes a cada punto muestral.
1 1 16
p (G) = p(2, 2) + p (2,3) + K + p (5, 5) = +L + =
25 25 25
• O, como todos los puntos muestrales son igualmente posibles, se puede pensar en uno de ellos y
multiplicar por la cantidad de casos como ese que forman G, es decir
1 16
p(G) = 16 * p(2, 2) = 16 * =
25 25
• O, utilizando el concepto de sucesos complementarios

G ={(1,1); (1,2); (1,3); (1,4); (1,5); (2,1); (3,1); (4,1); (5,1)} por lo que
1 1 9
p(G) = p(1,1) + p (1, 2) + K + p (5,1) = +L + = y por lo tanto
25 25 25
9 16
p (G) = 1 − p (G) = 1 − =
25 25
En forma similar considerando el espacio muestral de 1.2.2.B)

G ={(2,3); (2;4); (2,5); (3,2); (3,4); (3,5); (4,2); (4,3); (4,5); (5,2); (5,3); (5,4)}

G ={(1,2); (1,3); (1,4); (1,5); (2,1); (3,1); (4,1); (5,1)}


y la probabilidad se puede calcular como:

4
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

1 1 12
• p (G) = p (2,3) + p (2, 4) + K + p (5, 4) = +L + =
20 20 20
1 12
• p (G) = 12 * p (2,3) = 12* =
20 20
1 1 8
• p(G) = p(1, 2) + p(1,3) + K + p(5,1) = +L + = y por lo tanto
20 20 20
12 8
p(G) = 1 − p(G) = 1 − =
20 20

EJERCICIO 2) En una jaula conviven, en igual proporción, dos especies de jilguero, A y B. De la especie
A, el 22% de los ejemplares está parasitado por un protozoo intestinal, mientras que de la especie B, el 35%
de los ejemplares está parasitado por el mismo organismo. Un investigador necesita un jilguero para una
investigación, con lo cual entra a la jaula y captura uno al azar:
a) ¿Cuál es la probabilidad de que el jilguero capturado esté parasitado?
b) Si el jilguero capturado está parasitado, ¿cuál es la probabilidad de que pertenezca a la especie B?

SOLUCIÓN
Simbolizaremos a los sucesos
A = {el jilguero es de la especie A}
B= {el jilguero es de la especie B}
E= {el jilguero está parasitado}

Los datos son:


“.... conviven, en igual proporción, dos especies de jilguero”  p(A) = p(B) = 1/2

“De la especie A, el 22% de los ejemplares está parasitado por un protozoo intestinal”. Al saber que son de la
especie A se simboliza  p(E/A) = 0,22
“... mientras que de la especie B, el 35% de los ejemplares está parasitado por el mismo organismo”.
En forma similar, dado que se sabe que son de la especie B, se simboliza  p(E/B) = 0,35

Nota: si bien es conveniente que el símbolo seleccionado para cada suceso ayude a su interpretación (como
el caso de A y B) no se debe usar la letra P con más de una finalidad, por lo cual la reservamos para
probabilidad y para “parasitado” se utilizó el símbolo E (de enfermo).

a) Para la definición del suceso “sea parasitado”, debemos considerar a todos los parasitados, es decir, los
que están parasitados y son de la especie A y a los que están parasitados y son de la especie B, como
aparece en la fórmula:
[
p (E ) = p (E I A )U (E I B ) ]
Como son dos sucesos mutuamente excluyentes (si un jilguero es parasitado de la especie A ese jilguero no
es parasitado de la especie B) la probabilidad de parasitado (p(E)) se calcula como la suma de las
probabilidades de los dos sucesos que intervienen en la unión.

p (E ) = p [(E I A )U (E I B )] = p (E I A ) + p (E I B )

Cada uno de los términos es la probabilidad de una intersección de sucesos no independientes por lo tanto
se calcula
p (E) = p [(E I A )U (E IB )] = p (E I A ) + p (E IB ) = p ( A ) . p (E/A ) + p (B ) . p (E/B )

Sustituyendo los valores de las probabilidades y realizando el cálculo llegamos a

p(E) = p [(EIA )U(EIB )] = p (EIA ) + p (EIB ) = p ( A )* p (E/A ) + p (B )* p (E/B ) =


1 1
= 0, 22 + * 0,35 = 0,11+ 0,175 = 0, 285
2* 2

b) “Si el jilguero capturado está parasitado ... indica que “parasitado” es algo que ocurrió por lo tanto lo
p ( B/E )
solicitado se simboliza 
5
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

Y se resuelve p (E I B ) 0,175
p (B/E ) = = = 0, 614
p(E) 0,285

EJERCICIO 3) Dos campos con equinos en pastoreo clasificados según su pelaje presentan la siguiente
distribución:
campo 1 campo 2
Zaino 9 6
Bayo 11 6
Rosillo 5 13

3.1) Se selecciona un equino al azar. Calcular la probabilidad de que:


a) sea Zaino,
b) sea Zaino y del campo 1,
c) sea Zaino o del campo 1,
d) sea Rosillo, sabiendo que es del campo 1.
3.2) Si se seleccionan dos equinos al azar:
3.2.1) Con reposición
Calcular la probabilidad de que sean:
1) ambos Bayos,
2) el primero Bayo y el segundo Zaino,
3) uno Bayo y el otro Zaino,
4) uno Bayo y del campo 1; y, el otro, Zaino y del campo 2.
3.2.2) Sin reposición
Calcular las probabilidades pedidas en 3.2.1)
SOLUCIÓN
Para facilitar los cálculos agregamos una fila y una columna con los totales de animales que hay en cada
campo y de cada pelaje
campo 1 (C1) campo 2 (C2)
Zaino (Z) 9 6 15
Bayo (B) 11 6 17
Rosillo (R) 5 13 18
25 25 50
3.1)
a) 15 3
p ( Z) = = = 0,30
50 10
b) Es la probabilidad de una intersección y se puede calcular directamente observando la tabla y aplicando la
teoría clásica de probabilidades.
9
p ( Z I C1) = = 0,18
50
o por definición, considerando a cualquiera de los dos sucesos como el primero. Si primero se observa el
pelaje y luego de qué campo proviene:
15 9
p ( Z I C1) = p ( Z )* p ( C1/ Z ) = * = 0,18
50 15
Nota: Observar que dado que interviene una única vez el azar no se multiplica por dos.

c) Como puede darse que el animal sea Zaino y también del campo 1 los dos sucesos Z y C1 no son
mutuamente excluyentes lo que lleva a la siguiente expresión y correspondiente cálculo
15 25 9 31
p ( Z U C1) = p ( Z ) + p ( C1) − p ( Z I C1) = + − = = 0, 62
50 50 50 50

6
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

d) Lo que se sabe (equivalente a decir que está dado) es que “...es del campo 1” y lo aleatorio es que “...sea
rosillo”, por lo tanto p R ( C1) = 255 = 15 = 0, 20 (por lectura directa de tabla), tomando en cuenta que la

condición restringe la cantidad de casos posibles.


Por fórmula:
p ( R ∩ C1)
(
p R
C1)= p ( C1)
=
5 50
=
5
25 50 25
= 0, 20

3.2) Dos equinos al azar


3.2.1) Con reposición
1) Como la característica Bayo es la misma para los dos animales seleccionados, no se ven diferencias si se
los permuta o cambia de lugar por lo tanto NO multiplicamos por dos.
17 17 289
p (BB ) = * = = 0,1156
50 50 2500
2) Como indica el orden en que deben ocurrir los sucesos sólo hay una forma de calcularlo
17 15 255
p ( BZ ) = * = = 0,1020
50 50 2500

3) Al no indicar el orden en que deben ocurrir los sucesos, el planteo tiene dos formas de presentarse
17 15
p (BZ ) + p ( ZB ) ó 2* p (BZ ) = 2* * = 0, 2040
50 50

4) Como no aclara orden puedo plantear un caso y multiplicar por las permutaciones, es decir, por la cantidad
de cambios de lugar diferentes que se pueden dar. En este caso debo multiplicar por 2 debido a que sólo se
pueden dar en dos órdenes: primero BC1 y luego ZC2, o primero ZC2 y luego BC1.
11 6
p (BC1 IZC2 ) = 2* * = 0, 0528
50 50
3.2.2) Sin reposición
En este caso debemos recordar que:
- para calcular la probabilidad del primer elemento, se razona de la misma manera que lo que se hizo
con reposición.
- en el cálculo de la probabilidad del segundo elemento que se selecciona, y en los sucesivos, el
denominador (cantidad de elementos que pueden ser seleccionados) siempre van disminuyendo.
1) En este caso cuando se selecciona el segundo elemento y el primero no se repuso vamos a tener
también un caso favorable menos
17 16
p (BB ) = * = 0,1110
50 49
17 15 255
2) p (BZ ) = * = = 0,1041
50 49 2450
17 15
3) p (BZ ) + p ( ZB ) = 2* p (BZ) = 2* * = 0, 2082
50 49
11 6
4) p (BC1 I ZC2 ) = 2* * = 0, 0539
50 49

EJERCICIO 4) Queremos evaluar la calidad del análisis clínico en la detección de cáncer de mama. Para
ello se consideran los 2641 casos de consulta en un servicio de ginecología y patología mamaria de Capi-
tal Federal.
Los resultados registrados se han tabulado a continuación:

7
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

Resultado del análisis Resultado de la biopsia


clínico Cáncer Patología benigna Total
Anormal 635 268 903
Normal 486 1252 1738
Total 1121 1520 2641

Calcular: sensibilidad, especificidad, valor predictivo positivo, y valor predictivo negativo.

SOLUCIÓN
Para cada medida de calidad del análisis clínico se aplican las siguientes fórmulas:
Sensibilidad = P(+/E)= VP/(VP+FN)

Sensibilidad = 635/1121 = 0,5664

Especificidad = P(-/ E )=VN/(FP+VN)

Especificidad = 1252/1520 = 0,8237


VPP = P(E/+)=VP/(VP+FP)

Valor predictivo positivo = 635/903 = 0,7032

VPN = P( E /-)=VN/(VN+FN)

Valor predictivo negativo = 1252/1738 = 0,7204

EJERCICIO 5) Un test de diagnóstico tiene una probabilidad 0,9 de detectar la presencia de Escherichia
coli, en caso de haberla (sensibilidad del test). Si no está presente, detecta su ausencia con una probabi-
lidad de 0,8 (especificidad del test). La probabilidad de que una muestra de agua contenga Escherichia
coli es 0,20 (prevalencia).

1- ¿Cuál es la probabilidad de que el test dé un resultado positivo?


2- Suponiendo que el test dio un resultado positivo, ¿cuál es la probabilidad de que realmente la muestra
de agua contenga E. coli? (Valor predictivo positivo del test)
3- Por otro lado, si el test da un resultado negativo, ¿cuál es la probabilidad de que realmente el agua
está libre de bacterias? (Valor predictivo negativo del test)
4- Calcular el coeficiente Falso positivo = P(test positivo cuando la bacteria está ausente)
5- Calcular el coeficiente Falso negativo = P(test negativo cuando la bacteria sí está presente)

SOLUCIÓN
Consideremos una tabla similar a la del ejemplo anterior:
Bacteria Escherichia Coli
Presente Ausente
Resultado del test Positivo VP FP PP
diagnóstico Negativo FN VN PN
0,20 0,80 1,00

Sabemos que la sensibilidad de la prueba es 0,9, lo que indica que:

P(+/presente)= 0,9

Es decir que: VP/0,2 = 0,9 luego VP= 0,2*0,9 = 0,18


Además sabemos que la especificidad es 0,8, lo que nos indica que:

P(-/ausente)=0,8

8
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

Es decir que: VN/0,8 = 0,8 luego VN= 0,8*0,8 = 0,64

Volquemos estos resultados en nuestra tabla:


Bacteria Escherichia Coli
Presente Ausente
Resultado del test Positivo 0,18 0,16 0,34
diagnóstico Negativo 0,02 0,64 0,66
0,20 0,80 1,00

2- Suponiendo que el test dio un resultado positivo, ¿cuál es la probabilidad de que realmente la muestra
de agua contenga E. coli? (Valor predictivo positivo del test)

VPP = P(presente/+) = 0,18/0,34 =0,5294

3- Por otro lado, si el test da un resultado negativo, ¿cuál es la probabilidad de que realmente el agua
está libre de bacterias? (Valor predictivo negativo del test)

VPN = P(ausente/-) = 0,64/ 0,66= 0,97

4- Calcular el coeficiente Falso positivo = P(test positivo cuando la bacteria está ausente)

P(+/ausente) = 0,16/0,8 =0,2

5- Calcular el coeficiente Falso negativo = P(test negativo cuando la bacteria sí está presente)

P(-/presente) = 0,02/0,20= 0,10

PROBLEMAS PROPUESTOS
EJERCICIO 1) Un grupo de 60 perros fue clasificado como indica el cuadro:
Cachorro Adulto
Negro 6 9
Marrón 12 23
Blanco 2 8
Calcular:
a) la probabilidad de seleccionar:
a.1) un perro negro del grupo de cachorros;
a.2) un cachorro negro.
b) si se seleccionan dos perros, ¿cuál es la probabilidad de que:
b.1) uno sea un cachorro marrón y el otro un adulto negro?
b.2) el primero sea adulto blanco y el segundo un perro marrón?

EJERCICIO 2) Se efectuó la Prueba de Tuberculosis en vacas de un tambo y se obtuvieron los siguientes


resultados:
VAQ. VACA-1aP. VACA-2aP. VACA-3aP.
POSITIVAS 1 2 6 15
NEGATIVAS 7 10 13 10
SOSPECHOSAS 2 4 5 5
Antes de responder a las preguntas, clasifique los sucesos definidos en ellas, en mutuamente excluyentes o
no excluyentes, y enumérelos.
a) ¿Cuál es la probabilidad de hallar:
a.1) un animal de primera parición y negativo?
a.2) un animal de segunda o tercera parición y sospechoso?
a.3) un animal positivo entre las vaquillonas?
b) Si se examinan dos animales, ¿cuál es la probabilidad de que:
9
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

b.1) sean, el primero sospechoso y vaquillona y el segundo vaca de tercera parición y negativo?
b.2) sean uno negativo y otro sospechoso?
b.3) el segundo sea negativo sabiendo que el primero es una vaca negativa de tercera parición?

EJERCICIO 3) Un test detecta un cierto tipo de bacteria T con una probabilidad 0,90 en caso de haberla. Si
no la hay, detecta la ausencia, con probabilidad 0,80. Sabiendo que la probabilidad de que una muestra de
agua contenga la bacteria de tipo T es 0,20, calcular la probabilidad de que:
a) realmente haya presencia de bacteria cuando el test haya dado positivo.
b) realmente haya presencia de bacteria cuando el test haya dado negativo.
c) haya bacteria y además el test dé positivo.
d) o haya bacteria o el test dé positivo.

EJERCICIO 4) La esferocitosis es un tipo particular de anemia que se encuentra en 1 cada 2000 pacientes
con anemia. Se conocen dos métodos de detección: CHCM (concentración de hemoglobina corpuscular
media) mayor o igual a 34,5 y ADE (amplitud de distribución eritrocitaria) mayor o igual a 14,5. El test basado
en la CHCM tiene una sensibilidad de 86% y una especificidad de 90%, mientras que en el test basado en la
ADE la sensibilidad es de 94% y la especificidad de 88%.
a) ¿Cuál es la probabilidad de que una persona con anemia cuyo CHCM es mayor o igual a 34,5 tenga
esferocitosis?
b) ¿Cuál es la probabilidad de que una persona con anemia cuyo ADE es mayor o igual a 14,5 no tenga
esferocitosis?

EJERCICIO 5) Se sabe que uno de cada mil individuos contraen cierta enfermedad en una población de
estudio. Para detectar esta enfermedad se usa un test que da resultado positivo en el 99% de los casos de
personas enfermas, en tanto que da positivo sólo en el 2% de los casos de las personas sanas.
a.- Si tomamos un individuo al azar, le realizamos el test y da positivo, ¿cuál es la probabilidad de que haya
contraído la enfermedad?
b.- Si ha dado negativo el test, ¿cuál es la probabilidad de que la persona esté sana?

Completar la siguiente tabla:


Presencia de enfermedad
Enfermos Sanos
Resultado del test Positivo
diagnóstico Negativo

Sensibilidad:
Especificidad:
Valor predictivo positivo:
Valor predictivo negativo:

10
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

CUESTIONARIO
1) En un diario comentan que los accidentes automovilísticos en las rutas son más probables actualmente
que hace diez años. El diario de la competencia informa que este año la probabilidad de que suceda un
accidente automovilístico para las vacaciones de invierno es de 1,5; por lo que aconseja prudencia.
Opine sobre lo publicado en este último. Justifique su opinión.
2) Dados dos sucesos distintos de vacío A y B, puede ser que:
a) p (A) sea mayor que p (A/B)
b) p (A) sea igual que p (A/B)
c) p (A) sea menor que p (A/B)
Justifique en forma gráfica, analítica o con ejemplos cada una de las respuestas.

3) Defina probabilidad condicional. Ejemplifique.

4) Haga un círculo en verdadero (V) o falso (F) según corresponda:


Si A y B son dos sucesos no vacíos, incluidos en un espacio muestral S, cuyas probabilidades son 0,40 y
0,30 respectivamente, entonces:

- (V) (F) A y B pueden ser o no mutuamente excluyentes


- (V) (F) A y B son mutuamente excluyentes
- (V) (F) A y B no son mutuamente excluyentes

5) Haga un círculo en verdadero (V) o falso (F) según corresponda:


Si A y B son dos sucesos no vacíos, incluidos en un espacio muestral S, con p(A)= 0,40; p(B)= 0,30;
p(A/B)=0,7 entonces:

- (V) (F) A y B pueden ser o no independientes


- (V) (F) A y B son independientes
- (V) (F) A y B no son independientes

6) Según la teoría axiomática de probabilidades la probabilidad es una función que:


• tiene como dominio ..........................................................................
• cumple con la cantidad de ............ axiomas.

7) Dados dos sucesos A y B no vacíos incluidos en un espacio muestral S, son ........................ cuando
la ocurrencia de uno no impide la ......................................... del otro en ..................... repetición/nes del
experimento.

11
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

VARIABLE ALEATORIA
DISTRIBUCIONES EN PROBABILIDAD
* OBJETIVOS ESPECÍFICOS
 Comprender los conceptos de variable aleatoria, funciones de probabilidad y de distribución acumulada.
 Aplicar estos conceptos a la interpretación del comportamiento de fenómenos biológicos y conocer
algunas distribuciones de probabilidad que los describen.
 Analizar distintos casos y calcular valores medios y de dispersión.
 Calcular las probabilidades de ocurrencia de resultados experimentales.
* CONTENIDOS TEMÁTICOS
Variable aleatoria: discreta y continua.
Distribución de probabilidad, función de cuantía, densidad y distribución acumulada. Distribuciones de
probabilidad, Esperanza y varianza. Propiedades de la esperanza y la varianza. Percentil. Distribuciones
especiales: Bernoulli, Binomial, Normal, Normal estandarizada, t de Student y Ji-Cuadrado.

* GLOSARIO
Variable aleatoria. Funciones de probabilidad: función de cuantía, función de densidad, función de
distribución acumulada. Percentiles. Esperanza matemática. Varianza.
Distribuciones de probabilidad discretas y continuas. Distribuciones particulares: Binomial, Normal, t de
Student y Ji-Cuadrado.

PROBLEMAS RESUELTOS
EJERCICIO 1) Si X es una variable aleatoria discreta tal que:
xi 0 1 2 3 4
p(xi) 0,1 0,1 0,35 0,25 .……

a) Completar el valor faltante; b) Calcular la función de distribución acumulada; c) Determinar P(X ≥ 2);
d) Graficar la función de cuantía y la función de distribución acumulada; e) Hallar E(X); f) Hallar E(X+2);
g) Hallar E(2X)

SOLUCIÓN: observemos que la variable en estudio es una variable aleatoria discreta

a) Para resolver este punto debemos recordar una de las condiciones para que una función sea una función
de probabilidad puntual o función de cuantía: la suma de las probabilidades puntuales es igual a uno,
simbólicamente:
n

∑ p( x ) = 1 .
i =0
i

4
En nuestro caso ∑ p( x ) = 1 , es decir: p(0) + p(1) + p(2) + p(3) + p(4) = 1 ;
xi = 0
i

reemplazando por los valores de tabla nos queda: 0,1+ 0,1+ 0,35 + 0,25 + p(4) = 1, despejando obtenemos:
p(4)=1 - 0,1 - 0,1 - 0,35 - 0,25.

Por lo tanto el valor faltante es: p(4)=0,2

Nota:
Nota observar que el n de la sumatoria, puede ser infinito.

b) La función de distribución acumulada (F(xi)).


Por ejemplo si queremos F(2), usamos la función de probabilidad puntual, de la siguiente manera:
F (2) = P ( X ≤ 2) = p ( X = 0) + p ( X = 1) + p ( X = 2) = 0,1 + 0,1 + 0, 35 = 0,55
Repitiendo este procedimiento para cada valor de la variable se obtiene la función de distribución acumulada.

12
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

xi 0 1 2 3 4
p(xi) 0,1 0,1 0,35 0,25 0,2
F(xi) 0,1 0,2 0,55 0,80 1,0

c) Nos están preguntando la probabilidad de que la variable tome valores mayores o iguales a dos. Este ítem
se puede resolver de dos formas
1) Utilizando la función de cuantía y sumando cada probabilidad puntual
P ( X ≥ 2) = p ( X = 2) + p ( X = 3) + p ( X = 4) = 0,35 + 0, 25 + 0, 2 = 0,8
2) Utilizando la función de distribución y aplicando las propiedades de que la suma de todas las
probabilidades es uno y de sucesos mutuamente excluyentes:
P ( X ≥ 2 ) = 1- P ( X < 2 ) = 1- P ( X ≤ 1) = 1- 0,2 = 0,8
Por lo tanto P ( X ≥ 2) = 0,8

Nota:
Nota observar que en el caso en que la variable pueda tomar muchos valores, la primera forma de
resolución es poco práctica, ya que podría ser una suma con muchos términos; en cambio la segunda forma
siempre va a ser una operación de, a lo sumo, dos términos.

d) El gráfico de la función de cuantía es un gráfico de bastones que muestra las probabilidades puntuales de
cada valor de la variable. En el eje de las abscisas se ubican los valores de la variable y en el eje de las
ordenadas se ubican los valores de probabilidad puntual.
El gráfico de la función de distribución acumulada es un gráfico de escalones que muestra cuánto
acumula cada valor de la variable, antes del primer valor de la variable la función vale cero ya que no
acumula probabilidad y luego del último valor de la variable la función se mantiene constante en uno ya que
no hay más valores de variable que aporten probabilidad. En el eje de las abscisas se ubican los valores de
la variable y en el eje de las ordenadas los valores de probabilidad acumulada.

e) Para calcular la esperanza de una variable aleatoria discreta se utiliza la siguiente fórmula
n
E ( X ) = ∑ xi p ( xi )
i =o
4
En nuestro caso E ( X ) = ∑ xi p ( xi ) = 0 ∗ 0,1 + 1 ∗ 0,1 + 2 ∗ 0,35 + 3 ∗ 0,25 + 4 ∗ 0,2 = 2,35
i=0
Por lo tanto E(X)=2,35

13
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

f) Para calcular la esperanza que nos están pidiendo hay que utilizar la propiedad que establece que la
esperanza de una variable más una constante es la esperanza de la variable más la constante:
E(X+a)=E(X) + a. En nuestro caso la constante es 2, E(X+2) = E(X) + 2

Por lo tanto E(X+2) = 2,35 + 2 = 4,35

g) Para calcular la esperanza hay que utilizar la propiedad que establece que la esperanza de una
variable por una constante es la esperanza de la variable por la constante: E(aX) = aE(X). En nuestro
caso la constante es 2, E(2X) = 2 E(X),

Por lo tanto E(2X) = 2*2,35 = 4,7

1 2 1
EJERCICIO 2) Dada la función: f (x) =
x +
8 3
a) Verificar que f(x) es función de probabilidad en el intervalo [0;2] y graficar.
b) Hallar la función de distribución acumulada.
c) Calcular E(X)
d) Calcular P(0,5 < X ≤ 1,5)

SOLUCIÓN: observemos que la variable en estudio es una variable aleatoria continua

a) Para verificar que f(x) es una función de probabilidad hay que verificar las dos condiciones:
1) f ( x) ≥ 0 ∀ x ∈ ( −∞; ∞ )

2) ∫ f ( x) dx = 1
−∞

La primera condición se verifica directamente con el gráfico de la función:

f(x)
0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0.0 0.5 1.0 1.5 2.0


x

Desde menos infinito hasta 0 la función vale cero, desde 0 hasta 2 la función es mayor o igual que
cero y desde 2 hasta más infinito la función vale cero. Por lo tanto la primera condición se verifica.

La segunda condición se verifica calculando la integral, es decir verificando que el área bajo la curva es uno.
∞ 0 2 ∞ 0 2 ∞
1 2 1
∫ f (x )dx = ∫ f ( x)dx + ∫ f ( x)dx + ∫ f ( x)dx = ∫ 0 dx + ∫  8 x + 3 dx + ∫ 0 dx =
−∞ −∞ 0 2 −∞ 0 2
2 2
1 x 3 1   x3 x  2 3 2   0 3 0   8 2  1 2
= 0 +  . + x  + 0 =  +  =  +  −  +  =  +  − 0 =  +  = 1
8 3 3  0  24 3  0  24 3   21 3   24 3  3 3

Como la integral es igual a 1 se verifica la segunda condición.

14
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

Por lo tanto se verifican las dos condiciones es decir que f(x) es una función de probabilidad.

b) La función de distribución acumulada es la función que da las probabilidades acumuladas y se obtiene


integrando la función de probabilidad. La integral es muy parecida a la calculada en el punto “a”.
x
x x
1 1  1 u3 1  1 3 1
FX ( x ) = ∫ f ( u ) du = ∫  u 2 +  du =  + u = x + x
0
0
8 3  8 3 3  0 24 3

0 para x < 0
1
 1
FX ( x ) =  x 3 + x para 0 ≤ x ≤ 2
Por lo tanto la función de distribución es:
 24 3
1 para x > 2

c) Para calcular la esperanza de una variable aleatoria continua se utiliza la siguiente fórmula:

E( X ) = ∫ x f ( x)
−∞
dx

2
En nuestro caso:
2 2
1 1
2
1 1   1 x4 1 x2 
E ( X ) = ∫ x f ( x ) dx = ∫ x  x 2 +  dx = ∫  x3 + x dx =  +  =
0 
0
8 3 0
8 3  8 4 3 2 0
2
 1 1  24 22 16 4 7
=  x4 + x2  = + = + = = 1,17
 32 6  0 32 6 32 6 6

Por lo tanto E(X)=1,17.

Nota: La integral fuera del intervalo [0; 2] vale cero.

d) Nos están preguntando la probabilidad de que la variable tome valores entre 0,5 y 1,5.
Para calcular esta probabilidad utilizaremos la función de distribución acumulada. Primero calculamos la
probabilidad de que la variable tome valores menores que 1,5 (reemplazando este valor en la función de
distribución acumulada) y a este valor le restamos la probabilidad de que la variable tome valores menores
que 0,5 (reemplazando este valor en la función de distribución acumulada). Recordemos que, como la
variable es continua, la probabilidad en un punto es igual a cero, por lo tanto:
P ( X < 1,5) = P ( X ≤ 1, 5) = F (1,5) , y lo mismo para 0,5.
Por lo que se puede deducir que no importa si los extremos están o no incluidos, cálculo de probabilidad se
hace de la misma manera.
Nos queda:

P ( 0,5 < X ≤ 1,5 ) = P ( X ≤ 1,5) − P ( X < 0,5) = F (1,5 ) − F ( 0,5 ) =


 1  3 3 1  3    1  1 3 1 1 
=  *   + *   −  *   + *  =
 24  2  3  2    24  2  3 2 
27 1 1 1 26 2 90
= + − − = + = = 0, 46875
192 2 192 6 192 6 192
Por lo tanto P (0,5 < X ≤ 1,5) = 0,46875

EJERCICIO 3) Dada la función: f(x)= 2x definida en el intervalo [0;1] y


0 si x < 0
 2
F (X ) =  x si 0 ≤ x ≤ 1
1 si x > 1

Responder:
a) ¿es f(x) una función de densidad de probabilidad? ¿Por qué?
b) ¿cuál es la probabilidad de (X < ½)?
c) ¿y la P(X≤ 2)?

15
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

d) ¿cuál es la probabilidad de (X ≥ ½)?

SOLUCIÓN: Notemos que la variable en estudio es una variable aleatoria continua

a) Para verificar que es función de densidad, o función de probabilidad debemos probar que la función
cumple con dos propiedades (como en el ejercicio anterior).

Estas son:
1) f(x) ≥ 0 en todo su recorrido
+∞
2)
∫ f(x) dx = 1
−∞
La primera propiedad la verificamos directamente en el gráfico de la función y observamos que el
mismo aparece sobre el eje x (de abscisas), que se corresponde con el eje positivo de ordenadas, en
este caso f(x).
Al observar el gráfico vemos que se cumple la primera propiedad.

f(x) 2.0
La segunda propiedad la verificamos
realizando un cálculo sencillo a partir del
gráfico para evitar calcular integrales. 1.5
Debemos observar que la segunda
propiedad corresponde a considerar el
área bajo la curva que queda delimitada 1.0
por el intervalo de definición o dominio.

0.5

X 0 1 2
En este caso bajo la curva reconocemos una figura geométrica, el triángulo, por lo que debemos
calcular el área del mismo, su base es de 1 unidad y su altura es de 2 unidades, por lo tanto:

b∗h 1∗2
área del triángulo = = = 1
2 2
Como el área bajo la curva de la función es uno se verifica la segunda condición

Por lo tanto se verifican las dos condiciones, entonces f(x) es una función de probabilidad o función
de densidad.

b) Nos están preguntando la probabilidad de que la variable tome valores menores a ½, para esto
utilizaremos la expresión de la función de distribución acumulada, que es una función partida, es decir
que hay que prestar especial atención al valor de la variable ya que este nos va a indicar qué parte de la
función utilizar.
En este caso el valor es ½, este valor está entre 0 y 1, por lo tanto utilizamos la parte central de la
2
función, es decir F(x) = x
2
Por lo tanto F(1/2) = P(X < 1/2) = (1/2) = 0,25

c) Nos están preguntando la probabilidad de que la variable tome valores menores o iguales a 2. En este
caso el valor de la variable es 2, mayor que 1, por lo tanto utilizaremos la última parte de la función, es
decir F(x)=1

Por lo tanto F(2)=(P(X≤ 2) = 1

Nota: observar que el caso continuo es indistinto utilizar los símbolos > o ≥ y < o ≤, ya que la probabilidad
puntual de una variable aleatoria continua es siempre cero. Es decir que:
P(X≤a) = p(X<a) + p(X=a) = p(x<a) + 0 = p(x<a), por lo tanto P(X≤a) = P(x<a)

16
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

d) Nos están preguntando la probabilidad de que la variable tome valores mayores o iguales a ½, a
diferencia de los dos puntos anteriores, no podemos utilizar directamente la función de distribución ya
que esta sirve solamente para probabilidades acumuladas hasta el valor de la variable y, en este caso, es
una probabilidad acumulada a partir de dicho valor de la variable. Por lo tanto tendremos que hacer un
paso más que consiste en escribir la expresión P(X ≥ 1/2) como una probabilidad que acumula por
menor. Sabemos que la probabilidad total es uno por lo tanto: P(X ≥ 1/2)= 1 - P(X < 1/2).
Ahora estamos en condiciones de utilizar la función de distribución con el valor ½ (esta probabilidad fue
calculada en el punto “b”).
Por lo tanto P(X ≥ 1/2)= 1 - P(X < 1/2) = 1 - (1/2) = 1 - 0,25 = 0,75
2

EJERCICIO 4) De acuerdo a las leyes genéticas la inseminación artificial con semen proveniente de machos
Landrace con hembras Duroc Jersey da hijos con las características paternas en un 60% de los casos y el
resto con las características maternas. Si se tomaron 14 crías de este tipo de apareamiento (provenientes de
distintas madres), ¿cuál es la probabilidad de obtener:
a) hasta 5 crías con características maternas?
b) menos de 6 crías con características paternas?
c) el 50% de las crías con características maternas?
d) Hallar V(3X)
e) Hallar V(X+4).

SOLUCIÓN: La variable en estudio es una variable aleatoria discreta, pero a diferencia de las variables
discretas de los ejercicios anteriores, parecería tener una distribución conocida, la distribución Binomial,
cuyas probabilidades están tabuladas. Con lo cual, antes de calcular probabilidades debemos verificar los
supuestos de dicha distribución.
En principio, es necesario precisar en qué consiste el experimento aleatorio. En este caso sería inseminar
artificialmente una hembra Duroc Jersey con semen de un macho Landrace, y observar si un hijo tiene
características paternas.
Este experimento se repite 14 veces y, de esta manera, queda definida la variable binomial.
X: “N° de hijos de machos Landrace con hembras Duroc Jersey con características paternas, en 14 crías”.
1) El experimento aleatorio tiene dos resultados posibles: éxito y fracaso. Cada cría puede tener
características paternas o maternas (por como fue definida la variable el éxito es que tenga características
paternas; pero se podría haber definido de otra forma).
2) Cada repetición del experimento aleatorio es independiente de las demás. Cada cría es independiente de
las demás.
3) Los resultados del experimento aleatorio son mutuamente excluyentes. Si una cría tiene características
paternas no puede tener características maternas.
4) La probabilidad de éxito se mantiene constante a lo largo de todas las repeticiones. La probabilidad de
características paternas (p=0,6) es la misma a lo largo de los 14 repeticiones.
5) El número de repeticiones es prefijado. Hay 14 crías observadas (n=14).

∼Bi (14;0,6).
Una vez verificadas las condiciones de binomialidad se puede decir que X∼

Como la probabilidad de éxito es 0,6 es conveniente definir una variable aleatoria binomial auxiliar ya que
la tabla no puede usarse con probabilidades de 0,6 porque solo cuenta con probabilidades de 0 a 0,5. Por
esta razón definimos
Y: “N° de hijos de machos Landrace con hembras Duroc Jersey con características maternas, en 14 crías”.

∼Bi (14;0,4).
Es una variable aleatoria con distribución binomial con parámetros p=0,4 y n=14: Y∼

a) Nos están preguntando sobre las características maternas por lo tanto debemos utilizar la variable
aleatoria Y. “Hasta 5 crías con características maternas” quiere decir que la variable aleatoria Y puede tomar
valores menores o iguales que 5. Hay dos formas de resolver este ítem:
1) Por tabla, que da la función de distribución acumulada, entrando con n=14 y p=0,4 y buscando el 5
P(Y ≤ 5) = 0,4859

( )
5 14 y 14− y
2) Por fórmula: P(Y ≤ 5) = ∑ y 0, 4 .0, 6
i=0
Por lo tanto la probabilidad de obtener hasta 5 crías con características maternas es de 0,4859.

17
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

Nota: Por lo general es conveniente utilizar la tabla ya que los cálculos con fórmula son muy
trabajosos

b) Nos están preguntando sobre las características paternas por lo tanto debemos utilizar la variable aleatoria
X, pero vamos a tener que hacer un cambio de variable. “Menos de 6 crías con características paternas”
quiere decir que la variable aleatoria X puede tomar valores menores a 6, es decir menores o iguales a 5.
Para hacer el cambio de variable analicemos que sucede con la otra variable, si la variable X puede tomar
valores menores o iguales a 5 quiere decir que la variable Y puede tomar valores mayores o iguales a 9, ya
que si hay 5 crías con características paternas o menos hay 9 con características maternas o más
(recordemos que el total es 14). Este cambio de variable se puede ver más claramente con un esquema en
donde se ubican los valores de ambas variables:

X 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Y 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0

Aclarado este punto, existen dos formas de resolver este ítem:


1) Por tabla, haciendo el cambio de variable y luego utilizando la propiedad de la suma de las
probabilidades totales, entrando con n=14 y p=0,4 y buscando el 8.

P ( X < 6) = P ( X ≤ 5) = P (Y ≥ 9) = 1 − P (Y < 9) = 1 − P (Y ≤ 8) = 1 − 0,9417 = 0, 0583


2) Por fórmula se plantea: (no es necesario hacer el cambio de variable)
5
14 
P( X < 6) = P( X ≤ 5) = ∑  0,6 x 0,414− x
x =0  x 
Por lo tanto la probabilidad de obtener menos de 6 crías con características paternas es 0,0583.
c) Nos están preguntando sobre las características maternas, por lo tanto debemos utilizar la variable Y. “El
50% de las crías con características maternas”, es lo mismo que decir “7 crías con características maternas”,
ya que el 50% de 14 es 7, por lo tanto es la probabilidad puntual de que la variable Y tome el valor 7. Hay dos
formas de resolver este ítem
1) Por tabla, restándole a la probabilidad acumulada hasta 7 la probabilidad acumulada hasta 6.
P(Y = 7) = P(Y ≤ 7) - P(Y ≤ 6) = 0,8499 - 0, 6925 = 0,1574

2) Por fórmula: ( )
P(X = 7) = 14
7 7
x 0, 4 ⋅ 0, 6 = 0,1574
Por lo tanto, la probabilidad de obtener el 50% de las crías con características maternas es 0,1574.
Nota: la fórmula para el cálculo de las probabilidades puntuales no es la misma que la del cálculo de las
probabilidades acumuladas, ya que no tiene la sumatoria.

d) La varianza de toda variable con distribución binomial es: V(X)=np(1-p), por lo tanto en nuestro caso
2
V(X)=14*0,4*(1-0,4)=14*0,4*0,6=3,36. Aplicando la siguiente propiedad V(aX)=a V(X), y reemplazando a por
2
3, la varianza que nos están pidiendo queda: V(3 X)=3 *V(X)
Por lo tanto, V(3X)=9*3,36=30,24

e) Aplicando la siguiente propiedad V(X±a)=V(X) y reemplazando a por 4, la varianza que nos están
pidiendo queda V(X+4) = V(X)
Por lo tanto, V(X+4)= 3,36

EJERCICIO 5) Un tambero está al borde de la quiebra por lo que sus expectativas están puestas en la
producción futura. Las vacas Holando Argentino de su tambo tienen un rendimiento normal con media 450
litros y desvío estándar de 80 litros, por mes. El tambero superaría la situación actual si en el próximo mes
cada vaca produce más de 510 litros en promedio.

a) ¿Cuál es la probabilidad de que el tambero no llegue a la quiebra?


b) Sabemos además que el tambero pierde todos sus bienes personales si la producción mensual es
menor a 320 litros en promedio, ¿cuál es la probabilidad de que quiebre pero sin llegar a exponer su
patrimonio personal?

18
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

c) Si el tambero produjera en otro país tendría un 30% de probabilidad de no ir a la quiebra, ¿cuántos litros
tendría que producir para no quebrar?

SOLUCIÓN: La variable en estudio es una variable aleatoria continua, a diferencia de los ejercicios
anteriores, es una variable aleatoria con distribución conocida y tabulada. Por la información que nos dan en
el enunciado sabemos que es una variable aleatoria con distribución normal, con media poblacional 450
2 2
litros/mes y varianza poblacional de 6400 litros /mes (ya que su desvío estándar es de 80 litros/mes), por lo
tanto podemos decir que:

X: "Rendimiento mensual de leche de una vaca Holando-Argentino en un tambo"


X ∼ N(µ=450 litros/mes ; σ =6400 litros /mes )
2 2 2

Recordemos que sólo contamos con la tabla para la distribución normal estándar por lo tanto tendremos
que estandarizar la variable con la siguiente fórmula:
X −µ X − 450 y sabemos que Z tiene una distribución normal estándar, es decir una distribución
Z= =
σ 80
normal con media poblacional 0 y varianza poblacional 1, simbólicamente: Z∼N(0,1)
a) El tambero llega a la quiebra si produce a lo sumo 510 litros/mes por animal, por lo tanto no llega a la
quiebra si produce más de 510 litros/mes, es decir que nos están preguntando: ¿cuál es la probabilidad de
que la variable tome valores mayores que 510?, simbólicamente se escribe: P(X > 510) (tendremos que
utilizar la propiedad de que la probabilidad total es uno, ya que todas las tablas dan probabilidades para
valores menores que un cierto valor, ya que son tablas de funciones de distribución acumulada).
 X − µ 510 − 450 
P( X > 510) = P  >  = P( Z > 0,75) = 1 − P(Z ≤ 0, 75) = 1 − 0,77337 = 0, 22663
 σ 80 

El área sombreada bajo la curva normal es de 0,22663.

Por lo tanto, la probabilidad de que el tambero no


llegue a la quiebra es de 0,22663.

Nota: se entra en tabla por los márgenes con el valor


estandarizado de la variable, y se busca la probabilidad en el interior de la misma.

b) El tambero llega a la quiebra si produce a lo sumo 510 litros/mes y pierde su patrimonio personal si
produce menos de 320 litros/mes, por lo tanto no pierde su patrimonio personal si produce más de 320
litros/mes. Es decir que nos están preguntando: ¿cuál es la probabilidad de que la variable tome valores
entre 320 y 510? Simbólicamente se escribe: P (320 ≤ X ≤ 510)
 320 − µ 510 − µ   320 − 450 510 − 450 
P (320 ≤ X ≤ 510) = P  ≤Z ≤  = P ≤Z≤ =
 σ σ   80 80 
= P (−1, 63 ≤ Z ≤ 0, 75) = P ( Z ≤ 0, 75) − P ( Z ≤ −1, 63) = 0, 77337 − 0, 05155 = 0, 72182

El área sombreada bajo la curva normal es de 0,72182

Por lo tanto, la probabilidad de que el tambero llegue a la quiebra sin perder su patrimonio
personal es de 0,72182.

c) Si el tambero, en otro país, tiene una probabilidad de 0,3 de no irse a la quiebra, debemos buscar el
valor de la variable que nos determina esta probabilidad, es decir buscamos el valor de “a” que resuelve:
P(X>a)=0,3, pero debemos estandarizar, es decir que buscamos “b” que resuelva: P(Z>b)=0,30.

19
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

P ( Z > b) = 0,30 ⇒ P ( Z ≤ b) = 1 − 0,3 ⇒ P ( Z ≤ b) = 0,7 .


Entrando por el interior de la tabla con el valor de probabilidad 0,7 (o con el valor más cercano a este),
buscamos el valor de la variable en los márgenes, obtenemos que b = 0,53. Pero nos interesa este valor sin
estandarizar por lo tanto debemos “des-estandarizar”. Para esto debemos despejar el valor de X de la
fórmula de estandarización:
a−µ
b = Z 0, 7 = ⇒ Z 0, 7 * σ = a − µ ⇒ Z 0 ,7 * σ + µ = a
σ
En nuestro caso a = 0, 52*80 + 450 ⇒ a = 41, 6 + 450 ⇒ a = 491, 6
Por lo tanto si el tambero produjera en otro país debería producir más de 491,6 litros/mes para no irse a la
quiebra.

EJERCICIO 6) Sea X una variable aleatoria con distribución t-Student, con 16 grados de libertad
a) ¿Cuál es la probabilidad de que X ≤ 2,12?
b) ¿Cuál es la probabilidad de que X > 2,921?
c) ¿Cuál es la probabilidad de que X < -2,583?
d) ¿Cual es el valor de “a” que cumple con la siguiente restricción: P(X≤a)=0,90?
e) ¿Cuál es el valor de “a” que cumple con la siguiente restricción: P(X<a)=0,05?

SOLUCIÓN: La variable en estudio es una variable aleatoria continua con distribución t-Student con 16
grados de libertad por lo tanto podemos escribir: X∼t16. Vamos a utilizar la tabla de la distribución t, para
entrar en tabla necesitamos los grados de libertad, que en nuestro caso son 16, por lo tanto solo
utilizaremos la fila correspondiente a 16 para resolver los diferentes ítem del ejercicio.

a) En la tabla de t, función de distribución, las probabilidades se encuentran en el encabezado de


columna, en el encabezado de las filas figuran los grados de libertad, y los valores de la variable se hallan
en el interior de la tabla. Por lo tanto nos ubicamos en la fila correspondiente a 16 grados de libertad,
ubicando el valor de la variable pedido, que en este caso es 2,12, y buscamos en el encabezado de
columna la correspondiente probabilidad, que es 0,975.

Por lo tanto, P(X ≤ 2,12)=0,975.

Nota: si no está exactamente el valor de variable que buscamos se utiliza el valor más próximo.

b) Como nos están pidiendo la probabilidad de que la variable tome un valor mayor que 2,921 tendremos
que utilizar la propiedad de la suma de las probabilidades totales, ya que la tabla sólo contiene
probabilidades de valores menores que un valor de la variable.
Entonces P(X > 2,921) =1-P(X ≤ 2,921). Para encontrar P(X ≤ 2,921) hacemos lo mismo que en el
punto “a” y obtenemos que P(X ≤ 2,921) = 0,995. Con lo cual P(X>2,921)=1-0,995=0,005

Por lo tanto, P(X > 2,921) = 0,005.

c) La tabla de la distribución t sólo cuenta con los valores positivos de la variable, pero como es una
distribución simétrica utilizamos estos valores para encontrar probabilidades de los valores negativos. Por
ser simétrica podemos escribir P(X < -2,583) = P(X > 2,583) y seguir resolviendo como en el punto “b”,
con lo cual P(X < -2,583) = P(X > 2,583) = 1-P(X < 2,583)=1- 0,99 = 0,01

Por lo tanto, P(X < -2,583) = 0,01.

Nota: la simetría nos asegura que el área que queda a la izquierda del valor negativo de la variable es la
misma la que queda a la derecha del valor positivo de la variable.
d) Nos están pidiendo un valor de variable y nos están dando la probabilidad de que los valores de t sean
menores de ese valor de variable (0,90), por lo tanto entramos por el encabezado de columna con este
valor, lo cruzamos con la fila de los 16 grados de libertad y así queda determinado el valor que estamos
buscando: 1,337.
Simbólicamente: P(X<a) = 0,90 ⇒ a = t16,0.90 = 1,337
Por lo tanto, a =1,337.

20
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

e) A diferencia del punto anterior, no podemos entrar directamente a tabla, por que la tabla cuenta solamente
con valores de probabilidad desde 0,6 hasta 0,9995. Por lo tanto, tendremos que utilizar nuevamente la
propiedad de simetría de la distribución.
Por simetría: P ( X < a ) = 0, 05 ⇒ P ( X > − a ) = 0, 05
Por suma de las probabilidades totales: P ( X > − a ) = 0,05 ⇒ 1 − P ( X < −a ) = 0,05
Despejando: P ( X < − a ) = 1 − 0,05 ⇒ P ( X < − a ) = 0,95 .
Ahora podemos buscar el valor en la tabla, cruzando la fila de los 16 grados de libertad con el valor de
probabilidad 0,95, nos da que el valor de la variable es 1,746, es decir que – a =1,746, con lo cual a =-1,746.
Simbólicamente: P(X< a ) = 0,05 ⇒ a = t16,0,05= - t16,0,95 = -1,746
Por lo tanto, a =-1,746.

EJERCICIO 7) Sea Y una variable aleatoria con distribución Ji-cuadrado, con 22 grados de libertad
a) ¿Cuál es la probabilidad de que Y ≤ 26,04?
b) ¿Cuál es la probabilidad de que Y > 33,92?
c) ¿Cuál es el valor de “b” que cumple con la siguiente restricción P(Y<b) = 0,25?
d) ¿Cuál es el valor de “b” que cumple con la siguiente restricción P(Y>b) = 0,1?

SOLUCIÓN: La variable en estudio es una variable aleatoria continua con distribución Ji-Cuadrado con
22 grados de libertad por lo tanto podemos escribir: Y∼ χ 22 . Vamos a utilizar la tabla (de distribución
2

acumulada) de la distribución Ji. Para entrar en tabla necesitamos los grados de libertad, que en nuestro
caso son 22, por lo tanto solo utilizaremos la fila correspondiente a 22 para resolver los diferentes ítem
del ejercicio. La tabla de Ji es parecida a la de la t ya que cuenta con los valores de la variable en la parte
central, los grados de libertad en la primera columna y los valores de probabilidad en la primera fila.

a) Para obtener el valor que nos están pidiendo solo tenemos que buscar en la fila de los 22 grados de
libertad el valor de la variable 26,04, y leer en la fila de encabezados el valor de probabilidad
correspondiente.
Por lo tanto, P(Y ≤ 26,04) = 0,75.

Nota: si no está exactamente el valor de variable que buscamos se utiliza el valor más próximo.

b) Una vez más tendremos que utilizar la propiedad de la suma de las probabilidades totales ya que la
tabla sólo da probabilidad para valores menores que un determinado valor de variable y nos están
pidiendo una probabilidades para valores mayores que un determinado valor de variable. Con lo cual
P(Y> 33,92) = 1-P(Y ≤ 33,92), solo falta buscar el valor de probabilidad en tabla como en el punto “ a ”.
P(Y>33,92) =1-P(Y ≤ 33,92)=1-0,95 = 0,05
Por lo tanto, P(Y > 33,92) = 0,05.

c) Entramos directamente en tabla con los grados de libertad 22 y el valor de probabilidad 0,25, donde se
cruzan la fila de los grados de libertad y la columna del valor de probabilidad queda determinado el valor
pedido: b = 17,24
Simbólicamente: p(Y < b) = 0,25 ⇒ b = χ 22
2
, 0, 25 = 17,24
Por lo tanto, b=17,24.

d) Una vez más tendremos que utilizar la propiedad de la suma de las probabilidades totales
P (Y > b) = 0,1 ⇒ P (Y < b) = 1 − 0.1 ⇒ P (Y < b) = 0,9 . Ahora hacemos lo mismo que en el punto “c”,
pero con un valor de probabilidad de 0,9 y obtenemos que b = 30,81.
Simbólicamente: p(Y < b) = 0,1 ⇒ b = χ 22
2
, 0 , 9 = 30,81

Por lo tanto b=30,81

Nota: la distribución ji-cuadrada no es simétrica.

21
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

EJERCICIO 8) Un laboratorio afirma que una droga causa de efectos secundarios en una proporción de
5 de cada 100 pacientes. Para contrastar esta afirmación, otro laboratorio elige al azar a 2 pacientes a los
que aplica la droga. ¿Cuál es la probabilidad de los siguientes sucesos?
Resolver los siguientes ítems de dos maneras diferentes, utilizando la distribución correspondiente a la
variable de interés, y también aplicando los conceptos aprendidos en la unidad I.
a) Ningún paciente tenga efectos secundarios.
b) Uno tenga efectos secundarios y el otro no
c) Ambos tengan efecto secundario
SOLUCIÓN
Si aplicamos los conceptos de la unidad 1, debemos considerar los sucesos:
E: que el paciente tenga efectos colaterales provocados por la droga.
NE: que el paciente tenga efectos colaterales provocados por la droga.
El espacio muestral correspondiente al experimento en el que se extraen 2 individuos, con reposición,
formando el siguiente espacio muestral:
S = {(E, E); (E, NE); (NE, E); (NE, NE)}

Si aplicamos los conceptos de la unidad 2, necesitamos considerar la siguiente variable aleatoria:


X:”cantidad de pacientes con efectos secundarios provocados por la droga, de un conjunto de 2”. Es una
variable aleatoria discreta, con distribución binomial, que tiene como parámetros: n=2 y p=0,05.
En este punto, sería conveniente que usted aplique las condiciones de la binomial a esta situación prácti-
ca, para verificar que se trata de una distribución binomial.

a) Ningún paciente tenga efectos secundarios.


Aplicando la unidad 1, se resuelve como:
P(NE ∩ NE) = 0,95 * 0,95
Aplicando la unidad 2, se resuelve como:
P(x=0) = 0,9025

b) Uno esta tenga efectos secundarios y el otro no


Aplicando la unidad 1, se resuelve como:
P[ (NE ∩ E) ∪ (E ∩ NE) ] = (0,95 * 0,05) * 2 = 0,095
Aplicando la unidad 2, se resuelve como:
p(x=1)= p(x≤1) - p(x=0) =0,9975-0,9025=0,095

c) Ambos tengan efecto secundario


Aplicando la unidad 1, se resuelve como:
P(E ∩ E) = 0,05 * 0,05 = 0,0025

Aplicando la unidad 2, se resuelve como:


p(x=2)= p(x≤2) - p(x≤1) =1-0,9975=0,0025

EJERCICIO 9) En una jaula hay 3 cobayos negros y 5 blancos. Se extraen simultáneamente dos coba-
yos, se pide:
1. Hallar el espacio muestral si se observa y registra el color.
2. Calcular la probabilidad de que:
2.a- ambos sean negros.
2.b- ambos sean blancos.
2.c- uno sea negro y el otro blanco.
3. Si interesa estudiar la variable X: “número de cobayos negros seleccionados”, se pide:

22
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

3.a- A partir de los valores que toma la variable X, ordenarlos en una tabla, y calcular la función de
cuantía y la función de distribución.
3.b- Graficar ambas funciones.
3.c- Calcular esperanza y varianza.
3.d- Calcular la probabilidad de que a lo sumo dos cobayos sean negros.
SOLUCIÓN
1. Hallar el espacio muestral correspondiente a observar y registrar el color, y a la extracción de dos
cobayos.
S = { NN , NB, BN , BB}
2. Calcular la probabilidad de que:
2.a- ambos sean negros.
3 2 3
P ( NN ) = ∗ = = 0,107
8 7 28
2.b- ambos sean blancos.
5 4 5
P ( BB ) = ∗ = = 0,357
8 7 14
2.c- uno sea negro y el otro blanco.
3 5 15
P ( N ∩ B ) ∪ ( B ∩ N )  = 2 ∗ P ( N ∩ B ) =  ∗  ∗ 2 = = 0, 536
8 7 28
3. Si interesa estudiar la variable X: “número de cobayos negros seleccionados”, se pide:
3.a- A partir de los valores que toma la variable X, ordenarlos en una tabla, y calcular la función de
cuantía y la función de distribución.
X p(X) F(X)
0 5/14 5/14
1 15/28 25/28
2 3/28 1
3.b- Graficar ambas funciones.
p(xi) 0,60

0,50

0,40

0,30

0,20

0,10

0,00
0 1 2
X

3.c- Calcular esperanza y varianza.


5 15 3 3
E ( X ) = 0∗ + 1 ∗ + 2 ∗ = = 0, 75
14 28 28 4
2
5 15 3 3 45
V ( X ) = 0 ∗ + 12 ∗ + 22 ∗ −   =
2
= 0, 402
14 28 28  4  112
3.d- Calcular la probabilidad de que a lo sumo dos cobayos sean negros. P ( X ≤ 2) = F ( 2) = 1

23
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

PROBLEMAS PROPUESTOS
EJERCICIO 1) La distribución del número de crías nacidas muertas por parición de un lote de 200 cerdas
Duroc Jersey considerado como población es la siguiente:
xi 0 1 2 3 4 5
p(xi) 0,05 0,20 0,30 0,20 0,15 0,10

a) ¿Cuál y de qué tipo es la variable aleatoria en estudio?


b) p(xi) es la función de ..........................................................................................................................
c) Completar la tabla con la función de distribución acumulada.
d) Calcular P(X ≥ 2)
e) Calcular P(X < 3)
f) Calcular P(2 ≤ X ≤ 4)
g) Calcular la E(X)
h) Calcular la E(X - 0,5)

EJERCICIO 2) Considere la función de f (x ) = −2x en [- 1; 0] densidad:

0 para x < -1

con función de distribución acumulada:
F( X ) = -x2 +1 para -1≤ x ≤ 0
1 para x > 0

Calcular:
a) ¿De qué tipo es la variable en estudio?
b) F(X) es la función de ................................................ y f(x) es la función de ....................................
c) P (-1 ≤ X ≤ -0,5)
d) P (-0,5 ≤ X ≤ -0,1)
e) P (X ≥ -2)
f) P (X ≤ 1)
g) P (X < -0,25)

EJERCICIO 3) Una variable aleatoria se encuentra definida por:

xi 1 2 3 4 5 6
p(xi) 0,05 0,10 0,25 0,30 0,20 ?

a) ¿De qué tipo es la variable en estudio? ...........................................................................................


b) p(x) es la función de ........................................................................................................................
c) Completar el valor faltante
d) Calcular la F(x)
e) F(x) es la función de ..........................................................................................................................
f) Graficar las funciones de cuantía y de distribución acumulada
g) Calcular la E(X), E(3X) y E(X - 0,5)
h) Calcular P(X ≥ 3)
i) Calcular P(X≤1)
j) Calcular P(X<1)
k) Calcular P(X ≥ 0)

EJERCICIO 4) El exceso de lluvias en ciertos campos bajos produce parasitosis en el ganado.


Precipitaciones anuales mayores a 2000 mm son consideradas, en algunos casos, perjudiciales y provocan
infestaciones que involucran al 20% del ganado bovino destetado. Si se toma una muestra de 12 terneros de
un lote de 1000,
a) Definir la variable en estudio
b) Analizar si la variable verifica las condiciones de una distribución Binomial
c) Definir la variable auxiliar y especificar su distribución.
d) ¿cuál es la probabilidad de que ninguno esté parasitado?

24
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

e) ¿cuál es la probabilidad de que10 o menos estén parasitados?


f) ¿cuál es la probabilidad de que 5 ó 6 no estén parasitados?
g) Calcular la V(X), V(X+10) y V(3X)

EJERCICIO 5) 1ra. parte: La distribución del tiempo de respuesta obtenido en la aplicación de prostaglandi-
nas a hembras caninas preñadas entre 35 y 55 días es normal con media 60 horas y con desvío de 15
horas.
a) Definir la variable en estudio
b) Detallar su distribución
c) Si es necesario detallar la forma de estandarización
d) ¿Cuál es la probabilidad de obtener la reacción luego de 50 horas?
e) ¿Cuál es la probabilidad de obtener la reacción antes de 30 horas?
f) ¿Cuál es la probabilidad de obtener la reacción entre 30 y 60 horas?
g) ¿Cuál es la probabilidad de obtener la reacción luego de 90 horas?
h) ¿A partir de qué tiempo la probabilidad de obtener reacción es del 30%?

2da. Parte (se verá en la unidad temática correspondiente): Si se toma una muestra de 16 hembras
preñadas, ¿cuál es la probabilidad de que, en promedio, tengan la reacción:
a) luego de 50 horas?
b) antes de 30 horas?
c) entre 30 y 60 horas?
d) luego de 90 horas?
e) ¿A partir de qué tiempo medio la probabilidad de obtener reacción es del 30%?

EJERCICIO 6) Sea X una variable aleatoria con distribución t-Student


a) Con 20 grados de libertad.
1. ¿Cuál es la probabilidad de que X ≤ 2,85?
2. ¿Cuál es la probabilidad de que X > 2,09?
3. ¿Cuál es la probabilidad de que X < -2,53?
4. ¿Cual es el valor de “a” que cumple con la siguiente restricción: P(X≤a)=0,90?
5. ¿Cuál es el valor de “a” que cumple con la siguiente restricción: P(X<a)=0,05?
6. ¿Cuáles son los valores de a y b, tales que: P(a≤X≤b) = 0,90, siendo a y b simétricos con
respecto a 0?
b) Con 10 grados de libertad.
1. ¿Cuál es la probabilidad de que X ≤ 2,76?
2. ¿Cuál es la probabilidad de que X > -3,17?
3. ¿Cuál es la probabilidad de que X < 2,23?
4. ¿Cual es el valor de “a” que cumple con la siguiente restricción: P(X≤a)=0,90?
5. ¿Cuál es el valor de “a” que cumple con la siguiente restricción: P(X<a)=0,05?
6. ¿Cuáles son los valores de a y b, tales que: P(a≤X≤b) = 0,90, siendo a y b simétricos con
respecto a 0?

EJERCICIO 7) Sea Y una variable aleatoria con distribución Ji-cuadrado


a) Con 30 grados de libertad.
1. ¿Cuál es la probabilidad de que Y ≤ 43,8?
2. ¿Cuál es la probabilidad de que Y > 34,8?
3. ¿Cuál es el valor de “b” que cumple con la siguiente restricción P(Y<b) = 0,25?
4. ¿Cuál es el valor de “b” que cumple con la siguiente restricción P(Y>b) = 0,1?
5. ¿Cuáles son los valores de a y b, tales que: P(a≤X≤b) = 0,90, dejando a y b áreas iguales en las
colas?
b) Con 15 grados de libertad.
1. ¿Cuál es la probabilidad de que Y ≤ 18,3?
2. ¿Cuál es la probabilidad de que Y > 25?
3. ¿Cuál es el valor de “b” que cumple con la siguiente restricción P(Y<b) = 0,25?
4. ¿Cuál es el valor de “b” que cumple con la siguiente restricción P(Y>b) = 0,1?
5. ¿Cuáles son los valores de a y b, tales que: P(a≤X≤b) = 0,90, dejando a y b áreas iguales en las
colas?

25
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

EJERCICIO 8) En un criadero de perros se dedican a las razas labrador y doberman, de pelajes negro y
marrón. Se selecciona una muestra de 20 perros, y se ordenan los datos en la siguiente tabla:
Negro Marrón
Doberman 4 5
Labrador 3 8

Si se extraen dos perros al azar:


a) Definir el espacio muestral del experimento de la variable aleatoria X: ”Número de labradores negros”
b) Encontrar la función de cuantía (sugerencia: calcular la probabilidad de cada punto muestral)
c) Encontrar F(x)
d) Calcular las siguientes probabilidades: P(X>1) y P(X<2)

EJERCICIO 9) En un pensionado canino se encuentran 20 perros que fueron clasificados por tamaño y
edad:
Cachorro Adulto
Grande 2 1
Mediano 4 6
Pequeño 5 2
1. Calcular la probabilidad de seleccionar un perro:
1.a- mediano del grupo de los adultos.
1.b- mediano y adulto.
2. Si se seleccionan dos perros ¿Cuál es la probabilidad de que:
2.a- uno sea cachorro pequeño y el otro adulto grande.
2.b- el primero sea adulto pequeño y el segundo un perro mediano.

3. Si se sabe que el 40% de los perros del pensionado se contagia de pulgas, y también que la capacidad
es de 20 caniles que constantemente permanecen ocupados:
3.a- Definir la variable en estudio.
3.b- ¿Cuál es la probabilidad de que haya más de 8 perros con pulgas?
3.c- ¿Cuál es la probabilidad de que ninguno se haya contagiado de pulgas?

26
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

CUESTIONARIO
1) Indicar el tipo de variable aleatoria (D: discreta o C: continua) y la unidad experimental, para cada una
de las siguientes variables:
a) X = ”Número de alumnos en una comisión de Elementos de estadística”
b) X = ”Peso del cráneo de un animal”
c) X = ”Cantidad de dinero, en monedas, en un monedero”
d) X =”Producción de leche en un tambo”

2) Defina función de cuantía, ejemplifique y calcule la función de distribución acumulada

3) Dado un grupo de siete perros con ciertas afecciones, se sabe que la probabilidad de que un
tratamiento L sea efectivo es 0,85. Utilizando esta información:
a) defina una variable con distribución Binomial. Especifique dicha distribución.
b) verifique los supuestos teóricos en ESTE CASO.

4) Determinar el intervalo de definición para que la siguiente función sea una función de densidad de
probabilidad.

5) Diga si los siguientes gráficos


corresponden a una función de
distribución acumulada para una variable
aleatoria discreta. Justifique cada caso:
a) b)

c)

6) Si una función de densidad es distinta de cero en el intervalo (2 ; 7), ¿puede ser que la P(X=3)=0?
Justificar.

27
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

7) Sean las variables aleatorias X1 ≈ N(µ1 , σ1 ) y X2 ≈ N(µ2 , σ2 ). Establezca la relación de igualdad o


2 2

desigualdad ( < o > ), según corresponda, entre las siguientes probabilidades:


a) P (µ1 - σ1 < X1 < µ1 + σ1) ............ P (µ2 - σ2 < X2 < µ2 + σ2)
b) P (X1 < µ1) ............ P (X2 < µ2 + σ2)
c) P (X1 < µ1 + σ1) ............ P (X2 >µ2 + σ2)
d) P (X1 > µ1 ) ............ P ( X2 < µ2 )
e) P (X1 < µ1 -2 σ1) ............ P ( X2 > µ2 +2 σ2)

8) Realizar gráficos aproximados en un mismo esquema de:


a) Una distribución normal con media 4 y varianza 2 y una distribución normal con media 8 y varianza
2.
b) Una distribución con media -1 y varianza 3 y una distribución con media –1 y varianza 1.
c) Una distribución normal estándar y una distribución t-Student.
d) Una distribución Ji-cuadrado con 17 grados de libertad y una distribución Ji-cuadrado con 25
grados de libertad.
e) Una distribución t-Student con 20 grados de libertad y una distribución t-Student con 30 grados de
libertad.

9) Indicar verdadero o falso según corresponda:


V F a) La distribución normal es simétrica con respecto de cero.
V F b) Una variable aleatoria discreta puede tener distribución normal
V F c) Cuando los grados de libertad de una distribución Ji-cuadrado tienden a infinito la distribución se
asemeja a la distribución normal.
V F d) Una variable con distribución binomial tiene dos resultados posibles.
V F e) La distribución t-Student tiene los mismos parámetros que la distribución normal estándar.
V F f) La varianza de una variable más una constante es la varianza de la variable más la constante.
V F g) La esperanza de una variable aleatoria de cualquier tipo no puede tomar valores negativos.
V F h) Una variable aleatoria discreta no puede tomar valores negativos.
V F i) La distribución normal estándar tiene desvío estándar igual a 1.
V F j) La esperanza de una constante es siempre 1
V F k) Una variable con distribución t-Student sólo toma valores positivos.
V F l) Una variable con distribución Ji-cuadrado sólo toma valores mayores o iguales a cero.

10) Completar las siguientes expresiones:


a) La suma de las probabilidades de todos los puntos muestrales que pertenecen al mismo espacio
muestral es ...................................................................................................................................
b) La distribución normal es ....................... con respecto a su ........................................................
c) La función de ........................ da las probabilidades puntuales de una v. a. discreta.
d) La distribución t-Student tiene colas más .................................... que la distribución normal.
e) Los parámetros de la distribución Binomial son .................... y .................................................
f) Una variable con distribución Binomial toma solamente valores ...............................................
g) La varianza de una constante es siempre .....................................................................................
h) La función de distribución acumulada se mantiene constante en ...................... cuando la variable
tiende a infinito.
i) La distribución Ji-cuadrado es asimétrica a .................................................................................
j) Una variable con distribución normal estándar tiene media ...... y varianza ...............................
k) La probabilidad puntual de una variable aleatoria continua es siempre .....................................
l) La varianza de una variable por una constante es la varianza de la variable por la constante elevada
al ...................................................................................................................................................

28
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

ESTADÍSTICA DESCRIPTIVA
OBJETIVOS ESPECIFICOS
 Identificar una población o muestra
 Definir la o las variables que caracterizan a una distribución
 Calcular medidas de posición y de dispersión adecuadas para describir cada distribución.

CONTENIDOS TEMÁTICOS
Población y muestra. Variables cuantitativas continuas y discretas. Variable atributo. Principios y tipos de
muestreo. Distribución de frecuencias discretas y continuas. Gráficos. Medidas de posición y dispersión: me-
dia aritmética, mediana, modo, amplitud, varianza, desvío estándar, coeficiente de variación y distancia inter-
cuartílica. Propiedades de media aritmética y varianza. Esperanza, varianza y caso especial de la distribución
de X .

* GLOSARIO
Estadística. Variable: cuantitativa, cualitativa o atributo. Población. Muestra. Muestreo. Gráficos: barras,
bastones, escalones, histogramas; polígonos de frecuencias, ojiva; Boxplot. Media aritmética, Mediana,
Modo, Varianza, Desvío estándar, Coeficiente de variación, Rango o Amplitud. Variación relativa y abso-
luta.

El orden que seguimos es:


 Definir la población de la que seleccionaremos la muestra a evaluar
 Definir la variable de interés, donde debe constar la unidad de observación
 Ordenar los datos en una tabla de frecuencias.
 Graficar frecuencias a partir de la tabla.
 Calcular medidas que nos resuman las características de la distribución de la variable en la muestra.

PROBLEMAS RESUELTOS
EJERCICIO 1) En un estudio sobre la detección de pseudotuberculosis, la Dirección de Bromatología
seleccionó al azar 28 establecimientos, dedicados a la cría y engorde de ovinos, registrando la cantidad
de animales afectados, por establecimiento, al realizar la faena en el frigorífico:

70 110 135 110 77 82 118 110 82 77 77 82 110 110


75 82 75 82 70 75 118 75 120 77 77 82 82 70

a) Identificar la variable y clasificar la variable.


b) Construir la tabla de frecuencias.
c) A partir del boxplot analizar la distribución de la variable.
d) Calcular las medidas de posición y dispersión.
e) Si suponemos que en los establecimientos se realizó un tratamiento que disminuye en 10% la canti-
dad de animales afectados, ¿cómo se modifican las medidas calculadas en el punto e)?

SOLUCIÓN
a) La variable es aquella característica que nos interesa medir, en este caso:
X: cantidad de ovinos atacados de pseudotuberculosis en un establecimiento. V. Cuantitativa Discreta.
En este problema la población en estudio corresponde a los establecimientos dedicados a la cría y
engorde de ovinos; como no se especifica la región en donde están ubicados, solamente con esta descrip-
ción nos alcanza. Entonces, la muestra tomada es de:
n (tamaño de la muestra): 28 establecimientos dedicados a la cría y engorde de ovinos.

b) Tabla de frecuencias: la primera columna contiene los valores de la variable que se registraron en la
muestra, y se simboliza con xi; en la segunda columna se registra cuántas veces se observa cada uno de
los valores de la variable (xi), y corresponde a la frecuencia absoluta simple (fi). En la tercera columna se
registra cuántas veces se observan los valores de la variable menores o iguales a xi, o sea, las frecuen-
cias absolutas acumuladas (Fi). La cuarta columna corresponde al cociente entre fi y n, o sea la frecuen-
cia relativa simple (hi). En la última columna, correspondiente a las frecuencias relativas acumuladas
(Hi), sumamos las frecuencias relativas simples de la misma manera que en la tercera columna, hasta

29
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

acumular el total de la muestra. Por las características de las frecuencias relativas siempre obtendremos
como valor 1, o 100%, o cercanos a ellos, según se expresen en decimales o como porcentajes.

xi fi Fi hi Hi
70 3 3 0,11 0,11
75 4 7 0,14 0,25
77 5 12 0,18 0,43
82 7 19 0,25 0,68
110 5 24 0,18 0,86
118 2 26 0,07 0,93
120 1 27 0,04 0,96
135 1 28 0,04 1,00
TOTAL 28 1,00

La utilidad de la tabla es que el ordenamiento de los datos permite interpretar la información de la mues-
tra. Por ejemplo, tomemos la información de la cuarta fila de datos, en donde x4 = 82:
• f4 = 7, indica que en 7 establecimientos se encontraron 82 ovinos atacados de pseudotuberculosis.
• F4 = 19, se interpreta como que en 19 establecimientos se encontraron a lo sumo 82 ovinos atacados
de pseudotuberculosis (o hasta 82 ovinos atacados de pseudotuberculosis inclusive).
4
NOTA: F4 = ∑f
1
i = f1 + f 2 + f 3 + f 4 = 3 + 4 + 5 + 7 = 19

• h4 = 0,25, expresa que en el 25% de los establecimientos se encontraron 82 ovinos atacados de


pseudotuberculosis.
• H4 = 0,68, indica que en el 68% de los establecimientos se encontraron a lo sumo 82 ovinos atacados
de pseudotuberculosis (o hasta 82 ovinos atacados de pseudotuberculosis inclusive).
4
NOTA: H 4 = ∑h 1
i = h1 +h2 + h3 + h4 = 0,11 + 0,14 + 0,18 + 0, 25 = 0, 68
c) Boxplot.

Para analizar el boxplot debemos prestar atención a


la caja. En este caso vemos que la Me (representada
por la línea horizontal dentro de la caja) está próxima
al C1, de manera que el 25% de los datos centrales
inferiores a ella están muy cercanos, mientras que el
25% de los datos centrales superiores a la Me están
más alejados, si comparamos la distancia entre la Me
y C3. Además toda la caja está desplazada hacia la
parte inferior del gráfico: el bigote inferior es menor
que el superior. Esto nos indica que la distribución es
ASIMÉTRICA POSITIVA.
(Nota: no explicaremos la forma de graficarlo porque
excede el alcance de este curso. Esta gráfica la obte-
nemos aplicando el programa estadístico InfoStat®).

El gráfico siguiente se denomina de ESCALONES, y sirve para representar frecuencias acumuladas, ya sean
las absolutas o las relativas, pero en este ejercicio sólo necesitamos graficar estas últimas.

30
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

NOTA. En los ejercicios especificaremos cuál/es gráficos debe hacer.

Podemos observar los escalones y relacionarlos con el gráfico de la función de distribución acumulada
F(xi), que ya hemos visto en la unidad anterior (correspondiente a Distribuciones de Probabilidad).

d) Medidas de posición
MEDIA ARITMÉTICA
xi fi xi fi
Para calcular la media aritmética debemos sacar el promedio de
todos los valores de la variable que hemos obtenido en la muestra. En la 70 3 210
fórmula observamos que aparece la expresión Σxifi o sea la sumatoria de los 75 4 300
productos entre cada valor de la variable y su correspondiente frecuencia 77 5 385
absoluta simple. Para facilitar los cálculos podemos agregar una columna a 82 7 574
la tabla de frecuencias en donde realizaremos estos productos, de la si- 110 5 550
guiente forma: 118 2 236
Σxi fi 2510 120 1 120
x= = = 89, 64
n 28 135 1 135
Interpretación: aproximadamente 90ovinos atacados 28 2510
MEDIANA
Para calcular la mediana, primero debemos ordenar los datos de menor a xi Fi
mayor o de mayor a menor. En este ejercicio ya ordenamos los datos al construir
la tabla de frecuencias. Como sabemos, esta medida divide a la muestra en dos 70 3
partes iguales, por lo que en el primer paso debemos encontrar la posición de la 75 7
misma, o sea encontrar cuál es el valor central de la muestra (en caso de que n 77 12
sea un número impar), o cuáles son los valores centrales (en caso de que n sea 82 19
un número par). 110 24
n +1 29
Pos Me = = = 14,5 118 26
2 2 120 27
135 28
Entonces los valores centrales ocupan los lugares 14 y 15.
Como los valores centrales son x(14)=82 y x(15)=82, debemos realizar el promedio entre ellos:
x(14 ) + x(15) 82 + 82
Mex = = = 82 ovinos atacados
2 2
f 4 = 7 ⇒ Mo = 82 ovinos atacados

La interpretación es 82 ovinos atacados.

31
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

MODO

xi fi Para calcular el modo tenemos que recurrir nuevamente a la tabla de frecuencias,


70 3 porque en ella vamos a ubicar rápidamente cuál es el valor de la variable que se
repite con mayor frecuencia. Debemos observar cualquiera de las columnas de
75 4
frecuencias simples, en este caso tomamos la columna de fi. La mayor frecuencia
77 5 es f4, por lo tanto:
82 7 f 4 = 7 ⇒ Mo = 82 ovinos atacados
110 5
118 2
120 1
135 1
TOTAL 28 Observar que también estas medidas verifican la condición de asimetría positiva:
Me = Mo = 82 ovinos atacados < X = 89, 64 ovinos atacados
CUARTILES
Otra medida de posición para datos ordenados son los CUARTILES. Para calcularlos dividimos la
muestra en cuatro partes iguales, por lo que calculamos 3 cuartiles, C1, C2 (=Me) y C3.
Realizamos el mismo mecanismo que para calcular la Mediana, en cada una de las dos mitades, y
obtenemos:
C1 = 76 ovinos atacados y C3 = 110 ovinos atacados
Medidas de dispersión
RANGO o AMPLITUD
Esta medida de dispersión es la más sencilla y consiste en conocer cuántas unidades comprende
la totalidad de los valores observados en la muestra. Para calcularlo sólo basta con realizar la resta entre
el xmáx (mayor valor de la variable) y xmín (menor valor de la variable).
Rango o Amplitud = xMáx − xmín = 135 − 70 = 65 ovinos atacados

DISTANCIA INTERCUARTÍLICA
Es la medida de dispersión asociada a los cuartiles, se simboliza dC, y en ella observamos la disper-
sión de los valores centrales, la forma de calcularla es: dC = C3 – C1 , e indica el rango o amplitud donde
se encuentra el 50% “central” de las observaciones.

En este caso es: dC=C3-C1=110-76=34 ovinos atacados

VARIANZA xi fi xi fi xi2fi
En la fórmula observamos que aparece la
expresión xifi, que ya habíamos usado al calcular
70 3 210 14700
2
la media aritmética, y aparece una expresión, ∑xi fi, 75 4 300 22500
la sumatoria de los productos entre el cuadrado de 77 5 385 29645
cada valor de la variable y su correspondiente fre- 82 7 574 47068
cuencia absoluta simple. Para facilitar los cálculos 110 5 550 60500
podemos agregar una columna a la tabla de fre- 118 2 236 27848
cuencias en donde realizaremos estos productos, 120 1 120 14400
de la siguiente forma:
135 1 135 18225
TOTAL 28 2510 234886
1  2 ( Σxi f i )  1  ( 2510 )  1
2 2

s =
2
Σxi f i − =  234886 −  = ( 234886 − 225003, 57 ) = 366, 02
n − 1 
x
n  27  28  27

sx2 = 366,02
Debemos recordar que se expresa en la unidad de la variable pero elevada al cuadrado.

DESVÍO ESTÁNDAR
El desvío estándar es la raíz cuadrada de la varianza. Por lo que lo calculamos de la siguiente forma:

sx = sx2 = 366, 02 = 19 ,13


32
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

Interpretación: aproximadamente 19 ovinos atacados

COEFICIENTE DE VARIACIÓN
Es una medida de dispersión relativa en donde se relaciona una medida de dispersión (sx) con
una medida de posición ( x ), y su resultado se expresa en porcentaje. No tiene unidades de medida.

sx 19,13
C.V.x % = .100 = .100 = 21,34 es decir 21,34%
x 89 ,64
e) Si cada observación se disminuye en 10%, la variable inicial X se modifica de la siguiente forma:
z i = xi - 0,10 xi = xi (1 - 0,10) = 0,90 xi
La media aritmética y la varianza también se modifican, en este caso según la propiedad del producto
entre la variable y una constante:

z = 0,90.x = 0,90.89 , 64 = 80 , 68 ovinos atacados

s z = 0, 90 .s x = 0,81.366 , 02 = 296 , 48 ( ovinos atacados )


2 2 2 2

Como consecuencia de esta modificación, el valor del desvío estándar será:

sz = sz2 = 296, 48 = 17 , 22 ovinos atacados


sZ 0,90.s X s X
El CV no se modifica, ya que: CVZ = = = = CVX
z 0,90.x x

EJERCICIO 2) Los siguientes valores corresponden a la altura, en mm, del complejo QRS de 20 electro-
cardiogramas de galgos de ambos sexos, luego de una competencia:
25,0 29,3 20,0 24,1 22,5 20,5 25,0 24,0 21,0 23,7
17,0 20,5 30,0 20,6 23,2 30,8 27,5 30,3 25,5 33,8
a) ¿Cuál es la variable en estudio y de qué tipo es?
b) Realizar los gráficos correspondientes a los datos ordenados en una tabla de frecuencias.
c) Calcular las medidas de tendencia central y de dispersión, indicando las unidades que correspon-
den a cada caso.

SOLUCIÓN
a) X: altura del complejo QRS en electrocardiogramas de un galgo luego de una competencia, medida en
mm.
n = 20 (tamaño de muestra)

La población en estudio puede definirse como:


 el conjunto de todos los galgos, luego de una competencia  Población Biológica
 el conjunto de todos los valores de altura del complejo QRS en electrocardiogramas de galgos, des-
pués de una competencia  Población Estadística.
La unidad de observación es un galgo.
La clasificación de la variable de interés es cuantitativa continua.
La unidad de medida utilizada en esta variable es mm.

b) Tabla de frecuencias:
[ ; ) x'i fi Fi hi Hi
17,0 - 20,4 18,7 2 2 0,10 0,10
20,4 - 23,8 22,1 7 9 0,35 0,45
23,8 - 27,2 25,5 5 14 0,25 0,70
27,2 - 30,6 28,9 4 18 0,20 0,90
30,6 - 34,0 32,3 2 20 0,10 1,00
TOTAL 20 1,00

33
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

donde: x'i = marca de clase (punto medio del intervalo) fi = frecuencia absoluta simple
Fi = frecuencia absoluta acumulada hi = frecuencia relativa simple
Hi = frecuencia relativa acumulada

Ejercitemos la interpretación de los datos que aparecen en la tabla. Tomemos por ejemplo la infor-
mación del intervalo de clase que aparece en la cuarta fila: [27,2 – 30,6). ¿Cómo interpretamos “[27,2 –
30,6)”? El intervalo es cerrado en 27,2 y abierto en 30,6, por lo que la altura de complejo QRS de los electro-
cardiogramas realizados luego de la competencia a los galgos de la muestra, está comprendida entre 27,2
mm (inclusive) y 30,6 mm (sin incluir).
Como F4 = 18, podemos decir que 18 electrocardiogramas de galgos, luego de una competencia,
tienen una altura de complejo QRS menor a 30,6 mm.
Como h4 = 0,20, decimos que el 20% de los electrocardiogramas de los galgos muestreados, lue-
go de una competencia, tiene una altura de complejo QRS comprendida entre 27,2 mm (inclusive) y 30,6
mm (sin incluir).
f4 = 4, indica que se encontraron 4 galgos, cuyos electrocardiogramas realizados luego de una
competencia muestran una altura del complejo QRS comprendida entre 27,2 mm (inclusive) y 30,6 mm
(sin incluir).
H4 = 0,90, indica que el 90% de los galgos muestreados, luego de la competencia, muestran una
altura en el complejo QRS de hasta 30,6 mm.

6 Histograma Polígono de frecuancias


frecuencia absoluta

0
15,30 18,70 22,10 25,50 28,90 32,30 35,70
Altura

0,40
0,35
0,30
frecuencia relativa

0,25
0,20
0,15
0,10
0,05
0,00
15,30 18,70 22,10 25,50 28,90 32,30 35,70
Altura

Los dos gráficos representan las frecuencias simples (absolutas y relativas), se denominan HISTO-
GRAMAS y también tienen representado un polígono, llamado POLÍGONO DE FRECUENCIAS, que pasa
por los puntos cuyas abscisas son los puntos medios de los intervalos de clase, o las marcas de clase y cu-
yas ordenadas son las frecuencias correspondientes a dicho intervalo. Se cierra el polígono uniendo con las
marcas de clase de dos intervalos ficticios, uno anterior al 1er. intervalo, y otro posterior al último intervalo.
Ambos gráficos representan la densidad de los valores observados de la variable en esta muestra, ya que la
superficie encerrada dentro del histograma es equivalente a la superficie delimitada por el polígono de fre-
cuencias.
La distribución de la variable en esta muestra, presenta una leve asimetría positiva (cola a derecha).

34
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

frec. abs. acumulada 20

15 Poligonal u ojiva

10

5 Histograma

0
15,30 18,70 22,10 25,50 28,90 32,30 35,70
Altura

1,00

0,80
frec. rel. acumulada

0,60

0,40

0,20

0,00
15,30 18,70 22,10 25,50 28,90 32,30 35,70
Altura

En este caso, se representan las frecuencias acumuladas, absolutas y relativas. Se denomina HIS-
TOGRAMA (pero para frecuencias acumuladas), y se representa una poligonal, llamada OJIVA, que marca
la acumulación a lo largo del intervalo, uniendo la frecuencia acumulada obtenida en el límite inferior de cada
intervalo con la obtenida en el límite superior del mismo.

c) Medidas de centralidad:
(NOTA Observar que se trata de variables continuas, agrupadas en intervalos, por lo tanto: la media y la va-
rianza se calculan utilizando las marcas de clase.)

MEDIA ARITMETICA
∑ x′i f i 499 ,8
x= = = 24,99 mm
n 20
MEDIANA
n + 1 21
Pos Me = = = 10,5 ⇒ Int Me [23,8 ; 27,2)
2 2
 (n + 1 ) 
 -F i -1 
M ex = L i + c  2

 f i 
 
Donde: c : amplitud del intervalo
Li: límite inferior del intervalo mediana
fi: frecuencia absoluta simple del intervalo mediana
Fi-1: frecuencia absoluta acumulada del intervalo anterior
 10,5-9   1,5 
Mex = 23,8 + 3,4   = 23,8 + 3,4   = 23,8 + 3,4.0,3 = 23,8 + 1,02 = 24,82 mm
 5   5 

Es importante diferenciar POSICIÓN DE MEDIANA y cálculo de la MEDIANA en sí. La primera sólo nos
aporta la ubicación del Intervalo Mediana, y la segunda es el valor numérico de la Mediana.

35
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

MODO
Int. Mo ----> [ 20,4 ; 23,8)
 ∆1 
Mo = Li+ c  
 ∆1 + ∆ 2 
D o n d e:
∆ 1 = f (M a x) − f (a n t)
∆2 = f (M a x)
− f (p o st)
Li: Límite inferior del intervalo Modal.
c: Amplitud del intervalo Modal.
f(post): Frecuencia absoluta del intervalo posterior al intervalo Modal.
f(ant): Frecuencia absoluta del intervalo anterior al intervalo Modal.

 5  5
Mo = 20,4 + 3,4   = 20,4 + 3,4. = 20,4 + 2, 429 = 22,829 mm
 5+ 2  7

Volvamos a analizar la distribución de la variable en esta muestra utilizando las medidas de posición:
Me= 24,82 mm, Mo = 22,8295 mm, x = 24,99 mm. Al ser Mo < Me < x , podemos decir que la distribu-
ción tiene ASIMETRÍA POSITIVA.

Medidas de dispersión:
VARIANZA

1  2 ( Σx 'i fi )  1  ( 499,8 )  1
2 2

s =
2
Σx 'i f i −  = 12784, 02 −  = ⋅ 463,372 = 24,388mm 2
n − 1 
x
n  19  20  19

DESVÍO ESTÁNDAR
sx = sx2 = 24,388mm = 4,938mm

COEFICIENTE DE VARIACIÓN
sx 4,938
C.V .x % = .100 = .100 = 19, 75%
x 24,99
BOX PLOT

El boxplot o diagrama de caja lo utilizamos para analizar la distribución de la variable en esta muestra.

36
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

36,00

33,50

31,00

28,50
Altura

26,00

23,50

21,00

18,50

16,00

En la caja, la Me se ubica casi en el centro, y el tamaño de los bigotes es distinto, siendo mayor el
bigote superior. En este caso podemos decir que la distribución es levemente ASIMÉTRICA POSITIVA.

En este cuadro presentamos las medidas resumen obtenidas, a partir de los datos de la muestra,
aplicando el programa estadístico InfoStat®.

Estadística descriptiva
Variable n Media D.E. Var(n-1) CV Mín Máx Mediana
Altura 20 24,99 4,93 24,388 19,76 17,00 33,80 24,05

EJERCICIO 3) Para realizar un determinado experimento se ha medido la anchura interorbital, en mm, de


una muestra de 40 palomas, obteniéndose los siguientes datos:
a) Dada la distribución, completar la tabla con todas las frecuencias. ¿Qué fre- [ ; ) fi
cuencia usaría si necesita valores relativos al tamaño de muestra? 10,0 – 10,5 3
b) Grafique el histograma y el polígono de frecuencias. 10,5 – 11,0 4
11,0 – 11,5 14
c) Calcule la mediana, la moda, y el coeficiente de variación. 11,5 – 12,0 10
d) ¿Qué puede decir con respecto a la simetría de esta muestra? 12,0 – 12,5 5
12,5 – 13,0 3
e) ¿Cuál es la probabilidad de seleccionar una paloma al azar, de este conjunto 13,0 – 13,5 1
de palomas, y que su anchura interorbital mida entre 10 y 10,5 mm?
f) Sabiendo que hemos seleccionado de este conjunto una paloma cuya anchura interorbital es menor a
11,5 ¿cuál es la probabilidad de que se encuentre entre 10 y 10,5 mm?
g) Sabiendo que hemos seleccionado de este conjunto una paloma cuya anchura interorbital es menor a
11,5 ¿cuál es la probabilidad de que se encuentre entre 13 y 13,5 mm?

SOLUCIÓN
a)
2
[ ; ) x’i fi Fi hi Hi x’i* fi x’i * fi
10,0 – 10,5 10,25 3 3 3/40 3/40 30,75 315,1875
10,5 – 11,0 10,75 4 7 4/40 7/40 43 462,25
11,0 – 11,5 11,25 14 21 14/40 21/40 157,5 1771,875
11,5 – 12,0 11,75 10 31 10/40 31/40 117,5 1380,625
12,0 – 12,5 12,25 5 36 5/40 36/40 61,25 750,3125
12,5 – 13,0 12,75 3 39 3/40 39/40 38,25 487,6875
13,0 – 13,5 13,25 1 40 1/40 40/40 13,25 175,5625
40 40/40 461,50 5343,5

37
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

b)

16

14

12
frecuencia absoluta

10

0
9,5 10,0 10,5 11,0 11,5 12,0 12,5 13,0 13,5 14,0
Anchura

n + 1 41
c) MEDIANA: Pos Me = = = 20, 5 ⇒ Int. Mediana : [11, 0 ; 11,5 )
2 2
 Pos Me − Fi −1   20,5 − 17 
Me = Li + c   = 11, 0 + 0, 5 ∗   = 11, 4821 mm
 fi   14 

MODO: La mayor frecuencia absoluta simple es f4 = 14, por lo que el intervalo modal es [11,0 ; 11,5), por
lo que
 ∆1   10 
Mo = L i + c   = 11, 0 + 0,5 ∗   = 11,0 + 0,357 = 11,357 mm
 ∆1 + ∆ 2   10 + 4 

S 0, 6969
COEFICIENTE DE VARIACIÓN: CV = ∗100 = ∗100 ≅ 6, 044%
X 11,53

14,00

d) Como: Mediana = 11,4821 mm ; Moda = 11,357


mm ; Media = 11,53 mm, si ordenamos numérica-
13,00 mente los resultados tenemos que
Media > Mediana > Moda,
lo que nos indicaría que es levemente asimétrica posi-
tiva. Veamos qué nos dice el boxplot.
Anchura

12,00
En el boxplot se observa asimetría positiva.

11,00

10,00

38
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

3
e) p (10 < x < 10,5) = = 0, 075
40
3
f) p (10 < x < 10,5) / x < 11,5) = = 0,1428
21
i) p (13 < x < 13, 5) / x < 11,57) = 0/18 = 0

EJERCICIO 4) Se quiere estudiar la eficacia de un nuevo insecticida para plantas de interior. Se selec-
cionan 50 plantas y se cuenta el número de hojas que han sido atacadas por la plaga, después de haber
tratado la planta con el nuevo producto. Los resultados son:
N° de hojas atacadas fi
0 6
1 10
2 12
3 8
4 5
5 4
6 3
8 1
10 1
a) Definir la variable en estudio y clasificarla.
b) ¿Cuál es la población en estudio? ¿Y la muestra observada?
c) Encontrar todas las medidas de tendencia central que correspondan.
d) Encontrar todas las medidas de variabilidad que correspondan.
e) ¿Qué porcentaje de plantas observadas fueron atacadas? ¿Qué porcentaje de plantas observadas
tienen a lo sumo 1 sola hoja atacada? ¿qué porcentaje de plantas observadas tienen más de 5 hojas
atacadas?
f) Complete la tabla encontrando las frecuencias relativas y las frecuencias acumuladas (absolutas y
relativas).
g) Interprete, respecto al problema planteado, los valores de: f3 ; F6 ; h1 ; H4
h) La empresa que comercializa el nuevo insecticida dice que, el número de hojas atacadas por planta
cuando se aplica este insecticida, sigue la siguiente distribución de probabilidad:
N° de hojas atacadas p(x)
0 0,12
1 0,20
2 0,25
3 0,15
4 0,10
5 0,08
6 0,06
8 0,03
10 0,01
Encontrar la esperanza, varianza y desvío estándar de la variable definida. ¿Cuál es la probabilidad de
que una planta que ha sido tratada con el nuevo fertilizante tenga por lo menos 3 hojas atacadas, según
la información de la empresa que comercializa el nuevo fertilizante?

SOLUCIÓN
a) Definir la variable en estudio y clasificarla.
X: número de hojas atacadas por la plaga de una planta tratada con el nuevo insecticida
Variable cuantitativa discreta

39
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

b) ¿Cuál es la población en estudio? ¿Y la muestra observada?


Población: plantas de interior
Muestra: las 50 plantas de interior seleccionadas

c) Encontrar todas las medidas de tendencia central que correspondan.

d) Encontrar todas las medidas de variabilidad que correspondan.

Moda 2 hojas atacadas


Mediana 2 hojas atacadas
Media 2,68 hojas atacadas
Rango 10
Desviación estándar 2,133 hojas atacadas
Varianza de la muestra 4,549 (hojas atacadas)2
Mínimo 0
Máximo 10
Coeficiente de variación 0,796 o 79,6%
e) ¿Qué porcentaje de plantas observadas fueron atacadas? ¿Qué porcentaje de plantas observadas
tienen a lo sumo 1 sola hoja atacada? ¿qué porcentaje de plantas observadas tienen más de 5 hojas
atacadas?
A partir de la tabla de frecuencia obtenemos los porcentajes pedidos:
• De las 50 plantas observadas, 6 no han sido atacadas, por lo tanto han sido atacadas 50-6=44
plantas. Entonces el porcentaje de plantas de la muestra que han sido atacadas es:
44
*100 = 0,88*100 = 88%
50
• De las 50 plantas observadas, la cantidad de plantas que tienen a lo sumo una hoja atacada es
6+10=16. Entonces el porcentaje de plantas de la muestra que tienen a lo sumo una hoja atacada es:
16
*100 = 0,32 *100 = 32%
50
• De las 50 plantas observadas, la cantidad de plantas que tienen más de 5 hojas atacadas es
3+1+1=5. Entonces el porcentaje de plantas de la muestra que tienen más de 5 hojas atacadas es:
5
*100 = 0,1*100 = 10%
50

f) Complete la tabla encontrando las frecuencias relativas y las frecuencias acumuladas (absolutas y
relativas).
N° de hojas atacadas fi hi Fi Hi

0 6 0,12 6 0,12
1 10 0,2 16 0,32
2 12 0,24 28 0,56
3 8 0,16 36 0,72
4 5 0,1 41 0,82
5 4 0,08 45 0,9
6 3 0,06 48 0,96
8 1 0,02 49 0,98
10 1 0,02 50 1

40
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

g) Interprete, respecto al problema planteado, los valores de: f3 ; F6 ; h1 ; H4


f3=12 de las 50 plantas observadas tratadas con el nuevo insecticida, 12 tienen 2 hojas atacadas.

F6=45 de las 50 plantas observadas tratadas con el nuevo insecticida, 45 tienen a lo sumo 5 hojas
atacadas.

h1=0,12 de las 50 plantas observadas tratadas con el nuevo insecticida, la proporción de plantas que
no tienen ninguna hoja atacada por la plaga es 0,12. O también se puede decir que el 12% de las
plantas observadas de la muestra no tienen ninguna hoja atacada por la plaga.

H4=0,72 de las 50 plantas observadas tratadas con el nuevo insecticida, la proporción de plantas
que tienen a lo sumo 3 hojas atacadas es 0,72. También podemos decir que, el 72% de las plantas
observadas de la muestra fueron atacadas a lo sumo en 3 hojas.

h) La empresa que comercializa el nuevo insecticida dice que, el número de hojas atacadas por planta
cuando se aplica este insecticida, sigue la siguiente distribución de probabilidad:

N° de hojas atacadas p(x)

0 0,12
1 0,20
2 0,25
3 0,15
4 0,10
5 0,08
6 0,06
8 0,03
10 0,01
Encontrar la esperanza, varianza y desvío estándar de la variable definida. ¿Cuál es la probabilidad de
que una planta que ha sido tratada con el nuevo fertilizante tenga por lo menos 3 hojas atacadas, según
la información de la empresa que comercializa el nuevo fertilizante?

E ( X ) = 0*0,12 + 1*0, 2 + 2 *0, 25 + 3*0,15 + 4* 0,1 + 5*0,08 + 6*0, 08 + 8*0, 03 + 10*0, 01 =


= 0 + 0, 2 + 0,5 + 0, 45 + 0, 4 + 0, 4 + 0,36 + 0, 24 + 0,1 = 2, 65

E ( X 2 ) = 02 *0,12 + 12 *0, 2 + 22 *0, 25 + 32 *0,15 + 42 *0,1 + 52 *0,08 + 62 *0,08 + 82 *0, 03 + 102 *0, 01 =
= 0 + 0, 2 + 1 + 1,35 + 1, 6 + 2 + 2,16 + 1,92 + 1 = 11, 23

Var ( X ) = E ( X 2 ) − [ E ( X )] = 11, 23 − ( 2, 65 ) = 11, 23 − 7, 0225 = 4, 2075


2 2

Var ( X ) = 4, 2075 = 2, 0512

Entonces: E(x)=2,63 V(x)=4,2073 D(x)=2,051

PROBLEMAS PROPUESTOS
EJERCICIO 1) Clasificar las siguientes variables en CUALITATIVAS (NOMINALES u ORDINALES) o
CUANTITATIVAS (DISCRETAS o CONTINUAS):

a- Peso, en g, de pelo esquilado a un conejo de Angora.


b- Cantidad de lámparas de 40 W fabricadas en un día de trabajo.

41
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

c- Valor calórico de la grasa de la leche de una vaca.


d- Tiempo de incubación del sarampión en una persona, en días.
e- Color de ojos de un niño de 10 años nacido en la provincia de Córdoba.
f- Color de pelaje en un equino.
g- Número de insectos de Trifolium repens, encontrados por parcela.
h- Cantidad de caninos de raza Bóxer con linfosarcoma multicéntrico por distrito, en la Provincia de
Buenos Aires.
i- Efecto de una droga en un canino.
j- Número de cachorros nacidos por camada.
k- Número de llamados telefónicos que recibe una central telefónica por mes.
l- Alzada de un caballo del haras "La Biznaga".
m- Color de una rosa.
n- Circunferencia torácica de un lechón recién parido, expresado en cm.
o- Cantidad de tornillos producidos en ocho horas de trabajo.
p- Volumen de nafta despachada por una compañía petrolera en una semana.
q- Nivel educacional alcanzado por un individuo.
r- Número de errores cometidos por un estudiante en un examen de elección múltiple.
s- Distancia recorrida por un neumático de un vehículo, hasta el primer pinchazo.
t- Nacionalidad de un individuo.
u- Rendimiento de maíz en un campo determinado en la Provincia de Buenos Aires.
v- Número de niños nacidos en un hospital el primer día del año.

EJERCICIO 2) En veintiséis tambos se registró, en el año 1988, la cantidad de partos distócicos en la


raza Holando Argentino, obteniéndose los siguientes datos:
7

4 3 5 7 4 2 1 0 6 3 5 6 3
0 3 1 2 1 3 6 0 4 3 2 1 2 6

a) Ordenar los datos en una tabla de frecuencias. 5


I. ¿Cuál es la unidad de observación?
II. Interpretar el par (x5 ; f5) 4
Nro hojas

III. Interpretar el par (x3 ; H3)


b) Construir los gráficos para frecuencias absolu-
3
tas simples y acumuladas. ¿Es simétrica la
distribución de la variable en esta muestra?
c) Calcular media aritmética, mediana y modo. ¿Es 2

simétrica la distribución de la variable en esta


muestra? 1

d) Calcular varianza, desviación estándar y coefi-


ciente de variación. 0

e) Analizar el gráfico de caja (Box plot).

EJERCICIO 3) Los siguientes datos corresponden a la medición en sangre de GPT (glutámico pirúvico
transaminasa, enzima que demuestra toxicidad hepática) en felinos sometidos a una dosis tóxica mínima
de un nuevo antiparasitario externo:

[ ; ) 16,3-21,5 21,5-26,7 26,7-31,9 31,9-37,1 37,1-42,3


fi 1 5 5 9 5

Utilizando la información dada en la tabla:


a) Interpretar H2 , F4 , y h3.
b) ¿Cuál es la unidad de observación?
c) Representar gráficamente. ¿Cómo clasifica la distribución de la variable?
d) Calcular media aritmética, modo y mediana.
e) Calcular varianza, desvío estándar y C.V.

EJERCICIO 4) En un estudio de precios de un grupo de alimentos se obtiene la media aritmética y


desviación estándar para cada uno de ellos, expresados en unidad monetaria por kilogramo de producto.

42
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

Alimento Media A. Desvío


Manteca 80 7
Arroz 110 15
Lechuga 50 6
Zanahoria 30 6
Chaucha 350 50
a) Entre todos los alimentos considerados, ¿a cuál le corresponde la mayor variación relativa? ¿Y la
menor variación absoluta?
b) Entre los vegetales considerados, ¿cuál presenta la menor variación relativa? ¿y la mayor varia-
ción absoluta?

EJERCICIO 5) A continuación se presenta la media aritmética y el coeficiente de variación de las califi-


caciones obtenidas por 50 alumnos:

Materias Media A. C. V.%


Salud Pública 6,5 31
Estadística 5,8 29
Anatomía 4,2 74
Histología 5,3 68

a) ¿Qué materia presenta la mayor variación relativa? ¿Cuál la menor?


b) ¿Qué materia presenta la mayor variación absoluta?

EJERCICIO 6) Luego de aplicar a


un grupo de animales un trata-
miento con insulina se midió la
glucemia (en mg %) obteniéndo-
se:

a) Indicar cuál es la variable.


b) ¿Cuál es la unidad de obser-
vación?
c) ¿Cuál es el tamaño de la
muestra?
d) Calcular la media aritmética, la
desviación estándar y opinar so-
bre la distribución de la muestra
en términos del problema. ¿Es
simétrica?

EJERCICIO 7) Los siguientes datos corresponden a los diámetros car-


Intervalos frecuencias
díacos, en mm, medidos en radiografías de tórax de 100 adultos nor-
80,5 - 90,5 8
males:
90,5 - 100,5 15
a) Definir la variable y clasificarla. 100,5 - 110,5 21
110,5 - 120,5
b) La población en estudio es .................................................. 23
120,5 - 130,5
c) La unidad de observación es ............................................... 16
d) Completar la tabla de distribución de frecuencias y realizar los gráfi-130,5 - 140,5 9
cos correspondientes a las fi y Hi. 140,5 - 150,5 8
e) Interpretar f2 , F5 , h4 y H6
f) Calcular la media y la varianza.
g) Determinar los intervalos mediana y modal, y calcular las medidas correspondientes a cada uno.
h) Comparando los valores de las medidas de posición, ¿podemos concluir que la distribución es simétri-
ca?

EJERCICIO 8) Resolver la 2da. parte del ejercicio 12 de la página 22 (Unidad 2: Variable Aleatoria).

43
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

EJERCICIO 9) En un estudio acerca de las palabras usuales, usted necesita una muestra de las páginas
tomadas de un libro dado. Diseñe brevemente un procedimiento de muestreo que pudiera usar. ¿Qué
haría usted con las páginas que tienen grabados sobre ellas o con aquellas que están llenas sólo par-
cialmente?

EJERCICIO 10) En un estudio sobre parasitismo un grupo de investigadores registra la cantidad de hue-
vos por nido parasitados en 1700 nidos. Los datos se registran en la siguiente tabla:

N° de huevos N° nidos con x n°


parasitados por nido de huevos parasitados
11 52
12 820
13 572
14 215
15 41
a) Calcular media, varianza, modo y cuartiles.
b) Interpretar f4 y H4
c) Realice los gráficos correspondientes
d) ¿Cuál es la probabilidad de seleccionar un nido al azar y que este tenga al menos 13 huevos pa-
rasitados?
e) ¿Cuál es la probabilidad de seleccionar dos nidos al azar y que el primero tenga 13 huevos para-
sitados y el segundo 15?
f) Sabiendo que seleccionamos un nido que se encuentra dentro de los dos primeros cuartiles,
¿cuál es la probabilidad de que tenga 11 huevos parasitados?

EJERCICIO 11) Se conocen los pesos al destete de los


lechones de dos granjas diferentes (granja A y granja B). Peso al destete de la Peso al destete de la
granja A (Kg) granja B (Kg)
a) Definir las variables en estudio y clasificarlas. 7,5 5,1
b) ¿Cuál es/son la/s poblaciones en estudio? ¿Y la/las 6,4 3,9
muestras observadas? 7,1 4,3
c) Encontrar todas las medidas de tendencia central que 2,9 7,03
correspondan para ambas muestras. 4,6 4,6
d) Encontrar todas las medidas de variabilidad que co- 9,4 5,7
rrespondan para ambas muestras. 7,5 6,4
e) Comparar las dos muestras usando los resultados 6,8 4,9
hallados en a) y en b). 3,9 3,8
f) ¿Qué porcentaje de lechones en la muestra de la 4,1 5,9
granja A tiene un peso al destete superior a 6 Kg? ¿Y de 4,6 6,2
la Granja B? ¿Y si juntamos ambas muestras, qué porcen- 5,2 3,8
taje de lechones tienen un peso al destete superior a 6 6,8 5,7
Kg? 5,2 4,7
g) Si se tiene el dato de que el peso al destete de un 6,4 5,3
lechón de la granja A sigue una distribución normal con
2
media 5,5 Kg y varianza 2,25 Kg . ¿Cuál es la probabilidad de que un lechón de la granja A tenga al des-
tete un peso superior a los 6 Kg?
h) Se tiene el dato de que la probabilidad de que un lechón de la granja B tenga un peso mayor a 5,5 Kg
es 0,4. Si se toman 8 lechones al azar de la granja B, ¿cuál es la probabilidad de que todos tengan un
peso mayor a 5,5 Kg? ¿Y la probabilidad de que más de la mitad tenga un peso mayor a 5,5 Kg?

44
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

CUESTIONARIO
1) Responda “Verdadero” si la proposición siempre es verdadera, y si no cambie las palabras en negrita
por aquellas que siempre hagan verdadera la misma.
i La media aritmética se obtiene ordenando los datos y no es influenciada por valores extremos.
............................................................................................................................................................
ii La varianza es una medida de variación relativa porque permite comparar la dispersión de muestras de
distintas variables. .........................................................................................................
iii La media aritmética de una variable puede ser negativa. ...............................................................
iv El polígono de frecuencias se utiliza para graficar frecuencias absolutas y relativas simples.
............................................................................................................................................................
2) ¿Puede ser que en una muestra coincidan numéricamente la media aritmética y la varianza? Justifi-
que y/o ejemplifique.
3) ¿Está de acuerdo con la siguiente afirmación? “Si todos los valores de una variable con desviación
estándar 30 se aumentan un 30%, entonces la varianza de la nueva variable es 1521”. Justifique su res-
puesta.
4) En una distribución asimétrica positiva la mediana es numéricamente ............................ que la media.
5) ¿Cómo se representa F(x) para una variable discreta? ¿Por qué?
6) Haga un círculo en V (“Verdadero”) o F (“Falso”) según corresponda:
a) V F Los histogramas de todas las distribuciones muestrales siempre tienen forma simétrica.
b) V F Las frecuencias relativas están expresadas en las mismas unidades que la de la unidad de
observación.
c) V F La media aritmética es una medida influenciada por valores extremos.
d) V F El coeficiente de variación es útil para comparar valores promedios.
7) Si la distribución de una variable es asimétrica negativa, entonces cuando uno se mueve de menos
infinito a más infinito se encuentra con ....................... , ................................., y modo.
8) Dé dos razones válidas para justificar un muestreo en lugar de un censo para obtener información de
una población.
9) Se sabe que una máquina produce piezas defectuosas periódicamente y para testear su funciona-
miento se seleccionan una de cada 15 piezas producidas. ¿Qué tipo de muestreo se aplicó? ¿Le parece
adecuado en este caso? ¿Por qué? Indique las posibles conclusiones de este muestreo.
10) Para elegir en una región 1000 personas expuestas a un factor de contaminación ambiental (agua,
químicos, desechos tóxicos, etc.) es más fácil seleccionar al azar localidades, y dentro de ellas a las per-
sonas. ¿Cuál sería el muestreo más adecuado para este caso?
11) Se quiere estimar la producción por Ha de maíz en una región productora de dicho cereal. Se sabe
que algunas zonas tienen riego artificial y otras no, y que en algunas se emplean fertilizantes y en otras
no.
Indique:
i) qué muestreo le parece más adecuado para una estimación correcta:
a) Muestreo aleatorio simple
b) Muestreo estratificado
c) Muestreo por conglomerados
d) Muestreo sistemático
ii) ¿Cómo seleccionaría una muestra en el muestreo que haya elegido?

45
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

TEOREMA CENTRAL DEL LÍMITE – ESTIMACIÓN


* OBJETIVOS ESPECÍFICOS
 Conocer las características deseables de los estimadores puntuales.
 Comprender la utilidad e importancia del Teorema Central del Límite en estadística.
 Aplicar conceptos de inferencia estadística en el contexto de los fenómenos biológicos.
 Obtener e interpretar estimaciones puntuales y por intervalos de confianza de los parámetros que
caracterizan las distribuciones de probabilidad del fenómeno en estudio.

* CONTENIDOS TEMÁTICOS
 Propiedades de los estimadores.
 Teorema Central del Límite (TCL). Aplicaciones.
 Muestra aleatoria. Muestreo aleatorio simple. Unidad de muestreo. Tamaño de muestra.
Ejemplos de estimación puntual para:
a) la media ( µ )
b) la varianza ( σ )
2

c) la proporción ( p ) poblacional.
Algunos estimadores usuales para la media, para la varianza y la proporción. Distribuciones de X y S2 .
Aplicaciones.

 Estimación por intervalo de confianza (IC) para: a) µ cuando σ es conocida; b) µ cuando σ es


2 2

desconocida; c) σ ; y d) p. Límite superior e inferior del IC. Nivel de confianza 100(1-α)%. Margen de error,
2

relación con el tamaño de la muestra. Aplicaciones.

* GLOSARIO
Teorema Central del Límite (TCL). Muestra aleatoria. Unidad de muestreo. Tamaño de muestra. Estimador
puntual. Estimador por Intervalo de Confianza. Supuestos Teóricos. Error estándar.

PROBLEMAS RESUELTOS
EJERCICIO 1) Asuma que el aumento de peso en un cobayo, alimentado con un determinado
balanceado, se distribuye aproximadamente normal con media igual a 105 g y desvío estándar igual a
10,5 g. Si se extrae de esta población de cobayos una muestra aleatoria de tamaño 16:
a) ¿Con qué probabilidad un cobayo tomado al azar tendrá un aumento de peso de al menos 104 g?
b) ¿Cuál es la probabilidad de que los cobayos de una muestra de tamaño 16 tengan un aumento de
peso promedio inferior a 106 g?
c) ¿Qué valor del aumento de peso no será superado con probabilidad 0,95 por un cobayo tomado al
azar?
d) ¿Qué valor del aumento medio de peso no será superado con probabilidad 0,95 en muestras de
tamaño 16?

En este tipo de ejercicios, generalmente nos dan información de una variable (aumento de peso de un
cobayo, X ) y nos piden resolver cálculos de probabilidad para esa variable o para la variable promedio
(aumento de peso medio o promedio de 16 cobayos, X 16 ). Las distribuciones de estas dos variables
aleatorias son: X ≈ N (105; 110, 25) y X 16 ≈ N (105; 6,890625 )

En los gráficos siguientes se representa sendas muestras aleatorias de tamaño 10.000 cada una, a la
izquierda la distribución del aumento de peso en un cobayo, y a la derecha la de aumento de peso medio
o promedio de 16 cobayos.

46
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

0.26 0.23

0.19 0.17

frecuencia relativa
frecuencia relativa

0.13 0.11

0.06 0.06

0.00 0.00
64 78 91 105 119 132 146 64 78 91 105 119 132 146
Po bla ción Mu es tra 1 6
PESO PESO MEDIO

La distribución de la media muestral tiene una varianza menor que la de la variable original, lo que se ve
reflejado claramente en los gráficos anteriores, aunque coinciden en la media. Entonces, es importante elegir
correctamente la distribución sobre la cual se realizarán los cálculos de probabilidades. Si la pregunta se
refiere a un individuo, el cálculo de probabilidad se realizará con la distribución de la variable
X ≈ N (105;110, 25 ) ; en cambio, si la misma se refiere al promedio entonces se empleará la distribución del
promedio de la muestra, en este caso X 16 ≈ N (105; 6,890625 ) donde el 6,890625 proviene de
σ X2 110, 25
σ X2 = = .
n 16

SOLUCIÓN
a) En este caso estamos calculando la probabilidad de que un cobayo pese 104 g o más (al menos 104
g), nos interesa la distribución de X . Entonces se procede:
 104 − 105 
P ( X ≥ 104 ) = P  Z ≥ = P ( Z ≥ −0, 095 ) = 1 − P ( Z < −0, 095 )
 10,5 
Entonces, buscamos en la tabla de la distribución normal estándar aproximando –0,095 a –0,1 y obtenemos:
P( X ≥ 104) ≅ 1 − P ( Z < −0,10 ) ≅ 1 − 0, 4602 ≅ 0,5398
Un cobayo de la muestra tendrá un aumento de peso de al menos 104 g con una probabilidad aproximada
de 0,54.

b) En este caso nos preguntan sobre el aumento medio (o promedio) de los cobayos de una muestra de
tamaño 16, entonces se debe usar la distribución de X 16 .
 106 − 105 
P ( X 16 < 106 ) ≡ P  Z < = P ( Z < + 0,38 ) = 0, 6480
 10,5  
   
  16  

La probabilidad de que el promedio de los individuos de una muestra de tamaño 16 sea menor que 106 g es
igual a 0,65.
Debemos notar que en este caso no estamos usando el TCL, ya que suponemos que X es aproximadamente
normal y asumimos que la distribución de X 16 es aproximadamente normal, basados en las características
de la distribución de X . Además, notemos que 10, 5 / 16 es el desvío estándar de X 16 .

c) Se quiere saber que valor no será superado con probabilidad 0,95 por un cobayo tomado al azar. En este
caso interesa la distribución X , entonces, por un lado sabemos que:
 x − 105 
P ( X ≤ xi ) = 0,95 ≡ P  Z ≤ i = 0,95
 10,5 

47
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

( )
Por el otro, en la distribución normal estándar P Z ≤ z0,95 = 0,95 , sabemos que z0,95 = 1,64; entonces
xi − 105 , y despejando x − 105
igualando z0,95 con xi de dicha igualdad, 1, 64 = i , se obtiene el valor de xi .
10,5 10,5
xi = 105 + 1, 64 ⋅10,5 = 122, 22 g.
El valor del aumento de peso que no será superado con probabilidad 0,95 por un cobayo es
aproximadamente 122,2 g.

d) Esta pregunta, aunque similar a la anterior, se refiere al valor medio de una muestra de tamaño 16,
entonces, empleamos la distribución de X 16 .
 x − 105 
P ( X 16 ≤ xi ) = 0,95 ≡ P  Z ≤ i = 0,95
10,5 
 
 16 
xi − 105
Al igual que antes, igualando z0,95 con , y despejando xi se obtiene la solución:
10,5 16
xi = 105 + 1, 64 ⋅ 2, 625 = 109,305 g.
El valor del aumento medio de peso que no será superado con probabilidad 0,95 en muestras de tamaño
16 es aproximadamente 109,3 g.

50,00 77,50 105,00 132,50 160,00 90,00 97,50 105,00 112,50 120,00
Peso Peso medio

Notar que la solución en d) está más cerca de la media de su distribución que la solución en c) de la suya,
aunque ambas soluciones representen desde el punto de vista probabilístico lo mismo.

EJERCICIO 2) Se está investigando el efecto de una droga para reducir el nivel promedio de glucosa en
sangre (glucemia, en mg/ml), en una línea de ratas diabéticas. Para ello se tomó una muestra de 40 ratas
tratadas con la droga, con la suposición de que la probabilidad de que el promedio sea menor a los 2 mg/ml
(valor promedio de la glucemia en ratas sin tratar) sea alta (por ejemplo, mayor a 0,8).
Se desconoce la distribución del nivel de glucemia para las ratas tratadas con la droga, pero se sabe que
tiene media 1,7 mg/ml y desvío 0,8 mg/ml. ¿Se cumple la suposición de los investigadores?

SOLUCIÓN
Tenemos:
X: “glucemia de una rata tratada con la droga”, medida en mg/ml. (Con distribución desconocida, siendo
µ=1,7 mg/ml y σ = 0,8 mg/ml).

X : “glucemia media de una muestra de ratas tratadas con la droga”, medida en mg/ml.

48
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

 X −µ   2 − 1, 7   0,3 
P ( X ≤ 2) ≅ P  z ≤
Nos interesa calcular:
σ  = P  z ≤ 0,8  = P  z ≤ 0,13  = P ( z ≤ 2, 31) = 0, 98956
     
 n   40 

Como la probabilidad obtenida es 0,98956, o sea una probabilidad alta, se cumpliría con la suposición de
los investigadores.

EJERCICIO 3) Se toma una muestra de 18 caninos de la ciudad de Neuquén. A cada uno se le extrae
sangre, se separa el plasma de la misma, y finalmente se mide la concentración de colesterol libre.
3
Obteniéndose, a partir de los 18 registros de colesterol libre, un promedio de 70 mg/100 cm de colesterol
3
libre, y un desvío estándar de 15 mg/100 cm .

a.- Estimar la media poblacional mediante un intervalo de confianza del 99%.


b.- Ídem a) pero con una confianza del 90%.
c.- Comparar los resultados obtenidos y analizar la similitud o diferencia entre los mismos.

Antes de resolver el problema, vemos que tenemos que estimar intervalos de confianza de nivel 99% y 90%
para la media poblacional, µ, sin conocer σ (varianza poblacional), entonces se emplea como la variable
2

X −µ
pivotal a la siguiente t de Student: t= ∼tn-1
S
n
Esta es una variable auxiliar basada en la distribución de X que nos será de utilidad para obtener los
estimadores del intervalo de confianza para µ, no depende de ningún parámetro desconocido; sólo es
función de las observaciones de la muestra y de µ, y, además, tiene distribución conocida.

Para obtener las expresiones de los límites interior (LI) y superior (LS), debemos plantear la siguiente
igualdad:
 X −µ 
P  tn −1; α 2 ≤ ≤ tn −1;1−α 2  = 1 − α
S
 
 n 
Por conveniencia, ya que la distribución t de Student es simétrica, emplearemos − tn −1;1−α 2 en lugar de
tn −1; α 2 . Entonces,
 X −µ 
P  − tn −1;1−α 2 ≤ ≤ tn −1;1−α 2  = 1 − α
S
 
 n 
Despejando µ desde el término entre paréntesis de la igualdad anterior se obtienen las expresiones de los
límites inferior y superior del IC.
Primero despejamos la diferencia que contiene al parámetro: − tn −1;1−α 2 ⋅ S ≤ X −µ ≤ tn −1;1−α 2 ⋅
S
n n
Luego la media muestral: − X − tn −1;1−α 2 ⋅ S ≤ −µ ≤ − X + tn −1;1−α 2 ⋅
S
n n
S S
Multiplicamos por (-1): X + tn −1;1−α 2 ⋅ ≥µ≥ X − tn −1;1−α 2 ⋅
n n
S S
Reordenamos: X − tn −1;1−α 2 ⋅ ≤µ≤ X + tn −1;1−α 2 ⋅
n n
 S S 
Entonces, el intervalo de confianza está dado por:  X − t . ; X + tn −1;1−α .  , cuya expresión
n −1;1−α
2 n 2 n
S
puede resumirse en: X m tn −1;1−α 2 ⋅ (1)
n

49
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

Notemos que tanto el LI como el LS son variables aleatorias ya que dependen de las observaciones de la
muestra (para calcular X y S), del nivel de confianza, y del tamaño de la muestra; lo que permitiría la
siguiente expresión probabilística:
 S S 
P  X − tn −1;1−α 2 ⋅ ≤µ≤ X + tn −1;1−α 2 ⋅  = 1−α
 n n

Sin embargo, cuando X y S se reemplazan por los valores obtenidos a partir de la muestra, el LI y el LS ya
no son variables pues toman un único valor dependiendo de la muestra. Esto es lo que limita, en el momento
de la conclusión, la interpretación probabilística del intervalo de confianza obtenido. Entonces, siempre la
conclusión de los IC se expresa desde el punto de vista del nivel de confianza que se haya empleado en la
estimación del intervalo. Esto debería quedar claro en las conclusiones siguientes.

SOLUCIÓN
a.- Un IC99% para µ con σ desconocida. Datos: n = 18 (tamaño de la muestra);
2
x = 70 mg/100 cm3;
s = 15 mg/100 cm3; y nivel de confianza 99%, o sea 1-α = 0,99.

Por lo tanto, el valor tabular que emplearemos es tn −1;1−α 2 = t17; 0,995 = 2,898.

Notemos aquí que hay tres formas de expresar el valor tabular 1) simbólico en general: tn −1;1−α 2 , 2) sim-
bólico en particular (o sea, teniendo en cuenta el tamaño muestral y en nivel de confianza del ejercicio)
t17; 0,995 , 3) mediante su valor numérico: 2,898.
ATENCIÓN!! en el contexto del presente curso de estadística (al resolver ejercicios, parciales o finales)
“siempre” que sea posible se debe informar tanto el valor tabular “simbólico en particular” como su “valor
numérico”.
15
Reemplazando en (1) tenemos: 70 m 2,898 ⋅ .
18
Entonces, un intervalo de confianza del 99% para µ es [59,75 mg/100 cm ; 80,25 mg/100 cm ]
3 3

3
CONCLUSIÓN: Con un nivel de confianza del 99%, se espera que el intervalo [59,75 mg/100 cm ; 80,25
3
mg/100 cm ] cubra o contenga al verdadero valor de la media de la concentración de colesterol libre en el
plasma sanguíneo de los caninos de la ciudad de Neuquén.

NOTA: Debemos observar que se ha concluido empleando el concepto de confianza, y no se ha usado el


término probabilidad. Una forma de interpretar el concepto de confianza (o confiabilidad) aplicado al ejercicio
resuelto sería la siguiente. Supongamos que tomáramos 1000 muestras de tamaño 18, y con cada una
estimamos un intervalo de confianza del 99% para µ, con lo cual tendríamos 1000 IC99%. Entonces, una
confianza del 99% significa que “esperamos” que 990 de los 1000 IC contengan al parámetro µ y sólo 10
no lo contengan.

b) En este caso, 1-α = 0,90; entonces tn −1;1−α 2 = t17; 0,95 = 1,74. Los otros datos son iguales al punto anterior.
Reemplazando en (1) tenemos, ahora: 70 m 1, 74 ⋅ 15 .
18

Entonces, un intervalo de confianza del 90% para µ es [63,85 mg/100 cm ; 76,15 mg/100 cm ]
3 3

3
CONCLUSIÓN: Con un nivel de confianza del 90%, se espera que el intervalo [63,85 mg/100 cm ; 76,15
3
mg/100 cm ] contenga o cubra el verdadero valor de la media de la concentración de colesterol libre en el
plasma sanguíneo de los caninos de la ciudad de Neuquén.
c) El IC90% para µ es de menor amplitud (diferencia entre el límite superior e inferior, LS – LI) que el IC99%
para µ, pero también es menos confiable. Eso será una constante para un n fijo, a mayor amplitud mayor
confianza. El análisis de esto se discutirá en clase con el docente, es buena idea pensar un poco y llevar
preguntas al aula.

50
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

EJERCICIO 4) Se hicieron determinaciones de la concentración de amilasa en suero en individuos de una


muestra aleatoria, de tamaño 15, tomada de una población con individuos aparentemente normales. La
muestra proporcionó una media de 96 UI/ml y una desviación estándar de 35 UI/ml. Suponiendo que la
población se distribuye normalmente, estimar la varianza poblacional mediante un intervalo de confianza el
95%.

En este caso debemos estimar la varianza poblacional (σ ) mediante un intervalo de confianza. La variable
2

aleatoria χ es la indicada para ser usada como variable pivotal.


2

χ2 =
( n − 1) ⋅ S 2 ∼ χ 2
n −1
σ2
Como en el caso anterior, para obtener las expresiones de los límites del intervalo de confianza, debemos
plantear la siguiente expresión:

P  χ n2−1; α 2
( n − 1) ⋅ S 2
χ

≤ ≤  = 1−α
2
− − α
 σ
2 n 1;1 2

El mecanismo para obtener las expresiones del IC para σ es bastante sencilla pero requiere cierto
2

cuidado. Sabemos que esta variable aleatoria no es simétrica, con lo cual no podemos usar un único
valor tabular.
Despejando se obtiene el siguiente intervalo: ( n − 1) ⋅ S 2 ≤σ ≤2 ( n − 1) ⋅ S 2 (2)
χ n2−1;1− α 2 χ n2−1; α 2
SOLUCIÓN
Datos: n = 15; x = 96 UI/ml; s = 35 UI/ml ; y 1-α = 0,95.

Se necesitan dos valores tabulares: χ n2−1; α 2 = χ14;


2
0,025 = 5,629 y χ n2−1; 1− α 2 = χ14;
2
0,975 = 26,12

14 ⋅1225
Reemplazando en (2) nos queda: a) LI: = 656,58
26,15
14 ⋅1225
b) LS: = 3046, 72
5, 629
2 2
CONCLUSIÓN: Se espera con una confianza del 95% que el intervalo [656,58 (UI/ml) ; 3046,72 (U/ml) ]
contenga o cubra al verdadero valor de la varianza de la concentración de amilasa en suero en la población
de individuos aparentemente normales.

¿Qué hubiera ocurrido si en el ejercicio nos hubieran solicitado un intervalo de confianza para el desvío
estándar poblacional (σ)?
En principio nada muy distinto. Primero se obtiene un intervalo de confianza para σ , luego se obtiene la raíz
2

cuadrada de los LI y LS, y finalmente se concluye. Hubiera resultado ser algo así:

Para el ejercicio 4), estime el desvío estándar poblacional mediante un intervalo de confianza el 95%.
Un IC95% para σ : a) LI= 656,58 = 25, 62 UI/ml y b) LS= 3046, 72 = 55, 20 UI/ml
CONCLUSIÓN: Se espera con una confianza del 95% que el intervalo [25,62 UI/ml; 55,20 U/ml] contenga o
cubra al verdadero valor del desvío estándar de la concentración de amilasa en suero en la población de
individuos aparentemente normales.

EJERCICIO 5) Un fabricante de material de laboratorio desea saber qué proporción de sus productos no
contienen fallas. Estimar puntualmente y mediante un intervalo de confianza la proporción de material sin
fallas si se sabe que en una muestra de 100 unidades producidas se contó sólo 4 unidades con fallas. Usar
un nivel de confianza del 90% (1 - α = 0,90).
En este caso, la variable pivotal a emplear es: pˆ − p
z= ≈ N ( 0;1)
pˆ (1 − pˆ )
n

51
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

Usando el mismo razonamiento que antes se pueden obtener las expresiones de los límites inferior y
pˆ (1 − pˆ )
superior del IC para p, que presentamos en la siguiente expresión: pˆ m z α ⋅ (3)
1− n
2

SOLUCIÓN
Datos: n = 100; número de unidades con fallas = 4 ; 1 - α = 0,90

casos favorables 96
a) Estimación puntual: pˆ = = ˆ = 0,96
, o sea p
tamaño de muestra 100

b) IC90% para la proporción poblacional (p)


0,96 ⋅ 0, 04
Reemplazando en (3), 0,96 m 1, 64 ⋅ ≡ 0,96 m 0, 032 . Con lo cual, un intervalo de confianza
100
para p es: [0,928; 0,992].

CONCLUSIÓN: Con un nivel de confianza del 90%, se espera que el intervalo [0,928; 0,992] contenga o
cubra al verdadero valor de la proporción de unidades producidas sin fallas correspondiente al fabricante de
material de laboratorio.

EJERCICIO 6) Se desea estimar la proporción de machos de una población de Drosophila melanogaster.


Calcular el tamaño de la muestra para que la estimación de la proporción poblacional tenga un margen de
error no mayor a 5%, con una confiabilidad del 95%. Se sabe, por un muestreo piloto anterior, que en una
muestra de 100 individuos, 35 resultaron machos.

Antes de resolver el ejercicio, veamos algunos conceptos asociados a este problema. Llamamos margen de
error a la semiamplitud del intervalo de confianza y lo simbolizamos con la letra d.
Si la amplitud a = (LS – LI), entonces la semiamplitud d = (LS – LI) / 2. En los casos de los Intervalos de
Confianza expresados en (1) y (3), la semiamplitud coincide con el término a la derecha del signo m .
Entonces, nos podemos dar cuenta, analizando la función semiamplitud, de qué factores depende y cómo
depende de estos.

En el presente problema, el parámetro de interés es la proporción poblacional, por lo tanto se trabaja con el
intervalo presentado en (3), del cual se obtiene:
pˆ (1 − pˆ )
d = z1−α 2 ⋅ (4)
n
Observando (4) podemos ver que el nivel de confianza influye en el valor de z. La experiencia piloto nos
permite usar un valor de p̂ ; el margen de error, d, es igual a 0,05. Por lo tanto sólo se debe despejar n para
tener una respuesta al problema.

SOLUCIÓN
Datos: d = 0,05; 1-α = 0,95; xm = 35 (número de machos o casos favorables); y tamaño de la muestra
piloto np = 100.
Despejando n desde (4) obtenemos:
2
 z1−α 2 
n0 =   ⋅ pˆ (1 − pˆ ) (5)
 d 
[Notaremos n0 al tamaño de muestra calculado para satisfacer los requisitos de “margen de error” y
“nivel de confianza” deseados.]
Reemplazando en (5) con los datos, y recordando que z1−α 2 = z0,975 = 1,96:
2
 1,96 
n0 =   ⋅ 0,35 ( 0, 65 ) = 349,58 ≅ 350 moscas
 0, 05 
Respuesta: el tamaño de la muestra debe ser de 350 moscas para tener un margen de error de a lo sumo
0,05 y una confianza de 95%.

52
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

[Siempre que sea necesario redondear al buscar el tamaño de muestra, lo haremos redondeando hacia el
entero superior.]

Nota: Muchas veces, antes de realizar un muestreo para estimar con cierto margen de error un parámetro,
no se cuenta con información relativa a la variación de la población. En tal caso, se puede adoptar alguna de
las siguientes opciones: a) hacer un muestreo piloto, b) tomar información de bibliografía, c) consensuar un
valor sobre la base de la experiencia del investigador en el tema o tratando de considerar algún caso
extremo. (Ejemplo: pˆ = 0,5 en caso de no contar con información previa)
2
EJERCICIO 7) Se desea estimar el peso promedio de materia verde por m en un campo de 10 ha,
sembrado con alfalfa. Se admite un error en la estimación (sinónimo de margen de error) de 0,05 Kg, con una
confianza del 99%. Dado que no se dispone de información anterior se procedió a seleccionar una muestra
2 2 2
piloto de 20 unidades (o sea, 20 m ) y se calculó s = 1,4 kg . Determinar el tamaño de muestra adecuado a
las restricciones enunciadas y definir: a) Variable y población en estudio; y b) Unidad de muestreo.

En este ejercicio se agrega un concepto que es de utilidad cuando las poblaciones son de tamaño finito.
Generalmente, consideramos que N (el tamaño de la población) es infinito, pero en muchas situaciones,
como en la del ejemplo, la población tiene un tamaño finito. Entonces, para considerar esta situación se debe
usar la siguiente corrección:
n0
nf =
n
1+ 0
N
Notemos que ahora se denomina nf al tamaño de muestra requerido para satisfacer las restricciones de
margen de error y nivel de confianza cuando el tamaño de la población es finito.

SOLUCIÓN
2 2
Datos: N = 10 ha = 100000 m (tamaño de la población); np = 20 m (tamaño de la muestra piloto);
s = 1,4 kg ; 1-α = 0,99 → tn p −1;1−α 2 = t19; 0,995 = 2,861; y d = 0,05 Kg
2 2

2
a) Variable en estudio: peso de materia verde en 1 m expresado en Kg de campo sembrado con alfalfa.
2
Población en estudio: 100.000 m sembrados con alfalfa.
2
b) Unidad de muestreo: una parcela de 1 m sembrada con alfalfa.

En base a la información suministrada, se debe trabajar con la semiamplitud obtenida a partir de (1):
 s ⋅ tn p −1;1−α 2   1,1832 ⋅ 2,861  2
2

n0 =   =   = 4583,656
 d  0, 05 
 
En este punto sería necesario aproximar hacia el entero superior, pero como emplearemos la fórmula de
corrección por tamaño finito de la población, la aproximación se pospone hasta haber realizado el
siguiente cálculo:
4583,656
nf = = 4382,765 ≅ 4383 parcelas de 1 m
2

4583,656
1+
100000
2
El tamaño de la muestra para una población de tamaño finito debe ser de 4383 parcelas de 1m para
satisfacer las restricciones (margen de error y confiabilidad) en la estimación.

[Observar que nf es menor que no.]

EJERCICIO 8) El peso, en gramos, de pollitos blancos de raza Leghorn es una variable aleatoria con fun-
ción de probabilidad dada por:
 1
 si X ∈ [ 280;380]
f ( X ) = 100
0
 si X ∉ [ 280;380]

53
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

0 si X < 280
 1
 280
La función de distribución es: F ( X ) =  x− si 280 ≤ X ≤ 380
100 100
1 si X > 380
a) Se elige un pollito al azar de la población total en estudio. Calcular la probabilidad de que su peso sea
mayor que 330 g.

b) Se eligen al azar 10 pollitos en forma independiente. Calcular la probabilidad de elegir exactamente 6


pollitos cuyo peso sea mayor que 330 g.

c) Sabiendo que la media de los pesos de los pollitos blancos de raza Leghorn es 330 g y la varianza de
2
los pesos es 833,33 g , y se eligen al azar en forma independiente 36 pollitos, calcular la probabilidad de
que el peso promedio sea mayor a 330 g. Justificar el cálculo hecho.

SOLUCIÓN
 1 280 
a) P ( X > 330 ) = 1 − F ( 330 ) = 1 −  *330 − = 1 − 0,5 = 0,5
100 100 
b) Al elegir 10 pollitos en forma independiente, y considerar como variable X: “cantidad de pollitos blancos
de raza Leghorn con peso superior a 330 g”, se analiza si cumple con los requisitos para ser considerada
binomial. En este punto, sería conveniente que usted escriba los supuestos de la binomial, aplicándolos a
esta situación práctica. Verá que se cumplen, y podemos escribir lo siguiente: X∼Bi (n=10 ; p=0,5), por lo
que se resuelve:
P ( X = 6 ) = P ( X ≤ 6 ) − P ( X ≤ 5 ) = 0,8281 − 0, 6230 = 0, 2051
c) Como X tiene distribución uniforme, con µ=330 g y σ = 833,33 g , entonces podemos buscar la distri-
2 2

bución del peso promedio aplicando el Teorema Central del Límite, con lo que nos queda que:
 σ 2 833,33 
X 36 ≈ N  µ = 330; σ X2 = = = 23,148 
 n 36 
 
 330 − 330 
P( X > 330) = P  Z >  = P( Z > 0) = 1 − P( Z ≤ 0) = 1 − 0,5 = 0,5
 833,33 
 
 36 

EJERCICIO 9) En los últimos años se desarrollan actividades alternativas de cría, basándose en especies
animales autóctonas de la zona. Este es el caso de la cría del lagarto overo, en alguna localidad de la
Mesopotamia argentina. En un estudio realizado en un centro de reproducción y cría, de dicha localidad,
se midieron 45 colas de lagartos hembra juveniles, obteniéndose una media de 0,5 m y una varianza de
2
0,008 m . La variable de interés se distribuye en forma normal.
a) Estimar, utilizando un nivel del 95%, la longitud media de la cola.
b) Si usted hubiera decidido realizar el intervalo con un nivel de confianza del 90%, ¿qué modificación
hubiera tenido la amplitud del mismo? Justifique su respuesta y realice los cálculos correspondientes.
c) Suponga que, por bibliografía consultada, la longitud de la cola en los yacarés overos hembras juve-
niles es una variable aleatoria con distribución desconocida cuya media es 0,45 m y su varianza es 0,01
2
m . A partir de esta información y considerando que tiene los mismos elementos en su muestra, ¿puede
definir la distribución de la longitud media de la cola?
d) Si para reproducción se dejan aquellas hembras con longitudes medias de cola superiores a 0,48 m,
¿qué porcentaje de las hembras de la muestra serán seleccionadas para el plantel reproductor?

SOLUCIÓN
a) La variable en estudio es X: “Longitud de la cola de un lagarto overo hembra del centro de reproduc-
ción y cría de algún lugar de la Mesopotamia argentina”, y está medida en m. Los datos que tenemos
son: n=45 ; x = 0,5m ; s 2 = 0, 008m 2 , por lo que s = 0, 089m

54
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

Aplicamos la fórmula correspondiente al Intervalo de Confianza para µ:


s 0, 089
x mt α * = 0, 5 m 2, 015. = 0,5 m 0, 027 = [0,473 m; 0,525 m]
n −1;1− n 45
2
Conclusión: Con un 95% de confianza se espera que el intervalo [0,473 m; 0,525 m] cubra o contenga al
verdadero valor de la media poblacional de la longitud de la cola de lagartos overos hembras juveniles del
centro de cría y reproducción de alguna localidad de la Mesopotamia argentina.

b) La amplitud (simbolizada con a) del intervalo anterior la calculamos restando los valores de los límites
obtenidos: a = LS – LI = 0,525 – 0,473 = 0,052

Veamos qué ocurre si la confianza disminuye como en este caso, ya que pasamos a tener 90%. Recor-
demos que la semiamplitud del intervalo corresponde al producto entre el valor tabular de la variable pivo-
tal y el error estándar de la media, en este caso, dado que estamos armando un intervalo para la media,
s
quedando así: d = t α *
n −1;1− n
2
Si reemplazamos numéricamente y calculamos:
s 0, 089
d =t α * = t44;0,95 * = 1, 68* 0, 013 = 0, 022
n −1;1− n 45
2

Si multiplicamos por 2, obtenemos la amplitud (a): d*2 = 0,022*2 = 0,044


Al compararla con la anterior vemos claramente que es más pequeña, dada la reducción en el nivel de
confianza.

c) Sí, porque se puede aplicar el Teorema Central del Límite, quedando:


σ X2
E ( X ) = µ = 0, 45m ; V ( X ) = = 0, 0002m 2 , entonces X ≈ N ( 0, 45m; 0, 0002m 2 )
0, 01
=
n 45
 
 
d) P ( X > 0, 48 m ) = P  Z > 0, 48 − 0, 45  = P ( Z > 2, 01) = 1 − P ( Z ≤ 2, 01) = 1 − 0, 97778 = 0, 02222
 0, 01 
 
 45 

PROBLEMAS PROPUESTOS
EJERCICIO 1) Se desea estimar el peso promedio de un lote de 500 cerdas, a partir de una muestra de 36.
Los pesos obtenidos se presentan en la siguiente tabla:
PESO (Kg) Cant. animales
40 - 42 3
42 - 44 5
44 - 46 7
46 - 48 10
48 - 50 6
50 - 52 3
52 - 54 2
Proponer una respuesta trabajando con un nivel de confianza del 99%, y suponiendo que la distribución de la
variable es normal.

EJERCICIO 2) Se desea estimar el desvío estándar de la alzada de potrillos PSC (Pura Sangre de Carrera)
de la provincia de Entre Ríos, con una confianza del 95%, sabiendo que una muestra de 20 animales
presentó un CV% de 19,03% y un promedio de 1,10 m. Suponga que la variable tiene distribución normal.
a.- Definir la variable en estudio y la población de interés.
b.- Indicar la variable aleatoria empleada como pivotal expresando su distribución.
c.- Indicar los valores tabulares empleados para el LI y el LS.
d.- Estimar el desvío estándar poblacional mediante un intervalo de confianza y concluir.

55
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

EJERCICIO 3) Al examinar 154 vacas Holando Argentino, en un determinado tambo, el 15%,


aproximadamente, dio reacción positiva de brucelosis.
a.- Estimar puntualmente y a través de un intervalo de confianza del 90%:
a.1.- la proporción poblacional de vacas en ordeñe sin brucelosis.
a.2.- la proporción poblacional de vacas con brucelosis.
b.- Definir la variable en estudio y la población de interés
c.- Si se toma una muestra aleatoria de 15 vacas, ¿cuál es la probabilidad de no detectar ninguna como
positiva?

EJERCICIO 4) Un investigador necesita conocer el nivel medio de una enzima en una población. Con los
datos disponibles, correspondientes a determinaciones realizadas en una muestra piloto de 10 individuos, se
2
obtuvo una media de 22 UI y una varianza de 49 UI . Suponga que la variable tiene distribución normal.
a.- Definir la variable en estudio y la población de interés.
b.- Indicar la variable aleatoria empleada como pivotal expresando su distribución.
c.- ¿Qué cantidad de determinaciones deberá realizar para estimar la media poblacional con una confianza
del 99% y con un margen de error no mayor a 2 UI?
Asuma que se tomó una muestra del tamaño por Ud. recomendado en el punto c.-, y que entonces las
estimaciones para µ y σ resultaron ser 23 UI y 48,5 UI , respectivamente.
2 2

d.- Indicar los valores tabulares empleados para el LI y el LS.


e.- Estimar la media poblacional mediante un intervalo de confianza y concluir.

EJERCICIO 5) Se quiere estimar la proporción de familias del Conurbano Bonaerense que tienen alguna
forma de seguro de salud.
a.- Definir la variable en estudio y la población de interés.
b.- Considerando que no se dispone de información previa, ¿qué tamaño de muestra se deberá tomar para
asegurar un nivel de confianza del 99% y un margen de error de 0,3?
c.- Si se cree que el 70% de las familias tienen seguro, ¿qué tamaño de muestra se deberá tomar para
asegurar un nivel de confianza del 99% y un margen de error de 0,3?

EJERCICIO 6) Si el peso de los novillos de la raza Aberdeen Angus es una variable con una media de
360 Kg y un desvío estándar de 18 Kg,
a.- La probabilidad de que el promedio de 49 novillos Aberdeen Angus, elegidos al azar, pesen entre 380 y
390 Kg es igual a

Planteo Desarrollo Resultado

b.- Al tomar una muestra al azar de 36 novillos Aberdeen Angus, la probabilidad de que el promedio de la
misma esté entre 365 y 370 Kg es igual a
Planteo Desarrollo Resultado

EJERCICIO 7) Se tomó una muestra de 12 llamas pertenecientes a un establecimiento ganadero con el


propósito de evaluar la producción de lana, cuya distribución es aproximadamente normal, y se obtuvo
una media de 2,26 Kg y un desvío de 0,48 Kg. Se estimó, mediante un intervalo de confianza del 90%, la
varianza poblacional de la producción de lana.
a.- ¿Qué estadístico y qué dos valores tabulares fueron empleados para obtener dicho intervalo?
Estadístico Valor Tabular LI Valor Tabular LS

56
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

b.- Tache lo que no corresponde: “El intervalo de confianza fue [SIMÉTRICO] [ASIMÉTRICO] con respecto al
estimador puntual.”

EJERCICIO 8) ¿Cuál sería el tamaño de muestra necesario para que la amplitud de un intervalo de
confianza del 95% para la media poblacional de una variable, medida en mm, con distribución normal sea
2
igual a 2mm, si la varianza es conocida e igual a 4mm ?

EJERCICIO 9) Al estimar la media poblacional mediante un intervalo de confianza del 90% se obtuvieron
los siguientes límites: [95; 110]. Sabiendo que se trabajó con una muestra de 26 individuos, dar el valor
del promedio y de la varianza que se utilizó para el cálculo de dicho intervalo si σ era desconocida.
2

Suponga que la variable tiene distribución normal.

EJERCICIO 10) El administrador de un rodeo está interesado en conocer la edad promedio de las vacas
de cría en un año dado. Decide tomar una muestra de tamaño 25, con la que se obtuvo un promedio de
5,3 años. Si se conoce que esta variable tiene una distribución normal con varianza poblacional de 2,25
2
años .
a.- Estimar la edad promedio poblacional mediante un intervalo de confianza del 95%.
b.- Si se quiere reducir en un 50% la amplitud del intervalo de confianza ¿Cuál debería ser el tamaño de
la muestra?
c.- Si al punto anterior se le agrega la información de que el tamaño poblacional es finito, N = 500. ¿Cuál
sería su respuesta?

EJERCICIO 11) Con el fin de analizar el contenido de proteínas del salmón enlatado, medido en %, se
seleccionó una muestra de 15 unidades y se realizó la determinación correspondiente. Los datos obteni-
dos son los siguientes:
22,4 24,5 23,0 27,1 24,2 25,7 26,4 28,3 26,4 25,2 24,7 26,3 25,3 24,9 27,4

a) Halle la media y el desvío para la muestra dada. 29,00


b) A partir del siguiente boxplot obtenido a partir de la
muestra dada, le parece razonable el supuesto de 28,00
normalidad. Justifique.
27,00

Asumiendo que el contenido de proteínas del salmón enlatado


Proteínas

26,00
es una variable aleatoria con distribución normal:
25,00
c) Halle un intervalo de confianza del 95% para la verda-
dera media poblacional. Interprete en términos del 24,00
problema planteado
23,00
d) Halle un intervalo de confianza del 95% para el ver-
dadero desvío poblacional. Interprete en términos del 22,00
problema planteado

EJERCICIO 12) En la provincia de Misiones se registra un brote de leptospirosis canina. El resultado de


un estudio serológico que se realiza en 94 perros que llegan a una clínica con síntomas compatibles con
la enfermedad, indica que 41 de ellos están infectados.
a) ¿Cuál es la variable de interés? ¿Qué distribución tiene? Justifique su respuesta aplicando los con-
ceptos adquiridos en la unidad 2 (variable aleatoria)?
b) Estimar el parámetro de interés, de manera puntual y por intervalo de confianza, utilizando un nivel
del 95%.
c) El colegio de veterinarios de la localidad intenta estimar la proporción de caninos con leptospirosis,
para lo cual recurre a los registros informados por los consultorios, en los que figuran que de 230 perros
que presentaron síntomas compatibles con la enfermedad sólo 85 resultaron positivos. A partir de estos
datos, estime el parámetro de interés y utilice el mismo nivel de confianza que el utilizado en el punto b)?
¿Qué puede decir al comparar ambas amplitudes? Justifique su respuesta.
d) En Epidemiología se habla de epidemia cuando se produce un aumento en la proporción de enfer-
mos. En esta localidad, históricamente, la proporción de caninos enfermos con leptospirosis es 0,28. De
acuerdo a los intervalos que usted calculó e intuitivamente, ¿puede decirse que esta proporción está con-
57
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

tenida en ellos? En la próxima unidad usted aprenderá otro método estadístico que le permitirá hacer otro
tipo de inferencia, para responder a la siguiente pregunta: ¿aumentó la proporción de caninos con leptos-
pirosis?

CUESTIONARIO
( )
1.- a) Sea X una variable aleatoria, X ~N µ ; σ 2 . ¿Cómo se distribuye la media muestral para las muestras
de tamaño n? ¿Debe hacerse alguna consideración con respecto a n? Justifique la respuesta.
b) Ídem suponiendo que se desconoce la distribución de X .

( )
2.- Sea X una variable aleatoria, X ~N µ ; σ 2 . Establezca la relación de igualdad o desigualdad (< ó >)

( )
según corresponda entre las siguientes probabilidades: P a < X < b y P ( a < X < b ) siendo a < µ < b .
Justifique la respuesta.
3.- Sea X una variable aleatoria con distribución desconocida, pero de la cual se sabe que tiene E(X ) = µ
y V ( X ) = σ 2 . ¿Cómo se distribuye la media aritmética muestral para las muestras de tamaño 10?
Justifique la respuesta.
4.- Explique cuál es la importancia del Teorema Central del Límite a la Estadística.

5.- Sea X una variable aleatoria tal que X ~N ( µ ; σ 2 ) . Se toman dos muestras aleatorias, una de tamaño n
(muestra 1), y otra de tamaño m (muestra 2). Compare las varianzas correspondientes a las variables
promedio de las muestras 1 y 2 (o sea, X 1 y X 2 ), indicando la relación entre ellas en los casos: a) n = m y
b) n > m.
6.- Se construyó un intervalo de confianza para la media poblacional con varianza conocida. Con la misma
muestra se quiere construir otro intervalo de menor amplitud. ¿Qué puede proponer para lograrlo? Justifique
la respuesta.
7.- ¿Cómo interpreta el coeficiente de confianza cuando construye un intervalo de confianza? Ejemplifique.
8.- Al estimar σ por medio de dos intervalos de confianza construidos con la misma muestra, se obtuvieron
2

los siguientes valores:


a.- [180 ; 220] para un nivel de confianza del 95%
b.- [185 ; 225] para un nivel de confianza del 99%
¿Está de acuerdo con los valores hallados? Justificar.
9.- Para estimar la media poblacional de una variable con distribución normal, con varianza desconocida, y
tomando una muestra de tamaño n, ¿qué intervalo le parece más adecuado? Elija una opción y justifique.

 S S   S S 
a.-  X − S ; X + S  b.- X − ;X+  c.-  X − tn −1;1− α 2 . ; X + tn −1;1− α 2 . 
 n n  n n
10.- Si X es una variable aleatoria cuya distribución es desconocida, pero con media 120 y varianza 16
conocidas. Seleccionar la opción que considere correcta:
“La media de muestras de tamaño 100 se distribuye ...
a.- aproximadamente normal con media 120 y varianza 16.”
b.- exactamente normal con media 120 y varianza 0,16.”
c.- aproximadamente normal con media 120 y varianza 0,16.”
e.- con distribución desconocida pero con media 120 y varianza 0,16.”
11.- ¿Por qué debe decirse que “el intervalo cubre o contiene al parámetro” y no “el parámetro cae dentro del
intervalo”? Justifique la respuesta.
12.- “El teorema central del límite nos garantiza la distribución aproximadamente normal de la media muestral
cuando la variable X
a.- tiene distribución Normal.”
b.- tiene distribución no Normal.”
c.- tiene distribución desconocida pero tabulada”
d.- tiene distribución desconocida.”

58
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

13.- ¿Qué diferencias encuentra entre el margen de error para la estimación de µ cuando σ es conocida
2

con relación a cuando σ es desconocida?


2

14.- Trate de obtener la expresión de la amplitud (LS – LI) para un IC para la media poblacional, y analice
como varía esta en función de las variables que la componen.
15.- Intente realizar el despeje para obtener el LI y el LS de un IC para la varianza poblacional.
16.- ¿Cuál sería la razón de adoptar la regla del redondeo del tamaño de la muestra al entero superior?

59
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

PRUEBA DE HIPÓTESIS
* OBJETIVOS ESPECÍFICOS
 Comprender y analizar la lógica de los ensayos de hipótesis así como de sus componentes
fundamentales.
 Aplicar correctamente los conceptos de nivel de significación, potencia de una prueba y regla de decisión
estadística a la resolución de problemas.
 Desarrollar espíritu crítico para evaluar la correcta aplicación de una dócima en un determinado contexto.
* CONTENIDOS TEMÁTICOS
Concepto de hipótesis estadística. Errores tipo I y II. Nivel de significación. Concepto de potencia de una
prueba estadística. Esquema para contrastar una hipótesis. Prueba de hipótesis para la media (µ), la
2
proporción (p) y la varianza (σ ). Aplicaciones.

* GLOSARIO
Prueba, dócima o contraste de hipótesis. Supuestos teóricos. Hipótesis de trabajo. Hipótesis estadística.
Hipótesis nula y alternativa. Error tipo I y tipo II. Nivel de significación. Región crítica. Regla de decisión.
Potencia.

PROBLEMAS RESUELTOS
EJERCICIO 1) En una chimenea se ha instalado un sistema de precipitación con el que se cree que la
3
concentración de sólidos en el humo, que es en promedio de 1,8 g/m , será menor a la tercera parte. Puesta
3
en marcha la instalación se efectúa una serie de mediciones, obteniéndose los siguientes valores (g/m ):

0,50 0,52 0,53 0,54 0,55


0,55 0,56 0,56 0,57 0,64

En base a estos valores, ¿cree usted que se ha obtenido el resultado esperado? (α=0,05)

SOLUCIÓN
Variable en estudio
3
X: concentración de sólidos en el humo de una chimenea luego de instalar un sistema de precipitación (g/m )

El investigador expresa su supuesto como una ′hipótesis de trabajo′.

La hipótesis de trabajo (HT) expresa el supuesto o conjetura que motiva al experimentador. Se expresa
siempre como una afirmación y está dada en forma coloquial, no en términos estadísticos, ya que el
investigador no necesita tener conocimientos estadísticos específicos.
Es formulada antes de cualquier estudio estadístico.

En este caso HT es: “el sistema de precipitación instalado en la chimenea disminuye la concentración
de sólidos en el humo a menos de la tercera parte”.
Para poner a prueba la HT se necesita transformar las afirmaciones allí expresadas a términos
estadísticos a los fines de poder aplicarles la técnica adecuada que permita responder sobre la hipótesis
formulada. Esta consta de varios pasos y es importante tener claro en que consiste cada uno de ellos y el
orden en que se presentan.

Se llama hipótesis estadística a una aseveración o especificación acerca de la distribución de la


variable que se está estudiando o de los parámetros de esa distribución, según sea lo necesario acorde a
la hipótesis de trabajo del investigador.
Se formulan dos hipótesis: una hipótesis nula y una hipótesis alternativa, que son disjuntas y
exhaustivas; en caso de referirse a un parámetro abarcan todos los valores posibles que pueda tomar
este. La formulación se realiza entonces de manera tal que si una es verdadera la otra es falsa.
La hipótesis que se pone a prueba es la hipótesis nula, y en ella, a los fines del desarrollo de la
prueba, siempre debe colocarse una igualdad.

En este caso: De acuerdo a lo formulado en la hipótesis de trabajo, y teniendo en cuenta que el valor de la
3
concentración media de sólidos antes de instalar el sistema de precipitación era de 1,8 g/m , será:

60
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

H0 : µ ≥ 0,6 hipótesis nula


H1 : µ < 0,6 hipótesis alternativa

El nivel de significación es 0,05.

Este valor proporciona una medida del riesgo con el que se desarrollará la prueba, consecuencia del
método inductivo. Significa que de cada cien muestras obtenidas, cinco nos pueden llevar a resultados
erróneos; esperamos que la nuestra sea una de las noventa y cinco “buenas”.

En este caso:
α = 0,05 = P(rechazar H0 /H0 es verdadera) = P(suponer µ < 0,6 cuando en realidad es µ ≥ 0,6)
Esto significa que, en cinco de cada cien veces, concluiremos que el sistema disminuye la concentración
de sólidos a menos de la tercera parte cuando en realidad no lo hace.
Antes de elegir el estadístico de prueba, necesitamos tener información sobre la distribución de la
variable en estudio, ya que en este caso no está aclarada en el enunciado del problema.

El supuesto teórico (ST) que hacemos sobre la variable en estudio es:

ST : X ~ N (µ , σ ) X ≈ N (µ , σ )
2 2
ó

Para verificar este supuesto se realizó una prueba de Shapiro-Wilk, llegando a la conclusión de que se
puede suponer que la variable se distribuye aproximadamente normal.

Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Sólidos 10 0,55 0,04 0,91 0,4176

Donde W es el estadístico de prueba utilizado para esta dócima y p=p-valor.

El p-valor, p-value o simplemente p, es un valor de probabilidad que se acumula desde el valor


calculado del estadístico de prueba hacia +∞ o -∞, o ambos, de acuerdo a cómo esté planteada H1, y se
utiliza para definir la regla de decisión sin necesidad de buscar en tabla los valores críticos correspondientes.
Lo utilizaremos para decidir rechazar o no H0 en el caso de tener la salida de computadora.
La regla de decisión la armaremos comparando el p-valor con el valor de α, para cualquiera de las
H1:
o Si el p-valor ≤ α → rechazo H0
o Si el p-valor > α → no rechazo H0

Como p=0,4176 > 0,05 (nivel dado), no rechazo H0. Por lo tanto, al nivel del 5%, no tengo evidencias
suficientes para rechazar H0 y puedo suponer que parecería que la concentración de sólidos se distribuye
normalmente.

El estadístico de prueba a utilizar en este caso es:


X −µ
t= ∼tn-1
S
n
El estimador utilizado del parámetro en estudio es la media muestral. Si suponemos que la distri-
bución de la variable es normal, la media muestral también tendrá una distribución normal. Estandarizan-
do esta variable obtenemos una normal estándar, y como la varianza poblacional es desconocida enton-
ces utilizamos una t de Student. Así cumplimos con la necesidad de tener una distribución conocida para
poder emplear las tablas estadísticas.

Necesitamos ahora determinar la región crítica. Recordemos que la región crítica está formada
por los valores del estadístico de prueba en los cuales se va a producir el rechazo de la hipótesis nula.
Se determina a partir de la distribución del estadístico de prueba, el nivel de significación de la prueba, la
hipótesis alternativa y a veces, del tamaño de la muestra.

61
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

También se puede expresar la región crítica como un subconjunto de valores del estimador del
parámetro, pero no lo usaremos en este curso.

En este caso: la región crítica es unilateral izquierda por lo indicado en H1


Es el conjunto de valores de t ≤ -1,83
(como α=0,05 el valor tabulado corresponde a t(9) ; 0,05= -1,83)

Gráficamente:

La regla de decisión es: RECHAZO H0 si t Ho ≤ -1,83


NO RECHAZO H0 si t Ho > -1,83

Tomando una muestra aleatoria de la población en estudio, se estima el parámetro que se está
poniendo a prueba, y teniendo en cuenta toda la información obtenida de la muestra, se calcula el valor
del estadístico de prueba bajo la hipótesis nula y se toma la decisión.

Información muestral: x = 0,552 g/m3 ; s2 = 0,00139 (g/m3)2 ; s = 0,037 g/m3 ; n = 10


Reemplazando en el estadístico de prueba:
0,552 − 0,600
t H0 = = − 4,095
0,037 3,16

Como - 4,095 < -1,83 entonces, la decisión es rechazo H0

CONCLUSIÓN: Con un nivel de significación del 5%, tengo evidencias suficientes para rechazar H0: µ≥0,6
por lo tanto µ<0,6; es decir, la media poblacional de la concentración de sólidos en el humo de las chimeneas
3
en las que se ha instalado el sistema de precipitación es menor a 0,6 g/m ; en consecuencia se concluye
que la disminución producida por la instalación de este nuevo sistema lleva el valor medio de concentración
de sólidos en la chimenea por debajo de la tercera parte; por lo tanto se ha obtenido el resultado esperado.

EJERCICIO 2) En la situación práctica del problema 1), se sospecha que la varianza no se mantiene en el
3 2
valor histórico de 0,0015 (g/m ) , por lo que se ponen a prueba las siguientes hipótesis estadísticas:
H0 : σ =0,0015 vs H1 : σ ≠ 0,0015
2 2
al mismo nivel de significación

Indicar sólo: hipótesis de trabajo, estadístico de prueba, región crítica, regla de decisión, decisión e
interpretación biológica del parámetro en estudio acorde a la decisión tomada

SOLUCIÓN
Hipótesis de trabajo: La varianza de la concentración de sólidos en el humo de la chimenea una vez
3 2
instalado un sistema de precipitación es de 0,0015 (g/m )

ó La varianza de la concentración de sólidos en el humo de la chimenea una vez


3 2
instalado un sistema de precipitación difiere de 0,0015 (g/m )

El supuesto teórico de normalidad sobre la variable en estudio ya fue verificado; por lo tanto el
estadístico de prueba es:

χ2 =
( n − 1) ⋅ S 2 ∼ χ 2
n −1
σ2
y la región crítica de acuerdo con H1 es bilateral, siendo:
χ (9);0,025 = 2,70 ==> región izquierda χ 9 ≤ 2,70
2 2

y χ (9);0,975 = 19,02 ==> región derecha χ 9 ≥ 19,02


2 2

62
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

O sea, son los valores de χ 9 ≤ 2,70 ó χ 9 ≥ 19,02


2 2

Gráficamente:

α/2 α/2
] [
0,00 2,70 7,50 15,00 19,20 22,50 30,00

La regla de decisión es: RECHAZO H0 si χ H0 ≤ 2,70 o χ H0 ≥ 19,02


2 2

NO RECHAZO H0 si 2,70 < χ H0 < 19,02


2

A partir de la información muestral y reemplazando en el estadístico de prueba utilizado, tenemos:


9 ⋅ 0,00139
χ 2H0 = = 8,34
0,0015

Como 2,70 < 8,34 < 19,02 entonces la decisión es no rechazo H0

Parámetro en estudio: varianza poblacional de la concentración de sólidos en el humo de las chimeneas en


las que se ha instalado este sistema de precipitación.
Como no rechazo H0 se puede suponer que σ = 0,0015 (g/m ) , es decir, que, al 5%, la varianza poblacional
2 3 2
3 2
de la concentración de sólidos en el humo de estas chimenea no difiere de 0,0015 (g/m ) .

EJERCICIO 3) Un laboratorio está dispuesto a lanzar al mercado un nuevo fármaco si es aceptado al menos
por el 50% de los profesionales. Para ello selecciona una muestra aleatoria de 100 médicos veterinarios a
quienes pregunta si utilizarían el fármaco en cuestión, obteniendo 38 respuestas positivas. ¿Cuál será la
decisión del laboratorio trabajando con un nivel de significación del 5%?
Responda la pregunta indicando sólo: variable en estudio, supuesto de distribución de la misma, hipótesis
de trabajo, hipótesis estadísticas, estadístico de prueba, regla de decisión, valor calculado del estadístico de
prueba, decisión y población en estudio.

SOLUCIÓN
Variable en estudio
X: número de médicos veterinarios que aceptan el nuevo fármaco, en 100.
ST: X ~ Bi(100, p)

Para verificar este supuesto no se utilizan pruebas estadísticas. Sólo las condiciones de la distribución
Binomial vistas en la Unidad 2.

Hipótesis de trabajo: al menos el 50% de los médicos veterinarios acepta el nuevo fármaco que propone el
laboratorio

Hipótesis estadísticas
Las expresiones dadas por porcentajes se traducen a proporciones para el estudio
estadístico. Se trata entonces de un caso de una prueba de hipótesis para la proporción
poblacional.
En este caso, el 50% indica 50 de cada 100 médicos, por lo tanto p = 0,50.
Pero la hipótesis de trabajo expresa que “al menos el 50%...”, lo cual es equivalente a decir “como mínimo el
50%...”, o también “por lo menos el 50%....”, y esto se expresa entonces como p ≥ 0,50.
Teniendo en cuenta además que en la hipótesis nula debe colocarse siempre la igualdad, tenemos:

H0: p ≥ 0,50
H1: p < 0,50

63
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

pˆ − p
El estadístico de prueba es: ZH0 = ≈ N ( 0,1)
p.(1 − p)
n

Nivel de significación: α = 0,05

La regla de decisión es: RECHAZO H0 si ZH0 ≤ -1,64


NO RECHAZO H0 si ZH0 > -1,64

x 38
Información muestral: n = 100 ; x = 38 ; pˆ = = = 0,38
n 100

0,38 − 0,50
Por lo que sustituyendo en la variable pivotal resulta: ZH = = −2, 4 que es el valor calculado del
0 0,5 ⋅ 0,5/100
estadístico de prueba.

Como -2,4 < -1,64, entonces decidimos rechazar H0.

Población: los médicos veterinarios.

EJERCICIO 4) Se registró la edad de los niños atendidos por quemaduras en la última Navidad en los
hospitales y centros asistenciales de la ciudad “Quemucho” (Argentina) resultando:

Edad frecuencia
3–5 3
5–7 8
7–9 10
9 – 11 7
11 - 13 4
Se solicita:
a) Definir y clasificar la variable
b) Completar la tabla de frecuencias con las columnas de frecuencias relativas y la columna de frecuen-
cias absolutas acumuladas.
c) Interpretar el significado, en términos del problema, del número “10” que figura en la tabla
d) ¿Cuál es la proporción de niños de menos de 7 años que fueron atendidos por quemaduras en éste
grupo?
e) Si se considera la ciudad “Quemucho” es representativa de las ciudades de la Argentina respecto a los
casos de niños atendidos por quemadura durante la última Navidad:
e.1) estimar la proporción de niños menores de 7 años que fueron atendidos por quemaduras duran-
te la última Navidad en las ciudades de Argentina, con un 95% de confianza.
e.2) ¿Se puede afirmar, con un nivel de significación del 1%, que la edad media de los niños que se
atendieron en la última Navidad en Argentina es superior a 7 años? Suponga que la variable cumple
el supuesto de normalidad.

SOLUCIÓN
a) X: “edad de un niño atendido, por quemaduras en la última Navidad, en los hospitales y centros asis-
tenciales de la ciudad “Quemucho”. Variable aleatoria cuantitativa discreta.
b)
Edad fi Fi hi Hi
3-5 3 3 0,094 0,094
5-7 8 11 0,250 0,344
7-9 10 21 0,312 0,656
9-11 7 28 0,219 0,875
11-13 4 32 0,125 1,000

64
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

c) f3= 10 niños, de entre 7 y menores a 9 años, fueron atendidos por quemaduras en la última Navidad en
los hospitales y centros de asistencia de la ciudad “Quemucho”.

d) Me fijo en la columna Hi, y la que corresponde a lo pedido es H2=0,344, siendo esa la proporción de
niños menores de 7 años que fueron atendidos la última Navidad en los hospitales y centros de atención
sanitaria de “Quemucho”.

e)
e.1) Los niños menores de 7 años atendidos por quemaduras, son 11 de los 32 atendidos por
quemaduras en los centros sanitarios de la localidad de “Quemucho”, por lo que la estimación puntual de
la proporción es: pˆ = 0,344 . Como estamos diciendo que dicha localidad es representativa de las ciuda-
des de Argentina, entonces estimaremos la proporción poblacional de niños menores de 7 años que fue-
ron atendidos por quemaduras, la última Navidad, en centros sanitarios y hospitales de Argentina.
El intervalo de confianza del 95% correspondiente es:
pˆ . (1 − pˆ ) 0, 344.0, 656
pˆ m Z α = 0, 344 m 1,96 = 0,344 ± 0,165 = [ 0,179; 0, 509]
1− n 32
2
Con un nivel de confianza del 95%, se espera que el intervalo [0,179 ; 0,509] contenga la verdadera pro-
porción de niños menores de 7 años atendidos por quemaduras en los hospitales y centros de atención
sanitaria de Argentina en la última Navidad.

e.2) La hipótesis de trabajo es: la edad media de los niños que se atendieron en la última Navidad
en Argentina es superior a 7 años

H0 : µ = 7 X −µ
α = 0,01 t= ∼tn-1
H1 : µ > 7 S
n
La región crítica está definida por: t31 ≥ t31;0,99 ≅ t30;0,99 = 2, 457

Regla de decisión: Rechazo H0 si tobs ≥ 2,457 y No Rechazo H0 si tobs < 2,457

Los datos a tener en cuenta son: x = 8, 0625 ; s 2 = 5,54 por lo tanto s = 2, 35


X − µ 8, 0625 − 7
t obs = = = 2, 55
s 2,35
n 32
Decisión: Rechazo H0 pues 2,55>2,457

Conclusión: Con un nivel de significación del 1% hay evidencia suficiente para rechazar la hipótesis nula
( H 0 : µ = 7 ) , por lo que se puede decir que la edad media poblacional de los niños que se atendieron
por quemaduras en los hospitales y centros de atención sanitaria en la última Navidad en Argentina es
superior a 7 años.

EJERCICIO 5) En un establecimiento dedicado a la cría de llamas se han instaurado prácticas de selec-


ción y mejoramiento durante los últimos tres años. Para estudiar si dichas prácticas han sido productivas,
se seleccionan aleatoriamente 50 animales del rodeo general, y se registra en los mismos el peso del
vellón luego de la esquila. Estos resultados permitirán evaluar si se ha conseguido el objetivo propuesto
de aumentar la producción en el establecimiento. Por referencias históricas, para esta variable, antes de
la implementación de las técnicas de manejo, sabemos que el peso del vellón se distribuye normalmente
con una media de 4,5 kg y un desvío de 1,5 kg.
Los datos registrados fueron ordenados en la siguiente tabla:

65
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

[ ; ) X’i fi
4,45 - 4,70 4,58 3
4,70 - 4,95 4,83 9
4,95 - 5,20 5,08 7
5,20 - 5,45 5,33 13
5,45 - 5,70 5,58 7
5,70 - 5,95 5,83 9
5,95 - 6,20 6,08 2

a) Presentar los resultados de su investigación gráficamente, comentando lo observado en ellos.


b) Estimar puntualmente el parámetro de interés
c) Verificar, al 5%, si el objetivo de la selección se ha alcanzado
d) Estimar la varianza del peso de los vellones, puntualmente y mediante un intervalo de 95% de
confianza, para responder la siguiente respuesta: ¿se mantiene el mismo valor de varianza luego
de aplicar las prácticas de mejoramiento productivo?

SOLUCIÓN
La variable en estudio es X: “peso del vellón de una llama del establecimiento, luego de la esquila”, me-
dido en Kg.
a) Los resultados se pueden representar mediante el histograma y/o el boxplot. Ambos muestran que
la distribución de la variable es simétrica.
6,50
14

12
6,00
10
frecuencia absoluta
Peso Vellón

5,50 8

6
5,00
4

4,50 2

0
4,00 4,33 4,58 4,83 5,08 5,33 5,58 5,83 6,08 6,33
Peso Vellón

b) El parámetro de interés es la media poblacional del peso del vellón de las llamas, luego de esquila-
do, del establecimiento en el que se emplearon técnicas de mejoramiento productivo.
xi' * f i 265, 75
X =∑ = = 5,315kg
i n 50
Si trabajamos con InfoStat ® obtenemos las medidas resumen:
Estadística descriptiva
Variable n Media D.E. Mín Máx Mediana Q1 Q3
PesoVe 50 5,312 0,419 4,500 6,100 5,350 5,000 5,600

c) El objetivo propuesto, descripto en el enunciado es el de “aumentar la producción en el estableci-


miento”, con lo cual debe considerarse que, para esta variable, es necesario que el peso medio de
los vellones luego de la esquila sea superior a 4,5 Kg.

66
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

H 0 : µ ≤ 4,5 x −µ
α = 0,05 Z= ∼N(0,1)
H1 : µ > 4,5 σ
n
La región crítica es: Z ≥ Z0,95 = 1,64
Regla de decisión: Z obs ≥ 1, 64
Rechazo H0 si
No rechazo H0 si Z
obs
< 1, 64
X − µ 5,315 − 4, 5 0,815
Z obs = = = = 3,84 > 1,64 , por lo que la decisión es Rechazo H0.
σ 1,5 0, 2121
n 50
Podemos concluir que, con un nivel de significación del 5%, existen suficientes evidencias para decir que
el peso medio poblacional de los vellones de las llamas, luego de la esquila, es mayor a 4,5 Kg, en el
establecimiento en el que se han implementado prácticas de mejoramiento productivo. A partir de esto
podemos decir que el objetivo se ha cumplido.
2
d) Para estimar puntualmente la varianza, debemos calcular s . A partir de la tabla de frecuencias ob-
tenemos: ∑x * f
i
'
i i = 265, 75 ; ∑x i
'2
i * fi = 1420, 6375


∑ ( )  = 1 1420, 6375 − ( 265, 75)  = 1 [1420, 6375 −1412, 4613] =
2
xi' * f i
1 
2

s2 =  ∑ xi * fi −
'2 i

n −1  i n  49  50  49
1
= 8,1762 ≅ 0,1669 ( Kg )
2

49
El intervalo de confianza del 95% correspondiente es:
( n − 1) s 2 49*0,1669 8,1781
= 0,1378 ( Kg )
2
L.I . = = =
χ 2
α χ 49;0,975
2
59,342
n −1;1−
2

( n − 1) s 2 49 *0,1669 8,1781
L.S . = = = = 0,3347 ( Kg )
2

χ α
2
χ 49;0,025
2
24, 433
n −1;
2
(Notar que como 49 no figura en la tabla de chi cuadrado, se utilizó 50).
Como conclusión, podemos decir que, con un nivel de confianza del 95%, podemos esperar que el in-
2 2
tervalo [0,1378 (Kg) ; 0,3347 (Kg) ] cubra la varianza poblacional del peso de los vellones esquilados
de las llamas del establecimiento, luego de introducir mejoras a nivel productivo.

A partir de esto podemos comparar con el valor histórico y, sin realizar la prueba de hipótesis corres-
pondiente, tomar una decisión al respecto de si la varianza se modificó o no. Para ello, debemos elevar
2 2
al cuadrado el desvío informado, quedando la varianza con un valor: 1,5 = 2,25 (Kg) .

Las hipótesis que se plantean son: H0: σ = 2,25 vs H1: σ ≠ 2,25 . El nivel de significación es del 5%, y
2 2

se utiliza la misma información muestral que la usada en el intervalo.


La región crítica es bilateral, coincidiendo con el tipo de intervalo de confianza, también bilateral (límite
inferior y límite superior).

La pregunta concreta sería: ¿2,25 es un valor cubierto por el intervalo de confianza? Por lo que vemos,
2 2
no es así, dado que el intervalo es [0,1378 (Kg) ; 0,3347 (Kg) ]. A partir de esto tomamos como deci-
sión rechazar la hipótesis nula, al 5%, ya que hay evidencias suficientes para decir que la varianza po-
blacional del peso de los vellones, luego de la esquila, de las llamas del establecimiento en el que se
2
implementaron prácticas de mejoramiento productivo es distinto a 2,25 (Kg) .
A los fines prácticos, esto indica que en este sentido también se observa la mejora, dado que los pesos
tienen menor dispersión, y se logra mayor homogeneidad en ellos.

67
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

PROBLEMAS PROPUESTOS
EJERCICIO 1) Un lote de 25 animales recibe una ración durante un período de 60 días. A partir de las
ganancias de peso por animal, se calcula x = 420 g/día y s = 100 g/día. Al nivel de significación del 5%:
a) ¿es sustentable la hipótesis de que el tratamiento produce una ganancia media de peso mayor a 400
g/día?
b) ¿Cuál es el supuesto teórico que necesita cumplirse para que la prueba anterior sea válida?
c) Responda el punto a) suponiendo que σ = 90 g/día.
EJERCICIO 2) Para estudiar la respuesta de un nuevo método de medición de la concentración de una
sustancia química, se hacen 10 mediciones a una concentración fija. Los resultados son los siguientes:
3,04 3,88 3,53 2,98 3,09
3,38 3,12 3,56 3,71 3,43

Shapiro-Wilks (modificado)
Variable n Media D.E. W* p(una cola)
Concentr 10 3,37 0,31 0,91 0,4330

Considerando que el método anterior tiene varianza σ =1,20, decida si el nuevo método es mejor que el
2

anterior (α=0,05).

Indique:
a) Verificación del supuesto teórico: ................................................................................................................
b) Hipótesis de trabajo: .....................................................................................................................................
c) Hipótesis estadísticas: ..................................................................................................................................
d) Región crítica: ...............................................................................................................................................
e) Población en estudio: ...................................................................................................................................

EJERCICIO 3) Los investigadores desean probar si la proporción de pacientes cuya úlcera sanó después del
tratamiento con cimetidina supera el 50%. Para ello se administra la droga a 66 enfermos y luego de 6
semanas resultaron 43 pacientes curados. Probar la hipótesis de interés (α=0,05).
Indique sólo: variable en estudio, distribución de la misma, región crítica, decisión, interpretación biológica
del nivel de significación de la prueba, parámetro en estudio y su interpretación biológica acorde a la decisión
tomada.

EJERCICIO 4) En un laboratorio se realizaron determinaciones de glucosa en sangre en 11 caninos. Los


valores obtenidos, expresados en mg/dl, son:
63 - 74 - 81 - 92 - 83 - 69 - 82 - 98 - 74 - 80 - 64
A partir de estos valores y suponiendo normalidad, ¿puede sustentar la hipótesis de que el valor de la
desviación estándar poblacional de la glucosa en sangre no supera el valor 9 mg/dl? (α = 0,05).
Indique: variable en estudio, hipótesis estadísticas, regla de decisión, decisión, parámetro en estudio y su
interpretación biológica acorde a la decisión tomada, y respuesta a la pregunta planteada.

EJERCICIO 5) Un profesor de estadística, al final del cuatrimestre, les pregunta a los alumnos si han
asistido a clases de consulta, en dicho cuatrimestre, codificando como 0 (no asistió) y 1 (asistió). Las res-
puestas codificadas reportadas por cada estudiante son las siguientes:
00001000000000101011001010101000
10001000001000100001100000000001
Se solicita:
a) Definir y clasificar la variable
b) Construir una tabla de frecuencias.
c) Si se define una variable que cuenta la cantidad de alumnos que utilizan los horarios de consulta por
comisión:
c.1) ¿Qué distribución tiene dicha variable? Interprete los parámetros.

68
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

c.2) Suponiendo que todas las comisiones tienen cupo de 64 alumnos, y en base a la información an-
terior, ¿cuál es la estimación puntual del parámetro “proporción de alumnos que no utilizan el horario de
consulta”?
c.3) Considerando la distribución de la variable con los valores de los parámetros dados por lo obte-
nido en c.2), se pide calcular la probabilidad de que, entre 20 alumnos elegidos al azar de esta población,
10 de ellos NO usen el horario de consulta.
c.4) Suponiendo que se abre una nueva comisión de sólo 20 alumnos y considerando la misma pro-
porción de éxitos que en el inciso anterior, ¿cuál es la probabilidad de que más de 15 no utilicen el hora-
rio de consulta? ¿cuál es la probabilidad que entre 5 y 15 lo utilicen?
c.5) La Docente “My Plantas” afirma que “al menos el 30% de los alumnos utilizan el horario de con-
sulta”, por lo cual propone no suspenderlo. Al nivel de significación del 5%, ¿qué puede decir de dicha
afirmación?

EJERCICIO 6) Un establecimiento pecuario estaría dispuesto a implementar un sistema de inseminación


artificial a tiempo fijo si mediante el mismo puede garantizarse un porcentaje de preñez que supere el
60% en la primera inseminación. Se realiza un experimento con 25 animales y se obtiene una estimación
del parámetro de interés:
IC90% (0,62; 0,90)
a) Verifique si es válido implementar el sistema de manera tal de poder asegurarle al productor que la
decisión será tomada con una probabilidad de error igual o inferior al 5%.
b) A la luz de estos resultados si se inseminaran 150 animales, ¿cuál sería el número de animales pre-
ñados esperado?

CUESTIONARIO
1) Indique la opción correcta: En una prueba de hipótesis, las hipótesis estadísticas son aseveraciones
acerca de:
a) el parámetro en estudio
b) el estimador del parámetro en estudio
c) la relación entre el estimador y el parámetro en estudio

2) Indique la opción correcta. En una prueba de hipótesis, las hipótesis estadísticas se determinan:
a) a partir de resultados muestrales
b) a partir de un supuesto del investigador formulado antes de tener resultados muestrales
c) a partir de un supuesto del investigador formulado después de tener resultados muestrales

3) Coloque Verdadero o Falso, según corresponda, en las siguientes afirmaciones:


En una prueba de hipótesis
V F a) hay dos decisiones posibles a tomar
V F b) se denomina α al error de tipo I y β al error de tipo II
V F c) la probabilidad de cometer error de tipo I es complementaria de la potencia de la prueba
V F d) la probabilidad de cometer error de tipo I y la probabilidad de cometer error de tipo II son áreas
determinadas debajo de distintas funciones de probabilidad

4) Indique la opción correcta. En una prueba de hipótesis, el nivel de significación (α) es:
a) El error de tipo I
b) La probabilidad del error de tipo I
c) La probabilidad del error de tipo II

5) Complete las siguientes oraciones: En una prueba de hipótesis:


a) Rechazar la hipótesis nula cuando es falsa es una decisión ........................................................ con
probabilidad …….........................................................................................................................................

b) La probabilidad de rechazar la hipótesis nula cuando es verdadera se llama ....…........................... y


se simboliza .............................................................................................................................................

c) Al aumentar el tamaño de la muestra se ……….......................................... la potencia de la prueba.


69
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

Problemas Complementarios
UNIDADES 1, 2 y 3
1.- Para estudiar el efecto teratogénico de los aminoglucósidos se emplearon 15 ratas preñadas. Por
estudios anteriores se conoce que el 5% de los casos tratados tiene crías con alteraciones neurológicas.
a) Definir la variable en estudio.
b) ¿Verifica la variable las condiciones de Binomialidad?
c) Calcular la probabilidad de que en dicho lote haya 7 ratas con alteraciones en sus crías.
d) Calcular la probabilidad de que en dicho lote haya más de 4 con alteraciones en sus crías.
e) Calcular la probabilidad de que en dicho lote haya 12 ratas sin alteraciones en las crías.
f) Calcular la E(X)

2.- Se tienen dos jaulas con conejos, la primera con 2 blancos y 4 grises, y la segunda con 5 blancos. Se
selecciona un conejo de la primera jaula al azar y se lo coloca en la segunda. Luego se selecciona un conejo
de la segunda jaula. ¿Cuál es la probabilidad de que el conejo de la segunda jaula sea blanco si:
a) el primero fue gris?
b) el primero fue blanco?

3.- Se desea probar el efecto letal de una toxina, que se inyecta a huevos embrionados. Luego del período
considerado suficiente para obtener el efecto tóxico, se hace el recuento de embriones muertos por cada
bandeja de la incubadora: 8 7 7 5 9 10 12 8 6 12 6 5 10 9 5 11 15 8
10 6 8 12 10 6 8 15 7 11 12 5 6 7 9 5 9 10
a) Indicar y clasificar la variable en estudio.
b) La unidad de observación es .................................................................
c) Ordenar los datos en una tabla de distribución de frecuencias.
d) Interpretar f4 , h2 , F3 , H6.
e) Construir los gráficos correspondientes.
f) Calcular las medidas de tendencia central y de dispersión.
g) Interprete el Boxplot correspondiente a los datos de esta muestra.
h) A partir de la información del punto anterior clasifique la distribución de la variable con respecto a la
simetría.
16

15

14

13
Embriones muertos

12

11

10

4.- a.- Clasificar las siguientes distribuciones según sean simétricas o no.

Gráf. A: ........................................... Gráf. B: ................................................

70
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

Gráf. C: ........................................... Gráf. D: ................................................


b.- A cada histograma le corresponde un gráfico de caja. De acuerdo a la observación que usted realiza,
¿cuáles son los pares de gráficos correspondientes?
...................................................................................................................................

..............................................................................................................................

5.- Un especialista en ictiología tropical está interesado en calcular cuánto tiempo puede vivir cierto tipo de
pez en aguas con determinado porcentaje de toxicidad. Luego de una larga serie de experimentos llega a
concluir que la vida media de este tipo de pez alcanza los 90 días, con una desviación estándar de 20 días.
En apariencia, la distribución de los días sobrevividos es normal.
a) ¿Cuál es la probabilidad de que un pez viva más de 120 días?
b) ¿Cuál es la probabilidad de que un pez viva entre 90 y 125 días?
c) ¿Cuál es la probabilidad de que un pez viva menos que la media de vida?
d) Sin utilizar tabla, ¿entre qué valores de la variable quedan el 68% de los valores centrales?
6.- El 60% de los bovinos de un establecimiento está parasitado con Fasciola hepatica. Al revisar una
muestra de 12 animales,
a) Definir la variable en estudio.
b) ¿Verifica la variable las condiciones de Binomialidad?
c) ¿Cuál es la probabilidad de encontrar a lo sumo 8 parasitados?
d) ¿Cuál es la probabilidad de encontrar 10 que no estén parasitados?
e) ¿Cuál es la probabilidad de encontrar 8 animales parasitados?
f) ¿Cuál es la probabilidad de encontrar por lo menos 8 animales parasitados?
g) Calcular la E(X)
7.- El Servicio de Sanidad Ambiental luego de realizar tareas de desinfección y desratización en el área
vecina a una nueva autopista, hizo el recuento de ratas muertas por manzana, en parte del área afectada:
20 15 30 18 15 18 21 27 19 12 19 18 26
18 19 18 19 21 19 19 20 20 20 26 15
a) Definir y clasificar la variable en estudio.
b) Clasifique como Verdadera o Falsa la siguiente oración: “La unidad de observación es una rata.”
Justifique su respuesta.
c) Ordenar los datos en una tabla de distribución de frecuencias.
d) Interpretar f5 , H2.
e) Construir los gráficos correspondientes.
f) Calcular las medidas de tendencia central y de dispersión.
g) Interprete el Boxplot correspondiente a los datos de esta muestra.
h) En base a la información de los puntos e) y f), clasifique la distribución de la variable con respecto a la
simetría.

71
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

31

26

Ratas muertas
21

16

11

8.- Al estudiar la influencia de la dieta en el contenido de hemoglobina en sangre, se tomaron tres grupos
de animales y se alimentaron con tres raciones distintas. Si se supone que las dietas tienen distinto
comportamiento en cuanto a la variabilidad del contenido de hemoglobina, ¿qué medida recomendaría para
determinar:
a.- la dieta que presenta mayor variación absoluta en el contenido de hemoglobina en sangre?
.......................................................................................................................
b.- la dieta que presenta mayor variación relativa en el contenido de hemoglobina en sangre?
.......................................................................................................................
Justificar la respuesta.
9.- En una población de animales, la presión sistólica en reposo se distribuye normalmente con µ = 115
mm de Hg y σ = 225 (mm de Hg) . Hallar la probabilidad de que un animal de esta población tenga:
2 2

a) presión sistólica inferior a 140 mm de Hg.


b) presión sistólica entre 110 y 120 mm de Hg.
c) la presión sistólica por debajo de la cual está el 99% de la población.

10.- Un conjunto de vacas está constituido por 2 razas R1 R1 R2 TOTAL


y R2, clasificadas según estén o no vacunadas, V y NV.
V 80 200 280
NV 120 0 120
Se selecciona un animal al azar. Calcular la probabilidad de
que:
a) esté vacunado. c) sea de R2 sabiendo que está vacunado
b) esté vacunado y sea de R2. d) esté vacunado o sea de R2.
11.- Se comprobó que en un establecimiento de cría el 5% de los lechones que nacen son hermafroditas.
Si se extraen 12 animales al azar,
a) Definir la variable en estudio: ...................................................................................
..............................................................................................................................
b) ¿Verifica la variable las condiciones de Binomialidad? ¿Por qué? ...................................
..............................................................................................................................
..............................................................................................................................
..............................................................................................................................
..............................................................................................................................
c) Calcular la probabilidad de que se encuentren 2 animales normales.
Planteo Reemplazo numérico Resultado

72
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

d) Calcular la probabilidad de que se encuentren a lo sumo 3 normales


Planteo Reemplazo numérico Resultado

e) Calcular la probabilidad de que se encuentren por lo menos 4 hermafroditas.


Planteo Reemplazo numérico Resultado

f) Calcular la E(X) y laV(X)


Planteo Reemplazo numérico Resultado

12.- El 10% de los animales de un establecimiento pecuario dedicado a la cría de Aberdeen Angus no está
vacunado contra fiebre aftosa. Si se revisa un lote de 15 animales elegidos al azar,
a) Definir la variable en estudio.
b) ¿Verifica la variable las condiciones de Binomialidad?
c) Calcular la probabilidad de que ninguno de los animales esté vacunado.
d) Calcular la probabilidad de que, como máximo, el 20% no esté vacunado,
e) Calcular la probabilidad de que, como mínimo, 7 animales no estén vacunados,
f) Calcular la probabilidad de que haya entre un 40% y un 80% de animales vacunados.
g) Si se envían 200 animales al frigorífico, ¿cuál es la cantidad esperada de no vacunados?
13.- Se comprobó que cabras nacidas de cruzamientos consanguíneos presentan un 30% de prognatismo
superior y la consecuente muerte del animal por imposibilidad de succionar en forma normal. Para 10
hembras preñadas en esas condiciones,
a) Definir la variable en estudio.
b) ¿Verifica la variable las condiciones de Binomialidad?
c) ¿Qué probabilidad hay de que 5 tengan sus crías normales?
d) ¿Qué probabilidad hay de que 4 tengan sus crías no normales?
e) ¿Qué probabilidad hay de que entre 5 y 7 tengan sus crías normales?
14.- Si el número de casos favorables al suceso A es 40 y el número de casos favorables al suceso no A
es 80, entonces la probabilidad de ocurrencia del suceso A, será (Seleccione la respuesta correcta y
argumente brevemente):
a) p(A) = 0,50 c) p (A) = 0,33
b) p(A) = 0,67 d) p (A) = 0,05
15.- Calcular la probabilidad que corresponde al área comprendida entre los siguientes valores tabulares y
representarla gráficamente:
a) Zα = -1,96 y Zα = 2,20
b) t20 = -1,725 y t20 = 2,845
c) χ 302 = 16,79 y χ 302 = 50,89

16.- La edad en meses en que aparece la parvovirosis tiene distribución normal, siendo la media de 5,5,
con un desvío estándar de 2 meses. Al recibir en consulta un perro enfermo, ¿cuál es la probabilidad de que
tenga:
a) entre 2 y 7,5 meses?
b) más de 4 meses?
c) menos de año?
17.- La probabilidad de que Juan Sonrisa se levante malhumorado, en la semana, es 0,1 y cada vez que
comienza un nuevo día es independiente de lo que haya sucedido el día anterior.

73
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

a) Definir la variable en estudio.


b) ¿Verifica la variable las condiciones de Binomialidad?
c) ¿Cuál es la probabilidad de que 2 días de la semana se levante malhumorado?
d) ¿Cuál es la probabilidad de que más de la mitad de la semana se levante malhumorado?
e) Calcular la E(X)
18.- Considerando que la variable aleatoria t tiene distribución de Student con 25 grados de libertad,
a.- Calcular la probabilidad de que:
a.1.- t sea mayor que 2,48
a.2.- t esté comprendido entre -1,32 y 1,71
b.- Hallar el valor tp, tal que deje el 95% de los valores por debajo de él.
2
19.- Sea la variable aleatoria z, definida en el intervalo (0,1), con una función de densidad: f(z) = 3/2 (1 - z
), y función de distribución:
0 para z ≤ 0
 1
F( Z) =  (3z − z3 ) para 0 < z < 1
2
 1 para z ≥ 1
Calcular:
a) P (z ≤ 0,8) d) P (z > 1/2)
b) P (0,5 < z < 1) e) P (z ≤ 0)
c) P (z > 1,5)
20.- En una fábrica de lámparas UV se realiza el control de las partidas antes de que salgan a la venta.
Uno de los controles corresponde a la duración, medida en horas. Un día en particular llegan al laboratorio 25
de ellas, obteniéndose los siguientes resultados:
Duración (hs) fi hi
170 - 180 3/25
180 - 190 4/25
190 - 200 8/25
200 - 210 6/25
210 - 220 4/25
a) Definir la variable y clasificarla.
b) La unidad de observación es ................................................................................
c) Completar la distribución de frecuencias y graficar hi y Fi.
d) El “8” de la columna de fi significa que se observaron:
a. 8 lámparas de luz UV con una duración de hasta 200 horas.
b. Hasta 8 lámparas de luz UV con una duración entre 190 hasta 200 horas.
c. 8 lámparas de luz UV con una duración entre 190 hasta 200 horas.
e) Calcular la media, la varianza y el C.V.
f) Determinar los intervalos mediana y modal.
g) ¿Cuál es el porcentaje de lámparas con una duración menor a 200 hs?
h) La distribución de la variable es ................................................................ ¿Por qué?
............................................................................................................................
i) En la última semana el proceso de manufactura sufrió modificaciones que llevarían a un aumento en
el 10% de la duración de las lámparas.
i.1.- ¿Qué valor numérico tiene la media luego de la modificación?
Fórmula empleada para calcular la media Resultado

i.2.- ¿Qué valor numérico tiene la varianza luego de la modificación?


Fórmula empleada para calcular la varianza Resultado

74
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

21.- Sea X una variable aleatoria que representa el nivel normal de glucosa en sangre. Se supone que esa
variable X tiene una distribución aproximadamente normal, con media µ = 95mg/100ml y desviación estándar
σ = 6mg/100ml. ¿Para qué nivel de glucosa en sangre se puede tener un 90% de probabilidad de encontrar
un individuo que lo supere?
22.- Se comprobó que el 20% de los perros adultos que llegan a consulta por motivos diversos, dan
respuesta positiva al análisis de materia fecal, sin presentar síntomas clínicos de parasitosis. Calcular, sobre
una muestra de 14 animales atendidos en forma sucesiva durante una jornada,
a) Definir la variable en estudio.
b) ¿Verifica la variable las condiciones de Binomialidad?
c) Calcular la probabilidad de hallar como máximo 7 animales parasitados.
d) Calcular la probabilidad de hallar exactamente 5 animales parasitados.
e) Calcular la probabilidad de hallar que 10 o más no estén parasitados.
23.- Un camión jaula que transporta 10 Shorthorn, 5 Polled Hereford, y 7 Aberdeen Angus para participar
en la Exposición Rural de Palermo, sufre un accidente y queda tumbado en la ruta. Se escapan 2 animales.
Calcular la probabilidad de que:
a) sean de la misma raza,
b) uno de ellos sea Polled Hereford,
c) sean de dos razas distintas.
24.- Un experimentador suministró a un grupo de ovejas una hierba tóxica. Se sabe que el tiempo (en hs.)
2
que transcurre desde la ingestión hasta su muerte se distribuye aproximadamente N(µ=15;σ =2). ¿Cuánto
tiempo transcurrió hasta que murió el 90% de la ovejas?
25.- Sea la función de densidad: f(x) = 2 (x - 3), en [ 3 , 4 ] y
0 para x < 3
 2
Encontrar: F( X) =  x − 6x + 9 para 3 ≤ x ≤ 4
a) P(x ≤ 3,5) e) P(3 < x < 3,5) 1
 para x > 4
b) P(x > 3,5) f) P(3,8 < x < 4)
c) P(x < 3) g) F(X) es la función de............
d) P(x < 5)

26.- Un criadero industrial de conejos obtiene individuos de raza Neocelandés con un peso que se
distribuye normalmente con media igual a 2020 g y desvío estándar de 78 g.
a.- ¿Cuál es la probabilidad de que el promedio de peso de los animales de una muestra de 20 supere los 2
kg?
b.- Si se desea mantener como futuros reproductores a los de peso mayor a 2150 g, ¿Cuál es la
probabilidad de que un individuo supere los 2150 g?
27.- Un veterinario sospecha que una nueva hierba introducida en la región donde él se desempeña
produce toxicidad en ovinos. En la primera parte del estudio decide alimentar a un grupo de ovinos con fardo
más el agregado de cierta cantidad de la hierba, para medir el
tiempo que transcurre desde la ingestión hasta la muerte (en Intervalos Frecuencias
días). Al terminar el experimento obtiene la siguiente tabla: 7 - 10 2
10 - 13 4
a) ¿Cuál es la variable en estudio? Clasificarla. 13 - 16 3
b) Calcular: media, mediana, modo y C.V. 16 - 19 6
c) El “9/15” de la columna de Hi significa que se observaron:
a. De los 15 ovinos, hasta 9 murieron entre las 13 y las 16 horas de haber ingerido el fardo y la hierba
tóxica.
b. De los 15 ovinos, 9 murieron entre las 13 y las 16 horas de haber ingerido el fardo y la hierba
tóxica.
c. De los 15 ovinos, 9 murieron entre las 7 y las 16 horas de haber ingerido el fardo y la hierba tóxica.
d) El veterinario aplica los conocimientos de fisiología ruminal, por lo que decide cambiar el fardo por
una pastura verde, lo que aumentaría en 45% el tiempo que transcurre desde la ingestión hasta la muerte de
los ovinos.
d.1.- ¿Cuál es el valor numérico de la media?

75
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

Fórmula empleada Reemplazo numérico Resultado

d.2.- ¿Cuál es el valor numérico del desvío estándar?


Fórmula empleada Reemplazo numérico Resultado

Sea la función de densidad: f(x) = 3x – 12x + 12 para 1< x ≤ 2, con función de distribución
2
28.-
0 para x ≤ 1

F ( x ) =  x 3 − 6 x 2 + 12 x − 7 para 1 < x ≤ 2
1 para x > 2

Calcular:
a) P ( 1 ≤ x < 2 ) d) P ( 0 ≤ x ≤ 1,5 )
b) P ( x > 1,5 ) e) P ( 1,5 ≤ x < 3 )
c) P ( x ≤ 1,75 )
29.- En un lote de 20 animales hay 10 normales, 6 con defectos importantes y 4 con defectos leves. Se
escoge uno al azar. Calcular la probabilidad de que sea:
a) sin defectos;
b) sin defectos o con defectos leves.
Suponga que se escoge un segundo animal sin reposición del primero, calcular la probabilidad de que sea:
c) normal, pero sabiendo que el primero escogido fue normal;
d) con defectos importantes, sabiendo que el primero fue con defectos leves.
30.- Encontrar los valores de la variable en la distribución Ji-cuadrado que satisfagan:
a) P( χ15; p1 ≤ χ15 ≤ χ15;
2 2 2
p
2
) = 0,95 y área equivalente en las colas.

b) P( χ ≤ χ
2 2
18 18; p ) = 0,025

c) P( χ ≥χ
2 2
46 46; p ) = 0,95

31.- Los siguientes datos corresponden al dosaje de urea, en mg%, obtenidos en 25 perros sometidos a
pruebas renales en el período operatorio.
[ ; ) 16,5 – 21,9 21,9 – 27,3 27,3 – 32,7 32,7 – 38,1 38,1 – 43,5
Fi 2 6 12 21 25
a) Definir la variable en estudio y clasificarla.
b) La unidad de observación es ....................................................................
c) Completar la tabla de frecuencias.
d) Realizar los gráficos correspondientes.
e) Calcular medidas de posición.
f) Calcular medidas de dispersión.
g) Indicar cuál o cuales son las medidas más representativas. ¿Por qué?
h) ¿Qué porcentaje de perros tienen menos de 27,3 mg% de urea? NO UTILIZAR REGLA DE TRES
SIMPLE!
32.- Si X es una variable aleatoria discreta, tal que:
xi 0 1 2 3 4
p(xi) 0,1 0,15 0,35 0,25 ....

a) Completar el valor faltante. e) F(xi) es la función de.................


b) Calcular la F(xi) f) Graficar p(xi) y F(xi)
c) p(xi) es la función de................ g) Hallar E(X).
d) Determinar P(X ≥ 2 ).
33.- Se arrojaron mil veces cinco monedas equilibradas, y en cada tirada se contó el número de caras. En
base a los resultados obtenidos se construyó la siguiente tabla:

76
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

Núm. de caras 0 1 2 3 4 5
hi 0,038 0,144 0,342 0,287 0,164 …….
a) Definir y clasificar la variable considerada.
b) Completar el dato faltante en la tabla.
c) Hallar la función de distribución acumulada.
d) ¿En cuántas tiradas se obtuvieron más de dos caras?
e) Calcular el valor esperado del número de caras en una tirada.
34.- Se detallan a continuación los pesos de 30 pollos, luego de la aplicación de una nueva formulación de
una dieta comercial, elegidos al azar, expresados en Kg.
[ ; ) 1,3 – 1,9 1,9 – 2,5 2,5 – 3,1 3,1 – 3,7 3,7 – 4,3
hi 3/30 8/30 6/30 6/30 7/30
a) Completar la tabla de frecuencias.
b) Realizar los gráficos de frecuencias absolutas.
c) Calcular la media, la mediana y el modo. ¿Cómo clasifica la distribución de la variable?
d) Calcular el coeficiente de variación.
e) En el establecimiento informan que la balanza no estaba calibrada, por lo que los datos deben
aumentarse 0,5 Kg. ¿Cuánto vale la media del peso de los pollos al hacer esta modificación?
Fórmula empleada Reemplazo numérico Resultado

35.- Suponiendo que la altura de los estudiantes de un colegio se distribuye normalmente, con media 1,75
m y desvío estándar 0,25 m.
a.- Calcular la probabilidad de que el promedio de altura, para una muestra de 36 individuos, sea: a.1.-
mayor que 1,67 m, a.2.- entre 1,65 y 1,80 m.
b.- Cuántos individuos de la muestra se espera que tengan:
b.1.- altura mayor a 1,85 m, b.2.- entre 1,65 y 180 m.

36.- Complete las celdas faltantes asumiendo que:


a.- A y B son independientes b.- A y B son mutuamente excluyentes
p(A) p (B) p (A∪B) p (A∩B) p(A) p (B) p (A∪B) p (A∩B)
0,60 0,20 0,60 0,20

c.- A intersección B tiene probabilidad 0,15

p(A) p (B) p (A∪B) p (A∩B)


0,60 0,20

37.- En un estudio sobre tumores benignos y malignos en felinos se analizaron todos los casos que se
presentaron en el último año en el Hospital Escuela de la Facultad resultando:
Suponga que se seleccionan 2 felinos del grupo antes Estado de malignidad
citado para realizar ciertos estudios. benigno maligno
Lugar Cabeza 64 45
del Cara 21 18
¿Cuál es la probabilidad de que: Tumor Cuerpo 36 24
a.- ambos tengan tumores malignos?
Planteo simbólico Sustitución de valores Resultado

77
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

b.- el segundo tenga tumor maligno sabiendo que el primero tiene tumor benigno
Planteo simbólico Sustitución de valores Resultado

c.- uno tenga el tumor en la cabeza y el otro en la cara.


Planteo simbólico Sustitución de valores Resultado

d.- el primero tenga un tumor benigno en la cara y el segundo un tumor maligno en el cuerpo.
Planteo simbólico Sustitución de valores Resultado

38.- Un criador de perros presenta tres de sus mejores perros en una competencia. Sean los eventos:
A1: el perro 1 está entre los tres primeros
A2: el perro 2 está entre los tres primeros
A3: el perro 3 está entre los tres primeros
Suponga que los eventos son independientes y que p(A1) = p (A2) = p (A3)= 0,1
Encuentre la probabilidad de que:
a) ninguno esté entre los tres primeros
b) por lo menos 1 esté entre los tres primeros
c) por lo menos 2 estén entre los tres primeros
d) todos estén entre los tres primeros

39.- Al personal técnico y profesional de un hospital se lo clasificó según la tarea que realiza y la edad,
obteniéndose la siguiente tabla:

Edad
Hasta 25 Desde 26 a 35 Mayor a 35 total
Médicos 0 70 120 190
Enfermeros 145 520 195 860
Tarea
Laboratoristas 65 42 33 140
Otras 35 260 15 310
Total 245 892 363 1500
a.- Del personal del hospital se elige una persona al azar. Aplicar la teoría clásica de probabilidades para
hallar la probabilidad de que:
a.1.- sea médico y tenga más de 35 años
a.2.- tenga más de 35 años
a.3.- sea médico sabiendo que tiene más de 35 años
b.- ¿Los sucesos “ser médico” y “tener más de 35 años” son independientes? ¿Por qué?
40.- Investigadores que han conducido un estudio de habitación en una cierta ciudad, examinan todas las
casas ubicadas en manzanas seleccionadas aleatoriamente. ¿Constituye esto una muestra simple aleatoria
de las casas de la ciudad?
41.- Para analizar el estado civil de los habitantes de una gran ciudad se tomó un grupo de 500 familias e
individuos solteros. ¿Le parece correcto seleccionar a esas 500 familias e individuos solteros, sólo de la zona
residencial de la ciudad? ¿Por qué?

78
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

UNIDADES 4 y 5
1.- Se toma una muestra de 25 cerdos en un núcleo de selección. A cada uno se le mide el volumen del
eyaculado, y con los datos se obtuvieron: x = 180 ml y s = 50 ml . Estimar la media y la varianza pobla-
2 2

cional mediante intervalos de confianza del 95%, sabiendo que la variable tiene distribución normal.

2.- En un cultivo de mejillón a mar abierto, se eligieron al azar 25 mejillones y se los pesó individualmente.
Esta variable, peso, tiene distribución aproximadamente normal. El peso medio fue de 16 g, y el desvío
estándar de 5 g. Con una confianza del 95%:
a.- Indicar la estimación puntual del peso medio de la población cultivada y con una confianza del 95%.
b.- Calcular el número de individuos necesarios para estimar el peso medio poblacional con un margen de
error de 1,5 g y con una confianza del 95%.
3.- Se tomó una muestra de 16 quesos de la producción del mes de agosto en el establecimiento CRUP SA,
con el objetivo de estimar el peso medio. Los quesos fueron pesados individualmente, y con los datos
obtenidos se estimó el peso medio en 15 kg y el CV en 10%. Suponga que la variable se distribuye
aproximadamente normal.
a) Definir la variable en estudio y la población de interés.
b) Indicar la variable aleatoria empleada como pivotal expresando su distribución.
c) Indicar los valores tabulares empleados para el LI y el LS.
d) Estimar el peso medio poblacional mediante un intervalo de confianza del 95% y concluir.
4.- Con datos de una muestra de 25 pollos se estimó la varianza poblacional del peso individual de pollos,
2 2
obteniéndose el siguiente intervalo de confianza del 95%: (0,2342 g ; 0,7432 g ). ¿Cuál es el valor de la
estimación de la varianza?
5.- Se desea estimar la varianza del peso individual en una línea de conejos para carne con un coeficiente
de confianza del 95%. A partir de una muestra de 30 conejos se obtuvo una media de 2,40 kg y un desvío
estándar de 0,37 kg.
a.- Estimar la varianza poblacional del peso individual mediante un intervalo de confianza del 95% y concluir.
b.- Indicar la variable aleatoria empleada como pivotal expresando su distribución.
c.- Indicar los valores tabulares empleados para el LI y el LS.
d.- Definir la variable en estudio y la población de interés.
6.- En una muestra de 31 adolescentes que se prestaron como sujetos para un estudio inmunológico, una
variable de interés fue la prueba del diámetro de reacción de la piel a un antígeno. La media y la desviación
estándar obtenidas fueron, respectivamente, 21 y 11mm. ¿Es posible concluir a partir de estos datos y con
un nivel del 5%, que la media de la población es menor que 30mm?
Indique sólo: variable en estudio, supuesto de distribución requerido para ésta, hipótesis de trabajo, hipó-
tesis estadísticas, región crítica y población en estudio.
7.- En la estimación de la media poblacional de una variable con distribución normal, mediante un intervalo
de confianza del 95% se obtuvieron los siguientes límites: LI = 450 y LS = 550. Si dichos valores se
calcularon con una muestra de 30 elementos, determinar el valor de la media y de la varianza utilizados para
determinar dicho intervalo si σ es desconocida.
2

8.- Se tomó una muestra aleatoria de 16 informes de urgencias de los archivos de un servicio de
ambulancias. De ella se obtuvo que el tiempo medio en que las ambulancias llegaban a destino era de 13
minutos. Suponiendo que los tiempos de llegada de las ambulancias siguen una distribución normal con
2
varianza 9min , ¿es posible concluir, a un nivel del 5%, que la media de la población es mayor a 10 min?
Indique sólo: variable en estudio, hipótesis estadísticas, regla de decisión, decisión e interpretación
biológica del parámetro en estudio acorde a la decisión tomada.
9.- Un establecimiento avícola cuenta con 5000 gallinas ponedoras. A los fines de la organización, se desea
saber qué tamaño de muestra será necesario para estimar la media poblacional de huevos puestos por
semana, con un nivel de confianza del 95%, si se desea admitir un error no mayor a 0,8 huevos. En un
estudio previo se analizaron 28 gallinas y se obtuvo un promedio individual de 5,4 huevos por semana con
una desviación estándar de 1,8 huevos por semana. Suponiendo que la variable se distribuye noemalmente:
a.- Definir la variable en estudio.
b.- Hallar el tamaño de muestra necesario para satisfacer el nivel de confianza y el error a tolerar.
10.- Se supone que el nivel de proteínas totales en plasma de bovinos adultos se distribuye
aproximadamente normal. ¿Qué tamaño de muestra se tomará si se desea estimar el nivel medio de

79
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

proteínas totales, mediante un intervalo de confianza del 95%; con una semiamplitud de 0,7 g/ml; sabiendo
que en una muestra piloto de 10 bovinos, es obtuvo x = 9,7 g/ml y s = 1,303 g/ml?
11.- En una muestra aleatoria de 60 ovejas de una zona de la provincia de Santa Cruz, el 20% manifiesta
signos de "cabeza grande". ¿Cuál sería el margen de error de una estimación del 95% para la proporción de
ovejas con esta característica?
12.- Si en el ejercicio 1 (pág. 42) se deseara disminuir un 50% el margen de error en la estimación de µ
manteniendo el nivel de confianza:
a) ¿Cuál debería ser el tamaño de la muestra?
b) ¿Cuál sería el tamaño adecuado si Ud. sabe que el núcleo de selección cuenta con una población de 450
machos?
13.- Se compraron lechones para engorde en condiciones de crianza intensiva. Por compras anteriores,
2
se sabe que la varianza del peso es de 3600 g . ¿Cuántos lechones habría que tomar en una muestra
para estimar el peso promedio del lote con una confianza del 95% y un error no mayor a 20 g? Suponga
que la variable se distribuye aproximadamente normal.
14.- En un criadero industrial de conejos de Angora, se quiere saber con qué probabilidad el largo
promedio del pelo es de a lo sumo 5 cm, en muestras de tamaño 30.
Si bien se desconoce la distribución del largo del pelo de un conejo de Angora, se sabe que tiene un
promedio de 4,5 cm y un desvío de 2 cm. Justifique el procedimiento empleado.
15.- Los siguientes datos son los consumos de oxígeno (en ml) durante la incubación, de una muestra de
15 suspensiones celulares:
14,0 14,1 14,5 13,2 11,2 14,0 14,1 12,2
11,1 13,7 13,2 16,0 12,8 14,4 12,9
¿Proporcionan estos datos suficiente evidencia, a un nivel del 5%, de que la media de la población es de
al menos 12ml?
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
ConsumoOx 15 13,43 1,28 0,95 0,6693
Indique: verificación del supuesto requerido a la variable, hipótesis estadísticas, región crítica, regla de
decisión, decisión y población en estudio.
16.- Un grupo de 31 animales, elegidos al azar, recibe una ración por un período de dos semanas. Con los
aumentos de peso se obtuvo: x = 420g y s = 60g. ¿Qué tamaño de muestra se debe tomar si se desea un
margen de error que sea a lo sumo de 10g, para estimar el aumento medio de peso con una confianza de
95%?
17.- En una granja de pollos se desea experimentar con una nueva dieta de engorde. Si se sabe que el
desvío estándar del aumento de peso individual en un mes es igual a 60 g, ¿qué tamaño de muestra se debe
escoger para que la estimación del aumento medio de peso no contenga un margen de error mayor a 16 g,
con una confianza del 95%? Suponga que la variable se distribuye aproximadamente normal.
18.- De una población de vacas lecheras se obtiene una muestra de 1000 vacas que se someten a la
prueba de tuberculina en la tabla del cuello, resultando 90 vacas con resultado positivo. ¿Concuerda esta
información con la hipótesis de que la proporción (P) de positivos es 10% con un nivel de significación del
5%?
19.- De una población de bovinos se seleccionó una muestra de 25. Sesenta días después de vacunados
contra la fiebre aftosa, fueron sangrados y se determinó el título de anticuerpos contra esta enfermedad
mediante la técnica de seroneutralización en tubos (cultivo celular), obteniéndose una media de 2,3 y una
varianza de 0,64. ¿Confirman estos valores que el título promedio de anticuerpos poblacionales es de 2,5?
Suponga que la variable se distribuye aproximadamente normal y que α = 0,05.
20.- Por una experiencia se ha determinado que los valores de capacidad de cierto tipo de ampollas para
envasar vacunas sigue una distribución normal con media 10ml y desviación estándar 0,1 ml. Luego de dos
años de uso continuo, se toma una muestra de 25 ampollas, obteniéndose una media de 9 ml y una
desviación estándar de 0,2 ml. ¿Puede considerarse, con un nivel de significación del 5%, que se mantiene
la variabilidad luego de 2 años?
21.- Se ha establecido que la media y la desviación estándar de la longitud del cráneo humano son de
20,5cm y 3,3cm, respectivamente. Suponga que un explorador descubre una isla, en donde los nativos han
80
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

estado aislados del resto del mundo. Una muestra de 25 de estos nativos indica una longitud media del
cráneo de 24,6cm. ¿Tienen los investigadores suficiente evidencia para suponer que la longitud media del
cráneo de los habitantes de la isla es superior? Use α = 0,05 y suponga que la variable se distribuye
aproximadamente normal.

22.- Se estudió el tiempo al primer amamantamiento en 16 cerdos recién nacidos, obteniéndose los
siguientes resultados(en minutos):
7,8 8,0 9,0 10,0 10,9 8,5 9,5 7,0
6,3 8,7 9,1 10,3 9,3 9,7 9,9 9,8

Σ x i = 143,8 Σ x 2i = 1315,06
¿Concuerdan estos resultados con la afirmación de que la desviación estándar del tiempo al primer
amamantamiento es mayor a 1,1 min, con un nivel de significación del 5%?
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Tiempo 16 8,99 1,23 0,95 0,6655

23.- Por razones económicas sólo se continuará fabricando determinado medicamento si es utilizado por
más del 25% de los establecimientos hospitalarios. Para esto se realizó un estudio sobre 150
establecimientos de los que 40 respondieron que lo usaban. ¿Qué aconsejaría al fabricante, al nivel del 5%?
24.- La longitud de la antena de una población de insectos de la especie X se distribuye normalmente con
media 3,2 cm y desvío estándar 1,8 cm. De una muestra aleatoria de 16 insectos tomados de la población se
obtuvo un promedio de 2,3 cm para la longitud de antena. ¿Puede suponerse, con un nivel de significación
del 5%, que hubo una disminución en la longitud promedio de la antena?
25.- En una muestra de 50 pollitos tratados con una vacuna, se encontraron 10 muertos, ¿cuál es el
número adecuado de pollitos para estimar la proporción de muertos con un error de hasta 10% y una
confianza del 95%?
26.- Al estimar el parámetro poblacional µ, con un nivel de confianza del 95% y una muestra de tamaño 20,
se tienen las siguientes alternativas:
s x
A 10 100
B 11 110
C 9 90
¿En cuál de ellas se tendrá un mayor margen de error en la estimación? Considere que provienen de
variables con distribución normal. Demuestre su respuesta.
27.- Se realizó un estudio para analizar la efectividad de un nuevo medicamento sobre cierta anomalía en
embriones de pollo. Se inyectaron 50 huevos fertilizados y en el vigésimo día de incubación se observó que
12 de ellos presentaban anomalía.
a.- Estimar la proporción poblacional de embriones sanos mediante un intervalo de confianza del 95%.
b.- ¿Qué cantidad de huevos habría que haber inyectado para que, con un nivel de confianza del 95%, se
pudiera estimar la proporción poblacional de embriones sanos de modo que el margen de error no sea mayor
que 0,1?
28.- Un laboratorio investiga sobre el consumo diario de aves en crecimiento. Con tal motivo se desea
determinar el tamaño de la muestra a tomar para que la semiamplitud de la estimación del consumo medio
diario no supere 5 g, suponiendo que se decide trabajar con una confianza del 95% y que en una muestra
2
piloto de 30 aves se obtuvo un promedio de 100 g y una varianza de 490 g .
29.- Se examinó una muestra de 100 empleados de un hospital que habían estado en contacto con sangre
o sus derivados, para averiguar si presentaban evidencia serológica de hepatitis B. Se encontró que en 23 de
ellos se obtuvieron resultados positivos. ¿Es posible concluir a partir de estos datos que la proporción de
individuos que presentaron resultados positivos es a lo sumo del 15%? (α=0.01)
Indique: variable en estudio, supuesto de distribución requerido para ésta, hipótesis de trabajo, hipótesis
estadísticas, región crítica, decisión, interpretación biológica del parámetro en estudio acorde a la decisión
tomada y población.
30.- Como parte de un proyecto de investigación, se seleccionó una muestra de 25 niños nacidos en los
hospitales de un área metropolitana. La desviación estándar de los pesos de los niños obtenida fue de

81
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)

150 g. ¿Proporcionan estos datos la evidencia suficiente para afirmar que el desvío poblacional es
superior a 100g? Suponga que la variable se distribuye aproximadamente normal y que α = 0,05.
Indique: variable en estudio, hipótesis estadísticas, región crítica, decisión, interpretación biológica del
parámetro en estudio acorde a la decisión tomada y respuesta a la pregunta planteada.
31.- Un establecimiento dedicado a la elaboración de alimentos balanceados para aves, afirma que su
producto, si bien aumenta el peso promedio de las aves, no influye en la variabilidad del mismo. En una
muestra de 16 aves que habían consumido el alimento se obtuvo un peso promedio de 85g con una
2
varianza de 225g . ¿Se puede suponer que la afirmación del establecimiento en cuanto a la variabilidad
2
es correcta, teniendo como dato que la varianza del peso de las aves es de 200g ? (α=0.05). Suponiendo
que la variable se distribuye normalmente.
Indique: hipótesis de trabajo, hipótesis estadísticas, región crítica, decisión, interpretación del nivel de
significación y población en estudio.
32.- Antes del inicio de un programa de inmunización contra la rubéola realizado en un área metropolitana,
una encuesta reveló que 150 integrantes de una muestra de 500 niños de primaria habían sido inmunizados
contra esta enfermedad. ¿Son compatibles estos datos con el punto de vista de que el 50% de los niños de
primaria de dicha área habían sido inmunizados contra la rubéola? (α=0,10)
Indique: hipótesis de trabajo, hipótesis estadísticas, región crítica, decisión, interpretación del nivel de
significación y población en estudio.
33.- El espesor de la la cáscara de huevo es una variable aleatoria que, en una determinada raza de
ponedoras, tiene una media de 0,20mm y un desvío estándar de 0,08mm.
a) ¿Cuál es la probabilidad de que el espesor medio sea de al menos 0,18mm si se toma una muestra
de 100 huevos?
b) Indicar la variable en estudio
c) ¿En qué supuestos se basó para resolver el problema?

34.- Se sabe luego de consumir un alimento balanceado, las aves de un establecimiento presentan un
2
peso medio de 85g y una varianza de 225g . En una muestra de 64 aves
a) Hallar la probabilidad de que tengan un peso medio que esté entre 80 y 90g.
b) ¿Cuál es el peso medio que superan el 95% de las aves?

35.- ¿Existe alguna diferencia entre el cálculo de probabilidades de los ejercicios anteriores con
respecto a los resueltos en la Unidad 3 también referidos al promedio? Si su respuesta es afirmativa, ¿en
qué consiste?

82