Está en la página 1de 17

Universidad Tecnológica Nacional

Facultad Regional Avellaneda


Licenciatura en Enseñanza de la Matemática

PROBABILIDAD Y ESTADÍSTICA II

Guía de Ejercitación

Autores:

Mg. María Cristina Kanobel


Lic. Andrea Alvarez
Probabilidad y Estadística II UTN-FRA
LEM

BIBLIOGRAFÍA

EvansM., Rosenthal J, Probabilidad y Estadística, la ciencia de la incertidumbre, Editorial


Reverté.
Miller Irwin R y otros, Probabilidad y estadística para ingenieros, Ed. Prentice Hall
Hispanoamericana, 5° Edición.
Meyer Paul, Probabilidad y aplicaciones estadísticas, Addison Wesley.
Mendenhall, Sincich, Probabilidad y Estadística para Ingeniería y Ciencias, Prentice Hall, 4°
Edición.
Mendenhall, Williams y otros, Estadística matemática con aplicaciones, Grupo Editorial
Sudamericana
Walpole, Myers, Myers, Probabilidad y Estadística para ingenieros, Prentice Hall, 6° Edición.
Wonnacott Thomas H. y otros, Introducción a la estadística, Limusa, México
Zanardi Oílda, Introducción a la teoría de la probabilidad y a la inferencia estadística, UTN
FRA Departamento de publicaciones, 2° edición.

UNIDAD 1: VARIABLES BIDIMENSIONALES - SUMA DE VARIABLES ALEATORIAS


INDEPENDIENTES
Variables aleatorias bidimensionales. Distribuciones de probabilidad conjunta. Distribuciones
marginales. Independencia estadística. Valor esperado y varianza de variables aleatorias
bidimensionales. Covarianza. Coeficiente de correlación. Distribución de la suma de variables
aleatorias independientes normalmente distribuidas. Teorema central del límite.

UNIDAD 2: ESTIMACIÓN DE PARÁMETROS


Población. Muestra. Muestra Aleatoria. Estimadores. Estimación. Estimador puntual de la media
poblacional. Estimadores de la varianza. Propiedades de los estimadores: estimadores eficientes,
consistentes, insesgados. Estimadores máximo verosímiles. Distribución de la media y la proporción
muestral. Estimación de parámetros por intervalos. Intervalos de confianza para la media
poblacional con desvío conocido o desconocido. Intervalos de confianza para la varianza y el desvío
poblacional. Intervalos de confianza para la proporción poblacional.

UNIDAD 3: TESTS DE HIPÓTESIS


Prueba de hipótesis. Hipótesis nula y alternativa. Errores tipo I y II. Nivel de significación de un
test. Potencia de un test. Pruebas para la media y proporción poblacional. Tests a una o dos colas.
Pruebas para las medias de dos poblaciones. Pruebas para el desvío standard de una población.
Test de bondad de ajuste. Pruebas de asociación.

2
Probabilidad y Estadística II UTN-FRA
LEM

UNIDAD 4: REGRESIÓN Y CORRELACIÓN SIMPLE


Modelo de regresión lineal. Condiciones de Aplicación. Estimación de los parámetros del modelo.
Inferencias. Análisis de correlación. Estimación. Inferencias.

3
Probabilidad y Estadística II UTN-FRA
LEM

UNIDAD 1: VARIABLES BIDIMENSIONALES


1. La tabla siguiente representa la distribución de probabilidades conjunta de la
variable aleatoria discreta (X, Y). Calcular todas las distribuciones marginales y
condicionales.

Y / X 1 2 3 4 5
1 0.1 0.1 0.05 0.15 0.1
2 0.05 0.05 0.05 0.15 0
3 0.05 0.05 0 0.1 0

2. Dada la siguiente tabla :

Y / X 0 1 2 3 4 5
0 0 0.01 0.03 0.05 0.07 0.09
1 0.01 0.02 0.04 0.05 0.06 0.08
2 0.01 0.03 005 0.05 0.05 0.06
3 0.01 0.02 0.04 0.06 0.06 0.05

Obtener:
a) las distribuciones de probabilidad marginales.
b) la distribución de probabilidades de X + Y y XY.
c) el valor esperado y varianza de X + Y y de XY.

3. Dada la variable aleatoria bidimensional:

(X,Y) = { (-2,4), (-1,1), (1,1), (2,4)} todos los pares con igual probabilidad 1/4

a) obtener las distribuciones marginales de X y de Y.


b) calcular E(X), E(Y), E(XY).
c) verificar que X e Y no son independientes (existe entre ellas una relación
funcional
sencilla)

4. Si la distribución de probabilidad conjunta de la variable aleatoria bidimensional


(X,Y) viene dada por f(x,y) = (x +y)/30 para x  {0, 1, 2, 3} ; y  {0, 1, 2},
calcule:

a) P( X  2, Y = 1)
b) P( X< 2, Y  1)
c) P( X > Y)
d) P( X + Y = 4)
e) P(Y =1 / X = 2)
f) E(X) y E(Y)
g) E(X + Y) y V(X+Y).

5. Cierto supermercado tiene una caja de atención común y otra caja rápida.
Supongamos que X es el número de clientes que están en espera en la caja
común en un momento particular del día, y que Y es el número de clientes que
están en espera en la caja rápida al mismo tiempo. La distribución de
probabilidades conjunta de (X,Y) se resume en la siguente tabla:

yk
xi 0 1 2 3

4
Probabilidad y Estadística II UTN-FRA
LEM

0 0.08 0.07 0.04 0

1 0.06 0.15 0.05 0.04

2 0.05 0.04 0.1 0.06

3 0 0.03 0.04 0.07

4 0 0.01 0.05 0.06

a) ¿Cuál es la probabilidad de que haya exactamente un cliente en cada línea de


espera?
b) ¿Cuál es la probabilidad de que la cantidad de clientes en cada cola sea la misma?
c) Calcular la probabilidad de que haya por lo menos dos clientes más en una cola de
espera que en la otra.
d) ¿Cuál es la probabilidad de que la cantidad de clientes en ambas colas sea
exactamente 4?
e) Calcular el valor esperado del número de clientes en cada caja.
f) ¿ Son X e Y variables aleatorias independientes?

6. Considere la siguiente distribución de probabilidades conjunta de (X,Y) donde X


es la edad de chicos (en años) e Y sus estaturas en m.

xi
yk 8 9 10 11
1.2 0.1 0.04 0 0

1.25 0.05 0.11 0.2 0

1.3 0 0.1 0.15 0.1

1.35 0 0.05 0.1

Calcule el coeficiente de correlación (X, Y).

7. Para las tablas de distribución conjunta de probabilidades que se muestran a


continuación calcular:
a) E(X), E(Y), E(XY)
b) V(X) y V(Y)
c) Cov(X,Y) y el coeficiente de correlación (X,Y).
d) Analice la independencia de las variables X e Y.

Tabla 1
xi
yk -1 0 1
-1 0 0.1 0
0 0.1 0.6 0.1
1 0 0.1 0

Tabla 2

5
Probabilidad y Estadística II UTN-FRA
LEM

xi
yk -1 0 1
-1 0.2 0 0
0 0 0.6 0
1 0 0 0.2

Tabla 3
xi
yk -1 0 1
-1 0 0 0.2
0 0 0.6 0
1 0.2 0 0

8. La función de densidad de probabilidad conjunta de (X,Y) es:


a ( x  y ) 0  x  3, 0  y  3
f ( x, y )  
0 ( x, y )  (0,3)  (0,3)
Calcular
a) P(1 < X < 2, 1< Y <2)
b) E(X), E(Y)
c) (X) y (Y).

9. Sean X e Y, respectivamente, las proporciones de dos sustancias distintas que se


encuentran en una muestra de una mezcla de reactivos usada como insecticida.
Suponga que la función densidad de la distribución de probabilidades conjunta de
(X,Y) viene dada por:
2 ( x, y )  D  {( x, y ) / 0  x  1, 0  y  1, 0  x  y  1}
f ( x, y )  
0 ( x, y )  D
Calcular:

a) P(X<0.75, Y< 0.75)


b) P(X<0.5 / Y<0.5)
c) Obtener las funciones de densidad de probabilidad marginal de cada variable y
analizar su independencia.

10. Dos componentes electrónicos tienen la siguiente distribución de probabilidades


conjunta para sus tiempos de duración X e Y:

 x e  x (1 y ) x  0, y  0
f ( x, y )  
0 x  0 ó y  0
a) ¿Cual es la probabilidad de que la duración X del primer componente sea mayor
que 3?
b) Obtener las distribuciones marginales de probabilidad de cada variable y analizar
si son independientes.
c) Calcular la covarianza de X e Y.

6
Probabilidad y Estadística II UTN-FRA
LEM

11. Considere dos dispositivos que forman parte de un sistema y sean X e Y sus
tiempos de vida o duración (en miles de horas) hasta que fallen. Si X e Y son
variables aleatorias independientes con distribución exponencial de parámetro :
a) Obtener la distribución de probabilidades conjunta de (X,Y).
b) ¿Cuál es la probabilidad de que cada dispositivo dure a lo sumo 1/ ? (Sug:
considere P(X<1/, Y<1/)).
c) ¿Cuál es la probabilidad de que la duración total (X+Y) sea a lo sumo t miles de
horas?
(Sug: considere la región A = {(x,y}/ x>0, y >0 , x+y < t} e integre ...).

12. Suponga que X e Y son variables aleatorias. Demostrar que


a) si X e Y son independientes entonces cov(X,Y) = (X,Y) = 0.
b) cov (a X + b ,cY + d) = ac cov(X,Y) con a, b, c y d constantes.
c) (a X + b ,cY + d) =  (X,Y) con a, b, c y d constantes y sign(a) = sign(c).
d) Si Y = a X + b con a y b constantes (a  0) entonces  (X,Y) = sign(a).

RESPUESTAS :

1 . Distribución marginal de X
Valores x de X 1 2 3 4 5
pX(x) 0.2 0.2 0.1 0.4 0.1
Distribución marginal de Y
Valores y 1 2 3
de Y
pY(y) 0.5 0.3 0.2

Distribuciones condicionales de X dado Y


Valores x de 1 2 3 4 5
X/Y=1
pX/Y=1(x) 0.2 0.2 0.1 0.3 0.2
Valores x de 1 2 3 4
X/Y=2
  
pX/Y=2(x) 0.1 6 0.1 6 0.1 6 0.5
Valores x de 1 2 4
X/Y=3
pX/Y=3(x) 0.25 0.25 0.5

Distribuciones condicionales de Y dado X


Valores y de 1 2 3
Y/X=1
pY/X=1(y) 0.5 0.25 0.25
Valores y de 1 2 3
Y/X=2
pY/X=2(y) 0.5 0.25 0.25
Valores y de 1 2
Y/X=3
pY/X=3(y) 0.5 0.5
Valores y de 1 2 3
Y/X=4

7
Probabilidad y Estadística II UTN-FRA
LEM

pY/X=4(y) 0.375 0.375 0.25


Valores y de 1
Y/X=5
pY/X=5(y) 1

2.
a) Distribución marginal de X
Valores x de 0 1 2 3 4 5
X
pX(x) 0.0 0.0 0.1 0.2 0.2 0.2
3 8 6 1 4 8

Distribución marginal de Y
Valores y 0 1 2 3
de Y
pY(y) 0.2 0.2 0.2 0.2
5 6 5 4
b) Distribución de X+Y
Valores r de 1 2 3 4 5 6 7 8
X+Y
pX+Y(r) 0.0 0.0 0.1 0.1 0.2 0.1 0.1 0.0
2 6 3 9 4 9 2 5

Distribución de X.Y
Valores r de 0 1 2 3 4 5 6 8 9 10 12 15
X.Y
pX.Y(r) 0.28 0.02 0.07 0.07 0.11 0.08 0.09 0.05 0.06 0.06 0.06 0.05

c) E(X+Y) = 4.87; V(X+Y) = 2.6731; E(X.Y) = 4.76; V(X.Y) = 19.2224

4. a) P(X  2, Y = 1) = 0.2 b) P(X < 2, Y  1) = 2/15 c) P(X >Y) = 0.6


d) P(X +Y = 4) = 4/15 e) P(Y = 1 / X =2 ) = 1/3 f) E(X) = 2 E(Y) = 19/15
g) E(X + Y) = 49/15 V(X+Y) = 1.306

5. a) P(X = 1, Y = 1) = 0.15 b) P(X = Y) = 0.4 c) P(| X – Y| > 1) = 0.22


d) P( X + Y = 4) = 0.18 e) E(X) = 1.7 E(Y) = 1.55
f) Y e Y no son independientes.

6. 0.7
7.
Tabla 1 Tabla Tabla 3
2
E(X) 0 0 0
E(Y) 0 0 0
E(XY) 0 0.4 -0.4
V(X) 0.2 0.4 0.4
V(Y) 0.2 0.4 0.4
Cov(X,Y) 0 0.4 -0.4
Corr(X,Y) 0 1 -1
Independenci NO NO NO
a

8
Probabilidad y Estadística II UTN-FRA
LEM

8. a) 1/9 b) E(X) = E(Y) = 7/4 V(X) = V(Y) = 11/16


9. a) 7/8 b) 2/3
c) fx(x) = 2 – 2 x fy(y) = 2 – 2 y ; las variables no son independientes.
10. a) e –3 b) densidad marginal de X: e –x ; densidad marginal de Y : 1/(1+y)2; no
son
independientes. c)La esperanza de Y no converge.
11. a) f(x,y) = 2 exp (-(x + y)) si x>0 e y >0 b) ( 1- exp(-1))2
c) 1 – exp(- t) -  t exp(- t).

SUMA DE VARIABLES ALEATORIAS INDEPENDIENTES

I- Las manzanas que se producen en un huerto tiene distribución normal con media 100
gramos y desvío 20 gramos.
a) Hallar la probabilidad de que una bolsa con 40 manzanas pese no más de 4,2 kg.
(Considerar despreciable el peso de la bolsa)
b) Si se toman dos manzanas, hallar la probabilidad de que la diferencia entre ambas
sobrepase los 15 gramos. Rta.a-
0.9429, b- 0.5962

II-La distancia que recorre un camión de basura por viaje es una variable aleatoria uniforme en
[50;70] km. Si se toman 36 viajes, calcular la probabilidad de que la distancia promedio no
exceda los 63 km.
Rta. 0.9991
3
III- Sea una botella de 450 cm . La maquina envasadora envía una cantidad de líquido que es
una variable aleatoria con la siguiente función de densidad:
 k. x  500 0  x  500
f ( x)  
 0 otro x
3
a) Entre 50 botellas que se llenaron, calcular la cantidad esperada con menos de 10 cm libres.
b) Si se toman 30 botellas, calcular la probabilidad de que el contenido promedio no supere los
3
440 cm . Rta. a- 0.72;
b- 0.6406

IV- Los salarios que cobran los empleados de una multinacional tienen un valor medio de $700
con un desvío de $120. Si en una sucursal trabajan 50 empleados y recibe una partida de
$38000 ¿cuál es la probabilidad de que no se pueda pagar a todos los trabajadores?
Rta. aprox. 0

V- La duración de ciertas componentes se distribuye exponencialmente de tal forma que el


30.12% de la población dura por lo menos 300horas. Calcular la probabilidad de que 40
componentes logren una duración total de al menos 11000 horas si se conectan una tras otra a
medida que se van quemando.
Rta. 0.2643

VI- Los diámetros de ciertas arandelas se distribuyen normalmente con una media de 5mm y
un desvío de 0.4mm y los diámetros de los tornillos siguen una distribución normal con media
4.8mm y un desvío de 0.8mm. Calcular la probabilidad de que si se eligen un tornillo y una
arandela resulten compatibles.
Rta. 0.5871

VII- En un supermercado, el tiempo que tarda un cajero en registrar la compra de cada cliente
tiene distribución normal con media 5,5 minutos y desvío 1 minuto. Si se eligen al azar 2

9
Probabilidad y Estadística II UTN-FRA
LEM

personas que ingresan por una caja ¿cuál es la probabilidad de que la diferencia entre los
tiempos de registro de sus compras sea de a lo sumo 2 minutos?
Rta. 0.8414

VIII- El peso de las mujeres es una variable aleatoria normal con una media de 56kg y un
desvío de 7kg y el de los hombres es otra normal con peso medio de 78kg con desvío 6kg.
Suben 2 hombres y dos mujeres a un ascensor que soporta un peso máximo de 300kg. ¿Cuál
es la probabilidad de que el ascensor no funcione?
Rta.
0.0071

Revisión para el parcial

1. Una máquina empaqueta cierto producto en dosis de peso Xi que está distribuida
normalmente con media 25 gramos y desvío 4 gramos. Además el peso del paquete
vacío es una variable aleatoria normal con media 5 g y desvío 0,2 gramos. Si se toma
al azar un paquete completos hallar la probabilidad de que el peso se encuentre entre
29 y 31 gramos.

2. Para cierto proceso se usan tornillos y arandelas. El diámetro de los tornillos es


N(10;1)mm y el de las arandelas N(9,0,95). Cuando un par elegido al azar no calza, se
descartan tornillo y arandela. Hallar el porcentaje de pares descartados en este
procedimiento.

3. Las manzanas que se producen en un huerto tienen un peso que es una variable
normal con media 150 gramos y desvío 40 g. Si se toma una muestra de 50 manzanas
y se las embolsa, hallar la probabilidad de que la bolsa completa supere los 8 kg.

4. Los tubos que produce una fábrica tienen una duración exponencial; negativa con
varianza 1000000 h². Se colocan 50 tubos de este tipo en un sistema de modo tal que
al quemarse el tubo en uso se enciende automáticamente el siguiente (considerar nulo
el tiempo entre que se apaga y se prende el siguiente tubo. Hallar la probabilidad de
que el sistema falle después de los 7 años de funcionamiento

5. La distancia que recorre un camión de basura por viaje es una variable aleatoria normal
con media 60 km y desvío 20 km. Si se toman los recorridos de 40 viajes, calcular la
probabilidad de que la distancia promedio no exceda los 63 km.

6. Los arribos a la cola de espera de un banco ocurren según Poisson de modo tal que la
probabilidad de que no haya arribos en 5 minutos es e 1 .Calcular la cantidad esperada
de personas que arriban a la cola en una hora.

7. El diámetro de las arandelas que producen en una fábrica es una variable aleatoria
normal con media 4 mm. ¿Que valor debería tomar el desvío estándar para que el
porcentaje de arandelas con diámetro menor que 3,75 mm no exceda el 2%?
3
8. Sea una botella de 450 cm . La maquina envasadora envía una cantidad de líquido
que es una variable aleatoria con la siguiente función de densidad:
 k . x  500 0  x  500
f ( x)  
 0 otro x
a) Entre 50 botellas que se llenaron, calcular la cantidad esperada con menos de 10
3
cm libres.
b) Si se toman 30 botellas, calcular la probabilidad de que el contenido promedio no
3
supere los 440 cm

10
Probabilidad y Estadística II UTN-FRA
LEM

9. Sean X e Y las proporciones del tiempo de una semana de trabajo, que utilizan dos
empleados A y B para realizar las tareas que se le asignan. El comportamiento de la
frecuencia relativa conjunta de (X ; Y ) está modelada por la función de densidad:

 x+y 0  x  1, 0  y  1
f (x, y)  
0 otro  x, y 

a) Si se eligen al azar dos semanas hallar la probabilidad de que, en a lo sumo una de


las dos, la proporción de tiempo total que utilicen entre los dos empleados supere el
100%.
b) Si el empleado B no requiere más de la mitad de su tiempo para realizar sus tareas,
calcular la probabilidad de que el empleado A utilice más del 75% de la semana para
hacerlo. ¿Son independientes X e Y? Justificar.

RESPUESTAS

1. X: N(25;4) Q:N(5;0.2) E(X+Y) = 30 V(X+Y) = 16.04


P( 29  X+Q  31) = P(-0.25  Z  0.25) = 0.197412

2. T:N(10;1) A:N(9;0.95) E(T-A) = 1 V(T-A) = 1.9025


P(T  A) = P( T-A  0) = P(Z  -0.72) = 0.764238 es decir: 76.42%

3. X:N(150;40) E(X1+X2+...+X50) = 50 . 150 = 7500 V(X1+X2+...+X50) = 50 . 40²


P(X1+X2+...+X50  8000) = P( Z  1,77) = 0.0384

4. 1/² = 1000000 h² E(X) = 1/ = 1000 V(X) = 1/² = 1000000


P(X1+X2+...+X50  61320) E(X1+X2+...+X50) = 50000 V(X1+X2+...+X50) = 50.1000000
P(X1+X2+...+X50  61320) = P(Z  1,60) = 0,0548

5. X:N(60;20) E( X ) = 60 V( X ) = 20²/40
P( X  63) = P( Z  0.95) = 0.828944

11
Probabilidad y Estadística II UTN-FRA
LEM

UNIDAD 2: ESTIMACIÓN DE PARÁMETROS

1. Se toma una muestra aleatoria de tamaño 3 para estimar la media de una población y
x1  2 x 2  3 x 3
se define el estimador ˆ  . Analizar si es insesgado y explicar porque
6
x es más eficiente que el estimador definido.
2. Sabiendo que a1 y a2 son estimadores insesgados del parámetro a, analizar si el
promedio entre ellos es otro estimador insesgado de menor varianza.

3. Sabiendo que ˆ es un estimador insesgado de q, analice si también lo es k ˆ , donde k


es una constante.

4. En diferentes ocasiones se tomaron los tiempos que un operario tarda para realizar una
tarea, obteniéndose los siguientes resultados:
25 – 27 – 32 – 35 – 33 – 28 – 31 – 30 – 29 – 32
Estimar la media y la varianza muestral.

5. La producción de un tipo de lámparas tiene un desvío de 1400 horas. Se toma una


muestra de 36 lámparas que dieron en promedio una duración de 1600 hs. Hallar un
intervalo de confianza del 98% para la media.

6. Una maquina llena botellas de litro de gaseosa. Se toma una muestra de 35 botellas y
3 3
se calcula un contenido promedio de 950cm . Suponiendo un desvío 35cm , hallar un
intervalo de confianza del 99% para la media poblacional.

7. Se calcula que la media de los promedios de 36 alumnos de la UTN FRA del último año
es de 8.3. Hallar el intervalo de confianza del 99% para la media total de los alumnos del
último año. Los registros históricos indican un desvío de la población de 0.3 puntos.

8. Un contratista ha construido un gran número de casas de aproximadamente el mismo


tamaño y precio. Si se conociera que el desvío en el precio de las casa es de $400 ¿De que
tamaño debería tomarse una muestra para estimar el precio promedio con un intervalo de
confianza del 90% que tenga un error menor a $200?

9. Para relevar el contenido medio de los paquetes de papas fritas de 250g, una
asociación de protección al consumidor toma una muestra de 16 paquetes extraídos al azar
de las góndolas de 16 supermercados, obteniendo una media de 252g y un desvío de 10g.
Hallar un intervalo de confianza del 95% para el contenido medio de los paquetes de papas
fritas.

10. Una maquina expendedora de bebidas esta diseñada para servir, como promedio
200ml de bebida por vaso. Para probar la maquina se toma una muestra de 10 vasos de
bebida y se midió la cantidad vertida en cada uno. Se obtuvo una media de 203,5ml y un
desvío de 3,4ml. Hallar un intervalo de confianza del 95% para la cantidad promedio de
bebida que expende la maquina.

12
Probabilidad y Estadística II UTN-FRA
LEM

11. Se quiere conocer la duración, en promedio, de ciertas componentes. Para ello se toma
una muestra de 30, que dan una duración promedio de 1550hs y un desvío de 75 horas (la
distribución de la duración es aproximadamente normal) Hallar un intervalo de confianza del
95% para la media poblacional.

12. Se pretende estimar la media con el intervalo (174 ; 196) al 98% de confianza. Si el
desvío es 12 ¿de que tamaño era la muestra que permitió dicha estimación?

13. Para estimar el peso de unas manzanas, se tomo una muestra de 50 manzanas, se las
peso y se obtuvo un peso medio de 125gr, con un desvío de 20gr.
a. Hallar un intervalo de confianza del 99% para el peso medio de las manzanas
que se producen.
b. Si se conociera que el desvío de los pesos de las manzanas es 15gr, calcular
el tamaño de la muestra necesario para estimar el peso medio con un intervalo
de confianza del 95% de precisión 10 gr.

14. Un investigador esta convencido de que su equipo de medición posee una variabilidad
medida por un desvío estándar de 2. Al realizar el experimento registro observaciones de
4.1, 5.2, y 10.2. Hallar un intervalo de confianza para el desvío estándar poblacional.

15. El diámetro de los tornillos que se fabrican en una planta es una variable aleatoria.
Estimar el desvío estándar al 95% de confianza, si se cuenta con la siguiente muestra: 51 –
52 – 48 – 51 – 48 – 53 – 50 – 48.

16. Una encuesta de 400 seres humanos, produjo 280 para los que el ojo derecho es el ojo
dominante. Estime la fracción de la población total cuyo ojo derecho es el dominante por
medio de un intervalo de confianza del 95%.

17. Un genetista se interesa en el porcentaje de hombres africanos que tiene cierto


trastorno sanguíneo. Para ello se observan 100 hombres, de los cuales 24 padecen la
enfermedad. Hallar un intervalo de confianza del 99% para la proporción de hombres
africanos que tienen ese desorden sanguíneo.

18. Para estimar la proporción de piezas que se fabrican que tienen fallas, se toman 150
piezas, de las cuales 20 están falladas. Construir un intervalo de confianza del 95% para la
proporción.

19. En un barrio privado con vario monoblocks, existe más de un millar de automóviles, que
permiten tomar conocimiento del kilometraje anual que transitan, el que resulta ser una v.a.
normal. Una muestra aleatoria de 41 automóviles dio una media muestral de 9120km y un
desvío insesgado de 92,6km. Un intervalo de confianza tuvo por limite superior 9155km.
¿Cual fue el nivel de confianza?

20. Un fabricante de baterías para automóvil asegura que sus baterías duran en promedio,
3 años con una varianza de 1 año. Si 6 de estas baterías tienen duraciones de 1.9 – 2.5 –
3.0 – 3.2 – 3.5 y 4.2 años Determine un intervalo de confianza de 95% para 2 e indique si
es valida la afirmación del fabricante de que  = 1 (Suponer que la población de las
2

duraciones de las baterías se distribuye normalmente).

UNIDAD 3: TEST DE HIPÓTESIS

1. Los paquetes de azúcar de 1 kg se distribuyen normalmente con media 1000 gramos y


desvío 15 gramos. Tras varios controles, se sospecha que hay problemas con la
envasadora ya que el peso de los envases difiere mucho del peso esperado. Se

13
Probabilidad y Estadística II UTN-FRA
LEM

selecciona una muestra cuyos pesos fueron: 990, 9888, 1007, 1020,950, 930, 1090,
120, 998, 1000. ¿Avalaría la sospecha con un nivel de significación del 5%?

2. Los directivos de una empresa sostienen que, con el sistema de premios que
estableció, el salario de bolsillo promedio excede los $750. Se sospecha que esto no
ocurre. Para poder efectuar el reclamo, el sindicato toma una muestra aleatoria de 36
salarios que dieron una media de $780 con un desvío de $18. ¿Podría el sindicato
refutar las afirmaciones de la empresa con un nivel de significación del 10%?

3. Se acusa a una empresa de discriminación en sus prácticas de contratación. En el


juicio, un jurado comete un error tipo II al encontrar que la empresa es culpable.
Escriba las hipótesis nula y alternativa que se plantearon y justifique su respuesta

4. Un sociólogo afirma que la proporción de familias en las que sólo uno de los dos
padres trabaja supera el 40%. Para ello se tomó una muestra de 400 familias de las
cuales en 180 de los casos trabajaba solamente uno de los dos padres. ¿Proveen
estos datos suficiente evidencia para avalar la posición del sociólogo con un nivel de
significación del 10%?

5. Para ciertos caños de desagüe se especifica que su diámetro no puede exceder los
105 mm en más de 5 mm. Una muestra de 15 caños dio una media de 117 mm y un
desvío de 8 mm. ¿Se puede afirmar con un nivel de significación del 5% que el desvío
de los diámetros es superior al especificado?

6. En una fábrica de gaseosas se afirma que, durante el proceso de llenado, se


desperdician muchos litros de gaseosa por mes con un desvío de 300 litros. Se
implementó durante 10 meses una modificación en el proceso que reduciría la pérdida
de líquido pero no así su variaribilidad. Para tomar una decisión seleccionaron sendas
muestras de diez meses elegidos al azar con uno y otro proceso. Los datos fueron los
siguientes: con el proceso anterior se obtuvo una media de14900 litros con un desvío
de 350 litros, en cambio con el actual, la media fue de 14000 l con un desvío de 400 l
¿Se podría afirmar, con un nivel de significación del 5%, que el nuevo proceso
optimizaría la pérdida?

7. Una panificadora ha implementado un nuevo proceso de fermentación para preparar


panes con salvado de trigo a fin de reducir su nivel calórico. Se seleccionaron al azar
sendas muestras de dichos panes que fueron analizadas para determinar su contenido
calórico antes y después de la implementación del nuevo proceso. Una muestra de 30
panes con el proceso antiguo dio un a media de 1330 calorías con un desvío de 238
calorías mientras que otra muestra de 50 panes elaborados con el nuevo proceso dio
un promedio de 1255 calorías y un desvío de 215 calorías. ¿ Se proporcionan pruebas
suficientes para concluir que el número medio de calorías de dicho pan ha disminuido
desde que se implementó el nuevo proceso? Utilice un nivel de significación del 5 % e
indique los supuestos necesarios para la validez de la prueba.

Pruebas de Asociación

1. Unos buques mercantes de cierto tipo estuvieron expuestos durante 400 días a riesgos de
accidentes por tormentas, hielo, incendio, encallamiento, avería de máquina, etc. El
número de accidentes, X, de cada barco, puede considerarse como una variable aleatoria.
Se registraron los siguientes datos:

Nº de accidentes ( X) 0 1 2 3 4 5 6

14
Probabilidad y Estadística II UTN-FRA
LEM

Nº de barcos con 1448 805 206 34 4 2 1


accidentes
Los datos anteriores, ¿justifican que la variable X tiene distribución Poisson? Use un nivel
de significación del 5 %.
2. En un hotel se releva información sobre conformidad con el servicio. Cruzando las
variables Conformidad y Sexo se obtienen los siguientes resultados:

Varón Mujer
Conforme 140 231
No conforme 39 90
¿Se puede afirmar con un nivel de significación del 5% que las variables son dependientes?
3. En 100 lanzamientos de una moneda se observan 63 caras y el resto, cecas. ¿Es una
moneda balanceada? Use un nivel de significación de 0,05.
4. La siguiente tabla cruza la calificación promedio de 500 estudiantes de la carrera de
ingeniería con su rendimiento en los programas de inducción en su primer trabajo.

Puntaje de graduación
10 9 8 7 o menos
Sobresaliente 40 50 55 20
Muy Bueno 25 35 45 20
Bueno 10 25 50 36
Pobre 10 15 40 24

¿Se puede afirmar con un nivel de significación del 5% que las variables son dependientes?
5. Se realiza un análisis de datos sobre accidentes para determinar la distribución del número
de accidentes mortales según el tamaño del auto. Los datos para 346 accidentes son los
siguientes

Tamaño del auto


Pequeño Mediano Grande
Mortal 67 26 16
No mortal 128 63 46

¿Indican los datos que la frecuencia de accidentes mortales depende del tamaño de los
automóviles? Trabaje con un nivel de significación del 1%.

6. En la siguiente tabla se muestra la cantidad de fallas de aislación observadas en 250 rollos


de cable de igual longitud. Se podría decir con un 5% de probabilidad de error, que estos
valores corresponden a una ley de Poisson?

Nº de Fallas 0 1 2 3
Frecuencias 89 56 85 20

7. Se quiere establecer si la vida útil de ciertas lámparas sigue una ley normal. Para ello se
cuenta con los siguientes datos, donde X es la duración de una lámpara en horas y f es la
frecuencia absoluta.

X f
[1200;1400] 4
[1400;1600] 25
[1600,1800] 79
[1800;2000] 73

15
Probabilidad y Estadística II UTN-FRA
LEM

[2000;2200] 25
[2200;2400] 19
[2400;2600] 8
[2600;2800] 17
Total 250

¿Qué conclusiones puede sacar con un nivel de significación de 5%?

8. Se realizó una encuesta para evaluar la eficacia de una nueva vacuna contra la gripe. La
vacuna se aplicó gratuitamente en dos sesiones en un período de dos semanas a quienes
quisieran aprovecharla. Algunas personas recibieron las dos dosis, otras una y algunas
ninguna. Según los datos de la siguiente tabla ¿puede concluirse que las variables
“cantidad de dosis de la vacuna2” y “estado de salud” dependen una de la otra, con una
probabilidad de equivocarse del 5%?
9.
0 dosis 1 dosis 2 dosis
Gripe 24 8 13
No gripe 289 100 565

UNIDAD 4: REGRESIÓN Y CORRELACIÓN LINEAL

1. Los datos de la tabla representan la velocidad ( en km/ seg) y la altura ( en km) de la


estrella fugaz número 1242 informados en el Proceeding of the Symposium on
Astronomy and Physics of Meteors, Cambridge, Agosto 1961:
X 11.93 11.81 11.48 10.49 10.13 8.87
(Velocidad)
Y ( altura) 62.56 57.78 53.10 48.61 44.38 40.57

Analizar la pertinencia de un modelo lineal que explique la altura en función de la


velocidad. Si es posible hallar la recta de regresión.

2. Las calificaciones de un grupo de nueve estudiantes en un reporte del examen parcial


de mitad del trimestre (x) y del examen final (Y) son las siguientes:

X 77 50 71 72 81 94 96 99 67
Y 82 66 78 34 47 85 99 99 68

a) Estime la recta de regresión


b) Estime la calificación del examen final de un estudiante que obtiene 85 en el reporte del
examen parcial de mitad de trimestre.

3. Observen la tabla y analicen si las afirmaciones son verdaderas o falsas:

Peso del padre (kg) 85 73 64 125


Peso del hijo (kg) 50 95 44 90

a) Es apropiado un modelo lineal para estimar el peso del hijo en función del peso del
padre
b) El coeficiente de correlación muestra una correlación negativa

4. ¿Qué ocurre si en la tabla del problema anterior expresamos los pesos en gramos?
Justifiquen en cada caso la respuesta.
a) La covarianza y el coeficiente de correlación aumentan 1000 veces.
b) La pendiente y la ordenada al origen permanecen invariantes.
c) La covarianza no se modifica.
d) El coeficiente de correlación permanece invariante.

16
Probabilidad y Estadística II UTN-FRA
LEM

5. Un comerciante al menudeo lleva a cabo un estudio para determinar la relación entre los
gastos semanales de publicidad y las ventas. Se registraron los siguientes datos:

Costos de 40 20 25 20 30 50 40 20 50 40 50 25
publicidad
($)
Ventas($) 385 400 395 365 475 440 490 420 560 525 510 480

a) Grafique un diagrama de dispersión y analice la pertinencia del modelo lineal para la


relación entre variables.
b) Halle, si es posible, la recta de regresión lineal para predecir las ventas semanales a
partir de los gastos de publicidad.
c) Estime, si es posible, las ventas semanales cuando los costos de publicidad son de $
35.-
Hallar, si es posible, los costos de publicidad correspondientes a 600$ en concepto de ventas.

17

También podría gustarte