Está en la página 1de 10

Exercise 1.5.6.

The size of an ear of wheat in a field is modeled by a random variable X with normal
distribution N (15, 36) (unit: cm).
In another field, the size of an ear of wheat is modeled by a random variable Y with normal
distribution N (10, 16). What is the probability for an ear from the first field to be larger than
an ear from the second field?
Approximation of a binomial to a normal distribution

El tamaño de una espiga de trigo en un campo está modelado por una variable aleatoria X con
distribución normal N (15, 36) (unidad: cm).

En otro campo, el tamaño de una espiga de trigo está modelado por una variable aleatoria Y
con distribución normal N (10, 16). ¿Cuál es la probabilidad de que una espiga de trigo del
primer campo sea más grande que una espiga de trigo del segundo campo?
Aproximación de un binomio a una distribución normal

2. Find the probability for the clinic to perform successfully the surgery at least 345 times.

2. Encuentre la probabilidad de que la clínica realice con éxito la cirugía al


menos 345 veces.

3. Find the probability that the surgery fails in that clinic more than 28 times in the year.

3. Encuentre la probabilidad de que la cirugía falle en esa clínica más de 28


veces en el año.

4. The insurance accepts to cover a certain number of failed surgeries: that number has only a
1% chance to be exceeded. What number is it?

4. El seguro acepta cubrir un cierto número de cirugías fallidas: ese número


tiene solo un 1% de probabilidad de ser excedido. ¿Qué número es?

Let n be the number of failed surgeries that must be determined. The corresponding number
of successes is 400−n. Therefore P[N ≤ 400−n] = 0.01. Now:

Sea n la cantidad de cirugías fallidas que deben determinarse. El número de


éxitos correspondiente es 400-n. Por lo tanto P [N ≤ 400-n] = 0.01. Ahora:
The reasoning could also be applied to the number of failed surgeries R = 400−N. It follows the
binomial distribution B(400, 0.1), that can be approximated by the normal N (40, 36). The
desired number is such that P[R > n] = 0.01.

El razonamiento también podría aplicarse al número de cirugías fallidas R = 400-N. Sigue la


distribución binomial B (400, 0.1), que puede ser aproximada por el N normal (40, 36). El
número deseado es tal que P [R> n] = 0.01.

Of course the result is the same.

Por supuesto, el resultado es el mismo.

INTERVALOS DE CONFIANZA

Exercise 2.2.1. The compression force of a certain type of concrete is modeled by a Gaussian
random variable with expectation µ and variance σ 2 . The measurement unit is the psi (pound
per square inch). In questions 1. to 4., it will be supposed that the variance σ 2 is known and
equal to 1000. An empirical mean of 3250 psi has been observed from a sample of 12
measurements.

1. Give a 95% confidence interval for µ. Here, α = 0.05 and 1 − α/2 = 0.975. The quantile of
order 0.975 for the N (0, 1) distribution is 1.96. The confidence interval is:

There is no point in giving more digits than in the empirical mean. The lower bound is rounded
to the left, and the upper bound to the right; thus the rounding can only enlarge the interval,
ensuring that the confidence level remains higher than 0.95.
2. Give a 99% confidence interval for µ. Compare its width with that of the interval in the
previous question. Here, α = 0.01 and 1−α/2 = 0.995. The quantile of order 0.995 for the N (0,
1) distribution is 2.5758. The confidence interval is:

This interval is wider than the previous one. The higher the probability that the mean belong to
the interval (0.99 instead of 0.95), the wider the interval must be. To get greater confidence,
less precision must be accepted.

3. If using the same sample, a confidence interval of width 30 psi were given, what would its
confidence level be? The width of a confidence interval at level 1−α is:

If that width is 30, then:

This value is the quantile of order 0.9498 = 1−α/2 for the N (0, 1). Thus α = 0.1003 and 1 − α =
0.8997.

4. What minimal number of trials would be necessary to estimate µ with a precision of ±15 psi,
at confidence level 0.95? For n trials, the precision of the confidence interval at level 0.95 is:

If it is ±15, then:
The sample size must be at least 18.

5. From now on the theoretical variance is supposed to be unknown. For the 12 trials
mentioned above:

Give a 95% confidence interval for µ and compare it with that of question 1. Repeat the
calculation for a 99% confidence interval and compare it with that of question 2.

The estimated variance is:

The quantile of order 0.975 for the Student T (n−1) distribution is 2.201, that of order 0.995 is
3.106. The 95% confidence interval is:

Even though the estimated variance is lower than the theoretical one in this case, the
confidence intervals calculated with the Student distribution (unknown variance) are wider
thus less precise than those computed with the normal distribution (known variance). This is
due to the fact that Student distributions are more scattered than the N (0, 1) one: the interval
containing 95% of values for the T (11) is [−2.201 ; +2.201], instead of [−1.96 ; +1.96] for the N
(0, 1). It is reasonable to expect less precision when less information is available on the model.
6. Give a 95% confidence interval for the variance, and for the standard deviation. The quantile
of order 0.025 for the khi-squared distribution X 2 (11) is uα = 3.816. The quantile of order
0.975 is vα = 21.92. The 95% confidence interval for the variance is:

By taking the square root of both bounds, a confidence interval for the standard deviation is
obtained:

The confidence intervals for the variance or the standard deviations on small samples are
usually very wide.

Exercise 2.2.2. The weight of grapes produced per vine has been measured on 10 vines
selected at random in a vineyard. The results in kilograms are the following:

2.4 3.4 3.6 4.1 4.3 4.7 5.4 5.9 6.5 6.9 .

The weight of grapes produced by each vine is modeled by a N (µ, σ 2 ) distribution.

1. Find the empirical mean and variance of the sample.

2. Give a 95% confidence interval for µ.

3. Give a 95% confidence interval for σ 2 .

4. From now on, the standard deviation of productions per plant is supposed to be known and
equal to 1.4. Give a 95% confidence interval for µ.

5. Find the minimal number of plants that should be taken to estimate µ with 99% confidence
with a precision of ± 500 grams.

Exercise 2.2.4. A laboratory uses an optical device to measure the fluorescein concentration in
solutions. The measurements are modeled by a Gaussian random variable, the expectation of
which is equal to the true concentration of the solution, and the standard deviation,
guaranteed by the company selling the device is known: σ = 0.05.

1. Nine measurements are made for the same solution. The empirical mean of the 9 results is
4.38 mg/l. Give a 99% confidence interval for the true concentration of the solution.

2. For that same sample, what is the confidence level of the interval [4.36 ; 4.40]?

3. What should the sample size be if the concentration of the solution had to be known at
confidence level 0.99, with a precision of ±0.01 mg/l?
4. On the same sample of 9 measurements, a standard deviation of 0.08 mg/l has been
observed. Give a 99% confidence interval for the theoretical standard deviation. What do you
think of the company’s guarantee?

5. Answer the first question again, this time supposing that the theoretical standard deviation
is unknown, and estimated by the empirical one.

Un laboratorio utiliza un dispositivo óptico para medir la concentración de fluoresceína en


soluciones. Las mediciones se modelan mediante una variable aleatoria gaussiana, cuya
expectativa es igual a la concentración real de la solución, y se conoce la desviación estándar,
garantizada por la empresa que vende el dispositivo: σ = 0.05.

1. Se hacen nueve mediciones para la misma solución. La media empírica de los 9 resultados es
4.38 mg / l. Brinde un intervalo de confianza del 99% para la verdadera concentración de la
solución.

2. Para esa misma muestra, ¿cuál es el nivel de confianza del intervalo [4.36; 4.40]?

3. ¿Cuál debería ser el tamaño de la muestra si la concentración de la solución tuviera que


conocerse a un nivel de confianza de 0.99, con una precisión de ± 0.01 mg / l?

4. En la misma muestra de 9 mediciones, se ha observado una desviación estándar de 0.08


mg / l. Brinde un intervalo de confianza del 99% para la desviación estándar teórica. ¿Qué
piensas de la garantía de la empresa?

 5. Responda la primera pregunta nuevamente, esta vez suponiendo que la desviación
estándar teórica es desconocida y estimada por la empírica.

Exercise 2.2.6. The production of a new kind of apple tree has to be estimated. The production
of one tree is modeled by a Gaussian random variable with expectation µ and standard
deviation σ, both unknown.

1. A sample of 15 apple trees, has produced a mean crop of 52 kg with standard deviation 5 kg.
Find a confidence interval for the expected production of the apple trees of the new species, at
level 0.95, then 0.99.

2. Find a confidence interval for the standard deviation σ, at level 0.95.

PROPORCIONES

Exercise 2.4.3. A clinic has proposed a new surgery, and has had 40 failures out of 200
attempts. Let p be the probability of success of that new surgery.

1. What estimate would you propose for p?


2. Using the normal approximation, give a 95% confidence interval for p.
3. How many surgeries should the clinic perform to know the success probability with a
precision of ±1% with 95% confidence level?

INTERVALOS

Como consecuencia de la falta de gas registrada en la ciudad de La Plata, en los meses de


invierno, la Empresa Camuzzi - Gas Pampeana decide hacer un estudio para determinar la
cantidad gastada en este combustible para calefacción casera en un año en particular.
Con tal motivo se selecciona una muestra de n = 64 hogares de la ciudad. La media muestral del
gasto en gas para calefacción resultó de $83,6. Se sabe por experiencia que la desviación
estándar de la población es $17,8.
a) Halle un intervalo de confianza del 95% para el gasto promedio anual en este tipo de
combustible en las viviendas de la ciudad de La Plata.
b) Calcule un intervalo de confianza del 99% para ese gasto promedio anual.
c) ¿Qué conclusiones puede sacar de a) y b)?
Solución
a) La estimación puntual de  es X = 83,6 .
El valor de z, a la derecha del cual se tiene un área de = 0,025
2
0,05
y por lo tanto de 0,975 a la
izquierda es,
z0,025 = 1,96
De aquí que el intervalo de confianza del 95% es:
79,24    87,95
b) Para hallar el intervalo de confianza del 99%, se encuentra el valor de z, a la derecha del
cual existe un área de = 0,005
2
0,01
y por lo tanto, de 0,995 a la izquierda.
Usando la tabla de la N (0, 1) resulta: z0,005 = 2,575 y el intervalo de confianza del
99% es:
64
17,8
≤μ ≤83,6 + 2,575.
64
17,8
83,6 - 2,575.
o simplemente,
77,8    89,33
c) Se observa que:
la longitud del intervalo del 95% de confianza es: L1 = 8,71
la longitud del intervalo del 99% de confianza es: L2 = 11,53
El nivel de confianza establece en alguna medida la longitud del correspondiente intervalo de
confianza. Aumentando el nivel de confianza (mayor certeza), aumenta la longitud (menor
precisión).
Podemos decir que el intervalo con 95% de confianza, que tiene menor longitud estima a 
con mayor precisión.

Ejemplo 2 Se quiere estimar la facturación mensual promedio por luz eléctrica en el mes de
julio en casas de familia de la ciudad de La Plata. Se sabe que la desviación estándar es de $20.
Se quiere estimar la facturación promedio de julio con aproximación  5$ del promedio real,
con 99% de confianza. ¿Qué tamaño de muestra se necesita?
Solución
 = 20

   n 107
La Universidad de Ciencias Aplicadas está realizando un estudio sobre el
peso promedio de los ladrillos que comprenden los pasillos de la
universidad. Se enviaron trabajadores que recolecten y pesen una muestra
de 421 ladrillos; el peso promedio de esta muestra fue de 6,4 kg. Se sabe
con toda certeza que la desviación estándar del peso de los ladrillos es de
3,6 kilogramos. ¿Cuál es el intervalo alrededor de la media de la muestra
que incluirá a la media de la población 95,5% de las veces?

Para una población con una varianza conocida de 185, una muestra de 64
individuos conduce al valor de 217 como estimación de la media. Construya
una estimación de intervalo que incluya a la media de la población 68,3% de
las veces.

La desviación estándar de la duración de los focos de una determinada


fábrica es de 100 horas. Para un embarque de 2000 focos, el gerente de
control de calidad desea determinar el tamaño de la muestra necesaria, para
estimar la duración promedio con error de estimación de 20 horas y un 95%
de confianza.
La media y la desviación estándar de las cargas máximas soportadas por
100 cables producidos por la compañía DURAMAS son 20 toneladas y 1,1
toneladas. La media y la desviación estándar de las cargas máximas
soportadas por 60 cables producidos por la compañía CABLECOM son 16
toneladas y 0,8 toneladas. Determine el intervalo de confianza al 95% para
la diferencia de cargas máximas medias.
De qué tamaño debe ser la muestra para poder tener 95% de confianza en
que el error de estimación es de 5 o menos. Suponga que la desviación
estándar poblacional es de 25.

Una muestra al azar de 200 pilas de la marca A para calculadoras tiene


una vida media de 140 horas y una desviación estándar de 10 horas. Una
muestra al azar de 120 pilas de la marca B para calculadoras tiene una
vida media de 125 horas y una desviación estándar de 9 horas. Determine
el intervalo de confianza al 99% para la diferencia de medias de las dos
marcas de pilas para calculadoras

MUESTRAS PEQUEÑAS

De una muestra de 18 gasolineras REPSOL tomadas en la ciudad de Lima,


se encontró que el precio promedio de un galón de gasolina sin plomo es de
$ 3,17; con una desviación estándar de $ 0,08 por galón. Halle el intervalo
de confianza al 95% para el valor real del precio medio de la gasolina sin
plomo por galón.
Dos analistas tomaron lecturas repetidas en la dureza del agua de las napas
freáticas a lo largo del valle del Rimac. Determine un intervalo de confianza
del 95% para la diferencia de lecturas entre los analistas, suponiendo
varianzas iguales pero desconocidas.
Analista A 0,46 0,62 0,37 0,45 0,38 0,37 0,44 0,48 0,53 0,47
Analista B 0,82 0,64 0,54 0,55 0,58 0,42 0,48 0,33 0,32 0,25

Una máquina produce barras metálicas que se usan en el sistema de


suspensión de un automóvil. Se selecciona una muestra aleatoria de 20
barras y se mide el diámetro. Los resultados se muestran a continuación.
Suponga que el diámetro de las barras se distribuye normalmente.
Construya un intervalo de confianza del 95% respecto al diámetro de barra
medio.
8,24 8,23 8,20 8,29 8,31 8,25 8,24 8,31 8,29 8,20
8,31 8,26 8,25 8,29 8,27 8,32 8,31 8,21 8,20 8,30

PROPORCIONES

Una tienda de computación, que compra al mayoreo chips sin probar para
computadoras, está considerando cambiar de proveedor por otro que se los
suministre probados y con una garantía a un precio más alto. Con el fin de
saber si este es un plan costeable, determine la porción de chips defectuosos
que le suministra su actual proveedor. Se probó una muestra de 200 chips y de
éstos, 5% tenía defectos.
a) Estime el error estándar de la porción de chips defectuosos.
b) Construya un intervalo de confianza de 98% para la porción de chips
defectuosos adquiridos.

Estudios realizados en 1998 concluyeron que el 55% de profesionales


graduados antes de 1980 no conocían el manejo básico de Internet. Durante
1999 se realizó una encuesta a 1200 personas de las cuales 590 no conocían
el manejo básico de Internet.
Determine un intervalo de confianza del 98% para la proporción de
profesionales graduados antes de 1980 que conocen el manejo de Internet.
Si hoy se quiere averiguar el porcentaje de personas que trabajan con
Microsoft Office, ¿qué tamaño de muestra se deberá tomar para estimar el
porcentaje de personas que trabajan con Microsoft Office si el error máximo de
estimación deberá ser del 3%?
La empresa XXX dedicada a la investigación de virus informáticos estima
que el 2,5% de los virus que analiza no logran ser destruidos con un 0,5%
de error de estimación. La empresa ZZZ, de la misma línea de investigación,
tomó una muestra de 200 virus analizados y obtuvo que el 3% no pudo ser
destruido. ¿Se puede determinar qué empresa es más eficiente en la
destrucción de virus? Justifique cuantitativamente su respuesta.

AYUDA ( DIFERENCIA DE PROPORCIONES )


En una muestra al azar de 600 mujeres, 300 indican que están a favor de la ayuda del estado a los
colegios privados. En una muestra al azar de 400 hombres, 100 indican que están a favor del mismo.
Determine un intervalo de confianza
a) del 90%, 95% y 99% para la diferencia de proporciones de todas las mujeres y todos los hombres que
favorecen tal ayuda.

Approximation of a binomial to a normal distribution


2. Find the probability for the clinic to perform successfully the surgery at least 345 times.
3. Find the probability that the surgery fails in that clinic more than 28 times in the year.
4. The insurance accepts to cover a certain number of failed surgeries: that number has only a
1% chance to be exceeded. What number is it?

Let n be the number of failed surgeries that must be determined. The corresponding number
of successes is 400−n. Therefore P[N ≤ 400−n] = 0.01. Now:

The reasoning could also be applied to the number of failed surgeries R = 400−N. It follows the
binomial distribution B(400, 0.1), that can be approximated by the normal N (40, 36). The
desired number is such that P[R > n] = 0.01.

El razonamiento también podría aplicarse al número de cirugías fallidas R =


400-N. Sigue la distribución binomial B (400, 0.1), que puede ser aproximada
por el N normal (40, 36). El número deseado es tal que P [R> n] = 0.01.

También podría gustarte