Está en la página 1de 12

Proyecto Final

Mónica Valenzuela V.

ESTADÍSTICA PARA LA GESTIÓN

Instituto IACC

22 de octubre de 2018

INSTRUCCIONES:

Indicador 1: Interpretan la ocurrencia de sucesos usando distribución


binomial y geométrica.

Ejercicio 1 El último producto de una fábrica de galletas ha tenido un gran


éxito, hasta el punto de que el 80% de los clientes ya lo han probado. Un
grupo de 4 amigas le encantan las galletas:

a) ¿Cuál es la probabilidad de que en el grupo hayan probado las


galletas 2 personas?

X= “nº de personas que le encantan las galletas”; n=4 p = 0.8


q = 0.2 => X~B (4, 0.2)

La función de probabilidad de la distribución binominal se


expresa con la fórmula:
4 2. 2 4.3
p(x2) 0,8 .0,2  .0,64.0, 40,1536
 2 2
Lo que expresado como porcentaje nos dice que hay 15,36 % de
posibilidades de que, entre las 4 amigas, 2 hayan probado las
galletas.

b) ¿Y cómo máximo 2?

p ( X  2)  p ( X  0)  p( X  1)  p ( X  2) 

 4 0 4 1 3  4  2
0,8.2 0,8.20,1
0 1 2
Expresado en porcentaje, significa que hay 18,08 % de probabilidad que le hayan
gustado las galletas como máximo por 2 de las 4 amigas (pueden ser 0, 1 o 2).
Ejercicio 2: En una población de consumidores de bebidas gaseosas,
se estima que el 70% prefiere la bebida A. ¿Cuál es la probabilidad que
al entrevistar a un grupo de consumidores:
(Definiendo la variable X como sigue: “cantidad de ´personas que se va a
entrevistar aleatoriamente hasta obtener el primer consumidor que prefiera
la bebida A”)

Solución:
El primer punto debemos definir la variable.
Segundo punto, clasificaremos el modelo. Resultado que x cumple con una
variable geométrica con:
P = 0,70
q = 0,30
Y como último paso aplicaremos la fórmula:

Fórmula general p  ( X  K )  q k 1 p

a) Sea necesario entrevistar exactamente 4 personas para encontrar


el primer consumidor que prefiere la gaseosa A.

p ( x  4) Y que:
 (0,30) 4 1 (0,70)  0,0189
Expresado en porcentaje, significa que hay 18,9 % de probabilidad que sea
necesario de entrevistar a 4 personas para encontrar al primer consumidor que
prefiere la gaseosa A.

b) Se tenga que entrevistar a lo más 6 personas para encontrar el primer


consumidor que prefiere la bebida A.

p ( x  6) Y que:
Aplicando la fórmula q k 1
 (0,30) 6 1  0,00243
Expresado en porcentaje, significa que hay 24,3% de probabilidad que sea
necesario de entrevistar a 6 personas para encontrar al primer consumidor
que prefiere la gaseosa A.

Indicador 2: Determinan la probabilidad de ocurrencia de sucesos


usando distribución exponencial y normal.

Ejercicio 3 El tiempo de vida media de un medicamento en el


organismo sigue una distribución exponencial con una media de 16
horas. Se pide encontrar la probabilidad de que a una persona a la que
está en tratamiento con dicho medicamento deba de ingerir otro antes
de 20 horas.
Solución:

Realizamos una recopilación de datos que nos ofrece el problema:

· X ≡ 'Tiempo de vida media de un medicamento.


· La variable X se distribuye de forma exponencial: X ~ exp (16) años.

Pasamos a resolver los apartados ofrecidos por el enunciado del problema.

Apartado: debemos obtener la siguiente probabilidad:

P(X < .20)

Para resolverlo, emplearemos la distribución acumulada sabiendo que la función


de densidad de probabilidad de la distribución exponencial es:

Siendo:

· β = 16.

Y que la relación entre función de densidad de probabilidad y función de


distribución acumulada es:

Por lo tanto:

Realizamos el siguiente cambio de variable:

· t = -x/16
· dt = -dx/16

Sustituimos:

Deshacemos el cambio de variable:

· t = -x/16

Sustituimos y obtenemos la solución:

P (X < .20) = -e-x/16|200 = -(e-20/16 - 1) = 1 - e-5/4 ≈ 0.713495

Por lo tanto, la probabilidad de que a una persona a la que está en tratamiento con
dicho medicamento deba de ingerir otro antes de 20 horas., es aproximadamente
de 71,35%.
Ejercicio 4 En una máquina productora de alimentos se estima que la
temperatura máxima que puede alcanzar el horno sigue una
distribución normal, con media 23°C y desviación típica 5°C. Calcular
el número de días del mes (de 30 días) en los que se espera alcanzar
máximas entre 21° y 27°.

x
Solución: sabemos que = Z  ; como X 1 = 21 y X 2 = 27 entonces la

P (x 1 ≤ X ≤ x 2); μ=23° y σ=5° se define como:

p (21 ≤ x  27)  p 21  23 ≤ Z  27  23  


 5 5 
2 4
p ( 21 ≤ x ≤ 27) = p ( ≤ z ≤ )  p (0,4 ≤ z ≤ 0,8)=
5 5

 p (0.4 ≤ Z  0.8)  p ( Z  0.08)  1  p ( Z  0.4) 

= p ( z≤ 0,8)+ p ( z≤0,4)-1=0,7881+0,6554-1=0,4435

 0.4425 * 30  13,3 (Es decir 13 días).

Podemos decir que se espera alcanzar la máxima entre 21° y 27°, en un


número de 13 días.

Indicador 3: Calculan la probabilidad para medias muéstrales.

Ejercicio 5 La distribución de la temperatura máxima en cierta ciudad del


Caribe tiene una media anual de 33°C con una de desviación típica 0,85 °C.
Se elige una muestra de 105 días y se pide calcular la probabilidad de que la
temperatura media sea menor de 32,9 °C.

(La distribución muestral de �̅ es normal con media μ = 33 y σ = 0,85)


(Dadas las condiciones del problema se aplica el teorema del límite central)

Solución:
Al ser n=105, consideramos que la variable aleatoria media muestral normal es:

La variable aleatoria X se distribuye como una N (  , ) = =N
n

 0,85 
 33,   (33, 0,083)
 105 

32,9  33
Por lo tanto: p ( x  32,9)  p ( z  )  p ( z  1,2)  1  ( z  1,2) 
0,083

 1  0,8849  0,1151

La probabilidad que la temperatura media sea menor de 32,9°C es de


11,15. %
Indicador 4: Estiman la probabilidad usando estimadores puntuales y
por intervalos.

Ejercicio 6 Se ha realizado un estudio estadístico sobre el peso, en


gramos, y el sexo de los gatos recién nacido durante seis meses. El
peso de 15 de ellos es: 118 115 110 127 113 154 110 123 118 115 129 119
128 116 125 Además, 7 de esos gatos son machos. Determina un
estimador puntual para:

a) El peso medio de la población.

Solución:

Aplicando la fórmula: de la media x (o media aritmética), La media aritmética


es el valor obtenido al sumar todos los datos y dividir el resultado entre el número
total de datos.

Es decir:

=
xi 1820
X  121,33
i 1
 15
n

Podemos considerar 121 Kg como el peso medio de la población.

b) La proporción de machos nacidos.

Para sacar la proporción se utiliza la siguiente formula:


X
pˆ 
n
 7
p  0,47
15

Podemos considerar que el 47% de los recién nacidos son machos.


Ejercicio 7 La temperatura media de una muestra de 82 pacientes, fue
de 37,6 °C se sabe que la desviación típica de la población, 1,08 °C.
Calcular un intervalo de confianza para la media poblacional con un
nivel de confianza del 99 %.
El intervalo de confianza es de 99% luego tenemos que:
 z
1    0.99   0.005  a  z 0,005  2,58
2 2
El intervalo de confianza viene dado por la siguiente expresión:

 
( x  za : x + za )
2  2 

Sustrayendo los datos tenemos lo siguiente:

1,08 1,08
(37,6  ( 2,58). : 37,6  ( 2,58). )  (37,6  0,31 : 37,6  0.31) 
82 82

 (37,29; 37,91)

De acuerdo a la muestra elegida, la probabilidad de que la temperatura

media de los 82 pacientes esté en el intervalo de confianza (37,29 ; 37,91)

es de 0,99.

Ejercicio 8. Se realiza un estudio sobre el peso medio de 320 bebés


niños y 240 bebés niñas, y se obtienen los siguientes datos sobre el
peso de cada grupo al nacer.

Indicar si existen diferencias estadísticamente significativas entre los


pesos de los niños y de las niñas, utilizando un intervalo de confianza
para la diferencia de medias con un nivel de confianza del 95%.

Intervalo de confianza del 95%:


1    0,95    1  0,95  0,05  z a / 2 = z 0, 025 =1,96

Nc 95
1 1
P ( Z ≤ z a / 2 )= 100  100  1,95  0,975
2 2 2

Por tanto, al buscar dentro de la tabla de la distribución normal 0,975 se

obtiene 1,96
Un intervalo de confianza para la diferencia de medias poblacionales de dos
distribuciones normales con desviaciones típicas σ1 y σ2 conocidas, con un nivel
de confianza 1-α construido a partir de dos muestras de tamaño n1 y n2 es:

0,6 2 0,8 2 0,6 2 0,8 2


((3,8-3,4)-1,96  , ( 3,8  3,4)  1,96  )  (0,279 , 0,520)
320 240 320 240

De acuerdo al resultado obtenido hay una diferencia positiva entre los

pesos de los niños y de las niñas: 0,279 < 1 -  2 < 0,520

Luego el peso medio de un niño supera como mínimo en 0,279 Kg, como

máximo, en 0,52 Kg a las niñas, con una probabilidad de 95%.

Indicador 6: Realizan prueba de hipótesis usando métodos para ello.

Ejercicio 9 El tiempo promedio de duración de 100 ampolletas LED


producidos por una compañía resulta ser de 1570 horas, con una
desviación típica de 120 horas. Si µ es la duración media de todas las
ampolletas producidas por la compañía, comprobar la hipótesis de
que la media
Poblacional es igual a 1.600 horas contra la hipótesis alternativa de
que la media poblacional difiere de 1.600 horas con un nivel de
significación de 0.05.

1- Hipótesis nula  = 1600 hrs.

Hipótesis alternativa  <>1600 hrs. (Bilateral)

2- Nivel de significancia: a=0,05.

3- Para trabajar con tablas normalizadas, se utiliza z en lugar de x

x
z

n

Por otro lado z  / 2 será tal que el área bajo la normal a su derecha sea

 / 2 y - Z / 2 será tal que el área bajo la normal a su izquierda sea  / 2

.Estos dos valores definen las zonas de aceptación y rechazo de la


Hipótesis Nula. Según donde caiga el valor Z calculado por la expresión

anterior, se producirá la aceptación o rechazo.

4- Ahora Calculamos:

1570  1600
z  2,5
120
100

5- Dado que -2,5< -Z 0, 025 se rechaza la Hipótesis Nula, luego la duración

media de las ampolletas Led es significativamente menor que 1600 horas.

Indicador 7: Realizan prueba de hipótesis para la diferencia entre


medias.

Ejercicio 10: Una industria farmacéutica está interesada en reducir el


tiempo de malestares que produce un medicamento probando un
nuevo ingrediente. Se prueban dos fórmulas; la fórmula 1 tiene el
contenido químico estándar y la fórmula 2 tiene el nuevo ingrediente
que tiende a reducir el tiempo de malestares iniciales generados por la
ingesta de dicho medicamento. De la experiencia se sabe que la
desviación estándar del tiempo de reacción es de 8 minutos y esta
variabilidad inherente no debe verse afectada por la adición del nuevo
ingrediente. Se prueba el medicamento con la fórmula 1 en 35
pacientes y otros 35 pacientes con la fórmula 2 del medicamento. Los
dos tiempos de reacción molesta muestrales son 116 minutos para la
fórmula 1 y 112 minutos para la fórmula 2. ¿A qué conclusión puede
llegar la industria farmacéutica sobre la eficacia del nuevo ingrediente,
al nivel de significancia 0,01?


La variable x (media muestral), sigue una distribución: N (  , siendo 
n
la media poblacional,  la desviación típica poblacional, n el tamaño de la

muestra y la desviación típica de la media muestral.
n
X1= tiempo de reacción de la fórmula 1
X1~ Desc ( 1 ,  1  8)
X2= tiempo de reacción de la fórmula 2
X2~ Desc  2 ,  1  8)
X 1 - X 2 ~N ( 1   2 ,  1 / n1   2 / n1   2 / n2 )
2 2 2

X1= 116 minutos


X1= 112 minutos
n 1= n2  35
  0,01
ho : 1   2  0
h1 : 1   2 > 0
De acuerdo a la tabla observamos que Zc = 2,33
x1  x 2 (116  112
Zo   Z0   2,09
1  2
2 2
1

1
 8
n1 n2 35 35
La verdadera probabilidad de cometer error de tipo 1 es de 0,01831. Es decir
mayor que la aceptable.

Entonces decidimos aceptar la Hipótesis Nula. No hay evidencia suficiente como


para demostrar que el tiempo de reacción disminuye significativamente.

Indicador 8: Determinan tamaños de muestras aleatorias simples y


estratificadas.

Ejercicio 11.
Para llevar a cabo el análisis de las prestaciones de salud en un hospital de
alta afluencia de pacientes (200.000, en concreto) se desea realizar una
encuesta para determinar el gasto medio por paciente. Se ha decidido
aceptar un error máximo en el gasto medio de 30 M$. Suponiendo una
desviación estándar de la población de 200 M$ y un nivel de confianza del
95%, obtenga el tamaño adecuado de la muestra.

Solución:

Se debe utilizar la fórmula para poblaciones infinitas ya que se tiene una


población mayor a 100.000, dado que se supone que un nivel de confianza del
95%, el valor de Z será ± 1,96. Sustituyendo cada uno de los valores.

z 2 2 1,96 2 * 200 2
n 2   170,74  171
e 30 2

Entonces decimos que se obtiene un tamaño adecuado de la muestra de 171.

Ejercicio 12.

La cantidad de farmacias en una determina zona turística consta de


4.200. Se sabe que 1.150 de estas farmacias corresponden a la Cadena
A, 2.120 son de la Cadena B y 930 a la Cadena C. ¿Cuál debe ser el
tamaño de cada estrato si se desea obtener una muestra de
aproximadamente 500, utilizando el criterio proporcional?

Para el criterio proporcional utilizamos la siguiente fórmula:

Ni
ni  n
N

N1 1150
n1  n 500  137
N 4200

N2 2120
n2  n 500  252
N 4200
N3 930
n3  n 500  111
N 4200

Entonces podemos decir que para la cadena “A” el tamaño del estrato es de 137,

para la cadena “B” el tamaño del estrato es de 152 y para la cadena “C” el tamaño

del estrato es de 111.


Bibliografía

Contenidos de Curso Estadística para la Gestión Semanas 1, 2, 3, 4, 5 ,6 ,7

y 8 Plataforma Web IACC 2018