Está en la página 1de 17

1.

Se desea evaluar el consumo medio de arroz en bolsa en los hogares del distrito
de El Porvenir, durante la próxima semana. Definir a su criterio para esta
investigación:
a) Población y tipo de población según criterios.

b) Variable y tipos de variables según criterios.

c) Unidad de análisis, unidad de muestreo, marco muestral, parámetro y


estimador.

2. Se desarrollará una investigación en el mes próximo en las pequeñas tiendas


del distrito de La Esperanza para medir el porcentaje de tiendas que están omisas a la
declaración jurada.
a) Señale la población y tipo de población según criterios.
b) Identifique la variable, unidad de análisis, unidad de muestreo, parámetro y
estimador.
c) Señale el tipo de investigación científica, según criterios.
3. En una industria química se cree que una cierta cantidad de impurezas en la materia
prima afecta la producción; en cada carga de materia prima se mide la cantidad de
impurezas en valores codificados.

[Lím inf Lím sup) Número

30 34 4
34 38 25
38 42 48
42 46 66
46 50 32
50 54 10
54 58 7

a) Complete la tabla de distribución de frecuencia.


Tabla. Distribución de frecuencias de las impurezas en cada carga de materia prima,
medida en valores codificados.

i [ Li Ls ) Xi fi = ni Fi hi % Hi %
1 [30 34 32 4 4 2.08 2.08
2 34 38 36 25 29 13.02 15.10
3 38 42 40 48 77 25.00 40.10
4 42 46 44 66 143 34.38 74.48
5 46 50 48 32 175 16.67 91.15
6 50 54 52 10 185 5.21 96.35
7 54 58] 56 7 192 3.65 100.00
Total 192   100.00  

b) Interprete: n5, F6, h3%, H4%


n5: En 32 cargas de materia prima se encontró que tenían impurezas entre 46 y menos de
50 en valores codificados.
F6: En 185 cargas de materia prima se encontró que tenían impurezas entre 30 y menos de
54 en valores codificados.
h3%: El 25% de las cargas de materia prima analizadas tenían impurezas entre 38 y menos
de 42 en valores codificados.
H4%: El 74.48% de las cargas de materia prima analizadas tenían impurezas entre 30 y
menos de 46 en valores codificados.

c) Represente la información con una gráfica adecuada.


Figura. Distribución porcentual de frecuencias de las impurezas de 192 cargas de materia
prima.
40.00
34.38
35.00

30.00
25.00
25.00

20.00
%

16.67
15.00 13.02

10.00
5.21
5.00 3.65
2.08
0.00
32 36 40 44 48 52 56
Impurezas en la materia prima

4.Se presenta a continuación la información respecto a la calidad de un producto, de


dos empresas dedicadas al mismo rubro.

Calidad Empresa
(Xi) A B
Mala 20 25
Regular 110 80
Buena 185 155
Excelente 70 35
a) Represente gráficamente esta información.
Figura. Unidades de producto de las empresas A y B en función de su calidad.
200 185

180
155
160
Unidades de producto

140
110
120
100 80
70 Empresa A
80 Empresa B
60
35
40 20 25

20
0
Mala Regular Buena Excelente
Calidad del producto

b ) Encuentre la moda para la calidad de la empresa A


Moda( Mo): Buena
Interpretación: La calidad más común de la empresa A es buena.
b) Encuentre la moda para la calidad de la empresa B.
Moda( Mo): Buena
Interpretación: La calidad más común de la empresa B es buena.

5. Se reporta a continuación las fallas de un proceso de producción para un producto,


según causas atribuibles.
Causa A B C D E F G H I J
atribuible
Número de fallas 2 5 8 10 46 4 56 62 7 5
a ) Represente gráficamente la información según criterio de Pareto
Para ello se determinó la frecuencia relativa porcentual simple y luego se realizó el diagrama
de Pareto.
Tabla. Número de fallas y su porcentaje para cada causa atribuible.

Causa atribuible Número de fallas hi%


A 2 1.0
F 4 2.0
B 5 2.4
J 5 2.4
I 7 3.4
C 8 3.9
D 10 4.9
E 46 22.4
G 56 27.3
H 62 30.2

Figura. Diagrama de Pareto, donde se muestra el porcentaje para cada causa atribuible.

H 30.2

G 27.3

E 22.4

D 4.9

C 3.9
Defecto

I 3.4

J 2.4

B 2.4

F 2.0

A 1.0

0.0 5.0 10.0 15.0 20.0 25.0 30.0 35.0

c) Encuentre la moda para la causa atribuible.

Moda( Mo): H

d) Interprete el principio de Pareto para esta información.


Interpretación: De las 10 fallas (A-J), aproximadamente 2 de ellas (20%) afectan al resto del
proceso.

6. Sea X una variable que denota la demanda semanal de gas propano (en miles de
galones) de una instalación particular es una variable aleatoria continua X, con función de
densidad de probabilidad:
k (1−1/ x 2 ) 1< x <2
f(x)= { 0 Otros casos

a) Determine el valor de la constante k para que f(x) sea una función de


probabilidad
Condición: para que f(x) sea una función de densidad de probabilidad de la variable
aleatoria X, la integral desde 1 hasta 2 debe ser igual a la unidad.
2 2 2

∫ k 1− x12 dx=¿∫ kdx−k ∫ x12 dx=kx −k −1


( ) x
k
=kx + ¿
x ( )
1 1 1

2
1 1 2 1 1
∫k
1
( 1−
x)2
x( ) (( ) ( ))
dx=¿ k x + ¿ 1=k 2+ − 1− =1 ¿
2 1

k =2
b) Estime la probabilidad de que en una semana cualquiera las ventas sean
menos de 1500 galones.
Los 1500 galones lo podemos representar como 1.5 mil de galones tal que 1 ≤ x ≤1.5
1.5
1 1 1
f ( 1 ≤ x ≤1.5 )=∫ 2∗ 1−
1
( x )
2 ((
dx=2 1.5+
1.5) ( ))
− 1+
1

f ( 1 ≤ x ≤1.5 )=0.333
La probabilidad para que en una semana cualquiera la venta sea menor a 1500 galones es de
0.333.
c) Estime la probabilidad de que en una semana cualquiera las ventas estén entre
1200 y 1800 galones.
1.2 ≤ x ≤1.8
1.8
1 1 1
f ( 1 ≤ x ≤1.5 )=∫ 2∗ 1−
1.2
( x )
2 ((
dx=2 1.8+
1.8)(
− 1.2+
1.2 ))
f ( 1.2 ≤ x ≤1.8 )=0.644
La probabilidad para que en una semana cualquiera la venta la venta esté entre 1200 y 1800
galones es de 0.333.

7. Suponga que en una empresa se conoce que la probabilidad de que un obrero sea
obeso es de p=0.20; diga
p=0.20 ,q=0.80
a) La probabilidad de que al elegir a siete obreros al azar se tenga exactamente dos
obesos.
n=7
2 5
Prob ( X =2 )=( 72 )∗( 0.20 ) ( 0.80 ) =0.275

b) La probabilidad de que al elegir a siete obreros al azar se tenga más de dos obesos.
n=7
Prob ( X ≥ 2 )=1−Prob ( X ≤1 )
De la Tabla de probabilidades acumuladas para la distribución binomial obtenemos
Prob ( X ≤ 1 )=0.5767 .
Prob ( X ≥ 2 )=1−0.5767=0.4233
c) Si se eligen 580 obreros al azar, cuántos de ellos serán no obesos.
n=580
0 580
Prob ( X =0 ) =( 580
0 )∗( 0.20 ) ( 0.80 ) ≈0

La probabilidad para que salga seleccionado una persona obesa es del 0%, esto significa que
no esto no ocurrirá, lo mismo pasaría con los no obesos. Es decir, no se sabría exactamente la
cantidad de no obesos.

8. Se conoce que llegan a una tienda de exhibición en promedio 2.9 clientes por hora.
Calcule la probabilidad de que:
λ=2.9
a) En 1 hora lleguen exactamente 2 cliente.

e−2.9∗2.92
Prob ( X =2 )= =0.2314
2!
b) En una hora cualquiera lleguen más de dos clientes.
Prob ( x ≥ 2 )=1−Prob ( x ≤ 1 )
De tabla Función de Probabilidad de Poisson Acumulado obtenemos que
Prob ( x ≤ 1 )=0.2146.
Prob ( x ≥ 2 )=1−0.2146=0.7854
c) Durante la atención en 30 minutos, lleguen menos de 2clientes.
El valor medio de ocurrencias sería la mitad de 2.9 ya que el tiempo es 30 minutos. Entonces
el nuevo valor de λ sería 1.45.
x
e−λ∗λ x e−1.45∗1.450 e−1.45∗1.451 e−1.45∗1.452
Prob ( x ≤ 2 )=∑ = + +
x=0 x! 0! 1! 2!

Prob ( x ≤ 2 )=0.8213

9). La vida media de cierta batería es de 20 meses, con una desviación estándar de 1.3
meses; Se supone que la duración sigue una distribución normal. ¿qué porcentaje de estas
baterías puede esperarse que tengan la siguiente duración:
x́=20 meses , s=1.3 meses
Estandarizando : μ=20 meses , σ=1.3 meses

a) Menos de 15 meses.
15−20
z= =−3.846
1.3
Prob ( z ≤−3.846 )=F (−3.846 )
Como para valores cercanos a -4 ya no se encuentran en tablas, se calculó utilizando una
función de Excel.

Por lo que el valor es aproximadamente 0: Prob ( z ≤−3.846 ) ≈ 0


∴ El 0% de las baterías se espera que tengan una duración menos de 15 meses.

c) Entre 20 a 25 meses.
20−20 25−20
z 1= =0; z 2= =3.846
1.3 1.3
Prob ( 0 ≤ z ≤ 3.846 )=F (3.486 )−F (0)
Como para valores cercanos a 4 ya no se encuentran en tablas, se calculó utilizando una
función de Excel.

Por lo que el valor es aproximadamente para Prob ( z ≤−3.846 ) ≈ 1.


De tabla obtenemos el valor para Prob ( z ≤0 )=0.5
Prob ( 0 ≤ z ≤ 3.846 )=1−0.5=0.5
∴ El 50% de las baterías se espera que tengan una duración entre 20 y 25 meses.
d) Más de 22 meses.
22−20
z= =1.538
1.3
Prob ( z ≥1.54 )=Prob ( z ≤−1.54 )

De tabla obtenemos el valor de Prob ( z ≤−1.54 ) =0.0618


∴ El 6.18% de las baterías se espera que tengan una duración más de 22 meses.

10) Obtener los siguientes valores tabulares de la distribución normal estándar


z  N(0, 1)
a) F(z<1.645) = 0.9505
b) F(z>-1.00) = F(z<1.00) = 0.8413
c)F(-∞ , z ¿=0 . 9678  z= 1.85
d)F(-z< Z< z) = 0.90  z= 1.65

11). Valores según tabla de Student.


a) n= 21 grados de libertad α= 0.05 t= 2.080 dos colas
b) n= 25 grados de libertad α= 0.05 t= 1.708 cola derecha
c) n= 60 grados de libertad α= 0.05 t= 2.000 dos colas
12). Según tabla chi cuadrado, con α=0.05
a) n= 3 grados de libertad α= 0.05 χ 2=¿ 9.35 dos colas
b) n= 12 grados de libertad α= 0.05 χ 2=¿ 21.03 cola derecha
c) n= 10 grados de libertad α= 0.05 χ 2=20.48dos colas

13). Tabla F de Snedecor con α en cola derecha.


a) α= 0.05 n1= 5 n2= 10 F= 3.33
b) α= 0.01 n1= 4 n2= 7 F= 7.85
c) α= 0.10 n1= 2 n2= 10 F= 7.56

14). Un fabricante de cigarrillos analiza el tabaco de dos marcas diferentes, para


determinar el contenido medio de nicotina, tomando para la prueba pequeños lotes de
cada una de las marcas.
Lote 1 2 3 4 5 6 7 8 9 10 11
Marca A 23 25 25 22 23 24 25 26 24 23
Marca B 29 28 25 27 26 26 28 27 28 26 29

Se determinó la meda y desviación estándar usando Excel, los valores se muestra en la tabla que
aparece a continuación.

Marca Marca B
Media( x́)
24.000 27.182

Desviación estándar (s) 1.2472 1.3280

n 10 11

a). Compare el contenido medio de nicotina entre las dos marcas para α=0.05
i) Formulación de Hipótesis
Ho: μ 1=μ2

H 1: μ1≠ μ2

ii) Nivel de significación


α =0.05
iii) Estadística de prueba
( 10−1 )∗1.24722+ ( 11−1 )∗1.3280 2
2
DE = =1.6650
10+11−2
24.000−27.182 −3.182
t= = =−5.643
0.5638
√ (1.6650 ) ( 101 + 111 )
iv) Valor tabular
Para α =0.05 →nivel de confianza 95 %
t (n¿ ¿ 1+n −2 ;α )=t
2 (19; 0.05)
=2.093 ¿

El valor calculado |t |=5.643 pertenece a la región de rechazo ( p<0.05).


v) Decisión
El valor calculado |t |=5.643 pertenece a la región derechazo para α=0.05 por consiguiente
se rechaza la igualdad de medias (p<0.05).
b). Compare el contenido medio de nicotina entre las dos marcas para α=0.01
i) Formulación de Hipótesis
Ho: μ 1=μ2

H 1: μ1≠ μ2

ii) Nivel de significación


α =0.0 1
iii) Estadística de prueba
( 10−1 )∗1.24722+ ( 11−1 )∗1.3280 2
D E2= =1.6650
10+11−2
24.000−27.182 −3.182
t= = =−5.643
0.5638
√ (1.6650 ) ( 101 + 111 )
iv) Valor tabular
Para α =0.0 1→ nivel de confianza 9 9 %
t (n¿ ¿ 1+n −2 ;α )=t
2 (19; 0.0 1)
=2. 861¿

El valor calculado |t |=5.643 pertenece a la región de rechazo ( p<0.0 1).


v) Decisión
El valor calculado |t |=5.643 pertenece a la región derechazo para α=0.01 por consiguiente
se rechaza la igualdad de medias (p<0.01).
c) Interprete los resultados.
 Para la primera prueba con un 95 % de confianza se rechazó la igualdad de medias,
además p<0.05, significa que hasta dicha prueba había diferencia estadística
significativa en el contenido de nicotina de las dos marcas.
 Para la segunda prueba con un 99% de confianza se rechazó también la igualdad de
medias, además p<0.01, significa que ahora la diferencia estadística es altamente
significativa en el contenido de nicotina de las dos marcas.

15). En un proceso químico de destilación se quiere estudiar la relación entre la pureza del
oxígeno (Y) producido en un proceso químico de destilación y el nivel de hidrocarburos (X)
presentes en el condensador principal de la unidad de destilación. Se realizan n=20
observaciones y se anotan los valores de las variables (X, Y) = (xi, yi), i=1, ..., 20
Observació 1 2 3 4 5 6 7 8 9 10
n
X 1.08 1.01 1.15 1.29 1.45 1.36 0.87 1.23 1.55 1.40
y 90.32 88.05 91.43 93.74 96.70 94.45 87.59 91.77 99.42 93.65

Observació 11 12 13 14 15 16 17 18 19 20
n
X 1.19 1.15 0.98 1.01 1.10 1.20 1.26 1.32 1.43 0.98
y 93.54 92.52 90.56 89.54 89.85 90.39 93.25 93.41 94.98 86.20
a). Haga el diagrama de dispersión.
Figura. Gráfico de dispersión de la pureza del O2 vs el nivel de hidrocarburo.
105

100

95
Pureza del O2

90

85

80

75
0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6
Nivel de Hidrocarburo

c) Estime e interprete el coeficiente de correlación.

n ∑ xy - ∑ x∑ y
r = 2 2
√(n ∑ x 2
- ( ∑ x ) )(n ∑ y 2 - ( ∑ y ) )
Utilizando Excel se calculó el valor de las sumatorias, a continuación, se presente el valor
de cada una de ellas.

∑ x 2=¿ 24.4619 ¿ ∑ x =24.01 n=20

∑ y2 =¿ 169721.443¿ ∑ y=1841.36 ∑ xy =2220.795


20∗( 2220.795 )−(24.01)(1841.36)
r= 2 2
√ (20∗( 24.4619 )− (24.01 ) )( 20∗( 169721.443 ) −( 1841.36 ) )
r =0.9276
∴ El coeficiente de correlación es positivo, esto significa que ambas variables varían en el
mismo sentido. Además, |r=0.9276|> 0.80 por lo que existe una correlación fuerte entre X e
Y.
c). Escriba el modelo de regresión lineal y el coeficiente de determinación.
La ecuación y el coeficiente de determinación se va determinar utilizando Excel, para ello
vamos agregar una línea de tendencia sobre la gráfica de dispersión.
Figura. Regresión lineal entre las variables Pureza del O2 y el nivel de hidrocarburo.
105

100

f(x) = 16.06 x + 72.79


95 R² = 0.86
Pureza del O2

90

85

80

75
0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6
Nivel de Hidrocarburo

Modelo: Y =16.056 X +72.792


Coeficiente de determinación: R2=0.8605
d). Interprete el valor de b1 y estime Y para un valor de x= 1.50.
 Interpretación de b1: En el modelo de regresión lineal b1 viene a ser la pendiente, el
cual representa el incremento de Y por cada unidad de X. En este caso b1=16.056
indica que, según este modelo al aumentar el nivel de hidrocarburo en 1 unidad,
existe un incremento en la pureza del O2 de 16.056.
 Valor de Y cuando X=1.50
Y =16.056 ( 1.50 )+72.792=96.876
16). La resistencia del papel utilizado en la fabricación de cajas de cartulina (Y) está
relacionado con la concentración de madera dura en la pulpa original (X). Bajo
condiciones controladas, una planta piloto fabrica 16 muestras con un lote diferente de
pulpa y mide la resistencia a la tensión. Los datos obtenidos son los siguientes:
Muestr 1 2 3 4 5 6 7 8 9
a
X 1.2 1.5 1.5 2.0 2.0 2.0 2.2 2.4 2.5
Y 105.2 117. 118.1 106.2 131.9 146. 146.8 133.9 131.0
4 9

Muestr 10 11 12 13 14 15 16
a
X 2.5 2.8 2.8 3.0 3.0 3.2 3.3
Y 133.0 125.1 125. 124.3 120.5 113. 112.1
1 7
a) Representar gráficamente los datos y comentar los resultados.
Figura. Representación de los datos mediante una nube de puntos.
160

150

140
Resistencia a la tensión

130

120

110

100

90

80
1 1.5 2 2.5 3 3.5
Concentración de madera


Observamos que los puntos ya no siguen una tendencia lineal, mas bien el modelo
se asemeja a un modelo cuadrático debido a que forma como una especie de arco o
parábola.
 Los datos se incrementan hasta un cierto valor que está entre 2 y 2.5, luego
comienzan a descender a medida que recorremos el eje X.
b) Ajustar un modelo de regresión cuadrático. Predecir la resistencia de una caja de
cartulina para x= 2.6.
Figura. Regresión cuadrática para la resistencia a la tensión en función de la
concentración de la madera en la pulpa.
160

150

140

Resistencia a la tensión
130 f(x) = − 23.81 x² + 109.82 x + 6.98
R² = 0.54
120

110

100

90

80
1 1.5 2 2.5 3 3.5
Concentración de madera

Modelo: −23.814 X 2+109.82 X +6.9827


c) Determine la concentración de madera que puede optimizar la resistencia.
Derivando la ecuación modelo e igualando a cero:
dy
=−47.628 X +109.82=0
dx
X =2.3058
∴ La concentración de madera en la pulpa que optimiza la resistencia es de 2.3058.

17) Unos investigadores llevaron a cabo un estudio para ver la forma en que diversas
características del concreto se ven afectadas por X1 = % de piedra caliza en polvo y X2
= proporción de agua y cemento puede afectar a la resistencia a la compresión (Y);
dicho estudio dio por resultado los datos que aparecen a continuación ;
X1= % de piedra caliza X2=proporción agua- Y = Resistencia
cemento
21 0.65 13.60
21 0.55 11.50
7 0.65 4.55
7 0.55 3.85
28 0.60 16.80
0 0.60 0.00
14 0.70 9.80
14 0.50 7.00
14 0.60 8.50

a). Escriba el modelo de regresión lineal y el coeficiente de determinación.


Para hallar le modelo regresión lineal y el coeficiente de determinación se utilizó el paquete
estadístico de Excel ‘Análisis de Datos’, luego la opción de ‘Regresión’.
Imagen. Regresión lineal múltiple para la resistencia a la compresión como función del %
de piedra caliza y la proporción cemento-agua.

Coeficiente de determinación: R2=0.9969

Ecuación: Y =b0 +b1 X 1 +b 2 X 2 =¿>Y =−8.3833+0.5988 X 1 +14 X 2


b). Interprete el valor de b1, b2.
 Interpretación de b1: la resistencia a la compresión se incrementa en 0.5988
unidades cuando la piedra caliza aumenta 1%, permaneciendo las demás variables
constantes.
 Interpretación de b2: la resistencia a la compresión se incrementa en 14 unidades
cuando la proporción agua-cemento se incrementa en 1 unidad, permaneciendo las
demás variables constantes.
c). Estime Y para un valor de x1= 12, x2= 0.57
Y =−8.3833+0.5988 ( 12 )+ 14 ( 0.57 )
Y =6.7823

También podría gustarte