Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INTEGRANTES:
-Palomino Robles, José Eduardo
-Miranda Regalado, Danny Ángelo
-Ramos Quispe, Ruth Karina
-Lloclla Torres, Lissie Shantall
-Salazar Zapata, Diego Alexis
-Meneses Arnao, Sonaly Norka
DOCENTE:
ERICK AUGUSTO REYES MARTINEZ
LIMA-PERÚ
2023
ÍNDICE
INDICE
INTRODUCCIÓN: .................................................................................................................. 3
RESUMEN: ................................................................................................................................ 4
CAPITULO 1 ........................................................................................................................... 5
Antecedentes/Descripción del trabajo .................................................................................. 5
Problema central del trabajo................................................................................................. 6
Justificación de la investigación........................................................................................... 7
Objetivos Generales/ Específicos ......................................................................................... 7
4.1. O. GENERAL: ......................................................................................................... 7
4.2. O. ESPECÍFICO: ..................................................................................................... 7
CAPÍTULO 2 ........................................................................................................................... 8
2.1. Conceptos básicos Estadísticos: Identificación de la población, muestra, unidad de
análisis.................................................................................................................................. 9
2.1.1. Población ................................................................................................................ 9
2.1.2 Muestra.................................................................................................................... 9
2.1.3. Unidad de estudio................................................................................................. 10
2.1.4. Variables de estudio y tipos de variables ............................................................. 10
3.1 TABLAS DE FRECUENCIA PARA LA VARIABLE CUALITATIVA ................... 10
5. Distribución Muestral .................................................................................................... 22
6. Intervalos de Confianza.................................................................................................. 24
CAPÍTULO 3 ......................................................................................................................... 29
Pruebas de Hipótesis Estadísticas y análisis de resultados ................................................ 29
CAPÍTULO-4......................................................................................................................... 29
4.1. CONCLUSIONES: ..................................................................................................... 38
4.2. RECOMENDACIONES: ............................................................................................ 38
4.3. REFERENCIAS BIBLIOGRÁFICAS: ....................................................................... 38
INTRODUCCIÓN:
El mercado de agua embotellada en Perú tiene un gran potencial de crecimiento y
rentabilidad debido al bajo consumo per cápita y a la falta de garantías de acceso a
agua pura a través de la infraestructura de agua potable del país. Es crucial realizar un
control de calidad riguroso en las diferentes fábricas del país, tanto en la producción
como en el embotellado del agua. Además, es importante buscar nuevas formas de
envasar el agua para contribuir a la reducción de la contaminación y prolongar la fecha
de caducidad.
Durante el proceso, trabajamos con una tabla de datos que contiene información de las
diferentes fábricas de Perú, con el objetivo de obtener resultados más precisos y buscar
la solución óptima.
CAPITULO 1
Como estudiantes del curso de estadística y probabilidades II, nos interesa realizar un
análisis estadístico utilizando indicadores provenientes de diferentes fuentes de
información, como canales de información, revistas, noticias, entre otros. Esto nos
permitirá aplicar los conceptos y temas desarrollados en el curso a situaciones reales y
actuales.
4.1. O. GENERAL:
● Mejorar el uso de consumo de agua y evitar el desperdicio en exceso
que la sociedad realiza en la mayoría de situaciones.
● Evaluar los tipos de envases utilizados para el depósito de agua.
4.2. O. ESPECÍFICO:
● Dar a conocer en cada capítulo las evaluaciones estadísticas que
presenta en cada caso.
CAPÍTULO 2
El análisis y la toma de datos se tomaron en todas las fábricas del país recogiendo la
siguiente base de datos:
2.1.1. Población
El conjunto de todas las unidades de estudio del cual se desea obtener una muestra
que permita recopilar información selecta y sustancial, para la presente
investigación; está formado, en términos generales, por las Fábricas de
elaboración de embotellados de agua mineral en el Perú.
2.1.2 Muestra
En relación con la muestra mencionada anteriormente, se trata de una parte
representante de la población en cuestión. En este caso, se consideran 40 fábricas de
embotellado de agua mineral en el Perú como el subconjunto de elementos para el
estudio. Estás fábricas fueron seleccionadas mediante un muestreo aleatorio, lo que
significa que todos los elementos de la población previamente especificados tienen la
misma probabilidad de ser seleccionados al azar.
2.1.3. Unidad de estudio
En este escenario particular, la unidad de análisis seleccionada es una Fábrica de
embotellado de agua mineral en el Perú. Esta fábrica se convierte en la unidad de
estudio a partir de la cual se recopilan datos e información sobre características y
variables específicas, estos datos son útiles para comprender y explicar fenómenos
reales relacionados con la industria del embotellado de agua mineral.
TIPO DE
ENVASE fi hi Pi
Total 40 1 100%
Donde:
hi=Frecuencia Relativa
Pi= Porcentaje
GRAFICO CIRCULAR
Donde:
Grafico Circular
12%
48% Carton
40% Vidrio
Plastico
fi = Frecuencia Absoluta (conteo)
hi=Frecuencia Relativa
Pi= Porcentaje
GRAFICO DE BARRAS
Localizacion de la fabrica
20
18
16
14
12
10
8
6
4
2
0
LIMA AREQUIPA TRUJILLO
GRAFICO CIRCULAR
Grafico Circular
15%
40%
LIMA
AREQUIPA
45%
TRUJILLO
TABLAS DE FRECUENCIA PARA LA VARIABLE CUANTITATIVA
DISCRETA
Cantidad de
Producción
fi Fi hi Hi
(miles de litros)
Maq. A
8 2 2 0.05 0.05
10 4 6 0.1 0.15
11 2 8 0.05 0.2
12 7 15 0.175 0.375
13 4 19 0.1 0.475
14 2 21 0.05 0.525
15 8 29 0.2 0.725
16 4 33 0.1 0.825
17 4 37 0.1 0.925
18 2 39 0.05 0.975
20 1 40 0.025 1
TOTAL 40 1
HISTOGRAMA
9
8
7
6
FRECUENCIA
5
4
3
2
1
0
8 10 11 12 13 14 15 16 17 18 20
MARCA DE CLASE
TABLA 4: Cantidad de Producción (miles de litros) Maq. B
Cantidad de
Producción
fi Fi hi Hi
(miles de litros)
Maq. B
7 1 1 0.025 0.025
8 1 2 0.025 0.05
9 1 3 0.025 0.075
10 6 9 0.15 0.225
11 1 10 0.025 0.25
12 6 16 0.15 0.4
13 5 21 0.125 0.525
14 2 23 0.05 0.575
15 12 35 0.3 0.875
16 3 38 0.075 0.95
17 1 39 0.025 0.975
18 1 40 0.025 1
TOTAL 40 1
HISTOGRAMA
14
12
10
FRECUENCIA
0
7 8 9 10 11 12 13 14 15 16 17 18
MARCA DE CLASE
TABLA 5: Cantidad de Envase (Por Lote)
Cantidad de
Envase (Por fi Fi hi Hi
Lote)
720 1 1 0.025 0.025
730 1 2 0.025 0.05
750 2 4 0.05 0.1
760 1 5 0.025 0.125
770 1 6 0.025 0.15
780 4 10 0.1 0.25
790 3 13 0.075 0.325
800 2 15 0.05 0.375
850 1 16 0.025 0.4
860 1 17 0.025 0.425
880 2 19 0.05 0.475
890 7 26 0.175 0.65
900 3 29 0.075 0.725
910 1 30 0.025 0.75
950 5 35 0.125 0.875
970 1 36 0.025 0.9
990 3 39 0.075 0.975
998 1 40 0.025 1
TOTAL 40 1
HISTOGRAMA
6
FRECUENCIA
0
720 730 750 760 770 780 790 800 850 860 880 890 900 910 950 970 990 998
MARCA DE CLASE
OJIVA
Cantidad de
Envases fi Fi hi Hi
Defectuosos
7 6 6 0.15 0.15
8 8 14 0.2 0.35
9 9 23 0.225 0.575
10 8 31 0.2 0.775
12 3 34 0.075 0.85
13 4 38 0.1 0.95
14 1 39 0.025 0.975
15 1 40 0.025 1
TOTAL 40 1
HISTOGRAMA
10
7
FRECUENCIA
0
7 8 9 10 12 13 14 15
MARCA DE CLASE
TABLA 6: Cantidad de camiones (Reparto)
Cantidad
de
fi Fi hi Hi
camiones
(Reparto)
3 12 12 0.3 0.3
4 14 26 0.35 0.65
5 10 36 0.25 0.9
6 4 40 0.1 1
TOTAL 40 1
HISTOGRAMA
16
14
12
FRECUENCIA
10
0
3 4 5 6
MARCA DE CLASE
MEDIA 13.75
MEDIANA 14 L= 20
MODA 15
VARIANZA 13.2
DESVIACION
3.63318042
ESTANDAR
COEF. DE
0.2642313 = 13.75
VARIACION
Cantidad de
Producción
fi Fi hi Hi xi*fi
(miles de litros)
Maq. B
7 1 1 0.025 0.025 7
8 1 2 0.025 0.05 8
9 1 3 0.025 0.075 9
10 6 9 0.15 0.225 60
11 1 10 0.025 0.25 11
12 6 16 0.15 0.4 72
13 5 21 0.125 0.525 65
14 2 23 0.05 0.575 28
15 12 35 0.3 0.875 180
16 3 38 0.075 0.95 48
17 1 39 0.025 0.975 17
18 1 40 0.025 1 18
TOTAL 40 1 523
MEDIA 13.075
MEDIANA 13 L= 20
MODA 15
VARIANZA 13
DESVIACION
3.60555128
ESTANDAR
COEF. DE
0.27575918 = 13.075
VARIACION
MEDIA 864.2
MEDIANA 890 L= 20
MODA 890
VARIANZA 8317.86928
DESVIACION
91.2023535
ESTANDAR
COEF. DE
0.10553385 = 864.2
VARIACION
Cantidad
de Envases fi Fi hi Hi xi*fi
Defectuosos
7 6 6 0.15 0.15 42
8 8 14 0.2 0.35 64
9 9 23 0.225 0.575 81
10 8 31 0.2 0.775 80
12 3 34 0.075 0.85 36
13 4 38 0.1 0.95 52
14 1 39 0.025 0.975 14
15 1 40 0.025 1 15
TOTAL 40 1 384
MEDIA 9.6
MEDIANA 9 L= 20
MODA 9
VARIANZA 8.57142857
DESVIACION
2.92770022
ESTANDAR
COEF. DE
0.30496877 = 9.6
VARIACION
Cantidad
de
fi Fi hi Hi xi*fi
camiones
(Reparto)
3 12 12 0.3 0.3 36
4 14 26 0.35 0.65 56
5 10 36 0.25 0.9 50
6 4 40 0.1 1 24
TOTAL 40 1 166
MEDIA 4.15
MEDIANA 4 L= 20
MODA 4
VARIANZA 1.66666667
DESVIACION
1.29099445
ESTANDAR
COEF. DE
0.311083 = 4.15
VARIACION
5. Distribución Muestral
a. Distribución Muestral para la media con varianza conocida
Enunciado:
Se extrae una muestra aleatoria de 40 elementos de las fábricas de agua
del país donde se sabe que la cantidad de camiones de reparto tiene una
media 𝜇 = 4.15. Y una desviación estándar σ = 1.29. Cuál es la
probabilidad de que la media muestral sea superior a 5.
5 − 4.15
𝑃[𝑥̅ ≤ 5] = [ 1.29 ]
√40
𝑃[𝑥̅ ≤ 6] = [4.17]
𝑃[𝑥̅ ≤ 6] = 1
𝜇 = 4.15,
𝜎 = 1.29,
𝑛 = 40
𝑃[𝑥̅̅> 5] = 1 − 𝑃[𝑥̅̅< 5]
𝑃[𝑥̅̅> 5] = 1 − [ 5 – 4.15] /1.29 /√40
𝑃[𝑥̅̅> 5] = 1 - [4.17]
𝑃[𝑥̅̅> 5] = 0
𝐵−µ 𝐴−µ
P[A≤𝑥≤B]= [ σ ]-[ σ ]
√𝑛 √𝑛
Reemplazamos con los datos:
890−846,2 850−846,2
P[850≤𝑥≤890]= [ 80,9 ]-[ 80,9 ]
√40 √40
P[850≤𝑥≤890]= [3,42] – [0.29] = [0,99969] – [0,61409]
P[790≤𝑥≤890]= 0,3856
𝑃(𝑥>0.05) = 1 − 𝑃(0.88)
𝑃(𝑥>0.05) = 1 − 0.81057 = 0.18943
Maq. A Maq.B
𝑃1 = 20% 𝑃2 = 25%
𝑛1 = 40 𝑛2 = 40
𝑄1 = 1 − 0,20 = 0,8 𝑄2 = 1 − 0,25 = 0,75
Cálculo:
𝑃1 (1 − 𝑃1 ) 𝑃2 (1 − 𝑃2 )
𝜎𝑝1−𝑝2 = √ +
𝑛1 𝑛2
0,2(0,8) (0,25)(0,75)
𝜎𝑝1−𝑝2 = √ +
40 40
𝜎𝑝1−𝑝2 = 0,093
Calculando Z calculado:
Z=1,08
En la tabla sería el valor de 0,85993
𝑃(𝑝1−𝑝2<0,05)=0,5−0,85993
𝑃(𝑝1−𝑝2<0,05)=−0,35992
6. Intervalos de Confianza
1 + 0.90
𝑍1−𝛼/2 = = 0.95 → 1.64 𝑇𝑎𝑏𝑙𝑎 𝑍
2
2.8262 2.5762
(13.75 − 13.075) − 1.64 ∗ √ + ≤ 𝑢1 − 𝑢2
40 40
2.8262 2.5762
≤ (13.75 − 13.075) + 1.64 ∗ √ +
40 40
−0.317 ≤ 𝑢1 − 𝑢2 ≤ 1.667
Interpretación: Con un nivel de confianza del 90% la diferencia de las
medias está comprendido desde -0.317 y 1.667 de unidades producidas.
La media de producción de Maq.1 es mayor a la cantidad de
producción de Maq.2.
d. Intervalo de confianza para la diferencia de medias con varianza
desconocida pero iguales, usando los 11 primeros datos.
Una empresa de producción de agua desea escoger una máquina que
pueda producir mucho más: Maq.A y Maq.B. Se obtuvieron 11 y 10
muestras de la Maq.A y Maq.B respectivamente.
Maq.A: 13, 12, 10, 13, 15, 8, 10, 10, 12, 12, 12
Maq.B: 15, 12, 8, 12, 7, 9, 15, 13, 15, 10
Estime mediante un intervalo de confianza del 95% la diferencia entre los
promedios de envases defectuosos. ¿Cuál de las dos máquinas deberían
escoger?
Maq.A Maq.B
𝑛1 = 11 𝑛2 = 10
𝑥̅1 = 11.545 𝑥̅2 = 11.6
𝑠1 = 1.916 𝑠2 = 2.989 𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 = 11 +
10 − 2 = 19
1+0.95 (11−1)∗1.9162 +(10−1)∗2.9892
𝑡1−𝛼/2 = 2 = 0.975 𝑆𝑐2 = =
19
6.164
𝑇𝑎𝑏𝑙𝑎 𝑇 = 2.093
6.164 6.164
(11.545 − 11.6) − 2.093 ∗ √ + ≤ 𝑢1 − 𝑢2
11 10
6.164 6.164
≤ (11.545 − 11.6) + 2.093 ∗ √ +
11 10
−2.325 ≤ 𝑢1 − 𝑢2 ≤ 2.215
Interpretación: Con un nivel de confianza del 95% las diferencias de
las medias están comprendidas desde -2.325 y 2.215 de producción. La
media de la Maq.A es menor a la Maq.B.
𝑝1 𝑞1 𝑝2 𝑞2
(𝑝1 − 𝑝2 ) − 𝑍1−𝛼/2 √ + ≤ 𝜋1 − 𝜋2
𝑛1 𝑛2
𝑝1 𝑞1 𝑝2 𝑞2
≤ (𝑝1 − 𝑝2 ) + 𝑍1−𝛼/2 √ +
𝑛1 𝑛2
0.25(0.75) 0.4(0.6)
(0.25 − 0.4) − 1.96√ + ≤ 𝜋1 − 𝜋2
20 30
0.25(0.75) 0.4(0.6)
≤ (0.25 − 0.4) + 1.96√ +
20 30
−0.408 ≤ 𝜋1 − 𝜋2 ≤ 0.108
CAPÍTULO-4
ENUNCIADO A: Se quiere evaluar la cantidad de producción de la línea A si es mayor a 17
L para lo cual se toma una muestra de 40 datos y esta de promedio es de 13.75 L con una
desviación estándar de 2.83 L. Se conoce que el nivel de significancia es de 5%.
A) La prueba de hipótesis para la media con varianza conocida usando los 40 datos
Interpretación
Datos:
n = 40 Plantear la hipótesis
𝑥̅ = 13.75 𝐻0: 𝜇 ≥ 17
𝜎 = 2.83 𝐻1: 𝜇 < 17
𝜇 = 17
𝛼 = 5%
Calcular el valor e Z calculando:
̅−𝒖
𝒙
𝒁= 𝝈
√𝒏
𝟏𝟑. 𝟕𝟓 − 𝟏𝟕
𝒁= = −𝟕. 𝟐𝟔
𝟐. 𝟖𝟑
√𝟒𝟎
Calcular el valor de Z de la tabla:
El nivel de significancia de 5
En la tabla de distribución Z es de -1.65
B) La prueba de hipótesis para la media con varianza desconocida con la variable cantidad
de envase usando los 15 primeros datos Interpretación.
n = 18 Plantear la hipótesis
𝑥̅ = 871.56 𝐻0: 𝜇 = 800
𝑠𝑥 = 81.51 𝐻1: 𝜇 > 800
𝜇 = 800
𝛼 = 5%
Calcular el valor de T calculando:
𝑥̅ − 𝜇
𝑇 = 𝑠𝑥
√𝑛
871.56 − 800
𝑇= 81.51 = 3.72
√18
Calcular el valor de t de la tabla
El nivel de significancia es de 5%
1-𝛼 = 1-0.05 = 0.95
Grados de libertad n-1:18-1=17
Planteamiento:
𝑯𝟎: 𝑢1 = 𝑢2
𝑯𝟏: 𝑢1 < 𝑢2
(13,75 − 13,075)
𝑍=
√(2,83)² + (2,58)²
40 40
𝑍 = 1.12
Hallar el “Z” de la tabla de distribución normal
Datos:
α = 5%
Buscar en la tabla el valor 0.05
Entonces:
Z= -1.64
INTERPRETACIÓN: A un nivel de significación del 5%, existe evidencia para no rechazar
la hipótesis nula. Por lo tanto, el promedio de producción del agua mineral de la línea A es
menor que el de la línea B.
Línea
13 12 10 13 15 8 10 10 12 12
A
Línea
15 12 8 12 7 9 15 13 15 10
B
Se asume que las cantidades de producción son dos poblaciones iguales con distribución
normal. Con un nivel de significancia de 0,05. ¿Es la cantidad de producción promedio de
A mayor al promedio de B? Asuma varianzas poblacionales distintas.
𝑠𝑝2 = 27,54
Hallar el “t” calculado:
(𝑥̅1 − 𝑥̅2 ) − (𝑢1 − 𝑢2 )
𝑡=
1 1
𝑠𝑝2 (𝑛 + 𝑛 )
1 2
(11,5 − 11,6)
𝑡=
1 1
27,54 (10 + 10)
𝑡 = −0,013
Buscar en la tabla el valor 0.95. Por lo que nos arroja como resultado t= 1.711.
ENUNCIADO E: Una Empresa que produce agua mineral en el Perú afirma que su producto
tiene una participación del 45% en las bodegas. Para tomar una decisión al respecto de lo
afirmado se toma una muestra de 30 empresas que distribuyen su producción de agua en
diferentes establecimientos, pero se sabe que 10 establecimientos son bodegas.
¿Cuál es la decisión que se toma con un nivel de significancia 5%?
Datos: Hipótesis:
𝜋 = 0.45
p = 10/30 = 0.33 𝐻0 : 𝜋 = 0.45
n = 30 𝐻1 : 𝜋 ≠ 0.45
𝛼 = 0,05
(0.33 − 0.45)
𝑧= = −1,32
√0.45(1 − 0.45)
30
Calcular el valor de z de la tabla:
El nivel de significancia:5%
Se busca en la tabla de distribución normal:
𝛼 0,05
1 − 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒𝑟𝑖𝑎: 1 − = 0,975
2 2
• No rechazo Ho y rechazo H1
ENUNCIADO F: Se quiere saber que la proporción de todos los envases producidos por la
línea A es mayor a la proporción de los envases producidos por la línea B. De una muestra de
40 lotes se descubrió que 20 lotes fueron producidos en por la línea A y 15 lotes por la línea
B, utilizar un nivel de significancia del 5%.
F) La prueba de hipótesis para la diferencia de dos proporciones entre la producción de la
línea A y la línea B. Interpretación.
Línea A: Línea B:
𝑛1 = 40 𝑛2 = 40
20 15
𝑝1 = 40 = 0,5 𝑝2 = 40 = 0,375
Hipótesis:
𝐻0: 𝜋1 = 𝜋2
𝐻1: 𝜋1 > 𝜋2
Donde:
𝑥1 + 𝑥2 20 + 15
𝑝̅ = = = 0,438
𝑛1 + 𝑛𝑧 40 + 40
(0,5 − 0,375)
𝑧= = 0,797
√0,438(0,562) ( 1 + 1 )
40 40
ENUNCIADO G: Una empresa que supone que los precios de envase de agua mineral están
distribuidos normalmente con una varianza poblacional de 11,305 pero cree que ha
aumentado. Se toma una muestra de envases a los que los precios varían obteniéndose los
siguientes resultados en soles: 5 5 3 5 4 5 5 5 1 4 4 4 con esta información pruebe si lo que
se cree es cierto. Un nivel de significancia del 10%
G) La prueba de hipótesis para la varianza usando los 12 primeros datos. Interpretación.
DATOS
Calcular el X² calculado:
2
(𝑛 − 1)𝑠 2
𝑥 =
𝜎2
(11)1,424
𝑥2 = = 12,003
1,305
Calcular el valor de Chi-cuadrado de la tabla: El
nivel de significancia:10%
4.1. CONCLUSIONES:
● Beber agua mineral natural supone un gran beneficio para nuestra salud, ayudando a que
nuestro organismo funcione de la mejor manera posible.
● Tras el análisis, el material que más utilizan las empresas como envase es el cartón,
contamina menos, cuesta menos y prácticamente tiene las mismas fortalezas y puntos
positivos que el plástico
4.2. RECOMENDACIONES:
● Banco Finandina. (01 de Noviembre de 2019). Blog del Banco Finandina. Obtenido de
¿Qué es un intervalo de confianza y para qué se
utiliza?:https://www.bancofinandina.com/finanblog/noticias/2019/11/01/que-es-un-
intervalo-dec