Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Trabajo Final Estadística Inferencial PR
Trabajo Final Estadística Inferencial PR
TRABAJO APLICADO
INTEGRANTES:
SECCIÓN:
TURNO: Noche
LIMA-PERÚ
2020
Contenido
1 INTRODUCCIÓN ................................................................................................ 1
2 Objetivo .................................................................................................................. 2
3 Modelo de encuesta ............................................................................................... 2
4 Características de la base de datos ...................................................................... 2
4.1 Población ......................................................................................................... 2
4.2 Muestra ............................................................................................................ 2
4.3 Unidad de análisis ............................................................................................ 2
4.4 Variables .......................................................................................................... 2
4.5 Tipo de variables ............................................................................................2
5 Elaboración de las tablas de frecuencia para cada variable de estudio. .......... 3
6 Medidas de tendencia central............................................................................... 7
7 Medidas de dispersión .......................................................................................... 9
7.1 Varianza ..................................................................................................... 10
7.2 Desviación estándar ....................................................................................... 10
8 Cálculos realizados con la información obtenida (Problemas) ....................... 11
8.1 Intervalo de confianza para la media de una población ................................. 11
8.2 Intervalo de confianza para las medias de dos poblaciones .......................... 14
8.3 Prueba de hipótesis para la media de una población ..................................... 16
8.4 Prueba de Hipótesis para dos medias poblacionales ..................................... 18
8.5 Intervalo de confianza para la proporción de una población ......................... 19
8.6 Intervalo de confianza para la proporción de dos poblaciones ...................... 20
8.7 Prueba de hipótesis para la proporción de una población.............................. 21
8.8 Prueba de hipótesis para las proporciones de dos poblaciones ..................... 22
8.9 Intervalo de confianza para la varianza de una poblacion ............................. 23
8.10 Intervalo de confianza para la razón de dos varianzas poblacionales............ 24
8.11 Prueba de hipótesis para la varianza de una población.................................. 25
8.12 Prueba de hipótesis para la razón de dos varianzas poblacionales ................ 26
8.13 Prueba de bondad de ajuste. (Binomial o Poisson) ........................................27
8.14 Prueba de independencia ................................................................................29
9 Conclusiones y recomendaciones ....................................................................... 31
10 anexo 1 – Anexo 2 .................................................................................. 32-33-34
2
INTRODUCCIÓN
Muchas de estas bebidas gaseosas son además altamente azucaradas, por lo que
no solamente son otro factor para la obesidad sino que además pueden ser
perjudiciales para una dentadura sana. De hecho, en la placa dental hay una
bacteria que desdobla los azúcares contenidos en las gaseosas produciendo ácido
láctico que disuelve el esmalte dental y provoca caries.
Pero es que, además, muchos estudios que se han hecho al respecto han
demostrado una clara relación entre la diabetes y el consumo de bebidas
carbonatadas, es decir, que aquellas personas que consumen este tipo de bebidas
tienen más riesgo de desarrollar esta enfermedad. La razón de esto es que estas
bebidas tienen una gran cantidad de jarabe de maíz, un producto que contiene altos
niveles de fructosa, un azúcar que daña tejidos y células y que conlleva a la diabetes.
1
1
1. TITULO
Influencia del consumo de gaseosa en el peso de estudiantes de la UTP en el
mes de Setiembre.
2. OBJETIVO
Identificar la relación del peso con la cantidad de gaseosas que consume un
estudiante de la UTP (Sede Lima Centro).
3. MODELO DE LA ENCUESTA
Se ha encuestado a 60 estudiantes de la UTP (Sede Lima Centro) en el mes de
Setiembre del 2019, de la cual se ha obtenido una base de datos (Anexo1) y una
encuesta (Anexo2).
4.2 MUESTRA:
60 estudiantes de la UTP.
De estas seis variables se han analizado cuatro de ellas, donde dos son variables
cuantitativas y dos cualitativas:
2
5. ELABORACION DE TABLAS
10% 8% 8%
5%
5% 3% 2% 2%
0%
1 2 3 4 5 6 7 8 18
1 2 3 4 5 6 7 8 18
Conclusiones
3
2. VARIABLE: PESO
TIPO: CUANTITATIVA CONTINUA
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
Pesos 𝐱𝐢 𝐟𝐢 𝐅𝐢 𝐡𝐢 𝐇𝐢 𝐩𝐢 Pi
[46.00, 54.43> 50.215 6 6 0.10 0.10 10% 10%
[54.43, 62.86> 58.645 11 17 0.18 0.28 18% 28%
[62.86, 71.29> 67.075 17 34 0.28 0.57 28% 57%
[71.29, 79.72> 75.505 16 50 0.27 0.83 27% 83%
[79.72, 88.15> 83.935 7 57 0.12 0.95 12% 95%
[88.15, 96.58> 92.365 2 59 0.03 0.98 3% 98%
[96.58, 105.01] 100.795 1 60 0.02 1.00 2% 100%
TOTAL 60 1 100%
Fuente: Elaboración propia
Gráfico n°2
12 20%
10
7 15%
8 6
6 10%
4 1
2 5%
2
0 0%
[46.00, 54.43> [54.43, 62.86> [62.86, 71.29> [71.29, 79.72> [79.72, 88.15> [88.15, 96.58> [96.58, 105.01]
INTERVALO DE PESOS
Conclusiones
a) El 28% de estudiantes tienen un peso que se encuentra entre mayor o igual a 62.86
kg. y menor a 71.29 kg.
b) El menor número de estudiantes tienen un peso que se encuentra entre mayor o
igual a 96.85 kg. y menor a 105.01 kg.
c) El 10% de estudiantes tienen un peso que se encuentra entre mayor o igual a 46.00
kg. y menor a 54.43 kg.
4
3. VARIABLE: PREFERENCIA DE BEBIDA
TIPO: CUALITATIVA NOMINAL
TOTAL 60 1 100 %
Gráfico n°3
PREFERENCIA DE CONSUMO DE
GASEOSA
45%
28%
12% 13%
2%
5
Conclusiones
TOTAL 60 1 100%
SITUACION ECONOMICA
70%
60%
50%
40%
65%
30%
20% 30%
5%
10%
0%
BAJA MEDIA ALTA
6
Conclusiones
Media aritmética
∑k fi xi
i=1
x̅ =
n
179
X= = 2.98
60
2+2
Me = ( )=2
2
Interpretación: De todos los encuestados se puede ver que el 50% consume menos o
igual a 2 botellas de gaseosa.
7
Moda
Mo = Frecuencia mas alta (fi)
Mo = 1
Interpretación: De todos los encuestados se puede ver que la mayor cantidad
consume una (1) gaseosa.
VARIABLE: PESO
Pesos 𝐱𝐢 𝐟𝐢 Xifi
[46.00, 54.43> 50.215 6 301.29
[54.43, 62.86> 58.645 11 645.095
[62.86, 71.29> 67.075 17 1140.275
[71.29, 79.72> 75.505 16 1208.08
[79.72, 88.15> 83.935 7 587.545
[88.15, 96.58> 92.365 2 184.73
[96.58, 105.01] 100.795 1 100.795
TOTAL 60 4167.81
Mediana
Donde i n= 3
−F
i−1
Me = Li + c (2 )
fi
30 − 17
Me = 62.86 + 8.43 ( ) = 69.31
17
Interpretación: De todos los encuestados se puede ver que el 50% tiene un peso menor
o igual a 69.31 kg.
8
Moda
d1
Mo = Li + c ( )
d1 + d2
Donde
d1 = fi − fi−1
d2 = fi − fi+1
6
Mo = 62.86 + 8.43 ( ) = 70.09
6+1
Interpretación: De todos los encuestados se puede ver que el mayor peso se encuentra
entre 62.86 kg a 71.29 kg.
7. MEDIDAS DE DISPERSION
VARIABLE: CANTIDAD DE GASEOSAS
Xi fi 𝐗𝟐 X
1 19 19 19
2 16 64 32
3 8 72 24
4 5 80 20
5 5 125 25
6 2 72 12
7 3 147 21
8 1 64 8
18 1 324 18
TOTAL 60 967 179
∑𝑘𝑖=1 𝑋2 − 𝑖=1
s2 = 𝑛
(𝑛 − 1)
1792
967 −
60
59
432.983
s2 =
59
s2 =7.339
VARIABLE: PESO
Varianza
(∑𝑘 𝑓𝑋) 2
∑𝑘 𝑖=1
𝑖=1 𝑓𝑋 −
2
s2 = 𝑛
𝑛− 1
4167.812
297198.89 −
60
59
s2 = 130.31
Desviación
s = √v(x)
s = √130.31 = 11.42
10
8. PROBLEMAS
8.1 Intervalos de confianza para la media de una población
8.1.1 Problemas varianza poblacional conocida
Considere una población de estudiantes de la UTP, cuya población es de 20 estudiantes de la
cual consumen FANTA con respecto al aumento de peso, con una probabilidad del 90%, Hallar
la media de la población.
52 48 85 61 49 70 58 82 59 45
73 88 63 75 88 47 52 80 50 47
x̅ = x1+x2+x3+…+xn x=63.6
n
𝜎2=2019.04
𝜎 =14.8
IC(X ) : X Z0
Probabilidad
1-α = 0.90 α = 0.1 α/2 = 0.05
0,05 0,05
0.90
-1.65 1.65
Reemplazando
14.8
IC (μ) = 63.6 ± 1.65 x
√20
Interpretación
Con un nivel de confianza del 90% existe evidencia estadística para afirmar que la media
poblacional de estudiantes que toman la bebida FANTA está comprendida entre 58.14 y 69.06.
11
8.1.2 Problema de varianza poblacional desconocida y tamaño de muestra grande
Se conoce que personas de una localidad que toman COCA COLA ha tenido un aumento en su
peso con una media muestral de 62, de una muestra de 51 personas y una desviación estándar
de 7.5, encuentre la media con un intervalo de confianza del 95%.
DATOS
n=51
S=7.5
X=62
Intervalo de Confianza
1- α = 0.95 α/2 = 0.05 α = 0.025
0,025 0,025
0.95
-1.96 1.96
Reemplazando
7.5
IC (μ) = 62 ± 1.96 x
√51
IC (μ) = 62 ± 2.06
Interpretación
Con un nivel de confianza del 95% existe evidencia estadística para afirmar que la media
poblacional de personas de una localidad que toman COCA COLA está comprendida entre
59.94 Y 64.06.
12
8.1.3 Problemas de varianza poblacional desconocida y tamaño de muestra
pequeño
Se conoce que en cierta población de un distrito que consumen PEPSI COLA con respecto a su
peso se da con un intervalo de confianza del 98%, de una muestra de 18 personas. ¿Calcular la
media muestral?
62 80 70 52 65 75 75
78 54 75 72 79 56 46
53 105 58 60
x̅ = x1+x2+x3+…+xn = 67.5
n
Intervalo de confianza
0,01 0,01
0.98
-2.33 2.33
Desviación Estándar
𝑆2 = 200.5056
S=14.16
Reemplazando
14.16
IC (μ) = 67.5 ± 2.33 x
√18
Con un intervalo de confianza del 98% existe evidencia estadística para afirmar que la media
poblacional de un distrito que consume PEPSI COLA con respecto a su peso está comprendida
entre 59.72 y 75.28.
13
8.2 Intervalo de confianza para las medias de dos poblacionales
8.2.1 Varianzas poblacionales conocidas
1. Se tienen dos lugares que consumen dos diferentes tipos de gaseosas que son la COCA
KOLA y la INKA COLA que aumentan su peso con respecto a estas bebidas con una media
de 68 y 75 con valores poblacionales de 17 y 27 respectivamente, con desviaciones
estándar 13.57 y 15.78 . Hallar los límites entre los cuales se halla u1-u2 con un intervalo
de confianza de 97%.
Datos
Poblacional
uA = ? σ = 13.57 𝛔𝟐 = 184.21
uB = ? σ =15.78 𝛔𝟐 = 249.01
nA = 17 xA = 68
nB = 27 xB = 75
I.C = u1-u2
0,015 0,015
0.97
-2.17 2.17
Reemplazando
184.21 249.01
IC(uA-uB) = 68 – 75 ± 2.17 x √ + => √10.84 + 9.22 => √20.06 => 4.479*2.17
IC(uA-uB) = -7 ± 9.719
Se concluye que el intervalo con respecto al aumento de peso de las personas de ciertas
localidades que toman las bebidas COCA KOLA e INCA KOLA con un intervalo de confianza
de 97% está comprendidas entre -16.72 y 2.72.
14
8.2.2 Varianza poblacional desconocida y tamaño de muestra grande
1. Se tiene dos poblaciones que consumen las bebidas FANTA y PEPSI que aumentan su peso
lo cual se toma una muestra de 45 y 57 con desviación estándar de 4.5 y 5.8, los cuales se hizo
una encuesta con una media de 90 y 78. Hallar los límites entre los cuales se encuentran 𝑢1 −
𝑢2 con un intervalo de confianza de 95%.
DATOS
Poblacional
0,025 0,025
0.95
-1.96 1.96
10.001 ≤ 𝒖𝟏 − 𝒖𝟐 ≤ 13.999
Conclusiones
Con un intervalo de confianza del 95% se concluye que el intervalo con respecto al aumento
de peso de las personas de ciertas localidades que toman las bebidas FANTA y PEPSI está
comprendidas entre 10.001 y 13.999.
15
8.3 Prueba de hipótesis para la media de una población
8.3.1 Varianza poblacional conocida
1. Se verifica que en una empresa se consume la bebida COCA KOLA con relación al aumento
de peso con una media de 𝑢 37, lo cual la empresa cuenta con 22 empleados, y con una
varianza de 12, por lo que se obtiene una media de 45 personas, con un nivel de significancia de
0.05. ¿A qué conclusiones se puede llegar?
DATOS
Poblacional
𝒖=37
n=14
𝝈𝟐=20 𝝈 =4.47
x=45
1) Prueba de hipótesis
Ho: 𝑢 = 37
H1: 𝑢 ≠ 37
2) Nivel de confianza
1 - α = 0.05 α/2=0.025
3) Estadístico de prueba
45−37
z= z = 6.69
4.47/√14
4) Gráfico
-1.96 1.96
5) SE RECHAZA Ho
6) Con un nivel de significancia del 5%, existe evidencia estadística para afirmar que el consumo
de la bebida COCA KOLA y con relación al peso es diferente a la media.
16
8.3.2 Varianza poblacional desconocida con tamaño de muestra pequeña
1. En una bodega se verifica que el consumo de la bebida FANTA con relación al aumento de
peso, tiene una media 𝑢 es 23, por lo que se toma una muestra de 17 personas, con una
desviación estándar de 7.8, también se verifica que la media es de 30. ¿Qué conclusiones se
puede llegar con un intervalo de confianza de 95%?
DATOS
Poblacional
𝒖 = 23
n = 17
S = 7.8
X = 30
1) Prueba de hipótesis
Ho: 𝑢 = 23
H1: 𝑢 ≠ 23
2) Nivel de significancia
1 – α = 0.95 α =0.05 α/2=0.025
V=16
3) Estadístico de prueba
30−23
t = t = 3.7
7.8/√17
(n-1) gl.
4) Gráfico
17-1 = 16gl.
-2.1199 2.1199
5) SE RECHAZA Ho
6) Con un nivel de confianza del 95%, existe evidencia estadística para afirmar que el consumo
de la bebida FANTA con relación al aumento de peso no es una media de 37.
17
8.4 Prueba de hipótesis para dos medias poblacionales
8.4.1 Varianzas poblacionales conocidas
Se realiza un estudio estadístico de dos grupos de consumo de gaseosas en exceso de
COCAINKA para ello se ha encuetado a 30 personas. Su edad promedio fue de 21 años con
una desviación estándar de 0.5 años. Por otro lado, mi compañero del grupo de estadística
inferencial ha realizado otra encuesta a 40 personas. Se encontraron que la media es de 16
años con una desviación estándar de 0.3 años. Se requiere invertir en un nuevo estudio del
consumo de COCAINKA dado que las medias de cada uno fueron diferentes. Concluya si se
requiere un estudio estadístico adicional basándose en la prueba de hipótesis con alfa 0.05
Solución
Datos del problema
n1 = 30
n2 = 40
X1 = 21
X2 = 19
S1 = 0.5
S2 = 0.3
H0: µ1 = µ 2
H1: µ 1 ≠ µ2
Paso 4: Gráfico
-1.96 1.96
Paso 5: Se rechaza Ho
Paso 6: Decisión o conclusión
Interpretación: Con un nivel de significancia del 5%, existe evidencia estadística para afirmar
que la hipótesis nula en este caso no sería necesario invertir un nuevo estudio de COKAINKA.
18
8.5 Intervalo de confianza para la proporción de una población
Se selecciona una muestra aleatoria de 60 estudiantes de la UTP y se encuentra que 27
estudiantes prefieren beber la gaseosa Inka Kola. Encuentre el intervalo de confianza del
96% para la proporción de la población de estudiantes de la UTP (sede Lima Centro) que
prefieren consumir la gaseosa Inka Kola.
Solución
Datos del problema
n = 60 estudiantes
x = 27 estudiantes
𝐱 27
p= = = 0.45
𝒏 60
q = 1 – p = 0.55
Confianza
1 – α = 0.96 α = 0.04 α / 2 = 0.02
Gráfico
0,02
0.96 0,02
-2.05 2.05
Formula
Reemplazando
(0.45)(0.55) (0.45)(0.55)
(0.45) – (2.05)√ < π < (0.45) + (2.05)√
60 60
19
8.6 Intervalo de confianza para las proporciones de dos
poblaciones
Según la encuesta realizada en la UTP (sede Lima Centro) la gaseosa Inka Kola
sobrepasa en preferencia a la gaseosa Pepsi. Si se encuentra que 27 de 60 estudiantes
de la UTP prefieren la gaseosa Inka Kola y 7 de 60 estudiantes de la UTP prefieren
consumir la gaseosa Pepsi. Calcule un intervalo de confianza del 94% para la diferencia
de las proporciones de dos poblaciones de dichas marcas.
Solución
Datos del problema
Inka Kola Pepsi
nA = 60 estudiantes nB = 60 estudiantes
xA = 27 estudiantes xB = 7 estudiantes
PA = x/n = 27/60 = 0.45 PB = x/n = 7/60 = 0.11
1 – PA = 0.55 1 – PB = 0.89
Confianza
1 – α = 0.94 α = 0.06 α / 2 = 0.03
Gráfico
0,03
0.94 0,03
-1.88 1.88
Reemplazando
0.247 0.098
IC(πA – πB) = (0.45 - 0.11) ± (1.88)√ +
60 60
20
8.7 Prueba de hipótesis para la proporción de una población
Se está realizando una investigación sobre la cantidad de gaseosa que consumen los
estudiantes de la UTP (sede Lima Centro). Se ha tomado una muestra de 60 estudiantes
de y se ha encontrado que 17 de ellos consumen 4 o más gaseosas habitualmente.
Contrastar la hipótesis de que el porcentaje de estudiantes que consumen 4 o más
gaseosas es menor a 29% utilizando α=0,01.
Solución
Datos del problema
n = 60 estudiantes
x = 17 estudiantes
𝐱
p = = 17 = 0.28
𝒏 60
Paso 4: Gráfico
0.99
Zona de
0,01
de Ho
- 2.32
Paso 5: Se Acepta Ho
Paso 6:
Con un nivel de significancia del 1% existe evidencia estadística para firmar que el
porcentaje de los estudiantes de la UTP que consumen 4 o más gaseosas
habitualmente no es mayor a 29%.
21
8.8 Prueba de hipótesis para la proporción de dos
poblaciones.
Los estudiantes de la sede de Av. Arequipa de la facultad de UTP del centro de lima con
edades entre 18 a 60 años de edad. Con sus opiniones sobre el sobrepeso por consumir
mucho las bebidas de COCAINCA. Se presentó a dos muestras aleatorias de 300 hombres y
300 mujeres, 12 de los hombres opinan que al mes dos bebidas no generarían contrapeso.
Mientras 10 de las mujeres opinan que una bebida al mes no generaría contrapeso. Con un
nivel de confianza de 0.5 ¿se puede afirmar que hay evidencia estadística de que las opiniones
entre hombres y mujeres?
Solución
n1= 30 n2=30
Paso 1: Planteamiento de la hipótesis
X1= 12 X2= 10
Ho: µ1= µ 2
Hi: µ 1>µ2 12 10
Paso 2: Nivel de significación 𝒑𝟏 = 𝒑𝟐 =
30 30
p1 = 0.4 p2 = 0.33
∝ = 0.05
(p1−p2)−(π1−π2) (0.4−0.33)−(0)
𝒁𝑝 = 𝒁𝑝 = 𝒁𝒑 = 0.562
1 1 1 1
√(1−𝑝)( + ) √0.367(0−633)( + )
𝑛1 𝑛2 30 30
Paso 4: Gráfico
0.95
Zona de
Aceptación de
Ho 0,05
1.65
Paso 5: Se Acepta Ho
Paso 6: Con un nivel de significancia del 5%, existe evidencia estadística para afirmar que
hay evidencia estadística de que las opiniones entre hombres y mujeres son aceptables. La
proporción uno es a 0.4 mayor que la proporción dos que es 0.33.
22
8.9 Intervalo de confianza para la varianza de una población
1. En una empresa se identifica que el consumo de Inka Cola con relación a la edad de 18 y 29
años se toma una muestra de 15 personas, por lo que tiene una varianza de 2.77. Construir un
intervalo de confianza del 95% para la varianza
DATOS
Poblacional
𝒏 = 15
𝒔𝟐 = 2.77
IC: con un intervalo de confianza de: 1- α = 0.90 α =0.10 α/2 = 0.05
𝑰𝑪(𝝈𝟐) ∶
Reemplazando:
(14) 𝒙 2.7
(14) 𝒙 2.7 < 𝝈𝟐 <
26.119 5.629
4.113 < 𝝈𝟐 < 19.083
2.028 < 𝝈𝟐 < 4.369
Conclusiones
Con un nivel de significancia de que la varianza de las personas que toman Inka Cola de las
edades entre 18 a 29 años en la UTP Lima Centro son de 2.028 a 4.369 litros
23
8.10 Intervalo de confianza para la razón de dos varianzas
poblaciones
En ciertas poblaciones C y D, que toman gaseosas con relación a la edad de entre 18 a 20 años, por lo
que se toma una muestra de 2 poblaciones que son de 5 y 6, por lo que C tiene una varianza de 0.447 y
la población D una varianza de 0.548. Determinar el intervalo de confianza al 95% para el cociente de
varianza.
DATOS: Poblacional
Población C
𝑛=5
𝑠2 = 0.447
Población D
𝑛=6
𝑠2 = 0.548
IC: con un intervalo de confianza de: 1- α = 0.95 α =0.05 α/2=0.025
Reemplazando: 4 .6
0.090 < 𝑺𝟐< 6.228
𝟏
Conclusiones
Con un 95% de confianza de que la población C y D que consumen gaseosa con relación a las
edades de 18 a 20 años es de 0.090 y 6.288 litros
24
8.11 Prueba de hipótesis para la varianza de una población
Los alumnos que fueron encuestados de la UTP Av. Arequipa que consumen la bebida de Coca Cola tiene una
desviación estándar de 2.15. Según la encuesta realizada a 14 alumnos con una desviación estándar de 1.95.
Se puede concluir con un nivel de confianza al 95% que la desviación de los consumidores de la bebida Coca
Cola que consumen los alumnos de la UTP es mayor al de la de consumidores de la bebida estándar?
Solución:
𝐧 = 14 ; 𝒔 = 1.95
𝐻0: 2 ≤ 2.15
𝐻1 : 𝜎2 > 2.15
α = 0.05
Paso 4: Gráfico
(n-1) gl.
12-1 = 11gl.
0.99
Zona de
Aceptación 0.01
H0
𝑿𝟐 = 22.362
Paso 5: Se Rechaza Ho
Paso 6: A un nivel de significancia del 5% existe evidencia estadística para afirmar que la
desviación estándar. de los consumidores de la bebida Coca Cola es mayor que la desviación
estándar de los consumidores en general.
25
8.12 Prueba de hipótesis para la razón de dos varianzas
poblacionales
Las siguientes tablas son de cantidades de volúmenes en litros de dos marcas de
gaseosas que los alumnos de la UTP consumen a la semana
COCA 7 6 6 5 4 6 8 8
INKA 9 8 6 6 8 7 7
A un nivel de significancia del 5% existe homogeneidad de varianza entre la cantidad de
litros de las marcas consumidas por los alumnos de la UTP
Paso 1:
𝑯𝟎 ∶ 𝝈𝟐 = 𝝈𝟐
𝑨 𝑩
𝑯𝟏 ∶ 𝝈𝟐 ≠ 𝝈𝟐
𝑨 𝑩
Coca Cola (A) INKA KOLA (B)
Paso 4: Gráfico
𝟏 . 𝟏
= 5.12 = 5.70
𝑭 (6,7) 𝑭 (7,6)
26
Paso 5: Se rechaza Ho
Paso 6: A un nivel de significancia del 5% existe evidencia
estadística para afirmar que la evidencia estadística de la
varianza no ha disminuido.
27
8.13 Prueba de bondad de ajuste (Para distribución Poisson)
La cantidad de enfermedades a causa del consumo de gaseosas en los estudiantes
sigue una distribución de Poisson. En el siguiente cuadro presentamos para una muestra
de 80 días del año 2019. ¿Se puede afirmar que la cantidad de enfermedades causadas
por consumo de gaseosa por día, sigue una distribución Poisson?
Cantidad de enfermedades (X) Número de días (fo)
0 34
1 25
2 11
3 7
4 3
Solución:
𝒆−𝝁 . 𝝁𝒙
Distribución de Poisson: 𝒇 (𝒙) = 𝒙!
n = 80 ; 𝝁= ?
∑ 𝒙𝒇𝒐 (0)(34) + (1)(25) + (2)(11) + (3)(7)
𝝁= = =𝟏
𝒏 80
𝑒−1.(1)0
f (x=0) = = 0.27
0!
𝑒−1.(1)1
f (x=1) = = 0.46
0!
𝑒−1.(1)2
f (x=2) = = 0.23
0!
28
f (x>3) = 0.08
29
x fo Probabilidad fe
0 34 0.368 x 80 29.44
1 25 0.368 x 80 29.44
2 11 0.184 x 80 14.72
>3 10 0.08 x 80 6.4
80
Calculando:
∑(𝒇𝒐 − 𝒇𝒆)𝟐
𝒙𝟐 =
𝒇𝒆
(𝟑𝟒 − 𝟐𝟗. 𝟒𝟒)𝟐 (𝟐𝟓 − 𝟐𝟗. 𝟒𝟒)𝟐 (𝟏𝟏 − 𝟏𝟒. 𝟕𝟐)𝟐 (𝟏𝟎 − 𝟔. 𝟒)𝟐
𝒙𝟐 = + + + = 𝟒. 𝟒𝟎𝟒
𝟐𝟗. 𝟒𝟒 𝟐𝟗. 𝟒𝟒 𝟏𝟒. 𝟕𝟐 𝟔. 𝟒
Paso 4: Gráfico
(k-m-1) gl.
(4-1-1) = 2 gl.
0.95
Zona de
Aceptación
0.05
H0
𝑿𝟐 = 5.991
30
8.14 Prueba de independencia
SEXO
PARAMETRO
HOMBRE MUJER
Más de 14 litros 18 15
Menos de 14 litros 26 21
SEXO TOTAL
PARAMETRO
HOMBRE MUJER
Más de 14 litros 18 15 33
Menos de 14 litros 26 21 47
TOTAL 44 36 80
Solución:
Paso 1: Planteamiento de la hipótesis.
Ho: la cantidad de gaseosas consumidas en litros no es independiente del sexo.
H1: la cantidad de gaseosas consumidas en litros es independiente del sexo.
Paso 2: Nivel de significancia.
α = 0.01
𝟒(𝟒𝟕) 𝟑(𝟒𝟕)
e3 = = 25.85 e4 = = 21.15
𝟖𝟎 𝟖𝟎
31
Luego tenemos:
SEXO
PARAMETRO
HOMBRE MUJER
Más de 14 litros 18(18.15) 15(14.85)
Menos de 14 litros 26(25.85) 21(21.15)
𝒙𝟐 = 𝟎. 𝟎𝟎𝟓
Paso 4: Gráfico
(#filas – 1) (#columnas - 1) gl.
0.99
Zona de
Aceptación
0.01
H0
𝑿𝟐 = 6.635
Paso 5: Se acepta Ho
Paso 6: Con un nivel de significancia del 1% existe evidencia estadística para afirmar que
la cantidad de gaseosa que se consume en litros es independiente del sexo.
Conclusión:
La cantidad de gaseosa que se consume en litros en una semana es independiente del
sexo de la persona.
32
9. CONCLUSION
10. RECOMENDACION
Se recomienda minimizar el consumo de la gaseosa, porque tiene un alto
porcentaje de azúcar y en la sangre va incrementando rápidamente una explosión
de insulina y el hígado responde convirtiendo el azúcar en grasa.
Las bebidas gaseosas pueden remplazarse por agua pura y refrescos naturales
como limonadas, maracuyá, naranja o infusiones frías como manzanilla, menta,
anís, entre otros.
33
ANEXO 1
1. Nombres y Apellidos
2. ¿Cuál es tu género?
Masculino Femenino
3. ¿Cuál es tu edad?
4. ¿Cuál es tu Peso?
Baja
Media
Alta
34
ANEXO 2
BASE DE DATOS
35
PEPSI
Gerardo Santiago BerdejoCavagnaro MASCULINO 29 años 84 kilos BAJA 1
30 COLA
COCA
31 Juan Manuel Jove Martel MASCULINO 26 años 75 kilos BAJA
COLA
1
COCA
MASCULINO 25 años 78 kilos BAJA 5
32 Manuel Lopez Miranda COLA
33 Sarita Chiara Ramos FEMENINO 22 años 71 kilos BAJA FANTA 6
34 Miguel Angel Arellano Valz MASCULINO 26 años 82 kilos BAJA FANTA 3
35 Jessica RocioSebastianTimana FEMENINO 26 años 54 kilos BAJA INKAKOLA 1
36 Jacinto Luis VasquezSanchez MASCULINO 29 años 75 kilos BAJA INKA COLA 7
37 John Robert Marin Hilary MASCULINO 27 años 72 kilos BAJA INKA KOLA 1
COCA
FEMENINO 22 años 48 kilos MEDIA 1
38 Teresa barzola fuentes COLA
COCA
Roxana bazan Leiva FEMENINO 24 años 48 kilos BAJA 8
39 COLA
40 Ronal campos tirado MASCULINO 22 años 79 kilos MEDIA INKA KOLA 1
41 Jose Carlos Falcon fuentes MASCULINO 29 años 56 kilos MEDIA INKA COLA 3
42 Piero solano cabrera MASCULINO 29 años 65 kilos BAJA GUARANA 1
43 Rosa Villanueva coral FEMENINO 29 años 53 kilos BAJA INKA KOLA 3
Alexander Miguel Sotomayor
44 MASCULINO 28 años 105 kilos BAJA INKA COLA 18
Camacho
45 Marcelino Inga Condori MASCULINO 27 años 58 kilos MEDIA INKA KOLA 2
COCA
46 Gabriel Bustamante Loyola MASCULINO 26 años 58 kilos BAJA
COLA
5
PEPSI
47 Miguel AngelCosser Carpio MASCULINO 26 años 66 kilos MEDIA
COLA
1
48 Gioveth Pablo Tineo FEMENINO 26 años 64 kilos MEDIA FANTA 1
PEPSI
Kennji Esteban MoryYagi MASCULINO 25 años 85 kilos MEDIA 7
49 COLA
50 Ivonne Elizabeth Varga Villacorta FEMENINO 25 años 60 kilos BAJA INKA KOLA 6
51 Gloria tirado días FEMENINO 24 años 65 kilos BAJA INKA KOLA 2
52 Manuel Hilario Pariona MASCULINO 23 años 72 kilos BAJA FANTA 2
PEPSI
MASCULINO 22 años 65 kilos BAJA 2
53 Jose Conde Laura COLA
54 Luis CcenchoColonio MASCULINO 22 años 71 kilos BAJA INKA KOLA 4
55 Bladimir Cardenas Arias MASCULINO 22 años 69 kilos ALTA INKA KOLA 1
56 Juan carlos Medina cordova MASCULINO 22 años 75 kilos BAJA FANTA 1
57 Yssel Gonzales Sandoval FEMENINO 22 años 75 kilos ALTA INKA KOLA 1
COCA
58 Mario Marin Marin MASCULINO 22 años 75 kilos BAJA
COLA
4
59 Reyna Navarro peres FEMENINO 21 años 46 kilos ALTA INKA KOLA 2
60 Maryta Sercado Toro FEMENINO 19 años 60 kilos BAJA FANTA 1
36