Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Grupo: 231
Equipo 8. Integrantes:
Martín Allain Cavazos Alemán
Deborah Cristina Hernández González
Karen Lizbeth López Hernández
Víctor Uriel Martínez Velázquez
Adolfo Ángel Pinales Meza
Primera parte
2
1) Elaborado en equipo y entregado físicamente, deberá ir primero los conjuntos
de datos obtenidos en los PPA anteriores con sus respectivas medias,
varianzas y desviaciones estándares.
PPA1
Prueba 1:
Media 0.29584
Varianza 0.0337
Desviación estándar 0.1836
Prueba 2:
Media 0.26882
Varianza 0.0316
Desviación estándar 0.1777
PPA 2
Prueba 1:
Media 0.3217
Varianza 0.0308
Desviación estándar 0.1755
Prueba 2:
Media 0.2686
Varianza 0.0303
Desviación estándar 0.1741
Proporciones de la encuesta 1:
p 0.4
q 0.6
Proporciones de la encuesta 2:
p 0.52
q 0.48
3
2) A partir de las dos muestras elegidas en el PPA 1 (hacer una breve
descripción del problema en cuestión) realizar una prueba de hipótesis para
la media de la primera muestra con una significancia de α=.05, utilizando el
valor de referencia que usaste en el PPA 2 como el valor para la Media
poblacional.
Datos:
Ho: μ ≥ 0.3592 Las concentraciones de Oxalato de calcio
n= 50 Prueba obtenidas no son inferiores respecto a las de referencia.
UNILATERAL
X= .2958
Ha: μ < 0.3592 Las concentraciones de oxalato de calcio
μ= .3592
obtenidas son inferiores respecto a las de referencia.
σ= 0.1836
α= 0.05
Distribución “Z”
( 𝑋−𝜇) ( 0.2958−0.3592)
𝑍𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎 = = = - 2.44
σ/√n 0.1836/√50
Ztabulada= 1.65
4
3) A partir de las dos muestras elegidas en el PPA 1 (hacer una breve
descripción del problema en cuestión) realizar una prueba de hipótesis para
la diferencia de medias con una significancia de α=.01, suponiendo que las
medias poblacionales son iguales. (µ1-µ2 =0)
Problema: ¿Existe evidencia suficiente que demuestre que hay una diferencia entre
las medias de las concentraciones de ambas muestras de 50 datos?
Datos:
Ho: μ1 = μ2 No hay diferencia en la concentración
1 2 media de extracto metanólico de Berberis trifoliolata
𝑛 50 50
𝑥̅ 0.30 0.27 Prueba de los datos
𝑠2 0.03 0.03
BILATERAL Ha: μ1 ≠ μ2 Si hay diferencia en la concentración
media de extracto metanólico de Berberis trifoliolata
α= 0.01 de los datos
Distribución “𝑍”
( 𝑥̅ −𝑥̅ )−(𝜇1− 𝜇2 ) ( 0.30−0.27)−0 0.03
𝑍𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎 = 1 2 == = 0.03 = 1
𝜎2 𝜎2 0.03 0.03
√ 1+ 2 √ + 50
1𝑛 𝑛
2 50
Ztabulada = 2.58
-2.58 2.58
1
Conclusión: No hay diferencia significativa entre las medias de las concentraciones de ambas
muestras.
5
4) A partir de las dos muestras de tamaño 15 elaboradas en el PPA 2 (hacer
una breve descripción del problema en cuestión) realizar una prueba de
hipótesis para la media de la segunda muestra con una significancia de
α=.05, utilizando como referencia la Media de esa misma muestra pero la
original la del PPA 1(50 datos).
Datos:
Distribución “𝑇”
( 𝑥̅ −𝜇) ( 0.2686−0.2688)
𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎 = √𝑛 = 𝑡 = √15 = −0.004
𝑠 0.1741
𝑔𝑙 = 𝑛 − 1 𝑔𝑙 = 14
𝑡1−𝛼 = 0.95
Decisión: Como 𝑡𝑐𝑎𝑙 es mayor que -1.76 y menor que 1.76, Ho no se rechaza
Conclusión: No hay evidencia significativa que demuestre que la media de la segunda muestra de 15
datos sea menor que 0.2688.
6
5) A partir de las mismas muestras de tamaño 15 seleccionadas, realizar una
prueba de hipótesis para la diferencia de las medias con una significancia de
α=.01, utilizando también la diferencia de las medias originales la de datos
del PPA 1 (50 datos) para la diferencia poblacional.
Datos:
Ho: μ = μ₂ Las medias de ambas muestras son
𝑛1 = 15 𝑛2 = 15 iguales
̅ ̅
𝑋1 = 0.3217 𝑋2 = 0.2686 Prueba
𝑆 21 𝑆 22 BILATERAL
= 0.0308 = 0.0303 Ha: μ ≠ μ₂ Las medias de ambas muestras son
𝜇1 = 0.2958 𝜇2 = 0.2688 diferentes
Distribución “𝑇”
𝑔𝑙 = 𝑛1 + 𝑛2 − 2 = 28
𝑡1−𝛼/2 = 0.995
𝑡𝑡𝑎𝑏 = 2.76
-2.76 0.4086 2.76
Conclusión: Se concluye con un 99% de confianza que no existe diferencia significativa entre las
medias de las concentraciones de ambas muestras de 15 datos.
7
6) A partir de las dos muestras de tamaño 15 elaboradas en el PPA 2 realizar
una prueba de hipótesis con una significancia de α=.05, para la varianza y
para la desviación estándar de la primera muestra, utilizando la varianza y
la desviación estándar de la muestra original de datos del PPA 1 como los
valores respectivos poblacionales.
Problema: ¿Existe evidencia significativa que demuestre que la varianza y la
desviación estándar de la primera muestra de 15 datos son menores a la varianza
y la desviación estándar de la muestra original de 50 datos?
Datos:
Ho: 𝜎 ≥ 0.1836, la varianza de la primera muestra
S = 0.0308 de 15 datos es mayor o igual a la varianza de la
Prueba primera muestra original de 50 datos.
n = 15
UNILATERAL Ha: 𝜎 < 0.1836, la varianza de la primera muestra
σ = 0.0337 de 15 datos es menor que la varianza de la primera
muestra original de 50 datos.
2
Distribución
(𝑛 − 1 )𝑆 2 (15 − 1)0.0308
𝑋 2 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎 = 𝑋2 = = 12.80
𝜎2 0.0337
𝑔. 𝑙. = 𝑛 − 1 = 14
𝑥 2 1−𝛼 = 0.95
𝑥 2 𝑡𝑎𝑏𝑢𝑙𝑎𝑑𝑎 = 23.7
12.8 23.7
8
7) A partir de las dos muestras de tamaño 15 elaboradas en el PPA 2, realizar
una prueba de hipótesis con una significancia de α=.01 para la razón de las
varianzas de dichas muestras.
Problema: ¿Existe evidencia suficiente que demuestre que la varianza de la
primera muestra de 15 datos sea mayor que la varianza de la segunda muestra de
15 datos?
Datos:
Distribución “F”
S 21 0.0308
𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎 = 2
= = 1.02
S 2 0.0303
𝐹1−𝑎 = 0.99
𝑔𝑙 = 𝑛1 − 1 =14
𝑔𝑙 = 𝑛2 − 1 = 14
𝐹𝑡𝑎𝑏𝑢𝑙𝑎𝑑𝑎 = 3.66 3.66
1.02
Conclusión: No existe evidencia suficiente que demuestre que la varianza de la primera muestra de
15 datos sea significativamente mayor que la varianza de la segunda muestra de 15 datos.
9
8) Utilizando los datos colectados en la encuesta de tamaño 50 de una variable
dicotómica asignada en el PPA 2 para cada equipo, (hacer una breve
descripción del problema en cuestión) realizar una prueba de hipótesis para
la proporción de los que contestaron sí de cada muestra con una significancia
de α=.05 y suponer un valor para la proporción poblacional del 50%. (P=.5).
Se aplicó una encuesta de una variable dicotómica con la pregunta ¿te gusta el
fútbol americano? A 50 estudiantes de 1° a 4° semestre de la carrera de L.B.G. De
ellos, 20 estudiantes contestaron que sí.
Problema: ¿Existe evidencia significativa que demuestre que la proporción de los
estudiantes que respondieron que sí sea menor que 50%?
Distribución “Z”
Ztabulada= - 1.65
-1.65
-1.41 ->
Conclusión: No hay evidencia suficiente para concluir que la proporción de los estudiantes que
respondieron que sí sea significativamente menor que el 50%
10
Se aplicó una encuesta de una variable dicotómica con la pregunta ¿te gusta el
fútbol americano? A 50 estudiantes de 5° a 9° semestre de la carrera de L.B.G. De
ellos, 26 estudiantes contestaron que sí.
Problema: ¿Existe evidencia suficiente que demuestre que la proporción de los
estudiantes que respondieron que sí sea mayor que 50%?
𝑍tabulada = 1.65
Ztabulada= 1.65
0.28
1.65
Conclusión: No hay evidencia suficiente para concluir que la proporción de los estudiantes
que respondieron que sí sea significativamente mayor que el 50%.
11
9) Utilizando los datos colectados en la encuesta de tamaño 50 de una variable
dicotómica asignada en el PPA 2 para cada equipo, realizar una prueba de
hipótesis para la diferencia de proporciones de las encuestas con los que
respondieron que sí, con una significancia de α= .01, suponiendo que no hay
diferencia entre las Proporciones Poblacionales. (P1-P2=0).
Problema: ¿Existe evidencia significativa que demuestre que las proporciones de
los estudiantes que respondieron que sí, sean diferentes?
Ztabulada=
- 2.58 -12.25
-2.58 2.58
Conclusión: Las proporciones de los estudiantes que respondieron que sí, son
significativamente diferentes.
12
Segunda parte
Realizar un análisis de correlación Lineal y otro de regresión lineal simple con
conjuntos de datos de su área de competencia investigados por el equipo, con
descripción clara de las variables de estudio, dicho análisis elaborado en Excel.
Elaborar un documento en Word a donde deberán trasladar las gráficas de
dispersión, la ecuación de regresión, la nueva línea de regresión, todos los pasos,
procedimientos, cálculos, las gráficas de las distribuciones F y t, tabla de ANOVA,
las decisiones y conclusiones de validez respectivas usando una significancia de
α=0.05
Gramos de
Alimento carbohidrato Calorías (Y) X2 Y2 XY
(X)
Calamar 0 79 0 6241 0
Pan integral 42 216 1764 46656 9072
Carne de
0 203 0 41209 0
cordero
Castañas 37 170 1369 28900 6290
Cebada 84 360 7056 129600 30240
Espárragos 1 18 1 324 18
Galletas
76 448 5776 200704 34048
saladas
Fresas 6 26 36 676 156
Helado 21 209 441 43681 4389
13
Hígado de
2 153 4 23409 306
ternera
Huevo duro 1 153 1 23409 153
Jamón
1 152 1 23104 152
cocido
Leche light 27 201 729 40401 5427
Lentejas 53 304 2809 92416 16112
Macarones 79 370 6241 136900 29230
Palomitas
11 54 121 2916 594
de maíz
Pasta 82 373 6724 139129 30586
Pavo 0 107 0 11449 0
Piña 12 46 144 2116 552
Betabel 10 44 100 1936 440
Sandía 8 37 64 1369 296
Pay de
43 282 1849 79524 12126
manzana
Yogur
6 75 36 5625 450
natural
Uvas 16 61 256 3721 976
Ketchup 24 98 576 9604 2352
Salvado de
27 206 729 42436 5562
trigo
Repollo 3 29 9 841 87
Hot dog 33 308 1089 94864 10164
Pizza 25 234 625 54756 5850
Pan blanco 50 233 2500 54289 11650
n = 30 ∑ 𝑿 = 780 ∑ 𝒀 = 5249 ∑ 𝑿𝟐 = 41050 ∑ 𝒀𝟐 =1342205 ∑ 𝑿𝒀 = 217278
14
A. Análisis de Correlación Lineal Simple.
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.86125467
Coeficiente de determinación R^2 0.74175961
R^2 ajustado 0.73253674
Error típico 62.5195855
Observaciones 30
Diagrama de dispersión
500
450
r=0.8613
400
r^2=0.7418
350
300
Calorías (Y)
250
150
100
50
0
0 10 20 30 40 50 60 70 80 90
Gramos de carbohidrato (X)
15
2) Calcular el coeficiente de correlación de Pearson.
[(30)(217278) − (780)(5249)]
=
√[(30)(41050) − (780)2 ][(30)(1342205) − (5249)2 ]
6518340 − 4094220
= = 0.8613
√(623100)(12714149)
g. l. = n − 2 = 30 − 2 = 28
Decisión: Rechazar Ho
16
4) Si la asociación entre las variables es directa (positiva) o inversa (negativa),
explicar el porqué de acuerdo al caso.
6) ¿Hay alguna evidencia de relación lineal entre las dos variables estudiadas?
Para contestar la pregunta, elaborar un breve resumen donde explique los
resultados describiendo del gráfico de dispersión la dirección, el coeficiente de
correlación, la significancia y la fuerza de la correlación.
17
B. Análisis de Regresión Lineal Simple.
Diagrama de dispersión
500
450
400
350
300
Calorías (Y)
250
150
100
50
0
0 20 40 60 80 100
Gramos de carbohidrato (X)
2) Completar la tabla con los datos que se requieren para los cálculos: ΣX, ΣY,
ΣXY, ΣX2, ΣY2.
18
3) Calcular la ecuación de regresión Y= a + bX.
Y = 73.82 + 3.89(X)
↓
Calorías = 73.82 + 3.89(Carbohidratos)
450
400
350
300
Calorías (Y)
250
Valor observado
200 Valor estimado
150
100
50
0
0 20 40 60 80 100
Gramos de carbohidrato (X)
19
5) Calcular las Sumas de Cuadrados: SCtotal, SCreg , SCresidual, elabore la tabla
de ANOVA.
(∑ 𝑋)(∑ 𝑌)
2
(780)(5249) 2
[∑ 𝑋𝑌 − ] [217278 − ] 6529286416
𝑛 30
𝑆𝐶𝑅 = 2 = 2 = = 314361.41
2 (∑ 𝑋) (780) 20770
∑𝑋 − 41050 − 30
𝑛
(∑ 𝑌 )2
2
(5249)2
𝑆𝐶𝑇 = ∑ 𝑌 − = 1342205 − = 423804.97
𝑛 30
Tabla de ANOVA:
Grados Promedio Valor
Suma de
de de los F crítico
cuadrados
libertad cuadrados de F
1.0064E-
Regresión 1 314361.407 314361.407 80.4261062
09
Residuos 28 109443.56 3908.69857
Total 29 423804.967
20
6) Realizar la prueba de hipótesis a partir de la tabla de ANOVA con el estadístico
F para verificar la significancia de la ecuación de regresión, use una significancia
de α=0.05
numerador: g. l. r. = 1
denominador: g. l. e. = 28
𝐹calculada = 80.43
∴ 𝐹tabulada = 4.20
Decisión: Rechazar Ho
𝑟 = 0.8613
𝑟 2 = (0.8613)2 = 0.7418
21
8) En un breve resumen explicar los resultados: Significado del intercepto, la
pendiente, significancia de la regresión, coeficiente de determinación (r2) y
describa sus conclusiones.
22