Está en la página 1de 22

Universidad Autónoma de Nuevo León

Facultad de Ciencias Biológicas

Producto integral de aprendizaje de la etapa 3 (PIA 3):


Correlación y regresión lineal simple

Unidad de aprendizaje: Bioestadística


Facilitador: Dr. Eduardo Alfonso Rebollar Téllez

Grupo: 231
Equipo 8. Integrantes:
Martín Allain Cavazos Alemán
Deborah Cristina Hernández González
Karen Lizbeth López Hernández
Víctor Uriel Martínez Velázquez
Adolfo Ángel Pinales Meza

San Nicolás de los Garza, N. L. | 8 de junio del 2020


Universidad Autónoma de
Nuevo León Facultad de
Ciencias Biológicas Unidad
de Aprendizaje:
Bioestadística
PIA 3: CORRELACIÓN Y REGRESIÓN LINEAL SIMPLE

Primera parte

Situación: Se aplicaron dos soluciones de un extracto metanólico de Berberis


trifoliolata a concentraciones diferentes en 50 muestras de una solución que
contenía oxalato de sodio y cloruro de calcio. Después, se midió la concentración
de oxalato de calcio en las muestras, con la finalidad de probar la actividad
antiurolítica de dicho vegetal.

2
1) Elaborado en equipo y entregado físicamente, deberá ir primero los conjuntos
de datos obtenidos en los PPA anteriores con sus respectivas medias,
varianzas y desviaciones estándares.

PPA1
Prueba 1:
Media 0.29584
Varianza 0.0337
Desviación estándar 0.1836

Prueba 2:
Media 0.26882
Varianza 0.0316
Desviación estándar 0.1777

PPA 2
Prueba 1:
Media 0.3217
Varianza 0.0308
Desviación estándar 0.1755

Prueba 2:
Media 0.2686
Varianza 0.0303
Desviación estándar 0.1741

Proporciones de la encuesta 1:
p 0.4
q 0.6

Proporciones de la encuesta 2:
p 0.52
q 0.48

3
2) A partir de las dos muestras elegidas en el PPA 1 (hacer una breve
descripción del problema en cuestión) realizar una prueba de hipótesis para
la media de la primera muestra con una significancia de α=.05, utilizando el
valor de referencia que usaste en el PPA 2 como el valor para la Media
poblacional.

Problema: ¿Existe evidencia suficiente que demuestre que la concentración media


de la primera muestra de 50 datos es significativamente menor que 0.3592?

Datos:
Ho: μ ≥ 0.3592 Las concentraciones de Oxalato de calcio
n= 50 Prueba obtenidas no son inferiores respecto a las de referencia.
UNILATERAL
X= .2958
Ha: μ < 0.3592 Las concentraciones de oxalato de calcio
μ= .3592
obtenidas son inferiores respecto a las de referencia.
σ= 0.1836
α= 0.05

Distribución “Z”

( 𝑋−𝜇) ( 0.2958−0.3592)
𝑍𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎 = = = - 2.44
σ/√n 0.1836/√50

Ztabulada= 1.65

Regla de decisión: Rechazar Ho si Zcal < 1.65

Decisión: Como 𝑧𝑐𝑎𝑙 es menor de 1.65, Ho se rechaza

Conclusión: Las concentraciones de oxalato de calcio obtenidas son significativamente


inferiores respecto a las de referencia.

4
3) A partir de las dos muestras elegidas en el PPA 1 (hacer una breve
descripción del problema en cuestión) realizar una prueba de hipótesis para
la diferencia de medias con una significancia de α=.01, suponiendo que las
medias poblacionales son iguales. (µ1-µ2 =0)

Problema: ¿Existe evidencia suficiente que demuestre que hay una diferencia entre
las medias de las concentraciones de ambas muestras de 50 datos?

Datos:
Ho: μ1 = μ2 No hay diferencia en la concentración
1 2 media de extracto metanólico de Berberis trifoliolata
𝑛 50 50
𝑥̅ 0.30 0.27 Prueba de los datos
𝑠2 0.03 0.03
BILATERAL Ha: μ1 ≠ μ2 Si hay diferencia en la concentración
media de extracto metanólico de Berberis trifoliolata
α= 0.01 de los datos

Distribución “𝑍”
( 𝑥̅ −𝑥̅ )−(𝜇1− 𝜇2 ) ( 0.30−0.27)−0 0.03
𝑍𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎 = 1 2 == = 0.03 = 1
𝜎2 𝜎2 0.03 0.03
√ 1+ 2 √ + 50
1𝑛 𝑛
2 50

Ztabulada = 2.58

-2.58 2.58
1

Regla de decisión: Rechazar Ho si Zcal < -2.58 o Zcal > 2.58

Decisión: Como 𝑧𝑐𝑎𝑙 es menor de 2.58, Ho no se rechaza

Conclusión: No hay diferencia significativa entre las medias de las concentraciones de ambas
muestras.

5
4) A partir de las dos muestras de tamaño 15 elaboradas en el PPA 2 (hacer
una breve descripción del problema en cuestión) realizar una prueba de
hipótesis para la media de la segunda muestra con una significancia de
α=.05, utilizando como referencia la Media de esa misma muestra pero la
original la del PPA 1(50 datos).

Problema: ¿Existe evidencia suficiente que demuestre que la concentración media


de la segunda muestra de 15 datos es significativamente menor que 0.2688?

Datos:

n=15 Ho: μ ≥ 0.2688 La media del efecto es mayor o


Prueba igual que 0.2688
𝑥̅ = 0.2686 UNILATERAL
Ha: μ < 0.2688 La media del efecto es menor que
s = 0.1741
0.2688
𝜇= 0.2688

Distribución “𝑇”

( 𝑥̅ −𝜇) ( 0.2686−0.2688)
𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎 = √𝑛 = 𝑡 = √15 = −0.004
𝑠 0.1741

𝑔𝑙 = 𝑛 − 1 𝑔𝑙 = 14

𝑡1−𝛼 = 0.95

𝑡tabulada = 1.76 -1.76 1.76


-0.004
Regla de decisión: Rechazar Ho si tcal<-1.76 o >1.76

Decisión: Como 𝑡𝑐𝑎𝑙 es mayor que -1.76 y menor que 1.76, Ho no se rechaza

Conclusión: No hay evidencia significativa que demuestre que la media de la segunda muestra de 15
datos sea menor que 0.2688.

6
5) A partir de las mismas muestras de tamaño 15 seleccionadas, realizar una
prueba de hipótesis para la diferencia de las medias con una significancia de
α=.01, utilizando también la diferencia de las medias originales la de datos
del PPA 1 (50 datos) para la diferencia poblacional.

Problema: ¿Existe evidencia suficiente de que las medias de las muestras de 15


datos son diferentes?

Datos:
Ho: μ = μ₂ Las medias de ambas muestras son
𝑛1 = 15 𝑛2 = 15 iguales
̅ ̅
𝑋1 = 0.3217 𝑋2 = 0.2686 Prueba
𝑆 21 𝑆 22 BILATERAL
= 0.0308 = 0.0303 Ha: μ ≠ μ₂ Las medias de ambas muestras son
𝜇1 = 0.2958 𝜇2 = 0.2688 diferentes

Distribución “𝑇”

(𝑛1 −1)𝑆21 +(𝑛2 −1)𝑆22 (15−1)0.0308+(15−1)0.0303


𝑆2𝑝 = = = 0.0306
𝑛1 +𝑛2 −2 15+15−2
(𝑥̅ 1 −𝑥̅ 2 )−(𝜇1 −𝜇2 ) (0.3217−0.2686)−(0.2958−0.2688) 0.0261
𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎 = = = 𝑡= = 0.4086
𝑆𝑝2 𝑆𝑝2 0.0306 0.0306 0.0639
√ + √ +
𝑛1 𝑛2
15 15

𝑔𝑙 = 𝑛1 + 𝑛2 − 2 = 28
𝑡1−𝛼/2 = 0.995
𝑡𝑡𝑎𝑏 = 2.76
-2.76 0.4086 2.76

Regla de decisión: Rechazar Ho Si 𝑡𝑐𝑎𝑙 > 2.76 o si 𝑡𝑐𝑎𝑙 <-2.76

Decisión: Como 𝑡𝑐𝑎𝑙 es menor de 2.76, Ho no se rechaza.

Conclusión: Se concluye con un 99% de confianza que no existe diferencia significativa entre las
medias de las concentraciones de ambas muestras de 15 datos.

7
6) A partir de las dos muestras de tamaño 15 elaboradas en el PPA 2 realizar
una prueba de hipótesis con una significancia de α=.05, para la varianza y
para la desviación estándar de la primera muestra, utilizando la varianza y
la desviación estándar de la muestra original de datos del PPA 1 como los
valores respectivos poblacionales.
Problema: ¿Existe evidencia significativa que demuestre que la varianza y la
desviación estándar de la primera muestra de 15 datos son menores a la varianza
y la desviación estándar de la muestra original de 50 datos?
Datos:
Ho: 𝜎 ≥ 0.1836, la varianza de la primera muestra
S = 0.0308 de 15 datos es mayor o igual a la varianza de la
Prueba primera muestra original de 50 datos.
n = 15
UNILATERAL Ha: 𝜎 < 0.1836, la varianza de la primera muestra
σ = 0.0337 de 15 datos es menor que la varianza de la primera
muestra original de 50 datos.

2
Distribución 

(𝑛 − 1 )𝑆 2 (15 − 1)0.0308
𝑋 2 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎 = 𝑋2 = = 12.80
𝜎2 0.0337
𝑔. 𝑙. = 𝑛 − 1 = 14

𝑥 2 1−𝛼 = 0.95

𝑥 2 𝑡𝑎𝑏𝑢𝑙𝑎𝑑𝑎 = 23.7

12.8 23.7

Regla de decisión: Rechaza Ho. Si cal 2 cal>23.7

Decisión: Como 2 cal es menor que 23.7, Ho no se rechaza.

Conclusión: No hay evidencia suficiente que demuestre que la varianza y la desviación


estándar de la primera muestra de 15 datos sean significativamente menores que la
varianza y la desviación estándar de la primera muestra original de 50 datos

8
7) A partir de las dos muestras de tamaño 15 elaboradas en el PPA 2, realizar
una prueba de hipótesis con una significancia de α=.01 para la razón de las
varianzas de dichas muestras.
Problema: ¿Existe evidencia suficiente que demuestre que la varianza de la
primera muestra de 15 datos sea mayor que la varianza de la segunda muestra de
15 datos?
Datos:

Datos Ho : σ2 1 ≤ σ2 2 La varianza de la primera muestra no


n₁ = 15 n₂ = 15 Prueba es mayor que la varianza de la segunda muestra
S²₁= 0.0308 S²₂ = 0.0303 UNILATERAL
Ha : σ2 1 > σ2 2 La varianza de la primera muestra es
mayor que la varianza de la segunda muestra

Distribución “F”

S 21 0.0308
𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎 = 2
= = 1.02
S 2 0.0303

𝐹1−𝑎 = 0.99
𝑔𝑙 = 𝑛1 − 1 =14
𝑔𝑙 = 𝑛2 − 1 = 14
𝐹𝑡𝑎𝑏𝑢𝑙𝑎𝑑𝑎 = 3.66 3.66
1.02

Regla de decisión: Prueba unilateral Rechazar Ho si: 𝐹𝑐𝑎𝑙 < 3.66

Decisión: Como 𝐹𝑐𝑎𝑙 es menor que 3.66, Ho NO se rechaza

Conclusión: No existe evidencia suficiente que demuestre que la varianza de la primera muestra de
15 datos sea significativamente mayor que la varianza de la segunda muestra de 15 datos.

9
8) Utilizando los datos colectados en la encuesta de tamaño 50 de una variable
dicotómica asignada en el PPA 2 para cada equipo, (hacer una breve
descripción del problema en cuestión) realizar una prueba de hipótesis para
la proporción de los que contestaron sí de cada muestra con una significancia
de α=.05 y suponer un valor para la proporción poblacional del 50%. (P=.5).
Se aplicó una encuesta de una variable dicotómica con la pregunta ¿te gusta el
fútbol americano? A 50 estudiantes de 1° a 4° semestre de la carrera de L.B.G. De
ellos, 20 estudiantes contestaron que sí.
Problema: ¿Existe evidencia significativa que demuestre que la proporción de los
estudiantes que respondieron que sí sea menor que 50%?

DATOS: Ho : 𝑃 ≥ 0.5 → La proporción de los que


𝑛 = 50 Prueba respondieron que sí, es mayor o igual que 0.5
𝑝 = 20⁄50 = 0.4 UNILATERAL
𝑃 = 0.50
𝑄 = 0.50 Ha : 𝑃 < 0.5 → La proporción de los que
respondieron que sí, es menor que 0.5

Distribución “Z”

p−P 0.4 − 0.5 −0.1


Zcalculada = = = = −1.41
0.0707
√𝑃𝑄 √(0.5)(0.5)
𝑛 50

Ztabulada= - 1.65
-1.65

-1.41 ->

Regla de decisión: Rechazar Ho si: P<-1.65.

Decisión: Como Zcal es mayor que -1.65, Ho NO se rechaza.

Conclusión: No hay evidencia suficiente para concluir que la proporción de los estudiantes que
respondieron que sí sea significativamente menor que el 50%

10
Se aplicó una encuesta de una variable dicotómica con la pregunta ¿te gusta el
fútbol americano? A 50 estudiantes de 5° a 9° semestre de la carrera de L.B.G. De
ellos, 26 estudiantes contestaron que sí.
Problema: ¿Existe evidencia suficiente que demuestre que la proporción de los
estudiantes que respondieron que sí sea mayor que 50%?

DATOS: Ho : 𝑃 ≤ 0.5 → La proporción de los que


𝑛 = 50 Prueba respondieron que sí, es menor o igual que 0.5
𝑝 = 26⁄50 = 0.52 UNILATERAL
𝑃 = 0.50 Ha : 𝑃 > 0.5 → La proporción de los que
𝑄 = 0.50 respondieron que sí, es mayor que 0.5

p−P 0.52 − 0.5 0.02


Zcalculada = = = = 0.28
0.0707
√𝑃𝑄 √(0.5)(0.5)
𝑛 50

𝑍tabulada = 1.65

Ztabulada= 1.65

0.28

1.65

Regla de decisión: Rechazar Ho si: P>1.65.

Decisión: Como Zcal es menor que 1.65, Ho NO se rechaza.

Conclusión: No hay evidencia suficiente para concluir que la proporción de los estudiantes
que respondieron que sí sea significativamente mayor que el 50%.

11
9) Utilizando los datos colectados en la encuesta de tamaño 50 de una variable
dicotómica asignada en el PPA 2 para cada equipo, realizar una prueba de
hipótesis para la diferencia de proporciones de las encuestas con los que
respondieron que sí, con una significancia de α= .01, suponiendo que no hay
diferencia entre las Proporciones Poblacionales. (P1-P2=0).
Problema: ¿Existe evidencia significativa que demuestre que las proporciones de
los estudiantes que respondieron que sí, sean diferentes?

Datos: Ho: p1 = p2: Las proporciones de los estudiantes


Prueba que respondieron que sí, son iguales
1 2 BIILATERAL Ha: p1 ≠ p2: Las proporciones de los estudiantes
𝑛 50 50 que respondieron que sí, son diferentes
𝑝 0.40 0.52
q 0.60 0.48

(0.40 − 0.52) − 0 0.12


𝑍= = − = −12.25
9.79𝑥10−3
√(0.40)(0.60) + (0.52)(0.48)
50 50

Ztabulada=
- 2.58 -12.25

-2.58 2.58

Regla de decisión: Rechazar Ho si Zcal < -2.58 o > 2.58.

Decisión: Zcal es menor de 2.58, Ho se rechaza.

Conclusión: Las proporciones de los estudiantes que respondieron que sí, son
significativamente diferentes.

12
Segunda parte
Realizar un análisis de correlación Lineal y otro de regresión lineal simple con
conjuntos de datos de su área de competencia investigados por el equipo, con
descripción clara de las variables de estudio, dicho análisis elaborado en Excel.
Elaborar un documento en Word a donde deberán trasladar las gráficas de
dispersión, la ecuación de regresión, la nueva línea de regresión, todos los pasos,
procedimientos, cálculos, las gráficas de las distribuciones F y t, tabla de ANOVA,
las decisiones y conclusiones de validez respectivas usando una significancia de
α=0.05

Problema: Se realizó una recopilación de la cantidad de carbohidratos que


contienen 100 g de 30 alimentos de común consumo, así como la cantidad de
calorías contenidas en los mismos.

Gramos de
Alimento carbohidrato Calorías (Y) X2 Y2 XY
(X)
Calamar 0 79 0 6241 0
Pan integral 42 216 1764 46656 9072
Carne de
0 203 0 41209 0
cordero
Castañas 37 170 1369 28900 6290
Cebada 84 360 7056 129600 30240
Espárragos 1 18 1 324 18
Galletas
76 448 5776 200704 34048
saladas
Fresas 6 26 36 676 156
Helado 21 209 441 43681 4389

13
Hígado de
2 153 4 23409 306
ternera
Huevo duro 1 153 1 23409 153
Jamón
1 152 1 23104 152
cocido
Leche light 27 201 729 40401 5427
Lentejas 53 304 2809 92416 16112
Macarones 79 370 6241 136900 29230
Palomitas
11 54 121 2916 594
de maíz
Pasta 82 373 6724 139129 30586
Pavo 0 107 0 11449 0
Piña 12 46 144 2116 552
Betabel 10 44 100 1936 440
Sandía 8 37 64 1369 296
Pay de
43 282 1849 79524 12126
manzana
Yogur
6 75 36 5625 450
natural
Uvas 16 61 256 3721 976
Ketchup 24 98 576 9604 2352
Salvado de
27 206 729 42436 5562
trigo
Repollo 3 29 9 841 87
Hot dog 33 308 1089 94864 10164
Pizza 25 234 625 54756 5850
Pan blanco 50 233 2500 54289 11650
n = 30 ∑ 𝑿 = 780 ∑ 𝒀 = 5249 ∑ 𝑿𝟐 = 41050 ∑ 𝒀𝟐 =1342205 ∑ 𝑿𝒀 = 217278

14
A. Análisis de Correlación Lineal Simple.

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.86125467
Coeficiente de determinación R^2 0.74175961
R^2 ajustado 0.73253674
Error típico 62.5195855
Observaciones 30

1) Construir un diagrama de dispersión (incluya nombres de las variables,


unidades de medida y la leyenda correspondiente de la gráfica).

Diagrama de dispersión
500

450
r=0.8613
400
r^2=0.7418
350

300
Calorías (Y)

250

200 Valor observado

150

100

50

0
0 10 20 30 40 50 60 70 80 90
Gramos de carbohidrato (X)

15
2) Calcular el coeficiente de correlación de Pearson.

[(𝑛)(∑ 𝑋𝑌) − (∑ 𝑋)(∑ 𝑌)]


𝑟=
√[(𝑛)(∑ 𝑋2 ) − (∑ 𝑋)2 ][(𝑛)(∑ 𝑌 2 ) − (∑ 𝑌)2 ]

[(30)(217278) − (780)(5249)]
=
√[(30)(41050) − (780)2 ][(30)(1342205) − (5249)2 ]

6518340 − 4094220
= = 0.8613
√(623100)(12714149)

3) Probar la significancia de la correlación con un nivel de significancia de α=0.05

Ho : r = 0 → El coeficiente es igual a cero


Prueba BILATERAL
Ha : r ≠ 0 → El coeficiente es diferente a cero

(r)(√𝑛 − 2) (0.8613)(√30 − 2) 4.5576


𝑡calculada = = = = 17.65
(1 − 𝑟 2 ) 1 − (0.8613)2 0.2582

t1−α/2 = t1−0.05/2 = t1−0.025 = t0.975 17.65

g. l. = n − 2 = 30 − 2 = 28

∴ ttabulada = 2.05 -2.05 2.05

Regla de decisión: Rechazar Ho si tcalculada < −2.05 o > 2.05

Decisión: Rechazar Ho

Conclusión: El coeficiente de correlación es diferente a cero. Por lo tanto, es


significativo.

16
4) Si la asociación entre las variables es directa (positiva) o inversa (negativa),
explicar el porqué de acuerdo al caso.

Respuesta: La asociación entre las variables es directa (positiva) debido a que,


a medida que aumenta la cantidad de carbohidratos en los alimentos, también
aumenta el número de calorías que contienen.

5) Calificar el grado de asociación o fuerza de la correlación (si es débil, moderada,


fuerte o muy fuerte), use la información tabular analizada en clase.

Respuesta: El coeficiente de correlación es muy fuerte debido a que se


encuentra dentro del rango comprendido entre 0.80 y 1.00.

6) ¿Hay alguna evidencia de relación lineal entre las dos variables estudiadas?
Para contestar la pregunta, elaborar un breve resumen donde explique los
resultados describiendo del gráfico de dispersión la dirección, el coeficiente de
correlación, la significancia y la fuerza de la correlación.

Respuesta: Se obtuvo un gráfico de dispersión en el que se pudo observar una


asociación directa o positiva entre las variables. En cuanto al coeficiente de
correlación, se obtuvo un valor de r=0.8613, por lo que se considera una
correlación muy fuerte. Con una prueba de “t” se determinó que el coeficiente 𝜌
es diferente de 0, por lo que es estadísticamente significativo y válido para
cuantificar la magnitud de la correlación entre las variables “calorías” y
“carbohidratos”. El coeficiente de determinación fue r 2 = 0.742, lo cual significa
que existe un 74.2% de variación explicada de las variables. Por lo tanto, sí hay
evidencia suficiente de que existe una relación lineal entre las dos variables
estudiadas.

17
B. Análisis de Regresión Lineal Simple.

Error Estadístico Inferior Superior


Coeficientes Probabilidad
típico t 95% 95%
Intercepción 73.815776 16.0469979 4.59997418 8.2739E-05 40.9449909 106.686561
Gramos de
carbohidrato 3.89041887 0.43380828 8.96806034 1.0064E-09 3.00180288 4.77903486
(X)

1) Construir un diagrama de dispersión (incluya nombres de las variables,


unidades de medida y la leyenda correspondiente a la gráfica).

Diagrama de dispersión
500

450

400

350

300
Calorías (Y)

250

200 Valor observado

150

100

50

0
0 20 40 60 80 100
Gramos de carbohidrato (X)

2) Completar la tabla con los datos que se requieren para los cálculos: ΣX, ΣY,
ΣXY, ΣX2, ΣY2.

n = 30 ∑ 𝑋 = 780 ∑ 𝑌 = 5249 ∑ 𝑋2 = 41050 ∑ 𝑌 2 =1342205 ∑ 𝑋𝑌 = 217278

18
3) Calcular la ecuación de regresión Y= a + bX.

(∑ 𝑌)(∑ 𝑋2 ) − (∑ 𝑋)(∑ 𝑋𝑌) (5249)(41050) − (780)(217278) 45994610


𝛼= = = = 73.82
(𝑛)(∑ 𝑋2 ) − (∑ 𝑋)2 (30)(41050) − (780)2 623100

(𝑛)(∑ 𝑋𝑌) − (∑ 𝑋)(∑ 𝑌) (30)(217278) − (780)(5249) 2424120


𝛽= = = = 3.89
(𝑛)(∑ 𝑋2 ) − (∑ 𝑋)2 (30)(41050) − (780)2 623100

Y = 73.82 + 3.89(X)

Calorías = 73.82 + 3.89(Carbohidratos)

4) Calcular los nuevos valores de Y y graficar la línea de regresión en base a la


ecuación, y
¿Cuál será el valor estimado de Y = 73.82 + 3.89(X) para un valor de X = 42?
Respuesta: 237.2
¿Cuál será el valor estimado de Y = 73.82 + 3.89(X) para un valor de X = 37?
Respuesta: 217.75

Diagrama de dispersión Cal. = 73.82 + 3.89(Carb.)


(F = 80.43; 1, 28 (1); 𝜌 < 0.05)
500

450

400

350

300
Calorías (Y)

250
Valor observado
200 Valor estimado
150

100

50

0
0 20 40 60 80 100
Gramos de carbohidrato (X)

19
5) Calcular las Sumas de Cuadrados: SCtotal, SCreg , SCresidual, elabore la tabla
de ANOVA.

(∑ 𝑋)(∑ 𝑌)
2
(780)(5249) 2
[∑ 𝑋𝑌 − ] [217278 − ] 6529286416
𝑛 30
𝑆𝐶𝑅 = 2 = 2 = = 314361.41
2 (∑ 𝑋) (780) 20770
∑𝑋 − 41050 − 30
𝑛

(∑ 𝑌 )2
2
(5249)2
𝑆𝐶𝑇 = ∑ 𝑌 − = 1342205 − = 423804.97
𝑛 30

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑅 = 423804.97 − 314361.41 = 109443.56

Tabla de ANOVA:
Grados Promedio Valor
Suma de
de de los F crítico
cuadrados
libertad cuadrados de F
1.0064E-
Regresión 1 314361.407 314361.407 80.4261062
09
Residuos 28 109443.56 3908.69857
Total 29 423804.967

20
6) Realizar la prueba de hipótesis a partir de la tabla de ANOVA con el estadístico
F para verificar la significancia de la ecuación de regresión, use una significancia
de α=0.05

Ho : 𝛽 = 0 → El coeficiente 𝛽 de regresión es igual a


cero. Por lo tanto, la ecuación no es significativa.
Prueba UNILATERAL
Ho : 𝛽 ≠ 0 → El coeficiente 𝛽 de regresión es diferente
de cero. Por lo tanto, la ecuación sí es significativa.

numerador: g. l. r. = 1
denominador: g. l. e. = 28
𝐹calculada = 80.43
∴ 𝐹tabulada = 4.20

Regla de decisión: Rechazar Ho si


80.43 𝐹calculada > 4.20

Decisión: Rechazar Ho

Conclusión: Se concluye con un 95%


de confianza que el coeficiente 𝛽 de
4.20 regresión es diferente a cero. Por lo
tanto, la ecuación es significativa.

7) Calcular el coeficiente de determinación.

𝑟 = 0.8613

𝑟 2 = (0.8613)2 = 0.7418

21
8) En un breve resumen explicar los resultados: Significado del intercepto, la
pendiente, significancia de la regresión, coeficiente de determinación (r2) y
describa sus conclusiones.

Respuesta: La ecuación que cuantifica la relación entre las variables es:


Calorías = 73.82 + 3.89(Carbohidratos), lo cual indica que la variable “calorías”
se incrementa en 3.89 unidades por cada unidad de la variable “carbohidratos”.
La pendiente de la ecuación de regresión es positiva (+3.89) debido a que si se
incrementan los carbohidratos, pasa lo mismo con las calorías. Por medio de un
análisis de varianza (ANOVA) se determinó que el coeficiente 𝛽 es diferente a
cero, por lo que la ecuación de regresión es estadísticamente significativa y
válida para analizar la dependencia de las calorías por los carbohidratos en los
alimentos.

En conclusión, existe una dependencia de la variable “calorías” en función de


cambios de la variable “carbohidratos”.

22

También podría gustarte