Está en la página 1de 5

ESTADÍSTICA INFERENCIAL

SEMANA 14
TALLER N°8

1. El cuadro Anova de un modelo de regresión lineal simple se muestra en el siguiente cuadro


(Y vs X), donde Y representa la cantidad de combustible que un carro consume y X representa la
distancia recorrida.

Fuente de Variación GL SC CM Fc Ftab


Regresión 1 𝑆𝐶R =135.3 135.3 28.97 5.59
Residual (Error) 7 𝑆𝐶E =32.7 4.67
Total 𝑆𝐶T =168

Fc:
135.3
FC =
4.67

FC = 28.97

Ftab:

F(1-; 1,7) = F(1-0.05; 1,7) = F(0.95; 1,7) = 5.59

a) Halle e interprete el coeficiente de determinación y correlación

Coeficiente de determinación:

135.3
R2=
168

R2 = 80.54%

Coeficiente de correlación:

r =√ 0.8054
r = 0.8974

b) Pruebe si existe relación lineal entre las variables a un nivel de significación de 5%

H0: β 1 = 0
H1: β 1 ≠ 0

Fc (28.97) > Ftab (5.59). Por lo tanto se rechaza la H0 (Hipótesis nula). El modelo que se ha
estimado es estadísticamente significativa, por ende con un nivel de significación de 5%, se
concluye que si existe una relación lineal entre las variables (x, y)

1 Estadística Inferencial
2. Utilizando la recta de regresión de x sobre y correspondiente a la distribución siguiente:

x = altura sobre el nivel del mar 0 184 231 481 911


y = temperatura media en ºC 20 18 17 12 10

a) Calcula la temperatura media cuando la altitud de una ciudad sea 200

Temperatura media en °C = 19.5628 – 0.0115 Altura sobre el nivel del mar

Temperatura media en °C = 19.5628 – 0.0115 (200)

Temperatura media en °C = 17.2628

Rpta: La altura media en °C de una ciudad cuando la altitud es 200, es 17.26 °C.

b) Calcule el coeficiente de correlación e interprete

x = altura sobre y = temperatura


X^2 Y^2 XY
el nivel del mar media en ºC
0 20 0 400 0
184 18 33856 324 3312
231 17 53361 289 3927
481 12 231361 144 5772
911 10 829921 100 9110
1807 77 1148499 1257 22121

n ∑ XY −∑ X ∑ Y
r=
√ n ∑ X −∑ ¿ ¿ ¿ ¿ ¿
2

5 ( 22121 )−(1807)(77)
r=
√ 5 (1148499 )−¿ ¿ ¿
r = 0.9608

Rpta: Se confirma la relación lineal entre la altura sobre el nivel del mar y la temperatura media
en °C, con un coeficiente de correlación de 0.9608, evidencia la relación lineal positiva intensa
entre dichas variables. Por lo tanto, se concluye una relación directa fuerte entre el nivel del mar
y la temperatura media en °C.
2 2
→ R =0.9608 =0.9232∗100
2
R =92.32%

Temperatura media en °C = 19.5628 – 0.0115 Altura sobre el nivel del mar

Rpta: El modelo explica un 92.32% de la variabilidad de la temperatura media en °C, es decir, el


modelo tiene una muy buena capacidad predictiva, el modelo tiene muy buen ajuste.
2 Estadística Inferencial
3. El número de bacterias por unidad de volumen, presentes en un cultivo después de un cierto número
de horas, viene expresado en la siguiente tabla de análisis de varianza:

Fuente de Variación GL SC CM Fc Ftab


Regresión 1 𝑆𝐶R =34.3 34.3 4.7639 5.99
Residual (Error) 6 𝑆𝐶E =43.2 7.2
Total 𝑆𝐶T =77.5

Fc:
34.3
FC =
7.2

FC = 4.7639

Ftab:

F(1-; 1,6) = F(1-0.05; 1,6) = F(0.95; 1,6) = 5.99

a) Se sabe que el coeficiente de determinación es 𝑟2 = 44.26% y el coeficiente de correlación


es 𝑟 = 0.67, interprete cada uno de ellos

Coeficiente de Determinación:

Rpta: El modelo explica un 44.26% de la variabilidad del número de bacterias por unidad de
volumen es decir, el modelo tiene una relación lineal débil.

Coeficiente de Correlación:

Rpta: La relación lineal entre el número de bacterias por unidad de volumen y el tiempo, con
un coeficiente de correlación de 0.67, evidencia una relación lineal baja entre dichas variables.
Por lo tanto, se concluye una relación lineal débil entre el número de bacterias por unidad de
volumen y el tiempo.

b) Pruebe si existe relación lineal entre las variables a un nivel de significación de 5%

H0: β 1 = 0
H1: β 1 ≠ 0

Fc (4.7639) < Ftab (5.99). Con un nivel de significación de 5%, se concluye que no existe
suficiente evidencia estadística para rechazar la Hipótesis Nula β 1 = 0, no existe una relación
lineal entre las variables.

3 Estadística Inferencial
4. Sean X = gastos de investigación y desarrollo (mp) Y =
ganancia anual (mp)

X 2 3 4 5 7 4 6
Y 4 7 10 11 16 5 14

a) Halle el modelo de regresión

GASTOS DE
GANANCIA
INVESTIGACIÓN Y
ANUAL (mp) X^2 Y^2 XY
DESARROLLO (mp)
Y
X
2 4 4 16 8
3 7 9 49 21
4 10 16 100 40
5 11 25 121 55
7 16 49 256 112
4 5 16 25 20
6 14 36 196 84
31 67 155 763 340
^
Y = ^β0 + β^ 1 X
^
Ganancia Anual= β^ 0 + β^ 1 Gastos de Investigación en Desarrollo

^β 1=(n)¿ ¿

^β = ( 7 ) (340 )−(67)(31)
1
( 7 ) (155 )−¿ ¿

^β =2.4435
1

^β 0=¿ ¿

^β 0= ( 67 ) −(2.4435)(31)
7
^β =−1. 2 5
0

Ganancia Anual=−1.25+2.4435 Gastos de Investigación y Desarrollo

b) Halle e intérprete el coeficiente de correlación y determinación

4 Estadística Inferencial
Coeficiente de Correlación:

n ∑ XY −∑ X ∑ Y
r=
√ n ∑ X −∑ ¿ ¿ ¿ ¿ ¿
2

7 ( 340 ) −(31)(67)
r=
√ 7 ( 155 )−¿ ¿ ¿
r = 0.9322

Rpta: Se confirma la relación lineal entre Gastos de Investigación y Desarrollo y Ganancia


Anual, con un coeficiente de correlación de 0.9322, evidencia la relación lineal positiva intensa
entre dichas variables. Por lo tanto, se concluye una relación directa fuerte entre los Gastos de
Investigación y Desarrollo y Ganancia Anual.

Coeficiente de Determinación:

2 2
→ R =0.9322 =0.8690∗100
2
R =86.90 %

Ganancia Anual = -1.25 + 2.4435 Gastos de Investigación y Desarrollo

Rpta: El modelo explica un 86.90% de la variabilidad de la Ganancia Anual, es decir, el modelo


tiene una muy buena capacidad predictiva, el modelo tiene muy buen ajuste.

5 Estadística Inferencial

También podría gustarte