Está en la página 1de 4

Actividad en clase 1 Regresión Lineal Simple

En un laboratorio se quiere investigar la forma en que se relaciona la cantidad de fibra


(madera) en la pulpa con la resistencia del producto (papel). Los datos obtenidos en un
estudio experimental se muestran en la tabla.
Tabla 1. Datos de resistencia de la pulpa.

Porcentaje de Resistenci
fibra a
4 134
6 145
8 142
10 149
12 144
14 160
16 156
18 157
20 168
22 166
24 167
26 171
28 174
30 183

a). ¿En este problema cuál variable se considera independiente y cuál dependiente?
Variable independiente (x): % Fibra
Variable dependiente (y): Resistencia
b). Mediante un diagrama de dispersión analice la relación entre estas dos variables.
¿Qué tipo de relación observa y cuáles son algunos hechos especiales?

Gráfico de Dispersión
190

180

170
Rsistencia

160

150

140

130

120
0 5 10 15 20 25 30 35
% de Fibra

Se observa una relación lineal entre las variables Resistencia vs % de fibra. Es decir,
a media de que aumenta el valor del % de fibra aumenta el valor de la resistencia.
c). Haga un análisis de regresión (ajuste una línea recta a estos datos, aplique pruebas
de hipótesis y verifique residuos).
Curva de regresión ajustada.

Porcentaje de fibra Curva de regresión ajustada


190
180
170
Resistencia

160
150
140
130
120
0 5 10 15 20 25 30 35
Porcentaje de fibra

Resistencia Pronóstico Resistencia

Y=130.67+1.62X
Pruebas de hipótesis para los coeficientes del modelo de regresión Y=β0+ β1X
Para la ordenada se tiene:
Se acepta H0: β0=0, en caso contrario, se rechaza la hipótesis nula. Es decir, se
acepta la hipótesis alternativa Ha: β0≠0.
Para la pendiente se tiene:
Se acepta H0: β1=0, en caso contrario, se rechaza la hipótesis nula. Es decir, se
acepta la hipótesis alternativa Ha: β1≠0.
Conclusión:
En el caso de la ordenada, basado en las pruebas de hipótesis se demuestra el
rechazo de H0, debido a que el valor es 130.674. Significa que la curva ajustada
tiene un inicio distinto del origen.
Para la pendiente se demuestra el rechazo de la H0, quiere decir, que hay una
relación lineal entre mis variables.

Análisis de los residuales.

d). ¿La calidad del ajuste es satisfactoria? Argumente.


Y=130.674+1.624X

Estadísticas de la regresión
0.9644323
Coeficiente de correlación múltiple 18
0.9301296
Coeficiente de determinación R^2 95
0.9243071
R^2 ajustado 7
3.8764811
Error típico 66
Observaciones 14

Basado en las estadísticas de la regresión, se concluye que la calidad del ajuste del
modelo si es satisfactoria, debido a los siguientes puntos:
 El valor del coeficiente de correlación múltiple (r) es de 0.9644. Esto nos
quiere decir que hay una relación fuerte positiva, en otras palabras,
tenemos una relación creciente.
 El valor del coeficiente de determinación es de 0.9301. Esto nos indica, que
tanto explica la variable x a mi variable de respuesta.
 El valor de coeficiente de determinación ajustado es de 0.9243. Quiere
decir, que para fines de predicción es posible utilizar el modelo de
regresión, ya que cumple con el criterio de ser mayor al 70%.
 El error típico es de 3.876. Significa el error que estoy cometiendo al utilizar
la ecuación de regresión.

e). Con un porcentaje de 40% de fibra ¿qué resistencia de papel se tendrá?


Usando la ecuación de regresión se tiene que con un 40% de fibra se tendrá una
resistencia de 195.634.
f). Señale el valor de la pendiente de la recta e interprételo en términos prácticos.
Y=130.674+1.624X
El valor de la pendiente es 1.624. Por cada porcentaje de fibra que se incremente
habrá un incremento de 1.624 unidades en la resistencia.
g). Obtenga el error estándar de estimación y comente qué relación tiene éste con la
calidad del ajuste.
El error estándar de estimación es de 3.87. Es el error que se comete al usar la
ecuación de regresión.

También podría gustarte