Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2007
H. Hernndez / P. Reyes
Septiembre 2007
Pgina 1 de 11
REGRESIN Y CORRELACIN LINEAL P. Reyes / Sept. 2007
Son dos herramientas para investigar la dependencia de una variable dependiente Y en funcin de
una variable independiente X. Y = f(X)
Y = Variable dependiente que se desea explicar o predecir, tambin se llama regresor o respuesta
X = Variable independiente, tambin se llama variable explicativa, regresor o predictor
Regresin lineal - La relacin entre X y Y se representa por medio de una lnea recta
Regresin curvilinea - La relacin entre X y Y se representa por medio de una curva.
Y * *
** * * * *
* * * *
* b1 * * * *
* * * *
* * * * * *
b0
Correlacin positiva Correlacin negativa X
Sin correlacin
El trmino de error es la diferencia entre los valores reales observados Yi y los valores estimados por
la ecuacin de la recta. Se trata de que estos sean mnimos, para lo cual se utiliza el mtodo de
mnimos cuadrados.
Pgina 2 de 11
REGRESIN Y CORRELACIN LINEAL P. Reyes / Sept. 2007
*
Y Error Re siduo (Yi Yi )
*
Pgina 3 de 11
REGRESIN Y CORRELACIN LINEAL P. Reyes / Sept. 2007
Y
Yest = 4.4 + 1.08 X
Yi = 23 * Desviacin no explicada
Error = (Yi - Yest) = 1.32
Variacin total
(Yi-Ymedia)=5.13 Desviaci explicada
(Yest-Ymedia) = 3.81
Ymedia =17.87
X = 16 X
Ejemplo: Se sospecha que el tiempo requerido para hacer un mantenimiento preventivo est
relacionado con su nmero. Calcular el coeficiente de correlacin y graficar. Los datos de tiempo
tomados para n = 25 servicios se muestran a continuacin:
Si todos los puntos estuvieran completamente sobre la recta la ecuacin lineal sera
y = a + bx. Como la correlacin no siempre es perfecta, se calculan a y b de tal forma que se
minimice la distancia total entre puntos y la recta. Los clculos tomando las sumas de cuadrados
siguientes se muestran a continuacin:
Sxy = 2027.71
Sxx = 698.56
Syy = 6105.94
b1 1
( Xi X )(Yi Y ) S XY
= 2.902704421
( Xi X ) 2
S XX
b0 0
Y i 1 X i
Y X = 5.114515575
n
Pgina 5 de 11
REGRESIN Y CORRELACIN LINEAL P. Reyes / Sept. 2007
r r 2 = 0.9816
El coeficiente de correlacin proporciona el nivel de ajuste que tienen los puntos a la lnea recta
indicando el nivel de influencia de una variable en la otra. El factor de correlacin r es un nmero
entre 1 (correlacin negativa evidente) y +1 (correlacin positiva evidente), y r = 0 indicara
correlacin nula.
El coeficiente de correlacin r = 0.98 por lo cual tenemos suficiente evidencia estadstica para
afirmar que el tiempo de atencin esta relacionado con el nmero de servicios atendidos.
USO DE EXCEL
Resumen
Estadsticas de la regresin
Coeficiente de correlacin
mltiple 0.981811778
Coeficiente de determinacin R^2 0.963954368
R^2 ajustado 0.962387167
Error tpico 3.093419627
Observaciones 25
Pgina 6 de 11
REGRESIN Y CORRELACIN LINEAL P. Reyes / Sept. 2007
USO DE MINITAB
Para determinar la funcin de regresin y correlacin en Minitab se siguen los pasos siguientes
(despus de cargar los datos correspondientes a X y a Y en las columnas C1 y C2):
Para obtener la lnea de mejor ajuste de la regresin, se procede como sigue en Minitab:
Stat >Fitted Line Plot ... Indicar la columna de Respuestas Y y la de predictores X,
seleccionar si se quiere ajustar con los datos con una lnea, una funcin cuadrtica o cbica
Pgina 7 de 11
REGRESIN Y CORRELACIN LINEAL P. Reyes / Sept. 2007
y aceptar con OK. Observar el mayor valor del coeficiente de correlacin que indica el mejor
ajuste.
En Options: seleccionar Display Confidence (para media en X) y Prediction Intervals para
X.
En Graphs: Seleccionar Residual for plots Standardized y Normal Plot of residuals
La grfica de residuos debe apegarse a la recta y tener siempre un valor P value >0.05.
40
30
20
10
0
0 5 10 15 20
X Servicios
Los intervalos de confianza para la media y el intervalo de prediccin para un punto especfico
X son los siguientes:
Pgina 8 de 11
REGRESIN Y CORRELACIN LINEAL P. Reyes / Sept. 2007
Pgina 9 de 11
REGRESIN Y CORRELACIN LINEAL P. Reyes / Sept. 2007
EJERCICIOS:
Ajuste
Cons_energa Mq.
Y X
21.6 11.15
4 15.7
1.8 18.9
1 19.4
1 21.4
0.8 21.7
3.8 25.3
7.4 26.4
4.3 26.7
36.2 29.1
2. En base al porcentaje de puntualidad se trata de ver si hay correlacin con las quejas en una lnea
area. Las quejas son por cada 100000 pasajeros.
%puntos Quejas
Aerolinea X Y
A 81.8 0.21
B 76.6 0.58
C 76.6 0.85
D 75.7 0.68
E 73.8 0.74
F 72.2 0.93
G 70.8 0.72
H 68.5 1.22
Pgina 10 de 11
REGRESIN Y CORRELACIN LINEAL P. Reyes / Sept. 2007
Pgina 11 de 11