Está en la página 1de 16

Universidad Nacional Autónoma de México

Facultad de Estudios Superiores Cuautitlán

REGRESIÓN LINEAL SIMPLE

ANÁLISIS DE REGRESIÓN

Al continuar con el estudio de la relación


entre dos variables X y Y, ahora es
pertinente considerar el caso en que es
necesario pronosticar la variable
dependiente Y con base en la variable
independiente X, es decir, que nos puede
interesar pronosticar el nivel de glucosa
en la sangre de un varón adulto que
tenga X peso.

¿Qué es el análisis de regresión?

Es la técnica empleada para realizar la predicción del valor de la variable


dependiente Y, con base en un valor seleccionado de la variable independiente
X

Nota: La palabra regresión la utilizó por primera vez Sir Francis Galton en 1877
en su estudio de los factores hereditarios. Descubrió que las estaturas de los
descendientes de padres altos, tendían a una regresión (es decir a volver o
retornar) hacia la estatura promedio de la población.

Al observar el diagrama de dispersión,


se puede considerar que una línea recta
parece describir mejor la ubicación
promedio de los puntos, por lo que se
determinará mediante una ecuación
matemática correspondiente a una línea
recta.

¿Qué es la ecuación de regresión?

Es una expresión matemática que define la relación entre dos variables,


llamada también recta de regresión. Se pueden trazar manualmente varias
rectas que pasen aproximadamente cerca de todos los puntos, pero el
concepto de “cerca” se debería al juicio de cada persona que realiza el ajuste;
para evitar esta subjetividad y elegir la recta que mejor se ajuste a los puntos,
utilizaremos el método de mínimos cuadrados.

Regresión Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autónoma de México
Facultad de Estudios Superiores Cuautitlán

¿Qué es el método de mínimos


cuadrados?
Es una técnica empleada para llegar a la
ecuación de regresión, minimizando la
suma de los cuadrados de las distancias
o desviaciones verticales entre los
valores Y verdaderos (de los puntos) y
los valores pronosticados o estimados de
Y (de la recta).

La forma general de la ecuación de


regresión o recta de regresión, es

Y ' = a + bX

En donde:

Y’ es el valor pronosticado o estimado de la variable Y, para un


valor seleccionado de X.

a es la ordenada al origen de la recta o la intersección con el eje


Y; también se puede decir que es el valor estimado de Y cuando
X vale cero

b es la pendiente de la recta, es decir, el cambio promedio


(incremento o decremento según sea el signo) en Y’, por cada
unidad de cambio en la variable independiente X.

X
es cualquier valor seleccionado para la variable independiente.

Como la pendiente b indica el comportamiento o actitud que tiene la variable


dependiente Y con respecto a la variable independiente X, le denominaremos
como coeficiente de regresión.

Regresión Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autónoma de México
Facultad de Estudios Superiores Cuautitlán

¿Cómo se calculan el coeficiente de regresión y la ordenada al origen?

Con base en el planteamiento y solución de un sistema de dos ecuaciones


lineales normales, podemos definir las dos fórmulas correspondientes.

n( ∑ XY ) − (∑ X )(∑ Y )
b=
n( ∑ X 2 ) − ( ∑ X ) 2

∑Y ∑X
a= −b
n n

o bien

a = Y − bX

Y y X son los promedios o medias de las variables X y Y.

Continuando con nuestro ejemplo, con los valores de la siguiente tabla,


calcularemos la ecuación de la recta de regresión, que estima o pronostica el
valor de nivel de glucosa en la sangre para un valor del peso de un varón
adulto:

X Y X2 XY Y2

64.7 98 4,186.09 6,340.6 9,604


75.3 109 5,670.09 8,207.7 11,881
73.0 88 5,329.00 6,424.0 7,744
82.1 107 6,740.04 8,784.7 11,449
76.2 93 5,806.44 7,086.6 8,649
95.7 121 9,158.49 11,579.7 14,641
59.4 79 3,528.36 4,692.6 6,241
93.4 118 8,723.56 11,021.2 13,924
82.5 109 6,806.25 8,992.5 11,881
78.9 85 6,225.21 6,706.5 7,225

781.2 1,007 62,173.90 79,836.1 103,239

Calculamos ahora los valores de a y b:

10(79,836.1) − (781.2)(1,007) 11,692.6


b= = = 1.02
10(62,173.90) − (781.2) 2 11,465.56

1,007 781.2
a= − 1.02( ) = 100.7 − 1.02(78.12) = 21.03
10 10

Regresión Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autónoma de México
Facultad de Estudios Superiores Cuautitlán

por lo que la ecuación de la recta de regresión queda como:

Y ' = 21.03 + 1.02 X

78.12 kg es el peso promedio de la muestra de varones adultos que se está


analizando, y 100.7 mg/100ml es nivel de glucosa promedio de dicha muestra.

La ordenada al origen indica que, hipotéticamente un varón adulto que pesara


0 kg, tendría un nivel de glucosa en la sangre de 21.03 mg/100ml, aunque
debemos observar que el peso de los varones adultos está en un rango
experimental aproximadamente entre 60 y 100 kg.

El coeficiente de regresión indica que, por cada kilogramo de peso que


aumente un varón, su nivel de glucosa se incrementará (ya que el coeficiente
de regresión es de signo positivo) en 1.02 mg/100ml.

Para un varón adulto que tenga un peso de 80.0 kg, podríamos estimar su
nivel de glucosa, sustituyendo el valor del peso en la ecuación de la recta de
regresión encontrada:

Y ' = 21.03 + 1.02(80.0) = 21.03 + 81.58 = 102.62

Con base en el coeficiente de regresión, también podríamos decir, que si el


varón con 80.0 kg de peso tiene un nivel de glucosa estimado o pronosticado
de 102.62 mg/100ml, otro varón con 81.0 kg de peso, tendrá un nivel de
glucosa estimado de 102.62+1.02=103.64 mg/100ml.

Regresión Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autónoma de México
Facultad de Estudios Superiores Cuautitlán

¿Cómo trazar la recta de regresión en el diagrama de dispersión?

Para dibujar una línea recta, sólo


necesitamos las coordenadas de dos
puntos, las cuales se pueden obtener
substituyendo dos valores
(cualesquiera, de preferencia dentro del
rango de los valores originales) de la
variable independiente X o abscisas, en
la ecuación de regresión y obteniendo
dos valores estimados de Y’ u ordenadas. Dibujando estos dos puntos en el
diagrama de dispersión, se puede fácilmente trazar la recta de regresión.

Es conveniente indicar que el punto de coordenadas P(0,a) de la intersección


de la recta con el eje Y, y el punto de coordenadas P( ( X , Y ) de las medias de
las dos variables, pertenecen a la recta de regresión.

En nuestro ejemplo, para trazar la recta


de regresión debemos saber que contamos
con los siguientes puntos que pertenecen
a la recta:

El punto P(0, 21.03) correspondiente a la


intersección de la recta con el eje Y de la
variable dependiente (nivel de glucosa en
la sangre), y el punto P(78.12, 100.7) correspondiente a las medias de las dos
variables, pertenecen a la recta de regresión

Y ' = 21.03 .+ 1.02 X

Podemos encontrar dos puntos dentro del rango experimental, sustituyendo


por ejemplo los valores de 60.0 y 100.0 kg de peso en la ecuación de la recta
de regresión

Y ' = 21.03 + 1.02(60.0) = 82.22 mg / 100ml


Y ' = 21.03 + 1.02(100.0) = 123.01 mg / 100ml

Por lo que, por los puntos P(60.0, 82.22) y P(100.0, 123.01) se puede trazar la
recta de regresión

Regresión Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autónoma de México
Facultad de Estudios Superiores Cuautitlán

En el diagrama de
dispersión anterior, se
puede observar que no
todos los puntos están
sobre la recta de regresión,
lo cual indica que al realizar
el pronóstico de la variable
dependiente Y, no
tendríamos una exactitud
del 100%, sino que habría
un error, es decir que, la
estimación del nivel de glucosa no es exacta, con base en el peso de los
varones adultos. En el caso hipotético de que todos los puntos estuvieran
sobre la recta de regresión, el pronóstico sería exacto.

¿Cómo medir la precisión de los pronósticos o estimaciones?

La medida que indica la precisión en el pronóstico o estimación de la variable


dependiente Y, con respecto a la variable independiente X, se llama error
estándar de regresión. Se denota con S y . x y es similar a la desviación estándar

que nos mide la dispersión de un conjunto de valores con respecto a la media,


así, el error estándar de regresión mide la dispersión vertical de los puntos con
respecto a una recta promedio que llamamos recta de regresión.

¿Cómo se calcula el error estándar de regresión?

Se calcula con la siguiente fórmula:

∑(Y − Y ' ) 2
S y. x =
n−2
o bien

(∑Y)2 (∑X)(∑Y)
∑Y2 − −b[∑XY− ]
Sy.x = n n
n −2

Podemos ver en las fórmulas anteriores que el denominador del radical es n-2,
en lugar de n-1 como era para el caso de la desviación estándar; lo anterior
obedece a que para encontrar los valores a y b en la recta de regresión, son
dos incógnitas en el sistema de dos ecuaciones lineales normales, lo cual
también podríamos explicar diciendo que así como para calcular la desviación
estándar se necesitan como mínimo dos valores, para calcular el error estándar
de regresión se necesitan como mínimo tres puntos.

Regresión Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autónoma de México
Facultad de Estudios Superiores Cuautitlán

Para calcular el error estándar de regresión en nuestro ejemplo, de acuerdo a


la primer fórmula, debemos calcular los residuos, es decir, las distancias o
desviaciones verticales entre los valores observados del nivel de glucosa en la
sangre (Y) y los correspondientes valores estimados (Y’); por el método de
mínimos cuadrados, la suma de estos residuos debe ser igual a cero, es decir
∑ (Y − Y ' ) = 0 ; reiterando que se puede hacer fácilmente con los paquetes de
software estadístico, lo hacemos en la siguiente tabla

X Y Y’ Y-Y’ (Y-Y’)2
64.7 98 87.01 10.99 120.6865
75.3 109 97.82 11.18 124.8994
73.0 88 95.48 -7.48 55.9297
82.1 107 104.76 2.24 5.0229
76.2 93 98.74 -5.74 32.9703
95.7 121 118.63 2.37 5.6258
59.4 79 81.61 -2.61 6.8085
93.4 118 116.28 1.72 2.9496
82.5 109 105.17 3.83 14.6939
78.9 85 101.50 -16.50 272.0997
781.2 1,007 0.00 641.6864

Calculamos el error estándar muestral, con las dos fórmulas

641.6864 641.6864
S y. x = = = 80.2108 = 8.96
10 − 2 8

o bien

(1,007) 2 (781.2)(1,007)
103,239 − − 1.02[79,836.1 − ]
10 10 1,834.1 − 1.02(1,169.26)
S y. x = =
10 − 2 8

1,834.1 − 1,192.4136 641.6864


S y.x = = = 80.2108 = 8.96
8 8

El error estándar de regresión tiene un valor de 8.96 mg/100ml

Relación entre coeficiente de correlación y el error estándar de regresión:

Cuando en el diagrama de dispersión, los puntos están muy cerca de la recta


de regresión, podemos afirmar que la intensidad de la relación entre las dos
variables es fuerte, es decir, que el coeficiente de correlación (r) es muy
cercano a ± 1.00 , pero también podemos decir que el error estándar de
regresión ( S y . x ) es casi cero; por el contrario, cuando la relación entre dos

variables es nula, los puntos en el diagrama están totalmente dispersos con


respecto a la recta de regresión, lo que conlleva que r = 0 y que S y . x = ∞ .

Regresión Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autónoma de México
Facultad de Estudios Superiores Cuautitlán

¿Cuáles son los supuestos básicos para la regresión lineal?

El análisis de la regresión lineal, se sustenta en que se cumplan o satisfagan


los siguientes supuestos:

1. Para cada valor de la variable


independiente X, existe un conjunto
de valores Y, que tienen distribución
normal. Se le conoce como supuesto
de normalidad; si la distribución sólo
es aproximadamente normal, para el
análisis de regresión se puede decir
que se satisface el supuesto.

2. Las medias ( μ y / x ) de las distribuciones normales de valores Y, se

encuentran todas en la recta de regresión. Se le conoce como supuesto


de linealidad.

3. Las desviaciones estándares ( σ ) de dichas distribuciones normales,


ahora representadas por el error estándar de regresión ( S y . x ), son

iguales. Se le conoce como supuesto de homoscedasticidad; este


supuesto es importante que se cumpla para el uso del método de
mínimos cuadrados.

4. Para cada valor de la variable independiente X, se presenta un error, es


decir, la distancia o desviación vertical entre un valor observado Y y su
correspondiente valor pronosticado o estimado Y’; es necesario que se
cumpla la suposición de que estos errores sean independientes para
cada valor de X; se le conoce como supuesto de independencia de error.

Si las distribuciones de los valores Y para cada valor de X son


aproximadamente normales, entonces existen las mismas relaciones que
tienen los valores de μ y σ en la distribución normal, es decir, con una
muestra suficientemente grande, aproximadamente:

• Y '±1S y . x abarca o comprende el 68.26% centrado de los valores

observados.

• Y '±2 S y . x abarca o comprende el 95.44% centrado de los valores

observados.

• Y '±3S y. x abarca o comprende el 99.74% centrado de los valores

observados.

Regresión Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autónoma de México
Facultad de Estudios Superiores Cuautitlán

En nuestro ejemplo, si tomamos un varón adulto de X=75.0 kg de peso y


estimamos su nivel de glucosa en la sangre con

Y ' = 21 .03 + 1 .02 ( 75 .0 ) = 21 .03 + 76 .49 = 97 .52 mg / 100 ml

Entonces:

Entre 97.52 ± 1(8.96) = 97.52 ± 8.96, es decir , entre 88.56 y 106.47 mg / 100 ml de
nivel de glucosa en la sangre, se encuentra el 68.26% centrado, de los varones
con 75.0 kg de peso.

Entre 97.52 ± 2(8.96) = 97.52 ± 17.91, es decir , entre 79.61 y 115.43 mg / 100 ml de
nivel de glucosa en la sangre, se encuentra el 95.44% centrado, de los varones
con 75.0 kg de peso.

Entre 97 .52 ± 3(8.96 ) = 97 .52 ± 26 .87 , es decir , entre 70 .65 y 124 .39 mg / 100 ml de
nivel de glucosa en la sangre, se encuentra el 99.74% centrado, de los varones
con 75.0 kg de peso.

Casi todas las variables independientes que se han estudiado, son de tipo
cuantitativo, es decir, proporcionan valores numéricos de medición, pero en el
análisis de regresión a veces es necesario utilizar como variables
independientes, las que son de tipo cualitativo, es decir que sus valores son
categorías que proporcionan el concepto de atributo, como por ejemplo el
sexo, la nacionalidad, el grupo racial, la profesión u ocupación, la zona de
residencia, etc.

Para utilizar una variable independiente cualitativa en el análisis de regresión,


ésta debe tener la posibilidad de ser cuantificada, lo anterior puede lograrse
utilizando una variable ficticia.

¿Qué es una variable ficticia?

Es una variable que solo toma un número finito de valores enteros positivos
(incluyendo a veces al cero), para identificar las diferentes categorías de una
variable cualitativa.

Como por ejemplo:


Variable Variable
Cualitativa Ficticia
Sexo X
Masculino 0
Femenino 1

Regresión Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autónoma de México
Facultad de Estudios Superiores Cuautitlán

Cuando la variable independiente cualitativa


es el tiempo (hora, día, mes, año, etc.), al
análisis de regresión respectivo, se le llama
análisis de series de tiempo. Al dibujar el
diagrama de dispersión, se acostumbra unir
los puntos con una línea quebrada, ya que los
valores del tiempo como variable cualitativa,
están equidistantes

Tomemos como ejemplo las ventas mensuales (en miles de pesos) de una
empresa como la variable dependiente, durante el periodo de agosto de 2005 a
julio de 2006; este periodo de tiempo sería la variable independiente
cualitativa, que transformamos en una variable ficticia en la siguiente tabla:

Variable Variable Variable


independiente ficticia dependiente
cualitativa (ventas)
Mes X Y X2 XY Y2
Agosto 1 486 1 486 236,196
Septiembre 2 626 4 1,252 391,876
Octubre 3 630 9 1,890 396,900
Noviembre 4 809 16 3,236 654,481
Diciembre 5 925 25 4,625 855,625
Enero 6 546 36 3,276 298,116
Febrero 7 870 49 4,350 756,900
Marzo 8 368 64 2,944 135,424
Abril 9 426 81 3,834 181,476
Mayo 10 694 100 6,940 481,636
Junio 11 523 121 5,753 273,529
Julio 12 562 144 6,744 315,844
78 7,465 650 45,330 4,978,003

Primero calculamos la recta de regresión

12 ( 45 , 330 ) − ( 78 )( 7 , 465 ) − 38 , 310


b = = = − 22 . 33
12 ( 650 ) − ( 78 ) 2
1, 716

7,465 78
a= − (−22.33) = 622.08 − (−22.33)6.5 = 767.20
12 12

por lo que la ecuación de la recta de regresión queda como:

Y ' = 767.20 − 22.33 X


Podemos pronosticar las ventas para diciembre de 2006, con el valor ficticio de
X=17 y sustituyéndolo en la ecuación de regresión

Y ' = 767.20 − 22.33(17) = 387.67 miles de pesos

Regresión Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autónoma de México
Facultad de Estudios Superiores Cuautitlán

Esta estimación puede no ser muy exacta pues tenemos un error que puede
ser muy grande.

Calculemos ahora el error estándar de regresión y los coeficientes de


correlación, determinación y no determinación:

(7,465) 2 (78)(7,465)
4,978,003 − − (−22.33)[45,330 − ]
S y. x = 12 12
12 − 2

334,150.92 − ( −22.33)(−3,192.50) 334,150.92 − 71,273.12 262,877.80


S y. x = = =
10 10 10

S y.x = 26 , 287 . 78 = 162 . 14 miles de pesos

12(45,330) − (78)(7,465) − 38,310


r= =
[12(650) − (78) 2 ][12(4,978,003) − (7,465) 2 ] (1,716)(4,009,811)
− 38,310 − 38,310
r= = = −0.4618
6,880,835,676 82,950.80
r 2 = (−0.4618) 2 = 0.2133
1 − r 2 = 1 − 0.2133 = 0.7868

Lo que indica que sólo el 21.33% de la variación en las ventas, está explicado
por la variación en el tiempo, en tanto que el 78.68% muchísima variación no
está explicada, es decir que el coeficiente de correlación indica un grado de
intensidad débil entre las dos variables.

TRANSFORMACIONES

Cuando al analizar un diagrama de dispersión encontramos que los puntos no


están mas o menos en una tendencia lineal, sino que sería una curva la que
mejor se ajustaría a los puntos observados, entonces, si equivocadamente
insistimos en medir la correlación lineal entre X y Y, y encontrar la recta de
regresión para pronosticar los valores de la variable dependiente Y con
respecto a la variable independiente X, vamos a encontrar un valor de r
moderado o débil, es decir cercano a cero y un valor de S y . x muy grande, lo

que nos indicaría que es incorrecto el pronóstico que deseamos hacer de la


variable dependiente Y.

Regresión Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autónoma de México
Facultad de Estudios Superiores Cuautitlán

Para evitar que suceda lo mencionado en el párrafo anterior, se puede realizar


el análisis de dos formas:

1. Transformaciones de curvas no lineales a rectas de regresión.

2. Correlación y regresión polinomial, que se aplica cuando no se conoce la


forma funcional exacta de la curva de regresión y un polinomio de grado
n sirve para ajustar la curva y pronosticar el valor de la variable
dependiente Y; el polinomio es Y ' = a + bX + cX 2 + dX 3 + " + pX n
(Este tema se abordará en otro fascículo).

Transformaciones de curvas no lineales a rectas de regresión.

Si en el diagrama de dispersión cambiamos uno o los dos ejes por una escala
de transformación adecuada, podemos observar que se enderezan (por así
decirlo) los puntos y podemos realizar el análisis como si le ajustáramos una
recta de regresión y calculáramos una correlación lineal.

Para poder presentar los resultados en forma adecuada, debemos deshacer las
transformaciones realizadas, quedando valores y unidades de medida en la
forma original.

Algunos ejemplos de transformación, son los siguientes:

Función exponencial.

La función que representa los datos originales de las


Función exponencial
variables es

Y = A • B X

Si tomamos logaritmos decimales o naturales, la


función transformada queda como una función lineal
en X

log Y = log A + X log B

Los valores originales de la variable dependiente Y,


quedan transformados a

log Y

Regresión Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autónoma de México
Facultad de Estudios Superiores Cuautitlán

Función recíproca.

La función que representa los datos originales de las variables es

1
Y=
A + BX

Si tomamos el inverso en ambos miembros de la ecuación, la función


transformada queda como una función lineal en X

1
= A + BX
Y

Los valores originales de la variable dependiente Y, quedan transformados a

1
Y
Función de potencia.

La función que representa los datos originales de las variables es

Y = A• X B

Si tomamos logaritmos decimales o naturales, la función transformada queda


como una función lineal en X

log Y = log A + B log X

Los valores originales de la variable independiente X, quedan transformados a

log X

Y los valores originales de la variable dependiente Y, quedan transformados a

log Y

Por ejemplo, consideremos como variable independiente X a los miles de km


de recorrido de una llanta radial para automóvil compacto y como variable
dependiente Y al porcentaje de vida útil que aún le queda a la llanta.

Dibujando el diagrama de dispersión, observamos que los puntos se acomodan


aproximadamente en una forma exponencial, es decir que se ajustaría una
curva exponencial con ecuación
Y = A• BX

Regresión Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autónoma de México
Facultad de Estudios Superiores Cuautitlán

Si dibujamos el diagrama de dispersión,


cambiando el eje Y por el eje Z = logY,
podemos observar que los puntos se
“enderezan” y es factible encontrar una recta
de regresión cuya ecuación será:

Z ' = a + bX donde
Z = log Y Y = 10 Z
a = log A A = 10 a
b = log B B = 10 b

Realizamos los cálculos del método de mínimos cuadrados, utilizando la


siguiente tabla:

X Y Z=logY X2 XZ Z2
1 98.2 1.9921 1 1.9921 3.9685
2 91.7 1.9624 4 3.9247 3.8509
5 81.3 1.9101 25 9.5505 3.6484
10 64.0 1.8062 100 18.0618 3.2623
20 36.4 1.5611 400 31.2220 2.4370
30 32.6 1.5132 900 45.3965 2.2898
40 17.1 1.2330 1,600 49.3198 1.5203
50 11.3 1.0531 2,500 52.6539 1.1090
158 13.0311 5,530 212.1214 22.0863

8(212.1214) − (158)(13.0311) −361.9495


b= = = −0.0188
8(5,530) − (158) 2 19, 276

13.0311 158
a= − ( −0.0188) = 1.6289 − ( −0.0188)19.75 = 1.6298 + 0.3708 = 1.9997
8 8

la ecuación transformada queda

Z ' = 1.9997 − 0.0188 X

Regresión Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autónoma de México
Facultad de Estudios Superiores Cuautitlán

y la ecuación original en forma exponencial queda como:

A = 101.9997 = 99.94 y B = 10−0.0188 = 0.96

por lo que

Y ' = 99.94(0.96) X

Si deseamos pronosticar el valor del porcentaje de vida útil Y’, para una llanta
radial que lleve recorridos 65,300 km por ejemplo, podemos sustituir el valor
de X=65.3 en cualquiera de las dos ecuaciones de regresión anteriores:

Z ' = 1.9997 − 0.0188(65.3) = 1.9997 − 1.2262 = 0.7736

Por lo que queda

Y ' = 100.7736 = 5.94 % de vida útil

o también puede calcular

Y ' = 99.94(0.96)65.3 = 5.94 % de vida útil

El error estándar de regresión queda como:

(13.0311) 2 (158)(13.0311)
22.0863 − − ( −0.0188)[212.1214 − ]
S z.x = 8 8
8−2
0.8599 − ( −0.0188)(−45.2437) 0.8599 − 0.8496 0.0104
S z.x = = = = 0.0017 = 0.0416
6 6 6
S y. x = 1.10 % de vida útil

que es un valor pequeño, porqué los puntos están muy cerca de la línea recta.

Los coeficientes de correlación, determinación y no determinación se calculan


como:

8(212.1214) − (158)(13.0311) − 361.9495


r= =
[8(5,530) − (158) ][8(22.0863) − (13.0311) ]
2 2
(19,276)(6.8793)
− 361.9495 − 361.9495
r= = = −0.9940
132,605.0197 364.1497
r 2 = (0.9940) 2 = 0.9880 1 − r 2 = 1 − 0.9880 = 0.0120

Regresión Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autónoma de México
Facultad de Estudios Superiores Cuautitlán

Lo que nos indica un grado de intensidad muy


fuerte para la relación entre los km recorridos de
una llanta radial y su porcentaje de vida útil, ya
que podemos afirmar que el 98.80% de la
variación en el porcentaje de vida útil, está
explicado por la variación en los km recorridos.

Para concluir, se puede mencionar que también


existe la correlación y regresión lineal múltiple
(se tratará en otro fascículo), en la cual podemos
incluir dos o más variables aleatorias
independientes y entonces medir el grado de
intensidad de relación entre tres o más variables, mediante la correlación
múltiple lineal, y tratar de pronosticar el valor de la variable dependiente Y,
para valores específicos de las diferentes variables independientes, con la
regresión múltiple lineal; lo anterior mediante la ecuación:

Y ' = a + b1 X 1 + b2 X 2 + b3 X 3 + " + bk X k

Regresión Lineal Simple


http://www.cuautitlan.unam.mx

También podría gustarte