Está en la página 1de 3

11.

7 ANALISIS DE REGRESIÓN

Supongamos que tenemos datos presentados en un diagrama de


dispersión x-y (Figura 11.43) que representa n valores x i yn
valores yi correspondientes. A menudo es deseable encontrar la
mejor línea de ajuste para los datos presentados de modo que y
pueda predecirse mejor para cualquier valor de x. Este es el
análisis de regresión. Los conceptos básicos se presentan aquí
para una regresión lineal donde la mejor línea de ajuste que se Estas dos ecuaciones dan a y b como:
encuentra es una línea recta y = ax + b.
El primer paso es definir qué se entiende por mejor ajuste. La
definición más común es que la suma de los cuadrados de las
diferencias di (figura 11.43) entre los valores predichos de y y el
valor medido de y es mínima. La suma de los cuadrados es:

Facultad de Ingeniería
Juan Manuel Ortíz
Dpto. de Ingeniería Civil y
Agrícola Gómez 1
Est. Ingeniería Civil
11.7 ANALISIS DE REGRESIÓN

Si observa un diagrama de dispersión y "globo ocular" la línea de


regresión, tiende a minimizar la distancia normal (NM en la Figura
11.44) entre los puntos de datos y la línea de mejor ajuste en lugar Entonces la derivada con respecto a b da:
de la distancia vertical. Esto se llama una regresión ortogonal.

Eliminando b de la ecuación. 11.210 da:

Luego establecemos:
En este caso, la expresión para la suma de los cuadrados de las
distancias se convierte en:

Facultad de Ingeniería
Juan Manuel Ortíz
Dpto. de Ingeniería Civil y
Agrícola Gómez 2
Est. Ingeniería Civil
11.7 ANALISIS DE REGRESIÓN
que da la siguiente ecuación: Tenga en cuenta que si la línea de regresión se ve obligada a pasar
por el origen, entonces:

lo que lleva a la solución para un: El coeficiente de regresión r2 es una medida de qué tan bien la
ecuación de regresión predice los datos. Está dado por:

Nos dice qué tan bien la línea de regresión predice los datos en
comparación con un promedio simple. Los valores cercanos a 1
indican que y = ax + b es un muy buen predictor de los datos,
mientras que los valores cercanos a cero indican que y = ax + b es
un predictor muy pobre de los datos y que también podría usar la
media independientemente del valor de x.

Facultad de Ingeniería
Juan Manuel Ortíz
Dpto. de Ingeniería Civil y
Agrícola Gómez 3
Est. Ingeniería Civil

También podría gustarte