Está en la página 1de 19

17/06/2010

Regresión Lineal
Simple

Modelos Empíricos
Muchos problemas en la ingeniería involucran
las relaciones entre dos o más variables
Por ejemplo: temperatura y dureza
El análisis de regresión es una técnica
estadística muy útil para este tipo de
problemas.
Se puede hacer un modelo para predecir la
dureza del material a cierta temperatura

1
17/06/2010

Modelos Empíricos

Diagrama de dispersión

2
17/06/2010

Observaciones
No hay una curva simple que una todos los
puntos

Existe una tendencia muy fuerte a que todos


los puntos se encuentran dispersos
aleatoriamente alrededor de una línea recta

Regresión Lineal Simple


Es razonable asumir que el valor esperado de Y
está relacionado a x por:

Donde la pendiente y la intersección con el eje Y


se conocen como COEFICIENTES DE REGRESIÓN

Debido a que estamos hablando de una


aproximación, se le añade un término de error

3
17/06/2010

Regresión Lineal Simple

Donde є se le conoce como término aleatorio


de error
A la ecuación anterior le llamamos modelo
de regresión lineal simple debido a que
sólo tiene una variable independiente o
regresor

Importancia de la Varianza
La varianza determina la variabilidad en las
observaciones
Entonces si σ2 es pequeña los valores de las
observaciones de Y caerán muy cerca de la
línea, en cambio si σ2 es grande los valores de
las observaciones de Y se desviarán mucho de
la línea.
Debido a que σ2 es constante, la variabilidad
en Y para cualquier valor de x es el mismo

4
17/06/2010

Importancia de la Varianza

Regresión Lineal Simple


Suponemos que tenemos n pares de
observaciones
Utilizaremos un
criterio para la
estimación de los
coeficientes de
regresión llamado el
método de los
mínimos cuadrados

5
17/06/2010

Regresión Lineal Simple


Generalizando tenemos:

La suma de los cuadrados de las desviaciones de


las observaciones es:

Regresión Lineal Simple


Los estimadores mínimos cuadrados de
y de , o dichos de otra manera y
deben satisfacer:

Simplificando tenemos:

6
17/06/2010

Definición
Los estimadores de mínimos cuadrados en la
intercepción y en la pendiente en un modelo de
regresión lineal simple son:

Observaciones
La regresión lineal estimada por lo tanto es:

Para cada par de observaciones se debe


satisfacer la siguiente relación

Donde es llamado residual y


describe el error en ese punto

7
17/06/2010

Observaciones
Es conveniente dar símbolos especiales al
numerador y al denominador de la definición
anterior

Ejemplo

8
17/06/2010

Ejemplo

Ejemplo

9
17/06/2010

Estimación de σ2
Tenemos aún otro parámetro desconocido en
nuestro modelo de regresión, σ2 la varianza
del término de error aleatorio є
Para esto definimos La suma de cuadrados de
los residuales, mejor conocida como error de
suma de cuadrados

Estimación de σ2
Tenemos ahora que un estimador puntual de
la varianza es igual a:

Donde SSE también puede ser presentado así:

10
17/06/2010

Errores estándar
En la regresión lineal simple el error estándar
estimado de la pendiente y de la intersección
son:

Pruebas de hipótesis en regresión


lineal simple
Una parte importante para lograr un modelo
adecuado de regresión lineal es evaluar
hipótesis acerca de los parámetros de este
mismo modelo y de esta manera construir
intervalos de confianza

11
17/06/2010

Usando las pruebas-t


Supongamos que deseamos evaluar la
hipótesis de que la pendiente es igual a una
constante, por decir,

Las apropiadas hipótesis serían:


Nuestro valor T es el siguiente, con
distribución t y n-2 grados de libertad

Usando las pruebas-t


Podemos rechazar cuando:

Ahora para evaluar la intercepción

Se rechaza con la misma condición

12
17/06/2010

Casos especiales

Si aceptamos la hipótesis

Si Rechazamos la hipótesis

Ejemplo
Continuando con el ejemplo anterior, evaluemos las
siguientes hipótesis

Usaremos α = 0.01
Tenemos lo siguiente

Debido a que la hipótesis se rechaza

13
17/06/2010

Análisis de la Varianza
El método de análisis de la varianza mide la
significancia de la regresión
El método particiona la variabilidad total de la
respuesta variable en componentes
significativos como la base para la prueba
La igualdad para el análisis de la varianza es:

Análisis de la Varianza
Simbólicamente la ecuación puede escribirse así:

Donde:

Es la suma total corregida de los cuadrados (k=n-1)

Es el error de suma de los cuadrados (k=n-2)

Es la suma de regresión de los cuadrados (k=1)

14
17/06/2010

Análisis de la Varianza
Para rechazar o aceptar utilizaremos ahora la
distribución F

Rechazaremos H0 si
MSR y MSE son los cuadrados significativos

Ejemplo
Utilizaremos el mismo ejemplo anterior,

Se cumple por lo tanto la hipótesis


se rechaza

15
17/06/2010

Intervalos de confianza

Ejemplo
Encontrar intervalo de confianza del 95%
sobre la pendiente usando los datos
anteriores

16
17/06/2010

Ajuste de la recta de regresión

Debido a que para nuestro análisis requerimos


varias suposiciones, es necesario verificar que
nuestros resultados sean adecuados
Para esto utilizamos:
• Análisis de residuales
• Coeficiente de determinación

Análisis de residuales
Sabemos que un residual es:
Se podría utilizar un histograma de frecuencia
de residuales, pero es mejor utilizar una
gráfica de probabilidad normal

17
17/06/2010

Gráfica de PROBABILIDAD NORMAL


176, 191, 214, 220, 205, 192, 201, 190, 183, 185

Gráfica de PROBABILIDAD NORMAL

18
17/06/2010

Coeficiente de determinación R2
Se determina así:

Es utilizado para juzgar que tan adecuado fue


el modelo de regresión
El valor va de 0 a 1

19

También podría gustarte