Está en la página 1de 50

Tema 5: Regresión

lineal.
1. Introducción.
2. La ecuación de la recta.
3. El criterio de mínimos cuadrados.
4. Representación gráfica.
5. Coeficientes de regresión
estandarizados.
6. El coeficiente de determinación.
7. Introducción a la regresión múltiple.
REGRESIÓN LINEAL
La regresión permite conocer el valor de una variable desconocida a partir de
datos de otra variable con la que se asocia en varias observaciones, por lo que
permite llevar a cabo un análisis predictivo. De este modo, mediante la
regresión obtenemos una ecuación de estimación que relaciona las variables y
mediante el análisis de correlación se puede saber el grado en el que se
asocian. La variable conocida se llama variable independiente y la que se
desea predecir es la dependiente. Cabe destacar que la relación que se halla
entre las variables es una asociación, es decir, no tiene por qué ser siempre
una causa-efecto.
Hay dos tipos de regresión, la regresión lineal simple y la regresión múltiple,
lineal o no, en la que varias variables influyen en una en concreto entre otras.
En este tema nos centraremos en la regresión lineal simple y en el apartado 3
se introducirá la regresión lineal múltiple.
EJEMPLO
OTRA FORMA DE MÍNIMOS
CUADRADOS
Ejemplo
Encuentre la recta de regresión
EJEMPLO
UN SISTEMA DE MEDICION DE PRESIÓN DA COMO SALIDA UN VOLTAJE
PROPORCIONAL A LA PRESIÓN Y SE HA CALIBRADO CONTRA UN
TRADECTOR ESTANDAR. ENCUENTRE EL VOLTAJE COMO FUNCIÓN DE LA
PRESIÓN Y APLIQUE MINIMOS CUADRADOS Y ENCUENTRE EL ERROR
E [Mv] P[psi]

0,005 0,15

0,398 10,15

0,768 19,46

1,631 40,35

2,148 51,18

4,121 99,7

La variable independiente es la presión y la variable


dependiente es el voltaje
DETERMINE EL RANGO CON UN NIVEL DE SIGNIFICANCIA
DEL 95% SI EL VOLTAJE ES DE 2.54
ERROR ESTANDAR DE
ESTIMACIÓN
Una vez determinada la ecuación de la recta de regresión es
preciso cerciorarse de que tal estimación es buena. Tal estudio
se hace mediante el error estándar de la estimación que da
idea de la confiabilidad de la estimación llevada a cabo. Se
trata de un parámetro de significado similar a la desviación
estándar que evalúa lo que los datos se dispersan de la recta de
regresión obtenida. Su cálculo se lleva a cabo a partir de la
siguiente fórmula:
 El error de la estimación permite calcular
los intervalos de confianza de la
estimación. Si suponemos que los puntos
observados siguen un modelo de
distribución normal se puede suponer, del
mismo modo que en el tema 3 se vio con
la desviación estándar, que el 68% de los
puntos están a ±1 Se, el 95,5% a ±2 Se y el
99,7 a ±3 Se.
DATOS ESTIMADOS POR EL
MODELO SOBRE DATOS
OBSERVADOS
COEFICIENTE DE CORRELACIÓN
Tipos de correlación
EJEMPLO
DETERMINE:
 Escribir la recta de regresión y el coeficiente de
correlación.
 Calcular el error estándar de la estimación.
 ¿Entre qué valores hubiera oscilado la ganancia si el
miércoles hubiese habido 25 huéspedes a un nivel de
significancia del 99,7%?
ACTIVIDAD

 Escribir la recta de regresión y el coeficiente de


correlación y determinación.
 Calcular el error estándar de la estimación.
 ¿Entre qué valores hubiera oscilado la rendimiento
académico si tenemos la puntuación de 150 en una
estimación 95%
REGRESIÓN MÚLTIPLE
ECUACIÓN DE LA
REGRESIÓN MULTIPLE
SOLUCIÓN POR MÍNIMOS
CUADRADOS
ERROR ESTÁNDAR
COEFICIENTE DE
DETERMINACIÓN MÚLTIPLE
EJEMPLO
SOLUCIÓN MÍNIMOS
CUADRADOS
MISMO PROCESO Y ENCONTRAMOS
LA ECUACIÓN
ACTIVIDAD

 DETERMINE EL ERROR ESTANDAR


 COEFICIENTE DE DETERMINACIÓN.
ANÁLISIS RESIDUAL DE LA
REGRESIÓN LINEAL
el residual en la observación i-ésima es la diferencia entre el valor
observado de la variable independiente (yi ) y el valor estimado de
esa variable (ŷi ). En otras palabras, el i-ésimo residual es el error
debido al uso de la ecuación de regresión para predecir el valor
de yi . Un análisis de esos residuales ayudará a determinar si son
adecuados los supuestos que se hicieron sobre el modelo de
regresión; de hecho, ofrecen la mejor información con respecto a ϵ
EJEMPLO
Vamos a determinar el análisis residual de las ventas que se
han hecho durante 5 meses de ciertos artículos innovadores
para el hogar, según la publicidad ofertada, para ellos se ha
obtenido la siguiente tabla de valores:

MESES VENTAS(Y) PUBLICIDAD(X)


1 120 30
2 150 40
3 200 60
4 270 80
5 300 110
ACTIVIDAD
Determine el análisis residual entre la edad y talla de los de personas

También podría gustarte