Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DOE Maestría FIM UTP UNIDAD 8 PDF
DOE Maestría FIM UTP UNIDAD 8 PDF
REGRESIÓN LINEAL
Calor-1
REGRESIÓN LINEAL
Son herramientas para investigar la dependencia de una
variable dependiente Y en función de una variable
independiente X.
El análisis de regresión tiene como objetivo modelar en forma
matemática el comportamiento de una variable de respuesta en
función de una o más variables independientes (factores).
Ejemplo 1
En un laboratorio se quiere
investigar la forma en que se
relaciona la cantidad de fibra
(madera) en la pulpa con la
resistencia del producto (papel).
Calor-5
REGRESIÓN LINEAL
Ejemplo 1
En un laboratorio se quiere
investigar la forma en que se
relaciona la cantidad de fibra
(madera) en la pulpa con la
resistencia del producto (papel).
Calor-6
REGRESIÓN LINEAL
Calor-7
REGRESIÓN LINEAL
Calor-9
REGRESIÓN LINEAL
Al igualar a cero las dos ecuaciones y resolverlas en forma
simultánea con respecto a las dos incógnitas, se obtiene la
solución única:
Donde,
Calor-10
REGRESIÓN LINEAL
Las medias muestrales de las dos variables son:
Calor-11
REGRESIÓN LINEAL
Procedimiento para realizar los cálculos para la regresión
simple.
Calor-12
REGRESIÓN LINEAL
Procedimiento para realizar los cálculos para la regresión
simple.
Calor-13
REGRESIÓN LINEAL
Procedimiento para realizar los cálculos para la regresión
simple.
Calor-14
REGRESIÓN LINEAL
Procedimiento para realizar los cálculos para la regresión
simple.
Calor-15
REGRESIÓN LINEAL
Ahora obtengamos los coeficientes de regresión.
Calor-16
REGRESIÓN LINEAL
Ahora obtengamos los coeficientes de regresión.
Calor-17
REGRESIÓN LINEAL
Ahora obtengamos los coeficientes de regresión.
Calor-18
REGRESIÓN LINEAL
La ecuación anterior sirve para estimar la resistencia promedio
esperada para cualquier porcentaje de fibra utilizada. La
diferencia entre lo observado y lo estimado o predicho es una
estimación del error εi. Tal estimación recibe el nombre de
residuo, ei.
Calor-19
REGRESIÓN LINEAL
La ecuación anterior sirve para estimar la resistencia promedio
esperada para cualquier porcentaje de fibra utilizada. La
diferencia entre lo observado y lo estimado o predicho es una
estimación del error εi. Tal estimación recibe el nombre de
residuo, ei.
Calor-20
REGRESIÓN LINEAL
Pruebas de hipótesis en la regresión lineal simple
Calor-21
REGRESIÓN LINEAL
Pruebas de hipótesis en la regresión lineal simple
Calor-22
REGRESIÓN LINEAL
Suma de cuadrados del error
Calor-23
REGRESIÓN LINEAL
Tabla de ANOVA
Calor-24
REGRESIÓN LINEAL
Otro enfoque para analizar la significancia del modelo:
Los grados de libertad para Syy son n–1, SCR tiene un grado de
libertad y SCE tiene n–2.
Calor-25
REGRESIÓN LINEAL
Obtener la ANOVA en excel
Calor-26
REGRESIÓN LINEAL
Obtener la ANOVA en excel
Calor-27
REGRESIÓN LINEAL
Calidad del ajuste en regresión lineal simple
Calor-28
REGRESIÓN LINEAL
Coeficiente de determinación ajustado, R2aj.
Calor-29
REGRESIÓN LINEAL
Coeficiente de correlación r (R).
Calor-30
REGRESIÓN LINEAL
Otro método de análisis de la calidad de ajuste es observando
las gráficas de residuos y la probabilidad normal.
Para el ejemplo 1
Calor-31
REGRESIÓN LINEAL
Estimación y predicción por intervalo en regresión
simple
Calor-32
REGRESIÓN LINEAL
Calor-33
REGRESIÓN LINEAL
Calor-34
REGRESIÓN LINEAL
Predicción de observaciones futuras
Calor-35
REGRESIÓN LINEAL
Ejemplo 2.
Calor-36
REGRESIÓN LINEAL
Calor-37
REGRESIÓN LINEAL
a) ¿En este problema cuál variable se considera independiente
y cuál dependiente?
b) Haga un análisis de regresión (ajuste una línea recta a estos
datos, aplique pruebas de hipótesis y verifique residuos).
c) Señale el valor de la pendiente de la recta e interprételo en
términos prácticos.
d ) ¿La calidad del ajuste es satisfactoria? Argumente.
e) Si el diámetro máximo tolerado es de 45, ¿cuántas horas de
uso estima que tiene esa herramienta?
Calor-38
REGRESIÓN LINEAL
Regresión lineal múltiple
Calor-39
REGRESIÓN LINEAL
Si en la ecuación anterior k =1, estamos en el caso de regresión
lineal simple y el modelo es una línea recta; si k =2, tal
ecuación representa un plano. En general, la ecuación
representa un hiperplano en el espacio de k dimensiones
generado por las variables {Xj}.
Calor-40
REGRESIÓN LINEAL
Calor-41
REGRESIÓN LINEAL
Calor-42
REGRESIÓN LINEAL
Calor-43
REGRESIÓN LINEAL
Calor-44
REGRESIÓN LINEAL
El estimador de mínimos cuadrados de β es:
Calor-45
REGRESIÓN LINEAL
La suma de cuadrados del error tiene n-k-1 grados de libertad,
donde k + 1 es igual al número de parámetros estimados en el
modelo. Entonces, el cuadrado medio del error es:
Calor-46
REGRESIÓN LINEAL
Ejemplo 3.
Calor-47
REGRESIÓN LINEAL
Calor-48
REGRESIÓN LINEAL
Ordenando los datos de la tabla en forma matricial, tenemos:
Calor-49
REGRESIÓN LINEAL
Análisis de varianza
Para la regresión
Esto se logra probando la siguiente hipótesis: Por lo menos
algún término o variable en el modelo tiene una contribución
significativa al explicar la variable de respuesta, Y.
Calor-50
REGRESIÓN LINEAL
Análisis de varianza
Calor-51
REGRESIÓN LINEAL
Coeficiente de determinación.
Calor-53
REGRESIÓN LINEAL
Selección de variables para optimización de la ecuación.
Calor-54
REGRESIÓN LINEAL
Selección de variables para optimización de la ecuación.
Calor-55
ANÁLISIS DE LA REGRESIÓN LINEAL MÚLTIPLE
CON MINITAB
2. Factor de correlación
Estadística
Estadística básica
correlación
Se toman todas las variables.
El primer número es el factor de correlación y el segundo
es el P-valor.
Calor-56
3. Antes de hacer la regresión es bueno ver la dispersión de
los datos en la variable respuesta
Gráfica
Gráfica de valores individuales
Simple
Modo destacado de puntos (está en la fila más baja del
menú, parece una brocha o pluma). Para observar algunos
puntos de la dispersión, muestra las filas y los datos de la
tabla.
Calor-57
5. Hacer la regresión y eliminar las variables que tiene poco
impacto en la ecuación.
Estadística
Regresión
Regresión
Calor-58
7. Validación del modelo
- Residuos normales (centrados en cero y que sigan la
línea de ajuste)
- Residuos con varianza constante (igual varianza para
datos bajos y altos)
- Residuos sin presencia de datos anómalos
- Residuos independientes (datos ordenados en forma
aleatoria, no tiene relación en el orden que fueron
tomados)
Calor-60
REGRESIÓN LINEAL
Ejemplo 5.
Calor-61
REGRESIÓN LINEAL
Ejemplo 5. Base de datos
Calor-62
REGRESIÓN LINEAL
Ejemplo 5. Base de datos
Calor-63
REGRESIÓN LINEAL
Variable categóricas
Variable numérica discontinua (discreta)
Calor-64
REGRESIÓN LINEAL
Calor-65
REGRESIÓN LINEAL
Ejemplo 5. Análisis de correlación
Calor-66
REGRESIÓN LINEAL
Ejemplo 5. Análisis de correlación
Calor-67
REGRESIÓN LINEAL
Ejemplo 5. Correlación de Pearson (r - R), P-valor
Calor-68
REGRESIÓN LINEAL
Ejemplo 5. Gráfica de valores individuales de la respuesta
Calor-69
REGRESIÓN LINEAL
Calor-70
REGRESIÓN LINEAL
Calor-71
REGRESIÓN LINEAL
Ejemplo 5.
Calor-72
REGRESIÓN LINEAL
Calor-73
REGRESIÓN LINEAL
Ejemplo 5. Subconjuntos
Calor-74
REGRESIÓN LINEAL
Ejemplo 5. Subconjuntos
Calor-75
REGRESIÓN LINEAL
Ejemplo 5. Subconjuntos
Calor-76
REGRESIÓN LINEAL
Ejemplo 5. Regresión
Calor-77
REGRESIÓN LINEAL
Ejemplo 5. Análisis de la regresión
Calor-78
REGRESIÓN LINEAL
Ejemplo 5. Optimización manual (elimina una variable por vez)
Calor-79
REGRESIÓN LINEAL
Ejemplo 5. Optimización manual (elimina una variable por vez)
Se quita o no?
Calor-80
REGRESIÓN LINEAL
Ejemplo 5. Validez del modelo
Es o no es válido el modelo?
Variabilidad explicada
por el modelo
Calor-81
REGRESIÓN LINEAL
Ejemplo 5. Validez del modelo
Análisis de residuos
Calor-82
REGRESIÓN LINEAL
Ejemplo 5. Análisis de residuos
Calor-83
REGRESIÓN LINEAL
Ejemplo 5. Transformación del modelo (mejorar la validez)
Calor-84
REGRESIÓN LINEAL
Ejemplo 5. Nueva regresión
Calor-85
REGRESIÓN LINEAL
Ejemplo 5. Se elimina la variable aceleración y se obtiene una
nueva regresión
Calor-86
REGRESIÓN LINEAL
Ejemplo 5.
Calor-87
REGRESIÓN LINEAL
Ejemplo 5. Predicciones a futuro del modelo obtenido
Calor-88
REGRESIÓN LINEAL
Ejemplo 5. Predicciones a futuro del modelo obtenido
Calor-89
REGRESIÓN LINEAL
Ejemplo 5. Validación semiautomática
Calor-90
REGRESIÓN LINEAL
Ejemplo 5. Validación semiautomática – Mejores subconjuntos
Calor-91
REGRESIÓN LINEAL
Ejemplo 5. Validación semiautomática – Mejores subconjuntos
Calor-92
REGRESIÓN LINEAL
Ejemplo 5. Validación semiautomática – Paso a paso
Calor-93
REGRESIÓN LINEAL
Ejemplo 5. Validación semiautomática – Paso a paso
(minitab 17, es automático)
Calor-94
REGRESIÓN LINEAL
Ejemplo 4. (con correlación)
Se sometió a pruebas un
grupo de camiones ligeros
con motores diésel para saber
si la humedad, la temperatura
del aire y la presión
barométrica influyen en la
cantidad e oxido nitroso que
emiten (en ppm). Las
emisiones se tomaron en
diversos momentos y con
diferentes condiciones
experimentales.
Calor-95
REGRESIÓN LINEAL
Para este ejemplo seguir los diez pasos de análisis de
regresión vistos en clase.
Hacer observaciones para cada uno de los pasos dados.
Comparar entre los modelos obtenidos manualmente,
semiautomáticamente y automáticamente. Obtener
conclusiones de las comparaciones.
Pronosticar la cantidad de oxido nitroso, con los diferentes
modelos obtenidos, si las condiciones experimentales son:
Humedad 80
Temperatura 75
Presión 29.70
Cuál de los factores afecta en mayor grado la emisión de
Nox y por lo tanto se recomienda tener mayor control?.
Calor-96
REGRESIÓN LINEAL
Calor-97