Documentos de Académico
Documentos de Profesional
Documentos de Cultura
𝑿𝒊 = (𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑝 ) Modelo ( f )
𝒀
Interpretación Predicción
• Construir una función f que relaciona a X con Y • f también se usa para predecir
valores desconocidos de Y.
• Caracterizar la función f y la interpretación de sus (Pronosticar)
parámetros permiten comprender el efeto de los
predictores sobre la variable respuesta Y.
El problema de regresión
El supuesto subyacente:
1. Existe un patrón regular de asociación (F) entre X y Y.
𝑌 = 𝐹 𝑋1 , 𝑋2 , 𝑋3 , … , 𝑋𝑃 + 𝜀 2. El patrón ( F) es estable.
3. El patrón ( F ) no completamente aleatorio.
Componente sistemático, regular. Error aleatorio.
Estimable. Impredecible
𝐸 𝑌 = 𝐹 𝑋1 , 𝑋2 , 𝑋3 , … , 𝑋𝑃
Valor medio de Y
𝐸 𝑌 = 𝐹 𝑋1 , 𝑋2 , 𝑋3 , … , 𝑋𝑃 ≅ 𝐻 𝑋1 , 𝑋2 , 𝑋3 , … , 𝑋𝑃
n ( xy ) − ( x )( y )
r=
n ( ) ( )
x − ( x ) n y − ( y )
2 2 2 2
r = -0.047 r = 0.889
No existe
Relación ? Relación
Directa
r = -0.889
Relación Relación
Inversa No Lineal
r = 0.09
El modelo de Regresión Lineal Simple
Objetivo: Obtener la ecuación lineal que mejor aproxima la relación Y vs X
Y = 0 + 1 X +
Es un modelo para el valor medio
Intercepto Pendiente de Y de una población con X = x
Parámetros de regresión
Interpretación:
• 𝛽0 : Valor promedio de Y cuando X=0.
• 𝛽1 : Magnitud del cambio en Y por cada
unidad de cambio en X.
Ajuste del modelo – Estimación de Parámetros
MCO: (Mínimos Cuadrados Ordinarios): Utiliza los datos disponibles (𝒚𝒊 , 𝒙𝒊 ) para encontrar la
combinación de valores que minimizan la suma de los cuadrados de los residuos.
2
SCE = σ𝑛𝑖=1 𝑦𝑖 − 𝑦ො𝑖 2
= σ𝑛𝑖=1 𝑦𝑖 − 𝛽መ0 + 𝛽መ1 𝑋𝑖
Indicador de bondad de ajuste
Bondad de ajuste del modelo
2
1. Suma de cuadrados del error: SCE = σ𝑛𝑖=1 𝑦𝑖 − 𝑦ො𝑖 2
= σ𝑛𝑖=1 𝑦𝑖 − 𝛽መ0 + 𝛽መ1 𝑋𝑖
𝑛 2
2. Varianza residual: 2
σ𝑖=1 𝑦𝑖 − 𝑦
ො𝑖
𝜎ො =
2
𝑆𝐶𝑅 % de la variabilidad de Y
𝑅2 = 0 ≤ 𝑅2 ≤ 1
𝑆𝐶𝑇 explicada por el modelo.
Bondad de ajuste del modelo
➢ Si se rechaza Ho (valor-p ≤ α ) se concluye que existe una cantidad significativa de variación en Y que es
explicada a través del modelo formulado.
➢ Si se acepta Ho (valor-p > α ) se concluye que el modelo propuesto no se ajusta a los datos.
Inferencia sobre los parámetros del modelo
Validación de supuestos – Análisis de residuos
Explorando el termino error del modelo
Residuos
Validación de supuestos – Análisis de residuos
Validación de supuestos – Análisis de residuos
Validación de supuestos – Análisis de residuos
Validación de supuestos – Análisis de residuos
Relaciones no-lineales
Regresión con predictores cualitativos
Usando variables Dummy
Predictores cualitativos
Para incluir un predictor cualitativo → Dicotomización (Varibales Dummy)
✓ Media cero.
✓ Independencia.
✓ Homogeneidad de varianzas.
Variables predictoras.
Coeficientes de la regresión.
Crudas o transformadas.
✓ Distribución Normal.
𝑴𝒊𝒏𝒊𝒎𝒊𝒛𝒂 𝒆𝟐
Patologías:
1. Las estimaciones de los parámetros son inestables. Ligeros cambios en los datos cambian notoriamente.
2. Los indicadores de bondad de ajuste son falsamente altos.
1. La matriz de correlación entre las variables predictoras. → Identifica pares de variables con alta asociación.
2. Factor de Inflación de Varianza (VIF)
¿Cómo prevenirla/corregirla?
𝐴𝐼𝐶 = 2𝑝 − 2𝐿𝑜𝑔 𝐿
Crece siempre al adicionar una Penaliza al R² por el número de Penaliza al la verosimilitud por el número
nueva variable predictora. parámetros. de parámetros. Mejor modelo (AIC más
bajo).