Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estos son los temas que desarrollaremos en el apunte académico, considerando los
criterios necesarios para una regresión lineal.
La primera medida que nos permite saber que tan confiable sean los parámetros
estimados de nuestro modelo, con el objetivo de explicar los datos, es el error
estándar de los estimadores. Este mide los desvíos respecto al valor promedio y
contribuye a la generación del test estadístico para probar significancia parcial, es
decir, cual variable independiente contribuye de forma significativa en la explicación
de la variable dependiente.
Las estimaciones de parámetros betas mediante MCO utilizan datos muestrales que
se modifican de una muestra a otra, por lo que se exige confiabilidad en los
estimadores del modelo de regresión lineal obtenido, es decir, medir el error
estándar de los coeficientes 𝛽̂0 y 𝛽̂1 obtenido de la siguiente forma: (Gujarati &
Porter, 2010)
𝜎
𝑒𝑒(𝛽̂1 ) =
√∑ 𝑥𝑖2
∑ 𝑋𝑖2
𝑒𝑒(𝛽̂0 ) = √ 𝜎
𝑛 ∑ 𝑥𝑖2
Donde,
∑ 𝑢̂𝑖2
𝜎̂ = √
𝑛−2
i 𝑿𝒊 𝒀𝒊 𝑿𝒊 𝟐 𝒀𝒊 𝟐 𝑿𝒊 ∗ 𝒀 𝒊 ̂𝒊
𝒀 ̂𝒊
𝒖 ̂𝒊𝟐
𝒖 ̂𝒊 𝟐
𝒙
Veamos las predicciones que hace nuestro modelo para la posición 𝑖 = 3 (tercera
fila de datos o tercera familia). Puesto la tercera familia tiene tres hijos, tenemos que
𝑋3 = 3 e 𝑌3 = 400.000, nuestro modelo predice un gasto mensual de:
Por otra parte, el promedio de niños por familia para la muestra es:
𝑋1 + 𝑋2 + 𝑋3 + 𝑋4 + 𝑋5 1+2+3+4+5
𝑋̅ = = =3
5 5
Por tanto, tenemos que:
∑ 𝑢̂𝑖2 22.000.000.000
𝜎̂ = √ =√ = √7.333.333.333 = 85.634,88
𝑛−2 5−2
𝜎 85.634,88
𝑒𝑒(𝛽̂1 ) = = = 27.080,13
√10
√∑ 𝑥𝑖2
∑ 𝑋𝑖2 55
𝑒𝑒(𝛽̂0 ) = √ 2 𝜎=√ ∗ 85.634,88 = 89.814,62
𝑛 ∑ 𝑥𝑖 5 ∗ 10
1
En el video de la clase anterior puede encontrar como se obtienen estos datos.
Resumen
Estadísticas de la regresión
Coeficiente de correlación
múltiple 0,648885685
Observaciones 5
ANÁLISIS DE
VARIANZA
Grados
de Suma de Promedio de los Valor crítico
libertad cuadrados cuadrados F de F
Total 4 38000000000
𝑒𝑒(𝛽̂0 ) y 𝑒𝑒(𝛽̂1 )
Coeficiente de correlación en el modelo lineal simple
𝑛 ∑ 𝑋𝑖 𝑌𝑖 − ∑ 𝑋𝑖 ∑ 𝑌𝑖
𝑟=
√𝑛 ∑ 𝑋𝑖2 − (∑ 𝑋𝑖 )2 ∗ √𝑛 ∑ 𝑌𝑖2 − (∑ 𝑌𝑖 )2
Resumen
=r
Estadísticas de la regresión
Observaciones 5
Coeficiente de determinación o Bondad del ajuste del modelo
𝑌𝑖 = 𝑌̂𝑖 + 𝑢̂𝑖
𝑦𝑖 = 𝑦̂𝑖 + 𝑢̂𝑖
0
∑ 𝑦𝑖 2 = ∑(𝑦̂𝑖 + 𝑢̂𝑖 )2
∑ 𝑦𝑖 2 = ∑ 𝑦̂𝑖 2 + ∑ 𝑢̂𝑖 2
2
∑ 𝑦𝑖 2 = 𝛽̂1 ∑ 𝑥𝑖 2 + ∑ 𝑢̂𝑖 2
Sumas de cuadrados:
2 2
Suma de cuadrados explicada: 𝑆𝐶𝐸 = ∑ 𝑦̂𝑖 2 = ∑(𝑌̂𝑖 − 𝑌̅) = 𝛽̂1 ∑ 𝑥𝑖 2
2
Suma de cuadrados residual: 𝑆𝐶𝑅 = ∑ 𝑢̂𝑖 2 = ∑(𝑌̂𝑖 − 𝑌𝑖 )
𝑟 = ±√𝑟 2
Ejemplo: Una vez más, considerando el ejemplo de las 5 familias. Donde,
Promedio 3 470.000
2
𝑆𝐶𝐸 = ∑(𝑌̂𝑖 − 𝑌̅) = 16.000.000.000
2
𝑆𝐶𝑅 = ∑(𝑌̂𝑖 − 𝑌𝑖 ) = 22.000.000.000
𝑟 2 = (0.6489)2 = 0,42
Resumen
Estadísticas de la regresión
= r2
Coeficiente de correlación múltiple 0,648885685
Observaciones 5
Hemos mostrado como podemos lograr indicadores que nos permitan conocer
“cuán” bueno es un modelo para explicar los datos. Estos indicadores nos permiten
también comparar el desempeño de diferentes modelos y seleccionar el “mejor
modelo” de ellos en caso de tener alternativas.
Los primeros indicadores que mostramos fueron los errores estándar de los
coeficientes logrados a través de muestras, permiten identificar la confiabilidad de
las variables explicativas.