Documentos de Académico
Documentos de Profesional
Documentos de Cultura
3. Analizar los efectos que sobre la bondad del ajuste, tendrá la forma de la
curva lineal o no lineal en, la consecución de información relevante.
6. …
Universidad de las Américas
Estimación por Mínimos Cuadrados Ordinarios
Antes de aplicar el Paso 5, desarrollaremos la técnica de estimación mayormente utilizada en este curso:
Mínimos Cuadrados Ordinarios (MCO).
Luego, con el dominio de las fórmulas y métodos que nos provea este método (MCO) , lo aplicaremos a
nuestro, ya clásico, ejemplo consumo ingreso.
Para comenzar, vamos a entender en qué consiste la intuición detrás del método. En primer lugar, recordemos
que la FRP con la que estamos trabajando será:
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋i + μ𝑖 (𝐹𝑅𝑃)
Sin embargo, como no tenemos acceso a los datos de la población, usaremos una muestra aleatoria de tamaño
𝑛 para realizar una estimación de la FRP, mediante su función homóloga en la muestra, la FRM :
0 + 𝛽
𝑌𝑖 = 𝛽 1 𝑋i + μෝ𝑖 (𝐹𝑅𝑀)
Para pensar en cómo estimaremos esta función, y desarrollar el criterio detrás de MCO, realizaremos
un análisis gráfico; en el cuál supondremos dos cosas:
Tenemos un diagrama de dispersión entre X e 𝑌, que representará los datos de nuestra muestra
aleatoria, de tamaño 𝑛.
0 + 𝛽
𝑌𝑖 = 𝛽 1 𝑋i + μෝ𝑖
0 − 𝛽
μෝ𝑖 = 𝑌𝑖 − 𝛽 1 𝑋i
Sumamos:
𝑛 𝑛
2
μෝ𝑖 2 = 𝑌𝑖 − 𝛽
0 − 𝛽1 𝑋𝑖
𝑖=1 𝑖=1
Esta última expresión servirá como un indicador de la varianza
alrededor de la recta ajustada. En la medida en que esta
magnitud sea más pequeña, tendremos un modelo más
preciso, pues los datos se acercan más a la predicción
elaborada con la 𝐹𝑅𝑀 estimada.
El método de estimación por Mínimos Cuadrados Ordinarios, es aquél que minimiza la expresión anterior. Esta expresión refleja la
suma del cuadrado de los errores , o residuales. Dicho de otra manera, cuando buscamos los parámetros de 𝛽 0 y 𝛽 1 con el
método de MCO, formalmente estamos buscando aquellos valores de los parámetros que minimicen la suma cuadrática de los
errores residuales. Es decir:
𝑛 𝑛
2
min μෝ𝑖 2 = 𝑌𝑖 − 𝛽
0 − 𝛽
1 𝑋𝑖
0 ; 𝛽
(𝛽 1 )
𝑖=1 𝑖=1
0 ; 𝛽
Por lo tanto, los valores de 𝛽 1 obtenidos según MCO, son el 𝑎𝑟𝑔𝑚𝑖𝑛 σ𝑛𝑖=1 μෝ𝑖 2 . En breve, resolveremos el problema recién
planteado.
2
𝜕 σ𝑛
𝑖=1 ෞ
μ𝑖
= 2σ𝑛
𝑖=1 𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖 −1 = 0
0
𝜕𝛽
𝑛
𝜕 σ𝑛𝑖=1 μෝ𝑖 2
0 − 𝛽
= 2 𝑌𝑖 − 𝛽 1 𝑋𝑖 −𝑋𝑖 = 0
1
𝜕𝛽
𝑖=1
Estas ecuaciones son conocidas en los manuales de texto, como las Ecuaciones Normales del Método Mínimos Cuadrados
0 ; 𝛽
Ordinarios. Los valores de 𝛽 1 que satisfacen simultáneamente éstas dos ecuaciones, son los que minimizan la suma cuadrática de
los errores. Y por ende son aquellos valores que determinan la recta que proveerá “el mejor ajuste” a la nube de puntos
representada en el diagrama de dispersión.
0 ; 𝛽
Entonces el paso siguiente es resolver el sistema de dos ecuaciones normales, para los valores de 𝛽 1 .Se puede demostrar,
usando álgebra sencilla que éstos valores son:
Coeficiente de la razón media de cambio, o Pendiente.
𝑛 σ𝑛 𝑛 𝑛
𝑖=1 𝑌𝑖 𝑋𝑖 −[σ𝑖=1 𝑌𝑖 ×σ𝑖=1 𝑋𝑖 ]
1 =
𝛽 2
[𝑛 σ𝑛 2 𝑛
𝑖=1 𝑋𝑖 ]−[σ𝑖=1 𝑋𝑖 ]
Coeficiente de a intercepción al eje de las ordenadas , o Intercepto:
0 = 𝑌ത − 𝛽
𝛽 1 𝑋ത
ത
; donde 𝑌:promedio de 𝑌, y
ത
𝑋:promedio de 𝑋.
Es decir, cada vez que tengamos un conjunto de datos, donde exista una posible hipótesis de causalidad entre una variable
dependiente y una variable independiente, podemos calcular los valores de los coeficientes de la recta de regresión con estas
sencillas fórmulas.
0 + 𝛽
𝑌𝑖 = 𝛽 1 𝑋𝑖
Llamaremos a ésta función 𝐹𝑅𝑀 estimada debido a que podemos escribirla, una vez que le hemos aplicado el
principio de estimación por 𝑀𝐶𝑂 a los datos obtenidos, y estimado los coeficientes. Además, los coeficientes que
forman esta función cumplirán ciertas Propiedades Numéricas, que no tienen que ver con la generación de datos
misma, sino que con el procedimiento bajo el que se obtuvieron estos estimadores 𝑀𝐶𝑂.
Propiedades Numéricas:
1. Son una estadística suficiente: Es decir, pueden ser fácilmente calculados una vez que se tienen todos los
valores de la muestra disponibles.
2. Son estimadores puntuales: Esto es, dada la muestra cada estimador proporcionará un solo valor (puntual)
del parámetro poblacional relevante.
3. Una vez obtenidos los estimadores 𝑴𝑪𝑶 de la información muestral, la recta de regresión puede obtenerse
fácilmente, esta recta tendrá las siguientes dos propiedades:
0 + 𝛽
𝑌𝑖 = 𝛽 1 𝑋𝑖
Que se puede rescribir como:
1 𝑋)
𝑌𝑖 = (𝑌ത − 𝛽 1 𝑋𝑖
ത + 𝛽
Que a su vez, es lo mismo que:
1 (𝑋𝑖 − 𝑋)
𝑌𝑖 = 𝑌ത + 𝛽 ത
Luego, sumando y dividiendo por 𝑛 a ambos lados de la ecuación, se obtiene:
𝑌ഥ
= 𝑌ഥ
X (ingreso) Y (consumo)
Usaremos el ejemplo anteriormente descrito: relación entre Consumo e Ingreso;
con un 𝑛 = 60. A la derecha tenemos un resumen de estos datos. 80 55
Para ordenar correctamente nuestros cálculos, definimos: 100 88
𝑌𝑖 = 𝐶𝑜𝑛𝑠𝑢𝑚𝑜 𝐴𝑔𝑟𝑒𝑔𝑎𝑑𝑜 𝐶 120 79
𝑋𝑖 = 𝐼𝑛𝑔𝑟𝑒𝑠𝑜 − 𝑃𝐼𝐵 𝑛𝑜𝑚𝑖𝑛𝑎𝑙 − (𝑌)
140 80
140 93
Necesitamos calcular el promedio de cada variable, y luego la suma de "𝑌𝑖 ",
"𝑋𝑖 ", "𝑌𝑖 ∗ 𝑋𝑖 ” , “𝑋𝑖2 ". 140 95
Luego, con toda esa información resumida, usaremos la fórmulas proveídas por el … …
método 𝑀𝐶𝑂:
140 103
Para la pendiente.
160 125
𝑛 σ𝑛 𝑛 𝑛
𝑖=1 𝑌𝑖 𝑋𝑖 −[σ𝑖=1 𝑌𝑖 ×σ𝑖=1 𝑋𝑖 ]
1 =
𝛽 2 180 135
[𝑛 σ𝑛 2 𝑛
𝑖=1 𝑋𝑖 ]−[σ𝑖=1 𝑋𝑖 ]
σ60
𝑖=1 𝑋𝑖 = 10420 σ60
𝑖=1 𝑌𝑖 = 7272 ;
σ60
𝑖=1 𝑋𝑖 𝑌𝑖 = 1381220 σ60 2
𝑖=1 𝑋𝑖 = 2006800.
𝑋ത = 173.67 𝑌ത = 121.20
Reemplazando esta información en los estimadores MCO; se obtiene
Coeficiente para la Pendiente:
σ𝑛𝑖=1(μෝ𝑖 )2
𝜎
ෝ
𝜇
2
=
𝑛−𝑘
Finalmente, una vez que se ha calculado; el valor de μෝ𝑖
para todas las observaciones, y se han elevado al
cuadrado; se puede sumar y dividir en el total de
observaciones 𝑛 − 𝑘; donde 𝑘 es el número de betas
presentes en el modelo (en este caso 2) . A este indicador
se le conoce como varianza de el error 𝜎2
ෝ.
𝜇
En esta sesión hemos desarrollado el criterio de Mínimos Cuadrados Ordinarios (M.C.O). Este criterio nos provee de 2 sencillas
formulas:
𝑛 σ𝑛 𝑛 𝑛
𝑖=1 𝑌𝑖 𝑋𝑖 −[σ𝑖=1 𝑌𝑖 ×σ𝑖=1 𝑋𝑖 ]
1 =
𝛽 2
[𝑛 σ𝑛 2 𝑛
𝑖=1 𝑋𝑖 ]−[σ𝑖=1 𝑋𝑖 ]
0 = 𝑌ത − 𝛽
𝛽 1 𝑋ത
Que nos permitirán: Dado un conjunto de datos de una muestra aleatoria estimar la FRM que pasa lo mas centrada posible por dichos
datos.
Esto ultimo se logra minimizando la suma cuadrática de las residuales.
La FRM estimada por M.C.O cumple las siguientes propiedades numéricas:
1. Son una estadística suficiente: Es decir, pueden ser fácilmente calculados una vez que se tienen todos los valores de la muestra
disponibles.
2. Son estimadores puntuales: Esto es, dada la muestra cada estimador proporcionará un solo valor (puntual) del parámetro
poblacional relevante.
3. Una vez obtenidos los estimadores 𝑴𝑪𝑶 de la información muestral, la recta de regresión puede obtenerse fácilmente, esta recta
tendrá las siguientes dos propiedades:
A. 0 + 𝛽
Pasan por las medias muestrales de 𝑌 y de 𝑋. Ésto es obvio, ya que a partir de la fórmula del estimador intercepto de 𝑀𝐶𝑂, podemos escribir: 𝑌ത = 𝛽 1