Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PROBABILIDAD Y ESTADISTICA BASICA
REGRESION LINEAL SIMPLE POR EL METODO DE MINIMOS
CUADRADOS
ALEX MARCELO HARO HARO
DAVID NICOLAS VEGA PAEZ
GR3
La regresión lineal de los mínimos cuadrados (en inglés OLS: Ordinary Least Squares Regression –
Mínimos Cuadrados Ordinarios) es un método común para estimar los coeficientes de las ecuaciones
de regresión lineal que describen la relación entre una (o varias) variables independientes cuantitativas y una
variable dependiente.
Según el número de variables, podemos hacer una regresión También podemos utilizar el método del máximo de
simple o múltiple. Se llama regresión de los mínimos cuadrados verosimilitud y el estimador del método generalizado de
por qué se basa en la minimización del error cuadrático. momentos.
En la práctica, la regresión lineal se usa en varios dominios:
Así, una planta expuesta durante 5 días en el sol va a tener una altura aproxima de:
Y = 30 + 0.1*5 = 30.5 cm.
Las predicciones no son siempre exactas y por eso tenemos que tomar en cuenta el error aleatorio ε.
Además, antes de predecir, tenemos que encontrar los coeficientes β: empezamos con entrar una tabla que
contiene las alturas de las plantas con el número de días pasados en el sol. Si quiere conocer las calculaciones en
detalle, lea el próximo párrafo.
FUNCION DE LOS CUADRADOS MÍNIMOS
El método OLS (Ordinary Least Squares – Mínimos Cuadrados Ordinarios) tiene el objetivo de
minimizar la suma de diferencias cuadradas entre los valores observadas y predichas.
Así podemos estimar el vector β de los coeficientes:
y así en medio las predicciones varían de 0.89 en comparación con el valor real.
SUPOSICIONES PARA LA REGRESIÓN LINEAL
1.Los individuos (observaciones) son independientes. En general, es verdadero en las situaciones diarias (la cantidad de
lluvia no depende del dia precedente, el salario no depende del mes anterior, y la altura de una persona no depende de la
última persona medida antes).
2. La varianza es homogénea.
SELECCIÓN DE VARIABLES
1. El límite teórico es n-1, y con valores más grandes la matriz X’X
llega a ser non-invertible.
2. La supresión de algunas variables también puede ser no optimal: en
algunos casos, es posible que no añadamos una variable al modelo
porque es casi colineal a otros variables o a un bloc de variables, pero
sería más relevante remover una variable que ya está en el modelo y
añadir la nueva variable.
3. También para los casos en los cuales hay muchas variables
exploratorias, otros métodos han sido desarrollados como el método de
los cuadrados mínimos parciales (PLS)
ANEXOS
Explicación de los tipos de modelos y las formas de distribución:
GRACIAS
POR SU
ATENCION!