Está en la página 1de 32

ESTIMACIÓN DE LOS

PARAMETROS DEL MODELO


Estimación de los parámetros del modelo de regresión
Estimación de 𝜷𝟎 y 𝜷𝟏
Para estimar 𝛽0 y 𝛽1 se usa el método de mínimos cuadrados. Esto es, se estiman 𝛽0 y 𝛽1 tales que la suma de los
cuadrados de las diferencias entre las observaciones y¡ y la línea recta sea mínima. Según la ecuación (2.1), se puede
escribir

𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝜖𝑖 (2.3)

Donde 𝑖 = 1,2,3 … , 𝑛 Se puede considerar que la ecuación (2.1) es un modelo poblacional de regresión,
mientras que la ecuación (2.3) es un modelo muestral de regresión, escritos en términos de los n pares de
datos 𝑥𝑖 , 𝑦𝑖 .

Así el criterio de mínimos cuadrados es


𝑛
2
𝑆 𝛽0 ,𝛽1 = ෍ 𝑦𝑖 − 𝛽0 − 𝛽1 𝑥𝑖
𝑖=1
Retomando:

• Estime los parámetros del


modelo de regresión simple para
estos datos
Otra forma de calcular 𝑏1 es la siguiente:
(140∗1300)
21040−
10
𝑏1 = 1402
=5
2528−
10
La base de datos BWGHT.RAW contiene cifras sobre los hijos nacidos de mujeres en Estados Unidos. Las dos variables
de interés son la variable independiente, peso en onzas del niño al nacer (bwght) y la variable explicativa, cantidad
promedio diaria de cigarros consumidos por la madre durante el embarazo (cigs). La siguiente ecuación de regresión
simple se estimo con datos de n =1,388 nacimientos:

෣ = 119.77 − 0.514𝑐𝑖𝑔𝑠
𝑏𝑤𝑔ℎ𝑡

i) ¿Cual es el peso al nacer que se predice si cigs 0? .Y cuando cigs 20 (un paquete por día)? Analice la diferencia.
ii) ¿Capta esta ecuación de regresión simple una relación causal entre el peso del niño al nacer y el habito de fumar de la
madre? Explique.
iii) Para que el peso al nacer predicho sea de 125 onzas, .cual tiene que ser el valor de cigs? Explique.
iv) La proporción de mujeres en la muestra que no fumaron durante el embarazo es aproximadamente 0.85. .Ayuda esto a
entender sus hallazgos del inciso iii)?
Inicialmente debe importarla base
de datos. Para esto de click en la
opción “Import Dataset” y escoja
el formato de su archivo.

Puede que al hacer este procedimiento


el software empiece a cargar librerías.
No se preocupe, déjelo que termine,
tardara algunos minutos, pero eso es
Note que coloqué el normal.
nombre de la base
de datos acá.
Deben comprobar que la
base de datos aparezca
reflejada en la pantalla,
además de la palabra
“double”, que es la categoría
de la variable
El grafico indica una relación lineal negativa entre las variables x (Edad del propelente) & y
(Resistencia al corte).
La magnitud de la relación es el valor del coeficiente de correlación lineal de Pearson, que es:
[1] -0.9496533.
Este indica una fuerte relación estadística entre la variable regresora y la regresada.
El valor p de la prueba de hipótesis indica que existe suficiente evidencia estadística
para afirmar que la relación entre X y Y es no nula.

Por ende, es aceptable buscar un modelo que explique la media de la resistencia al


corte de acuerdo a la edad del propelente
Después de obtener el ajuste por mínimos cuadrados, surgen varias
preguntas interesantes:
1. ¿Qué tan bien se ajusta esta ecuación a los datos?
2. ¿Es probable que el modelo sea útil como predictor?
3. ¿Se viola alguna de las hipótesis básicas acerca delos supuestos del
modelo?
Se deben investigar todos estos asuntos antes de adoptar al
modelo en forma definitiva y usarlo. Como se dijo
anteriormente, los residuales juegan un papel clave para evaluar
la adecuación del modelo. Se puede considerar que los
residuales son realizaciones de los errores 𝜖𝑖 del modelo.

Así, para comprobar la constancia de la varianza y la hipótesis


de errores no correlacionados, uno se debe preguntar si los
residuales parecen ser realmente una muestra aleatoria de una
distribución con esas propiedades

También podría gustarte