Registro: 217060498 Análisis de regresión con dos variables: algunas ideas básicas 1. Ejemplo hipotético ¿Con qué se relaciona el análisis de regresión? Se relaciona en gran medida con la estimación o predicción de la media (de la población) o valor promedio de la variable dependiente, con base en los valores conocidos o fijos de las variables explicativas. ¿Cómo se les llama los valores medios y de que dependen? Se les llama valores esperados condicionales, en virtud de que dependen de los valores de la variable (condicional) X. Siendo de forma simbólica como E(Y/X), el cual se lee como el valor esperado de Y, dado el valor de X. ¿Cómo se obtiene la línea de regresión poblacional o la curva de regresión poblacional? Se obtiene mediante la unión de los valores medios condicionales de Y, graficados en función de los diferentes valores de X, es decir la conexión de las subpoblaciones de Y que corresponden a los valores dados de la regresora X. ¿Cómo se encuentran distribuidos los valores de X y? Los valores para cada X existen una población de valores Y que se distribuye alrededor de la media (condicional) de dichos valores Y. Por simplicidad que tales valores Y están distribuidos simétricamente alrededor de sus respectivos valores medios (condicionales). 2. Concepto de función de regresión poblacional (FRP) ¿Cómo se expresa la función de esperanza condicional, función de regresión poblacional? Se expresa simbólicamente de la siguiente manera: E(Y/Xi) =f(Xi) donde f(Xi) denota alguna función de la variable explicativa X. ¿Qué denota la función de la regresión de regresión poblacional? Solo denota que el valor esperado de la distribución de Y dad X i se relaciona funcionalmente con Xi. En otras palabras, dice como la media respuesta promedio de Y varía con X. ¿Qué es la forma funcional de la FRP? Es una pregunta empírica, aunque en casos específicos la teoría tiene algo que decir, como un economista que puede plantear que el consumo manifiesta una relación lineal con el ingreso. ¿Qué tipo de función lineal de Xi sería la Función de regresión poblacional? Sería del tipo E(Y/Xi) = β1+ β2 Xi. Donde β1 y β2 son parámetros no conocidos pero fijos que se denominan coeficientes de regresión; β1 y β2 se conocen también como coeficientes de intersección y de pendiente, respectivamente. 3. Significado del término lineal ¿Cuál es aquella linealidad más natural que se expresa en la linealidad de variables? Es aquel en que la esperanza condicional de Y es una función lineal de Xi. Geométricamente, la curva de regresión en este caso es una recta. ¿Cuál no sería considerado una función lineal y por qué? Una función de regresión como E(Y/Xi) = β1+ β2 X2i porque la variable X aparece elevada a una potencia o índice de 2. ¿Cuándo se presenta la segunda interpretación de linealidad? Se presenta cuando la esperanza condicional de Y, E(Y/Xi), es una función lineal de los parámetros, los β; puede ser o no lineal en la variable X. De acuerdo con esta interpretación, E (Y | Xi) = β1 + β2X2i es un modelo de regresión lineal (en el parámetro). ¿Qué significa el termino de regresión lineal? Significa una regresión lineal en los parámetros; los β (es decir, los parámetros) se elevan sólo a la primera potencia. Puede o no ser lineal en las variables explicativas X. 4. Especificación estocástica de la FRP ¿Cómo se expresa la desviación de un Yi en particular alrededor de su valor esperado? Se expresa de la siguiente manera Yi = E (Y | Xi) + ui, donde la desviación ui es una variable aleatoria no observable que adopta valores positivos o negativos. Técnicamente, ui se conoce como perturbación estocástica o término de error estocástico. ¿Cómo se expresa e interpreta la ecuación? Se expresa como la suma de dos componentes: 1) E (Y | Xi), que es simplemente la media del consumo de todas las familias con el mismo nivel de ingreso. Este componente se conoce como componente sistemático, o determinista. 2) ui que es el componente aleatorio, o no sistemático. ¿Qué es el termino de perturbación estocástica? Es un termino que sustituye o representa a todas las variables omitidas o ignoradas que puedan afectar a Y pero que no se incluyen (o no pueden incluirse) en el modelo de regresión. ¿Qué implica el supuesto de que la línea de regresión pasa a través de las medias condicionales de Y? Implica que los valores de la media condicional de ui (condicionados al valor dado de X) son cero. Siendo de formas equivalentes si E (ui | Xi) = 0. 5. Importancia del término de perturbación estocástica ¿Qué sucede si existe una teoría que determine el comportamiento de Y? Podría estar incompleta, y con frecuencia lo está, se tendría la certeza de un suceso, pero se ignoraría o no tendría la seguridad sobre las demás variables que afectan a Y. ¿A qué se refiere la falta de disponibilidad de datos? Aunque se conozcan las variables excluidas y se considerara por tanto una regresión múltiple en lugar de una simple, no contando con información cuantitativa sobre esas variables. ¿Qué podría presentar al introducir el modelo todas las variables pertinentes? Se podría presentar alguna aleatoriedad “intrínseca” en Y que no se explique, a pesar de todos los esfuerzos que se inviertan. Las perturbaciones, u, pueden reflejar muy bien esta aleatoriedad intrínseca. ¿Cómo conviene mantener el modelo de regresión? Conviene mantener lo mas sencilla posible. Si se explica “sustancialmente” el comportamiento de Y con dos o tres variables explicativas, y si la teoría no es bastante fuerte para indicar otras variables que pueden incluirse, no hay necesidad de introducir variables. 6. Función de regresión muestral (FRM) ¿Por qué no podría calcularse la FRP con precisión? No podría calcularse con precisión debido a las fluctuaciones muestrales como se presenta. ¿Cómo se conocen y representan las líneas de regresión? Se conocen como líneas de regresión muestral. Se supone que representan la línea de regresión poblacional, pero, debido a fluctuaciones muestrales, son, en el mejor de los casos, sólo una aproximación de la verdadera RP. ¿Cómo se expresa la contraparte de la ecuación de la FRP? Se expresa de la siguiente manera: Yˆi = βˆ1 + βˆ2Xi donde Yˆ se lee “Y sombrero” o “Y gorra” Yˆi = estimador de E (Y | Xi) βˆ1 = estimador de β1 βˆ2 = estimador de β2 ¿Cómo también se conoce un estimador y qué significa? Se conoce como estadístico (muestral), y no es mas que una regla, formula o método para estimar el parámetro poblacional a partir de la información suministrada por la muestra disponible. ¿Qué es una estimación? Es un valor numérico particular obtenido por el estimador en un análisis, además de que una estimación no es aleatoria.