Está en la página 1de 71
Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 1 UNIVERSIDAD NACIONAL DE COLOMBIA FACULTAD DE CIENCIAS ECONÓMICAS UNIVERSIDAD DISTRITAL FRANCISCO JOSE DE CALDAS FACULTAD DE INGENIERIA NOTAS ECONOMETRIA I. INTRODUCCIÓN a. Econometría: (Medición en la economía) Es la aplicación de métodos estadísticos y matemáticos al análisis de datos económicos, con el fin de confrontar empíricamente la teoría (Económica). Pero, ¿Qué es la economía?.... Nota: En el momento de usar las herramientas aprendidas en Estadística I y II en datos económicos estamos haciendo econometría, pero no basta con hacer un intervalo de confianza, o correr una regresión, es necesario que todo lo que hagamos este soportado por la teoría económica: Teoría Datos Económica Confrontación No son los datos los que arman la teoría sino que a partir de la teoría se intenta hacer investigación empírica. Es decir, intentar a través de un conjunto de datos verificar aquellas relaciones que se deben dar, de acuerdo al cuerpo teórico en el cual estamos. Ejemplo 1. Engel Gasto alimentos vs. Y % GASTO ALIMENTO Tomo o utilizo una muestra, donde se tiene la siguiente información Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 2 1 Y= Ingreso 2 Gasto alimento 3 Gasto total b. Un poco de Historia. Históricamente la aplicación de muestras estadísticas a datos económicos se da por primera vez en 1699 por Charles Davemant, que fue un programa de demanda empírica, 1907 Rodolfo Emiri realiza estudios de demanda, pero es a partir de 1930 con la conformación de la Sociedad Econométrica y posterior publicación de la revista Econometrics que tiene un impulso importante el uso de métodos estadísticos y matemáticos dentro de la economía, desarrollo que toma gran auge después de mitad de siglo y con la aparición del computador. El intento de un econometrista es describir el mundo (fenómeno), y una forma de aproximarse a esta descripción es mediante un modelo. Ejemplo 2. Comportamiento el ingreso en latino América. !! No es que el fenómeno se comporte como una gamma si no que la gamma se aproxima bastante bien a la realidad. Ejemplo 3. Relación Gasto Ingreso El fenómeno son los puntos. Y a G β + = % GASTO ALIMENTO Y Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 3 Este modelo se aproxima bastante al fenómeno. Definición 1. Modelo es una representación simplificada de un fenómeno. Dos características que se destacan de un modelo son que: 1. Sea sencillo, lo más simple posible. 2. Describa en buena forma el fenómeno y tenga supuestos realistas. Ejemplo 4. C n = Consumo Naranjas, P n = Precio Naranjas, ) P ( f C n n = → es poco realista Modelo Económico: Es un conjunto de suposiciones que describen de forma aproximada un proceso económico. Modelo Econométrico: Es un sistema de ecuaciones que se derivan del modelo económico, y incluye variables observadas y algunas perturbaciones. En este modelo se destacan dos características importantes, a saber: 1. Se acepta la existencia de un error en las observaciones y 2. Un modelo estadístico acerca del comportamiento de las distorsiones. Ejemplo 5. Modelo Económico q = Demanda de Atún p a = Precio del Atún p c = Precio de la Carne p p = Precio del Pollo q = F(p a , p c , p p ). Esto quiere decir que la demanda de atún es función del precio de la carne, el precio del atún y el precio del pollo. El modelo econométrico es: 1. U p p p q p c a 0 + + + + = 3 2 1 β β β α (Distribución) 2. E (U / p a , p c , p p ) = 0, Los errores U son independientes. 3. Distribución de los errores: U ∼ N (0, σ 2 ) c. Clasificación de Variables. - Por Nivel de Medida tenemos. Nominal: Sólo clasifica. Ejemplos: Genero, Color de Ojos, Tipo de Sociedad, etc. Ordinal: Clasifica y Ordena. Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 4 Ejemplos: 1. Comportamiento de la Economía: Pésimo, Malo, Regular, Bueno, Excelente. 2. Crecimiento de un país: Bajo, mediano, Alto Intervalo: Clasifica, Ordena e introduce una noción de distancia. No tiene cero absoluto. Ejemplos: Temperatura, no se puede decir que un objeto con 40º C, esta el doble de caliente que otro cuya temperatura es 20º C, por que al cambiar de escala esta relación no se mantiene. Razón: Clasifica, Ordena, introduce una noción de distancia, y nos permite hablas en términos de razones entre las cantidades. Tiene un cero fijo. Ejemplos: Peso, estatura, PIB, M1, etc. - De acuerdo a los valores que toma. Discretas: Son aquellas que toman un numero finito o infinito numerable de valores Ejemplos: Número de hijos, asistencia a primaria, genero, etc. Continuas: Son aquellas que pueden tomar cualquier valor de un intervalo. Ejemplos: Peso, estatura, PIB, M1, etc. II. INTRODUCCION AL MODELO LINEAL Los primeros que se hicieron del modelo lineal, fueron en astronomía y física por Laplace - Gauss. La palabra regresión viene de los trabajos de Galton en biología, finales del siglo XIX. Quien estudió la relación entre la estatura de los padres y los hijos. Denotemos las variables de interés como: Y = Estatura hijos, X = Estatura padres El modelo planteado se puede escribir de la forma: t t t e x y + + = 1 0 β β t=1,2,...,n (1) T: número de observaciones en el modelo Galton observó que padres altos tenían hijos altos, pero de estatura inferior a los padres, que los padres bajos tenían hijos bajos, pero de estatura mayor a sus padres, es decir: La estatura de los hijos ÷ ÷ → ÷ regresa a X (media poblacional). 1. Partes del modelo de regresión: Las partes del modelo planteado en la ecuación (1) son: Y t : Variable dependiente o explicada. Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 5 X t : Variables independiente o explicativa. β 0 , β 1 : Parámetros e t : Error del modelo, perturbación, este término lleva todo aquello que no podemos explicar de Y usando X. 2. Supuestos del modelo: Todos los supuestos son acerca de los errores e t . i. E(e t )=0 ii. E(e t 2 )=σ 2 . (2) iii. E(e t e s )=0. iv. e t ∼Normal (los errores tienen distribución normal). El último supuesto se hace con el propósito de realizar inferencia. El análisis de regresión simple es una herramienta para la descripción y evaluación de la relación entre una variable dependiente o explicada (Y) y una variable independiente (X) (explicativa), cuando usamos este modelo, se esta pensando en que se puede tener el valor de X y con este se puede estimar el valor de Y, usando el modelo lineal de regresión. El modelo de regresión se utiliza fundamentalmente para: 1. Estimar valores de Y fuera del rango muestral. (Ej.: no hay hijos en el estudio para padres con estaturas entre 1.70 y 1.80 metros, entonces se puede estimar estas estaturas usando el modelo). 2. Para realizar predicción. En el siguiente gráfico, veamos que es lo que estamos ajustando. El ajuste que estamos realizando lo muestra el siguiente gráfico t t o t e x y + + = 1 β β Observaciones Diferencia: Errores (e t ) t o t x y 1 β β + = Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 6 De acuerdo a los supuestos y observando este gráfico lo que se desea es que: i. La diferencia (el error), entre el modelo de regresión lineal (la recta) y las observaciones sea cero ii. Tenga varianza constante iii. Los errores sean independientes Agregado a lo anterior que estos errores giren alrededor de cero de acuerdo a una distribución normal. a. Modelo visto en Forma Matricial. El modelo que se tiene es: t t t e x y + + = 1 0 β β t=1,2,...,n Escribiéndolo en forma matricial cada una de la observaciones, se llega a la siguiente expresión: | | | | | . | \ | + | | | | | . | \ | + | | | | | . | \ | = | | | | | . | \ | n n n e e e x x x y y y     2 1 1 2 1 1 1 0 0 0 2 1 β β β β β β (3) Lo anterior es equivalente: | | | | | . | \ | + | | . | \ | | | | | | . | \ | = | | | | | . | \ | n n n e e e x x x y y y     2 1 1 0 2 1 2 1 1 1 1 β β (4) y finalmente (4) se puede expresar como: Y = Xβ + e Donde, Y y e son vectores de tamaño 1 nx y X es una matriz 2 nx . Los supuestos dados en el modelo (2), observación por observación, se convierten, para el modelo en forma matricial, en: i. E(e)=0 nx1 ii. E(ee´)=σ 2 I. (5) iii. e ∼Multinormal (el vector de errores tienen distribución multinormal). Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 7 Donde I es la matriz identidad de tamaño nxn . Nota: E(ee´) = σ 2 I es la matriz de varianza de los errores. Así se tiene el modelo lineal de regresión: Y = Xβ + e con e∼ MN(0 nx1 , σ 2 I) (6) Los parámetros del modelo serán β y σ 2 , que son desconocidos, y nuestra primera tarea será estimarlos. b. Estimación de los Parámetros. Método de Mínimos Cuadrados Mínimos Cuadrados Ordinarios (MCO). La filosofía de los MCO, es hallar un estimador de β, tal que el tamaño de los errores sea mínimo, es decir, minimizar los residuales. Trabajo con Matrices El criterio de desea e t → 1 0, lo cual se logra si se hace e t 2 → 0, y para minimizar todos los errores al mismo tiempo basta minimizar ∑ = n i i e 1 2 (al minimizar la suma estamos minimizando cada una de sus componentes, que es el objetivo). Ahora, ( ) e e e e e e e e e t n n n i i = | | | | | . | \ | = ∑ =   2 1 2 1 1 2 (7) De (6) se tiene que β X Y e − = , así ) X Y ( ) X Y ( e e t t β β − − = Dados Y y X fijos, hallar β ˆ , bajo la filosofía de MCO se convierte en: 1 Léase cercano a cero Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 8 Minimizar e e t ⇔ Minimizar f(β) ⇔ Minimizar ) X Y ( ) X Y ( t β β − − . Este un problema de cálculo diferencial vectorial. β β β β β β ∂ + − − ∂ = ∂ ∂ ) X X X Y Y X Y Y ( e e t t t t t t t = β β β β ∂ + − ∂ ) X X Y X ( t t t t 2 = β X X Y X t t 2 2 + − Si suponemos que existe β ˆ , tal que es punto crítico de f(β), entonces: 0 2 2 = + − = ∂ ∂ β β ˆ X X Y X ˆ e e t t t (8) De aquí Y X ) X X ( ˆ t t 1 − = β . Pero ¿Cómo saber que es un mínimo?. X X ˆ e e t t 2 2 2 = ∂ ∂ β que es una matriz definida positiva, por lo tanto se ha hallado un mínimo 2 . Conclusión: El estimador de MCO para el vector β esta dado por: Y X ) X X ( ˆ t t 1 − = β . (9) Veamos como lo anterior se puede ver en términos no de vectores y matrices sino de las observaciones. Trabajo con Sumas (observación por observación). De la ecuación (8) se llega a las ecuaciones normales (E.N.). Y X ˆ X X t t = β (10) Con | | | | | . | \ | = n x x x X 1 1 1 2 1   , | | | | | . | \ | = n y y y Y  2 1 , | | . | \ | = 2 1 β β β . 2 Bibliografía: Matrix Differential Calculus with Applications in Statistical Econometrics; Magnus, J. John Wiley, New York, 1988. Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 9 Reemplazando en (10), se obtiene: | | | | . | \ | = | | | | . | \ | + + ∑ ∑ ∑ ∑ ∑ = = = = = n i i i n i i n i i n i i n i i y x y x ˆ x ˆ x ˆ ˆ n 1 1 1 2 1 1 0 1 1 0 β β β β Es decir, 0 β ˆ y 1 β ˆ son tal que cumplen con las ecuaciones normales: ∑ ∑ = = = + n i i n i i y x ˆ ˆ n 1 1 1 0 β β (11a) ∑ ∑ ∑ = = = = + n i i i n i i n i i y x x ˆ x ˆ 1 1 2 1 1 0 β β (11b) Lo que se hará a continuación es hallar 0 β ˆ y 1 β ˆ que minimizan ∑ = n i i e 1 2 usando derivadas parciales, y mostrar que cumplen con las ecuaciones normales (11a) y (11b), y por lo tanto son los mismos. Este trabajo, además aporta el entender lo que nos están diciendo los estimadores 0 β ˆ y 1 β ˆ . ) , ( f ) x y ( e n i i i n i i 1 0 1 2 1 0 1 2 β β β β = − − = ∑ ∑ = = Hallemos el mínimo para f(β 0 ,β 1 ). ∑ ∑ = = − − − = ∂ − − ∂ n i i i n i i i ) x y ( ) x y ( 1 1 0 0 1 2 1 0 2 β β β β β Igualando a cero se obtiene ∑ ∑ = = = + n i i n i i y x ˆ ˆ n 1 1 1 0 β β De igual forma derivando con respecto a β 1 , e igualando a cero se llega a (11b), lo cual se deja como ejercicio al lector. De las ecuaciones (11a) y (11b), se tiene que los estimadores en forma de sumas son: - Despejando β 0 de (11a), x ˆ y ˆ 1 0 β β − = , reemplazando en (11b) y despejando β 1 se obtiene. - xx xy n i i n i i i n i i n i i i S S ) x x ( ) y y )( x x ( x n x x y n y x ˆ = − − − = − − = ∑ ∑ ∑ ∑ = = = = 1 2 1 1 2 2 1 1 β Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 10 Es importante notar: a. El estimador de β 0 se puede pensar como una corrección de la media de Y. Si la variable X tiene media cero, el estimador β 0 será la media de Y. b. El estimador de β 1 es la covarianza estimada entre X e Y, dividido por la varianza estimada de X. c. En todo el trabajo se supone que los valores x i no son aleatorios sino fijos. d. En la ecuación (9), se supone que X t X es no singular. Método de Máxima Verosimilitud Otro criterio para estimar los parámetros del modelo lineal es el de máxima verosimilitud. Criterio de Máxima Verosimilitud (MV). La filosofía de MV es hallar un estimador de β, tal que la probabilidad de obtener los datos que se tienen sea máxima. En otras palabras, es darle la mayor posibilidad de aparición a los datos que se tienen en la muestra. Ejemplo 6. Si lanzo una moneda una vez y sale cara, para que la probabilidad de que salga cara sea máxima basta pensar que la moneda esta marcada con cara por ambos lados, esto sería lo que concluiríamos si usamos el criterio MV. Conceptos Previos En estadística I y II se estudio la normal univariada. Dada la variable X, se dice que tiene distribución normal con media µ y varianza σ 2 si su función de densidad esta dada por: ∞ < < ∞ ) ` ¹ ¹ ´ ¦ − − = x ) x ( exp ) x ( f - 2 2 1 2 2 σ µ σ π (12) La función de distribución o función de probabilidad acumulada se definía como: F(x)=P(X≤x) Estos conceptos dados para una variable se pueden extender de una manera natural para varias variables, si se piensa en cuál es la probabilidad de que conjuntamente X 1 > k+1 (>> léase mucho mayor). Modelos Implícitamente Lineales. Antes de entrar a ver los estimadores de los parámetros del modelo, se recordaran algunos casos de ecuaciones que pueden ser llevadas a la forma de un modelo de regresión lineal. a. t tk t ... x t e y ε β β α + + + = 1 1 0 , si se puede asegurar la relación entre la variables y t y x t1 ,...,x tk , entonces aplicando logaritmo natural, se llega a la expresión: t tk k t t t x x x ) ln( ) y ln( ε β β β α + + + + + =  2 2 1 1 0 t=1,2,...,n. que es una relación de regresión lineal. Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 22 b. t tk t t ... X y ε β β β + + + + = 1 2 1 1 invirtiendo se llega a una relación de la forma de regresión lineal. c. p t tk t t ... X y ε β β β + + + + = 1 2 1 siempre y cuando y t lo admita con la transformación (.) 1/p , se logra una relación de la forma de regresión lineal. Como nota final se debe resaltar que cuando se utiliza una transformación lineal se introduce un sesgo cuando se vuelve a la variable original, este sesgo aparece en algunos libros como el de Guerrero. Estimación de β y σ 2 En el modelo de regresión lineal múltiple Y=Xβ+ε. Los criterios para estimar β son los mismos que se han utilizado en regresión lineal simple, MCO y MV. Así vía MCO se debe minimizar ε ε ε t n i i = ∑ =1 2 . (15) Ahora ) ( ) ( β β ε ε X Y X Y t t − − = , es decir la función a minimizar es: Min ) ( ) ( β β X Y X Y t − − Si el lector observa y compara con lo hecho en regresión lineal simple se esta minimizando la misma estructura (con respeto a β), así se llega a que el mínimo con respecto a β se logra si: Y X X X t t 1 ) ( ˆ − = β donde: | | | | | . | \ | = nk n n k k x x x x x x x x x X         2 1 2 22 21 1 12 11 1 1 1 y | | | | | . | \ | = k ˆ β β β β  1 0 Usando el criterio de MV, se tiene que la función de verosimilitud esta dada por: ) ` ¹ ¹ ´ ¦ − − − − − − = ∑ = n i ik k i i i / n ) x ... x x y ( exp ) ( ) Y ( f 1 2 2 2 1 1 0 2 2 2 2 1 2 1 β β β β σ πσ (16) Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 23 con Y = (y 1 ,y 2 ,...,y n ) Ahora ) ( ) ( ) ... ( 1 2 1 2 2 2 1 1 0 β β ε ε ε β β β β X Y X Y x x x y t t n i i n i ik k i i i − − = = = − − − − − ∑ ∑ = = Aplicando logaritmo natural en la función (16), se tiene: | | ( ) ( ) 2 1 2 2 2 2 2 2 β β σ σ π σ β X Y X Y − − − − − = = t ) ln( n ln n ) Y ( f Ln ) , ( l Ahora, maximizar l(β,σ 2 ), con respecto a β, es equivalente a minimizar ) ( ) ( β β X Y X Y t − − , así el estimador de MV para β es equivalente al estimador de MCO. Por lo tanto, Y X X X t t 1 ) ( ˆ − = β Antes de ver las propiedades más importantes para el estimador de β en el modelo de regresión múltiple se vera algunos conceptos básicos que permitirán entender mejor los desarrollos presentados. a. Esperanza de una Matriz Estocástica (aleatoria). Dada A={a ij } i=1,2,...n, j=1,2,...,m matriz estocástica, se define la función esperanza de A como: E(A)={E(a ij )} Propiedades: Sean A y B matrices estocásticas, α, θ y β matrices constantes y sea φ un escalar, todo definido de tal forma que las siguientes operaciones se puedan realizar. - E(βAθ + Bα) = βE(A)θ + E(B)α - E(φA) = φE(A). b. Matriz de Covarianza de un Vector Estocástico (aleatorio) Dado un vector aleatorio Y t = (y 1 ,y 2 ,...,y n ) con media µ t = (µ 1 ,µ 2 ,...,µ n ), se define la matriz de varianza – covarianza de la siguiente forma. Var(Y) = E{(Y-µ)(Y-µ) t } Propiedades: - V(βA) = βV(A)β t . - V(φA) = φ 2 V(A). Propiedades del Estimador β ˆ (de MCO y MV) en el Modelo de Regresión Lineal Múltiple. - Insesgamiento. Y X X X t t 1 ) ( ˆ − = β (17) Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 24 Antes de pasar a aplicar el operador esperanza, veamos: Y=Xβ+ε, reemplazando en ε β ε β β t t t t X X X X X X X 1 1 ) ( ) ( ) ( ˆ − − + = + = (18) de lo anterior, tomando el operador esperanza se tiene: β ε β ε β ε β β = + = + = + = − − − ) ( ) ( ] ) [( ] ) ( [ ) ˆ ( 1 1 1 E X X X X X X E X X X E E t t t t t t Conclusión: β ˆ es insesgado. - Matriz de Varianza de β ˆ . De la ecuación (18) se tiene que: ε β β t t X X X 1 ) ( ˆ − = − . Entonces, { } { } 1 2 1 2 1 1 1 1 1 ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ˆ )( ˆ ( ) ˆ ( − − − − − − − = = = = − − = X X X X X I X X X X X X E X X X X X X X X X E E Var t t t t t t t t t t t t t σ σ εε εε β β β β β (19) Se puede mostrar que β ˆ es de mínima varianza dentro de los lineales insesgados, lo cual quiere decir, que si realiza la estimación por intervalo para cualquiera de los β i los intervalos obtenidos serían los de longitud más pequeña. Se puede mostrar que el estimador es consistente bajos condiciones bastante fáciles de cumplir. Teorema de Gauss – Markov. El teorema de Gauss Markov resume las cualidades más importantes del estimador Y X X X t t 1 ) ( ˆ − = β . 1. Es una función lineal de Y. 2. Es un vector aleatorio con distribución muestral conocida (normal multivariada). 3. Es insesgado. 4. Su matriz de covarianza esta dada por 1 2 ) ( − X X t σ . Resulta ser de mínima varianza dentro de los lineales insesgados. A continuación se realizara el proceso de estimación de σ 2 en el modelo de regresión múltiple. Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 25 Estimación de σ 2 . Para el modelo de regresión lineal simple se mostró que MY Y t t = ε ε ˆ ˆ con t t X X X X I M 1 ) ( − − = , y por lo tanto 2 )) ( ( 2 ~ ˆ ˆ M ran t χ σ ε ε , pero ahora la matriz no tiene 2 columnas, sino k+1. Por lo tanto el rango de M ha cambiado. ) 1 ( ) ) ( ( ) ( ) ) ( ( ) ( 1 1 + − = − = − = − − k n X X X X Ran I Ran X X X X I Ran M Ran t t t t . De donde 2 )) 1 ( ( 2 ~ ˆ ˆ + − k n t χ σ ε ε y por lo tanto el estimador para σ 2 esta dado por: ) 1 ( ˆ ˆ ˆ 2 + − = k n t ε ε σ (20) Donde n: es el número de observaciones y k+1: es el número de parámetros en el modelo. Nota: es de resaltar que este estimador por construcción es insesgado. Predicción de un Vector de Observaciones Pensar en tener predicciones para el siguiente año, o el siguiente mes, o para un individuo fuera del rango de estudio es común, pero en varios casos necesitamos predecir el comportamiento de nuestra variable de interés para los siguientes doce meses, o los siguientes cinco años, o para un grupo de individuos. Un camino es realizar predicción para cada uno por separado, usando la técnica que ya hemos estudiado. En esta sección se introducirá la forma de realizar predicción de varios años, meses o individuos de forma simultanea, haciendo uso de matrices. Se tiene un conjunto de valores para las variables independientes, para los cuales se desconoce el valor de Y 0 . Sea | | | | | . | \ | = 0 0 1 0 2 0 21 0 1 0 11 0 1 1 1 pk p k k x x x x x x X        Estimado β ˆ se puede pensar en predecir t p y y y ) ˆ ,..., ˆ , ˆ ( ˆ 2 1 0 = Y mediante la ecuación: β X Y 0 0 ˆ ˆ = (21) Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 26 Así se obtiene una predicción, por ejemplo para los años, 2001, 2002,..., 2008 del PIB en un solo paso. Las propiedades de la predicción dada en (21) son: - Insesgamiento. 0 ) ˆ ( ) ( ) ( ) ˆ ( ) ˆ ( ) ˆ ( 0 0 0 0 0 0 0 0 0 0 = − = − − = − − = − β β ε β β ε β β X E X E X E X E X X E Y Y E Es decir, la predicción obtenida es insesgada. - Matriz de Varianza: { } | || | { } | | | | | | P I X X X X X E E X E X E X X X E Y Y Y Y E Y V p t t t t t t t t t t = + = − − − − + − − = − − − − = − − = − 2 0 1 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ) ( ) ˆ ( ) ˆ ( ) ( ) ˆ )( ˆ ( ) ) ˆ ( ) ) ˆ ( ) ˆ )( ˆ ( ) ˆ ( σ σ β β ε ε β β ε ε β β β β ε β β ε β β Donde P tiene la siguiente forma: | | | | | . | \ | = pp p p p p P P P P P P P P P P        2 1 2 22 12 1 12 11 Además, cada predicción tiene distribución normal. Es decir, ) , ( ~ ˆ ii i i P y N y , permitiendo esto último realizar estimaciones por intervalo para las predicciones de interés. Coeficiente de Determinación En esta sección, se mostrará el desarrollo algebraico del coeficiente de determinación (R 2 ) y sus falencias. En el modelo de regresión lineal múltiple Y=Xβ+ε, Y se puede escribir como: εˆ ˆ ) ˆ ( ˆ ˆ ˆ + = − + = + − = Y Y Y Y Y Y Y Y Entonces: t t t t t t Y Y Y Y Y Y Y ε ε ε ε ε ˆ ˆ ˆ ˆ 2 ˆ ˆ ) ˆ ˆ ( ) ˆ ˆ ( + + = + + = (22) A continuación se probara que 0 ˆ ˆ = ε t Y . Y X X X X I Y X X X X Y X Y Y Y t t t t ) ) ( ( ) ( ˆ ˆ ˆ 1 1 − − − = − = − = − = β ε Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 27 Así, 0 ) ) ( ( ˆ ) ) ( ( ) ˆ ( ˆ ˆ 1 1 = − = − = − − Y X X X X I X Y X X X X I X Y t t t t t t t t β β ε Volviendo a (22) ε ε ˆ ˆ ˆ ˆ t t t Y Y Y Y + = , pero ∑ = = n i i t y Y Y 1 2 , ∑ = = n i i t y Y Y 1 2 ˆ ˆ ˆ y ∑ = = n i i t 1 2 ˆ ˆ ˆ ε ε ε . De lo anterior, ∑ ∑ ∑ = = = + = n i i n i i n i i y y 1 2 1 2 1 2 ˆ ˆ ε (23) Luego, se tiene que Y X X X X X Y t t 1 ) ( ˆ ˆ − = = β y multiplicando por t X a lado y lado se tiene: Y X Y X t t = ˆ por lo tanto ∑ ∑ = = = n i i n i i y y 1 1 ˆ (porqué?). Así (23) se transforma en ∑ ∑ ∑ = = = + − = − n i i n i i n i i Y n y Y n y 1 2 2 1 2 2 1 2 ˆ ˆ ε , lo cual se puede reescribir como: ( ) ∑ ∑ ∑ = = = + − = − n i i n i i n i i Y y Y y 1 2 2 1 1 2 ˆ ) ˆ ( ε (24) Dividiendo todo por ( ) ∑ = − n i i Y y 1 2 se tiene que: ( ) ( ) ( ) ∑ ∑ ∑ ∑ = = = = − − = − − = n i i n i i n i i n i i Y y Y y Y y R 1 2 1 2 1 2 1 2 2 ˆ 1 ˆ ε (25) Problemas del Coeficiente de Determinación El coeficiente de determinación presenta gran debilidad en el momento de ser usado para comparar la bondad de ajuste de dos o más modelos, en particular cuando uno de los modelos posee todas las variables independientes del otro y más, pues el R 2 crece a medida que se introducen nuevas variables predictoras en el modelo, no importando si la variable aporta nueva información en la explicación de la variable Yt. Por lo anterior, algunos autores proponen R 2 alternos que penalizan la entrada de nuevas variables en el modelo. Una de las propuestas es: ) 1 ( ) 1 ( 1 1 ~ 2 2 R k n n R − | | . | \ | + − − − = Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 28 Donde k+1 es el número de parámetros (o variables predictoras en el modelo). Independencia entre 2 y σ β ˆ ˆ Cuando nosotros realizamos intervalos de confianza, pruebas de hipótesis para β o predicción, estamos pensando que los estimadores 2 ˆ y ˆ σ β son independientes, esta sección de dedica a mostrar lo anterior de una forma sencilla. Para lo anterior se necesita el siguiente teorema. Teorema 3. Dado W vector estocástico con distribución NM(µ, ∆), y sean W A W q t 1 = y W A l 2 = , q y l son independientes si y solo si 0 2 1 = A A ∆ . En nuestro modelo tenemos; ) ; ( ~ 2 I X NM Y σ β , Y A Y X X X t t 2 1 ) ( ˆ = = − β , con t t X X X A 1 2 ) ( − = ; y ) 1 ( ˆ 2 + − = k n MY Y t σ con t t X X X X I A M 1 1 ) ( − − = = , el denominador es constante por lo tanto si se comprueba que β ˆ es independiente con el numerador de 2 ˆ σ se habrá demostrado, que estos estimadores son independientes. Basta probar que 0 ) ( 1 2 2 = A I A σ . Veámoslo: 0 ] ) ( ) ( ) [( ] ) ( ][ ) [( ] ) ( )[ ]( ) [( 1 1 1 2 1 1 2 1 2 1 = − = − = − − − − − − − − t t t t t t t t t t t t t t X X X X X X X X X X X X X X I X X X X X X X I I X X X σ σ σ Conclusión: β ˆ y 2 ˆ σ son estimadores (variables aleatorias) independientes. Intervalos de Confianza Es importante resaltar que para los parámetros β (vector) y σ 2 que son desconocidos pero constantes, se tienen las funciones β ˆ y 2 σˆ , que son vector y variable aleatoria, es decir pueden variar de muestra en muestra, y por ende es relevante tener un intervalo (o vecindad) donde estos parámetro. Algunas veces no es importante los parámetros en sí mismos, sino combinaciones lineales de estos. Estimación de una Combinación Lineal de β. Se tiene que β ˆ ~ MN(β,σ 2 (X’X) -1 ), entonces se puede mostrar que dado cualquier vector R 1 =(r 0 , r 1 ,..., r k ) β ˆ 1 R tiene distribución ) ) ( ; ( 1 1 1 2 1 t t R X X R R N − σ β , así se tiene que: Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 29 ) 1 , 0 ( ~ ) ( ˆ 1 1 1 1 1 N R X X R R R Z t t − − = σ β β (26) Ahora se tiene que 2 )) 1 ( ( 2 2 ~ ˆ )) 1 ( ( + − + − = k n k n Q χ σ σ entonces: )) 1 ( ( 1 1 1 1 1 ~ ) ( ˆ ˆ )) 1 ( /( + − − − = + − k n t t t R X X R R R k n Q Z σ β β (27) Y por lo tanto el intervalo de confianza esta dado por: t t k n R X X R t R 1 1 1 ] 2 / 1 )); 1 ( [( 1 ) ( ˆ ˆ − − + − σ β α  (28) Veamos como se utiliza este resultado si se quiere calcular un intervalo de confianza para un β i en especial. Para β 0 , R 1 =(1,0,...,0), para β 1 , R 1 =(0,1,...,0), ...etc., y así para cada uno de los parámetros en el modelo. Para la siguiente parte se necesita recordar que: Dadas dos variables aleatorias W y Z independientes con distribución 2 ) l ( χ y 2 ) m ( χ respectivamente, entonces m / Z l / W tendrá una distribución F (l, m) . En la parte de anterior se pensó en la matriz 1 R como un vector fila de tamaño 1x(k+1), pero en general el problema se puede plantear con una matriz general )) 1 ( ( + k bx R , con b≤(k+1), y rango(R)=b. Es decir, se desea una región de confianza (un subconjunto de R b ) donde se mueven las combinaciones lineales de los parámetros. Sea | | | | | . | \ | = bk b b k k r r r r r r r r r R        1 0 1 11 10 0 01 00 Se tiene que β ˆ R tiene distribución ) ) ( ; ( 1 2 t t R X X R R MN − σ β y 2 ) ( 2 1 ~ ) ˆ ( ] ) ( [ ) ˆ ( b t t t R R R X X R R R L χ σ β β β β − − = − (29) Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 30 Ahora si se divide dos variables aleatorias chi – cuadrado se tiene una variable aleatoria F, utilizando esto, se puede dividir )) 1 ( /( / + − k n Q b L obteniendo: 2 )) 1 ( ; ( 2 1 ~ ˆ ) ˆ ( ] ) ( [ ) ˆ ( + − − − − k n b t t t F b R R R X X R R R σ β β β β (30) Entonces si se desea una región de confianza con una confiabilidad de (1-α), esta será: 2 ) 1 ); 1 ( , ( 2 1 ˆ ) ˆ ( ] ) ( [ ) ˆ ( α σ β β β β − + − − ≤ − − k n b t t t F b R R R X X R R R (31) Por ejemplo, se desea saber en que subconjunto de R 2 se mueven β 0 y β 1 simultáneamente la matriz R será: | | . | \ | = 0 1 0 0 0 1   R Veamos la aplicación en un ejemplo utilizando simulación de Monte Carlo, para ser más claro lo que se esta haciendo. Ejemplo de Regiones de confianza. En la Tabla No 1. aparecen los datos de variables artificialmente creadas. El modelo ajustado es Y t =β 0 +β 1 X t1 +β 2 X t2 +β 3 X t3 +ε t . Tabla No 3. Datos Simulados X 1 X 2 X 3 Y 0,95 4,78 0,04 6,1858 0,57 7,44 1,95 7,2817 2,26 2,83 2,10 5,1478 2,30 0,38 3,71 1,9516 2,47 9,59 3,28 11,6616 1,92 8,37 3,19 9,6490 2,89 4,32 4,10 6,6394 0,19 2,07 2,67 1,0673 2,24 6,80 2,45 8,8855 0,53 5,17 1,39 5,1704 1,64 8,87 1,14 10,7539 0,09 4,95 3,01 3,6217 0,91 4,66 0,95 5,5284 1,89 9,44 1,69 11,4263 Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 31 1,23 2,86 4,93 2,2242 1,30 6,75 3,51 6,8980 1,43 4,74 4,18 4,8380 2,16 9,05 3,60 10,4338 2,86 8,98 2,05 12,2698 0,06 9,12 2,16 8,1362 0,91 0,87 1,49 1,4665 0,61 1,61 4,86 0,0577 0,79 9,28 1,89 9,5388 1,34 7,57 0,25 9,4958 2,48 9,54 0,78 12,8752 Tabla No. 2 Analysis of Variance Sum o f Mean So ur c e DF Squar es Squar e F Value Pr o b>F Mo del 3 34 2 . 0 9 2 39 ( 1) 114 . 0 30 8 0 7710 8 . 79 2 0 . 0 0 0 1 ( 4 ) Er r o r 2 1 0 . 0 310 6 ( 2 ) 0 . 0 0 14 8 C To tal 2 4 34 2 . 12 34 5 ( 3) Ro o t MSE 0 . 0 38 4 6 R- s quar e 0 . 9 9 9 9 Dep Mean 8 . 9 2 8 17 Adj R- s q 0 . 9 9 9 9 C. V. 0 . 4 30 72 Tabla No. 3 Parameter Estimates Par am eter Stan dar d T f o r H0 : Var iable DF Es tim ate Er r o r Par am eter =0 Pr o b > |T| INTERCEP 1 1. 9 8 0 0 0 4 0 . 0 2 72 38 31 72 . 6 9 2 0 . 0 0 0 1 X 1 1 1. 5 0 12 9 8 0 . 0 0 9 5 35 5 2 15 7. 4 4 3 0 . 0 0 0 1 X 2 1 1. 0 0 15 0 8 0 . 0 0 2 8 8 4 5 4 34 7. 19 8 0 . 0 0 0 1 X 3 1 - 0 . 4 9 8 732 0 . 0 0 6 2 4 74 0 - 79 . 8 30 0 . 0 0 0 1 La Tabla No 2. presenta el análisis de varianza cuyas componentes son: La suma de cuadrados del modelo (1) ( ) ∑ = − = n i i Y y SCM 1 2 ˆ , suma de cuadrados del error (2) ∑ = = n i i SCE 1 2 ˆ ε y suma de cuadrados total (3) ( ) ∑ = − = n i i Y y SCT 1 2 , los cuadrados medios del modelo y del error; SSM/glm y SCE/gle, valor de la prueba F calculada, y su correspondiente valor P (P-value) (4). El objetivo de un análisis de varianza es verificar la hipótesis de linealidad del modelo, es decir, Ho: β 0 =β 1 =...=β k =0 (SAS no incluye el intercepto), en este caso k=3. Ha: β i ≠0 para algún i Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 32 El supuesto de linealidad se rechaza si el valor de P es menor a 0.05. En este caso Valor de P = 0.0001 por lo tanto se rechaza Ho. Es decir, al menos uno es diferente de cero. La Tabla No 3. Presenta la estimación de los parámetros con sus correspondientes contrastes de hipótesis, para las hipótesis: Ho: β i =0 vs Ha: β i ≠0 Una hipótesis para cada uno de los parámetros del modelo. La hipótesis nula no se rechaza o rechaza usando la misma regla sobre el valor de P. Para el modelo ajustado todos los parámetros son estadísticamente diferentes de cero. Intervalos de confianza para los Parámetros del modelo. Se tiene que ) , , , ( 3 2 1 0 β β β β β = , si se desea realizar un intervalo de confianza para β 2 la matriz R=(0,0,1,0). Usando la ecuación en (28) se tiene: t t R X X R t 1 ] 975 . 0 ; 4 25 [ 2 ) ( ˆ ˆ − − σ β  Donde, | | | | | . | \ | − − − − − − − − − − = − 026 . 0 004 . 0 009 . 0 079 . 0 004 . 0 006 . 0 006 . 0 037 . 0 009 . 0 006 . 0 061 . 0 034 . 0 079 . 0 037 . 0 034 . 0 502 . 0 ) ( 1 X X t Entonces 006 . 0 ) ( 1 = − t t R X X R . De esta el intervalo de confianza será: 1.0015±2.08(0.0385)(0.0775) Y una región de confianza para β 1 y β 3 , usando la ecuación (30), donde la matriz | | . | \ | = 1 0 0 0 0 0 1 0 R , t R ) ( 3 1 β β β = , t R ) 4987 . 0 5013 . 1 ( ˆ = β , | | . | \ | − − = − 026 . 0 009 . 0 009 . 0 061 . 0 ) ( 1 t t R X X R y | | . | \ | = − − 74 . 39 62 . 5 62 . 5 06 . 17 ] ) ( [ 1 1 t t R X X R . Usando la ecuación (30). Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 33 2 ) 95 . 0 ; 21 , 2 ( 2 1 ˆ ) ˆ ( ] ) ( [ ) ˆ ( F b R R R X X R R R t t t ≤ − − − σ β β β β 49 . 3 ) 0385 . 0 ( 2 ) 4987 . 0 ( 74 . 39 ) 4987 . 0 )( 5013 . 1 )( 62 . 5 ( 2 ) 5013 . 1 ( 06 . 17 2 3 3 1 2 1 ≤ − − + − − − + − β β β β Reescribiendo se tiene: 49 . 3 ) 4987 . 0 ( 10 . 516 ) 4987 . 0 )( 5013 . 1 ( 97 . 145 ) 5013 . 1 ( 56 . 221 2 3 3 1 2 1 ≤ − − + − − − + − β β β β Recordando nuestro trabajo en calculo es una elipse rotada y trasladada del origen. Modelo de Regresión con Restricción En los capítulos anteriores se ha pensado que toda la información de importancia esta contenida en Y t ,X t1 , X t2 ,..., X tk , y por ende en la función de verosimilitud l(β,σ / X,Y), pero existe otra fuente de información sobre el fenómeno, ésta es el investigador. La función l(β,σ/X,Y) contiene toda información experimental, pero no se puede olvidar los conocimientos y la experiencia de un experto o del investigador en el tema de trabajo. Por ejemplo: en la estimación de la función log - lineal de producción Y t =β 0 +β 1 X t1 +β 2 X t2 +ε t , sea X t1 el logaritmo del capital y X t2 es el logaritmo de la mano de obra, es posible pensar que se esta trabajando bajo la condición de retornos constantes, esto es β 1 +β 2 =1. Lo que se ha introducido es una restricción al modelo. Otras causas para imponer restricciones en los parámetros es el hecho de que estos no pueden tomar cualquier valor. Como ésta, se pueden imponer otras condiciones (restricciones) lineales que en general se pueden plantear de la forma: r R = β (32) Donde R y r son matrices de constantes conocidas, de orden (Jx(k+1)) y (Jx1) respectivamente, con rango de la matriz R igual a J ( k n t . 2. Si la matriz R es de dimensión (bx(k+1)), es decir de la forma R={r ij } i=1,...,b; j=0,...,k , con Rango(R)=b, el estadístico de prueba esta dado por: )) 1 ( , ( 2 0 1 1 0 ~ ˆ ) ˆ ( ] ) ( [ ) ˆ ( + − − − − − = k n b t t t F b r R R X X R r R σ β β λ con región de rechazo dada por: λ > F (b, n-(k+1),1-α) . Es importante notar que la región de aceptación es complemento de la región de rechazo. Todo lo anterior se mostró en el momento de construir los intervalos de confianza para los parámetros del modelo, todo descansa sobre el hecho que: ) ) ( , ( ~ ˆ 1 2 − X X MN t σ β β . Planteamiento de un Contraste de Hipótesis sobre σ 2 . Si desea contrastar las hipótesis 2 0 2 0 : σ σ = H vs 2 0 2 0 : σ σ ≠ H . El estadístico de prueba esta dado por: ( ) | | )) 1 ( ( 2 0 2 ~ ˆ 1 + − + − = k n k n χ σ σ η . Con región de rechazo η<χ (n-(k+1), α/2) o η>χ (n-(k+1),1-α/2) . Gráfica No 1. Población Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 39 Diagnostico del Modelo Ajustado Toda la inferencia que se puede realizar (estimación por intervalo de parámetros y predicciones, y prueba de hipótesis) sobre el modelo de regresión lineal esta basado en los supuestos; si alguno de estos no se cumple los procesos de inferencia son errados. El objetivo de este capítulo es mostrar los posibles problemas que se presentan cuando alguno de los supuestos no se cumple, y formas de corregir o lograr que el supuesto se cumpla. Los supuestos que se tienen, en el modelo: Y t =β 0 +β 1 X t1 +β 2 X t2 +...+β k X tk +e t son; i. E(e t )=0 para todo t. ii. E(e t 2 )=σ 2 para todo t (Homocedasticidad). iii. E(e t e s )=0 para todo t y s (no presentan correlación). iv. e t ~ normal. Otros implícitos en los desarrollos v. X X t es no singular (las columnas de X son linealmente independientes). Se tiene para cada supuesto: i. Es de fácil cumplimiento, puesto que el promedio de los errores por construcción es cero, ii. Lo contrario a homocedásticidad es la heterocedásticida, que consiste en que la varianza cambia a través de las observaciones, iii. y iv. Los problemas contrarios a estos supuestos son la autocorrelación y la no normalidad, y v. Este problema se presenta en el momento que X X t sea no invertible (es decir, singular). Es importante notar que los e t son no observables, no se conocen, pero se pueden estimar mediante t eˆ , así todas las pruebas de los supuestos se harán mediante estos últimos. 1. Heterocedásticidad: Cuando la varianza cambia a través del tiempo, se dice que los errores son heterocedásticos. a. Las consecuencias que produce la heterocedásticidad son: - Los estimadores de mínimos cuadrados siguen siendo insesgados pero no son de mínima varianza. Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 40 - El estimador de la varianza de los errores es sesgado y por ende, las varianzas de estimadores de parámetros y prediciones son erradas, lo que lleva a que las pruebas de significancia son inválidas. b. Formas de detección. - Mediante gráficos. Después de ajustar el modelo calcule t eˆ y realice las gráficas; t eˆ vs t, t eˆ vs Y t , y t eˆ vs X ti . Si los residuales tienen varianza constante deben parecer una salpicadura de pintura que no se sale de cierta franja. En la siguiente página se presentan ejemplos de heterocedásticidad. - Otra forma de detectar heterocedásticidad es ajustar modelos de regresión donde los residuales estimados versus cada una de las variables independientes ( t ti t u X eˆ + + = β α ), si alguna de estas regresiones presenta que la estimación del parámetro β es significativamente diferente de cero, esto puede indicar heterocedásticidad. - Usando pruebas de razón de verosimilitud que consiste en: dividir el conjunto de residuales en k grupos, en lo posible cada uno con igual número de observaciones, en cada grupo estime la varianza i ˆ σ i=1,2,...,k, y calcule la varianza de todos los residuales σˆ ; calcule: ∏ = = k i m m i i 1 ) ˆ /( ) ˆ ( σ σ λ Donde m i es el tamaño del i-esimo grupo, y m es el número de residuales total. λ~ 2 1) k ( + χ Para otras formas de detectar heterocedásticidad ver Maddala página 235. c. Soluciones al problema de Heterocedásticidad Las soluciones dependen del comportamiento que observemos en los residuales, es decir de los supuestos que se hagan del comportamiento de la varianza. - Transformación de Box – Cox. El objetivo de esta transformación es homogeneizar la varianza, en la mayoría de casos al cumplirse este objetivo se esta corrigiendo de una vez el problema de no normalidad. Esta transformación tiene como supuesto que la varianza es una función de la media, σ t 2 =f(µ t ), por lo tanto la metodología tiene como objetivo es buscar un valor para λ tal que σ t /µ t 1-λ =constante. La transformación se hará sobre la variable dependiente de la forma: Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 41 ¹ ´ ¦ = = = 0 0 λ λ λ si Y ln si Y ) Y ( T Metodología: 1. Se dividen las n observaciones en H grupos, cada uno con igual número observaciones contiguas. Ejemplo: si se tiene 125 observaciones y se quiere 7 grupos cada uno tendrá 17 observaciones (125/7=17) y se dejan por fuera las 6 últimas o primeras observaciones. Cada grupo tendrá (n - h)/H observaciones, donde h el número de observaciones que se dejan por fuera. 2. En cada grupo se calcula la media y la desviación estándar. Así se tiene: } y , s { },..., y , s { }, y , s { H H 2 2 1 1 3. Calculo para cada λ Potencia (λ) . H . H H . H H . . . . s y / s y / s y / s y / s H . . . . . . . . . . . . . . . . . . s y / s y / s y / s y / s s y / s y / s y / s y / s . . Grupo 5 0 1 1 5 1 1 2 1 2 5 0 1 1 2 1 5 1 2 1 2 2 1 1 5 0 1 1 1 1 5 1 1 1 2 1 1 2 1 1 5 0 0 5 0 1 − − _______________________________________________________ Coeficiente CV(-1) CV(-0.5) CV(0) CV(0.5) CV(1) CV(.) = Coeficiente de Variación = D.S(λ)/µ(λ). µ(λ)= ∑ = − H i i i y S H 1 1 ) / ( 1 λ ( ) | | ) H /( ) ( y / Si ) ( S . D H i i 1 1 2 1 − − = ∑ = − λ µ λ λ . 4. El λ 0 que se escoge para realizar la transformación, es aquel con menor coeficiente de variación. Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 42 2. No normalidad. a. Problemas que ocasiona: Las inferencias no son válidas, las funciones para estimar los parámetros del modelo y para realizar predicción, a las cuales se llegan para establecer intervalos de confianza y realizar prueba de hipótesis, se basan en el supuesto de normalidad en los errores. b. Formas de detección: Para detectar no - normalidad, lo que en general se usa son contrastes de hipótesis, donde la hipótesis nula es que se tiene normalidad, y la alterna es que este supuesto no se cumple. Aquí se presentarán dos contrastes de hipótesis para probar el supuesto de normalidad, los contrastes de Jarque – Bera y de Kolmogorov – Smirnov. Lo importante de mostrar estas pruebas es que el estudiante entienda la filosofía de estas, así estará en capacidad de leer a cerca de otras pruebas y entenderlas. - Contraste de Jarque – Bera. El contraste de Jarque - Bera utiliza las dos principales características de la distribución normal, como es la simetría y el apuntamiento, usando estas dos características las usará para saber si una distribución dada es o no normal. Planteamiento de hipótesis: Para esto sea F n (w) la distribución de los datos, w 1 ,...,w t , a los cuales se les quiere aplicar esta prueba, en el caso del modelo de regresión lineal (modelos economemetricos específicamente) son los residuales. Ho: F n (w) = N(µ 0 ,σ 0 2 ). Ha: F n (w) ≠ N(µ 0 ,σ 0 2 ). Estadística de Prueba: ( ) | . | \ | − + + − = 2 2 3 4 1 6 1 K S ) k ( n τ (41) Donde n: número de observaciones, (k+1): número de parámetros del modelo, S y K: son los coeficientes de asimetría y de apuntamiento (kurtosis) de F n (x) estimados. Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 43 Bajo la hipótesis nula τ~ 2 2 ) ( χ , esta se rechaza si τ ≥ 2 1 2 ) , ( α χ − . Coeficiente de Apuntamiento K (kurtosis): Mide el grado de apuntamiento de una distribución, teóricamente es el cuarto momento de una distribución alrededor de la media. ∑ = | . | \ | − = n i i ˆ w w n K 1 4 1 σ (42) El valor de la kurtosis para una distribución normal es 3. Coeficiente de Asimetría S: Mide la simetría de una distribución alrededor de la media. Es el tercer momento de una distribución alrededor de la media. ∑ = | . | \ | − = n i i ˆ w w n S 1 3 1 σ (43) El coeficiente de asimetría para una distribución simétrica, como es el caso de la normal, es cero. Si se vuelve a (41), se puede observar que el contraste de J-B, mide las distancias entre los coeficientes de simetría y kurtosis de la distribución de los datos y los de la distribución normal. Si la distribución es cercana a la normal estas diferencias van a ser pequeñas, de lo contrario el valor de tau será grande. Así se rechaza para valores grandes del estadístico de prueba. - Contraste de Kolmorov – Smirnov (K-S). El contraste de K-S, es una prueba no paramétrica, sirve para contrastar la hipótesis: Ho: F n (w) = F(w). Ha: F n (w) ≠ F(w). Donde F n (w) es la distribución muestral, w 1 ,...,w n son los valores observados, a los cuales se les quiere aplicar esta prueba y F(w) es cualquier distribución teórica con la cual se desea contrastar la distribución muestral. La metodología para usar esta prueba es la siguiente: 1. Ordene los valores observados w 1 ,...,w n , sea w (1) ,...,w (n) la muestra ordenada. 2. Sea F n (w (i) )=i/n, es decir la función de distribución muestral en w (i) , es igual al número de valores observados menores o iguales a w (i) . F n (.) asigna a cada observación una probabilidad igual a 1/n. Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 44 3. Usando la función de distribución teórica calcule F(w (1) ),F(w (2) ),..., F(w (n) ). 4. Calcule la distancia más grande en la función muestral y la teórica: | ) ( ) ( | ) ( ) ( 1 i i n n i n w F w F Max D − = ≤ ≤ Por la ley de los grandes números, ) ( ) ( x F x F Lim n n = ∞ → , así si la muestra proviene de una población con distribución F(.), es decir bajo H 0 , D n → 0, o su valor tenderá a crecer cuanto más lejana este la distribución de los datos de la teórica. El estadístico de prueba esta dado por: H(t)=n 1/2 D n . La distribución de esta función se puede ver encontrar en los libros de estadística básica. Ejemplo. Los datos observados son: -0.055, 0.268, 0.645, 1.445, -1.115, -0.914, 0.974, 0.771, 0.093, -1.935 La hipótesis que se plantea es Ho: F n (w) = N(0;1,11). Ha: F n (w) ≠ N(0;1,11). 3 Se tiene: Datos Ord. -1.935 -1.115 -0.914 -0.055 0.093 0.268 0.645 0.771 0.974 1.445 Fn(.) 1/10 2/10 3/10 4/10 5/10 6/10 7/10 8/10 9/10 1 F(.) 0.033 0.114 0.192 0.479 0.535 0.601 0.730 0.768 0.823 0.915 | Fn(.)-F(.)| 0.067 0.056 0.108 0.079 0.035 0.001 0.030 0.032 0.077 0.085 Otras pruebas para contrastar normalidad: Shapiro – Wild, y los gráficos P-P (Probability Plot). Existen pruebas para contrastar independencia y normalidad a la vez como es la prueba de Mcleod – Li. Autocorrelación. Se presenta cuando: a. En la recolección de los datos no se realizó un diseño muestral adecuado. 3 1,11 es la varianza estimada de las observaciones Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 45 b. Aunque el muestreo fue bien realizado, ciertas observaciones son correlacionadas por pertenecer a una zona especial, ejemplo los vecinos del mismo barrio se puede pensar que tienen un consumo parecido. c. Los datos son observados a través del tiempo. Ejemplo el M1, conociendo su valor para el mes t, t-1,...,etc, se puede hacer una idea de su valor para t, lo que muestra que el proceso es autoregresivo (autocorrelacionado). Los problemas ocasionados por autocorrelación dependen de la estructura de esta, pero en general los problemas que más se evidencian son: - El estimador de la varianza de los errores es sesgado. - De lo anterior las varianzas estimadas de los estimadores de los parámetros del modelo son incorrectas y por ende los procesos de inferencia pueden ser errados. Algunas estructuras de autocorrelación: - Autocorrelación de 1er orden: Consiste en que el error del momento t es correlacionado con el del período anterior. Es decir: E(e t e t-1 )≠0 y E(e t e s )=0 si |t - s| > 1. - Autocorrelación de 2º orden: Otra forma de ver la autocorrelación es pensar que un período influye sobre otro, pensándolo así la autocorrelación de 2º orden consiste en que los errores de los momentos t-2 y t-1 afectan el comportamiento (resultado) en el período actual. E(e t e t-1 )≠0, E(e t e t-2 )≠0 y E(e t e s )=0 si |t - s| > 2. De forma análoga se puede definir autocorrelación de orden p. - Una estructura de autocorrelación que se puede presentar en el análisis de variables observadas mensualmente, es la autocorrelación estacional, en donde los valores observados en diciembre del período anterior puede estar correlacionado con el observado en el período actual. Formas de Detección. Existen varias formas de detectar este fenómeno, pero la más sencilla y la primera a la mano, son los gráficos de los residuales vs t, xi´s, etc., análogo a lo hecho con heteroscedasticidad, pero ahora buscando patrones de comportamiento. En la página siguiente se presentan algunos ejemplos de los patrones que están indicando que los errores son correlacionados. Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 46 A continuación se mostrará la prueba de Durbin – Watson para corroborar la existencia de autocorrelación de primer orden. Autocorrelación de 1er Orden. Notese Corr(e t e t-1 )=ρ, en donde se puede estimar ρ, la pregunta que surge es cómo se sabe si este valor estimado ρˆ , indica que el parámetro poblacional es diferente de cero. Así el contraste de hipótesis que se plantea esta dado por: H 0 : ρ=0. vs. H a : ρ≠0. Para el anterior contraste se tiene la prueba de Durbin y Watson. El estadístico de prueba esta dado por: ( ) ∑ ∑ = = − − = n t t n t t t e e e d 1 2 2 2 1 ˆ ˆ ˆ El estadístico d tiende a 2(1- ρˆ ) cuando n se hace grande, y por lo tanto se tiene: Si ρ=1 entonces d ≅ 0. Si ρ=-1 entonces d ≅ 4. Si ρ=0 entonces d ≅ 2. Por lo tanto, si el estadístico es cercano a 0 ó a 4, se rechaza H 0 . Para saber cuando se debe rechazar existen tablas donde se presentan dos limites d L y d U y se deben observar las siguientes reglas para el caso en que d<2. Si dd U entonces no hay evidencia para rechazar H 0 . Si d L 2 basta calcular 4-d, se emplean las reglas mencionadas arriba. Es importante notar que la estadística de D-W depende de el número de parámetros del modelos, el tamaño de la muestra y el nivel de significancia. Formas de Corrección del Problema de Autorrelación Si la prueba de D-W rechaza la hipótesis de no correlación existen varias alternativas para estimar los parámetros del modelo. Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 47 Si el interés no se centra en el intercepto, es decir importa la relación de la variable dependiente con las independientes, una herramienta que puede servir es ajustar el modelo en primeras diferencias. Se tiene Y t =β 0 +β 1 X t1 +...+β k X tk +e t . t=1,2,...,n. por lo tanto Y t-1 =β 0 +β 1 X (t-1)1 +...+β k X (t-1)k +e t-1 . De lo anterior: Y t -Y t-1 =β 1 (X t1 - X (t-1)1 )+β 2 (X t2 - X (t-1)2 )+...+β k (X tk -X (t-1)k )+(e t -e t-1 ) Al realizar esta transformación se tiene que si ρˆ es pequeño, el problema de autocorrelación se elimina. Si la variable de interés tiene tendencia, se puede plantear el modelo: Y t =δ+β 0 t+β 1 X t1 +...+β k X tk +e t . Si se diferencia una vez se tiene: Y t -Y t-1 =β 0 +β 1 (X t1 - X (t-1)1 )+β 2 (X t2 - X (t-1)2 )+...+β k (X tk -X (t-1)k )+(e t -e t-1 ) Que es un modelo con intercepto. NOTA: - Una de las consideraciones en el momento de corregir el problema de autocorrelación es verificar sí en el modelo hace falta introducir alguna variable independiente que puede explicar a Y, y por falta de esta se produce la autocorrelación. - Existen otras formas de trabajar el problema de autocorrelación, como son procedimientos iterativos o reticulares. - Una forma de observar si los errores presentan una correlación de orden mayor a uno, es la función de autocorrelación (ACF) y función de autocorrelación parcial (PACF), estas pueden ser utilizadas fácilmente en el paquete E-views (correlagrama). Mínimos Cuadrados Generalizados Aitken propuso una solución (o manejo) del problema de heteroscedasticidad y Autocorrelación de una vez. Esto se basa en el hecho de no suponer la matriz de varianza de los errores no es σ 2 I, sino que se tiene una estructura general de la formaΦ. En el modelo trabajado, se tiene: Y=Xβ+e donde se supone que I ee E t 2 ) ( σ = . (44) Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 48 Un modelo más general que este es propuesto por Aitken, Y=Xβ+e donde se supone que E(ee’)= σ 2 Ψ=Φ. (45) Con Ψ={ψ ij } i,j=1,...,n una matriz simétrica y definida positiva. Es decir, ahora se tiene 0 ) ( = t e E . E(e t 2 )= σ t 2 (puede cambiar a través de t), y E(e i e j )= ψ ij ≠0 (puede existir autocorrelación). Un caso particular de Ψ es I. Es de notar que mínimos cuadrados ordinarios no sirven para obtener un estimador de β y de σ 2 (los supuestos no se cumplen). Lo que se intentará entonces es llevar por alguna transformación el modelo en (45) al modelo presentado en (44). Por ser una matriz simétrica y definida positiva se puede hallar una matriz P tal que: PΨP t = I (nxn) . (46) Ahora usando la matriz P se puede realizar la siguiente transformación del modelo en (45). PY=PXβ+Pe. Y * =X * β+e * . (47) Ahora la matriz de varianza para los errores e * . 1. E(e * )=E(Pe)=PE(e)=0. 2. E(e * e *t )= E[Pe (Pe) t ]=E(Pee t P t )= PE(ee t )P t = Pσ 2 ΨP t = σ 2 PΨP t = σ 2 I. Lo anterior muestra que el modelo transformado en (47), cumple los supuestos del modelo en (44), y por lo tanto sobre este último modelo se puede realizar estimación usando mínimos cuadrados ordinarios. De lo anterior: ∗ ∗ − ∗ ∗ = Y X X X t t g 1 ) ( ˆ β (48) Reemplazando en términos de los valores observados: PY P X PX P X PY PX PX PX t t t t t t g 1 1 ] [ ) ( ) ( )] ( ) [( ˆ − − = = β Pero qué es P P t ?. De (46) se tiene: PΨP t = I. entonces Ψ=P -1 (P t ) -1 =(P t P) -1 . Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 49 Así: Ψ -1 =P t P. Por lo tanto se tiene que el estimador de MCG esta dado por: Y X X X t t g 1 1 1 ] [ ˆ − − − = Ψ Ψ β (49). Las propiedades de este estimador: i) Insesgado: β β Ψ Ψ Ψ Ψ Ψ Ψ β = = = = − − − − − − − − − X X X X Y E X X X Y X X X E E t t t t t t g 1 1 1 1 1 1 1 1 1 ) ( ) ( ) ( ] ) [( ) ˆ ( ii) Matriz de Varianza. 1 1 2 1 2 1 2 ] [ ] [ ] [ ] ) ˆ )( ˆ [( − − − − ∗ ∗ = = = − − X X PX P X X X E t t t t t g g Ψ σ σ σ β β β β Es de mínima varianza dentro de los lineales insesgados. iii) Estimador de σ 2 . ) 1 ( ) ˆ ( ) ˆ ( ) 1 ( ) ˆ ( ) ˆ ( ) 1 ( ) ˆ ( ) ˆ ( ) 1 ( ˆ 1 2 + − − − = + − − − = + − − − = + − = − ∗ ∗ ∗ ∗ ∗ ∗ k n X Y X Y k n X Y P P X Y k n X Y X Y k n e e g t g g t t g g t g t g β Ψ β β β β β σ Se puede mostrar que este estimador es insesgado. La pregunta ahora es, ¿conozco Ψ? No, ¿cómo la estimo?. Su estimación depende de la estructura de autocorrelación y de varianza de los residuales. Es importante notar que si se utiliza los estimadores de MV para el modelo de Aitken se llegará a los mismos estimadores de MCG, se va a tener además que los estimadores de σ g 2 y β g son independientes y por ende se puede realizar pruebas de hipótesis e intervalos de confianza de forma análoga a la realizada con el modelo (44). Así dado el vector R=(r 0 ,r 1 ,...,r k ), se puede realizar el contraste de hipótesis: H 0 : Rβ g = r 0 vs. H a : Rβ g ≠ r 0 Usando como estadístico de prueba: Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 50 )) 1 ( ( 2 0 1 1 1 0 ~ ˆ ) ˆ ( ] ) ( )[ ˆ ( + − − − − − − = k n g g t t g t r R R X X R r R σ β Ψ β τ De lo anterior, se rechaza la hipótesis nula para valores grandes de τ. λ> t (n-(k+1),1-α/2) . 3. Si R es una matriz de dimensión (bx(k+1)), es decir de la forma R={r ij } i=1,...,b; j=0,...,k , con Rango(R)=b, el estadístico de prueba esta dado por: )) 1 ( , ( 2 0 1 1 1 0 ~ ˆ ) ˆ ( ] ) ( )[ ˆ ( + − − − − − − = k n b g g t t g F b r R R X X R r R σ β Ψ β τ Y se rechaza si: τ > F (b, n-(k+1),1-α) . Problemas de Usar MCO cuando se debe Usar MCG: - El estimador del vector de parámetros del modelo es insesgado pero es ineficiente. - La estimación de la varianza de los errores es sesgada y por lo tanto toda la inferencia que se realice será errónea. Un ejemplo de MCG, es el caso cuando se tiene que los errores presentan dos períodos (o dos grupos) donde en cada uno presenta una variabilidad diferente. Es decir: Y=Xβ+e En forma matriz estamos pensando en que tenemos dos poblaciones, definidas por varianzas diferentes. | | | | | | | | | | | | . | \ | | | | | | . | \ | | | | | | . | \ | + | | | | | . | \ | | | | | | | | | | | | | . | \ | | | | | | . | \ | | | | | | . | \ | = | | | | | | | | | | | | . | \ | | | | | | . | \ | | | | | | . | \ | + + + + + + + + + + n n n n k nk n n k n n n k n n n k n n n k k n n n n e e e e e e X X X X X X X X X X X X X X X X X X Y Y Y Y Y Y                    2 1 2 1 1 0 2 1 ) 2 ( 2 ) 2 ( 1 ) 2 ( ) 1 ( 2 ) 1 ( 1 ) 1 ( 2 1 2 22 21 1 12 11 2 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 β β β Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 51 que puede ser reescrito como: | | . | \ | + | | . | \ | = | | . | \ | 2 1 2 1 2 1 e e X X Y Y β Con Φ Ψ σ σ = = | | . | \ | = 2 2 2 1 2 1 0 0 ) ( I I ee E t , donde I 1 es la matriz identidad de orden n 1 y I 2 de orden n 2 = (n - n 1 ). Con lo anterior lo que se plantea es que la observaciones tienen una dispersión desde la observación 1 hasta la n 1 y otra de ahí en adelante. | | | | . | \ | = − 2 2 2 1 2 1 1 1 0 0 1 I I σ σ Ψ Se puede mostrar con relativa facilidad que el estimado1r de MCG y MV para el vector de parámetros para este modelo, bajo estos supuestos, esta dado por: Y X X X t t g 1 1 1 ] [ ˆ − − − = Ψ Ψ β | | . | \ | + | | . | \ | + = − 2 2 2 2 2 1 1 1 1 2 2 2 2 2 1 1 1 ˆ σ σ σ σ β Y X Y X X X X X t t t t g y i t i i t i i Y X X X 1 ] [ ˆ − = β i=1,2. ) 1 ( ) ˆ ( ) ˆ ( ˆ 2 + − − − = k n X Y X Y i i i i t i i i i β β σ i=1,2. Si se desea contrastar la hipótesis 2 2 2 1 0 : σ σ = H . Vs. 2 2 2 1 : σ σ ≠ a H . Se puede realizar usando el estadístico: 2 2 2 1 σ σ γ ˆ ˆ = ~F(n 1 , n 2 ). Rechazando si γ > F(n 1 , n 2, 1-α). Donde 2 2 2 1 σ σ ˆ ˆ > , en caso contrario se divide de forma inversa. Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 52 Multicolinealidad El problema de que las variables independientes sean colineales (cercanas a ser dependientes), o lo que es lo mismo que la matriz ) ( X X t sea cercana a ser singular. Lo anterior es indicando que las variables independientes presentan un alto grado de correlación así esta no sea perfecta. El modelo observación por observación: t tk k t t e X X Y + + + = β β β  1 1 0 . Con los supuestos del modelo clásico ya conocidos. Un caso extremo de multicolinelidad es aquel donde la matriz ) ( X X t es singular, lo que nos esta indicando que no es de rango completo y por lo tanto se tiene que la información de una o más variables esta contenida totalmente en las otras. Y por lo tanto deben identificarse las variables que no presentan un aporte y retirarse del modelo, este es el caso más sencillo. El caso en el cual ) ( X X t es no singular pero se tiene alta colinealidad es más complejo que lo anterior, pues no se sabe cuales de las variables deben ser excluidas del modelo, la solución que se presentará en el curso es el método de componentes principales. Es de notar que la multicolinealidad es un problema que se presenta en un alto grado, si la correlación entre las variables independientes es alta. Problemas Ocasionados por Alta Colinealidad. Saber exactamente que problemas puede ocasionar la presencia de colinealidad no es claro, pero los síntomas que con mayor frecuencia se presentan son: 1. Se tiene un modelo con un ajuste adecuado, pero los errores estándar de los estimadores de los parámetros son muy elevados. 2. Por lo anterior los intervalos de confianza para los parámetros y predicciones serán demasiado amplios, y por lo tanto no se tendrán respuestas definitivas a los problemas. Formas de Detectar Multicolinealidad. 1. Usando los números de condición o índice. Para llegar a entender estos conceptos debemos repasar o mirar un poco la fundamentación del análisis de componentes principales. Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 53 - Análisis de Componentes Principales (visión general). La filosofía del análisis de componentes principales (ACP) es: dado un conjunto de variables aleatorias X 1 , X 2 ,..., X k , se desea construir a partir de estas un nuevo conjunto de variables Z 1 , Z 2 ,..., Z k , tal que estas nuevas variables sean no correlacionadas (ortogonales) entre sí. Frecuentemente el objetivo más común del ACP es reducir la información contenida en k variables, en un número menor de indicadores que serán las variables Z ti ,, que contienen mayor información de las variables iniciales. El ACP puede iniciar con la matriz de correlaciones o de varianza. Para entender esta matriz definamos X =(X 1 ,X 2 ,...,X k ), un vector aleatorio, y sea V = Var(X) = E[(X-µ) (X-µ) t ] matriz de varianza de X, la metodología del ACP es como sigue: 1. Para la construcción de la matriz V calcule los valores propios. Lo que equivale a hallar los valores de λ, al resolver el sistema: |V-λI|=0. (50) Donde: |.| = es la función determinante e I es la matriz identidad. Nota: Sean λ 1 ,λ 2 , ..., λ k lo valores para los cuales la ecuación (50) se cumple. Estos valores son conocidos como los valores propios (eigen values) de la matriz V. Asociados a λ 1 ,λ 2 , ..., λ k se tienen las variables V 1 ,V 2 , ..., V k estas nuevas variables son conocidas como los vectores propios (eigen vector), y son las variables Z 1 ,Z 2 , ..., Z k que se están buscando. Número de Condición. Dada la matriz ) ( X X t del modelo de regresión lineal, supóngase que λ 1 >λ 2 > ...> λ k (**) son los valores propios de esta matriz, el número de condición se define como: N.C.= ) i ( min ) i ( max k λ λ λ λ = 1 De acuerdo a la literatura, Belsley (1980) y Green (1997) se considera que la colinealidad existente entre las variables es un problema, si N.C.>30. Una solución para el problema de alta colinealidad esta basado en componentes principales (Chattere – Price (1977)). Se calculan las nuevas variables usando ACP, Z 1 ,..., Z k , y el modelo de regresión no se ajusta sobre X 1 ,..., X k sino sobre menor de las variables nuevas. Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 54 Un ejemplo (sencillo) del calculo de los valores propios y vectores propios. La matriz que se le desea calcular los valores propios es: | | . | \ | = 5 3 3 7 V , V-λI= | | . | \ | − − = | | . | \ | − | | . | \ | λ λ λ 5 3 3 7 1 0 0 1 5 3 3 7 De lo anterior se debe calcular las soluciones del sistema | V-λI | = 0, |V-λI | = (7-λ)(5-λ)-3 = (λ-8)( λ-4) = 0 entonces λ=8,4 El vector propio asociado a λ=4. (V-4I)x= | | . | \ | = | | . | \ | | | . | \ | − − 0 0 4 5 3 3 4 7 2 1 x x De lo anterior se obtiene el sistema: (1) 3x 1 +3 1/2 x 2 =0 (2) 3 1/2 x 1 +3x 2 =0 (1) y (2) son equivalentes así basta resolver una de las dos. Una solución esta dada por : | | . | \ | − = 3 1 x Que es el vector propio asociado a λ=4. Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 55 Una Mirada al Análisis de Series de Tiempo El objetivo de estas notas y las posteriores es mostrar un panorama general de los modelos más utilizados en el análisis de Series en el Tiempo, como son la descomposición de economía y una breve introducción a los modelos arima. Los objetivos más comunes del análisis de series de tiempo son: 1. Realizar predicción, que consiste en pronosticar uno o más valores en el futuro de la variable de interés. 2. Analizar el comportamiento del fenómeno, ejemplo ver los ciclos de la economía colombiana. 0. Una Serie en el Tiempo: Es una sucesión de observaciones de un fenómeno en el tiempo. Es importante notar que el gran soporte teórico del análisis de series en el tiempo son los procesos estocásticos, es decir se supone, existe un proceso estocástico del cual se origina la serie. 1. Procesos Estocásticos. 1.1. Definición (Proceso Estocástico): Un proceso estocástico es una familia de variables aleatorias {X t , t∈T}, definidas en un espacio de probabilidad (Ω,F,P). T es el conjunto de índices. Cuando se habla de {X t , t∈T} se esta pensando que {X t (w), t∈T}, donde w pertenece a un espacio muestral. Ahora para todo t fijo X t (w) es una variable aleatoria, y para w dado, X t (w) es una función del tiempo llamada realización o función muestral. Una serie en el tiempo es una realización de un proceso estocástico. 2. Algunos Modelos para Aproximar una Serie en el Tiempo. Sea Y t , t=1,2,...,T, la serie a analizar. Los modelos más usados en el análisis de series en el tiempo son: 2.1. Descomposición Clásica. Este modelo parte de la concepción económica que la serie es resultado de la agregación de varias componentes. Es decir, se tiene que la serie esta armada de la siguiente forma: t t t t t Z S C T Y + + + = (1) Donde: Y t : es la variable de interés, T t es la Tendencia, C t es el Ciclo, S t es la Estacionalidad y Z t es el Componente Estocástica. Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 56 Explicación de cada una de las Componentes. Estacionalidad: Es el efecto producido por cada uno de los meses, trimestres o semestres en el proceso, esta concepción parte de observar que en ciertos meses del año la serie a analizar presenta caídas (o subidas), producidas por el hecho que en este mes(es), es necesario un gran abastecimiento. Ejemplo de lo anterior son las ventas de juguetes que en el mes de diciembre presenta crecimientos importantes. Es importante notar que si se tiene una serie observada anualmente pensar en la componente estacional es NO válido. Ciclos: Son los efectos producidos por la coyuntura económica, son crecimientos inesperados por cambios en la economía imprevistos. La diferencia entre estacionalidad y ciclo se centra en el hecho de que la estacionalidad es regular, se puede predecir cuando va a suceder pues ocurre a intervalos de tiempo fijo, mientras que los ciclos son totalmente impredecibles. Tendencia: Es la componente que nos indica para donde va el proceso a largo plazo. Para algunos autores la tendencia a largo plazo incluye los ciclos. Componente Estocástica: Son aquellos cambios no explicados, es aquello que no es explicado por las demás componentes, es una variación aleatoria. Es importante notar que en el modelo puede no presentarse la Tendencia, el ciclo, o la componente estacional, pero siempre se tiene la componente estocástica. Ajuste del Modelo. Dada la concepción anterior, el objetivo del análisis de series en el tiempo será obtener a partir de Y t , cada una de estas componentes. Una de las formas de ajustar la tendencia se puede aproximar por una función polinómica: T t = ∑ i i t a A cerca de la estacionalidad en buena parte de los modelos, se piensa que el efecto de esta es el mismo todos los años. Ejemplo de lo anterior: si se tiene series observadas mensualmente, el efecto de diciembre de este año es igual al efecto del mismo mes el año anterior e igual para todos los años en el rango de estudio. Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 57 Un segundo supuesto sobre esta componente, es que la suma de los efectos de la estacionalidad durante todo año es igual a cero, con los cual estaríamos pensando que este efecto no altera el nivel del fenómeno en estudio. Matemáticamente se puede escribir como: S t = S t+d , con ∑ = t d t s 1 =0. Una forma de entender las componentes de una serie es realizar simulación y observar los efectos de cada una por separado y luego todas al mismo tiempo. Simulación de un Fenómeno Creado Artificialmente. Un ejemplo simulado donde se construye una serie usando una recta, una función senosoidal y un proceso estocástico. Gráfica No. 1. Procesos Determinísticos, Tendencia y Estacionalidad Gráfica No. 2. Serie Anterior Adicionando La Componente Estocástica. En la última gráfica, se tiene una serie generada por adición de una componente lineal, una componente senosoidal y un ruido blanco (Normal(2,9)). -10 0 10 20 30 40 0 5 10 15 20 25 30 -10 0 10 20 30 40 0 5 10 15 20 25 30 Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 58 Ahora al incluir el efecto de un ciclo. Gráfica No. 3. Serie Anterior Adicionando Un Efecto Cíclico entre los Período 5-7 Suavizadores (filtros) Es importante resaltar que uno de los objetivos en el trabajo de series en el tiempo, es el de “anular” el efecto de la componente estocástica, para ello se ha utilizado los suavizadores (filtros), cuyo objetivo es suavizar la serie, es decir remover aquellas variaciones debidas a la componente estocástica, dejando sólo el esqueleto (Tendencias, Ciclos y Estacionalidad), que es lo que se desea estimar. Los tres clases de filtros son: 1. Filtros de promedio móvil (a dos colas): Consiste en suavizar el punto Y t por el promedio: ∑ − − − + = q q j t t Y ) q ( Y 1 1 2 -10 0 10 20 30 40 0 5 10 15 20 25 30 Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 59 Un ejemplo de su aplicación: Serie* Original Filtro Bilateral Tendencia Orden 1 Orden 2 Orden 3 2391 1622,52 2488 2501,0 1703,62 2624 2667,0 2674,6 1784,72 2889 2831,3 2797,8 2776,0 1865,82 2981 2959,0 2910,6 2816,9 1946,92 3007 3013,3 2921,2 2796,7 2028,02 3052 2912,0 2812,8 2745,9 2109,12 2677 2692,0 2670,2 2701,1 2190,22 2347 2430,7 2584,0 2674,1 2271,32 2268 2397,0 2532,0 2657,3 2352,42 2576 2545,3 2574,4 2631,4 2433,52 2792 2752,3 2679,2 2664,1 2514,62 2889 2850,7 2806,8 2766,0 2595,72 3060 3017,7 2973,2 2960,3 2676,82 3104 3061,7 3070,8 2964,0 2757,92 3021 3135,0 3013,4 3101,7 2839,02 3280 2967,7 3152,6 3237,6 2920,12 2602 3212,7 3299,8 3347,1 3001,22 3756 3399,3 3461,0 3488,7 3082,32 * La serie en estudio son las importaciones de bienes y servicios australianos. Los resultados de este trabajo se ven gráficamente en la siguiente página. El gran problema de este tipo de filtros es que se pierde información, la pérdida aumenta a medida que el orden del filtro aumenta. A medida que q se hace grande el filtro es más poderoso (dañino), pues tiende a volver la serie una recta. 2. Suavizadores Exponenciales: En este tipo suavizadores la ecuación usada para eliminar el efecto de la componente estocástica o crear la nueva serie suavizada es: S t = αY t + (1 - α) S t-1 . Con S 1 =Y 1 , y 0<α<1. α es conocida como la constante de suavizamiento y fijada por el investigador, si la serie es muy volátil (variable) se aconseja un α cercano a 0, si presenta poca variación cercano a 1. La ventaja de estos filtros es que no se pierde información. Más adelante se verán filtros como el de Hodrick – Prescott cuyo objetivo no es suavizar la serie sino estimar la tendencia a largo plazo. Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 60 Estimación de la Componente Estacional y la Tendencia. Estimación de la Estacionalidad. La filosofía es tome la serie original y para estimar la tendencia use un suavizador de orden lo suficientemente alto para que la componente estacional sea removida (gráficamente es aplastar el efecto de las estaciones). Teniendo la tendencia en cada punto utilice las diferencias entre la serie original y la tendencia para calcular el valor del efecto de cada estación. Gráficamente: El suavizador adecuado será uno de orden q tal que 2q=d, si d es par. Ajustado así: d / ) y . y ... y y . ( T ˆ q t q t q t q t t + − + + − − + + + + = 5 0 5 0 1 1 q