Está en la página 1de 20

Anonim_

www.wuolah.com/student/Anonim_

46722

7NORMALIDAD-DE-LAS-PERTURBACIONES-Y-OBSERVACIONES-INFLUYENTES.pdf
Problemas y teoría bien explicada

3º Econometría para la Empresa

Grado en Administración y Dirección de Empresas

Facultad de Ciencias Económicas y Empresariales


Universidad de Sevilla

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776

GRADO EN ADMINISTRACCIÓN Y DIRECCIÓN DE EMPRESAS


ECONOMETRÍA PARA LA EMPRESA

DISTRIBUCIÓN DE LAS
PERTURBACIONES ALEATORIAS:
NORMALIDAD Y MEDIA NULA
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776

NORMALIDAD DE LAS PERTURBACIONES


- El método de MCO no precisa el conocimiento de la distribución
poblacional de la variable aleatoria, por ello la Normalidad de la
distribución de las perturbaciones no es un supuesto necesario
para la estimación MCO del modelo.
Si eliminamos el supuesto de que la perturbación se distribuye
normalmente, los estimadores de MCO de los coeficientes de
regresión siguen siendo insesgados y poseen una variancia
mínima entre todos los estimadores lineales insesgados de los
respectivos parámetros.
- Sin embargo ya no puede afirmarse que son eficientes, porque
al no especificarse la forma de la distribución no se conocen las
cotas de Cramer-Rao de sus variancias, cuyas fórmulas quedan
inalteradas. Asimismo, no son los estimadores máximos
verosímiles señalados, puesto que la función de verosimilitud
empleada, que se basa en el supuesto de normalidad, ya no
puede aplicarse. 2

¿Qué necesitan los titulados para acceder a un empleo? - CUNEF


Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776

NORMALIDAD DE LAS PERTURBACIONES


Con respecto a las propiedades asintóticas, los estimadores de
MCO son consistentes y asintóticamente eficientes,
independientemente de la distribución del termino de
perturbación, puesto que sus distribuciones asintóticas son
normales (puede demostrarse en base al TCL). Ello significa que
su distribución asintótica coincide con la de los estimadores de
máxima verosimilitud.
Sin embargo, los intervalos de confianza y los contrastes de
significación de los parámetros dependen fundamentalmente del
supuesto de normalidad. Sin dicho supuesto, los estimadores
MCO no se distribuyen normalmente en muestras pequeñas y,
por tanto, en sentido estricto, los límites de confianza y las
contrastaciones que venimos realizando, no pueden ser
correctamente aplicadas. Afortunadamente, si la distribución del
término de perturbación no difiere muy radicalmente de la
normal, estos límites de confianza y los contrastes de
significación no se ven afectados muy seriamente y pueden 3
utilizarse como aproximaciones razonables.
¿Qué necesitan los titulados para acceder a un empleo? - CUNEF
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776

PRUEBAS DE LA NORMALIDAD DE LAS PERTURBACIONES

Todas las pruebas están basadas en los residuos MCO, dada la


imposibilidad de observar las perturbaciones.

REPRESENTACIÓN GRÁFICA: La representación gráfica en


forma de histograma, de los residuos de regresión es una
buena indicación de si èstos siguen, aproximadamente, una
distribución Normal.

CONTRASTE NO PARAMÉTRICO DE BONDAD DE


AJUSTE: Basado en la distribución χ2, se compara la
distribución de frecuencias de los residuos observados con la
correspondiente a los residuos esperados bajo el supuesto de
Normalidad. Para ello, los residuos pueden agruparse en
intervalos según sus valores sean de más/menos una, dos, tres
o más desviaciones estándar.
4
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776

PRUEBAS DE LA NORMALIDAD DE LAS PERTURBACIONES


PRUEBA DE NORMALIDAD DE JARQUE-BERA: Obtenida a
partir de los residuos normalizados o tipificados y de carácter
asintótico:
ei  0 ei
Residuos Normalizados : en  
ˆ ˆ
1 n
Para curtosis constante :  3   6n  n
 n 
2 e 3
  N (0,1)
i 1

 e  3 
1 n
Para asimetría constante :  4   24n 
 n 
2
4
n  N (0,1)
i 1

Por lo que :
 3   (1) ;  4   (1)   3    4   2 (2)  J .B
2 2 2 2 2 2

¿Qué necesitan los titulados para acceder a un empleo? - CUNEF


Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776

PRUEBAS DE LA NORMALIDAD DE LAS PERTURBACIONES


PRUEBA DE NORMALIDAD DE JARQUE-BERA: De carácter
asintótico, precisa del previo cálculo de los coeficientes de
asimetría (A) y de curtosis o apuntamiento (K) de los residuos
MCO. El estadístico experimental de la prueba es:

A  K  3 
2 2

JBexp  n  
 6 24 
Bajo la hipótesis nula de que los residuos siguen una distribución
Normal – en cuyo caso, A = 0 y K = 3 -, Jarque y Bera
demostraron que, asintóticamente, el estadístico experimental JB
sigue una distribución ji cuadrado con 2 grados de libertad. Si,
en una aplicación concreta, el p-valor del estadístico JB es
suficientemente pequeño, se puede, rechazar la H0 de que,
asintóticamente, los residuos están Normalmente distribuidos.6

¿Qué necesitan los titulados para acceder a un empleo? - CUNEF


Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776

OBSERVACIONES INFLUYENTES

Existen diversos instrumentos para comprobar la homogeneidad


de los datos, entendiendo por homogeneidad el hecho de que no
existan observaciones atípicas. En la estimación de un modelo de
regresión es habitual encontrar valores atípicos.
Podemos distinguir dos tipos de valores según cual sea su
influencia sobre las estimaciones: de influencia potencial o
valores inusuales y de influencia real o outliers. Mientras que la
presencia de los primeros no suele ser un problema grave, los
outliers modifican la pendiente de la recta de regresión entre la
variable dependiente y las variables explicativas.
Existen diversos instrumentos, en su mayoría gráficos, de
detección de valores atípicos. Así, los gráficos de dispersión de la
variable dependiente frente a cada una de las variables
explicativas. Una observación atípica aparecerá alejada de la
nube de puntos o diagrama de dispersión. 7

¿Qué necesitan los titulados para acceder a un empleo? - CUNEF


Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776

OBSERVACIONES INFLUYENTES
Un valor atípico, inusual o lejano es una observación muy
diferente del resto de observaciones muestrales. Su punto-
dato o punto-observación en la representación gráfica
aparece distante del resto de puntos-dato.
Un punto-dato se dice que ejerce un apalancamiento (grande)
si está desproporcionadamente distante de la mayor parte de
los valores representados por otros puntos-dato. Si este
punto dato es capaz de empujar a la recta de regresión
distorsionando el valor de su pendiente, se denomina punto
de influencia (observación influyente).
En los gráficos 1 y 2 observamos dos valores atípicos I y O.
Ambos tienen un gran apalancamiento, pero I ejerce poca
influencia para cambiar la pendiente de la recta de regresión,
mientras O realiza una fuerte influencia para cambiar la
pendiente. 8
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776

OBSERVACIONES INFLUYENTES

Valor inusual Outlier

Gráfico 1 Grafico 2
9

¿Qué necesitan los titulados para acceder a un empleo? - CUNEF


Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776

OBSERVACIONES INFLUYENTES
Una variable o una observación anómala con una influencia
inusitadamente grande en la estimación de los parámetros
puede reflejar un error en la codificación o la transcripción de
los datos. En este caso, será preciso una corrección.
Sin embargo, la mayor parte de las veces, la corrección de los
datos (o la omisión de puntos) no es necesaria. Una influencia
inusual puede señalar la falla del modelo de regresión para
explicar un valor de la variable para un elemento o período
particular, o bien reflejar el hecho de que la perturbación
aleatoria tiene una variancia grande.
La detección y evaluación de variables o valores anómalos,
especialmente sin son influyentes (outliers) es compleja, puesto
que la función de pérdida cuadrática implícita en los MCO
fuerza la pendiente de la línea estimada, como vemos en el
gráfico 3, a quedar cerca de dicho punto, por lo que éste no se
manifiesta como atípico. 10

¿Qué necesitan los titulados para acceder a un empleo? - CUNEF


Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776

OBSERVACIONES INFLUYENTES

Y
Yˆi  ˆ  ˆ X i

Yˆi  ̂  ˆ X i

Gráfico 3 X 11

¿Qué necesitan los titulados para acceder a un empleo? - CUNEF


Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776

OBSERVACIONES INFLUYENTES
Un instrumento muy útil para este análisis lo constituye el
gráfico de caja (boxplots). Éste representa en forma de caja los
valores de la variable comprendidos entre el primer (Q1) y tercer
cuartil (Q3). Señala además con un trazo vertical dentro de la
caja, la situación de la mediana y con otros dos fuera de la caja,
una vez y media la distancia del rango intercuartílico, tomado
éste desde la mediana, es decir, 1’5 x (Q3 - Q1)
Las observaciones situadas fuera de estas dos últimas líneas son
observaciones atípicas, en el sentido de estar muy alejadas de la
mediana. Entre éstas se señalan con un asterisco las
observaciones alejadas más de tres veces el valor del rango
intercuartílico (señal de una anomalía importante).
Puede ocurrir que las observaciones atípicas desde un punto de
vista univariante (variable a variable), no sean tales desde el
punto de vista multivariante, cuando se considera
conjuntamente la relación entre variables. 12
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776

OBSERVACIONES INFLUYENTES

GRÁFICO DE CAJA Y PATILLAS

13

¿Qué necesitan los titulados para acceder a un empleo? - CUNEF


Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776

OBSERVACIONES INFLUYENTES
Aunque con limitaciones, los valores de los residuos permiten no
sólo evaluar el supuesto de Normalidad de las εi sino que
pueden servir como indicadores de observaciones anómalas o
influyentes (outliers).
RESIDUOS NORMALIZADOS O STUDENTIZADOS: Los
residuos normalizados (e*) mayores que 1´96 en valor absoluto
o, de forma más general, los residuos estudentizados (e+)
mayores en valor absoluto que el valor crítico apropiado de la
distribución t, pueden considerarse como puntos atípicos y
deberían recibir atención especial.

e*

 yi  yˆi   0
; e  ( yi  yˆi )
e ˆ 1  hii
i

Si existe un porcentaje mayor que el esperado (≈5%) de tales


residuos debemos de cuestionar el supuesto de Normalidad. 14
¿Qué necesitan los titulados para acceder a un empleo? - CUNEF
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776

OBSERVACIONES INFLUYENTES
Todos los instrumentos señalados detectan la presencia de
valores atípicos, sin distinguir entre outliers y valores de
influencia potencial. Para identificar valores atípicos con
influencia real se emplea la distancia de Cook, definida como:
ei ˆ 1  hii
Distancia de Cook1 
k (1  hii )
Estadístico que se distribuye según una F de Snedecor con k y n-
k grados de libertad. Esta distancia proporciona una medida de
la influencia de la observación i sobre el conjunto de estimadores
de los parámetros, comparando el conjunto de estimaciones
obtenido al emplear todos los datos con el que se obtiene
eliminando la observación i.
El problema de este contraste es su escasa potencia, por lo que
su intervalo de confianza se suele calcular habitualmente al muy
15
liberal 50%.
¿Qué necesitan los titulados para acceder a un empleo? - CUNEF
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776

OBSERVACIONES INFLUYENTES
DFBETAS: Se calculan para cada observación mediante la
diferencia escalada entre la estimación MCO del parámetro
concreto y la estimación correspondiente con una observación o
variable particular omitida. Para un modelo univariante, donde se
ha suprimido la i-ésima observación.

ˆ  ˆ  i 
DFBETAi 
S ˆ (i )
Un valor del correspondiente DFBETA mayor que 1´96 en valor
absoluto señala la presencia de una observación influyente en la
estimación del parámetro en cuestión. Dicha influencia y,
consecuentemente, el DFBETA disminuye al aumentar el tamaño
muestral. Se recomienda atención cuando el valor del DFBETA de
una observación o variable particular es mayor, en valor
absoluto, que 2/√n. 16
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776

OBSERVACIONES INFLUYENTES
En todo caso, lo que no debemos hacer con los valores
atípicos es: a) Ignorarlos siempre como si no existieran, b)
Eliminarlos inmediatamente sin más consideraciones.
Lo correcto es: Intentar averiguar el por qué se han producido.
Si está claro que la causa es un error, se corrige (si es posible) o
se elimina el o los datos atípicos y asunto resuelto. Si no es un
error habrá que valorar la conveniencia de incluirlos en el
análisis, según sea la razón por la que se han producido, la
frecuencia con la que se espera valores similares, etc.
En caso de duda, una buena opción es realizar el análisis con y
sin estos datos, si se obtienen conclusiones similares la
disyuntiva deja de tener importancia. En caso contrario,
podemos salir de duda recogiendo más datos o también pueden
aplicarse técnicas específicas de análisis de la presencia de datos
anómalos o outliers, sobre la que existe una amplia bibliografía.
17

¿Qué necesitan los titulados para acceder a un empleo? - CUNEF


Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
VALOR MEDIO DE LAS PERTURBACIONES NO NULO
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776

E  i X i   0  E  i X i   i  E Yi X i      X i  i
a) μi es constante para todos los valores de Xi → μi = μ

E Yi X i   (   )   X i  E Yi X i    *   X i
El supuesto de exogeneidad no es demasiado restrictivo, puesto que el
estimador MCO de β no se ve alterado, pero la estimación MCO del término
independiente proporciona una estimación de α* y no de α. No hay
procedimiento para estimar α y μ por separado y obtener estimaciones
insesgadas o, al menos, consistentes.

b) μi no es constante para todos los valores de Xi.

E Yi X i     i   X i
El valor medio condicional de la variable endógena, E[Yi/Xi], no sólo varia
debido a los cambios de Xi, sino también por otras razones. El modelo no está
correctamente especificado, probablemente se ha omitido una o varias
variables explicativas relevantes. 18

¿Qué necesitan los titulados para acceder a un empleo? - CUNEF

También podría gustarte