Documentos de Académico
Documentos de Profesional
Documentos de Cultura
www.wuolah.com/student/Anonim_
46722
7NORMALIDAD-DE-LAS-PERTURBACIONES-Y-OBSERVACIONES-INFLUYENTES.pdf
Problemas y teoría bien explicada
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776
DISTRIBUCIÓN DE LAS
PERTURBACIONES ALEATORIAS:
NORMALIDAD Y MEDIA NULA
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776
e 3
1 n
Para asimetría constante : 4 24n
n
2
4
n N (0,1)
i 1
Por lo que :
3 (1) ; 4 (1) 3 4 2 (2) J .B
2 2 2 2 2 2
A K 3
2 2
JBexp n
6 24
Bajo la hipótesis nula de que los residuos siguen una distribución
Normal – en cuyo caso, A = 0 y K = 3 -, Jarque y Bera
demostraron que, asintóticamente, el estadístico experimental JB
sigue una distribución ji cuadrado con 2 grados de libertad. Si,
en una aplicación concreta, el p-valor del estadístico JB es
suficientemente pequeño, se puede, rechazar la H0 de que,
asintóticamente, los residuos están Normalmente distribuidos.6
OBSERVACIONES INFLUYENTES
OBSERVACIONES INFLUYENTES
Un valor atípico, inusual o lejano es una observación muy
diferente del resto de observaciones muestrales. Su punto-
dato o punto-observación en la representación gráfica
aparece distante del resto de puntos-dato.
Un punto-dato se dice que ejerce un apalancamiento (grande)
si está desproporcionadamente distante de la mayor parte de
los valores representados por otros puntos-dato. Si este
punto dato es capaz de empujar a la recta de regresión
distorsionando el valor de su pendiente, se denomina punto
de influencia (observación influyente).
En los gráficos 1 y 2 observamos dos valores atípicos I y O.
Ambos tienen un gran apalancamiento, pero I ejerce poca
influencia para cambiar la pendiente de la recta de regresión,
mientras O realiza una fuerte influencia para cambiar la
pendiente. 8
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776
OBSERVACIONES INFLUYENTES
Gráfico 1 Grafico 2
9
OBSERVACIONES INFLUYENTES
Una variable o una observación anómala con una influencia
inusitadamente grande en la estimación de los parámetros
puede reflejar un error en la codificación o la transcripción de
los datos. En este caso, será preciso una corrección.
Sin embargo, la mayor parte de las veces, la corrección de los
datos (o la omisión de puntos) no es necesaria. Una influencia
inusual puede señalar la falla del modelo de regresión para
explicar un valor de la variable para un elemento o período
particular, o bien reflejar el hecho de que la perturbación
aleatoria tiene una variancia grande.
La detección y evaluación de variables o valores anómalos,
especialmente sin son influyentes (outliers) es compleja, puesto
que la función de pérdida cuadrática implícita en los MCO
fuerza la pendiente de la línea estimada, como vemos en el
gráfico 3, a quedar cerca de dicho punto, por lo que éste no se
manifiesta como atípico. 10
OBSERVACIONES INFLUYENTES
Y
Yˆi ˆ ˆ X i
Yˆi ̂ ˆ X i
Gráfico 3 X 11
OBSERVACIONES INFLUYENTES
Un instrumento muy útil para este análisis lo constituye el
gráfico de caja (boxplots). Éste representa en forma de caja los
valores de la variable comprendidos entre el primer (Q1) y tercer
cuartil (Q3). Señala además con un trazo vertical dentro de la
caja, la situación de la mediana y con otros dos fuera de la caja,
una vez y media la distancia del rango intercuartílico, tomado
éste desde la mediana, es decir, 1’5 x (Q3 - Q1)
Las observaciones situadas fuera de estas dos últimas líneas son
observaciones atípicas, en el sentido de estar muy alejadas de la
mediana. Entre éstas se señalan con un asterisco las
observaciones alejadas más de tres veces el valor del rango
intercuartílico (señal de una anomalía importante).
Puede ocurrir que las observaciones atípicas desde un punto de
vista univariante (variable a variable), no sean tales desde el
punto de vista multivariante, cuando se considera
conjuntamente la relación entre variables. 12
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776
OBSERVACIONES INFLUYENTES
13
OBSERVACIONES INFLUYENTES
Aunque con limitaciones, los valores de los residuos permiten no
sólo evaluar el supuesto de Normalidad de las εi sino que
pueden servir como indicadores de observaciones anómalas o
influyentes (outliers).
RESIDUOS NORMALIZADOS O STUDENTIZADOS: Los
residuos normalizados (e*) mayores que 1´96 en valor absoluto
o, de forma más general, los residuos estudentizados (e+)
mayores en valor absoluto que el valor crítico apropiado de la
distribución t, pueden considerarse como puntos atípicos y
deberían recibir atención especial.
e*
yi yˆi 0
; e ( yi yˆi )
e ˆ 1 hii
i
OBSERVACIONES INFLUYENTES
Todos los instrumentos señalados detectan la presencia de
valores atípicos, sin distinguir entre outliers y valores de
influencia potencial. Para identificar valores atípicos con
influencia real se emplea la distancia de Cook, definida como:
ei ˆ 1 hii
Distancia de Cook1
k (1 hii )
Estadístico que se distribuye según una F de Snedecor con k y n-
k grados de libertad. Esta distancia proporciona una medida de
la influencia de la observación i sobre el conjunto de estimadores
de los parámetros, comparando el conjunto de estimaciones
obtenido al emplear todos los datos con el que se obtiene
eliminando la observación i.
El problema de este contraste es su escasa potencia, por lo que
su intervalo de confianza se suele calcular habitualmente al muy
15
liberal 50%.
¿Qué necesitan los titulados para acceder a un empleo? - CUNEF
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776
OBSERVACIONES INFLUYENTES
DFBETAS: Se calculan para cada observación mediante la
diferencia escalada entre la estimación MCO del parámetro
concreto y la estimación correspondiente con una observación o
variable particular omitida. Para un modelo univariante, donde se
ha suprimido la i-ésima observación.
ˆ ˆ i
DFBETAi
S ˆ (i )
Un valor del correspondiente DFBETA mayor que 1´96 en valor
absoluto señala la presencia de una observación influyente en la
estimación del parámetro en cuestión. Dicha influencia y,
consecuentemente, el DFBETA disminuye al aumentar el tamaño
muestral. Se recomienda atención cuando el valor del DFBETA de
una observación o variable particular es mayor, en valor
absoluto, que 2/√n. 16
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2909776
OBSERVACIONES INFLUYENTES
En todo caso, lo que no debemos hacer con los valores
atípicos es: a) Ignorarlos siempre como si no existieran, b)
Eliminarlos inmediatamente sin más consideraciones.
Lo correcto es: Intentar averiguar el por qué se han producido.
Si está claro que la causa es un error, se corrige (si es posible) o
se elimina el o los datos atípicos y asunto resuelto. Si no es un
error habrá que valorar la conveniencia de incluirlos en el
análisis, según sea la razón por la que se han producido, la
frecuencia con la que se espera valores similares, etc.
En caso de duda, una buena opción es realizar el análisis con y
sin estos datos, si se obtienen conclusiones similares la
disyuntiva deja de tener importancia. En caso contrario,
podemos salir de duda recogiendo más datos o también pueden
aplicarse técnicas específicas de análisis de la presencia de datos
anómalos o outliers, sobre la que existe una amplia bibliografía.
17
E i X i 0 E i X i i E Yi X i X i i
a) μi es constante para todos los valores de Xi → μi = μ
E Yi X i ( ) X i E Yi X i * X i
El supuesto de exogeneidad no es demasiado restrictivo, puesto que el
estimador MCO de β no se ve alterado, pero la estimación MCO del término
independiente proporciona una estimación de α* y no de α. No hay
procedimiento para estimar α y μ por separado y obtener estimaciones
insesgadas o, al menos, consistentes.
E Yi X i i X i
El valor medio condicional de la variable endógena, E[Yi/Xi], no sólo varia
debido a los cambios de Xi, sino también por otras razones. El modelo no está
correctamente especificado, probablemente se ha omitido una o varias
variables explicativas relevantes. 18