Está en la página 1de 5

Econometría (30.marzo.

2022)

Análisis de Normalidad
Para estimar los parámetros desconocidos de un modelo lineal se
supone que los datos que se utilizan constituyen una muestra
tomada al azar y en forma independiente (muestra aleatoria) de una
distribución de probabilidad conocida.

Siempre se debe analizar si los datos empíricos son concordantes


con las hipótesis básicas estructurales del modelo.

Modelo lineal:
“yi = parte sistemática + εi” → εi = yi – parte sistemática; i = 1,2, …, n
donde εi son v.a.i. ~ Normal(0 ; σ2)

En concreto, debemos comprobar:


1) Si la distribución supuesta (Normal) es consistente con los datos.
≡ ε ~ Normal
2) Si las observaciones son independientes
3) Si la muestra es homogénea, es decir, si todas las observaciones
provienen de una misma población

Herramientas para analizar Normalidad


Gráficos: Histograma o polígono de frecuencias, Box_Plots,
Q-Q, Diagrama Tallo-Hojas

1
Test de hipótesis más utilizados:
 Shapiro y Wilks
 Kolmogorov-Smirnov, modificado por Lilliefors (1967)
 Jarque Bera
 …

Gráfico de probabilidad Cuartil-Cuartil (Q-Q Plots)


Un gráfico Q-Q permite observar cuan cerca está la
distribución empírica de un conjunto de datos a alguna
distribución ideal. (en este curso analizamos Normalidad)
El gráfico Q-Q para analizar Normalidad, consiste en
representar en un diagrama de dispersión los pares
ordenados (cuartiles de la muestra, cuartiles de la N(0,1)).
Vamos a analizar si se cumple la hipótesis estructural de
Normalidad en un
Errores estimados o residuos estimados
̂
ε̂ i = yi – 𝐩𝐚𝐫𝐭𝐞 𝐬𝐢𝐬𝐭𝐞𝐦á𝐭𝐢𝐜𝐚 = ei

Se observa un buen ajuste a la


Normal

Para obtener el gráfico de probabilidad Normal, se ordenan


los datos (residuos) de menor a mayor y se representa el j-
ésimo valor ordenado contra su punto de probabilidad
(𝐣−𝟎,𝟓)
acumulada: , en papel de probabilidad Normal.
𝐧

2
También un gráfico QQ puede construirse en Excel,
graficando los conteos normales estandarizado Zj contra ej,
donde los conteos normales estandarizado satisfacen:

j - 0,5
FZ (z j )= P(Z zj ) = pj
n
Ejemplo: Los siguientes datos corresponden al peso (Y) en gramos
de 7 artículos de cierto tipo seleccionados aleatoriamente

24 32 30 22 38 20 31

Modelo: yteórico = µ + ε; → ε̂ = yobs - μ̂ ; μ̂ = y ; ε̂ = e

Wobs = R2(res, Z) ≡ [Corr. Pearson (res, z)]2

El gráfico QQ tiene como principio teórico que si los datos tienen una
distribución Normal, la figura correspondiente es una línea recta. En la
práctica se debe realizar el siguiente razonamiento: si los puntos se
encuentran muy próximo a la recta indica que R2(res, Z) = Wobs es cercano
a “1” → la distribución Normal podría ser adecuada para los datos. Para

3
asumir Normalidad el valor Wobs debe estar dentro de la zona de aceptación
del test SW
RA = { W > Wα,n } RC = { W < Wα,n }

Del ejemplo: H0: ε ~ Normal H1: ε no ~ Normal

Por lo tanto, se asume


Normalidad,

wobs = 0,9538 > pto. crítico=0,803

(por los decimales, no coinciden


las dos formas de determinar
wobs)

Ejercicio: Del ejercicio -Tiempo que tarda en dormirse… - Analice si se cumple la


hipótesis de Normalidad. α = 0.05.

Y = Tiempo que tarda en dormirse

Modelo teórico
yi = μi + εi → εi = yi – μj i = 1, 2, …, n ; j = 1, 2 (en el ejemplo n = 16)
luego se sabe que μ̂i = y i i= 1, 2
por lo tanto valores estimados de εi = ei
ei = yi - y i

4
5

También podría gustarte