Está en la página 1de 9

Comisión Económica para América Latina y el Caribe (CEPAL)

División de Estadísticas y Proyecciones Económicas (DEPE)


Centro de Proyecciones Económicas (CPE)

Conceptos Básicos de una Variable Aleatoria.


Christian A. Hurtado Navarro
Abril, 2006

Variable discreta.

Función de probabilidad.
p(xi) = p(X = xi); con p(xi) ≥ 0.
Denominando S al espacio muestral de todos los posibles valores de la
variable aleatoria (v.a.) x, se verifica que:

∑ p(x ) = 1
S
i

Función de probabilidad.
Forma equivalente de caracterizar la distribución de una v.a. La
función de distribución F(x) se define como la probabilidad de que la
v.a. X tome un valor menor o igual que x.
F(x) = p(X = x)
La función de distribución se define para todo valor x real, y por
definición no creciente.
F (− ∞ ) = 0
F (+ ∞ ) = 1

Si la variable toma valores x1 ≤ x 2 ≤ K ≤ x n , la función de distribución


es:
F (x1 ) = p( X ≤ x1 ) = p(x1 )

F (x 2 ) = p( X ≤ x 2 ) = p(x1 ) + p(x 2 )

M
n
F (x n ) = p ( X ≤ x n ) = ∑ p(x )
i =1
i

Material de docente de uso exclusivo de los alumnos del curso de Econometría Básica, CEPAL.
Variables Aleatorias Continuas.

Función de densidad.
Es una función f(x)(continua en intervalos) tal que:
f (x ) ≥ 0
+∞

∫ f (x )dx = 1
−∞

El área por debajo de f(x) es la probabilidad de ese intervalo de


valores.
b
p(a < x < b ) = ∫ f (x)dx
a

Es decir, la suma de la probabilidad de todas las clases con valores


entre a y b.
Nota: La probabilidad que un modelo de v.a. continua asigna a un valor
concreto cualquiera es cero y por tanto:
p(a < x < b ) = p(a ≤ x < b ) = p (a < x ≤ b ) = p(a ≤ x ≤ b )
En cambio la probabilidad de un intervalo cualquiera es igual al área
debajo de la densidad f(x).
⎛ Δx Δx ⎞
p⎜ x 0 − < x < x0 + ⎟ ≈ f ( x 0 ) ⋅ Δx
⎝ 2 2 ⎠
f(x) es por tanto una densidad de probabilidad por unidad de x.

Función de distribución.
x0
F (x 0 ) = p( X ≤ x0 ) = ∫ f (x )dx
−∞

F (x 0 + Δx ) − F (x0 ) = p(x0 < X ≤ x0 + Δx ) ≈ f (x 0 ) ⋅ Δx


Tomando límites, Δx → 0 se obtiene:

f (x ) = F (x )
d
dx
1. F (− ∞ ) = 0
+∞
2. F (+ ∞ ) = 1 , ie, ∫ f (x)dx = 1
−∞

3. F es no decreciente: si a < b, F(a) ≤ F(b)


La función f(x) no es una probabilidad, sino una densidad, hay que
multiplicarla por la anchura del intervalo para obtener la
probabilidad del intervalo (en el límite).
Ejemplo. Variable aleatoria continua uniforme
En el intervalo (a,b) se tiene la función de densidad f(x)

Material de docente de uso exclusivo de los alumnos del curso de Econometría Básica, CEPAL.
9 Constante para x en (a,b).
9 Cero fuera del intervalo.
Solución.
Uniforme en [0,1], U [0,1]: es el resultado de elegir un número al
azar entre 0 y 1. Todos deben tener la misma probabilidad de ser
elegidos, pero como esta es cero, equivale a que todos los intervalos
con la misma anchura h entre 0 y 1 tienen la misma probabilidad.
⎧1 0 ≤ x ≤1

f (x ) = ⎨
⎪0 x < 0, x > 1

Para el caso general
⎧c a≤ x≤b

f (x ) = ⎨
⎪0 x < a, x > b

y como además
+∞ b
1= ∫ f (x )dx = cdx = c(b − a )

−∞ a

1
obtenemos, c = y a ≤ x0 ≤ b.
b−a
x0 x0
x0 − a
F (x 0 ) = ∫ f (x )dx = ∫ b − a dx =
1
b−a
−∞ a

F(x) = 0, si x < a y F(x) = 1 si x > b.

Medidas características.

Medida de Posición (Media).

n
μ = E [x ] = ∑ x p(x )
i =1
i i Para una variable aleatoria discreta

+∞
μ = E [x ] = ∫ xf (x )dx Para una variable aleatoria continua
−∞

En general la esperanza de cualquier función de una variable aleatoria


g(x).
+∞
μ = E [g (x )] = ∫ g (x ) f (x )dx
−∞

Material de docente de uso exclusivo de los alumnos del curso de Econometría Básica, CEPAL.
Ejemplo. Distribución Uniforme Continua.

Sea f (x ) =
1
con a < x < b
b−a
La media o esperanza matemática es calculada de la siguiente forma:
b b
1 x2 b2 − a2 b + a
μ = E [x ] = ∫
x
dx = = =
b−a b−a 2 2(b − a ) 2
a a

Es decir, el punto medio donde la densidad no es cero.

Medida de dispersión (Varianza).

[
Var (x ) = σ 2 = E (x − μ )2 = E x 2 − μ 2 ] ( )
n
Var (x ) = σ 2 = ∑ (x
i =1
i − μ )2 p(xi ) Para una variable aleatoria discreta

+∞
Var (x ) = σ 2 = ∫ (x − μ )
2
f (x )dx Para una variable aleatoria continua
−∞

Ejemplo. Distribución Uniforme, x ~ U [a, b] .

⎧ 1
⎪b − a a≤ x≤b

f (x ) = ⎨
⎪ 0 x < a, x > b


La varianza es calculada de la siguiente forma:

[ ] [ ]
Var (x ) = E (x − μ )2 = E x 2 − μ 2
b
Var (x ) = ∫ (x − μ )
2
f (x )dx
a

b
Var (x ) = x 2 f (x )dx − μ 2

a

b 2
⎛b+a⎞
Var (x ) = ∫
1
x 2 dx − ⎜ ⎟
b−a ⎝ 2 ⎠
a

b 2
1 x3 ⎛b+a⎞
Var (x ) = −⎜ ⎟
b−a 3 ⎝ 2 ⎠
a

2
b3 − a3 ⎛ b + a ⎞
Var (x ) = −⎜ ⎟
3(b − a ) ⎝ 2 ⎠

Var (x ) =
(b − a )3 = (b − a )2
12(b − a ) 12

Material de docente de uso exclusivo de los alumnos del curso de Econometría Básica, CEPAL.
Otras Medidas.

Momentos de orden k respecto al origen, mk.


+∞
[ ] ∫x
mk = E x k = k
f (x )dx
−∞

Momentos de orden k respecto a la media.


+∞
[ ] ∫ (x − μ )
m k = E ( x − μ )k = k
f (x )dx
−∞

Medidas o momentos importantes de una distribución son los


coeficientes de asimetría y el coeficiente de curtosis.

Coeficiente de Asimetría o Skewness

Skewness, determina el grado de asimetría que posee una distribución.


Para el caso de funciones simétricas como la normal o la t-student,
este coeficiente es cero, y analíticamente se representa por:

⎛x −x⎞
3

∑ ⎜⎝ i σ ⎟⎠
Sk =
n

Donde n representa al tamaño muestral.


Este indicador indica si la cola más larga de la distribución se
encuentra desviada hacia la derecha, centrada o desviada hacia la
izquierda de la distribución. Si la cola más larga se encuentra hacia
la izquierda (derecha) de la distribución, el coeficiente de skewness
será negativo (positivo) y se dirá que la distribución es sesgada a la
izquierda (derecha).
Como todo estimador, el coeficiente tiene su propia distribución que
se deriva asintóticamente, y que permite hacer inferencia con muestras
6
finitas. La distribución es una normal, con media cero y varianza ,
n
lo cual representamos para T = 20, 50, 100 por la función de densidad:

⎛ s2 ⎞
⎜ ⎟
− 0.5⎜ k ⎟

f (S k ) =
1 ⎜6 ⎟
⎝ n⎠
e
6

n

Material de docente de uso exclusivo de los alumnos del curso de Econometría Básica, CEPAL.
a
⎛ 6⎞
S k ~ N ⎜ 0, ⎟
⎝ n⎠

La hipótesis nula H0 : Sk = 0 se evalúa a través de una tabla normal


estandarizada con el siguiente estadístico:

Sˆ k
z Sk = ~ N (0,1)
6
n

Curtosis

El cuarto momento se denomina curtosis, y determina si las colas


tienen una masa o altura superior, igual, o inferior a la de una
distribución normal. El coeficiente de curtosis adopta un valor de 3
si las variables aleatorias son generadas de una normal, y
analíticamente se representa por:

⎛x − x⎞
4

∑ ⎜⎝ i σ ⎟⎠
K=
n

La medida de referencia de este coeficiente para una distribución


normal es de 3 (mesocúrtica), de manera que si el estadístico es mayor
que 3, entonces la función tiene características de leptocurtosis (K >
3), mientras que si la distribución tiene un coeficiente menor a 3,
entonces esta se denomina platocúrtica (K < 3).
La función de distribución del coeficiente de curtosis es

Material de docente de uso exclusivo de los alumnos del curso de Econometría Básica, CEPAL.
⎛ ( K − 3 )2 ⎞
⎜ ⎟
− 0. 5 ⎜
⎟⎟
f (K ) =
1 ⎜ 24
⎝ n ⎠
e
24

n
a
⎛ 24 ⎞
K ~ N ⎜ 3, ⎟
⎝ n ⎠

Para testear la hipótesis nula de que K = 3 debemos calcular el


estadístico:

Kˆ − 3
zK = ~ N (0,1)
24
n
Test de Normalidad de Jarque-Bera

Tal como se menciona en la sección de funciones de distribución, si


sumamos dos funciones de distribución chi-cuadradas, la función
resultante también obedece a una distribución chi-cuadrada, teniendo
los grados de libertad que resultan de sumar los grados de libertad de
las funciones de densidad individuales.
Con este antecedente Jarque y Bera desarrollaron un estadístico que
evalúa en forma conjunta la hipótesis nula si el coeficiente de
skewness y curtosis toman valores de 0 y 3 respectiva y conjuntamente.
Para generar el estadístico requiero sumar el cuadrado de dos

funciones de distribución estandarizadas como son ẑ S k y ẑ k

( )2 + (zˆ k )2 ~ χ 2 (2)
jb = zˆ S k

Material de docente de uso exclusivo de los alumnos del curso de Econometría Básica, CEPAL.
2 2
⎛ ⎞ ⎛ ⎞
⎜ ⎟ ⎜ ⎟
⎜ S k ⎟ ⎜ Kˆ − 3 ⎟
jb = ⎜ ⎟ +⎜ ⎟ ~ χ (2 )
2

⎜⎜ 6 ⎟⎟ ⎜⎜ 24 ⎟⎟
⎝ n⎠ ⎝ n ⎠
2 2
⎛ ⎞ ⎛ ⎞
⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ K −3⎟
ˆ
⎟ ~ χ (2 )
S
jb = ⎜ k ⎟ + ⎜ 2

⎜⎜ 6 ⎟⎟ ⎜⎜ 24 ⎟⎟
⎝ n⎠ ⎝ n ⎠

jb =
S k2
+
(
Kˆ − 3)2
~ χ 2 (2)
6 24
n n

n ⎛⎜ 2 (K − 3)2 ⎞
⎟ ~ χ 2 (2)
jb = Sk +
6 ⎜⎝ 4 ⎟

Tal como se genera el estadístico cabe mencionar que este indicador
tiene una cota inferior en cero, es decir que no puede ser inferior a
cero, de manera que en la medida que se aleja de 0, ya sea porque el
coeficiente de skewness se aleja de 0 o porque el coeficiente de
curtosis difiere de 3, aumenta la probabilidad de rechazar la
hipótesis nula de que la distribución generadora de los datos proviene
de una distribución normal.

Material de docente de uso exclusivo de los alumnos del curso de Econometría Básica, CEPAL.
Ejercicio
Se tienen los siguientes datos de puntajes promedio de lectura en los
diferentes países componentes de la OCDE.

⎛ (x i − x ) ⎞ ⎛ ( x i − x ) ⎞ ⎛ (xi − x ) ⎞ 4 ⎛ (xi − x ) ⎞ ⎛ (xi − x ) ⎞ ⎛ (x i − x ) ⎞


3 3 4

País OCDE ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ País OCDE ⎜ ⎟ ⎜ ⎟ ⎜ ⎟


⎝ σ ⎠ ⎝ σ ⎠ ⎝ σ ⎠ ⎝ σ ⎠ ⎝ σ ⎠ ⎝ σ ⎠
1 546 1,680 4,745 7,974 15 504 0,149 0,003 0,000
2 534 1,243 1,919 2,385 16 497 -0,107 -0,001 0,000
3 529 1,060 1,192 1,264 17 494 -0,216 -0,010 0,002
4 528 1,024 1,073 1,099 18 493 -0,253 -0,016 0,004
5 527 0,987 0,963 0,951 19 492 -0,289 -0,024 0,007
6 525 0,914 0,765 0,699 20 487 -0,471 -0,105 0,049
7 523 0,842 0,596 0,502 21 484 -0,581 -0,196 0,114
8 522 0,805 0,522 0,420 22 480 -0,727 -0,384 0,279
9 516 0,586 0,201 0,118 23 479 -0,763 -0,445 0,339
10 507 0,258 0,017 0,004 24 474 -0,946 -0,845 0,799
11 507 0,258 0,017 0,004 25 470 -1,091 -1,300 1,419
12 507 0,258 0,017 0,004 26 441 -2,149 -9,926 21,333
13 505 0,185 0,006 0,001 27 422 -2,842 -22,957 65,246
14 505 0,185 0,006 0,001
Promedio 499,93
Desv. Est. 27,42
Skewness -0,90
Kurtosis 3,89

Jarque-Bera es un estadístico para testear si la serie esta


normalmente distribuida. Este test mide las diferencias de la
asimetría (skewness) y curtosis de la serie comparación con la
distribución normal. El estadístico es calculado de la siguiente
manera:

n ⎛⎜ 2 (K − 3)2 ⎞

jb = Sk +
6 ⎜⎝ 4 ⎟

Donde Sk es la skewness, y K es la curtosis, y k representa el numero
de parámetros estimados para crear la serie.
Bajo la hipótesis nula de distribución normal, el estadístico Jarque-

Bera se distribuye χ2 (chi-cuadrado) con dos grados de libertad.


Del ejercicio tenemos:

jb =
27 ⎛⎜
(− 0.895)2 +
(3.89 − 3)2 ⎞

6 ⎜⎝ 4 ⎟

jb =
27 ⎛⎜
(− 0.895)2 +
(0.89)2 ⎞

6 ⎜⎝ 4 ⎟

jb = 4.5(0.801025 + 0.198025)

jb = 4.495725 ≈ 4.5

Material de docente de uso exclusivo de los alumnos del curso de Econometría Básica, CEPAL.

También podría gustarte