Está en la página 1de 5

Distribución 2 (chi-cuadrado)

La distribución de probabilidad chi-cuadrado, introducida por K. Pearson alrededor


de 1900, tiene enorme interés por sus aplicaciones en inferencia estadística, ya que es
la distribución seguida por muchos de los estadísticos empleados en la estimación y
contraste de hipótesis (especialmente se utiliza en la estimación de varianzas, así co-
mo en pruebas de independencia y de bondad de ajuste).

Definición Una variable aleatoria ~x tiene una distribución chi-cuadrado si su fun-


ción de densidad está dada por:

1
f  2 ( x; n)  x ( n / 2)1e  x / 2 0 x
(n / 2) 2 n/2

donde el parámetro n es el número de grados de libertad de ~x .


Según aumenta n, la curva tiende rápidamente a hacerse simétrica.
Recordar que:  n  n  1! y  n 1  n n

f  2 ( x)

n=2

n=3
n=8
n = 10
n=5
x

Funciones de densidad chi-cuadrado

La distribución chi-cuadrado es un caso particular de la distribución gamma, cuya


función de densidad es:
a k k 1 ax
f  ( x; k , a)  x e x0 F. de densidad gamma
( k )

donde k y a son constantes positivas arbitrarias.


M:  (k , a)  k a V: V (k , a)  k a 2 FGM: M  ( ; k , a)  a a    ;   a
k
Si a = 1/2 y k = n/2, entonces:

1
f  2 ( x; n)  x ( n / 2)1e  x / 2 x0 F. de densidad chi-cuadrado
(n / 2) 2 n/2

Además, cuando n = 2 y  = 1/2, las distribuciones chi-cuadrado y exponencial


coinciden, esto es, f  x; 2  f E t;1 2 .
2

1
Chi-cuadrado f  2 ( x; 2)  e  x / 2 x0
2

1 t / 2
Exponencial f E (t;1 2)  e t 0
2

Media
1  1 
  ( n)  E ( ~
x)   x  x n / 2 1e  x / 2 dx   x n / 2 e  x / 2 dx
(n / 2)  2 n / 2 (n / 2)  2 n / 2
2
0 0

Si hacemos: y = x/2 ; x = 2y  dx = 2 dy

 n 2  n 2  n
2  2 2
  ( n) 
2
(n / 2) 0
y n / 2 e  y dy 
(n / 2)
 (n / 2  1) 
(n / 2)

  (n)  n
2

Varianza

1  1 
E(~
x2) 
(n / 2)  2 n / 2 0
x 2  x ( n / 2)1e  x / 2 dx 
(n / 2)  2 n / 2  0
x ( n / 2)1e  x / 2 dx

Si hacemos: y = x/2 ; x = 2y  dx = 2 dy
4  4
E(~
x2)  
(n / 2) 0
y ( n / 2)1e  y dy 
(n / 2)
 (n / 2  2) 


4
(n / 2)

 n 2  1  n 2  n 2  4 n 2 4  n 2  n 2  2n 

x 2 )  E ( ~
V 2 (n)  E ( ~ 
x )  n 2  2n  n 2  2n
2

V 2 (n)  2n

Función generatriz de momentos

 ~
M  2 ( ; n)  E e x 
1
2 (n / 2)
n/2 0

e x  x / 2 ( n / 2 )1
e x dx 
1
2 (n / 2)
n/2 0

e (1/ 2 ) x x ( n / 2)1dx

 t  dt
Si hacemos: t = (1/2 –  ) x  x    dx 
 1 2    1 2 

1 

2 n/2
(n / 2)(1 / 2   ) n / 2 
0
e t t ( n / 2)1dt 

2n / 2
(n / 2)  1  2 
n / 2
 n/2
2 (n / 2)(1  2 ) n/2

M  2 ( ; n)  1  2 
n / 2
  1/ 2
Media y Varianza a partir de la F. g. de momentos

Las derivadas 1ª y 2ª respecto de  de la función M  ( ; n)  1  2 


n / 2
son:
2

M  2 ( ; n) 1  2 
n / 2
 n1  2 
( n / 2 1)
d d
d d

M  2 ( ; n) 1  2  n / 2  n 2  2n 1  2 
( n / 2 2 )
d 2
d 2

d 2
d 2

La media y la varianza, respectivamente, resultan:

x )  n1  2 
 ( n / 21)
  (n)  E ( ~
2 n
 0

x 2 )  E ( ~
V 2 (n)  E ( ~
2

x )  n 2  2n 1  2  
 ( n / 2 2 )
 0
 n2

 
V 2 n  n 2  2n  n 2  2n

Observaciones

 La distribución chi-cuadrado se utiliza para efectuar pruebas de hipótesis (pruebas


no paramétricas o libres de distribución) sin necesidad de hacer suposiciones acerca
de distribución de la población de origen.

 Por su uso habitual en la contrastación de hipótesis, la distribución chi-cuadrado es


muy importante, y está tabulada para distintos valores del parámetro n.

 Para valores elevados de n (digamos n  30), la variable chi-cuadrado tiene aproxi-


madamente una distribución normal, con la media = n y varianza = 2n, por lo que la
z   2  n/ 2n , sigue una distribución aproximada N (0, 1).
variable tipificada ~
Ejemplo

Supongamos que de una variable chi-cuadrado con 150 grados de libertad, se ha

obtenido un valor de 180. ¿Cuál es la probabilidad de obtener un valor superior a éste

en dicha distribución?

Respuesta

Como el número de grados de libertad, 150, es suficientemente alto (en realidad

basta que n > 30), podemos aproximar la distribución chi-cuadrado por una N (150,

300), por lo que la probabilidad es:

 180  150 

p 150
2

 180  p ~
z

  p ~
z
30 

 300   17.32 

 p~
z  1.73  1  p~
z  1.73 

 1  0.9582  0.0418

También podría gustarte