Está en la página 1de 12

Extraído de “NOTAS DE PROBABILIDAD Y VARIABLE ALEATORIA”

de MARGARITA DIAZ

7. Distribuciones derivadas de la normal

Previo a la lectura de esta Sección, el alumno debe consultar la bibliografía


básica, páginas 188-193.

En esta Sección trabajamos con tres distribuciones deducidas a partir de una variable
normal, por lo que estos modelos son aplicables sólo a muestras extraídas de
poblaciones normales. Estas distribuciones que son la Chí-Cuadrado, la F de
Snedecor y la t de Student, tienen un considerable interés práctico ya que
desempeñan un papel muy importante en inferencia estadística y tienen asociados
parámetros que se conocen con el nombre de grados de libertad. Una forma práctica
de determinar los grados de libertad asociados a un estadístico es la siguiente: es el
número de observaciones disponibles, menos el número de estadísticos calculados a
partir de los datos1/.

7.1. Distribución Chí- Cuadrado de Pearson

Comenzamos a trabajar con la Chí-Cuadrado, por cuanto la t y la F se derivan a


partir de la misma, y tienen los grados de libertad de la variable Chí-Cuadrado de la
que se deducen.

Sea una muestra aleatoria de tamaño n extraída de una variable X  N(,  )

X1, X2,...Xn E(Xi )   var(Xi )   2

Si se estandarizan las n variables se distribuyen normal e independientemente con


media cero y varianza 1:

Z1, Z2,...Zn E(Zi )  0 var(Zi )  1

Si se suman los cuadrados de las variables estandarizadas, se obtiene una variable con
distribución Chí-Cuadrado con n grados de libertad.
n
( X i   )2 n
 n2  
i 1  2
 Z
i 1
2
i

El único parámetro de esta distribución son los grados de libertad, su esperanza es


igual a los grados de libertad y su varianza el doble de ese valor.

E( n2 )  n V ( n2 )  2n

Generalmente no se conoce la media poblacional y para estandarizar trabajamos con


la media de la muestra, por lo que se pierde un grado de libertad, resultando una Chí-
Cuadrado con n-1 grados de libertad.
n
( X i  X )2
 n21  
i 1 2
E(n21)  n  1 V (n21)  2(n  1)

La Expresión más frecuente para esta variable es la siguiente:

1/
Estrictamente, los grados de libertad están determinados por el rango de la matriz asociada a
una forma cuadrática. Para profundizar este tema se puede consultar Mood y Graybill (1978).
243
n
( X i  X )2 (n  1)S2
 n21   i 1 2

2
(8)

2
 (X i  X )2
donde S  i 1

n 1

Si analizamos la Expresión (8) de la variable, observamos que la misma relaciona la


varianza muestral y la varianza poblacional, por lo que esta distribución se utiliza para
hacer inferencias respecto a la varianza poblacional. Cuando se cuenta con las
observaciones de una muestra, x1, x2 ,...xn , a partir de esos datos calculamos la media
y la varianza muestral.
n

n  (x i  x)2
x  x
i 1
i s  2 i 1

n 1

La suma de los cuadrados de los valores estandarizados será un valor observado de


una Chí-Cuadrado con n-1 grados de libertad.
n
(xi  x)2 (n  1)s2
 n21  
i 1  2

2

Actividad 21:
Sea la variable estatura de mujeres, con distribución normal con media 165 y
varianza 36. Suponga que se extrajo una muestra de 11 alumnas, se midió su
peso y se obtuvieron los siguientes estadísticos muestrales: x  163.5
s2  42.25 .

a- ¿Cuál es el valor observado del estadístico Chí-Cuadrado?


b- ¿Cuántos grados de libertad tiene?

Características de la Distribución Chí-Cuadrado

a- Por tratarse de una suma de cuadrados sólo asume valores positivos.


b- Hay una distribución Chí-Cuadrado para cada valor de los grados de libertad.
c- Como se advierte en los gráficos presentados en el texto citado precedentemente,
la gráfica de la función de densidad de esta variable presenta asimetría derecha. Es
muy asimétrica cuando los grados de libertad son pocos y se aproxima a la normal
cuando los grados de libertad son muchos (lo que se deriva de un n grande).
d- La esperanza es igual a los grados de libertad y la varianza es el doble.

Uso de la Tabla de la Chí-Cuadrado (Tabla 7)

Los valores de los grados de libertad se encuentran en la primera columna (de 1 a 30


y denotados con la letra n) y en la primera fila se indica el valor de probabilidad
acumulado (desde 0.005 a 0.995). El cuerpo de la tabla contiene los valores de la
variable que acumulan esas probabilidades F ( ) .
2

Para buscar probabilidades en la Tabla, debemos ubicarnos en la fila que corresponde


a los grados de libertad del problema. En el caso planteado en la Actividad 21 por
ejemplo, se trata de una muestra de tamaño 11, por lo que los grados de libertad
resultantes son 10.

Si queremos obtener cuál es el valor que acumula el 95%, en la primera columna


buscamos n = 10 y nos desplazamos por esa fila hasta la columna encabezada por
0.95. En la intersección de esa fila y esa columna leemos el valor de la variable 18.3 y
244
por lo tanto:
Pr(10
2
 18.3)  0.95
La Figura 8 ilustra sobre el significado de este resultado.

Distribución Chí-Cuadrado acumulada

245
Figura 8
Área tabulada en la 10
2
hasta el valor 18.3

Si queremos el valor de la variable que acumula el 99%, está claro que será mayor
que el obtenido.

Pr(10
2
 c)  0.99 c  23.2

Actividad 22:
Sea una variable aleatoria que se distribuye  2 de Pearson con 15 grados de
libertad, se pide encontrar las siguientes probabilidades:

a- P (  2  7.26).
b- P (  2  25).
c- P (  2  6.26).
d- P (8.55   2  27.5).

Actividad 23:
Sea una variable aleatoria que se distribuye  2 de Pearson con 25 grados de
libertad, se pide encontrar el valor de  2* , tal que:

a- El área a la izquierda de  2* sea de 0.05.


b- El área a la derecha de  2* sea de 0.975.
c- El área a la derecha de  2* sea de 0.01
d- El área entre 12* y 22* sea de 0.95, siendo la probabilidad entre 0 y 12* de
0.025.

7
.
2
.D
i
st
r
i
bu
c
i
ón
F
de
S
n
e
de
c
o
r

La F de Snedecor se define como el cociente de dos variables Chí-Cuadrado estadísti-


camente independientes, divididas por sus respectivos grados de libertad.

Si las variables U y V tienen distribución Chí-Cuadrado con m y n grados de libertad


respectivamente:

U  m
2
V  n2

246
la variable F con m grados de libertad en el numerador y n en el denominador, se
obtiene haciendo:

U
Fm,n  m (9)
V
n

Uso de la Tabla de la F (Tabla 8)

En la tabla de la distribución F acumulada, la primera fila indica los grados de libertad


del numerador (denotados con la letra m), mientras que los del denominador,
representados por la letra n, están en la primera columna. En el margen izquierdo de
la tabla se indican las probabilidades acumuladas (0.90, 0.95, 0.975, 0.99 y 0.995) y
en el cuerpo de la tabla los valores de F.

Al igual que la Chí-Cuadrado, la F sólo asume valores positivos, presenta asimetría


derecha, y hay una distribución para cada combinación de los grados de libertad del
numerador y denominador.

Por ejemplo, si se trata de una F con grados de libertad del numerador = m = 10


y grados de libertad del denominador = n = 6, se encuentra que:

Pr(F10 ,6  2.94)  0.90

Pr(F10 ,6  4.06 )  0.95

Pr(F10 ,6  7.87)  0.01

Figura 9
Área tabulada en la F10 ,6 hasta el valor 4.06

247
Distribución F acumulada

248
Como se advierte de la lectura de la tabla, los valores de F tabulados acumulan como
mínimo un 90% de probabilidad, por lo que se sitúan en el extremo derecho de la
curva y los denotaremos Fd . No obstante ello, a partir de la tabla, se pueden obtener
los valores de la variable que acumulan probabilidades menores al 10% (complemen-
tarias de los valores de tabla: 0.10, 0.05,0.025,0.01 y 0.005), que estarán ubicados
en la cola izquierda, por lo que los denotaremos Fi .

Por ejemplo, si queremos obtener el valor de una F10 ,6 que acumula el 5% de proba-
bilidad, esta variable surge del cociente de una Chí-Cuadrado con 10 grados de
libertad en el numerador y otra con 6 en el denominador:

U / 10 U / 10
F10 ,6  Pr(  Fi(10 ,6 ) )  0.05
V /6 V /6

El valor de Fi(10 ,6 ) se obtiene tomando recíproca en la Expresión anterior:

V /6 1
Pr(  )  0.05
U / 10 Fi(10 ,6 )

V /6 1
Pr(  )  0.95 (10)
U / 10 Fi(10 ,6 )

Al tomar recíproca, se invierten los grados de libertad de la variable F y se obtiene un


valor tabulado (derecho) de la variable F con 6 y 10 grados de libertad:

1
Pr(F6 ,10  )  0.95
Fi(10 ,6 )

Pr(F6 ,10  Fd( 6 ,10 ) )  0.95 (11)

1
Comparando las Expresiones (10) y (11) concluimos que Fi(10 ,6 )  , lo que señala
Fd( 6 ,10 )
que el valor buscado es el recíproco del valor encontrado en la tabla.

1
En el ejemplo: Fi(10 ,6 )  0.31 
3.22

Figura 10
Valor F6 ,10 para el 95%

249
Figura 11
Valor F10 ,6 para el 5%

Resumen de los pasos a seguir para obtener valores izquierdos

a- Invertir los grados de libertad.


b- Considerar el complemento de la probabilidad buscada.
c- Invertir el valor de F encontrado en la tabla.

Actividad 24:
Sea F una variable aleatoria con distribución "F de Snedecor" encontrar el valor
de F* de acuerdo a los siguientes datos:

a- Pr ( F  F*m,n) = 0.975 donde: m = 6, n = 15


b- Pr ( F  F*m,n) = 0.99 donde: m = 12, n = 5
c- Pr ( F  F*m,n) = 0.05 donde: m = 30, n = 20

Actividad 25:
Sea una variable X que se distribuye "F de Snedecor" con 20 y 8 grados de
libertad, en el numerador y el denominador respectivamente, se pide encontrar
las siguientes probabilidades:

a- P ( X  3.15)
b- P ( X  5.36)
c- P ( X  0)
d- P ( 0  X  3.15)
1
e- P(  X  5.36 )
2.91

Actividad 26:
Sea F una variable aleatoria con distribución "F de Snedecor" con 9 y 7 grados
de libertad en el numerador y denominador respectivamente, encontrar los
valores críticos entre los que se encuentra el 95% de los valores de la variable.

Actividad 27:
Se tomó una muestra de empresas que tienen determinadas características
para comparar la variabilidad en la producción con dos máquinas distintas. Se
aplicó para ello el estadístico f() que tiene una distribución "F de Snedecor"
con 12 y 15 grados de libertad en el numerador y denominador respectiva-
mente. Con base a esta información se pide:

a- ¿Cuál es la probabilidad que el estadístico sea menor que 2.96?


b- ¿Cuál es la probabilidad que el estadístico sea menor a 1/ 3.18?

250
c- ¿Cuánto debe ser el valor del estadístico para que la probabilidad de
superarlo sea del 0.05?
d- ¿Cuánto debe ser el valor del estadístico para que la probabilidad de
superarlo sea del 0.9?

Aplicaciones de la Distribución F de Snedecor

Toda vez que se necesite comparar dos sumas de cuadrados independientes se deberá
construir un estadístico F. Por ejemplo, si se trata de la variable estatura y queremos
comparar las varianzas de la variable según el sexo. Retomando la Actividad 21,
supongamos que se extrae una muestra de alumnas de tamaño n1 y otra muestra de
alumnos de tamaño n2 , podemos construir el estadístico Chí-Cuadrado para los datos
de cada muestra y Expresarlo según (8):

(n1  1)S12 (n2  1)S22


U   n2 1 V   n2 1
 12 1
 22 2

A partir de dos variables Chí-Cuadrado, armamos un estadístico F efectuando el


cociente de las mismas:

(n1  1)S12
 12
n1  1 S2  2
Fn1 1,n2 1   12 22
2
(n2  1)S2 S2  1
 22
n2  1

Hemos arribado a una expresión que multiplica el cociente de varianzas muestrales por
el cociente de varianzas poblacionales. Si es razonable suponer que las varianzas de
las estaturas en los dos grupos son iguales, la F resulta igual al cociente de las
varianzas muestrales.

La variable F es el estadístico que se usa en numerosos modelos estadísticos, entre


ellos, el Análisis de Varianza y el Modelo de Regresión que se verán en Estadística II.

7
.
3
.D
i
st
r
i
bu
c
i
ón
t
-d
e
St
u
de
n
t

En la Sección 3 vimos que la media muestral proveniente de una muestra extraída de


2
una población normal, tiene esa distribución con media  y varianza . Estandari-
n
zando la variable se arriba a:

X 
Z  N( 0 ,1) (12)

n

Como se advierte, para trabajar con la normal se requiere conocer la varianza


poblacional. Este supuesto rara vez se cumple en la práctica y la pregunta que surge
es la siguiente: si se reemplaza la desviación estandar poblacional por la muestral, ¿el
estadístico resultante sigue siendo normal?. La respuesta es no, ya que el estadístico
tiene distribución t de Student:

X 
tn 1 (13)
S
n

251
Formalmente, una variable t se define como un cociente entre una variable Y con
distribución Normal (0,1) y la raíz cuadrada de una variable U con distribución Chí-
Cuadrado, dividida por sus grados de libertad, siendo Y y U estadísticamente
independientes. La t resultante tiene asociados los grados de libertad de la Chí-
cuadrado.

Y N(0,1) U 2 Y ,U son independientes


Y
t 
U

Para arribar a (13), la variable Normal estandarizada del numerador es la Z de la


Expresión (12) y la Chí-Cuadrado es la dada en (8), con n-1 grados de libertad2/:

X 

n X 
tn 1 
(n  1)S 2 S
 2 n
n 1

Características de la distribución t de Student

La distribución t es simétrica con media cero y de forma muy similar a la normal. De


hecho, a medida que aumentan los grados de libertad, su densidad se aproxima cada
vez más a la curva de la normal (0,1).

a- Es una variable continua que asume valores entre - a  .


b- Su esperanza es igual cero y su varianza es mayor que uno, ya que es igual a los
grados de libertad divididos por ese valor menos 2.


E(t )  0 V(t ) 
 2

c- Al igual que la normal, es simétrica con respecto a cero.


d- Hay una distribución t para cada valor de los grados de libertad.

Uso de la Tabla de la t (Tabla 9)

Como se trata de una curva simétrica, para buscar probabilidades trabajaremos con el
mismo procedimiento que usamos en la normal. En la primera columna se indican los
grados de libertad (denotados con la letra griega  ), mientras que en la primera fila
aparecen los valores de las probabilidades acumuladas, sólo para la cola derecha de la
distribución. En el cuerpo de la tabla encontramos los valores de la variable que, para
determinados grados de libertad acumulan esos valores de probabilidad.

Por ejemplo, si se trata de una t con 10 grados libertad, encontramos que el valor
1.812 acumula el 95% de probabilidad.

Pr(t10  1.812)  0.95

2/
Se puede demostrar que si la población es normal, la media y la varianza muestral son estadís-
ticamente independientes. Ver Mood y Graybill (1978)
252
Distribución t de Student

Si queremos obtener cuál es el valor que acumula el 99%, debemos desplazarnos


hacia esa columna y obtenemos:

* *
Pr(t10  t10 )  0.99 t10 = 2.764

Al igual que en la normal, el cálculo de probabilidades para valores negativos se


resuelve en virtud de la simetría de la curva. Así:

Pr(t10  1.812)  1  Pr(t10  1.812)  1  0.95  0.05

Actividad 28:
Si la variable t tiene una distribución "t de Student" con 15 grados de libertad,
se pide encontrar las siguientes probabilidades:

a- P (t  1.341)
b- P (t  2.131)
c- P (t  2.602)
d- P (t  2.947)
e- P (t  - 2.602)
f- P (- 1.341  t  1.341)
g- P (| t |  2.947)
h- P (| t |  1.341)

Actividad 29:
Si se toman muestras de poblaciones normales con media  y varianza
desconocida; se define entonces el estadístico "t de Student" que se distribuye
t con (n-1) grados de libertad. Se pide: considerar los distintos tamaños de
muestra que se exponen a continuación y encontrar la probabilidad que se
indica para cada caso:

a- n=6 Pr (- 2.015  t  2.015)


b- n = 19 Pr (- 1.734  t  1.734)
c- n = 36 Pr (- 1.69  t  1.69)
d- n = 51 Pr (- 1.676  t  1.676)
e- n = 101 Pr (- 1.66  t  1.66)
f- n = 1001 Pr (- 1.646  t  1.646)
g- Con base a los incisos anteriores extraer conclusiones (use ayuda gráfica,
puede ser útil).

253
Actividad 30:
El estadístico k con distribución "t de Student" con 20 grados de libertad se
utiliza para medir la capacidad que tiene el precio de un bien sustituto para
explicar los cambios en la demanda. Si k toma valores dentro del intervalo
"t* =  1.725" se confirma que el precio tiene capacidad para explicar los
cambios en la demanda. Se pide: ¿Cuál es la probabilidad que el precio no
tenga dicha capacidad?

254

También podría gustarte