Está en la página 1de 15

DISTRIBUCIÓN T DE STUDENT Y DISTRIBUCIÓN

MUESTRAL DEL COCIENTE DE VARIANZAS

Estadística Inferencial
Pedagogía en Física y Matemática – Pedagogía en Matemática
Profesora: L.Núñez
Distribución t de Student
• Cuando los datos (los valores en la muestra) se utilizan para calcular la media, hay 1 grado
de libertad menos en la información que se utiliza para estimar la varianza poblacional 𝜎 2 .
• El uso del TLC y la distribución normal es ciertamente útil en aplicaciones que giran
alrededor de las inferencias sobre la media de la población o la diferencia entre dos
medias de población. Sin embargo se supuso que la desviación estándar de la población
se conoce. Esta suposición puede ser racional en situaciones donde el científico o
pedagogo está bastante familiarizado con el comportamiento histórico de la variable.
• Sin embargo, en muchos escenarios experimentales el conocimiento de 𝜎 no es más
razonable que el conocimiento de la media 𝜇 de la población. Frecuentemente, de hecho,
una estimación de 𝜎 la debe proporcionar la misma información muestral que produce la
media muestral. Como consecuencia, una estadística natural a considerar para tratar con
las inferencias sobre 𝜇 es
𝑥−𝜇
𝑇= 𝑠
𝑛
Observaciones
1. Como 𝑠 es el análogo de la muestra para 𝜎.
Si el tamaño de la muestra es pequeño, los
valores de 𝑠 2 fluctúan de forma
considerable de una muestra a otra y la
distribución de 𝑇 se desvía de forma
apreciable de la de una distribución normal
estándar.
2. Si el tamaño de la muestra es
suficientemente grande, digamos 𝑛 ≥ 30,
la distribución de 𝑇 no difiere de manera
considerable de la normal estándar. Sin
embargo, para 𝑛 < 30, es útil tratar con la
distribución exacta de 𝑇.
3. Para desarrollar la distribución muestral de
𝑇 supondremos que la muestra aleatoria se
selecciona de una población normal.
• Luego
𝑋−𝜇
𝜎
𝑋−𝜇 𝑛 𝑍
𝑇= = =
𝑆 𝑆2 𝑉(𝑛 − 1)
𝑛 𝜎2
Donde
𝑋−𝜇 𝑛 − 1 𝑆2 2
𝑍 = 𝜎 ~ 𝑁 𝜇 = 0, 𝜎 = 1 𝑉= ~ 𝜒𝑛−1
𝜎2
𝑛
Se puede demostrar que 𝑋 y 𝑆 2 son independientes, luego 𝑍 y 𝑉 también lo son.
Teorema. Sea 𝑍 una v.a. normal estándar y 𝑉 una v.a. chi cuadrado con 𝜐 grados de libertad.
Si 𝑍 y 𝑉 son independientes, entonces la distribución de la v.a.
𝑍
𝑇=
𝑉/𝜐
Esta dada por
𝜐+1 𝜐+1

Γ 𝑡 2 2
𝑓 𝑡, 𝜐 = 𝜐 2 1+ , ∞<𝑡<∞
Γ 𝜋𝜐 𝜐
2
Conocida como distribución t (de Student) con 𝜐 grados de libertad.

Corolario. Sean 𝑋1 , 𝑋2 , … , 𝑋𝑛 variables aleatorias independientes que son normales ce


media 𝜇 y desviación estándar 𝜎. Entonces la v.a.
𝑋−𝜇
𝑇= ~ 𝑡𝑛−1
𝑆
𝑛
• La distribución de T es similar a la distribución de Z, pues ambas son simétricas alrededor
de una media de cero. Ambas distribuciones tiene forma de campana, pero la distribución
t es más variable, debido al hecho de que los valores de T dependen de las fluctuaciones
de dos cantidades,𝑋 y 𝑆 2 , mientras que los valores Z dependen solamente de los cambios
de entre una muestra y otra.
• La distribución de T difiere de la distribución de Z en que la varianza de T depende del
tamaño de la muestra 𝑛 y siempre es mayor que 1. Únicamente cuando el tamaño de la
muestra 𝑛 ⟶ ∞, las dos distribuciones serán la misma.
En la tabla de valores de T, se tiene los valores de T tales que
𝑃 𝑇 > 𝑡𝛼 = 𝛼
Y como la distribución de T es simétrica se tiene
𝑃 𝑇 < −𝑡𝛼 = 𝛼

Es decir si se quiere determinar el valor de T con 10 grados de libertad que deja un área de
0,01 a la izquierda de él, se debe ubicar el valor de T con 10 grados de libertad que deja 0,01
de probabilidad a la derecha de él. El reciproco de este valor es el valor de T buscado.
En este caso

𝑃 𝑇 < −2,764 = 0,01


Ejemplos de aplicación
1. Determinar el valor de T con 14 grados de libertad que deja un
área de 0,025 a la izquierda y por tanto un área de 0,975 a la
derecha.
2. Determinar 𝑃(−𝑡0,025 < 𝑇 < 𝑡0,05 )
3. Calcular el valor de 𝑘 tal que 𝑃 𝑘 < 𝑇 < −1,761 = 0,045, para
una muestra aleatoria de tamaño 15 que se selecciona de una
población normal.
4. Un ingeniero químico afirma que el rendimiento medio de la
población de cierto proceso en lotes es 500 gramos por
milímetro de materia prima. Para verificar esta afirmación
muestrea 25 lotes cada mes. Si el valor t calculado cae entre
−𝑡0.05 y 𝑡0,05 queda satisfecho con su afirmación. ¿Qué
conclusión extraería de una muestra que tiene una media de 518
gramos por milímetro y una desviación estándar de 40 gramos?.
Supongamos que la distribución de rendimientos es
aproximadamente normal.
Distribución F

• La distribución F encuentra enorme aplicación en la comparación de las varianzas


muestrales. Las aplicaciones de la distribución F se encuentran en problemas que
involucran dos o más muestras.
• La estadística F se define como la razón de dos variables aleatorias chi cuadrado
independientes, dividida cada una entre su número de grados de libertad.

𝑈
𝜐1
𝐹= 𝑉
𝜐2

Donde 𝑈 y 𝑉 son variables aleatorias independientes que tiene distribuciones chi cuadrado
con 𝜐1 y 𝜐2 grados de libertad respectivamente.
Teorema. Sean 𝑈 y 𝑉 dos v.a. independientes que tienen distribuciones chi cuadrado con 𝜐1
y 𝜐2 grados de libertad, respectivamente. Entonces de la distribución de la v.a.
𝑈
𝜐
𝐹= 1
𝑉
𝜐2
Esta dada por

𝜐1 /2
𝜐 +𝜐 𝜐1
Γ 12 2 𝜐2 𝜐1
−(𝜐1 +𝜐2 )/2
𝑓 𝑥, 𝜐1 , 𝜐2 = 𝜐 𝜐2 𝑥 𝜐1 /2−1 1+ 𝑥 , 𝑥>0
Γ 1 Γ 𝜐2
2 2

Conocida como distribución F (de Fisher) con 𝜐1 y 𝜐2 grados de libertad.


Observaciones
• La curva de la distribución F depende no solo de los parámetros 𝜐1 y 𝜐2 sino también del
orden en el que se establecen. Una vez dados estos valores, se puede identificar la curva.

Sea 𝑓𝛼 por arriba del cual encontramos un


área igual a 𝛼 (ver la Tabla de la
distribución F para 𝛼 = 0.05 y 𝛼 = 0.01).
De aquí, el valor de f con 6 y 10 grados de
libertad, que deja un área de 0.05 a la
derecha, es 𝑓0.05 = 3.22. Por medio del
siguiente Teorema estas Tablas también se
pueden utilizar para encontrar valores de
𝑓0.95 y 𝑓0.99 .
Teorema. Al escribir 𝑓𝛼 𝜐1 , 𝜐2 para 𝑓𝛼 con 𝜐1 y 𝜐2 grados de libertad, se obtiene
1
𝑓1−𝛼 𝜐1 , 𝜐2 =
𝑓𝛼 𝜐2 , 𝜐1

• Así el valor de f con 6 y 10 grados de libertad, que deja un área de 0,95 a la derecha, es
1 1
𝑓0,95 6,10 = = = 0,2463
𝑓0,05 10,6 4,06
• Si las muestras aleatorias de tamaño 𝑛1 y 𝑛2 se seleccionan de dos poblaciones normales
con desviaciones estándar 𝜎1 y 𝜎2 , respectivamente. De la distribución muestral de la
varianza se tiene que
2 2
(𝑛1 − 1)𝑠1 (𝑛 2 − 1)𝑠2
𝜒12 = y 𝜒2
2
=
𝜎12 𝜎22
Son variables aleatorias que tienen distribuciones chi-cuadrado con 𝜐1 = 𝑛1 − 1 y 𝜐2 =
𝑛2 − 1 grados de libertad. Además como las muestras se seleccionan al azar, se trata de
variables aleatorias independientes, luego por el Teorema anterior y 𝜒12 = 𝑈 y 𝜒22 =
𝑉obtenemos el siguiente resultado
Teorema. Si 𝑆1 y 𝑆2 son las desviaciones estándar de muestras independientes de tamaños
𝑛1 y 𝑛2 tomadas de poblaciones normales con desviaciones estándar 𝜎1 y 𝜎2 ,
respectivamente, entonces
𝑆12
𝜎12 𝜎22 𝑆12
𝐹= 2 = 2 2
𝑆2 𝜎1 𝑆2
𝜎22
Tiene una distribución F con 𝜐1 = 𝑛1 − 1 y 𝜐2 = 𝑛2 − 1 grados de libertad.

Observaciones
• La distribución F se utiliza en situaciones de dos muestras para extraer inferencias acerca
de las varianzas poblacionales. Esto implica la aplicación del Teorema anterior. Sin
embargo, la distribución F se aplica a muchos otros tipos de problemas en los que las
varianzas muestrales están involucradas.
• De hecho, la distribución F se llama distribución de razón de varianzas.
Ejemplo de aplicación. Se está
comparando la variabilidad de los Índice
Biológico de Diatomeas (I.B.D) de dos ríos
A y B, que suponemos siguen
distribuciones normales. Se realizan 16
mediciones en el río A y se obtiene una
cuasi-varianza de 9.52, y 18 mediciones
en el río B y se obtiene una cuasi-varianza
de 7. Obtener la probabilidad de que la
varianza en el río A sea como mínimo el
doble de la varianza en el río B.
Ejercicios de aplicación
1. El equipo de soporte técnico de una compañía aseguradora está en un proceso de
reemplazo de 22 unidades antiguas de computadoras por igual número de última
generación. El tiempo de instalación de las 22 nuevas máquinas para que operen a nivel
satisfactorio tiene una desviación estándar de 3.90 horas. El equipo, por trabajos
previos, manifiesta que el tiempo de instalación promedio antes de operar
satisfactoriamente es de 8.1 horas. Para el conjunto de las nuevas máquinas, ¿cuál es la
probabilidad de que el tiempo promedio de instalación sea menor a 7 horas?

2. Ejercicio de aplicación. Si 𝑆12 y 𝑆22 representan las varianzas de muestran aleatorias


independientes de tamaño 𝑛1 = 25 y 𝑛2 = 31, tomadas de poblaciones normales con
𝑆12
varianzas 𝜎12 = 10 y 𝜎22 = 15 respectivamente determine 𝑃 > 1.72
𝑆22

También podría gustarte