Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Inferencial
Pedagogía en Física y Matemática – Pedagogía en Matemática
Profesora: L.Núñez
Distribución t de Student
• Cuando los datos (los valores en la muestra) se utilizan para calcular la media, hay 1 grado
de libertad menos en la información que se utiliza para estimar la varianza poblacional 𝜎 2 .
• El uso del TLC y la distribución normal es ciertamente útil en aplicaciones que giran
alrededor de las inferencias sobre la media de la población o la diferencia entre dos
medias de población. Sin embargo se supuso que la desviación estándar de la población
se conoce. Esta suposición puede ser racional en situaciones donde el científico o
pedagogo está bastante familiarizado con el comportamiento histórico de la variable.
• Sin embargo, en muchos escenarios experimentales el conocimiento de 𝜎 no es más
razonable que el conocimiento de la media 𝜇 de la población. Frecuentemente, de hecho,
una estimación de 𝜎 la debe proporcionar la misma información muestral que produce la
media muestral. Como consecuencia, una estadística natural a considerar para tratar con
las inferencias sobre 𝜇 es
𝑥−𝜇
𝑇= 𝑠
𝑛
Observaciones
1. Como 𝑠 es el análogo de la muestra para 𝜎.
Si el tamaño de la muestra es pequeño, los
valores de 𝑠 2 fluctúan de forma
considerable de una muestra a otra y la
distribución de 𝑇 se desvía de forma
apreciable de la de una distribución normal
estándar.
2. Si el tamaño de la muestra es
suficientemente grande, digamos 𝑛 ≥ 30,
la distribución de 𝑇 no difiere de manera
considerable de la normal estándar. Sin
embargo, para 𝑛 < 30, es útil tratar con la
distribución exacta de 𝑇.
3. Para desarrollar la distribución muestral de
𝑇 supondremos que la muestra aleatoria se
selecciona de una población normal.
• Luego
𝑋−𝜇
𝜎
𝑋−𝜇 𝑛 𝑍
𝑇= = =
𝑆 𝑆2 𝑉(𝑛 − 1)
𝑛 𝜎2
Donde
𝑋−𝜇 𝑛 − 1 𝑆2 2
𝑍 = 𝜎 ~ 𝑁 𝜇 = 0, 𝜎 = 1 𝑉= ~ 𝜒𝑛−1
𝜎2
𝑛
Se puede demostrar que 𝑋 y 𝑆 2 son independientes, luego 𝑍 y 𝑉 también lo son.
Teorema. Sea 𝑍 una v.a. normal estándar y 𝑉 una v.a. chi cuadrado con 𝜐 grados de libertad.
Si 𝑍 y 𝑉 son independientes, entonces la distribución de la v.a.
𝑍
𝑇=
𝑉/𝜐
Esta dada por
𝜐+1 𝜐+1
−
Γ 𝑡 2 2
𝑓 𝑡, 𝜐 = 𝜐 2 1+ , ∞<𝑡<∞
Γ 𝜋𝜐 𝜐
2
Conocida como distribución t (de Student) con 𝜐 grados de libertad.
Es decir si se quiere determinar el valor de T con 10 grados de libertad que deja un área de
0,01 a la izquierda de él, se debe ubicar el valor de T con 10 grados de libertad que deja 0,01
de probabilidad a la derecha de él. El reciproco de este valor es el valor de T buscado.
En este caso
𝑈
𝜐1
𝐹= 𝑉
𝜐2
Donde 𝑈 y 𝑉 son variables aleatorias independientes que tiene distribuciones chi cuadrado
con 𝜐1 y 𝜐2 grados de libertad respectivamente.
Teorema. Sean 𝑈 y 𝑉 dos v.a. independientes que tienen distribuciones chi cuadrado con 𝜐1
y 𝜐2 grados de libertad, respectivamente. Entonces de la distribución de la v.a.
𝑈
𝜐
𝐹= 1
𝑉
𝜐2
Esta dada por
𝜐1 /2
𝜐 +𝜐 𝜐1
Γ 12 2 𝜐2 𝜐1
−(𝜐1 +𝜐2 )/2
𝑓 𝑥, 𝜐1 , 𝜐2 = 𝜐 𝜐2 𝑥 𝜐1 /2−1 1+ 𝑥 , 𝑥>0
Γ 1 Γ 𝜐2
2 2
• Así el valor de f con 6 y 10 grados de libertad, que deja un área de 0,95 a la derecha, es
1 1
𝑓0,95 6,10 = = = 0,2463
𝑓0,05 10,6 4,06
• Si las muestras aleatorias de tamaño 𝑛1 y 𝑛2 se seleccionan de dos poblaciones normales
con desviaciones estándar 𝜎1 y 𝜎2 , respectivamente. De la distribución muestral de la
varianza se tiene que
2 2
(𝑛1 − 1)𝑠1 (𝑛 2 − 1)𝑠2
𝜒12 = y 𝜒2
2
=
𝜎12 𝜎22
Son variables aleatorias que tienen distribuciones chi-cuadrado con 𝜐1 = 𝑛1 − 1 y 𝜐2 =
𝑛2 − 1 grados de libertad. Además como las muestras se seleccionan al azar, se trata de
variables aleatorias independientes, luego por el Teorema anterior y 𝜒12 = 𝑈 y 𝜒22 =
𝑉obtenemos el siguiente resultado
Teorema. Si 𝑆1 y 𝑆2 son las desviaciones estándar de muestras independientes de tamaños
𝑛1 y 𝑛2 tomadas de poblaciones normales con desviaciones estándar 𝜎1 y 𝜎2 ,
respectivamente, entonces
𝑆12
𝜎12 𝜎22 𝑆12
𝐹= 2 = 2 2
𝑆2 𝜎1 𝑆2
𝜎22
Tiene una distribución F con 𝜐1 = 𝑛1 − 1 y 𝜐2 = 𝑛2 − 1 grados de libertad.
Observaciones
• La distribución F se utiliza en situaciones de dos muestras para extraer inferencias acerca
de las varianzas poblacionales. Esto implica la aplicación del Teorema anterior. Sin
embargo, la distribución F se aplica a muchos otros tipos de problemas en los que las
varianzas muestrales están involucradas.
• De hecho, la distribución F se llama distribución de razón de varianzas.
Ejemplo de aplicación. Se está
comparando la variabilidad de los Índice
Biológico de Diatomeas (I.B.D) de dos ríos
A y B, que suponemos siguen
distribuciones normales. Se realizan 16
mediciones en el río A y se obtiene una
cuasi-varianza de 9.52, y 18 mediciones
en el río B y se obtiene una cuasi-varianza
de 7. Obtener la probabilidad de que la
varianza en el río A sea como mínimo el
doble de la varianza en el río B.
Ejercicios de aplicación
1. El equipo de soporte técnico de una compañía aseguradora está en un proceso de
reemplazo de 22 unidades antiguas de computadoras por igual número de última
generación. El tiempo de instalación de las 22 nuevas máquinas para que operen a nivel
satisfactorio tiene una desviación estándar de 3.90 horas. El equipo, por trabajos
previos, manifiesta que el tiempo de instalación promedio antes de operar
satisfactoriamente es de 8.1 horas. Para el conjunto de las nuevas máquinas, ¿cuál es la
probabilidad de que el tiempo promedio de instalación sea menor a 7 horas?