Está en la página 1de 25

La Distribución T de Student

Mayra Sáenz
FICB Universidad Central
Los conceptos básicos de estimación
estadística de muestras grandes se apoyan en
el teorema del límite central para justificar la
normalidad de los estimadores y estadísticas
de prueba, aplican sólo cuando las
muestras son grandes.

Cuando trabajamos con muestras pequeñas,


requerimos pruebas e intervalos de confianza
especializados para las medias y varianzas
poblacionales.

Estas técnicas de muestra pequeña requieren


que las poblaciones muestreadas sean
normales o que aproximadamente lo sean.
Distribución t de Student
¿cómo hacer inferencias sobre un parámetro poblacional, si se tiene una muestra
pequeña?

Recordemos de la distribución muestral de la media muestral:

• Cuando la población original muestreada sea normal, 𝑥̅ 𝑦 𝑧 = (𝑥̅ − µ)/(𝜎⁄ 𝑛) tienen


distribución normal, para cualquier tamaño muestral

• Cuando la población muestreada no es normal, 𝑥̅ 𝑦 𝑧 = (𝑥̅ − µ)/(𝜎⁄ 𝑛) tienen


distribuciones aproximadamente iguales, si el tamaño muestral es grande.
Distribución t de Student
!"#
Sin embargo, cuando n es pequeño (n < 30), el estadístico %⁄ &
no tiene una distribución normal.

Solución:

𝑥̅ − 𝜇
𝑡=
𝑠⁄ 𝑛

Características:

§ Tiene forma de montículo y es simétrica alrededor de t=0, igual que z

§ Es más variable que z, con “colas más pesadas”, esto es, la curva t no aproxima al eje horizontal con la misma rapidez

que z. Esto es porque el estadístico t abarca dos cantidades aleatorias, 𝑥̅ y s, en tanto que el estadístico z tiene sólo
la media muestral.
Distribución t de Student
Características (Cont.):

La forma de la distribución t depende del tamaño muestral n. a medida que n aumenta, la variabilidad de t disminuye
porque la estimación s de 𝜎 está basada en más y más información. En última instancia, cuando n sea infinitamente
grande, las distribuciones t y z son idénticas.
Distribución t de Student

• El divisor (n-1) en la fórmula para la varianza muestral, s2, se denomina el número de


grados de libertad (df) asociados con s2. Determina la forma de la distribución t.
Distribución t de Student

La tabla de probabilidades para la


distribución z normal estándar ya no es
útil para calcular valores críticos. En lugar
de ello, se usará la tabla 4 del apéndice I.
Al indizar un número particular de grados
de libertad, la tabla registra t𝛼, un valor de
t que tiene área 𝛼 de cola a su derecha
Distribución t de Student
Ejemplo
Para una distribución t con 5 grados de
libertad, el valor de t que tiene área .05 a su
derecha se encuentra en la fila 5 en la
columna marcada t.050. Para esta
distribución t particular, el área a la derecha
de t = 2.015 es .05; sólo 5% de todos los
valores de la estadística t rebasarán este
valor.

Realice el ejercicio 10.1de la página 397


Supuestos de la Distribución t de Student

Los valores críticos de t permiten hacer inferencias confiables sólo si el experimentador sigue
todas las reglas; esto es, su muestra debe satisfacer estos requisitos especificados por la
distribución t:

• La muestra debe ser seleccionada al azar.


• La población de la que se haga muestreo debe estar normalmente distribuida.
Supuestos de la Distribución t de Student
• La forma de la distribución t no se ¿Cómo saber si la muestra proviene de
afecta mucho mientras la población una población normal?
muestreada tenga una distribución • Gráfica de tallo y hojas
aproximadamente en forma de • Gráfica de puntos
montículo.

• El estadístico t es robusto: la
distribución de la estadística no
cambia de manera significativa cuando
se viola el supuesto de normalidad.
Distribución t de Student
Ejemplo
Supongamos que usted tiene una muestra de tamaño n = 10 de una distribución normal. Encuentre un
valor de t tal que sólo 1% de todos los valores de t sea más pequeño.

• Los grados de libertad que especifican


la distribución t son df = n – 1 = 9, y el
valor t necesario debe estar en la parte
inferior de la distribución, con área 0.01
a su izquierda.
• Como la distribución t es simétrica
alrededor de 0, este valor es
simplemente el negativo del valor en el
lado derecho con área .01 a su derecha,
o –t0.01 = - 2.821
El Intervalo de Confianza para la Media Poblacional

Donde, s/√n es el error estándar estimado del promedio muestral (ó error


estándar de la media)
Distribución Chi Cuadrado
Inferencias sobre la varianza poblacional
En ocasiones, el objetivo principal en una investigación experimental puede ser la varianza
poblacional, 𝜎2:
• Los instrumentos de mediciones científicas deben dar lecturas no sesgadas con un muy
pequeño error de medición: Un altímetro de un avión que mida la altitud correcta en
promedio es inútil si las mediciones tienen un error de hasta 1000 pies por encima o por
debajo de la altitud correcta.

• Las pruebas de aptitud deben estar diseñadas de manera que las calificaciones exhibirán
una cantidad razonable de variabilidad: Un examen de 800 puntos no es muy
discriminatorio, si todos los estudiantes obtienen calificaciones entre 601 y 605.
Inferencias sobre la varianza poblacional
∑($! %$)̅ "
Habíamos usado a 𝑠 ! = (%)
como estimador insesgado de 𝜎2 :

Es decir, en un muestreo repetido, el promedio de todas las estimaciones


muestrales será igual al parámetro objetivo, 𝜎2.

¿Qué tan cercano o lejano es probable que esté el estimador, 𝑠 ! , de su


objetivo?
La distribución chi-cuadrada
La estadística estandarizada

(𝑛 − 1)𝑠 (
𝑋( =
𝜎(

Recibe el nombre de variable chi (ji) cuadrada y tiene una distribución de muestreo llamada distribución de
probabilidad chi (ji) cuadrada, con n - 1 grados de libertad.
La distribución chi-cuadrada
• La distribución de chi-cuadrada es una distribución continua que se especifica por los
grados de libertad y el parámetro de no centralidad. La distribución es positivamente
asimétrica, pero la asimetría disminuye al aumentar los grados de libertad.
• Tiene dos usos principales:
• Pruebas de bondad de ajuste: Comprobar que tan bien se ajusta una muestra a una distribución teórica. P.
Ej., si unos datos se ajustan a una distribución de Poisson
• Pruebas de independencia de variables categóricas. P.Ej., un fabricante desea saber si la ocurrencia de
cuatro tipos de defectos en unas máquinas de producción está relacionada con los turnos
La distribución chi-cuadrada
• Cuando los grados de libertas son 30 o
más, la distribución Chi cuadrada puede
aproximarse a una distribución normal
Distribución muestral de la varianza
Si se extrae una muestra aleatoria de tamaño n de una población normal con media µ y varianza σ2,
y se calcula la varianza muestral, se obtiene el valor del estadístico s2 que se utilizará para conocer
la σ2, mediante una variable aleatoria chi cuadrada con “n-1” grados de libertad.
Formalizando:
Si s2es la varianza de una muestra aleatoria de tamaño “n” que se toma de una población normal
que tiene varianza σ2, entonces el estadístico:

!
(𝑛 − 1)𝑠 !
𝑥 =
𝜎!
Tiene una distribución chi cuadrado con v-n-1 grados de libertad
Distribución muestral de la varianza: Ejemplo
Un fabricante de baterías garantiza que su producto dura en promedio 2,5 años con una desviación estándar de
0,8 años. Se toma una muestra aleatoria de 8 baterías y se obtiene que 𝑥̅ = 2,8 𝑦 𝑠 = 1,2. Tiene razón el
fabricante respecto a la desviación estándar poblacional?

Solución:

1. Calculamos el estadístico: 𝑥 ! = (#$%)'


! )$% (%,!)!
! = ! = 15,75
( (%,))
2. Si se asume un 95% de confianza, usaremos la distribución Chi cuadrado con v = 8-1=7 g.l. Los valores
críticos serán:

Como el estadístico está dentro de estos valores, se puede afirmar, con un 95% de
confianza que el fabricante tiene la razón 20
Distribución F
Distribución F
• La distribución F es una distribución continua de muestreo de la relación de dos variables
aleatorias independientes con distribuciones de chi-cuadrada, cada una dividida entre sus grados
de libertad. La distribución F es asimétrica hacia la derecha y es descrita por los grados de libertad
de su numerador (ν1) y denominador (ν2).
• El efecto en la forma de la distribución de diferente número de grados de libertad:
Distribución F
• Utilice la distribución F cuando se quiera
probar la relación de dos variables que
tienen una distribución de chi-cuadrada
cada una.
• Por ejemplo:
• Análisis de varianza
• Pruebas de hipótesis para determinar
si dos varianzas de población son
iguales.
Ejercicio Verifique los siguientes enunciados:
a. El valor de F con área .05 a su derecha para df1 = 6 y df2 = 9 es 3.37.

b. El valor de F con área .05 a su derecha para df1 = 5 y df2 = 10 es 3.33.

c. El valor de F con área .01 a su derecha para df1 = 6 y df2 = 9 es 5.80.

También podría gustarte