Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Clase7 PDF
Clase7 PDF
O lo que es lo mismo:
La relacin entre la cerveza y los estudios de estadstica
La distribucin t de student fue descubierta por William S. Gosset en 1908.
Gosset era un estadstico empleado por la compaa de cerveza Guinness con
quien tena un contrato que estipulaba que no poda usar su nombre en sus
publicaciones. l recurri al sobrenombre de Student que es como ahora
conocemos el tipo de estadstica que desarroll.
Curva de Distribucin
Sin embargo, otra T de Student
diferencia en su uso
df
0.4
2
5
es el empleo de una o 10
15
t en lugar de la tabla 30
Densidad
50
100
para valor Z. 0.2
0.1
0.0
-3 -2 -1 0 1 2 3
X
Para derivar la ecuacin de esta distribucin, Gosset supuso que las
muestras se seleccionan de una poblacin normal. Aunque esto parecera
una suposicin muy restrictiva, se puede mostrar que las poblaciones no
normales que poseen distribuciones en forma casi de campana tambin
proporcionan valores de t que se aproximan muy de cerca a esta
distribucin.
Curva de Distribucin
T de Student
df
0.4
2
5
10
15
0.3 20
25
30
Densidad
50
100
0.2
0.1
0.0
-3 -2 -1 0 1 2 3
X
Otra diferencia con la distribucin normal, es que la forma de la distribucin t
de student depende de un parmetro llamado el nmero de grados de libertad.
libertad
El nmero de grados de libertad es igual al tamao de la muestra (nmero de
observaciones independientes) menos 1.
gl = df= n 1
df 0.4
0.4
2
5
10
15
0.3 20 0.3
25
30
Densidad
Densidad
50
100
0.2 0.2
0.1 0.1
0.0 0.0
-6 -4 -2 0 2 4 6 -6 -4 -2 0 2 4 6
X X
Las curvas muestran la forma que puede tomar la distribucin t de student la
cual depende del nmero de grados de libertad.
libertad Como se puede apreciar se
parece mucho a la distribucin normal. Incluso, para un nmero grande de
grados de libertad (es decir de nmero de datos en la muestra) las dos
distribuciones son iguales.
iguales
Curva de Distribucin
T de Student
0.4 df
2
100 grados de libertad
5
10
15
0.3 20
25
30
Densidad
50
0.2
100
2 grados de libertad
0.1
0.0
-3 -2 -1 0 1 2 3
X
n
( xi x ) 2
s 2
=
n 1
Esta frmula puede verse como un promedio de las distancias a la media sobre
n-1 datos .
La terminologa de grados de libertad resulta del hecho de que si bien s2
considera n cantidades, slo n 1 de ellas pueden determinarse libremente.
Por ejemplo, si tenemos 4 datos (n = 4) entonces tenemos cuatro diferencias:
xi x
Pero sabemos que la suma de ellas es = 0, por lo que si conocemos, por ejemplo:
x1 x = 4, x2 x = 2, x4 x = 3 4-2+ 3 = 5
entonces, la ltima diferencia queda definida porque 55 = 0
por lo tanto x3 x = 5
Lo que indica que slo 3 de las diferencias (n 1= 4 1 = 3) son libres y la
otra queda definida por las dems.
La distribucin t de student tiene las siguientes propiedades:
La media de la distribucin es igual a 0
df
La varianza es igual a donde df (se usa tambin ) es el nmero
df 2
de grados de libertad
La varianza es siempre mayor que 1, aunque es muy cercana a 1 cuando se
tiene un nmero de grados de libertad grande.
Con infinitos grados de libertad la distribucin t es igual a la normal.
Curva de Distribucin
T de Student
df
0.4
2
5
10
15
0.3 df 20
s= 25
df 2 30
Densidad
50
100
0.2
0.1
0.0
-2 -1 0 1 2
X
La distribucin t de student se puede usar cuando cualquiera de las siguientes
condiciones se cumplen:
Solucin
El resultado nos da: 0.2257. Esto significa que si la verdadera vida de un foco es de
300 das, hay una probabilidad de 22.6% de que la vida promedio de 15 focos
seleccionados al azar sea menor o igual a 290 das y nosotros ha sabramos a qu
atenernos si queremos poner en ridculo al Presidente o Jefe.
Distribucin t
14 grados de libertad
0.4
0.3
Densidad
0.2
0.1
0.226
0.0
-0.7746 0
X
Ejemplo 2
Supongamos que las calificaciones de una prueba estn distribudos normalmente
con una media de 100. Ahora supongamos que seleccionamos 20 estudiantes y les
hacemos un exmen. La desviacin estndar de la muestra es de 15. Cul es la
probabilidad de que el promedio en el grupo de muestra sea cuando ms 110?
Cul es la probabilidad de que el promedio en el grupo de muestra sea ms 110?
Solucin:
Primero calculamos el valor t como en el caso anterior ya sea en tablas o con ayuda
de herramientas tipo Minitab, Excel, etc. Nuestros datos son:
Nmero de grados de libertad: n-1 = 20 -1 = 19
La media de la poblacin es igual a 100
La media de la muestra es igual a 110
La desviacin estndar de la muestra es igual a 15
El valor t es 110 100
t= = 2.9814
15
20
Usando estos valores nos da un resultado de probabilidad acumulada de 0.00496.
Esto implica que hay una probabilidad de 0.45% de que el promedio en una muestra
sea mayor de 110.
Veamos el resultado grficamente
Distribucin t
14 grados de libertad
0.4
0.3
Densidad
0.2
0.1
0.00496
0.0
0 2.9814
X
Ejemplo 3:
Un ingeniero qumico afirma que el rendimiento medio de cierto proceso en lotes es
500 gramos por milmetro de materia prima. Para verificar esta afirmacin toma una
muestra de 25 lotes cada mes.
Si el valor de t calculado cae entre t0.05 y t0.05, aceptara su afirmacin (con 90% de
confianza). Qu conclusin extraera de una muestra que tiene una media de 518
gramos por milmetro y una desviacin estndar de 40 gramos? Suponga que la
distribucin de rendimientos es aproximadamente normal.
Solucin:
De la tabla encontramos que t0.05 para 24 grados de libertad es 1.711. Por tanto, el
fabricante queda satisfecho con esta afirmacin si una muestra de 25 lotes rinde un
valor t entre 1.711 y 1.711.
518 500
Se procede a calcular el valor de t: t= = 2.25
40
25
Este es un valor muy por arriba de 1.711, por lo que el fabricante dira que no es cierta
la afirmacin. Sin embargo, si se encuentra la probabilidad de obtener un valor de t
con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es
aproximadamente de 0.02. De aqu que es probable que el fabricante concluya que el
proceso produce un mejor rendimiento de producto que el que supona.
Distribucin de probabilidad para t de student
90% del rea
-1.711 1.711
El valor de
t = 2.25 cae
en esta zona
de la
distribucin