Está en la página 1de 12

Prueba t de Student

En estadstica, una prueba t de Student, prueba t-Student, o Test-T es cualquier prueba en la que el estadstico utilizado tiene
una distribucin t de Student si la hiptesis nula es cierta. Se aplica cuando la poblacin estudiada sigue una distribucin normal pero el
tamao muestral es demasiado pequeo como para que el estadstico en el que est basada la inferencia est normalmente distribuido,
utilizndose una estimacin de la desviacin tpica en lugar del valor real. Es utilizado en anlisis discriminante.
ndice
[ocultar]

1Historia

2Usos

3Estadsticos T y Z

4Pruebas t para dos muestras apareadas y desapareadas


o

4.1Desapareada

4.2Apareada

5Clculos
o

5.1Prueba t para muestra nica

5.2Pendiente de una regresin lineal

5.3Prueba t para dos muestras independientes

5.3.1Iguales tamaos muestrales, iguales varianzas

5.3.2Diferentes tamaos muestrales, iguales varianzas

5.3.3Diferentes tamaos muestrales, diferentes varianzas

5.4Prueba t dependiente para muestras apareadas


6Ejemplos desarrollados

6.1Varianzas desiguales

6.2Varianzas iguales

7Alternativas a la prueba t para problemas de locacin

8Pruebas multivariadas
o

8.1Prueba T 2 monomuestral

8.2Prueba T 2 bimuestral

9Implementaciones

10Lecturas adicionales

11Referencias

12Enlaces externos
o

12.1Calculadores en lnea

Historia[editar]
El estadstico t fue introducido por William Sealy Gosset en 1908, un qumico que trabajaba para la cervecera Guinness de Dubln. Student
era su seudnimo de escritor.1 2 3 Gosset haba sido contratado gracias a la poltica de Claude Guiness de reclutar a los mejores graduados
de Oxford y Cambridge, y con el objetivo de aplicar los nuevos avances en bioqumica y estadstica al proceso industrial de

Guiness.2 Gosset desarroll el test t como una forma sencilla de monitorizar la calidad de la famosa cerveza stout. Public su test en la
revista inglesa Biometrika en el ao 1908, pero fue forzado a utilizar un seudnimo por su empleador, para mantener en secreto los
procesos industriales que se estaban utilizando en la produccin. Aunque de hecho, la identidad de Gosset era conocida por varios de sus
compaeros estadsticos.4

Usos[editar]
Entre los usos ms frecuentes de las pruebas t se encuentran:

El test de locacin de muestra nica por el cual se comprueba si la media de una poblacin distribuida normalmente tiene un valor
especificado en una hiptesis nula.

El test de locacin para dos muestras, por el cual se comprueba si las medias de dos poblaciones distribuidas en forma normal son
iguales. Todos estos test son usualmente llamados test t de Student, a pesar de que estrictamente hablando, tal nombre slo debera
ser utilizado si las varianzas de las dos poblaciones estudiadas pueden ser asumidas como iguales; la forma de los ensayos que se
utilizan cuando esta asuncin se deja de lado suelen ser llamados a veces como Prueba t de Welch. Estas pruebas suelen ser
comnmente nombradas como pruebas t desapareadas o de muestras independientes, debido a que tienen su aplicacin ms tpica
cuando las unidades estadsticas que definen a ambas muestras que estn siendo comparadas no se superponen. 5

El test de hiptesis nula por el cual se demuestra que la diferencia entre dos respuestas medidas en las mismas unidades
estadsticas es cero. Por ejemplo, supngase que se mide el tamao del tumor de un paciente con cncer. Si el tratamiento resulta
efectivo, lo esperable sera que el tumor de muchos pacientes disminuyera de tamao luego de seguir el tratamiento. Esto con
frecuencia es referido como prueba t de mediciones apareadas o repetidas.5 6

El test para comprobar si la pendiente de una regresin lineal difiere estadsticamente de cero.

Estadsticos T y Z[editar]
La mayor parte de las pruebas estadsticas t tienen la forma , donde Z y s son funciones de los datos estudiados. Tpicamente, Z se disea
de forma tal que resulte sensible a la hiptesis alternativa (p.ej. que su magnitud tienda a ser mayor cuando la hiptesis alternativa es
verdadera), mientras que s es un parmetro de escala que permite que la distribucin de T pueda ser determinada.
Por ejemplo, en una prueba t de muestra nica, , donde es la media muestral de los datos, n es el tamao muestral, y es la desviacin
estndar de la poblacin de datos; s en una prueba de muestra nica es , donde es la desviacin estndar muestral.
Las asunciones subyacentes en una prueba t son:

Que Z sigue una distribucin normal bajo la hiptesis nula.

ps2 sigue una distribucin 2 con p grados de libertad bajo la hiptesis nula, y donde p es una constante positiva.

Z y s son estadsticamente independientes.

En una prueba t especfica, estas condiciones son consecuencias de la poblacin que est siendo estudiada, y de la forma en que los
datos han sido muestreados. Por ejemplo, en la prueba t de comparacin de medias de dos muestras independientes, deberamos realizar
las siguientes asunciones:

Cada una de las dos poblaciones que estn siendo comparadas sigue una distribucin normal. Esto puede ser demostrado
utilizando una prueba de normalidad, tales como una prueba Shapiro-Wilk o Kolmogrov-Smirnov, o puede ser determinado
grficamente por medio de un grfico de cuantiles normales Q-Q plot.

Si se est utilizando la definicin original de Student sobre su prueba t, las dos poblaciones a ser comparadas deben poseer las
mismas varianzas, (esto se puede comprobar utilizando una prueba F de igualdad de varianzas, una prueba de Levene, una prueba de
Bartlett, o una prueba de Brown-Forsythe, o estimarla grficamente por medio de un grfico Q-Q plot). Si los tamaos muestrales de
los dos grupos comparados son iguales, la prueba original de Student es altamente resistente a la presencia de varianzas
desiguales.7 la Prueba de Welch es insensible a la igualdad de las varianzas, independientemente de si los tamaos de muestra son
similares.

Los datos usados para llevar a cabo la prueba deben ser muestreados independientemente para cada una de las dos poblaciones
que se comparan. Esto en general no es posible determinarlo a partir de los datos, pero si se conoce que los datos han sido
muestreados de manera dependiente (por ejemplo si fueron muestreados por grupos), entonces la prueba t clsica que aqu se
analiza, puede conducir a resultados errneos.

Pruebas t para dos muestras apareadas y desapareadas[editar]


Las pruebas-t de dos muestras para probar la diferencia en las medias pueden ser desapareadas o en parejas. Las pruebas t pareadas
son una forma de bloqueo estadstico, y poseen un mayor poder estadstico que las pruebas no apareadas cuando las unidades apareadas
son similares con respecto a los "factores de ruido" que son independientes de la pertenencia a los dos grupos que se comparan [cita requerida].
En un contexto diferente, las pruebas-t apareadas pueden utilizarse para reducir los efectos de los factores de confusin en un estudio
observacional.

Desapareada[editar]

Las pruebas t desapareadas o de muestras independientes, se utilizan cuando se obtienen dos grupos de muestras aleatorias,
independientes e idnticamente distribuidas a partir de las dos poblaciones a ser comparadas. Por ejemplo, supngase que estamos
evaluando el efecto de un tratamiento mdico, y reclutamos a 100 sujetos para el estudio. Luego elegimos aleatoriamente 50 sujetos para
el grupo en tratamiento y 50 sujetos para el grupo de control. En este caso, obtenemos dos muestras independientes y podramos utilizar
la forma desapareada de la prueba t. La eleccin aleatoria no es esencial en este caso, si contactamos a 100 personas por telfono y
obtenemos la edad y gnero de cada una, y luego se utiliza una prueba t bimuestral para ver en que forma la media de edades difiere por
gnero, esto tambin sera una prueba t de muestras independientes, a pesar de que los datos son observacionales.

Apareada[editar]
Las pruebas t de muestras dependientes o apareadas, consisten tpicamente en una muestra de pares de valores con similares unidades
estadsticas, o un grupo de unidades que han sido evaluadas en dos ocasiones diferentes (una prueba t de mediciones repetitivas). Un
ejemplo tpico de prueba t para mediciones repetitivas sera por ejemplo que los sujetos sean evaluados antes y despus de un
tratamiento.
Una prueba 't basada en la coincidencia de pares muestrales se obtiene de una muestra desapareada que luego es utilizada para formar
una muestra apareada, utilizando para ello variables adicionales que fueron medidas conjuntamente con la variable de inters. 8
La valoracin de la coincidencia se lleva a cabo mediante la identificacin de pares de valores que consisten en una observacin de cada
una de las dos muestras, donde las observaciones del par son similares en trminos de otras variables medidas. Este enfoque se utiliza a
menudo en los estudios observacionales para reducir o eliminar los efectos de los factores de confusin.

Clculos[editar]
Las expresiones explcitas que pueden ser utilizadas para obtener varias pruebas t se dan a continuacin. En cada caso, se muestra la
frmula para una prueba estadstica que o bien siga exactamente o aproxime a una distribucin t de Student bajo la hiptesis nula.
Adems, se dan los apropiados grados de libertad en cada caso. Cada una de estas estadsticas se pueden utilizar para llevar a cabo ya
sea un prueba de una cola o prueba de dos colas.
Una vez que se ha determinado un valor t, es posible encontrar un valor p asociado utilizando para ello una tabla de valores de distribucin
t de Student. Si el valor p calulado es menor al lmite elegido por significancia estadstica (usualmente a niveles de significancia 0,10; 0,05
o 0,01), entonces la hiptesis nula se rechaza en favor de la hiptesis alternativa.

Prueba t para muestra nica[editar]


En esta prueba se evala la hiptesis nula de que la media de la poblacin estudiada es igual a un valor especificado 0, se hace uso del
estadstico:
donde es la media muestral, s es la desviacin estndar muestral y n es el tamao de la muestra. Los grados de libertad utilizados en esta
prueba se corresponden al valor n 1.

Pendiente de una regresin lineal[editar]


Supngase que se est ajustando el modelo:
donde xi, i = 1, ..., n son conocidos, y son desconocidos, y i es el error aleatorio en los residuales que se encuentra normalmente
distribuido, con un valor esperado 0 y una varianza desconocida 2, e Yi, i = 1, ..., n son las observaciones.
Se desea probar la hiptesis nula de que la pendiente es igual a algn valor especificado 0 (a menudo toma el valor 0, en cuyo caso la
hiptesis es que x e y no estn relacionados).
sea
Luego
tiene una distribucin t con n 2 grados de libertad si la hiptesis nula es verdadera. El error estndar de la pendiente:

puede ser reescrito en trminos de los residuales:

Luego se encuentra dado por:

Prueba t para dos muestras independientes[editar]


Iguales tamaos muestrales, iguales varianzas[editar]
Esta prueba se utiliza solamente cuando:

los dos tamaos muestrales (esto es, el nmero, n, de participantes en cada grupo) son iguales;

se puede asumir que las dos distribuciones poseen la misma varianza.

Las violaciones a estos presupuestos se discuten ms abajo.


El estadstico t a probar si las medias son diferentes se puede calcular como sigue:
Donde []

Aqu es la desviacin estndar combinada, 1 = grupo uno, 2 = grupo 2. El denominador de t es el error estndar de la diferencia entre las
dos medias.
Por prueba de significancia, los grados de libertad de esta prueba se obtienen como 2n 2 donde n es el nmero de participantes en cada
grupo.
Diferentes tamaos muestrales, iguales varianzas[editar]
Esta prueba se puede utilizar nicamente si se puede asumir que las dos distribuciones poseen la misma varianza. (Cuando este
presupuesto se viola, mirar ms abajo). El estadstico t si las medias son diferentes puede ser calculado como sigue:
Donde
Ntese que las frmulas de arriba, son generalizaciones del caso que se da cuando ambas muestras poseen igual tamao
(sustituyendo n por n1 y n2).
es un estimador de la desviacin estndar comn de ambas muestras: esto se define as para que su cuadrado sea un estimador sin
sesgo de la varianza comn sea o no la media iguales. En esta frmula, n = nmero de participantes, 1 = grupo uno, 2 = grupo
dos. n 1 es el nmero de grados de libertad para cada grupo, y el tamao muestral total menos dos (esto es, n1 + n2 2) es el
nmero de grados de libertad utilizados para la prueba de significancia.
Diferentes tamaos muestrales, diferentes varianzas[editar]
Esta prueba es tambin conocida como prueba t de Welch y es utilizada nicamente cuando se puede asumir que las dos varianzas
poblacionales son diferentes (los tamaos muestrales pueden o no ser iguales) y por lo tanto deben ser estimadas por separado. El
estadstico t a probar cuando las medias poblacionales son distintas puede ser calculado como sigue:
donde
Aqu s2 es el estimador sin sesgo de la varianza de las dos muestras, n = nmero de participantes, 1 = grupo uno, 2 = grupo dos.
Ntese que en este caso, no es la varianza combinada. Para su utilizacin en pruebas de significancia, la distribucin de este
estadstico es aproximadamente igual a una distribucin t ordinaria con los grados de libertad calculados segn:

Esta ecuacin es llamada la ecuacin WelchSatterthwaite. Ntese que la verdadera distribucin de este estadstico de hecho
depende (ligeramente) de dos varianzas desconocidas.

Prueba t dependiente para muestras apareadas[editar]

Esta prueba se utiliza cuando las muestras son dependientes; esto es, cuando se trata de una nica muestra que ha sido evaluada dos
veces (muestras repetidas) o cuando las dos muestras han sido emparejadas o apareadas. Este es un ejemplo de un test de diferencia
apareada.
Ejemplo de pares
emparejados
Para esta ecuacin, la diferencia D entre todos los pares tiene que ser calculada. Los pares se han formado ya sea con resultados de
una persona antes y despus de P
la evaluacin
Nom Edo entre
Te pares de personas emparejadas en grupos de significancia (por ejemplo,
tomados de la misma familia o grupo
de
edad:
vase
ar bre ad st la tabla). La media (XD) y la desviacin estndar (sD) de tales diferencias se han
utilizado en la ecuacin. La constante 0 es diferente de cero si se desea probar si la media de las diferencias es significativamente
diferente de 0. Los grados de libertad utilizados son
25 n 1.
1 Juan 35
0
Ejemplo de muestras
Joan
34
repetidas
1
36
a
0
Nmero
Nombre
Test 1
Test 2
Jaimi
46
2
22
1
Miguel
35% to
67% 0
2

Melanie

Melisa

50% Jesic 46% 20


2
21
a
0
90%
86%

Michell

78%

91%

Ejemplos desarrollados[editar]
Sea A1 denotando un grupo obtenido tomando 6 muestras aleatorias a partir de un grupo mayor:
y sea A2 denotando un segundo grupo obtenido de manera similar:
Estos podran ser, por ejemplo, los pesos de tornillos elegidos de un montn.
Vamos a llevar a cabo la prueba de hiptesis contando como hiptesis nula de que la media de las poblaciones de las cuales hemos
tomado las muestras son iguales.

La diferencia entre las dos medias de muestras, cada uno denotado por , la cual aparece en el numerador en todos los enfoques de
dos muestras discutidas anteriormente, es

La desviaciones estndar muestrales para las dos muestras son aproximadamente 0,05 y 0,11 respectivamente. Para muestras tan
pequeas, una prueba de igualdad entre las varianzas de las dos poblaciones no es muy poderoso. Pero ya que los tamaos
muestrales son iguales, las dos formas de las dos pruebas t se pueden desarrollar en forma similar en este ejemplo.

Varianzas desiguales[editar]
Si se decide continuar con el enfoque para varianzas desiguales (discutido anteriormente), los resultados son
y
El resultado de la prueba estadstica es aproximadamente 1,959. El valor p para la prueba de dos colas da un valor aproximado de
0,091 y el valor p para la prueba de una cola es aproximadamente 0,045.

Varianzas iguales[editar]
Si se sigue el enfoque para varianzas iguales (discutido anteriormente), los resultados son
y
Ya que el tamao de las muestras es igual (ambas tienen 6 elementos), el resultado de la prueba estadstica es nuevamente un valor
que se aproxima a 1.959. Debido a que los grados de libertad son diferentes de la prueba para varianzas desiguales, los valores P
difieren ligeramente de los obtenidos un poco ms arriba. Aqu el valor p para la prueba de dos colas es aproximadamente 0,078, y el
valor p para una cola es aproximadamente 0,039. As, si hubiera una buena razn para creer que las varianzas poblacionales son
iguales, los resultados seran algo ms sugerentes de una diferencia en los pesos medios de las dos poblaciones de tornillos.

Alternativas a la prueba t para problemas de locacin[editar]

La prueba t provee un mecanismo exacto para evaluar la igualdad entre las medias de dos poblaciones que tengan varianzas iguales,
aunque el valor exacto de las mismas sea desconocido. El test de Welch es una prueba aproximadamente exacta para el caso en que
los datos poseen una distribucin normal, pero las varianzas son diferentes. Para muestras moderadamente grandes y pruebas de una
cola, el estadstico t es moderadamente robusto a las violaciones de la asuncin de normalidad. 9
Para ser exactos tanto las pruebas t como las z requiere que las medias de las muestras sigan una distribucin normal, y la
prueba t adicionalmente requiere que la varianza de las muestras siga una distribucin Chi-cuadrado ( 2), y que la media muestral y la
varianza muestral sean estadsticamente independientes. La normalidad de los valores individuales de los datos no es un requisito
para que estas condiciones se cumplan. Por el teorema del lmite central, las medias muestrales de muestras moderadamente grandes
tambin aproximan una distribucin normal, incluso si los datos individuales no estn normalmente distribuidos. Para datos no
normales, la distribucin de la varianza muestral puede desviarse sustancialmente de una distribucin 2. Sin embargo, si el tamao
muestral es grande, el teorema de Slutsky indica que la distribucin de las varianzas muestrales ejerce un efecto muy pequeo en la
distribucin de la prueba estadstica. Si los datos son substancialmente no normales, y el tamao muestral es pequeo, la
prueba t puede entregar resultados equivocados.
Cuando la asuncin de normalidad no se sostiene, una alternativa no paramtrica a la prueba t puede ofrecer un mejor poder
estadstico. Por ejemplo, para dos muestras independientes cuando la distribucin de datos es asimtrica (esto es, que la distribucin
est sesgada) o la distribucin tiene colas muy grandes, entonces el test de suma de posiciones (ranks) de Wilcoxon (conocido
tambin como prueba U de Mann-Whitney) puede tener de tres a cuatro veces mayor poder estadstico que una prueba t.9 10 11
La contraparte no paramtrica a la prueba t de muestras apareadas es la prueba Wilcoxon de suma de posiciones con signo para
muestras pareadas. Para una discusin sobre cuando hacer una eleccin entre las alternativas t y no paramtricos, consulte a
Sawilowsky.12
El anlisis de varianza "one-way" generaliza la prueba t de dos muestras para casos donde los datos pertenecen a ms que dos
grupos.

Pruebas multivariadas[editar]
Una generalizacin del estadstico t de Student llamada estadstico t cuadrado de Hotelling, permite la comprobacin de hiptesis en
mltiples (y a menudo correlacionadas) mediciones de la misma muestra. Por ejemplo, un investigador puede presentar un nmero de
sujetos a un test de mltiples escalas de personalidad (p.ej el de cinco grandes rasgos de personalidad). Debido a que las medidas de
este tipo suelen estar muy correlacionadas, no es aconsejable llevar a cabo varias pruebas univariadas, ya que esto supondra
descuidar la covarianza entre las medidas e inflar la probabilidad de rechazar falsamente al menos una hiptesis (error de tipo I). En
este caso una nica prueba mltiple es preferible para llevar a cabo las pruebas de hiptesis. El estadstico t de Hosteling sigue una
distribucin T 2, sin embargo en la prctica, esta distribucin se utiliza muy raramente, y en cambio se suele convertir en una
distribucin de tipo F.

Prueba T 2 monomuestral[editar]
Para una prueba multivariable de nica muestra, la hiptesis es que el vector medio () es igual a un vector () dado. La prueba
estadstica se define como:
Donde n es el tamao muestral, es el vector de columnas medio y una matriz de covarianza muestral .

Prueba T 2 bimuestral[editar]
Para un test multivariable de dos muestras, la hiptesis es que los vectores medios (, ) de las dos muestras son iguales. La prueba
estadstica se define como:

Implementaciones[editar]
La mayora de los programas tipo hoja de clculo y paquetes estadsticos de lenguajes de programacin, tales
como QtiPlot, OpenOffice.org Calc, LibreOffice Calc, LISREL, Microsoft
Excel, SAS, SPSS, Stata, DAP, gretl, R, Python ([1]), PSPP, Infostat y Minitab, y PRISMA6 incluyen implementaciones del test t de
Student.

Lecturas adicionales[editar]

Boneau, C. Alan (1960). The effects of violations of assumptions underlying the t test. Psychological Bulletin 57 (1): 4964. doi:10.1037/h0041412.

Edgell, Stephen E., & Noon, Sheila M (1984). Effect of violation of normality on the t test of the correlation
coefficient. Psychological Bulletin 95 (3): 576-583. doi:10.1037/0033-2909.95.3.576.

Referencias[editar]
1.

Volver arriba Richard Mankiewicz, The Story of Mathematics(Princeton University Press), p.158.

2.

Saltar a:a b O'Connor, John J.; Robertson, Edmund F., Prueba t de Student (en ingls), MacTutor History of Mathematics
archive, Universidad de Saint Andrews.

3.

Volver arriba Fisher Box, Joan (1987). Guinness, Gosset, Fisher, and Small Samples. Statistical Science 2(1): 4552. doi:10.1214/ss/1177013437. JSTOR 2245613.

4.

Volver arriba Raju TN (2005). William Sealy Gosset and William A. Silverman: two "students" of science. Pediatrics 116 (3): 7325. doi:10.1542/peds.2005-1134. PMID 16140715.

5.

Saltar a:a b Fadem, Barbara (2008). High-Yield Behavioral Science (High-Yield Series). Hagerstwon, MD: Lippincott Williams &
Wilkins. ISBN 0-7817-8258-9.

6.

Volver arriba Zimmerman, Donald W. (1997). A Note on Interpretation of the Paired-Samples t Test. Journal of Educational and
Behavioral Statistics 22 (3): 349-360. JSTOR 1165289.

7.

Volver arriba Markowski, Carol A; Markowski, Edward P. (1990). Conditions for the Effectiveness of a Preliminary Test of
Variance. The American Statistician 44 (4): 322-326. doi:10.2307/2684360. JSTOR 2684360.

8.

Volver arriba David, HA; Gunnink, Jason L (1997). The Paired t Test Under Artificial Pairing. The American Statistician 51 (1): 912. doi:10.2307/2684684. JSTOR 2684684.

9.

Saltar a:a b Sawilowsky S., Blair R. C. (1992). A more realistic look at the robustness and type II error properties of the t test to
departures from population normality. Psychological Bulletin 111 (2): 353-360. doi:10.1037/0033-2909.111.2.352.

10.

Volver arriba Blair, R. C.; Higgins, J.J. (1980). A comparison of the power of Wilcoxons rank-sum statistic to that of Students t statistic
under various nonnormal distributions.. Journal of Educational Statistics 5(4): 309-334. doi:10.2307/1164905. JSTOR 1164905.

11.

Volver arriba Fay, MP; Proschan, MA (2010). Wilcoxon-Mann-Whitney or t-test? On assumptions for hypothesis tests and multiple
interpretations of decision rules. Statistics Surveys 4: 1-39. doi:10.1214/09-SS051. PMC 2857732. PMID 20414472.

12.

Volver arriba Sawilowsky S (2005). Misconceptions leading to choosing the t test over the Wilcoxon Mann-Whitney U test for shift in
location parameter. Journal of Modern Applied Statistical Methods 4 (2): 598-600.

O'Mahony, Michael (1986). Sensory Evaluation of Food: Statistical Methods and Procedures. CRC Press. p. 487. ISBN 0-824-77337-3.

Press, William H.; Saul A. Teukolsky, William T. Vetterling, Brian P. Flannery (1992). Numerical Recipes in C: The Art of Scientific
Computing. Cambridge University Press. pp. p. 616. ISBN 0-521-43108-5.

También podría gustarte