0% encontró este documento útil (0 votos)
1K vistas10 páginas

Prueba T'student

Este documento describe la prueba t de Student, un método estadístico para contrastar hipótesis sobre medias. Explica que se usa para muestras pequeñas cuando la desviación estándar de la población es desconocida y la distribución es aproximadamente normal. Detalla las fórmulas para calcular la prueba t para muestras individuales, regresiones lineales, dos muestras independientes y datos emparejados.

Cargado por

AnDrew DG
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
1K vistas10 páginas

Prueba T'student

Este documento describe la prueba t de Student, un método estadístico para contrastar hipótesis sobre medias. Explica que se usa para muestras pequeñas cuando la desviación estándar de la población es desconocida y la distribución es aproximadamente normal. Detalla las fórmulas para calcular la prueba t para muestras individuales, regresiones lineales, dos muestras independientes y datos emparejados.

Cargado por

AnDrew DG
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

ESCUELA SUPERIOR POLITECNICA DE CHIMBORAZO

FACULTAD DE CIENCIAS PECUARIAS

CARRERA: INGENIERIA AGROINDUSTRIAL

ASIGNATURA: ESTADISTICA

TEMA:
Prueba T`Student

NOMBRE:

NEPPAS CRISTIAN

NIVEL
CUARTO “B”
FECHA DE ENTREGA:

15/11/2019
RIOBAMBA-ECUADOR
PRUEBA T`STUDENT
La prueba t-Student se utiliza para contrastar hipótesis sobre medias en poblaciones con
distribución normal. También proporciona resultados aproximados para los contrastes de
medias en muestras suficientemente grandes cuando estas poblaciones no se distribuyen
normalmente (aunque en este último caso es preferible realizar una prueba no paramétrica).
Para conocer si se puede suponer que los datos siguen una distribución normal, se pueden
realizar diversos contrastes llamados de bondad de ajuste, de los cuales el más usado es la
prueba de Kolmogorov. A menudo, la prueba de Kolmogorov es referida erróneamente como
prueba de Kolmogorov-Smirnov, ya que en realidad esta última, sirve para contrastar si dos
poblaciones tienen la misma distribución. Otros tests empleados para la prueba de normalidad
son debidos a Saphiro y Wilks.[ CITATION Anosf \l 3082 ]

Caracteristicas
Tiene características similares a la distribución normal, su diferencia principal radica en las
áreas de los extremos las cuales son más amplias, como consecuencia de que usualmente se
trabaja con muestras pequeñas. La sintaxis en Excel es: DISTR.T(x;grados_de_libertad;colas)
X es el valor numérico al que se ha de evaluar la distribución. Grados_de_libertad es un
entero que indica el número de grados de libertad. Colas especifica el número de colas de la
distribución que se ha de devolver. Toma los valores de 1 o 2.

El nombre de la distribución se debe a su autor W.S. Gosset, quien le dio el seudónimo de T


de Student ante la imposibilidad de presentar sus trabajos so pena de perder su empleo, esto
sucedió a principio del siglo XX.
Esta distribución es recomendada cuando se requiere estimar la media poblacional y no se
conoce la desviación estándar y por lo tanto, hay que estimarla, eso si, siempre y cuando la
distribución original sea aproximadamente normal.
Otro término utilizado en ésta distribución continua, es el de grados de libertad (g.l), el cual
de manera intuitiva se expone así:
Y= x1 ± x2 ± x3 ± x4 , para satisfacer la ecuación, tres variables se pueden cambiar a libertad,
pero un de ellos no, por eso, cuando se tiene una sola muestra, se hable de n-1 g.l. A medida
que se aumenten los g.l. la distribución t, se aproxima a la distribución Z de la normal. Otra
lectura que se puede dar es que los g.l es una medida del número de observaciones
independientes en la muestra, que se usan para estimar la desviación estándar.
En general, cuando el tamaño de muestra no sea muy pequeño y la simetría no sea alta, se
puede usar para estimar la media poblacional cuando no se conoce la desviación.
Condiciones: Se utiliza en muestras pequeñas de 30 o menos elementos. La desviación
estándar de la población no se conoce.
Características: La distribución t-Student es menor en la media y más alta en los extremos que
una distribución normal. Tiene mayor parte de su área en los extremos que la distribución
normal.[ CITATION Lui16 \l 3082 ]
Fórmulas de cálculo
Prueba t para muestra única
En esta prueba se evalúa la hipótesis nula de que la media de la población estudiada es igual a
un valor especificado μ0, se hace uso del estadístico:

donde   es la media m uestral, s es la desviación estándar muestral y n es el tamaño de la


muestra. Los grados de libertad utilizados en esta prueba se corresponden al valor n − 1.

Pendiente de una regresión lineal


Supóngase que se está ajustando el modelo:

donde xi, i = 1, ..., n son conocidos, α y β son desconocidos, y εi es el error aleatorio en los


residuales que se encuentra normalmente distribuido, con un valor esperado 0 y una varianza
desconocida σ2, e Yi, i = 1, ..., n son las observaciones.
Se desea probar la hipótesis nula de que la pendiente β es igual a algún valor
especificado β0 (a menudo toma el valor 0, en cuyo caso la hipótesis es que x e y no están
relacionados).
sea

Luego

tiene una distribución t con n − 2 grados de libertad si la hipótesis nula es verdadera. El error


estándar de la pendiente:

puede ser reescrito en términos de los residuales:

Luego  se encuentra dado por:


Prueba t para dos muestras independientes
Iguales tamaños muestrales, iguales varianzas
Esta prueba se utiliza solo si

 los dos tamaños muestrales (esto es, el número, n, de participantes en cada grupo) son
iguales;
 se puede asumir que las dos distribuciones poseen la misma varianza.
Las violaciones a estos presupuestos se discuten más abajo.
El estadístico t a probar si las medias son diferentes se puede calcular como sigue:

Donde

,
Es la desviación estándar combinada, 1 = grupo uno, 2 = grupo 2. El denominador de t es el
error estándar de la diferencia entre las dos medias.
Por prueba de significancia, los grados de libertad de esta prueba se obtienen como 2n − 2
donde n es el número de participantes en cada grupo.
Diferentes tamaños muestrales, iguales varianzas[editar]
Esta prueba se puede utilizar únicamente si se puede asumir que las dos distribuciones poseen
la misma varianza. (Cuando este presupuesto se viola, mirar más abajo). El estadístico t si las
medias son diferentes puede ser calculado como sigue:

Donde

Nótese que las fórmulas de arriba, son generalizaciones del caso que se da cuando ambas
muestras poseen igual tamaño (sustituyendo n por n1 y n2).
 es un estimador de la desviación estándar común de ambas muestras: esto se define así
para que su cuadrado sea un estimador sin sesgo de la varianza común sea o no la media
iguales. En esta fórmula, n = número de participantes, 1 = grupo uno, 2 = grupo dos. n − 1
es el número de grados de libertad para cada grupo, y el tamaño muestral total menos dos
(esto es, n1 + n2 − 2) es el número de grados de libertad utilizados para la prueba de
significancia.
Diferentes tamaños muestrales, diferentes varianzas
Esta prueba es también conocida como prueba t de Welch y es utilizada únicamente
cuando se puede asumir que las dos varianzas poblacionales son diferentes (los tamaños
muestrales pueden o no ser iguales) y por lo tanto deben ser estimadas por separado. El
estadístico t a probar cuando las medias poblacionales son distintas puede ser calculado
como sigue:

donde

Aquí s2 es el estimador sin sesgo de la varianza de las dos muestras, n = número de


participantes, 1 = grupo uno, 2 = grupo dos. Nótese que en este caso,  no es la varianza
combinada. Para su utilización en pruebas de significancia, la distribución de este
estadístico es aproximadamente igual a una distribución t ordinaria con los grados de
libertad calculados según:
Esta ecuación es llamada la ecuación Welch–Satterthwaite. Nótese que la verdadera
distribución de este estadístico de hecho depende (ligeramente) de dos varianzas
desconocidas.
Prueba t dependiente para muestras apareadas
Esta prueba se utiliza cuando las muestras son dependientes; esto es, cuando se trata de
una única muestra que ha sido evaluada dos veces (muestras repetidas) o cuando las dos
muestras han sido emparejadas o apareadas. Este es un ejemplo de un test de diferencia
apareada.

Ejemplo de
pares
emparejado
s D entre todos los pares tiene que ser calculada. Los pares
Para esta ecuación, la diferencia
se han formado ya sea con resultados
E T de una persona antes y después de la evaluación o
P No
entre pares de personas emparejadas
d e en grupos de significancia (por ejemplo, tomados de
la misma familia o grupo a mbde edad:
a svéase la tabla). La media (XD) y la desviación estándar
(sD) de tales diferenciasr sere
han d
utilizado
t en la ecuación. La constante μ0 es diferente de
cero si se desea probar si la media de las diferencias es significativamente diferente de μ0.
2
Los grados de libertad utilizados son n − 1.
Jua 3
1 5
Ejemplo de n 5
0
muestras repetidas
3
Número Nombre Test Joa 3
1 1 Test4 2
na 6
0
1 Miguel 35% 67%
Jai 4
2 Melanie 50% 46% 2
2 mit 6
2
3 Melisa 90% 86%0
o

4 Michell 78%Jes 91%2


2
2 0
ica 1
0
Para datos emparejados
Las pruebas t de muestras dependientes o apareadas, consisten típicamente en una muestra de
pares de valores con similares unidades estadísticas, o un grupo de unidades que han sido
evaluadas en dos ocasiones diferentes (una prueba t de mediciones repetitivas). Un ejemplo
típico de prueba t para mediciones repetitivas sería por ejemplo que los sujetos sean evaluados
antes y después de un tratamiento.
Una prueba 't basada en la coincidencia de pares muestrales se obtiene de una muestra
desapareada que luego es utilizada para formar una muestra apareada, utilizando para ello
variables adicionales que fueron medidas conjuntamente con la variable de interés.

La valoración de la coincidencia se lleva a cabo mediante la identificación de pares de valores


que consisten en una observación de cada una de las dos muestras, donde las observaciones
del par son similares en términos de otras variables medidas. Este enfoque se utiliza a menudo
en los estudios observacionales para reducir o eliminar los efectos de los factores de
confusión[ CITATION Joa16 \l 3082 ].

Para datos No pareados


La siguiente información fue tomada de:[ CITATION Joa16 \l 3082 ]
Una de las opciones cuando se quiere comparar una variable continua entre dos grupos
consiste en comparar los resultados promedio obtenidos para cada uno. El hecho de que los
valores promedio de cada grupo no sean iguales no implica que haya evidencias de una
diferencia significativa. Dado que cada grupo tiene su propia variabilidad, aunque el
tratamiento no sea eficaz, las medias muestrales no tienen por qué ser exactas.
Para estudiar si la diferencia observada entre las medias de dos grupos es significativa, se
puede recurrir a métodos paramétricos como el basado en Z-scores o en la distribución T-
student. En ambos casos, se pueden calcular tanto intervalos de confianza para saber entre
que valores se encuentra la diferencia real de las medias poblacionales o test de hipótesis
para determinar si la diferencia es significativa.
La distribución T-student se asemeja en gran medida a la distribución normal. Tiene como
parámetros la media, la varianza y además incorpora a través de los grados de libertad una
modificación que permite flexibilizar las colas en función del tamaño que tenga la muestra.
A medida que se reduce el tamaño muestral, la probabilidad acumulada en las colas
aumenta, siendo así menos estricta de lo cabría esperar en una distribución normal. Una
distribución T-student con 30 o más grados de libertad es prácticamente igual a una
distribución normal.
El número de grados de libertad de la distribución T-student se calcula:

 Para estudiar una sola muestra: df=tamaño muestra−1df=tamaño muestra−1


 Cuando se comparan dos muestras: existen varios métodos, uno de los utilizados es
emplear los grados de libertad de la muestra de menor tamaño minimo((n1−1),
(n2−1))minimo((n1−1),(n2−1)). En los programas informáticos se emplean métodos
para ajustar de forma más precisa los grados de libertad.

Condiciones de un t-test para muestras independientes


Las condiciones para calcular intervalos de confianza o aplicar un test de hipótesis basados
en la distribución T-student son las mismas que para el teorema del límite central.

 Independencia: Las observaciones tienen que ser independientes unas de las otras.
Para ello el muestreo debe ser aleatorio y el tamaño de la muestra inferior al 10% de
la población.
 Normalidad: Las poblaciones que se comparan tienen que distribuirse de forma
normal. A pesar de que la condición de normalidad recae sobre las poblaciones,
normalmente no se dispone de información sobre ellas por lo que las muestras (dado
que son reflejo de la población) tiene que distribuirse de forma aproximadamente
normal. En caso de cierta asimetría los t-test son considerablemente robustos cuando
el tamaño de las muestras es mayor o igual a 30.
 Igualdad de varianza (homocedasticidad): la varianza de ambas poblaciones
comparadas debe de ser igual. Tal como ocurre con la condición de normalidad, si
no se dispone de información de las poblaciones, esta condición se ha de asumir a
partir de las muestras. En caso de no cumplirse esta condición se puede emplear
un Welch Two Sample t-test. Esta corrección se incorpora a través de los grados de
libertad permitiendo compensar la diferencia de varianzas pero con el inconveniente
de que pierde precisión. El número de grados de libertad de un  Welch Two Sample t-
test viene dado por la siguiente función:

Si las condiciones se cumplen se puede considerar que el parámetro estimado, en este caso
la diferencia de medias muestrales (X1−X2)(X1−X2) sigue una distribución T-
student (grados libertad, mean = parámetro estimado, sd = SE)
El error estandár (SE) de una distribución T-student para comparar medias se define como la
raíz cuadrada de la suma de las desviaciones típicas muestrales corregidas de cada grupo al
cuadrado, divididas por el tamaño de cada muestra.

El proceso a seguir para calcular intervalos de confianza o test de hipótesis es el mismo que
el seguido en el modelo Normal. La única diferencia es que en lugar de emplear  Z-
scores (cuantiles de la distribución normal) se emplean los T-scores (cuantiles de la
distribución t-student).

Intervalo de confianza

El intervalo de confianza de la diferencia de medias independientes para un nivel de


confianza de 1−α1−α tiene la siguiente estructura:
El valor t depende del porcentaje de seguridad del intervalo de confianza que se quiera
obtener. Se define como el valor (cuantil) para el cual en una distribución de student, con
unos determinados grados de libertad, un porcentaje igual al porcentaje de confianza del
intervalo queda comprendido entre el valor -t y el valor +t buscado.
Supóngase que se busca el valor t para un intervalo de confianza del 95% en una
distribución t-student con 15 grados de libertad:

El valor t puede encontrarse en tablas tabuladas o mediante programas informáticos, en R el


valor t para un determinado intervalo de confianza y grados de libertad se puede obtener con
la función qt(). t = qt(p = confianza del intervalo + (1-confianza intervalo)/2, df= ,
[Link] = TRUE)
Hide

qt(p = 0.95 + 0.05/2, df = 15, [Link] = TRUE)


## [1] 2.13145

Ejemplos:
Dependiente
EJEMPLO
Con un nivel de significancia de 5% se selecciona de manera aleatoria tres paquetes de
croquetas (bultos) alimento para perros,  de cada uno de los cinco pedidos. Al pesar los 15
paquetes se obtiene la media de = 49.4 y una desviación estándar de  S2 = 1.2

Establecer el estadístico de prueba calculado de acuerdo a la expresión


Sustituyendo datos queda:

Por tanto concluimos que


1.-  se encuentra en la región de rechazo  que por lo cual  se considera que existe menor
cantidad de croquetas en los paquetes.
2.- No cumple con lo que  pide.

Bibliografía
Aguas, L. (2016). Distribucion de T`student. Obtenido de SlideShare:
[Link]
%2030%20o%20menos%20elementos.&targetText=Caracter%C3%ADsticas%3A
%20La%20distribuci%C3%B3n%20t%2DStudent,extremos%20que%20una
%20distribuci%C3%B3n%20normal.
Amat, R. (2016). T-test: Comparación de medias poblacionales independientes. Obtenido de
Rpubs: [Link]
Anonimo. (sf). Modulo 8. Obtenido de Plan de Formación en Bioestadística:
[Link]

También podría gustarte