Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ASIGNATURA:
TÍTULO:
T-STUDENT
DOCENTE:
INTEGRANTES:
HUANCAYO – PERU
1. INTRODUCCIÓN
T Student fue descubierta por un especialista en estadística de una empresa irlandesa, este
señor cuyo nombre era William.S. Gosset hizo inferencias acerca de la media cuando la
prohibido publicar trabajos de investigación bajo sus propios nombres, es por eso que
distribución “T”, es una distribución de probabilidad que surge del problema de estimar
confianza y los grados de libertad, obteniendo valores de una tabla dada con respecto a
T Student es de gran utilidad, ya que reduce tiempo, costo y esfuerzos, se utiliza para
probar hipótesis y también para saber si dos muestras provienen de la misma población
1. OBJETIVOS
1.1.Objetivos generales
1
Analizar las características y aplicación de la distribución “T” de Student, para
1.2.Objetivos Específicos
problema en R Studio.
2. MARCO TEÓRICO
”se utiliza al trabajar con tamaños muestrales pequeños que parten de dos o tres
mediciones, por tanto es aplicable a modelos estadísticos que trabajan con muestras
analizar a las muestras correspondientes. Por otra parte, si analizamos los beneficios y
las restricciones que posee esta teoría. Según (Dos, 2004) ,podemos encontrarnos tanto
pros y contras que posee el trabajar con pequeñas muestras, en primera “al calcular el
estimación, por tanto, se tiene una mayor exactitud. Además, al no realizarse muchas
Ahora teniendo una noción de lo que contempla esta teoría, podemos adentrarnos en los
modelos estadísticos que aplican los principios de esta teoría. Es de mencionar que solo
2
2.1.1. T-Student
La t de Student, inicialmente se diseñó, para “examinar las diferencias entre dos muestras
varianzas” (Sánchez, 2015). Por otra parte, con respecto quien consolido sus principios,
hay fuentes que refieren a R. A. Fisher como el que la desarrollo y la bautizó Student en
honor a W. S. Gosset, quien usaba ese seudónimo para poder publicar sus trabajos en la
Por otra parte, no en todas las muestras puede aplicarse la t de Student, sino que existen
ciertas condiciones que al no cumplirse los resultados obtenidos por los estadígrafos seria
irreverentemente incorrectos, estas condiciones son para (Dos, 2004),las siguientes: “Las
selección de las muestras debe ser aleatoria y las muestras deben ser independientes entre
sí” (p.23). Por tanto, para trabajar con t de Student, es importante que una muestra sea
que las definen como: “tienen una única moda, que coinciden con la media y mediana, o
que la curva al realizar la distribución tiene forma de campana” (Díaz p. e., 2001) . Ahora
con respecto a la prueba t, una de las formas de terminar t, al hacer una comparación de
la muestra, el valor t tiende a extenderse desde -∞ a +∞” (Dos, 2004). Esta no es la única
3
forma de calcular la prueba t, sino existen casos particulares, en los cuales la forma de
calcular t, es diferente, sin embargo, la fórmula propuesta es la más utilizada, según Díaz,
(𝑃 − 𝜋)
𝑡=
√𝜋. (1 − 𝜋)/𝑛
determinar las diferencia entre las dos medias y la construcción del intervalo de confianza.
Por otra parte, según (Cordova, 2013), las variables aleatorias “tienden a distribuirse en
función a la probabilidad de t, conjuntamente con los grados de libertad (k). Sin embargo,
4
Sin embargo, mayormente se utilizan tablas para identificar qué valor toma la densidad,
mismas tablas que están en función a el valor de t y el valor de los grados de libertad (k),
dicha tabla se presenta en la Tabla 1. Con respecto a la gráfica en sí, para Córdova, T.
del valor de k y es muy semejante a la gráfica de una distribución normal” (p. 13), se
Imagen 1 Imagen 2
Distribución t de Student con 10 grados Valores críticos de distribución de t
de libertad
5
2.3. PROPIEDADES
(Rodó, 2019) nos indica que:
𝑛 ≥ 30.
normal estándar.
• La varianza es siempre mayor que uno y se puede definir solo cuando los grados
𝒗
de libertad 𝝂 ≥ 𝟑 y se da como: 𝑽𝒂𝒓 (𝒕) = [ 𝒗−𝟐]. ( 𝜎 = 1 para la distribución
normal estándar).
• Es menos puntiagudo en el centro y más alto en las colas, por lo que asume una
forma platicúrtica.
Hay tres tipos de pruebas t que podemos realizar en función de los datos disponibles:
Según nos menciona (Minitab Statistical Software, 2020), en una prueba t de una
media) establecido. Este promedio establecido puede ser cualquier valor teórico
𝑚−𝜇
𝑡=
𝑠/√𝑛
Dónde:
• t = t estadístico
utiliza para comparar las medias de dos muestras diferentes. Aquí está la fórmula
𝑚𝐴 − 𝑚𝐵
𝑡=
𝑆2 𝑆2
√
𝑛𝐴 + 𝑛𝐵
Dónde:
• 𝑚𝐴 y 𝑚𝐵 son las medias de dos muestras diferentes
1
• 𝑛𝐴 y 𝑛𝐵 son los tamaños de muestra
2
∑(𝑥 − 𝑚𝐴 )2 + ∑(𝑥 − 𝑚𝐵 )2
𝑆 =
𝑛𝐴 + 𝑛𝐵 − 2
𝑚
𝑡=
𝑆/√𝑛
Dónde:
• 𝑡 = estadístico t
Podemos tomar el grado de libertad en esta prueba como 𝑛 − 1 ya que solo está
involucrado un grupo.
2
Este escenario se da cuando se tiene dos medidas relacionadas de una misma muestra, las
cuales fueron obtenidas en diferentes lapsos de tiempo. Por otra parte, este escenario
presenta un supuesto, el cual es la diferencia entre las dos variables relacionadas donde
Estos escenarios se dan cuando se presentan dos muestras, en este caso se debe de
si sus varianzas son similares y/o idénticas, si esto sucede se trataría de un escenario de
dos muestras con varianzas homogéneas, por lo contrario, si las varianzas de dichas
dos muestras con varianzas heterogéneas. Por otro lado, estos dos escenarios comparten
dos supuestos: el primero es que sus respectivos datos poseen una distribución normal y
(Roldán, 2016)
PRUEBA T - STUDENT
3
Nota: La homocedasticidad en la estadística se da cuando la varianza del error
(Cruz, 2013) menciona que: “Los grados de libertad son iguales al número de
observaciones independientes que son libres de variar (el número de sujetos en los datos)
datos). En otras palabras, están relacionados al tamaño de la muestra. Así mismo, los
grados de libertad son usados para definir las distribuciones estadísticas y con ellos poder
Asimismo, se sabe que los grados de libertad están relacionados con el tamaño de la
muestra, es por ello que cuando más grande sea el tamaño de la muestra más grande serán
una distribución normal estándar. Cabe resaltar que la prueba t – Student siempre depende
Por otro lado, algunos textos de estadística de uso común definen a los grados de libertad
de la siguiente manera:
4
“El valor de los grados de libertad se relaciona con el número de veces que se usa la
“Se definen como el número de valores que podemos escoger libremente” (Levin, 1996)
“Los grados de libertad de una prueba estadística son el número de datos que son libres
de dos grupos de personas, el primer grupo procede de un área con alta prevalencia de
número muestral del grupo uno es de 20 sujetos, y el tamaño del segundo es de 28,
GL = (20 - 1) + (28 - 1) = 46
se rechaza la hipótesis nula y por lo tanto hay evidencia que las medias de hemoglobina
5
2.7. ERROR ESTÁNDAR
El error estándar es una estimación de la cantidad que el valor de una estadística de prueba
Asimismo, (Everitt, 2003) nos dice que “El error estándar es la desviación estándar de la
s
𝑆𝐸 =
√n
Donde:
SE = error estándar
Se sabe que el error estándar tiende a disminuir cuando aumenta el tamaño de las muestras
sin embargo para poder observar una disminución notoria es necesario cuadruplicar el
Por otro lado, es muy importante resaltar que el error estándar es fundamental en la prueba
𝑥̅ − 𝑢
𝑡=
SE
Donde:
t = punto de prueba t
𝑥̅ = media muestral
6
u = media poblacional
SE = error estándar
que μ1=μ2μ1=μ2.
poblacional es mayor, menor o distinto del valor que establece la Ho. Suele
contener los símbolos >, <,≠>, <,≠. En el caso de comparar dos medias
2.9.INTERVALOS DE CONFIANZA
𝑆12 𝑆22
[(𝑋1 − 𝑋2 ) ± 𝑡𝑑𝑓,1−𝛼 ∗ √ + ]
2 𝑛1 𝑛2
El valor t depende del porcentaje de seguridad del intervalo de confianza que se quiera
obtener. Se define como el valor (cuantil) para el cual en una distribución de Student, con
EJEMPLO
Supóngase que se busca el valor t para un intervalo de confianza del 95% en una
7
El valor t puede encontrarse en tablas tabuladas o mediante programas informáticos, en
0.05
𝑞𝑡(𝑝 = 0.95 + , 𝑑𝑓 = 15, 𝑙𝑜𝑤𝑒𝑟. 𝑡𝑎𝑖𝑙 = 𝑇𝑅𝑈𝐸
2
##[1] 2.13145
2.10. USOS Y APLICACIONES
hay una diferencia significativa entre las medias de dos grupos. Con toda la estadística
deductiva, asumimos que las variables dependientes tienen una distribución normal.
que estamos dispuestos a aceptar antes de que cerco datos p < .05 es un valor común se
a derecha. Para valores negativos no olvidar la simetría de esta distribución, tal que
8
el valor de probabilidad a la derecha de t, es igual al valor de probabilidad a la
izquierda de -t.
que presentaremos
3. Calcular el valor de T
la distribución normal aquí los valores de t están dentro de la tabla y los valores
3. CÁLCULOS
Student:
Sea una empresa que fabrica insecticidas en la ciudad de Huancayo, dicha compañía
afirma que sus productos tienen un promedio de 25 horas de elaboración. Para mantener
este promedio se prueban 15 insecticidas cada mes, entonces si el valor t calculado cae
¿Qué conclusiones debería sacar la empresa a partir de una muestra que tiene una media
9
DATOS:
PASO 1:
• H0=25
• H1 ≠ 25
PASO 2:
• α=0.01 equivale al 1%
- Grados de libertad
Posteriormente buscamos en nuestra tabla de datos un valor con los valores calculados.
TABLA T-STUDENT
10
Al graficar:
27.5
Región de aceptación
-2,602 2,602
PASO 3:
PASO 4:
Por lo tanto, la empresa queda satisfecha con su afirmación al aceptar la hipótesis nula.
PROGRAMACIÓN EN R
# Variables
X= 27.5 # media de la muestra
u=25 #valor hipotético
des_esta=5 # desviación estándar de la población
n=16 #tamaño de la muestra
11
# Operación
t=(X-u)/(des_esta/sqrt(n))
#Entonces calculamos el valor crítico a un nivel de significación de 0.05
alpha=0.01
gl=n-1
Vc_tabla=2.602
porc=pnorm(t)
a=porc*100
a
# Para poder graficar utilizamos el PLOT en una DISTRIBUCIÓN NORMAL
mean <- 0; sd <- 1
lb <- -2.602; ub <- 2.602
12
4. DISCUSIÓN Y RESULTADOS
R studio (Figura 1), entendemos que la hipótesis es aceptada debido a que el porcentaje
(Figura 1)
utilizamos para nuestra prueba de hipótesis que, en términos más certeros, podemos decir
que se acepta la hipótesis nula y por ende, existe suficiente evidencia para demostrar que
5. CONCLUSIONES
• T-Student se diseñó para examinar las diferencias entre dos muestras, para trabajar
con este debemos tener en cuenta que la muestra sea normal (unimodal y básicamente
13
simétrica), aleatoria e independiente, lo utilizamos para determinar si hay una
diferencia significativa entre las medias de dos grupos. Para el cálculo matemático
debemos conocer los estadígrafos de comparación los cuales son: los grados de
libertad, es el número de datos que son libres de variar cuando se realiza la prueba; el
de este, para lo cual se tiene que tener en cuenta los grados de libertad, entonces el
considera que no hay diferencia o cambio; hipótesis alternativa, considera que el valor
las tablas que varían en función a la variable t y los grados de libertad. Sumado a ello
podremos conocer los tres tipos de pruebas que existen: prueba t de una muestra,
diferencia entre las dos variables relacionadas donde dicho resultado posee una
dos supuestos, primero que sus respectivos datos poseen una distribución normal y
14
• Gracias a esto entenderemos la teoría de las pequeñas muestras, que lo utilizamos al
trabajar con tamaños muestrales pequeños, está compuesta de los estadígrafos antes
mencionados, cuya finalidad es analizar las muestras. Como toda teoría tiene sus pro
y contras. Entre los pros están: es de mayor exactitud, disminuye los costos y el
• En el ejemplo presentado se puede observar que todos los conceptos mencionados son
25 horas, además, que la media como la desviación afectan a la curva y al área bajo
6. REFERENCIAS BIBLIOGRÁFICAS
Cordova, T. (2013). DISTRUBUCION T DE STUDENT [Grafica]. Obtenido de
slideshare: https://es.slideshare.net/torimatcordova/distribucion-t-de-student-
28545004
Cruz, J. (2013). ¿Qué significan los grados de libertad? REDALYC, 1-16.
Dawson, B. (2005). Bioestadística Médica. REDALYC.
Díaz, p. e. (Diciembre de 2001). La distribución normal. Obtenido de Fisterra:
https://www.fisterra.com/mbe/investiga/distr_normal/distr_normal.asp
Díaz, V. P. (2009). Errores Estadísticos. SCIELO.
Dos, M. (4 de Julio de 2004). Teoría de las muestras estadísticas de trabajo. Obtenido
de https://www.gestiopolis.com/teoria-de-las-muestras-estadisticas-de-trabajo/
Everitt, B. (2003). Wikipedia. Obtenido de The Cambridge Dictionary of Statistics:
https://es.wikipedia.org/wiki/Error_est%C3%A1ndar
Flores, D. (Agosto de 2019). Tabla t Student [Tabla]. Obtenido de slideshare:
https://www.slideshare.net/DANNYFLORES44/tabla-t-studentpdf-analitica
Jimenez, A. e. (2017). Estadística. Obtenido de Informacíon Estadistica:
https://sites.google.com/site/estadisitica5demayo/home
Levin, R. (1996). ESTADÍSTICA PARA ADMINISTRADORES. REDALYC.
Minitab Statistical Software. (2020). Tipos de pruebas t. Obtenido de Soporte técnico de
Minitab 19: https://www.minitab.com/es-mx/products/minitab/
Pagano, R. (2009). UNDERSTANDING STATISTICS IN THE SCIENCE. REDALYC.
15
Rodó, P. (2019). Propiedades de la distribución t de Student. Obtenido de
Economipedia: https://economipedia.com/definiciones/propiedades-de-la-
distribucion-t-de-student.html
Roldán, L. (10 de abril de 2016). YouTube. Obtenido de
https://www.youtube.com/watch?v=ekf208Fvzcw&t=624s
Sánchez, R. (2015). t-Student. Usos y abusos. SciELO,
http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S0188-
21982015000100009.
Ticona, O. (2008). estadistica T de Student. Obtenido de
https://es.scribd.com/document/324922286/MONOGRAFIA-DE-
ESTADISTICA-T-DE-STUDENT-docx
Turcio, R. A. (2015). t - student. Usos y abusos. SCIELO.
Zanchez, T. (2015). la prueba t y la distribución t. Obtenido de
http://www.scielo.org.mx/pdf/rmc/v26n1/v26n1a9.pdf
ANEXOS
ANEXO 1
TABLA 2
Demostración del papel de la media y desviación estándar en la curva al trabajar con T-
Student.
16
#demostraremos como al variar la media hacia 2 o -2, la curva se desplaza #demostraremos como es que con la desviación estándar, la curva reduce su
por lo cual la función de densidad, depende de la media ancho
x <- seq(-5, 5, length=100) x <- seq(-5, 5, length=100)
hx <- dnorm(x,mean = 0, sd = 1) hx <- dnorm(x,mean = 0, sd = 1)
degf <- c(-2, 2)
colors <- c("red", "blue", "black") degf <- c(2, 3, 4)
labels <- c("-2", "2", "0") colors <- c("red", "blue", "darkgreen", "black")
plot(x, hx, type="l", lwd=2,lty=2, xlab="x value", labels <- c("sd=2", "sd=3", "sd=4", "sd=0")
ylab="Density", main="COMPARACIÓN DE DISTRIBUCIÓN T")
abline(h = 0, v = 0, col = "gray60") plot(x, hx, type="l", lwd=2,lty=2, xlab="x value",
abline(h = -1:5, v = -3:3, col = "lightgray", lty = 3) ylab="Density", main="COMPARACIÓN DE DISTRIBUCIÓN T")
for (i in 1:4){ abline(h = 0, v = 0, col = "gray60")
lines(x, dnorm(x,mean = degf[i], sd = 1), lwd=2, col=colors[i]) abline(h = -1:5, v = -3:3, col = "lightgray", lty = 3)
}
legend("topright", inset=0, for (i in 1:4){
labels, title = "mean", lwd=2, lty=c(1, 1, 2), col=colors) lines(x, dnorm(x,mean = 0, sd = degf[i]), lwd=2, col=colors[i])
}
legend("topright", inset=0,
labels, lwd=2, lty=c(1, 1, 1, 2), col=colors)
17