Informe Tstudent

UNIVERSIDAD NACIONAL DEL CENTRO DEL PERÚ
FACULTAD DE INGENIERÍA QUÍMICA
ESCUELA ACADÉMICA ROFESIONAL DE INGENIERÍA QUÍMICA AMBIENTAL
ESCUELA ACADÉMICA ROFESIONAL DE INGENIERÍA QUÍMICA
ASIGNATURA:
043 C- ESTADÍSTICA Y DISEÑO ESPERIEMNTAL
TÍTULO:
INFORME 01- TERORÍA DE PEQUEÑAS MUESTRAS
T-STUDENT
DOCENTE:
Ing. Henry Raul Ochoa Leon
INTEGRANTES:
ESTUDIANTES E.A.P. CORREO INSTITUCIONAL
Arenales Jiménez Adrián IQA e_2019200868j@uncp.edu.pe
Camarena Álvarez Eli Anderson IQA e_2019200871c@uncp.edu.pe
Cuestas Chagua Ana Cristina IQ e_2020100441j@uncp.edu.pe
Mallqui Carrasco, IQA e_2019101093k@uncp.edu.pe

Luz del Carmen
Medrano García Gianmarco IQA e_2019200884j@uncp.edu.pe
Pérez Segura Joyce Meyly IQ e_2020100449b@uncp.edu.pe
Toribio Tica Inés Yuliza IQA e_2019200893i@uncp.edu.pe
Vilcahuaman Esteban Anel Shantal IQA e_2019101102c@uncp.edu.pe
FECHA DE PRESENTACIÓN: 21/06/2021
HUANCAYO – PERU
1. INTRODUCCIÓN
T Student fue descubierta por un especialista en estadística de una empresa irlandesa, este
señor cuyo nombre era William.S. Gosset hizo inferencias acerca de la media cuando la
desviación poblacional fuese desconocida, los empleados de dicha empresa tenían
prohibido publicar trabajos de investigación bajo sus propios nombres, es por eso que
Gosset adopto el seudónimo de “Student”.
La distribución T Student es una prueba de hipótesis de medias en la cual usamos la
distribución “T”, es una distribución de probabilidad que surge del problema de estimar
la media de una población normalmente distribuida cuando el tamaño de la muestra es
pequeño, ya que en la distribución de t Student necesitamos que el espacio muestral no
pase de 30, una población que sea considerada normal.
ya que se desconoce la desviación población en esta distribución solo requerimos la
media muestral, población y error estándar.
Sus funciones se basan en establecer un intervalo de confianza, utilizando un nivel de
confianza y los grados de libertad, obteniendo valores de una tabla dada con respecto a
estas variables y aplicarla en la formula.
T Student es de gran utilidad, ya que reduce tiempo, costo y esfuerzos, se utiliza para
probar hipótesis y también para saber si dos muestras provienen de la misma población
Finalmente se describen algunos ejemplos como medio para estimar el grado de
conocimiento del trabajo.
1. OBJETIVOS
1.1.Objetivos generales
1
Analizar las características y aplicación de la distribución “T” de Student, para
poder aplicarlas posteriormente en la resolución de problemas que requieran del
uso de esta distribución
1.2.Objetivos Específicos
Conocer el uso correcto de la distribución de T Student para la resolución de un
problema en R Studio.
2. MARCO TEÓRICO
2.1.TEORÍA DE PEQUEÑAS MUESTRAS
La teoría de pequeñas muestra o también conocida como, “Teoría Exacta de Muestreo”,
”se utiliza al trabajar con tamaños muestrales pequeños que parten de dos o tres
mediciones, por tanto es aplicable a modelos estadísticos que trabajan con muestras
reducidas como: t de Student, Chi-cuadrada (𝑥 2 ) y el modelo F de Ficher” (Dos, 2004),
esta teoría está compuesta por un conjunto de estadígrafos de comparación (Grados de
Libertad, Error Estándar e Intervalos de Confianza), los cuales tienen la finalidad de
analizar a las muestras correspondientes. Por otra parte, si analizamos los beneficios y
las restricciones que posee esta teoría. Según (Dos, 2004) ,podemos encontrarnos tanto
pros y contras que posee el trabajar con pequeñas muestras, en primera “al calcular el
valor muestral por medio de un estadígrafo de comparación, no es necesaria una
estimación, por tanto, se tiene una mayor exactitud. Además, al no realizarse muchas
pruebas disminuye el costo y el tiempo, pero en contrapartida la precisión disminuye, ya
que el intervalo de confianza se hace más grande” (p. 20)
Ahora teniendo una noción de lo que contempla esta teoría, podemos adentrarnos en los
modelos estadísticos que aplican los principios de esta teoría. Es de mencionar que solo
tomaremos en cuenta la t de Student, mismo que se presenta en el siguiente apartado.
2
2.1.1. T-Student
La t de Student, inicialmente se diseñó, para “examinar las diferencias entre dos muestras
independientes y pequeñas que tengan distribución normal y homogeneidad en sus
varianzas” (Sánchez, 2015). Por otra parte, con respecto quien consolido sus principios,
hay fuentes que refieren a R. A. Fisher como el que la desarrollo y la bautizó Student en
honor a W. S. Gosset, quien usaba ese seudónimo para poder publicar sus trabajos en la
revista Biométrica, sin embargo, (Sánchez, 2015),menciona que, “Con el seudónimo de
estudiante (Student), William Sealy Gosset desarrolló la prueba t y la distribución t” (p.1).
Por otra parte, no en todas las muestras puede aplicarse la t de Student, sino que existen
ciertas condiciones que al no cumplirse los resultados obtenidos por los estadígrafos seria
irreverentemente incorrectos, estas condiciones son para (Dos, 2004),las siguientes: “Las
muestras deben ser extraídas de una población normal o aproximadamente normal, La
selección de las muestras debe ser aleatoria y las muestras deben ser independientes entre
sí” (p.23). Por tanto, para trabajar con t de Student, es importante que una muestra sea
normal, aleatoria e independiente. Ahora las muestras normales poseen características
que las definen como: “tienen una única moda, que coinciden con la media y mediana, o
que la curva al realizar la distribución tiene forma de campana” (Díaz p. e., 2001) . Ahora
con respecto a la prueba t, una de las formas de terminar t, al hacer una comparación de
medias muestrales es la siguiente:
Ecuación, para calcular Prueba

(𝑥̅ − µ)
𝑡=
𝐷𝑆/√𝑛
Fuente: (Dos, 2004)
“En dicha formula x representa a la media de la muestra correspondiente, u calculándose
por el producto de n y los grados de libertad k. En tanto DS, es la desviación estándar de
la muestra, el valor t tiende a extenderse desde -∞ a +∞” (Dos, 2004). Esta no es la única
3
forma de calcular la prueba t, sino existen casos particulares, en los cuales la forma de
calcular t, es diferente, sin embargo, la fórmula propuesta es la más utilizada, según Díaz,
p., et al (2001), estos son algunos casos particulares:
Student para proporciones
(𝑃 − 𝜋)
𝑡=
√𝜋. (1 − 𝜋)/𝑛
Fuente: (Dos, 2004)

Comparación de medias
(𝑥̅1 − 𝑥̅2 ) − (µ1 − µ2 )

𝑡=
𝐷𝑆 2 𝐷𝑆 2
√( 1 ) + ( 2 )
𝑛1 𝑛2
Fuente: (Dos, 2004)
2.2. DISTRIBUCIÓN DE PROBABILIDAD T-STUDENT
“La Distribución de probabilidad t-Student, surge del problema de estimar la media de
una población normalmente distribuida cuando el tamaño de la muestra es pequeño”
(Jimenez, 2017). Una de sus características es que aparece de manera natural, al
determinar las diferencia entre las dos medias y la construcción del intervalo de confianza.
Por otra parte, según (Cordova, 2013), las variables aleatorias “tienden a distribuirse en
función a la probabilidad de t, conjuntamente con los grados de libertad (k). Sin embargo,
para la construcción de gráficas es necesaria la densidad” (p. 13), dicha densidad se
calcula de la siguiente manera:
Ecuacion, para determinar la densidad

𝑘+1 (𝑘+1)
𝑟( ) −
2 𝑡2 2 𝑥
ℎ𝑘 (𝑡) = 𝑘 (1 + 𝑘 ) −∞ < 𝑡 < +∞ 𝑟(𝑝) = ∫0 𝑒 −𝑥 𝑥 𝑝−1 𝑑𝑥
𝑟( )√𝜋𝑘
2
Fuente: (Dos, 2004)
4
Sin embargo, mayormente se utilizan tablas para identificar qué valor toma la densidad,
mismas tablas que están en función a el valor de t y el valor de los grados de libertad (k),
dicha tabla se presenta en la Tabla 1. Con respecto a la gráfica en sí, para Córdova, T.
(2013), “La grafica resultante es simétrica, respecto al eje de coordenadas y no depende
del valor de k y es muy semejante a la gráfica de una distribución normal” (p. 13), se
presenta en la Gráfica 1, un ejemplo:
Imagen 1 Imagen 2
Distribución t de Student con 10 grados Valores críticos de distribución de t
de libertad
Fuente: (Cordova, 2013)
Fuente: (Flores, 2019)
5
2.3. PROPIEDADES
(Rodó, 2019) nos indica que:
• La distribución t de Student generalmente tiene forma de campana, y tiene una
mayor dispersión que la distribución normal estándar.
• La distribución t de Student es diferente para diferentes tamaños de muestra. A
medida que aumenta el tamaño de la muestra "𝑛", la prueba T de Student asume
la distribución normal. Aquí se dice que el tamaño de la muestra es grande cuando
𝑛 ≥ 30.
• La media es cero (muy similar a la distribución normal estándar). Y su
distribución es simétrica con respecto a aquella media.
• La distribución varía de − ∞ 𝑎 ∞ (𝑖𝑛𝑓𝑖𝑛𝑖𝑡𝑜).
• La forma de la distribución t cambia con el cambio en los grados de libertad. Con
infinitos grados de libertad, la distribución t es la misma que la distribución
normal estándar.
• La varianza es siempre mayor que uno y se puede definir solo cuando los grados
𝒗
de libertad 𝝂 ≥ 𝟑 y se da como: 𝑽𝒂𝒓 (𝒕) = [ 𝒗−𝟐]. ( 𝜎 = 1 para la distribución
normal estándar).
• Es menos puntiagudo en el centro y más alto en las colas, por lo que asume una
forma platicúrtica.
• La población es esencialmente normal (unimodal y básicamente simétrica)
2.4. TIPOS DE PRUEBA
Hay tres tipos de pruebas t que podemos realizar en función de los datos disponibles:
• Prueba t de una muestra
• Prueba t independiente de dos muestras

• Prueba t de muestras pareadas
a) Prueba t para una muestra
Según nos menciona (Minitab Statistical Software, 2020), en una prueba t de una
muestra, comparamos el promedio (o media) de un grupo con el promedio (o
media) establecido. Este promedio establecido puede ser cualquier valor teórico
(o puede ser la media de la población). La fórmula para calcular esto es:
𝑚−𝜇
𝑡=
𝑠/√𝑛
Dónde:
• t = t estadístico
• m = media del grupo
• µ = valor teórico o media poblacional
• s = desviación estándar del grupo
• n = tamaño del grupo o tamaño de la muestra
Una vez que se ha calculado el valor estadístico de t, la siguiente tarea es
compararlo con el valor crítico de la prueba t.
b) Prueba t independiente de dos muestras
Para la prueba t de dos muestras, según (Minitab Statistical Software, 2020), se
utiliza para comparar las medias de dos muestras diferentes. Aquí está la fórmula
para calcular el estadístico t para una prueba t de dos muestras:
𝑚𝐴 − 𝑚𝐵
𝑡=
𝑆2 𝑆2
√
𝑛𝐴 + 𝑛𝐵
Dónde:
• 𝑚𝐴 y 𝑚𝐵 son las medias de dos muestras diferentes
1
• 𝑛𝐴 y 𝑛𝐵 son los tamaños de muestra
• 𝑆 2 es un estimador de la varianza común de dos muestras, como:
2
∑(𝑥 − 𝑚𝐴 )2 + ∑(𝑥 − 𝑚𝐵 )2
𝑆 =
𝑛𝐴 + 𝑛𝐵 − 2
Aquí, el grado de libertad es 𝑛𝐴 + 𝑛𝐵 − 2. Finalmente se compara el t estadístico
calculado con el valor t crítico.
c) Prueba t de muestras pareadas
En la prueba t de muestras pareadas, de acuerdo a (Minitab Statistical Software,
2020) medimos un grupo en dos momentos diferentes. Comparamos
medias separadas para un grupo en dos momentos diferentes o bajo dos
condiciones diferentes. La fórmula para calcular el estadístico t para una
prueba t pareada es:
𝑚
𝑡=
𝑆/√𝑛
Dónde:
• 𝑡 = estadístico t
• 𝑚 = media del grupo
• µ = valor teórico o media poblacional
• 𝑠 = desviación estándar del grupo
• n = tamaño del grupo o tamaño de la muestra
Podemos tomar el grado de libertad en esta prueba como 𝑛 − 1 ya que solo está
involucrado un grupo.
2.5. ESCENARIOS Y SUPUESTOS DE LA PRUEBA T
2.5.1. Una muestra relacionada
2
Este escenario se da cuando se tiene dos medidas relacionadas de una misma muestra, las
cuales fueron obtenidas en diferentes lapsos de tiempo. Por otra parte, este escenario
presenta un supuesto, el cual es la diferencia entre las dos variables relacionadas donde
dicho resultado posee una distribución normal. (Roldán, 2016)
2.5.2. Dos muestras con varianzas homogéneas o heterogéneas
Estos escenarios se dan cuando se presentan dos muestras, en este caso se debe de
determinar si las varianzas de dichas muestras presentan homocedasticidad, es decir que,
si sus varianzas son similares y/o idénticas, si esto sucede se trataría de un escenario de
dos muestras con varianzas homogéneas, por lo contrario, si las varianzas de dichas
muestras son distintas, es decir que no poseen homocedasticidad se daría el escenario de
dos muestras con varianzas heterogéneas. Por otro lado, estos dos escenarios comparten
dos supuestos: el primero es que sus respectivos datos poseen una distribución normal y
el segundo es que dichas muestras permanecen a grupos totalmente independientes.
(Roldán, 2016)
PRUEBA T - STUDENT
UNA MUESTRA DOS MUESTRAS CON DOS MUESTRAS CON

RELACIONADA VARIANZAS HOMOGÉNEAS VARIANZAS
HETEROGÉNEAS
ANTES Y DESPÚES DE UNA

INTERVENCIÓN
ES NECESARIO CONOCER SI
POSEE
supuesto
HOMOCEDASTICIDAD
LA DIFERENCIA ENTRE LAS supuesto

DOS VARIABLES
RELACIONADAS POSEE UNA
DISTRIBUCIÓN NORMAL. • DISTRIBUCIÓN NORMAL
• GRUPOS INDEPENDIENTES
FUENTE: (Roldán, 2016)
3
Nota: La homocedasticidad en la estadística se da cuando la varianza del error
condicional a las variables explicativas es constante a lo largo de las observaciones, es
decir que la homocedasticidad se basa en comprobar si las varianzas son iguales o no a lo
largo del modelo estadístico.
2.6. GRADOS DE LIBERTAD
(Cruz, 2013) menciona que: “Los grados de libertad son iguales al número de
observaciones independientes que son libres de variar (el número de sujetos en los datos)
menos el número de parámetros estimados (el número de relaciones impuestas a los
datos). En otras palabras, están relacionados al tamaño de la muestra. Así mismo, los
grados de libertad son usados para definir las distribuciones estadísticas y con ellos poder
realizar las pruebas de hipótesis”.
Expresando matemáticamente lo anterior dicho, se define a los grados de libertad por:
Gl= n - 1 (PARA UNA MUESTRA)
Gl= (n1 + n2) - 1 (PARA DOS MUESTRA)
FUENTE: (Roldán, 2016)
Asimismo, se sabe que los grados de libertad están relacionados con el tamaño de la
muestra, es por ello que cuando más grande sea el tamaño de la muestra más grande serán
los grados de libertad y de esta manera la distribución t – Student se va aproximando a
una distribución normal estándar. Cabe resaltar que la prueba t – Student siempre depende
de los grados de libertad.
Por otro lado, algunos textos de estadística de uso común definen a los grados de libertad
de la siguiente manera:
4
“El valor de los grados de libertad se relaciona con el número de veces que se usa la
información de la muestra”. (Dawson, 2005)
“Se definen como el número de valores que podemos escoger libremente” (Levin, 1996)
“Los grados de libertad de una prueba estadística son el número de datos que son libres
de variar cuando se calcula tal prueba”. (Pagano, 2009)
Para retroalimentar la información dada ponemos el siguiente ejemplo:
Se desea conocer si la presencia de parásitos intestinales interfiere con la
absorción de hierro y por consiguiente producen niveles bajos de hemoglobina. Se
pone a prueba la hipótesis nula de no diferencia del nivel de hemoglobina promedio
de dos grupos de personas, el primer grupo procede de un área con alta prevalencia de
parasitosis intestinal y el segundo grupo procede de un área con baja prevalencia. Si el
número muestral del grupo uno es de 20 sujetos, y el tamaño del segundo es de 28,
entonces los grados de libertad asociados a la prueba t son:
GL = (20 - 1) + (28 - 1) = 46
Y tendremos en cuenta a los 46 grados de libertad cuando hallemos el punto crítico
para el rechazo de la hipótesis nula. Si consideramos un valor alfa igual a 0.05,
entonces nuestro punto crítico de rechazo será:
t(0.95 ; 46) = ±1.678
Y si nuestro estadístico t calculado cae a la izquierda de -1.678 o a la derecha de +1.678
se rechaza la hipótesis nula y por lo tanto hay evidencia que las medias de hemoglobina
de ambos grupos son diferentes. (Cruz, 2013)
5
2.7. ERROR ESTÁNDAR
El error estándar es una estimación de la cantidad que el valor de una estadística de prueba
varia de muestra a muestra, es decir que es la medida de la incertidumbre de la estadística
de prueba. (Turcio, 2015)
Asimismo, (Everitt, 2003) nos dice que “El error estándar es la desviación estándar de la
distribución muestral de un estadístico muestral”.
El error estándar se define matemáticamente como:
s
𝑆𝐸 =
√n
Donde:
SE = error estándar
s = desviación estándar de la muestra
n = número de observaciones de la muestra
FUENTE: (Díaz V. P., 2009)
Se sabe que el error estándar tiende a disminuir cuando aumenta el tamaño de las muestras
sin embargo para poder observar una disminución notoria es necesario cuadruplicar el
tamaño de la muestra para reducir el error estándar a la mitad.
Por otro lado, es muy importante resaltar que el error estándar es fundamental en la prueba
t – Student ya que el SE está involucrado en la fórmula para conseguir el punto de prueba,
el cual se denota como:
𝑥̅ − 𝑢
𝑡=
SE
Donde:
t = punto de prueba t
𝑥̅ = media muestral
6
u = media poblacional
SE = error estándar
2.8.HIPOTESIS NULA Y ALTERNATIVA

2.8 Hipótesis nula (H0H0): por lo general es la hipótesis escéptica, la que considera
que no hay diferencia o cambio. Suele contener en su definición el símbolo ==.
En el caso de comparar dos medias independientes la hipótesis nula considera
que μ1=μ2μ1=μ2.
2.8. Hipótesis alternativa (HAHA): considera que el valor real de la media
poblacional es mayor, menor o distinto del valor que establece la Ho. Suele
contener los símbolos >, <,≠>, <,≠. En el caso de comparar dos medias
independientes la hipótesis alternativa considera queμ1≠μ2μ1≠μ2.
2.9.INTERVALOS DE CONFIANZA
El intervalo de confianza de la diferencia de medias independientes para un nivel de
confianza de 1−α tiene la siguiente estructura:
𝑆12 𝑆22
[(𝑋1 − 𝑋2 ) ± 𝑡𝑑𝑓,1−𝛼 ∗ √ + ]
2 𝑛1 𝑛2
El valor t depende del porcentaje de seguridad del intervalo de confianza que se quiera
obtener. Se define como el valor (cuantil) para el cual en una distribución de Student, con
unos determinados grados de libertad, un porcentaje igual al porcentaje de confianza del
intervalo queda comprendido entre el valor -t y el valor +t buscado.
EJEMPLO
Supóngase que se busca el valor t para un intervalo de confianza del 95% en una
distribución t-Student con 15 grados de libertad. (Zanchez, 2015)
7
El valor t puede encontrarse en tablas tabuladas o mediante programas informáticos, en
R el valor t para un determinado intervalo de confianza y grados de libertad se puede
obtener con la función qt (). t = qt (p = confianza del intervalo + (1-confianza intervalo)
/2, df= , lower.tail = TRUE)
0.05
𝑞𝑡(𝑝 = 0.95 + , 𝑑𝑓 = 15, 𝑙𝑜𝑤𝑒𝑟. 𝑡𝑎𝑖𝑙 = 𝑇𝑅𝑈𝐸
2
##[1] 2.13145
2.10. USOS Y APLICACIONES
La prueba "t" de Student es un tipo de estadística deductiva. Se utiliza para determinar si
hay una diferencia significativa entre las medias de dos grupos. Con toda la estadística
deductiva, asumimos que las variables dependientes tienen una distribución normal.
Especificamos el nivel de la probabilidad (nivel de la alfa, nivel de la significación, p)
que estamos dispuestos a aceptar antes de que cerco datos p < .05 es un valor común se
utiliza. (Ticona, 2008).
Cómo usar las tablas
Las tablas de la distribución t de Student dan valores acumulados de izquierda
a derecha. Para valores negativos no olvidar la simetría de esta distribución, tal que
8
el valor de probabilidad a la derecha de t, es igual al valor de probabilidad a la
izquierda de -t.
Para extraer valores de probabilidad de esta tabla seguiremos los procedimientos
que presentaremos
Pasos para utilizar la tabla
1. Calcular los valores de la desviación estándar y el promedio y determinar el
valor del promedio para el que se desea calcular la probabilidad.
2. Determinar los grados de libertad (v) tal que v=n-1.
3. Calcular el valor de T
4. Localizar en tablas el valor de la probabilidad asociada a los valores de t y de
v. Los valores de t pueden ser negativos o positivos. Contrario a la tabla de
la distribución normal aquí los valores de t están dentro de la tabla y los valores
de probabilidad en la parte superior de la misma. En algunos casos puede
ser necesario interpolar para encontrar el valor exacto buscado, de lo contrario
se escoge el que más se aproxime.
3. CÁLCULOS
Ejercicio sobre una prueba de hipótesis para medias utilizando la distribución T-
Student:
Sea una empresa que fabrica insecticidas en la ciudad de Huancayo, dicha compañía
afirma que sus productos tienen un promedio de 25 horas de elaboración. Para mantener
este promedio se prueban 15 insecticidas cada mes, entonces si el valor t calculado cae
entre t-0.01 y t0.01 la empresa queda satisfecha con su afirmación.
¿Qué conclusiones debería sacar la empresa a partir de una muestra que tiene una media
de 27.5 horas y una desviación estándar de 5 horas?
9
DATOS:
μ= 25, X =27.5, n=16, σ=5, α=0.01 (nivel de significancia)
PASO 1:
Identificar nuestra hipótesis nula y alternativa
• H0=25
• H1 ≠ 25
PASO 2:
Calcular el valor crítico para la distribución
• α=0.01 equivale al 1%
- Grados de libertad
• Gl= n-1 =16-1=15
Posteriormente buscamos en nuestra tabla de datos un valor con los valores calculados.
TABLA T-STUDENT
r 0,25 0,2 0,15 0,1 0,05 0,025 0,01 0,005 0,0005

α
1 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,656 636,578
2 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,600
3 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841 12,924
4 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610
5 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869
6 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959
7 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,499 5,408
8 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,041
9 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781
10 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,587
11 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,437
12 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 4,318
13 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 4,221
14 0,692 0,868 1,076 1,345 1,761 2,145 2,624 3,977 4,140
15 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 4,073
10
Al graficar:
27.5
Región de aceptación
Región de rechazo Región de rechazo
-2,602 2,602
PASO 3:
Calculamos el estadístico de prueba en base a:

𝑋−μ
𝑡= σ
√𝑛
Donde:
• X: Media muestral
• μ: Media poblacional
• σ: Desviación estándar
• 𝑛: Tamaño de la muestra
27.5 − 25 2.5
𝑡= = =2
5 1.25
√16
PASO 4:
El valor de t=2 está entre los valores críticos: -2.602<t<2.602
Por lo tanto, la empresa queda satisfecha con su afirmación al aceptar la hipótesis nula.
PROGRAMACIÓN EN R
# Variables
X= 27.5 # media de la muestra
u=25 #valor hipotético
des_esta=5 # desviación estándar de la población
n=16 #tamaño de la muestra
11
# Operación
t=(X-u)/(des_esta/sqrt(n))
#Entonces calculamos el valor crítico a un nivel de significación de 0.05
alpha=0.01
gl=n-1
Vc_tabla=2.602
porc=pnorm(t)
a=porc*100
a
# Para poder graficar utilizamos el PLOT en una DISTRIBUCIÓN NORMAL
mean <- 0; sd <- 1
lb <- -2.602; ub <- 2.602
x <- seq(-4,4,length=1000)*sd + mean

hx <- dnorm(x,mean,sd)
plot(x, hx, type="n", xlab="t valores", ylab="",

main="Prueba t-student", axes=FALSE)
i <- x >= lb & x <= ub

lines(x, hx)
polygon(c(lb,x[i],ub), c(0,hx[i],0), col="red")
area <- pnorm(ub, mean, sd) - pnorm(lb, mean, sd)

result <- paste("P(",lb,"< t <",ub,") =",
signif(area, digits=4))
mtext(result,3)
axis(1, at=seq(-4, 4, 1), pos=0)
print(a) #es a % probable de que se cumpla hipótesis establecida inicialmente
12
4. DISCUSIÓN Y RESULTADOS
En base al resultado obtenido en el ejercicio anterior y mediante la gráfica brindada por
R studio (Figura 1), entendemos que la hipótesis es aceptada debido a que el porcentaje
resulta ser aproximadamente 99%.
(Figura 1)
Y es gracias al estadístico de prueba (t) calculada a partir de datos de muestra y la cual
utilizamos para nuestra prueba de hipótesis que, en términos más certeros, podemos decir
que se acepta la hipótesis nula y por ende, existe suficiente evidencia para demostrar que
el promedio de horas para la elaboración de insecticidas que tarda la empresa es de 25
horas; ratificando la afirmación inicial de la empresa.
5. CONCLUSIONES
• T-Student se diseñó para examinar las diferencias entre dos muestras, para trabajar
con este debemos tener en cuenta que la muestra sea normal (unimodal y básicamente
13
simétrica), aleatoria e independiente, lo utilizamos para determinar si hay una
diferencia significativa entre las medias de dos grupos. Para el cálculo matemático
debemos conocer los estadígrafos de comparación los cuales son: los grados de
libertad, es el número de datos que son libres de variar cuando se realiza la prueba; el
error estándar, es la medida de la incertidumbre de la estadística de prueba; el
intervalo de confianza, se necesita que el valor t depende del porcentaje de seguridad
de este, para lo cual se tiene que tener en cuenta los grados de libertad, entonces el
porcentaje de confianza del intervalo estará comprendido entre el valor -t y el
valor +t buscado. Además de algunos conceptos como: la hipótesis nula, que
considera que no hay diferencia o cambio; hipótesis alternativa, considera que el valor
real de la media es distinto del valor que establece la hipótesis nula.
• Lo antes mencionado nos ayudará a entender la distribución de probabilidad, que
estarán relacionadas con los grados de libertad y la densidad, usualmente se utilizan
las tablas que varían en función a la variable t y los grados de libertad. Sumado a ello
podremos conocer los tres tipos de pruebas que existen: prueba t de una muestra,
comparamos la media de un grupo con una media establecida; prueba t independiente
de dos muestras, comparamos las medias de dos muestras diferentes; prueba t de
muestras pareadas, comparamos medias separadas bajo dos condiciones diferentes.
• Podremos ver los casos supuestos: la de una muestra relacionada, el supuesto es la
diferencia entre las dos variables relacionadas donde dicho resultado posee una
distribución normal; la de dos muestras con varianzas homogéneas o heterogéneas, se
da cuando se presentan dos muestras y determinar si sus varianzas son similares
(homogénea), si las varianzas son distintas (heterogénea). Estos escenarios comparten
dos supuestos, primero que sus respectivos datos poseen una distribución normal y
segundo que dichas muestras permanecen a grupos totalmente independientes.
14
• Gracias a esto entenderemos la teoría de las pequeñas muestras, que lo utilizamos al
trabajar con tamaños muestrales pequeños, está compuesta de los estadígrafos antes
mencionados, cuya finalidad es analizar las muestras. Como toda teoría tiene sus pro
y contras. Entre los pros están: es de mayor exactitud, disminuye los costos y el
tiempo; entre los contras están: la exactitud disminuye.
• En el ejemplo presentado se puede observar que todos los conceptos mencionados son
utilizados, en la comparación del resultado final ratifica el dato brindado por la
empresa, que refiere que el tiempo promedio de la preparación del insecticida es de
25 horas, además, que la media como la desviación afectan a la curva y al área bajo
la misma (Anexo 1).
6. REFERENCIAS BIBLIOGRÁFICAS
Cordova, T. (2013). DISTRUBUCION T DE STUDENT [Grafica]. Obtenido de
slideshare: https://es.slideshare.net/torimatcordova/distribucion-t-de-student-
28545004
Cruz, J. (2013). ¿Qué significan los grados de libertad? REDALYC, 1-16.
Dawson, B. (2005). Bioestadística Médica. REDALYC.
Díaz, p. e. (Diciembre de 2001). La distribución normal. Obtenido de Fisterra:
https://www.fisterra.com/mbe/investiga/distr_normal/distr_normal.asp
Díaz, V. P. (2009). Errores Estadísticos. SCIELO.
Dos, M. (4 de Julio de 2004). Teoría de las muestras estadísticas de trabajo. Obtenido
de https://www.gestiopolis.com/teoria-de-las-muestras-estadisticas-de-trabajo/
Everitt, B. (2003). Wikipedia. Obtenido de The Cambridge Dictionary of Statistics:
https://es.wikipedia.org/wiki/Error_est%C3%A1ndar
Flores, D. (Agosto de 2019). Tabla t Student [Tabla]. Obtenido de slideshare:
https://www.slideshare.net/DANNYFLORES44/tabla-t-studentpdf-analitica
Jimenez, A. e. (2017). Estadística. Obtenido de Informacíon Estadistica:
https://sites.google.com/site/estadisitica5demayo/home
Levin, R. (1996). ESTADÍSTICA PARA ADMINISTRADORES. REDALYC.
Minitab Statistical Software. (2020). Tipos de pruebas t. Obtenido de Soporte técnico de
Minitab 19: https://www.minitab.com/es-mx/products/minitab/
Pagano, R. (2009). UNDERSTANDING STATISTICS IN THE SCIENCE. REDALYC.
15
Rodó, P. (2019). Propiedades de la distribución t de Student. Obtenido de
Economipedia: https://economipedia.com/definiciones/propiedades-de-la-
distribucion-t-de-student.html
Roldán, L. (10 de abril de 2016). YouTube. Obtenido de
https://www.youtube.com/watch?v=ekf208Fvzcw&t=624s
Sánchez, R. (2015). t-Student. Usos y abusos. SciELO,
http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S0188-
21982015000100009.
Ticona, O. (2008). estadistica T de Student. Obtenido de
https://es.scribd.com/document/324922286/MONOGRAFIA-DE-
ESTADISTICA-T-DE-STUDENT-docx
Turcio, R. A. (2015). t - student. Usos y abusos. SCIELO.
Zanchez, T. (2015). la prueba t y la distribución t. Obtenido de
http://www.scielo.org.mx/pdf/rmc/v26n1/v26n1a9.pdf
ANEXOS
ANEXO 1
TABLA 2
Demostración del papel de la media y desviación estándar en la curva al trabajar con T-
Student.
16
#demostraremos como al variar la media hacia 2 o -2, la curva se desplaza #demostraremos como es que con la desviación estándar, la curva reduce su
por lo cual la función de densidad, depende de la media ancho
x <- seq(-5, 5, length=100) x <- seq(-5, 5, length=100)
hx <- dnorm(x,mean = 0, sd = 1) hx <- dnorm(x,mean = 0, sd = 1)
degf <- c(-2, 2)
colors <- c("red", "blue", "black") degf <- c(2, 3, 4)
labels <- c("-2", "2", "0") colors <- c("red", "blue", "darkgreen", "black")
plot(x, hx, type="l", lwd=2,lty=2, xlab="x value", labels <- c("sd=2", "sd=3", "sd=4", "sd=0")
ylab="Density", main="COMPARACIÓN DE DISTRIBUCIÓN T")
abline(h = 0, v = 0, col = "gray60") plot(x, hx, type="l", lwd=2,lty=2, xlab="x value",
abline(h = -1:5, v = -3:3, col = "lightgray", lty = 3) ylab="Density", main="COMPARACIÓN DE DISTRIBUCIÓN T")
for (i in 1:4){ abline(h = 0, v = 0, col = "gray60")
lines(x, dnorm(x,mean = degf[i], sd = 1), lwd=2, col=colors[i]) abline(h = -1:5, v = -3:3, col = "lightgray", lty = 3)
}
legend("topright", inset=0, for (i in 1:4){
labels, title = "mean", lwd=2, lty=c(1, 1, 2), col=colors) lines(x, dnorm(x,mean = 0, sd = degf[i]), lwd=2, col=colors[i])
}
legend("topright", inset=0,
labels, lwd=2, lty=c(1, 1, 1, 2), col=colors)
17

Informe Tstudent

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Informe Tstudent

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD NACIONAL DEL CENTRO DEL PERÚ

FACULTAD DE INGENIERÍA QUÍMICA

ESCUELA ACADÉMICA ROFESIONAL DE INGENIERÍA QUÍMICA AMBIENTAL

ESCUELA ACADÉMICA ROFESIONAL DE INGENIERÍA QUÍMICA

043 C- ESTADÍSTICA Y DISEÑO ESPERIEMNTAL

INFORME 01- TERORÍA DE PEQUEÑAS MUESTRAS

Ing. Henry Raul Ochoa Leon

ESTUDIANTES E.A.P. CORREO INSTITUCIONAL

Arenales Jiménez Adrián IQA e_2019200868j@uncp.edu.pe

Camarena Álvarez Eli Anderson IQA e_2019200871c@uncp.edu.pe

Cuestas Chagua Ana Cristina IQ e_2020100441j@uncp.edu.pe

Mallqui Carrasco, IQA e_2019101093k@uncp.edu.pe

Pérez Segura Joyce Meyly IQ e_2020100449b@uncp.edu.pe

Toribio Tica Inés Yuliza IQA e_2019200893i@uncp.edu.pe

Vilcahuaman Esteban Anel Shantal IQA e_2019101102c@uncp.edu.pe

FECHA DE PRESENTACIÓN: 21/06/2021

desviación poblacional fuese desconocida, los empleados de dicha empresa tenían

Gosset adopto el seudónimo de “Student”.

La distribución T Student es una prueba de hipótesis de medias en la cual usamos la

la media de una población normalmente distribuida cuando el tamaño de la muestra es

pequeño, ya que en la distribución de t Student necesitamos que el espacio muestral no

pase de 30, una población que sea considerada normal.

ya que se desconoce la desviación población en esta distribución solo requerimos la

media muestral, población y error estándar.

Sus funciones se basan en establecer un intervalo de confianza, utilizando un nivel de

estas variables y aplicarla en la formula.

Finalmente se describen algunos ejemplos como medio para estimar el grado de

conocimiento del trabajo.

poder aplicarlas posteriormente en la resolución de problemas que requieran del

uso de esta distribución

Conocer el uso correcto de la distribución de T Student para la resolución de un

2.1.TEORÍA DE PEQUEÑAS MUESTRAS

La teoría de pequeñas muestra o también conocida como, “Teoría Exacta de Muestreo”,

reducidas como: t de Student, Chi-cuadrada (𝑥 2 ) y el modelo F de Ficher” (Dos, 2004),

esta teoría está compuesta por un conjunto de estadígrafos de comparación (Grados de

Libertad, Error Estándar e Intervalos de Confianza), los cuales tienen la finalidad de

valor muestral por medio de un estadígrafo de comparación, no es necesaria una

pruebas disminuye el costo y el tiempo, pero en contrapartida la precisión disminuye, ya

que el intervalo de confianza se hace más grande” (p. 20)

tomaremos en cuenta la t de Student, mismo que se presenta en el siguiente apartado.

independientes y pequeñas que tengan distribución normal y homogeneidad en sus

revista Biométrica, sin embargo, (Sánchez, 2015),menciona que, “Con el seudónimo de

estudiante (Student), William Sealy Gosset desarrolló la prueba t y la distribución t” (p.1).

muestras deben ser extraídas de una población normal o aproximadamente normal, La

normal, aleatoria e independiente. Ahora las muestras normales poseen características

medias muestrales es la siguiente:

Ecuación, para calcular Prueba

por el producto de n y los grados de libertad k. En tanto DS, es la desviación estándar de

p., et al (2001), estos son algunos casos particulares:

Student para proporciones

Fuente: (Dos, 2004)

(𝑥̅1 − 𝑥̅2 ) − (µ1 − µ2 )

Fuente: (Dos, 2004)

2.2. DISTRIBUCIÓN DE PROBABILIDAD T-STUDENT

“La Distribución de probabilidad t-Student, surge del problema de estimar la media de

una población normalmente distribuida cuando el tamaño de la muestra es pequeño”

(Jimenez, 2017). Una de sus características es que aparece de manera natural, al

para la construcción de gráficas es necesaria la densidad” (p. 13), dicha densidad se

calcula de la siguiente manera:

Ecuacion, para determinar la densidad

Fuente: (Dos, 2004)

(2013), “La grafica resultante es simétrica, respecto al eje de coordenadas y no depende