Está en la página 1de 24

UNIVERSIDAD NACIONAL DEL CENTRO DEL PERÚ

FACULTAD DE INGENIERÍA QUÍMICA

ESCUELA ACADÉMICA ROFESIONAL DE INGENIERÍA QUÍMICA AMBIENTAL

ESCUELA ACADÉMICA ROFESIONAL DE INGENIERÍA QUÍMICA

ASIGNATURA:

043 C- ESTADÍSTICA Y DISEÑO ESPERIEMNTAL

TÍTULO:

INFORME 01- TERORÍA DE PEQUEÑAS MUESTRAS

T-STUDENT

DOCENTE:

Ing. Henry Raul Ochoa Leon

INTEGRANTES:

ESTUDIANTES E.A.P. CORREO INSTITUCIONAL

Arenales Jiménez Adrián IQA e_2019200868j@uncp.edu.pe

Camarena Álvarez Eli Anderson IQA e_2019200871c@uncp.edu.pe

Cuestas Chagua Ana Cristina IQ e_2020100441j@uncp.edu.pe

Mallqui Carrasco, IQA e_2019101093k@uncp.edu.pe


Luz del Carmen
Medrano García Gianmarco IQA e_2019200884j@uncp.edu.pe

Pérez Segura Joyce Meyly IQ e_2020100449b@uncp.edu.pe

Toribio Tica Inés Yuliza IQA e_2019200893i@uncp.edu.pe

Vilcahuaman Esteban Anel Shantal IQA e_2019101102c@uncp.edu.pe

FECHA DE PRESENTACIÓN: 21/06/2021

HUANCAYO – PERU
1. INTRODUCCIÓN

T Student fue descubierta por un especialista en estadística de una empresa irlandesa, este

señor cuyo nombre era William.S. Gosset hizo inferencias acerca de la media cuando la

desviación poblacional fuese desconocida, los empleados de dicha empresa tenían

prohibido publicar trabajos de investigación bajo sus propios nombres, es por eso que

Gosset adopto el seudónimo de “Student”.

La distribución T Student es una prueba de hipótesis de medias en la cual usamos la

distribución “T”, es una distribución de probabilidad que surge del problema de estimar

la media de una población normalmente distribuida cuando el tamaño de la muestra es

pequeño, ya que en la distribución de t Student necesitamos que el espacio muestral no

pase de 30, una población que sea considerada normal.

ya que se desconoce la desviación población en esta distribución solo requerimos la

media muestral, población y error estándar.

Sus funciones se basan en establecer un intervalo de confianza, utilizando un nivel de

confianza y los grados de libertad, obteniendo valores de una tabla dada con respecto a

estas variables y aplicarla en la formula.

T Student es de gran utilidad, ya que reduce tiempo, costo y esfuerzos, se utiliza para

probar hipótesis y también para saber si dos muestras provienen de la misma población

Finalmente se describen algunos ejemplos como medio para estimar el grado de

conocimiento del trabajo.

1. OBJETIVOS

1.1.Objetivos generales

1
Analizar las características y aplicación de la distribución “T” de Student, para

poder aplicarlas posteriormente en la resolución de problemas que requieran del

uso de esta distribución

1.2.Objetivos Específicos

Conocer el uso correcto de la distribución de T Student para la resolución de un

problema en R Studio.

2. MARCO TEÓRICO

2.1.TEORÍA DE PEQUEÑAS MUESTRAS

La teoría de pequeñas muestra o también conocida como, “Teoría Exacta de Muestreo”,

”se utiliza al trabajar con tamaños muestrales pequeños que parten de dos o tres

mediciones, por tanto es aplicable a modelos estadísticos que trabajan con muestras

reducidas como: t de Student, Chi-cuadrada (𝑥 2 ) y el modelo F de Ficher” (Dos, 2004),

esta teoría está compuesta por un conjunto de estadígrafos de comparación (Grados de

Libertad, Error Estándar e Intervalos de Confianza), los cuales tienen la finalidad de

analizar a las muestras correspondientes. Por otra parte, si analizamos los beneficios y

las restricciones que posee esta teoría. Según (Dos, 2004) ,podemos encontrarnos tanto

pros y contras que posee el trabajar con pequeñas muestras, en primera “al calcular el

valor muestral por medio de un estadígrafo de comparación, no es necesaria una

estimación, por tanto, se tiene una mayor exactitud. Además, al no realizarse muchas

pruebas disminuye el costo y el tiempo, pero en contrapartida la precisión disminuye, ya

que el intervalo de confianza se hace más grande” (p. 20)

Ahora teniendo una noción de lo que contempla esta teoría, podemos adentrarnos en los

modelos estadísticos que aplican los principios de esta teoría. Es de mencionar que solo

tomaremos en cuenta la t de Student, mismo que se presenta en el siguiente apartado.

2
2.1.1. T-Student

La t de Student, inicialmente se diseñó, para “examinar las diferencias entre dos muestras

independientes y pequeñas que tengan distribución normal y homogeneidad en sus

varianzas” (Sánchez, 2015). Por otra parte, con respecto quien consolido sus principios,

hay fuentes que refieren a R. A. Fisher como el que la desarrollo y la bautizó Student en

honor a W. S. Gosset, quien usaba ese seudónimo para poder publicar sus trabajos en la

revista Biométrica, sin embargo, (Sánchez, 2015),menciona que, “Con el seudónimo de

estudiante (Student), William Sealy Gosset desarrolló la prueba t y la distribución t” (p.1).

Por otra parte, no en todas las muestras puede aplicarse la t de Student, sino que existen

ciertas condiciones que al no cumplirse los resultados obtenidos por los estadígrafos seria

irreverentemente incorrectos, estas condiciones son para (Dos, 2004),las siguientes: “Las

muestras deben ser extraídas de una población normal o aproximadamente normal, La

selección de las muestras debe ser aleatoria y las muestras deben ser independientes entre

sí” (p.23). Por tanto, para trabajar con t de Student, es importante que una muestra sea

normal, aleatoria e independiente. Ahora las muestras normales poseen características

que las definen como: “tienen una única moda, que coinciden con la media y mediana, o

que la curva al realizar la distribución tiene forma de campana” (Díaz p. e., 2001) . Ahora

con respecto a la prueba t, una de las formas de terminar t, al hacer una comparación de

medias muestrales es la siguiente:

Ecuación, para calcular Prueba


(𝑥̅ − µ)
𝑡=
𝐷𝑆/√𝑛
Fuente: (Dos, 2004)
“En dicha formula x representa a la media de la muestra correspondiente, u calculándose

por el producto de n y los grados de libertad k. En tanto DS, es la desviación estándar de

la muestra, el valor t tiende a extenderse desde -∞ a +∞” (Dos, 2004). Esta no es la única

3
forma de calcular la prueba t, sino existen casos particulares, en los cuales la forma de

calcular t, es diferente, sin embargo, la fórmula propuesta es la más utilizada, según Díaz,

p., et al (2001), estos son algunos casos particulares:

Student para proporciones

(𝑃 − 𝜋)
𝑡=
√𝜋. (1 − 𝜋)/𝑛

Fuente: (Dos, 2004)


Comparación de medias

(𝑥̅1 − 𝑥̅2 ) − (µ1 − µ2 )


𝑡=
𝐷𝑆 2 𝐷𝑆 2
√( 1 ) + ( 2 )
𝑛1 𝑛2

Fuente: (Dos, 2004)

2.2. DISTRIBUCIÓN DE PROBABILIDAD T-STUDENT

“La Distribución de probabilidad t-Student, surge del problema de estimar la media de

una población normalmente distribuida cuando el tamaño de la muestra es pequeño”

(Jimenez, 2017). Una de sus características es que aparece de manera natural, al

determinar las diferencia entre las dos medias y la construcción del intervalo de confianza.

Por otra parte, según (Cordova, 2013), las variables aleatorias “tienden a distribuirse en

función a la probabilidad de t, conjuntamente con los grados de libertad (k). Sin embargo,

para la construcción de gráficas es necesaria la densidad” (p. 13), dicha densidad se

calcula de la siguiente manera:

Ecuacion, para determinar la densidad


𝑘+1 (𝑘+1)
𝑟( ) −
2 𝑡2 2 𝑥
ℎ𝑘 (𝑡) = 𝑘 (1 + 𝑘 ) −∞ < 𝑡 < +∞ 𝑟(𝑝) = ∫0 𝑒 −𝑥 𝑥 𝑝−1 𝑑𝑥
𝑟( )√𝜋𝑘
2

Fuente: (Dos, 2004)

4
Sin embargo, mayormente se utilizan tablas para identificar qué valor toma la densidad,

mismas tablas que están en función a el valor de t y el valor de los grados de libertad (k),

dicha tabla se presenta en la Tabla 1. Con respecto a la gráfica en sí, para Córdova, T.

(2013), “La grafica resultante es simétrica, respecto al eje de coordenadas y no depende

del valor de k y es muy semejante a la gráfica de una distribución normal” (p. 13), se

presenta en la Gráfica 1, un ejemplo:

Imagen 1 Imagen 2
Distribución t de Student con 10 grados Valores críticos de distribución de t
de libertad

Fuente: (Cordova, 2013)

Fuente: (Flores, 2019)

5
2.3. PROPIEDADES
(Rodó, 2019) nos indica que:

• La distribución t de Student generalmente tiene forma de campana, y tiene una

mayor dispersión que la distribución normal estándar.

• La distribución t de Student es diferente para diferentes tamaños de muestra. A

medida que aumenta el tamaño de la muestra "𝑛", la prueba T de Student asume

la distribución normal. Aquí se dice que el tamaño de la muestra es grande cuando

𝑛 ≥ 30.

• La media es cero (muy similar a la distribución normal estándar). Y su

distribución es simétrica con respecto a aquella media.

• La distribución varía de − ∞ 𝑎 ∞ (𝑖𝑛𝑓𝑖𝑛𝑖𝑡𝑜).

• La forma de la distribución t cambia con el cambio en los grados de libertad. Con

infinitos grados de libertad, la distribución t es la misma que la distribución

normal estándar.

• La varianza es siempre mayor que uno y se puede definir solo cuando los grados

𝒗
de libertad 𝝂 ≥ 𝟑 y se da como: 𝑽𝒂𝒓 (𝒕) = [ 𝒗−𝟐]. ( 𝜎 = 1 para la distribución

normal estándar).

• Es menos puntiagudo en el centro y más alto en las colas, por lo que asume una

forma platicúrtica.

• La población es esencialmente normal (unimodal y básicamente simétrica)

2.4. TIPOS DE PRUEBA

Hay tres tipos de pruebas t que podemos realizar en función de los datos disponibles:

• Prueba t de una muestra

• Prueba t independiente de dos muestras


• Prueba t de muestras pareadas

a) Prueba t para una muestra

Según nos menciona (Minitab Statistical Software, 2020), en una prueba t de una

muestra, comparamos el promedio (o media) de un grupo con el promedio (o

media) establecido. Este promedio establecido puede ser cualquier valor teórico

(o puede ser la media de la población). La fórmula para calcular esto es:

𝑚−𝜇
𝑡=
𝑠/√𝑛
Dónde:
• t = t estadístico

• m = media del grupo

• µ = valor teórico o media poblacional

• s = desviación estándar del grupo

• n = tamaño del grupo o tamaño de la muestra

Una vez que se ha calculado el valor estadístico de t, la siguiente tarea es

compararlo con el valor crítico de la prueba t.

b) Prueba t independiente de dos muestras

Para la prueba t de dos muestras, según (Minitab Statistical Software, 2020), se

utiliza para comparar las medias de dos muestras diferentes. Aquí está la fórmula

para calcular el estadístico t para una prueba t de dos muestras:

𝑚𝐴 − 𝑚𝐵
𝑡=
𝑆2 𝑆2

𝑛𝐴 + 𝑛𝐵
Dónde:
• 𝑚𝐴 y 𝑚𝐵 son las medias de dos muestras diferentes

1
• 𝑛𝐴 y 𝑛𝐵 son los tamaños de muestra

• 𝑆 2 es un estimador de la varianza común de dos muestras, como:

2
∑(𝑥 − 𝑚𝐴 )2 + ∑(𝑥 − 𝑚𝐵 )2
𝑆 =
𝑛𝐴 + 𝑛𝐵 − 2

Aquí, el grado de libertad es 𝑛𝐴 + 𝑛𝐵 − 2. Finalmente se compara el t estadístico

calculado con el valor t crítico.

c) Prueba t de muestras pareadas

En la prueba t de muestras pareadas, de acuerdo a (Minitab Statistical Software,

2020) medimos un grupo en dos momentos diferentes. Comparamos

medias separadas para un grupo en dos momentos diferentes o bajo dos

condiciones diferentes. La fórmula para calcular el estadístico t para una

prueba t pareada es:

𝑚
𝑡=
𝑆/√𝑛
Dónde:
• 𝑡 = estadístico t

• 𝑚 = media del grupo

• µ = valor teórico o media poblacional

• 𝑠 = desviación estándar del grupo

• n = tamaño del grupo o tamaño de la muestra

Podemos tomar el grado de libertad en esta prueba como 𝑛 − 1 ya que solo está

involucrado un grupo.

2.5. ESCENARIOS Y SUPUESTOS DE LA PRUEBA T

2.5.1. Una muestra relacionada

2
Este escenario se da cuando se tiene dos medidas relacionadas de una misma muestra, las

cuales fueron obtenidas en diferentes lapsos de tiempo. Por otra parte, este escenario

presenta un supuesto, el cual es la diferencia entre las dos variables relacionadas donde

dicho resultado posee una distribución normal. (Roldán, 2016)

2.5.2. Dos muestras con varianzas homogéneas o heterogéneas

Estos escenarios se dan cuando se presentan dos muestras, en este caso se debe de

determinar si las varianzas de dichas muestras presentan homocedasticidad, es decir que,

si sus varianzas son similares y/o idénticas, si esto sucede se trataría de un escenario de

dos muestras con varianzas homogéneas, por lo contrario, si las varianzas de dichas

muestras son distintas, es decir que no poseen homocedasticidad se daría el escenario de

dos muestras con varianzas heterogéneas. Por otro lado, estos dos escenarios comparten

dos supuestos: el primero es que sus respectivos datos poseen una distribución normal y

el segundo es que dichas muestras permanecen a grupos totalmente independientes.

(Roldán, 2016)
PRUEBA T - STUDENT

UNA MUESTRA DOS MUESTRAS CON DOS MUESTRAS CON


RELACIONADA VARIANZAS HOMOGÉNEAS VARIANZAS
HETEROGÉNEAS

ANTES Y DESPÚES DE UNA


INTERVENCIÓN
ES NECESARIO CONOCER SI
POSEE
supuesto
HOMOCEDASTICIDAD

LA DIFERENCIA ENTRE LAS supuesto


DOS VARIABLES
RELACIONADAS POSEE UNA
DISTRIBUCIÓN NORMAL. • DISTRIBUCIÓN NORMAL
• GRUPOS INDEPENDIENTES

FUENTE: (Roldán, 2016)

3
Nota: La homocedasticidad en la estadística se da cuando la varianza del error

condicional a las variables explicativas es constante a lo largo de las observaciones, es

decir que la homocedasticidad se basa en comprobar si las varianzas son iguales o no a lo

largo del modelo estadístico.

2.6. GRADOS DE LIBERTAD

(Cruz, 2013) menciona que: “Los grados de libertad son iguales al número de

observaciones independientes que son libres de variar (el número de sujetos en los datos)

menos el número de parámetros estimados (el número de relaciones impuestas a los

datos). En otras palabras, están relacionados al tamaño de la muestra. Así mismo, los

grados de libertad son usados para definir las distribuciones estadísticas y con ellos poder

realizar las pruebas de hipótesis”.

Expresando matemáticamente lo anterior dicho, se define a los grados de libertad por:

Gl= n - 1 (PARA UNA MUESTRA)

Gl= (n1 + n2) - 1 (PARA DOS MUESTRA)

FUENTE: (Roldán, 2016)

Asimismo, se sabe que los grados de libertad están relacionados con el tamaño de la

muestra, es por ello que cuando más grande sea el tamaño de la muestra más grande serán

los grados de libertad y de esta manera la distribución t – Student se va aproximando a

una distribución normal estándar. Cabe resaltar que la prueba t – Student siempre depende

de los grados de libertad.

Por otro lado, algunos textos de estadística de uso común definen a los grados de libertad

de la siguiente manera:

4
“El valor de los grados de libertad se relaciona con el número de veces que se usa la

información de la muestra”. (Dawson, 2005)

“Se definen como el número de valores que podemos escoger libremente” (Levin, 1996)

“Los grados de libertad de una prueba estadística son el número de datos que son libres

de variar cuando se calcula tal prueba”. (Pagano, 2009)

Para retroalimentar la información dada ponemos el siguiente ejemplo:

Se desea conocer si la presencia de parásitos intestinales interfiere con la

absorción de hierro y por consiguiente producen niveles bajos de hemoglobina. Se

pone a prueba la hipótesis nula de no diferencia del nivel de hemoglobina promedio

de dos grupos de personas, el primer grupo procede de un área con alta prevalencia de

parasitosis intestinal y el segundo grupo procede de un área con baja prevalencia. Si el

número muestral del grupo uno es de 20 sujetos, y el tamaño del segundo es de 28,

entonces los grados de libertad asociados a la prueba t son:

GL = (20 - 1) + (28 - 1) = 46

Y tendremos en cuenta a los 46 grados de libertad cuando hallemos el punto crítico

para el rechazo de la hipótesis nula. Si consideramos un valor alfa igual a 0.05,

entonces nuestro punto crítico de rechazo será:

t(0.95 ; 46) = ±1.678

Y si nuestro estadístico t calculado cae a la izquierda de -1.678 o a la derecha de +1.678

se rechaza la hipótesis nula y por lo tanto hay evidencia que las medias de hemoglobina

de ambos grupos son diferentes. (Cruz, 2013)

5
2.7. ERROR ESTÁNDAR

El error estándar es una estimación de la cantidad que el valor de una estadística de prueba

varia de muestra a muestra, es decir que es la medida de la incertidumbre de la estadística

de prueba. (Turcio, 2015)

Asimismo, (Everitt, 2003) nos dice que “El error estándar es la desviación estándar de la

distribución muestral de un estadístico muestral”.

El error estándar se define matemáticamente como:

s
𝑆𝐸 =
√n
Donde:
SE = error estándar

s = desviación estándar de la muestra

n = número de observaciones de la muestra

FUENTE: (Díaz V. P., 2009)

Se sabe que el error estándar tiende a disminuir cuando aumenta el tamaño de las muestras

sin embargo para poder observar una disminución notoria es necesario cuadruplicar el

tamaño de la muestra para reducir el error estándar a la mitad.

Por otro lado, es muy importante resaltar que el error estándar es fundamental en la prueba

t – Student ya que el SE está involucrado en la fórmula para conseguir el punto de prueba,

el cual se denota como:

𝑥̅ − 𝑢
𝑡=
SE
Donde:
t = punto de prueba t

𝑥̅ = media muestral

6
u = media poblacional

SE = error estándar

2.8.HIPOTESIS NULA Y ALTERNATIVA


2.8 Hipótesis nula (H0H0): por lo general es la hipótesis escéptica, la que considera

que no hay diferencia o cambio. Suele contener en su definición el símbolo ==.

En el caso de comparar dos medias independientes la hipótesis nula considera

que μ1=μ2μ1=μ2.

2.8. Hipótesis alternativa (HAHA): considera que el valor real de la media

poblacional es mayor, menor o distinto del valor que establece la Ho. Suele

contener los símbolos >, <,≠>, <,≠. En el caso de comparar dos medias

independientes la hipótesis alternativa considera queμ1≠μ2μ1≠μ2.

2.9.INTERVALOS DE CONFIANZA

El intervalo de confianza de la diferencia de medias independientes para un nivel de

confianza de 1−α tiene la siguiente estructura:

𝑆12 𝑆22
[(𝑋1 − 𝑋2 ) ± 𝑡𝑑𝑓,1−𝛼 ∗ √ + ]
2 𝑛1 𝑛2

El valor t depende del porcentaje de seguridad del intervalo de confianza que se quiera

obtener. Se define como el valor (cuantil) para el cual en una distribución de Student, con

unos determinados grados de libertad, un porcentaje igual al porcentaje de confianza del

intervalo queda comprendido entre el valor -t y el valor +t buscado.

EJEMPLO

Supóngase que se busca el valor t para un intervalo de confianza del 95% en una

distribución t-Student con 15 grados de libertad. (Zanchez, 2015)

7
El valor t puede encontrarse en tablas tabuladas o mediante programas informáticos, en

R el valor t para un determinado intervalo de confianza y grados de libertad se puede

obtener con la función qt (). t = qt (p = confianza del intervalo + (1-confianza intervalo)

/2, df= , lower.tail = TRUE)

0.05
𝑞𝑡(𝑝 = 0.95 + , 𝑑𝑓 = 15, 𝑙𝑜𝑤𝑒𝑟. 𝑡𝑎𝑖𝑙 = 𝑇𝑅𝑈𝐸
2

##[1] 2.13145
2.10. USOS Y APLICACIONES

La prueba "t" de Student es un tipo de estadística deductiva. Se utiliza para determinar si

hay una diferencia significativa entre las medias de dos grupos. Con toda la estadística

deductiva, asumimos que las variables dependientes tienen una distribución normal.

Especificamos el nivel de la probabilidad (nivel de la alfa, nivel de la significación, p)

que estamos dispuestos a aceptar antes de que cerco datos p < .05 es un valor común se

utiliza. (Ticona, 2008).

Cómo usar las tablas

Las tablas de la distribución t de Student dan valores acumulados de izquierda

a derecha. Para valores negativos no olvidar la simetría de esta distribución, tal que

8
el valor de probabilidad a la derecha de t, es igual al valor de probabilidad a la

izquierda de -t.

Para extraer valores de probabilidad de esta tabla seguiremos los procedimientos

que presentaremos

Pasos para utilizar la tabla

1. Calcular los valores de la desviación estándar y el promedio y determinar el

valor del promedio para el que se desea calcular la probabilidad.

2. Determinar los grados de libertad (v) tal que v=n-1.

3. Calcular el valor de T

4. Localizar en tablas el valor de la probabilidad asociada a los valores de t y de

v. Los valores de t pueden ser negativos o positivos. Contrario a la tabla de

la distribución normal aquí los valores de t están dentro de la tabla y los valores

de probabilidad en la parte superior de la misma. En algunos casos puede

ser necesario interpolar para encontrar el valor exacto buscado, de lo contrario

se escoge el que más se aproxime.

3. CÁLCULOS

Ejercicio sobre una prueba de hipótesis para medias utilizando la distribución T-

Student:

Sea una empresa que fabrica insecticidas en la ciudad de Huancayo, dicha compañía

afirma que sus productos tienen un promedio de 25 horas de elaboración. Para mantener

este promedio se prueban 15 insecticidas cada mes, entonces si el valor t calculado cae

entre t-0.01 y t0.01 la empresa queda satisfecha con su afirmación.

¿Qué conclusiones debería sacar la empresa a partir de una muestra que tiene una media

de 27.5 horas y una desviación estándar de 5 horas?

9
DATOS:

μ= 25, X =27.5, n=16, σ=5, α=0.01 (nivel de significancia)

PASO 1:

Identificar nuestra hipótesis nula y alternativa

• H0=25

• H1 ≠ 25

PASO 2:

Calcular el valor crítico para la distribución

• α=0.01 equivale al 1%

- Grados de libertad

• Gl= n-1 =16-1=15

Posteriormente buscamos en nuestra tabla de datos un valor con los valores calculados.

TABLA T-STUDENT

r 0,25 0,2 0,15 0,1 0,05 0,025 0,01 0,005 0,0005


α
1 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,656 636,578
2 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,600
3 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841 12,924
4 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610
5 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869
6 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959
7 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,499 5,408
8 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,041
9 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781
10 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,587
11 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,437
12 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 4,318
13 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 4,221
14 0,692 0,868 1,076 1,345 1,761 2,145 2,624 3,977 4,140
15 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 4,073

10
Al graficar:
27.5

Región de aceptación

Región de rechazo Región de rechazo

-2,602 2,602

PASO 3:

Calculamos el estadístico de prueba en base a:


𝑋−μ
𝑡= σ
√𝑛
Donde:
• X: Media muestral
• μ: Media poblacional
• σ: Desviación estándar
• 𝑛: Tamaño de la muestra
27.5 − 25 2.5
𝑡= = =2
5 1.25
√16

PASO 4:

El valor de t=2 está entre los valores críticos: -2.602<t<2.602

Por lo tanto, la empresa queda satisfecha con su afirmación al aceptar la hipótesis nula.

PROGRAMACIÓN EN R

# Variables
X= 27.5 # media de la muestra
u=25 #valor hipotético
des_esta=5 # desviación estándar de la población
n=16 #tamaño de la muestra

11
# Operación
t=(X-u)/(des_esta/sqrt(n))
#Entonces calculamos el valor crítico a un nivel de significación de 0.05
alpha=0.01
gl=n-1
Vc_tabla=2.602
porc=pnorm(t)
a=porc*100
a
# Para poder graficar utilizamos el PLOT en una DISTRIBUCIÓN NORMAL
mean <- 0; sd <- 1
lb <- -2.602; ub <- 2.602

x <- seq(-4,4,length=1000)*sd + mean


hx <- dnorm(x,mean,sd)

plot(x, hx, type="n", xlab="t valores", ylab="",


main="Prueba t-student", axes=FALSE)

i <- x >= lb & x <= ub


lines(x, hx)
polygon(c(lb,x[i],ub), c(0,hx[i],0), col="red")

area <- pnorm(ub, mean, sd) - pnorm(lb, mean, sd)


result <- paste("P(",lb,"< t <",ub,") =",
signif(area, digits=4))
mtext(result,3)
axis(1, at=seq(-4, 4, 1), pos=0)
print(a) #es a % probable de que se cumpla hipótesis establecida inicialmente

12
4. DISCUSIÓN Y RESULTADOS

En base al resultado obtenido en el ejercicio anterior y mediante la gráfica brindada por

R studio (Figura 1), entendemos que la hipótesis es aceptada debido a que el porcentaje

resulta ser aproximadamente 99%.

(Figura 1)

Y es gracias al estadístico de prueba (t) calculada a partir de datos de muestra y la cual

utilizamos para nuestra prueba de hipótesis que, en términos más certeros, podemos decir

que se acepta la hipótesis nula y por ende, existe suficiente evidencia para demostrar que

el promedio de horas para la elaboración de insecticidas que tarda la empresa es de 25

horas; ratificando la afirmación inicial de la empresa.

5. CONCLUSIONES

• T-Student se diseñó para examinar las diferencias entre dos muestras, para trabajar

con este debemos tener en cuenta que la muestra sea normal (unimodal y básicamente

13
simétrica), aleatoria e independiente, lo utilizamos para determinar si hay una

diferencia significativa entre las medias de dos grupos. Para el cálculo matemático

debemos conocer los estadígrafos de comparación los cuales son: los grados de

libertad, es el número de datos que son libres de variar cuando se realiza la prueba; el

error estándar, es la medida de la incertidumbre de la estadística de prueba; el

intervalo de confianza, se necesita que el valor t depende del porcentaje de seguridad

de este, para lo cual se tiene que tener en cuenta los grados de libertad, entonces el

porcentaje de confianza del intervalo estará comprendido entre el valor -t y el

valor +t buscado. Además de algunos conceptos como: la hipótesis nula, que

considera que no hay diferencia o cambio; hipótesis alternativa, considera que el valor

real de la media es distinto del valor que establece la hipótesis nula.

• Lo antes mencionado nos ayudará a entender la distribución de probabilidad, que

estarán relacionadas con los grados de libertad y la densidad, usualmente se utilizan

las tablas que varían en función a la variable t y los grados de libertad. Sumado a ello

podremos conocer los tres tipos de pruebas que existen: prueba t de una muestra,

comparamos la media de un grupo con una media establecida; prueba t independiente

de dos muestras, comparamos las medias de dos muestras diferentes; prueba t de

muestras pareadas, comparamos medias separadas bajo dos condiciones diferentes.

• Podremos ver los casos supuestos: la de una muestra relacionada, el supuesto es la

diferencia entre las dos variables relacionadas donde dicho resultado posee una

distribución normal; la de dos muestras con varianzas homogéneas o heterogéneas, se

da cuando se presentan dos muestras y determinar si sus varianzas son similares

(homogénea), si las varianzas son distintas (heterogénea). Estos escenarios comparten

dos supuestos, primero que sus respectivos datos poseen una distribución normal y

segundo que dichas muestras permanecen a grupos totalmente independientes.

14
• Gracias a esto entenderemos la teoría de las pequeñas muestras, que lo utilizamos al

trabajar con tamaños muestrales pequeños, está compuesta de los estadígrafos antes

mencionados, cuya finalidad es analizar las muestras. Como toda teoría tiene sus pro

y contras. Entre los pros están: es de mayor exactitud, disminuye los costos y el

tiempo; entre los contras están: la exactitud disminuye.

• En el ejemplo presentado se puede observar que todos los conceptos mencionados son

utilizados, en la comparación del resultado final ratifica el dato brindado por la

empresa, que refiere que el tiempo promedio de la preparación del insecticida es de

25 horas, además, que la media como la desviación afectan a la curva y al área bajo

la misma (Anexo 1).

6. REFERENCIAS BIBLIOGRÁFICAS
Cordova, T. (2013). DISTRUBUCION T DE STUDENT [Grafica]. Obtenido de
slideshare: https://es.slideshare.net/torimatcordova/distribucion-t-de-student-
28545004
Cruz, J. (2013). ¿Qué significan los grados de libertad? REDALYC, 1-16.
Dawson, B. (2005). Bioestadística Médica. REDALYC.
Díaz, p. e. (Diciembre de 2001). La distribución normal. Obtenido de Fisterra:
https://www.fisterra.com/mbe/investiga/distr_normal/distr_normal.asp
Díaz, V. P. (2009). Errores Estadísticos. SCIELO.
Dos, M. (4 de Julio de 2004). Teoría de las muestras estadísticas de trabajo. Obtenido
de https://www.gestiopolis.com/teoria-de-las-muestras-estadisticas-de-trabajo/
Everitt, B. (2003). Wikipedia. Obtenido de The Cambridge Dictionary of Statistics:
https://es.wikipedia.org/wiki/Error_est%C3%A1ndar
Flores, D. (Agosto de 2019). Tabla t Student [Tabla]. Obtenido de slideshare:
https://www.slideshare.net/DANNYFLORES44/tabla-t-studentpdf-analitica
Jimenez, A. e. (2017). Estadística. Obtenido de Informacíon Estadistica:
https://sites.google.com/site/estadisitica5demayo/home
Levin, R. (1996). ESTADÍSTICA PARA ADMINISTRADORES. REDALYC.
Minitab Statistical Software. (2020). Tipos de pruebas t. Obtenido de Soporte técnico de
Minitab 19: https://www.minitab.com/es-mx/products/minitab/
Pagano, R. (2009). UNDERSTANDING STATISTICS IN THE SCIENCE. REDALYC.

15
Rodó, P. (2019). Propiedades de la distribución t de Student. Obtenido de
Economipedia: https://economipedia.com/definiciones/propiedades-de-la-
distribucion-t-de-student.html
Roldán, L. (10 de abril de 2016). YouTube. Obtenido de
https://www.youtube.com/watch?v=ekf208Fvzcw&t=624s
Sánchez, R. (2015). t-Student. Usos y abusos. SciELO,
http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S0188-
21982015000100009.
Ticona, O. (2008). estadistica T de Student. Obtenido de
https://es.scribd.com/document/324922286/MONOGRAFIA-DE-
ESTADISTICA-T-DE-STUDENT-docx
Turcio, R. A. (2015). t - student. Usos y abusos. SCIELO.
Zanchez, T. (2015). la prueba t y la distribución t. Obtenido de
http://www.scielo.org.mx/pdf/rmc/v26n1/v26n1a9.pdf

ANEXOS
ANEXO 1
TABLA 2
Demostración del papel de la media y desviación estándar en la curva al trabajar con T-
Student.

16
#demostraremos como al variar la media hacia 2 o -2, la curva se desplaza #demostraremos como es que con la desviación estándar, la curva reduce su
por lo cual la función de densidad, depende de la media ancho
x <- seq(-5, 5, length=100) x <- seq(-5, 5, length=100)
hx <- dnorm(x,mean = 0, sd = 1) hx <- dnorm(x,mean = 0, sd = 1)
degf <- c(-2, 2)
colors <- c("red", "blue", "black") degf <- c(2, 3, 4)
labels <- c("-2", "2", "0") colors <- c("red", "blue", "darkgreen", "black")
plot(x, hx, type="l", lwd=2,lty=2, xlab="x value", labels <- c("sd=2", "sd=3", "sd=4", "sd=0")
ylab="Density", main="COMPARACIÓN DE DISTRIBUCIÓN T")
abline(h = 0, v = 0, col = "gray60") plot(x, hx, type="l", lwd=2,lty=2, xlab="x value",
abline(h = -1:5, v = -3:3, col = "lightgray", lty = 3) ylab="Density", main="COMPARACIÓN DE DISTRIBUCIÓN T")
for (i in 1:4){ abline(h = 0, v = 0, col = "gray60")
lines(x, dnorm(x,mean = degf[i], sd = 1), lwd=2, col=colors[i]) abline(h = -1:5, v = -3:3, col = "lightgray", lty = 3)
}
legend("topright", inset=0, for (i in 1:4){
labels, title = "mean", lwd=2, lty=c(1, 1, 2), col=colors) lines(x, dnorm(x,mean = 0, sd = degf[i]), lwd=2, col=colors[i])
}

legend("topright", inset=0,
labels, lwd=2, lty=c(1, 1, 1, 2), col=colors)

17

También podría gustarte