Está en la página 1de 13

UNIVERSIDAD NACIONAL DE SAN AGUSTÍN

FACULTAD DE INGENIERÍA DE PROCESOS


ESCUELA PROFESIONAL DE INGENIERÍA QUÍMICA

«DISTRIBUCIÓN T DE STUDENT Y
CHI-CUADRADO»

ASIGNATURA : ESTADÍSTICA Y DISEÑO EXPERIMENTAL

LABORATORIO : N° 11

PRESENTADO POR : NÚÑEZ CCASA ÁNGEL YOEL

Julio, Arequipa 2022


Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería

GUÍA DE PRÁCTICAS

DISTRIBUCIÓN t DE STUDENT y DISTRIBUCIÓN CHI-CUADRADO

1. TEMA

a. DISTRIBUCIÓN T STUDENT

Descrita por William S. Gosset en 1908. Publicaba bajo el pseudónimo de «Studente» mientras
trabajaba para la cervecería Guinnes en Irlanda. Está diseñada para probar hipótesis en estudios con
muestras pequeñas menores a 30.
La fórmula general para la T de Student es la siguiente:

X−μ
t=
σ
√n
En donde el numerador representa la diferencia a probar y el denominador la desviación estándar de
la diferencia llamado también Error Estándar. En esta fórmula t representa al valor estadístico que
estamos buscando X es el promedio de la variable analizada de la muestra, y µ es el promedio
poblacional de la variable a estudiar. En el denominador tenemos a σ como representativo de la
desviación estándar de la muestra y n el tamaño de ésta.

Grados libertad

El número de grados de libertad es igual al tamaño de la muestra (número de observaciones


independientes) menos 1.

gl=df =( n−1 )

Si pudiera expresar en un cierto número de pasos para resolver un problema de t de student tendría
que declarar los siguientes:

PASO 1
Plantear la hipótesis nula (H0) y la hipótesis alternativa (H1). La hipótesis alternativa plantea
matemáticamente lo que queremos demostrar, en tanto que la hipótesis nula plantea exactamente lo
contrario.

PASO 2
Determinar el nivel de significancia (rango de aceptación de la hipótesis alternativa), a.
Se considera un nivel alfa de: 0.05 para proyectos de investigación; 0.01 para aseguramiento de la
calidad; y 0.10 para estudios o encuestas de mercadotecnia.

PASO 3
Evidencia muestral, se calcula la media y la desviación estándar a partir de la muestra.
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería

PASO 4
Se aplica la distribución T de Student para calcular la probabilidad de error por medio la fórmula
general presentada al principio y se contrasta con el valor de T obtenido de la tabla correspondiente.

PASO 5
En base a la evidencia disponible se acepta o se rechaza la hipótesis alternativa. Si la probabilidad
de error (p) es mayor que el nivel de significancia se rechaza la hipótesis alternativa. Si la
probabilidad de error (p) es menor que el nivel de significancia se acepta la hipótesis alternativa.
Por supuesto que al final lo que tenemos que contrastar es el valor de T que hayamos obtenido en el
problema contra el valor de T crítico que obtenemos de la tabla de T de Student.
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería

Si el resultado del problema cae en la región de H 0 se acepta ésta, de lo contrario se rechaza. Por
supuesto, si se rechaza H0 aceptarás H1.

En la gráfica precedente se aprecian las regiones de aceptación y de rechazo con respecto a H 0.

b. DISTRIBUCIÓN CHI-CUADRADO

La prueba Chi-cuadrado, también llamada ji cuadrado (X 2), se encuentra dentro de las pruebas
pertenecientes a la estadística descriptiva, concretamente la estadística descriptica aplicada al
estudio de dos variables. Por su parte, la estadística descriptiva se centra en extraer información
sobre la muestra. En cambio, la estadística inferencial extrae información sobre la población.
El nombre de la prueba es propio de la distribución Chi-cuadrado de la probabilidad en la que se
basa. Esta prueba fue desarrollada en el año 1900 por Karl Pearson.
La prueba Chi-cuadrado es una de las más conocidas y utilizadas para analizar variables nominales
o cualitativas, es decir, para determinar la existencia o no de independencia entre dos variables. Que
dos variables sean independientes significa que no tienen relación, y que por lo tanto una no
depende de la otra, ni viceversa.
Así, son el estudio de la independencia, se origina también un método para verificar si las
frecuencias observadas en cada categoría son compatibles con la independencia entre ambas
variables.
Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La hipótesis nula de
la prueba Chi-cuadrado postula una distribución de la probabilidad totalmente especificada como el
modelo matemático de la población que ha generado la muestra. Par realizar este contraste se
disponen los datos en una tabla de frecuencias. Para cada valor o intervalo de valores se indica la
frecuencia absoluta observada o empírica (Oi). A continuación, y suponiendo que la hipótesis nula
es cierta, se calculan para cada valor o intervalo de valores la frecuencia absoluta que cabría esperar
o frecuencia esperada. El estadístico de prueba se basa en las diferencias entre Oi y Ei; se define
como:
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería

k
( Oi−Ei )2
X =∑
2

i=1 Ei

Este estadístico tiene una distribución Chi-cuadrado con k-1 grados de libertad si n es suficiente
grande, es decir, si todas las frecuencias esperadas son mayores que 5. En la práctica se tolera un
máximo de 20% de frecuencias inferiores a 5.
Si existe concordancia perfecta entre las frecuencias observadas y las esperadas el estadístico
tomará un valor igual a 0; por el contrario, si existe una gran discrepancia entre estas frecuencias el
estadístico tomará un valor grande y, en consecuencia, se rechazará la hipótesis nula. Así, la región
crítica estará situada en el extremo superior de la distribución Chi-cuadrado con k-1 grados de
libertad.
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería

2. CONTENIDO

Las Distribuciones de t de Student y Chi-Cuadrado son de suma importancia para la


verificación de experimentos y validar procesos a nivel piloto o de la industria.
La distribución de probabilidad de la T de Student nos permitirá estimar el valor de la media
poblacional de una variable aleatoria que sigue una distribución normal cuando el parámetro se
extrae de una muestra pequeña y se desconoce la varianza poblacional.
El estadístico Chi-Cuadrado (o Ji cuadrado), que tiene distribución de probabilidad del mismo
nombre, nos servirá para someter a prueba las hipótesis referidas a distribuciones de
frecuencias. En términos generales, esta prueba contrasta frecuencias observadas con las
frecuencias esperadas de acuerdo con la hipótesis nula.

3. OBJETIVO

a) Representar los factores, que intervienen en la Elaboración de las Distribuciones t de


Student y Chi-Cuadrado.
b) Uso del software SPSS y EXCEL

4. PROCEDIMIENTO

Se ejecutarán varias funciones o procesos que se requieren para la elaboración de verificación


de Chi -Cuadrado o t de Student.

PROBLEMA PLANTEADO

Se toma una muestra aleatoria de 2200 familias y se les clasifica en una tabla de doble
entrada según su nivel de ingresos (alto, medio, bajo) y el tipo de colegio a la que envían sus
hijos. La siguiente tabla muestra los resultados obtenidos:

TIPO DE COLEGIO
INGRESO
PRIVADO PÚBLICO TOTAL
S
ALTO 506 494 1000
MEDIO 438 162 600
BAJO 215 385 600
TOTAL 1159 1041 2200

¿A un nivel de significancia del 5% hay una razón para creer que el ingreso y el tipo de
colegio no son variables independientes?

SOLUCIÓN

Tenemos que hallar el valor crítico Chi-cuadrado.


Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería

Grados de libertad
TIPO DE COLEGIO
INGRESOS PRIVADO
v=(Cantidad PÚBLICO
de filas−1)∗(CantidadTOTAL
de columnas−1)
ALTO 506 494 1000
MEDIO 438 162 600 v=( 3−1 )∗( 2−1 )
v=2
Nivel de BAJO 215 385 600 significancia
TOTAL 1159 1041 2200
En el problema nos indica trabajar
con 5%, así que trabajaremos con 0.05.

Valor del parámetro


p=1−nivel de significancia
p=1−0.05
p=0.95

En la tabla de Chi-cuadrado, tenemos que buscar el valor con dos grados de libertad y con una
probabilidad de 0.95.

Entonces, obtenemos
nuestra gráfica:

Ahora, tenemos que hallar el


VALOR CALCULADO
Chi-cuadrado.

Para hallar dichos valores,


usaremos la siguiente fórmula.
Total Columna∗Total Fila
f esperada=
Suma total

Tendremos que usar la fórmula para cada uno de los valores de la frecuencia del valor
observado.

1159∗1000 1041∗1000
f 506= =526.818 f 494= =473.182
2200 2200
1159∗600 1041∗600
f 438= =316.091 f 162= =283.909
2200 2200
1159∗600 1041∗600
f 215= =316.091 f 385= =283.909
2200 2200
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería

Ahora tenemos dos tablas con las que podemos calcular el chi-cuadrado

Frecuencia del Valor Observado

Frecuencia del Valor Calculado


TIPO DE COLEGIO
INGRESOS PRIVADO PÚBLICO
ALTO 526.81818 473.18182
MEDIO 316.09091 283.90909
BAJO 316.09091 283.90909

TIPO DE COLEGIO
INGRESOS PRIVADO PÚBLICO TOTAL
ALTO 506 494 1000
MEDIO 438 162 600
BAJO 215 385 600
TOTAL 1159 1041 2200
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería

Luego se procede a realizar los requerimientos del problema, la fórmula de Chi-cuadrado.


k
( fo−fe )2
X =∑
2

i=1 fe

fobservado fesperado fo-fe (fo-fe)^2 (fo-fe)^2/fe


506 526.81818 -20.81818 433.39669 0.82266844
438 316.09091 121.90909 14861.826 47.01757
215 316.09091 -101.0909 10219.372 32.3304834
494 473.18182 20.818182 433.39669 0.91592001
162 283.90909 -121.9091 14861.826 52.3471313
385 283.90909 101.09091 10219.372 35.995226
TOTAL 169.428999

Entonces el Valor calculado de Chi-cuadrado es 169.429, y lo interpretamos en la gráfica para


poder hallar la respuesta.

RPTA: Según la gráfica, el valor calculado es mucho mayor al valor crítico, por lo que
podemos concluir con el concluir y resolver el problema propuesto:
La educación de los niños DEPENDE, de los ingresos de los padres; y estos pueden tener
ingresos ALTOS, MEDIOS, y BAJOS. Y los tipos de educación son PÚBLICO y PRIVADO.
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería

CÁLCULOS REALIZADOS EN EL PROGRAMA DE SPSS DEL MISMO EJERCICIO,


PARA COMPROBAR LAS SIMILITUDES, Y LAS VÍAS QUE UNO TIENE PARA PODER
RESOLVER EJERCICIOS.

WEIGHT BY FRECUENCIA.
CROSSTABS
/TABLES=INGRESOS BY COLEGIO
/FORMAT=AVALUE TABLES
/STATISTICS=CHISQ
/CELLS=COUNT EXPECTED ROW COLUMN TOTAL
/COUNT ROUND CELL.

Tablas de contingencia
Notas
Resultados creados 10-JUL-2022 10:39:58
Comentarios
Entrada Conjunto de datos Conjunto_de_datos0
activo
Filtro <ninguno>
Peso FRECUENCIA
Dividir archivo <ninguno>
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería

Núm. de filas del 6


archivo de trabajo
Los valores perdidos definidos
Definición de los
por el usuario serán tratados
perdidos
como perdidos.
Tratamiento de los Los estadísticos de las tablas se
valores perdidos basan en todos los casos con
Casos utilizados datos válidos en los rangos
especificados para todas las
variables de las tablas.
CROSSTABS
/TABLES=INGRESOS BY
COLEGIO
/FORMAT=AVALUE TABLES
Sintaxis
/STATISTICS=CHISQ
/CELLS=COUNT EXPECTED
ROW COLUMN TOTAL
/COUNT ROUND CELL.
Tiempo de procesador 00:00:00.00
Tiempo transcurrido 00:00:00.02
Recursos Dimensiones 2
solicitadas
Casillas disponibles 131029

[Conjunto_de_datos0]
Resumen del procesamiento de los casos
Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
INGRESOS * 2200 100,0% 0 0,0% 2200 100,0%
COLEGIO

Tabla de contingencia INGRESOS * COLEGIO


COLEGIO Total
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería

PRIVAD PÚBLICO
O
Recuento 506 494 1000
Frecuencia esperada 526,8 473,2 1000,0
% dentro de 50,6% 49,4% 100,0%
ALTO INGRESOS
% dentro de 43,7% 47,5% 45,5%
COLEGIO
% del total 23,0% 22,5% 45,5%
Recuento 438 162 600
Frecuencia esperada 316,1 283,9 600,0
% dentro de 73,0% 27,0% 100,0%
INGRESO
MEDIO INGRESOS
S
% dentro de 37,8% 15,6% 27,3%
COLEGIO
% del total 19,9% 7,4% 27,3%
Recuento 215 385 600
Frecuencia esperada 316,1 283,9 600,0
% dentro de 35,8% 64,2% 100,0%
BAJO INGRESOS
% dentro de 18,6% 37,0% 27,3%
COLEGIO
% del total 9,8% 17,5% 27,3%
Recuento 1159 1041 2200
Frecuencia esperada 1159,0 1041,0 2200,0
% dentro de 52,7% 47,3% 100,0%
Total INGRESOS
% dentro de 100,0% 100,0% 100,0%
COLEGIO
% del total 52,7% 47,3% 100,0%

Pruebas de chi-cuadrado
Valor gl Sig. asintótica
(bilateral)
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería

Chi-cuadrado de 169,429a 2 ,000


Pearson
Razón de 174,511 2 ,000
verosimilitudes
Asociación lineal por 16,917 1 ,000
lineal
N de casos válidos 2200

a. 0 casillas (0,0%) tienen una frecuencia esperada inferior a


5. La frecuencia mínima esperada es 283,91.

Advertencia # 3211
En al menos un caso, el valor de la variable de ponderación era cero, negativa
o faltaba. Estos casos no son visibles para procedimientos estadísticos y
gráficos que necesiten casos ponderados positivamente, pero permanecen en el
archivo y se procesan mediante unidades no
stadísticas como LIST y SAVE.

5. CONCLUSIONES

En esta sesión se hizo la representación de los factores que interviene en la resolución de T


Student y Chi-cuadrado, se puede resolver ejercicios en los programas de SPSS y EXCEL,
en los que se aprendió a aplicar las fórmulas y conceptos hechos en las clases de teoría. La
aplicación de las distribuciones T Student y Chi-cuadrado, se puede dar en el día a día;
podemos usarlo en cualquier problema en los que se pueda comparar variables y trabajar
con hipótesis.

6. BIBLIOGRAFÍA

 https://estadisticaeninvestigacion.wordpress.com/distribucion-t-de-student/
 H. GUTIÉRREZ, R, DE LA VARA, ESTADÍSTICA Y DISEÑO
EXPERIMENTAL, SEGUNDA EDICIÓN, 2008.
 https://www.ucm.es/data/cont/media/www/pag-54183/APUNTES%20ESTAD
%C3%8DSTICA%203.pdf
 http://labrad.fisica.edu.uy/docs/tabla_chi_cuadrado.pdf
 https://economipedia.com/definiciones/distribucion-t-de-student.html

También podría gustarte