Documentos de Académico
Documentos de Profesional
Documentos de Cultura
«DISTRIBUCIÓN T DE STUDENT Y
CHI-CUADRADO»
LABORATORIO : N° 11
GUÍA DE PRÁCTICAS
1. TEMA
a. DISTRIBUCIÓN T STUDENT
Descrita por William S. Gosset en 1908. Publicaba bajo el pseudónimo de «Studente» mientras
trabajaba para la cervecería Guinnes en Irlanda. Está diseñada para probar hipótesis en estudios con
muestras pequeñas menores a 30.
La fórmula general para la T de Student es la siguiente:
X−μ
t=
σ
√n
En donde el numerador representa la diferencia a probar y el denominador la desviación estándar de
la diferencia llamado también Error Estándar. En esta fórmula t representa al valor estadístico que
estamos buscando X es el promedio de la variable analizada de la muestra, y µ es el promedio
poblacional de la variable a estudiar. En el denominador tenemos a σ como representativo de la
desviación estándar de la muestra y n el tamaño de ésta.
Grados libertad
gl=df =( n−1 )
Si pudiera expresar en un cierto número de pasos para resolver un problema de t de student tendría
que declarar los siguientes:
PASO 1
Plantear la hipótesis nula (H0) y la hipótesis alternativa (H1). La hipótesis alternativa plantea
matemáticamente lo que queremos demostrar, en tanto que la hipótesis nula plantea exactamente lo
contrario.
PASO 2
Determinar el nivel de significancia (rango de aceptación de la hipótesis alternativa), a.
Se considera un nivel alfa de: 0.05 para proyectos de investigación; 0.01 para aseguramiento de la
calidad; y 0.10 para estudios o encuestas de mercadotecnia.
PASO 3
Evidencia muestral, se calcula la media y la desviación estándar a partir de la muestra.
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería
PASO 4
Se aplica la distribución T de Student para calcular la probabilidad de error por medio la fórmula
general presentada al principio y se contrasta con el valor de T obtenido de la tabla correspondiente.
PASO 5
En base a la evidencia disponible se acepta o se rechaza la hipótesis alternativa. Si la probabilidad
de error (p) es mayor que el nivel de significancia se rechaza la hipótesis alternativa. Si la
probabilidad de error (p) es menor que el nivel de significancia se acepta la hipótesis alternativa.
Por supuesto que al final lo que tenemos que contrastar es el valor de T que hayamos obtenido en el
problema contra el valor de T crítico que obtenemos de la tabla de T de Student.
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería
Si el resultado del problema cae en la región de H 0 se acepta ésta, de lo contrario se rechaza. Por
supuesto, si se rechaza H0 aceptarás H1.
b. DISTRIBUCIÓN CHI-CUADRADO
La prueba Chi-cuadrado, también llamada ji cuadrado (X 2), se encuentra dentro de las pruebas
pertenecientes a la estadística descriptiva, concretamente la estadística descriptica aplicada al
estudio de dos variables. Por su parte, la estadística descriptiva se centra en extraer información
sobre la muestra. En cambio, la estadística inferencial extrae información sobre la población.
El nombre de la prueba es propio de la distribución Chi-cuadrado de la probabilidad en la que se
basa. Esta prueba fue desarrollada en el año 1900 por Karl Pearson.
La prueba Chi-cuadrado es una de las más conocidas y utilizadas para analizar variables nominales
o cualitativas, es decir, para determinar la existencia o no de independencia entre dos variables. Que
dos variables sean independientes significa que no tienen relación, y que por lo tanto una no
depende de la otra, ni viceversa.
Así, son el estudio de la independencia, se origina también un método para verificar si las
frecuencias observadas en cada categoría son compatibles con la independencia entre ambas
variables.
Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La hipótesis nula de
la prueba Chi-cuadrado postula una distribución de la probabilidad totalmente especificada como el
modelo matemático de la población que ha generado la muestra. Par realizar este contraste se
disponen los datos en una tabla de frecuencias. Para cada valor o intervalo de valores se indica la
frecuencia absoluta observada o empírica (Oi). A continuación, y suponiendo que la hipótesis nula
es cierta, se calculan para cada valor o intervalo de valores la frecuencia absoluta que cabría esperar
o frecuencia esperada. El estadístico de prueba se basa en las diferencias entre Oi y Ei; se define
como:
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería
k
( Oi−Ei )2
X =∑
2
i=1 Ei
Este estadístico tiene una distribución Chi-cuadrado con k-1 grados de libertad si n es suficiente
grande, es decir, si todas las frecuencias esperadas son mayores que 5. En la práctica se tolera un
máximo de 20% de frecuencias inferiores a 5.
Si existe concordancia perfecta entre las frecuencias observadas y las esperadas el estadístico
tomará un valor igual a 0; por el contrario, si existe una gran discrepancia entre estas frecuencias el
estadístico tomará un valor grande y, en consecuencia, se rechazará la hipótesis nula. Así, la región
crítica estará situada en el extremo superior de la distribución Chi-cuadrado con k-1 grados de
libertad.
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería
2. CONTENIDO
3. OBJETIVO
4. PROCEDIMIENTO
PROBLEMA PLANTEADO
Se toma una muestra aleatoria de 2200 familias y se les clasifica en una tabla de doble
entrada según su nivel de ingresos (alto, medio, bajo) y el tipo de colegio a la que envían sus
hijos. La siguiente tabla muestra los resultados obtenidos:
TIPO DE COLEGIO
INGRESO
PRIVADO PÚBLICO TOTAL
S
ALTO 506 494 1000
MEDIO 438 162 600
BAJO 215 385 600
TOTAL 1159 1041 2200
¿A un nivel de significancia del 5% hay una razón para creer que el ingreso y el tipo de
colegio no son variables independientes?
SOLUCIÓN
Grados de libertad
TIPO DE COLEGIO
INGRESOS PRIVADO
v=(Cantidad PÚBLICO
de filas−1)∗(CantidadTOTAL
de columnas−1)
ALTO 506 494 1000
MEDIO 438 162 600 v=( 3−1 )∗( 2−1 )
v=2
Nivel de BAJO 215 385 600 significancia
TOTAL 1159 1041 2200
En el problema nos indica trabajar
con 5%, así que trabajaremos con 0.05.
En la tabla de Chi-cuadrado, tenemos que buscar el valor con dos grados de libertad y con una
probabilidad de 0.95.
Entonces, obtenemos
nuestra gráfica:
Tendremos que usar la fórmula para cada uno de los valores de la frecuencia del valor
observado.
1159∗1000 1041∗1000
f 506= =526.818 f 494= =473.182
2200 2200
1159∗600 1041∗600
f 438= =316.091 f 162= =283.909
2200 2200
1159∗600 1041∗600
f 215= =316.091 f 385= =283.909
2200 2200
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería
Ahora tenemos dos tablas con las que podemos calcular el chi-cuadrado
TIPO DE COLEGIO
INGRESOS PRIVADO PÚBLICO TOTAL
ALTO 506 494 1000
MEDIO 438 162 600
BAJO 215 385 600
TOTAL 1159 1041 2200
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería
i=1 fe
RPTA: Según la gráfica, el valor calculado es mucho mayor al valor crítico, por lo que
podemos concluir con el concluir y resolver el problema propuesto:
La educación de los niños DEPENDE, de los ingresos de los padres; y estos pueden tener
ingresos ALTOS, MEDIOS, y BAJOS. Y los tipos de educación son PÚBLICO y PRIVADO.
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería
WEIGHT BY FRECUENCIA.
CROSSTABS
/TABLES=INGRESOS BY COLEGIO
/FORMAT=AVALUE TABLES
/STATISTICS=CHISQ
/CELLS=COUNT EXPECTED ROW COLUMN TOTAL
/COUNT ROUND CELL.
Tablas de contingencia
Notas
Resultados creados 10-JUL-2022 10:39:58
Comentarios
Entrada Conjunto de datos Conjunto_de_datos0
activo
Filtro <ninguno>
Peso FRECUENCIA
Dividir archivo <ninguno>
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería
[Conjunto_de_datos0]
Resumen del procesamiento de los casos
Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
INGRESOS * 2200 100,0% 0 0,0% 2200 100,0%
COLEGIO
PRIVAD PÚBLICO
O
Recuento 506 494 1000
Frecuencia esperada 526,8 473,2 1000,0
% dentro de 50,6% 49,4% 100,0%
ALTO INGRESOS
% dentro de 43,7% 47,5% 45,5%
COLEGIO
% del total 23,0% 22,5% 45,5%
Recuento 438 162 600
Frecuencia esperada 316,1 283,9 600,0
% dentro de 73,0% 27,0% 100,0%
INGRESO
MEDIO INGRESOS
S
% dentro de 37,8% 15,6% 27,3%
COLEGIO
% del total 19,9% 7,4% 27,3%
Recuento 215 385 600
Frecuencia esperada 316,1 283,9 600,0
% dentro de 35,8% 64,2% 100,0%
BAJO INGRESOS
% dentro de 18,6% 37,0% 27,3%
COLEGIO
% del total 9,8% 17,5% 27,3%
Recuento 1159 1041 2200
Frecuencia esperada 1159,0 1041,0 2200,0
% dentro de 52,7% 47,3% 100,0%
Total INGRESOS
% dentro de 100,0% 100,0% 100,0%
COLEGIO
% del total 52,7% 47,3% 100,0%
Pruebas de chi-cuadrado
Valor gl Sig. asintótica
(bilateral)
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería
Advertencia # 3211
En al menos un caso, el valor de la variable de ponderación era cero, negativa
o faltaba. Estos casos no son visibles para procedimientos estadísticos y
gráficos que necesiten casos ponderados positivamente, pero permanecen en el
archivo y se procesan mediante unidades no
stadísticas como LIST y SAVE.
5. CONCLUSIONES
6. BIBLIOGRAFÍA
https://estadisticaeninvestigacion.wordpress.com/distribucion-t-de-student/
H. GUTIÉRREZ, R, DE LA VARA, ESTADÍSTICA Y DISEÑO
EXPERIMENTAL, SEGUNDA EDICIÓN, 2008.
https://www.ucm.es/data/cont/media/www/pag-54183/APUNTES%20ESTAD
%C3%8DSTICA%203.pdf
http://labrad.fisica.edu.uy/docs/tabla_chi_cuadrado.pdf
https://economipedia.com/definiciones/distribucion-t-de-student.html