Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Distribución ji-cuadrada
La distribución ji-cuadrada es, como la distribución t, una familia completa de
distribuciones; hay una distribución diferente para cada valor de los grados de libertad
(g.l.= n – 1).
Esta distribución está sesgada positivamente, pero a medida que aumentan los grados de
libertad, la distribución se hace más simétrica y se aproxima a la normal. Por otra parte,
al ser una distribución de probabilidad, el área total bajo la curva es 1.
Así como en el caso de la distribución normal, que sirvió para estandarizar medias
muestrales, la distribución 2 cumple la misma misión para las varianzas.
1 − α = 0.9 α = 0.05
2
χ 0.95 = 0.1025 χ 2 0.05 = 5.99147
2
Sustituyendo en la fórmula del Intervalo de Confianza obtenemos:
2 * 10.57 2 *10.57
≤σ2 ≤
5.99 0.1025
3.53 ≤ σ ≤ 206.1
2
Note que este intervalo es de una longitud muy grande, es decir la estimación es muy
imprecisa, lo cual se debe a que el tamaño de la muestra es muy pequeña.
Pruebas de hipótesis
Para realizar esta pruebas necesitamos, igual que hicimos en el caso de pruebas de
hipótesis para media y proporciones, comparar el valor de un estadístico de prueba con el
percentil adecuado de la distribución muestral del estadístico. En este caso el estadístico
de prueba es:
(n − 1) * S 2
χ 2 prueba =
σ 20
σ 2 0 es la varianza hipotética de la población, s2 es la varianza muestral y n el tamaño de
la muestra.
1.Pruebas unilaterales.
a) H 0 : σ 2 ≥σ 0 H 1 : σ 2 <σ 0
2 2
b) H 0 : σ 2 ≤σ 0 H 1 : σ 2 >σ 0
2 2
2. Prueba bilateral
H 0 : σ 2 =σ 0 H 1 : σ 2 ≠σ 0
2 2
Ejemplo(continuación)
Suponga ahora que lo estándar es que la desviación de este tipo de instrumento sea de dos
unidades, y se ha decidido probar si con los resultados obtenidos de esta muestra puede
refutarse la hipótesis planteada. Con el mismo nivel de significación tenemos que:
Hipótesis:
H 0 :σ 2 = 4 H1 : σ 2 ≠ 4
(n − 1) S 2
Estadístico: = 5.29
σ 02
Percentil:
χ 2 0.95 = 0.1025 χ 2 0.05 = 5.99147
Decisión:
Debemos comprobar si el valor del estadístico cae o no en la región de rechazo.
0.1025<5.29<5.99, por lo que no cae en la región de rechazo, así que podemos concluir
que no existen evidencias suficientes para plantear que haya variado la varianza del
instrumento. Note que nuevamente a pesar de que la varianza hipotética
σ 0 2 = 4 y S 2 = 10.57 son diferentes aparentemente, esta diferencia no resultó ser
significativa, como para rechazar la hipótesis nula, debido a que la muestra es sólo de 3
observaciones.
5. Pruebas no Paramétricas
Pruebas no Paramétricas
Las pruebas no paramétricas (o libres de distribución) son procedimientos estadísticos
que se pueden utilizar para contrastar hipótesis cuando no es posible fijar ningún
supuesto sobre parámetros o distribuciones poblacionales.
Son muchos los tipos diferentes de pruebas no paramétricas que se pueden utilizar,
dependiendo de la necesidad determinada. Sin embargo, sólo se considerará la
distribución ji-cuadrada como manera de contrastar:
(a) La bondad de ajuste, para determinar si una distribución sigue una estructura
determinada.
(b) Tablas de Contingencia y pruebas de independencia.
i =1 f ei
k = número de categorías o clases
foi = frecuencias observadas de los sucesos en los datos muestrales
fei = frecuencias esperadas de los sucesos si la hipótesis nula es correcta
(e) Se hace la comparación 2 y χ prueba
2
Observaciones:
1. Hay casos en los cuales las frecuencias esperadas son iguales y en otros las frecuencias
se contrastan con cierta estructura en la cual no todas las frecuencias esperadas son
iguales, sino que vienen determinadas por fei = n * pi, en la cual pi es la probabilidad de
cada categoría que especifica la hipótesis nula.
3. Hay dos reglas de aceptación general respeto a pequeñas frecuencias en una celda:
(a) Si sólo hay 2 celdas, la frecuencia esperada en cada celda debe ser igual a 5 o mayor.
(b) Para más de dos celdas, no debe aplicarse la 2 si más del 20% de las celdas de fe
tienen frecuencias esperadas menores que 5.
Ahora bien, es posible recombinar las celdas para garantizar que todas las categorías
tienen una frecuencia esperada mayor o igual que 5
Ejemplo 5.1.1
1. Se supone que el número de defectos en las tarjetas de circuito impreso sigue una
distribución Poisson. Se reúne una muestra aleatoria de 60 tarjetas de circuito
impreso y se observa el número de defectos. Los resultados obtenidos son los
siguientes:
Número de Frecuencia
defectos observada
0 32
1 15
2 9
3 ó más 4
¿Muestran estos datos suficiente evidencia para decir que provienen de una
distribución Poisson?. Haga la prueba de la bondad del ajuste con un α = 0.05.
Solución:
H0; La distribución de los defectos es Poisson
32 * 0 + 15 * 1 + 9 * 2 + 4 * 3
λ= = 0.75
60
e − λ λk e −0.75 0.75 0
P( x = k ) = por ejemplo si x = 0 P( x = 0) = = 0.472
k! 0!
Con esta fórmula se calculan las probabilidades las que se que se multiplican por 60
para obtener los valores esperados, ya que: f ei = n * pi
0 0.472 28.32 32
1 0.354 21.24 15
2 0.133 7.98 9
Puesto que la frecuencia esperada en la última celda es menor que 5, se combinan las
dos últimas celdas.
0 28.32 32
1 21.24 15
2 ó más 10.44 13
Los grados de libertad serían 3-1-1=1, debido a que la media de la distribución
Poisson fue estimada a partir de los datos.
2.
Ejemplo 5.2:
Solución:
Límites Frecuencias
de clase observadas
Menor de 1.95 2
1.95 – 2.45 1
2.45 – 2.95 4
2.95 – 3.45 15
3.45 – 3.95 10
3.95 – 4.45 5
4.45 – 4.95 3
Observemos que si realizamos el histograma, para visualizar los datos:
tiene una forma que aparenta ser normal lo cual se probará estableciendo las hipótesis:
Ejemplo:
1.95 − 3.5
P( x < 1.95) = P Z < = P( Z < −2.21) = Φ (−2.21) = 0.01355
0.7
Como el 3.06 >.815, no se rechaza H0 y se concluye con un α = 0.05 los datos siguen una
distribución normal.
5.1 Prueba de Independencia
Tabla de contingencia
Es una tabla que contiene F filas y C columnas. Cada fila corresponde a un nivel de una
variable; cada columna, a un nivel de otra variable. Las entradas del cuerpo de las tablas
son las frecuencias con que cada combinación de variables se presenta.
Observaciones:
1. Para calcular el número de grados de libertad de una prueba de independencia ji-
cuadrada se multiplica el número de filas (menos uno) por el número de columnas
(menos 1)
g. l = (número filas – 1) * (número columnas – 1)
3.
2
se determina por
(f o − f e )2
χ prueba = ∑
2
fe
4. Las frecuencias esperadas deben ser de 5 o más para todas las categorías.
fe
(la expresión se aplica para cada celda y la suma total de cada uno de los valores es el
χ prueba
2
)
(f) Se hace la comparación entre 2
y χ prueba
2
Ejemplo 5.1
Rango
Profesor Profesor
Instructor Profesor
Satisfacción asistente asociado
en el
Mucha 40 60 52 63
trabajo
Regular 78 87 82 88
Poca 57 63 66 64
Solución:
Se procederá a calcular los valores esperados de cada celda. Como los grados de
libertad son 6, esto quiere decir que necesitamos calcular únicamente 6 frecuencias
esperadas, y las faltantes se encuentran por diferencia.
1. Se calcularán los valores esperados necesarios.
2. Como se necesitan los totales de renglón y columna se mostrarán en la tabla:
Rango
Profesor Profesor
Instructor Profesor Total
asistente asociado
Satisfacción
en el Mucha 40 60 52 63 215
Poca 57 63 66 64 250
Las frecuencias esperadas las colocaremos entre paréntesis en cada una de las casillas
de la tabla, los que no se calcularon por fórmula se obtuvieron por diferencia con
respecto a los totales.
Profesor Profesor
Satisfacción Instructor Profesor Total
asistente asociado
40 60 52 63
Mucha 215
(47.03) (56.44) (53.75) (57.78)
78 87 82 88
Regular 335
(73.28) (87.94) (83.75) (90.03)
57 63 66 64
Poca 250
(54.69) (65.62) (62.50) (67.19)