Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Los resultados obtenidos por muestreo no siempre coinciden exactamente con los esperados
teóricamente de acuerdo con las leyes de las probabilidades.
Sucesos E1 E2 E3 … Ek
Frecuencia esperada fe 1 fe 2 f e3 … fe k
Definición de χ 2
2 2 k 2
( fo 1−fe1 ) ( f o 2−fe2 ) ( f ok −fek ) k
( fo j−fe j )
=∑
2
χ= + +…+
fe 1 fe 2 fe k j=1 fe j
La hipótesis nula en una prueba de bondad de ajuste es una especificación respecto al patrón
de frecuencia esperado en un conjunto de categorías. El patrón esperado puede ajustarse a la
suposición de igual posibilidad y por tanto puede ser uniforme puede ajustarse a patrones
tales como binomial, el de Poisson o el normal.
Los valores obtenidos para el estadístico de prueba Ji-cuadrada se basan en conteos discretos,
mientras que la distribución Ji- cuadrada es continua. Si las frecuencias esperadas en las
casillas no son pequeñas, este hecho no es importante en términos de grado de aproximación
de la distribución Ji-cuadrada a la distribución del estadístico de prueba. Una regla usual es
que la frecuencia esperada para cada casilla, o categoría, debe ser por lo menos 5 . Las casillas
que no cumplen con este criterio deben combinarse, si es posible, con las categorías
adyacentes de modo que satisfaga este requerimiento. Entonces, éste número ya reducido de
categorías es el que se emplea para determinar los grados de libertad para esta prueba.
Tabla Combinada
2
Número de fallas Frecuencia observada f o Frecuencia esperada f e
( f o−f e )
fe
0 - 1 6 6,8 0,094
2 8 8,3 0,011
3 11 8,9 0,496
4 7 7,1 0,001
5 - 10 8 8,8 0,073
2
χ = 0,675
Contraste de Significación
Las frecuencias esperadas se calculan a base de una hipótesis nula, si bajo tal hipótesis el valor
2 2
calculado para Ji-cuadrado dado es mayor que algún valor crítico χ 0 , 95 o χ 0 , 99, que son los
valores críticos de los niveles de significación 0,05 y 0,01 respectivamente, debemos concluir
que las frecuencias observadas difiere significativamente de las frecuencias esperadas y
rechazaremos la hipótesis nula al correspondiente nivel de significación; en caso contrario, la
aceptaremos. Hay que constar que debe mirarse con suspicacia en circunstancias en las que Ji-
cuadrado sea demasiado próximo a cero, pues es raro que las frecuencias observadas
coincidan demasiado bien con las frecuencias esperadas.
Las tablas en que las frecuencias observadas ocupan una sola fila, se llama una tabla de
clasificación de entrada única. Como el número de columnas es K, también se le llama tabla
1 x k y cuyo grado de libertad se calcula por medio de V = k - 1. Extendiendo estas ideas,
podemos llegar a tablas de doble entada o tablas h x k, en las que las frecuencias observadas
ocupan h filas y k columnas. Tales tablas se suelen llamar tablas de contingencia.
Cada frecuencia observada en una tabla de contingencia h x k, donde h es la cantidad de
renglones y k la cantidad de columnas; hay una frecuencia esperada o teórica de la misma
dimensión (h x k) que se calcula sujeta a ciertas hipótesis de acuerdo con las leyes de
probabilidades.
La frecuencia total en cada fila o en cada columna se llama frecuencia marginal y se calcula por
la fórmula siguiente:
fh.fk
f e=
n
Las pruebas de independencia considera (cuando menos) dos variables categóricas, y lo que se
prueba es la hipótesis de que las variables son estadísticamente independiente. La
independencia implica que el conocimiento de categoría en la que se clasifica una observación
respecto de una de las variables no tiene efecto sobre la probabilidad de que, en relación con
otra variable, esté en una de las diferentes categorías.
2 2 2
2 (|fo1 −fe1|−0 ,5 ) (|fo2−fe2|−0 , 5 ) (|fok −fek|−0 ,5 )
χ ( corregido ) = + +…+
fe 1 f e2 fe k
Coeficiente de Contingencia
C= 2
√
χ2
χ +N
Que se llama coeficiente de contingencia. Cuanto mayor es C, mayor es el grado de asociación,
el número de filas y de columnas en la tabla de contingencia determina el máximo valor de C,
que nunca es mayor que 1. Si el número de filas y columnas es igual a k, el máximo valor de C
está dado por √ (k−1)/k .
Ejercicios:
1) En 200 tiradas de una moneda, han salido 115 caras y 85 cruces. Contrastar la hipótesis
de que la moneda es buena, con nivel de significación a) 0,05 y b) 0,01; Calcular el
coeficiente contingencia.
Frecuencia Esperada
5) Un estudio sobre 320 familias con 5 hijos reveló la distribución de la tabla siguiente. ¿es
consistente el resultado con la hipótesis de que los nacimientos de chicos y chicas son
igualmente probables?. Calcule el coeficiente de contingencia.
Número de
18 56 110 88 40 8 320
familias
Frecuencia Esperada
Número de
familias
Dígito 0 1 2 3 4 5 6 7 8 9
Frec. Observada 17 31 29 18 14 20 35 30 20 36
Frec. Esperada 25 25 25 25 25 25 25 25 25 25
7) Se lanzan tres monedas 240 veces con el número de caras que recoge juntos con los
resultados esperados bajo la hipótesis de que las monedas son buenas en la siguiente
tabla. Contrastar la hipótesis al nivel de significación 0,05.
Frecuencia Esperada
Frecuencia Esperada