Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ASIGNATURA: ESTADISTICA
TEMA:
PRUEBA CHI CUADRADO
NOMBRE:
NEPPAS CRISTIAN
NIVEL
CUARTO “B”
FECHA DE ENTREGA:
10/12/2019
RIOBAMBA-ECUADOR
PRUEBA CHI CUADRADO (X2)
La X2 es una prueba de libre distribución (no paramétrica) que mide la discrepancia entre una
distribución de frecuencias observadas y esperadas. Dentro de sus características generales, la
prueba X2 toma valores entre cero e infinito y no tiene valores negativos porque es la suma de
valores elevados al cuadrado (1). Existen tres usos relevantes de la prueba X2: – Prueba de
bondad de ajuste (una variable) – Prueba de independencia (dos variables) – Prueba de
homogeneidad (dos variables) En esta publicación, vamos a realizar mayor énfasis al uso que se
da a la X2 como prueba de independencia. [ CITATION RAB99 \l 3082 ]
Cuando queremos comprobar si una variable, cuya descripción parece adecuada, tiene una
determinada función de probabilidad. La prueba correspondiente se llama chi-cuadrado de
ajuste.
Cuando queremos averiguar si dos variables (o dos vías de clasificación) son independientes
estadísticamente. En este caso la prueba que aplicaremos ser la chi-cuadrado de
independencia o chicuadrado de contingencia.[ CITATION UCMsf \l 3082 ]
Los grados de libertad de un estadístico calculado sobre un conjunto datos se refieren al número
de cantidades independientes que se necesitan en su cálculo, menos el número de restricciones
que ligan a las observaciones y el estadístico. El número de grados de libertad del estadístico
Chi-cuadrado se calcula de la siguiente forma:
Se calcula, en primer lugar el número de sumandos, es decir m x n, siendo n y m el
número de filas y número de columnas en la tabla.
A esta cantidad se debe restar el número de restricciones impuestas a las frecuencias
observadas. Observamos que podemos cambiar todas las frecuencias de la tabla sin
cambiar los totales por filas y columnas, excepto los datos en la última fila y la última
columna de la tabla, pues una vez que fijemos todos los valores excepto estos, quedan
automáticamente fijados. Por tanto, si la tabla tiene m filas y n columnas, el número de
grados de libertad es (m-1) x (n-1). Expresamos esta dependencia en la siguiente forma:
2
( f −e )
χ 2exp = ∑ ∑ ij e ij → χ(2n−1)( m−1 )
i j ij
LA PRUEBA DE INDEPENDENCIA
Según la [ CITATION Uni16 \l 3082 ] , el Chi-cuadrado, nos permite determinar si existe una relación
entre dos variables categóricas. Es necesario resaltar que esta prueba nos indica si existe o no una
relación entre las variables, pero no indica el grado o el tipo de relación; es decir, no indica el
porcentaje de influencia de una variable sobre la otra o la variable que causa la influencia
Para comprender mejor este tema es necesario recordar cuales son lo eventos independientes y
cuales los dependientes.
Ejemplo:
El siguiente ejemplo se tomó según [ CITATION Uni16 \l 3082 ]
Una agencia de publicidad desea saber si el género de los consumidores es independiente de sus
preferencias de cuatro marcas de café. La respuesta determinará si se deben diseñar diferentes
anuncios dirigidos a los hombres y otros diferentes para las mujeres. Realice la prueba con un
nivel de significancía del 5%.
1. Los resultados obtenidos de la encuesta realizada a 139 personas fue:
7. Calculando ji-cuadrada.
8. Tomar una decisión y concluir.
Aceptar Ho:
Con un nivel de confianza del 5% se encontró que la marca de café es independiente del
sexo de la persona. Por lo que se recomienda elaborar un sólo tipo de anuncio.
Ejemplo
1. Un dado se lanzó 36 veces, haga una prueba con un nivel de significancía del 5%, para
comprobar si el dado es legal o no. [ CITATION Uni16 \l 3082 ]
Los resultados obtenidos del ejercicio fueron los siguientes:
HOMOGENEIDAD
Otro caso en que usamos una tabla de contingencia es aquél en que se dispone de una población
X clasificada en r subpoblaciones x1, x2,...,xr. En cada una de estas poblaciones se toma una
muestra, y los individuos de la misma se clasifican según una variable Y que puede tomar m
valores posibles y1, y2.....ym. Sea pij la proporción de individuos que, en la población x i tiene como
valor de Y=yj. [ CITATION Ayl07 \l 3082 ]
Un contraste de homogeneidad es cuando se desean contrastar las dos hipótesis siguientes:
H0:p1j = p2j = ...... = pmj para todo j; dicho de otro modo, todas las subpoblaciones tienen
idéntica distribución para la variable Y.
H1: algunas de estas proporciones son diferentes. Dicho de otro modo, la distribución de la
variable Y en alguna de estas subpoblaciones es diferente
El principal objetivo de realizar este contraste es comprobar que las distribuciones de todas las
subpoblaciones son iguales o si hay alguna que difiere. Esto nos resulta práctico para poder
combinar los resultados de todas las subpoblaciones, pues es necesario asegurarse de que los
datos de las distintas muestras que se pretende agrupar son homogéneos.
Ejemplo
Se desea saber si la distribución de los grupos sanguíneos es similar en los individuos de dos
poblaciones. Para ello se elige una muestra aleatoria de cada una de ellas, obteniéndose los
siguientes datos ¿Qué decisión se debe tomar?
A B AB 0 Total
Muestra 90 80 110 20 300
1
Muestra 200 180 240 30 650
2
Total 290 260 350 50 950
Calculamos las frecuencias esperadas:
Tabla 3.5. Frecuencias esperadas
A B AB 0
Muestra 1 82.10
91.5789 5 110.53 15.789
Muestra 2 177.8
198.421 9 239.47 34.211
Posteriormente calculamos:
( f ij−eij )2
χ 2exp =∑ ∑
i j eij = 1,76
Los grados de libertad son: (n-1) x (m-1) = 1 x 3 = 3
Mirando en la tabla Chi-cuadrado obtenemos que la probabilidad de obtener un valor 7,81 o
mayor con 3 grado de libertad es p = 0,184. Por tanto el valor es no estadísticamente
significativo, pues es mayor que 0,01. Aceptamos la hipótesis de homogeneidad de grupos
sanguíneos en las dos muestras.
BIBLIOGRAFÍA