Está en la página 1de 9

ESCUELA SUPERIOR POLITECNICA DE CHIMBORAZO

FACULTAD DE CIENCIAS PECUARIAS

CARRERA: INGENIERIA EN AGROINDUSTRIA

ASIGNATURA: ESTADISTICA

TEMA:
PRUEBA CHI CUADRADO

NOMBRE:

NEPPAS CRISTIAN

NIVEL
CUARTO “B”
FECHA DE ENTREGA:

10/12/2019
RIOBAMBA-ECUADOR
PRUEBA CHI CUADRADO (X2)
La X2 es una prueba de libre distribución (no paramétrica) que mide la discrepancia entre una
distribución de frecuencias observadas y esperadas. Dentro de sus características generales, la
prueba X2 toma valores entre cero e infinito y no tiene valores negativos porque es la suma de
valores elevados al cuadrado (1). Existen tres usos relevantes de la prueba X2: – Prueba de
bondad de ajuste (una variable) – Prueba de independencia (dos variables) – Prueba de
homogeneidad (dos variables) En esta publicación, vamos a realizar mayor énfasis al uso que se
da a la X2 como prueba de independencia. [ CITATION RAB99 \l 3082 ]

Se aplican en dos situaciones básicas:

 Cuando queremos comprobar si una variable, cuya descripción parece adecuada, tiene una
determinada función de probabilidad. La prueba correspondiente se llama chi-cuadrado de
ajuste.
 Cuando queremos averiguar si dos variables (o dos vías de clasificación) son independientes
estadísticamente. En este caso la prueba que aplicaremos ser la chi-cuadrado de
independencia o chicuadrado de contingencia.[ CITATION UCMsf \l 3082 ]

Los grados de libertad de un estadístico calculado sobre un conjunto datos se refieren al número
de cantidades independientes que se necesitan en su cálculo, menos el número de restricciones
que ligan a las observaciones y el estadístico. El número de grados de libertad del estadístico
Chi-cuadrado se calcula de la siguiente forma:
 Se calcula, en primer lugar el número de sumandos, es decir m x n, siendo n y m el
número de filas y número de columnas en la tabla.
 A esta cantidad se debe restar el número de restricciones impuestas a las frecuencias
observadas. Observamos que podemos cambiar todas las frecuencias de la tabla sin
cambiar los totales por filas y columnas, excepto los datos en la última fila y la última
columna de la tabla, pues una vez que fijemos todos los valores excepto estos, quedan
automáticamente fijados. Por tanto, si la tabla tiene m filas y n columnas, el número de
grados de libertad es (m-1) x (n-1). Expresamos esta dependencia en la siguiente forma:
2
( f −e )
χ 2exp = ∑ ∑ ij e ij → χ(2n−1)( m−1 )
i j ij

LA PRUEBA DE INDEPENDENCIA
Según la [ CITATION Uni16 \l 3082 ] , el Chi-cuadrado, nos permite determinar si existe una relación
entre dos variables categóricas. Es necesario resaltar que esta prueba nos indica si existe o no una
relación entre las variables, pero no indica el grado o el tipo de relación; es decir, no indica el
porcentaje de influencia de una variable sobre la otra o la variable que causa la influencia
Para comprender mejor este tema es necesario recordar cuales son lo eventos independientes y
cuales los dependientes.

 Dos eventos aleatorios, A y B, son eventos independientes, si la probabilidad de un evento no


está afectada por la ocurrencia del otro evento; por lo tanto p(A) = p(A/ B).”
 “Dos eventos aleatorios, A y B, son eventos dependientes si la probabilidad de un evento está
afectada por la ocurrencia del otro; por lo tanto, p(A) ≠ p(A/ B) .”
Una prueba de independencia usa la pregunta de si la ocurrencia del evento X es independiente a
la ocurrencia del evento Y, por lo que el planteamiento de las hipótesis para esta prueba de
independencia es; H0; La ocurrencia del evento X es independiente del evento Y. H1; La
ocurrencia del evento X no es independiente del evento Y.
En las pruebas de independencia se utiliza el formato de la tabla de contingencia, y por esa razón
a veces se le llama prueba de tabla de contingencia, o prueba con tabla de contingencia
Procedimiento para elaborar una prueba de independencia.

 Obtener la frecuencia observada (F.O), proveniente de una encuesta, estudio ó


experimento.
 Resumir los datos obtenidos, es decir, la frecuencia observada, en un cuadro de
contingencia.
 Calcular la frecuencia esperada (F.E), y se calcula con la siguiente formula:

 Determinar el nivel de significancía (α), y los grados de libertad, con la siguiente


formula:

 Plantear las hipótesis. H0: independencia H1: dependencia


 Construir las áreas de aceptación y rechazo.
 Calcular Chi-Cuadrada χ 2

 Tomar una decisión y emitir una conclusión en términos del problema

Ejemplo:
El siguiente ejemplo se tomó según [ CITATION Uni16 \l 3082 ]

Una agencia de publicidad desea saber si el género de los consumidores es independiente de sus
preferencias de cuatro marcas de café. La respuesta determinará si se deben diseñar diferentes
anuncios dirigidos a los hombres y otros diferentes para las mujeres. Realice la prueba con un
nivel de significancía del 5%.
1. Los resultados obtenidos de la encuesta realizada a 139 personas fue:

2. Elaboración de la tabla de contingencia.

3. Calcular la Frecuencia Esperada.

4. Calcular los grados de libertad

5. Plantear las hipótesis.


 H0: La marca de café que se consume es independiente del sexo de una persona.
 H1: La marca de café que se consume depende del sexo de una persona.

6. Construcción de las áreas de aceptación y rechazo.

7. Calculando ji-cuadrada.
8. Tomar una decisión y concluir.

 Aceptar Ho:
Con un nivel de confianza del 5% se encontró que la marca de café es independiente del
sexo de la persona. Por lo que se recomienda elaborar un sólo tipo de anuncio.

PRUEBAS DE BONDAD Y AJUSTE


La prueba de ji cuadrada también se puede utilizar para decidir si una distribución de
probabilidad, como la binomial, la de poisson o la normal, es la distribución apropiada. “La
prueba ji cuadrada nos permite formular una pregunta para probar si existe una diferencia
significativa entre una distribución observada y de frecuencia y una distribución teórica de
frecuencias”. De esta manera, estamos en condiciones de determinar la bondad y ajuste de una
distribución teórica; en otras palabras, podemos precisar hasta que punto encaja en la
distribución de los datos que hemos observado. Así pues podemos determinar si debemos creer
que los datos observados constituyen una muestra extraída de la supuesta distribución teórica.
[ CITATION Uni16 \l 3082 ]

Procedimiento para elaborar una prueba de bondad y ajuste.

 Obtener la frecuencia observada (F.O), proveniente de una encuesta, estudio ó


experimento.
 Determinar la frecuencia esperada (F.E),
 Establecer el nivel de significancia
 Determinar los grados de libertad. De la siguiente manera:
g.l = K −1
Donde k es el número de categorías  La regla general para el calculo de los grados de libertad
en una prueba de bondad y ajuste, consiste en primero “emplear la regla (K-1) y luego se resta un
grado adicional de libertad para cada parámetro de población que tenga que ser estimado de los
datos de la muestra.

 Plantear las hipótesis


H0: lo que se sostiene el supuesto valor del parámetro.
H1: lo que contradice al supuesto valor del parámetro.

 Construir las áreas de aceptación y rechazo.


 Calcular Chi-cuadrada
 Tomar una decisión y emitir una conclusión, en términos del problema.

Ejemplo
1. Un dado se lanzó 36 veces, haga una prueba con un nivel de significancía del 5%, para
comprobar si el dado es legal o no. [ CITATION Uni16 \l 3082 ]
Los resultados obtenidos del ejercicio fueron los siguientes:

Número de puntos 123456


Frecuencia Observada. 3 5 8 7 6 7

2. Obtener la frecuencia esperada.

3. Calcular los grados de libertad

4. Plantear las hipótesis


 H0: La frecuencia observada en el lanzamiento del dado es igual a la frecuencia esperada,
de dicho lanzamiento.
 H1: La frecuencia observada en el lanzamiento del dado es diferente a la frecuencia
esperada, de dicho lanzamiento.

5. Establecer las áreas de aceptación y rechazo


6. Conclusión
Aceptar H0: Se encontró evidencia estadística, con un nivel de significancía del 5%, que
el dado es legal.

HOMOGENEIDAD
Otro caso en que usamos una tabla de contingencia es aquél en que se dispone de una población
X clasificada en r subpoblaciones x1, x2,...,xr. En cada una de estas poblaciones se toma una
muestra, y los individuos de la misma se clasifican según una variable Y que puede tomar m
valores posibles y1, y2.....ym. Sea pij la proporción de individuos que, en la población x i tiene como
valor de Y=yj. [ CITATION Ayl07 \l 3082 ]
Un contraste de homogeneidad es cuando se desean contrastar las dos hipótesis siguientes:
 H0:p1j = p2j = ...... = pmj para todo j; dicho de otro modo, todas las subpoblaciones tienen
idéntica distribución para la variable Y.
 H1: algunas de estas proporciones son diferentes. Dicho de otro modo, la distribución de la
variable Y en alguna de estas subpoblaciones es diferente
El principal objetivo de realizar este contraste es comprobar que las distribuciones de todas las
subpoblaciones son iguales o si hay alguna que difiere. Esto nos resulta práctico para poder
combinar los resultados de todas las subpoblaciones, pues es necesario asegurarse de que los
datos de las distintas muestras que se pretende agrupar son homogéneos.
Ejemplo
Se desea saber si la distribución de los grupos sanguíneos es similar en los individuos de dos
poblaciones. Para ello se elige una muestra aleatoria de cada una de ellas, obteniéndose los
siguientes datos ¿Qué decisión se debe tomar?
A B AB 0 Total
Muestra 90 80 110 20 300
1
Muestra 200 180 240 30 650
2
Total 290 260 350 50 950
Calculamos las frecuencias esperadas:
Tabla 3.5. Frecuencias esperadas
A B AB 0
Muestra 1 82.10
91.5789 5 110.53 15.789
Muestra 2 177.8
198.421 9 239.47 34.211
Posteriormente calculamos:
( f ij−eij )2
χ 2exp =∑ ∑
i j eij = 1,76
Los grados de libertad son: (n-1) x (m-1) = 1 x 3 = 3
Mirando en la tabla Chi-cuadrado obtenemos que la probabilidad de obtener un valor 7,81 o
mayor con 3 grado de libertad es p = 0,184. Por tanto el valor es no estadísticamente
significativo, pues es mayor que 0,01. Aceptamos la hipótesis de homogeneidad de grupos
sanguíneos en las dos muestras.

BIBLIOGRAFÍA

Aylmer, R. (2007). El estadístico Chi-cuadrado y contrastes asociados. Obtenido de


http://www.ugr.es/~analisisdedatos/webcurso/leccion/leccion3/apuntes.doc
Betensky, R., & Rabinowitz, D. (1999). Maximally selected chi2 statistics for k x 2 tables.
Biometrics.;55(1):317-20.
UCM. (sf). POBLACIÓN Y MUESTRA. Obtenido de
https://www.ucm.es/data/cont/media/www/pag-54183/APUNTES%20ESTAD
%C3%8DSTICA%203.pdf
Universidad Nacional Autónoma de México. (2016). PRUEBA DE JI-CUADRADA. Obtenido de
Facultad de Estudios Superiores Cuautitlán:
http://asesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica/CARPETA
%203%20INFERENCIA_ESTADISTICA/DOC_%20INFERENCIA/TEMA
%204/08%20PRUEBA%20DE%20CHICUADRADA.pdf

También podría gustarte