Está en la página 1de 29

Maestrando: Andres Briner

La prueba de X2 de Pearson es una prueba estadstica inferencial no paramtrica, bivariada, para investigar la asociacin de 2 variables cualitativas o categricas. El objetivo de la prueba es determinar si existe una relacin entre las variables, que no se explique por el azar, es decir que la variable independiente y la variable dependiente estn relacionadas y que esta relacin tenga significancia estadstica.

Para efectuar este test, los datos numricos de las frecuencias observadas en cada una de las categoras de las variables de estudio son contrastadas con sus respectivas frecuencias esperadas, y analizadas utilizando la siguiente formula que explicaremos a continuacin:

(Fo 2= X Fe

2 Fe)

(Fo 2= X Fe

2 Fe)

Fo = Frecuencia observada Fe = Frecuencia esperada

Tabla de contingencia
Para efectuar el clculo se vuelcan los datos obtenidos como frecuencias observadas en una tabla de contingencia. Se le llama tabla de contingencia a las tablas de frecuencia de dos variables presentadas en forma simultanea, en una matriz, las que son construidas listando todas las categoras de una variable como filas y de la otra variable como columnas.

Tabla de contingencia
Despus de llenar los datos de la frecuencia observada (Fo) en cada celda, las cifras son sumadas en totales por fila, por columna y total general (n). Para ejemplificar utilizar una de las tablas de contingencia de mi trabajo de investigacin.

Tabla de contingencia

Determinacin de la frecuencia esperada (Fe)


Luego en base a los datos obtenidos se procede a determinar la frecuencia esperada, para cada celda en base al siguiente clculo: Frecuencia esperada en cada celda = (total de la columna * total de la fila) / n Se grafica a continuacin:

Determinacin de la frecuencia esperada (Fe)

La frecuencia esperada para cada celda se obtiene multiplicando los totales de la fila y de la columna (llamadas tambin frecuencias marginales) y dividindolo por n, en este caso para la celda correspondiente a sexo masculino y retenidos, es 279 x 299 / 692 = 120.6 Fe = 120.6

Se calcula la frecuencia esperada para cada celda

Se ha colocado el valor de Fe bajo Fo en cada celda

Se calcula la frecuencia esperada para cada celda

Ntese que los totales de las sumatorias de Fe en columnas y filas es igual a las sumatorias de Fo obtenidas en la misma forma.

Se resta la frecuencia observada menos la esperada

Se procede a restar de la frecuencia observada, la frecuencia esperada, colocndose el valor obtenido bajo cada celda

Fo - Fe

Se resta la frecuencia observada menos la esperada

Se ha colocado el valor de Fo menos Fe en cada celda

Se resta frecuencia observada menos esperada

Ntese que la sumatoria de las diferencias en cada columna y en cada fila tienen como resultado = 0

La diferencia se eleva al cuadrado, en cada celda

Y se divide en la frecuencia esperada (Fe) obtenindose X parcial para cada celda

Por ltimo se efecta la sumatoria de los X de cada una de las celdas

X = 0.8969 + 0.6828 + 0.6063 + 0.4610

X = 2.647

Una vez obtenido el valor de X se procede a la determinacin de los valores crticos que nos permiten concluir si podemos o no rechazar la hiptesis nula (Ho). Para determinar la significancia estadstica se ingresa en una tabla el valor de X y los grados de libertad. Los grados de libertad se definen como el numero de filas -1 multiplicado por el numero de columnas 1, en este caso tenemos 2 filas y dos columnas, lo que nos da como resultado gl = 1 o tambin gf = 1

Asi se compara el valor de X obtenido (2.647) con la cifra correspondiente al valor de la significancia estadstica del presente estudio, que en este caso es p < 0.05

El valor de X es menor que el de la tabla, no alcanzando la significancia estadstica.

El procedimiento mediante el uso de software SPSS ver. 20 es similar pero simplificado.

Hacer click

marcar

Y hacer click .

Marcar

Y hacer click

Y obtenemos:

Aqu tenemos el ejemplo de otra tabla de contingencia, de 6 columnas y 2 filas, gl = 5 y con significancia estadstica

Es muy importante dejar en claro que en cada casilla de la tabla de contingencia solo puede haber frecuencias y no otros valores como por ejemplo porcentajes o proporciones, ya que en esos casos el test no puede operar. Otra restriccin importante del test de X es que el tamao de nuestra muestra n no puede ser menor a 20 y ninguna casilla con una frecuencia menor a 5.

Conclusin
El test de significancia de X es una herramienta til para determinar si tiene sentido que el investigador interprete las tablas de contingencia. Un resultado significativo significa que los valores de las celdas de la tabla de contingencia debe ser interpretada. Un test no significativo significa que no se descubri efectos, y las diferencias en las casillas se pueden explicar por el azar. En este caso la interpretacin de las frecuencias en cada casilla no esta indicada.

Muchas gracias!!!