Está en la página 1de 6

1

Relaciones entre variables cualitativas



Problema: Existe relacin entre el estado nutricional y el rendimiento acadmico de estudiantes de enseanza bsica?

Estado Nutricional
Malo Regular Bueno TOTAL
Bajo 130 95 30 255
Promedio 90 450 35 575
Rendimiento
Acadmico
Sobre 70 30 70 170
TOTAL 290 575 135 1000

Ya vimos cmo podemos describir los datos que provienen de este tipo de problema, mediante tablas de contingencia o de
doble entrada. En esta unidad revisaremos los test estadsticos disponibles, el test de Ji cuadrado y el test F.

Test de Ji-cuadrado

Existen varios tests de Ji cuadrado
*
que sirven para contestar distintas preguntas, pero estos tienen ciertas caractersticas
comunes:

1. Los datos consisten en frecuencias observadas (O), esto es, cuantos tems o sujetos caen en cada categora.

2. Se calculan las frecuencias esperadas (E) bajo
0
H , esto es, las frecuencias que esperamos ver en cada categora si la
correspondiente hiptesis nula es correcta.

3. Comparamos las frecuencias observadas con las esperadas por medio del test estadstico que ser una medida de cun
cerca estn las frecuencias observadas de las frecuencias esperadas bajo
0
H . Entonces, si la "distancia" es grande,
tenemos evidencia para rechazar
0
H . El test de Ji cuadrado es:
( )


=
E
E O
2
2



Si las frecuencias observadas estn cerca de las frecuencias esperadas bajo
0
H , entonces el estadstico de
2
debe ser
chico. Valores grandes del estadstico indican diferencias entre lo observado y lo esperado. Como slo valores grandes
son evidencia a favor de la hiptesis alternativa, los tests de Ji cuadrado son unilaterales y la direccin del extremo es
hacia la derecha. El valor-p ser la probabilidad de observar un test estadstico igual o mayor al calculado, asumiendo
que la hiptesis nula es cierta.

4. La relacin entre el test y la distribucin funciona bien siempre cuando el nmero esperado es al menos 5. En general
los softwares estadsticos verifican este supuesto.


Propiedades de la distribucin de Ji-cuadrado ( ) gl
2


- La distribucin no es simtrica, es sesgada a la derecha
- Sus valores son cero o positivos, no negativos.
- La distribucin est definida por el nmero de grados de libertad.
- El promedio de la distribucin de Ji-cuadrado es igual a sus grados de libertad.
- La varianza de la distribucin de Ji-cuadrado es dos veces sus grados de libertad (2 gl).


*
Esencialmente la prueba de asociacin que veremos aqu y las pruebas de bondad de ajuste.
2
0 5 10 15 20

2
gl=1
gl=4
gl=10

Figura: Distribuciones de Ji cuadrado con distintos grados de libertad


3
Tabla de Ji cuadrado


4
Prueba de asociacin o de independencia
*


La prueba de asociacin, permite al investigador saber si existe asociacin entre dos variables cualitativas.

Ejemplo: Para evaluar un nuevo tratamiento, cuyos resultados son desconocidos, se trata a 12 pacientes con el nuevo
tratamiento y a 13 pacientes (seleccionados aleatoriamente) con un tratamiento antiguo y se registra si mejora o no.

Tratamiento
Experimental Antiguo

Total
Mejora 9 2 11 Estado
No mejora 3 11 14
Total 12 13 25

a) Planteamiento de la hiptesis

Hiptesis de nulidad (
0
H ): No hay asociacin entre el estado del paciente y el tratamiento, es decir, el porcentaje de pacientes
que mejora es el mismo, sin importar a qu tratamiento fue sometido.

Simblicamente,
ant
P P H =
exp 0
: en que P representa el porcentaje de mejora.

Hiptesis alternativa (
1
H ): Hay asociacin entre el estado del paciente y el tratamiento, es decir, el porcentaje de pacientes
que mejora es diferente entre los sometidos al tratamiento experimental y los sometidos al tratamiento antiguo.

Simblicamente,
ant
P P H
exp 1
:

Estadstica a utilizar:

2
1
2
=

=

i
fxc
i i
i
O E
E
( )

en que:

i
O = frecuencia observada en la celda i

i
E = frecuencia esperada en la celda i
fxc = nmero de celdas, se obtiene multiplicando nmero de filas (f) por nmero de columnas (c). En este problema =4

b) Clculo del Ji-cuadrado

Bajo la hiptesis nula, no hay asociacin entre el estado del paciente y el tratamiento; por lo tanto, el porcentaje que mejora
debera ser el mismo para los dos tratamientos. Su mejor estimacin ser: 11/25, 44%, vale decir, el porcentaje de mejora
observado en el total. La frecuencia esperada (
i
E ) de los que mejoran la obtenemos aplicando este porcentaje a los totales
marginales, respectivamente.
28 , 5 12
25
11
1
= = E 72 , 5 13
25
11
2
= = E
Por analoga, la frecuencia esperada (
i
E ) de los que no mejoran la obtendremos aplicando 14/25, 56% el porcentaje de los que
no mejoran a los totales marginales, respectivamente.

72 , 6 12
25
14
3
= = E 28 , 7 13
25
14
4
= = E


*
Algunos textos hacen la distincin entre una prueba de Ji cuadrado de independencia y una prueba de Ji cuadrado de
homogeneidad. El clculo y la interpretacin prctica de cada procedimiento son idnticos. Utilizamos la prueba de
asociacin para incluir ambos tipos.
5
Una manera alternativa para el clculo de las frecuencias esperadas para determinada celda utiliza los totales de la fila y de la
columna en que se encuentra el valor observado de la celda:

E = (total fila x total columna)/ Total

El estadstico observado a partir de los datos de este ejemplo es:

( ) ( ) ( ) ( )
000 , 9
28 , 7 11 72 , 6 3 72 , 5 2 28 , 5 9
28 , 7 72 , 6 72 , 5 28 , 5
2 2 2 2
2
=

=
OBS



c) Grados de libertad
Este test de Ji cuadrado tiene distribucin de Ji cuadrado con (nmero de filas - 1) x (nmero de columnas - 1)
grados de libertad.

En este ejemplo, (2-1) x (2-1) = 1 grado de libertad

Comparemos con la salida del SPSS:

Pruebas de chi-cuadrado
9.000
b
1 .003
6.744 1 .009
9.638 1 .002
.005 .004
8.640 1 .003
25
Chi-cuadrado de Pearson
Correccin por
continuidad
a
Razn de verosimilitudes
Estadstico exacto de
Fisher
Asociacin lineal por
lineal
N de casos vlidos
Valor gl
Sig. asinttica
(bilateral)
Sig. exacta
(bilateral)
Sig. exacta
(unilateral)
Calculado slo para una tabla de 2x2.
a.
0 casillas (.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada
es 5.28.
b.




6
Supuestos del test de Ji cuadrado

La prueba de Ji cuadrado no asume distribucin alguna para las observaciones, es decir es una prueba no paramtrica. Un
supuesto bsico al utilizar esta prueba consiste en que cada observacin registrada en la tabla de contingencia es
independiente de las dems. "Independencia" en este contexto significa que no ms de una observacin viene de cada
unidad observacional. La unidad ms comn es una persona. Si hay 96 personas en estudio, el nmero total de
observaciones en la tabla de contingencia deber ser 96. Si la misma persona contribuye en ms de una entrada en una tabla,
la prueba de Ji cuadrada no es apropiada.
Por ltimo, un supuesto importante es saber que el estadstico de Ji cuadrado sigue una distribucin de Ji cuadrado siempre
que los valores esperados sean mayores que 5, si esto no se cumple, el test no es vlido.

Qu hacer si tenemos frecuencias esperadas menores que 5?

El test de probabilidad exacta de Fisher

Se utiliza para el anlisis de tablas de contingencia cuando no se cumple el requisito del tamao mnimo para aplicar el mtodo
de Ji cuadrado, que exige que los valores esperados en cada celda de la tabla sean al menos 5. El test de probabilidad exacta de
Fisher requiere el clculo de las probabilidades individuales para las distintas maneras (combinaciones) en que pueden aparecer
las frecuencias dentro de las celdas de la tabla de contingencia, manteniendo constantes las frecuencias marginales.
No vamos a revisar los clculos para la prueba de Fisher sino que revisaremos la solucin que nos da la salida SPSS cuando
analizamos tablas de contingencia.


Paradoja de Simpson (opcional)

Ya hemos revisado el problema de las variables confundentes, el efecto de estas variables podra influenciar la asociacin
entre dos variables categricas.

Ejemplo: Suponga que el Ministerio de Salud nos entrega datos sobre la mortalidad de dos Hospitales de la Regin. Los
datos en una tabla de 2x2 nos muestran la sobrevivencia de pacientes despus de ciruga en el hospital A y B, donde
sobrevivencia significa que el paciente est vivo al menos 6 semanas despus de la ciruga.

HOSPITAL
A B
Vivo 2037 784
Estado
paciente
Muerto 63 16
Total 2100 800

Hospital A pierde 63/2100 = 3% de los pacientes de ciruga y Hospital B pierde 16/800 = 2% de los pacientes de ciruga.
Concluimos que el Hospital B es "mejor".

Pero, no todas las cirugas son del mismo tipo. Luego, se entregan nuevos datos que incluyen la condicin de los pacientes
antes de la ciruga clasificados como "buena" o "mala".

Buena condicin Mala condicin
Hospital Hospital
A B A B
Sobrevive 594 592 Estado Sobrevive 1443 192
Muere 6 8 Muere 57 8
Estado
Total 600 600 Total 1500 200

Si analizamos ahora segn la condicin, resulta que en el Hospital A slo 6/600 = 1% muere y en el Hospital B 8/600 =
1,3% muere entre los pacientes que estaban en buenas condiciones. Entre los pacientes que estn en malas condiciones en el
Hospital A slo 57/1500 = 3,8% muere y en el Hospital B 8/200 = 4% muere. Este fenmeno es conocido como la paradoja
de Simpson.

También podría gustarte