Está en la página 1de 3

10 DUDAS FRECUENTES QUE NUNCA NOS ANIMAMOS A PREGUNTAR

F. Penna; H. Cobos; S. Vzquez Ferrero & C. Ulagnero

10 DUDAS FRECUENTES QUE NUNCA


NOS ANIMAMOS A PREGUNTAR

Anlisis de variables categricas:


Distribucin Ji-Cuadrado (2)

1.- Por qu, al aplicar la prueba 2 en el estudio de tablas de contingencia,


es importante verificar si hay frecuencias observadas menores de cinco?
Porque con frecuencias observadas bajas cabe esperar frecuencias esperadas
bajas. Y las frecuencias esperadas aparecen en el denominador de la frmula
con que se determina la variable pivotal. Una frecuencia esperada cero llevara
a una divisin por cero que no es posible efectuar y un cociente con una
frecuencia casi cero (por ejemplo, 0,000007) conllevara un sumando, en la
frmula, enorme y, as, una suma enorme que nos llevara a rechazar la H0
indebidamente. Dicho en trminos ms tcnicos se incrementara el Error
Tipo I (rechazo indebido de la H0 por ser sta verdadera).

2.- Dado el nivel de significacin tradicional, una prueba 2 que lleve


asociado un p-valor > 0,05 razn por la que no podra rechazarse la H0
nos permite estar seguros de que las dos variables son independientes?
No. Slo nos dice que no hay pruebas suficientes para rechazar la
independencia con el nivel de confianza o de significacin preestablecido, o de
acuerdo con el nivel de Error Tipo I que se est dispuesto a cometer.

3.- Una prueba 2 que lleve asociado un p-valor < 0,05, nos permite estar
seguros de que las dos variables estn relacionadas?
No. Slo nos dice que, a la vista de las pruebas que aportan los datos, el
riesgo que corremos al rechazar la hiptesis nula de independencia es bajo.
Pero garanta total de que estn relacionadas las variables no tenemos. Tal
como ocurre en un juicio, si el juez estima que las pruebas son suficientes
para declarar culpable al acusado, as lo declara y lo penaliza (con crcel, por
ejemplo) pero certeza absoluta no hay.

4.- Se puede utilizar la prueba 2 con variables ordinales?


S. Cualquier variable puede operacionalizarse de modo tal que quede
reducida no ms que al categrico: pero ste no da cuenta de la informacin
(numrica, cuantitativa) asociada al orden en s.

1
10 DUDAS FRECUENTES QUE NUNCA NOS ANIMAMOS A PREGUNTAR
F. Penna; H. Cobos; S. Vzquez Ferrero & C. Ulagnero

5.- Al analizar una tabla de contingencia con frecuencias observadas nulas


que proporciona resultados estadsticamente significativos, debemos
tomar alguna precaucin?
S, porque la significacin puede ser espuria (ver respuesta a la pregunta n.
1).

6.- Al analizar una tabla de contingencia con frecuencias observadas nulas


que proporciona resultados estadsticamente no significativos, debemos
tomar alguna precaucin?
No, porque frecuencias observadas bajas llevan asociadas frecuencias
esperadas bajas. stas sern consideradas en el denominador del estadstico
de contraste y pueden proporcionar un valor experimental ms alto que el
real. Entonces: si, incluso siendo mayor de lo que debera, no ha sido
suficiente para rechazar la hiptesis nula de independencia el hecho de que
se haya aumentado no hubiera tenido relevancia alguna.

7.- Al confeccionar y analizar una tabla de contingencia que contiene


frecuencias relativas (o porcentajes) y proporciona resultados
estadsticamente significativos, debemos tomar alguna precaucin?
Trabajando con frecuencias relativas (o porcentajes), el valor del estadstico de
prueba (o variable pivotal) es ms bajo del que debera ser. Si, aun siendo ms
bajo, ha sido suficiente para rechazar la hiptesis nula de independencia
entonces no hay inconvenientes.

8.- Al confeccionar y analizar una tabla de contingencia que contiene


frecuencias relativas (o porcentajes) y proporciona resultados
estadsticamente no significativos, debemos tomar alguna precaucin?
S. Trabajando con frecuencias relativas (o porcentajes), el valor del estadstico
de prueba es ms bajo del que debera ser. La aceptacin de la hiptesis nula
de independencia puede deberse a eso. En trminos ms precisos, podramos
decir que se incrementa el riesgo de cometer un Error Tipo II (no rechazo de la
H0 siendo sta falsa).

9.- Si en lugar de tener dos variables, tenemos tres (o ms): bastara con
estudiar tantas tablas de contingencia como resulten de la combinacin
en pares de variables (cruzando la variable n 1 con la n 2, la n 1 con la
n 3, la n 2 con la n 3, etc.)?
No. Esa es una mala prctica porque puede ocurrir que la informacin
resultante de los anlisis parciales sea contradictoria (hecho conocido en la
literatura especializada como la Paradoja de Simpson: Fenmeno de
confusin en el cual la intervencin de una variable cambia la direccin de
una asociacin).
Supongamos las siguientes tablas en la que se recoge informacin sobre la
posible relacin entre la esperanza de encontrar empleo y la duracin de la
desocupacin, tanto para varones como para mujeres:

2
10 DUDAS FRECUENTES QUE NUNCA NOS ANIMAMOS A PREGUNTAR
F. Penna; H. Cobos; S. Vzquez Ferrero & C. Ulagnero

Si analizamos la tabla bifactorial correspondiente a los varones, obtenemos


que las frecuencias esperadas bajo supuesto de independencia son
exactamente iguales a las frecuencias observadas; hecho este que se
corresponde con un valor del estadstico de prueba 2 = 0 y con la conclusin
de que, en varones, ambas variables pueden considerarse independientes.
El mismo anlisis sobre la tabla bidimensional para las mujeres, proporciona
de nuevo un valor experimental nulo del cual podemos concluir que, tambin
en mujeres, la esperanza de encontrar empleo puede considerarse
independiente de la duracin de la desocupacin.
Como el resultado se mantiene, tanto en hombres como en mujeres, parece
que el sexo no tiene mayor inters en el estudio.
Sin embargo, reuniendo en la tabla las frecuencias correspondientes a ambos
sexos, obtenemos la tabla siguiente:

El valor del estadstico de prueba 2 es 94,252; el cual corresponde con un p-


valor altamente significativo (p < 0,01), razn por la cual debemos concluir, a
la vista de este nuevo anlisis, que ambas variables estn claramente
correlacionadas. Esto supone una clara contradiccin con los dos resultados
anteriores: Paradoja de Simpson.
El problema se debe a que la presencia de la tercera variable puede llevarnos
a una ponderacin inadecuada de las distintas poblaciones en estudio. En
este ejemplo ficticio, 100 varones llevaban desocupados un tiempo corto y slo
10 mujeres estaban en esa situacin; justo la proporcin se inverta para los
de larga duracin. Sin embargo, esta informacin no haba sido reflejada al
calcular el valor del estadstico de contraste.
10.- Qu hacer cuando tenemos tres variables en estudio?
Abordar el problema analizando las tablas trifactoriales. Esta situacin es ms
compleja ya que no hay una nica hiptesis a contrastar sino 7. Requiere del
estudio de procedimientos que no veremos en la materia.

También podría gustarte