Está en la página 1de 5

12.

7 PRUEBA DE INDEPENDENCIA (TABLAS DE CONTINGENCIA)

Puede decirse que en las pruebas de bondad de ajuste se tiene o emplea un solo criterio de clasificacin. No obstante, frecuentemente se requiere analizar las observaciones bajo dos o ms criterios de clasificacin. Para ver esto pngase el caso de una encuesta de intencin de voto. El criterio puede ser simplemente el partido poltico por el cual el sujeto entrevistado votar en una eleccin particular; de este modo se pueden tener, por ejemplo, 4 categoras o valores de la variable en estudio:

Las observaciones (frecuencias) se organizan en una columna adyacente, y puede plantearse una prueba de bondad de ajuste para ver si los resultados corresponden a un cierto modelo; por ejemplo 30: 20: 35: 15. El anlisis, sin embargo, puede estratificarse adicionando otro criterio o variable, por ejemplo el sexo del entrevistado, con valores: hombre, mujer. La distribucin de los resultados (frecuencias observadas de cada partido segn el sexo) requiere una tabla bidimensional, no una columna, como en el caso anterior (vea tabla 12.16).

La tabla resultante, llamada tabla de contingencia, tiene 8 celdas, producto de los cuatro valores posibles de la variable partido poltico por los dos valores de la variable sexo. En general suele verse simplemente como el producto del nmero de filas por el nmero de columnas de la tabla:

Celdas = filas X columnas = f X c Uno de los objetivos de la clasificacin doble es establecer si existe asociacin entre los dos criterios o variables, o si, por el contrario, se pueden considerar independientes. En el caso de los votantes, se puede determinar estadsticamente si la eleccin de partido poltico depende del sexo o si tal decisin es independiente del gnero. El razonamiento para contrastar si existe o no asociacin entre dos variables cualitativas se basa en calcular los valores de frecuencia esperados para cada una de las celdas, considerando que efectivamente las variables son independientes (hiptesis nula), y compararlos con los valores observados. Si las diferencias, medidas con el estadstico x^2 no son significativas estadsticamente, no hay razn para dudar que las variables sean independientes. Los grados de libertad para esta prueba se calculan multiplicando el nmero de valores de una de las variables menos uno por el nmero de valores de la otra variable menos uno; en trminos de filas y columnas: gl=(f- 1)(c-1) Como en ocasiones anteriores, se recurre a una situacin para mostrar la mecnica de la prueba. El uso de telfonos celulares ha aumentado drsticamente en los ltimos aos. A las autoridades de trnsito y a los fabricantes de telfonos celulares les interesa el efecto de stos en la tasa de accidentes de trnsito. La pregunta en trminos simples puede ser: es ms probable que tenga un accidente de trnsito alguien que est usando un telfono celular? La pregunta puede transformarse en hiptesis como sigue: Tabla 12.17 Frecuencias Observadas Sufri un Accidente Usando TC 24 No Usando TC 52

No Sufri un Accidente 296 408

Tabla 12.18 Totales Marginales y Gran Total Sufri un Accidente Usando TC No Usando TC Total Marginal 24 52 76

No Sufri un Accidente 296 408 704

Total Marginal 320 460 780(Gran Total)

H0: Las variables accidente de trnsito y uso de telfono celular son independientes H1: Las variables accidente de trnsito y uso de telfono celular no son independientes Una muestra aleatoria de 780 automovilistas que utilizan telfono celular cuando manejan report los resultados mostrados en la tabla 12.17. Corresponden a un periodo de 12 meses.

Los totales de cada fila y de cada columna son llamados totales marginales, mientras que la suma de las frecuencias de todas las celdas se conoce como el gran total, y corresponde al tamao de muestra n. La frecuencia esperada para la celda correspondiente al rengln i y la fila j, representada como Eij, se calcula de la siguiente manera: Eij=

total marginal fila i x total marginal columna j n

As, para la primera fila se tiene i = 1 y j = 1,2, de modo que las frecuencias son: E1,1=

320x76 320x704 = 31 ; E1,2= = 289 780 780 460x76 460x704 = 45 ; E2,2= = 415 780 780

Para la segunda fila, i = 2 y j = 1,2: E2,1=

Los resultados se incorporan a la tabla 12.19, quedando:

Tabla 12.19 Frecuencias Esperadas y Observadas Sufri un Accidente 0i,j Usando TC No Usando TC Total Marginal 24 52 76 Ei,j 31 45 76 No Sufri un Accidente 0i,j 296 408 704 Ei,j 289 415 704 Total Marginal 0i,j 320 460 780 Ei,j 320 460 780

Los totales marginales y el gran total para los valores esperados debern ser los mismos que los de los valores observados. El valor del estadstico de prueba, adaptando la expresin (12.15) a las tablas de contingencia, queda en general as:

Donde f= nmero de filas y c = nmero de columnas. La frmula (12.19) significa calcular las diferencias de los valores observados y esperados, elevarlos al cuadrado y dividirlos entre los valores esperados de cada celda y sumarlos. En este caso:

De tablas, el valor de x^2 Para gl= (2-1)(2-1) = 1 y un nivel de significancia de 0.05 da X^2(0.05,1)= 3.84 Como el valor observado de x^2 es menor que el de tablas, se acepta la hiptesis nula. Ejemplo 12.14 Se debe resolver la situacin de los accidentes y el uso de telfonos celulares utilizando el programa 12.1. Solucin Seleccionar en el programa 12.1 Ji cuadrada-Tablas de contingencia. Se escriben el nmero de filas (2) y de columnas (2), con lo que se obtiene la tabla para anotar los valores observados. Despus se selecciona el nivel de confianza y se hace clic en el botn Ejecutar. Se muestra la interface resultante:

Pruebas de homogeneidad Cuando una de las dos variables de clasificacin de una tabla de contingencia est controlada por el investigador, de forma que los totales de los renglones o de las columnas estn predeterminados o fijados antes de recolectar los datos, a la prueba de independencia se le llama prueba de homogeneidad. En este tipo de pruebas se sabe de antemano que las poblaciones son diferentes, y el inters radica en tomar una decisin

acerca de si el comportamiento de stas es homogneo respecto de alguna caracterstica. ste es el caso, por ejemplo, que se presenta si se tiene inters en determinar si los ingenieros egresados de instituciones oficiales tienen mayor disposicin para el trabajo de investigacin que los egresados de instituciones privadas. Se resuelve a continuacin un ejemplo. Suponga que 10,0 abogados, 190 contadores, 300 ingenieros y 400 mdicos participan en un estudio para calcular la magnitud del consumo de alcohol en las cuatro profesiones. La pregunta de investigacin se plantea genricamente de la siguiente manera: son las muestras extradas de poblaciones diferentes homogneas respecto de algn criterio de clasificacin? El modelo estadstico correspondiente es: H0: La proporcin de profesionistas cuyo consumo de alcohol es ocasional, moderado o alto es la misma en los cuatro grupos. H1: La proporcin de profesionistas cuyo consumo de alcohol es ocasional, moderado o alto no es la misma en los cuatro grupos. Los resultados que se obtuvieron en un experimento multinomial son los siguientes: Tabla 12.20 Frecuencias observadas para una prueba de homogeneidad

Los clculos a partir de este punto siguen exactamente los mismos pasos y frmulas que en las pruebas de independencia. As, los valores esperados son: Eij=

total marginal fila i x total marginal columna j n

Haciendo los clculos se obtiene x^2(0) = 31.201. Como gl= (3 - 1)(4 - 1) = 6 y = 0.05, se tiene de tablas x^2(0.05,6) = 12.59. Por lo tanto, se rechaza la hiptesis nula.

También podría gustarte