P. 1
Tablas Contingencia

Tablas Contingencia

|Views: 8|Likes:
Publicado porangel

More info:

Published by: angel on Aug 22, 2013
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOC, PDF, TXT or read online from Scribd
See more
See less

03/30/2015

pdf

text

original

TABLAS DE CONTINGENCIA CON CHI CUADRADA

TABLAS DE CONTINGENCIA

Página 1 de 9

2) Construir una tabla que contenga los valores observados.. Eij = Valor esperado de la celda i. Para probar las diferencias entre las proporciones de varios grupos (tabla de contingencia). concuerda con el modelo (serie esperada) de la información. Ho: No hay diferencia o no hay dependencia entre variables H1: Hay diferencia o si hay dependencia entre variables Pasos para realizar la tabla de contingencias χ 2 1) Plantear las hipótesis: Ho = p1 = p 2 = p3 .j.j 6) Determinar los grados de libertad mediante: gl = ( r − 1)( c − 1) donde r = número de renglones c = número de columnas 7) Calcular el valor crítico en la tabla χ 2 8) Criterio de decisión: si el valor crítico < valor del estadístico de prueba rechazamos Ho Página 2 de 9 . TABLAS DE CONTINGENCIA χ2 La tabla ji. = p k H1: al menos dos proporciones son diferentes.. Para todos los casos.cuadrada ( χ 2 ) se utiliza principalmente : • • Para probar si una serie de datos observada.TABLAS DE CONTINGENCIA CON CHI CUADRADA TABLAS DE CONTINGENCIA 1. 4) Debajo de cada valor observado poner el valor esperado utilizando la fórmula: Eij = ( total de i − ésimo renglón × total de j − ésima columna ) n 5) Calcular el valor del estadístico de prueba χ2 usando la fórmula: (Oij − Eij ) χ2 = ∑ Eij donde: Oij = Valor observado de la celda i. 3) Sumar los totales de los renglones y columnas de los valores observados.

las calificaciones de matemáticas fueron tabuladas en la siguiente tabla de contingencia de 3 × 2 para estudiar la relación entre la asistencia a clase y la calificación obtenida. los valores esperados se colocan en las celdas con paréntesis.TABLAS DE CONTINGENCIA CON CHI CUADRADA Ejemplo: Al final de un semestre. Página 3 de 9 . No Ausencias Aprobado aprobado 0-3 135 110 4-6 36 4 7 .. para calcular los utilizamos la fórmula: E ij = ( total de i − ésimo renglón × total de j − ésima columna ) n Total 245 40 15 300 Nùmero de ausencias Aprobado No aprobado 0-3 135 110 (147) (98) 4-6 36 4 (24) (16) 7-45 9 6 (9) (6) Total 180 120 Calculamos el valor del estadístico de prueba χ2 usando la fórmula: χ2 = ∑ (O ij − Eij ) ∧ 2 Eij La tabla siguiente nos ayuda a organizar los cálculos para el estadístico. ¿indican los datos que son distintas las proporciones de estudiantes que pasaron en las tres categorías de ausencias? H0 : p 1 = p 2 = p 3 H1 : al menos dos proporciones son diferentes. Nùmero de ausencias Aprobado No aprobado 0-3 135 110 ( ) ( ) 4-6 36 4 ( ) ( ) 7-45 9 6 ( ) ( ) Total 180 120 Total 245 ( ) 40 ( ) 15 ( ) 300 Los valores Oij = 135. 110. corresponden a los valores observados.45 9 6 Con α = 0.05 ..

98 144 1. Conclusión: Como el estadístico calculado Chi cuadrado es mayor al Chi de alfa y el valor P es menor a Alfa.44.00 144 9. Conclusión: Como este estadístico está localizado en la región de rechazo (a la derecha del valor crítico) .1) (3.00 17. Los datos de 3 proveedores en relación a partes defectuosas es como sigue: Probar a un 5% de significancia si los defectos dependen del tipo de proveedor.00 0 0. se rechaza Ho indicando que si hay dependencia de los aprobados y asistencias. Ejercicio 1. Proveedor A B C Buenos 90 170 135 Con Def menores 3 18 6 Con def graves 7 7 9 Página 4 de 9 .cuadrada encontramos que vale 5.1) (1.45 Tabla.l. rechazamos Ho por lo cual aceptamos la hipótesis alternativa H 1: al menos dos proporciones son diferentes.TABLAS DE CONTINGENCIA CON CHI CUADRADA Celda (1.991. Se trata de ver si el número de reclamaciones depende de la marca para un 5% de nivel de significancia.47 144 6. = 2 se denota χ0.2) Oij 135 110 36 4 9 6 Eij 147 98 24 16 9 6 (Oij-Eij)^2 (Oij -Eij)^2/Eij 144 0. En la tabla ji. Ho: Los rechazos son independientes de la marca. Cálculos para el estadístico Chi cuadrada Para determinar el valor crítico del estadístico de prueba procedemos de la siguiente manera: Determinar los grados de libertad usando la fórmula: gl = ( r −1)( c −1) . el valor del estadístico de prueba es χ2 =17. La tasa de aprobación si depende de las asistencias.00 0 0.2) (2.05 y g.05 (2) .1) (2.gl = (3-1)(2-1) = 2 2 El valor critico del estadístico ji-cuadrada para α = 0.2) (3. Ha: los rechazos dependen de la marca marca 1 2 3 OK 200 150 210 Rech 35 24 40 Ejercicio 2.

Los resultados de este procedimiento son expuestos en la figura siguiente.TABLAS DE CONTINGENCIA CON CHI CUADRADA Procedimiento de tablas de contingencia con SPSS Las tablas de contingencia nos permiten realizar comparaciones de Relación / Independencia entre dos o más variables categóricas. es necesario vincular las categorías de una de las variables en las Filas y las categorías de la segunda variable en las Columnas. es tener una respuesta o valor valido en las dos o más variables que compongan la tabla de lo contrario. el caso será excluido. Por ejemplo. La única condición que debe cumplir un caso (Respuestas de un encuestado) para ser incluido en la tabla de contingencia. también se acostumbra introducir Totales en las filas y columnas. si uno de los encuestados no responde la pregunta del Género. identificando aspectos como ¿cuántos hombres tienen teléfono celular? o ¿cuantas mujeres no tienen teléfono celular?. pero si la del Teléfono o viceversa. Para hallar la frecuencia de cada una de estas opciones. Si nos fijamos en los resultados de la tabla del Género. ya sean de tipo Nominal u Ordinal. observaremos que el 40% de los encuestados si tiene. es necesario acudir a los datos y verificar cuantos de los hombres y mujeres tienen teléfono y cuantos no. mientras el 60% no tiene. si nos fijamos en la tabla de tenencia de teléfono celular. Así mismo. la posición dos (2) representa a los hombres que No tienen teléfono. notaremos que el 35% de los encuestados corresponde a los hombres. la posición tres (3) representa a las mujeres que tienen teléfono y la posición cuatro (4) a las mujeres que No tienen teléfono. Figuras Si nos fijamos en la tabla de la figura [6-3]. Página 5 de 9 . Además de las frecuencias de cada uno de los cruces de categorías. Si introducimos las categorías de la variable Género en las Filas y las categorías de la variable Teléfono celular en las Columnas obtendríamos la tabla de la figura [6-2]. Los resultados de estas preguntas se plasman en las tablas de la figura. el caso será excluido al momento de generar la tabla de contingencia. el número de encuestados (que para el caso corresponde a 20). A través de una tabla de contingencia podemos obtener la relación de estas dos preguntas. mientras el 65% restante corresponde a las mujeres. Figura Para generar una tabla de contingencia. con el fin de obtener la mayor cantidad de información posible de las variables. Para comprender el concepto nos apoyaremos en los resultados de la encuesta piloto realizada a 20 personas cuyas preguntas son ¿Género del encuestado? y ¿Tiene teléfono celular?. en donde la posición uno (1) representa a los hombres que tienen teléfono. notaremos que los dos totales dan como resultado final. En este tipo de tablas se definen las categorías de una variable a través de la frecuencia o el porcentaje de las categorías de una segunda variable.

. Este cuadro de diálogo esta dividido en cuatro secciones (Lista de variables. el programa genera una tabla de contingencia para cada una de las categorías de la variable de Capa. Al hacer clic en él aparece el cuadro de diálogo correspondiente. Una vez abierto el archivo. Estadísticos descriptivos. podemos ejecutar el procedimiento. el cual se encuentra en el menú Analizar. por lo que debemos ir al menú Archivo. Para comprender mejor la metodología empleada en las tablas de contingencia y los elementos que nos facilita el procedimiento. en cuyo caso el objetivo es proporcionar información condensada que describa las categorías de las variables involucradas.Datos y por medio de la ventana de navegación ubicar el archivo en la unidad de CD ROM. intentando aumentar la complejidad de forma gradual. Columnas o Capas).sav incluido en la carpeta Capítulo6 del CD adjunto..B]. sus categorías definen cada una de las filas de datos de la tabla. Para este objetivo se emplean pruebas estadísticas a los datos de una muestra (por lo general la prueba de independencia de Chi-cuadrado). el programa genera una tabla de contingencia para cada combinación de variables de fila y columna. encontramos las tres ubicaciones que podemos emplear para las variables de la tabla (Filas. Opciones de resultados y Botones de opción).. Los ejemplos de este capítulo se realizarán con los datos del archivo Cruces. al ingresar una variable a la casilla Filas. al hacer clic sobre el procedimiento aparece el cuadro de diálogo correspondiente [Fig.. Figuras A y B En la sección Casillas de selección. en las siguientes lecciones vamos a generar una serie de ejemplos. en donde se intenta extraer conclusiones sobre las relaciones de las variables que puedan ser aplicadas a una población..TABLAS DE CONTINGENCIA CON CHI CUADRADA Las tablas de contingencia pueden servir a diferentes propósitos como el análisis descriptivo. Por último encontramos la casilla de Capa.. al ingresar una variable en esta casilla.Abrir. A su vez este tipo de tablas también pueden ser empleadas para la generación de análisis de Inferencia. sus categorías definen cada una de las columnas de la tabla. Casillas de selección. Para generar una tabla de contingencia es necesario tener un archivo de datos abierto en el Editor de datos de SPSS.A].Tablas de contingencia [Fig. a su vez al ingresar una variable en la casilla Columnas. Si se ingresan múltiples variables a una de las casillas. sin realizar comparaciones explicitas que generen conclusiones de una población. Página 6 de 9 . Todas las pruebas con que cuenta las tablas de contingencia se encuentran ubicadas dentro de las opciones del botón Estadístico.

Para finalizar hacemos clic en Continuar y luego en Aceptar con lo que los resultados son creados en el visor (figura siguiente) Página 7 de 9 .05 se rachaza la hipótesis nula. coeficiente eta. gamma. El cálculo del Chi-cuadrado arroja como resultado un valor numérico denominado alfa (a). A continuación seleccionamos el botón Estadísticos y activamos la opción Chi-cuadrado. Esta prueba nos permite determinar si el comportamiento de las categorías de una variable presentan diferencias Estadísticamente significativas. por el contrario si el valor calculado es mayor que 0. debemos asumir que los resultados de las categorías de una variable no se ven afectados o influenciados por las categorías de la segunda variable. tau de Kruskal y Goodman. es decir. prueba de asociación lineal por lineal.TABLAS DE CONTINGENCIA CON CHI CUADRADA Dentro de las diferentes pruebas estadísticas de asociación que nos ofrece el procedimiento encontramos el Chi-cuadrado de Pearson. el cual debe ser comparado con el valor teórico de 0. haciendo clic sobre la opción. r de Pearson. para lograrlo debemos volver al cuadro de diálogo y hacer clic en el botón Restablecer de manera que se retome la configuración inicial del procedimiento. Chi-cuadrado de la razón de verosimilitud. sucesivamente ubicamos la variable Género y la ingresamos en la casilla Columnas. coeficiente de contingencia. lambdas simétricas y asimétricas.05. ubicamos en el listado la variable Estado civil y la ingresamos en la casilla Filas. estimación de riesgo relativo. prueba de McNemar. coeficiente de incertidumbre. phi. tau-b de Kendall. Para establecer la diferencia a través de SPSS. Chi-cuadrado corregido de Yates. tau-c de Kendall. prueba exacta de Fisher. Por el momento sólo haremos énfasis en el Chi-cuadrado de Pearson. V de Cramer. La mayoría de estas pruebas nos permiten comprobar si existe alguna relación entre las variable.05 no se rechaza la hipótesis nula aceptando que no existe ninguna relación entre las variables. kappa de Cohen. con lo cual podemos concluir que si existe una relación entre las variables. debemos partir de la teoría que no existe relación entre las variables de la tabla de contingencia (Hipótesis nula). A manera de ejemplo vamos a generar la prueba de asociación del Chi-cuadrado para las variables Género y Estado civil. razón de ventajas. d de Somers. Una vez se habilita el cuadro. Cuando el valor calculado es menor que el 0. rho de Spearman. estadísticos de Cochran y Mantel-Haenszel. la cual es la más utiliza. generando un número para representar la fuerza de la relación.

De todos los valores que se incluyen en la tabla. Figura Página 8 de 9 . aparece el cuadro de diálogo correspondiente [Fig.TABLAS DE CONTINGENCIA CON CHI CUADRADA Figura 6-24 Como de costumbre el programa genera la tabla del resumen del procesamiento y la tabla de contingencia. proporcionan el medio para obtener resultados exactos cuando los datos no cumplen alguno de los supuestos subyacentes necesarios para obtener resultados fiables. sólo hay uno que realmente nos interesa y es el valor correspondiente a la significación asintótica (Bilateral) de la prueba Chi-cuadrado de Pearson. este valor es el resultado de la prueba y es el que se emplea para realizar la comparación. En ella aparecen los valores del Chi-cuadrado y la razón de verosimilitud los cuales son calculados con base a la diferencia entre las frecuencias observadas y las esperadas. Estos métodos (el método exacto y el de Monte Carlo). De acuerdo al resultado podemos concluir que las variables Estado civil y Género si tienen relación ya que el valor obtenido es menor que [0. Para concluir con las tablas de contingencia vamos a revisar el último botón de opción que podemos encontrar en el cuadro de diálogo.05].]. Existen tres factores que pueden alterar el resultado de las pruebas de asociación e independencia como lo son el tamaño de la muestra. antes de sacar alguna conclusión es necesario revisar estos factores ya que cualquiera de ellos puede distorsionar severamente el resultado. el cual corresponde a Exactas (Este botón sólo está disponible si se ha instalado el módulo de pruebas exactas). pero adicionalmente genera una tercera tabla denominada Pruebas de Chi-cuadrado. a través de sus opciones se proporcionan dos métodos adicionales para calcular los niveles de significación de los estadísticos disponibles en los procedimientos Tablas de contingencia y Pruebas no paramétricas. la fidelidad de los datos y el sesgo muestral. Al seleccionar este botón.

Según la significación exacta. la distribución. Este resultado lleva a la conclusión de que los resultados del examen son independientes del material del empaque. La significación exacta es siempre fiable. Al realizar una prueba exacta a la muestra obtenemos que el Chi-cuadrado de Pearson es de 0.04. los resultados de un examen de calidad de 20 empaques en una fábrica muestran que los cinco empaques plásticos superaron la prueba. el porcentaje de fila.07. Esto demuestra la importancia de la obtención de resultados exactos cuando no se pueden cumplir los supuestos del método asintótico. Adicionalmente este procedimiento nos permite generar gráficos de barras con las variables involucradas en la tabla. el procedimiento Tablas de contingencia nos permite realizar tablas en las que se describan las categorías de una variable a través de las categorías de una segunda variable. En conclusión. así como también pruebas estadísticas de independencia como el Chi-cuadrado de Pearson e incluso generar pruebas estadísticas de precisión como el método de Monte Carlo o el método Exacto Página 9 de 9 . independientemente del tamaño. lo que conduce a la conclusión contraria. el porcentaje de columna o el porcentaje de tabla. que contrasta la hipótesis nula de que los resultados son independientes del material. Una prueba de Chi-cuadrado de Pearson. Por ejemplo. la dispersión o el equilibrio de los datos. Para efectuar la descripción se pueden emplear diferentes medidas como el recuento.TABLAS DE CONTINGENCIA CON CHI CUADRADA Las pruebas exactas permiten obtener un nivel de significación exacto sin confiar en supuestos que los datos podrían no cumplir. dado que los datos incluyen sólo 20 casos y las casillas tienen frecuencias esperadas menores que 5. mientras que los resultados de los empaques de papel son diversos. Sin embargo. se concluirá que los resultados del examen y el material del empaque están relacionados. produce un nivel de significación asintótico del 0. este resultado no es fidedigno.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->