Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 5
Tema 5
Universidad de Burgos
Índice de contenidos
Exploración estadística de dos variables
Tablas de contingencia
Coeficientes de asociación
Contraste de hipótesis
Correlación
Ejercicio
práctico
Universidad de Burgos
Exploración estadística de dos variables
• Existen dos tipos de diagramas, aquellos que poseen base 100% (como en
el ejemplo) y los que no hacen.
– Base 100%: Se opera en frecuencia relativa.
– Otra base: Se convierte en frecuencia acumulada.
• Nos permite conocer visualmente las diferencias de nuestras categorías en
función de su número de casos.
• Se denomina así a la tabla de doble entrada que se representa para una distribución
bidimensional de atributos.
• Es una de las fórmulas más comunes de realizar análisis de dos o más variables en ciencias
sociales. De esta manera, se puede conocer la relación entre dos variables nominales u
ordinales.
• En las filas, a la izquierda, se incluirá a nuestra variable dependiente, mientras que en las
columnas, arriba, se explicitarán las categorías de nuestra variable independiente.
• Los resultados indican qué porcentaje de cada categoría se encuentra representado en el
otro. Por ello, debemos de tener cuidado ante cómo presentamos nuestros porcentajes, si
por filas o por columnas. Así, los primeros nos indicarían cuántos casos dentro de cada
categoría de nuestra variable dependiente se engloban en cada categoría de la
independiente. Por el contrario, si decidimos mostrar los porcentajes por columnas, el
resultado que arrojaría se correspondería con el inverso; es decir, con cuantos casos de cada
categoría de nuestra variable independiente se engloban en cada una de las categorías de
nuestra variable dependiente.
• Es importante no utilizar con variables con muchas categorías o, al menos, no presentarlas así
en un posterior informe. También resulta relevante incluir el número de casos total y en cada
una de las celdas.
• A partir de los datos de las tablas se pueden realizar comprobaciones estadísticas de
correlación y asociación para poder establecer que lo que los datos parecen decir a simple
vista posee, de verdad, una relación estadística real.
Niveles de
Posibilidades Coeficientes
medición
Existencia Chi cuadrado
Existencia y Magnitud V de Cramer
Ambas dicotómicas
Phi
Existencia, Magnitud y Sentido
Q de Yule
Existencia Chi Cuadrado
Ambas nominales Pluricotómicas Existencia y
V de Cramer
Magnitud
Rho de
Existencia,
Spearman
Ambas ordinales Varias categorías Magnitud y
Tau-C
Dirección
Gamma
Una nominal –
Existencia y Magnitud Etha
Otra intervalo
Técnicas de Investigación I Universidad de Burgos
Covariación vs. Causalidad
• Para cada celda hay que calcular las "frecuencias esperadas". Supongamos que lo
hacemos para la primera celda del cuadro (columna 1, fila 1).
• Una vez que tenemos todas frecuencias esperadas para todas las celdas del
cuadro, conviene realizar una prueba para comprobar de que no hubo errores de
cálculo. Esto se hace simplemente, sumando todas las "frecuencias esperadas", las
cuales deben ser igual al total de casos; es decir, el "N". Si el resultado no es
aproximadamente igual, sería conveniente revisar.
• El siguiente paso consiste en calcular para cada celda del cuadro la discrepancia
entre lo esperado y lo observado. Esto se hace simplemente restando ambos
números. Pero aquí es necesario hacer dos correcciones.
– La primera es elevar al cuadrado las diferencias calculadas en cada celda. Esto se hace para
eliminar los signos; si no lo hiciéramos, las diferencias terminarían por anularse.
– La segunda corrección es dividir el cuadrado calculado en cada celda entre las "frecuencias
esperadas" en esa celda. Esto se llama "normalización" y el objetivo es controlar el hecho de
que las celdas tienen diferentes cantidades de casos.
• Una vez que tenemos estos cuadrados, estamos en condiciones de sumar todos los
valores. El resultado va a ser el valor de la Chi cuadrado para nuestro cuadro.
• La chi cuadrado va desde 0 hasta un valor que varía según el número de datos y el número
de celdas. Eso de no contar con un máximo fijo dificulta bastante la interpretación.
• Harald Cramer propuso un índice, llamado V de Cramer, para transformar la Chi cuadrado
de Pearson. La V consiste en dividir la chi entre su máximo, por lo que el resultado va de 0
(no hay nada de relación) a 1 (relación máxima). Dado que χ2 está elevada al cuadrado, la
propuesta concreta de Cramer es aplicar también una raíz cuadrada:
• El problema ahora es qué hacer con esa V; es decir, cómo concluir si existe o no relación.
Esto es lo que ha venido llamándose problema del tamaño de efecto.
• Para cada índice o estadístico de relación, nos enfrentamos a la tarea de interpretarlo, por
lo que ideamos una estrategia que suministre un valor acotado o estandarizado (como
ocurre con la V) y ahí tenemos el tamaño del efecto.
• Pero en muchas ocasiones necesitamos traducir el continuo del efecto en una dicotomía:
“al final, dime, ¿hay o no relación?”. Autores como Jacob Cohen, han dado muchas vueltas
a este asunto y nos han suministrado alguna guía. Ya la conocemos:
– De 0 a 0,10, podemos decir que no hay efecto (el grado de relación es ridículo, despreciable o achacable al
ruido).
– Desde 0,10 hasta 0,30, el efecto es pequeño.
– Desde 0,30 hasta 0,50, el efecto es mediano o moderado.
– Y desde 0,50 hasta 1,00, el efecto es grande.
• Este es el sistema estándar de notación para nuestros datos que cualquier lector del mundo conoce y
entiende. De cualquier manera, suele referenciar en nota en tabla (debajo de la fuente) de la siguiente
manera: * p<0,1 / ** p<0,05 / *** p<0,01.