Está en la página 1de 5

Anlisis bivariados, correlacin y cuadros de contingencia En la mayora de los casos, los trabajos de investigacin suponen una indagacin sobre

la relacin entre por lo menos dos variables. En general, nos interesa detectar y describir la existencia de relaciones entre variables. En realidad, la existencia de relacin entre los conceptos tericos operacionalizados a travs de esas variables. Lo que el investigador busca es analizar si existe o no relacin entre los conceptos que estn en juego en sus hiptesis. El anlisis bivariado es un procedimiento destinado a detectar y a describir la relacin entre dos variables. Un ejemplo muy sencillo es visualizar la relacin entre dos variables que necesariamente varan de manera conjunta, como la edad y la altura. A mayor edad, tendremos una mayor altura (al menos hasta la edad en que termina el desarrollo). Un nio de 6 aos tendr, en promedio, una altura menor de la de un nio de 7 aos. Otro ejemplo podramos verlo en la relacin entre nivel de estudios realizados (escuela primaria, secundaria, estudios universitarios) y el nivel de ingresos: a mayor escolaridad, encontramos siempre hablando de promedios- un mayor nivel de ingresos. Son dos variables que varan en forma conjunta, es decir, que covaran. En cambio, para tener un contraejemplo, podramos pensar en cmo sera la relacin entre dos variables que no estn asociadas: color de cabello y preferencia por la comida vegetariana. La bsqueda de relaciones entre variables est en el corazn de todo proceso de produccin de conocimiento. El investigador, en general, se hace preguntas que ponen en relacin fenmenos que no son tan evidentes como los casos que mencionaba recin, entonces se preguntan por ejemplo cmo estn relacionados (si es que lo estn) el mirar pelculas y series con personajes violentos y la existencia de conductas delictivas. En investigaciones clnicas, podemos hacernos preguntas sobre infinidad de cuestiones: slo para mencionar algunas reas posibles, la relacin entre ciertas terapias y la mejora del paciente, historia familiar y prevalencia de cierto tipo de enfermedades mentales, entorno familiar y adicciones, etc. En cada uno de estos ejemplos, relacin significa que ciertos valores de la variable tienden a ir junto con ciertos valores de la otra variable. En el primer ejemplo la altura tiende a ir junto con la edad (si bien podr haber alguna excepcin, en trminos generales se cumple que estas dos variables se mueven en conjunto). En el ejemplo de la pregunta de investigacin sobre pelculas y violencia, algunos trabajos encuentras que la presencia de conductas violentas tiende a ir junto con un alto grado de identificacin con personajes de pelculas o series con alto contenido de violencia. Al plantear la existencia de relacin entre dos variables estamos postulando que ambas variables covaran; es decir, que parte de la varianza de la variable dependiente se explica por la varianza de la variable independiente. Usamos el concepto de covarianza para expresar en qu medida al moverse una variable se mueve la otra: en qu medida al analizar las preferencias de personas de diferente nivel socioeconmico vara sus pautas en los consumos culturales. La estadstica nos brinda una tcnica de anlisis que nos permite estudiar las relaciones entre dos variables. Esta tcnica es la construccin de cuadros bivariados o de contingencia. Algunas cuestiones previas que tenemos que definir, para entrar a considerar el anlisis bivariado, tienen que ver con la naturaleza de las variables y sus relaciones. Variables dependientes e independientes En la investigacin en ciencias sociales y humanas, las hiptesis habitualmente se enuncian en trminos de una relacin entre una variable independiente y variable dependiente. Identificar con claridad la diferencia entre variable independiente y variable dependiente es importante si el objetivo es proveer una explicacin (aunque sea provisoria y parcial) sobre un fenmeno social o psicolgico. Pero a veces el carcter dependiente o independiente de una variable es controversial, no es evidente. En el ejemplo que mencionbamos sobre edad y altura, es claro que la edad sera la variable independiente y altura la variable dependiente. Pero ya cuando consideramos nivel socioeconmico y nivel de estudios realizados, vamos a ver que

generalmente se considera (y hay buenas razones para esto) que el nivel de estudios es la variable independiente mientras que el nivel de ingresos es dependiente; pero algunos estudios muestran tambin que el nivel de estudios alcanzado depende del nivel socioeconmico familiar. Entonces definir el estatuto de las variables es discutible, en cada investigacin es necesario aclarar cmo se entiende a cada variable y cmo se va a estudiar su relacin. Es decir, en el mundo real, las variables no son ni dependientes ni independientes, su rol en la investigacin depende de cmo el investigador defina su problema de investigacin. De este modo, una variable que en una investigacin asume el rol de variable dependiente, puede ser independiente en el contexto de otra investigacin. En el lenguaje de la investigacin, la variable que el investigador quiere explicar es denominada variable dependiente. La variable que se espera explique o de cuenta de las variaciones en la variable dependiente se denomina variable independiente. En el caso de la investigacin que nos ocupa las pautas de los consumos culturales y los perfiles de los consumidores constituyen las variables dependientes. Mientras que, el nivel socioeconmico y el nivel de instruccin , entre otras, son variables independientes Qu quiere decir esto? Sencillamente que las pautas de los consumos culturales y los perfiles de los consumidores varan segn su nivel socioeconmico y su nivel de instruccin. Es importante dejar en claro que el hecho de postular variables dependientes y variables independientes en el contexto de una investigacin no necesariamente equivale a postular una relacin causal entre ellas. Utilizamos esta denominacin an cuando la relacin entre las variables no est necesariamente articulada en trminos de causa y efecto. Por qu es importante? Porque en las ciencias humanas - por las caractersticas de su objeto de estudio no es fcil inferir relaciones de causalidad entre variables. Cmo identificar cundo una variable se postula como dependiente y cundo cmo independiente? Veamos algunas ayudas que nos pueden ayudar a identificar cul es el rol de las variables en las hiptesis que plantean los investigadores. 1. La variable dependiente es siempre el fenmeno que el investigador intenta explicar, estudiar, investigar, describir y/o analizar. Es siempre el objeto de la investigacin. 2. La variable independiente, en general, es temporalmente anterior a la variable dependiente. 3. La variable independiente es vista como un factor que directa o indirectamente influencia el comportamiento de la variable dependiente. Independencia y dependencia estadstica Dos variables categricas son estadsticamente independientes si la distribucin condicional de la poblacin de una de ellas es idntica en cada categora de la otra. Las variables son estadsticamente dependientes si no son idnticas. En otras palabras, son independientes si el porcentaje de casos correspondiente a una categora de una variable (por ejemplo, la altura) es igual en todas las categoras de la otra variable (por ejemplo, edad). La independencia estadstica es una propiedad simtrica entre dos variables. Si la distribucin condicional entre filas es idntica, entonces tambin lo ser entre columnas. Representacin grfica de la relacin entre dos variables: diagramas de dispersin Cuando existe una relacin lineal positiva de asociacin:

Altura en cm segn edad en aos


180

160

140 Altura en cm

120

100

80

60

40

20

0 0 2 4 6 Edad en aos 8 10 12 14

Cuando no existe correlacin o sta es muy dbil:


Tipo de comida preferida

Tipo de comida preferida segn nivel de estudios alcanzado


4,5

3,5

2,5

1,5

0,5

0 0 0,5 1 1,5 2 2,5 3 3,5 Nivel de estudios alcanzado

Cmo construir un cuadro de contingencia o cuadro bivariado? El primer paso para investigar estadsticamente la asociacin entre dos variables es la construccin de un cuadro de contingencia. Un cuadro bivariado despliega la distribucin de una variable segn las categoras de otra variable. Se obtiene clasificando unidades de anlisis con base en los valores que obtienen para dos variables. Puede pensarse como distribuciones de frecuencias que se relacionan / se unen para hacer una nica tabla. Es un cuadro que muestra el nmero de sujetos o casos observado en cada una de las combinaciones entre las dos variables en cuestin. Para ejemplificar el proceso de construccin de un cuadro de doble entrada o cuadro bivariado vamos a utilizar como base un ejemplo con datos de un estudio clnico sobre el uso de bupropin en pacientes que intentan dejar de fumar. Ejemplo: Relacin entre situacin familiar e iniciacin en el tabaquismo en adolescentes Supongamos por ejemplo que estamos investigando adicciones, nos interesa el cigarrillo, queremos averiguar qu factores inciden en la iniciacin del consumo de cigarrillos. Segn nuestra revisin bibliogrfica, aparece como un factor relevante la composicin familiar. Entonces decidimos investigar la relacin entre el divorcio de los padres y la adiccin al cigarrillo. Tendramos que evaluar si estas dos variables estn asociadas (situacin familiar entendida como padres juntos/padres separados y adiccin al cigarrillo con los valores s/no), es decir, lo que queremos saber es si varan en forma conjunta, expresado en forma sencilla, queremos saber si los adolescentes cuyos padres se separan tienden a comenzar a fumar en mayor proporcin que los adolescentes cuyos padres siguen juntos. Es un modelo muy sencillo que tendramos que complejizar para tener una explicacin ms acercada a la realidad, pero vamos a ver el ejemplo con datos simplificados para entender cmo analizar la relacin entre dos variables, es decir cmo hacer un anlisis divariado. Para eso voy a presentar datos de una investigacin publicada en el Journal of health and social behavior, que utiliz una encuesta llamada Nacional Longitudinal Study of Adolescent Health, realizada en los EEUU. Se hace en dos olas, en las cuales se les hace una serie de preguntas a los chicos entre las cuales hay dos que se usaron en el estudio:

1) Vive actualmente con ambos padres? Si / No 2) Ha probado alguna vez el cigarrillo? Si / No Son variables nominales dicotmicas, siendo las respuestas posibles en ambos casos: SI / NO Con los datos de ambas olas, se construyen dos grupos: los de aquellos que vivan con ambos padres tanto en la primera como en la segunda ola de la encuesta y la de aquellos cuyos padres se separaron, y por ende en la segunda ola de la encuesta responden que viven solamente con sus madres. Anlisis de la correlacin de variables Tabla 1. Iniciacin en el cigarrillo segn situacin familiar en adolescentes en las olas 1 y 2 del Estudio Longitudinal de Salud Adolescente.
Situacin familiar Padres continan casados No probaron el cigarrillo Probaron el cigarrillo Total 2775 522 3297 Marginales Padres recientemente separados 77 29 106 Total 2852 551 3403 (n)

Fuente: Kirby, James (2002) sobre datos del nacional Longitudinal Study of Adolescent Health Waves 1 and 2.

Los marginales representan la distribucin de frecuencias de la variable Medicacin con bupropin, mientras que los subtotales representan la distribucin de frecuencias de la variable depresin. Se llaman distribuciones condicionales. En nuestro caso, nos interesa ver la distribucin condicional de la iniciacin en el consumo de cigarrillos segn la situacin familiar. El nmero total de casos (n) se representa en la interseccin entre marginales y subtotales. Para poder realizar comparaciones, necesitamos convertir las frecuencias absolutas en frecuencias relativas. Los porcentajes son indispensables para poder comparar dos o ms grupos (definidos por las categoras de la variable independiente, que en nuestro ejemplo es la medicacin con bupropin) cuando estos difieren en su tamao. En nuestro ejemplo una lectura apresurada del cuadro podra llevarnos a pensar que son ms los adolescentes de familia tipo que comienzan a fumar, ya que son 522 mientras que los hijos de padres separados que probaron el cigarrillo son slo 29. Pero veamos que pasa cuando construimos el cuadro con porcentajes: Tabla 2. Porcentaje de adolescentes que comenzaron a fumar segn su situacin familiar en la ola 2.
Situacin familiar Padres continan casados Padres recientemente separados No probaron el cigarrillo Probaron el cigarrillo Total 84,2 % 15,8 % 100 % 72,6 % 27,4 % 100 % Total 83,8 % 16,2 % 100 %

Fuente: Kirby, James (2002) sobre datos del nacional Longitudinal Study of Adolescent Health Waves 1 and 2.

Hay tres reglas bsicas para calcular y analizar porcentajes %: 1. Calcular los porcentajes tomando como base la frecuencia marginal definida para cada una de las categoras de la variable independiente. 2. Interpretar la tabla comparando los porcentajes entre las categoras de la variable independiente, para cada valor de la variable dependiente. 3. Incluir los totales muestrales de manera tal que el lector pueda reconstruir la distribucin de frecuencias si lo desea (y pueden, eventualmente, calcular los errores estndar para utilizar la proporcin muestral como estimador de los parmetros de la poblacin). El cuadro construido con los porcentajes indica las probabilidades condicionales. En nuestro ejemplo, vemos que los valores de iniciacin en el cigarrillo son significativamente diferentes en los adolescentes cuyos padres continan casados (15,8%), con respecto a los adolescentes cuyos padres se separaron (27,4%). Esta forma de analizar los cuadros bivariados nos permite un primer acercamiento para saber si existe o no relacin entre dos variables. A partir de este trabajo podemos encarar pruebas ms complejas para medir la asociacin entre las variables. Depender del tipo de variables que estemos usando (si son nominales, ordinales, intercalares o de razn), qu clculos y qu tcnicas podremos utilizar. Representacin grfica: columnas tridimensionales.
Iniciacin en el tabaquismo segn situacin fam iliar

84,2
90,0 80,0 70,0 60,0 50,0 40,0 30,0 20,0 1 0,0 0,0

72,6

No probaron el cigarrillo 27,4 15,8 Probaron el cigarrillo

Padres continan casados

Padres recientemente separados