Está en la página 1de 19

Captulo 12

ESTADISTICA DESCRIPTIVA III:


TRES O MAS VARIABLES

12.l.

ELABORACIN DE LA RELACIN ENTRE DOS VARIABLES

En los tres captulos anteriores nos hemos ocupado de analizar los


tipos de relaciones que se establecen entre dos vriables y las medidas
de asociacin utilizadas ms comnmente en tales relaciones bivariantes. En el presente captulo vamos a ocuparnos de una fase ms avanzada del anlisis. Una vez estudiadas las relaciones bivariantes que se
establecen en una determinada investigacin, el analista puede estar interesado en conocer cmo funciona una determinada relacin bsica
entre una variable independiente y otra dependiente, en diferentes subpoblaciones. Con la introduccin de una o m.s variables se elabora y
clarifica la relacin bsica entre dos variables. De la comparacin cuidadosa del tipo de relacin que aparece entre las dos variables bsicas
en cada U:na de las subpoblacones definidas, al introducir una o ms
variables, se pueden extraer consecuencias interesantes acerca del efecto de tales variables en la relacin bsica original. Esta forma de anlisis, que denominamos elaboracin, engloba una serie de procedimientos
especficos de anlisis que pueden representarse por medio de un esquema formal generalizado, que fue presentado por primera vez por Lazarsfeld, a quien se puede considerar la figura ms destacada del moderno anlisis sociolgico a travs de encuestas.
El carcter multidimensional de muchos fenmenos sociales determina que la simple relacin entre dos variables sea insuficiente para
alcanzar una explicacin satisfactoria de tales fenmenos. Adems, las
var.iables sociolgicas no se suelen presentar de manera aislada. Ms
bien, las variables sociolgicas se presentn asociadas unas con otras o
en bloque (Rosenberg, 1968, pg. 26). Cada individuo o cada grupo
social pueden describirse en trminos de un nmero determinado de
dimensiones. Al describir a un individuo segn una caracterstica, lo estamos describiendo al mismo tiempo en trminos de otras caractersticas.
Supongamos, por ejemplo, que encontramos en una investigacin
335

338 Socioestadstica.. Introduccin a ta Estadistica en Sociologa

que .ios trabajadores manuales se encuentran ms alienados que los trabajadores no manuales. Por otro lado, sabemos que ambos tipos de
trabajadores difieren en muchas otras dimensiones, adems del tipo de
trabajo especfico que realizan. As, los trabajadores manuales suelen
tener un nivel de educacin ms bajo que los no manuales. Su ndice
de religiosidad es menor, y su autoritarismo es mayor. Tienden a votar
con mayor frecuencia a partidos de izquierda, y sus hijos asisten en
menor proporcin a la universidad. Sus niveles de ingresos familiares
son menores, aunque suelen estar afiliados a un sindicato con mayor
frecuencia que los trabajadores no manuales.
Ser un trabajador manual o no manual, pues, significa algo ms que
realizar un trabajo fsico o mental, respectivamente. Por eso, cuando tratamos de explicar 'por qu los trabajadores manuales se encuentran ms alienados que los no manuales, trataremos de referirnos a algunas de las cara~tersticas que se han mencionado anteriormente, y que
se presentan asodad<}s o en bloque. El objetivo de un anlisis como
el propuesto es e1 de precisar qu caractersticas de las que definen la
situacin del trabajador manual son las responsables de la relacin con
Ja alienacin. Es decir, la relacin bivariable entre tipo de trabajo y
grado de alienacin deber ser ex~minada a la luz de terceras variables
CI,lie el marco terico de la investigacin seale como relevantes para
el anlisis.

12.2.

Estadstica descriptiva 111: Tres o ms variables 337

blemente, lo que prueba que las variables introducidas, en este caso la


ocupacin y rla educacin, son realmente las responsables o determi
nantes de fas relaciones originales.
Tal como seala Rosenberg en el trabajo anteriormente citado, tales
trminos tienen un significado bien preciso. Al decir que la relacin entre X e Y es debida a T. o que Tes la responsable o determinante de Ja
relacin xistente entre X e Y, s quiere significar que si no fuera por
la variable T no hubiera aparecido una relacin significativa entre las
variables X e Y. De este modo, la proposicin las mujeres son ms conservadoras que los hombres al emitir su voto poltico debe ser formulada del siguiente modo: Si no hubiera una proporcin tan alta de mujeres que no trabajan, el voto femenino sera menos conservador.
La frase clave Si no fuera por la variable T se traduce, a efectos
estadsticos, en el control -mantener constante- del factor de prueba,
eliminando de esta manera su influencia en la relacin original. Con el
fin de ofrecer una mayor claridad explicativa de este procedimiento, vamos a utilizar el mismo ejemplo con el que Lazarsfeld originalmente
glos esta tcnica analtica.

En un estudio sobre las preferencias del pblico norteamericano en


materia de emisiones radiofnicas, se encontr que la gente de ms edad
escucha con mayor frecuencia los programas religiosos que los jvenes.
Los datos se presentan en la tabla 12.1.
TABLA 12.l

LA lNTERP_RETACIN DE LAS RElACIONES ESTADSTICAS:


UN EJEMPLO DE ELABORACIN

Los- resultados que aparecen al establecer relaciones significativas


entre dos variables son de naturaleza descriptiva. Por ejemplo, tales resultados pueden poner de manifiesto que las mujeres son ms conservadoras que los hombres al emitir su voto poltico, o que manifiestan
ndices de religiosidad superiores. Pero tales resultados no indican por
qu ocurre esto. Aunque se puede especular tericamente sobre el contenido de tales relaciones, el analista debe seguir un camino ms sistemtico, y que no es otro que el de la introduccin de una tercera variable, l'amada variable de control o factor de prueba, en la relacin bivariable original. Este es precisamente el proceso que hemos llamado
anteriormente elaboracin.
La variable de control se introduce con el fin de obtener una mayor
y mejor comprensin de la relacin original, al tratar de determinar si
la relacin entre X (variable independiente) e Y (variable dependiente)
se debe a T (factor de prueba o variable de control). As, caso de que
introdujramos el tipo de ocupacin en la relacin entre sexo y voto
poltico, o el nivel de educacin en la relacin entre sexo y religiosidad,
el valor de las correspondientes relaciones bivariables disminuira sensi-

Edad y audiencia de programas religiosos


EDAD

Escuchan programas religiosos

Jvenes

Edades ms
avanzadas

S .................................. .

17

Z6

No ...

83

74

100

100

Porcentaje total . . . . .. .. . . .. . . . . . . . . .. . ..

FUENTE: Adaptado de Paul '.F. LAZARSFELD y Morris RoSENBERG (eds.):_ The Language
of Social Research (Glencoe, Ill., The Free Press, 1955), pag. 117.

Al tratar de explicar este resultado, Lazarsfeld sugiere que quiz se


deba al factor educacin, es decir, que si las personas de ms edad no
tuvieran los niveles ms bajos de educacin no escucharan con tanta
frecuencia los programas religiosos. Con el objeto de probar esta suge
rencia es preciso, analticamente, eliminar la influencia de la educacin.

338 Socoestadlstica. Introduccin a la Estadistica en Sociologfa

Estadstica descriptiva 111: Tl88 o ms variables 339

Y esto se puede hacer simplemente al comparar los jvenes y los- de


edad ms avanzada que tengan idntic;os niveles de educacin. Es decir,
se comparan los hbitos de audiencia de los jvenes y viejos ms educados con los hbitos de los jvenes y viejos menos educados. Los resultados que. encontr Lazarsfeld se presentan en la tabla 12.2:.
TABLA 12.2

diferentes combinaciones de las categoras de las dos variables de control. En tl)fuinos generales, se puede afirmar que el nmero de tablas
condicionales es igual al producto del nmero de variables de control
introducidas. El nmero de orden de las tablas condicionales ser igual
al nmero de variables de control introducidas.

12.3., LA

FRMULA DE RECUENTO DE LAZARSFELD

Edad y audiencia de programas religiosos segn el nivel de educacin


NIVEL DE EDUCACION

Ba i o

Alto
Escuchan programp:s religiosos

Jvenes

Edades ms
avanzadas

... ... . .. ... . ..


No ... ... .. . ... ... ...
.. . ...
Porcentaje total ... ... ... ... ... ...

9
91

11

29

89

10

100

71
100

S ... ...

Jvenes

Edades ms
avanzadas

32
68
100

Se oh.serva que entre las personas que tienen un nivel alto de educacin, apenas existen diferencias en los niveles de audiencia entre jvenes y viejos, y lo mismo se produce dentro del grupo de personas con
niveles bajos de educacin. En consecuencia, si no fuera por el nivel de
educacin, no aparecera la relacin original observada entre edad y audiencia de programas religiosos.
El procedimiento analtico seguido es, pues, bien sencillo. Hemos
partido de una relacin global entre dos variables, o asociacin de orden
cero, y seha tratado de explicar dicha relacin mediante la introduccin
de una variable de control o factor de prueba. La relacin original se ha
estratificado segn los valores del factor de prueba, lo que en nuestro
ejemplo ha dado lugar a otras dos. tablas, llamadas tablas condicionales o asociaciones de contingencia. En este caso, la estratificacin se
ha realizado al distinguir entre valores altos y bajos de educacin.
En el oaso de que en el factor de prueba se hubieran distinguido tres o
ms categoras, el nmero resultante de tablas condicionales seguira
el mismo orden.
Cuando se considera una sola variable de control, las tablas condicioaales resultantes se denominan de primer orden. Ahora bien, podemos
estar interesados en introducir una: segunda variable de control, por
ejemplo, tipo de residenCia (rural o urbana), en las tablas resultantes
de introducir la primera variable de control. En este caso, se obtendrn
tablas condicionales de segundo orden, y su nmero vendr dado por las

Volviendo al caso de tres variables, dos de ellas que definen la relacin original y una tercera variable de control que ayuda a explicar o determinar dicha relacin, vemos fcilmente que se pueden definir cuatro
relaciones. Para el ejemplo de la audiencia de programas radiofnicos
segn la edad y el nivel de educacin, la relacin principal se produce
entre la edad y las preferencias (XY). Es la informaein que aparece en
la tabla 12.1. En segundo lugar, tenemos las relaciones condicionales que
se producen entre ambas variables para cada _nivel de educacin. Un
simbolismo apropiado para las relaciones que aparecen en la tabla 12.2
es (XY;
y (XY; T'). En tercer y cuarto lugar, tenemos las relaciones
entre la variable independiente y la variable de control, por un lado
-en nuestro ejemplo, entre la edad y el nivel de educacin (XT')---, y la
que se produce al cruzar la variable dependiente y la variable de control
. -en nuestro ejemplo, entre el nivel de educacin y el tipo de audiencia
radiofnica (TY)-. Estas dos ltimas relaciones, llamadas tambin marginales, no las hemos reproducido en el texto, pero se pueden obtener
fcilmente si dispusiramos de los datos originales.
Resumiendo, hemos partido de una relacin original (XY), y al introducir una variable de control, T, se han producido cuatro nuevas
relaciones las dos relaciones condicionales y las dos relaciones marginales. (Es~o para el caso, naturalmente, de que el factor de control est
dicotomizado. Si estuviera dividido en ms de dos categoras, el nmero de relaciones condicionales se incrementara correspondientemente;)
Pu~s bien Lazarsfeld ha demostrado que las nuevas relaciones resultantes puede~ igualarse a la relacin original de la que se han originado.
La ecuacin resultante se puede escribir como sigue:

(XY)=(XY; T) -3(XY; T') 0(XT) (TY)

Esta ecuacin se puede formular verbalmente de la siguiente manera:


la relacin original entre dos variables, X e Y, es igual a la suma de las
relaciones parciales entre X e Y cuando la poblacin se estratifica segn
los dos valores del factor de prueba T, ms un trmino que es el producto de la relacin entre X y T, por un lado, y entre T e Y, por el otro.
(El signo G de ta ecuacin anterior ha sido rodeado por un crculo para
indicar que no se trata de una suma aritmtica convencional, ya que

340 Socioestadfstica. lntroduccin a la Estadstica en Sociologa

para realizar la suma aritmtica de las anteriores relaciones habra que


considerar ciertos factores de correccin que no se han introducido con
el objeto de simplificar la exposicin.
Tal como ha sealado Hyman (1955, pg. 283), la ecuacin anterior
no es una ecuacin de clculo convencional. En otras palabras, no nece-.
sitamos dicha ecuacin para determinar la relacin original, o cualquiera de las relaciones condicionales o marginales. El valor de dicha
ecuacin radica en que explicita la diversidad de relaciones que se producen al introducir una tercera variable en una relacin original entre
dos variables, al mismo tiempo que pone de manifiesto cmo se relacionan entre s las diferentes relaciones. Se trata, en palabras de Hyman,
de una ecuacin formalizadora, ya que formaliza las conexiones mutuas
que se producen entre diversas relaciones, y los valores que pueden
tomar al variar el valor de cada uno de sus trminos.
Existen dos situaciones en las que la frmul toma valores que interesan especialmente al socilogo. La primera de ellas se produce cuando el factor de prueba no est relacionado con una o ninguna de las
variables originales. En este caso, el trmino de los marginales de la
ecuacin se reduce a O y la relacin original entre X e Y es igual a la
media ponderada de las dos relaciones parciales o condicionales. En
trminos simblicos, la ecuacin queda as,

=(XY;

T)

(XY; T') + {O) (TY)

(XY) =(XY; T)

(XY; T') + (XT) (O)

(XY)

Lazarsfeld designa a esta ecuacin con el tipo P, o parcial, de elaboracin, ya que la. relacin original depende de los valores de las relaciones parciales.
La segunda situacin de inters se produce cuando desaparecen las
relaciones parciales. En dicho caso, la relacin original es igual atlas
trminos marginales, es decir, al producto de las relaciones que se establecen entre el factor de prueba y cada una de las variables originales. En trminos simblicos, dicha situacin se puede expresar del siguiente modo:
{XY)=O+O+(XT) (TY)

A este caso; lo denomina Lazarsfeld el tipo M, o marginal, .de elaboracin, ya que depende de fas relaciones marginales que se establecen
entre las tres variables.

Estadistica descriptiva Ht: Tres o ms variables 341

12.3.L El papel d.e la teor en la elaboracin de relaciones


entr( variables

Conviene sealar que en la prctica de la investigacin real, pocas


veces se encuentran casos puros de los tipos P y M de elaboracin. Lo
ms corriente es que los trminos que aparecen como O en las ecuaciones anteriores tengan valores que no son precisamente O. Nuestro
inters en .los tipos P y M no se basa, pues, en su carcter emprico,
sino en que representan, de forma esquematizada, ciertos procedimientos
analticos y de investigacin en sociologa. Las diferencias que existen
entre P y M ponen de manifiesto que no todos los factores de prueba o
variables de control tienen el mismo significado, exhiben las mismas
propiedades estadsticas o responden a idntica finalidad terica.
El papel del marco terico es muy importante a la hora de realizar
la elaboracin analtica de la relacin entre tres o ms variables. En
primer lugar, la teora nos ayudar a seleccionar las relaciones originales y las variables de control ms relevantes. Pinsese que en un estudio, modesto ciertamente, en el que interviniesen slo 5 variables,
y que cada variable tuviese 5 categoras. se pueden confeccionar 10 tablas de orden cero, 150 tablas condicionales de primer orden. 1.500 tablas de segundo orden, etc. Es obvio que en la realidad de la investigacin sociolgica se maneja un nmero muy superior a 5 variables,
por lo que el problema consiste en seleccionar las relaciones realmente
relevantes, dejando de lado las irrelevantes. y en esto consiste precisamente et papel de la teora.
Adems, el orden terico de las variables es decisivo en la interpretacin de los resultados en el proceso de elaboracin. Sabemos, por
definicin, que la variable independiente antecede a la variable dependiente. Sin embargo, la variable de control o factor de prueba, puede
ocupar posiciones diferentes. Si. el factor de prueba antecede a las variables dependiente e independiente; se denomina variable antecedente.
Simblicamente, tendramos lo siguiente:
(T)

~(X)

--+(Y)

Si los efectos del factor se prueba se producen despus de las varia


bles dependiente e independiente, se denomina entonces variable consecuente, y se representa as:
(X)~

(Y) - - + (T)

Si el fator de prueba acta antes de la variable dependiente pero


despus de la variable independiente, se trata entonces de una variable
interviniente como sera en el siguiente caso:
(X)~

(T) --+(Y)

Estadstica descriptiva 111: Tres o ms variables 343

342 Socioestadlstica. Introduccin a la Estadstica en Sociologa

Son muchos los au.tor~s que sugi:ren la utilizacin de un diagrama

d: flechas de l~s rela<;1ones entre variables, para clarificar el orden te-

nco de las variables ~ el ti~o d_e_ anlisis estadstico que debe emplearse
ante un ~r?blema de m~est1gac1on determinado. As, Loether y Mctavish
09?4) utilizan un :~tud~~ de la. ~elacin entre la implicacin en organizac1on~s Y l~ part1c1pa~~on -~olit1ca ~ealizada por William Erbe (1964),
para ejemplificar l ut1lizac1on del diagrama de flechas. La revisin de
la li~eratura disponible ~obre el tema, condujo a Erbe a sugerir la existencia de otras dos variables relevantes para explicar la relacin entre
aquellas dos variables. Las relaciones tericas entre las variables utilizadas para guiar su estudio, las esquematiz del siguiente modo:

_.e.

Cla~e

Implicacin en
,/organizaciones

social

r~

Participacin
) poltica

~Alienaciri/

Este modelo indica de inmediato la ordenacin de las variables, cules


de ellas son intervinientes, y sugiere la necesidad de tener en cuenta la
clase ~oci~l y la alienacin para explicar la relacin entre implicacin en
orgamzac1ones y participacin poltica.
Conviene insistir en que la ordenacin terica de las variables tambin juega un papel bsico en la interpretacin de los resultados. Como
sealan Loether y Mctavish, resultados estadsticos virtualmente idn
ticos pueden interpretarse bien como evidencia de que una unin causal
hipottica es espuria, o falsa, bien como evidencia de la existencia de
un lazo causal, o como evidencia de una influencia independiente, y
todo ello depender de la ordenacin de las variables. Ms adelante veremos ejemplos concretos de lo que venimos diciendo.
Algunas veces, el orden temporal de las variables viene determinado
simplemente por la lgica de la medicin o por el tipo de variables. As,
si se observa una relacin significativa entre la pertenencia a un grupo
de status socioeconmico y determinadas actitudes polticas, cabe pensar con una alta probabilidad que la pertenencia a un grupo de status
es el factor causal. Pero otras veces las variables no se encuentran tan
claramente ordenadas. As, por ejemplo, en todos los pases industriales,
incluido Espaa, se ha encontrado que existe una relacin significativa
_e~tre la situacin ocupacional de la mujer casada y la tasa de fecundidad, de tal manera que las mujeres que trabajan fuera del hogar tienen, por trmino medio, un nmero de hijos menor que el .que tienen

las amas de casa. Sin embargo, lo que no resulta evidente por s mismo
es ~i al trabfiar fuera del hogar las mujeres deciden tener menos hijos
o s1 es e~ hetho de tener una familia reducida lo que facilita o impulsa
a las mujeres a tener un trabajo extradomstico.
Otras veces, la ordenacin temporal de las variables se establece sencillamente al obtener informacin sobre algunos fenmenos sociales en
dos o ms momentos en el tiempo. Los diseos longitudinales se utilizan precisamente para estudiar la evolucin, en el tiempo, de determinados fenmenos sociales, como pueden ser el ciclo familiar o la mo
vilidad social. En los estudios que utilizan el diseo de panel, una misma
poblacin es estudiada en varios momentos en el tiempo. Tales diseos
son frecuentes en el estudio del comportamiento electoral, en el estudio
de audiencias en televisin y en los estudios de mercado .
El papel central de la teora en la interpretacin de los resultados
de la elaboracin de las relaciones entre variables, se puede ver con
mayor claridad al glosar con ejemplos concretos de investigaciones sociolgicas reales los diferentes modelos de elaboracin.

12.4.

MODELOS DE ELABORACIN

Una vez familiarizados con la formalizacin avanzada por Lazarsfeld


para elaborar las relaciones bivariables, vamos a estudiar con mayor
profundidad los modelos de elaboracin que aparecen con ms frecuencia en la investigacin sociolgica emprica.

12.4.1. La especificacion de una relacin entre dos variables


Responde al tipo P de elaboracin en la frmula de Lazarsfeld. En
este caso, el inters del investigador se centra en el tamao relativo de
las relaciones parciales con el fin de especificar las circunstancias bajo
las cuales la relacin original es ms o menos pronunciada. Debido a la
interaccin estadstica ** entre el factor de prueba y la variable independiente, se especifican los valores que toma la variable dependiente. As,
por ejemplo, en un estudio sobre los hbitos deportivos de los espaoles, se encontr una clara asociacin entre 1a edad y la prctica de un
deporte. Los resultados obtenidps se presentan en la tabla 12.3.
Vemos que a medida que aumenta la edad de la poblacin, disminuye sensiblemente la proporcin de personas que practican algn tipo
~ Para una exposicin de los problemas metodolgicos que comportan los estudios de panel, ver Hans ZEISEL, Dgalo con nmeros, Mxico, FCE, 1962.
. ** Se produce un. efecto interactivo entre una variable independiente y una variable de. control, cua?do ambas explican una i:_nayor proporcin de la variacin
de la variable dependiente, de la que cabra esperar del simple efecto aditivo de
ambas por separado.

Estadstica descriptiva ///: Tres o ms variables 345

344 SOCioestadfstica. lntrodUC!:in a la Estadstica en Sociologa

TABLA 12.3

TABLA 12.4

Edad y prctica de un deporte

Edad :prctica de un deporte, segn el nivel de educacin

EDAD (AOS)

15 - 25

... ... ... ... ... ...


.
No ... ..............................
... ... ... ...

... ... ... ...


total ... ... ...

Nmero de casos ... ... ...

40+

Total

. ..

56

32

12

24

...

43

66

85

74

100

100

100

No contesta ...
Porcentaje

26 - 40

100

(865)

(1267)

(2.359)

(T,): Bachiller

(T,): Estudios primarios o medios

Practica w1 deporte

(4.493)

FUENTE: Manuel GARA FERRANDO, Deporte y sociedad, Madrid, Ministerio de Cultura, 1982.

EDAD

EDAD

Prctica de un
deporte

15-25

26-40

40+

41
59

20
79

6
92

- - - - - - - - -- --

S .. ~ ... ... ...

No ... ...

Porcentaje total .. . . . . . . . . .. 100


100
100
Nmero de casos ............ 2(306} (621) (1.532}

'I

(T,}:

Prctica de un
deporte

15-25

26-4-0

40+

-67- -42- -24-

S
No .........

33

58

75

Porcentaje total ... ... ... ... 100


Nmero de casos ............ (507)

100

100

(301}

(212)

(T,}: Universitario

Grado medio

EDAD

EDAD

~e

deporte. En una primera aproximacin se podra concluir, pues, que el


factor edad determina l prctica o no de un deporte. Pero en el contexto
de la investigacin referida, el deporte en una sociedad moderna es
contemplado com un fenmeno cultural de la soc;iedad de masas, cuya
prctica responde ms a criterios sociales qe a criterios estrictamente
biolgicos o cronolgicos. Es decir, que para hacer deporte no se necesita tanto ser joven como disponer de una situacin social y personal que
lo permita. Si introducimos la variable educacin; que es un buen indicador del status social de los individuos, podremos saber mejor cmo
funciona la relacin entre edad y prctica de un deporte en cada grupo
social. Los resultados obtenidos aparecen en la tabla 12.4.
La introduccin de la variable educacin en cuatro categoras, esto
es, estudios primarios o menos, bachiller, grado medio y universitario,
ha dado lugar a cuatro tablas parciales en las que el grado de relacin
entre la edad y la prctica de deporte va disminuyendo segn pasamos
de T1 a T4. En efecto, mientras que las diferencias de prctica de un
deporte son mximas. entre los diferentes grupos de edad para el nivel
de estudios primarios, tales dif.erencias se hacen mnimas en el nivel de
estudios universitarios, en donde el 45 por 100 de las personas de ms
de 40 aos practican algn deporte, frente al reducido 6 por 100 de
dicho grupo de edad que manifiesta tal comportamiento en el nivel de estudios inferiores. Concluimos, pues, que la prctica de deporte, como.
fenmeno social y cultural, responde ms a condicionamientos clasistas
que a los estrictamente fsicos de edad y salud. La interaccin estadstica entre la variable de control educacin y la variable independiente
edad, ha contribuido a especificar el nivel de la variable dependiente
prctica de algn deporte. El resultado es diferente para cada una de

Prctica de un
deporte

15-25

26-40

40+

-------

NoS ...... ... ... ..... 71 5544 3364


------ Porcentaje
100
100
100
tal ...
Nmero
de
ca sos ............ (59)
(90)
...

... .

29

to

(118)

Prctica de un
deporte

S ... ... ... ...


No ............

15-25

26-40

40+

64
36

62
38

45
52

100

100

(87}

(42}

------

------

Porcentaje total ............ 100


Nmero de casos ............ (60)

las categoras de la variable de control y ha permitido .e.speci~i<;:ar algunas de las condiciones bajo las que permanece la. relac1on ongmal.
Naturalmente, no es solamente el nivel de educacin el que ~ete~
mina la relacin entre edad y prctica de un deporte. En el estud10 citado se analizan otras variables, tales como sexo, tipo de reside~c~a,
estilos de vida, etc . que tambin contribuyen a especificar las con~1c10nes bajo las que opera la relacin bivariable origi.nal. ~l ca~;' analizado
aqu nos ha permitido ejemplificar una lnea de mveshgac10n que consideramos muy provechosa.
12.4.2. La explicacin de una relacin entre dos variables

Cuando un investigador descubre una relacin entre dos variables, la


primera pregunta que implcitamente se formula ~s: se t~at~ ~e una
relacin realmente significativa? Dado que las variables soc10log1cas se
encuentran con frecuencia asociadas unas con otras, el investigador debe
asegurarse de que existe una ligazn inherente entre las dos variables

Estadistica descriptiva 111: Tras o ms variables 347

348 Socioe8tsdstica. Introduccin a la Estadistica en Sociologa

origina1es para que se pueda hablar de relacin significativa, porque de


l contrario pudiera ocurrir que la relacin se debiera a una conexin
accidental con una variable asociada. En este ltimo caso, tendramos
una relacin espuria (este trmino proviene del latn spurius, que significa bastardo o falso) y el investigador debe estar bien pretenido contra ellas.
Tal como seala con acierto Rosenberg (1968, pg. 28), no existen
relaciones espurias en sentido estricto, sino ms bien interpretaciones
espurias. No obstante, es costumbre hablar de relacin espuria cuando no existe una ligazn inherente o significativa entre dos variables,
ya que la relacin aparente se debe a fa asociacin accidental de ambas
variables con una tercera variable ajena a la relacin original. Es decir,
la relacin que aparentemente aparece como asimtrica es, en realidad,
simtrica, ya que se trata de dos consecuencias de la misma causa, de
dos indicadores. del mismo concepto, de dos manifestaciones de un
fenmeno complejo o, tambin, de dos factores que aparecen asociados
puramente por azar.
La explicacin de la relacin bivariable original, que es como denomina Lazarsfeld a este modo de elaboracin, consiste en el control de
factores, antecedentes, que invaliden la relacin. Simblicamente, se
puede expresar el modelo de la siguiente manera:

las dos variables originales. As, la razn de la aparicin de una relacin


entre el nmero de cigeas y el nmero de nacimientos, es la localizacin rural o/'urbana. La mayora de las cigeas se encuentran' en las
reas rurales, en donde adems la tasa de natalidad es mayor que en
las zonas urbanas. Si en la relacin original se introdujera la variable
rural-urbano, la relacin original desaparecera en cada una de las dos
tablas parciales resultantes.
De igual modo, la razn de la relacin en_tre personas hospita~i;:adas
y tasa de ..mortalidad se debe, como es obv10, a_ que la proporc1on de
personas enfermas en un hospital es notablemente mayor que fuera del
hospital. Y por lo que se refiere al ejemplo de los bombe~os, la cau~a
de la aparente relacin entre el nmero de stos y la cuanha de las perdidas se encuentra en que acuden ms bomberos a los incendios ms
inten~os, en los que las prdidas materiales son mayores. Con el fin de
glosar con mayor claridad este ltimo caso, podramos confecc~o~a.r la
siguiente tabla 12.5 en base a datos ficticios, pero que guardan s1md1tud
con lo que se podra encontrar en la realidad.
TABLA 12.5
Tablas totales_y parciales para el ejemplo de los bomberos

A. Tablas totales.
Tipo de incendio

Tipo de incendio

En la literatura sociolgica se pueden encontrar diversos ejemplos


que, tradicionalmente, se utilizan para glosar este proceso, algunos de los
cuales vamos a exponer a continuacin. As, se suele sealar que existe
una relacin entre el nmero de cigeas en una regin y el nmero
de nacimientos. Se trata, qu duda cabe, de una relacin espuria, aunque
realmente lo que es espuria es la interpretacin, ya que sabemos que
las cigeas no son portadoras de los bebs.
Tambin se puede encontrar en cualquier sociedad que la tasa de
mortalidad entre ia gente que est en l9s hospitales es mayor que entre
las personas de la mjsma edad que residen fuera de los hospitales.
Este resultado, sin embargo, no permite sacar ninguna conclusin sobre
la influencia de los hospitales en determinar la esperanza de vida de
las personas. Tambin se puede comprobar que existe una asociacin de
signo positivo entre el nmero de bomberos que acuden a apagar un
incendio y el valor de los daos causados por el fuego. Pero esto no
quiere decir que cuantos ms bomberos participan en la extincin de un
incendio, se producen ms destrozos.
En los tres ejemplos anteriores, la razn, o causa, de las relaciones
originales es siempre la existencia de una tercera variable, asociada a

Cuanta de las
prdidas (ptas.)

Nmero de
bomberos

Pequeo Grande

Un milln o menos ........ .


Ms de un milln ........... .

60

20

40

80

Porcentaje total.

100

100

Pequefia Grande

4 menos ......
Ms de 4 ......

75
25

20
80

Porcentaje total.

100

100

B. Tablas parciales.

T,: Incendios grandes

T,: Incendios pequeos

Nmero de
bomberos

Nmero de
bomberos
Cuanta de las
prdidas (ptas.).

60

60

Un milln o menos ........ .


Ms de un milln ........... .

40

40

Porcentaje total.

100

100

Cuatro
o menos

Mds de
cuatro

Un milln o menos ...


Ms de un mlln # . . . . . .

20

20

80

80

Porcentaje total.

100

100

Cuanta de las
prdidas (ptas.)

Cuatro Ms de
o menos cuatro

Estadstica descriptiva 111: Tres o ms variables 349

348 SocioeStadlstica. Introduccin a la Estadstcs en SocioJogfa

Conviene sealar, por otro lado, que estos resultados sobre el trabajo
femenino que cita Zeisel y que, por tanto, se refieren a la 'poblacin laboral norteamricana, son semejantes a los que P.ueden encontrarse al
respecto en cualquier otro pas industrial, como 'Espaa. Pues bien, a
la vista de los resultados de la tabla 12.6, el investigador pens en la
siguiente explicacin: las mujeres casadas faltan en mayor proporcin
al trabajo que las solteras, debido a que tienen que atender a ms tareas domsticas. A fin de comprobar esta hiptesis. se introdujo en el
anlisis corno factor de prueba la _cantidad de trabajo domstico al que
tienen que hacer frente los diferentes grupos de mujeres. Si la hiptesis
es cierta, la relacin entre estado civil y tasa de absentismo debe desaparecer. Utilizando la nomenclatura de Rosenberg, esto representa la equivalencia tcnica a la afirmacin que establece que si no fuera por el factor
trabajo domstico, las mujeres casadas y solteras no ofreceran diferentes tasas de absentismo.
Y, en efecto, fos resultados que aparecen en la tabla 12.7 confirman
la hiptesis anterior, tal como se puede observar a continuacin.

. Las tablas totales, que eran casi perfectamente asimtricas, y por


lo tanto mostraban una relacin de valor elevado (caso de haber calculado un coeficiente de correlacin apropiado a los gatos), dan lugar a
unas relaciones parciales o condicionales que son perfectamente simtricas y, por lo tanto, de nula relacin. Queda claro, pues, que el investigador debe estar en guardia contra asociaciones accidentales como las
anteriores, para no alcanzar conclusiones errneas.'Cuando se manejan
datos sociolgicos incompletos y se especula superficialmente sobre ellos,
pueden alcanzarse conclusiones con visos aparentes de plausibilidad,
pero que en el fondo encubren relaciones espurias. La elaboracin analtica apropiada de las relaciones estadsticas aparentes, es la mejor
salvaguarda contra tan equivocado proceder.
12.4.3. La interpretacin de una relacin entre dos variables.
Ejemplo .de una secuencia causal
Hasta ahora hemos tenido ocasin de estudiar .el papel que desempea un factor de prueba o variable de control en la especificacin de
una relacin bivariable -analizando los valores diferentes que toma la
relacin en cada una de las categoras de la variable control-, o en el
anlisis del carcter real o aparente de una relacin original. Adems,
los factores de prueba ofrecen otra ventaja terica y es que a travs
del uso de variables anteedentes e intervinientes se pueden establecer
secuencias causales. Para glosar este ltimo modelo de elaboracin, vamos a analizar dos ejemplos que son clsicos en el anlisis sociolgico
de encuestas.

En una investigacin relacionada con el absentismo laboral, se encontr que las mujeres casadas faltaban el trabajo en la fbrica en mayor
proporcin que las mujeres solteras. Los datos obtenidos se reflejan en
la siguiente tabla 12.6. .

TABLA 12.7

Absentismo laboral femenino, segn el estado civil y la cantidad


de tareas domsticas

Cantidad de tareas domsticas


Siwacin de absentismo

Muchas
Casadas

al trabajo ...............
Faltan
Asisten a su trabajo .. . .. . ... .. .
total ... ... ... ...
Porcentaje
Nmero de casos .. . .. . ... .. . . ..

TABLA 12.6
.;,

7
93

100
(5.680)

Pocas

Solteras

Casadas

6
94

3
97

100

100
(816)

(1.104)

Solteras

2
98

100
(9.126}

Absentismo laboral femenino, segn el estado civil


Situacin de absentismo

Mujeres
casadas

Faltan al trabajo ........... .


Asisten a su trabajo .............. .

6
94

Porcentaje total ... ... .. . .. .


Nmero de casos ............. ..

100
(6.496)

Mujeres
solteras

Entre las mujeres con idntica cantidad de trabajo, las diferencias


en las tasas de absentismo son mnimas. Realmente las diferencias no
se han eliminado del todo, lo que indica que la cantidad de trabajo domstico no es el nico factor que interviene en la relacin entre absentismo y estado civil, pero s es, con mucho, el factor principal. El status
lgico del factor de prueba es, claramente, el de variable interviniente,
pues tal corno se ha visto con anterioridad en la seccin 123.l, se trata
de un factor que es consecuencia de la variable iildependiente -en nues-

2
98

IOO
(10.560}

FUENTE: Adaptado de Hans ZEISEL: Dgalo con. nmeros, Mxico, F. C. E. 1962.

~~ . ;/
';.

350 Socioestadistica. lntmducci6n a la E.stadistica en Sociologfa

Estadstica descriptiva 111: Tres o ms variables 351

tro caso, estado civil- v es determinante de la variable dependienk


--es decir, del absentismo laboral-.
Otro ejemplo, clsico en los-estudios de conducta electoral, es el
analizado por Lazarsfeld, Berelson y Gaudet, en The People's Choice.
Los investigadores estaban interesados en el examen de la relacin entre
clas social y participacin en las elecciones. Los resultados obtenidos
en su inve~tigacin les permitieron comprobar que las j>ersonas con niveles de -estudios ms elevados, tienden a votar con mayor frecuencia
que aquellas otras que tienen n:ienos_ aos de escolaridad, tal como se
puede observar en la siguiente tabla 12.8.

TABLA 12.8
Nivel de estudios e intencin de voto
Nivel de estudios
/mencin de voto

Piensa votar . . . .. .
No piensa votar ...

Porcentaje total ...


Nmero de casos ......

Secundarios
y ms

Menos de
secundarios

92
8

86
14

100
(1.613)

100
( 1.199)

Cabra pensar en explicaciones alternativas a la anterior, por ejemplo, que la clp.se social influye en el inters por la poltica al mismo
tiempo que incide su efecto tambin en las intenciones de_ voto. En tal
caso, el diagrama de relacin de las tres variables sera el siguiente:

(X)-----+

(Inters por
la poltica)

(Clase social)

(Intencin
de voto)

Si realmente existe una relacin causal como la sealada con ante


rioridad, la introduccin del factor de prueba, inters por la poltica,
deber producir tablas parciales o condicionales en las que la relacin
original desaparezca, ya que al controlar la variacin debida a dicho
factor, desaparecer tambin la variacin debida a la variable independiente, clase social; con lo que ya no existir relacin entre esta variable y la variable dependiente, intencin de voto. Por el contrario, si la
introduccin del {actor de prueba no consigue hacer desaparecer la aso
ciacin original, entonces no se puede aceptar como vlida la secuencia
causal y, en cambio, habra que aceptar como vlida la explicacin que
se ha representado en el segundo diagrama. Los resultados que logra
ron obtener Lazarsfeld y colaboradores permitieron, no obstante, aceptar como vlida la primera de las explicaciones, como se puede comprobar a travs de los datos que se presentan en la tabla 12.9.

v. BERELSON y H. GAUDl!T: The People's


Choice, N. Y., Columbia University Press, 1948. pg. 47.

FuENTE: Adaptado de Paul F. LAZARSPIBLll,

TABLA 12.9
Como vemos, los investigadores utilizaron como indicador de la clase. soeial de las personas su nivel de estudios. Para explicar la relacin
que aparece en la anterior tabla, Lazarsfeld y colaboradores formularon la hiptesis de que las personas de clase social ms elevada tienden
a votar con mayor frecuencia que los de clase social baja, porque estn
ms interesados por la poltica, lo que les conduce a votar en mayor
proporcin. Es decir, existe una secuencia causal entre clase social (medida en este caso 'por el nivel de estudios), inters por la poltica e intencin de voto. El diagrama se puede e_stablecer del siguiente modo:

Nivel de estudios e .intencin de votos, segn el nters por la poltica


Inters por la poltica
ALTO

!mencin de voto

(X)----~

(n - - - - - 7 (Y)

Clase social
(nivel de estudios)

Inters por
la poltica

Intencin
de voto

Piensa votar .. . .. . .
No piensa votar
Porcentaje total ...
Nmero de casos ...

BAJO

MEDIO

Menos
Menos
Menos
de
de
de
Estudios estudios Estudios estudios Estudios estudios
secunda- secun- secunda- secun- secunda- secundarios
darios
darios
ros+
rios +
ros+

99
1

98

100

100

(495)

(285)

93
7
100
(986)

56
44

59
41

100

100

(669}

(132)

100
(245}

90
10

352 Soc1oesradfstica. Introduccin a la Estadstica en Sociologa

La observacin de las distribuciones porcentuales de la tabla 12.9


pone de manifiesto que entre aquellas personas que muestran idntico
inters por la poltica, no aparece una relacin consistente o sustancial
entre educacin y voto. En consecuencia, la relacin original se puede
explicar por el factor inters por la poltica.
Llegados a este punto en nuestra exposicin, quiz resulte onveniente que nos extendamos en explicar las diferencias que existen en los
papeles que juega el factor de prueba o variable de control, en la elaboracin de la relacin entre dos variables mediante la explicacin y mediante la interpretacin. En ambos casos, la relacin original se explica
por el factor introducido y, adems, el procedimiento estadstico que se
sigue es idntico: la introduccin de la tercera variable permite estratificar a la poblacin de acuerdo con los valores de las categoras de dicha
variable, encontrndose entonces que la relacin original desaparece.
Sin embargo, en el caso de la interpretacin, el factor de prueba es una
variable interviniente, mientras que en el caso de la explicacin el
factor de prueba es una variable ajena (Rosenberg la denomina, en ingls, extraneous). La diferencia entre ambos tipos de variable es de naturaleza lgica y terica, pero no estadstica -ya que el proceso estadstico que desencadenan es el mismo--. La distribucin se basa en el tipo
de relacin causal que se supone existe entre las variables. Para el caso
de una variable ajena, no se presupone la existencia de un lazo causal
entre las variables independiente y dependiente. La asociacin original
observada se debe enteramente a su asociacin respectiva con una tercera variable.
Para el caso de las variables intervinientes, el proceso analtico es
diferente, ya que el factor de prueba, en lugar de estar relacionado por
separado con las dos variables originales, representa a una variable que
interviene entre ambas. Y en tal caso, se prodm~en tres relaciones asimtricas: 1, una relacin original entre la variable independiente y la
variable dependiente; 2, una relacin entre la variable independiente y
el factor de prueba, y 3, una relacin entre el factor de prueba y la variable dependiente.
Estas tres relaciones asimtricas implican una direccin o influencia
dominante, pero no absoluta. La clase social influye en la intencin de
voto, pero sta no es responsable de aqulla .. La clase social influye
igualmente en el inters por la poltica, pero slo en algunos pocos casos
puede el inters por la poltica producir movilidad social y un cambio,
por tanto, de clase social. Finalmente, el inters por la poltica conduce
a las personas a que voten, y slo raras .veces se producir la influencia
contraria. De este modo, en tanto se pueda establecer la direccin dominante de la influencia en las tres relaciones asimtricas, ser posible
caracterizar al factor de prueba como variable interviniente.

Estadslica descriptiva ///: Tres o ms variables 353

12.4.4. Variables supresoras y variables transformadoras


r
A lo largd de este captulo nos hemos preocupado principalmente de
comprobar si. la relacin que apareca entre dos variables era real o
aparente, mediante la introduccin de un factor de prueba. Pero desde el
punto de vista de la investigacin sociolgica, resulta del mismo inters
terico comprobar si la ausencia de. relacin entre dos variables es real
o se debe, por el contrario, a la existencia de una tercera variable que
suprime la manifestacin de una asociacin entre las dos variables originales. Como tambin resulta de gran inters terico comprobar si la
relacin de un determinado signo no viene alterada, en sentido contrario, por una tercera variable que transforma el sentido real de la relacin. La denominacin de algunas variables como supresoras o transformadoras, se debe originalmente a .Rosenberg {1968, pgs. 84-104)
quien utiliza tales trminos (supressar and distorter variables, en ingls)
" falta de otros mejores. Y por la misma razn los empleamos aqu.
Quiz sea a travs de sendos ejemplos la mejor forma de explicar
el significado y pa{lel anal~tico-estadstico de ambos tipos de variables,
y para ello vamos a utilizar datos imaginarios, pero que estn basados
en nuestra experienc~a cmo investigador social.
Se podra formular la hiptesis de que la aprobacin del control
de natalldad es mayor entre los personas de status socioeconmico alto
que entre las personas de status socioeconmico bajo. Sin embargo, al
realizar una encuesta para comprobar tal hiptesis. se puede encontrar
un resultado que aparentemente la invalida, tal como el que se recoge

en la tabla 12.10.
Aparentemente y en contra de la hiptesis formulada, no aparece relacin alguna entre ambas variables. Si calculramos un coeficiente de

TABLA 12.10
Opinin sobre el control de la natalidad segn el nivel
de Statu.s socioeconmico *
Status socioeconmico
Opinin sobre el control
de la 11atalidad

Baio

Medio

Alto

Lo aprueba . . . ...
Lo desaprueba ...

48
52

47
53

48

Porcentaje total

100

100

100

* Datos imaginarios.

52

354 Socioestadfstica. Introduccin a Ja Estadstica en Soc/ologa

Estadstica descriptiva 111: Tres o ms variables 355

correlacin para los datos que se contienen en la tabla 12.l l, su valor


sera O o muy prximo a O. No obstante, nuestro conocimiento previo
'sobre el tema nos puede conducir a pensar que existe algo extrao en la
no relacin que se observa en tales datos. Por eso, cabe pensar que
puede existir algn factor que est ejerciendo un papel de supresin de
la relacin. Veamos qu ocurre si introducimos como factor de prueba la
asistencia o no a misa, por el papel qwe juega la religiosidad en las actitudes y opiniones con un alto contenido tico y moral.

ante la aceptacin de relaciones que realmente funcionan en sentido


contrario. Rcurrarnos de nuevo a un ejemplo imaginario para esclarecer nuestro ar~umento analtico. En re~acin a las actitudes regionalistas de los espanoles, cabe pensar que las preferencias por 'el autonomismo, como op~sicin. al _centr~lismo poltico, es mayor entre las personas
de status soc10econom1co mas alto. Unos resultados que permitiran la
aceptacin de tal hiptesis, son los que se contienen en fa. tabla 12.12.
TABLA 12.12

TABLA 12.J 1

Preferencias regionalistas segn el nivel de estatus socioeconmico

Opinin sobre el control de natalidad, segn el nivel de status


y la asistencia a misa
T,: No van a Misa

T,: Vn a Misa
Statu~

Opinin sobre el
socioeconmico
control de la
natalidad
B a i o Medio Alto

Lo aprueba . ..
Lo desaprue
ba ... ... ... ...
Porcentaje total .. . .. . ... ...

Preferencias regonalistas

42

25

21

58

75

79

100

100

100

Status
socioeconmico

Opinin sobre el
control de la
natalidad
B a o Medio Alto

Lo aprueba ...
Lo desaprueba ............
Porcenta.ie total

62

66

74

38

34

26

100

100

100

------

Al separar a la poblacin en dos grupos, segn vayan o no a misa,


aparecen sendas relaciones entre la opinin sobre el control de natalidad y el status socioeconmico, pero de signo opuesto. Entre las personas que van a misa, el rechazo al control de la natalidad es mayor entre
las personas de status ms elevado, mientras que lo contrario ocurre
entre aquellas que no van a misa, ya que el grado de aprobacin del con
trol de la natalidad es mayor cuanto ms elevado es el status socoeconmico de las personas.
La variable religiosidad, medida por la asistencia o no a misa, estaba actuando como supresora de la asociacin, que ahora resulta evidente, entre la aprobacin o rechazo del control de la natalidad y el status
socieconmico. Caso de haber detenido el anlisis en los resultados de
la tabla 12.10, hubiramos alcanzado unas conclusiones totalmente
errneas.
Otro caso de gran inters para el anlisis sociolgico se pro~uce al
actuar uha variable desvirtuando el sentido de una determinada relacin. Antes de alcanzar conclusiones definitivas, conviene estar alerta

Status socioeconmico
Alto

B a; o

Centralismo ..... .
Autonoma ........ .

37
73

45
55

Porcentaje total ..... .

100

100

* Datos imaginarios.

En efecto, se observa que las preferencias autonomistas son mayores


entre la poblacin de status socioeconmico elevado, frente a la poblacin de status bajo. Sin embargo, sabemos que en las regiones en las
que se ha producido una fuerte inmigracin en los ltimos aos, tales
como el Pas Vasco y Catalua, existen diferencias notables en muchos
sentidos, entre la poblacin autctona y la poblacin inrni~rante. Veamos qu ocurre en la relacin anterior cuando introducimos corno factor de prueba el carcter de oriunda o inmigrante de la poblacin.
Al exminar las relaciones que aparecen en la tabla 12.13, nos damos
cuenta de lo infundado de ll relacin original. Entre la poblacin inmigrante, la preferencia autonomista es mayor entre las personas de status
socioeconmico ms alto, mientras que entre la poblacin autctona
ocurre lo contrario, ya que las preferencias autonmicas son ligeramente superiores entre la poblacin de status bajo. En tal caso, nos referiremos ~l carcter de inmigrante o de oriunda de la poblacin, como
una variable transformadora, que altera el sentido de la relacin entre
las preferencias autonmicas y el status socioeconmic de la poblacin.
Despus de esta exposicin, creemos que resulta evidente la impor
tancia que para el analista socilogo tiene el saber reconocer el tipo de
variable o factor de prueba que introduce en la elaboracin de las rela-

358 Socioestadfstica. Introduccin a ta Estadistica en Sociologa

Estadstica descriptva 111: Tres o ms variables 357

TABLA 12.13
Preferencias regionalistas segn el nivel de Status~ .Y el carcter
de oriundo o de inmigrante de la poblaczon
Poblacin inmigrante

Poblacin oriunda

Status

Status

Preferencias regionalistas

Centralismo . .. .. . . . . .. . . ..
Autonoma .. . . .. . ..

Porcentaje total ...

Alto

Ba ;o

Alto

Baio

50
50

70
30

30
70

20
80

100

100

100

100

dones entre dos variables originales, y la ne:e.si.dad_ ~e consider~r . simultneamente el papel de la teora y del anahsts logico .Y estadistico
de las variables, para lograr resultados de inters que permitan un avance real de nuestros conocimientos sociolgicos.
12.5.

tema como un todo. Matilda White Riley propone como ejemplo de un


anlisis ideal ,de este tipo, al que denomina anlisis del sistema social",
la observacih en un conjunto de sociedades de la totalidad de interrelaciones de las caractersticas que las definen, tanto a nivel indilf:idual
como a nivel grupal. Se podra comenzar mediante la identificacin de
cada individuo -en trminos de las propiedades objeto de estudio-como perteneciente al sector agrario o industrial, y como residente en
un rea urbana o rural. A partir de aqu se determinara cmo se ordenan los diferentes tipos de individuos al formar la estructura interna de
roles dentro de cada sociedad estudiada. Finalmente, se compararan
las diferentes sociedades en trminos de sus estructuras internas de
roles y en sus modelos globales de urbanismo e industrialismo.
En la prctica habitual de la investigacin sociolgica, dado el actual
nivel de desarrollo cientfico social, tal modelo de anlisis rar~mente
es utilizado. Tal como destaca Riley, existe todava una cierta confusin
acerca de las definiciones conceptuales de los diferentes niveles y de
sus relaciones mutuas. Adems, con frecuencia, el anlisis completo no
es necesario. Aqu vamos a referirnos, brevemente, a dos tipos de anlisis
parciales del sistema social, que cuentan con una buena tradicin sociolgica. Se trata del anlisis estructural y del anlisis contextual, refiriendo al lector interesado en un tratamiento ms amplio de tales temas a
la obra de Riley sealada.

MODELOS CON VARIABLES A DISTINTOS NIVELES DE ANLISIS

12.5.1. Anlisis estructural

Hasta ahora hemos estudiado modelos de anlis_is esta~stico en los


que las variables venan referidas todas ellas al mismo mve.I. Con frecuencia nos hemos ocupado de variables que hacen referencia. a ca.r~c
tersticas de Jos grupos o de los individuos, en el supu~sto 1mphc1to
de que la agregacin pertinente de tales variables nos remite al ststema
del ms alto nivel de Ja colectividad como un to?o. Per~ una de las
mayores dificultades que se le presentan al apahsta soc~l, es el ~e
la traslacin de Ja nocin de colectividad como un todo o sistema social
a la propia prctica investigad?ra. Y de ~ificultad no ?1enor es el manejo de asociaciones que impliquen relaciones de va~1a?les referentes
a propiedades individuales, tales como actitudes u opm1o~e~, con propiedades grupales, tales como val~:es societales o caractenst1cas demogrficas de un sector de la poblac1on.
..
.
En un tratamiento muy lcido de este tema, la soc10loga y antrop?loga norteamericana Matilda White Riley (1963, p~gs. 701 Y ~igs.) sug1e.re
e con el fin de comprender la naturaleza del sistema social, el anahs~ debe utilizar propiedades de dos o ms niveles del sistema, ya qu: es
a travs de Jos anlisis combinados de varios niveles como es posible
investigar )as interacciones e interdependencias ?~ las partes, Y sus co.nsecuencias, funcionales y disfuncionales como dma Merton, para el sis-

En un anlisis estructural, el inters est centrado en las propiedades


del grupo, pero con alguna referencia a los roles diferenciados que se
relacionan mtuamente para formar la estructura interna del grupo. En
este caso, las acciones y motivaciones de los actores individuales se consideran como mecanismos en el funcionamiento de la colectividad, y
las normas y reglas que gobiernan a los individuos pueden considerarse
como las condiciones bajo las que los fenmenos del grupo objeto de la
investigacin operan sin que se resienta la integracin del sistema. Riley
sugiere como ejemplo de anlisis estructural, dentro del ejemplo global
anteriormente propuesto, la comparacin de los residentes en las zonas
rurales de las diversas sociedades consideradas, con el fin de saber si el
grado de industrializacin de la sociedad como un todo afecta al proceso de industrializacin de los segmentos rurales.
En el famoso estudio de Durkheim sobre el suicidio (1960, e. o. 1897)
* Este trmino no tiene nada que ver con el moderno anlisis sistmico o
teora de los sistemas, que a partir de modelos cibernticos, trata de lograr la unidad de la ciencia. Para un reciente tratamiento en espaol del anlisis sistmico
aplicado a la sociologa, ver Francisco PARRA: Para qu sirve la teora de sistemas
en Sociologa?, Revista Espaola de Investigaciones Sociolgicas, 15, 1981, pgs.
77-111.

358 Socioestadfstica. Introduccin a la Estadfstica en Sociologfa

se puede encontrar un buen ejemplo de anlisis estructural. .~e~pus


de haber descubierto en un anlisis de grupo que la tasa de suicidio ~e
un pas se encuentra asociada con su composicin religi?sa, Durkhe1m
quiso asegurarse de que la religin no es un factor esp~no, y por tanto
que los segmentos de poblacin catlica y protestante difieren en efecto
en sus respectivas tasas de suicidio, despus de controlar el entorno
sociai del pas (es decir, su composicin familiar, sistema poltico, etc.).
DuI'kheim continu su anlisis dividiendo cada grupo en un segmento
compuesto por individuos protestantes y en otro. segment~ compu.es.to
por individuos catlicos -ya que como el propio Durkhe1m escnbi,
con el fin de mantener constantes los efectos de diferencias ms amplias
entre los grupos, es preciso comparar las dos religiones en el corazn
de cada sociedad-.
Al comparar el segmento de poblacin _protestante con el segmento
catlico dentro de cada,grupo, le fue posible a Durkheim demostrar su
argumento de qe aquellos segmentos de poblacin c~racterizados por
instituciones y valores protestantes son los que manifiestan tasas de
suicidio ms elevadas. El anlisis de tipo estructural seguido por Durkheim le permiti poner de manifiesto que en cada pas l.~ pobl~c.in
protestante se suicida en mayor proporcin que la poblacion catohca,
con independencia del carcter del pas.
Para tenninar esta breve referencia al estudio de Durkheim sobre
el suicidio, conviene sealar que este estudio contina siendo un modelo
de investigacin sociolgica riguroso y un ejemplo para la actual metodologa de las ciencias sociales, ya que todo el anlisis de Du:kheim e.n
este trabajo consiste en contemplar los efectos que surgen al mtroducir
progresivamente terceras variables en las rela:io~es bivari~b~es originales. A pesar de que Durkheim careca de las tecmcas estadisticas p~ra
desarrollar sus ideas con rigurosidad, supo anticiparse en muchos anos
a una de las lneas dominantes del actual anlisis sociolgico (Selvin,
1958, pg. 609).
12.5.2. Anlisis contextual

En un anlisis contextual, el inters se centra en el individuo, pero


se sita y explica el papel del individuo con referencia a su contexto de
grupo. As, el investigador puede estar interesado en saber por qu las
personas eligen ciertas tareas ocupadon~l~s ~ en cmo las n.ori:i~s sociales de movilidad ocupacional y geograf1ca mfluyen en los md1viduos
y en sus intereses, o en cmo las personas se relacionan y son influenciadas por otras personas y grupos dentro de determinadas estructuras
econmicas y demogrficas. Para estudiar todos estos p:oblema~, el tratamiento analtico adecuado es el contextual. En el ejemplo ideal de
Riley, habra que aplicar esta perspectiva si se desea saber si los residen-

Estadstica descriptiva 111: Tres o ms WJTiMJles 359

tes rurales participan en ocupaciones industriales con mayor probabilidad en el cqntexto de una sociedad altamente urbanizada, que los residentes rurafes en el contexto de una sociedad predominantemente rural.
Los autores del cuarto' Informe FOESSA sobre el Cambio Poltico en
Espaa (Juan J. Linz y cols., 1981), han realizado un amplio uso del
anlisis contextual. Con ello, han tratado de superar las limitaciones que,
por separado, presentan los estudios electorales basados, respectivamente, en datos individuales y en datos agregados o ecolgicos. Al estudiar
la influencia contextual en las actitudes y comportamientos del electorado, los autores intentan conocer si diferentes contextos dan lugar a
diferentes actitudes y comportamientos polticos del electorado, al mismo tiempo que relacionan los diferentes tipos de contextos con variables individuales. Ejemplos de variables contextuales polticas utilizadas por los autores del informe FOESSA son las siguientes: participacin
-proporcin del Censo. electoral que ha depositado su papeleta en las
urnas-, votos positivos, negativos y en blanco de cada Referndum, y
votos derecha, izquierda y regionalistas de las Elecciones legislativas.
Como variables contextuales ecolgicas, los autores utilizaron las siguientes: nmero de habitantes del municipio, crecimiento demogrfico
intercensal, proporcin de empresarios grcolas y fuerza electoral de
la derecha en 1979 .
Para conocer la aplicacin que se ha hecho del anlisis contextual en
el Informe FOESSA, vamos a reproducir aqu un anlisis parcial del modelo explicativo seguido en el estudio del autoposicionamiento del electorado en una escala ideolgica izquierda-derecha de valor mnimo 1 y
valor mximo 10. Las diferentes mediciones realizadas sobre el autoposicionamiento ideolgico de la poblacin espaola en el perodo 19761979; han puesto de manifiesio un incremento de las posiciones de iz
quierda, hasta su relativa estabilizacin a partir de 1978. Este hecho condu~e a Linz y colaboradores a sugerir una cierta estabilidad poltica del
electorado espaol, que no responde ya a los estmulos polticos coyunturales .. Con el fin de comprobar la influencia que los diferentes contextos puedan haber ejercido en la conducta del electorado, prepararon una
tabla a partir de las puntuaciones medias de diferentes grupos, dentro
de los contextos que los controlan.
La primera conclusin que se obtiene de la observacin de la tabla
12.14 es la de que en los diferentes tipos de contextos considerados
se dan diferentes puntuaciones medias del electorado, lo que revela diferentes autoposicionamientos en el espacio poltico. Tal como sealan
los autores del Informe FOESSA, tanto el "tamao del hbitat", como el
peso del "empresariado agrcola", como los contextos definidos por los
diferentes "niveles de crecimiento", presentan variaciones en el autoposi* Para una exposicin detallada de la metodologa del anlisis contextual utilizada en el Informe FOESSA, ver el apndice metodolgi:o que se incluye en la
referida obra.

360 Socloestadfstica. Introduccin a la Estadistica en Sociologa


Nlil"~

- <::!

()

- <:s

~'B

li
'O
;;

<::!
~

'..,
"'!. '
...,
-<i

r-

"'v

"'~

<::!"'
t:'\'j

.....:;:

<::!

.....

"'::

.:::

() 8-

"'~...

:::1:: 1!~ ..ti

<:

"'.,.,

"'
C!.N
r

'
O\
v

""v.O

v
"!.
v

::o

U)

cionamiento, que se corresponden con diferentes estructuras del electorada, que,tSe constituye as en diversos "electorados",, (Linz y cols.,
op. cit., pg. 186).

~~
vv

~~
tri"'

f"fi...

Tambin se puede observar en la tabla anterior que las mayores diferencias se dan en el contexto de la variable fuerza electoral de la derecha. Del conjunto de las diferencias observadas, se puede concluir
que en los contextos de tamao de poblacin reducidos, con pesos elevados de la poblacin empresarial agrcola y con un crecimiento demo
grfico inferior a la media, el autoposicionamiento tiende ms hacia la
derecha que en el resto de los contextos, lo que viene a confirmar la influencia contextual.
Por lo que se refiere a las diferencias que se establecen pra las diversas categoras de las variables sociodemogrficas individuales, en el
caso del sexo y de la clase social las oscilaciones de las puntuaciones
medias son reducidas, mientras que son mximas para el indicador de
la religiosidad. De este modo, el factor religioso se destaca como el ms
discriminante a la hora de diferenciar posiciones del electorado en el espacio poltico de competencia entre partidos (Linz y cols., op. cit.,
pg. 187).
Numerosas son las conclusiones que los autores del Informe FOESSA
obtienen de los diversos anlisis contextuales incluidos en el texto.
Basten las aqu citadas para poner de manifiesto las excelentes posibilidades que brinda la utilizacin simultnea de variables individuales y
variables contextuales dentro del mismo modelo analtio. Con todo, este
tipo de anlisis ofrece algunos problemas que surgen al trasladar conclusiones de un nivel analtico a otro diferente, que conviene tener presente a fin de no alcanzar resultados errneos.

O\ N

' -et"'..

~O'!.

co..

VI v

"' "'

cu
't:I

s::

"'o
:!
...i:..c
~

~:;::.~

-..."'
cu

....

s::cu

cu

... "'s::
l,Y'<::!'N

...

()-0

~o

o;, cuu

- -- ~

()-0"'

"'
.S!
()
.!:!
...

<::!

<"'i

'O

<
,_

cu cu
"t:t
-:;::

o o

- u

l:l.

:;::
.~o
;: :;::

"'

ti.

lll

<
E--<

~
........
o:;:

u""'
~V)

cu

.;:"'

s::

"'
"'...

'>

~..

~.9

...

...

..~.2
l..;'\'j
.::..~
;:: t:

......

......

:-

v"

" ' 00

"'-

00
00 -

--o

~""l

Ov

00
.,..,

N""

"l. "t
Lt'lv

f"-...

()

.~

:;:'O

"' -"!.
.,.., "'

'.,.,

o~

~ ::~

~"'o
:;:

'>

-:. N..,

.,., "'

Lt'lv

v 00

"'
-.-.
ui--:;

'rt t'!.

. -<i

"' "'

...

~S.S!

'-'<;!

"'"'
:: s::
~~

V)

'

"'

o ....

"'

'
r--.
"'v

00
"'
tri'M

~ lr)

...;

00

00

Ol
()

:e.

'l::io

:::8
~-

"'

"'

"'
cC!

o..

"'oo.
v

"'
~et

...... 00

'~lfl
"'

-O N
tr). rri"'

VV)

"'v

()

:::
<::!
::

....

;;;

"'

..

12.5.3. Falacias que surgen en el manejo de modelos con diferentes


niveles de anlisis

tfJ
tfJ

'l:l

I.l

'<"'::18.

.,...

"'!. '
"'v
v

,.....~

... '

00' N
"'
"

vi'

00 -

-<i -<i

r')..

~-

"'l:!
cu

"'...
E
.8
.5

"'s::cu

. e:"'

....s::

:; ...

:::;

6!;

... ;:l

Q..

..J

<
...

...

(/)

><

:>

't:l
o
"O

~:E

:J

IX

=.E
o-i::i
o :;

u ....

v't:l

Os

't:l

"'~
E ...

E.
o

;a

o "'
u
...

Oi

-;;

oo

"'
"'"'o

..."'

"O

<o

.i

~
'

::::. .D

Estadstica descriptiva 111: Tres o ms variables 361

<

....
z

"';:J
u..

.~

La mayor parte de las dificultades con las que se enfrenta el investgador que utiliza modelos con dos o ms niveles de anlisis, surgen de
la incapacidad de trasladar el modelo conceptual en operaciones a un
nivel apropiado del sistema social. Las falacias que surgen al utilizar
datos inapropiados originan obviamente resultados equvocad9s.
As, si el modelo se refiere a roles individuales pero el anlisis lo
basa el investigador en el manejo de grupos, se produce la falacia agregacional o falacia ecolgica, tal como fue denominada por W. S. Robinson en un artculo ampliamente citado (Robinson, 1950). Inversamente,
si el modelo se refiere al grupo, pero el anlisis se basa en individuos,
se producir una falacia atomstica.
En el ejemplo de Robinson, la hiptesis inicial se refiere a individuos
y establece que dado que los niveles de estudios son ms bajos entre la

362 Socioestadfstica. Introduccin a la Estadistica en Sociologa

Estadstica descriptiva 111: Tres o ms variables 383

poblacin inmigrante en relacin a la poblacin nativa, la relacin entre


el porcentaje de poblacin inmigrante y el porcentaje de analfabetismo
debe ser positiva. Para probar su hiptesis, Robnson tom datos censales- por tanto, datos agrupados-, y encontr una correlacin negativa (-0;619) entre la proporcin de poblacin inmigrante y la proporcin analfabeta. Pero Robinson no rechaz su hiptesis inicial a pesar
de este aparente resultad negativo, ya que en caso de haber basado sus
datos en individuos, las conclusiones hubieran sido diferentes, como se
observa en la tabla 12.15.
TABLA 12.15
Distribucin de la poblacin segn niveles de alfabetismo
y lugar de nacimiento
Inmigrantes

FUENTE:

Nativos

Total

Analfabetos . . . . .. . ., . . .
Alfabetos ... . . . ... . .. ...

1.304
11.913

2.614
81.441

3.918
93.354

Total ... . .. .. .

13.217

84.055

97.272

----

Robinson, 1950, pg. 354.

En efecto, la proporcin de analfabetos es mayor entre la poblacin


inmigrante que entre la poblacin activa, luego la correlacin ahora es
de signo contrario a la obtenida utilizando datos censales. Claramente,
este ltimo tipo de datos resulta inapropiado para comprobar la hiptesis inicial, que se refera a individuos y no a grupos.
En los estudios electorales es fcil caer en la falacia ecolgica, ya
que con frecuencia slo se dispone de datos agregados, y a veces se pretende obtener de ellos conclusione5 referidas a individuos. As, a pesar
de que en las zonas rurales existe un voto predominantemente de derechas, no se puede concluir por ello que los agricultores votan sobre todo
a la derecha. En una buena discusin sobre la falacia ecolgica en los
estudios electorales, Lpez Guerra (1977, pgs. 85-86) sugiere Ja utilizacin de diversas tcnicas, tales <;:orno la adopcin de modelos de regresin mltiple o de modelos no lineales, para evitar este tipo de falacia,
as como el mximo uso psible de variables de tipo individual.
Inversamente, la falacia atomstica se producira si se pretendieran
obtener conclusiones sobre las caractersticas de los grupos censales a
partir de los datos individuales que Robinson prepar y que hemos reproducido en la tabla 12.15. Naturalmente, la falacia atomstica se evitar
cuando al formular hiptesis sobre grupos sociales, los datos que se

utilizan se refieran igualmente a grupos, y no a individuos.. En general,


pues, el investigador debe reunir la informacin que demande su modelo
de anlisis, 'y no debe suplir la ausencia de una informacin relevante
por otra referida a un nivel de anlisis diferente, ya que inevitablemente
los resultados que logre sern err.neos.
12.6.

COEFICIENTES DE CORRELACIN PARCIAL

Al elaborar la relacin entre dos variables, los objetivos del investigador pueden estar dirigidos al anlisis de las diferenci::ls que se produzcan en las tablas condicionales, o bien al cambio global que se pueda
producir en el grado de asociacin de las relaciones condicionales. En
el primer caso, se deben de seguir algunos de los pr.ocedimientos de elaboracin expuestos anteriormente, pero si lo que se pretende es lo segundo, se pueden utilizar otros recursos estadsticos para observar si el
grado de asociacin en las tablas condicionales es el mismo, ha aumentado o ha disminuido en relacin a la asociacin de la tabla original.
Precisamente el procedimiento del clculo de la correlacin parcial es el
apropiado para obtener tales medidas, y para ello se calcula como una
media de los resultados de las tablas condicionales.
El coeficiente de correlacin parcial representa una medida nica
del grado de asociacin entre dos variables al confrol;u los efectos de
terceras variables adicionales. Des~e el punto de vista conceptual, la correlacin parcial es anloga al procedimiento de elaboracin de tabulaciones cruzadas estudiado anteriormente. No obstante, ofrece algunas
ventajas que conviene tener en cuenta al elegir uno u otro procedimiento de anlisis. En la elaboracin de relaciones bivariables, el control que
se ejerce es literal -se examina la relacin bivariable en cada categora
de la variable de control- y, adems, para que resulte ~ignificativa, conviene que cada celdilla cuente con un nmero suficiente de casos. Caso
de no ser as, la relacin observada pierde significado cuando alguna
celdilla est vaca o cuenta con pocos casos.
En la correlacin parcial, el control es, naturalmente, de tipo estadstico y se basa en el supuesto de la existencia de relaciones lineales entre
las variables, permitiendo al investigador separar el efed de la variable
de. control de la relacin entre la variabl~ independiente y la dependiente,
sin manipular directamente los datos originales. A partir del clculo de
las relaciones bivariables posibles enfre .(as tres variables, esto es, la
independiente, la dependiente y la de control, d coeficiente de correlacin parcial se calcula por medio de la construccin estadstica de nuevas variables independiente y dependiente, al separar el efecto de la variable de control. La p.ueva variable independiente se construye al calcular la diferencia entre el valor original de la variable independiente y su
valor tal como lo predice la variable de control. La nueva variable no

Estadistica descripti>a 111: Tres o ms variables 365

!t64 Socioestadstica. Introduccin a la Estadstica en Sociologa

est, pues, por definicin, correlacionada con la variable de control.


Lo mismo se hace con la variable dependiente. La correlacin simple
entre las nuevas variables ajustadas es la correlacin parcial. De hecho,
para calcular el coeficiente de correlacin parcial se parte de la matriz
de correlaciones -bivariables-, siendo estos los valores que se intro
ducen en el clculo.
Tales clculos se pueden hacer a partir de variables de nivel ordinal
o a partir de variables medidas a nivel de intervalo, aunque en la investigacin sociolgica la mayor parte del anlisis de correlacin parcial
.se realiza a partir del coeficiente r de Pearson, esto es, entre variables
de intervalo. En tal caso, el coeficiente de correlacin parcial de primer
orden (slo se controla una variable) se calcula por medio de la siguiente frmula:

Del mismo modo se pueden calcular coeficientes de correlacin par


cial de orden superior, es decir, con el control de dos o ms variables,
en cuyo caso la frmula es la misma pero utilizando los coeficientes de
correlacin parcial de orden inferior. As, para l caso de dos variables
de control, el coeficiente de correlacin parcial de segundo orden se
calcula por medio de la frmula:

muestra de ciudades espaolas, y convengamos en que los primeros resultados de 1.a investigacin han puesto de manifiesto la existencia de
una relacin 1rnoderadamente positiva entre la proporcin de poblacin
inmigrante en las ciudades y la tasa de delincuencia. Sin embargo, podemos sospechar que la relacin es espuria y se debe, en realidad, a los
efectos de otras dos variables: l) tasa de desempleo y 2) tamao de la
ciudad, que estn correlacionadas fuertemente con las dos variables originales, con lo que la relacin entre la proporcin de inmigrantes y la
tasa de delincuencia es simplemente una funcin de la relacin previa
con la tasa de desempleo y el tamao de la comunidad. El problema
que hay que resolver, pues, es el de saber cul es realmente el grado de.
asociacin entre inmigracin y delincuencia, cuando se controlan los efectos del desempleo y del tamao de la ciudad. Examinemos unos datos
hipotticos, para glosar el usar de la correlacin parcial. Supongamos
que hemos obtenido las siguientes correlaciones bivariables.

(X)

% inmigrantes ... ...

(T,) Tasa de desempleo .


(T,) Tama.o ciudad .. . . .. ...
(Y)

Al igual que con el coeficiente de correlacin total, r, el coeficiente


de correlacin parcial vara desde -1,00 a +1,00. El cuadrado de su
valor expresa la proporcin de la variacin en Y ( X) que queda explicada por su asociacin lineal con la otra variable X ( Y), despus de
controlar los efectos de. la variable de prueba.
12.6.l.

Utilzaein de la correlacin parcial

La correlacin parcial puede emplearse con diversos fines de investi


gacin en sociologa. Utilizada adecuadamente, resulta ser una tcnica
apropiada para descubrir relaciones espurias y para localizar variables
intervinientes. Blalock (1964) propone tambin su uso para realizar cierto tipo de inferencias causales. No obstante, aqu nos vamos a ocupar tan
slo del empleo de la correlacin parcial en el estudio de relaciones ms
o menos espurias.
Supongamos que estamos estudiando tasas de delincuencia en una

Tasa de delincuencia ...

(X)

(T,)

Proporcin
de
inmigrantes

Tasa de
desempleo

1,00

0,49
1.00

(T,)

(Y)

Tamao
ciudad

Tasa de
delincuencia

0,38
0,26
1,00

0,33
0,60
0,47
1,00

La observacin de la matriz de correlaciones pone de manifiesto que


la correlacin (0,60) entre tasa de desempleo y tasa .de delincuencia,
por un lado, y entre el tamao de la ciudad y la tasa de delincuencia
(0,47), por otro, es mayor que la que aparece entre proporcin de pobla
cin inmigrante y tasa de delincuencia (0,33). Adems, las correlaciones
entre la proporcin de inmigrantes y las otras dos variables independientes son bastante elevadas, 0,49 y 0,38, respectivamente. Estos datos
permiten ya al investigador sospechar que existe una relacin espuria.
El clculo de tres coeficientes de correlacin parcial (dos parciales de
primer orden y otro parcial de segundo orden) nos va a permitir matizar y comprobar tales sospechas.
Si la correlacin entre la proporcin de inmigrantes y la tasa de delincuencia desaparece, esto es, se hace cero o casi cero, cuando se controlan los efectos del desempleo y del tamao, habremos obtenido la
evidencia estadstica de que la relacin es, en efecto, espuria. Veamos
ahora los clculos:

Estadistica descriptiva llf: Tres o ms variables 367

386 Socioestadstica. Introduccin a la Estadistica en Sociologa

(0,33)-(0,60) {0,49)

.J< 1-0,4~) (1-0,602)


r,,. T 2

(0,33)-(0,47) .(0,38)

.J(1-0,382) (1-0,47

(proporcin :fo votos de la CEDA en 1936) y la proporcin de votos de


UCD, contro}ando el resto de las variables que inciden ms fuertemente
en el voto: '

0,08

0,20

2
)

Coef. correlacin parcial entre voto


UCD y voto CEDA (1936)

Variables de control

-0,06

Veamos ahora cmo interpretamos estos coeficientes de correlacin


parcial. La corre!~cin parcial entre inmigracin y delincuencia, al con.ttolar el desempleo, es 0,08, lo que indica una fuerte reduccin de la
relacin original, que es 0,33. Cuando se controla el tamao de la ciudad.
la corrlacin parcial es 0,20, que indica tambin una reduccin de la
relacin original, pero no tan fuerte como en el caso anterior. En cuanto
a la correlacin parcial de segundo orden, esto es, cuando controlamos
simultneamente los efectos del desempleo y del tamao, el coeficiente
se reduce a -0,06, que a efectos prcticos equivale a cero. Estos resultados clarifican notablemente las cosas: as, la relacin entre la proporcin de poblacin inmigrante y tasa de delincuencia es efectivamente
espuria, por efectos de las variables tasa de desempleo y tamao de la
'ciudad; pero la variable tasa de desempleo ejerce un efecto contaminante de mayor importancia que el tamao de la ciudad. As, pues, los
resultados obtenidos ponen de manifiesto que las tasas de delincuencia
en las ciudades espaolas, cuando se controlan los efectos de la tasa
de desempleo y del tamao de la ciudad, son independientes de la proporcin de poblacin inmigrante que en ellas reside.
Otro ejemplo, con datos reales, del uso de la correlacin parcial lo
vamos a extraer de la sociologa poltica. En un estudio sobre el voto
emitido por la poblacin espaola con motivo de las elecciones legislativas del 15 de junio de 1977, los autores tratan de obtener un mayor nivel de profundidad en el anlisis, mediante la identificacin de los factores ms influyentes {Vila Carro, D. y cols., 1978). Pai-a ello, tratan de
aislar aquellos factores que, aparte de estar relacionados con el voto
de cada uno de los partidos, sean al mismo tiempo independientes entre
s o estn poco interrelacionados. Por lo que respecta al voto de UCD,
el anlisis de correlacin simple haba puesto de manifiesto que la variable histrica presentaba las relaciones ms dbiles con el resto de los
factores demogrficos y socioeconmicos que determinan dicha tendencia de voto; Pues bien, para comprobar la fuerza del hecho histrico se
obtuvieron los coeficientes de correlacin parcial de la variable histrica

Poblacin activa agraria (1975) .. .


Poblacin autctona ................ .
Pes de la clase media urbana . . . ..
Consumo de Kw/mes por hogar ..... .

0,518
0,391
0,439
0,416

Dado que la correlacin entre voto UCD y voto CEDA es del 0,46, los
resultados de la correlacin parcial ponen de manifiesto que al mantener constante la influencia de las variables de poblacin activa agraria,
poblacin autctona, peso clase media urbana o consumo de kW/mes,
no se altera significativamente la relacin original. Los autores interpretan estos resultados del siguiente modo: el voto UCD es un resultado
conjunto de los antecedentes histricos v de una estructura social (contextual) determinada. As lo demuestran los coeficientes de correlacin
mltiple entre la proporcin de votos de la CEDA en 1936 combinada
con cualquiera de los dems factores que definen la estructura social y
la proporcin de votos UCD:
R. ;.,.=0,776
R. hd=0,753

a=Voto UCD.
b =Voto CEDA.
c=Consumo kW/rnes.
d =Poblacin activa agraria.

En este caso, en efecto, se retuerzan los efectos de las variables b y e


o b y d, y el coeficiente de correlacin ve incrementado su valor, pasan
do del 0,4 original al 0,7 actual.

12.7.

TERMINOLOGA

Se recomienda la memorizac1on y comprens1on del significado de


cada uno de los trminos y conceptos siguientes:
-

Factor de prueba, variable de control.


Asociacin de orden cero.
Tablas condicionales, tablas parciales.

368 Socioestadfstica. Introduccin a la Estadstica en Sociologa

-.,.
-

Estadstica descriptiva 111: Tres o ms variables 369

Tablas condicionales de primer orden, de segundo orden.


Frmula de recuento de Lazarsfeld.
Elaboracin de tipo P, o partial.
Elaboracin de tipo A{ o marginal.
Variable antecedente.
Variable consecuente.
Variable interviniente.
Diseos longitudinales.
Diseos de panel.
Interaccin estadstica.
Especificacin.
Explicacin.
Relacin espuria.
Variable ajena.
Variable supresora.
Variable transformadora.
Anlisis del .sistema social.
Anlisis estructural.
Anlisis contextual.
Falacia ecolgica, falacia agregacional.
Falacia atomstica.
Correlacin parcial.
Coeficiente de correlacil} parcial de primer orden.
Coeficiente de correlacin parcial de segundo o tercer orden.

/
Ocupacin
No manual ......
Manual ... ... ...
En paro ............

2.

'f

Or
--

lS
69
lS
(13)

Intermedia o
universitaria

Secundaria

Primaria o menos
11

Or

12

11

13

32

4S
42
(31)

18
(22)

17
67
lS
(37)

9
76
14
(21)

12

Or

12

11

70
26
4
(76)

S8
36
6
(33)

-- -- -- -- -- -- -- -s

70
24
(37)

so

83
17
(29)

En un estudio sobre la opinin de la poblacin respecto de la aprobacin de una ley que regule el aborto, se estableci la hiptesis de
que las posturas afirmativas seran ms frecuentes entre los individuos de clase social elevada que entre los de clase ms baja. Una
encuesta con una muestra representativa de la poblacin ofreci los
siguientes resulta.dos:
CLASE SOCIAL

-~

Opinin Ley Aborto

;;:.
/!

. ,

S ... ........................
No ...........................

Baja

Media

Alta

Total

49
Sl
(383)

46
S4
(189)

so
so

49
Sl
(797)

(22S)

Al estratificar la poblacin segn la preferencia poltica, medida a


travs de la intencin de voto, en partidarios de un partido de derechas y partidarios de un partido de izquierdas, se obtuvieron las siguientes tablas condicionales:

EJERCICIOS
l.

EOl'CACION

En un estudio sobre las oportunidades ocupadonales de la poblacin orhmda y de la poblacin inmigrante en una ciudad industrial,
se obtuvieron los siguientes datos para el conjunto de la poblacin
de la muestra, teniendo en cuenta el nivel de educacin alcanzado
por los individuos. El autor del estudio mantena la hiptesis de que
el tipo de origen de la poblacin --0riunda o inmigrante- condiciona la estructura de las oportunidades ocupacionales. A la vista de
los datos, qu se puede afirmar sobre dicha hiptesis? (Or: oriundo; I2: inmigrante de segunda generacin; 11: inmigrante de primera generacin.)

DERECHA
CLASE SOCIAL

Opinin Ley Aborto

S .......................... .
No .......................... .

Baja

Media

Alta

Total

42
S8
(262)

26
74
(98)

23
77
(102)

34
66
(462)

IZQUIERDA

POBLACION TOTAL

CLASE SOCIAL

Ocupacin

Or

12

[[

No manual ................ ..
Manual ....................... .
En paro .................... .

S2
39
9
(64)

40
48
12
(IS9)

29

so

21
(8S)

Opinin Ley Aborto

S .......................... .
No .......................... .

Baja

Media

Alta

Total

64
36

67
33
(89)

72
28
(119)

68
32
(321)

(113)

370 Socoestadstica. Introduccin a la Estadstica en Sociologa

Estadstica descriptiva 111: Tres o ms variables 371

A la vista de los anteriores cuadros, se puede rechazar o aceptar la


hiptesis? Qu tipo de papel desempea la variable preferencia poltica en la relacin entre clase social y opinin sobre la Ley del
Aborto?
3. Los siguientes datos de 15 ciudades, reflejan los ndices de anomia,
satisfaccin con la vida y movilidad social de las correspondientes
muestras aleatorias y representativas de la poblacin que en ellas
reside:
Indice de
anomia

Ciudad

A
B

... ...

...
D ...
E ...

F
G

...

... ...

...

..

... ...

....

:~

...

H ... ... ...


1 ... ... ... ... .. . ...
J ... ... ... ... ... ...
... ... ... ...
K
L ... ... . ......
M ... ...
N ...
o ... ... ... ...

17,0
15,2
14,8
14,2
13,5
13,4
12,8
12,2
11,7
11,5
10,4
10,3
10,1
9,9
9,8

Indice de
salisfaccin
con la vida
18,6
14,4
21.2

13.4

15,2
23.4
20,8
17,4
15,3
18,7
14,3
22,5
20,6
18,2
12,6

Indice de
movilidad social

14,0
18,2
13,8
17,5
14.6
19,3
16,5
18.6
20,3
16,2
18.3
13,5
16.4
20,1
17,2

a) Calcular la correlacin parcial entre anomia y satisfaccin con


la vida, controlando la movilidad soial.
b) Calcular la correlacin parcial entre anomia y movilidad social,
controlando la satisfaccin con la vida.
4. Seleccionar un modelo terico que se pueda representar mediante
un diagrama de flechas. Explicar cmo deberan utilizarse las tablas
condicionales y los coeficientes de correlacin parcial para contrastar
el modelo. Qu tipo de relaciones cabra esperar de los datos a
la visia del modelo?

BIBLIOGRAFIA
BLALOCK, Hubert M.: Causal lnference in Non-experimental Researc11. Chapel Hill,
U. N. Carolina Press, 1964.
DURKHEIM, Emile: Le Suicide,.Pars, P. U. F., 1960 (e. o. 1987).
GARCIA FERRANDO, Manuel: Deporte y Sociedad, Madrid, 1982 (en prensa).
HYMAN, Herbert H.: Sutvey Desing and Analysis, New York, Free Press, 1955.
LAZARSFELD, P. f;; B. BERELSON y H. GAUDET: The People's Choice, N. Y. Columbia
University Press, 1948.
l.AZARSFELD, P. F. y M. ROSEMBERG (eds.): The Language Qf Social Researc/1, Glence,
1, 11, Free Press, 1955.

LlNz, Juan J., el al foforme Sociolgico sobre el Cambio Polilico e11 Espaia, 19751981, Madridr Euramrica, 1981.
LoEHIF.R, H. J.i y D. E. McTAVISH: Descriptive Statistics fur Sociologists, Boston,
Allvn and Bacon, 1974.
LPEZ GUERRA, Lub: Niveles de Anlisis, falacia ecolgica y falacia contextual,
Revista Espaola de la Opirtin Pblica, 48, 1977, pgs. 69-87.
PARRA, Francisco: uPara qu sirve la teora de sistemas en Sociologfa 1 , Revista
Espaola de lmestigaciones sociolgicas, 15. 1981, pgs. 77-111.
Ru.iv, Matilda Whitc: Sociological Research A Case Approach, New York: Harcourt, Brece & World,. 1963.
RoB1:osoN, W. S., Ecological Corrc!ations and the Behavior of Individuals, Ame
rican Socialogical Review, 15, 1950, pgs. 351-357.
RosNBERG, Morris: Tl1e Lo:ic of Suney Analysis, New York, Basic Books, 1968.
SNCHEZ CARRTN, J. J.: Anlisis de Tablas de Contingencia, en J. J. Snchez Carrin (ed.), Introduccin a las Tcnicas de Anlisis multivariable aplicadas a las
Ciencias Sociales, Madrid, C.J.S:, 1984, pgs. 267-294.
SELVIN, Hanan C.: Durkeim Suiide and Problems ol Emprica! Social Research,
American Journal of Sociolo;y, vol. 63, 1958, pgs. 607-619.
VILA CARRO, D.; F. A. RIZO y M. G. REINO: Sociologa del Actual Cambio Poltico
en Espaa, en varios, Sntesis actualhada del 111 lnforme FOESSA. 1978, Madrid, Euramrica, 1978, pg. 681-731.
ZEISEl., Hans: Dgalo con ndmeros. Mxico, F. C. E .. 1962 .