Está en la página 1de 14

b Q/\,OM.~ I llw-\ 'S Cet~Jtle<Á 1 W,_d lJ ~ \ J._ cl.J;; .

T AADl,{tdu,c:l'!.~ ~ oJL ,U;~ ol.L ' le' c_v\,\ U:.v\ Cu.oA:E\,Q, \) \JtG4 u

1\99 ?._; ' «Otra peculiarüfaá tÚ f.os áatos científicos es que, pese. a
{a etimofogía áe fa pafaóra 'áato', no son naáa áaáo,
sin.o que fia!t que proáucirfos, !I mucfias 'l1eces
la6oriosamen.te». ('!Junge; 1979)

l « ¿ Qué es un dato?», es la pregunta a la que quisiéramos responder en este


primer capítulo. Intentaremos mostrar así como la estructura de cualquier dato es
esencialmente el producto de un acto clasificatorio. acto cuya simplicidad es sólo
aparente. Lejos de sernos inmediatamente "dado" -como lo sugiere
engañosamente la etimología-, el dato presupone toda una serie de operaciones
que se llevan a cabo en forma simultánea dentro de un sistema conformado por
múltiples dimensiones. De este modo, el dato más elemental ya conlleva toda una
serie de elecciones teórico-metodológicas. Y es que desde el punto de vista que
se sostiene aquí, el dato es eminentemente racional: no se "ve" más que lo que ya
se está dispuesto a ver.1

Comenzaremos procediendo a un ejercicio de disección de la naturaleza del


dato, mediante el cual estaremos en condiciones de aislar sus elementos
constitutivos. La exposición algo dogmática de una serie de definiciones nos
permitirá establecer las relaciones sistemáticas por las que se vinculan unos a otros
los conceptos de 'sistema' y 'unidad de análisis', 'propiedades' y 'medición',
'variables' y 'valores'. Para ello, r1os valdremos de ejemplos muy sencillos y
deliberadamente no sociológicos. Al término de este trabajo analítico, el dato
deberá aparecer como el producto de la imbricación de dos estructuras: la que
permite atribuir una propiedad a un objeto, y la que posibilita estructurar
sistemáticamente conjuntos de propiedades.

1 Desde la tradición epistemológica francesa (Cf. Bachelard, 1972 y 1986) esto es una
obviedad. En la vereda opuesta, el positivismo lógico (Cf. Ayer, 1965) sostenía la
posibilidad de un lenguaje observacional puro dentro del cual era factible formular
enunciados que permitieran dirimir acere.a de la verdad--falsedad de una hipótesis . En el
mundo anglosajón, hubo que esperar hasta Kuhn (1969) para que se pusiera radicalmente
en cuestión la reconstruc.ción positivista. ,/'J. 9...
2 Construcción y análisis de datos La estructura de los datos 3

1. UNIDADES DE ANÁLISIS, VARIABLES, VALORES serían sistemas . Es evidente que, por definición, la variedad de sistemas que
pueden distinguirse no tiene límites.: \Jna célula es un 'sistema·, y también lo son
un auto, un alumno, un libro o una galaxia. A su vez, cada sistema puede ser
Según nos dice Galtung, 2 todo dato hace referencia a una estructura constituida caracterizado por toda una serie de propiedades·
por tres elementos: unidad de análisis, variable y valor . Cualquier dato aislado
consistirá pues en .. un auto en particular podrá ser rojo,
caro,
a) una unidad de análisis que veloz,
antiguo.
b) en una variable específica presentará etc.
c) un determinado valor.
Sin embargo, observemos desde ya que no todas las propiedades son
Lo que constituye el dato son estos tres elementos considerados aplicables a todos los sistemas. No tendría sentido pensar en un libro ·veloz·, así
conjuntamente con las relaciones que mantienen entre sí Sea Gual sea nuestro como carecería de significado hablar de una galaxia 'cara' (al menos para nosotros,
objeto de estudio, si queremos sostener cualquier proposición empírica acerca de aquí y ahora) Esta es una simple consecuencia del hecho de que un dato deba
él, se lo deberá concebir en términos de esa estructura tripartita. 'Unidad', 'variable' expresarse en una proposición, vale decir en algo que necesariamente habrá de
y ·valor' son todos términos que denotan determinados tipos de conceptos. ser verdadero o falso. Así el enunciado «este libro es veloz,, no haría referencia a
ninguna proposición. 5
Una sencilla aproximación desde la lógica puede permitirnos echar algo más de
luz sobre su significado. partiendo de las categorías clásicas de ·sujeto' y Cuando a partir de la observación de un sistema predicarnos una propiedad,
'predicado' La idea más elemental de lo que es un dato puede ejemplificarse a podemos decir que estamos realizando una medición.6 Lo fundamental es que
partir de un enunciado muy simple «ese sillón es rojo" Se puede reconocer en los sistemas no son jamás medidos en sí mismos sino que lo que medirnos son
este enunciado un sujeto ("sillón") y un predicado ("rojo"); también podemos decir siempre propiedades de los sistemas; es así que estamos en condiciones de
que al hacer esta afirmación estamos denotando una determinada propiedad de producir una nueva definición
un objeto Lo mismo sucede cuando sostengo, por ejemplo, que "Rórnulo es
argentino" 'argentino' es una propiedad que se predica del sujeto de la oración un @l@'ll@ es el producto de un procedimiento
("Rómulo"). Ahora bien, las fórmulas «ese sillón es rojo» y «Rómulo es argentino» de medición, y lfüil@@lllU' supone predicar una
consisten simplemente en enunciados que se refieren respectivamente a propiedad.
diferentes proposiciones. 3 Por lo tanto, es posible establecer desde ya que
Encontramos ejemplos de datos muy simples en enunciados del tipo

«Este auto es .. rojo.»,


Torgerson (1965) propuso el uso del término 'sistema· para denotar todo tipo de «Esa galaxia es. .... lejana",
objetos o de "cosas", así ,en nuestros ejemplos. tanto 'ese sillón' corno 'Rómulo' «Este libro pesa .. . 358 gramos ,, ,
etc.

2 Cf. Galtung, 1968: 1, cap 1 Es desde este punto de vista que se puede afirmar que el conocimiento
3 Es importante tener en cuenta esta distinción que establece la Lógica Asi, «ese sillón es científico consiste en la identificación de sistemas de determinadas clases, en la
rojo,, y «Ce tauteuil est rouge» son ciertamente enunciados diferentes, pero ambos hacen medición de sus propiedades, y en el establecimiento de relaciones entre dichas
referencia a la misma proposición . Según Copi, "Se acostumbra usar la palabra
'proposición' para designar el significado de una oración declarativa ( ) Una oración
declarativa forma siempre parte de un lenguaje determinado, el lenguaje en el cual es 5 «Para los fines de la lógica, puede definirse una proposición como algo de lo cual es
enunciada, mientras que las proposiciones no sonpropias de ninguno de los lenguajes en posible afirmar que es verdadero o falso" (Cf Cohen y Nagel. 1968 t. 41) Convendrá notar
los cuales pueden ser formuladas» (1962: 21 ).. · .·.•· que esto abre la posibilidad de que existan datos falsos: asi contrariamente a lo afirmado
4 Según Bunge, «Las ideas que expresan el resultado de una fase de observaciones son un con anterioridad, lo cierto es que «(mi amigo) Rórnulo es uruguayo . "
conjunto de datos. Un dato es una proposiéión singular o existencial como, por ejemplo, 'Se 6 Al menos impllcitarnente; puesto que la simple afirmación de la propiedad es lógicamentE?íl'
inyectó a la rata# 13 1 mg de nicotina el primer día'» (1979: 742) equivalente a la negación de la no-propiedad. _,/ fJ O
/
4 Construcción y análisis de datos La estructura de los datos 5

propiedades. Por lo demás. es obvio que en ciencias sociales no nos interesan Se pueden imaginar fácilmente sistemas que no satisfagan algunas de estas
todos los sistemas, ni tampoco todas sus propiedades. De hecho. sucede que propiedades: una avioneta Piper o una lancha no "caminan". una bicicleta no es
precisamente puede entenderse que lo que diferencia a las disciplinas científicas "movida por un motor de explosión", etc. ·
unas de otras son en gran medida los tipos de sistemas de los que se ocupan y las
i
propiedades de dichos sistemas que toman en cuenta. 7 ) Lo que queremos remarcar, entonces. es que no solamente existen sistemas
r de los cuales es posible predicar propiedades. sino que los sistemas mismos son
Por otra parte, basándonos en determinadas propiedades podemos referirnos a susceptibles de ser definidos en última instancia a partir de una determinada
clases de sistemas: combinación de propiedades. Mucho "antes" de ser rojo, un ·auto' es auto en
tanto presenta determinadas propiedades . Podríamos pensar que todos los
las galaxias lejanas. sistemas se dividen en dos clases "Vehículos" y "No-vehículos"; que algunos
los autos O kilómetro, de los vehículos "caminan" mientras otros no lo hacen, y que sólo algunos de
los libros de Sociología, estos últimos son "movidos por un motor de explosión"·
los alumnos de Metodología,
etc . Figura 1: Tipos de sistemas
Sistemas
También de estas clases de sistemas podemos predicar propiedades:

«Los autos O km. son caros». No-vehículos


/1 Vehículos
«Las galaxias lejanas son diffciles de observar»,
«Los libros de Sociología son aburridos,,
«Los alumnos de Metodología son sabios ,, . Navegadores/ 1 " " Voladores
Caminadores
etc

Así como existen autos de diversos colores. también existen lápices. flores, Sin motor
/1 Con motor
libros y cielos de distintos colores . Todos concordaremos sin embargo en que un
auto no es ni un lápiz ni una flor. ni un libro ni un cielo Si queremos saber qué es
No-autos
/1 A utas
un auto podemos recurrir al Larousse usual " Vehículo que camina movido por un
motor de explosión» Todos coincidiremos en que un lápiz no "camina", en que
una flor no es un "vehículo", y en q1.i1e los libros y cielos no son "movidos por un A partir de las nociones de "sistema" y de "propiedad". podemos establecer los
motor de explosión". Es imposible que confundamos un auto con un lápiz. porque conceptos de "universo" (y. correlativamente. el de "muestra").ª "unidad de
de algún modo poseemos definiciones de estos objetos; sabemos que un auto análisis'', "variable". y "constante". Estos términos cobrarán un sentido específico
se define por determinadas características tener cuatro ruedas. un volante. cuando se los considere dentro de una estructura definida en un determinado
asientos y una carrocería, y ser capaz de llevarnos con relativa -y cada vez nivel de inclusión Así. podemos reconocer en el "Universo" el nivel de mayor
menor- seguridad de un punto a otro de la superficie terrestre, rodando por los inclusión posible. que se compone de todos los sistemas existentes. de todos los
caminos. En otras palabras, el sistema 'auto' se caracteriza por presentar que han existido y existirán. en este nivel se incluyen también -al menos
determinadas propiedades, a saber potencialmente- todas las propiedades posibles Ahora bien. apelando a
determinadas propiedades podemos definir sub-universos -o. simplemente.
"ser vehículo ", "universos" - dentro de este "Universo" mayor en un número ilimitado . Por
ejemplo. es posible definir el universo de los "vehículos" Los vehículos son
"caminar", sistemas que permiten desplazar a otros sistemas (y también a sí mismos) de un
"ser movido por un motor a explosión ", punto a otro del espacio: se los define por poseer la propiedad de ser "medios de
locomoción".9 Se los puede distinguir así de todos los otros sistemas en los que
"tener cuatro ruedas ", no reconocemos la propiedad de funcionar como medios de locomoción Todos
etc.
8 Cf . lnfra, capítulo 111
7
O, para decirlo de otra manera, las ciencias se diferencian por sus "objetos" 9 Larousse dixit
Construcción y análisis de datos La estructura de los datos 7

los vehículos comparten esta propiedad de ser "medios de locomoción": para esta los sistemas que corresponden a un nivel de inclusión dado conforman un
clase de sistemas. el ser "medio de locomoción" es una constante. Notemos que universo. y que cada uno de estos sistemas que componen dicho universo _es
en el nivel de inclusión inmediatamente superior -el Universo- no todos los susceptible de ser considerado como una unidad de análisis. Ello nos permite
sistemas son "medios de locomoción"· en ese nivel superior dicha propiedad definir:
funciona como una variable .
Una !lllUUn@l@@I @!@ @@~UO@O@ es un sistema definido por presentar
Podemos continuar definiendo universos de menor nivel de inclusión. Así determinadas (FllJ'@[Fltl@@l@@I@@, algunas de ellas ©@Uil@ll@Uilll@@ (las
tendremos el universo de los vehículos "caminadores" (que se diferencia de los que definen su pertenencia a un universo compuesto por
universos de los vehículos "voladores" y "navegadores"); a su vez, dentro del todos los sistemas que presentan esas mismas propiedades)
universo de los vehículos caminadores. definimos el de los "movidos a motor". y y otras W@lJ'O@!:M@@ (las que podrán ser materia de investigación
dentro de éste. el universo de los autos. La Figura 11. permite apreciar cómo cada dentro de ese universo).
universo 1 O está definido por una serie de propiedades constantE\s y se
corresponde con un determinado nivel de inclusión. Todo nivel de inclusión Disponemos ahora de una primera definición de lo que es una 'variable',
inferior requiere para su definición a partir del nivel inmediatamente superior tomar entendida como un determinado tipo de propiedad, a partir de los conceptos de
como constante al menos una propiedad; y viceversa; al pasar de un nivel de 'unidad de análisis' y de 'universo'. En lo que sigue. nos proponemos continuar
inclusión menor a otro superior aumentará el número de propiedades variables. elucidando este concepto de 'variable', para lo cual deberemos introducir una
nueva idea: la de 'valor' .
Figura 11: Ejemplo de definición de universos en base a
propiedades constantes y variables
La siguiente definición de Galtung es un buen punto de partida para esclarecer
las relaciones que median entre los tres elementos constitutivos del dato:
/' .....
PROPIEDADES ccDado un conjunto de unidades, un w@íl@U' es algo que puede
UNIVERSOS Medio en que Medio de pr,edicarse de una unidad, y una W@l?tl@lQJíl@ es un conjunto de
Medio de Número
locomoción se desplaza impulsión de ruedas valores que forma una clasificación.» 11

Sistemas Variable Variable Variable Variable De acuerdo a lo que se ha venido exponiendo, no debe haber ninguna dificultad
en reconocer de inmediato que un ·valor' es simplemente una propiedad. Ahora
, bien, hemos dicho que una variable también es una propiedad; ¿Significa esto que
Vehículos Constante Variable Variable Variable 'valor' y 'variable' son dos términos que denotan el mismo concepto, el de
'propiedad'?. En absoluto .
Vehículos Constante Constante Variable Variabte
caminadores Cuando enunciamos «Este auto es rojo», ¿ En qué sentido es posible hablar
Vehículos de "medición"? Solamente en tanto ésta propiedad 'rojo· se encuentre definida
caminadores Constante Constante Constante Variable por su lugar dentro de una estructura que le confiera un sentido. A~~ la E'.structura
::¡ mntnr
más simple en la que podemos pensar se basa en una relac1on simple de
oposición·
Autos Constante Constante Constante Constante
rojo versus no-rojo

De este modo afirmar que el auto es rojo equivale a afirmar que dic~o auto no es
En cualquier nivel de inclusión que se tome, las propiedades aparecerán no-rojo: la afirmación de la propiedad es al mismo tiempo la negac1_6n de la no-
jugando entonces un doble papel: algunas de ellas, tornadas como constantes, propiedad . Podríamos introducir un término para denotar esta propiedad -~l _de
estarán definiendo un universo, mientras que otras funcionarán como variables y 'rojidad.. "- que denotaría una variable. entendida ahora como una caractenst1ca
podrán ser objeto de investigación. Podemos ahora introducir la idea de que todos

1 O Excepto, claro está, el primero de todos: el "Universo de todos los sistemas". 11 Cf. Galtung, 1968: 1, 78.
8 Construcción y análisis de datos La estructura de los datos 9

susceptible de adoptar diferentes valores ("sí" y "no") . Cualquier unidad de análisis 'variable'. 'Variable' y 'valor' aparecen pues como conceptos bien distintos. aun
de la cual se pudiera predicar con sentido la rojidad presentaría en esta variable el cuando se encuentren estrechamente relacionados. Un valor es parte de una
valor "sí" o el valor "no". Así como podríamos medir la longitud de un auto («este variable, no existe sino _por las relaciones que guarda con los otros valores que
auto mide 427 cm ... ), así también mediríamos su 'rojidad': componen esta variable. A su vez, una variable no es otra cosa que el conjunto de
los valores que la conforman y de las relaciones que éstos mantienen entre sí.
«Este auto presenta el valor "sí" en la variable rojidad,.
(o. para decirlo más simplemente: «Este auto es rojo»). Las variables correctamente construidas deben necesariamente satisfacer los
requisitos demandados a cualquier clasificación: los valores que las compongan
De este modo, podemos establecer que: deberán en cada caso ser exhaustivos -en su conjunto-. y mutuamente
excluyentes. Así como la hemos construido, nuestra variable 'color' es
una \17@fi'Orur9lO@ es un conjunto estructurado de valores12 imperfecta: un auto rosado no encontraría ubicación en ningún valor; nuestra
clasificación no es exhaustiva, y requeriría del agregado de otros valores (o.
Ahora bien. el término 'rojo' también puede definirse por su pertenencia a una categorlas). En cambio, sí resultan mutuamente excluyentes las categorías (o
estructura algo más compleja; dentro de esta estructura, el 'rojo' se definirá como valores) que la componen: cualquier persona de cuatro o más años en nuestra
tal por no ser ni marrón, ni verde, ni amarillo, ni blanco, ni naranja, ni azul. ni cultura dispone de un sistema de reglas que le permite aplicar correctamente estos
violeta, ni negro. 'Rojo' puede aparecer ahora como un valor de una variable a la valores.
que podríamos denominar 'color', y en la que se opone a toda una serie de otras
propiedades que constituyen otros tantos valores posibles de esa variable.
2. NIVELES DE MEDICION
Figura 111: Ubicación de "rojo" dentro de una
estructura de oposiciones
Puesto que las variables no consisten en otra cosa que en un conjunto de valores
vinculados unos a otros por relaciones de diferente tipo. una base fundamental
verde para la clasificación de las variables es la que se encuentra en el tipo de relaciones
marrón amarillo que mantienen entre sr sus valores. Dicho de otro modo, las variables pueden ser
muy diferentes en cuanto a su estructura interna. La importancia de esta distinción

~/
es crucial. porque las estructuras constitutivas de las variables determinan
totalmente el tipo de operaciones a las que pueden ser sometidas

Remitiéndonos a la clásica distinción entre ciencias fácticas y ciencias


negro ro j o blanco formales.13 recordemos que Bunge destaca el rol instrumental de las ciencias

violet~ ~aranja
formales; es en este sentido que se puede decir que todas las ciencias fácticas
recurren a la Lógica y todas tienden at.uso de las Matemáticas.1 4 La razón principal
para ello es que las matemáticas pueden ser vistas como un arsenal de modelos de
distinto tipo aplicables a la materia de cada una de las disciplinas que versan sobre
la naturaleza o la sociedad. A partir de la formalización de determinados aspectos
azul que hacen a los objetos reales de las ciencias. el uso de las matemáticas habilita
para operar simbólicamente sobre los objetos de conocimiento, con toda la
ganancia en eficiencia y precisión que ello entrar.a para la práctica científica.

Los nombres de colores incluidos en la Figura 111 constituyen "un conjunto de


valores que forma una clasificación", vale decir, lo que Galtung define como 13 Cf. Bunge, 1968: capítulo 1.
12 Para Frege, uno de los padres de la moderna Lógica, .. una variable es un signo que, en 14. Puede cuestionarse este rol "instrumental" de las matemáticas con respecto a las
ciencias fácticas. Así, según Althusser (1985: 31 y ss. ) el papel de las matemáticas en la
lugar de tener un designado fijo, "recorre" un espectro de posibles designados, y la Física era constitutivo antes que meramente instrumental: la Física es impensable sin el
determinación de un designado particular consistirá en la asignación de un valor para esa cálculo. Empero, aún desde esta perspectiva. las matemáticas son distintas de la Física,
variable,. (Cf. Lungarzo, 1986: 1, 36). en tanto existen con independencia de ésta y se utilizan en otras disciplinas .
/83-
La estructura de tos datos
11
Construcción y análisis de datos

( .. ) se busca que el modelo matemático sea isomórfico con el concepto; esto es,
Ahora bien, al decir de Blalock, «el empleo de un determinado modelo que la 'forma' del modelo sea idéntica a la 'forma' del concepto» (Padua, 1979:
matemático supone que se ha alcanzado un determinado nivel de medición» . 15 154).
Es decir que la posibilidad de hacer uso de modelos matemáticos está
dependiendo de que se hayan desarrollado procedimientos de medición Al hablar de niveles de medición se está aludiendo ya a la existencia de una
satisfactorios. Desde este punto de vista, no es del todo errónea la idea que lo que jerárquía entre los modelos matemáticos aplicables a los objetos; Y es gi.:e. en
distingue a las ciencias sociales en general de las ciencias de la naturaleza efecto, los hay más poderosos que otros . Presentaremos a continuac1on las
globalmente consideradas son los distintos niveles de medición en que operan características básicas de los cuatro niveles distinguidos por Stevens,
predominantemente unas y otras . 16 Por supuesto, existen también diferencias '-Y comenzando por el más bajo de ellos
no menores- dentro de estos dos grandes conjuntos <::Je disciplinas. Así, la
Economía se nos aparece como una ciencia social esencialmente cuantificadora. Nivel nominal
que nos habla permanentemente en números. horas de trabajo, toneladas de
producto. valor en pesos, etc . : ha avanzado mucho más que la Sociología en La operación más básica y a la vez más sendlla de toda ~iencia es la
dirección hacia la cuantificación.. 17 claslflcaclón. Al clasificar, agruparnos nuestras unidades de análisis en clases
mutuamente excluyentes basándonos en sus semejanzas y diferenci~s De este
A partir del clásico trabajo de Stevens de 1951, 18 es corriente considerar que modo obtenemos una escala nominal, que corresponde al nivel mas bajo de
existen cuatro distintos niveles de medición nominal. ordinal, intervalar y medición. y que es a su vez una condición necesaria que deben satisfacer los
racional. 1 9 Algunos autores definen a la medición corno el proceso de asignar niveles más elevados . El requerimiento fundamental para construir una escala
números para representar cantidades, 20 y excluyen de este modo el nivel nominal. nominal es que se puedan distinguir dos o más categorías significativas Y _que se
Otros. a cuyo criterio nos atendremos, no consideran que la cuantificación sea una establezcan los criterios según los cuales los individuos, grupos. objetos o
condición necesaria para poder hablar de 'medición'. Así, por ejemplo, se puede re~;.,puestas serán incluidos en una o en otra categoría Las -~ategoría~
definir 'medida' como «Cualquier procedimiento empírico que suponga la -exhaustivas y mutuamente excluyentes- no mantienen otra relac1on entre s1
asignación de símbolos, de los cuales los numerales son solamente un tipo, para que la de ser distintas unas de otras: sobre todo no existe implicación <:tlguna de
los objetos o sucesos que concuerdan con las reglas previamente que puedan estar representando una cantidad mayor o menor de la propiedad que
establecidas» 21 Lo cierto es que la operación de medición será posible solamente se está midiendo.
en tanto y en cuanto se pueda determinar una cierta correspondencia entre las
características discernibles de nuestros objetos de estudio y las propiedades de En ciencias sociales son muchas las propiedades que se encuentran definidas
los modelos matemáticos que les sean aplicables. Según resumen Padua y nominalmente: sexo. estado civil, nacionalidad, religión, afiliación partidaria. etc Es
Ahrnan «La medición, de hecho, corresponde a una serie de teorías <;onocidas cierto que nada prohibe la utilización de números para identificar las diferentes
como niveles de medición detr'ás de cada uno de los distintos niveles de categorías, codificando por ejemplo 'masculino' como '1' y 'femenino' como '2'.
medición están operando una serie de principios lógicomatemáticos, que van a pero es esencial comprender que aquí los números no funciona~ _como tales. en t:;l
determinar o no el isomorfismo entre un concepto y el nivel de medición apropiado sentido de que no autorizan el empleo de las operaciones antmet1cas ~sual~s As1.
carecería de sentido sumar los códigos que presenten en la variable sexo todos
15 Ct H Blalock, 1966 29 . los integrantes de un grupo familiar. del mismo modo que resultaría disparatado
16 Ct , por ejemplo, Torgerson (1965) sumar sus números de documento de identidad. pero sí en cambio la suma de sus
ingresos mensuales en pesos tendría un significado claro En el nivel nominal, si
17 Como lo demuestra a contrario el estudio de las sociedades primitivas, esta posibilidad
de cuantificación de la Economía está directamente ligada a una característica histórica de utilizamos números les hacemos cumplir la función de meros nombres que nos
su objeto real. la aparición del dinero como medio de intercambio generalizado y la permiten identificar las categorías designándolas de modo difere_~te La operación
reducción de todas las mercancías, fuerza de trabajo incluida, a una base común producida de medición queda por lo tanto limitada a referir una observac1on a una clase: o
por la generalización del modo capitalista de producción categoría para luego poder contar cuántos c~sos cae~. dentro de cada cat99ona;
18 Reproducido en la compilación de Wainerrnan (1976) Esto limita severamente las operaciones estad1st1cas utilizables que no van mas alla
19 Coombs (en Festinger y Katz. 1976) distingue seis niveles o escalas del número de casos, el cómputo de porcentajes, el modo, el cálculo de algunos
20_ Así, Bl~lock defin6_ " Por medición, nos referimos al proceso general por el que se coeficientes de asociación en tablas de contingencia (Q. Phi, etc.) y de la ch1-
asigna~ numeras a ob¡etos de tal modo que queda establecido qué tipo de operaciones cuadrada.
~ternat1cas pueden ser utilizadas legitimamente, dada la naturaleza de las operaciones
fls1cas que se han usado para justificar o racionalizar dicha asignación de números a
objetos .. (1982 11)
21 Cf. C. Selltiz eta/., 1965:. 215
12 Construcción y análisis de datos
La estructura de los datos 13

Nivel ordinal ocurre en Física con las escalas de temperatura Celsius y Farenheit. En estas
escalas, las unidades representan cantidades iguales de cambio en el volumen de
una columna de mercurio bajo una determinada presión . Así, es posible afirmar por
. ~n este nivel_ apa~ece la idea de orden. No sólo se puede distinguir entre ejemplo que entre O C. y 10 C. existe la misma diferencia de temperatura que
distintas categonas, sino que es además posible afirmar si una unidad de análisis
entre 1 O C. y 20 C .. vale decir. 1O grados Celsius en ambos casos. Pero subsiste
~s~e en mayor, en !gual o en menor grado que otra la propiedad que se está
todavía una limitación que deviene de la ausencia de un punto cero absoluto y
m1d1endo. As~. por ejemplo, en la escala de la jerarquía militar no solamente
que hace que las operaciones de multiplicación y de división carezcan de sentido,
~demos ~ec1r que un capitán, un teniente y un sargento son diferentes entre sí,
con lo que las proporciones resultan también carentes de significado. Tratando con
sm~ que dichas categorías pueden ordenarse con respecto a la autoridad que
reviste cada uno de esos grados: una escala meramente intervalar como la de Celsius, no puede sostenerse que una
temperatura de 20 C. sea el doble de una de 1 O C.. Debido a la arbitrariedad del
punto cero en la escala Celsius -la temperatura de congelamiento del agua- no
Capitán > Teniente > Sargento es posible formular este tipo de relaciones. 23 Para la mayoría de las variables en
ciencias sociales no existen procedimientos de medición que garanticen tan
Pero lo_ gue no podemos determinar con exactitud es cuanta más autoridad tiene siquiera la igualdad de intervalos: Thurstone no se equivocó al denominar a su
un cap1t~n que un teniente. ni si la diferencia entre éstos es menor o. mayor que la escala "de intervalos aparentemente iguales". En este nivel se amplían
que m_e~~a entre los grados de sargento y de teniente.. « Una escala ordinal define sustancialmente los estadísticos aplicables. que incluyen ya a la media aritmética. la
~a Pc:>s1c1~n relativa de objetos o individuos con respecto a una característica, sin variancia, diversos modelos de regresión, y el coeficiente producto-momento de
1mphcac1on alguna en cuanto a la distancia entre posicionesn.22 La escala de Pearson.
dur_eza de Mo~s. que se aplica a los minerales. es un clásico ejemplo de escala
ordinal en las ciencias de la n;:¡turaleza. Nlvel raciona!

En ciencias so_cia~es las var_iables medidas en el nivel ordinal son muy También es llamado nivel 'de razones' o 'por cocientes' se alcanza al producir
numer?sas los indices ~e. nivel e_conómico-social (NES), el prestigio una escala de intervalos que cuenta con un punto cero absoluto. Es solamente en
oc':'pac1onal. el grado de rad1cahsmo polltico o de nacionalismo. la religiosidad, etc. este njvel que se justifican afirmaciones del tipo «A pesa el doble que s ... o bien
A~1. es frecuente que los NES se ordenen de 1 a 7, sin que ello signifique que los «Yo gasté la mitad que vos». En Física, son numerosas las escalas definidas en
num~ros func1~:>nen plenamente como tales. puesto que sólo representan este nivel· distancia en metros. intervalos de tiempo en segundos. medidas de
r~l~c1ones del tipo 'mayor qu~· o 'men_~r que' Puede afirmarse que el NES 7 es peso. mas. velocidad. resistencia eléctrica. etc.
distinto del NES 6, puede_ decirse tamb1en que el NES 7 es más alto que el 6: pero
no pod~mos saber s1 la d1ferenc1a antre ambos es igual a la que separa el NES 2 Empero. la distinción entre escalas de intervalos y de razones resulta irrelevante
del _1. ni ta~P:<JCO podremos sostener que el valor 4 representa el doble de status las más de las veces. Según Blalock. " esta distinción es puramente académica.
soc1o~conom1~.º que el 2. No obstante ello, se amplían en este nivel las medidas ya que es extremadamente difícil encontrar una escala legítima de intervalos que
esta~1st1cas ut1hza~les; además ~e las apl!cables a escalas nominales, se agregan la no sea al propio tiempo una escala de proporciones. Esto se debe al hecho de
mediana. los cuart1les y percent1les, coeficientes de correlación de rangos como el que. una vez establecida la magnitud de la unidad. es casi siempre posible
de Spearman, etc. concebir cero unidades. pese a que··nunca podamos hallar un cuerpo que no
posea largo o masa. u obtener una temperatura de cero absoluto. Así pues.
Nivel intervalar prácticamente en todos los casos en que se dispone de una unidad. será legítimo
emplear todas las operaciones de la aritmética. incluidas las raíces cuadradas. las
Cuando se alc::anza_ a cor:istruir una escala de intervalos iguales, no potencias y los logaritmos» ( 1966: 27)
solan:i~nte es posible d1f~~enc1ar Y. ordenar las unidades de análisis, sino que
tamb1e~ se pued~ espec1t1car _la distancia que separa a unas de otras en una De acuerdo a esto. a todos los efectos prácticos podemos manejarnos
~etermina?a prop1edac:1 Este nivel de medición requiere que se establezca algún reteniendo la distinción entre los tres niveles que aparecen en el cuadro sintético
tipo c:te unidad de med1~a que pueda ser considerado por todos como una norma siguiente. Habrá que tener presente siempre que los niveles superiores
c~mun Y q':le sea repetible, esto es. que se pueda aplicar indefinidamente a los presentan. además de las propiedades que les son propias. todas las
mismos objetos produciendo los mismos resultados. Para el caso, ello es lo que
23 Esto se hace evidente mediante el sencillo expediente de expresar estas mismas
22 Definición de Selltiz et al. (1965: 219). temperaturas en grados Farenheit (mediante la fónnula: F= 1,8 C + 32) oon lo que la relación
no se mantiene: 68 F. no es ciertamente el "doble" de 50 F..
Construcción y análisis de datos 15
La estructura de los datos

características que pertenecen a los niveles inferiores . Así, por ejemplo, a una
deberían llegar con el tiempo - ¿ cuánto más?- a mediciones intervalares de
variable de nivel intervalar 9omo el ingreso mensual en pesos. se le puede aplicar
todas las propiedades fundamentales de s4s objetos. ¿O, por lo contrario, es que
-además de la media aritmética- la mediana y el modo aunque, por cierto, al
existe una característica intrínseca a dichos objetos que limita las posibilidades de
precio de una gran pérdida de información.
cuantificación?26 No existe una única respuesta a estos interrogantes. Si se
Figura IV: Resumen de características de los niveles de medición
atiende a la dimensión simbólica de lo social, a la importancia del significado
atribuido por los actores a sus acciones. a la representación que se hacen de las
relaciones sociales como un elemento que las constituye como tales, entonces
/ Nivel Operación Medidas Ejemplos ........ puede carecer de sentido proponerse la medición de ciertas variables en un nivel
de estadísticas de más elevado que el que se plantean estos mismos actores. Así. para dar un
básica
medición admisibles ejemplo burdo, el valor peculiar que puede revestir el color 'rojo' en nuestra cultura
variables
-- política es algo que no mantiene ninguna relación con su longitud de onda. 2 7 Es
Nº de casos, Sexo, decir, propiedades medibles en un nivel intervalar pueden funcionar socialmente
Nominal Clasifi.cación. Modo, Estado civil, en un nivel puramente nominal. 28
(a""' b) %, Q, Phi, A filiación política,
Gamma, Nacionalidad. Por otra parte, y para finalizar, también es frecuente que se produzca el caso
chi-cuadrada Religión inverso, cuando a propiedades nominalmente definidas se les puede atribuir un
Mediana, NES, significado ordinal. Sin ir más lejos, es lo que ocurre con la variable 'ocupación',
Orden de las cuyas diferentes variedades distinguidas nominalmente son susceptibles de ser
Ordinal percentiles, Nacionalismo,
categorías ordenadas según niveles de prestigio . 29 Análogamente. es corriente que en la
cuartiles, Religiosidad,
(a> b) confección de muchos índices se parta de propiedades clasificatorias a las que. a
Rho (Spearman) Actitudes los efectos de la elaboración del índice, se les confiere un determinado valor
DistariCia entre Media aritmética, Edad en años, numérico. Esto supondrá siempre ordenar las categofilas de acuerdo con algún
lntervalar categorías Varianza, Ingreso en $, criterio, con lo que la propiedad dará lugar a la generación de una variable de nivel
(a + b = c) r (Pearson) Tasa de suicidios ordinal .
'--
Algunos autores consideran que el subdesarrollo de las ciencias sociales
obedece precisamente a la falta qe medidas definidas en un nivel racional. Y es
que, según S~lltiz. «El descubrimiento de relaciones precisas entre características,
tal. como ha sido expresado en leyes numéricas. depende en buena parte de la
ex1stenc.1a de esc~las_ de razones» (1965: 225) . Lo que se observa justamente en
la h1stona de la c1enc1a es como se ha ido progresando de un nivel a otro . Como
señala .stevens, «Cuando los hombres conocían la temperatura sólo mediante
sensaciones, cuando las cosas eran sólo 'más calientes' o 'más frías' que otras, la
temperatura pertenecía al tipo ordinal de escalas. Se convirtió en una escala de
26 Según Passeron, tal subdesarrollo no responde a problemas de medición, sino a una
intervalo con el desarrollo de la termometría, y después que la Termodinámica conformación epistemológica insuperable de las disciplinas que denomina "ciencias del
utilizó la razón de expansión de gases para extrapolar a cero, se convirtió en una curso del mundo histórico" en las que «Las constataciones se dan en un contexto que
escala de razón» 2 4 Análogamente, la distinción entre los colores de los objetos puede ser designado pero no agotado por un análisis finito de las variables que lo
que ~e~izamos corrientemente en un nivel nominal, 25 desde la Física puede ser constituyen y que permitirian razonar ceteris paribus... (Passeron, 1991: 25).
considerada como una escala de intervalos: se trata de la reflexión de la luz en 27 Sólo pretendo ilustrar la escasa importancia de la "objetividad" de ciertas
diferentes longitudes de onda. caracteristicas, cuando su única función es de la ser soporte de significaciones para los
actores. Una discusión en buen nivel de este problema más general puede encontrarse en
Ahora bien, cabe preguntarse si las ciencias sociales, hoy subdesarrolladas, la obra de Cicourel (1982: capítulo 1).
28 Integradas a sistemas clasificatorios que se estructuran en base a oposiciones simples:
24 Cf . Articulo reproducido en Wainerman (Ed.), 1976: 64 "rojo/blanco", "trio/caliente", etc.
25 Aunque de modo variable en culturas diferentes 29 Más estrictamente, deberíamos hablar en este caso de un único objeto -la
'ocupación'- del que podemos predicar varias propiedades (calificación, prestigio. etc.)./JC:-
112 Construcción y análisis de datos

Nos detenemos en este punto, dado el nivel elemental en que está planteado
este texto. El análisis de datos requiere sin embargo de otras técnicas que están
más allá del objetivo que n9s fijamos aquí . Sobre todo, ya se trate de tablas de
contingencia o de distribuciones multivariantes, es esencial poder acometer el
análisis simultáneo de más de dos variables

Para las tablas de contingencia, el análisis multivariable encuentra sus


fundamentos en el clásico trabajo de Lazarfeld (Cf. 1968). En lo que hace a
variables intervalares, existe una variedad de técnicas que se adaptan a diferentes
situaciones. Así. para analizar la relación entre una variable intervalar dependiente, En este capítulo nos ocuparemos de los problemas que presenta la
y varias variables independientes de nivel nominal y/o ordinal, se puede recurrir al construcción de índices y de escalas. La cuestión consiste precisamente en
análisis de variancia:64 si tanto las variables independientes como la dependiente «Cómo un concepto, proveniente del. lenguaje común o de la reflexión teórica
son intervalares. el análisis de regresión múltiple puede ser una alternativa
sobre la realidad social, puede ser traducido en una medida» . 1 Se trata <;te uno de
adecuada.65 Por último, y siempre dentro de las técnicas estadísticas más clásicas, los aspectos fundamentales del "proceso de operacionali~ación", vale decir, d~ ~~s
también se puede recurrir al análisis factorial66 para una multiplicidad de propósitos. operaciones típicas que se requieren para generar un instrumento de med1c1on
Recomendamos la lectura de los buenos manuales para familiarizarse con estas
partiendo de un concepto o de una noción. 2
técnicas un poco más complejas.
A partir del concepto de 'espacio de propiedades', expondremos las distintas
En cuanto al uso de todas estas técnicas. se ve hoy en día muy simplificado por
alternativas de reducción y pasaremos a describir las etapas del proceso de
la difusión de la computadoras personales.67 y ia existencia en el mercado de operacionalización, mostrando como un índice consiste esencialmente en la
sottwar#8 cada vez más poderosos . A esta altura, cualquier lego en computación reducción de un espacio.
tiene a su disposición una variedad de paquetes estadísticos que incluyen todas
las técnicas mencionadas y muchas otras, y que son de muy sencilla utilización. Luego, presentaremos brevemente algunas técnicas para la construcció~ de
escalas destinadas a la medición de actitudes. definiendo a las escalas como trpos
particulares de índices. Por último. abordaremos el tema de_ la confiab~li~ad y
validez de los instrumentos de medición, haciendo referencia a los distintos
procedimientos utilizables para evaluar su bondad .

64 Cf lverseri y Norpoth, 1976.


65 Cf Schroeder, Sjoquist y Stephan, 1986.
66 Cf Kim y Mueller (1978), y los aportes originales de la escuela francesa sobre L 'analyse
des données ( Cf. Fénelon . 1981, y Cibois, 1990) 1 Palabras del Prefacio de Jean Stoetzel al primer volumen de la obra de Boudon Y
67 Nos referimos a las computadoras 'PC' (del inglés, Personal Computet), ya sea del tipo Lazarsfeld que -no por azar- se titula "El vocabulario de las ciencias sociales".
-mal- denominado 'compatible' o Apple, cada vez más poderosas, y que, para las 2 Concebido en su mayor amplitud, el "proceso de operacionalización" desi~na_el trabajo de
aplicaciones mencionadas, sustituyen perfectamente a las computadoras de gran tamaño producción de la matriz de datos definiendo sus tres elementos const1tut1".10s: UUAA,
(mainframe ). variables y valores. Juan Samaja propone agregar a la estructura _de la matrr:z un c:uarto
68 El software consiste en la parte "blanda" de la computación, los programas con elemento: los indicadores definidos "como los procedimientos aplicados a d1mens1ones
instrucciones para realizar distintos tipos de operaciones: procesamiento de textos, relevantes de la variable para efectuar su medición".(Cf . Samaja, 1992: 17). Sin emba~go,
graficadores, hojas electrónicas, etc. El hardware está constituido por la parte "dura".: la tanto lo que Samaja denomina 'variables' como lo que _llama 'indicadores' ~esempenan
computadora en sí, los soportes físicos de la información (discos rígidos, diskettes, etc.). exactamente el mismo papel en la estructura de la matriz de datos: ambos figuran c:omo
Sobre aplicaciones en general de la computadora a las ciencias sociales, Cf. los trabajos columnas en dicha matriz . Como se verá, ocurre precisamente que las columnas-:·~anable
de Schrodt (1985), y Brownell (1985), en el manual de Padua (1979) hay un capítulo son generadas a partir de operaciones sobre las columnas--indicador. La cu~tt0n de la
dedicado a reseñar las técnicas incluidas en el SPSS ( Statistical Package tor the Social selección de los indicadores, de cómo se mide, es tan ajena a la forma de la matriz oomo el
Sciences - Paquete Estadístico para las Ciencias Sociales). tal vez el más célebre problema de seleccionar una muestra de UUAA.
programa para maintrame.
114 Construcción y análisis de datos Indices y escalas 115

Figura XIX Posición de los departamentos de Misiones en un espacio de


1. ESPACIOS DE PROPIEDADES E INDICES propiedades continuo

*San Javier
El concepto de 'espacio de propiedades'. tal como fue desarrollado por Alan 40
Barton, es uno de los instrumentos analíticos más poderosos para la investigación * Conc pción
IA
sociaL Sus aplicaciones son múltiples. aunque aquí nos centraremos en la idea de
reducción de un espacio de propiedades . 3 Según Carlos Borsotti, " la

e
o ·Guaraní
·¡; *San Pedro
propiedad-espacio se define como el conjunto de posiciones que puede ocupar
~
una unidad de análisis en una variable o en un sistema de varias variables"_ 4 En 30 e *LN.AI m
o '"G .Belgrano
este sentido, toda variable considerada individualmente ya configura por sí misma o
una propiedad-espacio unidimensionaL e "Candelaria
o • · toles "Cainguás
Si tomamos, por caso, los Departamentos de la Provincia de Misiones como
unidades de análisis, cada uno de ellos es susceptible de ser ubicado en una línea
horizontal que simbolice el continuo de todos los valores posibles que pueden
asumir en una variable cualquiera de nivel intervalar --por ejemplo, el porcentaje de
20 ·-:¡
IA GI

-e.;
!.~
IA
Oberá 25 de mayo
• S n Ignacio

"lguazú
hogares con asistencia escolar deficiente que presente cada Departamento_ Del '"L .San Martín
mismo modo, estas mismas unidades podrían ubicarse en otro continuo, como el
porcentaje de hogares con condiciones sanitarias deficientes, siendo que el
conjunto de valores comprendidos entre el O y el 100 % constituiría una nueva
1 ª=
..
i·r¡ ~
'"Capital
.. Mo*n tEldorado
ecarto

propiedad-espacio. Ahora bien. por múltiples razones podemos tener interés en "Cll 1
• IA
ubicar nuestras unidades de análisis en espacios multidimensionales, es decir
espacios en los que cada unidad aparecerá ubicada simultáneamente en dos o más
dimensiones o variables

En la Figura XIX se observa el resultado de distribuir en un espacio de 5 10 15


% de hogares rurales con asistencia escolar deficiente
propiedades conformado por las dos variables mencionadas los Departamentos de
Misiones obtenemos un clásico diagrama de ejes cartesianos Fuente: elaboración propia. en base a datos de Argentina, 1984: 332.

Sin embargo, esta forma de representación tan satisfactoria sólo es posible si


estamos tratando con dos variables de nivel intervalar, basadas típicamente en Reducciones de espacios de propiedades cualitativas
propiedades analíticas de colectivos (los Departamentos de nuestro
ejemplo).Cuando lidiamos con unidades de análisis de menor nivel, y en especial Supongamos que estamos realizando una investigación en el campo de la
tratándose de individuos, nuestras mediciones alcanzan raramente dicho nivel y Sociologfa del Trabajo y que, inquiriendo a un conjunto de obreros acerca de su
debemos conformarnos con trabajar con atributos y órdenes_ ¿ Qué sucede satisfacción con la tarea que realizan, hemós llegado a diferenciarlos -mediante el
entonces cuando se combinan dos propiedades cualitativas? El espacio de uso de algún tipo de índice o de escala- según su satisfacción con la tarea sea
propiedades resultante ya no consiste en un plano continuo, no se resuelve en un Alta (A). Media (M) o Baja (8) . Al mismo tiempo. hemos preguntado a los mismos
par de ejes cartesianos, sino que toma la figura de un conjt1nto ordenado de obreros si se consideraban satisfechos con el salario que percibían. obteniendo
celdas, cada una de las cuales representa una determinada combinación de valores una clasificación análoga en Alta. Media y Baja satisfacción con la remuneración. Si
o categorías. ahora nos interesa ver cómo se distribuyen estas unidades (los obreros)
simultáneamente en las dos clasificaciones, la combinación de ambas variables dará
lugar a un espacio de propiedades de nueve ( 3 x 3 ) variantes. No por sencillo
3 No nos ocuparemos aquí del concepto de 'substrucción', operación inversa a la de resulta menos esencial captar que al conformar ese conjunto de nueve variantes lo
reducción y de innegable trascendencia para el trabajo teórico. que hicimos fue generar una nueva clasificación: cada obrero encuestado deberá
4 Cf. Padua,, 1979: 239. necesariamente encontrar su ubicación en una celda y solamente en una celda .
./fffi'-
116 Construcción y análisis de datos Indices y escalas 117

Para decirlo con toda claridad, lo que ha ocurrido es que, combinando dos variables Reducción por simplificación de dimensiones: sin duda, el caso más
(cuyos valores originales eran. en ambos casos, A, M y B ), hemos creado una obvio. Es sabido que cualquier variable es susceptible de ser reducida a una
nueva variable, con los valores AA, AM, AB, MA, MM. MB, BA. BM y BB. 5 dicotomía. Si entonces reducimos el núm'ero de valores de una o más de las
dimensiones que conforman un espacio de propiedades, se reducirá
Figura XX: Ejemplo de espacio de propiedades cualitativas necesariamente el número de celdas de dicho espacio.

Satisfacción Satisfacción con la tarea Figura XXI : Reducción por simplificación de dimensiones
con el salarlo B A
M
B A
A AB AM AA
A AB AA
M MB MM MA
B BB BA
B BB BM BA

Ahora bien. puede ocurrir que nos resulte impráctico manejarnos en el análisis
con estos nueve valores de nuestra nueva variable o bien que. a los efectos de En nuestro ejemplo . hemos reagrupado en ambas dimensiones los valores
nuestra investigación, la relación que medie entre esta variable y otras variables no "Media" y "Baja" bajo el rótulo arbitr~rio de "Baja" (tal vez. con mayor exactitud.
se destaque con la suficiente nitidez al trabajarla en un nivel de desagregación que pudiéramos haber denominado a esta nueva categoría "No Alta") . De un espacio
implica tanto detalle. Hay muchos motivos por los cuales puede resultar de propiedades de nueve variantes pasar.nos así a uno de cuatro, las
conveniente reducir el número de valores que conforma el espacio de combinaciones originales MM. MB. BM y BB dan ahora lugar a una sola posición
propiedades. Por ejemplo, podemos estar trabajando con una muestra que, por su BB. ·
escaso tamaño, imponga limitaciones a la magnitud de las tabulaciones cruzadas
que tenga sentido encarar; 6 también puede ocurrir que no todas las posiciones Reducción numérica: cuando es sostenible pensar que las diferentes
_-o valores- de la nueva variable revistan la misma significación ni sean igualmente dimensiones que conforman un espacio de propiedades se relacionan todas con
importantes con respecto a las hipótesis que tenemos en mente. Desde este _una misma característica subyacente, es posible practicar este tipo de reducción
punto de vista, lograremos una mayor claridad conceptual refundiendo varias
posiciones de nuestro espacio de propiedades original en una nueva categoría. Figura XXII Reducción numérica
En su~a. existen motivos t~nto empíricos como teóricos que con frecuencia nos B (O) M (1) A (2)
lleva_ran a encontrar venta1as en proceder a una reducción de un espacio de
propiedades . Esto supone contar con criterios determinados en base a los cuales A (2) 2 " 3 4
se pueda reagrupar el conjunto de valores que constituye el espacio de
propiedades original en un número menor.de categorías. A continuación, pasamos
M (1) 1 2 3
a describir tres tipos distintos de reducción señalados por Barton 7

5 Dado que una variable es un conjunto de valores tal que forma una clasificación (Cf. B (O) o 1 2
supra. Cap. 1). las combinaciones de variables son a su vez variables.
6 Hemos visto en el Cap. 111 como Galtung sugiere la necesidad de contar con un número de
~sos que contemple como mínimo un promedio de 1o unidades por celda. En nuestro Así. la satisfacción con la tarea realizada y la satisfacción con el salario son
e1~mplo, la nueva variable cuenta con nueve posiciones, por lo que para cruzarla aunque factibles de ser subsumidas una idea más general. que englobaría a ambas, la de
mas no sea con otra variable dicotómir.a, requeriríamos un tamaño mínimo de la muestra de 'satisfacción con el trabajo' En efecto, parece lógico suponer que cuanto más
9 x 2 x 1O = 180 unidades de análisis. satisfecho se sienta un obrero con la tarea que realiza. mayor será la satisfacción
7 Barton_ ~~ce referencia a un cuarto tipo: la reducción funcional; esta es la que se aplica con su trabajo (y viceversa). y que lo mismo ocurre respecto a la satisfacción con su
en el anahs1s de escalograma de Guttman (Cf. tnfra). salario .
Indices y escalas 119
118 Construcción y análisis de datos

En estas condiciones. y suponiendo que ambas dimensiones tengan la misma


pragmática como la siguiente:
relevancia en cuanto a la satisfacción con el trabajo, se pueden asignar idénticos
puntajes numéricos a las posiciones análogas en cada dimensión En nuestro
ejemplo, asignamos 2 puntos a 'Alta satisfacción', 1 a 'Media' y O a ·~~a· ur:
obrer~
Figura XXIII Reducción pragmática
con alta satisfacción tanto respecto a su tarea como a su remunerac1on obtiene as1
un puntaje -máximo- de 4 puntos; uno con baja satisfacción en ambas B M A
dimensiones obtendría el mínimo de O puntos. El resultado de este procedimiento
es la generación de una nueva variable que cuenta con cinco posiciones -o
valores- ordenados de o a 4, y que son interpretables como la expresión de A
grados crecientes de satisfacción con el trabajo.
Media
Nada impediría por lo demás reducir nuevamente este conjunto resultante de M
satisfacción
categorías. Asl, podríamos definir
Baja
4 o 3 puntos í Alta satisfacción con el trabajo B satisfacción
2 puntos í Mediana satisfacción con el trabajo
1 o O puntos í Baja satisfacción con el trabajo
En el ejemplo. los que tenían un puntaje alto (4 o 3) en la reducción numérica
siguen agrupados bajo el rótulo de 'Alta satisfacción'; lo mismo ocurre con los de
En definitiva, mediante este procedimiento de reducción numérica hemos bajo puntaje (1 o O). Pero aparecen dos nuevas categorías: "Insatisfacción
generado una nueva variable, a la que convendremos en denominar 'índice' profesional" (en la celda superior izquierda) e "Insatisfacción económica" (en la
inferior derecha). Observemos sin embargo que el conjunto de los valores
Reducción 'pragmática' si observamos nuestra reducción numérica con mayor producidos por esta reducción pragmática ya sólo se presenta en forma
detalle, podemos plantearnos la siguiente cuestión. Considerando qué significa parcialmente ordenada. En efecto. se puede convenir en que
tener una 'mediana satisfacción con el trabajo', vemos que los obreros que
obtengan un puntaje de ·2· pertenecerán necesariamente a alguna de estas tres Alta satisfacción > Media satisfacción > Baja satisfacción
combinaciones·
2 (salario) + O (tarea)
¿Pero qué ocurre con las categorías restantes de insatisfacción "profesional". Y
1 (salario) + '1 (tarea) "económica"? Ya no encuentran ubicación en esa secuencia. En consecuencia.
podemos decir que mientras cualquier reducción numérica deviene en una variable
O (salario) + 2 (tarea) ordinal, nuestra reducción pragmática produce una variable que se inscribe en el
nivel nominal de medición
¿ Ahora bien. es legítimo englobar en una misma categoría -el valor ·2·- a
personas cuyas situaciones son tan diferentes? Puede que sí o puede que no. En lo que se podría discrepar parcialmente con Barton, es en la denominación
ello depende de cuáles sean nuestros objetivos, de lo que nos propongamos de ·pragmática· 9 que le da a la última forma de reducción que hemos examinad~
lograr al llevar adelante esta reducción. 8 Podría ocurrir que nos interesara En efecto. si algo debe quedar claro es que cualquier reducción que hagamos sera
conservar la especificidad de alguna(s) de las categorías del espacio original, por siempre "pragmática", en el sentido de que deberá ser útil a nuestros objetivos.
revestir un significado especial para la investigación que estamos desarrollando En el ejemplo que dimos. tal vez cupiera hablar de un tipo de reducción "mixta" (se
Así, si tuviéramos la idea -o hipótesis- de que la insatisfacción que deviene de combina una reducción numérica básica con algún crite1 io adicional) Sin embargo.
una baja remuneración es distinta de la que produce una tarea monótona o de no toda reducción "pragmática" parte necesariamente de una reducción numérica
escaso prestigio, y que, por ejemplo, ambos tipos de insatisfacción bajo previa. El siguiente es un ejemplo clásico de Barton que permite ilustrar este punto
determinadas condiciones tenderían a estar asociados a diversos correlatos a partir de datos de un estudio de panel
ideológico-políticos, sería absolutamente legítimo proponer una reducción

8 Dice Barton'. «Sin embargo, para algunos propósitos, cualquier sistema de indicadores
ponderados resulta muy rígido y agrupa las categorías de modo muy arbitrario,, (en Korn, 9 Denominación que conservaremos. no obstante. en aras a la tradición.
1969: 64).
1:20 Construcción y análisis de datos Indices y escalas 121

mensurable. Describiremos a continuación las cuatro etapas que componen este


Figura XXIV: Reducción de un espacio de propiedades de proceso .
posición política en dos puntos del tiempo
* La primera etapa corresponde a la representación del concepto en
Intención de voto Imágenes. " El concepto, en el momento en que cobra cuerpo, no es más que
Voto efectivo una entidad concebida en términos vagos, que otorga sentido a las relaciones
Demócrata No sabe Republicano
observadas entre los fenómenos" 11 De acuerdo a Francis Korn, llegaríamos aquí
Cristalización desde la noción primigenia hasta ei nivel de una definición nominal 12 del
Demócrata Constancia Gambio
concepto. 13
No sabe Abandono C'..onstancia
Abandono * La fase siguiente consiste en analizar los componentes más importantes de
no critalizada
esta noción primera. Se trata de discernir los aspectos o dimensiones principales
Republicano inherentes al concepto. Estas pueden ser deducidas analíticamente del concepto
Gambio Cristalización C'..onstancia
general que las engloba, o bien ser producidas más empíricamente a partir de la
estructura de sus correlaciones . Así, en nuestro ejemplo, tratándose de
Fuente: Korn, 1969: 66. operacionalizar la noción de 'satisfacción con el trabajo', cabría reconocer al menos
una dimensión "económica" y otra de tipo "profesional" . En otra terminología,
podríamos decir que esta etapa consiste en la producción de una definición "real"
En definitiva, la de 'reducción pragmática' es una categoría residual, a la que del concepto 14
habrán de ir a parar todas las formas que no procedan ni "por simplificación de
dimensiones" ni "numéricamente"
* La tercera etapa supone proceder a la selección de los indicadores
Así, deberíamos contar con un grupo de preguntas (o ítems) dirigidos a medir la
El proceso de operacionalización satisfacción con el salario, y con otro grupo de indicadores destinados a
representar la satisfacción con la tarea. La necesidad de combinar varios
Ya hemos mencionado que el resultado de una reducción numérica es un indicadores (o ítems. o preguntas) deviene de que la relación que vincula cada
índice Cuando realizamos esa reducción de nuestro espacio original, tal vez no indicador a la dimensión correspondiente -y por ende al concepto- es una
fuéramos conscientes de estar generando un índice. Disponíamos de dos
relación esencialmente probabilística y no de certidumbre . 15
variables a las que combinamos en un espacio de propiedades, con lo que
aparentemente -por una suerte d~ generación espontánea- de los mismos
* Por último. los indicadores seleccionados deben combinarse, siguiendo
datos surgía e:I tal índice. Lo primero que debemos destacar es esta idea
elemental un índice consiste esencialmente en la reducción de un reglas determinadas. en alguna clase de indice. Un procedimiento sencillo de
espacio de propiedades. No existe por lo demás ninguna magia en la combinación de los indicadores es adjudicar un cierto número de puntos a cada
generación del índice: es nuestra capacidad imaginativa la que nos permite respuesta (o valor. o categoría) dentro de cada indicador. con lo que cada unidad
introducir una idea más general -la de 'satisfacción con el trabajo'- para subsumir
en ella las dos variables originales considerándolas como aspectos o dimensiones
parciales de la misma . Sin esta idea, nuestra reducción carecería totalmente de 11 Cf . Boudon y Lazarsfeld, 1965: 28
sentido. 12 Cf. Korn. 1969· 10-11 .
13 En rigor, el punto de partida puede consistir tanto en una noción -proveniente del
Nos encontramos ahora en condiciones de plantear el problema de la sentido común, tal vez con una gran carga ideológica. etc . - , como en un concepto
construcción de índices "al derecho", por así decirlo . Hay un texto célebre de Paul --inserto dentro de un campo teórico. con significado "constitutiv0" (Cf . Torgerson, 1965).
Lazarsfeld, 1O en el que aborda las etapas del proceso de operacionalización. Este 14 Cf. Korn. 1969: 10-11 La expresión 'definición real' es sumamente discutible (Cf.
proceso consiste muy precisamente en la construcción de un índice que permita Cohen y Nagel, 1967); por lo demás, esta cuestión no es ajena a la muy antigua "querella de
traducir un concepto -de menor o mayor grado de abstracción - en una variable los universales'', a la que más modernamente se alude como "nominalismo versus realismo"
(Cf. Galtung, 1966: Gap. 1).
15 Dice Lazarsfeld: .. cada indicador posee un carácter específico y no se lo debe jamás .
1O Publicado originalmente en Daedalus , y reproducido posteriormente en infinidad de
considerar como plenamente representativo para la clasificación que se busca,. (Cf.. . ~-'
antologías, entre otras en las de Boudon/lazarsfeld (1965) y de Korn (1969). Boudon y Lazarsfeld, 1965: 33).. ./'?/-

, . •. ··-~--- "r. . ·~ :,;,;~J:r~


i22 Construcción y análisis de datos
Indices y escalas i23

de análisis presentará un puntaje total -su puntaje en el índice-, consistente en investigador; 17 no existe, en efecto, regla alguna objetiva que nos permita
la suma de los puntajes ootenidos en cada indicador. Es a través de estas dos determinar cuál es el número de dimensionl3S requerido para operacionalizar un
últimas etapas que se arriba a una definición operacional del concepto . concepto determinado. Por último, en lo que se refiere a los indicadores, se los
Figura XXV: Etapas del proceso de operacionalización deberá seleccionar primordialmente atendiendo a su validez interna (Cf. infra ), vale
decir de acuerdo a su congruencia con el concepto a medir En este sentido, debe
quedar claro que tampoco el número de los indicadores requeridos se encuentra
determinado a priori. Lazarsfeld habla de un universo hipotético de indicadores
1ndicador 1 . 1 posibles, con lo que la cuestión de seleccionarlos pasa a convertirse en un
problema de muestreo de indicadores Al enunciar su principio de 1a
01 Indicador 1.2 lntercamblabllldad de los indicadores. Lazarsfeld hace gala de un pragmatismo
extremo . Su razonamiento parte de que no existe la medición pura en ciencias
sociales, sino que nuestras medidas serán siempre y necesariamente imperiectas
Indicador 1 j Así, por ejemplo, si se toman dos muestras distintas de indicadores de una misma
característica subyacente. la correlación entre los dos índices generados de ese
1 modo, con ser elevada, no alcanzará nunca a ser periecta No obstante si antes
Puntos
~ Indicador 1.n
02 N que una clasificación perfecta de nuestras unidades de análisis nos interesa la
Concento \"\-___:::___} D relación entre la característica que investigarnos y alguna otra variable externa.
1 ambos índices conducirán a resultados prácticamente equivalentes
Di Puntos e
Di E En síntesis, cuantos más indicadores seleccionemos para un indice
determinado, mejor será nuestra medición de la caracteristica subyacente 18 Un
Indicador es una caracteristica o respuesta manifiesta que se encuentra ya
Puntos definida en términos de lo que hay que observar La medida compleja que se
Dm Dm obtiene combinando los valores obtenidos por un individuo en cada uno de los
indicadores propuestos para la medición de una variable se denomina índice "La
diferencia entre un indice y un indicador es entonces de grado Un indice es un
Indicador m.n complejo de indicadores de dimensiones de una variable. y constituye por lo tanto
Etapa 1 Etapa 2 Etapa 4 el indicador total de una variable compleja (Korn, 1969 . 12),,
Etapa 3
Representación Especificación Selección Combinación
del concepto delas delos de los indicadores
en imágenes dimensiones indicadores en el índice
17 Criterio que a posteriori podrá ser compartido por otros miembros de la comunidad
Definición Definición Definición
nominal "real" operacional
científica. pero esta es otra cuestión "
18 Aunque juega aquí una suerte de "ley de rendimientos decrecientes" Según H W Smith
«Los primeros items que se agregan contribuyen en mucho mayor medida a la confiabilidad
En todo este procedimiento, es de notar que con frecuencia la reducción dell que los últimos añadidos Así, luego de un cierto punto (i.e, 8 a 10 items) cualquier ítem
adicional contribuirá casi insignificativamente a aumentar la confiabilidad ¿ Por qué se
espacio de propiedades será implícita, puesto que éste no requiere haber sido mantiene esta relación entre la longitud de la escala y la confiabilidad? Cualquier medida
diagramado como tal Hay algunos puntos de esta presentación que merecer tiene fuentes idiosincráticas de error Por ejemplo. el uso del ingreso como una medida del
destacarse . Si bien Lazarsfeld parece inclinarse por la alternativa de que el índice status socioeconómico presenta problemas idiosincráticos como el de incluir en la clase
se genere a partir de los propios datos, 16 tampoco excluye la posibilidad de un alta miembros de la Mafia con un salario de 100.000 US . Con cada ítem agregado a la escala
proceder más teórico Por otra parte, en lo que hace a las dimensiones del puede esperarse que decrezcan los errores ítem-específicos. ouesto que normalrnente se
concepto, es importante señalar que el proceso de especificarlas es espera que se cancelen unos a otros. Esto es. puede esperarse que cada medida incluya
esencialmente analítico y que tiende a descansar en el criterio subjetivo del factores irrelevantes para lo que el investigador está midiendo, pero corno estos
componentes irrelevantes son presumiblemente distintos para cada ítem, y corno todos los
íterns comparten un foco común. el conjunto total de medidas proveerá normalmente una
16 «¿"Dados" por quién?,, , preguntaría Pierre Bourdieu. medición más pura del fenómeno en estudio que cualquier medición aislada,, (Cf. Srnith.á4>
1975: 60-61) ~7-('/ -

También podría gustarte