Está en la página 1de 4

. - --!

'f -
..
_..; ..: ,
CAPITULO
·· · LA M TRIZ DE D.ATOS

1.1. Lo fonna tripartita de los daros

Se obtienen dotossociol gicos cuando un sociólogo registro hechos


., acerca de oigan sector de la realidad social· o recibe h~c~os registrados
para él. Se suele decir que las datos deben tener' oigan tipo de referente
emprrico fuera del sociólogo rrllsmo, ·y vamos o respetar esto tradición.
A pes<ir de que _los datoJ de la soclologra, debido o lo enorme ex-
tensión de su o~jeto, adopto~ muy diferentes fonnas, hay una estructura
coman q~e e n mucho~ cosos se ~videncia prontamente y en ?tras se lmP.O-
ne con facilidad a los dotas. Esto estructura tiene tres partes, pero ellas
aparecen con nompres distinto! en diferentes contextos.
En ,prlmer·lugor, y es Id mós importante, te"!emos los elementos de
1 ondl isiso unidades de anól isis,·ltales como seres hurricinos (interpel_ados) en
1
' una cmcuesto o -en un experirpento de labo~torlo, o nociones en un es-
tudio comparativo de los nociones,-o unidades mds c~mp~e¡os . Estas uni~
dodes tienen una coracter~tic4 en é:omOn en C.!!.anto constituyen el ~bLeto
de la investigaclcSn soclolcSg~co; ell~s consisten en seres humanos.., en
. p~oductos de_los seres humanys, como eñ ~1 .caso del ·anól isl$ del cante-
nado de recortes de periódicos. ·
En segundo ·lugar, exls~en. los .dimenslones o variables que uno de-
.. seo- conocer en cuanto a las Jnidcides, toles como el consumó de énerera
ner cdoita en los estudios ac~rca de las nociones subdesorrollodas 1 o los
respuestas o ciertas pregun~ estrat6gicos. en un estudio acerca de una
1

elección. Algunos veces esto lsmo puede ser fonnulodo con mds propi~ ­
dadcomo un conjunto de con iciones con los cuales ~e desea estudiar las ·
unldacfes, o como un con¡untó de estrmulos. Uttl i~aremos ~ a e~preslón
'variables• cuando -estemos trdtando unidades que sean imponderables,· en .
el sentido que ellas no puedon¡ (de una manero artificial ci natural) s~r so- .
metidas o un conJunto de-co cficiones ·de manera que e1-soc:lólogo pue<;la
estudiar los _resultados, y u lllzaramos las expresiones 1condiclones 1 o
1
est~mulos' en los cosos en que .esto sea posible. .
· En tercer lugar, tenembs- los valores que alcanzan ~os unidades en
los variables estudiados o 1 ~!!izando los otro~ expresiones, los r.espues-
tos. o los resultados qtJe se obtienen cuando los unidades se exponen o los .
·estrmulos o a los conaJclones. segOn las cuales el sociólogo deseo estu-
diarlos. 1

De. este modo, tenem9s los tres portes que puede ~ecirse constit.u-
:P.·
o •

' 2 Teorra y métodos de la Investigación soc;lal La.matrlz de datos 3


·yen la estructura de .,()S
datos socioldgicos, expresadas en el lenguaje de
.los variables, en el ~enguaJe de los condiciones, estrmulos y respuestas .
{lenguaje SR) y en el qua puede-Uamarse lenguaJe de las encuestas : de de;organlzacidn Social , ·S, tales camo alcoholismo, enfer~edad men-
y
tal.~ criminal ldad ge¡u!!ral ~ nc;¡mlcldio suicidio para Ün ano determi~ado·.
Tobla 1.1.1. l as tres partes de 1~ datos ~xpresadas en términos ól! Si, adem6s, se estudia. el cambio en las tasas a lo largo de un perrodo de
diferentes ai'los, de modo que en los hechos puede resultar un~ tabla de tres dimen-
•slones, se C:OJ1Serva.Ta estructura original ·trlpartita multipl ic:qndo .las ein-
Hrminos
cotasasdedesorganizaci6npor, digamos, los 15 anos, de tal manera )U!!
generales. dimensiones unidades valores
en total resultan 75 variables (o condiciones). ~o estruc tu ra de los datos
1 . Lenguaje de variables untdades de valores de pe~anece. ldé(ltica; ·se ~.tuatan. Uf!lclades de an6l isls con urr n1lmero de-
variables estudiados anólisis o
las variables' ' terminado de dimeoslones.
· Si admitimos, por el momento, qua muchos datos pueden presen-
Lenguaje~ condiciones J unidades .de resul todos, .... tarse como si estuvieron compuestos de ' est~s tres portes, P,pdemos pasar
estrmulos on6llsis respuestas al próximo conceptÓ: la matriz de datos. Lo mátriz· de datós es un modo
Lenguaje dé objetos suJetos respuestos de ordenarlos datos'de manero que sea particularmente visible la formo
los encuestas psioold~icos Interpelados o ' tripartita: ·

'Es difrcil elegirentt.e estos terminologras, perlo simple rozcSñ da que .ellas Tabla 1.1.3. La matri:z: de. datos
no son totolmenta,slndnlmas, de tal manera que fendremos que usar al su~
o
nas comblnoélones de los t•rmlnos, sel'ec:clo~r el lenguaJe que parez-
·S¡ 52 53: .... s, •, •• •• sn
co mós apropiado para la ocosidn, Para evitar muchos de los dlflc:ul tades
• • ' • ~1)• ' • • ' Rln
o o.

: RUe s.11ral!ñ de esto, y evitar distinclon'" que son muy a menudo innece- O¡ Rn R12 R13
sarl as1 Introduciremos algunas srmbolos sencillos:
Tabla 1.1.2. srmbolo pa!O los tres partes de los datos socioldgl~os 02 ~21 R~ R23 • • : • R~l • • • • , R2,n
\

Parte da las datos dimensiones, unidades de valores 1 ·a 3 R31 R32 R33 • • •• R3f' • • •• R3n
variables .an~lisis respuestas
srmbolo para
M'='
un e lemento S, V, X o R
. Stinbolo para una
, clo!e de elementos ~.~x. Q. B..
srmbolo para el
n6mero n m', N
' Parador un eJemplo, la investigación oo,rriente del tipo encuesta comien-
za proponiendo a m interpelados (O) n preguntas (S) u 'objetos psicold-
g¡cos' según la términologra de Th~tone, de tal manera que para cada
pregunto S y para cada interpelado O hay r respuestas diferentes f?OSÍ- 0m Rml Rm2 . Rm3 · ' •• ·Rmj'' •• ' Rmn
bles, & qtm efemplo: ·se puede haciU'j un estudio comparativo de m' na-
ciones poniendo en una lista sus valores~50bre una serie den variables
En esta esquema, R~ la respuesta que da la unidad n'!i al estrmulo n~jt
o, en otras palabras, el valor que tiene la unidad"'' en, la variable~¡.
~
- . ·.1 .. . .
o ,, o o o
/

4 Teorta y m6todos de la invesl"lgacldn social La motriz de·dSJto$ 5

. - Por lo tanto, se obtiene lo comporapllidod cuando l.os tres series se


Ésta es exactamenf.e~a.forina en qu~ 'aparecen los datos si hay una tarjeltl · ajUÍton las unas a las otras 9e tal manero que se satisfaga lo con.dlción
perfo rado para codea unida~, una columna para cada variable y una per-
·foración para coda yQlor, y .se pasan las tor¡etas por uno móquina que ré-
mencionado. en el principio n;i. Est'? quiere decir, por. eJemplo, qu~ los
· preguntas deben ser adecuociaf'ente traducidas .en una encuesta comparo- .
glstra paro cada tarj eta lo qu~ estó perforado en el·la. Jo..dennSs, ásta ·es
-tlva, pero no quiere decir que ~nq. pregunto een una encuesto 'de~ tener
lo forma q!Je reviste el tipo de dataJ que tiene .un director de !!$Cuela en
. el m!smo significado' para tidos los Interpelados, siendo suf<iciente que ·
su registro<. con los nombres de los alumnos puestos verticalmente, las ma- !enga- alg11n· significado. La comparabilldod en nuestra a!=epc l6n es un (
teri·as ensenadas en lo escuela :puestas hori:z:ontolmente y la co.llficoclón
req_ulsito menos .Xlgente: sin 'mba~, siS"nlfl.ca que una ltneo puede ser..
obten~do por e! 4"dlante ~¡ en la materia' ntÍ puesta en ·la·celda apro- · comparada con otra parque·!~ R ~n las celdas no car~cen d'e sentid.o. • ~
piado. , Si se d~cubre que ¡:los .unidades .sorf dlferenh¡:s 'en cuento o una dl,-
En t~rminos t!Scnicos, la matriz de datos nos da para coda por en· el
mensldn ~' se puede descompa~er la dlferpncio en 'dos compa!'entes 1 UnQ _
producto cartesiano. O por S el valor correspondiente .en R.o, en otras pá- 'real'yotro.'semdnt.tco', y atripuir la diferencfo observada o alguno fun- .
lobras, la idea es,Simplemente, que debe haber un valor R para cada cldn de estos _dos component.,. Se pti~e, incl~so, sosten~ que todo l9 .
combinación o, s. la forma mismo de la matriz de .datos y esta defini:. Cli~erencla"se debe a un comffnent~ semdnt_ico, como en el caso en que
c lón nos conducen i.,;;edlatamente a los primeros 3 principios de la re- extste un mero desasuerdo v~rDal y· no un desacuerdo. en los hechos . ~
colección de éiatos: • Puede tambl4n darse el lcasc de que !os componentes semdntico y
1.) Principio de COI'f:'parabilldad:. lo proposición '(O¡, S¡) da el valo~ co- real se anulen recl'procamente, de tal manera ~ue el resultado neto sea
rrespondiente en Rk' debe ser verdadera o falstJ poro cada·l, 1y k. .. unaseíne)anzaobservadaque pq~e ~ol iflcarse de.espúria. Pero todo esto
. 1 . es un problema de interpre~cl~ y no pertenece el coni!¡lO de lo recolac:-
2) Principio de c laslficbcidn: por~ ·cada esttmulo S¡ lo serie de las ~~­ cldn de datos, salvo si se ha Clecidido. reducir al mdximo el .componente
tegortas de respuestas R¡k debe producir una clasificael6n de ·t29P1 semdntlco• . Debe notarse, :sin embarga, que no es evidente ROr srmlsmo
los pares (O¡ S¡ } (i = 1, • ,' ., m). _ que el factor semdntlco constl uyo ~n 'e rror' en un estudio tipo encuesto
3) Principio de Integridad: para cada f,ar (O¡,. S¡) debe hallarse empt,- o que las tasas de criminalidad de las naciones no _puedan ser compor~as
rlcamente un valor RJ<, porquese'l:iosan eÍ1 c6dlgas pena es diferentes. tlna frase ambigua es, con
todo,. una frase, y una investlg cl~n ac~rca d~ cómo reaccionan los per-
Estos=tres pri~ciplos exigen algunos. comentarios: . sanc;z$ o Ona frase de este tipo uede producir informac ión importonte a-
Si ui observa una columna cuplqulero de la matriz M en la tabla cerca de c6mo reacclonarran tal frpse en la vida diario, y aunque las
1.1.3, se ve que la Idea es,slmplenlente , que. el mismo esttmulo debe ser fosas de crlm inall~ad varlarra~ si se basaran.en un criterio universal, se
presentado a todas lai unidades de andllsis; por eJemplo, se debe forml.!- pueden llevar a coba muc has lrvestlgaciones basados en la comparacidn
1arla m~regunta a todos los Interpelados. lo importante es que seo detasas fundadas en defloiclon1s diferen tes, por lo sencil la razdn de que
la misma pregunta¡ el esttmulo no debe ser cambia~ de un objeto a otro. las tasas pueden · decirnos a lga acerca de cdmo cambia de un pa'rs a otro
Esto, Sin embargo, es .sola Jo que ya estaba en·Ja definición de Jo matriz. 'ese que s.e llama crimen'. · ~ .
El .prlnclpio de comparabllidod agn¡ga ahora que cada una de tales com- · · El princlplo'de claslflctzc]dn agrega 'tres limlta~lones mds para lo
binaciones de un estrmulo determinado con una unidaé:l de añdlhis debe selección de las series ~J a y k.:: Lo que dice este principio es que para
tener s~ntido, es decir, debe ser verdadero o falso que una combinocl6n ·cada esttmulo S¡ la serie de respuestas Rjk debe Formar una claslficocidn;
(O¡ S¡) da un valor determinado RJ'k. Por medio de este principio se ha- i>Or ejemplo, paro cada par (oi Js ¡)debe· haber :•'la (exhaustivldad)y solo
cen comparables-los estrmulos, Las unidades y las respuestas. Si O¡ es r una exc lusldnmutua )R¡~ en qu~..é~ puedo ser ubicado. ltdea lmenre 1
uno noción, S¡ una pregunto directo acerca del estado civil y-R¡k lo 1isto l debehabertambi'n un fundameritum dlvisionls .) Cuando se satisface elte
de los elementos "casados, solteros, viudo~ y divorciados", entonces cual- .prlneipio en la prdctica, es!anos seguro$ de qwe hay una, y· solo uno res-
quier combinación no es.ni cierta ni .falsa, sin~ q ue simplemente no ti e-· puesta paro cada posible com~lnacldn de unidades y estrmulos. En kl
ne sentido,. como no lo tendrra pregyntor acerca del sex9 de una ~oC:i6n. construcción de cuestionarlos. ~tom ismo. se conoce como el principio se-
. - .· bOn el cual cada interpéla<!odel::le moreCil' una , y solo una respuesta o co-
tegorta. Cuando se concede al lRterpelodo lo llamado ',elección maltt-
. ..
_

....... .

6 Teorra y métódos de la investigación saclal Lo matriz de datos 7'

P. le', se le e1t6- dan~o en:loshechos une; s.erie de estrmulos, uno ,para ca- .-:nrocterrstico de . lo n¡otriz. W es una c ltro que do una idea de c uónto
da categorra., de tal manera qu• hay dos respuestas para codo estrmulo, trabajo hoy en un proceso de reco ~eccfdl) de los doto~, aunque debe dar-
ocectacidn o rechazo. Ésta es una claslflcacldn tan buena· como cual- se mds·lmp.ortoncio a ni y o n que a r} r el una med l ~a de cuónto med ición
qu•er otra; es una áic"Otomra. dlscrlminotor.la se hace 'y, po~ lo tanto, .deb~ .ser ieual, pof lo menos, a
De los tres principios mencionados, los dos primeros se refiere~ a i. Si r = 1, no se puede hacer ninguno. discriml no~idri entre diferentes
ta ldglca 'de la matriLy a las tres series sobre los que se bcl'sa; El terce- unidades y 1~ dimensión no tiene valor descript!vo ..ni .analll'lco, puesto
ro, principio de lnte¡;¡rldad , se refiere .al trabajo emprtlca de Henar la q'ue el resultado siempre es cohOcido y cón~cida como si.endo siempre i-
matrlx, y dice simplemente esto: 110 delar nlnpuna celda vocra. Este gual. Por. cierto, r puede variar y en generol 'varra de. va~iobl e en va-
desiderotum se enuncia fdcilmente, pero. no se alcanxa tan· fdciln¡ente en riable, de tal manero que r debe ·ser c_pncebida como a lgún t ipo de valor
la prdctlco, de tal manera q11e todo lo qué contiene el principio es una pro~edl~ entre los diferentes r¡· . · . . ·
norma ¡egdn la cual la cantidad de celdas que contengan 'ninguna infor- La. eleccidn b6sica en cualquier plan de investigocial)eS lendró. que
macldn• 1 'ninguna respuesta', etc., debe ser mantenida ton bajo_c_omo referi.lse a los nCmeros m y n. Un proyecto con las dimensiones (300,20)
sea posible. Mientras se pueda cumplir con ~os del primeros principios el obviamente muy diferente de un proyecto del tipo (20, 300), El lnves-
antes.de lo recoleccidn de los datos, cuidando que los estl'mul01 i~s va- o . '
tlgodortendróqueelegir•. Llamaremos al por ordenado (¡n,n ) la estrategia
riables se ~ltquén a todas las unidades y que todas las serl~ de cotego- de lnvestigocld"! d,l proyecto; el inves.t.igodor tiene qua elegir su estro-
rrasderespuestos fo~en claslflcaclones, solamente se puede cumplir con tag•a paro atacar el problema que encara y la prdxima sección se dedico
el tercer principio en el pro~eso de lo recoleccldn de los datos y con pos- a hacer algunas reflexionés acerca de diferentes tlp~s de. eshategios. ·
terlal'ldad, Aqurentran en Juego cosas tale1 como los técnicos paro man- Por di timo, diremos 9 lgunas palabras acerca de cómo t depende de
tener bajas las tasas de rechaxo a trov'és ~a una legitlmacl~n adecuado m y de n. No hay ninguno razón por la que deba depender de n: agregar
qe la investigación, o las maneras de rastrear dotal casi imposibles de ob- una ~orlabl e no cambio el núme1'9 ~e valores de los .voriables precede n-
tener. Pero existe tomblán lo posibilidad post hoc de examinar la dlstri- tes. Sin embargo, s.e puede considerar a .r como dependiendf de m. Es-
bucldn de las celdas vocras en M y d~ eliminar las O y S mdl adecuadas trictamente hablanclo, siempre podemos tener r~m, puesto que. no nece-
para! iberarse del mdxlmo de celdas yac ras con el ntrnim:~ de supresiones . sitemos mds valorel que elementos o unidades ·por medir. Si tenemos .uno
Como regla general ¡:le tipo prdctlco, puede ·decirse que un l (1l{. es el un idad, nec.,itamoa un salo valor; no hay ,que esp.e~ificor e l reJto (por lo :
mdxlmoabsolutodeceldosvacrosodmlslbles en cualquier columna o cual - tont~, la variable consisfird en ese valor y en todos los otros valores po-
quier filo de M y que un !i% el un mdxlmo mds <!_conseJghle. sibles agrupadas),. No .obstante, ~n lo medido en que m aumente, r a)J-
En algunos- casos, sin embargo, puede t11ner algc:ln valor mantener mentard coda vex menos. Pronto se hora evidente la ampl ifué:l ( r:,o~ ,y·,
uno O o uno S en la motriz aun Infringiendo los dos principios relativos con mas unidades habrd mds dificultadel en discriminar entre el las y ma- ,
a los celdas vocras; una ra:t<Sn es que 'nlnounp n:sgqestn' también puede yor tend~cio a ~grvparlos. A menudo la variable uti lizado no serd es-
ser uno respuelta y trotdrsela como tal. trl~tomente unldimal}sional,· de m~do que 1o ubicación exacta de los úni-
Generalixondo, lo técnico consiste-, por lo tanto, en contar el na-
mero de las 'DK's y de las'NA's poro codo O y paro coda S y. oblener su .
• !
dodes con respecto o otros unidades serd disciJtibl e, confll.cto que solo .
puede ser resuelto estableciendocotegorrCISmós crudas, e1to es, bajos va- ·
distribución.* Muy tJ menudo, un pequello porcentaje de los O y de los lores de r. El investigador procura capturar lo ubicdcidn gen~ri cq y dejo
S ?bsorberd un gran porcentaje .de .Jas' DK's y de los'NA's, y, naturol - ) . a un lado los.detallel y los problemas que le vienen o la mente precisa-
mente,.éstas son nuestras candidatas obvlds poro el rechazo. Solo en ro- mente cuando se encuentra con muchas unidades.
ros oportunidades los 1DK's y los 'NA's e1torón distribuidas al azar en la
motrix de datos, · 1.2. El nÓmero de unidades y de variables
Si,· c~n'lo de costumbre, m es el n-ari¡-,.ro de unidades; n el n.:imero
·de las dimensiones y r el namero.P.rQJTiedio de los cotegorros de respuestas ,
Los nOmeros m y n son de importancia crucial para la.evalua ciónde.
la cifro W =m x n x r,o, mejor, escrltadeestemodo: (m,n,r), es la
· '-. , cu.alquier proce.so de recoJecoidn de datos, tantp desde un punto de v.istq
* . . . · · ·t.eor~tlco e;citr¡o desdr un punto de ·v isto muy prdctico. El valo r mós bajo1
'DK',·forma abreviada de don.'t know, no ¡é¡ 'NA', formo ~breviada d~
no onswer, faifa 'de respue1ta. (N. del T.) · .de m es 1, c:omo en el caso en que s~ investigo a una sola persono ·o? úno.

También podría gustarte