Está en la página 1de 121

L a v erd ad d e las

E stad sticas

A p ren d er con los d atos


H u go O scar A m b rosi

L a v erd ad d e las
E stad sticas

A p ren d er con los d atos


Composicin y armado: Ediciones Lumiere S. A.
Correccin: Susana Frugoni Villar
Diseo de tapa: [estudio dos] comunicacin visual.

Ambrosi, Hugo Oscar


La verdad de las estadsticas : aprender con los datos -
1a ed. - Buenos Aires : Lumiere, 2008.
240 p. ; 23x16 cm.

ISBN 978-987-603-040-3
A mi primera maestra, mi madre.
1. Estadsticas. I. Ttulo A mi primer amigo, mi padre.
CDD 310

2008 Hugo Oscar Ambrosi


2008 Ediciones Lumiere S.A.
E-mail: info@edicioneslumiere.com
www.edicioneslumiere.com

Printed and made in Argentina.


Hecho e impreso en la Repblica Argentina.

ISBN: 978-987-603-040-3

Queda hecho el depsito que previene la ley 11.723.

Prohibida la reproduccin total o parcial de este libro, o su alma-


cenamiento en un sistema informtico, su transmisin por
cualquier medio electrnico, mecnico, fotocopia, registro u otros
medios sin el permiso previo por escrito de los titulares del
copyright.
Todos los derechos de esta edicin reservados por Ediciones
Lumiere, Ciudad Autnoma de Buenos Aires, Argentina.
n d ice

A grad ecim ien tos ................................................... 1 1


P rlogo ................................................................. 1 3
C ap tu lo I - A p ren d er con los d atos ....................... 1 7
C ap tu lo II - R azon es ............................................ 2 5
C ap tu lo III - E l escen ario ...................................... 3 9
C ap tu lo IV - P atrocin ad ores ................................. 6 3
C ap tu lo V - G en te d el oficio .................................. 8 3
C ap tu lo V I - L os p roveed ores o
d el tod o a la p arte ................................................. 9 3
C ap tu lo V II - P regu n tas y resp u estas .................. 1 1 3
C ap tu lo V III - E stad stica y len gu aje ................... 1 3 3
C ap tu lo IX - C on texto ........................................ 1 4 1
C ap tu lo X - R evelacin estad stica ..................... 1 5 3
C ap tu lo X I - D e la p arte al tod o .......................... 1 8 7
C ap tu lo X II - S ign ificad o d e las d iferen cias ......... 2 0 3
C ap tu lo X III - P or qu ? ..................................... 2 1 3
C ap tu lo X IV - L a d am a d e la lm p ara ................. 2 2 5
C ap tu lo X V - E p logo p ara estad sticos ............... 2 3 1
A n exo ................................................................. 2 3 5
A grad ecim ien to s

Expresar mi gratitud a cada uno de los que me mo-


tivaron e intentaron hacerme entender distintos as-
pectos de la estadstica, hacindola crecer en comple-
jidad y humanismo, es de la clase de cosas que uno
siente que hace con sumo placer, aunque deba reco-
nocer que no hay forma de cumplirlas cabalmente.
Porque la larga cadena de endeudamientos empez
hace muchos aos, con episodios marcados por el cl-
culo en algn momento de la escuela primaria. El arte
polismica de contar, empieza con el contar las cuen-
tas y el contar los cuentos, en una temprana edad.
Por eso van mi agradecimiento a Anglica, Clotilde,
Julio y Edelma. A ellos los siguieron otros docentes
que tambin hacan de su trabajo un magisterio, en el
pleno sentido de la palabra.
Y despus y siempre los libros. Para un habitante del
Sur profundo de Amrica, los libros son el puente de
plata para pertenecer al mundo. El nico hasta ahora,
cuando Internet anula las distancias. Gracias por los li-
bros y gracias por Internet. Detrs de cada libro un autor
y una historia. Para esta ocasin, un extraordinario libro
sin frmulas de Jessica Utts, Seeing through Statistics.
H u go O scar A m b rosi

Entre tanta gente maravillosa que tuve la suerte de


encontrar en la vida, quiero rendir homenaje al profe-
sor Carlos Eugenio Dieulefait. Quienes tuvimos el pri-
vilegio de ser sus alumnos primero y tratarlo despus, P r lo go
en la docencia o en la vida profesional, sabemos de su
enorme humanidad y de su genio multifactico.
Hay muchos, muchos ms a los que debo dar las
gracias y espero que cada uno sepa que soy conscien-
te de todo lo que recib.
Pero hay alguien a quien debo mencionar porque
somos socios. Con ella tenemos una sociedad conyu-
gal que ha hecho frente a muchos embates de la vida,
como les pasa a tantos. Lo notable es que en algn Hace ya ms de quince aos yo daba cursos de Me-
momento, cuando las exigencias nos permitieron de- todologa cualitativa en el Instituto de Desarrollo Eco-
tenernos a tomar un caf cada tanto, no me acuerdo nmico Social, en Buenos Aires. Minutos antes de co-
bien cundo ni por qu, empezamos a hablar de esta- menzar mis clases lea el listado de los inscriptos
dstica. Siempre haba sido mi trabajo, compartido con cuando me sorprendi el Ttulo acadmico de uno de
gente y caracterizado por planes y proyectos, que fue- los participantes: Doctor en Estadstica.
ron noticia al volver del trabajo. Pero en algn mo- Slo quien haya cruzado por los senderos de la in-
mento el hilo de la conversacin se fue para otro lado. vestigacin en esos aos podr comprender el asom-
De que se habla cuando se habla de estadstica? Eso bro que me produjo ese extrao caso de un estadsti-
es otra cosa. De la que empezamos a hablar con Ana, co que concurre a un curso de cualitativa. Por entonces
y continuamos hacindolo. an arda aquella lucha de tribus que nos haca poco
Este trabajo, es un resumen del contenido de nues- congneres; por lo que, para cualquiera de nosotros,
tras charlas de caf. Por eso, si algn mrito tiene, se los cuanti eran seres tan engredos como famosos por
debe a las preguntas que hizo ella. Los defectos son sus acusaciones sobre el exceso de subjetivismo y la
exclusivamente mos, que intentaba responderle. incapacidad de producir generalizaciones empricas
que para ellos haca de los cuali verdaderos tramoyeros
de la ciencia. Razn suficiente para inducirnos a creer
que si alguno de ellos llegaba a leer algo de nuestros
productos, lo valorara en tanto literatura pintoresca,
nunca como ciencia. Conviccin tan fuertemente arrai-
gada que en ese momento se me ocurri que si al-
guien se propona medir el grado de autocontradiccin
12
H u go O scar A m b rosi P rlogo

e incredibilidad de una proposicin bien podra haber condicin humana y su condicin de ciudadano, lla-
exclamado: ms contradictorio que un estadstico en mando a sus colegas a compartir una aventura en la
un curso de mtodos cualitativos! que sus quehaceres sean socialmente tiles, al decir-
Sin embargo, bastaron unas horas de intercambio les: Hagamos realidad que aprender estadstica no
para comprobar lo que por teora saba y por prejui- sirva para saber estadstica, sino para comprender
cios ignoraba: el peso que tiene lo singular cuando de a la gente.
singulares se habla. Su participacin en el curso fue En el contexto de un libro que nunca ocult las
clida y llena de aportes que resaltaban por lo inteli- dificultades y limitaciones de la contribucin de la es-
gentes y bien intencionados. tadstica al conocimiento, esta proclama lo sita en
Desde entonces compartimos una amistad que mu- ese filo, en el que la utopa se yergue llamando a la
cho aprecio, tanto por la bonhoma del autor de este aventura de una lucha por siempre ser algo mejores;
libro como por lo picaresco de su hablar provinciano y y que esa mejora se exprese en una conviccin: lo
por una tan ardiente vocacin cognitiva, que hace que que nos place y nos ayuda a vivir deberamos actuarlo
nuestras mateadas sean un andar por los ms diver- de tal modo que hayan otros que puedan aprovechar
sos territorios del conocimiento. de nuestras acciones del mismo modo que, en comu-
Podra terminar aqu este prlogo y decir que las nidad, nosotros aprovechamos las de ellos.
tres caractersticas que percib en su autor estn pre-
sentes en este libro. Es ms, que lo estn en tan alto
grado que el lector ser inmediatamente seducido por Dr. Homero Rodolfo Saltalamacchia
la profundidad del razonamiento, la gracia de la expo-
sicin y la audacia con la que rompe con los secretos
de una profesin a la que atribuye, con razn, una
inmensa importancia para nuestras vidas cotidianas.
Podra finalizarlo, pero con Ambrosi uno siempre
quiere quedarse charlando un rato ms, y lo mismo
me ocurre al escribir sobre su libro. Tentacin que
normalmente no es frustrada pues las excusas siem-
pre sobran. Eso es justamente lo que me ocurre en
este momento en el que, entre las muchas que el
libro me proporciona elegir una, emergente del l-
timo captulo. En ste, el autor deja de explicarnos a
los legos el ser cientfico y social de las estadsticas y
pasa a interpelar a los miembros de su propia comu-
nidad cientfica. All, el estadstico hace aparecer su
14 15
CAPTULO I
Aprender con los datos

Una de las definiciones ms breve e ingeniosa de la


Estadstica dice que es la ciencia de aprender con los
datos. La idea central en esa definicin es aprender,
la que se caracteriza por una forma, la ciencia y un
material, los datos.
El aprendizaje es el proceso de adquirir conocimien-
to, habilidades, actitudes o valores, a travs del estu-
dio, la experiencia o la enseanza. En nuestro caso,
con la estadstica se trata de adquirir conocimiento de
los distintos fenmenos naturales o sociales, princi-
palmente mediante la experiencia.
La ciencia es la forma ordenada de adquirir conoci-
miento, mediante la observacin o la experimentacin,
que son dos formas de acumular datos de la realidad.
Ver: http://es.wikipedia.org/wiki/Ciencia
Los datos son los signos que representan las carac-
tersticas observadas de los fenmenos. Constituyen
la quintaesencia de la experiencia.
Si quisiramos reducir an ms la breve definicin
citada, podramos decir que estadstica es la forma de
aprovechar la experiencia, ese proceso en el que con-
sumimos la vida.
H u go O scar A m b rosi A p ren d er con los d atos

Una primera conclusin, que nos sirve de apoyo de nuevas formas de vinculacin entre los datos y las
para el desarrollo de las ideas que se exponen en personas. Los formatos analgicos de la representa-
este libro, es que la estadstica, por ocuparse de la cin de los resultados estadsticos mediante diagramas,
experiencia, es un asunto de inters comn que se grficos y mapas reflejan la cultura de la imagen.
aplica en forma general a los ms diversos aspectos En esta poca parece haber llegado el tiempo anun-
de nuestra vida. ciado por H. G. Wells, cuando profetiz: Llegar el
As, en este captulo se trata de la cualidad de la da en que saber estadstica ser tan importante como
estadstica para hacer visibles aspectos comunes de la leer y escribir, para el ejercicio de la ciudadana.
experiencia, mediante un proceso que identificamos Cuando la estadstica se produce como resultado de
como la capacidad para ver el bosque. Veremos as una accin social comn, ya sea pblica o privada pero
con ejemplos cotidianos, cmo de manera natural pro- con la participacin de grupos, y no en forma indivi-
cesamos la experiencia mediante operaciones sobre dual, esos grupos o individuos asumen distintos roles.
los datos, que son los modos de que se vale la estads- En primer lugar, siguiendo un ordenamiento jerr-
tica, para dejarnos ver la realidad a travs de un cris- quico o histrico, se estudia la conducta de los que
tal menos oscuro. As emerge del conjunto observado llamaremos patrocinadores. En el captulo IV describi-
el promedio, como un valor novedoso resultante de los mos la actividad de ese sector, al cual se debe que
valores originales. existan determinados datos y no otros. Desde el pun-
Un comentario aparte merece la relacin entre Es- to de vista del conocimiento, esa caracterstica no es
tadstica y Matemticas. El enorme poder y la valiosa indiferente ya que importan tanto los datos disponi-
contribucin de la matemtica al desarrollo y sistema- bles como los que no se han observado o registrado.
tizacin de la Estadstica, no debe impedirnos recono- Ellos ponen los recursos, otorgan los permisos, eli-
cer que su impronta levanta una barrera de dificultad gen los procedimientos, seleccionan a los tcnicos, re-
para el uso corriente de los datos. A continuacin nos suelven la aceptacin o el rechazo de los resultados y
ocupamos de la vida social de la estadstica. Con esa aun entre lo aceptado, definen qu ser difundido y
expresin queremos ilustrar el hecho de que la expe- qu no lo ser.
riencia se enriquece y, en consecuencia, el aprendi- Definido un proyecto y su correspondiente patro-
zaje basado en ella, mejora cuando compartimos in- cinio, en la capa inmediata se encuentran los tcni-
formacin. Nuevas audiencias receptoras de la cos que dominan el oficio, los modos de hacer las
informacin se incorporan y modifican el escenario. cosas en el campo sujeto a observacin. Nos referi-
Por su parte, las tecnologas de la informacin y mos a ellos como la gente del oficio en el captulo V.
comunicaciones (TIC) aportan una capacidad de alma- Esta denominacin tiene la intencin de destacar el
cenamiento, proceso y distribucin de datos tan im- aspecto del proceso estadstico irreductible a los l-
portante, que le dan nombre a la poca como era de mites de la ciencia. Muchos prefieren hablar de arte,
la informacin. Esa capacidad y abundancia, requiere considerando que como toda ciencia de lo artificial,
18 19
H u go O scar A m b rosi A p ren d er con los d atos

contiene una componente de diseo que debe ser su- instrumentos del lenguaje), las personas participantes
ficiente para el objetivo buscado, por encima de una (encuestadores) son algunas de las fuentes de esos erro-
excluyente razn, en la eleccin de los medios y de res sistemticos. Como se puede notar, las desviacio-
las formas tcnicas. nes resultantes son difciles de identificar y de medir.
En Del todo a la parte (captulo VI) se consideran A continuacin, en Preguntas y respuestas (cap-
los lmites de lo observable. En primer lugar, se re- tulo VII), se plantean los problemas relacionados con
quiere la determinacin del objeto de observacin que la preparacin de un cuestionario. Las preguntas abier-
est formado por los elementos cuyas caractersticas tas y cerradas, el orden en que se expresan los temas,
son de inters. Ese conjunto o fuente de los datos, las expresiones verbales o fraseo, son algunos de los
que llamamos poblacin, puede ser tanto los tornillos problemas que presenta la medicin mediante cues-
de un proceso de manufactura como los votantes en una tionarios.
eleccin. En el captulo VIII nos detendremos en los aspectos
Por distintas razones, la poblacin de proveedores no numricos de los datos. Aspectos que se manifies-
muchas veces no puede ser inspeccionada exhausti- tan con toda su riqueza y la ambigedad del lenguaje
vamente. Razones de costos, urgencia, naturaleza corriente. Ese captulo servir de introduccin a las cues-
destructiva de los ensayos, obligan a tomar slo una tiones vinculadas con el cuestionario como instrumen-
parte, algunos elementos de la poblacin. Cmo ele- to de observacin propio de las aplicaciones sociales.
gir los objetos a observar o medir? La respuesta es El sistema de medicin est formado por 4 compo-
clave en el edificio de la estadstica, ya que debe resol- nentes: el Objeto medido, el Instrumento de medicin,
ver el problema de lograr que la muestra parcial re- el Sistema de referencia o Patrn de comparacin y el
presente bien a la poblacin que reemplaza. Operador, o encargado de poner en relacin a los otros
Los principios puestos en juego y los procedimien- tres componentes. Resulta bastante obvia la forma en
tos se organizan en torno al concepto central de que esos componentes se corresponden con los ele-
muestreo estadstico. El resultado de la aplicacin de mentos que se analizan en este trabajo.
los mtodos estadsticos de muestreo, recibe frecuen- Al decidir las caractersticas que se van a someter
temente el nombre de muestra probabilstica, aunque a observacin, se cierra una frontera, que separa lo
es ms amplio que eso. que est dentro del campo de observacin de todo lo
La ventaja del muestreo estadstico, es que permite dems.
medir el error que se comete por relevar slo una par- Los datos que sean obtenidos, organizados, compa-
te de la poblacin. Esa cantidad recibe el nombre de rados, clasificados dentro de esa clausura, estarn ro-
error de muestreo. deados siempre por todo lo que ha quedado afuera
Ese error suele ser menor que otros que se pueden pro- Por eso importa saber qu pasa en el contexto, mien-
ducir, aun si el conjunto es observado exhaustivamente. tras estamos observando lo que cae dentro de nuestro
Los instrumentos fsicos utilizados, los cuestionarios (como campo. De esos temas trata el captulo IX.
20 21
H u go O scar A m b rosi A p ren d er con los d atos

La hiptesis subyacente es que puede separarse la Un estereotipo es una imagen mental muy simpli-
realidad en partes, que es posible aislar unas de otras ficada y con pocos detalles acerca de personas o cosas
y determinar cmo se influyen entre ellas dentro de que comparten ciertas cualidades caractersticas o
esa clausura artificial. Si se pierde de vista que se trata estereotpicas. Los estereotipos son clichs que im-
nada ms que de un recurso metodolgico, el insistir plican personajes o situaciones predecibles. En con-
en esa direccin conduce a una concepcin empobre- secuencia, estn muy cerca de los prejuicios, o sea de
cida y deformada de la realidad, resultante de una vi- las afirmaciones que se hacen sin razonar, sin tomar
sin tnel, incapaz de asomarse a la complejidad. en cuenta la experiencia, los datos.
Ver el bosque, aprender con los datos, ir del todo a Por eso es necesario establecer reglas y criterios
la parte, descubrir el secreto que est en las palabras, claros para extender las conclusiones ms all del
la visin tnel, resumen la primera parte del camino. cuadro de los datos estrictamente observados. Cmo
La transformacin estadstica de los datos, es un inferir conclusiones generales que abarquen los ca-
proceso que se puede considerar de revelacin. Eso se sos no observados?
trata en el captulo X. Siguiendo la imagen de lo que Los mtodos que propone la Estadstica han demos-
ocurre en el laboratorio fotogrfico, T. Salvemini utili- trado, al aplicarse en diversos campos y circunstan-
za la expresin revelacin estadstica para identificar cias, que son robustos y confiables.
la emergencia de los valores estadsticos de posicin, Establecidas las conclusiones generales, la siguiente
de tendencia central, de dispersin, de asociacin o fase es interpretarlas, extraer el sentido que contie-
correlacin. nen los resultados. Un primer paso busca dar razones
Existen muy buenos libros donde estudiar como re- de las diferencias encontradas, mediante la compara-
velar los datos, por lo que no se darn demasiados deta- cin (captulo XII).
lles en relacin con el clculo de esos valores. Se pondr Debe hacerse una distincin inicial que permita se-
el acento, en cambio, en el razonamiento estadstico. parar las diferencias propias de la variacin natural,
Veremos en el captulo VI, que los datos sern siem- del trepidar de las cosas, de las que son consecuencia
pre parciales e incompletos. Cmo apoyar en esa base de causas especiales, de caractersticas diferentes de
imperfecta, conclusiones que se puedan proyectar so- los grupos que se comparan. A stas se las llama
bre toda la poblacin objeto de inters? En De la par- estadsticamente significativas.
te al todo (captulo XI), reflexionamos sobre esta fase Pero aun en el caso de que, con una muestra suficien-
crtica del proceso estadstico. temente grande, las diferencias puedan ser estads-
La generalizacin de los resultados observados es ticamente significativas, es posible que desde el punto de
uno de los actos ms comunes en la vida cotidiana. vista clnico, la diferencia encontrada, no represente ven-
Pero como dice la sabidura popular, las generaliza- taja para ninguno de los tratamientos comparados.
ciones siempre son malas, o por lo menos peligrosas. Esto deja al descubierto, que no hay forma de que
Es el peligro de caer en un estereotipo. la Estadstica por su cuenta determine la significacin
22 23
H u go O scar A m b rosi

o no de una diferencia, excepto en cuanto a su mag-


nitud en relacin con la precisin de la estimacin
hecha. CAPTULO II
En el captulo XIII, nos referimos al otro gran tema
del conocimiento. Por qu? Por qu causas se pro-
Razones
ducen los cambios observados? Una vez ms vamos a
subrayar las limitaciones de nuestras conclusiones.
Nada hay ms peligroso que un amigo ignorante;
En este caso nos valemos de la imagen de la ventana
es mejor un enemigo razonable.
de observacin.
La orientacin y el tamao de la ventana son inevi- Jean de la Fontaine
tables consecuencias del punto de vista desde el que
se hacen las observaciones, y del conjunto de decisio-
nes que se han tomado, desde el momento en que se
decide hacer un estudio o investigacin. Por qu tenemos que hablar de la Estadstica?
Nuestras explicaciones son estrictamente locales. Porque
Suponemos algn tipo de contacto entre las variables cuando se anuncia un nuevo tratamiento para al-
que son observadas. Queda recludo lo remoto y lo guna enfermedad, detrs est el mtodo estadstico
inobservable. respaldando los resultados.
Finalmente, el captulo XIV, bajo el ttulo de La cuando se leen las noticias deportivas, buena
Dama de la Lmpara rescata la figura de Florence parte de ellas son datos de los equipos o de los
Nightingale como modelo de aplicacin de la informa- jugadores.
cin para impulsar cambios sociales. Los grficos y el los ndices de precios, la tasa de desocupacin, la
lenguaje son los medios apropiados para iluminar y matrcula escolar, manifiestan la actividad estadstica
convencer, habida cuenta de las limitaciones de la del Gobierno.
demostracin en sentido estricto. el control de la calidad en la industria, es otro
campo destacado de la Estadstica.
Nuestra sociedad recibe constantemente aportes de
la estadstica para su funcionamiento. Sin embargo,
no todas son adhesiones y complacencia. Quien elija
la opcin de aprender con los datos pronto tropezar
con diversas dificultades. En su camino deber supe-
rar los obstculos puestos por los intereses creados,
los celos, las fobias y el egosmo, que reflejan las fla-
quezas de la naturaleza humana.
24
H u go O scar A m b rosi R azon es

De esos factores negativos surgi la frase: Hay tres Por qu se ha armado tanto alboroto con la Esta-
tipos de mentiras: las piadosas, las crueles y las esta- dstica? Por qu perduran visiones tan opuestas so-
dsticas, que convierte la lucha entre la Estadstica y bre ella? Por qu muchos toleran el Censo estads-
las mentiras, en una difamatoria y discepoliana con- tico, pero rechazan el razonamiento estadstico?
fusin. Cuando se comprueba que la accin de contar, pri-
Para no caer en alguna trampa, debe fijarse clara- mer paso en el proceso de observar estadsticamente
mente su verdadera naturaleza, como herramienta que la realidad, no puede agotar siempre la incgnita, por
sirve para abrir el camino en la bsqueda de la ver- limitaciones de medios, de tiempo o de los mismos
dad. El saber estadstico singular se diferencia de las objetos contables, en ese momento emerge la estima-
mltiples estadsticas, presentes en la masa de da- cin estadstica como solucin, frente al Censo inal-
tos que nos agobia en los medios de prensa. La Esta- canzable.
dstica determina las estadsticas adecuadas, como La relacin entre la realidad y los hechos por un
la Medicina selecciona las medicinas tiles a cada lado, con las normas y las decisiones por otro, se arti-
paciente. cula mediante los datos, de cuya produccin y manejo
Es preciso plantear desde el comienzo que, frente a se ocupa la Estadstica como ciencia de los datos. En
la realidad, nuestro razonamiento slo puede escoger consecuencia, su campo de inters se extiende sobre
ineludiblemente, como soporte de sus conclusiones, una gran diversidad de materias.
entre los datos, las ancdotas o los dogmas. La medicina, el derecho, la poltica y la ingeniera,
Es decir que, o nos ponemos de acuerdo sobre qu entre otros campos, aprovechan el apoyo que propor-
datos necesitamos, los reunimos y los analizamos, con ciona el conocimiento estadstico. Eso ocurre porque
procedimientos objetivos y transferibles, haciendo de ella se ocupa tanto de la forma en que pensamos los
la observacin una ciencia, o quedamos a merced de problemas, como de la manera en que aprovechamos
los fundamentalismos discrecionales, incorregibles y los datos disponibles.
cerrados en s mismos, imposibilitados de alimentar La estadstica nos proporciona un mbito exterior a
cualquier reflexin e intiles como va de aprendizaje. nosotros, un espacio objetivo y neutral, donde nues-
La clave de bveda de este planteo es el reconoci- tro pensamiento puede ser sometido a crtica y com-
miento de que todos hacemos estadstica en nuestras parado con el de otros, ordenando el debate y facili-
vidas, y que el saber estadstico nos puede ayudar a tando el acuerdo entre los distintos actores, lo que
sacar provecho de nuestra experiencia. Es una cues- refuerza los cimientos de nuestra accin colectiva. Tan-
tin de principio y no solamente de prctica y de teo- to en la industria como en el gobierno, en la salud, la
ra. Adems, demanda el compromiso de todos para educacin y el trabajo.
ser mejores en lo que hacemos, en nuestra conducta, La Estadstica es una parte esencial de la naturale-
en la convivencia, sacando provecho del pensamiento za humana. Integra nuestro equipamiento porque sim-
de conjunto estadstico. plemente hacer estadstica, o sea estimar magnitudes
26 27
H u go O scar A m b rosi R azon es

o riesgos, es algo inherente a nuestra naturaleza. Es- nacidos durante un ao en la Ciudad Autnoma de
tadstica es el nombre que le damos a la experiencia. Buenos Aires. Esa masa total se puede dividir en ma-
Basta para comprobarlo que nos detengamos en cier- sas parciales, considerando los nacimientos por mes,
tas expresiones comunes: o segn el sexo. Una masa estadstica corresponde
al concepto lgico, en el que se condensan las repre-
sentaciones individuales.
P - C u n to tard as en llegar al tra- En la segunda fase se revela el contenido de esa
b ajo? E stim u lacin p u n tu al.
R - A lred ed or d e 2 0 m in u tos.
masa de datos, mediante relaciones de distinto tipo.
Con las caractersticas observadas en las unidades se
realizan operaciones de comparacin, clasificacin, or-
P - Q u p recio tien en los tom ates?
R - E l sb ad o, en la feria, estab an
denamiento, mediante cifras relativas. Es el reino de
E stim u lacin p or in tervalo.
en tre $ 3 y $ 3 .5 0 . los porcentajes.
Los resultados permiten formular juicios sobre las
P - C u n to ped s p or tu viejo au to?
relaciones entre los elementos observados y el con-
V alores extrem os.
R - N o m en os d e $ 1 8 0 0 . junto total al que pertenecen. Otros valores son crea-
dos en ese momento, para reflejar el alcance general
P - T e exim s en tod as las m ate-
de la evidencia reunida. Por eso se suele decir que esta
rias? E xtravagan te. In flu en cia. fase cumple las funciones del juicio en la lgica.
R - B u en o, en m atem ticas n ece- La estimacin estadstica es la fase correspondiente
sito u n 9 y en qu m ica u n 1 1 !
a la etapa de razonamiento. Es el momento en que se
pasa de la parte al todo, como en el caso de las en-
P -C m o an d a el trab ajo? cuestas por muestreo. La comparacin, la generaliza-
R - Y , p or ah ora en tran 2 3 clien - F recu en cia (in tervalos).
tes p or d a.
cin, la explicacin y la prediccin forman el ncleo
esencial del razonamiento estadstico.
Esa estadstica natural de la que estamos hablan-
P - C u l es la p rob ab ilid ad d e qu e
h oy llu eva?
do, se ha ido modelando a lo largo del tiempo. Desde
C h an ce - p rob ab ilid ad .
R - 60% . la antigedad se encuentran aplicaciones de concep-
tos estadsticos, como el promedio y el rango. Entre
hindes y griegos ya utilizaban la media, el modo, los
valores extremos. Por ejemplo, la maniobra para cons-
En todos los casos podemos comprobar que se atra- truir las escaleras que permitieran penetrar las de-
viesan tres etapas. En la primera se recoge una masa fensas troyanas por sobre sus murallas, signific la
de datos, en la cual se renen todos los valores o las estimacin de la altura de las defensas, en base a la
modalidades individuales. Por ejemplo la cantidad de cantidad de ladrillos y la altura de cada uno de ellos,
28 29
H u go O scar A m b rosi R azon es

estimados a la distancia por varios observadores, se- desocupacin, la pobreza y por ltimo nuevamente
gn relata Homero. el IPC (ndice de Precios al Consumidor).
Por otro lado tenemos la antigua tradicin de los Es muy posible que la orientacin que sigui la es-
censos, promovidos con el objeto de reclutar soldados tadstica desde principios del siglo XX, haya influido
y recaudar impuestos. Como aquel recuento del Em- en esa imagen social y en la percepcin generalizada
perador romano, que convirti a Beln en el lugar de de su naturaleza. El necesario proceso de matema-
nacimiento de Jess. tizacin en su maduracin como ciencia se aceler, y
El comercio y la navegacin contribuyeron al desa- llev al desarrollo de la estadstica matemtica, que
rrollo de la medicin, base esencial de la estadstica. alcanz un poder imperial, en el campo de la prctica,
Esos antecedentes se agrupan, segn los casos, bajo la investigacin y la enseanza.
alguna de las visiones de la estadstica y corresponde- Se produjo el distanciamiento entre el pensamiento
rn, respectivamente, ora a la estadstica como razo- y los datos. Hubo un vuelco hacia los modelos tericos
namiento, ora al censo como observacin y clculo. que, bajo supuestos ms o menos realistas, podan re-
Los datos censales en los tiempos modernos for- presentar el comportamiento de las observaciones.
man la base del sistema representativo de gobierno, Esa estructura lgico-matemtica se present como
dando razn de la distribucin de las bancas de los una potente herramienta con la cual se podan atacar
representantes legislativos. los ms diversos problemas. Los conocimientos nece-
En tales registros obran las pruebas del lento avance sarios para aplicarla la convirtieron en dominio de ex-
de los principios republicanos. La Constitucin norte- pertos, que la dotaron de poderosos mtodos y logra-
americana reconoca a los negros un peso estadstico ron aplicaciones de mucho valor. Pero sus
de solamente 3/5 respecto a un blanco, mientras los procedimientos crecieron en complejidad y en nme-
indios no estaban siquiera incluidos en la cuenta. Al ro, de tal manera que muy pocos y excepcionales sa-
no pagar impuestos, su valor sencillamente era cero! bios conservaron la visin del conjunto y la capacidad
Viejas culpas de la estadstica? Tal vez... de identificar la herramienta adecuada, dentro de un
La mencionada subestimacin de los negros, re- arsenal tan abundante.
quiri una sangrienta guerra civil para cambiar las so se reflej en dificultades en la enseanza, que
cosas. Acaso lo que cambiaba era solamente una me- se volvi abstracta para abarcar un campo cada vez
todologa? ms extenso. Las aplicaciones cayeron a una catego-
Qu ha pasado, para que hoy exista una imagen ra secundaria, quedando postergado el objetivo prin-
de la estadstica que la presenta como abstracta, dif- cipal, que era la resolucin de problemas reales.
cil y aburrida por un lado, y por otro se multipliquen William S. Gosset, el inolvidable Student, nos leg
las dudas y los debates sobre los resultados estads- un modelo paradigmtico de lo que es un estadstico en
ticos? En nuestro pas, primero fueron las discusio- accin, resolviendo problemas sin importarle desvelar a
nes en torno al costo de la vida, despus sobre la algunos, que se preguntaban si era un cervecero que
30 31
H u go O scar A m b rosi R azon es

haca estadstica o un estadstico que trabajaba en Alguna vez se ha preguntado, por qu se llama
una cervecera. como se llama, el Instituto Nacional de Estadstica y
Los datos no nos son dados. Es necesario cons- Censos? Acaso los censos no son tambin estadsticas?
truirlos. No existe un desocupado, o un nacido vivo, o La metfora preferida para
R E C O L E C C I N D E D A T O S
un inmigrante, hasta que no se describen y corrobo- describir el censo, es la de una
R E V E LA C I N
ran las condiciones que deben llenarse para que se foto instantnea. Esa foto,
R E P R E S E N TA C I N
pueda considerar la existencia de esas entidades y apenas revelada, muestra una
R E L A C IO N E S
consecuentemente, contarlas o medirlas. imagen histrica del objeto re-
A continuacin, se plantea la medicin de la deso- flejado, que a medida que pasa el tiempo se diferen-
cupacin, y en ese proceso podemos ver cmo se van cia ms y ms de la imagen grabada. Y as la esta-
desplegando sucesivos refinamientos, cuya necesidad dstica censal se equipara con la Historia, a la que
no es evidente al principio. proporciona materiales. Pero es poco lo que podra
decir respecto al presente y al porvenir, con el solo
apoyo de esas constancias histricas. Con el paso
Q u in est d esocu p ad o?
E l qu e n o trab aja...? de los aos, cada vez es ms difcil reconocerse en
el DNI!
Y si n o qu iere trab ajar?
E l qu e n o trab aja p ero qu iere tra b a ja r...? Esto deja al descubierto el problema esencial de la
estadstica: cmo superar los lmites de los datos, con-
Y si h a trab ajad o 1 h ora?
E l qu e n o trab aja p ero qu iere trab ajar m s d e 1
finados en su alcance por su definicin, por su anti-
h ora ...? gedad, o por su parcialidad?
Resolver ese problema es trascender las limitacio-
S i n o trab aja p ero qu iere trab ajar m s d e u n a h ora...
Y ya tien e u n con trato qu e em p ezar den tro d e 1 m es! nes de la evidencia. Es avanzar en la bsqueda del
sentido y el significado de nuestro conocimiento im-
perfecto. Fatalmente imperfecto.
Este ejemplo, pone en evidencia las dificultades que Como dijo Samuel Butler: La vida es el arte de sa-
se presentan en la definicin de qu se quiere medir car conclusiones suficientes a partir de datos insufi-
y al mismo tiempo deja en claro tambin, que la solu- cientes. Pero, cmo se puede hacer eso?
cin que se adopte ser siempre una solucin de com- Es un problema que no tiene solucin cuantitativa.
promiso, convencional, y por lo tanto discutible. Es decir, no es suficiente agregar ms recursos que se
En consecuencia, toda vez que se presenten resulta- conviertan en censos ms frecuentes o encuestas cada
dos deber decirse expresamente bajo que convencin vez ms grandes. Ya veremos que los errores comunes
se han obtenido. Las aplicaciones debern demostrar a censos y encuestas son difciles de tratar, y dismi-
que es razonable el empleo de esos datos, as defini- nuyen la atraccin ejercida por la presunta calidad
dos, en cada caso. fotogrfica de los censos.
32 33
H u go O scar A m b rosi R azon es

Tanto en uno como en otro caso se deben tener en recursos y la otra con la libertad, determinan que siem-
cuenta otros tipos de fallas como los errores de res- pre nuestros datos sean imperfectos, incompletos, li-
puesta, resultantes de los factores de la entrevista mitados. El ltimo enunciado reconoce un imperativo
(encuestador, cuestionario y entrevistado), que deben tico, por el cual se prohibe atravesar ciertos lmites en-
incluirse entre las fuentes de imperfeccin de los da- tre lo privado y lo pblico establecidos en nuestro acuer-
tos. En resumen, es inevitable que una relacin basa- do social bsico. El derecho a la privacidad se enfrenta a
da en el lenguaje est sometida a las generalidades la sombra amenazadora del Hermano Grande.
de malentendidos, ignorancia, engao, simulacin, re- Siempre estaremos, en consecuencia, frente al pro-
sistencia y negativa a contestar. Como dice Humberto blema de los datos imperfectos como soporte de nues-
Ecco: Si el lenguaje no sirve para mentir, tampoco tro sistema de aprendizaje y de decisiones. Frente a
sirve para decir nada. tantas dificultades, nos preguntamos sobre alternati-
Tal vez los censos podran llegar a informar algu- vas que reemplacen los mtodos estadsticos y apa-
nas escasas variables de tamao, como el total de ha- rentemente no hay otra solucin.
bitantes, si la sociedad aceptara establecer normas de La estadstica se ocupa de patrones generales, de
minucioso control y registro. Normas que resultaran representaciones de conjunto que no identifican a nin-
rpidamente cuestionadas como autoritarias e incom- gn individuo.
patibles con la libertad.
Si se ampliara el contenido de las cdulas censales, Puede ilustrarse la estrategia adoptada con las en-
se veran multiplicadas las amenazas a la privacidad y cuestas electorales, donde la expresin exhaustiva de
a la confidencialidad, que alarman a nuestras socie- las opiniones en las urnas, se reemplaza con el infor-
dades. Amenazas que se agravan cuando el objetivo es me anticipado sobre la presunta conducta de algunos
obtener informacin sobre individuos (personas, ho- pocos que se utiliza para inferir el comportamiento
gares, establecimientos, empresas). masivo en el acto electoral.
Las encuestas pueden ser llevadas a niveles de co- En consecuencia debemos trabajar para mejorar
bertura muy amplia. Para ser muy detalladas se aproxi- nuestro sistema estadstico de informacin. El pbli-
maran necesariamente a los censos, con lo cual, se co y el privado.
encontraran ante una doble dificultad, como resulta- Para ello, debemos reconocer que el eje central de
do de la accin del par de postulados siguiente: nuestro enfoque es el desarrollo de un pensamiento
Los costos de los operativos estadsticos ejecuta- crtico, basado en el razonamiento estadstico.
dos rigurosamente, son altos. El razonamiento recibir el auxilio del clculo esta-
Un sistema de registros exhaustivos en tiempo real, dstico. Pero no ser reemplazado nunca por ste ni
resulta intolerable para una sociedad abierta, en la que por las mquinas.
la esfera de lo privado est firmemente amparada. El razonamiento estadstico, es una forma sobresa-
Esas dos limitaciones, una relacionada con los liente de la argumentacin. Es el cultivo analtico, la
34 35
H u go O scar A m b rosi R azon es

ser presentados los nmeros para que resulte una com-


ciencia prctica desarrollada como sistematizacin del
paracin justa?
arte de valerse de la experiencia que, en su forma
original, se aloja en el lenguaje cotidiano.
Una revista interrog a sus lectores sobre distintos
Debemos aceptar que, como le pasaba a Mr.
temas de sexo y violencia en la televisin. De los 65.142
Jourdain con la prosa, frecuentemente razonamos
lectores que respondieron, el 97% estaba muy o algo
estadsticamente, en una forma espontnea, sin la
preocupado por la violencia en la TV. Basado en esta
intermediacin del clculo.
encuesta, puede usted concluir que el 97% de los
Un productor de seguros, en oportunidad de un
ciudadanos estn preocupados por la violencia en TV?
curso de capacitacin, dejo or lo siguiente:
Intente pensar por qu s o por qu no.
Todos sabemos qu es un promedio, hasta que
nos quieren explicar la frmula!
Eso es bueno, porque nos asegura que todos tene-
mos el sentido de los valores de conjunto. Pero, por
otro lado, nuestro sentido comn, puede ser auxilia-
do beneficiosamente con el anlisis y la reflexin, para
no caer en trampas, cuando a veces no procesa co-
rrectamente la informacin.
Los censos, los seguros martimos, los juegos de azar,
la mortalidad, las encuestas, el control de calidad, son
hitos histricos que jalonan el desarrollo de la pro-
duccin estadstica y del clculo estadstico.
Hoy la sociedad de la informacin y del riesgo, es
una oportunidad y una exigencia para aplicar los me-
jores procedimientos de opinin y decisin, y en esa
direccin espero que contribuyan estas pginas.

Preguntas para pensar


Suponga que usted leyera que la mayora de los
egresados universitarios que se volvieron millonarios,
perteneca a la universidad ms grande del pas, en
detrimento de las pequeas universidades de la zona.
Sera esa una comparacin correcta? Cmo deberan
36 37
CAPTULO III
El escenario

La vida social de la Estadstica


La informacin estadstica no es el resultado de un
algoritmo ni la solucin de una ecuacin. Es el pro-
ducto de un proceso social del que participan distintos
personajes, que se relacionan entre s bajo la influen-
cia de diversos factores ideolgicos, sociales, polticos
y econmicos. La ms variada gama de intereses y
emociones enerva esas interacciones. En medio de
ellas transcurre la vida social de la estadstica.
Como todas las tcnicas, no puede ser calificada ni
de buena ni de mala, dado que solamente la inteli-
gencia y la voluntad de quienes la utilizan, produci-
rn buenos o malos resultados.

Datos, mentiras y video


Las cifras hablan por s solas. Los nmeros no
mienten. Son frases que se escuchan con frecuencia
y quedan atrapadas en la ambigedad de las verdades
a medias.
Veremos ms adelante, la compleja configuracin
de los datos.
H u go O scar A m b rosi E l escen ario

Por ahora nos bastar con tener en cuenta la evi- Para destacar esas influencias, Moore seala: los
dencia que nos seala que son los hombres los que datos estadsticos lo son en un contexto.
equivocan la interpretacin de los datos, a veces sin
intencin, o admitiendo silenciosamente datos defec- Objeto de la Estadstica
tuosos, o ya con total alevosa y mala fe, deforman los
resultados para forzarlos a mentir, con la tramposa El proceso estadstico se desarrolla con el objeto de
intencin de sacar ventajas o de daar. resolver problemas relacionados con el conocimiento
Los errores de buena fe pueden ocurrir por fallas del mundo, con las creencias de la gente en las bon-
involuntarias, originadas en la imperfeccin de los pro- dades de ciertas acciones o productos y con la toma
cedimientos o del razonamiento, a pesar de que este- de decisiones. Para comprender los flujos de informa-
mos honestamente encaminados a explorar algn cin resultantes, es menester reunir ciertas habilida-
aspecto de la realidad. des o ser lo que se ha dado en llamar estadsticamente
Por otro lado, siempre est abierta la posibilidad letrado.
de manipular, de mala fe, la informacin mediante la Esto no implica estar especialmente entrenado en el
ocultacin, la fragmentacin o sacndola de contexto, clculo estadstico, sino disponer de la capacidad para
para alcanzar alguna ganancia, evitar un dao o me- entender, interpretar, comprender, argumentar y comu-
ramente demostrar poder. Entre la verdad y el engao nicar el significado y el sentido de la informacin.
nicamente se levanta la barrera moral. Esto significa que, todos y cada uno de nosotros,
La desinformacin que consiste en la multiplicacin tenemos que atender un flujo permanente de infor-
de mensajes contradictorios, vaca de significado a la macin, que debe ser leda cuidadosamente, analiza-
informacin, lo que es aprovechado maliciosamente da e interpretada. En algunos casos, incluso tambin
por una amplia gama de pcaros, ambiciosos, tenemos que producir nuevos datos.
inescrupulosos o simples oportunistas, que prospe- En este momento histrico estamos en medio de
ran a la sombra de las verdades a medias, consecuen- un cambio en la forma de considerar a la estadstica,
cia perversa de la informacin conculcada. con respecto a la concepcin dominante durante la
En nuestra poca estamos participando de lo que segunda mitad del siglo XX.
se ha dado en llamar Era de la Informacin. Y en Este cambio no solamente es de inters para los
este tiempo, los medios de prensa ocupan una posi- estadsticos, sino que su influencia alcanza plenamente
cin central, clave en el proceso de distribucin de la al resto de la sociedad. Porque se trata de devolver la
informacin. Estadstica es un proceso que incluye di- estadstica a su centro de inters en los fenmenos
versos aspectos tcnicos, sistemticos e histricos y, sociales, balanceando el ambicioso programa de
en consecuencia, es el resultado de mltiples factores abstraccin matemtica que se desarroll durante
que influyen en la validez de los resultados finales de buena parte del siglo pasado, con la fsica social
ese proceso. que contribuya a mejorar la marcha de la sociedad

40 41
H u go O scar A m b rosi E l escen ario

democrtica. Ese cambio del eje de inters, se conju- los roles del autor, el lector y el crtico. El idioma se
ga con el reconocimiento de la complejidad del pensa- nutre de los aportes de todos ellos, pero fundamental-
miento, de la produccin y del anlisis estadstico. mente de la prctica viva de la lengua en los distintos
Qu importancia tiene ese giro? Pues nada menos escenarios de la vida.
que permitir que todos intervengan en la conversa- Esta nueva situacin determina, por un lado, la ur-
cin cuantitativa. Que se imponga la necesidad y el gencia de una renovada alfabetizacin que provea la
derecho a la interpretacin de los datos, para que la habilidad para entender y dar sentido a la informa-
comprensin sume valor y fortalezca la amalgama so- cin que recibe el ciudadano, y capacitarlo para ejer-
cial. Solo mediante la ms amplia participacin se po- citar un pensamiento crtico.
drn alcanzar los niveles de confianza que requiere Por otro lado, requiere el cultivo de las competen-
una sociedad libre, prspera y justa. cias profesionales, que otorguen las habilidades orto-
Distintos autores sealan que se han producido grfica y sintctica necesarias para producir textos es-
grandes cambios en varios aspectos de la sociedad en tadsticos inteligibles y significativos.
los que se desarrolla la actividad estadstica.
En primer lugar ha cambiado la audiencia de la Revolucin informtica
estadstica. El pblico que participa del proceso de
comunicacin estadstica ha crecido. Cada vez est ms La revolucin informtica nos coloca en una posi-
claro que al ncleo histrico de las personas relacio- cin novedosa. Hoy enfrentamos las exigencias que
nadas con el hacer estadsticas, hoy se le suma un imponen al razonamiento los enormes bancos de da-
creciente nmero de ciudadanos que reciben infor- tos, que atesoran la ms diversa informacin.
macin estadstica como parte de las noticias del da. Al mismo tiempo, la tecnologa pone en nuestras
Se reconoce que los analistas de informacin, como manos instrumentos que nos facilitan las cosas de ma-
planteaba Rifkin en El Fin del Trabajo, constituyen nera insospechada pocos aos atrs.
legiones cada vez ms numerosas. Para tener una perspectiva de los cambios tecnolgicos
En esa audiencia cada vez ms amplia participan dentro del campo de la estadstica, simplemente recorde-
adultos, que tal vez nunca harn estadsticas en el mos que Ronald A. Fisher utiliz, en los aos 20, uno de
sentido que stas pueden tener para un estudiante los ms poderosos ingenios del clculo de esa poca: una
universitario en su proyecto de tesis o de investiga- calculadora Millionaire a motor, la primera que efectuaba
cin. Sin embargo existe una conciencia creciente de la multiplicacin directa. El omnipresente teclado redu-
la importancia para la vida de cada uno, y para el con- cido tiene menos de cuarenta aos.
junto de la sociedad de los resultados estadsticos: cen- Un enorme avance tecnolgico hoy pone en nues-
sos, encuestas, ndices, etc. tras manos calculadoras, computadores, software y una
Esa renovada audiencia estadstica, pone en eviden- red mundial que contiene y permite compartir datos,
cia la necesidad de diferenciar, como en la Literatura, mtodos y recursos.
42 43
H u go O scar A m b rosi E l escen ario

El uso de las calculadoras se ha hecho universal y Estadstica es razonamiento y clculo. Razonamiento


muchos modelos de bajo precio poseen teclas espe- como arte de la argumentacin, a la que todos debe-
ciales para calcular la media, el desvo estndar, etc. mos recurrir en la convivencia social. Clculo como
El acceso a las computadoras tambin es amplio y prctica artesanal, que nos auxilia y facilita la organi-
generalizado. Ya no es necesario poseer una compu- zacin de los argumentos.
tadora, es suficiente contar con una moneda y acce- La estadstica tiene una dimensin digital y otra
der a uno cualquiera de los numerosos cibercafs analgica. A los efectos de la tecnologa de las herra-
que han proliferado por todas partes, aun en los pue- mientas estadsticas, las formas digitales y los
blos ms pequeos. Es la demostracin palpable de algoritmos son dominantes.
que la sociedad llamada del acceso, por Rifkin, est Desde el punto de vista de la comunicacin, de la
presente. interpretacin y de la comprensin, las formas
analgicas, grficas y visuales constituyen el soporte
Las herramientas privilegiado.
Histricamente, era necesario enfrentar con fre-
Programas como las hojas de clculo electrnicas cuencia la falta de informacin frente a variadas y cre-
(Excel), tienen capacidades y funciones de clculo es- cientes necesidades. Eso provocaba un estado de ten-
tadstico. No caben dudas que constituye la ms im- sin entre la efectiva disponibilidad de informacin
portante extensin de la capacidad de procesamiento
suficiente y el problema de las restricciones de tiem-
y clculo, no slo por las funciones que incluye, sino
po y oportunidad.
por el carcter universal de su distribucin y del co-
Esa fue la situacin del ama de casa a quien algn
nocimiento de su manejo.
funcionario aconsej una vez que antes de comprar
Los programas estadsticos ms populares (Minitab, averiguara precios. A cuntos lugares tiene que ir?
SPSS), estn basados en mens, a travs de los cua- Cunto tiempo puede dedicarle a esa investigacin?
les se eligen los procedimientos y las opciones que se Y cmo decide despus? Y si donde estaba barato
quieren emplear en un anlisis estadstico. Esto faci- no tienen ms cuando ella llega, exhausta con su
lita las cosas a quienes realizan espordicamente es- changuito vaco?
tos trabajos y que, por consiguiente, tienen dificulta- La informacin es costosa, hay que buscarla espe-
des para utilizar los sistemas basados en lneas de cialmente y el proceso es muy lento.
comando, o interfase de texto, que exigen recordar los La escasez de datos ocupa la escena cuando se es-
nombres y las reglas del lenguaje. tudian nuevos productos, cuando se trata de estimar
A estos elementos debemos agregar la nueva condi- relaciones causa-efecto o cuando lo que se requiere
cin de nodos vinculados en red, que irrumpe con es informacin sobre la actualidad o el futuro. Ese
Internet. No puede negarse el impacto de esta nueva hecho condiciona la eleccin de los mtodos y proce-
situacin de no estar solos, a ninguna hora del da. dimientos a seguir.
44 45
H u go O scar A m b rosi E l escen ario

Con la proliferacin del procesamiento electrnico La biblioteca del Congreso de USA en mayo de 2007
de datos surgi un escenario diferente. La base de este ya haba acumulado 70 TB de material originado en
cambio es la nueva capacidad de dejar registradas to- Internet.
das las caractersticas, simultneamente, con la ejecu- El procesamiento electrnico de datos (PED), ha he-
cin de la accin primaria. Esto ha sido posible por la cho posible la rpida acumulacin de enormes vol-
facilidad del procesamiento de datos y el enlace en re- menes de los mismos. La captura directa de mltiples
des. Baste como ejemplo la actividad bancaria que uni- transacciones y los distintos procedimientos de
da al sistema de tarjetas de crdito, de compra, etc., ha digitalizacin, han crecido de manera impresionante.
hecho posible, la observacin en vivo de buena parte
de la economa. Este escenario de abundancia es el de Oportunidad
las grandes bases de datos de los sistemas de tarjetas de
crdito, los cajeros automticos o los supermercados. Cuando enfrentamos situaciones de aguda crisis y
Nuestro paso por el supermercado, deja una huella de- profundos cambios, como los sufridos por la sociedad
tallada del contenido del carrito, que se agrega a los re- argentina en los ltimos aos (1990-2000 y 2001 a la
gistros de anteriores compras. La tarjeta magntica que actualidad), se hace imprescindible recurrir a todas
me permite participar de los sorteos, es la que vincula las herramientas que contribuyan a orientarnos en la
todas mis compras, en una enorme base de datos. determinacin de los objetivos comunes a alcanzar, y
a organizar el pensamiento y la accin.
Son millones de transacciones registradas en for-
Y entre esos instrumentos, ocupa un lugar promi-
ma continua y que dan lugar a esas enormes bases.
nente el conocimiento de la realidad y el manejo de
Recordemos que 1 byte equivale al espacio necesario
reglas adecuadas de intercambio y convalidacin de
para guardar 1 letra o 1 dgito, de tal manera que 1
ese conocimiento. Es decir estadstica en su doble fun-
terabyte puede contener ms de 3 millones de libros
cin como datos y como mtodo.
de 200 pginas. Y se habla de cientos o miles de
Las instituciones estadsticas deben adaptarse a las
terabytes, cuando se describe el tamao de algunas
exigencias actuales. Slo entonces, dichas institucio-
bases. El primer milln de bytes es el conocido
nes lograrn consenso y sern confiables en su capa-
megabyte que sirve para medir el tamao del disco
cidad de producir datos pertinentes, relevantes, vali-
rgido de nuestra computadora. Actualmente en reali-
dos, confiables y oportunos. Al mismo tiempo debern
dad, ya hablamos en unidades de mil megabytes: los
oficiar como central de difusin de una crtica es-
gigabytes. Los terabytes marcan el arribo al segundo
tadstica sana y necesaria, sobre la base de proce-
milln, en lo que se conoce como billn en la escala
sos participativos que generen resultados crebles
larga. Es decir al milln de millones de bytes.
y convincentes.
Los Archivos Nacionales del Reino Unido, superan
los 580 TB, como resultado de ms de 900 aos de
acumulacin de material escrito.
46 47
H u go O scar A m b rosi E l escen ario

Tenemos el poder! 1 gigab yte (G B ) S in fon a en son id o d e alta fid elid ad .


2 gigab ytes 2 0 m etros d e estan tera d e lib ros.
Es dificil concebir el enorme poder del que dispo- 2 0 gigab ytes A rch ivos d e au d io d e la ob ra d e B eeth oven .
nemos actualmente, en capacidad de almacenamien- terab yte (T B ) 1000 G B
to y recuperacin de datos. Nos puede ayudar hacer 1 terab yte T od as las p elcu las rad iogrficas d e u n h osp ital d e
algunas comparaciones con obras conocidas, sobre alta tecn ologa.
cuyo volumen podemos formarnos una idea. De esa 5 0 0 0 0 rb oles tran sform ad os en p ap el e im p resos.
manera daremos a los medios actuales toda la enorme 1 0 terab ytes C oleccin im p resa d e la B ib lioteca d el C on greso d e
importancia que tienen. E E .U U .
La unidad elemental de informacin es el byte, que p etab ytes (P B ) 10 00 T B
puede guardar un carcter: letra, nmero o signo de 2 p etab ytes T od as la b ib liotecas d e in vestigacin acad m ica d e
un conjunto de hasta 256 formas diferentes. El kilobyte E E .U U .
(KB) equivale a mil bytes y el megabyte (MB) a un exab yte (E B ) 10 00 P B
milln de bytes o 1000 KB. 5 exab ytes T od as las p alab ras d ich as algu n a vez p or los seres
h u m an os.
Las primeras computadoras personales (PC) tenan
discos duros del orden de los 10 MB; ahora la configu-
racin habitual de los equipos incluye discos de 50 a No acercamos a un nuevo umbral de tamao en las
120 gigabytes. El gigabyte (GB) es 1000 veces mayor unidades de almacenamiento en la PC: el terabyte (TB).
que el MB. En consecuencia, en un cuarto de siglo la Llegaremos cuando se alcancen los 1000 gigabytes o
capacidad disponible en una PC domstica ha pasado sea, al billn de Bytes!
de 10 MB hasta ubicarse entre 50.000 y 120.000 MB, En consecuencia, contamos con un poder iniguala-
que sin duda, es un crecimiento explosivo. do para manejar informacin. A eso se suma el cre-
Pero qu significan esos valores en trminos de ciente dinamismo de INTERNET, en la que una mayor
nuestra experiencia humana y personal? En el cua- velocidad de transmisin hace posible compartir da-
dro siguiente se presentan algunos valores compara- tos y aplicaciones efectivamente.
tivos, y se agregan otros mltiplos del byte.
Nuevas desigualdades y amenazas
U n id ad V alo r/E jem p lo
2 k ilob ytes P gin a d actilografiad a.
Las grandes bases de datos, que se mencionaron
5 m egab ytes O b ras com p letas d e S h ak esp eare;
ms arriba, ponen al alcance de sus administradores
3 0 segu n d os d e vid eo. un volumen de datos que hace pocos aos no hubi-
5 0 m egab ytes M am ografa D igital. ramos imaginado. El acceso a esas fuentes es codicia-
1 0 0 m egabytes 1 m etro d e estan tera d e lib ros. do y surgen nuevos negocios. El destino final del dato
2 vol m en es d e u n a en ciclop ed ia. brindado en algn ignoto formulario es imprevisible.
5 0 0 m egabytes C D -R O M Surge un conflicto entre el derecho a la privacidad y
48 49
H u go O scar A m b rosi E l escen ario

el poder de los medios de captura de datos. El hbeas La tecnologa mueve las fronteras de las capacidades
data, el derecho a saber que saben los dems de m, individuales y de las comunidades, pero no tenemos
llega a la Constitucin Nacional. que olvidar que la informacin tiene una vida, que est
Una gran asimetra entre las personas aparece como ineludiblemente inmersa en las relaciones sociales.
resultado de la concentracin del acceso a la informa- En medio de ellas se teje la trama del contexto, me-
cin y, en consecuencia, crece el riesgo de manejo diante el entrelazado del significado, el propsito y el
interesado. criterio. El significado que tiene toda representacin. El
Con qu medios cuenta una sociedad democrti- signo enlazando al significante y al significado, para con-
ca, para que este novedoso recurso sirva para mejorar sumar nuestro destino de hacedores de sentido.
el bienestar comn, y no solamente funcione como El propsito que moviliza y que constituye el ncleo
un multiplicador del poder de los sectores sociales y de toda decisin. Por qu se plantea el problema,
econmicos dominantes? Los problemas centrales en cul es la razn que lo dispara en el escenario?
este escenario son de representacin y de distribu- El criterio que juzga y valora en trmino de objeti-
cin. O de reduccin y de comunicacin. Y para ocu- vos y fines. Los valores definiendo el paso final de la
parse de ellos est especialmente calificada la estads- eleccin, el para qu determinante y ltimo...
tica. Frente al caos de la inmensa masa de datos, se Vamos a abandonar momentneamente el escena-
requiere toda la potente capacidad reveladora de sig- rio de la opulencia para dedicar nuestra atencin al
nificado de la estadstica. proceso generador de informacin, cuando la escasez
Tanto los almacenes de datos (datawarehouses), es duea de la escena.
como la minera de datos (data mining) son herramien- Necesito los datos!
tas que ayudan a organizar y aprovechar los grandes Con qu medios se cuenta para producir datos?
volmenes de datos. Brindan facilidades para el ma- Desde un punto de vista estrictamente tcnico-admi-
nejo de los mismos y la exploracin de relaciones. nistrativo: los censos, registros y encuestas por
muestreo constituyen las estrategias bsicas disponi-
Pongmoslo en el contexto bles de produccin de datos.
Actualmente la demanda refleja una necesidad de
El contexto en que est inmersa la informacin es informacin desagregada con gran detalle geogrfico y
tan importante como la informacin en s. Es posible actualizada con la mayor frecuencia posible. Para alcan-
morir de sed en medio del mar...! zar esos resultados hacen falta ingeniosas combinacio-
Seor, seor, dnde queda el mar? El pez nes de las estrategias bsicas mencionadas anteriormente.
pequeo le pregunta al pez grande. As una estrategia mixta que combine dos o ms fuen-
Por aqu no lo he visto, tal vez ms all...! le tes, constituye la clave de un diseo eficaz y eficiente de
contesta, mientras sigue nadando, el pez grande. un proceso estadstico en el que los registros, los censos
y las encuestas se articulen armnica y creativamente.

50 51
H u go O scar A m b rosi E l escen ario

Sin embargo, antes de avanzar en la revisin del La conclusin llega naturalmente:


proceso estadstico, es pertinente considerar algunos
conceptos que se usan indistintamente, pero que es Por lo tanto, el conocimiento tiene elementos
necesario diferenciar para mejorar nuestros modos de tanto subjetivos como objetivos. Para nuestros pro-
aprender y decidir. psitos actuales, podemos definir el conocimiento
como una creencia verdadera y justificada.
Datos, informacin y conocimiento
Antes de proseguir con el proceso de formacin del
Es conveniente tener en claro los conceptos de da- conocimiento, recordemos que no hace mucho, en una
tos, informacin y conocimiento. Hansson distingue de sus visitas peridicas a Buenos Aires, Jacob Ryten,
claramente de que trata cada uno y en qu orden de- destacado estadstico canadiense, tuvo expresiones que
bemos considerarlos. coinciden totalmente con Hansson. Dijo a La Nacin,
El conocimiento es un concepto complejo. En (...) si vamos a tomar una decisin basndo-
primer lugar, el conocimiento es una especie de nos en una estadstica, tenemos que saber que
creencia. Lo que uno no cree no puede ser conoci- hay algo de subjetivo que es inevitable. Por eso,
miento. Por lo tanto, si tengo acceso a una infor- debe exhibir criterios transparentes y explicables.
macin correcta, pero no creo en ella, para m no
constituye un conocimiento.
A los ignorantes los aventajan los que leen libros.
A stos, los que retienen lo ledo.
Esa primera definicin impacta porque rene dos A stos, los que comprenden lo ledo.
dimensiones que se nos ha enseado a considerar se- A stos, los que ponen manos a la obra.
paradas. Ms que separadas incompatibles. Saber y Proverbio Hind
creer. Pero la relacin que plantea Hansson no es sim-
ple. Veamos lo que contina diciendo:
Metabolismo
Por otra parte, las creencias incorrectas tampoco
Hansson hace el paralelo entre el metabolismo de
se pueden considerar conocimiento. Si alguien cree
la alimentacin y la transformacin de los datos en
que la Tierra es plana, est claro que no se trata de
informacin. Expresa as que el material debe ser asi-
un conocimiento. Adems, lo que se considera cono-
milable y asimilado. Siguiendo las transformaciones
cimiento tiene que estar justificado. Si alguien cree
que se producen desde el dato hasta el conocimiento.
que el nmero atmico del oro es un nmero primo
Es necesario cocinar los datos para que sean asimilables
porque cree que el ncleo del tomo del oro tiene 61
(como informacin), y cuando se los ingiere deben ser
protones, eso no es un conocimiento.
asimilados por el proceso de interpretacin, mediante el

52 53
H u go O scar A m b rosi E l escen ario

anlisis y la reflexin, que son como una buena meros datos. Sin embargo, no por ello la distincin
masticacin para la digestin. es menos importante.
Al respecto dice: Es lamentable que en la ciencia informtica, el cono-
cimiento y la informacin se empleen frecuentemente
Para que algo se considere como conocimiento como sinnimos. Quiz es por esto por lo que no siem-
tiene que ser integrado en el sistema de creencias pre se distingue claramente entre sociedad del cono-
del sujeto. Mientras estoy escribiendo tengo sobre cimiento y sociedad de la informacin.
mi mesa un libro sin leer que trata de los hbitos Precisamente la organizacin de los datos, segn
viajeros de los habitantes de Estocolmo. Esto sig- criterios que les otorguen sentido, es la nica va que
nifica que tengo acceso a la informacin sobre puede evitar que nos ahoguemos en bits. Por ese
este tema, pero no tengo conocimiento. motivo, para describir las caractersticas demogrfi-
Si leo el libro, entonces es probable que la in- cas de los porteos es ms informativa una tabla por
formacin se transforme en conocimiento. Ahora edad y sexo, que la gua de telfonos.
bien, esta transformacin de la informacin en
conocimiento, slo se producir si entiendo la in- Metamorfosis
formacin de manera que pueda integrarla en mi El paso de la informacin al conocimiento se logra
sistema de creencias de forma adecuada. transformando la naturaleza de la informacin. El co-
Si me aprendo el texto de memoria, sin enten- nocimiento es una estructura que le pone alas a la
derlo, entonces tendr informacin sobre el tema, informacin, mediante la conceptualizacin que le da
pero an no tengo conocimiento. sentido. Ese cambio puede verse como la metamorfo-
sis de larva en mariposa.
Los datos se diferencian de la informacin en que Los hechos observados se organizan y articulan en
no tienen que estar en una forma determinada, ade- conocimiento, sobre la base de la teora que los rela-
cuada para la asimilacin. Si en lugar del libro se tu- ciona, formulando las reglas sobre cmo funcionan las
vieran sobre la mesa los 10000 cuestionarios en los cosas.
que se basa, entonces se tendran datos en lugar de
informacin.
Simbiosis
En resumen, los datos tienen que ser asimilables
para que se puedan calificar como informacin, y de- El conocimiento implica creencia, y sta requiere un
ben ser asimilados para que se los pueda calificar de alto grado de seguridad (subjetiva).
conocimiento. La acumulacin masiva y extendida de informacin
En general, es difcil trazar una lnea clara de se- y, en menor medida de conocimiento, es una caracte-
paracin entre el conocimiento y la mera informa- rstica evidente de las sociedades actuales. Igualmen-
cin, y lo mismo ocurre entre la informacin y los te lo es la presencia de riesgos e inseguridades en

54 55
H u go O scar A m b rosi E l escen ario

cuestiones de debate pblico y en la adopcin de de- tambin imperfectas, con las cuales se producir una nue-
cisiones. va sntesis, creble y precaria a la vez.
Pero para llegar a la accin, es necesario que el co- En el esquema de Haeckel, se destaca la integra-
nocimiento fragmentado se articule simbiticamente cin de la evidencia a sucesivos marcos de referencia.
con el resto del saber, y bajo la gua de los valores, Haeckel propone un esquema, donde se justifica el
ilumine el camino a seguir. principio de ms por menos, con la revaloracin de
(...) cuando se trata de entender una sociedad (o la sntesis, en oposicin a la idea de que una funcin
una organizacin) mucho ms importante -y ms dif- de anlisis creciente es uniformemente beneficiosa.
cil- que saber cules son las ideas existentes en ella
es averiguar cules son sus creencias bsicas (Ortega Prueba, probabilidad, probanza
y Gasset). Las probabilidades son uno de los modelos que in-
Si la incertidumbre existe en el mundo real, es tentan representar los datos imperfectos. Pensamos a
una cuestin abierta. Sin embargo, cualquiera sea la la probabilidad habitualmente como una forma de lo-
respuesta, debe aceptarse que nuestra representacin tera. Pero cuando decidimos, estamos ms cerca de
del mundo, resultante de la informacin disponible, pensar la probabilidad como la capacidad de probar,
es incompleta. Los datos disponibles en un sistema de dar prueba de algo. Una acepcin de probable ms
de informacin siempre son imperfectos, de una ma- cercana a los tribunales que al casino.
nera u otra. Aunque las tendencias de ms informacin y ms
En esas condiciones es difcil que contemos con evi- inseguridad pueden parecer contradictorias, hay una
dencias suficientes para actuar. Para superar esos l- razn para que coexistan. La nueva informacin, es-
mites es que se producen largos procesos de anlisis, pecialmente la que nos brinda la ciencia, resuelve en
que vinculan teora y datos para cubrir la brecha de la ocasiones viejas inseguridades, pero va produciendo
evidencia insuficiente. otras nuevas a un ritmo mucho ms rpido.
La vida es el arte de sacar conclusiones suficientes a
partir de datos insuficientes. Riesgo
Samuel Butler El conocimiento sobre la inseguridad y, concomitan-
temente, el conocimiento sobre el riesgo, es una cate-
Ms por menos gora epistemolgica propia de nuestra era. Para en-
frentar sta inseguridad, es necesario elaborar
Es necesario organizar los datos en sucesivos mar- estrategias adecuadas para procesar informacin y to-
cos de referencia como una forma de potenciarlos, mar decisiones.
enriquecerlos, y establecer creencias provisionales, que El riesgo, o sea la incertidumbre, genera inseguridad
sern revisadas cuando aparezcan nuevas evidencias, y sta produce temor. Cuando el mdico nos plantea
56 57
H u go O scar A m b rosi E l escen ario

las probabilidades de cura de algn mal con cierto tra- est preparado... Finalmente hay una posicin de
tamiento, es natural sentirse atemorizado. Y algunos fe, aunque no se entiendan los argumentos tcnicos.
decidirn tomar ese riesgo y otros no. Todo depende
de las actitudes bsicas: de aprensin o de propen- Pero esta necesidad de recurrir a la fe, a la creen-
sin al riesgo. cia, no se agota en las relaciones con el Estado. Cuan-
do se trata de nuestra salud, tambin terminamos de-
Hay que creer en las estadsticas? cidiendo por una cuestin de fe; o cuando ponemos
nuestros intereses en manos de un abogado de con-
La confianza es la clave esencial de nuestra vida fianza. Precisamente la confianza es la base de
social. La reforma del sistema ingls de estadstica se sustentacin de las creencias, en el sentido que veni-
hizo bajo el eslogan: estadstica, una cuestin de con- mos exponiendo aqu.
fianza. Francis Fukuyama se ha ocupado de la confianza
Sin embargo es menester ser cauto en trminos de
de manera extensa. Y le otorga suma importancia como
la confianza que se deposite en las estadsticas oficia-
parte del capital social. Confianza es aquello que nos
les. Ms all de que el gobierno debe hacer todo lo
permite hacer cosas juntos. Cuando la palabra empe-
posible para ganar la confianza de los ciudadanos en
ada era garanta suficiente, la confianza, ella fue de-
las estadsticas que produce, desde el punto de vista
terminante de nuestras relaciones sociales. Hoy en
de la ciudadana crtica es conveniente mantener un
cambio, solamente la ley obliga, y fuera de su trama
grado prudente de duda metdica.
los compromisos y las consecuencias aparecen dbil-
La creencia es la que nos permite actuar, vivir, sin
mente ligados.
sufrir las discontinuidades que provoca nuestra igno-
Los crculos de confianza radius of trust, las comu-
rancia en muchos aspectos. Peirce lo dice claramente:
nidades de prctica, son todos elementos que pueden
Creo, luego acto.
y deben servir para recomponer nuestra sociedad, to-
Cuando le preguntaron a Jacob Ryten: Est pre-
nificando la confianza.
parado el ciudadano comn para interpretar las esta-
dsticas? l contest diciendo:
Brecha digital
Y estar preparado para saber cul es la La informacin no es ajena a los problemas de equi-
incidencia de los cambios en la tasa de inters? dad que afectan a todos los aspectos de nuestra vida
Y para interpretar cmo debera ser la estructura en sociedad. Aunque exista potencialmente la posi-
de los impuestos indirectos? No hablemos sola- bilidad de acceder a los recursos de la sociedad de la
mente de estadstica. En las relaciones entre el informacin, esa posibilidad est limitada de distintas
ciudadano y el Estado hay muchas complejida- formas como consecuencia de la falta de medios mate-
des. Para entenderlas, claro que el ciudadano no riales, pero fundamentalmente por las carencias que

58 59
H u go O scar A m b rosi E l escen ario

sufre la educacin de un gran nmero de personas, lo conocen previamente cul es el producto nuevo y cul
que les impide cultivar las habilidades requeridas para el viejo? Explique por qu s o por qu no.
desempearse en las redes.
Al mismo tiempo la urgencia de las necesidades ms Los parches de nicotina son sujetados al brazo de
elementales, postergan la atencin de otras ubicadas alguna persona que intenta dejar de fumar, para que
en niveles superiores de la pirmide de Maslow. distribuyan nicotina en la sangre. Suponga que usted
Y de esa forma la brecha se ampla cada vez ms, ley sobre un estudio que muestra que esos parches
porque la marcha de los que tienen acceso se hace de nicotina son dos veces ms eficaces en conseguir
cada vez ms rpida, dado que se desarrolla como un que las personas dejen de fumar, que los parches de
proceso de realimentacin positiva. Por ejemplo, al- control (aparentemente iguales, pero que no aportan
guien con acceso a una computadora, aumenta de nicotina). Adems, suponga que es usted un fumador
manera insospechada su capacidad de clculo y de que intenta dejar de fumar, qu preguntas querra
expresin verbal. Si adems est vinculado a Internet, hacer sobre el estudio, antes de decidir sobre la con-
los medios disponibles para su preparacin o para la veniencia de probar los parches?
resolucin de problemas o situaciones problemticas
se expanden de manera prodigiosa. Pensemos en la A partir de una encuesta de opinin realizada puer-
biblioteca del aula hace 30 o 40 aos, frente a la dis- ta a puerta sobre distintos temas pblicos, piensa que
ponibilidad actual de una PC, con acceso a Internet. resulta importante saber quin realiza las entrevistas?
D un ejemplo de cmo podra surgir una diferencia.

Preguntas para pensar


Un columnista de un importante diario de la capital
le solicita peridicamente a sus lectores que le escri-
ban, para de ese modo poder conocer sus sensaciones
sobre distintos tpicos de la vida social. Usted piensa
que las respuestas que l obtiene son representativas
de la opinin pblica? Explique por qu s o por qu no.

Las pruebas de degustacin sobre nuevos produc-


tos son frecuentemente realizadas dndole a probar,
en la misma ocasin, a una cierta cantidad de consumi-
dores el producto viejo y el producto nuevo. Usted piensa
que los resultados sern sesgados si los entrevistados

60 61
CAPTULO IV
Patrocinadores

La informacin lejos de ser un producto natural es


un objeto artificial, resultado de la accin racional y
voluntaria del hombre. Como primera consecuencia
de eso surge el interrogante acerca de los motivos por
los que hay cierta informacin y porqu alguna otra
no existe.
La diversidad de razones que alimentan la avalan-
cha de datos que diariamente nos abruma, elimina de
raz la hiptesis de neutralidad. No es realista supo-
ner tal condicin entre los participantes del proceso
de produccin de datos. Siempre, la informacin se
recopila por intereses, admiracin, celos, sentimientos,
gustos, curiosidad y una larga lista de otros motivos.
Una razn comn es el afn de reunir argumentos
favorables en una controversia. Se buscan apoyos que
sostengan alguna causa, como hacen las partes en los
litigios judiciales. Consideremos, por ejemplo, el caso
de las encuestas de opinin, o las de intencin de
voto. Es pblico y notorio que en este ltimo terreno
caben todos los manejos posibles, detrs del objetivo
de la imagen o del triunfo.
H u go O scar A m b rosi P atrocin ad ores

Ese cuadro se aleja de la buclica imagen que po- tener, en funcin de sus intereses, la fuente de
demos tener de una ciencia objetiva y prescindente. financiamiento.
En la realidad encontramos grados de mayor o menor Sabido quienes son los interesados y cuales son esos
compromiso con emociones, intereses, fobias, temo- intereses, s se puede aceptar que existe el necesario
res, que actan como factores de imprecisin y de con- margen de neutralidad, habr que establecer contro-
fusin en nuestras investigaciones. les a cargo de supervisores independientes, que ase-
Teniendo en cuenta lo anteriormente referido a las guren que el proceso se mantenga bajo control y est
intenciones, el otro elemento a considerar son los protegido de eventuales ataques de sectores interesa-
medios requeridos para llevar a la prctica el proyecto dos. En caso contrario, si se llegara a la conclusin de
impulsado por alguna de las motivaciones menciona- que el proceso est amenazado por el poder del patro-
das. Cuando convergen los propsitos y los medios en cinador, cuyas intenciones estn dominadas por inte-
alguna persona o institucin, sta se convierte en un reses parciales, habr que disear procedimientos de
protagonista en el escenario de la informacin. proteccin adecuados.
Y de su accionar depender la existencia o falta de En ese caso, cmo aplicar mediciones y compara-
datos. ciones, que pongan en evidencia los defectos provoca-
Quines son los responsables de lo que hay? Y dos por la influencia que se ha identificado, para evi-
de lo que falta? tar que se concrete el intento de fraude?
Quines aprueban la eleccin y contribuyen con
los recursos para que se rena la informacin que apa- El Estado
rece en los medios?
Quines evitan que se revelen otros datos y cmo Entre todos los responsables se destaca especialmente
lo hacen? Quines prohiben? el Gobierno, por el poder y los recursos de que dispone.
Los patrocinadores, los que fijan los objetivos y dis- Considerando que el Gobierno tiene a su cargo las
ponen de los medios legales y materiales, sin duda recopilaciones de datos ms importantes, las respon-
son determinantes para responder algunas de las pre- sabilidades sobre la informacin estadstica reposan
guntas anteriores. Los censores, los que prohiben, en gran medida sobre el Estado. Los censos, los regis-
sabotean o denigran, deben dar cuenta de las otras tros civiles, los ndices de precios, de desempleo, de
respuestas. pobreza, el producto bruto, son una muestra suficien-
Identificado el financista (individuo, empresa o go- te del poder que tiene el Estado en materia de infor-
bierno), cabe preguntarse: para qu quiere que se macin, y en consecuencia de su capacidad para mo-
haga ese estudio? Qu beneficio espera obtener con delar el escenario de los debates sociales.
sus resultados? O tambin por qu se opone? Por ese motivo en el caso de las Estadsticas Oficia-
Contestadas esas cuestiones, corresponde indagar so- les tienen una importancia crtica las respuestas que
bre la inclinacin a influir en los resultados que pueda reciban las siguientes preguntas:

64 65
H u go O scar A m b rosi P atrocin ad ores

Quin fija las metas? Quin determina las priori- Las Naciones Unidas establecieron en 1994 los Prin-
dades? cipios Fundamentales de las Estadsticas Oficiales, que
Esas son preguntas particularmente importantes se pueden consultar en:
cuando se trata de programar las estadsticas, cuya (http://unstats.un.org/unsd/goodprac/bpabout.asp),
funcin principal es permitir el control de la gestin y cuyo cumplimiento ha sido evaluado en oportunidad
de los organismos de la Administracin. del 10 aniversario de dichos principios.
Siendo el Poder Ejecutivo el principal productor de En nuestro pas queda establecido desde el manda-
estadsticas en la sociedad, ser necesario fijar reglas to constitucional, que dice:
y establecer los controles, que aseguren preventiva-
mente la debida objetividad y neutralidad de los fun- Art. 47.- Para la segunda Legislatura deber
cionarios hacia los programas estadsticos. realizarse el censo general, y arreglarse a l, el
La informacin debidamente planificada y correcta- nmero de diputados; pero este censo slo podr
mente producida, contribuye a la transparencia, a la renovarse cada diez aos.
previsibilidad y a la mejora de los procesos de deci-
sin en una sociedad democrtica. Se asigna al Gobierno, la obligacin de reunir in-
Debern recopilarse cifras que justifiquen las pol- formacin con el objeto de ajustar la composicin
ticas pblicas, en su etapa de diseo y discusin. Ms del Poder Legislativo a las condiciones cambiantes
tarde sern la base de los programas de monitoreo y de la sociedad. Resulta de gran inters la lectura
evaluacin de la gestin de la administracin durante del anlisis que hace Dieulefait en el trabajo Esta-
la aplicacin de esas polticas. dstica Censal y Estadstica Administrativa Argenti-
Cuando suene la alarma en los puntos de control nas, de la evolucin histrica de las actividades y
establecidos, se debern activar los mecanismos de de los organismos estadsticos. Si alguien abriga
correccin. Por ese motivo se deben tomar las precau- dudas sobre la influencia de los intereses subalter-
ciones necesarias en defensa de la sociedad, que im- nos, basta revisar las pginas dedicadas a la cues-
pidan la manipulacin de la informacin pblica. tin del Censo Nacional de Poblacin entre 1914 y
En el proceso de evaluacin merece ser recordada 1947, especialmente el destino de los proyectos le-
la diferencia entre apreciar la eficiencia desplegada, gislativos que no prosperaron por influencia de los
la que se caracteriza por haber hecho cosas intereses regionales.
prolijamente, de la eficacia demostrada, cuando se Desde 1821 cuando se cre la Mesa Estadstica, bajo
han hecho las cosas debidas oportunamente, el Gobierno de Martn Rodrguez, diversas leyes han
logrndose los resultados buscados. ido reglamentando el quehacer estadstico del sector
La cuestin clave de las estadsticas oficiales es: pblico. Con el tiempo cambiaron las normas, los
para qu y para quines, el Estado debe recopilar objetivos y las formas de organizacin, bajo la in-
informacin? fluencia del aumento en la diversidad de los temas

66 67
H u go O scar A m b rosi P atrocin ad ores

incluidos dentro del proceso de recopilacin, a tra- Nacional de Desarrollo y Consejo Nacional de Seguri-
vs de las distintas pocas. dad, ha desaparecido, quedando sin respuesta formal
Ya en 1852 se reconoce la importancia de la ciencia las preguntas esenciales:
estadstica, al establecerse una ctedra a cargo del Quin fija las metas? Quin determina las priori-
coronel Bartolom Mitre, cuyo dictado debi interrum- dades?
pirse por el exilio del profesor. El resultado es un INDEC que concentra, por defec-
Actualmente rige la Ley 17622, de 1968. Durante to, el poder de decisin sobre los objetivos y metas del
su vigencia la actividad estadstica ha tenido una sistema, excediendo en sus funciones los lmites que
compleja evolucin. As como se pueden reconocer puede tolerar una sociedad democrtica.
proyectos exitosos como la Encuesta Permanente de Revistan en el INDEC ms de 1000 agentes, que
Hogares o el Censo de Poblacin de 1980, tampoco constituyen el grueso de los recursos humanos del
se puede ignorar que no ha favorecido el fortaleci- SEN. Es un valor muy alejado de los 50 funcionarios
miento institucional del sistema estadstico. La falta que los redactores del texto de la ley, imaginaron para
de instituciones que cobijaran la participacin de un organismo dedicado a coordinar un sistema efecti-
los usuarios, el paulatino debilitamiento de los or- vamente descentralizado.
ganismos provinciales han opacado el desarrollo de La falta de un cuerpo o un proceso taxativo de con-
la actividad estadstica. No es este el lugar para ha- sulta a los actores sociales perdura como una caren-
cer un anlisis detallado de sus disposiciones, pero cia, vicio de origen entendible de la norma menciona-
es necesario dejar en claro sus caractersticas que da, que no ha permitido desarrollar un proceso social
han sido, en buena medida, la causa de las limita- de base amplia para la determinacin de las priorida-
ciones y fragilidades del Servicio Estadstico del pas. des, los planes y programas, que permanecen como
Esta ley determina la organizacin de todas las ofi- atributo exclusivo del Poder Ejecutivo.
cinas pblicas en un sistema nico, bajo el principio No hay cuerpos intermedios, como existen en otros
de centralizacin normativa y descentralizacin ejecu- modelos nacionales en cuyos Consejos Nacionales de
tiva. Ese sistema en abstracto puede mejorar la com- Estadstica o similares estn representados los distin-
patibilidad y comparabilidad de la informacin. Sin tos sectores de la sociedad: funcionarios, acadmicos,
embargo la falta de una forma adecuada de organiza- representantes de los sectores productivos, gremios, etc.
cin de la demanda de los usuarios, para la determina- En ese mbito se debaten y deciden los contenidos y
cin de prioridades, ha tenido un indeseable efecto cen- prioridades del programa estadstico nacional.
tralizador en el desarrollo del sistema estadstico nacional, La nueva versin del Manual de Organizacin Esta-
especialmente agravado por la desigual capacidad finan- dstica de las Naciones Unidas se refiere detallada-
ciera de los organismos provinciales, frente al INDEC. mente a este tipo de rganos. Ver:
El modelo institucional imperante en la poca de su http://unstats.un.org/unsd/goodprac
sancin, que giraba en torno a los llamados Consejo
68 69
H u go O scar A m b rosi P atrocin ad ores

El proyecto de Comisin Bicameral de Seguimiento que aseguren un mejor aprovechamiento de la infor-


de la Crisis del Instituto Nacional de Estadsticas y macin disponible. La informacin se materializa en
Censos, que se autodefine como una instancia de co- resultados, que pueden ser ms o menos favorables a
ordinacin entre el Congreso Nacional y el Poder Ejecu- las distintas posiciones o grupos de influencia. Pero
tivo Nacional, puede cumplir un importante papel esos resultados son la consecuencia de procesos, que
institucional, si no limita sus alcances a la crisis en el deben ser sometidos a control, para que se conserven
INDEC durante 2007 y asume en cambio plenamente el independientes y produzcan salidas confiables, cuya
rol de pieza esencial del Sistema Estadstico Nacional. transparencia sea garanta de fidelidad en sus con-
clusiones.
Informacin y poder Pero si no existen procedimientos de control que ase-
guren cierto nivel de calidad en los procesos de pro-
La informacin puede ser tan importante que ya duccin de los datos estaremos en problemas. Qu
Maquiavelo recomendaba al Prncipe que guardara puede impedir que los grupos de inters, con recur-
secreto y actuara por sorpresa. Dos formas egostas de sos suficientes, con poder, obtengan los valores de-
sacar provecho de la informacin. En un caso evitando seables y convenientes para sus fines?
que los rivales conozcan la informacin propia y en el En el caso de que nada se oponga, se obtendrn
segundo utilizndola oportunamente, y haciendo efec- valores sin detenerse en el cuidado del procedimien-
tiva la ventaja que da su conocimiento. La potencia to. No se tratar de asegurar un proceso, sino de lo-
del dicho: la informacin es poder aumenta propor- grar un resultado. Y esto abre la posibilidad de produ-
cionalmente a la cercana de la estadstica con el po- cir resultados fraguados, por encargo. Como en
der poltico. cualquier guerra, los soldados de fortuna se prestan a
Ese inevitable vnculo entre la informacin y el cualquier maniobra por la paga.
poder, debe tenerse en cuenta, especialmente si se Cuando la informacin se convierte en el tema de
trata de mejorar una sociedad democrtica. Las lu- discusin, el debate se aleja del problema principal y
chas de intereses utilizarn de manera permanente se diluye en los vericuetos de las tcnicas empleadas.
el campo de la informacin, para obtener grandes o Si se discute el ndice de Desempleo, se est poster-
pequeas ventajas. No es posible desconocer esos gando al anlisis del problema del desempleo.
hechos, cuando se trata de interpretar la informa- Esto no significa que no tenga que haber una crtica de
cin pblica. Todo se desarrolla en un escenario la informacin. Lo que no debe ocurrir es que la discu-
donde los intereses compiten por el poder. No exis- sin de fondo sea reemplazada por otra instrumental.
te informacin que est libre de la influencia de in- Pero en esta poca, el Gobierno ya no es el nico
tereses e ideologas. proveedor. La tecnologa y el poder econmico de
No hay cabida para las ingenuidades, y se debe afron- organizaciones sociales o grupos privados multiplican
tar con nimo decidido el desarrollo de las prcticas las fuentes de informacin.
70 71
H u go O scar A m b rosi P atrocin ad ores

Por esa razn el primer interrogante crtico que se establecer controles a cargo de supervisores indepen-
debe formular a un cuerpo de datos es: Quin pag dientes, que garanticen que las desviaciones espera-
el estudio? Quin fijo los objetivos y asign los me- das e inevitables se mantengan bajo control.
dios? Debe hacerse lo anterior, porque si se descubre que
Una vez identificado el patrocinador (individuo, em- un estudio fue patrocinado por una organizacin que
presa o gobierno), debe preguntarse: para qu quie- puede estar muy interesada en un resultado particu-
re que se haga ese estudio?, qu beneficios espera lar, tiene una importancia fundamental demostrar que
obtener con sus resultados? fueron seguidos estrictamente los procedimientos cien-
Desgraciadamente, no siempre es sencillo identifi- tficos en el desarrollo del estudio, en cuanto a objeti-
car quin ha financiado una investigacin. Muchas in- vidad y controles.
vestigaciones universitarias en EEUU estn siendo fi- En pocas palabras, siempre hay que prestar aten-
nanciadas por compaas privadas. cin a que todas las fases del proceso funcionaron
En su libro Verdad Corrupta (Tainted Truth) Cynthia segn las buenas prcticas reconocidas. Ejemplos de
Crossen advierte: buenas prcticas pueden encontrarse en el sitio de
las Naciones Unidad:
[...]las compaas privadas han encontrado http://unstats.un.org/unsd/goodprac/default.asp
ms barato y hasta ms prestigioso, desarrollar En el proceso estadstico los defectos inducidos
sus investigaciones a travs de investigadores aca- sistemticamente, por dolo o fallas de diseo, perte-
dmicos o del gobierno, de modo tal de no ser necen al tipo de errores que para ser evaluados exi-
sospechados de fraude. Las corporaciones, los gen el desarrollo de anlisis comparativos detallados,
litigantes, candidatos polticos, asociaciones de para cuya ejecucin se necesita programar cuidado-
comercio, lobbystas, grupos de intereses, todos samente las estrategias a seguir. La correccin de esas
pueden comprar una investigacin para usarla fallas, cuando es posible, resulta muy costosa.
como deseen.... Hace pocos aos se dieron a publicidad estudios
sobre el hbito de fumar, que haban financiado las
Aclarada esa cuestin, corresponde investigar la pro- compaas tabacaleras. Sus conclusiones son un buen
pensin a sesgar el proceso, la disposicin a influir en ejemplo de conflicto de intereses, entre los producto-
los resultados, que puede tener el soporte financiero res de los datos y los usuarios de la informacin.
de la investigacin, en funcin de su identidad, de Otra situacin similar se presenta cuando un parti-
sus objetivos y de sus intereses. do poltico da a conocer los resultados de encuestas
Cumplidas esas etapas, se podr determinar si el sobre intencin de voto que ha encargado sobre
proceso est amenazado de parcialidad. Cuando la ame- comicios en los que participa.
naza potencial no tenga tal gravedad que condicione
irremediablemente el proyecto, se podr pensar en

72 73
H u go O scar A m b rosi P atrocin ad ores

UN CASO INTERESANTE - Lavagna y los ndices de Pobreza,


La doctrina Rayner, fue formulada en los 80 en - Moreno y el IPC
pleno apogeo del thatcherismo y se puede resumir en Y la lista podra continuar indefinidamente, porque
la frase: esas prcticas operan a todos los niveles del poder. En
todos los escalones burocrticos y polticos, hay quie-
el estado slo debe reunir la informacin que nes comulgan con la idea de que la informacin ms
necesita para sus propios objetivos. poderosa es la que se guarda, la que se esconde. Y
viven como amenaza para sus pequeos o grandes feu-
El informe oficial declaraba: dos, que los dems puedan saber algo ms. Son
datafbicos.
ya no hay razn para que el gobierno acte Hay que superar su resistencia, casi siempre sorda
como proveedor universal la informacin no debe y disimulada, para que las cosas se puedan hacer, por-
recogerse fundamentalmente para ser publicada; que guardan celosamente las llaves de acceso a los
debe hacrselo fundamentalmente porque el Go- recursos y a las fuentes, tanto en las empresas como
bierno la necesita para su propio uso. en el estado.
El mayor peligro que perciben es que su palabra se
Lo nico que justifica mencionar ese antecedente, pueda contrastar con informacin independiente. Se-
fuera de Gran Bretaa, es que fue discutido y aproba- ra una calamidad para sus objetivos de dominio y
do como poltica oficial. Pero no debe pensarse que es seguridad.
una rareza ideolgica. Ms an, puede considerarse Como una prueba de que las opiniones detrs de la
que es el pensamiento dominante entre quienes poltica son variadas, tambin la prctica estadstica
detentan el poder poltico aun en sociedades que por en una sociedad moderna, se puede ilustrar con el
sus leyes deberan ser abiertas y participativas. caso ingls. El Libro Blanco sobre Gobierno Abierto
Es que el viejo consejo de Maquiavelo al Prncipe producido durante la gestin de John Major dice:
sobre guardar secreto y dar sorpresa, choca
frontalmente con el acceso a la informacin y la Las estadsticas oficiales contienen una vasta
previsibilidad que requiere una sociedad democrtica. gama de informacin sobre la economa y la socie-
dad. Son recogidas por el gobierno para informar
CHOQUES DE INTERESES el debate, la toma de decisiones y la investigacin,
Recordemos brevemente los cruces verbales entre tanto en su propio mbito como en la comunidad
la informacin oficial y los poderosos de turno: toda... Estadsticas sociales y econmicas confiables
- Martnez de Hoz y el ndice de Precios al Consu- son fundamentales para[...] los gobiernos abiertos,
midor (Costo de Vida), que tienen la responsabilidad de proporcionarlas y
- Menem y la Tasa de Desempleo, mantener la confianza pblica en ellas.

74 75
H u go O scar A m b rosi P atrocin ad ores

Como dijo Bodin, Presidente del ISI, en su visita a Esto significa que los gobiernos deben crear un am-
Buenos Aires, cuando a fines de los 90 estaba ame- biente adecuado y proveer un marco jurdico y presu-
nazada la Encuesta Permanente de Hogares: puestario equitativo, para que se produzcan y difun-
dan datos estadsticos que respondan a las necesidades
Las estadsticas oficiales se producen para de todos los usuarios y no solamente a las propias.
dar lugar al ejercicio del derecho a la informa- La resolucin sobre los Principios Fundamentales
cin, uno de los ms importantes derechos del de las Estadsticas Oficiales de las Naciones Unidas
ciudadano en las sociedades democrticas. ha servido particularmente para tener una conciencia
Aunque las condiciones de la produccin de cada vez mayor de que:
estadsticas hayan cambiado radicalmente des-
de hace 20 30 aos, los gobiernos tienen el la informacin estadstica oficial es una base
deber de crear un ambiente adecuado y pro- esencial para el desarrollo en los campos econ-
veer un entorno jurdico y presupuestario equita- mico, demogrfico, social y ambiental, y para el
tivo, para que se produzcan y difundan datos conocimiento y el comercio mutuos entre los Esta-
estadsticos acordes con las necesidades de to- dos y los pueblos, y sigue diciendo:
dos los usuarios y no solamente con las suyas
propias.
la confianza esencial del pblico en la infor-
Y agreg: macin estadstica oficial depende en gran parte
del respeto por los valores y principios fundamen-
Entretanto, en las democracias modernas, se tales, que son las bases de cualquier sociedad
admite cada vez ms que un amplio acceso a la democrtica que trate de comprenderse a s mis-
informacin estadstica es un importante compo- ma y de respetar los derechos de sus miembros.
nente del derecho de los ciudadanos a la infor-
De todos los artculos en estos diez mandamien-
macin, necesario para un funcionamiento efi-
tos estadsticos, el artculo 1 es particularmente per-
ciente de esas democracias.
tinente para la actual consideracin de la mejor estra-
tegia para satisfacer las necesidades de los usuarios y
Por otra parte, la esencial confianza de todas las
para cumplir con el derecho a la informacin de la
categoras de usuarios en las estadsticas oficiales, slo
sociedad en general.
puede alcanzarse si todos los que asumen la respon-
sabilidad de producirlas se sujetan a las buenas prc-
ticas para conseguir que los proveedores de datos b- Alerta 1
sicos respondan favorablemente a las peticiones de Frente a un problema, a preguntas que esperan res-
informacin de las Oficinas Estadsticas. puesta, a hiptesis que deben evaluarse, siempre hay

76 77
H u go O scar A m b rosi P atrocin ad ores

un sujeto que debe resolverlo, contestarlas o discer- una reduccin en los beneficios inesperada? Cmo
nir. l ser el disparador del proceso de bsqueda de contrarrestar la campaa que la competencia, con da-
soluciones y respuestas. A veces, se presentan por se- tos parecidos, seguramente lanzar sobre el mercado?
parado la necesidad de la informacin, de la capaci- Una de las formas de responder es la ocultacin de
dad de producirla. Otras veces ocurrir que, al mismo la informacin desfavorable. Es tal vez la ms simple y
tiempo, el usuario interesado es el que aporta los me- ms generalizada forma de aprovecharse del poder de
dios para la realizacin prctica de las actividades ne- la informacin. El disimulo se puede producir a dis-
cesarias: encuestas, experimentos, anlisis de datos. tintos niveles. Desde burcratas que temen por sus
Es el caso del Estado y de las empresas importan- posiciones y cajonean expedientes, esperando el
tes. Ellos tienen equipos tcnicos y les asignan re- momento de valerse de sus contenidos para negociar
cursos, para llevar adelante planes de recopilacin o sacar ventajas, hasta mandatarios elegidos por el
de datos. En el Estado para producir los indicadores voto, que piensan que el engao es una forma vlida
que permitan orientar y evaluar la accin de gobier- de relacionarse con sus mandantes. De ah el poder
no. En las empresas, para explorar las caractersti- del secreto.
cas del mercado, para indagar sobre tendencias y Sin embargo no es la nica manera de manipular
preferencias de los consumidores, para evaluar la los datos. Otras dos formas no menos perniciosas son
satisfaccin de los clientes, para asegurar la cali- la alteracin de los resultados mediante algn artilu-
dad de sus productos y controlar la de las materias gio, o el descrdito de la fuente o del procedimiento, de
primas que utilizan. manera que los resultados pierdan todo sustento, y se
Hasta ah, todo parece marchar sobre rieles. Pero si conviertan en una grotesca curiosidad desprovista de
se considera que, tanto en uno como en otro caso, hay todo significado.
fuertes intereses, predominantemente polticos en un Como puede notarse, en todos los casos de violen-
caso y econmicos en el otro, es inevitable y necesa- cia sobre los datos, hay una falla tica manifiesta.
rio considerar la reaccin que les provocarn los re- Se cometen inmoralidades en aras de intereses sub-
sultados que obtengan. alternos que buscan beneficios econmicos o rditos
Qu harn si los datos reflejan demandas sociales electorales. Estamos frente a modalidades antisociales
insatisfechas? Y si se encuentra que la marca propia frente a las cuales hay que desarrollar formas adecua-
ha visto caer su participacin de mercado? das de prevencin y, para el caso de su perpetracin,
Cmo se le explicar, en la prximas elecciones, a normas represivas que sancionen esas conductas.
los votantes, que la plataforma prometida no pudo En el terreno preventivo debemos considerar en pri-
cumplirse? Cmo responder a la oposicin que ha mer lugar los medios que impidan el ocultamiento.
venido criticando las acciones seguidas hasta ahora? En el campo de lo pblico, tenemos a nuestro favor, el
Cmo se justificar ante los accionistas o ante los due- principio republicano que impone la publicidad de los
os que, de acuerdo a la informacin, debe esperarse actos de gobierno.
78 79
H u go O scar A m b rosi P atrocin ad ores

Debe quedar claramente sealado que de ninguna As como se regulan los ejercicios profesionales que
manera la doctrina Rayner puede ser la gua de una tienen que ver con la salud, con lo jurdico, con diver-
poltica democrtica. sas tcnicas, as deber regularse el quin es quin en
Para que se puedan ejercer los debidos controles materia de informacin.
ser necesario, entonces, que tanto el Poder Legisla- Eso incluye la adopcin de un Cdigo de tica, cuya
tivo como el Judicial intervengan en la proteccin del vigilancia y aplicacin deber confiarse a un consejo
proceso de formacin, y difusin de informacin en independiente de pares.
la sociedad. De esa forma se podrn combatir las obscenas ma-
El Poder Legislativo deber convalidar las acciones nifestaciones en las que se reconoce que se hacen las
del Ejecutivo, tanto en el proceso de programacin de cosas a gusto del cliente..., para no perderlo! Qu
las actividades, como posteriormente mediante la ve- dramtico resulta imaginar igual criterio aplicado a la
rificacin de la efectiva y transparente difusin de los medicina!
resultados. No ser una carga para los legisladores, sino El usuario que se somete a estas reglas, est admi-
una parte importante de sus funciones, ya que les ase- tiendo que aceptar los resultados, aunque le sean des-
gurar que tengan acceso a toda la informacin sobre favorables y le est prestando un servicio a la sociedad,
cuestiones sociales que el Gobierno est manejando y que tendr a su disposicin, informacin objetiva.
que es necesaria para legislar con fundamento. O sea que el balance necesario de una decisin gu-
An as, quedan en pie las otras dos maneras de bernamental o empresaria, son las buenas prcticas
descalificar a los datos. En primer lugar, cmo levan- profesionales, conformes con el estado del arte y ejer-
tar los cargos que sealan que la fuente no es confia- cidas por un sector profesional debidamente regula-
ble, o que no est capacitada, para hacer lo que se le do. Por otro lado el rigor y neutralidad tcnicos esta-
ha pedido. rn amparados por un Cdigo de tica dirigido a que
En segundo lugar, si no hubiera una fuente atacable las conductas respeten en los hechos, los pasos meto-
con las mencionadas acusaciones, puede ser objeto dolgicos, y al mismo tiempo cuiden la disponibilidad
de ofensiva el particular proceso, que puntualmente de toda la informacin sobre los datos producidos.
ha producido los incmodos resultados que se estn
considerando.
Tanto si se ataca la fuente o se descalifica el proce-
so, resulta evidente que es imprescindible, regular el
ejercicio de las actividades de produccin de datos.
Hay que establecer claramente los estndares de cali-
dad que se deben seguir en las distintas etapas y las
modalidades de evaluacin que garanticen que efecti-
vamente se cumple con los estndares deseados.
80 81
CAPTULO V
Gente del oficio

Cada vez que me formulan la pregunta, me tengo que


detener a reflexionar. La pregunta es simple, y me la
hacen mis vecinos, mis parientes y amigos, mis hijos y
hasta algunos forasteros de paso por la ciudad:En qu
est usted (o en qu ests t) trabajando en este momen-
to?, Esperan, y con razn, que mi respuesta sea igual-
mente sencilla y clara. Sin embargo invariablemente vacilo:
cmo podra extraer de mi jerga acadmica profesional
alguna expresin llamativa, alguna idea que remueva las
profundidades? Cmo introducir en una conversacin
casual esos largos prrafos argumentativos que son los
que inyectan adrenalina a una idea? Y de qu manera
podra transmitir mi entusiasmo a los mundos dispares del
abogado, el peluquero del barrio, el mdico cirujano, el
delegado de ventas, el ingeniero, el artista, el fantico del
rock?
Gergen, El Yo Saturado

Un experto es una persona que ha cometido todos los


errores que se pueden cometer en un determinado campo.
Niels Bohr

Hemos visto que el desarrollo del proceso estadsti-


co, organizado para producir la informacin necesaria
y responder al problema o a las preguntas plantea-
das, exige como todas las cuestiones prcticas y apli-
cadas, la contribucin tcnica del saber cmo deben
hacerse las distintas tareas y de la responsabilidad
tica que asegure una actitud de honestidad intelec-
tual durante todo el proceso.
H u go O scar A m b rosi G en te d el oficio

del patrocinio y el financiamiento, sobre cualquier pro-


Por esos motivos, se requiere en los encargados de
yecto de investigacin estadstica.
llevar adelante el programa de trabajo, el dominio del
Mientras un proyecto no ha sido reducido a mero
oficio. Para alcanzar ese reconocimiento son impor-
medio de promocin o propaganda y, en consecuen-
tantes los conocimientos tericos que posean, la expe-
cia, no est insalvablemente destinado a servir a un
riencia prctica y la integridad moral que se aquilate.
sector o grupo, todava puede considerarse como un
Como se ver ms adelante, el oficio de estadstico
proyecto de mejora del conocimiento de los problemas
est ms prximo al lenguaje, como soporte del pensa-
sociales.
miento y de la comunicacin, que al exclusivo manejo
Pero si queremos que el proyecto se transforme en
de valores numricos.
un programa, ser importante observar los requisitos
tcnicos y logsticos a cubrir para que el proceso de
Objetividad y neutralidad
produccin de los datos cumpla con las necesarias con-
La complejidad de las situaciones y de los proble- diciones de calidad.
mas sociales, coloca a los expertos en estadstica en La pregunta clave en este punto es: Quines son
situaciones donde ven amenazada su objetividad y su los encargados de disear, implementar y controlar el
neutralidad. proceso estadstico? Es necesario saber exactamente
Conviene distinguir entre objetividad y neutralidad. quin efectua las entrevistas y a travs de qu mensa-
Si consideramos la objetividad como opuesta a subjetivi- je se concretan las mismas, ya que los participantes
dad, debemos admitir que es inevitable encontrar algn usualmente contestan influenciados por los deseos del
grado de subjetividad. Por eso, una forma prctica de ver entrevistador.
las cosas es exigir que se establezca explcitamente el Considere, por ejemplo, un estudio que se realiza
enfoque, el punto de vista, desde el que se aborda la en un shopping para evaluar una nueva marca, en
produccin de los datos. De esa manera, los resultados comparacin con una vieja marca familiar. Los clien-
podrn ser contrastados con otros enfoques y el criterio tes son interrogados, para que respondan por el sabor
elegido ser incorporado en la interpretacin. de cada marca, y para que establezcan su preferencia.
La neutralidad tiene como objetivo evitar tomar par- Es sumamente importante que, tanto los presenta-
tido durante el proceso; es decir, impedir las activida- dores de los productos como los clientes, ignoren a
des que modifiquen en alguna direccin preferida los qu marca pertenece cada uno de ellos. De no ser as,
resultados de manera intencional. el consumidor escoger con preferencia la marca que
Por ese motivo, son importantes los medios que tenga ya le es familiar.
el sistema para evitar las influencias sistemticas que O si el presentador sugiere la superioridad de un
pueden producirse. producto en relacin con el otro, en muchos casos
En el captulo anterior se destac la enorme in- los clientes contestarn en ese sentido slo para
fluencia que ejercen los grupos de intereses, a travs complacerlo.
84 85
H u go O scar A m b rosi G en te d el oficio

Otro ejemplo: si usted decide hacer un estudio sobre gubernamentales, con lobbies privados y otros gru-
el consumo de drogas, y enva a policas uniformados a pos de presin, pueden tambin llegar a afectar la
recolectar la informacin, muy probablemente no obten- integridad de las estadsticas oficiales y obstaculi-
ga resultados confiables que luego puedan ser utilizados. zar la necesaria autonoma profesional de los esta-
Saber quines son los expertos que disean, dsticos oficiales.
implementan, gestionan y evalan el proceso de in- Pero las buenas prcticas observadas en algunos
formacin es un asunto clave. Tanto el dominio de las pases enumeran actitudes positivas frente a las ame-
buenas prcticas estadsticas, como un cdigo de nazas y/o prcticas engaosas.
conducta respetuoso de los principios ticos recomen- Los investigadores responsables de conducir los es-
dados, son elementos fundamentales para reforzar la tudios estadsticos deben llenar ciertos requisitos, en
confianza en los resultados del proceso. cuanto a solvencia tcnica y responsabilidad moral.
Cuando los estadsticos oficiales preparan una nueva La solvencia tcnica, no solamente se refiere a las
encuesta estadstica, tienen que responder de mane- acreditaciones acadmicas, sino al oficio, a la madu-
ra vlida y confiable a varias cuestiones previas (las rez artesanal con que cuentan para llevar adelante el
recomendaciones de la ONU y las buenas prcticas proyecto.
utilizadas en otros pases pueden sugerir directivas y Los responsables metodolgicos preservarn su
sugerencias para responder a esas preguntas). Esas autonoma profesional mientras tratan con los pro-
cuestiones se pueden agrupar segn se vinculen con veedores, con los usuarios, con las estructuras gu-
los usuarios o los informantes: bernamentales y con los grupos de inters y de pre-
sin. Esa actividad se refleja a nivel institucional,
Sobre la actitud hacia los usuarios:
en los Servicios Nacionales de Estadsticas, enca-
Qu factores pueden afectar la credibilidad de los bezados por las Oficinas Nacionales de Estadstica,
usuarios en los resultados de la encuesta? Cmo tra- cuyas funciones reflejan la visin social del rol de
tar equitativamente a todos los usuarios (y no sola- la estadstica.
mente a los gobiernos)? Cmo estar seguros de que Debe ser ya comprendido claramente que el com-
los resultados de la encuesta satisfarn efectivamente promiso tico, no es una declaracin vaca de conteni-
las necesidades de los usuarios? do, sino que implica ajustar los procedimientos a un
Cdigo de Conducta, cuya aplicacin ser vigilada por
Sobre la actitud hacia los entrevistados:
un Tribunal de tica. Las bases generales se encuen-
Cmo asegurar el secreto y la integridad de los tran en los principios ticos establecidos por el Inter-
datos individuales? Cmo minimizar la carga de los nacional Statistical Institute: (http://isi.cbs.nl/
entrevistados? ethics.htm )
En todos los pases, las relaciones de los orga-
nismos estadsticos oficiales con las estructuras

86 87
H u go O scar A m b rosi G en te d el oficio

sectorialmente, como se expresa en el Art. 3 de dicho


Programa
decreto. Ratifica el enfoque fijado en la Ley 17622, ya
Para fijar la filiacin histrica de la Ley 17622, bas- que por encima de la proclamada descentralizacin
ta recordar que fue un producto de la gestin de ejecutiva, que no fue desarrollada ni en lo geogrfico
Ongana. Esa propuesta defina tres tiempos para la ni en lo sectorial, se manifiesta una fra y calculada
resolucin de los problemas nacionales, que se orde- centralizacin conceptual, sustentada en el manejo
naban sucesivamente en las etapas econmica, social del presupuesto estadstico nacional.
y poltica, aplicando un modelo lineal ajeno a la com- Artculo 3.- El Instituto Nacional de Estadstica y Cen-
plejidad y sincronicidad de los hechos histricos. sos, mediante Resolucin del Ministerio de Economa y
Como lgica consecuencia, la programacin esta- Obras y Servicios Pblicos, detallar las series esta-
dstica qued reducida a un ejercicio de ordenamien- dsticas que integrarn el Programa Anual de Estads-
to, en el que participan solamente tcnicos y burcra- tica y Censos, y que constituirn la informacin mni-
tas, bajo la hiptesis de que existe algn modelo ma que deber suministrar cada organismo.
descriptivo que permitira cumplir, sin consultar a la El organigrama que se refleja en esa norma es ob-
sociedad, con lo establecido en el inciso b) del artculo soleto y cabe preguntarse si las primitivas obligacio-
5, que dice: nes han sido vinculadas a las nuevas estructuras.
Confeccionar el programa anual de las estadsti-
cas y censos nacionales, con su correspondiente pre- poca de cambios
supuesto por programa, basndose especialmente en
las necesidades de informacin formuladas por las Debemos prestar especial atencin a las consecuen-
Secretaras del Consejo Nacional de Desarrollo cias sobre la produccin estadstica, de los cambios
(CONADE) y del Consejo Nacional de Seguridad producidos durante el siglo XX y que continan desa-
(CONASE), sin perjuicio de tener en cuenta los requeri- rrollndose en el actual.
mientos que puedan plantear otras entidades pbli- La ms importante transformacin que introducen
cas y privadas. las nuevas tecnologas y el desarrollo de los medios de
El Decreto 3110/70 ratifica esa orientacin en su comunicacin, se relaciona con la posicin social que
artculo 6. ocupa la produccin de estadsticas.
Artculo 6.- Compete al INDEC la determinacin El modelo anterior se basaba en una funcin espe-
de las series estadsticas que integrarn el Programa cializada, a cargo de ciertos cuerpos dedicados a esa
Anual de Estadsticas y Censos, con la participacin tarea, y el resto de la sociedad actuando como clientes
de los organismos del SEN para lograr eficiencia y o proveedores de datos elementales.
coordinacin. Hoy las redes y los nodos inteligentes, constituidos
El Decreto 1831/93, enumera los temas y delega por las computadoras personales diseminadas en esas
en el INDEC el detalle de la informacin a recopilar redes, han hecho estallar ese viejo modelo y ahora

88 89
H u go O scar A m b rosi G en te d el oficio

ms que nunca la produccin de estadsticas es una Esa ocultacin, puede arrastrar al usuario a una
actividad sistmica de toda la sociedad. interpretacin errnea, a una sobrevaloracin de los
Un ndice de ese cambio es la proyeccin del em- indicios, que darn motivos para descalificar a los da-
pleo de los estadsticos. Cada vez ser menos acelera- tos. Y esos efectos se producirn igualmente si ha me-
do el crecimiento de puestos en cuyo nombre aparez- diado una intencin dolosa o ha habido meramente
ca la referencia directa a la Estadstica. En cambio, la descuido o desprolijidad.
demanda para ocupar posiciones en otras ramas de la El estadstico es depositario de la confianza de la
organizacin que requieren las habilidades de los Es- sociedad para hacer una tarea segn las reglas de su
tadsticos, crecer muy rpidamente. oficio, y acompaarlas con una conducta que justifi-
que la confianza recibida. Cmo puede estar segura
Recapitulacin la sociedad que efectivamente se cumple con ambas
condiciones?
Razonamiento y conducta son los dos ejes que arti- Existen algunos recursos que ya se han probado en
culan el quehacer del Estadstico. Su pensamiento otras profesiones. Es el caso de los Consejos Profesio-
debe seguir el ritmo del estado del arte en lo cientfico nales, que ponen en manos de los pares en un oficio
y metodolgico, y su comportamiento ajustarse estric- la vigilancia y las sanciones de los miembros, frente a
tamente al cdigo tico profesional. las sombras y amenazas que los intereses y los temo-
Tendr que estar muy atento a las desviaciones i- res arrojan sobre los procedimientos.
nevitables que se producirn en la prctica, con res- Los estadsticos estn colocados en una posicin cr-
pecto a los modelos tericos en los que se basa su tica. Por un lado, actan como garanta del proceso
enfoque del problema. Distribucin normal, marco de impulsado por los usuarios patrocinadores, aseguran-
muestreo, muestreo al azar, observaciones indepen- do la calidad del mismo en trminos de condiciones
dientes, datos faltantes, variables confusoras, valores tcnicas y de transparencia en materia moral.
extravagantes, son aspectos que debe considerar ex- Por el otro, son responsables de informar debidamen-
plcitamente en el informe que acompaar a los re- te a los entrevistados sobre los propsitos de la investi-
sultados. Si falta esa historia de los datos, stos no gacin y de asegurar la proteccin de su privacidad.
tendrn sentido, y cualquier significado que se les atri- Con respecto a las fuentes proveedoras de datos hay
buya, ser arbitrario. dos principios bsicos que sostienen todo el edificio
Si no se cumple con el deber de informar sobre as- de la informacin, sin los cuales ste se derrumbara
pectos como los mencionados, que tienen que ver con estrepitosamente. Esos principios se identifican como
las diferencias entre el proyecto de trabajo ex ante y el del consentimiento informado y el del secreto o
lo que efectivamente se pudo llevar a la prctica, ex reserva estadstica.
post, no solamente se incurre en una falla tcnica, El consentimiento informado expone claramente, que
sino que se cae en una falta moral. todo aquel que es interrogado durante una campaa de
90 91
H u go O scar A m b rosi

relevamiento, deber ser informado del contenido y


del propsito de esa campaa, de tal manera que pue-
da negarse a contestar, en forma total o parcial, en CAPTULO VI
cualquier momento de la entrevista.
Por otra parte, no se podrn revelar las respuestas
Los proveedores o del todo
individuales de los informantes sin autorizacin pre- a la parte
via de los mismos, bajo ninguna circunstancia. Los
datos nicamente se difunden en compilaciones de
conjunto, como cuadros o ndices estadsticos. Para muestra basta un botn
Esos principios son la piedra angular de todo el sis- Dicho popular
tema, que solamente se puede desarrollar si logran la
colaboracin voluntaria de los participantes, y con la
defensa de las fuentes de informacin de cualquier
infidelidad, que pueda ocasionarles perjuicios perso- Los datos siempre corresponden a conjuntos de ele-
nales daos econmicos o los desanime de cooperar mentos o de hechos; desde los tornillos de un proceso
en la produccin de datos. de manufactura, hasta los votantes en una eleccin.
Cada elemento proporciona una parte de los datos,
pero si queremos trascender la ancdota y tener una
visin general de la caracterstica o del proceso debe-
mos observar todos y cada uno de los integrantes del
conjunto.
Todas las unidades cuya observacin interesa o sea el
conjunto de todos los casos forman la poblacin objetivo.
Pero, frecuentemente y por distintas razones, la po-
blacin no puede ser inspeccionada exhaustivamente.
Costos, urgencia, naturaleza destructiva de los ensa-
yos, son algunos de los motivos que obligan a tomar
slo una parte, algunos elementos de la poblacin.
Por ejemplo: es limitado el tiempo para obtener in-
formacin financiera til, en relacin con los docu-
mentos disponibles en una auditoria. Un candidato
poltico en campaa, desea conocer sus perspectivas y
no puede preguntar a todos los votantes, por costoso e
inoportuno. Un fabricante de cohetes que desea saber
92
H u go O scar A m b rosi L os p roveed ores o d el tod o a la p arte

si sus artefactos estallarn, evidentemente no puede justificacin del empleo de muestras estadsticas, que
probarlos a todos. se obtienen extrayendo sus unidades al azar, en base
El paso siguiente entonces es la eleccin de los ele- a probabilidades claramente asignadas a cada elemen-
mentos que sern observados. La necesaria extraccin to de la poblacin. Estos procedimientos codifican
de algunas unidades, para estudiarlas, para someter- modos intuitivos naturales, que se aplican en el pro-
las al tratamiento deseado. ceso de hacer experiencia probando.
La poblacin objetivo, ser reemplazada por una En el procedimiento de seleccin es necesario re-
muestra parcial de sus elementos. Pasamos del todo solver la tensin entre nuestro conocimiento de la
a la parte. Pero no cualquier parte, sino una que re- poblacin y la neutralidad que tenemos que garantizar.
presente con fidelidad al resto. Esa neutralidad significa que el modo de elegir no puede
Cmo elegir las unidades que formarn la muestra? depender de la identidad de quien haga la seleccin.
La muestra condicionar la amplitud o generalidad Por eso, si se tiene algn conocimiento previo de
de las conclusiones que se obtengan. El mtodo de las unidades que guarde relacin con las caractersti-
seleccin empleado determinar la poblacin a la que cas que se quieren estudiar, deber ser incorporado
efectivamente se llega a investigar con la muestra. La al diseo, evitando as afectar la objetividad del proce-
forma de seleccin y la cantidad de unidades observa- so de seleccin, por la influencia de ese conocimiento
das determinar la precisin de las conclusiones. sobre el encargado de elegir. Se debe evitar a toda
Una expresin que solamente sirve para confundir costa elegir entre los elementos por simpata.
es muestra representativa. Tal concepto est vaco de En el camino que debe recorrerse para producir in-
significado, porque la poblacin objeto de estudio es formacin vlida y confiable, vale la pena destacar la
desconocida en los aspectos de inters. Mal se podra importancia que adquiere la eleccin de la muestra,
verificar la representatividad con respecto a algo que de la cual depender el valor de todo lo que se haga a
no se conoce, porque es imposible establecer criterios continuacin.
de comparacin. En caso contrario sera suficiente uti- Resulta fcil reconocer que una eleccin arbitraria
lizar la informacin disponible, no solamente para con- o dirigida de las unidades a observar, hace posible
trolar la representatividad de la muestra, sino para controlar los resultados. Si en una compulsa de ex-
responder directamente la cuestin planteada, con la pectativas de votos, se preguntara a los afiliados de
informacin exhaustiva disponible. un partido durante un mitin de campaa, seguramente
Lo mximo a lo que podemos aspirar, es a aplicar se podrn exhibir mayores porcentajes de adhesin
un procedimiento objetivo, independiente de quien que en una encuesta que realizara un partido opues-
elija la muestra y que adems pueda replicarse, per- to, entre los concurrentes a sus locales partidarios.
mitiendo comparar dos o ms muestras. Las diferen- Cuando lo que se busca es una muestra de la po-
cias encontradas reflejarn tambin la distancia en- blacin general, esa condicin de neutralidad no se
tre las muestras y la poblacin desconocida. Esa es la cumple en el muestreo por cuotas, o en las llamadas
94 95
H u go O scar A m b rosi L os p roveed ores o d el tod o a la p arte

encuestas coincidentales (en la va pblica), cuyo mis- unidad una probabilidad conocida, que en los dise-
mo nombre ya lo dice todo. os elementales llega a ser constante e igual en todos
Por eso es necesario adoptar un procedimiento ob- los casos. As es la probabilidad de cada cara de un
jetivo, independiente de quien est a cargo, para ele- dado, o la de cada valor de la baraja bien mezclada o
gir los elementos de la muestra. Ese procedimiento de cada nmero en la mesa de la ruleta.
deber aprovechar todo el conocimiento previo, me- El modelo ms simple consiste entonces en una lis-
diante la clasificacin de la poblacin en grupos o es- ta de las unidades (marco) y en un procedimiento de
tratos, por ejemplo separando por sexo o por lugar de sorteo de esas unidades. Por ejemplo, si la lista tiene
residencia. 40 elementos (estudiantes en una clase), cada uno de
A continuacin se aplica para la eleccin de las uni- los alumnos podr ser representado por una carta de
dades un mecanismo de sorteo. Como en la lotera. O una baraja espaola. Mezclar bien los naipes y ex-
como cuando se mezclan los naipes. O cuando se arro- traer 5 cartas nos estarn indicando cules 5 estu-
jan lo dados. Lo que sale de ese mecanismo es la indi- diantes han sido seleccionados.
cacin de qu elementos deben ser incluidos en la Es oportuno sealar en este punto, que uno de los
muestra. trabajos que el estadstico realiza es el diseo de los
Y ms all de las variaciones al azar, no impor- procedimientos de seleccin, que en algunos casos
ta quin aplica el procedimiento. Es independiente pueden llegar a ser muy complicados.
del operador. Y esa es la condicin que necesita- Sin embargo, en la mayora de las aplicaciones co-
mos para fundamentar nuestra creencia en los munes es posible una solucin elemental, compren-
datos. sible y de fcil ejecucin.
Un plan de muestreo tendr entonces dos compo- Cul es el precio que se paga por no tomar todos
nentes principales. los elementos de la poblacin y limitarnos a los ele-
En primer lugar el procedimiento para aprovechar mentos de la muestras?
la informacin disponible. Existen muchas formas, al- Para responder a esa pregunta, debemos notar que
gunas muy complejas, de incluir la informacin auxi- cada muestra producir resultados ms o menos dife-
liar en el diseo de una muestra. rentes de las otras muestras posibles. Esas diferen-
Tambin ocurre que no todos los diseadores tie- cias dependern de las diferencias existentes en la
nen igual acceso a la informacin existente. Para que poblacin base. Es fcil notar que si la poblacin tiene
la eficiencia no sea afectada excesivamente por esas elementos todos iguales, las muestras heredarn esa
desigualdades, adquiere gran importancia el modo en condicin y no habr diferencias entre ellas. Ms, an
que el Estado cumple su deber de proveer informa- en ese caso podemos anticipar que ser suficiente con
cin bsica, accesible a todos. observar un solo elemento y ya sabremos todo lo que
En segundo lugar hay que establecer un proce- se puede saber. Y no importar el tamao de la pobla-
dimiento de seleccin al azar, que asigna a cada cin. Ser lo mismo para 100 que para 10.000.
96 97
H u go O scar A m b rosi L os p roveed ores o d el tod o a la p arte

El comentario anterior encierra dos ideas que difciles, o que directamente no se encuentre una fr-
estructuran el pensamiento estadstico. La primera mula para medir el error de muestreo con los resulta-
considera la incertidumbre que introduce nuestra ca- dos de la misma muestra.
pacidad limitada de observacin, por la que no pode- La otra lnea lleva a desarrollar procedimientos que
mos conocer todos los casos, durante todo el tiempo. La sean eficientes para reducir o controlar la incertidum-
evidencia que tendremos siempre ser incompleta. bre. Entre stos ltimos est el tamao de la muestra.
La segunda subraya la relacin entre la diversidad Necesitamos una frmula que relacione la variabili-
de la poblacin estudiada y el tamao de la muestra. dad entre las muestras con el tamao de stas.
Si todas la bolillas son rojas, ser suficiente extraer En este punto corresponde mencinar que frente al
una, y ya tendremos toda la informacin sobre el co- lgebra compleja se cuenta con una solucin estads-
lor de la poblacin de bolillas. Qu haremos si son tica en el abordaje del problema mediante el muestreo
rojas y blancas, por partes iguales? Y si no sabe- replicado, que Deming expone magistralmente en
mos, como en la mayora de los casos, cuntas hay Sampling in Bussiness. El principio es genialmente
de cada color? simple y consiste en aplicar la experimentacin. Si
Ese no es un problema balad. Es lo que ocurre cuan- cada muestra puede dar un resultado particular, por
do queremos medir el desempleo, por ejemplo. qu no extraer ms de una muestra (2, 5,10) y obser-
Para permitir que la muestra refleje la variacin de var como varan entre ellas, en forma concreta, mate-
la poblacin, la clave es el tamao de la muestra. Por rial? Y entonces, con las herramientas descriptivas ele-
distintas vas: el sentido comn, la demostracin ma- mentales se puede calcular una evaluacin de la
temtica o la experimentacin (fsica o digital), se lle- informacin obtenida. En lugar de una muestra de
ga al mismo resultado: aumentar el tamao o repetir 500 casos, se extraen 5 muestras de 100 unidades o
la muestra (replicarla), permite acotar los errores, en 10 muestras de 50 unidades. De ellas se pueden cal-
el sentido de las diferencias observadas entre las dis- cular media, rango, cuartiles, variancia, etc.
tintas muestras. Cul es el principio del muestreo replicado? Preci-
Esa estabilidad de los resultados es necesaria para samente que podemos saber ms de la poblacin si
que la evidencia obtenida sea til. Es decir que pueda extraemos ms de una muestra. En especial sabremos
aplicarse a cuestiones prcticas. ms sobre la variabilidad y los sesgos de las muestras
Se abren dos lneas de trabajo, que debemos en- que se sacan. Cada muestra debe extraerse de igual
tender claramente. Una de ellas se refiere a la medi- forma que cualquiera de las otras.
cin de la variabilidad. Es un paso necesario para en- En estadstica la replicacin es un principio
frentar a la incertidumbre. Si queremos medir el grado medular. Las repeticiones de un experimento con
de incertidumbre resultante del procedimiento de monedas o dados, los resultados de un proceso de
muestreo y del tamao de la muestra, puede ocurrir, produccin de lmparas o tornillos, es lo que est
fuera de los casos elementales, que aparezcan frmulas bajo observacin. En esas repeticiones se alojan los
98 99
H u go O scar A m b rosi L os p roveed ores o d el tod o a la p arte

mecanismos azarosos que determinan la incertidumbre. sexo de los observadores, dado que el daltonismo afecta
Y domesticar el azar es el trabajo de la estadstica. de manera diferente a hombres y a mujeres.
El muestreo replicado, es decir la seleccin de 2 o Suponga que una muestra -seleccionada al azar-
ms muestras similares, en lugar de una muestra ni- de 1500 personas a lo largo del pas fue interrogada
ca, deja al descubierto los mecanismos que se activan acerca de si ellos miran regularmente un programa
con el procedimiento de muestreo. Y las rplicas per- de televisin, y el 24% dijo que s. Cun cerca usted
miten controlar los errores con frmulas simples, cap- piensa que puede estar ese valor del porcentaje de
tando toda la complejidad del proceso y evitando la televidentes que efectivamente miran el programa?
complejidad de las frmulas. Dentro del 30%, del 10%, del 5% o del 1%? Es exac-
tamente el mismo?
El error de muestreo
Hay alguna informacin que puede asombrar. Si usa
Es importante mencionar en este punto que la va- los mtodos comnmente
C o m o regla gen era l, la
riabilidad de muestreo, no es la nica fuente de in- aceptados para elegir
can tid ad p or la cu al la p rop or-
certidumbre. Avanzando un poco ms, al analizar los aleatoriamente 1500 adul-
ci n o b ten id a a p a rtir d e la
errores de diverso tipo que se producen y que influ- tos de una poblacin de mi-
m u estra d iferir d e la verd ad era
yen en las respuestas que se obtienen, resulta que llones de adultos, puede de-
p ro p orcin p o b la cion a l ra ra -
algunos de ellos no se reducen con ms observacio- terminar casi con total
m en te su p era 1 d ivid id o p or la
nes. Por el contrario frecuentemente aumentan cuan- seguridad, dentro del 3%, raz cu ad rad a d el tam a o d e la
do el esfuerzo se dispersa entre muchos casos. Por el porcentaje de la pobla- m u estra.E sto est expresad o p or
aquello de l que mucho abarca, poco aprieta. cin entera que tiene cier- la sim p le frm u la
1/ n , d on d e
Muchos errores son independientes de la cantidad ta caracterstica u opinin. la letra n rep resen ta el n m ero
de casos. Dicho ms claramente, hay errores que no (No hay nada mgico sobre d e p erson as en la m u estra.
desaparecen aunque interroguemos a toda la pobla- 1500 y el 3%, como se ver
cin. Entre ellos pueden citarse, los inducidos por una ms adelante.)
mala preparacin o redaccin de las preguntas, la in- An ms asombroso es el hecho de que este resulta-
fluencia de los encuestadores, la mutabilidad de las do no depende de cun grande es la poblacin: depen-
respuestas del entrevistado. de slo de cuntos hay en la muestra. Una muestra de
1500 estimara igualmente bien el porcentaje en una
Las variaciones que tienen que ver con el procedi- poblacin de 10 mil o de 10 millones, dentro del 3%.
miento de medicin que se aplica a los elementos se- Por supuesto, uno tiene que usar un mtodo de
leccionados no dependen de la cantidad de casos, sino muestreo apropiado, pero explicaremos eso ms
de las propiedades del instrumento empleado. Si se adelante.
trata de reconocer los colores, y el instrumento utili- Adems lleva menos tiempo conducir una encuesta por
zado es el ojo humano, deberemos tener en cuenta el muestreo, que un censo, y debido a que se necesitan
100 101
H u go O scar A m b rosi L os p roveed ores o d el tod o a la p arte

menos entrevistadores, hay un mejor control de la Eso ocurrir, segn las condiciones impuestas, a lo
calidad. sumo en una de cada veinte muestras.
Podemos ver por qu los investigadores se ocupan La precisin de los resultados se define segn un
de obtener encuestas de la opinin pblica ms que valor determinado por las condiciones del problema y
en tratar de recoger el sentir de todos. nuestra evaluacin de la tolerancia permitida. se es
Es mucho ms barato interrogar a 1500 personas el margen de error. Por otro lado, es necesario limitar
que a varios millones, especialmente cuando obte- la probabilidad de ocurrencia de desviaciones supe-
ner una respuesta es casi igual de preciso en ambos riores al margen fijado. Hay limitar la incertidumbre,
casos. la que depende la variabilidad de la poblacin y del
tamao de la muestra. De ellos surge el nivel de
Precisin de una encuesta por muestreo confianza.
Gran parte de las encuestas por muestreo son usa- Usted puede ver resultados tales como, El cincuenta
das para estimar la proporcin o porcentaje de perso- y cinco por ciento de los encuestados estuvieron de
nas que tienen cierta caracterstica u opinin. acuerdo con el plan econmico del Presidente. Si el
Por ejemplo, los ratings de TV, usados para deter- margen de error para esta encuesta es ms menos
minar el porcentaje de televisores argentinos sintoni- 2,5 puntos porcentuales, esto significa que es casi
zados en cierto programa, estn basados en un seguro (en la proporcin de 1 a 20) que la proporcin
muestreo de unos cuantos miles de hogares. que est de acuerdo con el plan se ubique entre el
Los diarios y revistas llevan a cabo peridicamente 52,5% y el 57,5% de la totalidad de la poblacin.
encuestas a unos cuantos cientos de personas, para En otras palabras, si suma y resta el margen de
determinar la opinin del pblico sobre temas de in- error al valor muestral, el intervalo resultante cubre
ters actual. Estas encuestas, si son conducidas apro- el verdadero valor poblacional con una seguridad ex-
piadamente, son asombrosamente precisas. presada por el nivel de confianza. Cada vez que usted
La medida de la precisin es un nmero llamado lee los resultados de una encuesta conducida apro-
margen de error. Comnmente se estipula que la di- piadamente, con un nivel de confianza del 95%, el
ferencia entre la proporcin muestral y la proporcin verdadero porcentaje caer fuera del intervalo, so-
poblacional no exceda el margen de error estipulado lamente 1 vez de cada 20.
ms que en 1 de cada 20 encuestas, es decir, en el 5% Conviene recordar los dos trminos que definen la
de las veces o menos. Eso es lo que se llama el nivel situacin: margen de error y nivel de confianza.
de confianza. Todo lo que hemos considerado se refiere especial-
Qu significado tiene este error? Pues es la pro- mente al caso en que el observador tiene a su cargo la
babilidad de que la diferencia entre el valor muestral, eleccin de las unidades.
por ej. la media y el valor verdadero y desconocido de Distinta es la situacin cuando la eleccin es hecha
la poblacin, exceda el margen de error establecido. por la naturaleza. En ese caso ser necesario verificar,

102 103
H u go O scar A m b rosi L os p roveed ores o d el tod o a la p arte

si es posible, que las unidades resultantes, pertene- muestreo. Segundo, una fuente generadora de nme-
cen a la poblacin de inters y si el proceso que pro- ros aleatorios.
duce la muestra no presenta alguna preferencia que Si la poblacin no es muy grande, se pueden usar
introduzca diferencias entre la poblacin y la muestra mtodos fsicos, como se ilustra en el prximo ejem-
de manera sistemtica. plo hipottico.
En resumen, el muestreo es un procedimiento com- Se puede usar un bolillero, donde cada bolilla co-
plejo que requiere el concurso de expertos, como cuan- rresponde a uno de los elementos de la poblacin,
do se trata de disear un puente. como en la lotera. Tambin existen tablas diseadas
El siguiente apartado ofrece una descripcin de las para ese propsito, llamadas tablas de nmeros
formas bsicas de muestreo. aleatorios o pueden ser generadas por computadoras
y calculadoras.
SOBRE EL MUESTREO Cmo hacer un muestreo de su clase?
Suponga que est en una clase con 200 estudian-
Muestreo aleatorio simple tes y que estn descontentos con el mtodo de ense-
La capacidad de una muestra relativamente peque- anza.
a para reflejar en forma precisa las opiniones de una Para comprobar si existe un N IV E L D E C O N F IA N Z A 9 5 %
M AR G E N D E TA M A O
poblacin mucho mayor, no se verifica por casualidad. problema que se deba presentar ERRO R M U E S TR A L
Se logra slo si se usan mtodos de muestreo apropia- a las autoridades, se decide obte-
2 .0 0 % 2500
dos. En la poblacin todos deben tener una probabili- ner una muestra aleatoria simple 2 .5 0 % 1600
dad conocida de entrar en la muestra. de 25 estudiantes y preguntarles 3 .0 0 % 1111
Los mtodos que tienen esta caracterstica son lla- sus opiniones. 4 .0 0 % 625
mados planes de muestreo probabilsticos. Note que una muestra de este 5 .0 0 % 400
La forma ms simple de lograr este objetivo es usar tamao tendra un margen de 10 .00% 100
una muestra aleatoria simple. error de alrededor del 20% por- 15 .00% 44
Con una muestra aleatoria (al azar) simple, cada que 1 / 25 1 / 5 0 , 2 , de acuerdo 20 .00% 25
grupo imaginable de personas del tamao requerido con la regla.
tiene la misma chance de ser elegido. Si la muestra es As, si el 60% de la muestra dijo que estaban
de tamao 10 y la poblacin son 100 personas, cual- insatisfechos, usted podra decirles a sus superio-
quier grupo de 10 personas entre esas 100 tendr la res que entre el 40% y el 80% de la clase entera
misma probabilidad de ser seleccionado. estaba probablemente insatisfecha, haciendo 0,60
Para producir en la prctica una muestra aleatoria +/- 0,20.
simple, se necesitan dos cosas. Primero, una lista de Aunque esa no es una afirmacin muy precisa, es
las unidades en la poblacin. Esa lista de las unida- ciertamente suficiente para mostrar una insatisfaccin
des que componen la poblacin, es el marco de importante: ms del 40% est desconforme.

104 105
H u go O scar A m b rosi L os p roveed ores o d el tod o a la p arte

El muestreo estratificado es usado a veces en lugar del


Para obtener la muestra, debe proceder como sigue: muestreo aleatorio simple por las siguientes razones:
Paso 1: Prepare una lista de estudiantes en la cla- Podemos calcular estimaciones separadas para cada
se, numerados del 1 al 200. estrato.
Paso 2: Obtenga 25 nmeros aleatorios entre 1 y Si la variable auxiliar presenta valores menos dis-
200. Una forma simple de hacer esto sera escribir persos dentro de cada uno de los estratos que dentro
cada uno de los nmeros, del 1 al 200, en trozos de de la poblacin entera, podemos obtener estimadores
papel iguales en tamao, ponerlos en una bolsa, mez- ms precisos de los valores poblacionales.
clarlos muy bien y extraer 25. Si los estratos estn separados geogrficamente,
Paso 3: El prximo paso ser ordenarlos en forma puede ser ms barato muestrearlos separadamente.
ascendente, y quedarn listos los 25 nmeros. Algunos Podemos usar entrevistadores diferentes dentro de
pueden aparecer repetidos. En ese caso basta repetir las cada uno de los estratos.
extracciones hasta tener 25 nmeros distintos.
Muestreo sistemtico
Otros mtodos de muestreo Si existe una lista de las unidades elementales de
Las poblaciones reales pueden presentarse organi- la poblacin se puede emplear el procedimiento de
zadas de distinta forma y la informacin disponible seleccin sistemtica.
sobre los elementos puede ser mayor o menor. Por ejemplo, si tiene una lista de 5000 nombres y
Los mtodos de muestreo tratan de aprovechar la nmeros de telfono de la cual hay que seleccionar
informacin disponible y atenuar los inconvenientes una muestra de 100. Eso significa seleccionar 1 de
que presentan las caractersticas de la poblacin, man- cada 50 personas en la lista, considerando la relacin:
teniendo controlado el costo.
5000 100 = 50
Muestreo aleatorio estratificado Teniendo en cuenta que por cada elemento de la
Cuando se cuenta con alguna informacin sobre las muestra, hay 50 en la poblacin, la primera idea que
unidades, y se sabe que esta informacin auxiliar est surge es simplemente elegir una unidad cada 50 n-
asociada con la caracterstica a estudiar, se puede apro- meros de la lista.
vechar ese conocimiento de distintas formas. Una de Un plan de estas caractersticas supone, en primer
ellas es clasificar las unidades en grupos (estratos), lugar, definir un salto, que no es otra cosa que el total
de acuerdo con los valores de la variable auxiliar. de unidades del universo dividido el tamao muestral
Una muestra aleatoria estratificada se obtiene to- deseado. En nuestro caso: 5000/100 = 50.
mando una muestra aleatoria simple de cada uno de El siguiente paso es definir un arranque aleatorio.
los estratos. Por ejemplo, los estratos pueden ser re- En nuestro caso, como seleccionaremos 1 de cada 50
giones del pas o partidos polticos. unidades, debemos elegir al azar un nmero entre 1
106 107
H u go O scar A m b rosi L os p roveed ores o d el tod o a la p arte

y 50. Este nmero de orden corresponde a la primera (manzanas) y se relevan slo las unidades de la pobla-
unidad seleccionada. cin incluidas en esos conglomerados.
Para completar la muestra elegimos, partiendo del Una ventaja obvia del muestreo de conglomerados
arranque aleatorio, las unidades siguientes, sumando es que solamente se necesita listar los conglomera-
50 al arranque, para la segunda unidad, otros 50 para dos, en lugar de una lista de todas las unidades indi-
la tercera y as hasta sumar 4950 (99x50) al arran- viduales. En este caso no existe una lista de viviendas
que, para la ltima. Habremos seleccionado as las 99 y prepararla sera muy costoso.
unidades restantes. Corresponden hacer dos observaciones sobre aspec-
tos que afectan la eficiencia de este diseo.
Muestreo de conglomerados
En primer lugar las diferencias en tamao (canti-
Es bastante comn encontrar agrupadas las unida- dad de unidades elementales) de los conglomerados.
des de inters en conglomerados que pueden identifi- En segundo lugar, la homogeneidad, es decir el gra-
carse claramente. En algunas ocasiones no tenemos do en el que unidades parecidas tienden a aparecer
informacin particular de las unidades elementales. reunidas en conglomerados. En el caso extremo, los
Solamente sabemos que estn agrupadas en conjun- conglomerados contienen cada uno solamente unida-
tos, de los cuales tenemos alguna informacin. Por des de un tipo determinado.
ejemplo, la mayora de los habitantes de un pas se En ese caso, relevar todas las unidades del conglo-
encontraran en alguna vivienda, cuya identificacin merado nos da la misma informacin que una sola
en el terreno, generalmente es evidente. Podemos en- unidad. La media es igual a cada elemento.
tonces elegir viviendas, para obtener una muestra de
personas. Es muy importante que la aplicacin del m- Muestreo multietpico
todo sea descripta detalladamente, porque puede mos- El hecho de que la informacin que proporcionen
trar una gran prdida de eficiencia comparado con el los conglomerados dependa de sus caractersticas (ta-
muestro simple al azar. mao y homogeneidad), los hacen en ocasiones poco
Consideremos las manzanas de una ciudad. Tene- eficientes como unidades de muestreo. Por eso es ne-
mos todos los datos de ubicacin geogrfica y el n- cesario aumentar su nmero. Pero por otro lado, es
mero de viviendas correspondientes al ltimo censo. evidente la inutilidad de relevar todas las unidades
Cmo organizar una muestra de viviendas en ese elementales, cuando son muy homogneas, porque
caso? en ese caso, una sola representa fielmente a todas
Los grupos entre los que se dividen las unidades de las del conglomerado.
la poblacin, se llaman conglomerados (1 manzana Las condiciones anteriores, ms los costos de acce-
igual a 1 conglomerado). so a las unidades, que acentan la conveniencia de
En lugar de muestrear viviendas individuales, se- utilizar conglomerados, hace que en las encuestas
leccionamos una muestra aleatoria de conglomerados grandes, especialmente aquellas que son relevadas cara

108 109
H u go O scar A m b rosi L os p roveed ores o d el tod o a la p arte

a cara, ms que por telfono, se use una combinacin Por qu no extraer efectivamente ms de una mues-
de los mtodos mencionados. tra, para disponer de un modelo fsico de la distribu-
Se puede estratificar por regin del pas, luego cin? Si hablamos de distribucin de las muestras...
estratificar por zona urbana, suburbana, y rural; y lue- pues tengamos efectivamente varias muestras! para
go elegir una muestra aleatoria de comunidades den- estudiar y medir su comportamiento.
tro de esos estratos. Ese es el principio en que se basa el muestreo re-
Luego se dividiran esas comunidades en manzanas plicado, que permite estimar la precisin de los clcu-
o reas, como conglomerados, para muestrear algunas los ms complejos, donde los procedimientos analti-
de ellas. Todos en la manzana o dentro del rea pue- cos requieren impresionantes procedimientos de valor
den ser entonces entrevistados. O se pueden muestrear solamente aproximado.
la unidades elementales dentro del conglomerado fi- El mtodo se completa con la seleccin sistemtica
nal. ste es un plan de muestreo multietpico. de las unidades, dentro de un marco de muestreo que
puede incorporar en su estructura la informacin auxi-
Muestreo replicado o submuestras independientes
liar disponible y, en una sola etapa, competir con los
Cuando en el diseo muestral es necesario tomar diseos ms complejos, incluyendo conglomeracin y
en cuenta informacin auxiliar, que refleje el conoci- etapas mltiples.
miento que se tiene de la poblacin, las condiciones La eleccin de la muestra es solamente la primera
son ms complejas. Ya sea por la estratificacin que parte del encadenamiento entre la poblacin y los da-
presenta o los conglomerados que renen unidades tos. Cuando se trata de elegir personas para formular-
elementales se hace difcil, y a veces imposible, calcu- les preguntas, surgen dos grandes temas. Uno de ellos
lar la precisin de la muestra. Las frmulas del error, es el contenido y forma del cuestionario, lo que ser
si existen son muy complejas y, a pesar de ello, sola- analizado a continuacin. El otro es el modo en que se
mente aproximadas, bajo supuestos ms o menos res- establece la relacin con el entrevistado. Cmo se le
trictivos. Se presenta un escenario de gran trabajo y presenta la encuesta? Qu informacin recibe? Qu
resultados inseguros. derechos tiene?
Se cuenta con un abordaje alternativo: las sub-
muestras interpenetrantes, o muestras replicadas o Alerta 2
submuestras independientes.
El principio es simple. Todo el razonamiento en La necesidad del consentimiento informado y
que se basan las estimaciones muestrales, se apoya la proteccin de la privacidad no son meramente
en que el resultado pertenece al conjunto de resul- garantas del mundo privado de cada uno, aunque
tados posibles. Y se calcula la distribucin de ellos, efectivamente lo protejan. Constituyen los medios
para determinar el margen de error y el nivel de necesarios para que la informacin no se vea afec-
confianza. tada en su validez o confiabilidad, por los temores,

110 111
H u go O scar A m b rosi

resistencias o intereses, de los informantes, en rela-


cin con el interrogatorio. Si se presta a declarar y
est seguro que lo que diga no podr perjudicarlo, CAPTULO VII
queda despejado el camino para obtener la informa-
cin correcta.
Preguntas y respuestas

Una vez identificados los patrocinadores de un


proyecto de datos, comprobadas las calificaciones
del equipo de expertos a cargo del proyecto y defi-
nidas adecuadamente la poblacin a estudiar y la
forma de elegir los miembros que sern observa-
dos, debe abordarse el diseo del instrumento de
medicin que para el caso de una encuesta, es el
cuestionario.
Es oportuno reiterar la afirmacin hecha anterior-
mente, al decir que las respuestas que se obtengan
dependern de las preguntas que se hagan.
Ese postulado de alcance general, cuya validez se
comprueba al analizar el proceso de medicin, cuan-
do la investigacin se dirige a cualquier objeto (perso-
nas, animales o cosas), se manifiesta con total e
impactante vigencia cuando se redacta el cuestionario
para una encuesta social.
Los efectos de las preguntas no dependen solamente
de su contenido conceptual, sino, en gran medida, de
las expresiones verbales, del fraseo, que es utilizado
en forma concreta al dirigirse a los entrevistados, in-
tegrantes de la poblacin objetivo.
112
H u go O scar A m b rosi P regu n tas y resp u estas

El protocolo de la investigacin, definido por los de- de todo el proceso. Se deben revisar los requerimien-
talles sobre qu, cmo, dnde y cundo interrogar a tos recibidos, analizarlos, disear un prototipo del ins-
los individuos elegidos, condiciona los resultados que trumento y fundamentalmente, probarlo!, en ensa-
se obtengan. yos debidamente preparados.
Nos vamos a detener ahora especialmente en la pre- Debe prestarse mucha atencin a las decisiones cr-
paracin de las preguntas que se incluirn en un cues- ticas que se tomen durante la preparacin de un pro-
tionario, de acuerdo con los requerimientos del patro- y ect o basado en datos.
cinador que aporta los recursos, con quien ya se ha Una de las decisiones ms difciles es precisamente
determinado tambin la poblacin objetivo, el blan- decidir exactamente qu medir o qu preguntas ha-
co del estudio. cer. Y una vez decidido qu preguntas hacer, todava
En este punto debe definirse el sistema de trabajo a existen mltiples formas de redactar la pregunta ele-
utilizar en las mediciones que se efecten. Si se trata gida, es decir, cmo ponerla en palabras.
de una encuesta, sern los cuestionarios, guas de El descuido de las expresiones utilizadas produce,
entrevista, clasificaciones y nomenclaturas, instruc- tarde o temprano, malas interpretaciones y errores.
ciones de los encuestadores y del personal de gabine- Cuando se leen los resultados de un estudio, es im-
te que procesar los datos. portante saber qu fue medido o preguntado y exac-
Las preguntas que se incluyan en el cuestionario, tamente cmo fue recolectada esa informacin.
estarn dirigidas a determinar los valores que presen-
ten algunas caractersticas de los entrevistados. La medicin
Las respuestas varan entre los distintos individuos.
Esa variabilidad determinar el tamao de la muestra Considere algo tan sencillo como medir su propia
a seleccionar. Por esa razn el diseo de la muestra altura. Hagamos un experimento. Con una regla y una
no quedar cerrado hasta que no se defina el conteni- tiza marque su altura en la pared. Para ello apoye la
do del cuestionario. regla sobre su coronilla y haga una marca con la tiza,
Vale la pena destacar que el orden de actividades se- guiado por la regla.
guido hasta aqu, no se opone a que en un caso real, las Reptalo varias veces y compruebe si los valores de
condiciones del problema y los datos iniciales disponibles las distintas mediciones se conservan dentro de una
impongan cambios en la secuencia de actividades. diferencia de menos de medio centmetro.
As, nada impide que el primer elemento que surja No? Analice los factores que han influido en sus
sea alguna pregunta o una primera versin del cues- resultados y haga una evaluacin del sistema de me-
tionario. Pero hay un orden que debe conservarse en dicin aplicado.
el anlisis y evaluacin de los procedimientos, tenien- Ahora imagine que trata de medir algo mucho ms
do en cuenta las eventuales influencias entre los dis- complejo, como las intenciones de voto en una elec-
tintos componentes del diseo, sobre los resultados cin nacional.

114 115
H u go O scar A m b rosi P regu n tas y resp u estas

Los investigadores rutinariamente intentan efectuar El sistema de referencia, condiciona la exactitud por
mediciones de ese tipo y para eso es necesario una la forma en que fue construido. Por eso importan los
cuidadosa preparacin y ensayos bien planificados. detalles del proceso de medicin y de aceptacin de la
Medir es contar, comparar una unidad con otra y calibracin del instrumento. Por ejemplo, recordemos
asignarle un valor. Es asignar nmeros a los objetos. la definicin de las dos medidas ms difundidas: el
Todo lo que existe, existe en una cierta cantidad y metro y el kilogramo.
puede ser objeto de medicin. Si se trata de queso, es (http://www.exploralaciencia.profes.net/
medio kilo de queso, o una pieza de queso, etc. ver_noticia.aspx?id=5757 )
El sistema de medicin est formado por 4 compo- El metro patrn de 1889 era una copia del metro
nentes: el Objeto medido, el Instrumento de medicin, que se estableci durante la famosa medida del meri-
el Sistema de referencia o Patrn de comparacin y el diano terrestre entre Dunquerque y Barcelona. A par-
Operador, o encargado de poner en relacin a los otros tir de ese patrn inicial se construy un prototipo de
tres componentes. platino con dos marcas cuya distancia a 0C constitu-
Como ejemplo basta recordar el sistema mtrico de- y la definicin oficial de metro.
cimal, cuyo Metro Patrn, que se define como unidad En el caso del kilogramo, se defini conceptual-
de referencia, ha evolucionado desde la representa- mente como la masa de un litro de agua a 4C y una
cin material concreta hasta ciertas formulas relacio- atmsfera de presin, y se construy un prototipo en
nadas con constantes fsicas. platino que se guard junto con el del metro en los
Su evolucin desde la poca de la Revolucin Fran- Archivos de Pars.
cesa hasta ahora, ilustra los cambios del saber cient- La Conferencia de 1983 adopt una nueva defini-
fico y por lo tanto muestra lo relativo de las definicio- cin: el metro es la longitud del camino atravesado
nes de los estndares. por la luz en el vaco durante un intervalo de tiempo
La precisin de los resultados obtenidos con un sis- de 1/299.792.458 de un segundo medido con un re-
tema de medicin depende de cada uno de sus com- loj de cesio.
ponentes y de las interacciones entre ellos. La teora Pero con el kilogramo no ha ocurrido lo mismo, por-
de los errores de medicin se ocupa del manejo de la que no se ha encontrado un patrn inmaterial capaz
incertidumbre resultante. de sustituirlo. El actual prototipo data de 1889, y se
El instrumento determinar tambin, de acuerdo a custodia con toda clase de precauciones en el Bureau
sus caractersticas, el nmero de cifras significativas. International des Poids et Mesures, en Francia. Slo se
Por ejemplo, si la regla est graduada en centmetros, ha manipulado algunas veces, pero se cree que ha
la menor unidad operativa sern los centmetros. Si modificado ligeramente su masa. Tan solo en tres oca-
estuviera graduada en milmetros, stos determina- siones, separadas en unos 40 aos, se ha comparado
rn la ltima cifra significativa, por lo menos desde el la masa del patrn internacional con las masas de
punto de vista del instrumento de medicin. las copias oficiales, y los resultados muestran ciertas
116 117
H u go O scar A m b rosi P regu n tas y resp u estas

divergencias en el tiempo: las copias muestran varia- instrumentos o mtodos imperfectos afectarn nuestros
ciones de aproximadamente 5 x 10-8 desde su primera resultados siempre en un mismo sentido.
calibracin con relacin al patrn internacional. Imaginemos por ejemplo el caso de una balanza
bien calibrada que se usa para conocer el peso de las
Sobre los errores
personas en los centros comerciales u otros negocios.
Vulgarmente el trmino error se emplea como equi- Como es usual que las personas, estando en pblico,
valente a equivocacin. En ciencia, en cambio, el error se pesen vestidas, los valores registrados con estas
est asociado al concepto de incertidumbre en el re- balanzas tendrn un error sistemtico por el peso de
sultado de una medicin. la vestimenta.
La nica manera de detectarlos y corregirlos es com-
parar nuestras mediciones con otros mtodos alter-
nativos y realizar un anlisis crtico y cuidadoso del
procedimiento empleado. Tambin es aconsejable in-
tercalar en el proceso de medicin, patrones confiables
que permitan calibrar el instrumento durante la me-
dicin.
Errores aleatorios: Son los que se producen al azar.
En general son debidos a causas mltiples y fortui-
tas. Ocurren cuando, por ejemplo, nos equivocamos
en contar el nmero de divisiones de una regla, o si
estamos mal ubicados frente al fiel de una balanza y
no esperamos a que se detenga.
Estos errores pueden cometerse con igual probabi-
lidad por defecto como por exceso. Por tanto, midien-
do varias veces y promediando el resultado, es posible
reducirlos considerablemente. Es a este tipo de erro-
Grfico 1. Tipos de errores. res a los que comnmente hace referencia la teora
estadstica de errores de medicin.
El Grfico 1 presenta los errores clasificados en sis- Errores ilegtimos o espurios: Supongamos que de-
temticos (a y c) o aleatorios (b y d). seamos calcular el volumen de un objeto esfrico y
Errores sistemticos: corresponden a las imperfec- para ello determinamos su dimetro. Si al introducir el
ciones de los mtodos de medicin. Por ejemplo, valor del dimetro en la frmula, nos equivocamos en el
pensemos en un reloj que atrasa o adelanta, o en nmero introducido, o lo hacemos usando unidades
una regla dilatada, etc. Los errores introducidos por incorrectas, o bien usamos una expresin equivocada
118 119
H u go O scar A m b rosi P regu n tas y resp u estas

del volumen, claramente habremos cometido un error El tipo de escala utilizado para las mediciones, sirve
que est ms cercano al concepto convencional de equi- para clasificar las variables que han sido medidas. Se
vocacin. obtienen as, variables categricas cuando el tipo de
A este tipo de errores, designados como ilegtimos o escala es el nominal, es decir cuando el valor que pre-
espurios, no se aplica la teora estadstica de errores. senta cada observacin se distingue de los dems por
El modo de evitarlos consiste en evaluar cuidadosa- un nombre (pases, clubes de ftbol, etc.). Si se utili-
mente los procedimientos seguidos en la medicin. zara un nmero para identificar cierta modalidad, como
Considerando la evolucin de las unidades de me- en la identificacin de las aulas de una escuela, debe
dida de longitud y peso, qu cabe esperar de los in- tenerse en cuenta que en ese caso los nmeros son
tentos de medicin, con instrumentos de tan difcil ca- etiquetas. Dara lo mismo que se les pusieran letras o
librado como los cuestionarios de una encuesta social? algunos nombres.
En el intento de establecer un proceso de medicin Slo identifican el objeto al que han sido adjudica-
es necesario considerar desde el comienzo la escala dos, cumpliendo la funcin de un cdigo. En esa fun-
en la que las medidas sern tomadas. cin no pueden ser sometidos al clculo aritmtico.
Las escalas de medida utilizadas en el proceso se Un ejemplo de este tipo de error es el que se come-
pueden clasificar en categricas o numricas. Las ti en el Mars Climate Explorer a fines de 1999, al
categricas pueden ser nominales u ordinales. Las pasar de pulgadas a cm se cometi un error que cost
numricas a su vez pueden ser de intervalo o de el fracaso de dicha misin a Marte.
razn, segn las propiedades de las comparaciones Teniendo en cuenta lo anterior, no deber sorpren-
entre ellas. der cmo pueden cambiar las respuestas a causa de
pequeos cambios en la redaccin de las preguntas.
Cualitativas o Categricas: * Nominales y * Ordinales. J. Utts menciona un experimento durante el cual se
Cuantitativas o Numricas: * Intervalo y * Razn. les mostraron a estudiantes universitarios pelculas
sobre un accidente de automvil. Despus de la pro-
Las escalas categricas o cualitativas, se basan en yeccin se les hicieron preguntas sobre lo que ha-
procesos de clasificacin y ordenamiento. El sistema ban visto.
de nmeros naturales se utiliza en ellas para contar Un grupo fue interrogado con la siguiente
la dotacin de las clases resultantes del proceso. pregunta:Aproximadamente qu tan rpido iban los
Supongamos que hacemos el inventario en un aula. autos cuando entraron en contacto uno con otro?. La
Entre los elementos estn las tizas de colores. Las se- respuesta promedio fue 51,2 kilmetros por hora.
paramos segn el color y contamos la cantidad que A otro grupo le fue preguntado: Aproximadamen-
hay de cada uno. Si contamos 14 tizas amarillas, po- te qu tan rpido iban los autos cuando chocaron uno
dremos comparar ese valor, con las cantidades equi- con otro? En ese grupo, la respuesta promedio fue
valentes obtenidas para las rojas o las azules. 65,7 kilmetros por hora.
120 121
H u go O scar A m b rosi P regu n tas y resp u estas

Simplemente cambiando la palabra contactar con encuesta de manera que los resultados tuvieran la
la palabra chocar se incrementaron las estimaciones mejor concordancia posible con su posicin.
de velocidad en 14,5 kilmetros por hora, o el 28%, Sera necesario preparar en cada caso las pregun-
aunque quienes respondieron haban sido testigos de tas con las que se produciran las estimaciones de la
la misma pelcula. proporcin de gente que piensa que el aborto debera
Si la sola diferencia de una palabra, produjo esa ser completamente ilegal. Las siguientes preguntas
diferencia en las respuestas, no debemos subestimar son ejemplos de enfoques diferentes:
la importancia que tiene la redaccin de las pregun- Usted est de acuerdo con que el aborto, el asesi-
tas, sobre los resultados. nato de seres inocentes, debera ser ilegal?
Como consecuencia de lo dicho, cuando se ha- Usted est de acuerdo con que hay circunstancias
cen preguntas en una encuesta o experimento, se bajo las cuales el aborto debera ser legal, para prote-
puede caer en muchas trampas. He aqu algunas ger los derechos de la madre?
de ellas: Es casi seguro que cada pregunta producir un es-
timador diferente. De aqu resulta lo esencial de este
S esgo d elib erad o
punto: una redaccin adecuada no debe inclinar las
S esgo n o in ten cion ad o
respuestas en una direccin determinada.
D eseo d e com p lacer
P regu n tar sob re tem as ign orad os por el en trevistado Sesgo no intencional
C om p lejid ad in n ecesaria
A veces las preguntas se redactan de tal forma que
O rd en am ien to d e las p regu n tas
el significado es malinterpretado por un gran porcen-
C on fid en cialid ad y an on im ato
taje de los interrogados.
S esgo d elib erad o
Por ejemplo, si fuera a preguntarle a la gente cul
A veces, si una encuesta est siendo conducida a es la fecha ms importante de su vida, necesitara acla-
favor de cierta causa, las preguntas se redactan rar si se refiere a la fecha ms importante del calenda-
deliberadamente en una forma que inclinen las res- rio o a un hecho personal. Por ejemplo, esa diferencia
puestas en el sentido deseado. har que alguien cambie su eleccin entre el aluniza-
Por ejemplo, las preguntas que comienzan con fra- je de Armstrong o su propio casamiento.
ses como Usted est de acuerdo con..., estn bajo Por regla general, una misma palabra tiene ms de
la influencia de la tendencia de la mayora de la gente un significado y lo importante es dejar bien claro cul
que desea concordar y estarn inclinados a responder se aplica en una pregunta concreta. Para lograr esto
s a menos que tengan fuertes sentimientos en la otra se deben utilizar siempre palabras que sean de uso
direccin. corriente entre la poblacin que integrar el universo
Por ejemplo, suponga que un grupo antiaborto y de una determinada investigacin. Si desea conocer
un grupo proaborto quisiera conducir cada uno una las opiniones de sus empleados sobre un determinado

122 123
H u go O scar A m b rosi P regu n tas y resp u estas

aspecto de los procesos internos de trabajo en los que


estn involucrados, es conveniente utilizar un lenguaje Preguntar por temas ignorados por el entrevistado
similar al que ellos utilizan para hablar de su expe- A la gente no le gusta admitir que no sabe de lo que
riencia laboral. se est hablando cuando le hacen una pregunta.
Por ejemplo, si desea conocer las opiniones del sec- Crossen da un ejemplo: Cuando el American Jewish
tor de cocina de un restaurante de primera categora, Committee estudi las actitudes hacia varios grupos
usted debera utilizar el lenguaje particular con el que tnicos, casi el 30% de los entrevistados tuvo una opi-
sus miembros describen los procesos internos de la nin sobre los ficticios Wisianos, valundolos en un
cocina (sus jerarquas particulares, sus costumbres, estado social por encima de media docena de otros
etc.) para poder preguntarles algo que fuera relevante grupos tnicos reales, incluyendo mexicanos, vietna-
para la investigacin y que estuviera en concordancia mitas, y negros africanos.
con el modo en que esos procesos son vividos por sus Los encuestadores polticos que estn interesados
participantes. en encuestar slo a aquellos que realmente van a vo-
tar, aprendieron hace rato que es intil preguntar sim-
Deseo de complacer
plemente a la gente si piensa votar. La mayora de
La mayora de los entrevistados en las encuestas, ellos dir que s. En cambio, ellos hacen preguntas
como en la vida de relacin, se sienten naturalmente para establecer una historia de votacin, tales como
inclinados a complacer a la persona que les est ha- Dnde vot en las ltimas elecciones?.
ciendo la pregunta. Existe la tendencia a subestimar
las respuestas y opiniones propias. Complejidad innecesaria
Por ejemplo, si una encuesta es realizada directa- Las preguntas deben ser hechas de manera simple,
mente por el personal jerrquico de una organizacin, para ser entendidas. Una pregunta del tipo siguiente,
la obreros de la empresa pueden pensar que ellos no es seguro que lleva a confusin:
tienen nada importante que decir sobre los procesos No debera a los ex vendedores de drogas no
de trabajo, aun en aspectos en los que estn ms di- permitrseles trabajar en hospitales luego de que sa-
rectamente involucrados y sobre los que tienen un len de prisin?.
conocimiento ms detallado que sus superiores. Una respuesta s significa que a ellos deberan o
Es de vital importancia preguntar de tal manera no deberan permitirles trabajar en hospitales? Toma-
que no resulte estimulado en los entrevistados el de- ra algunas lecturas darse cuenta de eso.
seo de ser conciliadores con el saber de quienes pre- Otra forma en la cual una pregunta puede resultar
guntan o de quienes dirigen la investigacin. Esto innecesariamente compleja es preguntar ms de una
alcanza tanto a las actitudes de quin pregunta como cuestin a la vez.
qu se pregunta. Un ejemplo sera una pregunta del tipo,
Usted apoya el plan porque asegurara que todos
124 125
H u go O scar A m b rosi P regu n tas y resp u estas

los habitantes reciban cobertura mdica? Si usted Es ms fcil tratar de asegurar confidencialidad que
est de acuerdo con la idea de que todos deberan un verdadero anonimato. En una encuesta verdadera-
recibir cobertura mdica, pero no est de acuerdo con mente annima, el investigador no conoce la identi-
el resto del plan, usted responde s o no? Y qu hay dad de los entrevistados.
si usted est de acuerdo con el plan de salud, pero no Las preguntas sobre temas tales como comporta-
por esa razn? miento sexual e ingreso son particularmente difciles
porque la gente los considera como temas privados.
El orden de las preguntas
Una variedad de tcnicas han sido desarrolladas para
Si una pregunta requiere que los entrevistados pien- ayudar a asegurar la confidencialidad.
sen sobre algo que, tal vez, ellos no hubieran conside- Una pregunta abierta es una en la cual a los entre-
rado, entonces el orden en el cual las preguntas son vistados se les permite contestar en sus propias pala-
presentadas puede cambiar los resultados. bras, mientras que una pregunta cerrada es una en
Por ejemplo, suponga que usted en una encuesta la cual les es dada una lista de alternativas entre las
preguntara: cuales deben elegir su respuesta.
En qu grado usted piensa que los adolescentes de Usualmente la ltima forma ofrece una eleccin de
hoy se preocupan por la presin social relacionada otro, en la cual al que responde le es permitido lle-
con tomar alcohol?. nar el espacio en blanco libremente.
Y seguidamente hiciera la pregunta:
Nmbreme los cinco motivos de presin social ms Problemas con las preguntas cerradas
importantes a los cuales piensa usted que se enfren- Para mostrar la limitacin de las preguntas cerra-
tan los adolescentes de hoy. das, consideremos los resultados de un estudio en los
Es muy probable que muchos respondieran apli- EE.UU., en que preguntaron sobre:
cando la idea que acaban de recibir y nombraran a la el problema ms importante que hoy en da en-
presin social relacionada con tomar alcohol como una frenta este pas.
de las cinco presiones ms importantes. A la mitad de la muestra, le fue dada como pregun-
ta abierta. Las respuestas ms comunes fueron:
Confidencialidad y anonimato
Desempleo (17%)
La gente a veces responde preguntas en forma dife-
Problemas econmicos en general (17%)
rente segn el grado de creencia en que su respuesta
Amenaza de guerra nuclear (12%)
es annima.
Asuntos de poltica exterior (10%)
Al asegurar confidencialidad, el investigador prome-
te no dar a conocer informacin identificatoria sobre En otras palabras, ms de la mitad de las respues-
los entrevistados. La confidencialidad es una piedra tas se expresaron voluntariamente por alguna de esas
angular del proceso de produccin estadstica. cuatro opciones.

126 127
H u go O scar A m b rosi P regu n tas y resp u estas

A la otra mitad de la muestra le fue dada como pre- pueden ser probados antes de que sea demasiado tar-
gunta cerrada. A continuacin est la lista de opcio- de para cambiarlos.
nes y el porcentaje de entrevistados que la eligieron:
Problemas con las preguntas abiertas
La falta de energa (5,6%)
El mayor problema con las preguntas abiertas es
La calidad de las escuelas pblicas (32,0%)
que los resultados son difciles de resumir. Si una en-
La legalizacin del aborto (8,4%)
cuesta incluye miles de entrevistados, puede ser una
La contaminacin (14,0%)
tarea enorme categorizar las respuestas.
Estas cuatro opciones combinadas fueron mencio- Otro problema es que la redaccin de la pregunta
nadas por solo el 2,4% de los entrevistados en la en- puede excluir, accidentalmente, respuestas que hu-
cuesta de la pregunta abierta. Aun as, las eligi el bieran sido atractivas si hubieran sido incluidas en
60% de los entrevistados, cuando fueron las nicas una lista de alternativas (tales como en una pregun-
opciones disponibles. ta cerrada).
Ms an, a los entrevistados en esta encuesta de Para probar esto, se le pidi a 347 personas que
preguntas cerradas les fue dada una eleccin abierta. nombren uno o dos de los eventos o cambios ms
Sobre la base del cuestionario que contena estas importantes a nivel nacional e internacional durante
preguntas cerradas, los encargados de disear e los pasados 50 aos.
implementar polticas estratgicas que estuvieran en Las respuestas ms comunes y el porcentaje que la
concordancia con la voluntad del pblico hubieran sido mencionaron fueron:
seriamente desorientados sobre lo que es importante La Segunda Guerra Mundial (14,1%)
y lo que no. El asesinato de John F. Kennedy (4,6%)
Sin embargo, es posible evitar este tipo de discre- La Guerra de Vietnam (10,1%)
pancias sorprendentes. Si las preguntas cerradas son No sabe (10,6%)
preferidas, primero deberan ser presentadas como Todas las otras respuestas (53,7%)
preguntas abiertas a una muestra de prueba (que pue-
de ser numricamente mucho menor que la muestra La misma pregunta fue luego repetida en forma ce-
final) antes de que sea conducida la encuesta real. rrada a un nuevo grupo de 354 personas.
As, las respuestas ms comunes que viertan los Fueron dadas cinco alternativas: las primeras cua-
participantes, expresadas en sus propios trminos, tro alternativas en la lista precedente, ms la inven-
sern incluidas en la lista de opciones para la pre- cin de la computadora..De los 354 entrevistados,
gunta cerrada. el porcentaje de aquellos que seleccionaron cada op-
Este tipo de ejercicio es hecho usualmente como cin fue:
parte de lo que se denomina una encuesta piloto, La Segunda Guerra Mundial (22,9%)
en la cual varios aspectos del diseo de un estudio

128 129
H u go O scar A m b rosi P regu n tas y resp u estas

estandarizacin y calibrado. Este camino se est reco-


El asesinato de John F. Kennedy (11,6%) rriendo, mediante la organizacin de recopilaciones
La guerra de Vietnam (14,1%) de preguntas utilizadas en distintas encuestas. Eso
La invencin de la computadora (29,9%) permite aplicarlas en otras investigaciones, y de esa
No sabe (0,3%) manera estandarizar los resultados.
Todas las dems opciones (5,4%)
La respuesta ms frecuente fue la invencin de la
computadora, la cual haba sido mencionada slo por Preguntas para pensar
el 1,4% de los entrevistados en la pregunta abierta.
Claramente la redaccin de la pregunta llev a los Suponga que estuviera interesado en descubrir qu
entrevistados a enfocarse en sucesos ms que en siente la gente como el problema ms importante al
cambios, y la invencin de la computadora no vino a que se enfrenta la sociedad hoy. Piensa que sera
la mente rpidamente. Cuando fue presentada como mejor darles un conjunto fijo de opciones entre las
una opcin, sin embargo, la gente se dio cuenta que cuales ellos deben elegir, o formular una pregunta
de hecho fue uno de los ms importantes sucesos o con final abierto que les permita especificar lo que
cambios durante los ltimos 50 aos. quieran? Cules seran las ventajas y las desventajas
En resumen, hay ventajas y desventajas para am- de cada aproximacin?
bas aproximaciones. Un procedimiento seguido para
resolver el conflicto consiste en pedir a una pequea Usted y un amigo estn haciendo cada uno una en-
muestra de prueba que listen las primeras respuestas cuesta para ver si hay una relacin entre altura y feli-
que les vengan a la mente, y luego usar las ms comu- cidad. Ambos tratan de medir la altura y la felicidad
nes de ellas en una encuesta de preguntas cerradas. de las mismas 100 personas. Cun probable es que
Conviene recordar que en el momento de interpre- coincidan en sus mediciones de altura o en sus medi-
tar los resultados, el lector debera estar siempre in- ciones de felicidad? Explique, discutiendo cmo me-
formado sobre si las preguntas fueron hechas en for- dira cada caracterstica.
ma abierta o cerrada, y si en este caso debera ser
informado de cules fueron las opciones. Tambin de- Usted est en una pileta de natacin con un amigo
bera ser claro si fueron ofrecidas como opciones no y estn curiosos de saber el ancho de la pileta. Su
sabe o no contesta, en forma separada o conjunta. amigo tiene una regla de 20 centmetros, con la cual
se las arregla para medir la anchura. l informa que
Conclusin el ancho es de 4,81 metros. Usted cree que la pileta
La preparacin de preguntas es un arte. Si esas tiene exactamente ese ancho? Cul es el problema?
preguntas deben formar parte de un sistema de medi-
cin, es necesario establecer alguna forma de

130 131
CAPTULO VIII
Estadstica y lenguaje

Sorprenderse, extraarse, es comenzar a entender.


Jos Ortega y Gasset

Todo est en las palabras


Las estadsticas son algo ms que nmeros. Tome-
mos, por ejemplo, el valor de la temperatura segn el
informe del Servicio
Meteorolgico. Aca-
so ese nmero 12
es la informacin?
Tambin 12
puede indicar la fe-
cha del da martes
12 de agosto de
2005. O la edad de
un sobrino. El nmero solo, no contiene la informa-
cin que necesitamos. Solamente decir 12 no alcan-
za. Y entonces?
Veamos. En el caso de la temperatura hablamos
de 12 grados. La fecha se completa al decir el mes
y el ao. La edad tendr sentido cuando aadimos
aos y el nombre del sobrino. Es imprescindible,
para que los nmeros tengan sentido, que se espe-
cifique de qu se habla. Cul es la sustancia, la
materia?
H u go O scar A m b rosi E stad stica y L en gu aje

Pero una vez establecido que se trata de la tem- Los resultados estadsticos son smbolos de un len-
peratura, o de la fecha, o de la edad, todava el sig- guaje, con los cuales se transmiten significados. Ms an,
nificado est incompleto. Falta establecer cmo se estadstica es una parte esencial del lenguaje. Es parte
obtiene el nmero, cmo se lo extrae del material de la lengua que hablamos todos los das. Es un barrio
en bruto que estamos observando. (Con perdn de mucho ms ancestral que las recientes urbanizaciones
nuestro sobrino). levantadas por el clculo infinitesimal, por ejemplo.
El resultado depender del procedimiento que se En nuestra conversacin sabemos bien que pesan e
emplee para medir. El instrumento: termmetro, re- importan tanto los dichos como los supuestos que, ni
gla, balanza, es una parte, un componente del siste- ms ni menos, permiten que nos entendamos. Lo que
ma. La otra es la escala con la que se grada el instru- se da por sobreentendido es lo que une y lo que sepa-
mento. Un termmetro puede expresar sus valores en ra. Lo que nos puede incluir o convertir en extraos.
grados Celsius, Fahrenheit o Centgrados. Una regla Con lo anterior en mente, se comprende que leer e
estar graduada en centmetros o en pulgadas. La ba- interpretar los resultados de una encuesta o de un
lanza podr pesar gramos o libras, y al mismo tiempo experimento no es muy diferente de leer una noticia
estar graduada con variable precisin. policial o deportiva.
Y dnde aparecen la sustancia y el instrumento Un aficionado a los deportes, sabe qu informacin
que producen el nmero? Son los factores que ha- debe estar incluida en una nota deportiva, y tambin
cen de un nmero, un dato. La manifestacin con- nota cuando falta alguna informacin importante.
creta de la naturaleza compleja del dato, que no pue- Igualmente si se ha visto envuelto en un suceso que
de reducirse a la mera cantidad representada por el luego es comentado por los peridicos, distinguir muy
nmero, sino que requiere la expresin de qu es bien cul es la informacin faltante y de qu modo esa
medido y cmo. Y esos antecedentes son cualita- ausencia puede estar conduciendo a los lectores del
tivos y su descripcin se hace con los recursos del diario a un error.
lenguaje. Por eso la matemtica no puede agotar el Usted debe saber qu informacin debe ser incluida
contenido de los datos. Porque stos son como un en un informe estadstico. Desgraciadamente mucha
puente entre lo real y lo abstracto. La estadstica de la informacin crucial frecuentemente se omite.
matemtica opera con las propiedades numricas del Cmo nos informamos?
dato, dejando congelados sus atributos cualitativos Mediante:
e inmovilizando su historia. la recuperacin de informacin,
Pero la nica manera de entender e interpretar la formacin de una comprensin amplia y general,
los datos, es a travs de su biografa, de su histo- el desarrollo de una interpretacin,
ria, que permite entender su significado e interpre- la reflexin y evaluacin de la forma del texto, y
tarlo. Por eso se dice que estadstica es datos en la reflexin y evaluacin del contexto
contexto.
134 135
H u go O scar A m b rosi E stad stica y L en gu aje

Con un poco de prctica, se puede determinar qu que incluyen estructuras tan caras a la identidad es-
es lo que est faltando, as como interpretar aquello tadstica como las listas, las tablas, los diagramas y los
que est efectivamente publicado. grficos. Y esos textos constituyen un 32% del mate-
De esa forma no se depender ms de las conclu- rial de lectura. Es decir que 1/3 de lo que recibimos
siones elaboradas por otros, ya que se las podr dedu- de informacin, viene en alguno de esos formatos, de-
cir personalmente. nominados textos no continuos.
Nuestra poca ha visto crecer a los usuarios de la El diagrama siguiente describe como se organizan
informacin, particularmente estadstica, en cantidad las competencias en la lectura, teniendo en cuenta el
y en diversidad. Esa diversidad se refleja en las dife- contenido, las relaciones internas y la estructura del
rentes formas de contacto que tienen con la discipli- texto.
na, como ocurre con las curvas en el campo matemti-
co. Son las audiencias, a que nos referamos al
comienzo.
Si consideramos cul es el mnimo grado de contac-
to necesario para que exista ese vnculo, descubrimos
qu ocurre en la prctica de la lectura. La apropiacin
por la percepcin, especialmente visual, del conteni-
do de un conjunto de signos, que son presuntamente
portadores de significado y cuyo sentido surgir de la
interpretacin de lo ledo por el sujeto observador.
Simplemente, cuando encontramos una tabla, por
ejemplo los resultados de la ltima fecha del torneo
de ftbol, cuando leemos las cotizaciones de las accio-
nes en la Bolsa, cuando buscamos en el pronstico
del tiempo los anuncios para el prximo fin de sema-
na, nos enfrentamos a un conjunto de smbolos, algu-
nos alfanumricos, es decir combinaciones de nme-
ros y letras, muchas veces organizados de determinada
manera (listas, tablas o cuadros) y otras veces son fi-
guras, grficos, diagramas.
Pero esos signos, esas estructuras no estn separa-
das del universo del discurso corriente. En el proyecto
PISA se han incorporado, en la evaluacin de las habili-
dades para la lectura, los llamados textos no continuos
136 137
H u go O scar A m b rosi E stad stica y L en gu aje

El concepto de orden, esencialmente matemtico, Evolucin de la poblacin total en censos nacionales,


en un texto continuo viene dado por la sucesin lineal por regiones.
de las oraciones y de los prrafos. Eso se altera en
Rayuela de Cortzar, mediante el cifrado de los cap- T otal d el p as.
C en sos 19 4 7 -2 00 1
tulos con una clave adicional, que altera la historia. El
hipertexto lleva esa posibilidad ms lejos an.
V ariacin p orcen tu al en tre cen sos su cesivos
La prensa, los informes habituales en la burocracia
y en las empresas, son una mezcla de los dos tipos de R egin
texto. El texto continuo es valioso, porque su capacidad 1960/47 1970/60 1980/70 1991/80 2001/1991
para relatar historias, sirve de soporte a una gran di-
versidad de formas que emergen y se entrelazan en el Total del pas 25.9 16.7 19.6 16.7 11.2
texto bsico, dndole la apariencia de un archipilago. G ran B u en os
42.7 23.9 16.9 12.0 4.8
Cuadros, listas, grficos son las islas de ese reticulado A ires
Pam pean a 13.5 12.9 16.8 14.6 10.4
superpuesto al continuo del relato o de la descripcin.
C u yo 33.1 14.1 21.8 18.7 15.3
Por eso es menester que quien se enfrente a los tex-
N ordeste 22.8 11.8 24.3 25.6 19.3
tos actuales debe dominar las reglas de la navegacin,
N oroeste 23.1 8.2 26.5 22.1 21.2
ortogrficas y sintcticas, que se aplican a esos particu-
Patagon ia 40.1 39.2 46.5 43.5 17.3
lares discursos, caracterizados por letras, nmeros y
formas geomtricas, cuya disposicin y proporciones F u en te: IN D E C
representan propiedades y comportamientos de obje-
tos y hechos de la naturaleza o de la sociedad. Como en un mapa comn, las coordenadas (longi-
Todo lenguaje es un alfabeto de smbolos cuyo uso tud y latitud) nos ubican en un punto, en este caso
presupone un pasado que los interlocutores compar- referido al espacio (Cuyo) y al tiempo (1980/70).
ten... Una tabla o cuadro estadstico puede ser visto La celda sombreada, corresponde a la Regin de
como un mapa que permite recorrer el territorio de Cuyo y al perodo 1970-1980. El ordenamiento per-
los datos. Por ejemplo, el cuadro siguiente. mite comparar a Cuyo con las otras regiones en el
La primera columna enumera las diferentes regio- mismo perodo, recorriendo la columna sombreada. O
nes, lo que nos facilita interpretar la tabla como un considerar la evolucin de Cuyo a lo largo del tiempo,
mapa. Eligiendo una fila por ejemplo Cuyo, fijamos observando los valores en la fila sombreada. Curiosa-
una posicin en este caso geogrfica. mente el valor de la celda, ocupa la cuarta posicin,
En la otra direccin, siguiendo los encabezamien- tanto entre las regiones, como entre los perodos
tos de columnas, tenemos distintos perodos de tiem- intercensales. Verifquelo.
po. Si elegimos la columna identificada como 1980/ Resulta relativamente directo extender el concepto de
70, nos estamos refiriendo al perodo 1970/1980. mapa a estructuras de datos que no son ni geogrficas
138 139
ni temporales. Una tabla es un mapa conceptual, que
organiza los datos en forma grfica, y nos facilita el
acceso, la consulta y la comparacin. CAPTULO IX
Cuando Tuckey propuso el diagrama de tallo y ho-
jas (stem and leaf) como la forma de pasar de la lista Contexto
de datos individuales, a una estructura que refleje el
comportamiento del conjunto, nos ense el revelado
instantneo de sus propiedades.
Ese instrumento cambia nuestra visin, de la inme- Yo soy yo y mi circunstancia.
diata contemplacin de los rboles a la revelacin m- J. Ortega y Gasset
gica y umbrosa del bosque. El diagrama, a mitad de
camino entre una tabla y un grfico, encierra la po-
tencia del Aleph de Borges. El microcosmo de alqui- Hemos visto que tanto al definir la poblacin como
mistas y cabalistas, nuestro concreto amigo prover- al decidir las caractersticas que se van a someter a
bial, el multum in parvo! observacin, queda determinada una frontera, que se-
Nuevas entidades emergen de la masa de datos. Po- para lo que est dentro del campo de observacin, de
seen propiedades nicas, que les otorgan significado. todo lo dems.
Y esas propiedades se reflejan en el diagrama, que Los datos que se obtengan, sern organizados, com-
constituye una expresin lingstica capaz de nom- parados y clasificados dentro de ese campo, estarn
brar y describir las nuevas entidades. siempre rodeados por todo lo que ha quedado afuera
Y frente a su aparicin, es necesario desarrollar la
Por eso importa saber qu pasa en el contexto, mien-
capacidad de descifrar su significado, de modo que
tras estamos observando lo que cae dentro de nuestro
efectivamente sirvan para la comunicacin.
campo.
Por ejemplo, las fechas de las monedas que tengo
El sentido de los resultados, depender del lugar,
en mi monedero:1967, 1990, 1992, 1989, 1982, 1989,
del momento, de las circunstancias. Debe destacarse
1972, 1998, 1978, 1993, 1982, 1992, 1989, 1995,
que la clausura de la frontera de lo observable, existe
1995, 1996, 1994, 1993, 1983, 1998, 1987. Segn
solamente a los efectos del proceso de medicin de las
las reglas, el tallo y hoja resultante es:
caractersticas. Solamente atena las influencias sobre
el proceso de medicin, pero no interrumpe los inter-
cambios de otro orden entre los objetos y caractersti-
cas observadas y todo lo dems. La complejidad resiste
indiferente nuestras estrategias de simplificacin.
La estadstica, como lenguaje, se debe interpretar a
la luz del contexto donde se produce. El contexto en
H u go O scar A m b rosi C on texto

el que las mediciones fueron tomadas incluye factores poblacin de determinada ciudad, a fin de obtener
tales como cundo y dnde fueron tomadas, y si los datos sobre las opiniones referidas a algn problema
entrevistados fueron contactados por: telfono, carta de inters pblico. Se ha definido el cuestionario, se
o personalmente, por ejemplo. han cuidado las palabras y el orden de las preguntas,
Un estudio puede ser fcilmente influenciado por los encuestadores han sido cuidadosamente entrena-
el momento de su realizacin. Por ejemplo, un estu- dos y hay un buen sistema de control y supervisin
dio sobre criminalidad puede variar drsticamente si del trabajo de campo.
se lo realiza inmediatamente despus de la publica- En el acto de la entrevista, dialogan el encuestador
cin de notas referidas a algn asesinato muy conmo- y el entrevistado, guiados por el cuestionario, como el
vedor o a algn secuestro. libreto que organiza la conversacin. Pero por detrs
Si las preguntas son realizadas por telfono du- de ese acto se puede comprobar que sobre los
rante el medioda, es muy probable que no estn en interlocutores de esa escena, estn influyendo en for-
su casa aquellos que trabajan y que, en consecuen- ma ms o menos activa una variedad de factores.
cia, el relevamiento produzca resultados que reflejen En el caso del entrevistado su estado de nimo, sus
las diferencias que pueden existir entre unos casos y intereses personales en el tema, las emociones que
otros. Es decir entre la poblacin que trabaja y la que ste le despierta (miedo, vergenza, deseo de compla-
no lo hace. cer), su opinin sobre temas generales, que pueden o
Cada uno de los medios a travs de los cuales se no vincularse directamente con el tema en particular,
lleva a cabo el relevamiento puede interactuar con los la hora del da, el clima, la marcha de la economa, su
otros elementos del proceso de manera diferente. Por situacin laboral, el estado de la empresa en la que
ejemplo, aquellas preguntas vinculadas a conductas trabaja, y as podramos seguir la lista con la seguri-
sexuales o a ingresos de las personas pueden ser ms dad de no agotar las posibilidades de factores que in-
fcilmente contestadas por telfono, porque el vaden el campo de los intereses, sensaciones fsicas,
respondiente se siente ms seguro, menos expuesto y creencias, sentimientos, que configuran el mundo de
protegido en el anonimato, que en el caso de las en- cada uno.
cuestas personales o cara a cara. Y aunque esos aspectos no son objeto en general
Algunas veces los estudios son realizados en labo- de observacin o medicin, nadie podr negar que in-
ratorios y pueden no corresponder a la vida en el mun- fluyen sobre nuestras opiniones y actitudes, frecuen-
do exterior, en condiciones naturales. Por ejemplo, en temente de manera decisiva.
esos experimentos de laboratorio se suelen dar condi- Aunque nos ilusione la idea de que el oficio re-
ciones que dejan dudas sobre los resultados que se sultante de su experiencia prctica aleja al encuestador
podrn obtener fuera de esos lmites. de influencias similares, debemos admitir que no es
Consideremos las circunstancias en que se lleva a as. Mientras se desarrolla el encuentro estar presen-
cabo una entrevista de una encuesta dirigida a la te en su nimo el resultado de la entrevista anterior,
142 143
H u go O scar A m b rosi C on texto

junto con sus propias condiciones de salud, familia- venta como el precio registrado en registros pblicos, de
res, laborales, que forman la trama de sensaciones, hecho puede no reflejar el precio que pactaron el com-
emociones y pensamientos, de ese da en particular. prador y el vendedor sobre lo que realmente vala la casa.
Resulta ingenuo imaginar un dilogo asptico, don- Para determinar si una medida es vlida, se necesi-
de el juego del lenguaje siga dcilmente las reglas di- ta saber exactamente qu fue medido. Por ejemplo,
seadas ad hoc en gabinete. algunos lectores, una vez conocida la definicin, po-
Siempre los resultados estarn subordinados a las dran no estar de acuerdo con los valores del desem-
condiciones de lugar (ciudades o pueblos, hogar o va pleo informados por el gobierno, y no los reconoce-
pblica, por ejemplo) y tiempo (da laborable o fin de ran como una medida vlida del desempleo, segn ellos
semana, da o noche, verano o invierno, maana o tar- entienden el trmino. Hay que tener en cuenta que
de, etc.). Adems las circunstancias personales pue- los datos conocidos no incluyen trabajadores desalen-
den ser las ms diversas: sexo, edades, profesiones, tados, es decir aquellos que no buscan trabajo porque
ingresos, estado emocional, etc. creen que no lo van a encontrar, aunque lo necesitan
La influencia del contexto es muy compleja. Sin em- y lo desean.
bargo algunos aspectos se destacan por su influencia La cuestin es determinar si el porcentaje de la po-
en aspectos crticos de los resultados. blacin econmicamente activa, que est actualmen-
te desempleada, de acuerdo a las definiciones preci-
Amenazas a la validez
sas provistas por el INDEC, mide realmente lo que se
Cuando se habla de algo que es vlido, quiere decir pretende, o sea el desempleo. Para ello es necesario
que es legtimo y defendible. Lo mismo puede decirse adoptar una definicin comn de desempleo.
para el resultado de una medicin. Una medida vli- El problema es que la mayora de la gente descono-
da es una que de hecho mide lo que dice que mide. ce y, en consecuencia, no entiende qu midi exacta-
As, si se trata de medir la motivacin laboral con mente el gobierno.
un test de coeficiente intelectual, no se obtendr una
medida vlida de dicha motivacin. Amenazas a la confianza
Un ejemplo ms realista surge si se considera la Un auto confiable es aquel que arranca siempre y
manera de determinar el precio de venta de una casa. nos lleva a donde vamos sin preocupacin.
Obtener una medida vlida del precio real de venta de Un amigo confiable es uno que siempre est ah
una casa puede ser engaoso, porque la compra suele para nosotros, no aquel que a veces est demasiado
involucrar un regateo sobre qu cosas van a ser dejadas ocupado para molestarse por nosotros.
por los antiguos dueos, qu reparaciones sern hechas Similarmente, una medida confiable es una que le
antes de que la casa sea vendida, y as sucesivamente. dar a usted y a cualquier otra persona aproximada-
Estos tems pueden cambiar el precio de venta en mente el mismo resultado una y otra vez, cuando sea
miles de pesos. Si furamos a definir el precio de tomada sobre el mismo objeto o individuo.

144 145
H u go O scar A m b rosi C on texto

Por ejemplo, una forma confiable de definir el pre- medicin darn cuenta de una inestabilidad de los resul-
cio de venta de una casa sera la cantidad oficialmen- tados, que arrojar por tierra el refinamiento original.
te registrada por el escribano interviniente. Esto puede Por ejemplo, si un amigo mide el ancho de una pile-
no ser vlido, pero nos dara un valor consistente sin ta de natacin con una regla y le dice que mide 4,81
ninguna ambigedad, cualquiera sea quien realice la metros de ancho, usted debera desconfiar. Sera muy
medicin y en cualquier momento del tiempo. difcil medir una distancia tan grande en forma confia-
La confianza es un concepto til en las evaluacio- ble con una regla de 20 centmetros. Un segundo inten-
nes psicolgicas y de aptitud. Un test de CI obviamen- to de medicin sin dudas dara un nmero diferente.
te no es confiable si mide el CI de la misma persona
Sesgo
una vez 70 y otra vez 120.
Si estamos de acuerdo que el test est midiendo lo Un desvo sistemtico en una direccin es llamado
que realmente queremos significar por inteligencia sesgo. Es el caso de un instrumento o procedimiento de
(esto es, si es realmente vlido), debera al menos ser medicin, cuyos resultados se desvan sistemticamente
lo suficientemente confiable para darnos aproximada- en la misma direccin. Ese instrumento o procedimien-
mente el mismo nmero cada vez, bajo el supuesto de to produce una medida sesgada.
que la caracterstica se mantiene constante, entre una Si estuviera tratando de pesarse con una balanza
medicin y otra. que no fue satisfactoriamente ajustada en la fbrica, y
Los test de CI comnmente usados son bastante estuvo siempre un par de kilos por debajo, usted ten-
confiables. Alrededor de dos tercios de las veces, al dra una visin sesgada de su propio peso.
tomar el test una segunda vez da una lectura que est
Variabilidad
dentro de 2 o 3 puntos del primer test, y la mayora de
las veces, da una lectura dentro de los 5 puntos. Si alguien tiene humor variable, queremos decir
Las medidas fsicas tomadas con un instrumento que esa persona tiene cambios impredecibles en su
de medicin preciso son las ms confiables. Por ejem- estado de nimo.
plo, es mucho ms fcil obtener una medida confiable Cuando decimos que el clima es muy variable, quere-
de la altura de una persona que de sus opiniones, mos decir que cambia sin ningn patrn consistente.
asumiendo que se tiene una cinta de medir precisa. La mayora de las medidas estn propensas a algn
Qu piensa, desde este punto de vista, de las en- grado de variabilidad. Con eso, queremos decir que
cuestas de intencin de voto? incluyen errores impredecibles o discrepancias que
Sin embargo, hay que ser cauteloso con las medi- no tienen una explicacin razonable.
das dadas con una precisin aparentemente mayor Si tratara de medir su altura o el largo de una mesa
de la que puede proveer el instrumento utilizado para colocando una regla al final de la posicin anterior, sin
medir. Un resultado con ese grado de aparente preci- duda obtendra una respuesta levemente diferente cada
sin carecer de confiabilidad. Las repeticiones de la vez que lo hiciera.

146 147
H u go O scar A m b rosi C on texto

A diferencia de los otros trminos que hemos defi- consecuencia del hecho de que todas las mediciones
nido, como la validez o el sesgo, que son usados para son diferentes, y pueden tener algn tipo de variacin
caracterizar una nica medida, la variabilidad es un segn patrones que les son propios.
concepto usado cuando hablamos sobre dos o ms Por ejemplo, si queremos conocer la causa del de-
mediciones, una en relacin con otra. crecimiento de la tasa de ganancia de una organiza-
A veces dos mediciones varan porque el instrumento cin y constatamos que un grupo de empresas que
de medida produce resultados no confiables, como forman parte de sta tienen malos resultados en la
sera el intento de medir una gran distancia con una poca de invierno de forma reiterada durante 5 aos,
regla pequea. dicha variabilidad podra deberse a cambios naturales
Otras veces la variabilidad resulta de cambios en el del negocio principal de esas empresas y no a un mal
sistema que est siendo medido, por ejemplo, aun con desempeo de su personal o a una mala estrategia
un dispositivo de medicin altamente preciso su pre- econmica. Sobre este punto llam la atencin Deming
sin arterial registrada diferir entre un momento y el y en l se basan los criterios del control de calidad
siguiente. moderno.
Por eso tiene gran importancia, distinguir las dife-
Variabilidad natural
rencias debidas a la variabilidad natural, de las dife-
Un concepto relacionado al anterior, es el de varia- rencias correspondientes a factores que podemos defi-
bilidad natural. ste es crtico para entender los m- nir, medir, y posiblemente manipular. Con estos ltimos
todos estadsticos modernos. podemos explicar los cambios y las diferencias y conse-
Cuando medimos la misma cantidad a travs de va- cuentemente, tomar decisiones que refuercen los re-
rios individuos, tales como la tasa de ganancia prome- sultados positivos y neutralicen los indeseables.
dio de todas las empresas de una organizacin duran- Es fundamental tener en cuenta cuando una varia-
te los ltimos 5 aos, es inevitable obtener alguna cin en alguno de los indicadores est inducida por
variabilidad, producto de las diferencias irreductibles alguna modificacin estratgicamente implementada
entre las observaciones que provienen de mltiples en la organizacin, o cuando simplemente responde a
factores incontrolables, que producen una especie de procesos naturales del desenvolvimiento de una de-
agitacin molecular en cada caso. Puede pensar en la terminada actividad sobre la que nuestras acciones
trayectoria de una cualquiera de las empresas y los estratgicas no han producido ninguna modificacin
imprevistos cotidianos que se producen en ella. Eso real hasta ese momento.
har que sus resultados difieran de los de otra, sin Esta idea bsica, de comparar la variabilidad
que se pueda identificar ninguna causa determinan- natural con la variabilidad inducida por los com-
te. A eso llamamos variabilidad natural. portamientos diferentes, intervenciones, o pertenen-
Aunque algo de esta variabilidad puede ser debida cias a grupos, forman el corazn de la estadstica
a nuestro instrumento de medicin, la mayora es moderna.
148 149
H u go O scar A m b rosi C on texto

Las complejas relaciones entre el proceso de medicin de la frontera ordenadora del trabajo de observacin y
y el contexto se deben tener en cuenta especialmente en lo exterior. Es tan importante lo que se toma en cuen-
dos momentos del proceso. ta, se mide y compara, como lo que precariamente se
La primera vez es antes de la medicin, para eva- supone neutral y desconectado. Por la sencilla razn
luar las condiciones bajo las cuales se deber trabajar de que ambas categoras no son ms que hiptesis de
y elaborar un detallado informe de dichas condicio- trabajo no verificadas, empleadas solamente en razn
nes. En esa situacin, adquiere singular importancia de la economa de nuestro trabajo.
tomar nota de las condiciones, y sobre esa base in-
cluir o excluir unidades en la poblacin e incluir o
excluir caractersticas del proceso de observacin.
La segunda oportunidad es despus de las medi-
ciones, cuando se analizan los datos. En ese momen-
to es importante saber cules fueron las condiciones
particulares en que se recogieron los datos. Por eso
se ha desarrollado un gran esfuerzo para sistemati-
zar la presentacin de los datos de los datos, en lo
que se ha dado en llamar metadatos. Es crtico con-
tar con descripciones completas de las condiciones
de trabajo.
Visin tnel
Cuando se estudian los hechos, se seleccionan de-
terminados aspectos que se colocan en el campo de
observacin y sobre ellos se concentra la atencin. La
suposicin, bsica es que puede separarse la realidad
en partes, que es posible aislar algunas partes de otras
y determinar cmo se influyen entre ellas, dentro de
esa clausura artificial. Si se pierde de vista que no se
trata nada ms que de un recurso metodolgico, el
insistir en esa direccin conduce a una concepcin
empobrecida y deformada de la realidad, consecuen-
cia de esa visin tnel.
Para evitarla es necesario constantemente revisar
las relaciones entre texto y contexto, entre el interior

150 151
CAPTULO X
Revelacin estadstica

...los cientficos creen que su lenguaje es exacto y los otros


son inexactos. Paradjicamente el lenguaje de los poetas,
siendo ms inexacto, es ms verdadero.
A veces es incluso ms exacto.
Abraham Maslow

Para el estudio de un fenmeno colectivo, el punto de


partida es sin duda la revelacin estadstica.
Tomasso Salvemini

Los casos individuales, mltiples y variados, son lo


que podemos observar directamente. El conjunto re-
sultante de las observaciones no aparece en primer
plano. Para que emerja, la imagen del conjunto tiene
que ser revelada. Cmo? Ah radica la novedad de
la visin estadstica. Se trata de una mirada
comprehensiva, abarcativa. Por eso decimos que la es-
tadstica permite ir ms all de los rboles... para ver
el bosque...!
Las propiedades del conjunto emergen como nue-
vas entidades, en las que se destacan los vnculos y
relaciones que no se hubieran distinguido en la con-
templacin de las ocurrencias singulares. Esa visin
permite tomar en cuenta el movimiento colectivo, cuyo
andar probable podemos rastrear en lugar del impre-
decible devenir azaroso de los casos individuales.
H u go O scar A m b rosi R evelacin estad stica

Qu es el azar? Ms fcil que dar una definicin, grupos o clases a todos aquellos que son iguales, o son
es proponer algn ejemplo de su accin. Cuando se parecidos en alguna medida previamente establecida.
arrojan los dados, la cara que queda hacia arriba es Por ejemplo, si queremos estudiar la edad de las
un resultado del azar. Si revoleamos una moneda, el personas, podemos preguntarles: cul es su fecha de
hecho de que caiga cara o cruz, tambin es conse- nacimiento? Una vez obtenidas las respuestas las or-
cuencia del azar. Los naipes que recibo, despus de denamos, reuniendo a todos los nacidos en la misma
mezclar bien el mazo, son un grupo formado al azar. fecha. Sin embargo, esa es una condicin demasiado
Podramos decir que el azar es una fuerza de la estricta y poco til. Si la cantidad de casos fuera pe-
naturaleza. quea, muchas de las clases quedaran vacas. Habra
Ms all de la incertidumbre resultante, tenemos fechas en las que ninguno de la lista cumplira aos.
una nueva posibilidad: considerar lo que ocurre cuan- Por eso, en el proceso de clasificacin utilizamos
do los hechos se repiten, al arrojar reiteradas veces clases ms amplias, colocando juntos a todos aquellos
los dados o la moneda, por ejemplo. El conjunto de los que nacieron en el mismo ao calendario.
resultados muestra regularidades: resultados de apa- Con procedimientos como el anterior surge un nuevo
ricin frecuente y otros que raramente ocurren. gnero de caractersticas, que son propias y exclusi-
Un tipo especial de leyes describe los vaivenes del vas del conjunto de valores: las frecuencias, que se
azar, cuyo comportamiento de esa manera se hace tra- obtienen contando la cantidad de casos que se en-
table y aun previsible, dentro de un margen de incer- cuentran en las categoras que se definen.
tidumbre, que depender de la naturaleza de las co- En nuestro ejemplo, preguntamos primero cun-
sas y de la ventana de observacin que hayamos abierto. tos nacimientos ocurren en el mismo da? Por ejem-
As podemos esperar que en una serie de lanza- plo, el 14 de marzo de 1975. Y as durante los dems
mientos de una moneda, alrededor de la mitad de las das bajo la ventana de observacin, que puede ser,
veces salga cara. Por qu? Porque le atribuimos a la por ejemplo, el ao 1975. Obtenemos un mosaico de-
moneda una simetra que excluye cualquier razn para tallado de 365 das.
esperar otro resultado. Lo mismo pasa con los dados, No es difcil notar que podemos cambiar la regla y,
donde cada cara aparecer ms o menos el mismo en lugar de enumerar los nacimientos diarios, contar
nmero de veces. Salvo que el dado haya sido carga- los que ocurren durante cada mes. Nuestro lente en
do, rompiendo el supuesto de simetra! ese caso tiene una precisin diferente, con el detalle
Cmo se produce la reunin de los datos indivi- reducido a 12 meses. Esta forma de describir la lectu-
duales en conjuntos contenedores? ra de los datos pone en evidencia el mayor o menor
El paso inicial en esa transformacin se da con dos grado de detalle que se puede registrar con el ins-
operaciones muy simples: comparacin y clasificacin. trumento de observacin. La decisin sobre esa ca-
Con la primera identificamos los valores y determi- libracin depender del propsito del relevamiento
namos su semejanza. Con la segunda reunimos en de datos.
154 155
H u go O scar A m b rosi R evelacin estad stica

Concepto de tabla estadstica grficos sirven de soporte al tratamiento de los datos


Una tabla o cuadro, es un ordenamiento especial y a la comunicacin de la informacin.
de nmeros o texto, basado en una cuadrcula como Las tablas surgen de la necesidad de organizar los
vimos en la pg. 139. datos de una forma que facilite destilar la informacin
que ellos contienen. Es el alambique que permite ob-
tener la esencia de la masa de datos.
A B C D En lugar de tabular los datos, podramos optar
1 por redactar un informe, donde se describiera la
clasificacin que se est haciendo. Es decir, en pri-
2 B2 mer lugar explicar cules son las clases estableci-
3 das y a continuacin las dotaciones que correspon-
den a cada una. Por ejemplo, si se hubieran
clasificado los estudiantes de una divisin por sexo,
La primera fila y la primera columna identifican cla- podramos describir que se han encontrado 12 va-
ses o categoras a las que pertenecen los casos obser- rones y 17 mujeres.
vados. En las otras celdas se colocan valores corres- Pero el texto continuo que aparece como resulta-
pondientes al conjunto de elementos que pertenecen, do, tiene el inconveniente de que sigue un orden li-
a la vez, a las categoras de esa fila y columna. Si se neal. Y de esa manera se ve fcilmente que ser difi-
coloca en las celdas la cantidad de casos, decimos que cultoso el anlisis, apenas aumenten las categoras
es una tabla de frecuencias. sujetas a estudio y las comparaciones resultantes se
Las tablas de frecuencias, son la herramienta bsica alejen en el texto.
empleada en la revelacin de un conjunto de datos. Por ejemplo si en un informe tenemos que expo-
En una tabla el texto se enriquece mediante el ner las edades de una poblacin, en grupos de 5 aos
ordenamiento de los valores incluidos en ella. Su de edad, podemos elegir empezar por los ms jve-
organizacin tiene que facilitar la consulta, la na- nes e ir aumentando. En ese caso si queremos com-
vegacin, mediante la gua que prestan los encabe- parar la importancia numrica de los mayores con la
zados de filas y columnas. Puede resultar til pen- de los jvenes, tendremos que dirigirnos a dos regio-
sar una tabla como un mapa, donde los puntos se nes del texto. Eso se complica, si adems tomamos
definen teniendo en cuenta la posicin relativa en en cuenta el sexo.
las escalas horizontal y vertical. Las columnas se- Pero tal vez nos interese solamente cotejar el total
alan la longitud de los puntos de inters y las filas, de menores de 15 con el total de 65 y ms aos. Y el
la latitud. formato del texto continuo, no nos ayuda para nada
Para revelar las propiedades del conjunto, la tabla debe en esta tarea. Ni siquiera en la bsqueda, que prece-
ser ordenada y sus valores transferidos a un grfico. Los de a la comparacin.
156 157
Por eso las tablas o los cuadros, se han impuesto
TITU LO
como una de las formas dominantes de transmisin
A claracion es: para toda la tabla (por ej. cifras expresadas en m iles).
de informacin estadstica.
Cmo se describe una tabla? Bsicamente puede V ariab le 1
V ariab le 2
decirse que ella tiene una estructura compuesta por C olu m n a a C olu m n a b ... T otal
el ttulo, el cuerpo y las notas. F ila 1
El ttulo describe el contenido de la tabla, inclu- F ila 2
yendo el nombre de los datos, el lugar y fecha a que ...
corresponden y la forma en que se presentan.
T otal
El cuerpo, es una cuadrcula cuya primera fila con-
tiene los nombres de las clases que se ordenan segn *Aclaraciones puntuales (para alguna o algunas celdas).
Fuente:
las columnas (A, B, C) y la primera columna los nom-
bres de las categoras dispuestas por filas (1, 2, 3). Una tabla que sirva para la representacin grfica,
En las celdas de la tabla se colocan los valores de debe ser ordenable. Es decir, se colocarn sus filas y/o
los datos (B2), que corresponden a las categoras de la columnas en el orden que sea ms conveniente para el
fila y la columna que corresponden a cada celda. propsito perseguido. Esa es la observacin fundamen-
Las notas recogen observaciones que pueden ser tal que formul Jacques Bertin en su clsico trabajo de
tiles al lector para interpretar mejor los datos. Semiologa Grfica.
As en la parte superior de la tabla, se colocan las En cualquier anlisis estadstico el punto de partida
referencias generales como las unidades en que se ex- consiste en la tabulacin directa de una sola dimen-
presan los valores (en miles, en toneladas, en dlares). sin. En su forma ms simplificada, produce la clasifi-
Al pie, debajo de la grilla de celdas, primero se cacin en dos grupos y, en general, revela la distribu-
colocan todas las notas que son observaciones a algu- cin de los casos entre varios grupos, segn los valores
nos valores de la tabla. Por ejemplo cuando alguna de un atributo. A continuacin se presenta un ejemplo:
cifra tiene una caracterstica especial (por Ej. cifra
estimada). Despus, un tipo de nota muy especial, la
Tabla 1: Resultados de la encuesta en el departamento X antes
Fuente, que identifica el origen del que provienen los de la Votacin de la eleccin presidencial.
datos. En general es una institucin (el INDEC) o un
operativo estadstico muy importante y pblico (el Cen- V otarn p or el: P erson as
so Nacional de Poblacin).
C an d id ato R ep u b lican o 2 68 0
C an d id ato D em crata 2 48 0

T otal 5 16 0

158 159
H u go O scar A m b rosi R evelacin estad stica

De acuerdo con este sencillo cuadro, se puede obser- Porcentajes


var que el candidato republicano obtiene 2680 respues-
En las comparaciones se utilizan generalmente los
tas favorables, en tanto que el demcrata slo rene 2480.
porcentajes. Son una sencilla transformacin de los
Si aceptamos que el cuadro se basa en una muestra
datos, que consiste en elegir una cantidad que puede
estadstica, podemos suponer que refleja estimativamente
ser el total general de una tabla, o el total de una fila o
las opiniones de la poblacin al momento de ser consul-
columna e igualarla a 100, modificando las cifras com-
tada, en cuanto a la intencin de voto.
ponentes de ese total, de manera que sus relaciones
La tabulacin directa puede considerarse como un
guarden las proporciones existentes entre los nme-
resultado preliminar, que exige un anlisis ms am-
ros originales. Por ejemplo, el total de una fila es 80
plio, dirigido a responder a la pregunta: por qu?.
como resultado de sumar una celda con un valor de
Por qu razn algunos entrevistados tienen la in-
64 y otra con 16. Calculando los porcentajes, hace-
tencin de votar por el candidato republicano? Cu-
mos 80 igual a 100, y en forma proporcional 64 pasa a
les son los factores que determinan la magnitud de
valer 80 y 16 ser equivalente a 20, mediante una
esta proporcin?
simple regla de tres.
O bien, si se formula la misma pregunta en forma
algo diferente: cules son las caractersticas del gru- 80 = 100
po de personas con intencin de votar a favor del par- 64 = 100 x 64/80 = 80%
tido demcrata, en comparacin con el grupo que se 16 = 100 x 16/80 = 20%
inclina por el candidato republicano?
En este sentido puede considerarse la tabulacin Por ejemplo, si el cuadro correspondiente a la vota-
directa simplemente como el punto de partida de un cin presidencial se clasifica segn la posicin econ-
anlisis ms complejo, en el que se relacionen efectos mica de los votantes, se obtiene el resultado siguiente:
y agentes o factores mediante cuadros comparativos
Tabla 2 : Votacin preelectoral en el departamento X, segn
ms complejos. La muestra se divide en subgrupos nivel econmico
(por ejemplo, de posicin econmica elevada y baja, o
de varones y mujeres, o de mayores de cierta edad y N ivel econ m ico
menores, etc.) que probablemente difieran en lo que P artid o
A lto (% ) B ajo (% )
respecta a la distribucin sujeta a anlisis.
Se comparan entonces las distribuciones relativas R ep u b lican o 60 45
a los subgrupos con la original en una sola dimen- D em crata 40 55
sin. De esa manera se puede avanzar en el proceso T otal 10 0 10 0
de descubrir los factores que determinan las propor-
ciones absolutas. (N d e casos) (2 6 0 4 ) (2 5 5 6 )

160 161
H u go O scar A m b rosi R evelacin estad stica

Se ha tomado como base de los porcentajes, el total (90=72+18), no es evidente la igualdad de ambas, que
en cada nivel econmico o sea el total de cada columna. se revela al calcular los porcentajes, que en ambos
Los resultados nos indican que la proporcin de votan- casos son idnticos (100=80+20).
tes, a favor del partido republicano, es mayor entre las Las comparaciones mejoran en dos formas, utilizan-
personas de mejor posicin econmica que entre las do porcentajes.
menos pudientes. Por lo contrario, la proporcin de vo- Los nmeros se reducen a una escala que facilita
tantes a favor del partido demcrata predomina entre los clculos ya que los porcentajes son nmeros infe-
las personas de nivel econmico ms bajo. riores a 100.
Los datos disponibles dan lugar a la hiptesis se- Transformando a uno de los nmeros, total gene-
gn la cual la cantidad de votos que pudieran obtener ral, de fila o de columna, que es la base, en la cifra
los candidatos demcratas o republicanos, estn aso- 100; se facilita la determinacin de la magnitud rela-
ciados al nivel socio-econmico. tiva de los subgrupos.
La tabla anterior, de 2 filas por 2 columnas, consti- En qu sentido se han de calcular los porcentajes?
tuye el tipo ms sencillo de tabulacin comparativa. La tabulacin comparativa que se describi ms
Su objetivo, como el de cualquier otra tabulacin com- arriba, se refleja en tablas que tienen, por lo me-
parativa, consiste en investigar si la forma de repartirse nos, dos factores que se comparan mutuamente,
los casos bajo estudio entre las filas vara como en el ejemplo.(Ver Tabla 1) los partidos y el
sustancialmente, cuando se considera una u otra de nivel socioeconmico.
las categoras de las columnas. El primer paso requiere decidir si los porcentajes
Es decir existen cambios entre los diversos grupos han de calcularse en sentido vertical o en sentido
en una direccin, (filas por ejemplo), que puedan con- horizontal, empleando las palabras vertical y hori-
siderarse consecuencia de las diferencias reflejadas zontal en relacin con la disposicin de las cantida-
por la clasificacin en el otro sentido (columnas). As, des en la tabla.
si se consideran los votos dentro del nivel econmico El objeto que tienen las cifras de los porcentajes es
alto, se observa que los Republicanos renen una facilitar las comparaciones numricas; por lo tanto, la
mayora del 60%. Por el contrario, entre los menos pregunta bsica es: cul es la comparacin de inte-
favorecidos econmicamente, la mayora del 55% es rs, la de las cifras de las distintas columnas o las que
para los Demcratas. aparecen en las diferentes filas?
En nuestro ejemplo, qu deseamos comparar? La
Ms sobre los porcentajes
distribucin de los votos por nivel socioeconmico se-
Se utilizan para indicar con mayor claridad la im- gn partido, o la distribucin de los votos por partido
portancia relativa de dos o ms nmeros. Por ejemplo, segn nivel socioeconmico?
si se tuviera que comparar la distribucin anterior Cmo se tienen que calcular los porcentajes?: en
(80=64+16), con otra formada por los valores el sentido del factor cuyo efecto se desea corroborar.
162 163
H u go O scar A m b rosi R evelacin estad stica

Se hace igual a 100 el total de cada categora de ese Tabla 3: Mortalidad por cncer, segn la raza, en los EEUU
factor. En el ejemplo, son los totales de cada columna (slo nmeros)
(Alto, Bajo), que se utilizan como base de los porcentajes.
C au sas d e m u erte
Cuando uno de los factores de la tabla puede consi- R aza T otal
derarse como causante de la distribucin del otro fac- C n cer O tras
tor, la regla indica que los porcentajes deben calcu-
B la n ca 1 3 96 2 7 1 0 55 8 0 4 1 1 95 4 3 1
larse en el sentido del factor dependiente,
haciendo igual a cien el total de cada categora N egra 9 18 2 1 6 93 9 1 1 7 85 7 3
del factor causante.
T otal 1 4 88 0 9 1 2 25 1 9 5 1 3 74 0 0 4

T otal AA BB CC
Tabla 4: Mortalidad por cncer, segn la raza, en los EEUU
T otal (porcentajes en sentido vertical)
I 10 0
C au sas d e m u erte
R aza T otal %
II 10 0 C n cer % O tras %
III 10 0
B la n ca 93 ,8 86 ,2 87 ,0

N egra 6,2 13 ,8 13 ,0
Si pensamos que las caractersticas (I, II, III) orde-
nadas por fila pueden influir en la distribucin por T otal 10 0,0 10 0,0 10 0,0
columna de los casos, el total de cada fila ser la base
de clculo de los porcentajes. En este caso el factor
Tabla 5: Mortalidad por cncer, segn la raza, en los EEUU
investigado ser el que tiene las categoras I, II y III. (porcentajes en sentido horizontal)
Debemos tener presente que no se trata de identifi-
car qu factor es la causa de otro, sino solamente C au sas d e m u erte
revelar si la distribucin de los porcentajes vara entre R aza T otal %
C n cer % O tras %
las distintas categoras del factor causal.
En el siguiente ejemplo se presentan tres tablas B la n ca 11 ,7 88 ,3 10 0,0
que relacionan cifras sobre raza y mortalidad por cn-
cer. La Tabla 3 presenta cifras absolutas; en la Tabla 4 N egra 5,1 94 ,9 10 0,0
se ha calculado el porcentaje de estas cifras en senti- T otal 10 ,7 89 ,3 10 0,0
do vertical, y en la Tabla 5 se calcularon los porcenta-
jes horizontalmente.
164 165
H u go O scar A m b rosi R evelacin estad stica

El contenido estadstico de estas tres tablas es el segn niveles de ingreso y tipo de programa radiofnico
mismo; sin embargo, calculando los porcentajes en que prefieran.
diferentes sentidos se obtienen distintas comparacio-
nes entre las distribuciones, que facilitan la inspec- Tabla 6: Programas favoritos de radio de acuerdo con los diver-
cin de los datos. sos niveles econmicos
La Tabla 3 indica las cantidades de negros y blan-
C lase d e in greso T od as las
cos que mueren de cncer y por otras causas. P rogram a
A B C D clases
Ms an, si lo que deseamos es estudiar los efectos
V aried ad es 85 28 8 43 2 20 2 1 00 7
que produce la clasificacin segn la raza en la propor-
cin de muertes por cncer, la Tabla 5 (cuyos porcentajes S eries 33 10 8 17 5 75 39 1
estn basados en el Total de blancos y Total de negros) N oticieros 44 90 87 32 25 3
es el medio apropiado para presentar los hechos. T eatro 15 66 79 30 19 0
En esa tabla se muestra que la incidencia de la mor- M sica clsica 25 65 66 6 16 2
talidad por cncer entre los negros es menos de la T em as religiosos 4 15 23 11 53
mitad, en magnitud, que entre los blancos. Estas pro- M sica b ailab le 10 7 33 1 44 3 20 1 1 08 2
porciones esenciales no pueden encontrarse en la Ta- T otal 31 3 96 3 1 30 5 55 7 3 13 8
bla 4, en la cual los porcentajes estn calculados en
otro sentido. Tabla 7: Programas favoritos de radio de acuerdo con los diver-
Puede observarse tambin que la fila del Total en sos niveles econmicos. (Porcentajes en sentido vertical)
la Tabla 5 indica la proporcin de muertes debidas al N ivel B aile V aried a- S eries N oticie- T eatro M sica T em as reli-
cncer, sin tener en cuenta la raza. En cambio la co- econ m ico (% ) d es (% ) (% ) ros (% ) (% ) clsica (% ) giosos (% )
lumna del Total en la Tabla 4 slo seala la propor- A 10 8 8 17 8 15 8
cin de blancos y negros en la lista de las defuncio- B 30 29 28 36 35 40 28
nes, lo que no tiene inters si el problema en estudio C 41 43 45 34 41 41 43
es el de la mortalidad ocasionada por el cncer. D 19 20 19 13 16 4 21
Los porcentajes pueden calcularse en cualquier T ota l 100 100 100 100 100 100 100
sentido? N de (10 82 ) (1 007) (3 91 ) (2 53 ) (1 9 0 ) (1 62 ) (5 3 )
La estructura de la tabla, sugiere que los porcenta- casos
jes se podran anotar en cualquier sentido. Sin em-
bargo, cada direccin tiene un significado distinto, Si deseamos conocer el efecto de la posicin econ-
en cuanto a la relacin entre las caractersticas que se mica en la preferencia de los programas de radio, en-
han combinado en la tabla. tonces los porcentajes debe calcularse con respecto a
El ejemplo siguiente ilustrar este punto. Se hizo la cada posicin econmica, como si fuera la causante
tabulacin de una muestra representativa de oyentes, de los resultados observados. La Tabla 8 presenta los
166 167
H u go O scar A m b rosi R evelacin estad stica

resultados de considerar cada Clase de Ingreso por los noticieros y la msica clsica se encuentran entre
separado. Se han intercambiado filas y columnas, con los programas que tienen un atractivo relativamente
respecto a la Tabla 6 y la Tabla 7 para facilitar las alto entre las clases sociales superiores; las series, el
comparaciones. teatro, la msica bailable y los programas religiosos
Partiendo de esta tabla es posible alcanzar la siguiente tienen un auditorio relativamente mayor entre los gru-
conclusin: los programas de variedades y de series pos sociales de ms bajos recursos econmicos.
aumentan en popularidad a medida que disminuye la No siempre es aplicable la regla de causa y efecto
posicin econmica; pero los noticieros y los programas
de msica clsica muestran una tendencia contraria: Debido a las limitaciones estadsticas de la mues-
mientras ms alto es el nivel econmico gustan ms. tra, a veces hay que descartar la regla acerca del sen-
tido en que debemos calcular los porcentajes. Desde
Tabla 8: El programa favorito segn diversos niveles econmicos
el punto de vista del problema en particular, podra
ser aconsejable calcular los porcentajes en un deter-
C lase d e in greso T od as las minado sentido, pero puede ser que la naturaleza de
P rogram a la muestra no nos lo permitiera hacer.
A (% ) B (% ) C (% ) D (% ) clases (% )
Un ejemplo de esta situacin es el siguiente. Con la
V aried ad es 27 30 33 36 32
finalidad de calcular la fuerza relativa de dos partidos
S eries 11 11 13 14 12 polticos antes de la eleccin, se llev a cabo una vo-
N oticieros 14 9 7 6 8 tacin de prueba en dos provincias. En cada provin-
T eatro 5 7 6 5 6 cia se realizaron ocho mil entrevistas, y con los resul-
M sica clsica 8 5 5
tados se form la tabla siguiente:
7 1
T em as religiosos 1 1 2 2 2
Tabla 9: Votos por partido en dos provincias
M sica b ailab le 34 35 34 36 35
T otal 10 0 10 0 10 0 10 0 10 0 P rovin cias P artid o X P artid o Y T otal
N d e casos (3 1 3 ) (9 6 3 ) (1 3 0 5 ) (5 5 7 ) (3 1 3 8 )
A 2 50 0 5 50 0 8 00 0
Sin embargo, en este caso los porcentajes tambin B 3 50 0 4 50 0 8 00 0
pueden calcularse en sentido opuesto. El tipo de pro-
T otal 6 00 0 1 00 0 0 1 60 0 0
grama podra considerarse como la causa que atrae
distintas proporciones de oyentes de los diversos gru-
pos socioeconmicos. En la Tabla se calculan los porcentajes en sentido
En Tabla 8 se observa claramente la composicin horizontal. En sta, se supone que la causa de la fuer-
econmica de los auditorios para cada tipo de programa: za relativa del partido X y del partido Y, es la provincia
168 169
H u go O scar A m b rosi R evelacin estad stica

misma; es decir, la estructura social y econmica particu- Pero una sencilla consideracin pone en claro que
lar de la provincia y la actitud poltica de sus habitantes. la Tabla 11 no indica lo que pretende mostrar, o sea,
la magnitud relativa de la aportacin de las provincias A
Tabla 10: Importancia del partido para la provincia
y B a la fuerza total de ambos partidos. O por lo menos,
P rovin cia A P rovin cia B la tabla slo lo muestra en circunstancias especiales.
P artid o (% ) (% ) Es verdad que el 42% de los votos de la muestra a
X 31 44 favor del partido X provienen de la provincia A, pero este
42% depende, en realidad de un factor arbitrario: el ta-
Y 69 56 mao relativo de la muestra en ambas provincias.
T otal 10 0 10 0 Con el objeto de esclarecer este punto, vamos a su-
poner ahora que se llevaron a cabo 8000 entrevistas
en la provincia A, y que en la provincia B, debido a
Esta tabla nos indica que aunque el partido Y es que su poblacin de votantes es dos veces mayor que
mayoritario en las dos provincias, es relativamente ms la de la provincia A, se realizaron 16000 en vez de
fuerte en la provincia A. 8000. Supongamos adems, que la muestra aumen-
Sera posible calcular los porcentajes en el otro sen- tada de la provincia B no seala ningn cambio en la
tido (vertical), comprobando as la hiptesis de que el distribucin del partido; o dicho en otras palabras, los
partido puede ser la causa del apoyo variable de las porcentajes que se indican en la Tabla 10 (31-69 y 44-
dos provincias: 56) permanecen sin ningn cambio.
Tabla 11: Importancia de la provincia para el partido La tabla dispuesta de manera similar a la Tabla 9,
quedara de la forma siguiente:
P rovin cia P artid o X (% ) P artid o Y (% )
Tabla 12: Importancia de las provincias para el partido
A 42 55
P artid o X P artid o Y T otal
B 58 45 P rovin cias
N % N % N %
T otal 10 0 10 0 A 2 50 0 26 5 50 0 38 8 00 0 33
B 7 00 0 74 9 00 0 62 1 60 0 0 67
N d e votos (6 0 0 0 ) (1 0 0 0 0 ) T otal 10 0 1 45 0 0 10 0 2 40 0 0 10 0
9 50 0

Esta tabla nos muestra que el 42% de los votos a Por esta tabla puede verse que el partido X obtiene
favor del partido X provienen de la provincia A; mien- el 26% de los votos en la provincia A: comprese ste
tras que son tambin de dicha provincia, el 55% de los con el 42% de la tabla anterior. Con lo cual se de-
votantes del partido Y. muestra que, por lo que respecta a los porcentajes en
170 171
H u go O scar A m b rosi R evelacin estad stica

estos dos cuadros, el nmero relativo de entrevistas Antes de seguir, detengmonos por un momento en
por provincia es el que controla los resultados. algunas expresiones que son de uso comn. Tomemos
Este no es el caso de la Tabla 10: sea cual fuere el el caso del promedio: tardamos en promedio cierto tiem-
nmero de entrevistas en las dos provincias, las pro- po para algo, calculamos un peso promedio de algn
porciones no cambiarn (sin tener en cuenta los cam- objeto, decimos que una cantidad en promedio ocupa
bios resultantes del aumento o reduccin del error un lugar o tiene un determinado peso.
de muestreo). Las cifras de los porcentajes de la Ta- Y no efectuamos en ese momento ningn clculo
bla 11 son engaosas, porque han sido calculadas particular. Pero la expresin tiene un significado de-
en un sentido que no corresponde al diseo de la terminado, que sirve, es til en el proceso de transmitir
muestra estadstica. a otro alguna informacin sobre cosas o actividades.
Saber cuntas manzanas entran en promedio en un
Recopilacin de datos para comprobar determinadas kilogramo, resulta muy til para el dueo de un res-
causas taurante. Cunto se tarda en promedio para recorrer
La afirmacin de que los porcentajes nicamente la distancia hasta la oficina en mnibus, sirve para
se pueden calcular en el sentido del diseo de la mues- establecer nuestro horario de salida para ir al trabajo.
tra, tiene una consecuencia importante: si el prop- Qu significa en esos casos en promedio?
sito del anlisis es el de investigar las diferencias que Una primera idea que surge es la de aproximacin.
existen entre dos distribuciones, entonces es necesario En promedio es ms o menos. No quiere decir que
y suficiente que la muestra estadstica sea elegida en ese valor sea el que va a presentarse, en la espera del
ese sentido y los porcentajes tienen que calcularse tam- mnibus, o en la cantidad de manzanas. S, sugiere
bin en el mismo sentido. que lo valores sern parecidos, cercanos a ese valor
Ms adelante veremos las dificultades y desastres promedio, influidos por alguna causa comn. Que mu-
que se presentan en el estudio de la causalidad, que chas veces se considera como el ms probable, el que
se introduce con la sencilla herramienta de los por- esperamos que ocurra.
centajes. Otra forma de describir la relacin entre el prome-
dio y los valores que efectivamente se producen en la
Medidas resumen prctica, experimentalmente, es la idea de equidis-
tancia. El promedio se ubica de alguna manera en el
Media, mediana, modo centro de los datos, en el medio de la hipottica fila
Con el trabajo anterior de comparacin, clasifica- que forman los valores ordenados de los resultados
cin y conteo del conjunto de datos, hemos iniciado el posibles. El promedio no puede ser superado por to-
estudio de las distribuciones estadsticas. Con res- dos los valores ni estar por encima de todos ellos; su
pecto a dichas distribuciones un concepto til es la lugar es en medio, o sea dejando tantos por arriba
idea de centro de los datos. como por debajo.
172 173
H u go O scar A m b rosi R evelacin estad stica

Es importante identificar esas acepciones del pro- Pero tambin puede darse que mi presupuesto sea
medio, porque cuando los sujetos de la comunicacin inferior al mnimo, en cuyo caso, el agente me dir
no le dan el mismo significado, surgen los que deberemos orientarnos hacia otra zona de la
malentendidos. ciudad.
En resumen, cuando apelamos al promedio, esta- Han aparecido dos conceptos elementales del razo-
mos haciendo referencia a una cantidad que es cen- namiento estadstico: el centro y la dispersin de los
tral, que ocurre con mayor frecuencia con los valores valores (alrededor del centro). Es decir la distribucin
cercanos. Sin embargo hay veces en que, o no pode- de los valores.
mos, o no nos sirve recurrir al promedio. Una aclaracin: el proceso de reconocimiento con-
Por ejemplo, si el control de asistencia en mi traba- ceptual de la distribucin, puede realizarse de distin-
jo es muy estricto, tengo que asegurarme de llegar a tas formas. O bien en el transcurso de la conversacin,
horario, para no perder la bonificacin por como ocurre ms arriba, o en la mente del agente que
presentismo. Debo entonces reservar para el viaje un con sus preguntas rene la informacin que necesita
tiempo suficiente, aun en el caso de que el mnibus para orientarnos hacia la zona y el tipo de inmueble
tarde el mximo de tiempo. que se ajusta a nuestras necesidades y recursos.
Si estoy buscando departamento para vivir, inicial- Una forma comn de expresar el costo de los depar-
mente parto de alguna idea de costo promedio. Cuan- tamentos es indicando su valor por metro cuadrado.
do visito una inmobiliaria, el agente me informa que En general se trata de valores mnimos y mximos, por
los precios dependen de la superficie, la antigedad zona geogrfica, tipo y antigedad de la construccin.
y el barrio. Y agrega a continuacin que los valores Se hace eso porque se ha observado, y se acepta, que el
pueden oscilar entre un mnimo y un mximo. Entre costo total depende principalmente, de la superficie
ellos se encuentra el costo que pienso invertir. Por cubierta, dentro de una zona y para determinada cali-
qu me plantea la cuestin en esos trminos? dad/antigedad de la construccin.
Pues porque es necesario organizar las prioridades Es decir que, en esas condiciones, hay una gran
de bsqueda acotando la diversidad de la oferta, que asociacin entre el tamao y el precio, de tal modo
incide en la variedad de precios. Me preguntar que que se puede aceptar que, en promedio, el precio sea
tamao de departamento quiero, de que antigedad y igual al producto de los metros cubiertos por el precio
en que zona. Todo eso reducir el intervalo entre m- unitario por metro cuadrado. Esa relacin entre dos
nimo y mximo valor. cantidades, superficie y costo total, sirve para mos-
Y en ese momento, volveremos a considerar el im- trarnos uno de los recursos ms potentes del pensa-
porte disponible. Puede ocurrir que an est entre el miento estadstico, que se manifiesta cotidianamente
rango de los valores. Si est muy cerca del mnimo en muchas de nuestras expresiones.
sabremos que las posibilidades de encontrar algo se- El fenmeno de la asociacin entre cantidades, la
rn menores que en el caso opuesto. correlacin entre ellas, contribuye en gran medida a
174 175
H u go O scar A m b rosi R evelacin estad stica

organizar nuestro comportamiento, tanto frente a los En una clase se obtuvieron 28 puntajes. La media
hechos de la naturaleza, como a los acontecimientos de los 28 valores es 76,0. Ordenados de menor a ma-
sociales. La intensidad de una asociacin puede va- yor, dan el siguiente orden:
riar desde la determinacin casi cierta hasta la sola 3 2 ,5 5 ,6 0 ,6 1 ,6 2 ,6 4 ,6 4 ,6 8 ,7 3 ,7 5 ,7 5 ,7 6 ,7 8 ,7 8
indicacin de una dbil tendencia. 7 9 ,7 9 ,8 0 ,8 0 ,8 2 ,8 3 ,8 4 ,8 5 ,8 8 ,9 0 ,9 2 ,9 3 ,9 5 ,9 8
Entonces, cuando se utiliza el smbolo que repre-
senta el promedio, se moviliza toda la trama concep- Considerando que hay 28 valores en total, en este
tual anterior. As cuando a una cantidad se le aso- caso la mediana, es decir el valor que deja por encima
cia el atributo de ser un promedio mediante la suyo la misma cantidad de puntajes que por debajo, o
equivalencia con su smbolo, se les est dando un sea 14 valores, se sita entre 78 y 79; en este caso,
significado extendido que incluye las propiedades donde el nmero de respuestas es par, se toma el pun-
del promedio. Si llamamos x al promedio, entonces to medio entre 78 y 79, o sea 78,5...
al decir: Se puede notar que la mediana es ligeramente ma-
yor que la media en este caso. Esto es porque el pun-
x = 6 m an zan as/k g taje 32, comparativamente muy bajo, reduce la suma
Le estamos agregando al valor 6 manzanas/kg, las de los valores y, en consecuencia, la media. No afecta
propiedades de la media. a la mediana porque, siempre y cuando ese valor bajo
La media es una generalizacin del mtodo pro- sea menor que 78, su efecto en la mediana ser indife-
porcional o de la antigua regla de tres. Esta ltima rente. Lo mismo ocurre con los valores altos, es decir
se cumpla con certeza porque cada elemento era mayores a 79: pueden cambiarse por otros, sin modifi-
idntico a cualquiera de los otros. En cambio cuan- car la mediana, que es resistente a esos cambios.
do hablamos del promedio, estamos aceptando que Es decir si cambiamos por un valor menor cual-
pueda haber diferencias entre los elementos. Por quiera de los valores de la mitad inferior del conjunto
ejemplo cantidad de manzanas por kg da lugar a de datos, la mediana no cambia pero la media refleja
dos situaciones: que en un kg entren ms o menos su influencia. Lo mismo cabe decir si el cambio es en
manzanas que el promedio o bien que el peso de el otro extremo de la distribucin.
seis de manzanas est por encima o por debajo de 1 Con el mismo criterio empleado para determinar la
kg de peso. Es decir que el promedio nos permite mediana, se definen los cuartiles. El primero (Q1)se
llegar a un resultado numrico dando prioridad, se- ubica dejando la cuarta parte de los valores por debajo
gn el caso, al peso o a la cantidad de unidades. de l y tres cuartos por encima. El tercer cuartil (Q3), a
Otra medida que apunta al centro de los datos es la inversa, supera al 75% de las observaciones y queda
la mediana. Esta medida toma el valor que divide en solamente un cuarto que son mayores que su valor.
dos mitades idnticas al total de las mediciones, pre- Si uno o dos puntajes estn lejos del resto de los
viamente ordenadas. datos, se llaman valores extravagantes (outliers). No

176 177
H u go O scar A m b rosi R evelacin estad stica

hay reglas rpidas y potentes para determinar qu es el valor mximo. En este caso, los puntajes mnimos y
un valor extravagante, pero en este caso la mayora de mximos fueron respectivamente 32 y 98, as que el
la gente estara de acuerdo que el puntaje de 32 per- rango es de 66 puntos.
tenece a ese tipo de valores. Una medida de variabilidad ms complicada es la
Existe otra medida de tendencia central llamada desviacin estndar, que se emplea en los trabajos es-
modo, la cual es ocasionalmente til. El modo es sim- tadsticos en forma rutinaria. Est basada en los des-
plemente el valor ms comn en la lista, es decir aquel vos de cada valor con respecto a la media aritmtica.
valor que dentro del universo observado fue el que apa- En consecuencia cuanto ms dispersos estn los valo-
reci con ms frecuencia. Para los puntajes de exa- res, mayores sern los desvos respecto a la media. No
men, no existe un nico modo porque cada uno de los es posible calcular simplemente el promedio de los
puntajes 64, 75, 78, 79 y 80 ocurri dos veces. El modo es desvos, porque por una propiedad matemtica de la
ms til para datos discretos o categricos con un nme- media aritmtica, la suma de los desvos respecto a
ro relativamente pequeo de valores posibles. Por ejem- ella, es igual a cero. Para evitar ese inconveniente, los
plo, si midiera el nivel alcanzado de los alumnos de una desvos se elevan al cuadrado, con lo que todos se con-
clase de estadstica y los clasificara como 1= estudiante vierten en positivos, y entonces el Desvo Estndar,
de 1 ao, 2= estudiante de segundo ao, etc, sera pro- que es la raz cuadrada del promedio de los desvos al
bablemente ms til conocer el modo (el nivel alcanzado cuadrado, es siempre positivo.
ms comn) que conocer la media o la mediana. Otra medida, que est menos sometida a las con-
tingencias de los valores extremos (mximo y mni-
mo), la diferencia intercuartlica, es definida como la
Rango, variancia
diferencia entre el tercer cuartel menos el primer cuar-
El segundo tipo de informacin til contenida en tel (Q3-Q1).
un conjunto de datos es la variabilidad. Qu tan des- La tercera clase de informacin til es la forma, la
parramados estn los datos? Estn todos juntos? Es- cual puede ser derivada de un cierto tipo de figura
tn la mayora juntos, pero algunos son valores extra- producida por los datos. Podemos responder pregun-
vagantes? Sabiendo que la media es aproximadamente tas tales como: estn la mayora de los datos agrupa-
76, un puntaje de examen de 80 es an difcil de in- dos en el medio, con algunos valores en los extremos,
terpretar. Tendra obviamente una connotacin dife- dando una misma forma de cola en cada lado? Hay
rente si el puntaje variara entre 72 y 80 que si lo hi- dos agrupamientos distintos? Estn la mayora de
ciera entre 32 y 98. los valores agrupados en un extremo, con unos pocos
valores muy altos o bajos? Puede ver que su puntaje
Rango
de 80 tendra diferentes significados dependiendo de
La medida ms simple de variabilidad es el rango, cmo los puntajes de los otros alumnos se agruparon.
es decir la distancia entre el mnimo valor obtenido y Por ejemplo, si la mitad de los restantes alumnos tuvo
178 179
H u go O scar A m b rosi R evelacin estad stica

puntajes de 50 y la otra mitad de 100, entonces aun- E stad o In greso E stad o In greso
que su puntaje de 80 estuvo alrededor del promedio M on tan a 13852 R h od e Islan d 18061
no se vera tan bien. A continuacin nos concentra- N eb raska 15360 S ou th C arolin a 13616
N evad a 18827 S ou th D ak ota 13244
mos en cmo mirar la forma de los datos. N ew H am p sh ire 20251 Ten n essee 14765
N ew Jersey 23764 T exas 15483
N ew M exico 13191 U tah 13027
Ms que mil palabras N ew York 20540 16399
V erm on t
N . C arolin a 15221 V irgin ia 18970
El diagrama de tallo y hojas es una manera rpida y N orth D ak ota 13261 W ash in gton 17640
fcil de poner una lista de nmeros en orden, a la vez O h io 16499 W est V irgin ia 12529
que se obtiene una imagen grfica de la forma de la O k lah om a 14151 W iscon sin 16759
O regon 15785 W yom in g 14135
distribucin. P en n sylvan ia 17422
La tabla titulada Ingreso per-cpita por estado, en
EE. UU. (1989) lista el ingreso para los 50 estados y el Antes de leer ms, mire a la parte derecha de la Ta-
distrito de Columbia de EEUU en 1989. Examinar la bla 13.-Ejemplo: Diagrama de tallo y hojas, as puede
lista nos da alguna informacin, pero sera ms fcil ver cmo luce un diagrama de tallo y hojas completo.
obtener el cuadro completo si estuviera en algn tipo Cada uno de los dgitos extendindose a la derecha
de orden numrico. Podramos simplemente listar los representa un valor observado o punto muestra.
estados ordenados jerrquicamente por valor en vez La primera cosa que se ve es 11|8. Esto representa
de alfabticamente, pero eso tampoco nos dara nin- un ingreso per cpita de $11800, el cual es una ver-
guna idea de la forma de la masa de datos. sin truncada del ingreso per cpita de Mississippi,
$11835, que es el estado con ingreso per cpita ms
In greso p er-cp ita p or E stad o, en E E .U U . (1 9 8 9 ) bajo. (Para truncar un nmero, simplemente elimine
E sta d o In greso E sta d o In greso
los dgitos al final. Esto es diferente de redondear.)
Cuando el valor correspondiente a un estado compar-
A lab am a 13679 Illin ois 18858 te los dos dgitos del nmero a la izquierda de la lnea,
A lask a 21173 In d ian a 16005
A rizon a 15881 Iow a 15524 se agrega a la derecha el siguiente dgito, que en este
A rk an sas 12984 K an sas 16182 caso corresponde a las centenas, para cada uno de
C a liforn ia 19740 K en tu ck y 13777 esos estados.
C olorad o 17494 L ou isia n a 13041
C on n ecticu t 24604 M ain e 16310 Por ejemplo, el segundo tem en el diagrama de tallo
D elaw are 19116 M arylan d 21020 y hoja es 12|9 5. Esto representa dos estados: Arkansas,
D .C . 22436 M assachusetts 22196 $12984, y West Virginia, $12529. Para un ejemplo ms,
F lorid a 17694 M ich igan 17745
G eorgia 16188 M in n esota 17746 repare en la parte inferior de la figura, 24|6. Eso re-
H aw aii 18306 M ississip p i 11835 presenta $24600, el cual es el valor truncado para los
Id ah o 13762 M issou ri 16431 $24604 per cpita correspondiente a Connecticut.
180 181
H u go O scar A m b rosi R evelacin estad stica

Tabla 13: Ejemplo diagrama de tallo y hoja de l, y la mitad por debajo. Si hay un nmero impar
de valores en el conjunto de datos, la mediana es
P aso 1 P aso 2 P aso 3 simplemente el valor que divide la lista ordenada. Si
C rean d o el tallo A gregan d o u n a h oja D iagram a fin al hay un nmero par de valores (y por lo tanto no se
11 11 11 8 puede encontrar un valor que divida la lista de los
12 12 9 12 95 resultados en dos mitades de igual cantidad de ca-
13 13 6 13 6 7 7 0 8 1 2 6 2 2 sos), la mediana es el promedio de los dos valores
14 14 14 171 del medio.
15 15 8 15 8 5 3 2 7 4 Por ejemplo, la mediana de la lista 70, 75, 85, 86,
16 16 16 1 01 34 43 7 87, resulta ser 85 porque es el valor medio que logra
17 17 46 17 4 6 7 7 4 6
dividir a la poblacin estudiada en dos mitades igua-
18 18 18 3 8 8 0 9
71 71
les, una con valores superiores y la otra con valores
19 19 19
20 20 20 25
inferiores. Si la lista tuviera un valor adicional de 90,
21 21 1 21 10 la mediana sera 85,5, el promedio de los dos valores
22 22 22 1 del medio, 85 y 86.
23 23 4 23 4 La mediana puede ser encontrada rpidamente en
24 24 6 24 6 un diagrama de tallo y hoja, especialmente si las ho-
E jem p lo 1 1 | 8 = $ 1 1 8 0 0
jas han sido ordenadas. Usando la Tabla 14, verifique
que la mediana del ingreso per cpita ($16300), es el
26 valor dentro del total ordenado de los 51 valores
Diagrama letras y valores
estudiados, desde cualquier extremo. Tenga cuidado
El llamado resumen de cinco nmeros es una for- de contar los valores en orden numrico cuando llegue
ma til de representar una larga lista de nmeros. al valor de tallo 16, y no en el orden en el cual aparecen.
Como indica su nombre, es un conjunto de cinco Los cuartiles son simplemente las medianas de las
nmeros que proporcionan un buen resumen de la dos mitades de la lista ordenada. El cuartil inferior
lista entera. est situado a mitad de camino en la parte inferior de
La Tabla 14: Los cinco nmeros para los datos del los valores y queda, en consecuencia, un cuarto de los
ingreso per cpita presenta el orden en el cual son valores entre l y el mnimo.
usualmente mostrados. Similarmente, el cuartil superior est a un cuarto
Los valores mnimo y mximo presentan los lmi- de camino del mximo. Existen algoritmos complica-
tes inferior y superior del rango de valores obtenidos dos para encontrar cuartiles exactos. Podemos acercar-
para una determinada medicin. nos lo suficiente simplemente encontrando la mediana
La mediana, como se dijo anteriormente, es el n- primero, luego encontrando la mediana de los valores
mero tal que la mitad de los valores estn por encima debajo de ella, y la de los valores superiores a ella.
182 183
H u go O scar A m b rosi R evelacin estad stica

Para los datos del ingreso per cpita, el cuartil in- Preguntas para pensar
ferior sera la mediana de los 25 valores debajo de la
Si usted lee que los resultados de un estudio de
mediana de $16300, o sea, $13800. El cuartil supe-
cierta mquina de gimnasia muestra que su uso ge-
rior sera la mediana de los 25 valores superiores,
nera una prdida de peso de 5 kilos en promedio,
$18800. Ntese que stos son el 13 desde el mnimo
Adems de eso, qu otra cosa querra saber sobre
y del mximo de cada mitad porque 25 = 12 + 1 + 12.
los resultados? Piensa que TODOS los que usaron la
El resumen de cinco nmeros para los datos del in-
mquina perdieron 5 kilos?).
greso per cpita son:
Suponga que usted compara dos ofertas de trabajo,
Tabla 14: Los cinco nmeros para los datos del ingreso y una de sus consideraciones es el costo de vivir en el
per cpita rea de cada una de las ofertas. Usted compra el pe-
ridico y anota el precio de 50 avisos de departamen-
$16300 tos de cada rea. Qu medida resumen de los valores
$13800 $18800 de alquiler para cada comunidad necesitara de ma-
$11800 $24600 nera de hacer una comparacin til?

Un reciente artculo de un peridico de Buenos Aires


Estos cinco nmeros nos proveen un resumen til deca que la mediana del precio de casas unifamiliares
del conjunto entero de 51 datos, que nos permiten vendidas el ao anterior en la zona era de $136.000 y el
visualizar la distribucin de los resultados de un modo precio promedio era de $149.160. Cmo piensa usted
mucho ms complejo que lo que nos proporciona el que estos resultados fueron calculados? Cul cree us-
promedio de esos resultados. ted que es ms til para alguien que piensa comprar
Podemos tener alguna idea de la dispersin y sobre una casa, la mediana o el promedio?
si los datos estn o no agrupados en un extremo o en
el otro. El test de coeficiente intelectual de Stanford-Binet
Debido a que existe un vaco mucho ms grande est diseado para tener una media, o promedio, para
entre $18800 y $24600 que entre $11800 y $13800, la poblacin entera de 100. Tambin se dice que tiene
sabemos que los valores estn probablemente ms una desviacin estndar de 16, qu aspecto del con-
agrupados en el extremo inferior y ms desparrama- junto de coeficientes intelectuales cree usted que se
dos en el extremo superior. En otras palabras, esto describe con desviacin estndar?
confirma que los datos son asimtricos a la derecha.

184 185
H u go O scar A m b rosi

Estudiantes de una clase de una gran universidad


fueron interrogados para una encuesta. Una de las
preguntas fue la edad, en aos cumplidos. Un estu- CAPTULO XI
diante era un jubilado y su edad era un valor alejado
de los otros, extravagante. Qu cree usted que se
De la parte al todo
quiere decir con valor extravagante? Si fueran medi-
das las alturas de los estudiantes, cree que esta mis-
Nuestra experiencia siempre es limitada.
ma persona tambin tendra un valor que fuera un La evidencia es imperfecta; de modo tal que solamente
valor extravagante? Explique. proporciona indicios ms o menos evocadores, desde la
mnima extensin de lo anecdtico, exclusivo y nico,
hasta las formas ms elaboradas del diseo experimental.
Siempre, pero siempre!, sometida a la continua ratifica-
cin o rectificacin de nuevos datos.

Consideremos una bsqueda de departamento. Se


recopila informacin para elegir. Es completa?
Cundo se termina la bsqueda?
Esa incertidumbre radical acenta la dificultad del
paso de las observaciones particulares y concretas, a
leyes que alcancen a la poblacin de individuos se-
mejantes que no han sido observados pero de los cua-
les tambin se quiere saber el valor de las caractersti-
cas en estudio.
Los elementos elegidos, la muestra seleccionada,
estn amenazados de distintas formas en su capaci-
dad de reflejar fielmente a la poblacin total. Las fa-
llas y defectos de la muestra efectivamente observada,
condicionan las posibilidades de que sus resultados
puedan ser extendidos a la poblacin de la cual ha
sido extrada.
El marco de muestreo es la lista de la poblacin de
unidades de la cual la muestra es seleccionada.
A veces un marco de muestreo incluir unidades
no deseadas y/o excluir unidades pertinentes. Eso
186
H u go O scar A m b rosi D e la p arte al tod o

introduce diferencias entre la poblacin que interesa Las encuestas telefnicas tienden a recibir una alta
y el listado disponible para elegir la muestra. proporcin de respuestas de mujeres porque ellas
Por ejemplo, los padrones electorales utilizados para atienden el telfono ms a menudo. Para tratar de
predecir los resultados de las elecciones incluyen tanto contrarrestar este problema, los investigadores a ve-
a aquellos que probablemente votarn como a aque- ces piden hablar con el adulto de ms edad en el ho-
llos que probablemente no lo harn. Cuando se usa gar. Esas encuestas suelen tambin tener problemas
una gua telefnica para una encuesta de mercado para contactar a la gente que trabaja muchas horas y
que pretenda alcanzar a la poblacin general, se est que estn raramente en el hogar o aquellos que tien-
excluyendo a aquellos que se mudan frecuentemen- den a viajar a menudo.
te, aquellos con nmeros no listados (tales como m- En aos recientes, muchas organizaciones han sido
dicos y profesores), y aquellos que no pueden pagar la presionadas para producir encuestas de opinin p-
tarifa mensual de un telfono. blica rpidamente. Cuando aparece una noticia
Con diversos procedimientos se intenta mejorar la controversial, la gente quiere saber qu piensan y cmo
relacin entre el marco y la poblacin objetivo. As, en sienten otros sobre ello.
el ejemplo de los votantes, los entrevistadores pueden E st a p r esi n r esu l t a en l o qu e l a p er i od i st a d el Wall
preguntarle a la persona contactada dnde vota, como Street Journal, Cynthia Crossen, llama encuestas r-
presuncin de que votar, y luego continuar la entre- pidas. Como ella dice, stas probablemente estn mal
vista slo si la persona sabe la respuesta. porque las preguntas son diseadas a las apuradas y
En lugar de usar una gua telefnica, las encuestas son probadas muy pobremente, y es casi imposible
usan el discado aleatorio de nmeros. Esta solucin obtener una muestra aleatoria en una noche (Crossen,
todava excluye a aquellos sin telfono pero no aque- 1994, p. 102).
llos que no aparecen en la gua. Aun con los nmeros de telfono para la muestra a
Aun cuando se haya elegido una muestra apropia- generados aleatoriamente con la computadora, mu-
da de individuos, puede ocurrir que no se alcancen chas personas probablemente no estn en casa esa
todas las unidades seleccionadas. Por ejemplo, la re- noche y pueden tener opiniones diferentes de aque-
vista de una organizacin de consumidores enva por llos que se encuentren en casa.
correo una larga encuesta a sus suscriptores para ob- La mayora de los informes responsables sobre en-
tener informacin de la confianza en varios produc- cuestas incluyen informacin sobre las fechas duran-
tos. Si alguien recibe tal encuesta, y tiene un amigo te las cuales ellas fueron conducidas. Si una encues-
cercano que ha tenido problemas con uno de los pro- ta fue hecha en una noche, cuidado!
ductos incluidos en la misma, puede decidir pasarle Es importante que una vez que una muestra fue
su cuestionario para responder. De esa manera, el seleccionada, esos individuos sean los que finalmente
amigo registrara sus quejas sobre el producto, pero resulten medidos. Es mejor poner recursos en obte-
no se habra llegado a la persona elegida. ner efectivamente una muestra menor que obtener
188 189
H u go O scar A m b rosi D e la p arte al tod o

una sesgada porque los entrevistadores se dirigen a Las encuestas que simplemente usan las respues-
la siguiente persona en la lista cuando un individuo tas de aquellos que responden voluntariamente es se-
seleccionado no est disponible. guro que estn sesgadas en la direccin de las opinio-
Aun las mejores encuestas no pueden contactar a nes de aquellos con opiniones fuertes o con tiempo
todos en la lista, y no todos los contactados responden. suficiente.
Ms all de tener un equipo bien instruido y res- Establecer leyes generales es uno de los objetivos.
ponsable, no se puede hacer mucho para que todos Anticiparse a los hechos, mediante la prediccin es el
en la muestra respondan. Las tasas de respuesta sim- otro. Los grandes desafos son pasar de la parte al
plemente deberan ser informadas en los resmenes todo y avanzar del pasado al futuro.
de las investigaciones. La generalizacin es un paso difcil de dar, sujeto a
Como lector de estadsticas, recuerde que cuanto una inexorable y fundamental fragilidad. Pero al mis-
ms baja sea la tasa de respuesta, menos pueden ser mo tiempo es inevitable.
generalizados los resultados a la poblacin como un La incertidumbre se paga aceptando como precio
todo. cierto margen de error. Todos los esfuerzos se dirigen
Responder o no a una encuesta es voluntario, y a que ese precio sea lo ms bajo posible, es decir que
aquellos que responden es probable que tengan opi- el error sea mnimo. Permanentemente en la vida dia-
niones ms fuertes que aquellos que no responden. ria recurrimos al tipo de decisiones que han pasado la
Con las encuestas por correo, se pueden comparar prueba de utilidad prctica, ya que fueron exitosas en
aquellos que responden inmediatamente con aquellos el camino de una larga evolucin. Frente al clima, cuan-
que necesitan una segunda exhortacin, y en las en- do calculamos el tiempo necesario para un viaje, la
cuestas telefnicas podran compararse aquellos que cantidad de carne o de frutas para el fin de semana,
estn en casa al primer intento con aquellos que re- hacemos ese tipo de clculos.
quieren numerosas llamadas. Si esos grupos difieren Para enfrentar esos desafos, tenemos que partir de
en la medida de inters, entonces aquellos que nun- nuestra experiencia, de la evidencia que hemos podi-
ca fueron encontrados son probablemente diferen- do reunir y constatar. Esa experiencia est sometida a
tes tambin. dos fuertes limitaciones.
En una encuesta por correo, es mejor no confiar En primer lugar los diversos casos observados so-
solamente en la respuesta voluntaria. En otras pala- lamente son algunos de los producidos o de los posi-
bras, no permita que los encuestadores impongan el bles. De lo contrario la situacin carecera de todo
criterio de que aquellos que no respondieron la pri- inters.
mera vez no pueden ser convencidos de hacerlo. A Por qu causas la experiencia es parcial? Lo pue-
menudo, el envo de un recordatorio con una estam- de ser en el tiempo, porque el proceso empez antes
pilla para el franqueo de la respuesta, o una llamada de la apertura de la ventana de observacin y conti-
personal, producirn el efecto deseado. na despus de cerrarla. El pronstico meteorolgico
190 191
H u go O scar A m b rosi D e la p arte al tod o

se apoya en los registros histricos disponibles, ms o direccin racional, como cuando se eligen las direc-
menos antiguos, segn el caso. ciones de los encuestados a visitar en un estudio
A veces sucede que el total de casos de inters es social.
muy grande y resulta demasiado gravoso relevarlos a Muchas veces, en cambio, los datos provienen de
todos, tanto en recursos como en tiempo. un proceso que transcurre fuera de nuestro con-
Puede ser que el tratamiento que se aplique a cada trol. En esos casos es necesario verificar la forma
elemento sea destructivo en algn sentido. Por ejem- en que la fuente emite sus seales, para conjetu-
plo, la prueba de explosivos o algunos ensayos con rar sobre la forma del modelo oculto de sorteo que
drogas, que pueden ser potencialmente dainas. produce los resultados observados. Como cuando
En otros casos el acceso a los elementos puede re- se observan los clientes que demandan algn ser-
sultar difcil, por razones geogrficas, blicas, polti- vicio: consultorio mdico, peluquera, lavadero de
cas, etc. autos, etc.
Por las razones mencionadas y muchas otras que El muestreo, o sea el proceso por el cual una parte
se pueden encontrar, es que disponemos solamente de un conjunto se pone al alcance de la observacin
de una muestra del material que nos interesa. (para contar o medir los casos) tiene dos modalidades.
Habitualmente, como seal Tuckey, estamos en pre- Una en la que el observador tiene un papel muy activo
sencia de experiencias que son irrepetibles, y resulta en el diseo y la aplicacin de los procedimientos. Esto
inevitable la contaminacin entre nuestro aprendiza- ocurre en general en las encuestas sociales, donde la
je exploratorio y los argumentos confirmatorios que eleccin de los participantes es el resultado de deci-
levantamos: sobre la misma base emprica! Sobre siones tomadas en funcin de medios y fines. Tam-
la nica muestra que conocemos! bin en control de calidad, la muestra se define como
Una muestra, es una parte de ese todo. Como la parte del proceso.
caladura de la sanda. Como la cucharada de sopa. La otra forma se presenta cuando la dinmica de
Como la copa que degusta el sommelier. las cosas o la urgencia del propsito imponen la ob-
Con una parte, con solo una parte, tenemos que servacin de los resultados que ocurren en forma es-
formarnos opinin y conocimiento del todo. Nos pre- pontnea o natural. En estos casos ser de importan-
guntamos entonces, qu condiciones tiene que reunir, cia crtica describir la poblacin de donde provienen
para que se puedan sostener en ella afirmaciones que los datos observados, verificando que las condiciones
se extiendan aun a los casos no observados? Algunas en que se obtienen permitan asegurar para cada miem-
caractersticas del proceso de muestreo, se describie- bro de la poblacin la oportunidad de aparecer en la
ron en Del todo a la parte, cuando se consider cual muestra.
era la mejor forma de elegir esa parte. Si lo anterior se cumple, el razonamiento estadsti-
Las evidencias no siempre son producto de un pro- co encontrar la base necesaria para contribuir al an-
ceso reflexivo o de un cuadro armado bajo nuestra lisis y comprensin de los hechos observados.
192 193
H u go O scar A m b rosi D e la p arte al tod o

La correcta identificacin de la poblacin o del pro- Cuando se evala la ejecucin de un estudio, de-
ceso, donde se originan las observaciones (muestra), ben ser consideradas las dificultades que pueden ocu-
ofrece las mejores oportunidades de aplicacin del pen- rrir en la prctica. Si no se implementa un plan de
samiento estadstico en la vida cotidiana. muestreo apropiado, las conclusiones pueden ser en-
La idea de ventana de observacin es til para ilus- gaosas e imprecisas.
trar de manera concreta estas circunstancias. Por esto los criterios analizados en Del todo a la
Una ventana tiene un tamao y una orientacin. parte, deben ser valorados por todo aquel que tra-
Eso limita el punto de vista, ya que no es posible ver baje con informacin proveniente de un relevamiento
lo que est en el otro lado, detrs de la pared opues- parcial (muestra), sea diseado ad hoc o espontneo,
ta. Pero tampoco se puede ir ms all de cierto punto natural.
hacia la derecha o izquierda, hacia arriba o abajo. Todo usuario debe hacerse la pregunta sobre la po-
Esa es nuestra situacin frente a los hechos. En blacin de la que se est hablando. Formular ese in-
consecuencia, nuestras conclusiones estarn referi- terrogante, aun cuando no sea un especialista en la
das exclusivamente a los objetos visibles desde la ven- materia, es un paso fundamental para interpretar las
tana que tenemos disponible. Siempre ser relativa a respuestas que se obtengan y sobre las cuales se ba-
la ventana. Otro observador, desde all tendr el mis- sarn sus decisiones.
mo alcance. Desde otro lugar, se tendr una visin Por otro lado, los criterios con los que trabaja-
diferente. mos no plantean ninguna complejidad que no pue-
En el laboratorio o en el gabinete del estadstico, la da ser entendida por quien simplemente est inte-
ventana est especficamente definida. En los estu- resado en el modo de obtencin de los resultados
dios sociales es la resultante de un conjunto de limita- que se le ofrecen.
ciones que condicionan el punto de vista. Y hace que Comencemos repasando las dificultades y los de-
las conclusiones sean relativas a ese punto de vista. sastres que pueden darse en el proceso de seleccin
Para reflejar fielmente las caractersticas de la po- de las observaciones:
blacin objetivo, en primer lugar es necesario asegu-
rar que todos los elementos de inters, los casos que Dificultades y desastres en el muestreo
en conjunto constituyen la poblacin, sobre la que
D ificu ltad es D esastres
nos formulamos las preguntas, tengan posibilidad de
U sar u n m arco d e m u estreo O b ten er u n a m u estra d e
ser vistos, o sea de ser seleccionados. in correcto. volu n tarios.
En teora, es fcil y directo disear un buen plan de
N o llegar a los in d ivid u os U sar u n a m u estra d e con -
muestreo. Sin embargo, el mundo real raramente co- seleccion ad os. ven ien cia o fortu ita.
opera con los planes bien trazados y tampoco es una N o ob ten er resp u esta u ob te-
excepcin a esa regla, el proceso de recolectar una n er u n a resp u esta volu n taria.
muestra apropiada.
194 195
H u go O scar A m b rosi D e la p arte al tod o

Tanto las dificultades como los desastres, estn los errores de muestreo, que acompaan siempre a
sealando rupturas en la continuidad del proceso las encuestas.
que vincula los datos disponibles con la poblacin
objetivo; esa continuidad es necesaria para llevar THE LITERARY DIGEST
adelante el proyecto de generalizacin, con un gra-
do tolerable de incertidumbre. Un caso histrico es el The Literary Digest y su en-
Esa continuidad se interrumpe si la seleccin fue cuesta voluntaria a los lectores, frente al diseo de
afectada por el uso de listas imperfectas, o fallas en Gallup, en ocasin de las elecciones presidenciales de
los contactos o por la falta de respuesta de los interro- 1936, en EE.UU.
Durante la carrera por la presidencia de 1936, The
gados.
Literary Digest predijo con gran convencimiento que
Sin duda que hay grados de deterioro, que pueden
Alf Landon derrotara a Franklin Roosevelt y obten-
ser leves o catastrficos, en trminos comparativos,
dra la presidencia.
entre la muestra que debi ser y la que efectivamente
se obtuvo. Ver (http://historymatters.gmu.edu/d/5168/).
Pero cometieron un tremendo error. Los encues-
ERROR SISTEMTICO tadores del Digest no advirtieron que haban encuestado
a demasiados republicanos y a muy pocos demcratas.
Esos defectos introducen un tipo especial de error, La encuesta de 1936 fue la ltima que realiz The
llamado sistemtico. Esos errores son graves, porque Literary Digest y la revista dej de publicarse al ao
su deteccin es difcil y la eventual correccin requiere siguiente. A su vez Gallup tuvo tambin su desastre
disponer de acceso a la comparacin con otras fuen- particular en 1948. (http://poll.gallup.com/).
tes o procedimientos.
Bsicamente deber recordarse que no desapare-
ERROR ALEATORIO
cen ni se atenan, por el mero hecho de aumentar la
cantidad de observaciones. Esa es precisamente una Otro tipo de errores depende de la variabilidad de
de las razones que neutraliza la supuesta ventaja del los elementos seleccionados en la muestra y su impor-
Censo sobre las encuestas por muestreo. Y puede lle- tancia es inversamente proporcional al tamao de la
gar a ser una desventaja. muestra.
Porque no se gana nada cuando se suma ms de lo Como el sentido comn indica, al aumentar la mues-
mismo, si se marcha en la direccin equivocada, bajo tra se reduce el promedio de las desviaciones produci-
la influencia de los sesgos ocasionados por la falta de das. Cuando se eligen unos pocos casos, pueden predo-
respuesta, por ejemplo. Hay que tener presente todos minar entre ellos, al azar, los valores demasiado grandes
los componentes del error, y ser prudente cuando se o demasiado pequeos. El remedio para el error aleato-
enumera entre las ventajas del Censo, la ausencia de rio, como se le llama, es extraer muestras ms grandes.

196 197
H u go O scar A m b rosi D e la p arte al tod o

El error asociado a la muestra que finalmente se extrai- La inferencia estadstica tiene dos ejes. Uno de ellos
ga, dar una medida de la incertidumbre, y debe incluirse es el margen de error, o los lmites dentro de los cua-
obligatoriamente en las conclusiones que se obtengan. les se estima que se encuentra el valor desconocido
As, en el caso de estimar el promedio, p. ej., de la de la poblacin. En este caso la altura media de todos
altura de los alumnos de una escuela con una mues- los alumnos del colegio.
tra de 30 nios elegidos entre los 600 inscriptos, la El otro factor es una medida de la confianza en
media de la muestra en general diferir de la media que eso ocurra efectivamente.
general de todos los alumnos. Ese nivel de confianza depende del conjunto de
Para ilustrar este caso, pensemos que en el colegio los valores de la estadstica calculada con las distintas
hay un alumno excepcionalmente alto. La muestra, muestras posibles. Esos valores determinan las pro-
con sus 30 componentes, ser muy sensible al hecho piedades de la distribucin de probabilidad.
de que ese caso particular, sea incluido o no en ella, Muchos valores, como el promedio, tienen la pro-
en cambio su influencia en la poblacin total de alum- piedad de seguir la distribucin normal. Este hecho
nos se diluye entre la mayor cantidad de casos. permite el tratamiento unificado de muchas situacio-
Existen procedimientos para neutralizar la influen- nes similares y constituye el ncleo histrico de la
cia de los valores extravagantes, pero como criterio ge- inferencia estadstica.
neral, debemos vigilar el tamao de la muestra y de- Dos son los grandes problemas que aborda la infe-
tectar la presencia de valores inslitos. rencia estadstica.
El paso de la muestra a la poblacin, la obtencin Uno es la estimacin.
de conclusiones de alcance general, se llama en esta- El otro es el contraste de hiptesis.
dstica, inferencia. Esos dos problemas constituyen el ncleo del deba-
Cuando hablamos con alguien, tambin hacemos te entre los que consideran la probabilidad como una
inferencias a partir de sus palabras, sobre el significa- propiedad de los sistemas fsicos y los que la entienden
do de lo que quiere decir y el alcance que les da a sus como el grado de creencia en nuestro conocimiento.
expresiones.
Inferir es darle significado a lo que se dice, en cuanto El esquema es el siguiente:
al contenido y en cuanto al alcance.
Estimacin puntual Mltiplo del desvo
De lo que me est diciendo infiero que no se siente estndar (DE) un determinado nivel de
cmodo haciendo clculos. confianza.

Los ltimos balances permiten inferir que la ges- Por ejemplo la tasa de desempleo es publicada con
tin de la Junta de Directores, ha sido muy beneficio- una estimacin del error, dada por el coeficiente de
sa para la compaa. variacin (CV= DE/tasa).

198 199
H u go O scar A m b rosi D e la p arte al tod o

Aceptando la aproximacin normal, el intervalo con recorrido posible de los valores, nuestra expectativa,
extremos definidos por (valor estimado - 2 DE) y (valor creencia o verosimilitud, de que el estimador efectiva-
estimado + 2 DE), corresponde a un nivel de confian- mente caiga en ese intervalo, disminuye, para un mis-
za del 95%. Con esos valores regulamos nuestras creen- mo tamao de muestra. Puro sentido comn. Si el
cias y justificamos el admitir, con fines prcticos, el rango es amplio, es ms probable que cubra el valor.
valor estimado de la tasa de desocupacin. Si es estrecho, la probabilidad es menor.
Intervalo de confianza = d +/- 2DE; nivel de con-
fianza = 95%.
En resumen la generalizacin, o sea el paso de la Preguntas para pensar
parte al todo, requiere:
Las alturas de las mujeres adultas en EEUU siguen,
La comprobacin de que no se han producido erro-
al menos aproximadamente, una curva con forma
res fijos o sistemticos en primer lugar. Esos errores
acampanada. Qu cree Ud. que esto significa?
surgen cuando se producen perdidas en las observa-
ciones o el instrumento de observacin est mal cali-
Qu significa decir que el peso de un hombre se
brado (balanza o cuestionario).
encuentra en el 30 percentil de todos los hombres
Cumplida la condicin anterior se necesita una
adultos?
medida del error variable o aleatorio. Ese error es el
precio de la incertidumbre, la expresin de la pr-
Un puntaje estandarizado (puntaje Z) es simple-
dida de precisin causada por la observacin parcial
mente el nmero de desviaciones estndar en que un
de los hechos. La compensacin por tomar la parte
individuo cae por arriba o por debajo de la media de
por el todo.
todo el grupo. (Los valores por encima de la media
La magnitud del error aleatorio calculado con las
tienen puntajes estandarizados positivos, mientras que
mediciones hechas en la muestra, no es suficiente.
aquellos por debajo de la media tienen puntajes ne-
Es necesaria una medida de la confianza que me-
gativos.) La altura de los hombres tiene una media de
rece el intervalo elegido como margen de precisin.
70 pulgadas y un desvo estndar de 3 pulgadas. La
Esta confianza depender de la cantidad de veces
altura de las mujeres tiene una media de 65 pulgadas
que quepa el desvo estndar, en el intervalo definido.
y un desvo estndar de 2,5 pulgadas. De este modo,
Bajo la hiptesis normal, si tomamos +/- 1 DE, la
un hombre que mide 73 pulgadas de altura tiene un
confianza ser del 68,3%. Si fueran +/-2 los DE, la
puntaje estandarizado de 1. Cul es el puntaje es-
confianza asciende al 95% y si fueran +/-3 DE, lle-
tandarizado correspondiente a su propia altura?
gar al 99%.
El nivel de confianza indica la probabilidad de que
Los conjuntos de datos que consisten en mediciones
el valor estimado, sea cubierto por el intervalo. Es fcil
fsicas (alturas, pesos, longitud de huesos, etc.) para
notar que si el intervalo se estrecha, reduciendo el
200 201
H u go O scar A m b rosi

adultos de la misma especie y sexo tienden a seguir un


patrn similar. El patrn consiste en que la mayora de
los individuos se agrupan en torno al promedio, con CAPTULO XII
nmeros decrecientes en los valores que se alejan del
mismo en cada direccin. Piense en la forma que ten-
Significado de las diferencias
dr un histograma con medidas de este tipo.

Viva la diferencia.
Gladstone

When men and women agree, it is only in their


conclusions; their reasons are always different.
George Santayana

Un error no se convierte en verdad por el hecho de que


todo el mundo crea en l.
Mahatma Gandhi

La ausencia de evidencia no es evidencia de ausencia.


Annimo

Se ha visto anteriormente que el proceso estadsti-


co da como resultado medidas simples de conjuntos,
poblaciones o muestras, que reflejan el comportamien-
to promedio y la diversidad o dispersin de los valores
individuales. Las estadsticas que calculamos resumen
los valores de una sola variable.
Sin embargo es posible, y efectivamente mucho ms
interesante, cuando las estadsticas describen las re-
laciones entre dos o ms conjuntos de nmeros. Esas
son las estadsticas que realmente importan en inves-
tigacin. Ampere, en un desarrollo crucial para la filo-
sofa, seal que la ciencia no estudia las cosas en s
mismas, sino las relaciones entre sus atributos.
202
H u go O scar A m b rosi S ign ificad o d e las d iferen cias

Cuando las mediciones que se hacen sobre caracte- Adems cmo reconocer, si ese tamao tiene al-
rsticas variables se ordenan y agrupan por otra carac- gn significado, si se debe a algn cambio realizado
terstica, es natural que se observen diferencias en los en la situacin, si no es meramente casual? Y all es
resultados. Por ejemplo, si se mide la altura de un donde aparece el vnculo del efecto con la causa que
grupo de adultos y se clasifican los resultados por sexo. lo explica. Son los efectos causales. Tenemos una
En esos casos la diferencia se interpreta como efec- profunda necesidad de pensar el mundo, como un lu-
to del cambio en la categora o el valor de la caracte- gar donde las cosas ocurren como consecuencia de
rstica bajo la cual se ordenan y agrupan los resulta- otras, mediante un encadenamiento ininterrumpido
dos. Lo que vara entre uno y otro grupo en el ejemplo de contactos. Aunque en la profundidad de la mate-
citado es el sexo. ria, se presentan otros comportamientos, ver Totali-
El esfuerzo de la estadstica est dirigido a la medi- dad y orden implicado, David Bohm.
cin de esos efectos. Pero, qu son exactamente los Existen diversas situaciones en las que nos interesa
efectos? poder juzgar si un efecto observado es grande o pequeo.
Reiterando la observacin de Ampere, bsicamente La diferencia entre las medias de dos grupos es un
no se estudian las propiedades de las cosas en s caso, las frecuencias, expresadas muchas veces como
mismas, sino las relaciones entre esas propiedades. porcentajes es otro y la relacin entre variables o co-
Y es entre esas relaciones que surge la idea de efecto. rrelacin, es una tercera situacin.
Naturalmente muy cerca, aparece el concepto de cau- Considerando el primer caso, la diferencia entre dos
sa. Aunque la naturaleza de ese par de elementos sea promedios depender de la escala de medida utiliza-
muy diferente. Tanto como que los efectos son obser- da. Para evitar ese inconveniente, se expresa la dife-
vables y medibles, mientras las causas son hipotti- rencia como mltiplo de la Desviacin Estndar (DE)
cas y provisorias, por naturaleza. promedio de las dos poblaciones comparadas. Segn
Estamos acostumbrados a considerar el par causa-efec- los autores, una diferencia es pequea si se ubica en-
to, como la forma abreviada de explicar lo que sucede, o tre 20-63% de la DE promedio. Es moderada si su va-
sea cmo ocurren las cosas. Sin embargo el tratamiento lor est entre el 63-116% y es grande si est por arri-
estadstico de los efectos, es diferente al proceso de deter- ba de 116%, respectivamente.
minacin de causas, ms all de que sean inseparables,
al menos en lo que corresponde al orden explicado. C ASO TR IV IA L PE Q U E O M O D ER AD O G RAN D E M U Y G RAN D E
En este captulo se analizan los efectos y las ca- C orrelacin (r) 0 0.1 0.3 0.5 0.7
ractersticas de inters de los mismos. Una primera
D iferen cia en tre
pregunta a contestar es: Cundo es grande o cuando m ed ias (D E ) 0 0.2 0.6 1.2 2.0
es pequeo un efecto? El tamao de los efectos es
D iferen cia en tre
una propiedad a tener en cuenta que depender de la frecu en cias (% ) 0 70
10 30 50
escala de medida y del criterio de comparacin.
204 205
H u go O scar A m b rosi S ign ificad o d e las d iferen cias

El concepto de tamao del efecto es de gran impor- Para determinar si una relacin es significativa, nos
tancia prctica. Dicho tamao se determina como un preguntamos qu chances hay que sea observada en
mltiplo de la desviacin estndar de las observaciones. la muestra una relacin tanto o ms fuerte que la ob-
tenida, si en realidad no existe en la poblacin. Si
Tamao del efecto versus significacin estadstica esas chances son pequeas, declaramos que la rela-
cin es estadsticamente significativa y que el resulta-
Para detectar si existe una relacin estadstica en- do obtenido no es slo accidental.
tre dos variables, los observadores cuentan usualmente La mayora de los investigadores estn dispuestos a
con mediciones de una sola muestra de individuos. Sin declarar que una relacin es estadsticamente signi-
embargo, en cualquier muestra particular, puede pre- ficativa si las chances de observar la relacin en la
sentarse una relacin que no sea extensible al resto muestra son menores del 5%, cuando dicha relacin
de la poblacin. Esta relacin puede deberse slo a la realmente no existe en la poblacin. Por supuesto,
composicin de esa muestra particular. este razonamiento implica que de todas las relaciones
Por ejemplo, supongamos que un estudio observa- que ocurren por azar, slo 1 entre 20 de ellas sern
cional relev durante 5 aos una muestra de 1000 falsamente calificadas de estadsticamente signi-
propietarios de telfono celular y una muestra de 1000 ficativas. Ese es el precio que pagamos por no medir
no propietarios y encontr que 4 de los propieta- a toda la poblacin.
rios de telfono celular desarrollaron cncer de ce- A su vez, en un estudio grande, un resultado sig-
rebro, mientras que fueron afectados slo dos no nificativo a veces puede no ser clnicamente impor-
propietarios. tante. Pero surge un problema mayor cuando las prue-
Podra el investigador argumentar legtimamente bas no resultan significativas y se hace una mala
que la tasa de cncer entre los propietarios de telfo- interpretacin de esos resultados.
nos celulares es 2 veces la de los no propietarios? Eso ocurre cuando ensayos clnicos debidamente
Los nmeros son sencillamente demasiado peque- controlados y aleatorizados que no muestran una di-
os para ser convincentes, con respecto a si la rela- ferencia significativa entre los tratamientos que se com-
cin observada est sealando un problema en el res- paran, son calificados como negativos. Ese trmi-
to de la poblacin. no induce a pensar que el estudio ha mostrado que
Para sortear ese problema, los estadsticos tratan no hay ninguna diferencia, cuando lo que normal-
de determinar si la relacin observada en una mues- mente se ha mostrado es una ausencia de evidencia
tra es estadsticamente significativa. de una diferencia. stas son dos afirmaciones bas-
Qu es la significacin estadstica? tante diferentes.
Una relacin observada, para ser convincente, Dos advertencias sobre la significacin estadstica.
debe ser no slo fuerte sino tambin estadstica- Dos aspectos llevan comnmente a malinterpretar
mente significativa. la significacin estadstica.
206 207
H u go O scar A m b rosi S ign ificad o d e las d iferen cias

Primero, el tamao de la muestra. Incluso una re- La correlacin mide solamente relaciones lineales;
lacin dbil puede ser estadsticamente significati- esto es, mide cun cercanos a una lnea recta se en-
va si la muestra es grande. No obstante, ese resulta- cuentran los puntos en un diagrama de dispersin.
do no implica necesariamente que exista una relacin
Otros rasgos de las correlaciones
fuerte ni tampoco que tenga importancia prctica.
Una correlacin de +1 (o 100%) indica que hay una
Segundo, aunque una relacin sea muy fuerte, si
relacin lineal perfecta entre dos variables: a medida
la muestra es muy pequea, puede ocurrir que no
que el valor de una aumenta, la otra tambin lo hace.
tenga significacin estadstica.
En otras palabras, todos los individuos caen en la
Si leemos sobre investigadores que fracasaron en
misma lnea recta, como cuando las dos variables re-
encontrar una relacin estadsticamente significativa
lacionadas matemticamente por una linea recta.
entre dos variables, no nos confundamos creyendo
Una correlacin de 1 indica que existe una rela-
que han probado que no existe relacin. Es probable
cin lineal perfecta entre las dos variables; pero a
que sencillamente no hayan tomado suficientes medi-
medida que una aumenta, la otra disminuye.
ciones para descartar el azar como explicacin.
Una correlacin de cero indica que no existe rela-
La ausencia de prueba no es prueba de ausencia. cin lineal entre las variables. Puede indicar tambin
una lnea recta exactamente horizontal en el diagra-
Midiendo la fuerza mediante la correlacin lineal ma de dispersin de los datos.
Una correlacin positiva indica que las variables
Es conveniente tener un solo nmero para medir la
aumentan juntas.
fuerza de la relacin entre dos variables y hacer que
Una correlacin negativa indica que a medida que
ese nmero sea independiente de las unidades em-
una variable aumenta, la otra disminuye.
pleadas para hacer las mediciones.
Las correlaciones no varan si las unidades de me-
La correlacin entre dos variables numricas es un
dida son cambiadas. Por ejemplo, la correlacin entre
indicador de cun cerca de una lnea recta caen sus
peso y altura se mantiene si la altura es expresada
valores.
tanto en metros, centmetros o milmetros.
Habitualmente, esta medida recibe el nombre de
coeficiente de correlacin, y es generalmente repre- Edades y alturas de maridos y esposas
sentado por la letra r. En una investigacin se presentaron datos sobre
Ntese que el alcance de la definicin estadsti- las edades y alturas de 46 matrimonios.
ca de correlacin es ms limitado que en el uso La Ilustracin 1 y la Ilustracin 2 muestran diagra-
comn. mas de dispersin para las edades y las alturas de las
Por ejemplo, entre dos variables que tengan una parejas, respectivamente.
relacin curvilnea perfecta, puede que la correlacin Ntese que las edades caen mucho ms cerca de
medida por r sea nula o insignificante. una lnea recta que las alturas.

208 209
H u go O scar A m b rosi S ign ificad o d e las d iferen cias

En otras palabras, las edades de los maridos y es-


posas estn ms relacionadas, mientras que las altu-
ras parecen estarlo menos. La correlacin entre las
edades de maridos y esposas es 0,92, mientras que la
correlacin entre sus alturas es de slo 0,33. As, los
valores para las correlaciones confirman lo que obser-
vamos en los diagramas de dispersin.

Ilustracin 2- Alturas de esposos y esposas.

Ilustracin 1-Edades de esposos y esposas.

210 211
Captulo XIII - Por qu?

A good statistician will point out that causality can be


proven only by demonstrating a mechanism. Statistics
alone can never prove causality, but it can show you where
to look.

La causalidad no es una ley que la naturaleza


respeta sino la forma en que son formuladas
las proposiciones de la ciencia.
No es obligatorio que algo tenga que ocurrir
porque otra cosa haya ocurrido.
Slo hay una necesidad lgica. Toda la
visin moderna del mundo se basa en
el espejismo de que las llamadas
leyes de la naturaleza explican
los fenmenos de la naturaleza.
(Tractatus 6.37.)

La ventana de observacin
Llego a mi casa, despus de oscurecer, y al entrar,
mecnicamente enciendo la luz. Para ello activo el in-
terruptor y de inmediato brilla la lmpara. Hago eso
sin pensar, con absoluta seguridad de que actuando
as, se prendera la luz causa y efecto...
Por otro lado, mientras preparo el desayuno, sue-
na el timbre y una tostada salta de la tostadora. Es
sorprendente. Pero ms sorprendente sera suponer
que existe una relacin de causa a efecto, entre la
campanilla del timbre y el circuito elctrico estableci-
do, que precipita la eyeccin de la tostada.
H u go O scar A m b rosi P or qu ?

Cmo salimos de la duda? Probando. Experimen- La constante vocacin para salir del encierro de ese
tando. Repitiendo el proceso. Y admitir, mantenien- cuarto, nos introduce en otros sucesivamente ms
do la mente abierta, que toda solucin es provisio- grandes, de los cuales tambin saldremos, aunque sea
nal y transitoria. solamente para entrar en otro, mayor y as sin solu-
Pero tambin hay que reconocer que es necesario acep- cin de continuidad. O en ocasiones cambiamos la
tar las relaciones que no son contradichas por la eviden- orientacin de la ventana, para ver el otro lado de las
cia. Y actuar en consecuencia. Nuestras acciones, si son cosas.
acompaadas por los efectos previstos, les darn justifi- Si olvidamos la limitacin que nos impone la ven-
cacin a las causas. Es la prueba de la utilidad. tana de observacin, corremos el grave riesgo de caer
Los hechos deben ser explicados. Hay que encon- en l a vi si n en t n el de l a r e al i dad. G r a ve
trar las razones por las cuales se producen. De lo con- discapacidad que nos quita perspectiva y empobre-
trario caern en la categora especial de lo inexplica- ce nuestra percepcin de la complejidad, cuando aca-
ble, donde recibirn un tratamiento especial como rrea el desconocimiento de los mltiples factores
prodigios, quedando sujetos a la magia. perifricos, que pueden quedar fuera del alcance de
Si cuando se pone una nueva rebanada de pan en la la ventana de observacin.
tostadora y se oprime el timbre, no pasa nada, y tam- Pero ese no es el nico riesgo. Resulta que no siem-
poco ocurre en ninguna de las maanas siguientes, pre la causa precede discretamente al efecto y perma-
podemos aceptar que no hay una relacin que vincule nece esfumada en ese segundo plano.
un hecho con el otro. Por lo contrario si se repitiera, y Cuando alguien arroja una cerilla en medio del bos-
ocurriera reiteradamente aunque a veces falle, debe- que, provoca el encendido de algunas ramas secas. s-
ramos estudiar estos hechos, que tal vez estn mos- tas a su vez aumentan el calor, de manera que otros
trando alguna sorpresiva propiedad de la naturaleza. rboles y arbustos se encienden. Y as el efecto vuelve
Nuestra actitud habitual es dar por sentado que la sobre la causa y la potencia, en un bucle de retroaccin
luz se prender con la respectiva llave. Por lo contra- positiva que rompe el ordenado devenir lineal de la causa
rio, el episodio de la tostada merecer tal vez una son- al efecto. Por lo contrario, en un moderno edificio, las
risa y alguna broma, si l que llega acepta compartir velas de un pastel de cumpleaos pueden activar el
nuestro desayuno. Sin embargo, fuera de esos casos sensor del sistema antiincendios del techo, que des-
triviales, deberamos tener una actitud ms vigilante, carga la lluvia prevista y sofoca la causa, mediante una
ya que las cosas no son tan simples. retroaccin negativa... que termina aguando la fiesta!
Hay que evitar el encierro de la visin en tnel, cuan- Otras veces esa ceguera parcial que nos impone la
do se trata de atribuir causas a los hechos observados. ventana disponible, hace que pensemos que la asocia-
Siempre la ventana desde la que miramos el mundo, cin entre dos hechos est indicando alguna corres-
se abre hacia un lado, nos deja cierto ngulo ciego, es pondencia determinante entre uno y otro, cuando en
parcial y limitada. realidad ambos estn bajo la influencia de una tercera
214 215
H u go O scar A m b rosi P or qu ?

circunstancia que permanece oculta a nuestra observa- pecera donde nada indiferente... un solitario pez!
cin, en el ngulo ciego. Si leemos que la cantidad de Como eludir las consecuencias de la paradoja ERP,
televisores aumenta al mismo tiempo que la esperanza donde las partculas elementales despus de su en-
de vida, a nadie se le ocurrira que la profusin televisiva cuentro, pasan a formar parte de un sistema mayor
redunda en una correspondiente pltora de aos! que las incluye a ambas, a pesar de la distancia. Como
Pero esas variables no observadas pueden influir el circuito que enfoca a la nica pecera...
en sentido contrario, disimulando o deformando la ver- Resulta difcil mantener la concepcin reducida de
dadera relacin entre otras. As, cuando encontramos la causalidad, que se apoya en condiciones como las
que la mortalidad en dos regiones no tiene la diferen- siguientes:
cia que esperbamos o es opuesta a esa expectativa,
- Debe existir correlacin entre X e Y.
es muy posible que debamos considerar la estructura
- Debe existir una asimetra temporal o un orden
por edades de la poblacin en ambos lugares, para
temporal entre ambas.
descifrar el sentido de los datos resultantes.
- Se debe eliminar la hiptesis de que terceras varia-
Desde la dorada edad de los porqus infatigables,
bles intervienen en la relacin como factores causales.
necesitamos explicaciones, razones que nos revelen
los mecanismos que mueven el mundo o que impul- En una realidad sistmica, plena de bucles, re-
san a la gente. troacciones y reincidencias, la correlacin como medi-
Nuestra naturaleza pide explicaciones, aventura pre- da del paso armnico o contrapuntstico de los fen-
dicciones y necesita influir en el estado de las cosas. menos, es la herramienta que nos permite ir
La relacin causa efecto permite responder a esas di- desentraando la compleja diversidad de la superfi-
versas necesidades. cie, en busca de la trama estructural que en el sote-
Hemos visto antes que en el camino de la rrado dispara los impulsos y conexiones, y cuyo cono-
causalidad surgen diversas dificultades, obstculos y cimiento nos permite anticipar, remediar o fortalecer,
seales engaosas. resultados, crisis o tendencias.
Tampoco la causalidad est sola. Las coincidencias Qu mide la correlacin? Pues el grado en que
constituyen un universo transversal, donde la dos fenmenos se mueven de manera coincidente,
sincronicidad rige el devenir de las cosas, en lugar del opuesta o independiente. Pensemos en los precios
transcurrir sucesivo. El conejo televidente de Bohm, de algn producto. Su aumento en general estar
que contempla alternativamente sus dos televisores, acompaado por el de todos los que sirvan para lo
registra el nadar tranquilo de dos peces de la misma mismo, o sean sustitutivos. En cambio, si se trata de
especie. Curiosamente presentan similitudes, que re- cantidades consumidas, el aumento del consumo de
saltan como curiosas coincidencias. En otro cuarto, caf, posiblemente reduzca el de t o mate.
fuera del alcance de la percepcin y del saber del co- Pearson sinti que el descubrimiento de la correla-
nejo, dos cmaras enfocan en un ngulo de 90 la cin hecho por Galton, significaba ni ms ni menos

216 217
H u go O scar A m b rosi P or qu ?

que un nuevo concepto, ms amplio, que inclua a la ausencia. Por ejemplo: si no hubiera llamado por tel-
causalidad como un caso lmite. El nuevo enfoque, per- fono, no se habra enterado de la llegada de Juan.
mita darle tratamiento matemtico a las cuestiones Esa argumentacin contrafctica da por sentado
que estudian la psicologa, la antropologa, la medici- que la llamada fue la razn necesaria y suficiente, para
na y la sociologa. saber que Juan haba vuelto. La vuelta de Juan se
En 1911 aparece la tercera edicin de la Gramtica hizo realidad con la llamada. Verdaderamente es as?
de la Ciencia, en la cual Pearson incluye un captulo O no ser ms preciso, considerar que la llamada so-
titulado Contingencia y Correlacin - la insuficiencia lamente fue suficiente para enterarse de algo que ocu-
de la causalidad. All Pearson niega la necesidad de rri con independencia.
un concepto independiente para la causalidad, sepa- Las explicaciones, en consecuencia, siempre son
rado de correlacin. Y jams volvi a mencionar el tr- precarias y corregibles. Especialmente en el sistema
mino causalidad en sus trabajos. social resulta conveniente tener presente los bucles y
En 1913 B. Russell observa que en ciencia avanza- retroalimentaciones.
da, la palabra causa no se presenta. Este criterio es importante porque los movimientos
Las dos grandes preguntas que se plantean con la sociales, se producen como consecuencia de los ges-
causalidad son: tos individuales. Muchas veces encontramos que se
Que evidencia emprica legitima una conexin pretende convertir las regularidades colectivas en man-
causa-efecto? datos, en legalidades de curso obligatorio para las per-
Es decir, qu datos exhiben caractersticas tales sonas. Especialmente en economa se encuentra ese
que justifiquen una relacin causaefecto?: debe existir tipo de leyes, que sirven para preservar ciertas formas
covariacin entre las variables. de orden, que responden a determinados intereses.
Qu inferencias pueden ser extradas de la infor- La correlacin entre caractersticas, es la base que
macin causal? Y cmo? permite organizar los datos en modelos, que resumen
Si la relacin se cumple, cuando acta la causa, las razones del comportamiento de alguna variable,
cabe esperar determinadas consecuencias, que po- en funcin de otras.
dran ser anticipadas. Si por ejemplo observamos la alta correlacin que
La prediccin, pronstico, proyeccin, previsin, existe entre el peso y la altura de las personas, po-
son todos nombres que se refieren a una actividad que dremos estimar el peso a partir de la altura conoci-
desarrollamos continuamente y que constituye la base da de alguien.
de nuestras decisiones y acciones. Cuando actuamos Esa concepcin supone que la realidad sigue un
lo hacemos porque pensamos que la realidad ser de modelo mecnico formado por partes separadas, que
determinada forma. la manipulacin de alguna de ellas produce efectos
Una forma frecuente de manifestar la confianza en en otra u otras y que el observador es algo separado
la influencia de un hecho sobre otros, es suponer su de lo observado.
218 219
H u go O scar A m b rosi P or qu ?

Cuando se alcanza la explicacin de un fenmeno regularidades observadas tienen la legalidad suficien-


ser posible predecir su ocurrencia o aparicin. El or- te, como para distinguir cul es el comportamiento
den temporal por el cual la causa anticipa el efecto, correcto. En consecuencia se inhibe la capacidad de
permite prever y evita los sucesos sorprendentes. cambiar de conducta. Es el caso de una retroalimen-
Esa es una oportunidad de control basada en el po- tacin positiva, al servicio de los intereses creados, bajo
der de prediccin. Y el poder es un factor destacado una fachada cientfica. Se aprovecha la oportunidad
en la vida social alrededor del cual se mueven deseos, de controlar y ejercer el poder.
intereses, temores. La mayor tragedia es cuando la gente hace y piensa
lo que le dicen, sin animarse a pensar por s misma o
Aprender con los datos y tomar el control. criticar lo que escucha. De esa manera, lo odo o visto
Informacin y poder se erige como creencia, que al decir de Ortega y Gasset:
Las ciencias sociales dirigidas a estudiar el compor- Las creencias constituyen la base de nuestra vida, el
tamiento del hombre y de sus grupos convivientes, adop- terreno sobre el que acontece. Porque ellas nos ponen
taron el formato de las ciencias naturales. Entre otras delante, lo que para nosotros es la realidad misma...
cosas, las partes de la realidad que relacionan sus teo- En ellas vivimos, nos movemos y somos. Por lo mismo,
ras se suponen materiales, estables y separadas. no solemos tener conciencia expresa de ellas, no las pen-
Sin embargo es necesario tener en cuenta que esa samos, sino que actan latentes. Como implicaciones
de cuanto expresamente hacemos o pensamos.
trama conceptual aplicada a lo social, se refiere a com-
Cuando creemos de verdad en una cosa, no tene-
portamientos humanos, resultantes de motivaciones,
mos la idea de esa cosa, sino que simplemente conta-
creencias, emociones, intenciones.
mos con ella.
Maslow plante una organizacin de las necesidades
Y Maras agrega:
en forma de pirmide, con las necesidades fsicas en la
La importancia de estas creencias no es intelec-
base y en el vrtice las necesidades de la autorrealizacin.
tual sino vital; no es tan importante una creencia cuan-
Si las condiciones no permiten ascender al plano de las
to ms amplia y hondamente permite entender lo real
necesidades superiores, como consecuencia de la insa-
sino cuanto ms decisivamente condiciona una vida; y
tisfaccin de las necesidades bsicas las personas desa-
su solidez no es asunto de evidencia o de demostra-
rrollan diversas patologas: depresin, alienacin, cinis- cin sino de lugar de implantacin.
mo. En consecuencia la vinculacin con el mundo,
cambiar segn sea el nivel en que nos situemos.
Resumen
Teniendo en cuenta lo anterior, se puede entender
que cuando se ensean esas teoras o se exponen, Como ya hizo notar Ampere, no observamos princi-
dndolas como modelos explicativos de la realidad, en palmente caractersticas aisladas, sino fundamental-
verdad se est adoctrinando. Se est diciendo que las mente las relaciones entre caractersticas.

220 221
H u go O scar A m b rosi P or qu ?

Con esa bsqueda tratamos de entender cmo fun- fuertemente asociado con las enfermedades. Sin embar-
cionan las cosas, queremos explicar y explicarnos cmo go, el fin de este proceso, requiere el descubrimiento de
se producen. la sustancia en el tabaco que provoca las enfermedades.
En la ciencia fsica se encuentran fcilmente Finalmente, el 19 de octubre de 1996, aparece publicado
ejemplos, gracias a la facilidad de organizar expe- en La Nacin bajo el ttulo Confirman la relacin entre
rimentos, en los cuales alguna caracterstica es ob- cncer y tabaco el comentario del anuncio publicado en
servada aisladamente. Science de los resultados del estudio realizado por cien-
En el campo social e histrico, las cosas son dife- tficos de varios centros de investigacin de EEUU. Esa
rentes. Vale tener como referencia constante el traba- ser la teora explicativa de los hechos observados.
jo de Yule sobre la pobreza, cuando dijo: El criterio de utilidad para decidir sobre la bondad
de una teora, dice que una teora es buena, cuando
Estrictamente hablando, donde dice debido produce buenas predicciones.
a debe leerse asociado con. Sin embargo no es simple establecer criterios para re-
conocer cuando una prediccin es buena o no lo es. Las
La explicacin que se busca, no puede ser encontrada
hiptesis tienen que ser sometidas a pruebas que sean
entre los datos, sino que surgir del mecanismo que expli-
exigentes y se repitan. Mientras las supera, se manten-
que lo que ocurre. Los datos iluminan la bsqueda, sea-
dr vigente. Cuando los hechos, los datos, la contradigan
lan la direccin, pero no prueban la accin de ninguna
deber ser revisada y eventualmente reemplazada.
causa. En cambio, s pueden dar motivos para rechazarla.
Las asociaciones y correlaciones observadas, deben
Las conclusiones estadsticas siempre son condicio-
ser interpretadas, para que tengan sentido. De la in-
nales. Estn sujetas a las suposiciones que determi-
terpretacin, nos ocuparemos en el captulo siguiente.
nan las caractersticas que son observadas y suponen
la neutralidad de lo que se deja fuera de observacin.
Igualmente dependen de las hiptesis que se formu-
lan sobre las variables no observables del modelo, como Preguntas para pensar
la distribucin de los errores aleatorios. Si pensamos en autos viejos, existe una correlacin
La hiptesis constitucional que Fisher propuso para negativa entre la antigedad del auto y el precio de
explicar la asociacin entre fumar y el desarrollo de venta. Explique qu significa para dos variables tener
enfermedades fue difcil de experimentar. La hip- una correlacin positiva o negativa.
tesis del gran estadstico era que la gente poda
estar genticamente dispuesta a fumar y a desa- Supongamos que Ud. estuviera por hacer un diagra-
rrollar enfermedades. ma de dispersin de alturas de hijos adultos versus altu-
Finalmente un estudio hecho con gemelos idnticos, ras de padres, recogiendo datos de sus amigos varones.
present pruebas contundentes de que fumar apareca Podra usar el diagrama de dispersin para ayudarlo

222 223
H u go O scar A m b rosi

a predecir la altura de su sobrino cuando crezca, ba-


sndose en la altura de su padre? Explicar.
CAPTULO XIV
Piensa Ud. que los siguientes pares de variables
tienen una correlacin positiva, negativa o no tienen
La dama de la lmpara
relacin?
Caloras ingeridas por da y peso. Todo es segn el color del cristal con que se mira.
Caloras ingeridas por da y coeficiente intelectual. Ramn de Campoamor
Cantidad de alcohol consumido y precisin en un
examen de destreza manual. No hay dos personas que lean el mismo libro.
Edmund Wilson
Nmero de sacerdotes y nmero de tiendas de licor
en ciudades de la provincia de Buenos Aires. Hemos aprendido a volar como los pjaros y a nadar
Altura de marido y altura de esposa . como los peces, pero no hemos aprendido el
sencillo arte de vivir juntos como hermanos.
Martin L. King
En 1998 un artculo de un diario norteamericano
comentaba los estadounidenses son demasiado gor- El que no tiene opinin propia siempre
dos, segn los investigadores, un 54% del total de adul- contradice las de los dems.
Lingre
tos es ms pesado de lo saludable. Si la tendencia
contina, los expertos dicen que en unas pocas gene- Quien no comprende una mirada tampoco comprender
raciones, virtualmente, cada adulto estadounidense una larga explicacin.
tendr sobrepeso. Esta prediccin est basada en una Proverbio Arabe
extrapolacin, que asume que la tasa de incremento
No existen hechos, existen interpretaciones
continuar indefinidamente. Es sta una suposicin Nietzsche
razonable? Est Ud. de acuerdo con esta prediccin?
Cuanto ms practico, ms suerte tengo.
Explicar.
Gary Player, jugador de golf sudafricano

El que busca la verdad corre el riesgo de encontrarla.


Isabel Allende

La tcnica es siempre un proyecto histrico-social y en l


se proyecta lo que una sociedad y los intereses en ella
dominantes tienen el propsito de hacer con los hombres y
con las cosas.
J. Habermas

224
H u go O scar A m b rosi L a d am a d e la lm p ara

La lgica se ocupa de lo terico y universalmente Pero en ese proceso, las primeras etapas estn en
vlido, la retrica se ocupa de lo prctico, de lo cotidia- manos de los productores de informacin. Datos, in-
no y de lo probable. Con lo cual todo tipo de razona- formacin y generalizacin, son competencia de los
mientos acerca del obrar o el hacer, ya se trate de productores.
asuntos domsticos, de poltica, de planificacin y ur- La confianza en el conocimiento y la prudente valora-
banismo, de tratamiento de problemas y situaciones cin de conjunto, son el espacio de los usuarios. Lo que
concretas o de decisiones de diferentes clases, es ob- debe reconocerse y aceptarse, es que productores y usua-
jeto de actividad retrica, discursiva. rios tienen distintas visiones. Es lo que se llama efecto
Hemos revisado los distintos aspectos sobre los que lentes. Eso produce las distintas visiones de la realidad
se debe desplegar la vigilancia estadstica. As pudi- que tienen los usuarios, que influye en su evaluacin de
mos ver que la informacin que se encuentra tiene un la evidencia y de las inferencias resultantes de ella.
propsito, es decir que fue seleccionada y organizada Los productores, cuando determinan qu datos re-
por alguien con la intencin de influir sobre nuestra copilar, lo hacen a partir de lo que creen que son las
forma de pensar. necesidades de los usuarios, lo cual puede diferir de
Por lo tanto, tenemos todo el derecho a decidir si las necesidades como las perciben estos ltimos.
queremos o no ser instrumentos para la realizacin Esas diferentes visiones, segn el lado desde el que
de ese propsito. se observe, resultan como si entre uno y otro sector
La informacin llega a manos de quienes van a utilizar- (productores, usuarios) hubiera un cristal que modifi-
la. O, en forma genrica, se publica, y queda disponible ca la imagen percibida. Por eso se habla de un efecto
para todos los que pueden acceder a esa publicacin. Antes lentes. Que es bidireccional, de modo que son dife-
de considerar la actitud de los usuarios, es necesario ha- rentes las visiones de las necesidades y tampoco el
cer un comentario sobre un tema que tiene gran influen- usuario coincide plenamente en la apreciacin de la
cia en el xito o el fracaso de un programa de produccin informacin y el conocimiento que el productor le ofre-
estadstica. Para ello, revisemos las grandes transforma- ce. Reconocer estas diferencias, es de importancia
ciones que se producen durante el proceso estadstico. crucial, en la evaluacin de la evidencia y de las
La enorme multiplicidad de datos, se organiza y con- inferencias resultantes de ella.
densa en informacin al colocarlos en un marco de Hasta aqu hemos revisado distintos aspectos sobre
significado. El razonamiento estadstico, aplicado a la los que se debe desplegar la vigilancia estadstica. As
informacin influye en el alcance y la generalidad de pudimos ver que la informacin que se encuentra tie-
las estimaciones. Cuando se reduce la incertidumbre ne un propsito, es decir que fue seleccionada y orga-
y aumenta la credibilidad, se conforma la fase del co- nizada por alguien con la intencin de influir sobre
nocimiento. Finalmente la integracin de conocimien- nuestra forma de pensar.
tos parciales, da lugar al estado que puede llamarse Por lo tanto, tenemos todo el derecho a decidir si
de sensatez o de prudencia. queremos o no ser instrumentos para la realizacin
226 227
H u go O scar A m b rosi L a d am a d e la lm p ara

de ese propsito. Desde nuestros padres, tanto Si admitimos que en todo argumento se puede omitir
publicistas como maestros, polticos, autores y confe- informacin, qu se supone que debemos hacer?
renciantes, organizan la informacin de que disponen El beneficio que trae preguntarse por la informa-
con el fin de moldear nuestras decisiones. Es natural y cin omitida es que nos hace ms cautelosos: quien
predecible que quienes tratan de persuadirnos de algo, ha sufrido desengaos no se convence tan rpidamente
buscarn presentar su argumento de la manera ms de algo (votar por alguien, comprar tal cosa, leer tal
slida posible, ocultando si es necesario, la informa- libro, o enamorarse, no?).
cin o los datos que podran perjudicar su posicin. La erstica es el arte de tener razn. Tener razn no
Muchos cientficos sociales han renunciado a un es buscar la verdad, sino tratar de ganar la discusin,
ideal de explicacin basado en leyes y ejemplos para de cualquier manera. Schopenhauer enumera 38 for-
asumir otro basado en casos e interpretaciones, bus- mas de argumentar para ganar.
cando menos la clase de cosas que conecta planetas y Superadas las comprobaciones anteriores estaremos
pndulos y ms esa clase que conecta crisantemos y en condiciones de prestar nuestra conformidad a la
espadas. (Geertz, 1980, p. 32.) masa estadstica, es decir el conjunto de datos obteni-
En el caso de las ciencias sociales, en funcin de su dos segn el proceso de observacin realizado.
objeto y modo de acceso al conocimiento, ajeno al modo Llegados a este punto, hemos obtenido la capaci-
de proceder cientfico-natural, el mtodo propio sera dad de ver el conjunto, ver el bosque y en conse-
hermenutico o interpretativo, con el objetivo de com- cuencia nuestro razonamiento se apoyar sobre una
prender las acciones humanas. Como dice el base mucho ms amplia que el mero recurso de lo
antroplogo Geertz (1988, p. 20) no se trata de una anecdtico a que nos reducan los lmites sensoriales
ciencia experimental que busca leyes, sino una cien- de nuestra capacidad de observacin, ilustrada por
cia interpretativa en busca de significaciones. aquello de: los rboles no dejan ver el bosque.
El giro hermenutico vendra simbolizado por ha- En ese punto, las explicaciones, las predicciones, la
ber pasado de querer conectar planetas y pndulos, capacidad para influir en la marcha de las cosas, cul-
recordando el intento de Galileo, a crisantemos y es- minan en la comprensin, en ese estado de integra-
padas, por recordar el clebre ensayo de R. Benedict cin y entendimiento de los problemas, que los pone
sobre la cultura japonesa. en perspectiva y los armoniza con el estado del mun-
Fundamentalmente, convencernos de que por muy do y de nuestro conocimiento.
atractivo que sea un argumento, es necesario revisarlo Y en ese punto, vueltos a la riqueza y a los matices
una y otra vez, para ver si se omite informacin (como del lenguaje natural, podemos retomar la amable y
cuando queremos comprar algo: lo revisamos una y otra corts conversacin, brevemente interrumpida por
vez, comparndolo con otros productos similares). nuestra incursin en laboratorios y gabinetes de don-
Informacin relevante omitida, es informacin que de regresamos con algunas de las preciadas esencias
afectar nuestra decisin final sobre cualquier asunto. que nos facilita la ciencia, permitiendo que nuestro
228 229
H u go O scar A m b rosi

dilogo se fortalezca y pueda ser positivamente cons-


tructivo o saludablemente prudente.
En la ltima filosofa de Wittgenstein, al depotenciarse CAPTULO XV
el lenguaje monopolizador de las ciencias naturales se
abre paso al pluralismo de los lenguajes naturales que
Eplogo para estadsticos
ya no apresan tericamente la realidad en un nico
marco de comprensin del mundo, sino que la sitan
prcticamente en los diversos mundos de la vida. Las
reglas de estos juegos de lenguaje constituyen gra-
mticas tanto de lenguajes como de formas de vida.

Esta es una historia y una invitacin. Una historia y


balance de proyectos. El cotejo entre lo vislumbrado
como posible y lo finalmente cumplido como hecho
verificable.
Las discusiones que hemos sostenido, en el intento
siempre renovado de perfeccionar la identidad de nues-
tra profesin, que servira para hacer ms slida nues-
tra propia posicin en la sociedad.
La alta tensin entre quienes tienen mayor afinidad
por las matemticas y quienes estn cerca de la pro-
duccin de los datos, de la administracin de diversos
fondos de informacin. Acadmicos y aplicados.
Falsas antinomias que tal vez slo sirvieron para ale-
jar la discusin de los verdaderos problemas, que con
tanta claridad estampara en el nmero 1 de Estadsti-
ca, la revista del IASI, el fundador del IBGE, Mario Au-
gusto Teixeira de Freitas, a quien Dieulefait llamaba
el Santo de la Estadstica:

Haga la Amrica la Estadstica que debe hacer


y la Estadstica har grande a la Amrica.

230
H u go O scar A m b rosi E p logo p ara estad sticos

Augusto Teixeira fue como Quetelet y como el mis- slo contar nuestras cuentas, sino tambin contar
mo Dieulefait de la raza de los apstoles, sembradores interpretando, para que el otro no padezca con los
de esperanzas en la capacidad del hombre para hacer enigmticos trazos de nuestras frmulas exclusivas y
un mundo mejor. excluyentes.
Seremos capaces de levantar esa bandera y lle- Pongmonos a trabajar para contener esa avalan-
varla adelante? Uniendo la maravillosa exageracin cha de datos sin sentido que abruman con su enorme
del apasionado, con la convencida perseverancia del volumen y alta velocidad de renovacin, desconecta-
artesano. dos de toda teora, significado o propsito.
Para hacer realidad nuestros sueos y darle a nues- Hagamos realidad que aprender estadstica no
tra sociedad la savia vital del conocimiento, debemos sirva para saber estadstica, sin para comprender a
despojarnos de cualquier atisbo de exclusivismo elitista la gente.
y convocar a todos, bajo las premisas de la confianza Seamos capaces de volver efectivamente a las cosas,
y el compromiso. como nos peda Ortega hace casi 80 aos.
La tarea es demasiado ardua para nuestras es-
paldas. Pero tambin es urgente e irrenunciable. Hace
falta el aporte de todos.
Es necesario que la gente redescubra (y nosotros
con ellos) que se hace estadstica en la vida, de la mis-
ma manera que se habla en prosa: sin darse cuenta.
La invitacin es a que pongamos manos a la obra de
inmediato. Que abramos nuestro cajn de herramien-
tas y las pongamos a disposicin de todos los que es-
tn dispuestos a aprender, a poner la razn al servicio
de la pasin.
Seamos los hombres y mujeres que hacen falta.
Hbiles con sus herramientas, confiables en su tra-
bajo, generosos con su saber y disponibles para el
necesitado.
Recuperemos la capacidad de comprender, de trans-
mitir, de convencer. Aceptemos que el debate es la
forma de construir consenso en una repblica. Culti-
vemos los modos del razonamiento que fortalezcan
comunidades de prctica, donde el saber se difunda
en el desarrollo de soluciones concretas. Sepamos no
232 233
Anexo

A continuacin se ofrece una lista de preguntas re-


copiladas por Morris Polanco, para revisar con espri-
tu crtico la evidencia que se nos presenta. Esta cita
corresponde a su trabajo Razonamiento Critico y L-
gica, que incluye la traduccin libre de Browne, M.
Neil y Keely, Stuart M. (1998). Asking the Right
Questions. A Guide to Critical Thinking. Upper Saddle
River, New Jersey: Prentice Hall.

Origen de los datos o hechos presentados en el


argumento
De dnde proceden los datos?
La informacin que se presenta como hechos, pro-
cede de investigaciones serias, hecha por personas de
prestigio en el campo?

Detalles de los procedimientos usados para recopilar


los datos
Cuntas personas respondieron el cuestionario?
Cmo estaba redactado el cuestionario?
H u go O scar A m b rosi A n exo

Tcnicas alternativas para reunir u organizar la Efectos positivos y negativos omitidos


evidencia
Se ha omitido mencionar los posibles (o reales) efec-
Cambiaran los resultados si en lugar de cuestio- tos negativos de la accin propuesta?
nario se usara otra tcnica de recopilacin de datos, Sera necesario o conveniente conocer los efectos
como la entrevista? de la accin propuesta en el rea poltica, social, eco-
nmica, biolgica, espiritual, de salud o ambiental?
Definiciones faltantes
Contexto de las citas y testimonios
Cmo quedara el argumento si los trminos cla-
ves se definieran de otra manera? Se ha tomado una cita o un testimonio fuera de su
contexto?
Preferencias o perspectivas faltantes
Beneficios que obtendra el autor al persuadir a otros
Desde qu otro conjunto de valores podramos abor-
dar el problema? Se beneficiar el autor (econmicamente, sobre
Qu argumentos presentara quien abordara el pro- todo) si se adopta su propuesta?
blema desde otra perspectiva o conjunto de valores?
Sobre los valores
Argumentos contrarios
En la lista anterior se han mencionado los valores,
Qu razones daran los que no estn de acuerdo? como un elemento desde el cual se formula tanto la
Existen estudios que contradigan los datos pre- produccin de la evidencia como su interpretacin.
sentados? Qu son los valores? Son ideales que la gente
Existen ejemplos, testimonios, o analogas que apo- considera dignos de aprecio. Los seres humanos to-
yen la visin contraria? mamos decisiones y actuamos de una forma u otra
porque nos guiamos por ciertas creencias sobre lo que
Figuras, grficas, tablas o datos faltantes es importante en la vida del ser humano: el trabajo, la
amistad, el dinero, la solidaridad, el poder, etc.
Cambiara la figura si incluyera datos de aos an-
Si alguien es muy sociable y comunicativo, por ejem-
teriores o posteriores?
plo, no cabe duda de que tiene en alta estima (ocupan un
Se ha encogido la figura, para disimular las dife-
lugar alto en su escala de valores) la amistad y la gente.
rencias?
Otro valor fundamental es el respeto de la vida hu-
mana, que definir nuestra posicin respecto a te-
mas como la pena de muerte, el aborto, la guerra, las

236 237
H u go O scar A m b rosi A n exo

drogas. Considero ms importante la justicia que la


vida de una persona, cuando se ha cometido un cri- 4 . O rd en vs. lib ertad d e D eb era n ir a la c rcel los
men atroz? (pena de muerte). Considero ms impor- exp resin extrem istas?
tante la vida de un no nacido que las posibles compli-
caciones que puede traer a una vctima de violacin 5 . S egu rid ad vs. em ocin S on lcitos los d ep ortes alta-
(aborto). m en te p eligrosos?
Los diferentes valores y la intensidad con la que
cada uno los defiende es lo que hace que las perso- 6 . G en erosid ad vs. E s acon sejab le d ar ayu d a a los
xito m aterial p ord ioseros?
nas lleguen a diferentes conclusiones sobre proble-
mas prescriptivos, aunque la informacin descripti-
7 . T rad icin vs. D eb era facilitarse el d ivorcio?
va disponible, sea comn y nica. Es decir, en m od ern id ad
situaciones que se resuelven definiendo cmo debe
ser la conducta. 8 . E stad o d e d erech o vs. D eb en las leyes favorecer a los
Estas diferencias de prioridades o de lealtades pue- ju sticia social sectores m s p ob res o n ecesitad os?
den verse con facilidad cuando hay pares de valores
en conflicto. Por ejemplo: qu valora Ud. ms: la com-
petencia o la cooperacin?, la igualdad de oportuni- La Regla de Oro de la tica se encuentra en Mateo
dades o la igualdad de todos ante la ley? 7:12, y dice; As que, todas las cosas que queris que
El siguiente cuadro presenta algunos conflictos de los hombres hagan con vosotros, as tambin haced
valores que se plantean frente a determinadas cues- vosotros con ellos; porque esto es la ley y los profetas.
tiones (tomado de M. Polanco). (Sermn de la Montaa).

V a lor C u estin
D eb era u sted in form ar a su s
1 . L ealtad vs. h on rad ez p ad res qu e su h erm an a con su m e
d rogas?
E st d e acu erd o con el siste-
2 . C om p eten cia vs. m a d e calificacion es (y con el cu a-
coop eracin d ro d e h on or)?

3 . Igu ald ad vs. E stara ju stificad o u n n m ero


in d ivid u alism o m n im o d e d ip u tad os in d gen as?

238 239
240

También podría gustarte