Está en la página 1de 10

Universidad de Buenos Aires Facultad de Ciencias Sociales Carrera de Sociologa

Documento de Ctedra 90 Tassi, P.: De lo exhaustivo a lo parcial: un poco de historia sobre el desarrollo de los sondeos

Tassi, P. (1988). De lexhaustif au partiel: un peu dhistoire sur le dveloppement des sondages. Statistique et analyse des donnes, 13 (2), 113-129 Traduccin resumida del francs al espaol realizada por Martn Gelman (2013)

Ctedra de Metodologa y Tcnicas de la Investigacin Social Profesora Titular: Ruth Sautu

Este Documento de Ctedra forma parte de una serie que tiene como propsito contribuir a la formacin de alumnos de la Carrera de Sociologa de la Universidad de Buenos Aires en cuestiones vinculadas al diseo y realizacin de investigaciones cientficas en el campo de las ciencias sociales. Su contenido complementa los textos de metodologa de lectura obligatoria y optativa incluidos en cada uno de los tres cursos que se dictan en la Carrera. Estos documentos son material de uso interno y no pueden ser incorporados a ediciones impresas ni reproducidos comercialmente. La Ctedra solicita a los usuarios de estos Documentos que citen a sus autores indicando las referencias completas, es decir: autores, fecha, ttulo, nmero y tipo de documento (traduccin, resumen, elaboracin propia, etc.). En los casos en que el usuario utilice slo parte del documento, haciendo referencia a algunos de los autores/obras originales all incluidos, consignar que fue tomado de nuestro Documento de Ctedra. Por ejemplo: E. O. Wrigth (1985), Classes, London: Verso, citado en Documento de Ctedra II.1., Plotno, G., Lederman, F. & Krause, M. (2007) Escalas Ocupacionales.

Los orgenes Generalmente se admite que la estadstica abarca un conjunto de mtodos que contribuyen al conocimiento de una poblacin, tomando este ltimo vocablo en sentido amplio, tanto si su uso proviene de la demografa como del recuento censal de individuos. La aparicin del trmino estadstica es en s relativamente reciente, sobre todo en comparacin con la actividad correspondiente de recoleccin de datos que se remonta a la antigedad. En general, atribuimos la creacin del trmino estadstica a la escuela descriptiva alemana de Gottingue y, en particular, a Gottfried Achenwall (1746). El trmino proviene del latn statisticum: que tiene relacin con el Estado. Sin embargo, es ms probable que Achenwall solo haya contribuido a imponer el empleo del vocablo puesto que hacia 1701 ya contbamos con una Biblioteca Statistica y en 1672 con un Microscopium Statisticum.

Remontndonos an ms en el tiempo, el trmino estadstica parece haber pertenecido al lenguaje administrativo francs del colbertismo.1 Por el contrario, la aparicin de la necesidad estadstica de contar con datos numricos precede a su denominacin en varios milenios. En su origen, la necesidad provena de los jefes de Estado deseosos de conocer los elementos bajo su poder: poblacin, potencial militar, riquezas, etc. Qu mejor conocimiento que el procedente de la observacin sistemtica y exhaustiva de todos los elementos de la sociedad? La idea de censo o de inventario aparece, entonces, de manera natural en la historia implicando adems una impresin de precisin de la ms alta calidad. Los primeros censos parecen remontarse a la civilizacin sumeria de 5000 a 2000 aos antes de nuestra era. El relevamiento de personas y bienes tuvo lugar regularmente en la Mesopotamia hacia el 3000 a.C. Egipto parece haber sido la primer nacin en organizar sistemticamente censos de poblacin al menos desde el ao 2900 a.C., as como en institucionalizar los censos fiscales (entre el 2700 y el 2500 a.C).

Nota del traductor: Con el trmino colbertismo se designa a la doctrina econmica elaborada por Jean-Baptiste Colbert en el siglo XVII.

China desempea tambin un importante rol en la historia de los censos. Por ejemplo, el emperador Yao edita, hacia el ao 2238 a.C, el relevamiento total de individuos y producciones agrcolas.

Los primeros intentos de extrapolacin A partir del siglo XIII de nuestra era, los datos devienen ms numerosos en virtud de la proliferacin de las categoras fiscales. Durante el siglo XIV comienzan a registrarse las actas de estado civil [actes d tat civil]. Pese a que durante todo este perodo se consolida la estadstica administrativa, los censos resultan poco frecuentes. La estadstica retomar sus progresos fundamentales durante la segunda mitad del siglo XVII a partir de la necesidad que volvan a sentir los monarcas y sus consejeros de conocer y explicar los fenmenos econmicos y sociales. Esta poca coincide con el desarrollo de la escuela de aritmtica poltica inglesa, precursora de la estadstica inferencial. Esta escuela, cuyos fundadores fueron John Graunt (1620-1674) y William Petty (1623-1687), se guiaba por la preocupacin de la cuantificacin y la bsqueda de constantes de comportamiento que permitieran realizar estimaciones y previsiones: nmero de hijos por mujer, tiempo entre dos nacimientos para una misma madre, nmero de habitantes por vivienda y hogar, proporcin de fallecimientos, etc. Las tcnicas del multiplicador de la aritmtica poltica sern utilizadas en detrimento de los censos, favoreciendo la aparicin de encuestas parciales. Paralelamente, el reemplazo de un conocimiento exhaustivo por una extrapolacin fundada en el examen de una parte de la poblacin ser una actitud que comenzar a encontrar elementos de justificacin con la aparicin de los primeros resultados de probabilidades. En Inglaterra, los mtodos de la aritmtica poltica prosiguieron con sus progresos. Las tcnicas de extrapolacin o multiplicador conocieron

rpidamente un enorme suceso que contribuy a poner un freno [mettre un frein] a los censos, juzgados por ciertos sectores como onerosos, poco precisos y monstruosos (Saint- Simon). A comienzos del siglo XIX, parecan estar dadas las condiciones para el desarrollo de la metodologa de los relevamientos parciales: la prctica,

esencialmente demogrfica, haba surgido; el clculo de las probabilidades segua su progresin y la voluntad de los Estados de poseer informacin numrica se confirmaba. No obstante, debern pasar ms de 100 aos para que el inters por los sondeos fuera reconocido y, ms an, para establecer una teora matemtica fundada en la aleatoriedad.

Un tiempo de cese: el siglo XIX Contrariamente a lo esperado, el siglo XIX estuvo marcado por el retorno forzado de los censos, poco frecuentes durante el siglo precedente. En 1801 se realizan en simultneo censos de poblacin en Inglaterra, Dinamarca, Francia y Noruega. En muchos pases los censos devienen regulares y peridicos. Pese a que la teora estadstica conoci un desarrollo sin precedentes, el muestreo retrocedi frente a la exhaustividad. Uno de los fundadores de la ciencia estadstica tal como la conocemos en la actualidad es el belga Adolphe Quetelet (1796-1874). Quetelet es, ciertamente, el primero en concebir con gran claridad que la estadstica poda estar fundada sobre el clculo de probabilidades. Quetelet ampli el campo de aplicacin de la estadstica, de la economa y las ciencias sociales a la antropometra. Asimismo, organiz en 1853 en Bruselas el primer Congreso Internacional de Estadstica. Sin embargo, Quetelet lejos de preconizar los sondeos, se encontraba movilizado por la obsesin del relevamiento total; su preocupacin constante era asegurar la exhaustividad de los datos recolectados. An as, aceptaba extender al conjunto de la poblacin datos correspondientes a ciertos subgrupos (por ejemplo, la tasa de analfabetismo calculada entre los delincuentes). Pese a la preponderancia de la enumeracin total, las visiones parciales no desaparecieron por completo del bagaje de los estadgrafos. El polo principal de utilizacin de los sondeos se sita en Estados Unidos con la emergencia de las encuestas de opinin pblica, de la que hablaremos ms adelante.

1895-1925: el debate sobre la representatividad El concepto de representatividad de un resultado o muestra es muy reciente. Si bien Condorcet haba hecho referencias alusivas repetidas veces, parece haber sido explcitamente utilizado por primera vez por Jean-Baptiste Say. Say afirma la imposibilidad de considerar representativa para el conjunto de una poblacin una tasa de mortalidad calculada para sectores de altos ingresos, extrapolacin que, como vimos, defenda Quetelet. El debate sobre la representatividad tendr como marco al Instituto Internacional de Estadstica (IIS) creado en Londres en 1885. El punto de partida del debate lo constituye la histrica exposicin de Anders Nicolai Kiaer, director de la Oficina Central de Estadstica del Reino de Noruega, en el congreso del IIS en 1895 en Berna, Suiza. La idea de una parte sobre el todo es lanzada [lance] a un pblico de estadgrafos. Es necesario remarcar que, a priori, ningn puente se haba tendido entre las probabilidades y el muestro representativo. Durante un congreso en Budapest en 1901, Kiaer expresa:
() el mtodo representativo demanda un gran nmero de unidades de observacin repartidas de modo tal que, en la medida de lo posible, los diferentes atributos se encuentren representados como lo estn en el conjunto de la poblacin.

Ladislaus von Bortkiewicz, profesor en la Universidad de Berln, sugiere recurrir al clculo de probabilidades para probar estadsticamente la diferencia entre las distribuciones de la muestra y de la poblacin total en las variables claves.
() se trata de determinar si la diferencia observada puede o no ser considerada un producto del azar, de causas fortuitas o accidentales.

Durante el mismo perodo, otras contribuciones fundamentales fueron aportadas por el ingls Arthur Bowley (1869-1957), quien desarroll el muestro aleatorio y la estratificacin y estableci, entre otras cosas, la ecuacin de anlisis de la varianza en universos estratificados. El tercer gran nombre del perodo es el de Alexander Ivanovich Tchuprow quien defini la afijacin ptima en un muestreo estratificado, lo que entra en 4

contradiccin con la idea corriente de representatividad segn la cual la muestra es un modelo reducido [modle rduit] de la poblacin entera. Luego de 1925 el punto de discusin no ser ya si hacer el muestreo o no hacerlo, sino cmo extraer la muestra. Rpidamente, el debate involucrar a los partidarios del muestreo aleatorio [random sampling2] y del muestreo estratgico [purposive selection3]. Adolphe Jensen, jefe del departamento de estadstica de Dinamarca, era consciente de ello:
() cuando el IIS discuta el tema veinte aos atrs, la cuestin que generaba mayor inters tena que ver con el reconocimiento del mtodo. Hoy en da el debate es otro. Me atrevo a decir que en la actualidad difcilmente exista un estadgrafo que impugne la legitimidad del mtodo representativo ()

La introduccin del modelo probabilstico se encuentra en curso. La etapa ulterior se iniciar en 1934. No obstante, desde haca varios lustros se vena desarrollando, en Estados Unidos, un dominio de utilizacin del sondeo: el conocimiento de la opinin pblica. Una evolucin paralela: los orgenes de los sondeos de opinin en Estados Unidos Los sondeos de opinin nacieron del deseo de obtener informacin, en la medida de lo posible cuantitativa, sobre el estado de nimo [tat d esprit] de la poblacin. Los sondeos de opinin surgen en los Estados Unidos en ocasin de la cobertura de prensa de las elecciones presidenciales. Desde 1824 los peridicos Harrisbourg Pennsylvanian y Raleigh Star venan realizando encuestas pre-electorales a travs de la consulta individual a los electores. Seguidamente, otros peridicos como el New York Herald, el Chicago American, el Columbus Dispatch y, en particular, desde 1916, el Literary Digest retomarn este hbito apreciado entre el pblico.
2 3

Nota del traductor: En ingls en el original. Idem.

Las muestras recogidas por los peridicos no reposaban sobre ningn criterio de representatividad (el trmino recin aparecera 70 aos ms tarde). Sus propiedades residan esencialmente en el elevado nmero de unidades muestrales: 30 mil para el New York Herald en 1905, ms de 2 millones para el Literary Digest en 1936. Una fecha crucial en la historia del muestreo es el 3 de noviembre de 1936, da de publicacin de los resultados de la eleccin presidencial en los Estados Unidos. Mientras que el Literary Digest haba pronosticado la victoria de Alfred Landon, el ganador fue Franklin Delano Roosevelt. El triunfo de Roosevelt haba sido predicho por tres sondeos independientes realizados por Archibald Crossley, Elmo Roper y George Gallup. Este ltimo cre su propio instituto de opinin pblica en 1935. Los tres estudios fueron realizados utilizando el mtodo representativo de seleccin estratgica [mthode reprsentative par choix judicieux], seleccionando por cuotas a las unidades muestrales. Pese a la amplitud de la muestra, el sondeo del Literary Digest se revel sesgado. A partir de 1937, numerosas publicaciones norteamericanas contaron con una seccin de opinin, nutrida de encuestas con muestras representativas realizadas por organismos privados. En 1938 aparecen los primeros institutos de estudios de opinin en Gran Bretaa y Francia. Poco despus, numerosos pases van a continuar con este movimiento hasta que, en 1947, tiene lugar en Pars el primer Congreso Internacional de Opinin Pblica. La situacin en la Rusia pre-revolucionaria En el siglo XIX, al mismo tiempo que surgan y se generalizaban en Estados Unidos los sondeos de opinin, el Imperio Ruso conoca un desarrollo considerable en los mtodos fundados sobre una visin parcial de la poblacin. En 1864 el poder central crea los zemstvo, gobiernos locales en el seno de los cuales existan departamentos estadsticos encargados de recoger, en particular, datos sobre el estado de la agricultura para facilitar la definicin de las orientaciones de la poltica econmica rural.

El padre espiritual de la estadstica zemstvo fue Tchuprow (1842-1908), profesor de Economa Poltica y de Estadstica en la Universidad de Mosc y miembro del IIS desde su fundacin. La existencia de institutos estadsticos en los zemstvos favoreci la aparicin de numerosos estadgrafos matemticos que contribuyeron fuertemente al desarrollo de los mtodos. Las tcnicas de muestreo parecen haber sido empleadas tempranamente por los estadgrafos rusos en virtud de la imposibilidad de observar

exhaustivamente los territorios de su competencia. En 1894, Tchuprow brinda en Mosc una conferencia sobre el mtodo monogrfico, el cual consiste en la seleccin de elementos tpicos determinados a partir de un conocimiento exhaustivo de una poblacin. Se admite generalmente que los sondeos, en el sentido amplio del trmino, eran utilizados comnmente en la estadstica rusa independientemente de Kiaer. Un avance metodolgico esencial surge en 1910, en paralelo a los trabajos de Bowley en Inglaterra. Tchuprow estudia el muestreo aleatorio y desarrolla su utilizacin para medir la precisin de los estadsticos calculados. Asimismo, hace referencia al muestreo por conglomerados y al muestreo estratificado, con y sin reposicin. Las dificultades vinculadas con la distancia, el idioma y, lgicamente, los eventos ligados con la Revolucin de Octubre, impidieron durante mucho tiempo apreciar la importancia de la escuela rusa en la estadstica parcial4. El desarrollo de la metodologa y de la utilizacin de los sondeos en la Rusia zarista fue considerable. Numerosos estadgrafos rusos de comienzos del siglo XX pueden ser considerados como los precursores e iniciadores del mtodo, en la misma medida que Kaier, Bowley y Neyman.

Los inicios del desarrollo contemporneo Luego de 1925 la discusin sobre el mtodo representativo ya no giraba en torno a sus premisas, sino sobre sus modalidades de aplicacin.

Nota del traductor: Por estadstica parcial, el autor refiere a aquellos estudios que no relevan a todas las unidades de una poblacin sino que se basan en algn tipo de muestreo.

De igual modo que Bowley y Tchuprow, Jerzy Neyman (1894-1981) puede ser considerado uno de los fundadores de la teora estadstica de los sondeos. El aporte de Neyman ser considerable ya que, en primer lugar y a diferencia de Bowley que los situaba en un mismo plano, tomar partido por el muestreo aleatorio en desmedro del muestreo intencional. Neyman muestra que las dos tcnicas de muestreo no son equivalentes y que conviene utilizar el muestreo aleatorio dado que la seleccin deliberada de las unidades en el muestreo intencional reduce la confianza general. Neyman consideraba representativas aquellas metodologas de sondeo que producan estadsticos convergentes con los parmetros poblacionales y permitan calcular la precisin de los resultados. Ms all de esta cuestin fundamental de eleccin entre mtodos de muestreo, Neyman contribuy con numerosos desarrollos ya vislumbrados por Bowley: el muestreo aleatorio simple con y sin reposicin y el muestreo estratificado. Asimismo, contribuy con el desarrollo del muestreo por conglomerados, hizo avanzar significativamente la teora de la estimacin por sondeos y estudi la afijacin ptima de un muestreo por estratos5. Estableciendo la superioridad de las tcnicas de sondeo aleatorio en universos estratificados, Neyman orient una gran parte de la investigacin en esta direccin. A partir de ese momento, las bases de la estadstica de los sondeos se encuentran sentadas. Surgen dos grandes vas de desarrollo: una ligada a los problemas de la prctica (forma de extraer la muestra, estimacin, varianza, no-respuestas, etc.) y otra referente al modelo probabilstico subyacente a la teora de los sondeos. Los avances de la primera va permitieron la construccin de la metodologa fundamental de los sondeos.

Los desarrollos actuales Desde mediados de los aos cincuenta, las investigaciones metodolgicas se fundan crecientemente en las relaciones existentes entre los sondeos y el modelo de la estadstica inferencial.
5

Nota del traductor: La afijacin es la distribucin del tamao muestral global entre los estratos diferenciados. La afijacin ptima es aquella que no solo considera el peso relativo del estrato en la poblacin, sino tambin su variabilidad o heterogeneidad respecto de la variable considerada en la estratificacin. A aquellos estratos de mayor heterogeneidad y peso poblacional les corresponder un tamao muestral superior.

Un primer eje de investigacin concierne a la aplicacin en los sondeos de conceptos estadsticos introducidos a partir de la teora de la estimacin de Ronald Fisher, tales como la admisibilidad, la exhaustividad y la verosimilitud. A modo de conclusin, vale resaltar que la lectura de las grandes obras o artculos que marcaron la historia de la estadstica a fines del siglo XIX y principios del XX mostr que generalmente fueron omitidas en las investigaciones las condiciones de obtencin de datos. Ello resulta

perfectamente comprensible en virtud de las principales etapas de desarrollo de los sondeos. Sin embargo, los procedimientos estadsticos fueron utilizados habitualmente como si las propiedades de la muestra fueran semejantes a las de la poblacin. En otros trminos, se procedi siempre como si la extraccin de todas las muestras brindara la misma probabilidad de estimar los parmetros poblacionales. No sera necesario modificar los mtodos habituales para tener en cuenta el procedimiento aleatorio de recoleccin de datos y la complejidad creciente de los planes de sondeo? Recientemente, han comenzado a surgir reflexiones sobre la validez de los procedimientos estadsticos cuando los datos provienen de sondeos complejos. Esta tendencia a reexaminar la validez de las herramientas de la estadstica matemtica en el modo de obtencin de los datos, que promete futuros desarrollos para la ciencia estadstica en su conjunto, debe acentuarse rpidamente.