El texto de Arthur Bowley que presentamos a continuacin, fue publicado
en 1936 por la American Statistical Asociation, y su origen es una intervencin oral expuesta en 1935, en el grupo de estudio de la Royal Statistical Society britnica. No obstante, el lector tiene ante s uno de los primeros escritos donde la encuesta estadstica se aborda con la terminologa moderna y donde apare- ce el modo de calcular lo que ha dado en llamarse intervalos de confianza en funcin de la probabilidad. Es tambin, uno de los primeros textos en los que se deja a un lado los ejemplos con dados y cartas, para ilustrar los fundamen- tos del muestreo con casos reales tomados de las encuestas inglesas sobre pobreza y condiciones de vida de la clase obrera. En definitiva, podemos com- probar la paternidad efectiva de Bowley en la metodologa de la encuesta esta- dstica as como su papel en el trnsito de la incertidumbre que arrastraba el margen de error hacia el optimismo posterior del intervalo de confianza 2 . Arthur Bowley (1868-1957) haba estudiado matemticas, pero bajo la influencia de Edgeworth y Marshall se orienta hacia los estudios de economa La aplicacin del muestreo a los problemas econmicos y sociolgicos 1 ARTHUR L. BOWLEY London School of Economics EMPIRIA. Revista de Metodologa de Ciencias Sociales. N. 5, 2002, pp. 195-204. 1 BOWLEY, A. L.: The application of sampling to economic and sociological problems. Journal of the American Statistical Asociation, September 1936, Vol. 31, n. 195. Traduccin: Jos M. ARRIBAS. Departamento de Sociologa I, UNED, Madrid. Agradezco al profesor Luis Castro Nogueira las sugerencia y mejoras introducidas. 2 Desrosieres apunta como Bowley hace de la imprecisin del margen de error un objeto res- petable: el intervalo de confianza, pero lo situa en un texto de 1906: Presidential ardes to the Economic Section of the British Association, Jornal of the Royal Statistical Society, pp. 540- 558. DESROSIRES A. La Politique des grands nombres. ditions la dcouverte, Paris, 1993, p. 275. Tambin Desrosieres 2002: El administrador y el cientfico: las transformaciones de la profesin estadstica en ARRIBAS, J.M. y BARBUT, M., Estadstica y Sociedad, UNED Edicio- nes, p. 143. y sociologa. En 1915 comienza a impartir clases de Estadstica Econmica, y en 1919 ocupa la primera ctedra de Estadstica de la Universidad de Lon- dres. Miembro de la London School of Economics, ostenta puestos de res- ponsabilidad hasta 1936 y es tambin, uno de los fundadores de la Interna- tional Econometric Society. Sus trabajos sobre la definicin y medida del producto nacional se utiliza- ron para la realizacin de las primeras estimaciones oficiales y como estads- tico redefini las tcnicas de muestreo, convirtindolas en norma de cientfi- cos sociales e investigadores de mercados. Entre sus trabajos empricos, hay que destacar, la encuesta sobre la vivienda de la clase obrera : Livelihood and Poverty, publicada en 1915 y su trabajo, tal vez el ms importante: New Sur- vey of London Life and Labour, realizado entre 1930-1935. En Elements of statistics, publicado por primera vez en 1901, aunque con sucesivas ediciones y ampliaciones posteriores, y en An elementari manual of statistics de 1909 (tambin con sucesivas ediciones posteriores) ya haba abordado el tema del muestreo a partir de experimentos que se presentan como aplicaciones de la ley de los grandes nmeros y la ley del error 3 . En estos textos, los fundamentos tericos estn ya desarrollados, aunque el mtodo y la maquinaria tcnico-administrativa an no esta lista para la ela- boracin de las grandes estadsticas del Estado. La metodologa de la encues- ta estadstica representativa se construye cuando existe una base emprica suficiente de naturaleza censal y problemas de suficiente calado poltico. La utilizacin de los intervalos de confianza, por ejemplo, no aparecer como resultado de profundos clculos matemticos sobre la curva de errores, sino por la necesidad de persuadir a los responsables de la Administracin del Estado ( con formacin jurdica, pero sin formacin matemtica) de la perti- nencia del mtodo aleatorio, y en menor medida, a sindicalistas y trabajado- res manuales (natural man en el texto). La resistencia de la Administracin para aceptar el mtodo representativo como sustitutivo de los recuentos censales es tan patente en el texto que con- viene recordar los antecedentes del asunto. Aparte de los clculos que haba hecho Laplace sobre la poblacin de Francia y las aplicaciones de la curva de errores en astronoma, los estadsticos no iniciaron hasta muy avanzado el siglo XIX, experiencias y reuniones cientficas con objeto de introducir el mtodo aleatorio en la estadstica administrativa. A partir de 1895, el estads- tico noruego Kiaer presenta comunicaciones sobre el mtodo representativo en las reuniones del Instituto Internacional de Estadstica celebradas en Berna 196 ARTHUR L. BOWLEY 3 En 1906 utiliza el teorema del lmite central para demostrar que para muestras grandes tomadas de una poblacin, las proporciones de las muestras se distribuan de forma aproxima- damente normal, y en 1915 en Livelihood and Poverty, a propsito de la estimacin del error de las muestras propone utilizar una estimacin mediante intervalos de ms o menos tres veces el error tpico de la muestra que est ya muy cerca de lo que llamar intervalos de confianza dos dcadas ms tarde. Vid. CORK, D. Review of Statistical Sampling, from Laplace to Neyman en The History of the First American Census and the Constitucional Language on Censusta- king: Report of a Workshop. ese mismo ao, San Petesburgo en 1897 y Budapest en 1901 (donde Kiaer muestra la carta de adhesin del USA Department of Labour ). En ellas los estadsticos oficiales discuten acerca de la validez de los datos estadsticos obtenidos a partir de pequeas muestras y por procedimientos aleatorios, no alcanzando estos su reconocimiento definitivo hasta 1925. En 1909 en el coloquio de la Asociacin Internacional de Estadstica, Edgeworth haba abordado las cuestiones relativas a la aplicacin del clculo de probabilidades a la estadstica con una amplia ponencia 4 , pero no es hasta el coloquio de Roma cuando la Asociacin internacional acepta oficialmente la plena vali- dez del mtodo aleatorio. En el caso de Arthur Bowley, son las encuestas sobre las condiciones de vida de la clase obrera las que alientan sus investigaciones sobre el mtodo aleatorio 5 . En mayo de 1887, Charles Booth haba ledo en la Royal Statisti- cal Society un informe sobre las condiciones sociales y econmicas de la pobreza redactado a partir de una encuesta realizada en el East London cuyos resultados fueron publicados en 17 volmenes entre 1889 y 1903. Bowley buscar un umbral objetivo que de cuenta de la pobreza ms all de la simple consideracin de los ingresos de la familia 6 , por ejemplo, la cantidad de calo- ras necesarias para la supervivencia o lo que representa el coste necesario para satisfacer las necesidades mnimas de una familia media. El mtodo de Booth pareca ciertamente extensivo: estudio calle por calle de las condicio- nes sociales de muchas familias obreras, mientras que las posteriores investi- gaciones sern intensivas: menos familias entrevistadas y mayor informacin sobre cada una de ellas. La encuesta de Booth utilizaba un mtodo indirecto: un cuestionario que los inspectores educativos se encargaban de rellenar, al estilo de las encuestas desarrolladas en Espaa por la Comisin de Reformas Sociales, mientras que las encuestas de Bowley y sus colegas, realizadas entre 1914 y 1924, se hicieron mediante entrevistas directas, casa por casa. Pero lo ms destacable es que la seleccin de los entrevistados se realiz utilizando procedimientos aleatorios, entrevistando, por ejemplo, una de cada veinte familias del rea seleccionada. Las encuestas de Bowley hay que situarlas en el contexto de preocupacin por el conflicto de clases y el hacinamiento de la clase obrera en las zonas industriales inglesas, as como del nacimiento del Estado del Bienestar. En esta situacin, el Estado comienza a intervenir los mercados de trabajo, regu- LA APLICACIN DEL MUESTREO A LOS PROBLEMAS ECONMICOS... 197 4 EDGEWORTH, F. Y.: On the application of the calculus of probabilities to statistics IIS, XII Session, Paris, 1909, pp. 505-551. 5 Habra que sealar tambin los importantes avances de la estadstica rusa durante el per- odo 1885-1917 en los zemstos. La reflexin de los estadsticos rusos y la calidad de las encues- tas durante ese perodo por la asignacin ptima utilizando estratos que A.G. Kovalevskij pre- senta en 1924, diez aos antes que Neyman. Vase al respecto los interesantes trabajos de Martine MESPOULET: Du tout la partie. Lge dor du sondage en Russie (1885-1924). Revue detudes comparatives Est-Ouest, vol. 31, n. 2, pp. 5-49. 6 Booth publica los datos sobre cantidades y precios de la comida consumida por diferentes familias pertenecientes a distintos grupos sociales, mientras que en estudios posteriores como el de Bowley fijan una dieta mnima de 3.000 caloras que marcara el umbral de la pobreza. lando salarios, jornadas y condiciones laborales, pero tambin introduciendo el seguro de desempleo. En 1923 el Ministerio de Trabajo britnico necesitaba una fotografa deta- llada de aproximadamente un milln doscientos cincuenta mil trabajadores que aparecan registrados como parados, y John Hilton, director de Estadsti- cas del Ministerio de Trabajo 7 , comienza a examinar el 27 de enero de 1923 una de cada tres solicitudes 8 de ayuda al desempleo para conocer las carac- tersticas de los solicitantes, a partir de los ficheros del Employment Exchan- ges as como de otros documentos con informacin relevante. Realizaron el anlisis sobre 372.875 personas y a pesar de que la tabulacin de los datos fue difcil y costosa, el informe final clasific a los solicitantes, por edad, sexo, estado civil, industria, nmero de personas que dependan del parado, nme- ro de das que haban cobrado subsidio, das cotizados, etc. No obstante, el informe, no aclaraba an ciertos aspectos claves sobre la situacin de los soli- citantes del subsidio: Solo una entrevista especial con el solicitante dir Hilton poda facilitar la informacin que se deseaba obtener 9 . Para el siguiente informe, adems de las entrevistas directas se procedi, bajo la reco- mendacin de Bowley, a analizar uno de cada 10.000 casos. Estamos pues ante el nacimiento de la encuesta estadstica moderna: utili- zan muestras seleccionadas mediante procesos aleatorios, obtienen informa- cin de manera directa mediante entrevista personal a los sujetos de estudio, depuran el aparato matemtico derivado de la aplicacin del clculo de pro- babilidades demasiado cargado de ejemplos tericos y se inicia el proceso que conduce a la legitimacin del mtodo por parte de la ciencia y el Estado. Hay que sealar, no obstante, que las encuestas se realizaron a partir de 1923 y el texto que presentamos se publica por la revista de la Asociacin Americana de Estadstica en 1936. En las ediciones de esos aos no hay en su manual Elements of Statistics un captulo sobre teora muestral tal como hoy lo conocemos: clculo del tamao de la muestra, intervalos de confianza, etc. ni se expone claramente el asunto de la confianza algo que seguramente est ms relacionado con el desarrollo de la actividad aseguradora y el inters de esos aos por la probabilidad subjetiva 10 . No obstante, esta exposicin de 1935/6 es perfectamente clara desde el punto de vista matemtico. Nos dice que lo importante es el universal 1/n donde n es el nmero de unidades incluidas en la muestra, le sigue en importancia p, la proporcin del atribu- to en el universo de estudio, y S, la desviacin tpica, cuando estamos consi- derando variables. Por ltimo nos pone un ejemplo de la New London Survey 198 ARTHUR L. BOWLEY 7 HILTON, J.: Enquiry by sample: An experiment and its results. Journal of the Royal Sta- titical Cociety, Vol. LXXXVII, 1924, pp. 544-570. 8 (The claim form con firma y fecha como evidencia de que contina desempleado). 9 Ibidem, p. 545. 10 Bruno de FINETTI comienza a madurar sus ideas sobre la probabilidad subjetiva a partir de 1930. Su primer artculo data de 1931 Probabilismo: saggio critico sulla teoria delle probabi- lit, al que siguen otros como Sul significato soggettivo della probabilit de 1931 o La previ- sin: ses lois logiques, ses sources subjectives de 1935. en el que estima el intervalo de confianza para un porcentaje con + una , dira- mos hoy utilizando la terminologa moderna, o tambin podramos decir: con una probabilidad del 68,26%. JOS M. ARRIBAS MACHO Departamento de Sociologa I Teora, Metodologa y Cambio Social, UNED * * * Desde que se discutieron los mtodos de muestreo en la ltima reunin de la Sociedad Estadstica, podra esperarse que no hay nada nuevo que decir sobre el asunto, puesto que la mayor parte de mis trabajos tericos sobre los aspectos matemticos de la cuestin son accesibles a los estudiantes desde hace tiempo 11 , y los resultados de las investigaciones en las que he participa- do directamente o he cooperado, han sido publicados 12 . La teora del muestreo es correlativa a la teora matemtica de la probabi- lidad, al menos, en la parte que se aborda en Eleccin y azar de Whitworth. Un universo se simboliza por una urna o un grupo de urnas que contienen determinados nmeros de bolas de diferente color; se disean una o ms selecciones de acuerdo con normas definidas, y se pregunta cual es la relacin entre la proporcin del color en la seleccin y en el universo. El problema tiene dos caras, podemos conocer la proporcin en el universo, como cono- cemos el contenido de una baraja, y preguntar cual es la esperanza de una jugada determinada en la teora del bridge, o podemos desear inferir las propiedades de un universo desconocido desde el estudio de uno o ms ejem- plos. En el campo de la investigacin, esto ltimo es el problema. Conviene distinguir los problemas biolgicos de los sociolgicos. En el examen de las especies, el universo puede ser considerado ilimitado y no esta- mos interesados tanto en las proporciones que tienen diferentes caractersti- cas, como en la variacin de los atributos medibles. En los estudios de Men- del, de todos modos, es la proporcin lo que importa, pero todava estamos tratando con un universo hipottico e ilimitado. Las tablas de vida tambin remiten a un universo hipottico. La mayor parte de las investigaciones rela- cionadas con la probabilidad antes de 1900, eran de este tipo. Quetelet no estuvo tan interesado en los estudios estadsticos como en el hallazgo de ilus- traciones de la ley normal del error. Por otro lado, estamos interesados en la investigacin de la estructura numrica de un universo real limitado, o poblacin, que es, tal vez, la mejor LA APLICACIN DEL MUESTREO A LOS PROBLEMAS ECONMICOS... 199 11 Se refiere a Elements of Statistics, London King and Son, cuya primera edicin es de 1901 y a An Elementary manual of statistics, London, Macdonal and Evans cuya primera edicin es de 1909. 12 Los ms importantes son Earners and Dependants in English Towns in 1999. Econmi- ca 1921 n. 1, London School of Economics and Political Science, Livelihood and Poverty (1915). denominacin para nuestro propsito. Nuestros problemas son claramente, inferir la poblacin desde la muestra. El problema es estrictamente anlogo a la estimacin de la proporcin de las bolas de diferentes colores en una urna a partir de una o ms tiradas. La primera aplicacin de este principio en una investigacin original se hizo, al menos hasta donde yo conozco, en 1912, cuando un grupo de perso- nas de Reading, me preguntaron cmo usar de la mejor forma posible una suma de dinero destinada a investigar las condiciones econmicas de la clase obrera de esa ciudad.. Recomend la aplicacin del simple mtodo del mues- treo para obtener resultados vlidos en el tiempo y con el dinero y dems recursos disponibles. A continuacin se publicaron las investigaciones en Livelihood and Poverty y en Has Poverty Diminished?, en New Survey of London Life and Labour; en Merseyside y en Work and Wealth in a Modern Port donde el profesor Caradog Jones y Mister Ford siguen un idntico plan. Como es bien conocido, el proceso de seleccin consisti en tomar una lista de casas del rea, de acuerdo al orden alfabtico de calles, y seleccionar una de cada n casas colocadas en ese orden. Este es literalmente el mtodo de muestreo estratificado que se corresponde con el esquema de Poisson y que consiste en seleccionar bolas de un nmero de urnas en el cual el color esta en proporciones diferentes. Encontramos otro grupo de casos cuando el universo es un fichero de car- tulinas u hojas en las cuales hay datos relativos a personas, inquilinos de viviendas u otras entidades. En 1915, obtuve de la oficina del Censo extrac- tos relativos a una familia de cada cincuenta, tomadas en el orden de las cedu- las de habitabilidad de Boroughs. La clasificacin resultante de los miembros de las familias de clase obrera fue publicada en Econmica en 1921. En los aos siguientes, el profesor Hilton aplic un mtodo similar de seleccin en sus estudios sobre desempleados. De las hojas de los libros de seguros del Labor Exchanges se seleccionaron una de cada cien y los detalles fueron amplificados con entrevistas directas al demandante. Recomiendo una atenta lectura del articulo de Mr Hilton en el Statistical Journal de 1924 y de la dis- cusin que hay en l. Ha habido muchas otras investigaciones de similar carcter dirigidas y publicadas por el Ministerio de Trabajo. Las autoridades del Censo todava no estn persuadidas del uso de este mtodo, con el resul- tado de que an estamos esperando alguna de las ms importantes tabulacio- nes del Censo de 1931. No deben conocer, segn creo, que los japoneses, cuando una gran parte de las tabulaciones fueron destruidas en Tokio por el terremoto de 1923, tomaron una muestra en la proporcin de uno cada 1000 nmeros 500, 1500, etc. hasta 11 millones de hojas de empadronamiento y publicaron los resultados por edad y grupos segn el sexo, tamao de la fami- lia, etc. En 1924, comprobaron que las discrepancias entre la muestra y los resultados censales completos obtenidos fueron insignificantes, y dentro de los mrgenes esperados segn la teora 13 . 200 ARTHUR L. BOWLEY 13 Ver Boletn del Instituto Internacional de Estadstica, Tomo XXV, Deuxieme Libracin, p. 121. Reunin de Tokio, 1930. Puedo mencionar otras dos investigaciones con muestras controladas en las cuales he estado implicado. En el comienzo de la guerra enviaron un comi- t de voluntarios a examinar los efectos inmediatos del desempleo. Me incor- por, segn creo, el 5 de agosto de 1914. Enviamos formularios a todas las empresas de Londres incluidas en el Censo de la produccin, en la proporcin de uno sobre veinte de la lista total de factoras, talleres y oficinas de la ciu- dad. La cuestin principal era saber cuanta gente estaba empleada el 21 de julio, cuanta el 21 de agosto, cuantos estaban alistados, cuantos trabajaban a tiempo parcial, etc. Hicimos pblicos los resultados el 29 de agosto. Este pro- cedimiento fue realizado por la Cmara de Comercio (Board of Trade), sema- nal o mensualmente y lo extendi para el conjunto del pas, sirviendo para formar la base de los estudios de reclutamiento, exenciones, etc. Y si recuer- do correctamente, en parte debido a una simple muestra. Para completar este relato personal en 1917-18, el Ministerio de Alimentacin recibi mensual- mente cuestionarios de miles de panaderos de todo el pas seleccionados a partir de una muestras sistemtica, en los que se preguntaba sobre los stocks y el uso de la harina, con objeto de comprobar el efecto del racionamiento voluntario y determinar si era suficiente el abastecimiento de cereales. Duran- te el bloqueo submarino de 1917, cuando las reservas alcanzaban tan slo para unas pocas semanas y la cosecha estaba a varios meses vista, la situacin era crtica. Una muestra es, no obstante, de escasa utilidad, a no ser que conozcamos el universo, y tengamos algn medio de juzgar esto con precisin. La naturaleza del universo difiere mucho, desde este punto de vista, segn el caso. En el ejem- plo japons el universo eran las viviendas a partir de las cuales se realiz el censo. La investigacin del desempleo tiene un universo mejor y ms definido: las solicitudes nominativas que hacen las personas sin seguro para obtener sub- sidios. En las encuestas municipales, la principal definicin era la de las casas habitadas enumeradas en una lista accesible, con la escueta etiqueta : ocupado por personas designadas como clase obrera bajo ciertas condiciones de clasifi- cacin. La cuestin fundamental es que el universo siempre implica la exis- tencia de una lista de unidades o sus equivalentes. Esta lista, a veces no se corresponde exactamente con el universo que realmente deseamos investigar; por ejemplo, nosotros podemos estar interesados en personas desempleadas independientemente de que tengan seguridad social o no. A veces, est limita- da en muchos casos por la inclusin de una clusula como unidades sobre las que puede obtenerse la informacin. La importancia de esto es evidente si estamos jugando con presupuestos de gasto. Cuando el nmero de unidades definido para cada informacin necesaria es relativamente pequeo, podemos considerar el mximo efecto de su exclusin; por ejemplo, en las ciudades encuestadas, podemos computar el efecto en el porcentaje clasificado como pobreza con la presuposicin de que todo o nada de lo excluido estaba debajo de la lnea de pobreza, o asumir que la proporcin era la misma en lo descono- cido que en lo conocido; o podemos usar conocimientos complementarios para hacer una estimacin aproximada. Pero en alguno de estos planes perdemos la posibilidad de medir la desviacin tpica u otra desviacin de lo estimado. LA APLICACIN DEL MUESTREO A LOS PROBLEMAS ECONMICOS... 201 Esta posibilidad depende primariamente de que cada una de las unidades definidas tenga la misma probabilidad de ser incluida, lo que depende de la existencia de un universo previamente definido y catalogado. De esto hay una comparacin en Econmica n. 1 realizada por Miss Hoog sobre el nmero de personas dependientes de una mujer, a partir de los informes municipales, donde el universo est definido; y otros informes espordicos en los que el universo est definido de forma imperfecta en algunos casos con una fuerte tendencia a incluir mujeres con personas a su cargo. Cuan- do tenemos asegurado lo esencial: que el universo est bien definido y todos los elementos tienen la misma oportunidad de ser incluidos, o que las posi- bilidades difieren en una forma conocida de una seccin a otra, como se hizo con los factores de muestreo en la New London Survey, entonces, el clculo de la desviacin tpica depende completamente de la frmula matemtica, la cual difiere si la seleccin se ha hecho de forma aleatoria o estratificada, etc., y si los atributos o las variables no estn bien definidos. En esta frmula me limito a una o dos puntualizaciones. En mi experiencia, el factor mas impor- tante es el universal 1/n donde n es el nmero de unidades incluidas en la muestra. Lo siguiente en importancia es p, la proporcin que tiene en el uni- verso el atributo en cuestin, o s, la desviacin tpica cuando estamos consi- derando variables. Si tomamos simplemente pq/n o s/n, erramos usualmen- te en sobreestimar la desviacin tpica de nuestra estimacin. Por la estratifi- cacin se reduce el error, como por el hecho de que el universo sea finito, as como con la introduccin de controles en la muestra representativa. En ningu- na de las investigaciones en las cuales he estado implicado, o en los experi- mentos artificiales que he realizado, estos factores han resultado de gran importancia, salvo por lo que respecta a la infraestimacin del error. Pero, por supuesto, hay casos donde incrementan la precisin considerablemente y entonces, los resultados deben ser estimados y facilitados segn la frmula. Qu tamao debe tener n ? Dado que el trabajo de tabulacin crece ms rpidamente que n debido entre otras cosas a la gran dificultad de compro- bar el trabajo, que es importante reducir gastos, y todava ms importante, ganar tiempo, debemos estar preparados para responder a esta cuestin. Pode- mos formarnos una idea preliminar de la magnitud de p o s en el universo, y podemos decidir que precisin deseamos obtener. Si esperamos que p sea alrededor de 0.3 y deseamos un error tpico de la estimacin ms pequeo de 0.01, la respuesta es de naturaleza 30 + 1 por ciento, entonces la solucin es: 0.01 = pq/n, de modo que n = 2.100. En la New London Survey, n era alrededor de 30.000, y el porcentaje de familias de clase obrera en situacin de pobreza podra estar entre 9.8+ 0.17, al menos por lo que respecta al error debido a la muestra. La muestra fue cier- tamente tan grande como result necesario, porque no tiene sentido trabajar con los peniques cuando las libras son inciertas. No obstante, las diferentes definiciones, la ambigedad de la definicin de Booth, la aparicin de fichas incompletas en los retornos y su dudosa validez en algunos casos, da ocasin para pensar en un lmite de duda ms amplio que este 0.17. 202 ARTHUR L. BOWLEY Sugiero que 1000 es frecuentemente un nmero razonable para n, pensan- do, por supuesto, que no puede establecerse ninguna regla. Esto da un error tpico de p de 0.014 o 30 + 1.4 por ciento cuando p = 0.3, que puede ser redu- cido por estratificacin. En mi experiencia el error tpico de la variable es pequeo, y en el rea este de la New London Survey, el tamao de las fami- lias de clase obrera constituye un grupo de frecuencias cuya media era 3.69 y la desviacin tpica sobre 1.7. Si la muestra hubiera sido slo de 1000, el error tpico de la estimacin habra sido 1.7/1000 = 0.06, que es suficientemente pequeo para muchos propsitos. El anlisis de un pequeo grupo como 1000 es suficientemente rpido, y el gasto y el trabajo de recoleccin no es muy grande; el nmero es tambin suficientemente grande para asegurar que todas las secciones son incluidas, y neutralizar errores debidos al azar en las tabulaciones. Conviene insistir en la importancia de la regla de igualdad de oportunida- des de inclusin necesitara ms nfasis, porque es fcil trasgredirla acciden- talmente. Por supuesto, si solo incluimos lo obvio o lo fcil, estamos limitan- do nuestro universo, yo siempre he intentado evitar esto con instrucciones estrictas para que todas las unidades seleccionadas, y no otras, puedan ser informadas (encuestadas); cuando una casa seleccionada se comprueba que esta deshabitada, se toma la casa siguiente o la de la izquierda. Teniendo en cuenta que una unidad numerada con el 1 puede ocupar tal posicin debido a ciertos atributos puede ser por ejemplo una casa en esquina el nmero de la lista comienza un poco despus del principio. Los japoneses, segn es conocido, comienzan con el nmero 500. En la primera encuesta de Mr. Hil- ton se introdujo un error por seleccionar para la entrevista al primero de cada grupo de 100 en los libros de la Oficina de Trabajo (Labourexchange), en vez de elegir a un parado actual de antemano. Me he dado cuenta que la ms lige- ra desviacin de la regla, puede traer serias complicaciones, introduciendo una tendencia desconocida. Es importante incluir cuestiones que puedan ser testadas desde otras fuen- tes. Los resultados de una encuesta municipal deben estar de acuerdo con los del Censo, las estadsticas de Educacin, etc., si no es as, quedan patentes los fallos en la organizacin de la muestra. En Reading, de todos modos, he usado la muestra para corregir la informacin pblica que me haban facilitado. La Autoridad Educativa me dio la media de asistentes, en vez del nmero de registrados en la escuela. No me propongo discutir la relacin de la informacin suministrada por la desviacin tpica con el problema inverso de inferir el universo, porque ha sido recientemente el tema de dos reuniones de la Sociedad Estadstica, la pri- mera de las cuales esta ya publicada, y porque es muy difcil versar sobre ello brevemente o de forma no matemtica. Slo dir para apoyar mi argumento que, a medida que hacemos ms grande la muestra, vemos cmo la estima- cin converge hacia lmites progresivamente ms pequeos hasta que llega a estabilizarse, y que el hombre comn confiar en su pertinencia, aunque el grado de confianza no sea equivalente al que proporcionan las suertes mate- mticas. LA APLICACIN DEL MUESTREO A LOS PROBLEMAS ECONMICOS... 203 Pasemos ahora por los casos donde no podemos catalogar el universo, o tener acceso a alguna unidad, o que tal vez no define el universo satisfacto- riamente, como es el caso de los precios al por menor. Aqu no tenemos teora de probabilidad para ayudarnos a contabilizar el error tpico de los resultados, pues la base completa de la teora descansa en suertes conocidas de inclusin o seleccin. Tal vez, hay una excepcin en la formacin de los nmeros ndices de precios, si podemos asumir que los cam- bios de precios no son correlativos con la facilidad para definir del artculo o la accesibilidad al registro de precios. Algunas veces podemos afirmar con alguna plausibilidad que estamos trazando un sistema aleatorio desde un gran universo, y que los objetos que tratamos de encontrar no son significativa- mente diferentes de los que nos eluden. Otra vez, podemos tener buenas razo- nes para pensar que la ausencia de informacin no se correlaciona con la medida de lo que deseamos medir. Por ejemplo he examinado recientemen- te las fichas de la New London Survey, con la intencin de dar cuenta del nmero y edades de nios en una familia, la edad de la madre y el status ocu- pacional del padre. En una proporcin considerable de las fichas, la edad de la madre no aparece y en muchos otros, se sospecha que es la edad aparente, de hecho, los investigadores fueron instruidos solo para insistir en la pregun- ta de la edad a personas por debajo de los 21 y con ms de 60. Hasta donde se puede suponer, la ausencia de informacin tuvo ms que ver con el celo o el tacto del investigador que con cualquier cosa relacionada con el nmero de hijos o la ocupacin del padre. Pero aqu, como sucede frecuentemente, en la tabulacin de las hojas devueltas, arroj luz sobre la adecuacin y la impar- cialidad de los datos. Las edades en torno a determinados nmeros no siem- pre son nmeros redondos, y esto fue lo que sucedi en cada nivel de ingre- sos que tom. Aquello pareca ser tosco e inexacto, pero no sesgado. Aparte de esto, los resultados mostraron regularidad en el incremento o disminucin de los nmeros al aumentar la escala de edad, y el tipo de diagramas que representaban los resultados mostraron los grados de semejanza y diferencia que caba esperar. La tabulacin es normalmente un trabajo tediosos y abu- rrido, pero tiene cierto inters ver las frecuencias que se acumulan en una tabla de doble entrada y observar como crecen de forma continuada indepen- dientemente del azar. Cuando los resultados toman la forma de una curva regular de frecuencias, y especialmente si tenemos razn para esperar una curva normal y la encontramos, tenemos razones para suponer que hemos medido satisfactoriamente una entidad real. As, la distribucin de los precios de cambio y sus logaritmos en una escala normal, proporciona un gran sopor- te acerca de la validez de un nmero ndice. En tales casos la contabilidad de un error tpico es razonable. Pero ante la ausencia de condiciones de muestreo puras, tenemos dudas de cmo est definida la cantidad que hemos medido satisfactoriamente. En general, practicar el muestreo de forma no regulada no es necesaria- mente intil pero slo puede producir resultados orientativos; su significacin es cuestin de juicio no de medida, y hay un gran riesgo de que el conjunto sea sesgado aunque no haya habido intencionalidad. 204 ARTHUR L. BOWLEY