Aplicación Del Muestreo PDF

TEXTO CLSICO
El texto de Arthur Bowley que presentamos a continuacin, fue publicado

en 1936 por la American Statistical Asociation, y su origen es una intervencin
oral expuesta en 1935, en el grupo de estudio de la Royal Statistical Society
britnica. No obstante, el lector tiene ante s uno de los primeros escritos donde
la encuesta estadstica se aborda con la terminologa moderna y donde apare-
ce el modo de calcular lo que ha dado en llamarse intervalos de confianza en
funcin de la probabilidad. Es tambin, uno de los primeros textos en los que
se deja a un lado los ejemplos con dados y cartas, para ilustrar los fundamen-
tos del muestreo con casos reales tomados de las encuestas inglesas sobre
pobreza y condiciones de vida de la clase obrera. En definitiva, podemos com-
probar la paternidad efectiva de Bowley en la metodologa de la encuesta esta-
dstica as como su papel en el trnsito de la incertidumbre que arrastraba el
margen de error hacia el optimismo posterior del intervalo de confianza
2
.
Arthur Bowley (1868-1957) haba estudiado matemticas, pero bajo la
influencia de Edgeworth y Marshall se orienta hacia los estudios de economa
La aplicacin del muestreo
a los problemas econmicos
y sociolgicos
1
ARTHUR L. BOWLEY
London School of Economics
EMPIRIA. Revista de Metodologa de Ciencias Sociales. N. 5, 2002, pp. 195-204.
1
BOWLEY, A. L.: The application of sampling to economic and sociological problems.
Journal of the American Statistical Asociation, September 1936, Vol. 31, n. 195.
Traduccin: Jos M. ARRIBAS. Departamento de Sociologa I, UNED, Madrid.
Agradezco al profesor Luis Castro Nogueira las sugerencia y mejoras introducidas.
2
Desrosieres apunta como Bowley hace de la imprecisin del margen de error un objeto res-
petable: el intervalo de confianza, pero lo situa en un texto de 1906: Presidential ardes to the
Economic Section of the British Association, Jornal of the Royal Statistical Society, pp. 540-
558. DESROSIRES A. La Politique des grands nombres. ditions la dcouverte, Paris, 1993, p.
275. Tambin Desrosieres 2002: El administrador y el cientfico: las transformaciones de la
profesin estadstica en ARRIBAS, J.M. y BARBUT, M., Estadstica y Sociedad, UNED Edicio-
nes, p. 143.
y sociologa. En 1915 comienza a impartir clases de Estadstica Econmica,
y en 1919 ocupa la primera ctedra de Estadstica de la Universidad de Lon-
dres. Miembro de la London School of Economics, ostenta puestos de res-
ponsabilidad hasta 1936 y es tambin, uno de los fundadores de la Interna-
tional Econometric Society.
Sus trabajos sobre la definicin y medida del producto nacional se utiliza-
ron para la realizacin de las primeras estimaciones oficiales y como estads-
tico redefini las tcnicas de muestreo, convirtindolas en norma de cientfi-
cos sociales e investigadores de mercados. Entre sus trabajos empricos, hay
que destacar, la encuesta sobre la vivienda de la clase obrera : Livelihood and
Poverty, publicada en 1915 y su trabajo, tal vez el ms importante: New Sur-
vey of London Life and Labour, realizado entre 1930-1935.
En Elements of statistics, publicado por primera vez en 1901, aunque con
sucesivas ediciones y ampliaciones posteriores, y en An elementari manual of
statistics de 1909 (tambin con sucesivas ediciones posteriores) ya haba
abordado el tema del muestreo a partir de experimentos que se presentan
como aplicaciones de la ley de los grandes nmeros y la ley del error
3
. En
estos textos, los fundamentos tericos estn ya desarrollados, aunque el
mtodo y la maquinaria tcnico-administrativa an no esta lista para la ela-
boracin de las grandes estadsticas del Estado. La metodologa de la encues-
ta estadstica representativa se construye cuando existe una base emprica
suficiente de naturaleza censal y problemas de suficiente calado poltico. La
utilizacin de los intervalos de confianza, por ejemplo, no aparecer como
resultado de profundos clculos matemticos sobre la curva de errores, sino
por la necesidad de persuadir a los responsables de la Administracin del
Estado ( con formacin jurdica, pero sin formacin matemtica) de la perti-
nencia del mtodo aleatorio, y en menor medida, a sindicalistas y trabajado-
res manuales (natural man en el texto).
La resistencia de la Administracin para aceptar el mtodo representativo
como sustitutivo de los recuentos censales es tan patente en el texto que con-
viene recordar los antecedentes del asunto. Aparte de los clculos que haba
hecho Laplace sobre la poblacin de Francia y las aplicaciones de la curva de
errores en astronoma, los estadsticos no iniciaron hasta muy avanzado el
siglo XIX, experiencias y reuniones cientficas con objeto de introducir el
mtodo aleatorio en la estadstica administrativa. A partir de 1895, el estads-
tico noruego Kiaer presenta comunicaciones sobre el mtodo representativo
en las reuniones del Instituto Internacional de Estadstica celebradas en Berna
196 ARTHUR L. BOWLEY
3
En 1906 utiliza el teorema del lmite central para demostrar que para muestras grandes
tomadas de una poblacin, las proporciones de las muestras se distribuan de forma aproxima-
damente normal, y en 1915 en Livelihood and Poverty, a propsito de la estimacin del error
de las muestras propone utilizar una estimacin mediante intervalos de ms o menos tres veces
el error tpico de la muestra que est ya muy cerca de lo que llamar intervalos de confianza
dos dcadas ms tarde. Vid. CORK, D. Review of Statistical Sampling, from Laplace to Neyman
en The History of the First American Census and the Constitucional Language on Censusta-
king: Report of a Workshop.
ese mismo ao, San Petesburgo en 1897 y Budapest en 1901 (donde Kiaer
muestra la carta de adhesin del USA Department of Labour ). En ellas los
estadsticos oficiales discuten acerca de la validez de los datos estadsticos
obtenidos a partir de pequeas muestras y por procedimientos aleatorios, no
alcanzando estos su reconocimiento definitivo hasta 1925. En 1909 en el
coloquio de la Asociacin Internacional de Estadstica, Edgeworth haba
abordado las cuestiones relativas a la aplicacin del clculo de probabilidades
a la estadstica con una amplia ponencia
4
, pero no es hasta el coloquio de
Roma cuando la Asociacin internacional acepta oficialmente la plena vali-
dez del mtodo aleatorio.
En el caso de Arthur Bowley, son las encuestas sobre las condiciones de
vida de la clase obrera las que alientan sus investigaciones sobre el mtodo
aleatorio
5
. En mayo de 1887, Charles Booth haba ledo en la Royal Statisti-
cal Society un informe sobre las condiciones sociales y econmicas de la
pobreza redactado a partir de una encuesta realizada en el East London cuyos
resultados fueron publicados en 17 volmenes entre 1889 y 1903. Bowley
buscar un umbral objetivo que de cuenta de la pobreza ms all de la simple
consideracin de los ingresos de la familia
6
, por ejemplo, la cantidad de calo-
ras necesarias para la supervivencia o lo que representa el coste necesario
para satisfacer las necesidades mnimas de una familia media. El mtodo de
Booth pareca ciertamente extensivo: estudio calle por calle de las condicio-
nes sociales de muchas familias obreras, mientras que las posteriores investi-
gaciones sern intensivas: menos familias entrevistadas y mayor informacin
sobre cada una de ellas. La encuesta de Booth utilizaba un mtodo indirecto:
un cuestionario que los inspectores educativos se encargaban de rellenar, al
estilo de las encuestas desarrolladas en Espaa por la Comisin de Reformas
Sociales, mientras que las encuestas de Bowley y sus colegas, realizadas entre
1914 y 1924, se hicieron mediante entrevistas directas, casa por casa. Pero lo
ms destacable es que la seleccin de los entrevistados se realiz utilizando
procedimientos aleatorios, entrevistando, por ejemplo, una de cada veinte
familias del rea seleccionada.
Las encuestas de Bowley hay que situarlas en el contexto de preocupacin
por el conflicto de clases y el hacinamiento de la clase obrera en las zonas
industriales inglesas, as como del nacimiento del Estado del Bienestar. En
esta situacin, el Estado comienza a intervenir los mercados de trabajo, regu-
LA APLICACIN DEL MUESTREO A LOS PROBLEMAS ECONMICOS... 197
4
EDGEWORTH, F. Y.: On the application of the calculus of probabilities to statistics IIS, XII
Session, Paris, 1909, pp. 505-551.
5
Habra que sealar tambin los importantes avances de la estadstica rusa durante el per-
odo 1885-1917 en los zemstos. La reflexin de los estadsticos rusos y la calidad de las encues-
tas durante ese perodo por la asignacin ptima utilizando estratos que A.G. Kovalevskij pre-
senta en 1924, diez aos antes que Neyman. Vase al respecto los interesantes trabajos de
Martine MESPOULET: Du tout la partie. Lge dor du sondage en Russie (1885-1924). Revue
detudes comparatives Est-Ouest, vol. 31, n. 2, pp. 5-49.
6
Booth publica los datos sobre cantidades y precios de la comida consumida por diferentes
familias pertenecientes a distintos grupos sociales, mientras que en estudios posteriores como
el de Bowley fijan una dieta mnima de 3.000 caloras que marcara el umbral de la pobreza.
lando salarios, jornadas y condiciones laborales, pero tambin introduciendo
el seguro de desempleo.
En 1923 el Ministerio de Trabajo britnico necesitaba una fotografa deta-
llada de aproximadamente un milln doscientos cincuenta mil trabajadores
que aparecan registrados como parados, y John Hilton, director de Estadsti-
cas del Ministerio de Trabajo
7
, comienza a examinar el 27 de enero de 1923
una de cada tres solicitudes
8
de ayuda al desempleo para conocer las carac-
tersticas de los solicitantes, a partir de los ficheros del Employment Exchan-
ges as como de otros documentos con informacin relevante. Realizaron el
anlisis sobre 372.875 personas y a pesar de que la tabulacin de los datos fue
difcil y costosa, el informe final clasific a los solicitantes, por edad, sexo,
estado civil, industria, nmero de personas que dependan del parado, nme-
ro de das que haban cobrado subsidio, das cotizados, etc. No obstante, el
informe, no aclaraba an ciertos aspectos claves sobre la situacin de los soli-
citantes del subsidio: Solo una entrevista especial con el solicitante dir
Hilton poda facilitar la informacin que se deseaba obtener
9
. Para el
siguiente informe, adems de las entrevistas directas se procedi, bajo la reco-
mendacin de Bowley, a analizar uno de cada 10.000 casos.
Estamos pues ante el nacimiento de la encuesta estadstica moderna: utili-
zan muestras seleccionadas mediante procesos aleatorios, obtienen informa-
cin de manera directa mediante entrevista personal a los sujetos de estudio,
depuran el aparato matemtico derivado de la aplicacin del clculo de pro-
babilidades demasiado cargado de ejemplos tericos y se inicia el proceso
que conduce a la legitimacin del mtodo por parte de la ciencia y el Estado.
Hay que sealar, no obstante, que las encuestas se realizaron a partir de
1923 y el texto que presentamos se publica por la revista de la Asociacin
Americana de Estadstica en 1936. En las ediciones de esos aos no hay en su
manual Elements of Statistics un captulo sobre teora muestral tal como hoy
lo conocemos: clculo del tamao de la muestra, intervalos de confianza, etc.
ni se expone claramente el asunto de la confianza algo que seguramente
est ms relacionado con el desarrollo de la actividad aseguradora y el inters
de esos aos por la probabilidad subjetiva
10
. No obstante, esta exposicin de
1935/6 es perfectamente clara desde el punto de vista matemtico. Nos dice
que lo importante es el universal 1/n donde n es el nmero de unidades
incluidas en la muestra, le sigue en importancia p, la proporcin del atribu-
to en el universo de estudio, y S, la desviacin tpica, cuando estamos consi-
derando variables. Por ltimo nos pone un ejemplo de la New London Survey
7
HILTON, J.: Enquiry by sample: An experiment and its results. Journal of the Royal Sta-
titical Cociety, Vol. LXXXVII, 1924, pp. 544-570.
8
(The claim form con firma y fecha como evidencia de que contina desempleado).
9
Ibidem, p. 545.
10
Bruno de FINETTI comienza a madurar sus ideas sobre la probabilidad subjetiva a partir de
1930. Su primer artculo data de 1931 Probabilismo: saggio critico sulla teoria delle probabi-
lit, al que siguen otros como Sul significato soggettivo della probabilit de 1931 o La previ-
sin: ses lois logiques, ses sources subjectives de 1935.
en el que estima el intervalo de confianza para un porcentaje con + una , dira-
mos hoy utilizando la terminologa moderna, o tambin podramos decir: con
una probabilidad del 68,26%.
JOS M. ARRIBAS MACHO
Departamento de Sociologa I
Teora, Metodologa y Cambio Social, UNED
* * *
Desde que se discutieron los mtodos de muestreo en la ltima reunin de
la Sociedad Estadstica, podra esperarse que no hay nada nuevo que decir
sobre el asunto, puesto que la mayor parte de mis trabajos tericos sobre los
aspectos matemticos de la cuestin son accesibles a los estudiantes desde
hace tiempo
11
, y los resultados de las investigaciones en las que he participa-
do directamente o he cooperado, han sido publicados
12
.
La teora del muestreo es correlativa a la teora matemtica de la probabi-
lidad, al menos, en la parte que se aborda en Eleccin y azar de Whitworth.
Un universo se simboliza por una urna o un grupo de urnas que contienen
determinados nmeros de bolas de diferente color; se disean una o ms
selecciones de acuerdo con normas definidas, y se pregunta cual es la relacin
entre la proporcin del color en la seleccin y en el universo. El problema
tiene dos caras, podemos conocer la proporcin en el universo, como cono-
cemos el contenido de una baraja, y preguntar cual es la esperanza de una
jugada determinada en la teora del bridge, o podemos desear inferir las
propiedades de un universo desconocido desde el estudio de uno o ms ejem-
plos. En el campo de la investigacin, esto ltimo es el problema.
Conviene distinguir los problemas biolgicos de los sociolgicos. En el
examen de las especies, el universo puede ser considerado ilimitado y no esta-
mos interesados tanto en las proporciones que tienen diferentes caractersti-
cas, como en la variacin de los atributos medibles. En los estudios de Men-
del, de todos modos, es la proporcin lo que importa, pero todava estamos
tratando con un universo hipottico e ilimitado. Las tablas de vida tambin
remiten a un universo hipottico. La mayor parte de las investigaciones rela-
cionadas con la probabilidad antes de 1900, eran de este tipo. Quetelet no
estuvo tan interesado en los estudios estadsticos como en el hallazgo de ilus-
traciones de la ley normal del error.
Por otro lado, estamos interesados en la investigacin de la estructura
numrica de un universo real limitado, o poblacin, que es, tal vez, la mejor
11
Se refiere a Elements of Statistics, London King and Son, cuya primera edicin es de 1901
y a An Elementary manual of statistics, London, Macdonal and Evans cuya primera edicin es
de 1909.
12
Los ms importantes son Earners and Dependants in English Towns in 1999. Econmi-
ca 1921 n. 1, London School of Economics and Political Science, Livelihood and Poverty
(1915).
denominacin para nuestro propsito. Nuestros problemas son claramente,
inferir la poblacin desde la muestra. El problema es estrictamente anlogo a
la estimacin de la proporcin de las bolas de diferentes colores en una urna
a partir de una o ms tiradas.
La primera aplicacin de este principio en una investigacin original se
hizo, al menos hasta donde yo conozco, en 1912, cuando un grupo de perso-
nas de Reading, me preguntaron cmo usar de la mejor forma posible una
suma de dinero destinada a investigar las condiciones econmicas de la clase
obrera de esa ciudad.. Recomend la aplicacin del simple mtodo del mues-
treo para obtener resultados vlidos en el tiempo y con el dinero y dems
recursos disponibles. A continuacin se publicaron las investigaciones en
Livelihood and Poverty y en Has Poverty Diminished?, en New Survey of
London Life and Labour; en Merseyside y en Work and Wealth in a Modern
Port donde el profesor Caradog Jones y Mister Ford siguen un idntico plan.
Como es bien conocido, el proceso de seleccin consisti en tomar una lista
de casas del rea, de acuerdo al orden alfabtico de calles, y seleccionar una
de cada n casas colocadas en ese orden. Este es literalmente el mtodo de
muestreo estratificado que se corresponde con el esquema de Poisson y que
consiste en seleccionar bolas de un nmero de urnas en el cual el color esta
en proporciones diferentes.
Encontramos otro grupo de casos cuando el universo es un fichero de car-
tulinas u hojas en las cuales hay datos relativos a personas, inquilinos de
viviendas u otras entidades. En 1915, obtuve de la oficina del Censo extrac-
tos relativos a una familia de cada cincuenta, tomadas en el orden de las cedu-
las de habitabilidad de Boroughs. La clasificacin resultante de los miembros
de las familias de clase obrera fue publicada en Econmica en 1921. En los
aos siguientes, el profesor Hilton aplic un mtodo similar de seleccin en
sus estudios sobre desempleados. De las hojas de los libros de seguros del
Labor Exchanges se seleccionaron una de cada cien y los detalles fueron
amplificados con entrevistas directas al demandante. Recomiendo una atenta
lectura del articulo de Mr Hilton en el Statistical Journal de 1924 y de la dis-
cusin que hay en l. Ha habido muchas otras investigaciones de similar
carcter dirigidas y publicadas por el Ministerio de Trabajo. Las autoridades
del Censo todava no estn persuadidas del uso de este mtodo, con el resul-
tado de que an estamos esperando alguna de las ms importantes tabulacio-
nes del Censo de 1931. No deben conocer, segn creo, que los japoneses,
cuando una gran parte de las tabulaciones fueron destruidas en Tokio por el
terremoto de 1923, tomaron una muestra en la proporcin de uno cada 1000
nmeros 500, 1500, etc. hasta 11 millones de hojas de empadronamiento y
publicaron los resultados por edad y grupos segn el sexo, tamao de la fami-
lia, etc. En 1924, comprobaron que las discrepancias entre la muestra y los
resultados censales completos obtenidos fueron insignificantes, y dentro de
los mrgenes esperados segn la teora
13
.
13
Ver Boletn del Instituto Internacional de Estadstica, Tomo XXV, Deuxieme Libracin,
p. 121. Reunin de Tokio, 1930.
Puedo mencionar otras dos investigaciones con muestras controladas en
las cuales he estado implicado. En el comienzo de la guerra enviaron un comi-
t de voluntarios a examinar los efectos inmediatos del desempleo. Me incor-
por, segn creo, el 5 de agosto de 1914. Enviamos formularios a todas las
empresas de Londres incluidas en el Censo de la produccin, en la proporcin
de uno sobre veinte de la lista total de factoras, talleres y oficinas de la ciu-
dad. La cuestin principal era saber cuanta gente estaba empleada el 21 de
julio, cuanta el 21 de agosto, cuantos estaban alistados, cuantos trabajaban a
tiempo parcial, etc. Hicimos pblicos los resultados el 29 de agosto. Este pro-
cedimiento fue realizado por la Cmara de Comercio (Board of Trade), sema-
nal o mensualmente y lo extendi para el conjunto del pas, sirviendo para
formar la base de los estudios de reclutamiento, exenciones, etc. Y si recuer-
do correctamente, en parte debido a una simple muestra. Para completar este
relato personal en 1917-18, el Ministerio de Alimentacin recibi mensual-
mente cuestionarios de miles de panaderos de todo el pas seleccionados a
partir de una muestras sistemtica, en los que se preguntaba sobre los stocks
y el uso de la harina, con objeto de comprobar el efecto del racionamiento
voluntario y determinar si era suficiente el abastecimiento de cereales. Duran-
te el bloqueo submarino de 1917, cuando las reservas alcanzaban tan slo
para unas pocas semanas y la cosecha estaba a varios meses vista, la situacin
era crtica.
Una muestra es, no obstante, de escasa utilidad, a no ser que conozcamos el
universo, y tengamos algn medio de juzgar esto con precisin. La naturaleza
del universo difiere mucho, desde este punto de vista, segn el caso. En el ejem-
plo japons el universo eran las viviendas a partir de las cuales se realiz el
censo. La investigacin del desempleo tiene un universo mejor y ms definido:
las solicitudes nominativas que hacen las personas sin seguro para obtener sub-
sidios. En las encuestas municipales, la principal definicin era la de las casas
habitadas enumeradas en una lista accesible, con la escueta etiqueta : ocupado
por personas designadas como clase obrera bajo ciertas condiciones de clasifi-
cacin. La cuestin fundamental es que el universo siempre implica la exis-
tencia de una lista de unidades o sus equivalentes. Esta lista, a veces no se
corresponde exactamente con el universo que realmente deseamos investigar;
por ejemplo, nosotros podemos estar interesados en personas desempleadas
independientemente de que tengan seguridad social o no. A veces, est limita-
da en muchos casos por la inclusin de una clusula como unidades sobre las
que puede obtenerse la informacin. La importancia de esto es evidente si
estamos jugando con presupuestos de gasto. Cuando el nmero de unidades
definido para cada informacin necesaria es relativamente pequeo, podemos
considerar el mximo efecto de su exclusin; por ejemplo, en las ciudades
encuestadas, podemos computar el efecto en el porcentaje clasificado como
pobreza con la presuposicin de que todo o nada de lo excluido estaba debajo
de la lnea de pobreza, o asumir que la proporcin era la misma en lo descono-
cido que en lo conocido; o podemos usar conocimientos complementarios para
hacer una estimacin aproximada. Pero en alguno de estos planes perdemos la
posibilidad de medir la desviacin tpica u otra desviacin de lo estimado.
Esta posibilidad depende primariamente de que cada una de las unidades
definidas tenga la misma probabilidad de ser incluida, lo que depende de la
existencia de un universo previamente definido y catalogado. De esto hay
una comparacin en Econmica n. 1 realizada por Miss Hoog sobre el
nmero de personas dependientes de una mujer, a partir de los informes
municipales, donde el universo est definido; y otros informes espordicos
en los que el universo est definido de forma imperfecta en algunos casos
con una fuerte tendencia a incluir mujeres con personas a su cargo. Cuan-
do tenemos asegurado lo esencial: que el universo est bien definido y todos
los elementos tienen la misma oportunidad de ser incluidos, o que las posi-
bilidades difieren en una forma conocida de una seccin a otra, como se hizo
con los factores de muestreo en la New London Survey, entonces, el clculo
de la desviacin tpica depende completamente de la frmula matemtica, la
cual difiere si la seleccin se ha hecho de forma aleatoria o estratificada, etc.,
y si los atributos o las variables no estn bien definidos. En esta frmula me
limito a una o dos puntualizaciones. En mi experiencia, el factor mas impor-
tante es el universal 1/n donde n es el nmero de unidades incluidas en la
muestra. Lo siguiente en importancia es p, la proporcin que tiene en el uni-
verso el atributo en cuestin, o s, la desviacin tpica cuando estamos consi-
derando variables. Si tomamos simplemente pq/n o s/n, erramos usualmen-
te en sobreestimar la desviacin tpica de nuestra estimacin. Por la estratifi-
cacin se reduce el error, como por el hecho de que el universo sea finito, as
como con la introduccin de controles en la muestra representativa. En ningu-
na de las investigaciones en las cuales he estado implicado, o en los experi-
mentos artificiales que he realizado, estos factores han resultado de gran
importancia, salvo por lo que respecta a la infraestimacin del error. Pero, por
supuesto, hay casos donde incrementan la precisin considerablemente y
entonces, los resultados deben ser estimados y facilitados segn la frmula.
Qu tamao debe tener n ? Dado que el trabajo de tabulacin crece ms
rpidamente que n debido entre otras cosas a la gran dificultad de compro-
bar el trabajo, que es importante reducir gastos, y todava ms importante,
ganar tiempo, debemos estar preparados para responder a esta cuestin. Pode-
mos formarnos una idea preliminar de la magnitud de p o s en el universo, y
podemos decidir que precisin deseamos obtener. Si esperamos que p sea
alrededor de 0.3 y deseamos un error tpico de la estimacin ms pequeo de
0.01, la respuesta es de naturaleza 30 + 1 por ciento, entonces la solucin es:
0.01 = pq/n, de modo que n = 2.100.
En la New London Survey, n era alrededor de 30.000, y el porcentaje de
familias de clase obrera en situacin de pobreza podra estar entre 9.8+ 0.17,
al menos por lo que respecta al error debido a la muestra. La muestra fue cier-
tamente tan grande como result necesario, porque no tiene sentido trabajar
con los peniques cuando las libras son inciertas. No obstante, las diferentes
definiciones, la ambigedad de la definicin de Booth, la aparicin de fichas
incompletas en los retornos y su dudosa validez en algunos casos, da ocasin
para pensar en un lmite de duda ms amplio que este 0.17.
Sugiero que 1000 es frecuentemente un nmero razonable para n, pensan-
do, por supuesto, que no puede establecerse ninguna regla. Esto da un error
tpico de p de 0.014 o 30 + 1.4 por ciento cuando p = 0.3, que puede ser redu-
cido por estratificacin. En mi experiencia el error tpico de la variable es
pequeo, y en el rea este de la New London Survey, el tamao de las fami-
lias de clase obrera constituye un grupo de frecuencias cuya media era 3.69 y
la desviacin tpica sobre 1.7. Si la muestra hubiera sido slo de 1000, el error
tpico de la estimacin habra sido 1.7/1000 = 0.06, que es suficientemente
pequeo para muchos propsitos.
El anlisis de un pequeo grupo como 1000 es suficientemente rpido, y
el gasto y el trabajo de recoleccin no es muy grande; el nmero es tambin
suficientemente grande para asegurar que todas las secciones son incluidas, y
neutralizar errores debidos al azar en las tabulaciones.
Conviene insistir en la importancia de la regla de igualdad de oportunida-
des de inclusin necesitara ms nfasis, porque es fcil trasgredirla acciden-
talmente. Por supuesto, si solo incluimos lo obvio o lo fcil, estamos limitan-
do nuestro universo, yo siempre he intentado evitar esto con instrucciones
estrictas para que todas las unidades seleccionadas, y no otras, puedan ser
informadas (encuestadas); cuando una casa seleccionada se comprueba que
esta deshabitada, se toma la casa siguiente o la de la izquierda. Teniendo en
cuenta que una unidad numerada con el 1 puede ocupar tal posicin debido a
ciertos atributos puede ser por ejemplo una casa en esquina el nmero de
la lista comienza un poco despus del principio. Los japoneses, segn es
conocido, comienzan con el nmero 500. En la primera encuesta de Mr. Hil-
ton se introdujo un error por seleccionar para la entrevista al primero de cada
grupo de 100 en los libros de la Oficina de Trabajo (Labourexchange), en vez
de elegir a un parado actual de antemano. Me he dado cuenta que la ms lige-
ra desviacin de la regla, puede traer serias complicaciones, introduciendo
una tendencia desconocida.
Es importante incluir cuestiones que puedan ser testadas desde otras fuen-
tes. Los resultados de una encuesta municipal deben estar de acuerdo con los
del Censo, las estadsticas de Educacin, etc., si no es as, quedan patentes los
fallos en la organizacin de la muestra. En Reading, de todos modos, he usado
la muestra para corregir la informacin pblica que me haban facilitado. La
Autoridad Educativa me dio la media de asistentes, en vez del nmero de
registrados en la escuela.
No me propongo discutir la relacin de la informacin suministrada por la
desviacin tpica con el problema inverso de inferir el universo, porque ha
sido recientemente el tema de dos reuniones de la Sociedad Estadstica, la pri-
mera de las cuales esta ya publicada, y porque es muy difcil versar sobre ello
brevemente o de forma no matemtica. Slo dir para apoyar mi argumento
que, a medida que hacemos ms grande la muestra, vemos cmo la estima-
cin converge hacia lmites progresivamente ms pequeos hasta que llega a
estabilizarse, y que el hombre comn confiar en su pertinencia, aunque el
grado de confianza no sea equivalente al que proporcionan las suertes mate-
mticas.
Pasemos ahora por los casos donde no podemos catalogar el universo, o
tener acceso a alguna unidad, o que tal vez no define el universo satisfacto-
riamente, como es el caso de los precios al por menor.
Aqu no tenemos teora de probabilidad para ayudarnos a contabilizar el
error tpico de los resultados, pues la base completa de la teora descansa en
suertes conocidas de inclusin o seleccin. Tal vez, hay una excepcin en la
formacin de los nmeros ndices de precios, si podemos asumir que los cam-
bios de precios no son correlativos con la facilidad para definir del artculo o
la accesibilidad al registro de precios. Algunas veces podemos afirmar con
alguna plausibilidad que estamos trazando un sistema aleatorio desde un gran
universo, y que los objetos que tratamos de encontrar no son significativa-
mente diferentes de los que nos eluden. Otra vez, podemos tener buenas razo-
nes para pensar que la ausencia de informacin no se correlaciona con la
medida de lo que deseamos medir. Por ejemplo he examinado recientemen-
te las fichas de la New London Survey, con la intencin de dar cuenta del
nmero y edades de nios en una familia, la edad de la madre y el status ocu-
pacional del padre. En una proporcin considerable de las fichas, la edad de
la madre no aparece y en muchos otros, se sospecha que es la edad aparente,
de hecho, los investigadores fueron instruidos solo para insistir en la pregun-
ta de la edad a personas por debajo de los 21 y con ms de 60. Hasta donde
se puede suponer, la ausencia de informacin tuvo ms que ver con el celo o
el tacto del investigador que con cualquier cosa relacionada con el nmero de
hijos o la ocupacin del padre. Pero aqu, como sucede frecuentemente, en la
tabulacin de las hojas devueltas, arroj luz sobre la adecuacin y la impar-
cialidad de los datos. Las edades en torno a determinados nmeros no siem-
pre son nmeros redondos, y esto fue lo que sucedi en cada nivel de ingre-
sos que tom. Aquello pareca ser tosco e inexacto, pero no sesgado. Aparte
de esto, los resultados mostraron regularidad en el incremento o disminucin
de los nmeros al aumentar la escala de edad, y el tipo de diagramas que
representaban los resultados mostraron los grados de semejanza y diferencia
que caba esperar. La tabulacin es normalmente un trabajo tediosos y abu-
rrido, pero tiene cierto inters ver las frecuencias que se acumulan en una
tabla de doble entrada y observar como crecen de forma continuada indepen-
dientemente del azar. Cuando los resultados toman la forma de una curva
regular de frecuencias, y especialmente si tenemos razn para esperar una
curva normal y la encontramos, tenemos razones para suponer que hemos
medido satisfactoriamente una entidad real. As, la distribucin de los precios
de cambio y sus logaritmos en una escala normal, proporciona un gran sopor-
te acerca de la validez de un nmero ndice. En tales casos la contabilidad de
un error tpico es razonable. Pero ante la ausencia de condiciones de muestreo
puras, tenemos dudas de cmo est definida la cantidad que hemos medido
satisfactoriamente.
En general, practicar el muestreo de forma no regulada no es necesaria-
mente intil pero slo puede producir resultados orientativos; su significacin
es cuestin de juicio no de medida, y hay un gran riesgo de que el conjunto
sea sesgado aunque no haya habido intencionalidad.

Aplicación Del Muestreo PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Aplicación Del Muestreo PDF

Cargado por

Copyright:

Formatos disponibles

TEXTO CLSICO

El texto de Arthur Bowley que presentamos a continuacin, fue publicado

También podría gustarte