Está en la página 1de 8

ESTADSTICA ESPAOLA Vol. 38, Nm. 141, 1996, pgs.

237 a 244

A cerca de la finitud en las poblaciones


por VICENTE MANZANO ARRONDO
Departamento de Psicologa Experimental Universidad de Sevilla

RESUMEN Las expresiones poblacin finita ypoblacin infinita son frecuentemente utiliiadas. Pero su uso no viene acompaado de una comprensin fundamentada de qu es lo que significan cada uno de estos trminos y en qu circunstancias puede considerarse a una poblacin finita o infinita. En este trabajo se pretende facilitar recursos prcticos para definirse acerca de la finitud de una poblacin, en el contexto del muestreo aleatorio simple.

Palabras clave.^ poblaciones finitas, poblaciones infinitas, muestreo. Clasificacin AMS: 62 D05.

1.

INTRODUCCIN

En teora del muestreo, al igual que en cualquier otro rea de conocimiento terico-matemtico, la preocupacin bsica no es la adecuacin de los modelos matemticos a las situaciones prcticas, sino la generacin de estos modelos bajo determinados supuestos. Debido a esta circunstancia, es cada vez ms frecuente

f^ ^ f 1l)Iti l l( ,i f^f'.^ti( )I ^

encontrar la expresin la prctica del muestreo (Salgado, 1990) como conjunto de conocimientos generados a raz de adecuar la teoria del muestrea a ios imperativos fcticos. Una de las puntas de este iceberg es el hecho de que si bien la teora del muestreo contempla poblaciones finitas e infinitas (el espacio muestral compuesto par infinitas tiradas de un dado, por ejemplo), en el caso de las investigaciones en cantextos sociales, lo ms que nos encantramos son grandes coiectivos humanas, pero estrictamente hablando no son poblaciones infinitas. Si no existiera ningn otro tipo de informacin, se deberia observar que ningn nvestgador social Clega a utilizar la expresin poblacin infinita, ni los algoritmos algebraicos que genera la teora del muestreo para el clculo de errores tpicos y tamaos de muestra en el contexto de estas pablaciones. Pero no es as. Tanto para el clculo del tamao de la muestra como para el proceso de estimacin de las funciones poblacionales, ios investigadores en ciencias sociales utilizan frecuentemente el recurso de las pablaciones de tamao infinito. Considerando la circunstancia de que, estrictamente habiando, no existen las poblaciones infinitas en ciencias sociales, el obviar este hecho puede Ilevar a consecuencias negativas. ^Qu consecuencias?: estimar tamaos de muestra, varianzas y errores incorrectos por sobreestimados, incrementando el coste global del estudo. ^En qu medida eC error es despreciable?: conforrne el tamao de la poblacin se acerque ms al infinito. No obstante, !o cerca o lejos que el tamao de una poblacn se encuentre de! considerado prcticamente infinito no es constante en cualquier situacin, sino que depende del contexto concreto: estimador, funcin poblacional a estimar, riesgos I y II, error de precisin o tamao del efecto o el modelo de muestreo. Se puede considerar que la utilizacin de expresiones de clculo bajo el supuesto de poblaciones de tamaos nfinitos, constituye una actitud conservadora, ya que tales expresiones san cotas superiores para sus homlogas en poblacianes finitas. No obstante, este comportamiento atenta claramente contra el criterio de tamar decisiones ptimas. En trminos del tamao de la muestra, se buscara una cantidad tal que consiga la mxima precisin con el mnimo coste (por ejemplo, Sukha#me, 1953; Raj, 19fi8; Cochran, 1976; Stuart, 1984; Kalton, 1987 o Salgado, 1990). Considrese que "EI costo de los procesos puede ser mucho ms determinante que cualquier consideracin tebrica" (Silva, 1993:142). En concreto, cabe sealar tres situaciones problemticas en relacin a la finitud de las poblaciones: 1. Existe una clara confusin entre la finitud de la poblacin y los modelos de muestreo con y sin reposcin. 2. EI hbito y la comodidad ailanan el camino para la utilizacin de las expresiones algebraicas que corresponden al contexto de las poblaciones infinitas. Estas

^C^f^RC'^^ I)E-. L,r\ F^I^I^(^L`I) E^-ti L:>S F'C)Fil..1ClOtiFti

23^^

expresiones son siempre ms fciles y cmodas de aplicar, gracias a que consideran menos elementos para el clculo y resultan ser ms breves. Considerando que la decisin sobre qu tcnicas estadsticas utilizar depende muchas veces de la comodidad de su uso (Lebart y otros, 1985) rns que a su adecuacin, resulta comprensible el que algunos investigadores caigan en la trampa de escoger las expresiones ms sencillas precisamente por su senciilez, inclusive cuando puede Ilegar a insistirse en ello desde la literatura especfica ( Kish, 1965; Veres, 1981).

3. Ya que, en la prctica social, no existen poblaciones con infinita cantidad de elementos, corren algunas informaciones acerca de a partir de qu tamaa puede considerarse una poblacin corno prcticamente infinita.

2.

^A PARTIR DE QU TAMAO UNA POBLACIN ES "PR,,CTICAMENTE"


INFINITA?

Si bien se ha sealado ya la inexistencia de pobiaciones estrictamente infinitas en el entorno social, puede ocurrir, no obstante, que ta poblacin cuente con un nmero de unidades tal que 1a diferencia entre los resultados que generan las expresiones para situaciones de finitud o infinitud sea despreciable. EI problema que surge entonces es ^Cundo una poblacin estrictamente finita puede ser considerada como prcticamente infinita?. Para responder a la pregunta con algn viso de utilidad, es necesario circunscribir las deducciones a un contexto concreto. Para ello, los contenidos que siguen se refieren a la estimacin de una rnedia aritmtica en el muestreo aleatorio simple. Esta decisin nos permitir expresar la infinitud prctica de las poblaciones en funcin del nivel de significacin y del error de precisin o radio del intervalo de estimacin.
Para ello, denominamos: nN n, N tamao de muestra para una poblacin finita tamao de muestra para una poblacin infinita tamao finito de la poblacin, y k

[^l

En principio, el supuesto "poblacin infinita" es asumible nicamente cuando la discrepancia

[ ti l ^^[>Itil l( > ! `+f'^^\t ^ I ^

No obstante, es razonable admitir una distancia dn^0 siempre que su valor no exceda aign umbrai b predeterminado como e! mximo asumible. Es decir, el calificativo "infinita" para una poblacin sera aceptabie nicamente cuando dn <_ S. Sin embargo, la distancia absoluta dn no es una buena medida para evaluar !a discrepancia, considerando su sensibilidad a los tamaos muestrales. Mejor estrategia es operar con un ndice relativo: la razn entre ambos tamaos (razn de similitud, k). De esta forma y dado que
0<nrv^n,

dividiendo todos los trminos entre n, ^y segn [1): 0<k_<1

De la expresin para el clculo def tamao de la muestra para la estimacin de medias en el muestreo aleatorio simple (1): N N-1 _ ____ + 1 n, N-1+n,, n^

nN

- k( N+ n,,, - 1 y -^

[2]

--^ N- k N= ( n., - 1) k--^ N=^ n,,, - 1)

k 1-k

Por otro lado, en el muestreo aleatorio simple para la estimacin de una media aritmtica, el tamao de la muestra se calcula segn:

n,;

Zt^ i2 a ep

donde Z,x,2 es la distancia estandarizada que corresponde a una probabilidad a, 6 es !a desviacin tipo poblacional y ep es el error de precisin o radio del intervalo de

(1) Las expresiones de clculo estn basadas en Azor n y Snchez Crespo t 1986), si bien pueden encontrarse en cualquier texto sobre muestreo.

A('E:RC^A [.)F^ l_A f^INITI!D E:ti LAS PC)f3l_ACIC)tiE^:S

estimacin. Incluyendo esta expresin en [2] e indicando el error de precisin estandarizado (Ze = ep 1 cs^ , se obtiene: N _ Zr2 _ 1
Z k k- 1 [3]

Para estudiar el comportamiento de [3] se requieren expresiones concretas para Z^,2 y para Z^. En el primer caso, los niveles de significacin ms usuales son .05 y .01 (por ejemplo, Rosnow y Rosenthal, 1989; Cohen, 1992; Manzano, 1997). Por otro lado, a la hora de traducir estos valores de probabilidad a distancias estandarizadas Za,,2 y si bien es habitual considerar la distribucin muestral normal, contemplaremos tambin el caso de total desconocimiento (acotacin de Chebyshev). Con ello, las distancias estandarizadas correspondientes se rnuestran en el cuadro 1. Cuadro 1 VALORES DE Z^,J2
Normal cx = .01 a = .05 2.5758 1.9600 Chebyshev 10.0000
4.4721

Con respecto a Ze, una estrategia satisfactoria es la consideracin de un error de precisin que se corresponda aproximadamente can 1/10 0 1/20 de la desviacin tipo (Manzano, 1996}, en cuyo caso y respectivamente, ^ podra acotarse entre .1 y.05
Tabla 1
N

TAMANOS POBLACIONALES "PRACTICAMENTE" INFINITOS Ze=.1 Ze=. 05 Normal Chebyshev Normal Chebyshev . 01 . 05 . 01 a-^. 05 . 05 . 01 . 05 . 01
3448 3874
4406

k
.90 .91 .92 .93 .94 .95 .96 .97 .98 .99

5962 6698
7618

17991 20212
22988

89991 101101
114988

13821 15527
17660

23876 26824
3050$

71990 80877
91987

359991 404434
459988

5091 6003 7280 9196 12389 18775


37932

8801 10379 12587 15899 21420 32461


65584

26558 31317 37980 47975 64633 97949


197896

132844 156651 189981 239975 323300 489948


989890

20402 24058 29177 36855 49652 75246


152027

35246 41562 50405 63669 85777 129991


262634

106271 125315 151978 191972 258629 391943


791879

531415 626650 759980 959974 1293297 1959941


3959857

^^^,T-^[^^Iti^t^^t^^^ t ^;F>^^tit^t ^^

Con los valores especificados para ias dos distancias estandarizadas implicadas en el clculo de un tamao para la muestra, la expresin (3) sumnistra los resultados que figuran en la tabia 1. En sta, se han considerado valores para k entre .99 y.9. Con eiio, se tiene por ejemplo que una poblacin de 728^ eiementos puede ser considerada ya como prcticamente infinita en el caso habitual de una estimacin de medias o proporciones con a=.OS, un nivel de exigenca moderado para la precisin (Ze=.1) y una razn k=.95.

3.

CONCLUSIONES

La observacn de 1a tabla 1 deberia llevar a la conclusin de que la consideracin de una poblacin finita como prcticamente infinita no se basa en una nica cantidad sna que sta depende de multitud de factores de los que hemos realizado una exposicin nicamente en el caso de la estimacin unitaria de medias en el muestreo aleatorio simple. Cabe esperar variaciones sensibles en otros contextos. La soiucibn canservadora no es recomendable aqu, ya que genera estimaciones de varianzas y decisiones sobre tamaos muestrales innecesariamente elevados, cuando existe informacin suficiente (expresiones de ciculo pertinentes} como para aspirar a una solucin ms cercana a ia ptima. Las consecuencias de la mencionada actitud canservadora son difcilmente evaluables. Un aspecto positivo es el aumento de la precisn en las estimaciones o disminucin de los errares asociados. No obstante, este supuesto efecto positivo slo es posible si el aumento en el nmero de unidades seleccionadas, con respecto al tamao ptimo, no viene acompado par una disminucin en la capacidad de control durante la investigacin. EI aspecto negatvo viene representado por un incrementa injustificado del coste total del estudio, en funcin de la distancia absoluta entre tamaos dn. Por ltimo, es recomendable acudir siempre a ias expresiones para tamaos finitas en ios estudios aplicados. Entre otras consecuencias, este hbito aumenta la probabilidad de canseguir un tamao ptimo de muestra. En cantraposicin, las expresiones de clculo son m^s complejas. No obstante, el tiempo implicado an baja el supuesto de realizar las operaciones con papel y ipiz, es despreciabie con respecto al tiempo tatal que exige el diseo de la investigacin.

^^('F:Rt^A Uf^- E.^^ FI^:I T'l'[) E-:!^ E_.^S E'OE3L^C 1OtiE ^

REFERENCIAS
AZORN, F. ; SNCHEZ CRESPO, J. L. (1986}. Mtodos y apl icaciones del muestreo . Coleccin Alianza Universidad Textos. Madrid: Alianza Editorial.

COHEN, J. (1992). Cosas que he aprendido ( hasta ahora). Anales de Psicologia, 8, 3-17.
CocHRAN, WILLIAM G. (1976). Tcnicas de muestreo. Mxico: Compaa Editorial Continental S.A. KALTON, GRAHAM (1987). Introduction to survey sampling. SAGE Paper. Beverly Hills: SAGE Publications, Inc. University

K^sH, L. (1965). Survey Sampling. New York: John Wiley & Sons.
LEBART, L.; MORINEAU, A.; Y F^NELON, .J. P .

(1985). Tratamiento estadstiCO de datos. Mtodos y programas. Barcelona: Marcombo.

MANZANO, V. (1996). Tamao ptimo de muestra en investigacin mediante encuestas. Fundamentos e implementacin de un sistema de ayuda a la decisin. Tesis doctoral no publicada. Facultad de Psicologa. Universidad de Sevilla. MANZANO, V. (1997}. Usos y abusos del error tipo I. Psicolgica. 18, 2, 153-169. RAJ, DES (1968). Sampling Theory. New York: MCGraw-Hill. RosNOw, R.L. y ROSENTHAL, R. (1989). Statistical procedures and the justification of knowledge in psychological science. American Psychologist, 44, 1276-1284. SALGADO CARRIN, Jos^ ANTONio (1990). La prctica del muestreo. En Ortega, E. {Ed.) Manual de investigacin comercial. Madrid: Pirmide. Pginas 344 a 377. SILVA AYAGUER, Luis CARLOS (1993). Muestreo para la investigacin en ciencias de la salud. Madrid: Daz de Santos.
STUART, ALLAN (1984) .

The Ideas of Sampling. High Wycombe (England): Char(1953). Sampling theory with applications .

ies Griffin & Co. Ltd.


SUKHATME, PANDURANG V .
^OWa: IOWa

State College Press. VERES, E. (198^1). Tamao muestral ptimo de maximizacin del valor esperado de un experimento. Estadstica espaola, 92,47-65.

f^ti 1;1C)lSTlf".^ f^^.tiPAtiOLA

ABOUT THE FINlTE {JR INFINITE POPULATiONS

SUMMARY The expressions finite population and infinite population they are frequently used. But its use does not come accompanied of a based comprehension of what is what mean each one of these terms and in what circumstances can be considered to an infinite or finite population. In this work we intend to facilitate practical resources to be defined about the finite or infinite population, on the simple random sampling context. Key words: finite populations, infinite populations, sampling. AMS Classification: 62 D45 .