Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Blalock Hubert - Estadistica Social PDF
Blalock Hubert - Estadistica Social PDF
ESTADISTICA
SOCIAL
GB
¿0 ANIVERSARIO
T ítulo original:
Social Statistics
© 1960, 1972, Me Graw-Hill, Inc. Nueva York
D . R . © 1966, F o n d o d e C u l t u r a E c o n ó m ic a
D. R. © 1986, F o n d o d e C u l t u r a E c o n ó m ic a , S. A. d e C. V.
C arretera PicachoA jusco 227; 14200 México, D. F.
ISBN 968-16-0135-1
Im preso e n México
A
An n , S u s ie
y K atie
E ste lib r o h a sid o e s c rito fu n d a m e n ta lm e n te p a r a aq u e llo s e s tu
d ia n te s d e sociología, ta n to los y a titu la d o s c o m o lo s q u e a ú n
n o lo e s tá n , q u e se p ro p o n g a n d e d ic a rs e a la in v e stig a ció n social.
D u ran te los doce años tran sc u rrid o s desde que apareció la p ri
m era edición, ta n to el nivel de p rep aració n com o la com plejidad
de la estad ística ap licad a h a n experim entado u n a m ejo ría consi
derable, n o sólo en el cam po de la sociología, sino e n los de la
ciencia política, la antropología, la geografía y el tra b a jo social.
A p e sa r de ello, u n a ab ru m a d o ra m ayoría de los estudiantes, o
de los q ue ejercen en estos terren o s, carecen de la necesaria
b ase m atem ática que les p erm ita o b ten er p len a v en taja de la bi
blio g rafía técn ica sobre estad ística, m atem ática y econom etría,
cuyos m ateriales au m en ta n rápidam ente. T eniendo e n m en te tales
dato s básicos h a sido escrito este texto, tra ta n d o de evitar, h asta
donde es posible, la s derivaciones m atem áticas, bastan d o u n a
rá p id a revisión de ciertos principios algebraicos, listados en el
A péndice 1, p a ra q ue el estu d ian te m edio obtenga u n a p re p a ra
ción suficiente. Aun cu an d o n o re su lte n ecesario e n u n p rim e r
cu rso de estad ística p o n e r de relieve dichas derivaciones m atem á
ticas, el a u to r está convencido de la necesidad de en te n d e r p e r
fectam en te ciertas ideas básicas y fundam entales so b re las que
se asien tan los prin cipios de la deducción estadística. Tal cosa
re s u lta ind isp en sab le si h a de lograrse algo m ás que u n conoci
m ien to lim itad o a "re c e ta s” estadísticas. H em os pu esto p o r ello
especial in teré s en la lógica q u e fu n d a m e n ta la deducción esta
dística, incluyendo asim ism o u n capítulo relativo a la p robabili
dad, en ta n to se h a p re sta d o m en o r atención a m ateria s m ás o
m enos ru tin a ria s estu d iad as e n textos elem entales.
Uno de los p roblem as m ás difíciles e n la enseñanza de la esta
dística ap licad a es el de lo g rar in c ita r a los estudiantes, de m a
n e ra q u e éstos su p eren su te m o r a las m atem áticas y ap ren d an
a ap lica r la estad ística e n su s p ro p io s cam pos de in terés. P or
e sta ú ltim a razón el a u to r n o h a in te n ta d o c u b rir u n a gam a am
p lia de aplicaciones, eligiendo p o r el co n tra rio ejem plos de in te
rés fu n d am en tal p a ra los sociólogos. T am bién h a escogido o tro s
ejem plos de cam pos fronterizos de la sociología, tom ados de te
rren o s tales com o la psicología social, el tra b a jo social y la con
d u cta política. E n la m ayoría de los casos cada nuevo tem a h a
sido ilu stra d o con u n solo ejem plo, p o r su p o n er que m uchos
e stu d ian tes p e rd erían el hilo básico del razonam iento si se u tili
zasen m uchos de ellos p a ra ilu s tra r u n punto. Se proporcionan,
sin em bargo, ejem plos adicionales b a jo la fo rm a de ejercicios
q ue ap arecen al final de cada capítulo. E n general h a tra ta d o
el a u to r de lo g rar u n equilibrio razonable e n tre la conveniencia
d e estab lecer los principios básicos e n fo rm a ta n clara y concisa
com o re su lte posible, y la necesidad de re p e tir algunas de las
ideas m ás dificultosas cada vez que exam ina u n nuevo tem a.
H a sta donde es posible, las ideas nuevas h an sid o p resen tad as
grad u alm en te y —lo q u e es igualm ente im p o rtan te— se h a n he
cho esfuerzos p a ra que cada nuevo tem a quede relacionado con
los que h an p reeedido. Al h acerlo así se tuvo p re se n te la m eta
fun d am en tal, co nsistente en b rin d a r u n a apreciación de las sem e
janzas básicas que fu n d am en tan m uchas de las p ru e b as (te sts)
y m ediciones m ás com únm ente usadas.
Casi to d as las sugerencias que h e recibido de p erso n as deseo
sas de ay u d ar a m e jo ra r la p rim e ra edición se re fería n m ás a la
conveniencia de au m en ta r que a la de re d u cir el libro, dando a
en ten d e r q ue m uchos de los tem as trata d o s originalm ente debe
ría n ser exam inados m ás técnicam ente. E n m i opinión, ta n to los
sociólogos com o los estudiosos de ciencias políticas, en p artic u la r,
precisan verse m ás expuestos, ta n to a una bibliografía de m ayor
nivel técnico so b re diseños experim entales, com o a procedim ien
tos p a ra el u so de ecuaciones sim ultáneas relacionadas con la
investigación n o experim ental. R esultó claro q u e si se agregaban
estos m ateriales al texto original, éste p e rd e ría su atra ctiv o com o
in tro d u cció n ad ecuada p a ra los estu d ian tes que asp ira n a la m aes
tría en ciencias sociales. Se resolvió, pues, que los diseños expe
rim entales, el análisis de facto res y los m étodos de ecuaciones
sim ultáneas, así com o o tro s tem as m ás avanzados, serían tra ta
dos en u n tex to separado, a cargo de dos de m is colegas: Lewis
F. C árter y K rishnan N am boodiri.
Se incluye en el texto cierto n ú m ero de secciones, p árrafo s
y ejercicios que, o bien son conceptualm ente difíciles o p resupo
nen q ue el estu d ian te posee cierta fam iliaridad con tem as cubier
to s en cursos acerca de los m étodos de investigación. E stas p a r
tes del tex to h a n sido señaladas con asteriscos (* ), y pueden ser
leídas sin d eten erse en ellas, o b ien elim inadas del todo. Los
in stru cto re s q u e utilicen el tex to en cursos de u n sem estre
p o d rá n in d icar a los estu d ian tes la conveniencia de o m itir dichos
m ateriales.
Se h a llevado a cabo u n a leve revaluación e n los aspectos téc
nicos, em p ero sin cam b iar la e stru c tu ra b ásica del texto. Hay
ciertas m odificaciones en la sección relativa a la estad ística des
criptiva, sección a la que el a u to r h a añadido discusiones sobre
supuestos y conceptos básicos, confiando así en a c la ra r la rela
ción en tre los m odelos estadísticos y el m undo re al con el que
el científico social h a de tra ta r. Además de estos cam bios, la
p resen te edición contiene discusiones acerca de diversos proce
dim ientos, tests y m ediciones que h an venido siendo usados cada
vez m ás d u ra n te la década de 1960-1969.
El cap ítu lo ix, sobre la probabilidad, h a sido am pliado m edian
te el exam en de p erm u tas, diagram as e n árbol, T eorem a d e Ba
yes y cálculos relacionados con las probabilidades condicionales
y la noción de valores previstos. T am bién al capítulo x, q u e in
cluye u n a explicación d e la distribución binom ial, h a agregado
el a u to r u n a breve discusión de dicha d istribución binom ial, la
distrib u ció n h ipergeom étrica y la distribución de Poisson. E stas
agregaciones facilitarán la transición a o tro s textos,^orientados
específicam ente a la estad ística n o p aram étrica.
E l a u to r h a au m entado asim ism o el espacio dedicado a técnicas
n o p aram étricas, incluyendo el test de F riedm an p a ra análisis
recíprocos de fluctuaciones con o rd e n ; gam m a y dyx, com o m edi
das de asociación o rd in a l; u n te st p a ra la interacción relativa a la
d iferencia de diferencias de proporciones, y la norm alización en
el caso de procedim ientos con escala nom inal. El lecto r encon
tr a r á adem ás u n a discusión am pliada acerca de las propiedades
de las v arias m edidas ordinales y técnicas d e divisibilidad con
escalas ordinales.
De m an era análoga h a sido am pliado el com entario de los acer
cam ientos p aram étricos p a ra incluir en él la discusión de los
supuestos p a ra el m odelo lineal general, cubriendo adem ás el
acercam iento de la variab le sim ulada com o perspectiva altern a
en el análisis de la covariación. T am bién se h an agregado los
principios esenciales básicos d e la teo ría que fu n d am en ta el uso
de com binaciones lineales, aplicándola a la discusión del e rro r
n o rm al de la m edia, la diferencia de m edias, la diferencia de las
diferencias de p roporciones y el em pleo d e com paraciones o rto
gonales en el caso de m u estras m últiples.
E n u n esfuerzo p a ra a y u d a r al lecto r en la apreciación del cua
d ro global, el a u to r h a incluido u n a ta b la resu m en d e tests y
m ediciones, tab la que aparece en el in te rio r de la tap a, así com o
am plios sum arios al final de los capítulos u , xiv y xx.
Son m uchas las personas que h an colaborado e n esta revisión,
p ero el a u to r desearía d a r gracias de m an era especial a R ichard
G. Ames, E rica B orden y Louis G oodm an p o r sus com entarios en
relación con la to talid a d del m anuscrito.
P o r su ayuda en la p rep aració n de la p rim e ra edición, deseo
d a r gracias de m an era destacada a los estud iantes y colegas de
la U niversidad de M ichigan, quienes leyeron varios b o rrad o res
del lib ro y sugirieron m ejoras. A R ichard T. LaPierre, S anford
D om busch, R obert Ellis, S an to Cam illeri y T heodore A nderson
m i ap recio p o r leer y c ritic a r el m an u scrito original. Deseo igual
m en te agrad ecer p o r la corrección de pruebas, el m ecanografiado
y la revisión de los cálculos, la ayuda p re sta d a p o r Ann Blalock,
D iane Etzel, Ann Laux y Doris Slesinger. G racias igualm ente a
Daniel O. Price, m erecedor de am plio reconocim iento p o r h ab e r
estim u lad o m i in terés e n la estadística.
Quedo en deu d a con el p ro feso r S ir R onald A. F isher, de Cam
bridge, con el d o cto r F ran k Yates, de R otham sted y con los se
ñores Oliver a n d Boyd, Ltd., de Edim burgo, p o r su autorización
p a ra re im p rim ir los cuadros iii, iv y v de su lib ro Cuadros esta
d ísticos para investigaciones biológicas y agrícolas. T am bién es
toy reconocido a los distin to s editores y autores, m encionados
en los lugares adecuados, quienes am ablem ente dieron perm iso
p a ra el u so de varios cuadros y form as de com putación.
INTRODUCCIÓN
E l cam po d e la estad ística tien e m últiples aplicaciones, com o lo
d em u estra el hecho de que se den cursos de ella en m ateria s ta n
dispares com o son la odontología y la sociología, la ad m in istra
ción de negocios y la zoología, la salud pública y la enseñanza.
A p e sa r d e ello, existen to d av ía m uchas concepciones erró n eas
acerca de la n atu raleza d e esta disciplina en estad o de rá p id o
desarrollo. La id ea que de la estad ística se h ace el lego, puede
d ife rir m u ch o de la que tien e de ella el estad íg rafo profesional.
A veces se supone q u e el estadígrafo es u n a p erso n a que m ani
p u la n ú m ero s p a ra d em o strar s u p u n to d e vista. P o r o tra p a rte ,
en cam bio, algunos estu d ian tes de sociología o de o tra s ciencias
sociales, p ro p en d en a ad m ira rle com o a alguien que, con la ayuda
d e su calculadora, p u ed e co n v ertir casi cualquier estu d io en
"cien tífico ”. D ebido p osiblem ente al re sp eto q u e m uchas p e rso
n as sien ten p o r to d o aquello que en alguna fo rm a se relaciona
con las m atem áticas, a m uchos estu d ian tes les re s u lta difícil
in scrib irse en u n cu rso d e estad ística sin c ie rta aprehensión.
P ese a q u e les in fu n d a te m o r la perspectiva de tra b a ja r con n ú
m eros, es posible tam b ién que esp eren dem asiado d e u n a disci
p lin a q u e p arece ta n form idable. Antes, pues, de e n tra r dem asia
do rá p id a m en te en m ateria , con lo que correm o s el riesgo d e
p e rd e r la perspectiva, em pecem os p o r p re g u n ta rn o s q u é e s exac
tam en te la estad ística y q u é es aquello q u e p u ed e y aquello que
n o p u ed e hacer.
T al vez re su lte m ás fácil em pezar indicando aquello q u e la
estad ística n o e s .»E n p rim e r lugar, la estad ística n o es en m odo
alguno u n m scodo con el q u e u n o p u e d a p ro b a r casi to d o aquello
que d esea p ro b a r. V erem os, a n te s bien, q u e los estadígrafos
po n en especial em peño e n estab lecer las reglas del juego d e ta l
m an era q u e las in terp retacio n es n o vayan m ás allá de los lím ites
de los datos. Sin em bargo, n o h ay n ad a en los m étodos estad ís
ticos e n sí m ism os q ue sea capaz de ev itar q u e el individuo su
perficial o intelectu alm ente poco escrupuloso saq u e sus p ro p ias
conclusiones, a p e sa r de los datos, y u n o de los aspectos m ás
im p o rtan tes de u n cu rso d e introducción a la estad ística consiste
p recisam en te en p o n e r a los estu d ian tes en gu ard ia c o n tra los
posibles abusos de esta h erram ien ta.
La estad ística no es sencillam ente u n a colección d e hechos. Si
lo fu era, n o v ald ría m ucho la p en a estudiarla. Ni constituye ta m
poco u n su stitu tiv o del p en sam iento a b stra c to teó rico o del exa
m en m inucioso de los casos excepcionales. E n algunos d e los
lib ro s de texto m ás antiguos solían e n c o n tra rse p ro lijas discu-
15
siones acerca de los m éritos del estu d io casuístico, fre n te al m é
todo estadístico. Ahora, en cam bio, ad m ítese claram en te que los
m étodos estadísticos n o se "oponen" en m odo alguno al análisis
cualitativo de los casos p artic u la res, sino que am bos m étodos se
com plem entan. Y n i siq u iera es exacto que la estad ística sólo
sea aplicable en , p resencia de u n gran n ú m ero de casos, o que
no p u ed a em p learse en los estudios de exploración. Finalm ente,
la estad ística n o es tam poco u n s u s titu to de la m edida, o de la
p rep aració n cuidadosa de u n a cédula de investigación o de otros
in stru m en to s p a ra la recolección de datos. Se in sistirá con m a
y o r detalle en este ú ltim o aspecto al final del p re se n te capítulo
y en el siguiente.
Y ahora, habiendo indicado lo q u e la estad ística n o es, ¿pode
m os acaso a firm a r decididam ente aquello que es? In fo rtu n ad a
m ente, los estadígrafos m ism os p arece n d iscre p ar algo e n tre sí
en cu an to a la extensión de aquello que deba co m p ren d erse b ajo
el apelativo general de "estad ístic a”. A doptando u n p u n to de vista
pragm ático, podem os decir p o r n u e stra p a rte q u e la estad ística
com prende dos funciones m uy vastas, y que n a d a de aquello que
no cum ple dichas $ o s M ic ió ñ é s fo rm a p a rte de ella. L a p rim era
es la de la descripción, el resu m en de la info rm ación de tal m odo
que se p u ed a em p lear m ejo r. Y la segunda es la de la inducción,
con sisten te en fo rm u la r generalizaciones a p ro p ó sito de u n a de
term in ad a población sobre la base de u n a m u e stra ex traíd a de
la m ism a. E sta s dos funciones se exam inarán a su tiem po.
1.3. A dvertencia
E n p resen cia de u n n ú m ero o de u n a ecuación m atem ática, algu
nos estu d ian tes ex p erim en tan u n tem o r que va desde u n a ligera
ap reh en sió n h a sta la inhibición m en tal com pleta. Si el lecto r es
de éstos, d eb erá tr a ta r especialm ente de deponer to d a idea p o r
el estilo acerca de que “la estad ística es algo que ya sé que nunca
llegaré a e n te n d e r”. E n efecto, el grado de m atem áticas reque.
rid o en este texto es tal, que los cursos de álgebra de la escuela
secundaria, añadidos a las pocas operaciones algebraicas elem en
tales q u e se exponen en el A péndice 1, constituyen u n a p re p ara
ción suficiente. H ay que re c o rd a r, con todo, q u e los textos de
m atem áticas y estad ística n o se leen com o u n a novela. P o r lo
reg u lar, e n efecto, la m a te ria se p re se n ta en fo rm a m uy conden-
sa d a . D e a h í, p u e s, q u e se re q u ie ra n u n a le c tu r a a te n ta y u n a
d isp o sic ió n de e s p ír itu activ a, y n o sim p le m e n te p asiv a , f r e n te
al m a te ria l p re s e n ta d o . É s ta es la ra z ó n d e q u e n o se p u e d a
p r e s c in d ir de u n tr a b a jo c o tid ia n o y d e la re so lu c ió n d e los p ro
b le m a s p rá c tic o s in c lu id o s al fin a l de c a d a ca p ítu lo .
B iblio g ra fía
AD = AB + BC + CD
la escala de intervalo,
la escala nom inal,
* la definición operativa,
la escala ordinal y
la escala de razón.
B iblio g rafía
1. Blalock, H. M .: "The Measurement Problem: A Gap between the
Languages of Theory and Research” ; en H. M. Blalock y Ann B.
Blalock (E.) Methodology in Social Research, McGraw-Hill Book
Company, Nueva York, 1968, cap. 1.
2. Bridgman, P. W .: The Logic of Modern Physics, The Macmillan
Co„ Nueva York, 1938, pp. 1-39.
3. Cohén, M. R. y E, Nagel: An Introduction to Logic and Scientific
Metkod, Harcourt, Brace and Company, Inc., Nueva York, 1937,
caps. 12 y 15.
4. Coleman, James S.: Introduction to Mathematical Sociology, The
Free Press, Nueva York, 1964, cap. 2.
5. Coombs, C. H., H. Raiffa y R. M. Thrall: "Some Views on Mathe
matical Models and Measurement Theory", Psychological Review,
vol. 61, pp. 132-144, marzo de 1954.
6. Coombs, C. H.: A Theory of Data, John Wiley & Sons, Inc., Nue
va York, 1964.
7. Coombs, C. H .: "Theory and Methods of Social Measurement”,
en L. Festinger y D. Katz (ed.), Research Methods in the Behavio-
ral Sciences, The Dryden Press, Inc., Nueva York, 1953, pp. 471-535.
8. Lundberg, G. A.: Foundations of Sociology, The Macmillan Com
pany, Nueva York, 1939, caps. 1-2.
9. Northrop, F. S. C., The Logic of the Sciences and the Humanities,
The Macmillan Company, Nueva York, 1947, caps. 5-7.
10. Radcliffe-Brown, A. R.: A Natural Science of Society, The Free
Press of Glencoe, 111., Nueva York, 1957, pp. 2842.
11. Selltiz, C., M. Jahoda, M. Deutsch y S. W. Cook: Research Me
thods in Social Relations, Henry Holt and Company, Inc., Nueva
York, 1959, caps. 5 y 10.
12. Senders, V. L., Measurement and Statistics, Oxford University
Press, Nueva York, 1958, cap. 2.
13. Stevens, S. S.: "Mathematics, Measurement, and Psychophysics",
en S. S. Stevens (ed.), Handbook of Experimental Psychology,
John Wiley & Sons, Inc., Nueva York, 1951, pp. 1-49.
14. Stouffer, S. A., et ai.: Measurement and Prediction, Princeton Uni
versity Press, Princeton, N. J., 1950, caps. 1 y 3.
15. Weiss, R. S.: Statistics in Social Research, John Wiley & Sons,
Inc., Nueva York, 1968, cap. 2.
S eg u n d a P a rte
E S T A D ÍS T IC A D E S C R IP T IV A UNIVARIADA
I I I . ESCALAS N O M IN A L E S : P R O P O R C IO N E S ,
P O R C E N T A JE S Y R A ZO N ES
I I I .1. P roporciones
Con o b jeto de p o d er servirnos de las proporciones, hem os de
p re su m ir que el m éto do de clasificación h a sido ta l que las cate
gorías son m u tu am en te exclusivas y exhaustivas. E n o tro s térm i
n o s: cada individuo h a sido pu esto en u n a categoría y en u n a
sola. Con fines de sim plificación, tom em os u n a escala nom inal
q u e co n ste d e c u a tro categorías, con N u N 2, N s y N 4 casos re s
pectivam ente. S upongam os que el nú m ero to ta l de los casos sea
N. La pro p o rció n de casos en cualquier categoría dada e s tá defi
n id a com o el nú m ero en la categoría dividido e n tre el nú m ero
to tal de casos. P o r lo ta n to , la proporción de individuos de la
p rim e ra categoría se halla d ad a p o r la ca n tid ad N 1/N , y las p ro
porciones de las dem ás categorías son respectivam ente de N 2/N ,
N 3/ N y N J N . Es obvio que el valor de u n a proporción n o puede
ser m ay o r que la unidad. .En efecto, com o q u iera que
Nj. + N 2 + N 3 + N é = N
tenem os que
Nx N2 Ns Ni N
_ J_ + __L + _ L = -------- = i
N N N N N
I1I.2 P orcentajes
Los p o rcen tajes pueden o b ten erse de las proporciones m ultipli
cando sim plem ente p o r 100. La p a la b ra p o rc en taje significa por
ciento. P or lo tan to , al servirnos de los p o rc en tajes norm alizam os
en relación con el volum en, calculando el n ú m ero de individuos
que h ab ría en u n a categoría d eterm in ad a si el to ta l de los casos
fu era 100, perm aneciendo in altera d a la p roporción en cada cate
goría. Y com o q uiera que las proporciones sum adas dan la uni
dad, es obvio que los p o rcen tajes sum arán 100, a m enos que las
categorías no sean m u tu am en te exclusivas o exhaustivas.
Al re p ro d u cir resultados, los p o rcentajes se em plean con
m ucha m ayor frecuencia que las proporciones. Las cifras del cua
dro XII.2 h ab ría n podido expresarse lo m ism o e n térm inos de
i Puede utilizarse exactamente el mismo procedimiento en el caso de por-
oentajes.
p o rcen tajes. M ejor que servirnos de los m ism os datos, tom em os
o tro cuadro que puede servir p a ra iiu s tra r otros diversos aspec
tos. Supongam os que tenem os tres agencias de servicios dom és
ticos con u n a distribución de casos com o la que se indica en el
cu ad ro III.3.
Como es usual, los p o rcen tajes se h an dado h a sta el p rim er
decim al y se h an operado los aju stes de los últim os dígitos, de
m odo que los totales den exactam ente 100. Aquí el núm ero de ca
sos de cada agencia es lo suficientem ente grande com o p a ra ju s
tificar el em pleo de p orcentajes. Sin em bargo, si el núm ero de
casos h u b iera sido m enor, el em pleo de aquéllos h a b ría resultado
equívoco'. E n efecto, supóngase que la agencia C h ab ía trata d o
sólo 25 casos en total. Si h u b iera hab id o cu a tro m ad res solteras
y siete p arejas de novios, los po rcen tajes en dichas categorías
h ab ría n sido respectivam ente del 16 y del 28 p o r ciento. Y com o
q u iera que m uchas personas aco stu m b ran m ira r sólo los p o r
cen tajes y no el núm ero efectivo de casos com prendidos, po
d ría fácilm ente o btenerse la im presión de que h ab ía m uchas m ás
p arejas de novios que de m ad res solteras. Como se verá cuando
lleguem os a la estad ística inductiva, la diferencia e n tre cuatro
y siete casos p u ed e deberse perfectam en te a factores pu ram en te
casuales. El em pleo de los p o rc en tajes y las proporciones com
p o rta p o r lo re g u lar u n a estabilidad m ucho m ayor de las cifras.
P o r lo tan to , he aquí dos reglas generales im p o rta n te s: 1) indí
quese siem pre el núm ero de casos ju n ta m en te con los porcentajes
o las proporciones, y 2) n o se calcule nunca u n porcentaje, a m e
nos que el n ú m ero d e casos en que está basado se halle a proxi-
II I.3. R azones
La razón de u n n ú m ero A con respecto a o tro núm ero B se de
fine com o A dividido e n tre B . La cantidad que precede se pone en
el n u m erad o r, en tan to que la que sigue fo rm a el denom inador.
S upóngase que en una elección local se hallan inscritos 365 re p u
blicanos, 420 dem ócratas y 130 independientes en calidad de vo
tan tes. E n este caso la razón de los republicanos a los dem ócra
tas es de 365/420, y la de los republicanos y los dem ócratas a los
independientes es de (365 + 420)/130. O bsérvese que, a diferen
cia de la proporción, la razón puede to m a r u n valor su p erio r a
la unidad. Vemos asim ism o q u e la expresión que precede o que
sigue pueden constar, u n a y o tra, de cantidades d istin tas ( v.gr.
republicanos y d em ócratas). G eneralm ente la razón se reduce a
su expresión m ás sim ple elim inando en el n u m era d o r y el deno
m in ad o r los factores com unes. Así, pues, la razón de los dem ó
cratas a los independientes se escrib irá com o 42/13 o bien, en
fo rm a equivalente, com o 42:13. En ocasiones es conveniente ex
p re s a r la razón en térm inos de u n denom inador form ado p o r la
unidad. P o r ejem plo, la razón de los dem ócratas a los indepen
d ientes pu ed e escribirse com o 3.23 a 1.
E s obvio que las proporciones re p resen tan u n tip o especial de
razón en la que el denom inador es el nú m ero to tal de los casos
y el n u m era d o r u n a cierta fracción de aquél. Sin em bargo, el
térm in o de razón se em plea p o r lo re g u lar p a ra re ferirse a casos
en los q ue A y B re p re se n ta n categorías separadas y distintas.
P odríam os, p o r ejem plo, estab lecer la razón de los delincuentes
a los n o delincuentes, o de los m atrim onios a los novios. Es evi
d ente que con cu atro o cinco categorías el n ú m ero de razones
posibles susceptible de calcularse es m uy grande. En consecuen
cia, a m enos que el in terés se cen tre a n te to d o en uno o varios
p ares de categorías, será en general m ás económ ico y m enos su
je to a confusión p o r p a rte del lecto r servirse de los p o rcentajes
y las proporciones. O bsérvese que, si las categorías sólo son dos,
será posible calcular la proporción d irectam en te a p a r tir de la
razón y viceversa. Así, p o r ejem plo, si sabem os que la razón de
los varones a las m u jeres es de 3 :2, entonces en cada cinco p er
sonas h a de darse u n prom edio de tres varones y dos m ujeres.
La p ro p o rció n de los varones es, pues, de 3/5, o .6.
Las razones pu eden ex presarse en térm inos de cualquier b ase
que re su lte conveniente. L a base de la razón está indicada p o r la
m ag n itu d del d enom inador. Así, p o r ejem plo, las razones relati
vas al sexo se in d ican convencionalm ente en térm in o s del núm ero
de varones p o r 100 m u jeres. P o r lo tan to , u n a razó n de 94 en
m ateria de sexo in d icará que el n ú m ero de los varones es ligera
m en te in fe rio r al de las m u jere s, en ta n to que u n a razón de
sexos de 108 significaría u n a ligera p re p o n d eran cia de los p ri
m eros. Las bases que co m p o rtan núm eros grandes, tales como
1 000 o 100 000, se em plean a m enudo al calcular cuotas, o tro tipo
de razón, cuando el em pleo de las proporcion es o los po rcen tajes
co n d u ciría a valores decim ales pequeños. Las cuotas de n atali
dad, p o r ejem plo, suelen d arse e n térm in o s del n ú m ero de naci
m ien to s vivos p o r 1 000 m u jeres e n ed ad de p ro c rea r. Las cuotas
de asesinatos pueden darse en térm in o s del n ú m ero de asesinos
p o r 100 000 h ab itan tes.
Las cuotas de crecim iento constituyen o tro tip o co rrien te de
razón. Al calcu lar u n a de estas cuotas, tom am os el crecim iento
efectivo d u ra n te el perio d o considerado, dividido e n tre el volum en
al principio del periodo. Así, p o r ejem plo, si la población de una
ciu d ad au m en ta de 50 000 a 65 000 e n tre 1940 y 1950, la cuota de
crecim iento d u ra n te el decenio en cuestión s e rá de
65 000 - 50 000
---------- — ---------- = .30
50 000
o 30 p o r ciento. E n el caso de cuotas de crecim iento, es obvio
q ue los p o rc en tajes se p re s ta n bien m ás allá del 100 p o r ciento,
en ta n to que serán negativos si la ciu d ad h a experim entado un
descenso de población.
G losario
Porcentaje
Proporción
Tasa
Razón
E j e r c ic io s
Alta 37 36 13 86
Mediana 26 12 71 109
Baja 24 20 29 73
Total 87 68 113 268
Intervalo Frecuencia, f
0.0— 9.9 5
10.0— 19.9 17
20.0 — 29.9 39
30.0 — 39.9 22
40.0 — 49.9 8
50.0 — 59.9 1
60.0 — 69.9 0
70.0 — 79.9 0
80.0 — 89.9 1
93
Intervalo Frecuencia, f
0.0 — 19.9 22
20.0 — 39.9 61
40.0 — 59.9 9
60.0 — 79.9 0
80.0 — 99.9 1
93
d e -0 .0 5 a 9.95
de 9.95 a 19.95
de 19.95 a 29.95
etcétera.
%
-43.0
-32.3
-21.5
-10.8
0 10 20 30 40 50 60 70 80 90 100
F ig . IV .l. H istogram a de intervalos iguales.
t %
40 -43.0
30 -32.3
20 -21.5
10 -10.8
%
-43.0
-323
-21.5
-10.8
f %
dnLdxn
F %
93.00 -100 , , ' , -
46.50 -50 /
23.25 -25 /
0, —-"i i i
0 10 20 30 40 50 60 70 80 90 100
Fig. IV.5. Ojiva que representa una distribución d e frecuencia
acum ulativa.
E j e r c ic io s
3 5 2 3 3 4 1 8 4
2 4 2 5 3 3 3 0 3
5 6 4 3 2 2 6 3 5
4 14 3 5 6 3 4 2 4
9 4 1 4 2 4 3 5 0
4 3 5 7 3 5 6 2 2
5 4 2 3 6 1 3 16 5
3 11 4 5 19 4 5 2 2
4 3 14 5 2 1 4 3 4
B ibliografía
- 2X
X = -------
M
2 (X «-X ) = 0
«=*i
y — » y _
2 (Xt - X ) = 2 Xt - 2 X
<=*1 1=1 i= 1
X X-73 X-70
72 - 1 2
81 8 11
86 13 16
69 - 4 - 1
57 -1 6 -1 3
0 15
1 ( X i - X ’)
X = X ’ + — ----------------- ( V.2)
N
o bien, en p a la b r a s :
2 (Xi ~ X ) 2 = m ínim o.
i= l
* La p ru eb a de esta propiedad es m uy sencilla. C onsiderem os
las desviaciones de X t alrededor de cualquier o tro n ú m ero X ' que
previam ente hayam os tra ta d o com o m edia anticipada. S um ando
y re sta n d o la m edia real X de cada u n a de dichas expresiones
podrem os a n o ta r :
Xi - X ' = ( X í - X ) + ( X - X ' )
(X i - X' ) s = ( X t - X )2 + 2( Xi - X ) ( X - X ’) + ( X ~ X ’)2
2 2 (X j — X )2 + N ( X — X ')2
i=i <=i
V.2. La m ediana
A m en u d o necesitam os localizar la posición del caso m edio cuan
do los d ato s se h a n o rd e n ad o de m ay o r a m enor. O podem os
d iv id ir u n g rupo de estu d ian tes en p o rc en tajes localizando los in
dividuos q ue tienen exactam ente el 10 p o r ciento de la clase que
q u ed a d eb ajo de ellos, ex actam ente el 32 p o r ciento d eb ajo de
ellos, etcétera. Las m ed id as de este tip o se designan a m enudo
com o m ed id a s de posición, ya que localizan la posición de algún
caso típ ico (o atípico) en relación con o tro s individuos. La m e
d ian a es ta l vez la m ás im p o rta n te de estas m edidas de posición.
D efinim os la m ed ian a com o u n núm ero que posee la pro p ied ad
d e te n e r el m ism o n ú m ero de m arcas con valores m enores que
las que h ay de valores m aypres. La m ed ian a divide h ab itu alm en
te el to ta l de los datos en dos m itades. Si el n ú m ero de los ca
sos es im p ar, la m ed ian a será sim plem ente la m arca del caso
del m edio. Si N es p ar, no h a b rá caso cen tral y, de hecho, cual
q u ier n úm ero e n tre los valores de los dos casos centrales ten d rá
la p ro piedad de dividir las m arcas e n dos grupos iguales. Así,
pues, si N es p ar, la m ediana queda definida am biguam ente. Por
convención tom am os entonces com o valor único de la m ediana
la m edia aritm ética de los dos datos centrales.
Si tuviéram os los núm eros 72, 81, 86, 69 y 57, la m ediana sería
72 (e n ta n to que la m edia es 73). Si h u b iera u n sexto térm ino,
digam os, p o r ejem plo, 55, las dos m arcas centrales serían 69 y 72,
y tom aríam os com o m ediana (69 + 72)/2, o sea 70.5. Si se da el
caso de que los dos casos centrales tengan la m ism a m arca,
la m ediana será, p o r supuesto, este m ism o dato. O bsérvese que
si N es im par, la m ediana será el dato (N + l) /2 . Si el núm ero
de los datos es p ar, la m ediana se en c o n trará en el ce n tro e n tre
el dato N /2 y el d ato (N + l)/2 . Así, p o r ejem plo, si N = 251, la
m ediana será el dato del caso centésim o vigésim o sexto, y si
N = 106, tom am os u n valor m edio e n tre las cifras de los casos
quincuagésim o terc ero y quincuagésim o cuarto. E stas fórm ulas
re su ltarán ú tiles p o r lo re g u lar cuando N sea relativam ente
grande.
Vimos que la m edia posee las propiedades sig u ien tes:
S (X í - X ) = 0
i= l
y
1 (X t —X )2 = m ínim o.
i=l
La razón de que la p rim e ra pro p ied ad se verifique es fundam en
talm en te que, cuando se su strae la m edia de cada u n o de los
datos, las diferencias resu ltan tes son tales que las m arcas nega
tivas se eq u ilib ran exactam ente con las positivas. P ero supóngase
que h ubiéram os prescindido p o r com pleto de los signos, consi
deran d o to d as las diferencias com o positivas, ¿qué o c u rrirá en
este caso? P uede d em o strarse que si se h u b iera re sta d o la m e
diana de cada u n a las m arcas prescindiendo del signo de las di
ferencias y sum ando los residuos, se o b ten d ría u n a sum a m enor
que la cifra co m parable de cu alq u ier o tra m edida de tendencia
central. E n sím bolos esto se expresa a s í :
y
2 |Xi —M d | = m ínim o
<=i
en donde M d re p resen ta la m ediana y las b a rra s a am bos lados
de la expresión (X i — M d ) indican q u e hay que to m a r el valor
positivo (o "ab so lu to ” ) de cada diferencia. A unque esta p ro p ie
d ad de la m ediana posea ta l vez algún interés, n o parece, sin em
bargo, te n e r aplicaciones directas de alguna significación socio
lógica.
Puntos medios
Límites fijados Límites verdaderos ft fimi
("«i)
$2000-2 900 $ 1 950-2 950 $2450 17 $ 41650
3 000-3 900 2 950-3 950 3 450 26 89700
4 000-4 900 3 950-4 950 4 450 38 169100
5000-5900 4 950-5 950 5450 51 277 950
6000-6 900 5950-6950 6450 36 232 200
7 000-7 900 6 950-7 950 7 450 21 156450
Totales 189 $967050
2 /„«,
967050
X = - = $5117
~Ñ 189
Limites Puntos
verdaderos medios n ¿i fA
La fó rm u la m odificada es a h o ra :
A udi
X = X ' + _1JL----- i (V.5)
N
en donde i re p resen ta la am p litu d de intervalo. P or co n siguiente:
81 94.5 132
-----J | +H I I I I l-l H I I | l | -------------------------------- ■---------------- I !
4,950 5,950
de 94.5 o N /2 . Es p o rq u e estam os operando con p u n to s m e
dios de in tervalos pequeños que contam os exactam ente N /2
intervalos, con o b jeto de localizar la posición del caso {N + l)/2 .
El v alo r de la m ed ian a pu ed e ah o ra o b ten erse m ultiplicando
sim plem ente el n ú m ero de subintervalos ab arcad o s p o r la m ag
n itu d de cada u no de ellos y añadiendo el re su lta d o al lím ite
in ferio r del intervalo. E l procedim iento co n ju n to pu ed e resu
m irse en la fó rm u la siguiente:
N /2 — F
M d = t + -------------- i (v .6 )
Md = u ~ ¿ (V.7)
132 * 94.5 __
M d = 5 950 --------- —----- 1000 = $5 215.
Simétrica
. . . x
Asim étrica negativa Asim étrica positiva
2 N tX x
X = — --------- (V.8)
N
47 25 — 43
Q1 = 3 950 + — ^---------- 1 000 = 3 950 + 112 = $ 4 062
38
G losario
Decil
Media
Mediana
Modo
Percentil
Cuartil
Distribución asim étrica
E je r c ic io s
B iblio g rafía
V I.l. E l recorrido
De las d istin tas m edidas de dispersión que vam os a exam inar en
este capítulo, el re co rrid o es con m ucho el m ás sim ple. El reco
rrid o se define com o la diferencia e n tre la m arc a m ás a lta y la
m ás b aja. Así, pues, e n relación con los datos proporcionados en
el capítulo a n te rio r (72, 81, 86, 69 y 57), el re c o rrid o sería la dife
ren cia e n tre 86 y 57, o sea 29. P o r lo re g u lar solem os in d icar el
re co rrid o ya sea p o r m edio de la diferencia real (29), o dando
las dos m arc as extrem as, v.gr. 57 y 86. Si los datos se h a n agru
pado, tom am os com o re co rrid o la diferencia e n tre los puntos
m edios de las categorías extrem as. Así, pues, si el p u n to m edio
del in tervalo in ferio r es 2 450 y el del intervalo su p e rio r 7 450, el
re co rrid o será de 5 000.
La sim plicidad extrem a del re co rrid o com o m ed id a de disper
sión p re sen ta a la vez ven tajas e inconvenientes. E n efecto, el
re co rrid o pued e re s u lta r m uy ú til si se tr a ta de o b ten er unos
cálculos m uy rápidos que p u ed an p ro p o rcio n ar u n a indicación
b ru ta de la dispersión, o si los cálculos h a de hacerlos alguna
90
p erso n a que n o esté fam iliarizada con la estad ística. Si los datos
h an d e p re sen tarse a u n a audiencia relativ am en te ingenua, el reco
rrid o será tal vez la ú n ica m edida de dispersión que aquélla esté
en condiciones de in te rp re ta r fácilm ente. S in em bargo, el nivel de
p re p aració n de los sociólogos está alcanzando ráp id am en te u n
p u n to tal, que podem os legítim am ente su p o n er que en ten d erán
tam b ién m edidas algo m ás com plicadas y satisfactorias. E l in
conveniente del re co rrid o es obvio: se b a sa exclusivam ente en
dos casos, que son, adem ás, los dos casos extrem os. Y com o
q u iera que los casos extrem os suelen se r ra ro s o poco com unes
en la m ay o ría de los problem as em píricos, nos dam os cu en ta que
p o r lo re g u lar es u n a cuestión de az ar q u e obtengam os u n o o dos
de ellos en n u e stra m u estra. Supóngase, p o r ejem plo, que en la
localidad investigada hay u n m illonario. Si escogem os 10 perso
nas al azar, es p ro b ab le que aquél n o e sté incluido e n tre ellas.
Pero, supóngase que sí está. E n ta l caso el re co rrid o de los in
gresos será ex trao rd in ariam en te am plio y m uy engañador en
cu an to m edida de dispersión. Si nos servim os del re co rrid o
com o m edida, n a d a sabem os acerca de la variación de las m a r
cas e n tre los dos valores extrem os, excepto que éstas se sitú an
en algún lu g ar en el in te rio r de dicho re co rrid o . Así, pues, com o
re su lta del ejem plo a n terio r, el re co rrid o v a ria rá considerable
m en te de u n a m u e stra a o tra. P or o tra p a rte , el re co rrid o será
p o r lo re g u la r m ayor en las m u estras grandes que en las peque
ñas, sim plem ente p o rq u e e n los p rim ero s tenem os m ás p ro b a
bilidades de in clu ir a los casos individuales extrem os. É sta es
la razón de que el re c o rrid o n o se em plee p o r lo re g u la r en so
ciología, excepto al nivel de tipo m ás exploratorio.
O tra m ed id a su m am ente sim ple, la razón de variación, puf de
s e r utilizada e n el caso de los datos en grupo, lo que re su lta
especialm ente adecuado en el caso de las escalas nom inales.
C onsiste b ásicam ente en u n a m edida del grad o en que se con
ce n tran los dato s en la categoría m odal, en lu g ar de que se les
e n cu en tre distrib u idos u n iform em ente a lo larg o de to d as las ca
tegorías. Se define a s í :
V i?. = 1 - f moaJ N ,
(Xt-X)*
(V I.3)
N
en donde s se em plea p a ra designar la desviación están d ar.1 O en
1 Algunos textos definen s con N —1 en el denominador en vez de N. La
razón de ello no resultará clara hasta e n el capítulo XI.
p a la b ra s : tom am os la desviación de cad a m arc a con respecto
a la m edia, a la d ra m o s cada diferencia, sum am os los resultados,
dividim os e n tre el n ú m ero de casos y extraem os la raíz cuadrada.
P ara conseguir u n a re sp u esta correcta, es indispensable que las
operaciones se efectúen exactam ente e n el o rd e n indicado. E n
n u e stro ejem plo n um érico la desviación e stá n d a r p o d ría conse
guirse com o sigue:
*« (X.-X) (Xt - X P
72 - 1 1
81 8 64
86 13 169
69 - 4 16
57 -1 6 256
--- ---
X = 73.0 0 506
s = V506/5 = V101.2 = 10.06
2 ( Xt - X P
<=i
V ariancia = s2 = -------—-----------
N
2 2 { X ? - 2X j l + X*)
i= l Í=1
. _ _ _
2 X ? - 2X 2 X i + N X 2
«—i t=i
N
O bsérvese que, com o q u iera que X es constante, pudim os tom ar
la fre n te al signo de sum ación en el segundo térm in o del n u m era
dor. E n el te rc e r térm ino, a su vez, nos hem os servido del hecho
de que, p a r a to d a co nstante k, te n e m o s :
2 k = N k.
i=l
_ w
Pero, com o q u iera q u e X = 2 X J N , el térm ino cen tral del nu-
í =*i
m era d o r se red u ce a — 2X 2, y podem os e s c rib ir:
X _ 2 N 2 .V 2
2 (X t ~ X ) 2 X,2 X 4
i= l 4=1 _, ___ i= l ___
2X2 + X2 = ------------X2
N N M
P o r lo ta n to :
V N
ír 2
2 X,
\T
-X * (W .4)
Algunas o tras fórm ulas de cálculo altern ativ as son las sig u ien tes:
v ^-(4y (VI.5)
(^X
i)
N 2 \ 4=1
2 X ¿--------------------
í= i jv
/
-V (V I.6)3
1 I N 2 / N \ 2
(VL7)
Xi *<2
72 5184
81 6561
86 7 396
69 4761
57 3 249
365 27151
E n adición al n ú m ero to ta l de casos, las dos cantidades requeri-
-V !f 2
das son S I , y 2 X t. A m bas sum as pueden acum ularse sim ul-
«=i i=i „
tán eam en te con las m odernas calculadoras de oficina. Calcula
m os ah o ra s a p a r tir de (V I .7):
s = 1/5 V 5(27 151) - (365)2 = 1/5 V 135 755 - 133 225 = 10.06
(V I.8)
vemos que
&
i—1
=X-X'
N
y que, p o r lo ta n to :
fc V
2 ] fA \
k / k \ 2
V
= 1 000 J __ ( = 1000 V 2.1%—.111
" 189 V 189 /
= 1444
3(X - M d)
A sim etría = ------------------
5
Glosario
Coeficiente de variabilidad
Desviación media
Desviación cuartil
Recorrido
Desviación estándar
Variancia
E jercicios
1. Calcúlense las desviaciones media y estándar de los datos indica
dos en el ejercicio 1, cap. v. Respuesta, 9.62; 11.59.
2. Calcúlense las desviaciones estándar y cuartil de los datos agru
pados en el ejercicio 1, cap. iv. Hágase lo mismo con los del ejercicio
2, cap. iv.
3. Calcúlese la desviación estándar de los datos del ejercicio 4,
cap. v. Contrólense los cálculos escogiendo una media anticipada y
una fórmula de cálculo distintas. Respuesta, 10.83.
4. Indíquese en qué form a resultaría afectada la desviación normal
por los cambios indicados en el ejercicio 5, cap. v.
B iblio g rafía
1. Anderson, T. R., y M. Zelditch: A Basic Course in Statistics, 2- ed.,
Holt, Rinehart and Winston, Inc., Nueva York, 1968, pp. 76-84.
2. Downie, N. M., y R. W. H eath: Basic Statistical Methods, 2? ed.,
Harper and Row, Publishers, Incorporated, Nueva York, 1965, cap. 5.
3. Hagood, M. J., y D. O. Price: Statistics for Sociologists, Henry
Holt and Company, Inc., Nueva York, 1952, cap. 9.
4. McCollough, C., y L. van A tta: Introduction to Descriptive Sta
tistics and Correlation, McGraw-Hill Book Company, Nueva York,
1965, cap. 3.
5. Mueller, J. H., K. Schuessler y H. L. Costner: Statistical Reasoning
in Sociotogy, 2“ ed., Houghton Mifflin Company, Boston, 1970, cap. 6.
6. Weinberg, G. H., y J. A. Schumaker: Statistics: An Intuitive
Approach, Wadsworth Publishing Company, Inc. Belmont, Cal. 1962,
cap. 3.
7. Weiss, R. S.: Statistics in Social Research, John Wiley & Sons,
Inc., Nueva York, 1968, cap. 7.
L a noción de la distribución de frecuencia es ya fam iliar. El p re
sen te capítulo se ocupa de u n tipo m uy im p o rtan te de d istrib u
ción de frecu en cia: la cu rv a n orm al. E sta distribución es m uy
ú til, no sólo p o rq u e u n gran n ú m ero de distribuciones em píricas
se en cu en tran se r aproxim adam ente norm ales, sino debido tam
bién a su significado teórico en la estad ística inductiva. E n este
m om ento, el le c to r n o debe preo cu p arse p o r las aplicaciones en
las que se em plea la curva norm al. E n efecto, el o b jeto del p re
sen te capítulo está en in d icar las propiedades de la curva en
cuestión y en fam iliarizar al lecto r con el em pleo de cuadros
basados en la m ism a. E sta distribución se exam ina e n la esta
dística d escriptiva m ás que en la inductiva p o r dos razones p rin
cipales. P rim ero, la curva n orm al puede em plearse p a ra p ro p o r
cio n ar u n a in terp re tació n de la desviación están d ar. Y en segundo
lugar, serán útiles al lecto r p a ra fam iliarizarse con la distribución
norm al algunos capítulos antes de exponerse a pru eb as estad ís
ticas que req u ieren facilidad en la m anipulación de la m ism a.
P o r lo tan to , cuanto m e jo r se com prenda la m a te ria expuesta en
este capítulo, tan to m enos dificultad se ex p erim en tará m ás ade
lante.
:d f £ "TTTTt-t- - ..
(í)
Y = - - - - - -- - - - - e - ( x - x ) * / 2 í*
sV2jc
X -X
Z = ------------
s
10
El hecho de que Z sea negativa indica sim plem ente que el área
ach u rad a se sitú a a la izquierda de la m edia. Al u tilizar la tabla
Leptocúrtico
Distribución de frecuencia límite
Curva normal
Platicúrtico
Marca estándar
E jercicios
1. Ya se calcularon la media y la desviación estándar de los datos del
ejercicio 1, capítulo iv. ¿Cuál fue la proporción de los casos dentro
de una desviación estándar de la media? ¿Al interior de dos desviacio
nes estándar? ¿De tres desviaciones estándar? ¿Con cuánta aproxima
ción corresponden dichas cifras a las que encontraríamos si la distri
bución fuese exactamente normal? Contéstese a las mismas preguntas
en relación con el ejercicio 2, capítulo iv. Compárense y expliqúense
las diferencias entre los resultados de los dos grupos de datos.
2. Si la media de una distribución normal es de 80 y su desviación
estándar de 12,
B ibliografía
1. Downie, N. M., y R. W. H eath: Basic Statistical Methods, 2‘ ed.,
Harper and Row, Publishers, Incorporated, Nueva York, 1965, cap. 6.
2. Hagood, M. J., y D. O. Price: Statistics for Sociologists, Henry
Holt and Company, Inc., Nueva York, 1952, cap. 14.
3. Mueller, J. H., K. Schuessler y H. L. Costner: Statistical Reasoning
in Sociology, 2‘ ed., Houghton Mifflin Company, Boston, 1970,
cap. 6.
4. Weinberg, G. H., y J. A. Schum aker: Statistics: An Intuitive Appro-
ach, Wadsworth Publishing Company, Inc., Belmont, Cal., 1962,
cap. 8.
5. Weiss, R. S.: Statistics in Social Research, John Wiley & Sons, Inc.,
Nueva York, 1968, pp. 147-156.
T ercera P arte
E S T A D ÍS T IC A IN D U C TIV A
E l objeto de este breve capítulo está en d a r u n b osquejo gene-
ra l de la estad ística inductiva y, en p artic u la r, de los razo n a
m ien to s que se h allan a la base de la verificación de las h ip ó
tesis estadísticas. E s m u y fácil verse ta n ab ru m ad o p o r ios
detalles de cad a p ru e b a p a rtic u la r en co n trad a, que re su lte im
posible p e rc ib ir las sem ejanzas q u e to d as ellas tien en en co
m ún. E n ta l caso, el aprendizaje de la estad ística p u ed e con
v ertirse fácilm ente en u n ejercicio de "re c e ta rio ” co n sisten te
e n a p re n d e r de m em o ria las fórm ulas y los p rocedim ientos. P o r
ello este capítulo es m uy im p o rtan te y deb ería releerse a te n ta
m en te u n a vez que el le c to r haya visto las dos o tres p rim e ra s
p ru e b as específicas.1
Glosario
Hipótesis
Parámetro
Población
Estadística
Errores de tipo I y II
B ibliografía
1. Ackoff, R. L.: The Design of Social Research, University of Chicago
P rp c c P.hií'fiífív 1051 c a n . 5.
2. Northrop, F. s! C.: The Logic of the Sciences and the Humanities,
The Macmillan Company, Nueva York, 1947, caps. 7 y 8.
3. Weiss, R. S.: Statistics in Social Research, John Wiley & Sons,
Inc., Nueva York, 1968, cap. 13.
T odos tenem os sin ninguna clase de duda u n a noción intu itiv a de
lo que se en tien d e p o r probabilidad, au nque n o estem os e n con
diciones de fo rm u la r del térm in o u n a definición precisa. E n el
len guaje co rrien te hay cierto n ú m ero de p alab ras y frases que
se em plean en fo rm a casi intercam biable con el concepto de
probabilidad, tales com o posibilidades, perspectivas, ventaja,
etcétera. E stos conceptos se em plean en ocasiones en cierto n ú
m ero de sentidos diversos. P reguntam os, p o r ejem plo, "¿cuál es
la p ro b ab ilid ad de que hoy llueva?”, refiriéndonos a un aconte
cim iento singular (el llover hoy) que puede o c u rrir o no en el
futu ro . El enunciado "no es pro b ab le que Jones asesin ara a su
su eg ra” se p arece al an terio r, p e ro se re fiere a un acontecim iento
q u e h a ten id o ya lugar y a cuyo p ro p ó sito nos falta, con todo,
inform ación suficiente p a ra fo rm u la r u n a afirm ación categórica.
Puede u n o re fe rirse a lo que sucederá a la larg a : "si juegas, es
p ro b ab le qu e llegues a p e rd e r h a sta la cam isa”. Aquí la alusión
n o se refiere a que u n o h ay a de p e rd e r la cam isa con u n solo
golpe de dados, sino a lo que o c u rrirá si el experim ento se rep ite
u n gran n ú m ero de veces. "Un niñ o varón, nacido en los E sta
dos Unidos, de p ad res blancos nativos, vivirá p robablem ente 65
años.” S em ejante enunciado p arece re ferirse m ás al tipo gene
ralizado de niño de los cu ad ro s actu ariales q u e a u n Jim m y B row n
co n creto cualquiera.
Es obvio, sin em bargo, que si hem os de h a b la r de la probabi
lidad de m odo inteligente y, en p artic u la r, si hem os de hacer
in terv en ir al m atem ático, el concepto h a de definirse con la p re
cisión suficiente p a ra que todos podam os em plearlo con el m is
m o sentido. P o r desgracia, sin em bargo, no es ta n sencillo' obte
n e r u n a definición que satisfaga al p ro p io tiem po al m atem ático
y a n u e s tra noción in tu itiv a de aquello que p o r lo re g u lar enten
dem os con el térm ino. Según verem os, en efecto, el m atem ático
considera n ecesario p e n sa r en térm inos de probabilidades a vriori,
que en re alid ad n o pueden obtenerse em píricam ente y que no
dependen de cualquier m u estreo p a rtic u la r de datos. E n las
secciones que siguen, el concepto de pro b ab ilid ad se d efinirá en
lenguaje m atem ático y se exam inarán algunas de sus propieda
des m atem áticas m ás im p o rtan tes. Al p ro p io tiem po tratarem o s
de conseguir que dicha definición y dichas propiedades m atem á
ticas parezcan razonables a la luz del em pleo y la experiencia
cotidianos.
E n estad ística nos ocupam os en establecer generalizaciones a
p ro p ó sito de u n a población com puesta p o r lo regular de u n
g ran nú m ero de individuos. S em ejante población puede ser u n a
población fin ita realm en te existente —como, p o r ejem plo, la p o
blación de los E stados Unidos, o los varones blancos nativos de
m ás de 65 años— y, p o r lo tanto, claram en te delim itable. En tal
caso, tom arem os p o r lo re g u la r algún tip o de m u estra de la po
blación, y el in terés se dirigirá en p rim e r térm ino a la población
p o r sí m ism a (o a algún subgrupo de ella), m ás que a los indi
viduos que acontecen fig u ra r en una cualquiera de las m u estras
p articu lares. P ero la población puede tam bién ser una población
hip o tética que im plique, digam os, u n núm ero ilim itado de expe
rim en to s efectuados “en condiciones sim ilares”. P or consiguien
te, al estadígrafo n o le in teresan el acontecim iento o el individuo
p articu lares, a no ser en la m edida en que el acontecim iento
o individuo en cuestión puedan ayudarle a o b ten er inform ación a
p ro p ó sito de la población. Como q uiera que este texto es u n
texto de estad ística, nos servirem os en él del térm ino probabili
dad p a ra re ferim o s no a acontecim ientos p articu lares (llover hoy,
Jones asesino), sino a u n gran nú m ero de acontecim ientos o a
lo que o cu rre a la larga.1
¿Cóm o podem os o b ten er probabilidad desde el pu n to de vista
de acontecim ientos repetidos? E n p rim e r lugar, es m enester p en
sa r en térm inos de u n experim ento ideal que se deje re p e tir un
g ran nú m ero de veces "en condiciones sim ilares”. Sin duda, las
condiciones cam bian en la realidad, p ero h a de ser posible im a
g in ar p o r lo m enos q u e n o lo hacen. En cada uno- de dichos expe
rim en to s p erfectos h an de an ticip arse todos los resultados. Así,
pues, hem os de ac o stu m b ra m o s a p en sa r en térm inos de una
m oneda ideal que se lanza al aire un gran núm ero de veces, en
circu n stan cias idénticas, y con sólo dos resu ltad o s posibles (c ara
o cru z) en cada cara o cruz. P rescindim os del hecho de que en
el p roceso del lanzam iento de la m oneda real po d ría ac ab ar por
g astarse de m odo irreg u lar, o que en ocasiones se pu d iera m an
te n e r de canto. A prendem os a concebir u n juego de naipes p er
fectam en te b arajad o , en el que ninguno de ellos tienda a pegarse
a o tro, pese a que sem ejan te juego no se en c o n trará nunca en la-
v ida real.
L lam em os todo- re su ltad o o grupo de resultados un "aconteci
m ien to ”. E n este caso el acontecim iento pu ed e ser sim ple ( que no
1.00 --
0.75 -
O.
0.25 -
si 1 = P(A ) + P ( B ) + P ( C ) + ........ + P ( K ) ,
e n to n c e s : 1 — P( A) — P ( B ) + P(C) + .........+ P( K) .
1 12
1 ------o — .
13 13
P( A) = .2 P ( A \ B ) ~ . 25
P (B ) = .6 P( B\ A) = .75
P ( A & B & C ) = P( A) P( B) P( C)
P o r lo q ue se re fiere a las probabilidades condicionales, sus
principios p u ed en ap licarse fácilm ente a ciertos casos sencillos.
Así, p o r ejem plo, si hu b iéram o s de sac ar c u a tro ases co n reposi
ción, po d ríam o s calcular la pro b ab ilid ad d e o b ten erlo s com o
sigue:
P (4 ases) = — ----- ------ - ----- L = ___ l___
52 51 50 49 270 725
700 400 50 50
= ----------------------- = ----------= .05
1000 700 400 1 000
P(A&B&C)-P{C)P(B\C)P(A\B & C)
400 75 50 50
= — -------------------- = ----------= .05
1000 400 75 1 000
ecuación conocida com o teo rem a de Bayes. E ste teo rem a puede
se r generalizado p a ra diversas alternativas B lt B 2, . . . , B k, en
ta n to estas altern ativ as sean m u tu am en te exclusivas y exhausti-
k
vas, de m odo que 2 ? (£ » ) = 1. La p ro b ab ilid ad de que u n B u
i —1
dado, sup u esto que A h a ocurrido, puede escrib irse a s í :
PjB^PjAlB^
P( Bt \A)
S PÍBJPiAlBO
i=l
E s posible desde luego ap licar el teo rem a de Bayes siem pre que
se nos den todas las probabilidades condicionales e incondicio
nales, p e ro estas aplicaciones n o son especialm ente útiles. Puede
sin em bargo ser ap licado tam b ién en casos en que las "p ro b ab i
lidades psicológicas” hayan reem plazado los conceptos de fre
cuencia relativa. H ays [5 ] previene c o n tra este em pleo. Las
aplicaciones d irectas del concepto bayesiano e n relación con la
e stad ística e stá n a ú n relativam ente poco p ro b ad as. P arece sin
em bargo aconsejable su g erir m étodos p a ra su em pleo. Conside
rem o s en p rim e r lu g ar u n p ro b lem a m uy sencillo. Supongam os
q ue u n individuo escoge a capricho u n a de dos u rn a s, y a con
tin u ació n selecciona a capricho u n a bola de la u rn a que había
elegido. La p rim e ra de las u rn a s contiene u n a m ita d de bolas
b lan cas y o tra m ita d negras, en ta n to que la segunda contiene dos
tercios de bolas blancas y u n tercio de bolas negras. Sabem os que
el in dividuo selecciona u n a bola blanca, y desea asig n ar u n a
p ro b a b ilid ad al hecho de que h a seleccionado, digam os, la p rim e
r a u rn a . O bsérvese q u e en este caso se tr a ta de u n a especie de
"p ro b ab ilid ad in v ersa”, p a rtic u la rm e n te a p ro p ia d a al concepto
d e p ro b ab ilid ad es e n el que se refleja el estad o de n u estro s co
n ocim ientos. P uede decirse que el individuo seleccionó o n o se
leccionó la p rim e ra u rn a , siendo las respectivas probabilidades
1 a 0. P ero si hu b iéram os de h ac er u n a apuesta, con base en el
conocim iento que tenem os de que sacó u n a bola blanca, ¿qué
v e n ta ja estaríam o s dispuestos a d a r a favor d e que escogiera
la p rim e ra u rn a ? É sta es ciertam en te u n a fo rm a razonable de
p la n te a r el problem a.
Si denom inam os A al acontecim iento de la selección de u n a
bola blanca, B al de q u e fu e seleccionada la p rim e ra u rn a, y
B al acontecim iento de que fue seleccionada la segunda urn a,
obten d rem o s, al ap lica r el teo rem a de Bayes
P ( B |¿ ) = ________
P ( B ) P ( A \ B ) + P( B ) P ( A \ B )
(1 /2 )(1 /2 ) 1/4 3
( l/2 ) ( 1/2) + (1 /2 ) (2 /3 ) 1 / 4 + 1/3 7
P ÍB J P jA lB J
P (B i|A ) =
I P iB J P iA lB j
(•4)(.3) .12 _
• = .25
(.4 )(.3) + (.3)(.5) + (.2) (.6) + ( .l) ( .9 ) .48
, / 8! \ , 8 7 6 5 4 3 2 1
, o g ( T r ) = 1 “ B— m —
r
= jlo g 8 + log 7 + lo g ó + log 5 + log 4 + log 3 + log 2 + log l l
r -i
- jlo g 3 + log 2 + log 1j = log 8 + log 7 + log 6 + log 5 + log 4
p2 = .3 6 0 42 = 160
pqp = , 144 pqq ~ .0 9 6
q p p = .1 4 4 qpq = . 0 9 6
P ro b a b ilid a d d e -------
g a n a r la s e rie .6 4 8 .3 5 2
p 2 + 2p 2q + 2 p q 2 + q 2 = p 2 + 2p q ( p + q) + q s
= p z + 2p q + q2 = ( p + q )2 = 1
+ ( 1 X 1 / 6 ) = 1/3 = 1.333
E ( X ) = •X1p(.X1) + X zp ( X ¡¡) + . . . + X x p { X N)
= ( X 1 + X 2 + . . . + X lr) ( l / N ) - X
11 E s lo q u e s e v e r á e n el c a s o d e ¡a b in o m ia l q u e s e e x a m i n a r á e n e l
s ig u ie n te c a p ítu lo . S in e m b a r g o , e n el c a s o d e o t r a s p r u e b a s , e l le c to r h a b r á
d e a c e p t a r s im p le m e n te la v e r d a d d e e s t e a s e r to .
a s E n e l c a p . x x i s e d i s t i n g u i r á l a e x tr a c c ió n d e m u e s t r a s a l a z a r d e o t r a s
f o r m a s d e e x tr a c c ió n d e u s o c o r r ie n t e , ta le s c o m o la s i s t e m á ti c a , la e s t r a t i
f i c a d a y l a d e c o n g lo m e r a d o s .
población, entonces puede ap licarse a veces u n fa c to r de correc
ción p a ra com pensar la fa lta de rem plazo.13
P ese a que los problem as re su ltan te s de la fa lta d e rem plazo
no> sean graves, la fa lta de p ro p o rcio n ar a cada com binación de
individuos la posibilidad de ap arecer en la m u e stra puede tra d u
cirse en u n a grave violación del supuesto de independencia. Su
póngase, p o r ejem plo, que nos dispusiéram os a clasificar los n ai
pes corrientes en c u a tro m o n to n es: uno p a ra los tréboles, o tro
p a ra las espadas, etcétera. Supóngase luego que fuéram os a se
leccionar u n o de dichos m ontones al azar. E s obvio q u e cada
c a rta de la b a ra ja te n d ría la m ism a o p o rtu n id ad (I sobre 4) de
se r seleccionada, p ero in d u d ab lem en te todas las com binaciones
no serían posibles, y n o digam os ya igualm ente probables. E n
efecto, sab iendo que el n aipe de encim a es u n a espada, sabem os
q u e todos los dem ás naipes del m o n tó n son igualm ente espadas.
Las m u estras de área o p o r conglom erados em pleadas com ún
m en te en las investigaciones sociales n o cum plen el su p u esto de
independencia p o r esta m ism a razón. E n efecto, si se seleccionan
al azar 100 m anzanas de casas de u n a población y luego se in
cluye en la m u e stra cada te rc e ra fam ilia de las m anzanas en cues
tión, es obvio que to d as las com binaciones de fam ilias no tienen
la m ism a o p o rtu n id ad d e fig u ra r e n aquélla. E n efecto, dos fa
m ilias de la m ism a m anzana tien en m ayor o p o rtu n id ad de fig u rar
en la m ism a m u estra de lo que es el caso de dos fam ilias en dos
m anzanas distin tas. Como quiera que las m anzanas de casas u rb a
n as suelen se r p o r lo re g u la r relativ am en te hom ogéneas e n cuanto
a ca rac te rístic as tales com o el ingreso o la in stru cció n del jefe
de fam ilia, el re su ltad o de sem ejan te tip o de extracción d e m ues
tr a será m enos exacto q u e u n a selección de u n a m u e stra aleatoria
del m ism o tam año. E sto puede verse in tu itiv am en te si im agina
m os u n a situación en que to d as las m anzanas sean to talm en te
hom ogéneas, com o e ra el caso de los c u a tro m ontones de naipes.
E n tal caso, en efecto, sólo necesitaríam os o b te n e r inform ación
acerca de u n a vivienda e n cada m anzana, y el n ú m ero de "casos"
sería de h echo el n ú m ero de las m anzanos seleccionadas, esto
es, u n N b a sta n te m enor. Según verem os en el capítulo xxi, es
posible o b ten er unos resu ltad o s ex trem adam ente engañosos, si h a
biendo ex traíd o una m u e stra sem ejan te p o r conglom erados, el
investigador se sirve luego de pru eb as estadísticas que presupon
nen u n a extracción al azar.
Un p ro b lem a análogo p u ed e fácilm ente en c o n trarse cuando se
está in teresado en los actos individuales de conducta. Supóngase,
p o r ejem plo, que u n sociólogo efectúa u n experim ento en el que
se sirve de 30 su jeto s, cada uno de los cuales fo rm u la 50 juicios
d istintos. Se ten d ría n en tal caso 1 500 juicios, y nos podríam os
ver inducidos a servim os en u n a p ru e b a estad ística d e sem ejan-
i s V é a s e se c c . X X I .l.
te N artificialm en te ponderada, suponiendo que los 1 500 juicios
en cuestión co n stituyeran u n a m u estra al a z ar de los juicios de al
gún tip o de población. P ero sería m anifiestam ente ab su rd o en
la m ayoría de los casos su p o n er que los juicios de u n m ism o
individuo son estadísticam ente independientes unos de otros. En
efecto, suS p rim eros 30 juicios afectarán probablem ente a los de
m ás, ya que a diferencia de la m oneda, la p erso n a sí tiene m e
m oria.
Supóngase que u n sociólogo se in tere sa a n te todo en p ares de
perso n as, com o unidad, m ás que en el individuo singular. Puede
te n e r u n grupo de 20 personas, cada u n a de las cuales esté en
interacció n con to d as las dem ás. T endría, en consecuencia, (20)
(1 9 )/2 o 190 p ares de personas, p e ro no e staría en condiciones
d e co n sid erar cada p a r com o in dependiente de los otros. Es
obvio que el conocim iento a p ro p ó sito del p a r Sm ith-B row n su
m in istra rá p ro b ab lem en te alguna inform ación sobre los p ares
Sm ith-Jones o B row n-Jones, ya que las m ism as personas figuran
en varios pares.
Los ecólogos, antropólogos y otros sociólogos in teresad o s en
generalizar a p ro p ó sito de localidades, sociedades u o tra s u n id a
des definidas espacialm ente necesitan tam bién p reo cu p arse de la
fa lta de independencia en u n a gran p a rte de su labor. Aquí el
p ro b lem a p arece derivarse del hecho de que las unidades selec
cionadas n o son a m enudo claram ente distintas. E n efecto, las
fro n te ra s de u n a sociedad o u n a localidad pueden se r difíciles
de definir, y u n a u n id ad sem ejante puede p a s a r gradualm ente a
la o tra, siendo las divisiones m ás o m enos arb itra ria s.14 Así, p o r
ejem plo, si se utilizan com o unidades los d istrito s del censo en
el in te rio r de u n a ciudad o los d istrito s te rrito ria le s en el in te rio r
de u n E stado, re su lta a m enudo posible p re d ecir a p ro p ó sito de
u n a u n id ad sobre la b ase d e la un id ad vecina. Si la cuota de delin
cuencia es elevada en u n distrito, es pro b ab le que lo sea tam bién
en el vecino, y a q ue es incluso posible q u e las m ism as ban d as
de delincuentes se extraigan de am bos distritos. Que "algo no
e stá en o rd e n ” en relación con el su p u esto de independencia p u e
de p ercib irse in tu itiv am en te dándose cuenta de que, cuando las
u n id ad es no son claram ente distintas, sería posible p o n d e ra r el
n ú m ero de "u n id a d es” a cualquier tam añ o deseado, co rtan d o
sim plem ente el p astel en m uchos pedazos pequeños. Así, p o r
ejem plo, si no h ay b astan te s sociedades en el m undo p a ra o b ten er
significancia estadística, p o d ría dividirse cada sociedad en 10
subregiones y o b ten er 10 veces m ás "casos”.
14 E s t a s i t u a c ió n s e p a r e c e r í a e n c i e r t o m o d o a l a d e u n a b a r a j a c a d a u n a
d e c u y a s c a r t a s p a s a r a in s e n s ib le m e n te a la s o t r a s , d e m o d o q u e r e s u l t a r a
d if íc il d e c i r d ó n d e u n a d e e lla s t e r m in a b a y e m p e z a b a l a o t r a . O t a m b ié n ,
¡ q u e c a d a c a r t a f u e r a c a p a z d e i n f lu i r l o s v a lo r e s f ig u r a d o s d e s u s v e c in a s
in m e d ia ta s !
E n u n tex to com o éste n o es po sib le exam inar soluciones a los
pro b lem as q ue com portan violaciones del su p u esto de indepen
dencia. Que el a u to r sepa, m uchos de dichos problem as n o h an
sido resu elto s satisfactoriam ente. R esulta a m en u d o difícil apre
c ia r la g ravedad de los erro res introducidos cu an d o no se cum
p len su p u esto s requeridos, com o el de independencia. Pisam os
terren o firm e siem pre que tenem os la seg u rid ad d e que los su
puesto s re q u erid o s p a ra alguna p ru e b a s í se c u m p le n ; p e ro si no
se cum plen, ra ra m e n te re s u lta posible decidir exactam ente en
q ué m edida nos ap artam o s de dichos supuestos. Con o b jeto
de e s ta r seguro, el lecto r h a de ac o stu m b ra rse a exam inar cuida
d o sam ente to d o supuesto. Si se tien en m otivos p a r a d u d a r de
la validez d e alguno, entonces h a b ría q u e co n sid erar seriam ente
el serv irse de o tro p rocedim iento que n o lo contenga. Así, p o r
ejem plo, p o d ría decidirse re c u rrir a o tra u n id a d de análisis, o sea
a la p erso n a, m ás bien q u e a los actos de la co nducta o a los
p ares de personas, o b ien a los delincuentes p a rtic u la re s m ás que
a las ta sa s de delincuencia e n relación con u n d istrito del censo.
Si bien los sociólogos y o tro s que se sirven d e la estad ística
aplicad a h a n p ro p en d id o en ocasiones a p re sc in d ir d e los supues
tos, llegando así a conclusiones infundadas, es tam b ién posible,
p o r o tra p a rte , p e c a r de p ru rito excesivo d e perfección. Como
q u iera que, en efecto, n o nos la s habernos n u n ca con situaciones
ta n sencillas com o las de lan zar u n a m oneda al a ire o sac ar nai
p es de u n a b a ra ja p erfecta, re su lta siem pre posible p o n e r en tela
de ju icio cu alq u ier pro ced im ien to a títu lo d e im p erfecto en rela
ción con el ideal q u e se persigue. S e p u ed e a b rig a r u n tem o r
ta l de v io lar supuestos, que se p re fiere p re sc in d ir p o r com pleto
de to d a técn ica estadística. E s necesario, so b re to d o e n u n a dis
ciplina q u e se ca rac te rice p o r estudios exploratorios y técnicas
científicas relativ am en te im precisas, llegar a com prom isos con
la realidad. E l proced im ien to m ás indicado co n sistirá en h acer
el m en o r n ú m ero de com prom isos posible, d e n tro d e los lím ites
de lo p racticable.
Gwsario
Sucesos
Límite
Sucesos m utuam ente exclusivos
Probabilidad
Muestra aleatoria
Independencia estadística
E jercicios
1. En un simple lanzamiento de u n dado no cargado, ¿cuál es la pro
babilidad de:
a) ¿sacar u n 6?
b) ¿no sacar un 6?
c) ¿sacar un 1 o un 6? Respuesta, 1/3
d) ¿sacar un 1 y un 6?
e) ¿sacar un núm ero im par o un 6?
B ibliografía
1. Alder, H. L., y E. B. Roessler: Introduction to Probdbility and Sta
tistics, 4- ed., W. H. Freeman and Company, San Francisco, 1968,
cap. 5.
2. Feller, William: An Introduction to Prohability Theory and Its
Applications, 3? ed., John Wiley & Sons, Inc. Nueva York, 1967.
3. Freund, J. E .: M odem Elementary Statistics, 3» ed., Prentice-Hall,
Inc., Englewood Cliffs, N. J., 1967, caps. 5 y 6.
4. Gelbaum, B. L., y J. G. M arch: Mathematics for the Social and
Bekavioral Sciences, W. B. Saunders Company, Filadelfia, 1969,
caps. 24.
5. Hays, W. L.: Statistics, Holt, Rinehart and Winston, Inc. Nueva
York, 1963, caps. 2 y 4.
6. Kemeny, J. G., J. L. Shell y G. L. Thompson: Introduction to Fini-
te Mathematics, 2- ed., Prentice-Hall, Inc., Englewood, Cliffs, N. J.,
1966, caps. 3 y 4.
7. Mueller, J. H., K. Schuessler y H. L. Costner: Statistical Reason-
ing in Sociology, 2* ed., Houghton Mifflin Company, Boston, 1970,
cap. 8.
8. Savage, L. J . : The Foundations of Statistics, John Wiley & Sons,
Inc., Nueva York, 1954, caps. 1-3.
X . P R U E B A S D E H IP Ó T E S IS : LA D IS T R IB U C IÓ N
B IN O M IA L
(X.l)
N I = [ N ( N - l ) ( N ~ 2 ) .. . ( N - r + 1 )] U N - r ) . .. (3 )(2 )(1 )]
= [ N ( N — 1)(AÍ — 2 )...(A T — r + l ) ] [ ( A T — r ) ! ]
(4)
(1 0 )(9 )(8 )(7 )
210
(4 )(3 )(2 )(1 )
O bsérvese que al em p lea r la ecuación (X .2) se tiene el m ism o
n ú m ero de facto res en el n u m era d o r y el denom inador. E sto es
siem p re así. E sta segunda fo rm a es m ás sencilla, con fines de
cálculo, que la p rim era. Si r > N/ 2, em pezam os a te n e r algunos
térm in o s que aparecen ta n to en el n u m e ra d o r com o en el deno
m in ad o r y, p o r consiguiente, se elim inan recíprocam ente. P or
ejem plo, si r = 6, tenem os:
N
rrnX-r
p(t-) = ( “7 " J prq'
005
F ig . X .l. Com paración de las regiones críticas de pruebas de una
sola cola y d e dos colas, em pleando el nivel de significación de .05
N? de éxitos Probabilidad
0 V 258 = .004
1 8/ 256 = -031
2 23/256 = -109
3 w/sM = .219
4 TO/ 258 — -274
5 B8/ 256 = -219
6 “ / aM = .109
7 8/ 256 = .031
8 V M8 = .0W
1.000
O tam b ién
««-(!) m r -
21
16 384
w = ( !) (t)W= 1
16 384
21 + 1
P( 6) + P (7 ) = ---------= .0013
16 384
N\
P ( r lt r2, rk) = — — ------------ p / i p 2r* ... pf*
ri'.r2l . . . r lc\
P ( N v N 2 ........ N
P( 6 ,6 ,1 ) =
G losario
Distribución binomial
Región crítica
Distribución hipergeométrica
Modelo versus hipótesis
Distribución multinomial
Pruebas de una y de dos colas
Distribución de Poisson
Distribución de muestras
Nivel de significación
E jercicios
1. En 11 lanzamientos de una moneda insesgada, ¿cuál es la probabi
lidad de obtener exactamente cuatro caras? ¿Exactamente siete caras?
¿Menos de tres caras? Respuesta, P(4) = 330/2.048.
2. Supóngase que la moneda del ejercicio anterior está sesgada y
que la probabilidad de obtener cara es en realidad. 6. Sin efectuar los
cálculos, indíquese de qué modo esto afectaría cada una de las pro
babilidades anteriores (esto es, si las aumentaría, las reduciría o las
dejaría inalteradas). Respuesta, menor de P(4)
3. Supóngase que se quiere verificar la hipótesis nula, en el sentido
de que la moneda es insesgada, echando 11 lanzamientos. Indíquese
la región crítica que se utilizaría:
B ibliografía
1. Alder, H. L., y E. B. Roessler: Introduction to Probability and
Statistics, 4‘ ed., W. H. Freeman and Company, San Francisco, 1968,
cap. 6.
2. Anderson, T. R., y M.Zelditch: A Basic Course in Statistics, 2-
ed., Holt, Rinehart and Winston, Inc., Nueva York, 1968, cap. 11.
3. Bradley, J. V.: Distribution-free Statistical Tests, Prentice-Hall,
Inc., Englewood Cliffs, N. J., 1968, caps. 3 y 7.
4. Hays, W. L.: Statistics, Holt, Rinehart and Winston, Inc., Nueva
York, 1963, cap. 5.
5. Pierce, Albert: Fundamentáis of Nonparametric Statistics, Dicken-
son Publishing Company, Inc., Belmont, Cal., 1970, caps. 9 y 12.
6. Selltiz, C., M. Jahoda, M. Deutsch, y S. W. Cook: Research Methods
in Social Relations, Henry Holt and Company, Inc., Nueva York,
1959, cap. 4.
7. Siegel, Sidney: Nonparametric Statistics for the Behavioral Scien
ces, McGraw-Hill Book Company, Nueva York, 1956, pp. 36-42.
8. Spiegel, M. R.: Theory and Problems of Statistics, Schaum’s Out-
line Series, McGraw-Hill Book Company, Nueva York, 1961, cap. 7.
9. Tables of the Binomial Probability Distribution, National Bureau
of Standards, Applied Mathematics Series, Núm. 6, 1950.
X I. PR U EB A S D E M U E ST R A S S IM P L E S Q U E IM PLIC A N
M E D IA S Y P R O PO R C IO N E S
y
V ar Y — a ,/ = c^a * * + c 22ax22 + . . . + a ^ a ^ 2
= —- [ o2 + o2 + . . . + o®]
2 3 4
a le / 216
E s ta d istribución, com o p u ed e ap reciarse en la fig u ra XI.5 em
pieza ya a acercarse a la fo rm a de la curva n orm al, pese a que
el tam añ o de la m u e stra n o sea m ás que 3. Después de u n exa
m en aten to d e las cifras an terio res, el lecto r e s ta rá e n condicio
nes de co m p ren d er in tu itiv am en te lo que o cu rre y p o r qué se va
obteniendo u n a cu rv a en fo rm a cad a vez m ás p ro n u n ciad a de
cam p an a a m ed id a que la m ag n itu d de N au m en ta. E n efecto,
si bien con u n a sola ju g ad a es tan p ro b ab le sac ar u n 6 com o u n
3 o* u n 4, y de hecho dos 6 son ta n p robables com o dos 3, sólo
hay, con todo, u n a m an era de o b te n e r dos 6, e n tan to que hay
cierto n ú m ero de m an eras d istin tas de o b ten er u n pro m ed io de
3.0 en dos o m ás jugadas. E n lenguaje com ún decim os que los
g randes n ú m eros tienden a se r com pensados p o r pequeños, sobre
to d o si N es grande.
= f 7 500
y/N V I* »
c /y /Ñ
7 900 - 7 500
2.67
150
XI.3 La d istribución t de S tu d e n t
E n la m ay o ría de los casos es to talm en te im p ráctico tr a ta r a o
com o si fu e ra conocida. P or lo re g u la r in cu rrim o s en d ificulta
des considerables con o b jeto de a se g u rar el ca rác te r fo rtu ito de
la m u estra, ya que lo que nos in tere sa en p rim e r térm in o es la
com probación de los su p u esto s acerca de la población a estu d iar.
E n p ru e b as de la clase que se exam ina en este capítulo, es pro-
b ab le q ue el lecto r desee verificar u n a hipótesis relativ a a [x. P ero
si así fu e ra el caso, ¿ e sta rá jam ás en condiciones de conocer el
valo r de o? P rácticam en te no. P orque si tu v iera conocimiento* de
a, e sta ría tam b ién sin du d a alguna en condiciones de conocer ¡x,
a m enos, p o r supuesto, que alguien como, p o r ejem plo, su m aes
tr o de estad ística le estuviera d eliberadam ente o cultando in fo r
m ación. P o r lo reg ular, pues, n o conocerá los valores ni de ¡x ni
de 0. ¿Q ué puede, pues, h ac er en sem ejan te situación? Como
q u iera que el teo rem a del lím ite ce n tral co m porta a, n o puede
ig n o rar su v alo r p o r com pleto. U na solución p o d ría p arece r con
sistir en rem p lazar a p o r s, desviación e s tá n d a r de la m uestra.
De hecho, esto es lo que se hacía co rrien tem en te an tes del des
a rro llo de la estad ística m oderna. E n efecto, en la fó rm u la de
Z, a / \ / N se rem p lazaba sencillam ente p o r s / \ / N y, com o q uiera
q ue s p o d ía calcu larse d irectam en te de los dato s de la m u estra,
no h ab ía m ás incógnitas e n la fórm ula. Y de hecho, este pro ce
d im iento da re su ltad o s razonablem ente buenos cuando N es gran
de. Sin em bargo, com o habrem os de v er a continuación, las
pro b ab ilid ad es o b tenidas e n esta fo rm a pueden ser to talm en te
falaces cu an d o N es relativ am en te pequeño. Veam os p o r qué
es así.
Podem os co n stru ir u n a estad ística altern ativ a d e p ru e b a c o m o :
s/V JV - 1
E sta estad ística fue in tro d u c id a p o r W. S. G osset, que escribía
b a jo el seudónim o de " S tu d e n t”, y se conoce con el no m b re de
d istrib u ció n t de S tudent. C om parando t con Z, observam os
que, en ta n to que los n u m era d o res son idénticos, los denom ina
dores difieren, en cam bio, e n dos aspectos, a s a b e r : 1 ) tenem os
u n A? — 1 b ajo el radical, y 2) a h a sido* rem p lazad a p o r s. Con
o b jeto de co m p ren d er e sta s m odificaciones, exam iném oslas u n a
después de otra._ Al hacerlo habrem os de in tro d u c ir algunas ideas
nuevas.
La desviación están d a r de la m u estra s puede em plearse com o
una estim ación de a. Si b ien el p roblem a de la apreciación se
tra ta rá en el próxim o capítulo, b a ste m encionar aquí q u e a m enu
d o necesitam os que u n a estim ación posea ciertas propiedades.
U na de las propiedades de u n a "b u en a” estim ación es que sea
insesgada. A hora bien, co n tra riam en te a lo que p o d ría suponerse,
re su lta que s n o es u n a estim ación com pletam ente insesgada de a.
P uede d em o strarse m atem áticam ente que o tra cantidad, que po
dem os designar con c y se obtiene m ediante la fó rm u la
2 (X t - X Y
A
a:-V- \ l
'
« -1
N - 1
\/N y/N
N (N — 1)
■« E n r ig o r , n o e s a, l a e s t im a c ió n e q u il ib r a d a d e a, s i n o q u e a 2 e s u n a
e s t im a c ió n e q u i l i b r a d a d e a2. N o te n e m o s p o r q u é p r e o c u p a m o s , c o n to d o ,
p o r e s t a d i s t i n c i ó n s u ti l . E n e s t e te x to n o s s e r v ir e m o s n o r m a l m e n te d e u n
a c e n to c i r c u n f l e j o ( * ) s o b r e u n a l e t r a g r ie g a p a r a i n d i c a r u n a e s tim a c ió n
d e l p a r á m e t r o . A lg u n o s te x to s d e f in e n s c o n N — 1 e n e l d e n o m i n a d o r , p e r o
p r e f e r im o s p o r n u e s t r a p a r t e m a n t e n e r l a d i s t in c ió n e n t r e l a s d o s f ó r m u l a s .
[ I (X i-X m /N
i= l 5
y'N -l y/N -í
7 A lg u n o s t e x to s r e c o m ie n d a n e l e m p le o d e N — 1 p a r a m u e s tr a s p e q u e ñ a s
y d e N p a r a l a s g r a n d e s . S in e m b a r g o , s e m e j a n t e p r o c e d im ie n to p a r e c e
a ñ a d i r u n a c o n f u s ió n in n e c e s a r ia . P o r s u p u e s to , e n e l c a so d e m u e s tra s
g ra n d e s , es in d ife re n te s e rv ir s e d e u n a c if r a o d e la o tra .
desviaciones con resp ecto a X y, p o r consiguiente, sería sorpren
d en te en c o n trar X y s estadísticam ente independientes u n a res
p ecto de o tra. Conociendo la X de la m u estra, esperaríam os
a u m en ta r n u e s tra posibilidad de an tic ip a r s p a ra la m ism a m ues
tra . Acontece, sin em bargo, que, p a ra las poblaciones norm ales
y m u estreo al azar, la m edia y la desviación e stá n d a r de la m ues
tra son estad ísticam ente independientes u n a de o tra. Como q uiera
que, con todo, esta pro p ied ad n o se verifica p a ra to d as las d istri
buciones de la población y que, p o r o tra p a rte , X — jx n o estará
d istrib u id a n o rm alm en te a m enos que N sea grande, de ahí que
al serv im o s de la p ru e b a t hayam os de su p o n er u n a población
norm al.
Problema. S upóngase que se están apreciando los program as
de u n a m u estra al azar de 25 agencias de asistencia social indi
vidual seleccionadas e n tre la población de to d as las del E stado
de Nueva Y ork. Cada u n a de ellas lleva u n reg istro del porcen
ta je de los casos favorables, de acu erd o con u n crite rio uniform e.
Se h a establecido u n a n o rm a según la cual el p o rc en taje m edio
de éxitos sería del 60 p a ra todas las agencias. Sin em bargo, en
su m u e stra el lecto r en c u en tra que el p o rc en taje m edio es del
52 y la. desviación e stá n d a r del 12 p o r ciento. ¿Tiene el lector
algún fu n d am en to p a ra sospechar que p a ra la población co n ju n ta
de las agencias el nivel de los éxitos está p o r debajo de la norm a
esperada?
1. Form ulación d e supuestos. Los supuestos necesarios pueden
en u m erarse com o sigue:
N ivel de m e d ic ió n : escala de intervalo
M o d elo : m u estreo al azar
población n orm al
H ip ó te sis : n = 60 p o r ciento.
s/y/N - 1 12/V 24
0 P e s e a q u e n o p u e d a n o b te n e r s e d e l a t a b l a d e p r o b a b ilid a d e s e x a c ta s ,
l a in te r p o la c ió n , c o n to d o , s ie m p r e e s p o s ib le . S i n e m b a r g o , p o r lo r e g a l a r
b a s t a i n d i c a r q u e p q u e d a e n t r e d o s v a l o r e s d e t e r m i n a d o s , v.gr. .0005< p £
co m p o rtab an u n a escala de intervalo. P or o tra p arte , había
q ue p re su m ir tam b ién n o rm alid ad de población en el caso de
m u estras pequeñas. E n e sta sección verem os cóm o puede em
p learse la ley de los grandes núm eros p a ra a b a rc a r p ru e b as que
co m p o rtan proporciones, siem p re que N sea b a s ta n te grande. En
efecto, las p ro p o rciones se tra ta rá n com o casos especiales de las
m edias, de m odo que n u e stra s consideraciones an terio res segui
rá n ten ien d o aplicación.
Supóngase que tenem os u n a sim ple escala nom inal dicotóm ica.
Podem os q u e re r verificar u n a hipótesis relativa, p o r ejem plo, a
la p ro p o rció n de los varones en u n a población. Asignamos a rb i
tra ria m e n te el v alor u n o a los varones y cero a las hem bras, y
tra ta m o s las m arcas com o u n a escala de intervalo. Aunque no
se dé u n a u n id ad claram en te concebida, a m enos que ésta sea
el a trib u to de “m ascu lin id ad ”, que se posee o n o se posee, pode
m os, con todo, tr a ta r dichas m arcas a rb itra ria s com o u n a escala
d e in terv alo , p o rq u e sólo son dos. Si se añ a d ie ra u n a te rc era
categoría, ello y a n o sería posible, sin em bargo, y a que en tal
caso sería necesario d eterm in a r la posición exacta de dicha ca
teg o ría e n relación con las de las o tra s dos. Lo q u e aq u í decim os,
en efecto, es que n o es necesario h ac er u n a distinción e n tre es
calas nom inales, o rdinales y d e intervalo en el caso de u n a dico
tom ía, ya que el p ro b lem a de c o m p arar distancias e n tre m arcas
n o se p la n te a nunca.
Tenem os así u n a población com puesta p o r e n te ro de unos y
ceros. E s é sta u n a d istrib u ció n bim odal, d e casos concentrados
todos ellos en un o d e lo s dos puntos, que ciertam en te n o es n o r
m al. P ero sabem os que, si N es suficientem ente grande, la dis
trib u ció n de m u estreo de las m edias de las m u estras será aproxi
m ad am e n te ATor(ji, a2 / M) , independientem ente de la fo rm a de
la población. Todo lo que h ay que hacer, pues, es averiguar la
m ed ia y la desviación e stá n d a r de esa población d e unos y ceros.
Pongam os q u e p u re p re s e n ta la p ro p o rció n de varones en la
p o blación y qu la p ro p o rció n d e hem bras, en la s que la u sub
índice in d ica que tra ta m o s de la población universal. Con o b jeto
d e o b ten er la m edia de los unos y los ceros de ésta, sum am os
sim p lem en te los valores y dividim os e n tre el n ú m ero total d e ca
sos. E l n ú m ero de unos será así el n ú m ero to ta l de casos m u lti
p licad o p o r la p ro p o rció n de varones. In d ep en d ien tem en te del
n ú m ero d e ceros, la contribución de éstos a la sum a será cero.
P o r lo tan to , la m edia de la población s e r á :
M pu
M puqu(q u +p „ ) _ J M pvqv
V M ~ V M
* PuQu
Obsérvese, de paso, q u e M se elim ina ta n to e n la fó rm u la de ^
com o en la o, la m edia y la desviación e stá n d a r d e la población
so n independientes de la m ag n itu d re al de la población.
P o r lo tan to , podem os servim os del teorem a del lím ite central
p a ra o b te n e r:
v;
PuQu
°x = Gp* ' N
en donde el sím bolo cPl indica que operam os con el e rro r están
d a r de las p roporciones de la m u estra. E n n u e stra nueva term i
nología, p s su stitu y e a X , pu sustituye a ¡i, y aPt sustituye a c - en
la fó rm u la de Z. Así, p u e s :
M* P& Pu
Oj y/PuQu/N
Glosario
Teorema del límite central
Distribución rectangular
Error estándar
Distribución t
E jercicios
S ( X t ~ X )2
N N 4=1
-------- 52 = ------------------------------
N - l N - l N
I ( X t - X )2
«=i
F ig .
X II.l. Comparación de las distribuciones de m aestreo de
una estim ación sesgada, con alta eficacia, y una estim ación no
sesgada, de eficacia m enor
N _
a la m edia de la m uestra, o sea la ecuación 2 X J N — X . Dado
_ <=i
el valor de X , podem os a trib u ir valores a rb itra rio s a N — 1 de
las X (, y la ú ltim a de éstas e sta rá determ inada p o r la ecuación.
Como q u iera que hem os perdido u n grado de lib e rta d al deter
m in ar el valor de la m edia de la m u estra alrededor de la cual se
han tom ado desviaciones, p a ra o b ten er n u e stra estim ación no
sesgada de a2 hem os de dividir e n tre N — 1 en lugar de N. Si el
lector p refiere p en sa r en esta form a, puede considerar que hem os
aju stad o ligeram ente el núm ero de casos, con o b jeto de com pen
sa r p o r el hecho de que hem os tom ado desviaciones resp ecto de
la m edia de la m u estra y no de la m edia de la población verda
dera. E sencialm ente, al calcular la m edia de la m u estra, hem os
despreciado un caso. Se verá que las estim aciones no sesgadas
n o obtienen frecu entem ente d iv id ien d o 'en tre los grados de liber-
tuü, m ejor que dividiendo e n tre el nú m ero to tal de casos.
I', f ¡ciencia. La eficiencia de u n a estim ación se refiere al grado
en que la distribución de m uestreo está agrupada alrededor del
verdadero valor del parám etro. Si la estim ación no está sesgada,
dicho u gnipam iento puede m edirse p o r medio- del e rro r están d a r
de la estim ació n : cuanto m en o r sea el e rro r están d ar, ta n to m a
yor es la eficiencia d e la estim ación. La eficiencia siem pre es
relativa. Ninguna estim ación puede se r to talm en te eficiente, ya
que esto im plicaría que no existía e rro r de m u estreo alguno. Sin
em bargo, podem os c o m p arar dos estim aciones y decir que u n a
de ellas es m ás eficiente que la otra. Supóngase, p o r ejem plo,
q ue tenem os u n a población norm al. E n e ste caso, el e rro r están
d a r de la selección al azar es a / y / N . Si p a r a ap re c ia r la m edia
de la población se u tilizara la m ediana d e la m u estra, entonces
el e rro r e s tá n d a r de la m ediana sería de 1.253 o / y / Ñ ,1 p a ra m ues
tra s al azar. P o r lo tan to , ya que el e rro r e stá n d a r de la m edia
es m ás peq u eñ o que el de la m ediana, la m edia es la estim ación
m ás eficiente. É sta es, p o r supuesto, la razón d e que p o r lo r e
g u lar se u tilice la m edia con preferen cia a la m ediana, incluso
cuando, com o en el caso d e u n a población norm al, su m edia y
su m ed ian a son idénticas. Decimos que la m ed ia está m enos
su je ta a las fluctuaciones de la m u estra o, en o tro s térm inos, que
es m ás eficien te.2
De los dos criterios que acabam os de exam inar, el de la eficien
cia es el m ás im p o rtan te. Si dos estim aciones tienen el m ism o
grado de eficiencia, escogerem os, p o r supuesto, la que esté m enos
sesgada. É sta es la razón de que se u tilice a con preferen cia a s.
E n cam bio, u n a estim ación eficiente lig eram en te sesgada será
p referib le a o tra no sesgada p e ro m enos eficiente. Un sim ple
d iagram a ay u d ará a co m p ren d er el p o rq u é d e ello. E n la figu
ra X II.l, la curva p u n tiag u d a ligeram ente sesgada sería p re fe ri
ble, ya que, pese a que a la larg a p ropenderíam os a su b estim ar
el p a rá m e tro en u n a peq u eñ a cantidad, tenem os con todo m ayor
p ro b ab ilid ad , en el caso de u n a p ru e b a dada, de o b ten er u n a es
tim ación de la m u e stra relativ am en te vecina del p arám etro . El
hecho de que sepam os que a la larg a las estim aciones se irán
p ro m ed ian d o hacia la cifra co rrecta no nos sirve de gran con
suelo si, en relación con u n a m u estra d eterm in a d a cualquiera,
la aproxim ación tiene probabilidades de a p a rta rs e m ucho del
p arám etro .
F ig .
XII.2. Comparación de intervalos de confianza con la d istri
bución. d e ¡muestreo de la m edia, m o strando p o r q u é los inter
valos de confianza del 95 por ciento com prenden jx
el 95 p o r ciento d e tas veces
xz
f3
¿4
*5
*6
*1
-*3
■*10
s
X ± 2.797 = X ± 2.797
v w -i
cr
.1 = 1.96----- -
y /N
o sea
V aT = J ^ L = 49
y
N = 2 401
B iblio g rafía
E S T A D IS T IC A S BIV A R IA D A S Y M ULTIVARIADA S
X II I. PR U E B A S D E DOS M U E S T R A S : D IF E R E N C IA D E
LAS M E D IA S Y LAS P R O P O R C IO N E S
E ( Y ) = E ( X x - X 2) = ( D E m + ( - 1 ) £ ( X 2) = m - |x*
y
Oí2 022
—¡ j— +
i
0,* = ( l ) 2 0 / + ( - 1 ) 2 0j 2 =
2 Ni —rf—
N2
Obsérvese que si hubiésem os fo rm ad o la sum a de X-¡ y X 2, la
expresión de la variancia p a ra dicha can tid ad h u b ie ra sido la m is
m a que la co rresp o n d ien te a su diferencia. E n el capítulo xvi
estu d iarem o s o tro s tipos m ás com plejos de com paraciones en las
q u e se incluye u n a generalización de esta sim ple com paración
de dos m ed ias de m u estras.
Vamos a v e r ah o ra u n ejemplo- ilu strativ o del em pleo de la
p ru e b a de la diferencia de las m edias. El caso de las 0 conocidas
n o lo exam inarem os, y a dicho p ro b lem a es obvio y m ás bien
poco práctico-. S upondrem os, pues, que las 0 no se conocen. Con
siderarem os dos casos p a rtic u la re s : en el p rim ero supondrem os
que 0X= 02, en ta n to que e n el segundo se su p o n d rán dos 0 des
iguales. Es obvio que estos dos m odelos com prenden todas las
altern ativ as posibles,
Problem a. Se establece u n a com paración e n tre dos tipos d e dis
trito s, o sea e n tre los pred o m in an tem en te u rb an o s y lo-s que son
fu n d am en talm ente ru rales. Los d istrito s en cuestión se com paran
en relación con el p o rc e n ta je de p e rso n a s que votan p o r los de
m ó cratas en u n a elección presidencial, con los siguientes resul
tados :
Distritos urbanos Distritos rurales
N ± = 33 iV2 = 19
= 57 % X2 = 52 %
5! = 11 % s2 = 14 %
M odelo 1: ai = o2
1. S u p u esto s
N ivel de m e d ic ió n : el p o rc en taje de votos dem ocráticos es u n a
escala de intervalo
M odelo: m u estras aleatorias independientes
poblaciones norm ales, ai — a2 = a.
H ip ó te sis: = ^2.
la 2 o3 / l l |N i + #2
=V^vT+ ~ Ñ 7 ~ ° ^ ~ K "ÑT_aV
La varian cia com ún o2 puede evaluarse ah o ra obteniendo u n a
apreciación com binada de am bas m u estras. Como q u iera q u e las
dos variancias de las m u estras se b a sa rá n p o r lo re g u lar en n ú
m eros distin to s d e casos, podem os o b ten er u n a apreciación d e o2
to m an d o u n pro m edio p o n d erad o de las variancias de las m ues
tra s, poniendo cuidado e n dividir e n tre los grados propios de liber
tad , con o b jeto de conseguir u n a estim ación insesgada. E xtrayen
d o la raíz cu ad rada, obtenem os la estim ación de o com o sigue:
A . I ^1S18 + N 2 S 22
a-
+ N2 - 2
_
P u esto q u e : Ar1s12 = 2 ( X a - X x )2, podrem os su s titu ir N 1s 12 p o r :
í=i
—
2 ¿Cu2, en donde x it = X {1 — X i.
Xnz + 2 xiSz
Nt + N2- 2
A ! N lSl* + ¡N1+ N2
c . _ T. = i - -, 7 ' (X III.4 )
2 i AT-i + iVo — 2 " N i N i
P o r lo tan to ,
(X t — X 2) — 0 _ 5 7 - 5 2 _
358
a I s i2 s22
= 1 ñ = i + J ¡¿ ri W
E n el ejem plo em pleado an terio rm en te tenem os, p u es:
V a t.- i n, - iJ
” ( A Y ( « í i H & r (s~ n )™ ,
E n esta fo rm a obtenem os en el ejem plo a n te rio r:
1. Supuestos.
N ivel de m edición: el tipo de recreación com o dicotom ía
M odelo: m u estreo al azar independiente
H ip ó tesis: pUl = p n (im plica ax = as )
o — ~\/PuQu
p odem os p o n e r a = V PuQu
Así, pues
A A , ¡ ¿*1 + N2 ^|a A + Í V 2
C¡ ~ * J Ni
p* i - p*2 “ ° 1 N tN 2 1 1 NiN. (XIIL8)
P o r lo tan to , qu = 1 — p u = .479
150 + 120
SPn-> .2 = V ( - 5 2 1 ) ( . 4 7 9 ) /
(150)(120)
= (.4996) (.1225) = .0612
Y de ahí que
( P „ , - f t 2) - 0 .5 7 - .4 6
Z= ---------------= _ ü_ _ = 1.80
5. Decisión. Como quiera que con u n a p ru e b a de u n a sola cola
la p ro b ab ilid ad de o b ten er u n valor d e Z igual o m ayor que 1.80
es de .036, siem pre q u e la hipótesis n u la sea efectivam ente co
rrecta, podem os d e sc a rta r esta hipótesis al nivel de .05. Conclui
m os, pues, que existe u n a diferencia significativa en relación con
la preferen cia de tipos de recreación pasiva en tre las dos clases
de trab a jad o res d e la fáb rica considerada.
H ay que m en cionar aquí que existen diversas clases a lte rn a ti
vas de p ru ebas, la m ás im p o rtan te de las cuales es la de la 1 y_ al
cuadrado, que se exam inará en el capítulo xv, que pueden u tili
za rse en lu g ar de la p ru e b a de la diferencia de las proporciones.
Com o q u iera que, e n efecto, el em pleo de la p ru e b a de la dife
ren cia de las proporciones está lim itado a dos m uestras y una
variab le dicotóm ica, é sta no re su lta ta n p rá ctica com o la p ru eb a
% al cuadrado, que puede aplicarse lo m ism o a tres o m ás m ues
tra s . Sin em bargo, u n a de las ventajas de la p ru e b a de la diferen
cia de las p roporciones es que, m ed ian te m odificaciones adecua
das, se la puede u tiliza r en el caso de m u estras de áreas o p o r
conglom erados. D esafortunadam ente, las m odificaciones en cues
tió n n o tienen cabida en el m arco del p re sen te texto.
* Diferencia de diferencias de proporciones. Podem os am p liar
fácilm ente el p rincipio de u n a p ru e b a p a ra u n a diferencia de p ro
porciones (o m ed ias) h a sta a b a rc a r u n a diferencia de d iferen
cias, o incluso u n a d iferencia de diferencias de diferencias. Su
pongam os, p o r ejem plo, q u e tenem os datos relativos ta n to a
trab a jad o res com o a trab a jad o ras, y que deseáram os co m parar
los sexos en o rd en a la relación e n tre los trab a jo s realizados
y las preferencias recreacionales. Tal vez encontraríam os en el
caso de los h o m bres u n a diferencia ta l com o la que acaba
m o s de ilu strar, p e ro ninguna en el caso de las m ujeres. O tal
vez la dirección de la diferencia pu ed a re s u lta r co n tra ria e n tre
am bos sexos. A m pliando esta ilustración podríam os d esear agre
g ar el d ato relativo a las edades. E n tal caso puede concebirse
que ten d ríam o s u n a diferencia de diferencias (e n tre h om bres y
m u je re s) en el caso de los trab a jad o res jóvenes, y u n resu ltad o
d istin to p a ra los trab a jad o res adultos. P uede observarse q u e es
tam os an ticip an do problem as que ta l vez su rja n cuando m an eje
m os m ás de dos variables, y cuando las diferentes variables pue
d an cau sar peculiares efectos com binados. En tales casos se
afirm a que hay "in teracció n ” e n tre las variables, o q u e sus efec
to s unidos son n o aditivos. E n los capítulos xvi y xx tendrem os
o p o rtu n id ad de estu d ia r con m ás d etalle estos tipos de posibili
dades.
E n el m uy sencillo ejem plo en el que deseam os co m p arar las
diferencias de proporciones e n tre h om bres y m ujeres, suponga
m os que p Ul y p „2 re p resen ta n las proporciones de población p a ra
h om bres, com o en el a n te rio r ejem plo. T endrem os entonces dos
pro p o rcio n es sem ejantes, p U3 y p „4 q u e re p re se n ta rá n las m u je
res, y p o d ríam o s h ac er u n a p ru e b a sim ilar de la hipótesis nula,
ta l como, p a ra las m u je re s p«3 —A,4. P ero podem os p ro b a r asi
m ism o la h ip ó tesis m ás com pleja de que las diferencias (d e p o
b lació n ) p a ra los sexos son tam b ién idénticas. N u e stra hipótesis
n u la p asa así a se r
Y = c xp Sl + c2p S2 + csp ss + c 4p H
y
P v xQux P«8<7«8 í*«4*7«4
g tt ~ — Nn ------
x 1--------N
¡rr------ 1— t í ------- 1-------- n —
z Ns N4
( P gl ~ P s2 ) ~ ( P s 3 ~ P H )
1 63 68 5
2 41 49 8
3 54 53 - 1
4 71 75 4
5 39 49 10
6 44 41 - 3
7 67 75 8
8 56 58 2
9 46 52 6
10 37 49 12
11 61 55 —6
12 68 69 1
13 51 57 6
52
1. S u p u esto s
N ivel de m edición: El p o rc en taje de los votos es u n a escala
de intervalo
M odelo: muestreo- aleatorio
diferencias de población d istrib u id as n o rm alm en te
H ip ó te s is : [xD = 0.
X D = 52/13 = 4.0
P o r consiguiente:
B iblio g rafía
ABBABAAABABBABBAAABAAB
y no com o
AAAAAAAAABABBBBBBBBBBB
1. Supuestos.
N ivel de m e d ic ió n : el prestigio com o escala ordinal
M odelo: m u estras aleatorias independientes
H ip ó te s is : las m u estras se han extraído de poblaciones con
las m ism as distribuciones continuas.
2N1N 2
m edia = iv= ----- — + 1 (X IV .l)
^ Nx+ N2
y la
desviación e s tá n d a r = ar
V M A M - N, - n
(N 1 + N 2) H N 1 + N 2 - l )
2)
( XI V. 2 )
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Tenem os p o r consiguiente:
r-Ur 12 - 10.47
Z = ----- üü = ---------------= .725
crr 2.11
y la ___________________
N j .N Ú N t + N a + 1 )
V-------------—------------ (XIV.4)
3. N ivel de significación y región critica. Con fines d e com pa
ración, seguim os sirviéndonos del nivel de .05, sin p re d ecir la
d irección de la relación.
4. Cálculo de la estadística de la prueba. La estad ística U pue
de calcularse p o r u n o de los dos m étodos siguientes. Con N pe
queñ a será relativ am en te sencillo calcu lar U siguiendo el proce
d im iento im plicado en la fó rm u la de definición. C entrándonos en
cad a u n o de los nueve grupos de la segunda m u estra, contem os
el n ú m ero de casos de la p rim e ra m u e s tra que tienen m en o r
prestig io y, p o r lo tan to , m ayores m arcas de orden. Como q u iera
que la p rim e ra organización de la segunda m u e stra se h a clasifi
cado com o te rc era en prestigio, hay en la p rim e ra m u e stra ocho
grupos con m arcas de prestig io inferiores. Y en fo rm a análoga,
el segundo g ru p o de la segunda m u e stra se clasifica com o octavo,
de m o d o que hay cu atro grupos en la o tra m u e stra con m arc as de
prestig io inferiores. P rosiguiendo el proceso p a ra cada u n a de las
organizaciones re sta n te s de la m u e stra 2 y sum ando, o b te n e m o s:
17 = 8 + 4 + 3 + 2 + 2 + 1 + 1 + 0 + 0 = 21
í/' = 9 + 9 + 8 + 8 + 8 + 8 + 7 + 6 + 4 + 2 = 69
o b ien
u- = n , n 2 + J ^ ± 1 L - Rí
R x = 76 Ro, = 114
R ¡+ R a = 3 1 ± ± L
o bien
19(20)
76 + 114 = ---- -— i - = 190
9(10)
1 7 = 1 0 (9 ) + 114 = 90 + 4 5 - 114 = 21.
i/.V.A/.Í.V + 1 )/',
V - N XN J 2 2 1 -4 5
Z = ----------------- — ------------= ------------ ------------ = -1-96
y'Ñ ^Ñ J.W ^+ N 2 + l ) / l 2 V 1 0 ( 9 ) (20)/12
V - NrN.,/2
— — (X IV .9)
V l N iN n / N ( N - l)][(A ís - A /r) / 1 2 - 2 r i ]
2 T¡ = T i + T« = í*— 1 + M ~ fa
12 12
23-2 33 — 3 6 24
= ------------ 1------------- = ----- i----- = 2 5
12 12 12 12
y
E sta corrección de los em pates sólo p u ed e em plearse con la apro
xim ación norm al, ya que las tablas exactas se h an calculado sin
te n e r e n cu en ta los em pates. P or lo regular, el efecto del facto r
de corrección será despreciable salvo si el núm ero de em pates
es m uy gran d e.2 Si el n ú m ero de em pates es extrem adam ente
g ran d e d eb erá u sarse probablem ente la p ru e b a de S m irnov (ver
m ás a b a jo ) com o altern ativ a a la de M ann-W hitney.
C om paración en tre las pruebas de M ann-W hitney y de las se
cuencias. P ara am bas p ru e b as la hipótesis n u la es que las dos
m u estras se h an extraído de poblaciones iguales. P or lo regular,
n u e stro in terés se c e n tra en las diferencias de tendencia central,
com o en el caso de la p ru eb a de la diferencia de las m edias. En
ocasiones, sin em bargo, podrem os e s ta r m ás interesados e n las
diferencias de d ispersión o de form a. A títu lo de enunciado ge
neral, podem os d ecir que la p ru e b a d e M ann-W hitney será m ás
fu e rte que la d e las secuencias, siem pre q u e las m ayores d iferen
cias e n tre las dos poblaciones sean con respecto a la tendencia
central, en ta n to q u e la segunda se rá m ás fu e rte en aquellas si
tuaciones en que las poblaciones sólo difieren ligeram ente en
cu an to a la ten d encia central, p ero sustancialm ente, en cam bio,
en d ispersión o e n form a.
Un sim ple ejem plo serv irá p a ra ilu s tra r este punto. Supóngase
que tenem os dos poblaciones de m edianas iguales, pero, en u n
caso, con u n a d istrib u ció n m uy hom ogénea y, en el otro, m uy
heterogénea. P odríam os, en tal caso, e sp e ra r resultados com o los
siguientes :
Muestra 1 Muestra 2
5 1
6 2
7 3
8 4
9 13
10 14
11 15
12 16
ÍRj = 68 R2 = 68
2 P a r e c e r í a c o m o s i l a c o r r e c c ió n d e lo s e m p a te s r e d u j e r a s ie m p r e e l d e
n o m i n a d o r s i n c a m b i a r e l n u m e r a d o r , p e r o d e b e m o s t e n e r p r e s e n t e q u e d i
c h o s e m p a t e s h a r á n n o r m a l m e n t e q u e U y U’ s e a p r o x im e n , io q u e s e t r a
d u c i r á a s u v e z e n u n a d i s m i n u c ió n d e l n u m e r a d o r .
E n este ejem p lo extrem o, la p ru e b a de M ann-W hitney n o condu
ciría a d e sc a rta r la hipótesis n u la (la cual es m an ifiestam en te fal
sa), p o rq u e es exactam ente igual a R a. S irviéndonos d e la
p ru e b a d e las secuencias, e n cam bio, estaría m o s m anifiesta
m en te en condiciones de d esc artar, p o rq u e sólo ten d ríam o s tre s
secuencias. Como q u iera que d e ja r de d e sc a rta r significa com eter
un e rro r de tip o II, vem os q u e en este caso la fu erza de la p ru e
b a de las secuencias es m ay o r que la de la M ann-W hitney. E n la
m ayoría de los casos, tenem os m ás pro b ab ilid ad es de h a lla r dife
rencias en la ten d en cia cen tral, con diferencias relativam ente
m enores en dispersión. El le c to r h a r á bien en convencerse p o r sí
m ism o q ue e n el caso de tales poblaciones tenem os pro b ab ilid a
des de o b te n e r u n n ú m ero relativ am en te g ran d e d e secuencias
h acia el ce n tro de la distribución. Y en relación con sem ejantes
datos, la p ru e b a de las secuencias se rá m u ch o m enos fu e rte que
la de M ann-W hitney. E n relación con la m ayoría de las aplicacio
nes sociológicas, la p ru e b a de M ann-W hitney p arece ser la m ás
ú til de las dos.
* Si se h a conseguido u n nivel de escala de intervalo y se su
ponen leg ítim am ente poblaciones norm ales, p u d o h ab e rse efec
tu ad o la p ru e b a t p a ra la d iferen cia e n tre las m edias. E n tales
condiciones, ¿cuánto p erd eríam o s sirviéndonos de la p ru e b a de
M ann-W hitney, cayendo p a ra ello h ac ia a trá s en cu an to al nivel
de m edición y sirviéndonos de u n m odelo m ás débil? La eviden
cia está en que, en el caso de m u e s tra s m edianas y grandes, la
eficacia de la fu erza de la p ru e b a d e M ann-W hitney es aproxim a
d am en te del 95 p o r ciento en com paración con la de la t. La efi
cacia de la fu erza es asim ism o m u y g ran d e en el caso de m ues
tra s pequeñas, pese a que los valores n u m érico s exactos n o sean
fáciles de o b tener. B radley [ 1 ] observa q u e e n general la eficacia
de m uchas p ru e b a s n o p aram étrica s, e n tre ellas la d e Mann-
W hitney, es relativ am en te m ay o r p a r a las m u estras pequeñas que
p a ra las g randes. Así, pues, la p ru e b a de M ann-W hitney consti
tuye u n a altern ativ a m uy fu e rte de la p ru e b a t. E n v ista del he*-
cho de que re q u ie re su p u esto s m u ch o m ás débiles, d eb e ría em
p learse en aquellas situaciones en q u e existe alguna d u d a razo
n ab le de la legitim idad ya sea d e la escala de in terv alo o de la
n o rm alidad. Se sabe m enos, e n cam bio, a p ro p ó sito d e la eficien
cia de la fu erza d e la p ru e b a d e las secuencias. S m ith [ 8] h a
en c o n trad o eficiencias de ap ro x im ad am en te el 75 p o r ciento en
varios ejem plos em píricos, en los q u e los tam añ o s de las m ues
tra s eran d e alre d ed o r de 20 y las poblaciones norm ales presen
ta b a n desviaciones e stá n d a r iguales. B radley [1 ] observa que la
eficacia de la p ru e b a de secuencias con m u estra grande, es, p o r
com paración con la p ru e b a t, d e ap ro x im ad am en te u n tercio, en
igualdad de condiciones.
X IV .4. La prueba de K olm ogorov-Sm im ov
La p ru e b a de K olm ogorov-Sm irnov, que designarem os sim ple
m en te com o p ru e b a de Sm irnov, es o tra p ru e b a n o p ara m é tric a
de dos m u estras, que re q u ie re los m ism os su p u esto s q u e las
p ru e b as de las secuencias y de M ann-W hitney. La fu erza de
la p ru e b a S m irnov es e n general difícil d e evaluar, p e ro en aque
llas situaciones en q u e la población difiere solam ente en relación
con la tendencia cen tral, dicha fuerza parece e sta r co m p ren
dida e n tre las de las p ru e b as de lás secuencias y la de Mann-
W hitney. (B rad ley [1 ], p p . 291-292.) E n u n sen tid o estricto , la
p ru e b a S m irnov tam poco supone em pates, pero, com o verem os,
el p ro ced im ien to es m u y conveniente e n las situaciones en que
se d a u n bu en n ú m e ro de em pates, com o re su ltad o de h ab e r
ag ru p ad o los dato s e n categorías ordenadas.
E n la investigación sociológica nos servim os con m u ch a fre
cuencia d e variables q u e son en re alid ad escalas ordinales, p ero
en relació n con las cuales los datos se h an agrupado, con todo, en
tre s o m ás categorías grandes. Si se d an c u a tro o m ás categorías
o rd en ad as de e s ta clase, la p ru e b a de S m irnov re su lta rá p a rtic u
larm e n te ú til, en ta n to q u e el n ú m ero de em p ates p ro h ib iría p ro
b ab lem en te el em pleo de la de M ann-W hitney. Un sociólogo pue
de acaso h a b e r dividido los residentes de u n a localidad en seis
clases sociales, tra ta n d o a todas las p erso n as de u n a clase com o
ligadas a los dem ás m iem b ro s de la m ism a con respecto a la ca
ra c te rístic a general. O pu ed en h a b e rse o rd en ad o las ocupaciones
según la condición d e las p erso n as asignándose a todas las de
la m ism a clase d e ocupación m arc as em p atad as. Tal vez se haya
en co n trad o u n a v ariab le d e co m p o rtam ien to que dé u n a escala
de G u ttm an con siete tip o s d e resp u estas. E n todos estos ejem
plos podem os q u e re r concebir la v ariab le com o continua en re a
lidad, p e ro el in stru m e n to de m edición h a sido excesivam ente
im p erfecto y h a p ro p o rcio n ad o datos q u e se hallan agrupados en
u n n ú m ero re lativ am en te pequeño d e categorías ordenadas. Lo
m ism o que en el caso de las escalas de intervalo, cu an to m ás
su tiles sean las distinciones y cu an to m ay o r sea el n ú m ero de las
categorías em pleadas, ta n to m enos in fo rm ació n se pierde.
E l p rin cip io que se h alla e n la base de la p ru e b a de S m irnov
es m uy sencillo. Si la hipótesis n u la de que se h an extraído
m u e stra s aleato rias independientes, de poblaciones idénticas, es
co rrecta, entonces esperarem os que las distribuciones de frecuen
cia acu m u lad a d e las dos m u estras sean fund am en talm en te si
m ilares. La estad ística de la p ru e b a em pleada en la p ru e b a de
Sm irnov es la d iferen cia m áxim a e n tre las dos distribuciones
acum uladas. Si d icha d iferencia es m ay o r de lo que se esp eraría
p o r azar con la h ip ó tesis nula, esto significa que la diferencia
e n tre las d istrib u cio n es se h a hecho ta n gran d e que decidim os
d esc artar la hipótesis. Podem os to m a r la diferencia m áxim a ya
sea en u n a sola dirección (si ésta se h a anticipado) o en am bas
direcciones.
Problema. Supóngase que hem os dividido una m u e stra al azar
de varones adultos de u n a localidad en seis clases sociales y los
hem os clasificado al propio tiem po según sus aspiraciones b ajas
o altas de cam bio. E stas dos últim as categorías pueden conside
ra rse com o m u estras aleatorias independientes de las poblacio
nes m ás am plias de varones adultos con aspiraciones b ajas o
resp ectivam ente altas, ya que u n a m u estra to ta l com pletam ente
al azar asegura la independencia e n tre las su b m u estras que po
dam os escoger. Supóngase que hem os anticipado que los de as
piraciones de cambio- elevadas ten d erán a ocu p ar u n a posición
de clase su p erio r a los de aspiraciones b ajas. ¿Podem os concluir
que los resu ltados son significativos al nivel de .0 1?
Aspiraciones Aspiraciones
Clase bajas altas
B a ja in fe rio r 58 31
B a ja s u p e rio r 51 46
M e d ia in f e r io r 47 53
M e d ia s u p e r io r 44 73
A lta in f e rio r 22 51
A lta s u p e rio r 14 20
T o ta l 23 6 27 4
1.36 Y
■f = 4D2 N lN ‘2 - ( X IV .10)
1 Nx + Na
en donde los grados d e lib e rta d asociados a la ^-cuadrada son
siem pre dos en e s ta p a rtic u la r aplicación. Si bien al em p lear
la aproxim ación de la ^-cuadrada se suponen distribuciones con
tin u as de la población, si los datos son en re alid ad discretos y
d an lugar, en consecuencia, a grandes n ú m ero s de em pates, las
p ro b ab ilid ad es o b ten id as quedarán, e n caso de desearse el des
carte, en sen tid o conservador. E n o tro s té rm in o s: las v erdade
ra s p ro b ab ilid ad es serán m enores q u e las calculadas.
3. N ivel de significado y región crítica. El p ro b lem a re q u ie re
el nivel de significado d e .01. Y a q u e se h a an ticip ad o la direc
ción, nos servirem os d e la aproxim ación d e la ^-cuadrada.
4. Cálculo de la estadística de la prueba. O btenem os p rim ero
las d istribuciones de frecuencia acu m u lad a de cada u n a de las
m u estras (véase c u a d ro X IV .l), ex presando los valores de F
com o p roporciones d e las m agnitudes to tales de las m u estras.
Así, pues, el p rim e r v alo r in scrito e n la colum na de las F de la
m u e stra 1 será 58/236, o sea .246; el segundo se rá 109/236, o
.462, y así sucesivam ente. Las ú ltim as anotaciones de cada co
lu m n a serán, p o r supuesto, la unidad. F orm am os ah o ra una
colum na de las diferencias, F1 — F2, y localizam os la diferencia
m ay o r con el signo positivo, ya que anticipam os m ayores p o r
cen tajes de las clases in ferio res con aspiraciones b ajas, o sean
m ayores valores de Ft . E ste valor de D re su lta se r de .187, com o
lo indica la flecha. A continuación calculam os el v alor de la
X - c u a d r a d a sirviéndonos de la ecuación (X IV .10).
5. Decisión. O bsérvese q u e cu an to m ay o r sea el v alor de D,
ta n to m ay o r será la ^-cuadrada. P o r lo tan to , sólo necesitam os
sa b e r cuán g ran d e d eb a s e r ésta p a r a d e sc a rta r la hipótesis nula.
R ecurrim os, pues, al cu ad ro de la x-cuadrada (c u a d ro i del Apén
dice 2 ), b u scam os los grados de lib e rta d de a rrib a a b a jo en el
m arg en izquierdo, y el nivel de significación, arrib a, de izquierda
a derecha, y vem os que, con 2 grados de lib ertad , co rresponde
al nivel .01 el v alo r 9.210. E sto significa que si la hipótesis n u la
fu e ra cierta, o b ten d ríam o s u n a ^-cuadrada de e s ta m agnitud, o>
3 D e b id o a e llo t a l v e z s e p o d r á a p l a z a r e l e s t u d io d e l a p r u e b a d e Smir*-
n o v h a s t a d e s p u é s d e h a b e r le íd o e l c a p . xv.
C uadro X IV .l. Cálculos para la prueba de dos m uestras
de S m irn o v
Aspiraciones de cambio
Clase Diferencias
Altas F1 Bajas F2
Debajo de la baja
superior 58 .246 31 .113 .133
Debajo de la media
inferior 109 .462 77 .281 .181
Debajo de la media
superior 156 .661 130 .474 .187
Debajo de la alta
inferior 200 .847 203 .741 .106
Debajo de la alta
superior 222 .941 254 .927 .014
Total 236 1.000 274 1.000
n ,n 2 236(274)
/2 -4 m — 4(.187)2. - 17.74
Nx+ N 2 236 + 274
m ayor acaso, m enos del uno p o r ciento de las veces. Y ya que ob
tuvim os u n a /-cu a d rad a de 17.74, vem os que podem os d esc artar
la hipótesis nula. E sta m ism a p ru e b a de la /-cu a d rad a puede em
p learse en relación con m u estras pequeñas cuando se h a antici
p ad o la d irección; y si se tiene interés en d e sc a rta r la hipótesis
nula, la aproxim ación de la /-cu a d rad a será en realid ad conser
vadora. E n o tro s té rm in o s : las probabilidades obtenidas con este
m étodo serán m ayores que las reales.
Si no se h u b iera anticipado la dirección, entonces necesitaría
m os, p a ra o b ten er significación al nivel de .01, u n valor de D que
sea p o r lo m enos igual o su p erio r a
Ni del Orden de
Grupo A Grupo B Diferencia la diferen órdenes
par negativos
cia
1 63 68 5 (+ ) 6
2 41 49 8 ( + ) 10.5
3 54 53 -1 ( - ) 1.5 1.5
4 71 75 4 (+ ) 5
5 39 49 10 ( + ) 12
6 44 41 -3 (-) 4 4
7 67 75 8 ( + ) 10.5
8 56 58 2 (+ ) 3
9 46 52 6 (+ ) 8
10 37 49 12 ( + ) 13
11 61 55 -6 (-) 8 8
12 68 69 1 ( + ) 1.5
13 51 57 6 (+ ) 8
Total 13.5
Con fines de com paración, sirvám onos de los m ism os datos u ti
lizados en el caso de la p ru e b a t correspondiente. El cu ad ro X IV .2
re p ite dichos datos y p roporciona al p ro p io tiem po los cálculos
necesarios p a ra la p ru e b a de W ilcoxon. O bsérvese que, al ignorar
los signos, algunas de las m arcas de las diferencias re su ltan em
p atad as en cu an to a la m agnitud. E n ta l caso, dam os u n a vez má*
a las m arcas em patadas el valor prom edio que h ab ría n tenido de
n o estarlo .4 Así, p o r ejem plo, tenem os dos diferencias d e tam a.
T = 1.5 + 4 + 8 = 13.5
1. S u p uestos.
N ivel de m e d ició n : escala m étricam en te ord en ad a (las m a r
cas de las diferencias pueden o rd en arse).
M odelo: m u e stra s aleatorias.
H ip ó tesis: la su m a de los órdenes positivos = a la de los
órdenes negativos en la población.
y desviación e s tá n d a r = or = ^ ^ (X IV .12)
X IV .6. R esu m en
E n el p re sen te capítulo hem os exam inado c u a tro p ru e b as n o p a
ra m é tricas d istin tas. E n los capítulos sucesivos verem os otras.
Tal lecto r h a b rá observado, sin duda, que todas esas p ru e b a s,n o
p a ra m é tric a s co m p o rtan h a s ta aq u í ideas m uy sim ples y consi
d erab lem en te m enos cálculos q u e la p ru e b a d e la d iferencia de
las m edias, p o r ejem plo. É sta es u n a razón m ás e n fav o r de nues
tr a tesis en el sen tid o de que, en el fu tu ro , los sociólogos se
servirán m ucho m ás de estas p ru e b as n o p aram étricas. P o r des
gracia, en u n tex to general n o se p u ed e h ac er m u ch o m ás que
exam inar un as pocas de esas p ru e b as brevem ente. Algunas de las
p ru e b as exam inadas en el p re se n te capítulo tienen adem ás algu
n as o tras aplicaciones que no se h an exam inado. Así, p o r ejem plo,
la p ru e b a de las secuencias p u ed e em plearse com o p ru e b a del
c a rá c te r fo rtu ito . L a p ru e b a de Sm irnov, p o r su p a rte , puede
u tilizarse com o p ru e b a de u n a sola m u e stra p a ra c o m p arar las
frecuencias observadas con las q u e se h an an ticip ad o teórica
m ente. E n algunos casos, pueden o b ten erse intervalos d e confian
za em pleando procedim ientos no param étricos. P o r lo tanto, una
vez que se h aya fam iliarizado con las p ru e b as tra ta d a s en este
texto, el lecto r p ro p e n d erá ta l vez a co n su ltar o b ras m ás especia
lizadas. A fortunadam ente, m uchos de estos procedim ientos no
p aram étrico s pu ed en com prenderse fácilm ente, au n p o r p a rte del
lecto r sin g ran p rep aració n m atem ática. Es u n a suerte, tam bién,
que cierto n ú m ero de esos procedim ientos hayan sido resum idos
en textos recientes de Siegel [7 ], B radley [1 ] y Pierce [5]. El
lecto r p o d rá co n su ltar asim ism o con provecho la extensa biblio
g rafía sobre m étodos n o p aram étrico s com pilada p o r Savage [ 6].
T anto en este ca p ítu lo com o en el a n te rio r hem os observado
q u e es necesario' d istin g u ir e n tre m u estras que fu ero n seleccio
n ad as in d ependientem ente, y aquellas que h a n sido paread as o
en las que se incluyen com paraciones de puntuaciones correspon
dientes a los m ism os individuos. De e sta m anera, la indepen
dencia, o la fa lta de ella, e n tre m u estras, es u n a de las considera-
raciones que deben h acerse cuando se escoge e n tre distintos
pro cedim ientos estadísticos. E n el caso de m u estras paread as
fo rm am o s u n a sim ple p u n tu ació n p a ra cad a p a r, y a continuación
utilizam os el d ato com o si se tra ta ra d e u n a sola m uestra. Cuan
do las m u estras h a n sido tra ta d a s independientem ente, no siendo
ta l vez iguales p o r o tra p a rte los tam añ o s de las m u estras,
fo rm ulam os la h ip ótesis nula, suponiendo que h a hab id o m u és
treo s in dependientes de las m ism as poblaciones, y que la d is tri
bu ció n de n u e stra estad ística de la p ru e b a (Z, t, r, U o D ) se
b asó e n dicho su puesto. E stos principios se am plían fácilm ente
a m ás de dos p ru eb as. E n los capítulos xv y xvi observarem os
com paraciones e n tre tre s o m ás m u estras seleccionadas indepen
dien tem ente, cuan do la segunda variable p u ed e se r u n a escala
nom inal, o rd in al o de intervalo. Aun cuando no nos cen trarem o s
en el exam en de ejem plos m ás com plejos, e n los que haya im
plícitas m ás de dos m u e stra s p areadas, p o d rá verse e n el e je r
cicio 5 del cap ítu lo a n te rio r y en el ejercicio 5 d e este m ism o
capítulo, que la am pliación es directa. La id ea b ásica es la de
que u n o o b tiene u n a sola p u n tu ació n p a ra cad a p a r (la que pu©-
d e re s u lta r de u n a d iferencia de diferencias o alguna o tra función!
m ás com p leja), p ro ced ien d o a continuación com o si se hubiese
tra ta d o de u n a sim ple m u e stra de tam añ o N, en la que N re
p re se n ta el n ú m ero d e p ares (o d e trío s, etc é te ra ).
E n el p re sen te ca p ítu lo abordam os p o r p rim e ra vez u n pro b le
m a d e tip o general, a s a b e r : el del c rite rio q u e h a d e aplicarse al
escoger e n tre p ro cedim ientos estadísticos altern ativ o s. Nos hem os
c e n tra d o especialm ente en el concepto de la eficacia de las fu e r
zas relativ as d e las p ru e b as p o r el hecho de que algunas d e éstas
req u ieren supuestos m ás fu ertes que o tras. No debe sin em bargo
el le c to r q u ed arse b a jo la im p resió n de que el problem a es tan
sencillo com o aq u ella d istinción da a en ten d er. Ya se h a hecho
n o ta r q ue en la m ayoría de los casos p ráctico s n o se conoce lo
su ficien te acerca del v alo r real de los p a rá m e tro s com o p a ra
b a s a r en ta l conocim iento unas conclusiones definitivas. H ay ad e
m ás o tra cuestión, m ás técnica, que no hem os discutido. E n ella
están im plicadas las sensibilidades relativas d e las p ru e b as en
ord en a la violación de los supuestos requeridos. P or ejem plo :
¿qué p erju icio se causa si se u tiliza u n a p ru e b a de diferencia de
m edias cu an d o la población tiene u n a fo rm a especificada com o
no n o rm al? ¿Q ué o cu rre si se viola el su p u esto de las escalas
de intervalo? Los estadísticos em plean la expresión robustez de
una prueba cu an d o aluden a su sensibilidad a n te diversas clases
de distorsiones. L a ro b u stez re su lta p a rtic u la rm e n te difícil de
ev aluar cuando son varias las distorsiones, o los supuestos no
cum plidos, cuya aplicación es sim ultánea. Aun cuando los proce
dim ientos p aram étrico s, tales com o la p ru e b a de la diferencia
de m edias, p u ed en parecer razo n ab lem en te ro b u sto s b a jo m uchas
situaciones, hay diferencias d e opinión en cu a n to a lo aconseja
ble que re su lte u tiliz a r tales p ru e b as cuando se dispone de a lte r
nativas no p aram étricas.
N u estra p o sición es la d e que cu an d o n o se pueden aplicar
criterio s claros lo p ru d e n te es u tiliza r v arias p ru e b as diferentes,
tan to p aram étrica s com o n o p aram étrica s, publicando los dos'
grupos de re su ltad o s p a ra que el lecto r p u ed a sac ar sus propias
conclusiones. H ab itu alm en te se hace esto dando, en no tas al pie
de la página, los resultados de u n a segunda pru eb a, com entando
las razones p o r las cuales las conclusiones no re su lta ro n idénti
cas. C uando h ay u n a p ru e b a (o estim ación) n o p aram étrica dis
ponible, cuya fuerza sea casi ta n a lta com o la de u n procedim ien
to param étrico com parable, tal com o la p ru e b a de M ann-W hitney
com o altern ativ a a la p ru eb a t, p arece ría p referib le confiar m ás
bien en el p rocedim iento no p aram étrico . E nco n trarem o s em pe
ro m uchos pro cedim ientos p aram étrico s m ultivariados p a ra los
que no existe u n a altern ativ a no p aram étrica satisfactoria. An
tes que u s a r u n a altern ativ a débil o teóricam ente n o satisfacto
ria, re su lta preferible, si tal es el caso, re c u rrir decididam ente
a los p ro cedim ientos p aram étrico s, conscientes de que n o se
po d rán o b ten er con ellos resu ltad o s definitivos. No es posible,
en pocas p alab ras, d a r u n a sim ple re sp u esta dogm ática a la p re
g u n ta: ¿Qué clase de p ru e b a o m edida es la m ás apropiada?
G losario
Prueba no param étrica
* Eficiencia de fuerza
* Función de fuerza
* Fuerza de una prueba
E jercicios
1. Se ha clasificado cierto número de iglesias protestantes de una
localidad como: 1) predominantemente de clase alta o clase media
alta» o 2) predominantemente de clase media baja o clase baja. Se
ordenan según el grado de formalismo de sus servicios, con los si
guientes resultados:
Clase alta o clase media alta: órdenes 1, 2, 3, 6, 7, 8, 11, 13, 14, 15, 17,
21, 25
Clase media baja o clase b a ja : órdenes 4, 5, 9,10, 12,16, 18, 19, 20, 22,
23, 24, 26, 27.
Profesional y directivo 46 97
Empleado 81 143
Obrero calificado 93 88
Obrero semicalificado 241 136
Obrero no calificado 131 38
X2 = S Í Í L Z ^ 1 (XV.1)
Je
en lo que f0 y f e se refieren respectivam ente a las frecuencias ob
servadas y esp eradas p a ra cada casilla.2 O en o tras p a la b r a s : la
^-cuadrada se o btiene tom ando p rim ero el cu ad rad o d e la diferen
cia e n tre las frecuencias observadas y esperadas p a ra cada casilla.
Dividimos d icha cifra e n tre el n ú m ero de casos esperados en cada
casilla, con o b jeto de norm alizarla, de m odo que las m ayores
contribuciones n o provengan siem p re de las casillas m ayores. Y
la sum a de to d as esas cantidades no negativas p a ra todas las ca
sillas es el v alo r de la ^-cuadrada.
Católicos
Partido Protestantes y Total
judíos
Republicanos 126 99 225
Demócratas 71 162 233
1. S upuestos.
N ivel de m e d ic ió n : dos escalas nom inales
M odelo: m u estras aleatorias independientes
H ip ó tesis: n o existen diferencias e n tre las poblaciones con
fesionales e n relación con la preferen cia política.
* Para un examen más detallado de este problema véanse las pp. 299-301.
(197) = 96.8. Las dem ás frecuencias anticipadas pueden calcularse
en fo rm a análoga. P o r lo re g u lar se recom ienda re te n e r p o r lo
m enos u n a cifra decim al al calcular las frecuencias esperadas.
De m odo que en el caso a n te rio r no redondearíam os a 97.
Antes de p a sa r adelante, conviene ob serv ar que las frecuencias
esp erad as tam bién pueden obtenerse razonando en fo rm a inver
sa, esto1 es, en térm inos de la pro p o rció n de republicanos que
esp eraríam o s que fu e ran p ro testan te s. Toda vez que la p roporción
de p ro testan te s en la m u e stra com binada es de 197/458, o sea
.4301, podem os o b ten er la frecuencia an ticip ad a de republicanos
p ro te sta n te s com o sigue: (.4301) (225) = 96.8. El lecto r h a de
ac o stu m b ra rse a o b ten er las frecuencias esp erad as en am bas fo r
m as, a títu lo de co n tro l de los cálculos.
U na vez que nos hayam os aco stu m b rad o al procedim iento, en
co n trarem o s p ro b ab lem en te m ás sencillo' servim os de u n a sim ple
fó rm u la com o la q u e se describe a continuación. Si designam os
las casillas y los to tales m arginales com o
a b a+ b
c d c+d
a+c b+d N
2■ /o2
X ■N (XV.2)
Casilla f 2
10 fo2/fe
a 15 876 164.008
b 9 801 76451
c 5 041 50.309
d 26244 197.620
T o ta l 488.388
y2 - 488.388 - 458
" = 30.388
• (jv4 _ e )s
Xa =
1,=1
2 S " ’í
r r c A l-Z
f = N 2 2 ----- *--------1
[. *=! ^ N¡. N.j
y así vemos que no hay necesidad de co m putar explícitam ente
las frecuencias esperadas.
5. Decisión. Antes de servirnos del cuadro de la ^-cuadrada,
hem os de d eterm in a r los grados de lib ertad asociados a esta es
tadística de prueba. En los problem as anteriores, los grados de
lib ertad dependían siem pre del núm ero de los casos selecciona
dos. En los problem as de contingencia, en cambio, dichos grados
sólo dependen del núm ero de casillas del cuadro. Al calcular las
frecuencias esperadas, pudo observarse que no es necesario cal
cu lar valores p a ra cada casilla, ya que la m ayoría de ellas podían
obtenerse p o r sustracción. Y de hecho, en la ta b la de 2 X 2 sólo
necesitam os calcular u n a de las frecuencias esperadas, y las o tras
quedan au to m áticam ente determ inadas. E sto es así porque, p a ra
calcu lar las frecuencias esperadas, nos servim os de los totales
m arginales de n u e stra m u estra. E n o tro s térm in o s: si ponem os
el valor de u n a casilla cualquiera, los dem ás valores están p er
fectam ente determ inados, ya que las frecuencias esperadas han
de te n e r los m ism os totales m arginales que las observadas. Por
lo tan to , sólo tenem os u n grado de lib ertad .
H abiendo, pues, averiguado que en la ta b la de 2 X 2 sólo hay
un grado de libertad, buscam os en el cu ad ro de la /-cu ad rad a
a lo largo de la hilera correspondiente a u n grado de lib ertad
h asta e n c o n trar el nivel de significación deseado. Vemos en esta
fo rm a que al nivel de .001 le corresponde u n a /-cu ad rad a de
10.827. E sto significa que, si todos los supuestos son efectiva
m ente correctos, obtendrem os u n valor de la /-cu ad rad a igual
o m ayor que ése u n a vez e n tre mil. E n o tro s té rm in o s: sólo m uy
ra ram en te d iferirán las frecuencias observadas y las esperadas
en u n a cantidad que dé u n a /-cu ad rad a > 10.827, si no h u b iera
relación alguna e n tre la confesión religiosa y la preferencia en
cu anto al voto (ta l como se h a definido operativam ente en este
p ro b lem a). Y com o q u iera que hem os obtenido p a ra la /-cua
d ra d a u n valor igual a 30.388, concluim os que la hipótesis nula
pued e descartarse al nivel de .001. Vemos, de paso, que, si N es
grande, no es n ad a difícil llegar a o b ten er significación al nivel
de .001.
Pese a que sólo nos ocupáram os de valores grandes de la
/-cu ad rad a, la dirección de la relación no se anticipó en el ejem
plo an terio r. Independientem ente de si los p ro testan tes p re sen
tab an m ás probabilidades de ser republicanos o dem ócratas, el
re su ltad o h a b ría sido u n a /-cu ad rad a grande si los p o rcen tajes
eran tam b ién grandes. E n otros térm inos, la estadística de la
p ru e b a es aquí indiferente a la dirección de la relación, ya que
co m p o rta los cuadrados de las desviaciones y, p o r consiguiente,
no pued e ser negativa. Podem os sacar p a rtid o de las predicciones
relativas a la dirección partien d o sim plem ente p o r la m ita d el
nivel de significación obtenido. En efecto, si la /-cu ad rad a es lo
b astan te grande p a ra d a r significación al nivel de .10 sin a n ti
cip ar dirección, el re su ltad o será tam bién significativo al nivel
de .05, a condición, p o r supuesto, que la dirección de la rela
ción se haya fijado de antem ano.
Si el nivel de significación deseado no puede obtenerse exacta
m en te de la tab la d e la /-cuadrada, se conseguirá u n a aproxim a
ción satisfacto ria extrayendo la raíz c u a d rad a de la /-cu ad rad a
y recu rrien d o a la ta b la norm al. Así, p o r ejem plo, sabem os que
u n a /-cuad rad a de 3.841 con u n grado de lib ertad corresponde
al nivel de .05 si no se h a adivinado la dirección. La raíz cu adrada
de esta cifra es 1.96, que es el valor de Z necesario p a ra ob ten er
sig n ificació n co n la ta b la n o rm a l. É s ta , sin e m b arg o , sólo p u ed e
e m p le a rse e n el c a so de p ro b le m a s d e co n tin g en c ia d e 2 X 2.
Caso general. E n el caso general d e la tab la de contingencia con
r hileras y c colum nas, los supuestos y cálculos p a ra la ^-cua
d ra d a sólo req u ieren u n a ligera m odificación. La hipótesis nula
de "ausencia de diferencias” o "ausencia de relación" im plica
ah o ra que cada población te n d rá las m ism as proporciones p ara
cada u n a de las categorías de la segunda variable. Las frecuen
cias esperadas pueden obtenerse exactam ente en la m ism a fo r
m a que an terio rm en te, p ero ten d rem o s ah o ra re casillas, y los
grados de lib e rta d serán distintos.
Supóngase que nos servim os del m ism o p roblem a an terio r,
p ero en su fo rm a original, o sea la de u n a tab la de 3 X 3. O bser
vemos de p aso que e sta tab la nos p roporciona m ay o r inform a
ción que la de 2 X 2, en la que los católicos y los ju d ío s se com
bin aro n en u n a sola categoría. Podem os, p o r lo tan to , esp erar
resu ltad o s que difieran algo de aquellos obtenidos an terio rm en
te. Calculando las frecuencias esperadas p o r uno cualquiera de
los m étodos an terio rm en te sugeridos, obtenem os:
d f — (r — í ) (c — l )
Cuadro XV.3. Cálculo de la /-cuadrada para una tabla de
contingencia de 3 x 3
Casilla fo fe •f 02 w u
x 2 = 5 6 1 .6 6 5 - 518 = 43.665
(a + b) (c + d) (a + c) (b + d )
15 15 30 15 15 30
x2 = 5.40 x2 = 3.75
a+ c b+ d N
P(a,b) =
(a + c)! (b + d)\ (a + c ) ! (b + d) \
a\(a + c - a ) \ b\(b + d - b ) \ alcl bldl
P( a , b ) =
NI N\
(a + b ) \ ( N — a — b ) \ (a + 1b ) \ (c + d ) !
(a + c ) \ { b + d ) \ ( a + b ) \ ( c + d ) \
Nlalblcldl
3 9 12
12 5 17
15 14 29
2 10 12 1 11 12 0 12 12
13 4 17 14 3 17 15 2 17
15 14 29 15 14 29 15 14 29
Po + Pi + ^2 + P&
p a ra calcu lar la p ro b ab ilid ad de o b ten er tre s o m enos casos en
la casilla a. Y ya que nos estam os sirviendo de una p ru e b a de
s En raros casos cambiará la dirección de la relación si se sigue la regla
de que la casilla a sea siempre la más pequeña. Por ejemplo, si las dos
distribuciones marginales son muy desiguales, la regla tal vez no se apli
que. Así, si a, b, c y d son 1, 2., 3 y 7, respectivamente, el producto ad ( = 7 )
es mayor que el producto be ( = 6). Si uno reduce entonces a hasta 0, las
casillas resultantes serán 0, 3, 4 y 6, y se producirá una inversión de direc
ción, puesto que be > ad. Deben ser vigiladas tales inversiones y, en caso
de que se produzcan, deberá denominarse como a la casilla más pequeña en
la menor de las dos diagonales.
u n a sola cola, habrem os de doblar el nivel de significación obte
nido, si no estuviéram os en condiciones de p o d er p red ecir Ja di
rección.0
S erá m ucho m ás conveniente que calcular cada u n a de las
de la fó rm u la an terio r, que co m p o rta p ro d u cto s de factoriales,
ob ten er P 0 d irectam en te y o b ten er luego las probabilidades res
tan tes como funciones de P0. Con objeto de distin g u ir en tre las
varias com binaciones posibles de los valores num éricos de a, b,
c y d en el caso de m arginales fijos, sirvám onos de u n subíndice
k p a ra d esig n ar la m agnitud de la casilla m ás pequeña a. Así,
p o r ejem plo, si hay k individuos en la casilla a, designarem os
las cantidades de las dh'ersas casillas como- a.k ( = k), bk, ck y dk.
Toda vez q ue se supone que los m arginales perm anecen fijos, si
dism inuim os % y d Jc en uno, hem os de au m en ta r b k y ck tam bién
en uno. Podem os ah o ra sim plificar la fó rm u la de P 0, ya que
ao = 0 y, p o r consiguiente, a0! = 1 (p o r definición), (cz0 + &«) ¡ =
b0 \, y ( a0 + c.0)! = c0!. O sea que cierto número- de factoriales se
elim inan, dejándonos c o n :
n _ (cfí + d 0) \ ( b 0 + d0)\
bi-c,,
Pk ( «f c+nC^f c+l )
o sea
P bA P
7“+1 (fl,. + l ) ( 4 + l ) *
Y p o r consiguiente:
bnC0 12(15)
P = ---------- — --------- P0 = _ — 1 (.17535 x 10-5) _ 10.521 x 10-»
(ao+l)(4>+D K3)
Al calcu lar P2 hem os de cuidar de servirnos de a1: b¡, cx y d 1: y
no de las cifras em pleadas p a ra o b ten er Pt . Tenemos, a s í :
Y análogam ente :
boC2 10(13)
P = ---------^ -------- p = _J:— 1 (202.529 x 1 0 -s ) = 1 755.252X 10-»
(añ + l ) ( i 2 + l ) 3(5)
30 20 50
20 30 50
50 50 100
La /-cu a d rad a de esta tab la re su lta ser exactam ente 4.0. Suponga
m os ah o ra que se duplican los tam años de las m uestras, m an te
niendo las m ism as proporciones en .cada casilla. O btendríam os
así :
60 40 100
40 60 100
100 100 200
y la /-cu ad rad a sería 8.0, o sea una cifra exactam ente doble de la
an terio r. Exam inando la fórm ula de la /-cu ad rad a, re su lta m uy
fácil d em o strar que, si las proporciones d e las casillas p erm ane
cen in alterad as, la /-cu a d rad a varía directam ente con el núm ero
de casos. Si duplicam os el nú m ero de éstos, duplicam os aquélla,
y si triplicam os los p rim eros, triplicam os la segunda. Supóngase
que el n ú m ero de casos inicial se m u ltip lica p o r el facto r k. E n
tonces, com o q uiera que las proporciones de las casillas p erm a
necen inalterad as, to d a nueva frecuencia observada será exacta
m ente k veces la an terio r, y lo m ism o p o r lo que se refiere a las
frecuencias esp eradas. La nueva y-cuadrada puede, pues, expre
sarse com o:
,(X ) -------
^ W
71--------" = ^S -------
o - k f e )2
—-------- = A,: 2^- ( f o ~
k ? ( f o - f e )2 f e )2
k fe k fe fe
30 20 50 60 40 100
20 30 50 y 40 60 100
0 50 50
50 50 100
T2 _ ________ t __________________
N ^/{r-l){c-\) y ( r - l ) ( c - 1)
Aunque el lím ite su p erio r de T sea la unidad, este lím ite sólo
pued e alcanzarse cuando los núm eros de hileras y dolum nas son
iguales. E n otro s té rm in o s : T h a de ser siem pre m en o r q u e la
u n id ad en u n a tab la de 2 x 3 o de 3 X 5. Si hay considerable
m en te m ás h ileras que colum nas (o viceversa), el lím ite su p erio r
de T pu ed e q u ed ar m uy p o r debajo de la unidad. P ara co rreg ir
este hecho, podem os siem pre dividir el v alo r obtenido de T e n tre
la m áxim a T posible p a ra núm eros dados de hileras y colum nas.
Sin em bargo, com o q u iera que disponem os de m edidas m ás sa
tisfactorias, n o necesitam os exam inar este procedim iento de co
rrección.
I
r c
2 /S
<=i 2i •
N i.N .j
Obsérvese que:
N i? N i}
< ------ p a ra i=l,2,...,r
Ni.N.j ~ Ni_
Ni? ^ Na . , ,
y T T T r— par a ; = 1 »2, ...,C
P o r tan to
r c Ni? r ° N if r
2 , 2 --------- —
í = i í= .i Ní.N.j ~~
<
i=1 1=1 Ni.
2 2 — = 2 1 = r
r 0 9 r n c
y 2 2 --------- - — < 2 2 — — = 2 1 = c
< _ i i N i.N .j - / - i «-i Af.y í'” 1
r c
Así: 2
í= i
2 --------- - Min (r,c)
N - ---- <
y de allí:
X2 < J V [ M i n ( r , c ) - 1 ] = AT[ Mi n ( r - 1, c - 1 ) ]
P o r ta n to :
V2- ^ ^
N M in (r — 1, c — 1) M i n ( r — l , c — 1)
Al igual que las o tras m edidas, C se hace cero cuando las v aria
bles son independientes. Sin em bargo, el lím ite su p erio r de C
depende del n ú m ero de hileras y colum nas. E n el caso de 2 X 2,
el lím ite su p erio r de C2 se convierte e n . N / ( N + N) , ya que
puede alcanzar u n valor m áxim o de N. P or lo tanto, el lím ite
s u p e rio r de C es .707. Si b ien el lím ite su p erio r aum en ta a m edi
da que au m en ta el n ú m ero de hileras y colum nas, dicho' lím ite
siem pre es m en o r que la unidad. De ahí que C sea algo m ás difí
cil de in te rp re ta r que las o tras m edidas, a m enos que se in tro
duzca u n a corrección dividiendo e n tre el valor m áxim o de C p a ra
n ú m ero s p articu lares de hileras y colum nas. E n el caso de la
tab la 2 x 2 , p o r ejem plo, la C o btenida h a b ría de dividirse e n tre
.707.
Las m edidas an terio res de la fuerza de la relación se b asan
to d as ellas en la '/-cuadrada. Como q u iera que p o r lo regular
el v alo r de la ^-cuadrada se h a b rá calculado previam ente con ob
je to de verificar el significado, todas las m edidas en cuestión re
qu ieren en realid ad m uy poco cálculo adicional. P ero p o r o tra
p arte , n o existe razón p a rtic u la r alguna en cuya v irtu d u n a m e
dida de asociación haya de b asa rse en la estad ística de la p ru e b a
correspondiente. E n efecto, puede d em o strarse que todas las
m edidas basadas en la ^-cuadrada son algo- a rb itra ria s en su esen
cia y sus in terp retacio n es d ejan m ucho que desear. Así, p o r ejem
plo, to d as ellas confieren m ayor peso a las colum nas o hileras
de m arg in ales m ás pequeños que a las de m arginales m ayores [ 2 ].
Sin em bargo, com o q u iera que ta n to la p ru e b a T com o la C se
en cu en tran con frecuencia en la bibliografía, e¡l lecto r deb ería fa
m iliarizarse con sus propiedades.
La Q de Yute. O tra m ed id a de uso- co rrien te es la Q de Yule,
que es tam b ién u n caso especial de la m edida y (gam m a) que se
d isc u tirá en el capítulo x v in en relación con las escalas o rd in a
les. E sta m edida sólo puede em plearse con la tab la de 2 X 2 y se
define com o sigue:
ad — be
ad + be
en donde a, b, c y d se refieren a las frecuencias de las casillas.
Obsérvese que, u n a vez elevado al cu ad rad o y m ultiplicado p o r
N, el n u m era d o r es el m ism o que en la expresión de la /-cu a d ra
da. Lo m ism o que en el caso de las dem ás m edidas, Q desaparece
cuando las variables son independientes, o sea, cuando los p ro
ductos diagonales ad y be son iguales. A diferencia de <£2, sin
em bargo, Q alcanza sus lím ites de ± 1.0 cuando una cualquiera de
las casillas es igual a cero. Con o b jeto de com p ren d er el c a rá c te r
de las circu n stancias en cuya v irtu d Q pueda se r igual a la u n i
d ad en tan to que <f>2 queda p o r d eb a jo de dicho valor, tom em os
los siguientes ejem p lo s:
30- 0 30 40 0 40
20 50 70 10 50 60
50 50 100 50 50 100
Bi Bs Total
•^1 30 0 60 0 30 0 1200
60 0 100 100 800
^2
E n o tro s térm in o s : nos hem os evitado 195 e rro res del núm ero
to tal esp erado de 1 270, y los hem os reducido en u n 15.4 p o r cien
to. Si t 6 h u b iera re su ltad o se r .50, podríam os d a r así la in te rp re
tación m u y sim ple de que el conocim iento de A red u ciría el núm e
ro de e rro re s a la m itad, en ta n to que u n v alor d e .75 equivaldría
a re d u cir el n ú m ero de los e rro re s a u n cuarto, y así sucesivam en
te. E n el caso d e <f>2 en cam bio, sem ejante in terp re tació n sencilla
no es posible (véase [2 ]). Si hubiéram os querido in te rp re ta r las
clases B a p a r tir de las A, h ab ríam o s designado la m edida co rres
p o n d ien te com o xa. P or lo general, xa y xb n o ten d rá n los m ism os
valores num éricos. ¿P or qué?
E n el caso del cu adro 2 x 2 puede d em o strarse que xa = t s = <p2.
E sto nos in d ica que se dan dos tipos de dificultades en la anota
ción. O bsérvese que algunas de n u estras m edidas (C, Q, T y V)
vienen indicadas m ed ian te letra s latinas, e n ta n to que o tra s (<£ y
r) lo son m ed ian te letra s griegas. Si fu éram o s consecuentes de
beríam o s re se rv a r las letra s griegas p a ra los p arám etro s de po
blación calculados m ed ian te m u estras estadísticas. P o r desgracia,
u n a vez q ue los signos vienen siendo usados en fo rm a generali
zada, re su lta difícil n o rm alizar su em pleo, y lo m e jo r que el lecto r
p u ed e h ac er es to m a r n o ta de la inconsistencia. P o r o tra p arte ,
ciertas m edidas aparecen elevadas al cuadrado, e n ta n to o tras no
lo están. Vem os especialm ente en el caso 2 x 2 q u e el sím bolo x,
n o elevado al cu adrado, es equivalente a <f>z, el que en este caso
es igual a P y V2. Así, en el caso del cu ad ro m ás general puede
p a re c e r razonable c o m p arar x con los o tro s coeficientes al cua
drado, au n q u e observando que no serán idénticos. E n general
puede esp erarse que los valores num éricos de t sean m enores
que los coeficientes no elevados al cuadrado <f>, T y V. Si hubie
ra que p en sa r en función de ciertas m agnitudes absolutas, consi
derándolas pequeñas, m edianas o grandes (p o r ejem p lo : u n valor
in ferio r a .3 es "peq u eñ o ” ), fácilm ente p o d ría in cu rrirse en e rro r
a m enos que se reconocieran claram en te las diferencias e n tre las
m edidas.
Lam bda. E xiste o tra m edida, lam bda (1) que es m uy sem ejan
te a t y que igualm ente es asim étrica con resp ecto a A y B. To
m ando a B com o la variable dependiente con la que se hacen
predicciones, obsérvese que el nú m ero esperado de erro res se
red u cirá si se nos perm ite colocar a todos los individuos en la m a
y or de las categorías jB{ (véase ejercicio 5, capítulo ix ). E n el
ejem plo a n te rio r esto h a b ría su p u esto colocar los 2 000 casos en
B í en lu g ar de lim itarn o s a 900. Si lo hiciéram os así com etería
m os 1 100 erro res, ya que hay u n to tal de 1100 casos en B 2 y B ñ.
Obsérvese que éstos son m enos e rro res que los que hicim os en
el caso del den o m inador de xh. Supongam os que sabem os la ca
tegoría de A a la que pertenece el individuo. Si se nos perm ite
asig n ar la to talid a d de los 1 200 individuos de A x a B 2, la fila que
contiene el m ayor núm ero de individuos Alt com eterem os sola
m ente 300 + 300 = 600 errores. De m an era análoga, si colocam os
a todos los 800 individuos A2 en la categoría B lt com eterem os sólo
200 errores. Conociendo, pues, la categoría A, y si se nos perm ite
h acer estas distribuciones m enos restrictivas, podrem os esp erar
com eter 800 erro res. F orm arem os u n a m edida l hl de "reducción
proporcional en el erro r", com o sig u e :
1 100 - 800
Clase media
Alto 60 40 40 24
Bajo 20 24 24 12
Clase baja
Alto 40 6 18 2
Bajo 16 32 38 54
Cuadro X V .6
Nivel de
Clase Aplicación 3(,-cuadrada significación
Varones Hembras
Protes Cató Protes Cató
tantes licos Judíos tantes licas Judías
E jercicios
1. Calcúlese la x-cuadrada para los datos del ejercicio 5 del capítulo ix.
Tornando las aspiraciones profesionales como variable dependiente
B, ¿cuál es el valor de t„? ¿Cómo se compara el valor de x,, con el de
la medida que se calculó en la parte d) del ejercicio 5?
2. En el ejercicio 3 del capítulo xiv nos servimos de la prueba de
Smimov. Tomando los mismos datos, ¿a qué conclusión llegamos al
servimos de la prueba de la x-cuadrada? En relación con esos datos
particulares, ¿cuál prueba se preferirá? ¿Por qué? Calcúlense <t>, T, V,
c, t 6 y h-
*3. La prueba de la /.-cuadrada puede emplearse en general para
comparar frecuencias observadas y teóricas. En particular, puede uti
lizarse para verificar la hipótesis nula de que los datos de la m uestra
se han seleccionado al azar de una población normal. Las frecuencias
observadas se comparan con las que se habrían anticipado en caso
de ser la distribución efectivamente normal, con la misma media y
desviación estándar que se han calculado de los datos de la muestra.
Una vez obtenidos los valores de X y de s, podemos servil-nos de los
verdaderos límites y de la tabla normal para dar las frecuencias es
peradas dentro de cada intervalo. Los grados de libertad serán k — 3,
en donde k representa el número de intervalos. Se perderá un grado
de libertad, ya que el total de las frecuencias esperadas ha de ser N;
los otros dos grados de libertad que se han perdido se deben a la
necesidad de utilizar X y s a título de apreciaciones de los paráme
tros reales jt y a. Teniendo estos hechos presentes, verifiqúese si los
siguientes datos se apartan o no significativamente de la norm alidad:
Respuesta %s — 2.53, sin rechazar.
Intervalo Frecuencia
0.0- 9.9 7
10.0-19.9 24
20.0-29.9 43
30.0-39.9 56
40.049.9 38
50.0-59.9 27
60.0-69.9 13
208
B iblio g rafía
Tasas de criminalidad
Total
Centro Centro Centro
industrial comercial político
X y - X . . = ( X i i - X . i) + ( X . i - X . . )
o sea
( d a to m edia V _ / d ato m ed ia de \
individual g ra n d e / \ individual la clase /
( m edia de m edia \
la clase g ra n d e /
Categorías
Total
Ai A2 A-h
*n *12 *»
*21 *22 . . . * 2*
*31 *32 *3fc
M arcas
*AT11
2 2 * i¿
Sum as 2 X tl 2 * i2 2 *«, i ¡
i= l i= l í= i
2(X.,-X..) 2 (Xy-X.,)
i
Pero, com o q u iera que p a ra cada colum na las desviaciones res
p ecto de la m ed ia de la colum na h an de ser cero, vem os inm e
d iatam ente q ue el térm ino cen tral h a de desaparecer p a ra todas
y cada u n a de las colum nas. O btenem os, p u e s :
2 ( X i l - X . 1y + 2 ( X i 2- X . 2)* + . . . + 2 { X i h- X . ky
i= l t= l i= l
N -l = (N-k) + (k-í)
dif. to ta l = dif. d e n tro + dif. e n tre colum nas
i j
estim ación d en tro = --------------------------- (X V I.2)
N —k
S 2 ( I r L )s
i i
estim ación e n tre colum nas = --------------------------- (X V I.3)
k - 1
1. Supuestos.
N ivel de m e d ic ió n : Tasas d e crim inalidad, escala de interva
lo. Tipo de ciudad com o escala nom inal.
M odelo: M uestreo independiente aleatorio.
Poblaciones norm ales p a ra cada tipo de ciudad.
Las variancias de las poblaciones son iguales.
(a i2 = a32 = . . . = ofc2 = a2)
H ip ó tesis: Las m edias de las poblaciones son iguales.
(fi.l = (1.2 = . . . = [X.fc)
3 Ocurre, por ejemplo, a veces que las categorías que tienen las medias
más grandes son también las menos homogéneas. En tales casos, si se toma
como escala de intervalo el logaritmo de la variable original, el efecto será
el de igualar las variancias. Para un examen más detallado del empleo de
la transformación logarítmica, véase la sec. XVIII2.
sen ta considerablem ente m ás tra b a jo q u e el que se req u iere p a ra
las o tra s dos sum as de cuadrados y, p o r lo tan to , obtenem os la
su m a d en tro de éstos restan d o la sum a e n tre colum nas de la sum a
to ta l de los m ism os.
La fó rm u la de cálculo p a ra la su m a to ta l de los cuadrados se
ob tiene en la m ism a fo rm a que la de la variancia [véase la ecua
ción (V I .6)]. Así p u e s:
■(2x«)2
i
( in i2)2 (si x jn (ssii,)2
-i j
~ ----- ------ - -|----------------1- . . . ~\---- 1------l— ------------------
. N¿ N2 Nk N
O bsérvese que el segundo térm in o de la expresión a n te rio r es el
m ism o fa c to r que se su stra jo de 2 2 I ¡ / p a ra o b ten er la sum a
í i
to ta l de cuadrados. El p rim e r térm ino, en cam bio, es suscepti
ble de d eso rie n ta r al lector. A nalizando e sta expresión, vem os
que calculam os p rim e ro la sum a de cada colum na y luego la ele
vam os al cu ad rad o p a ra o b ten er ( 2 X Í3)2. Dividimos luego dicha
i
expresión e n tre el núm ero de casos de la colum na, que no necesi
ta ser siem pre el mismo-. Tenem os así p a ra la colum na j-ésim a:
( 2 Xi j Y/ Nj . F inalm ente, hacem os lo m ism o con cada colum na
i
y sum am os los resultados.
Los cálculos del p ro b lem a n um érico q u e se dan a continuación
ay u d arán a a c la ra r el procedim iento. Las sum as to tal y e n tre
colum na d e cu ad rados se calculan com o sigue:
2 2 X ij1 = (4.3 )2 + (2.8)2 + . . . + (1.9)2 = 1 453.58
%j
(2
4 # (lól.O)2
= 1 080.042
N 24
Total 373.538 N - 1 = 23
Entre columnas 42 303 k ~ 1= 2 21.152 . ,.
Dentro de columnas 331.235 M — k — 21 15.773
I II III IV V
: control contra los demás
(I vs. II, III, IV y V) 1 -V i -V i -V i -V i
’1>2: autoritarios contra democráticos
(II y III vs. IV y V) 0 Va V2 -y 2 -'/2
: frustración moderada contra
extrema
(II y IV vs. III y V) 0 V2 -y 2 V2 —lh
Si las v arian cias de población o,2 son aproxim adam ente igua
les, las poblaciones aproxim adam ente norm ales, y todas las
m u estras del m ism o tam año, las com paraciones separadas serán
m u tu am en te independientes (como- asim ism o ortogonales), siem
p re que se p roduzca la siguiente relación é n tre los co eficien tes:
k
2 c np i} = 0 p a ra to d as las h ^ i
i^ i
S ^ - = 0
í-i N,
E n n u e stro ejem plo hem os utilizado solam ente tre s com para
ciones m u tu am en te ortogonales, en ta n to que k — 1 , o cuatro,
son posibles. E n la m ayoría de los casos no te n d rá p o r su puesto
sentido teó rico el u tiliza r todas las com paraciones ortogonales
p o sibles; sin em bargo, es instru ctiv o d eterm in a r cuál sería la
cu a rta. O bsérvese que ya hem os com parado el grupo de con
tro l con todos los grupos experim entales, y p o r ello n o es de
e sp e ra r que u n a com paración de dicho grupo de control con
cu alq u iera de los subgrup-os (p o r ejem plo el de los grupos auto
rita rio s ), re su lte ortogonal con la p rim e ra com paración. Puede
co m p ro b arse esto fácilm ente aplicando el criterio de prueba.
O bsérvese que hem os com parado el grupo II (ju n to al I I I o el
IV ) con el grupo- V (en com binación a su vez con los grupos I I I
y IV). Podríam os así e sp e rar que si los grupos I I y V son p a
reados c o n tra los I I I y IV, la com paración re su ltan te fuese
o rtogonal con las re sta n te s com paraciones, com o en efecto así
o cu rre. A m enos que de m an era específica se buscase u n a in te r
acción, tal com paración p a rtic u la r carecería probablem ente de
sen tid o teórico-, ya que re q u eriría p ro m ed ia r las puntuaciones
del g ru p o au to rita rio con fru stracio n es m edias con las del grupo
dem ocrático con elevada frustración.
O bsérvese que al co m p ro b ar la ortogonalidad o independencia
m u tu a e n tre com paraciones no hem os dicho n ad a en relación
con el tam añ o real de la m uestra, excepto en el caso d e las
m u estras tam añ o N¡. E l crite rio de p ru e b a im plica solam ente
las ponderaciones c i} y n o las m edias d e las m u estras o varian
cias. Las decisiones relacionadas con las com paraciones deben
se r hechas, en efecto, antes de realizar la recogida de datos. Se
puede entonces b u sca r la significación estad ística de cada com
paración, com o se indica m ás abajo. E sta p ru e b a incluye la dis
trib u ció n t de m a n e ra exactam ente análoga a lo que o c u rre con
la p ru e b a de la diferencia de m edias, la que es p o r su puesto la
com paración m ás sim ple posible, en la que clí = l, y c12 = —1 .
El n u m era d o r de t será u n a estim ación de la función lineal %
o b ten id a su stitu y en d o las c o n tra p artes de la población con las
m edias de las m u estras. Así, si hacem os:
% = Ci l Xl + Ci 2 ^ 2 + .. • + cilcX k
tendrem os el n u m era d o r p a ra la ¿-ésima com paración. E n el caso,
p o r ejem plp, d e n u e stra p rim e ra com paración e n tre el grupo de
co n tro l y todos los dem ás, hab ríam o s tenido
% = x t - ( y*)(x2+ x z + x á+ x 5)
ta l y com o el sen tid o com ún lo h a b ría sugerido.
P ara n u e stro denom inador de t deseam os u s a r u n estim ador
resu m id o b asad o e n todas las m u estras, incluso en los casos en
q u e la com paración no ab a rq u e la to talid a d de dichas m u estras.
R ecordando n u e stro resu ltad o p a ra la variancia de u n a com bi
nación lineal, sabem os que
o2= ^ í s i2 + + . ■. + N 6 S b2
N - 5
(d e n tro del grupo estim ad o de variancia)
, (>/2 ) 2 (Ü )2 { -V i )a , (- y * )*
v *L ‘ H------ TZ------r ■ +
i-1 Nf Nt N.
i i i \
+ ~ Ñ r+ ~ Ñ r+ ~Ñ r)
( V2) ( X2 + X s) - ( Vz ) ( X4 + X s)
y p o r lo ta n to í = --------------------------- ----------------- ;------
o ( J * W l / N 2 + 1/iSTg + 1 / J V 4 + \ / N s
( X 2 + X 8) - ( X 4 + X 5)
oy / l / Nz + l / N ñ + í / N 4 + 1/ÑB
Tipo de ciudad
Regiones Total
Industrial Comercial Gubernamental
*1 5 10 20
10 15 25
Bs 25 30 40
^= y¡j = X i j — X i . — X.J + X . .
X ijk = X. . + ( X t. - X „ ) +(X.,-X..)
(g ran m ed ia -f (efecto de fila) + (efecto de colum na)
+ ( X l j - X i . ~ X . , + X. . ) + ( X m - X i , )
+ (efecto de in teracció n ) + (té rm in o de e r ro r)
P o r ejem plo, en el caso de la segunda ciudad política en el
N ordeste ten d ríam o s:
E sto pued e efectuarse tom ando cada com binación de las catego
rías A y B y tra tá n d o la com o categoría de u n a variable sola com
binada. E n o tro s térm inos, tra ta m o s el problem a com o si tu
viéram os u n a sola escala nom inal con las categorías, A xB ^ A2B lt
. . . , AkB¡. Es obvio que si sólo h u b iera u n caso en cad a subeasi-
11a no p o d ría h a b e r variación alguna de subclase. Si n o existe
interacció n en absoluto, deberíam os o b ten er exactam ente el m is
m o e rro r o btenido adicionando separadam ente los efectos d e las
h ileras y las colum nas [com o en la ecuación (X V I.6)]. P o r o tra
p arte , si se d a u n a interacción significativa, el térm in o de e rro r
será m en o r em pleando este segundo m étodo. Así, p o r ejem plo,
el lecto r d ebería convencerse p o r sí m ism o d e que, si la casilla ij
p ro d u je ra efectos en discrepancia con las dem ás, dioha casilla
será relativ am en te hom ogénea en com paración y a sea con la
colum na / o con la h ile ra i, y la sum a d en tro de cu ad rad o s de
las subclases será m en o r que el resid u o obtenido re sta n d o la
su m a de las sum as de cuadrados e n tre colum nas y e n tre hileras
de la sum a to ta l d e cuadrados.
La diferencia en tre la cantidad de variación explicada sirvién
dose de esas subcasillas y la can tid ad explicada en el supuesto
de ad itiv id ad p u ed e entonces a trib u irs e a interacción. Así te
nem os :
1. S u p u esto s
N ivel d e m e d ic ió n : Dos escalas nom inales, u n a escala d e in
terv alo ;
M o d elo : M uestras independientes a le a to ria s;
Todas las poblaciones de las subcasillas, las hileras
y las colum nas son n o rm ales;
Las variancias d e las poblaciones de las subcasillas
son iguales.
H ip ó tesis: 1. Las m edias de las colum nas de la población
son iguales.
2. Las m edias d e las hileras de la población son
iguales.
3. A dicionalidad d e la población (sin in teracció n ).
44.92 i 16.12
SC e n tre h ileras = ---------- 1-------------- 1 080.042
12 12
(fc Z — 1 )’ — ( & — 1 + Z — l ) = ( f c — 1 ) ( Z — 1 )
1. Supuestos.
N ivel d e m e d ic ió n : escalas o rd in al y nom inal
M odelo: m u estreo al azar independiente
H ip ó te sis : m u estras sacadas d e la m ism a población continua
2. N ivel de significación y región crítica. Tom em os el nivel
del .05.
3. D istribución d e m uestreo. La distribución de m u estreo de
H será ap ro x im adam ente la ^-cuadrada con k — 1 grados de lib er
tad, en donde k re p resen ta el n ú m ero de categorías em pleadas.
4. Cálculo de la estadística de la prueba. Calculam os H p o r m e
dio de la fó rm u la
/ 12 * R* \
(-w ñ í t t & h - ) - 3 ( N + 1 )
H = --------------------------------------------------- (X V I.8)
1 - 27y(JV 3 — N )
T *= t í-%
s —t■
S = 2 (T,-T)*
i
* - n w + í) ~ - m + » k T' - 3 H i t + »
Ti 20 14.5(14) 13.5(14) X = 16
12
v* = ------------[20* + 14.52 + 13.52] - 3(8) (4) = 3.06
* 8(3)(4)
F —1
i*í = -
F + ( k —1)
Razón de correlación
Variación explicada e inexplicada
Homoscedasticidad
Interacción
Correlación intraclase
Comparaciones ortogonales.
E j e r c ic io s
$ 13 00 0 $ 1 5 00 0 $ 2 0 800
11500 10600 18 100
G ra n d e 17 300 12 30 0 14 600
19 100 11400 22300
16700 10 800 16 500
15 0 0 0 9 30 0 14 4 0 0
12 300 10400 10 80 0
P equeño 13 900 12 90 0 9 700
14 300 11000 12300
11700 9100 13 100
3. T r a n s f ó r m e n s e l o s d a t o s d e l e j e r c i c i o 2 r e l a t i v o s a l i n g r e s o e n
r a n g o y , u tiliz a n d o la p r u e b a d e K ru s k a l-W a llis , in v e s tig ú e s e s i e x is te
o n o r e la c ió n e n tr e e l tip o d e o rg a n iz a c ió n y e l in g re s o :
a ) P r e s c i n d i e n d o d e l t a m a ñ o d e l a l o c a l i d a d . R e s p u e s t a , H = 9 .2 ;
r e c h a z o a l n i v e l .05.
b) C o n t r o l a n d o e n r e l a c i ó n c o n e l t a m a ñ o .
4. U t i l i c e l o s d a t o s d e l e j e r c i c i o 2, y s u p o n g a q u e l a s c o m u n i d a d e s
h a n s i d o o r g a n i z a d a s e n tríos d e a c u e r d o c o n s u t a m a ñ o , h a b i e n d o
d ie z d e a q u é llo s . L a s o r g a n iz a c io n e s e n l a h i l e r a s u p e r io r ( c o n in g r e
s o s d e $ 13 0 0 0 , $ 1 5 0 0 0 y $ 2 0 8 0 0 ) , r e p r e s e n t a n l a s l o c a l i d a d e s m a y o r e s ;
la s d e la s e g u n d a h ile r a , la s s ig u ie n te s e n ta m a ñ o , y a s í s u c e s iv a m e n te .
U tilíc e s e la p r u e b a d e F r ie d m a n p a r a h a l l a r la r e la c ió n e n tr e tip o d e
o r g a n i z a c i ó n e i n g r e s o s d e l p r e s i d e n t e ( a n i v e l .0 5 ).
*5. E l a n á l i s i s d e v a r i a n c i a p u e d e p r a c t i c a r s e l o m i s m o c o n d a t o s
a g r u p a d o s q u e s in a g r u p a r . C o n o b je to d e r e d u c ir la c o n fu s ió n , lo m á s
s e n c illo s e r á s e r v i r s e d e l a s e c u a c io n e s ( X V I.4 ) y ( X V I.5 ) , s in m o d i
fic a r, p e ro re c o rd a n d o , s in e m b a rg o , q u e e n el c a s o d e d a to s a g ru p a
d o s tr a ta m o s la s m a r c a s c o m o s i e s tu v ie ra n c o n c e n tr a d a s e n lo s p u n
to s m e d io s d e lo s in te r v a lo s . T e n ie n d o e n c u e n t a e s ta s in d ic a c io n e s ,
e f e c t ú e s e u n a n á l i s i s ú n i c o d e v a r i a n c i a c o n l o s d a t o s d e l e j e r c i c i o 2,
c a p ítu lo x m . A títu lo d e c o n tr o l d e lo s c á lc u lo s , ¿ c ó m o s e c o m p a r a n
e n t r e s í lo s v a lo r e s d e F y f?
6. U t i l i z a n d o l o s d a t o s d e l e j e r c i c i o 2 a n t e r i o r :
a ) Ig n o ra n d o el ta m a ñ o d e la lo c a lid a d , b ú s q u e s e la s ig n ific a c ió n d e
la d if e r e n c ia e n tr e e l in g r e s o m e d io d e lo s p r e s id e n te s d e la s o r
g a n iz a c io n e s re lig io s a s y la s d e lo s c o rre s p o n d ie n te s a la s o rg a
n iz a c io n e s s o c ia le s y c iv ile s c o m b in a d a s .
b) ¿ Q u é c o m p a ra c ió n r e s u lta r ía o rto g o n a l c o n la h e c h a e n a ) ?
c) S u p ó n g a s e q u e te n e m o s s e is tip o s d e o r g a n iz a c io n e s ( r e lig io s a s
e n lo c a lid a d g r a n d e , r e lig io s a s e n lo c a lid a d p e q u e ñ a , s o c ia l e n
localidad grande, etcétera). ¿Cuántas comparaciones mutuamen
te ortogonales serían posibles? Hállese un grupo específico del
anterior núm ero de comparaciones que sean m utuam ente ortogo
nales, comprobando que así es el caso.
B ibliografía
1. Anderson, R. L., y T. A. Bancroft: Statistical Theory in Research,
McGraw-Hill Book Company, Nueva York, 1952, caps. 17 y 18.
2. Blalock, H. M.: "Theory Building and the Statistical Concept of
Interaction”, American Sociological Review, vol. 30, pp. 374-380,
1965.
3. Bradley, J. V.: Distribution-free Statistical Test, Prentice-Hall,
Inc., Englewood Cliffs, N. J., 1968, cap. 5.
4. Dixon, W. J., y F. J. Massey: Jntroduction to Statistical Analysis,
2“ ed., McGraw-Hill Book Company, Nueva York, 1957, cap. 10.
5. Haggard, E. A.: Intraclass Correlation and the Analysis of Varían-
ce, The Dryden Press, Inc., Nueva York, 1958, caps. 1-5.
6. Hagood, M. J., y D. O. Price: Statistics for Sociologists, Henry
Holt and Company, Inc., Nueva York, cap. 22.
7. Hays, W. L.: Statistics, Holt, Rinehart and Winston, Inc. Nueva
York, 1963, caps. 11-14.
8. Johnson, P. O.: Statistical Methods in Research, Prentice-Hall,
Inc. Englewood Cliffs, N. J., 1949, caps. 10 y 11.
9. Kirk, R. E.: Experimental Design: Procedures for the Behavioral
Sciences, Brooks/Cole Publishing Company, Belmont, Cal., 1968,
cap. 3.
10. Siegel, S.: Nonparametric Statistics for the Behavioral Sciences,
McGraw-Hill Book Company, Nueva York, 1956, pp. 166-172, 184-193.
11. Walker, H. M., y J. Lev: Statistical Inference, Henry Holt and
Company, Inc., Nueva York, 1953, cap. 14.
E n e l p resen te capítulo y en el siguiente exam inarem os la re la
ción e n tre dos escalas de intervalo. La extensión a tres o m ás
variables de escala de intervalo se verá en el capítulo xix, al tra
ta r de la correlación m ú ltip le y parcial. De m om ento, considera
m os situaciones en las que tenem os dos m edidas de escala de
in tervalo p o r cada individuo. Así, p o r ejem plo, podem os conocer
el n úm ero de años de enseñanza com pletados y el ingreso anual
de los varones adultos de u n a localidad determ inada. O puede
in tere sa m o s relacionar el p o rc en taje de m ano de o b ra em pleado
en la in d u stria con el crecim iento dem ográfico de u n a población.
E n algunos problem as de esta índole nos interesam os a m enu
do no sólo en las pru eb as de significación y las m edidas de gra
dos de relación, sino q u e podem os tam b ién q u erer d esc rib ir la
naturaleza de la relación en tre las dos variables, de m odo que,
conociendo u n a de ellas, podam os an ticip ar la otra. Así, p o r
ejem plo, podem os q u erer p red ecir el ingreso fu tu ro de u n a p e r
sona sobre la b ase d e su instrucción, o la tasa de crecim iento
de u n a ciudad a p a r tir del p o rc en taje de su m an o de o b ra em
pleada en la in d u stria. C uando el in teré s se ce n tra an te to d o en
la ta re a exploradora de e n c o n tra r cuáles variables se relacionan
con u n a variable determ inada, nos interesam os p o r lo regular
p rincip alm en te p o r las m edidas de grados o fuerza de las re la
ciones, tales com o los coeficientes de correlación. P or o tra p a r
te, u n a vez halladas las variables significativas, propendem os a
d irig ir n u e s tra atención al análisis d e regresión, en el que in ten
tam os p re d ecir el v alor exacto de u n a variable a p a r tir d e la o tra .
Si b ien el lecto r ya está fam iliarizado con las p ruebas de sig
nificación y las m edidas de asociación, recom iéndase, con todo,
em pezar n u estro exam en estudiando el p ro b lem a de la predicción.
E sto se debe a que la noción de regresión es a la vez a n te rio r
lógicam ente y m ás im p o rtan te teóricam ente q u e la de correlación^
L a razón d e ello se irá viendo m ás clara a m edida que vayam os
avanzando. D espués de h a b e r exam inado el p roblem a de la p re
dicción, dirigirem os n u e stra atención a la m edición de la fuerza
d e la relación. E n el capítulo x v m , que d e hecho re p re se n ta la
continuación del p resen te, exam inarem os diversas p ru e b as de
significación, así com o la correlación del orden de lugares, que
pueden em plearse p a ra relacionar dos escalas ordinales.
O
V»
CP
C3>
*4 *5
Educación
Fig. X V II.l. F orm a general de la regresión de Y sobre X , o curso
de las m edias de los valores de Y para valores fijo s de X.
Y = a + $X (X V II.l)
Y i = a + ¡3X¡ + ei
Y = a + bX (X V II.2)
R esu ltará así que la a y la b obtenidas con este m étodo son las
apreciaciones insesgadas m ás eficaces d e los p arám etro s d e la
población, a y p, si la ecuación d e regresión es efectivam ente u n a
re cta y si suponem os : 1) M uestreo al azar, 2 j Que E ( e{) = 0, y
3) Que X{ y son estadísticam ente independientes.
N u estro criterio d e los m ínim os cuadrados com porta h a lla r la
única re c ta que posee la pro p ied ad de que la sum a de los cua
d rados de las desviaciones de los valores reales de Y respecto de
dicha re c ta sea m ínim a. Así, p o r ejem plo, si trazam os líneas
verticales d e los p u n to s a la línea de los m ínim os cuadrados"^
y si elevam os al cuadrado dichas distancias y las sum am os, la
sum a re su ltan te será m en o r que la su m a correspondiente de cua
d rad o s a cu alq u ier o tra re c ta posible (véase la figura X V II.5).
O bsérvese que son las distancias verticales, y no las perpendicu
lares o las horizontales las que aquí se consideran. S ería posi
ble m inim izar la sum a de los cuadrados de las distancias p er
p endiculares (d esignada com o sum a ortogonal de los m ínim os
cu ad rad o s), p e ro las ecuaciones de ello resu ltan tes no son ni
con m u ch o ta n p rácticas. Y si se em plearan las distancias ho
rizontales, la re c ta de m ínim os cu adrados re su lta n te p o d ría u ti
lizarse p a ra ap re c ia r la regresión d e X a Y. E l lecto r h a de
convencerse p o r sí m ism o q u e m inim izar la su m a de cuadra
dos de las d istan cias verticales n o m inim iza necesariam ente
la su m a de cu adrados de las d istancias horizontales. Así, pues,
2 (Xí - X K Y í - Y ) 2
i=X t= l
y 6 = ------ — ----------- -------- - = — -------- (X V II.4)
2 (Xt -X y * 2 x 42
i= l i= l
n z x y - o x x sr)
N 2 X 2 - ( 2 X )2
Y P = a + b X = 561.83 + 19.931X
a = Y — bX
te n e m o s : Y = a + bX
lo que indica que estos valores de X y Y satisfacen la ecuación.
P o r consiguiente, el p u n to (X , Y ) queda exactam ente sobre la
línea.
E n el p ro b lem a an terio r, si sabem os el valor de X (p o rcen taje
de negros) p a ra cualquier ciudad d ad a del M edio Oeste, n u estra
m ejo r estim ación del valor de Y sería aquel valor de Y que co-
Porciento de nearos
XVII.2. Correlación
Supongam os a p a r tir de ah o ra que X es estocástica, y n o so
m etid a p o r tan to al control del investigador. No sólo deseam os
conocer la fo rm a o la n atu raleza de la relación e n tre X y Y, de
m odo que u n a de las varia
bles p u ed a p re d ecirse a p ar
tir de la o tra, sino que es
necesario al p ro p io tiem po
conocer el grado o fuerza de
la relación. E s obvio que si la
relación es m uy débil, no tie
n e o b jeto tra ta r de p red ecir
Y a p a r tir de X . Los soció
logos tien en a m en u do in te
rés an te todo en d escu b rir
cuáles de u n g ran n ú m ero de
variables se relacionan m ás
de cerca con u n a variable
dependiente determ inada. En
los estudios de exploración
de esta clase, el análisis de
S in relación
regresión rev iste im p o rtan cia
secundaria. A m ed ida que
u n a ciencia va m ad u ran d o y
que se d escubren variables
im p o rtan tes, la atención pue (*>
de c e n trarse en m étodos de
p redicción exacta. Algunos
estadígrafos son del p arece r
que en conjunto se h a p re s Relación negativa débil x
tado dem asiada atención a
F ig. XVII.7. Diagrama de dispersión
la correlación y casi ningu que muestra las diferentes fuerzas y
n a al análisis de regresión. direcciones de las relaciones entre
Que esto sea así o que no lo X y Y.
sea depende, p o r supuesto,
del estad o del conocim iento en la ciencia considerada.
El coeficiente de correlación r, que vam os a exam inar en esta
sección, fuie in tro d u cid o p o r K arl P earson y se designa a m enudo
com o correlación m om ento-producto, con o b jeto de distinguirla
de o tra s m edidas de asociación. E ste coeficiente m ide la canti
d ad de dispersión a lre d ed o r de la ecuación lineal de los m ínim os
cuad rad o s. H ay u n coeficiente correspondiente de población rh o
(p ), que m ide la b o n d ad del a ju ste a la verd ad era ecuación de
regresión. O btenem os u n a estim ación r d e dicho p arám etro mi*
diendo las desviaciones r e s p e t o de’ la lín ea calculada p o r m edio
de los m ínim os cuadrados.
Como q u iera q u e la ecuación d e regresión re p re se n ta el curso
d e las m edias de las Y p a ra u n as X dadas, sería tam b ién posible
m ed ir la d isp ersión resp ecto d e esa línea tom ando u n a desviación
e stá n d a r d e la m ism a.6 S in em bargo, los investigadores de la
m ayoría d e los cam pos de aplicación se h an aco stu m b rad o al coe
ficiente de co rrelació n ; es probable, con todo, que el coeficiente
de correlación se m antenga. Posee la v en taja de se r de fácil in
terp retació n , v su re co rrid o va de — 1.0 a 1 .0. hecho que re su lta
atractiv o p a r a la m ayoría de los p rácticos. Según verem os, en
efecto, la relación e n tre el coeficiente de correlación y la des
viación e stá n d a r respecto de la lín ea d e los m ínim os cuadrados
es m uy sencilla, hecho que p u ed e u tilizarse p a ra p ro p o rcio n ar
u n a in terp re tació n de r.
Se acaba de in d icar que r tiene u n lím ite su p erio r de 1.0. Si
todos los p u n to s se hallan, exactam ente sobre la x e c ta . r será OT
o — LO. según q ue l a relación sea positiva ó negativa. Y si los
p u n to s están disper^ados_^L azaj^.x^firá cero. C uanto m e j o r s ^
el a ju s te /ta n to m ay o r será la m ag n itu d de r. Es lo que se indica
en la fig u ra XVII.7.
O bsérvese que r es u n a m edida d e relación lineal, ya que es una
m ed id a de la b o n d ad de a ju ste d e la línea, d e los m ínim os cua
drados. El lecto r n o debe caer en el e rro r de su p o n er que si
r = 0 (o srQ = 0 - ) ;n o c is t e relación alguna,. E n efecto, si n o hay
relación, síguese que r será aproxim adam ente cero y h a b rá una
dispersión de p u n to s al azar. Sin em bargo, puede h a b e r u n a rela
ción p erfec ta m e n te curvilínea y, con todo, se r r cero, indicando
que n o se d a recta alguna que satisfaga los datos. É ste es el caso
en la fig u ra X V II.8, p o r ejem plo. P or lo tan to , si el investigador
en cu en tra u n a correlación d e cero, h a b rá d e p recav erse c o n tra la
deducción de q u e n o existe relación e n tre las variables. P o r lo re
gular, la inspección del diagram a d e dispersión in d icará si hay
o no relación d e hecho, o si la relación es suficientem ente no li
neal p a ra p ro d u c ir u n a correlación de cero. E n la m ayoría de
los pro b lem as sociológicos, las relaciones pueden aproxim arse
razonablem ente p o r m edio de re ctas. Sin em bargo, esto no signi
fica que n o se d eb a e sta r b a sta n te a le rta co n tra excepciones even
tuales.
H asta el p re sen te no hem os definido todavía el coeficiente de
correlación, p e ro podem os h ac erlo fácilm ente en los térm inos
d e la fó rm u la:
Y - Y = ( a + b X ) - ( a + bX) = b (X - X )
De d o n d e: 2¡(X - X ) ( Y - Y ) = - X)*
y 2 ( y - r ) 2 = b s2 ( X - X )2
t _ 2 (X -X )(Y -Y )
®ccy — —
2 ( Y — Y )2
en donde X = axy + bxyY
Así, pues, r tien e el m ism o n u m era d o r que las dos b. Si éstas son
cero, síguese que r h a de se r tam b ién cero y viceversa.
P ara sum as de cuadrados en X y Y dadas, el valor de byx (o de
b ^ ) será p ro p orcional a r. E sto p arece ría conducir a la conclu
sión de que la fuerza de la relación sea proporcional a la pendien
te de la línea de los m ínim os cuadrados. Sin em bargo, esto sólo
será así si el denom inador p erm an ece fijo. Así, pues, b es u n a
función n o sólo de la fuerza de la relación, sino tam b ién de las
desviaciones e s tá n d a r.7 Si h ay b a sta n te variabilidad en X , en re
lación con Y, el v alor de b será relativ am en te pequeño, indicando
que se re q u ie re u n gran cam bio de X p a ra p ro d u c ir u n cam bio
m o derado de Y. Como lo verem os después, los valores nu m é
ricos de las b dependen, p o r consiguiente, de la m ag n itu d de las
unidades de m edida.
El valor de r se h a estan d a rizad o d e m odo que sea h a sta cier
to pu n to in d ependiente de las m agnitudes relativas d e las desvia
ciones e s tá n d a r en X y Y. S ería en efecto desdichado que no
fu e ra así, ya que difícilm ente deseam os u n a m ed id a que v aria ra
7 Excepto en los casos en que ello pudiera dar lugar a confusión, seguire
mos sirviéndonos de b sin subíndice para representar & .
según que escogiéram os com o u n id ad m o n etaria dólares o centa
vos. Se o b serv ará en las fórm ulas de r y las b que r2 pu ed e ex
p re sa rse en térm in o s d e estas últim as. Así, pu es:
[S x y ]2
= (X V IL ?)
________ (X V II.8)
V tW S X 2 - C£X)2][jV2Y2 - (2 Y )2]
33 199
■= .301
110120
(b)
X
Fig. XVII.9. Diagramas de dispersión que m uestran los efectos
posibles de valores extrem os de X .
P or lo tan to , al calcu lar r p u ed e re s u lta r necesario a ñ a d ir a cada
valor u n n ú m ero ligeram ente su p erio r a la m arc a negativa m ayor.
H ay que te n e r presente, e n este pu n to , o tro hecho relativo a la
correlación. Y es que, com o q u iera que esta m ed id a com porta
variancias y covariancias a la vez, se ve sum am ente afectada por
unos pocos valores extrem os de cualq u iera de las dos variables.
P o r o tra p a rte , la m agnitud d e r depende del grado de variabili
d ad general d e la variable independiente. Es lo que ilu stra la
figura XVII.9. E n la figura XVII.9a, el efecto de u n o o dos valo
res extrem os p ro d u ce u n a correlación m oderadam ente alta cuan
do no se d a nin g una en los casos re sta n te s. E n la fig u ra XVII.9&,
tenem os u n a relación lineal m o d erad am en te elevada, excepto en
cu anto al hecho d e que los casos extrem os n o quedan en línea
re cta con los dem ás. E n este ú ltim o caso tenem os probablem en
te u n ejem plo de relación n o lineal. El diagram a de dispersión
re s u lta rá siem pre ú til p a ra in d icar la n atu ra leza de la situación
en u n p ro b lem a determ inado. Veam os ah o ra lo que pu ed e h a
cerse cu an d o se p re sen ta u n a u o tra de estas situaciones.
La fig u ra X V II.9a ilu stra el p u n to an terio rm en te señalado de
que la m ag n itu d del coeficiente d e correlación depende del m ar-
Y
X
Fig. X V II.10. Diagrama d e dispersión que no m u estra relación
alguna den tro de u n recorrido lim itado de variación de X, pero
con relación positiva sobre el recorrido total.
gen de v ariab ilid ad de am b as variables. Si h u b iera h ab id o u n
n ú m ero m ayor d e casos extrem os, la d istrib u ció n re su lta n te h a
b ría p odido se r com o en la fig u ra XVII.10. E n este caso, la co
rrelació n c o n ju n ta p o d ría se r alta, p e ro en el in te rio r d e cual
q u ier re co rrid o lim itad o de las X la correlación puede se r vecina
d e cero. E sto in d ica d e hecho que hay insuficiente v ariabilidad de
X en el in te rio r d e dicho re co rrid o lim itad o p a ra c o n tra rre sta r
los efectos de las nu m ero sas variables incontroladas. E n reali
dad, X e s tá siendo m a n ten id a casi constante. P or consiguiente, si
el diag ram a d e d ispersión re su lta se r sem ejan te al de la figura
XVII.9íz, h a b ría q ue tr a ta r de ex ten d er el re co rrid o de variabili
d ad de X h allan d o m ás casos extrem os.
Si la extensión del re c o rrid o d e variab ilid ad no re su lta p rá c ti
cam en te posible, o si el in te ré s del investigador se ce n tra an te
to d o en casos m enos extrem os, será ta l vez m ás razonable p re s
c in d ir to talm e n te e n el análisis de los casos extrem os. Así, p o r
ejem plo, supongam os que X es el tam añ o d e las ciudades y que
la ciu d ad de N ueva Y ork fig u ra en la m u estra. A m enos que haya
u n g ra n n ú m ero de ciudades de tam año correspondiente, y n o las
hay, p u ed e re s u lta r necesario lim ita r la atención a ciudades de
m enos de 500 000 hab itan tes. E n algunos casos p o d rá parecer
indicado calcu lar r ta n to con los casos extrem os com o sin ellos.
Es obvio que la decisión dependerá de la naturaleza del problem a
y del in terés del sociólogo. El lecto r h a de p ercatarse bien del
hecho de que u n a o dos m arcas extrem as pueden eventualm ente
ejercer u n efecto m uy pro n u n ciad o sobre el tam añ o de r, hecho
que e n alguna fo rm a debe tenerse siem pre en cuenta. De ahí que
el reco rrid o d e v ariabilidad debiera consignarse ju n tam en te con
los coeficientes d e correlación. E sto constituye o tra ilustración
del p u n to im p o rtan te relativo a q u e u n a sim ple m edida de resu
m en, p o r m uy su p erio r que sea resp ecto de o tras, pu ed e ser a
m enudo d eso rien tadora.
Si los dato s se p re se n ta n com o en la figura XVII.9&, sospecha
rem os, p o r supuesto, que n o existe linealidad. Aquí tam bién,
pues, h a b ría que obtener, de ser posible, m ás casos extrem os. Si
éstos son sólo u n o o dos, re su lta rá tal vez p referib le excluirlos
del análisis. Las situaciones de esta índole ilu stra n el hecho de
que, al in te rio r d e cierto reco rrid o u n a relación de variación pue
de se r ap roxim adam ente lineal, resu ltan d o en cambio- inapropiada
si se extiende el m odelo lineal. De ahí, pues, que se im ponga
p ru d en cia en cu an to a generalizar m ás allá de los lím ites d e los
datos. Un en u n ciado p o r el estilo de “den tro los lím ites de
---------y--------- la relación re su lta se r aproxim adam ente lineal”
será m ás apropiado.
Comparación en tre correlaciones y declives. Las observaciones
an terio res acerca d e la sensibilidad d e los coeficientes de corre
lación an te las diferencias en la can tid ad de variación de X , re
lativ a a la disp ersión p ro d u c id a p o r facto res extraños, ap u n ta
u no d e los pro b lem as fundam entales con cualquier m edida del
grado de asociación. N u e stra atención debe e sta r c e n trad a en la
n atu raleza d e la ley que relaciona X y Y , de si la relación es o no
es lineal, y, si lo es, en la m agnitud del declive. Al co m p arar los
resu ltad o s d e dos estudios o de varias subm uestras, debem os re
conocer que es p erfectam ente posible o b ten er diferencias sustan
ciales e n tre los coeficientes de correlación, aun cuando se apli
quen las m ism as leyes (m edidas p o r los declives). E s decir, que
las r pueden d ife rir aunque no- los declives, lo que p u ed e se r debi
do ú n icam en te a diferencias en la can tid ad d e variación en la
variable in d ependiente X , o a diferencias en la am p litu d con que
h an sido som etidos a control otros factores extraños que p ro d u
cen variaciones aleatorias en Y . Como verem os al tr a ta r del análi
sis de la covariancia, al b u sca r la interacción estam os en efecto
buscando u n a d iferencia en tre declives, y no correlaciones. E n el
capítulo siguiente estudiarem os brevem ente las pru eb as p a ra en
co n tra r diferencias e n tre correlaciones, pero el lecto r debe e sta r
prevenido acerca del peligro de que tales diferencias, u n a vez
encontradas, p u ed an se r fácilm ente m al in terp re tad as.
Puede ser ú til concebir u n coeficiente de correlación r ^ com o
función de dos tipos variables, con el declive bw y u n facto r sx/ s v
abarcando la razón de las dos desviaciones e stán d a r que se apli
can a la m u estra o su b m u estra p a rtic u la r que nos ocupa. A sí:
P
donde la d irección d e las flechas re p re se n ta el “c u rso causal”
(p o r ejem p lo : pro b ab ilid ad es influidas p o r m agnitudes de rela
ciones y tam añ o s de m u e stra s), lo q u e va frecu e n te m e n te en di
rección o p u esta a la que siguen los p aso s del proced im ien to em
p lead o en u n análisis estadístico. E l diagram a in d ica que p es
u n a función d e dos variables, u n a d e las cuales (e l tam añ o de la
m u e stra ) no es d e in teré s in h eren te, y que la correlación es
asim ism o u n a fu n ció n de dos facto res, u n o de los cuales { s j s v),
n o es d e in teré s. N u e stro objetivo consiste en llevar el análisis
h acia a rrib a en el diagram a h a s ta la estim ación d e los coeficien
tes de regresión, en lu g ar de deten ern o s en los niveles d e p ro b a
bilidad, o fo rm u lan d o declaraciones en relación con los coeficien
tes de correlación.
R esulta q u e en cu an tas ocasiones se m an eja n m edidas ordina
les de asociación, tales com o las q u e se v erán en el cap ítu lo si
guiente, d esap arece la distinción e n tre declives y m edidas de
asociación. E n el caso d e dicotom ías, sin em bargo, p u ed e dem os
tra rs e que si se sigue la regla d e colocar la variable independien
te al trav és d e la p a rte a lta del cuadro, y se co m p u tan las p ro
porciones (o p o rc en tajes) de m odo que sum en 1.00 (o 100) hacia
abajo, co m p aran d o a continuación de izquierda a derecha, la
d iferen cia de p ro porciones re su ltan te puede se r considerada
com o u n caso especial del declive byx, en ta n to q u e -<j> p asa a ser
u n caso especial de rmy. Si se co m p u tan las pro p o rcio n es en la
o tra dirección, la diferencia de proporciones p asa a s e r u n caso
especial de b ^ , d e m odo que ten d re m o s u n a ju stificació n m ás
p a ra seguir la regla em pírica p rev iam en te sugerida. Pueden ob
ten erse estos re su ltad o s p o r el sim ple procedim iento de asignar
pu n tu acio n es d e 0 y 1 ta n to a X com o a Y , utilizan d o a continua
ción las fó rm u las básicas p a ra el cálculo de rxy y byw.
* Cálculos a p a rtir de datos agrupados. Si el n ú m ero de casos es
gran d e o si no' se dispone de u n a calculado ra m oderna, el cálculo
de los coeficientes de correlación p u ed e re s u lta r ex trem adam ente
laborioso. E n tal caso será ta l vez m ás indicado servirse de d a
tos agrupados, au n a riesgo de in tro d u c ir eventualm ente algunas
im precisiones. E n principio, estos cálculos de dato s agrupados
no son m ás que aplicaciones abreviadas de los procedim ientos
em pleados p a ra o b te n e r la m edia y la desviación están d a r. Tene
m os ah ora dos variables que h a n d e clasificarse cruzadam ente
com o en el c u a d ro XVII.2. H em os de an tic ip a r u n a m edia p a ra
cad a variable, to m an d o desviaciones graduales de cada u n a de
las m edias y sirviéndonos de facto res de corrección en cada caso.
Además, n ecesitarem os u n térm in o d e p ro d u c to cruzado equiva
len te a 2x>\ Como que las desviaciones ta n to de X com o de Y
se to m ará n de las m edias adivinadas respectivas, necesitam os
serv im o s de u n fa cto r de corrección a s u s tra e r del térm in o del
p ro d u c to cru zad o apreciado. Podem os m odificar así las fórm ulas
de cálculo de r y b de m odo que se tenga en cu en ta que nos he
m os servido d e m edias adivinadas en lugar de las correctas.
Se re co rd a rá que u n a de las fórm ulas de s sirviéndose de datos
agrupados era (d e ja n d o de lado los su b ín d ices):
5 = ^ - V ^ 2 / d '2 - ( 2 / d ' ) 2
N V f x y d ’w d ' v - a f x d ’* ) ( ? f v d ’v ) V I I 9
2 Y -6 2 X
a — -------------------— =
y —bX
N
Y P = 32.14 - .1733X
, 2 ( 7 - ji,)*
x
Fig. X V II.11. R epresentación geom étrica que m uestra las desvia
ciones respecto de la m edia Y com o una sum a de desviaciones
respecto de la recta de m ín im o s cuadrados y desviaciones de la
recta de m ínim os cuadrados respecto de la Y.
des re p resen ta la desviación del valor de Y respecto de la línea
de los m ínim os cuadrados e indica la cantidad de e r ro r que se
com ete cuando se em plea Y P p a ra p re d ecir Y . La segunda expre
sión, en cam bio, indica la desviación de la línea de m ínim os cua
drados (p a ra u n a X d ad a) respecto de Y . E n la m ayoría de los
casos, esta can tid ad re p re se n ta rá el m o n to en que se reduce el
e rro r al conocer Y P. Si elevam os al cuadrado ahora am bos m iem
bros de la ecuación y sum am os luego todos los casos, o b ten em o s:
2 ( y - y ) 2= 2( y - y pp + 2(yJ, - y )2 (xvii.12)
SC to tal = SC inexplicada + SC explicada
La p rim era cantidad de la derecha de la ecuación re p resen ta
la sum a de los cuadrados de las desviaciones de los valores re a
les de Y respecto de la línea de los m ínim os cuadrados. E sta
can tid ad es inexplicada, ya que indica la m agnitud del e rro r en
la predicción. Y la cantidad re sta n te indica lo que hem os gana
do al servim os de Y v con preferen cia a Y , pudiendo designarse
com o la sum a de cuadrados explicada. P or explicada n o enten
dem os, p o r supuesto, u n a explicación causal, sino sim plem ente
u n a asociación e n tre las dos variables. Considerem os ah o ra m ás
de cerca cad a u n a de estas cantidades.
Si tom am os u n a sum a de cuadrados inexplicada y dividim os en
tre el núm ero to tal de casos, obtenem os la variancia de la m ues
tra Sy\x respecto de la línea de los m ínim os cuadrados. O sea:
= (X V II.13)
A2 S Í F - F ,) 2 /VW TT14-V
o*\m = ----- — ~----- (X V II.14)
Ai — 2
(Yp- Y ) = b ( X - X )
P o r consiguiente:
(2 x2)2 2*2
( 2 xy)2
7 • ( 2 y2) = r22y2
2x22y2
= r22 ( y - y )2
Hem os dem o strado así que:
•2 — .
2 (yp- Y )2 SC explicada
2(y — Y ) s SC to tal
P o r m edio de u n razonam iento sim ilar pudim os h a b e r dem os
tra d o q ue f 2 re p re se n ta la razón d e la variación explicada en X
a la variación to ta l en X. P or lo tan to , el cu ad rad o del coeficien
te de correlación p u ed e in te rp re ta rse com o la p ro p o rció n de
variación to tal en u n a de las variables explicada p o r la o tra. La
can tid ad de \ / \ — r2, designada a m enudo com o coeficiente de
alienación, re p re se n ta la raíz c u a d ra d a de la pro p o rció n d e la
sum a to tal de cu ad rad o s que perm an ece sin explicar p o r la varia
ble independiente.
Cabe o b serv ar que no se d a in terp re tació n d ire c ta y sim ple
alguna de la r m ism a. De hecho, es posible d ejarse d eso rie n ta r
p o r los valores d e r, ya que estos valores serán n u m éricam ente
m ayores que los d e r2 (a m enos que r sea 0 o ± 1 .0 ). Así, p o r
ejem plo, p o d ría p arece r que u n a r d e .5 sea la m ita d de buena
q ue u n a correlación perfecta, en ta n to que vem os que, en este
caso, sólo explicam os u n 25 p o r ciento de la variación. Una co
rrelación d e .7 indica que algo m enos de la m ita d d e la variación
re su lta explicada. Vemos asim ism o que correlaciones d e .3 o m e
nores significan que sólo u n a fracción m uy pequeña de la varia
ción es explicada. E l cu ad ro XVI 1.4 indica las relaciones e n tre
las diversas cantidades.
Como q u iera que 1 — r 2 re p re se n ta la pro p o rció n d e variación
inexplicada, ten em o s:
2 ( y - y )2 2 ( y - y p)»
N N
o bien :
(l-r* )V = 4 .
De d o n d e :
= V 1 - r 2 Sí-
Glosario
Distribución normal bivariada
Coeficiente de alienación
Coeficiente de correlación
Covariancia
Intercepción
Ecuación de los mínimos cuadrados
Regresión de Y sobre X
Declive.
E jercicios
1. Los siguientes datos relativos a 29 ciudades de 100 mil o m ás habi
tantes de regiones fuera del Sur están tomados del estudio de R. C.
.Angelí sobre la integración m oral de las ciudades norteamericanas.
El índice de integración m oral se ha derivado combinando los índi
ces de tasas de criminalidad con los de la labor de mejoramiento.
La heterogeneidad se midió en térm inos de los números relativos de
los no blancos y los blancos nacidos en el extranjero contenidos en la
población. Y se calculó asimismo, a título de segunda variable inde
pendiente, un índice de movilidad, que mide los números relativos
de las personas que se establecen o dejan la ciudad.
B ibliografía
1. Blalock, H. M.: Causal Inferenees in Nonexperimental Research.
University of North Carolina Press, Chapel Hill, 1964, caps. 2 y 3.
2. Christ, Cari: Econometric Modets and Methods, John Wiley &
Sons, Inc., Nueva York, 1966, Parte III.
3. Croxton, F. E„ y D. J. Cowden: Applied General Statistics, 3- ed.,
Prentice-Hall, Inc.: Englewood Cliffs, N. J. 1967, caps. 19 y 20.
4. Hagood, M. J., y D. O. Price: Statistics for Sociologists, Henry
Holt and Company Inc., Nueva York, 1952, cap. 23.
5. Hays, W. L.: Statistics, Holt, Rinehart and Winston. Inc., Nueva
York, 1963, cap. 15.
6. Johnston, J.: Econometric Methods, McGraw-Hill Book Company,
Nueva York, 1963, Parte II.
7. McCollough, C., y L. Van A tta: Introduction to Descriptive Sta-
tistics and Correlation, McGraw-Hill Book Company, Nueva York,
1965, caps. 5-8.
8. Mueller, J. H., K. Schuessler, y H. L. Costner: Statistical Reason-
ing in Sociology, 2? ed., Houghton Mifflin Company, Boston, 1970,
cap. 1 1 .
9. Wallis, W. A., y H. V. Roberts: Statistics: a New Approach, The
Free Press of Glencoe, 111., Chicago, 1956, cap. 17.
10. Weinberg, G. H., y J. A. Schum aker: Statistics: An intuitive Appro
ach, Wadsworth Publishing Company, Inc., Belmont, Cal., 1962,
caps. 16-18.
E n el p resen te capítulo proseguim os el exam en de la correlación
y la regresión. Se tra ta rá n p rim e ro algunas pru eb as de signifi
cación, a continuación de lo cual pasarem os a las relaciones no
lineales, tem a que se exam inará asim ism o brevem ente en el ca
p ítu lo xix. A continuación estudiarem os los efectos d e los erro
res de m edición en las pendientes y las correlaciones. F inalm en
te, se exam inará el tem a de la correlación grado-orden.
Total 2 y2 N -l
fV2y2
Explicada r't'S.y2 1
1 r2(N - 2)
(1 — r2)2 y2 ( 1 - r 2)
Inexplicada (1 — r2)2 y2 N -2
N -2
F I,Jf_ 2 = - 1r —
^ r2 (iV - 2) (X V III.l)
1 -j- Y
z = 1.151 log — —
1 —r
Y esto n o sólo p erm ite servirse de la tab la norm al, sino que he-
iiion elim inado adem ás la necesidad d e h a b e r estim ado q, y a que
i<| e rro r están d a r d e z sólo depende d e N . Tom ando com o ejem
plo num érico la correlación d e .301 e n tre el p o rc en taje de negros
y In ilIncrim inación, hallam o s que el v alo r co rresp o n d ien te d e z
t*s ilc* 0.3106. Como q u ie ra que no h a b ía m ás que 13 casos, te
nemos :
en donde se re co rd a rá q ue:
560 0 2 4 - 1 9 .9 3 1 ( 2 553.77)
= V 46 284 = 215.1
, 6= _ j m _ = _2m =1900
V128.131 11.32
V
I 1— —-----------------
(X-X)* ,(X
Y,,VnIII.5)
„v
N 2 (Xi-X)*
i= i
,en donde el valor p a rtic u la r de X a u tilizar en ( X — X ) 2 puede
ponerse en cu alq u ier lugar del eje de las X. Obsérvese, de paso,
que eunnto m ás lejos X queda de X, ta n to m ayor es el valor nu-
m áiieo del e rro r están d ar. Supóngase que deseam os o b ten er el
rm > r e stá n d a r estim ado cuando X = 10.0. Como q uiera que
V 4.837, obtenem os:
(X V III.6)
( Z i — Zb ) - 0
Z=
= .301 ro = .567
Z t= 0.3106 za = 0.6431
= V l/ i o + V i 4 = + -0714 = .414
P o r lo ta n to :
t - (r _ r } (W -3 )(l + r„ )
*• — \ * x y r zy f '
2(1 1xy“ r X !? 2 r x y r x z V zy )
(X V III.7)
Y = a + b X + cX* + dX» + . . . + k X n
Y = a + b log X
Y — a + b log X = a + bZ
Total 2y2 N -l
Explicada por el mo
delo lineal 1
Adicional, explicada
por el modelo no ( £ 2—r2)Sy2
lineal ( £ 2 _ r2)2y2 k -2
k -2 (E 2- r 2)(W -fc)
(1 —JB2)2y2 (1 — E 2) ( k — 2)
Inexplicada (1 - £ 2)2y2 N -k
N -k
( £ 2 — r2) ( N — k)
(XVIIL8)
y
t2 ! ------ ü .
E H N -l)-(k-í)
E2 = — 1 1 -------------------------------------i (X V III.9)
N —k
<V + o„a
<V2 = oa +
6(207.50)
r - i ------i--------- i- = 1 - .305 = .695
16(255)
O r d e n de O r d e n de
l't'tsonas
popularidad participación
Z = — r* ° = .695 y /Í 5 = 2.69
í/y w -i
•tilvMniiono* de la tab la n o rm al vem os que la relación es signi-
flrwllvt* «I nivel tle .0 1.
t a (>iu tfs K nutall. Al calcular la rs de S pearm an nos servim os
rft» lim i iimlindos de las diferencias en los rangos. La ta u de
fcwülrtl!, t'tt t timbio, que tam bién varía e n tre —1.0 y 1 .0, se b asa
•H utm (ípt'tiu lón algo d istin ta. E n efecto, calculam os p rim ero
u n a estad ística S buscando todos los pares posibles de casos y
observando si las puntuaciones están o n o en el m ism o orden.
Así, p o r ejem plo, supongam os que teníam os las siguientes com
binaciones de lugares:
a b c d
A 1 2 3 4
B 2 3 1 4
S = C - D = ( 2 - l ) + ( l - l ) + ( l - 0) = 2
IU olí vio que si hay discrepancia perfecta en tre los dos sistem as
tlt» ni lim ación (esto es, si B estuviera ordenado com o 4, 3, 2, 1),
ni valor de S será —ViN^N — 1), y x será —1.0. Y asim ism o, si las
it'i'4 v¡iriubles no tienen relación alguna e n tre sí, las contribucio
nes a .S positivas y negativas se invalidarán, y x será cero.
( un o b jeto de ilu s tra r el caso de los órdenes em patados, sir
vámonos nuevam ente del ejem plo del cam pam ento de trab ajo .
iJUpongairios a los individuos en orden horizontal y reemplace*
iiiiih los nom bres p o r letras. N u estra disposición se p re sen ta en
i»i»l¡i turm a:
a I) cdef g h i j k l m n o p
A I 2.5 2.5 4 5 6 7 8 9 10 11.5 11.5 13.5 13.5 15 16
II V5 5.5 1 2 3 9.5 5.5 13.5 9.5 16 5.5 11.5 8 15 11.5 13.5
T = M [2 (l) + 2(1) + 2 (1 )] = 3
De donde:
60 60 60
rh = ------------------------------------ ----------------------= ------- = .526
V [8 (1 5 )-3 ][8 (1 5 )-9 ] y/(U7)(lll) 114.0
<r„ = 22.21
S- 0 60.0
: 2.70
c3 22.21
c —l)/m ]
(X V III.14)
ilomle m = M in (r,c )
Ai|u( seguim os a K endall en el em pleo del sím bolo xc, con o b jeto
ile distin g u ir la ecuación (X V III.14) de las fórm ulas p reced en tes.
Veamos ah o ra cóm o se calcula rc.
l , o s dato s del cu adro X V III.4 re p re se n ta n los lugares asignados
(i *17 estu d ian tes de in troducción a la sociología en la U niversi
d a d de Michigan. La v ariab le B co m p o rta el in terés general del
■oillidiante en cuanto a a d o p ta r las fo rm as "ap ro p iad a s” o "co-
m v l a s ” de com p ortam iento en los m edios convencionales. E n
l a n í o que la v ariable A co m p o rta el deseo de fo rm a r p a rte de or-
H¡uii/:adones ú n icam ente con o b jeto de m e jo ra r la posición social.
Toda vez que la m edición de am bas variables fue m ás b ien tosca,
se decidió d iv id ir cada u n a de ellas en c u a tro c a te g o ría s : interés
alto, m o d erad am en te alto, m o d erad am en te b a jo y bajo. De este
m odo, si b ien cada variable c o m p o rta u n a escala o rd in al con u n
C uadro X V III.4. Datos com parados para el cálculo de la tau de
K endall a p a rtir de datos agrupados
Alto 18 19 12 8 57
M oderadamente alto 16 16 12 10 54
Moderadamente bajo 11 14 18 16 59
Bajo 5 5 15 22 47
Total 50 54 57 56 217
Asi pues:
4741
x0 = ------------------------------ = .268
]/ i( 2 1 7 ) 2 [ ( 4 - l ) / 4 ]
9055 - 4314
« = ------------------ = .3 5 4
r 9055 + 4314
B
A Alta Media Baja Total
Alta 100 80 0 180
Media 0 20 80 100
Baja 0 0 20 20
Total 100 100 100 300
B ibliografía
1. Anderson, T. R., y M. Zelditch: A Basic Course in Statistics, 2‘
ed., Holt, Rinehart and Winston, Inc., Nueva York, 1968, caps. 7 y 8.
2, Blalock, H. M .: "Estim ating Measurement E rror Using Múltiple
índicators and Several Points in Time”, American Sociological
Review, vol. 35, pp. 101-111, 1970.
Bohmstedt, G. W .: “Observations on the Measurement of Change”,
en Edgar Borgatta (ed.), Sociological Methodology 1969, Jossey-
Bass Inc., Publishers, San Francisco, 1969, cap. 4.
4. Christ, Cari: Econometric Models and Methods, John Wiley &
Sons, Inc., Nueva York, 1966, Parte III.
V Costner, H. L .: "Criteria for Measures of Association”, American
Sociological Review, vol. 30, pp. 341-353, 1965.
(>. Costner, H. L.: "Theory, Deduction and Rules of Correspondence”,
American Journal of Sociology, vol. 75, pp. 245-263, 1969.
/. Croxton, F. E., y D. J. Cowden: Applied General Statistics 3’ ed.,
Prentice-Hall, Inc., Englewood Cliffs, N. J., 1967, cap. 20.
H, Goodman, L. A., y W. H. Kruskal: "Measures of Association for
Cross Clasifications”, Journal of the American Statistical Associa
tion, vol. 49, pp. 732-764, 1954.
V. Goodman, L. A., y W. H. Kruskal: “Measures of Association for
Cross Classifications, II: Further Discussion and References”,
Journal of the American Statistical Association, vol. 54, pp. 123-
163, 1959.
10, Goodman, L. A., y W. H. Kruskal: "Measures of Association for
Cross Classifications, III: Aproxímate Sampling Theory", Journal
of the American Statistical Association, vol. 58, pp. 310-364, 1963.
11. Haggard, E. A.: Intraciass Correlation and the Analysis of Va-
riance, The Dryden Press, Inc., Nueva York, 1958, pp. 22-26.
12. Hagood, M. J., y D. O. Price: Statistics for Sociologists, Henry
Holt and Company, Inc., Nueva York, 1952, cap. 23.
13. Hays, W. L.: Statistics, Holt, Rinehart and Winston, Inc., Nueva
York, 1963, cap. 16.
14. Heise, D. R .: "Separating Reliability and Stability in Test-Retest
Correlation”, American Socialogicat Review, vol. 34, pp, 93-101,
1969.
15. Johnston, J.: Econometric Methods, McGraw-Hill Book Company,
Nueva York, 1963, Parte II.
16. Kendall, M. G.: Rank Correlation Methods, Hafner Publishing
Company, Inc., Nueva York, 1955, caps. 1, 3 y 4.
17. Kruskal, W. H.: "Ordinal Measures of Association”, Journal of
the American Statistical Association, vol. 53, pp. 814-861, 1958.
18. Mueller, J. H., K. Schuessler, y H. L. Costner: Statistical Reason-
ing in Sodology, 2‘ ed., Houghton Mifflin Company, Boston, 1970,
cap. 10.
19. Siegel, Sidney: Nanparametric Statistics for the Behaviorál Scien
ces, McGraw-Hill Book Company, Nueva York, 1956, cap. 9.
20. Somers, R. H.: “A New Asymmetric Measure of Association for
Ordinal Variables”, American Socialogicat Review, vol. TI, pp. 799-
811, 1962.
21. Wallis, W. A-, y H. V. Roberts: Statistics: A New Approach, The
Free Press of Glencoe, 111., Chicago, 1956, cap. 17.
22. Wilson, T. P .: "A Critique of Ordinal Variables”, Social Forces,
vol. 49, pp. 432-444, 1971.
23. Wilson, T. P.: "A Proportional-Reduction-in-Error Inteipretation
for KendaH's tau-b”, Social Forces, vol. 47, pp. 340-342, 1969.
E n los dos ú ltim o s capítulos nos hem os ocupado de la relación
e n tre dos escalas d e intervalo, en tre u n a variable dependiente
y u n a sola v ariable independiente. Los análisis de correlación y
reg resió n pu ed en extenderse fácilm ente p a ra com p ren d er cual
q u ie r n ú m ero d e escalas de intervalo, u n a d e las cuales puede
to m arse com o dependiente, y las dem ás com o independientes. El
p ro b lem a se p u ed e concebir com o u n p ro b lem a de predicción en
el q u e tra ta m o s d e p re d e c ir u n a v ariab le dependiente Y a p a r tir
de las variables X x, X 2, . . . , X k. H abrem os de servirnos d e nue
vo de u n m odelo m uy sencillo, que será directam en te análogo a
la reg resió n lineal, excepto en cuanto al hecho d e que h a b rá m ás
de dos dim ensiones.
El concepto d e correlación se generalizará en dos form as. E m
plearem os el térm in o d e correlación parcial p a ra designar la co
rrelació n e n tre dos variables cualesquiera cuando los efectos de
o tra s variables se h a n controlado. El de correlación m últiple,
en cam bio, serv irá p a ra in d icar qué ta n to de la variación to ta l de
la variab le dep en d iente p u ed e explicarse p o r to d as las variables
in d ep en d ien tes actu an d o co n ju n tam en te. V erem os que los m ate
riales exam inados en el p re sen te capítulo co m p o rtan en su m ayor
p a rte extensiones d irectas d e razonam ientos p resentados a n te
rio rm en te . U na vez que hayam os am pliado las nociones de co rre
lación y regresión, estarem o s en condiciones, en el cap ítu lo si
guiente, d e e m p re n d er el análisis d e covariancia, que com porta
u n a com binación de las técnicas d e regresión con el análisis de
la variancia.
(X IX .2)
y volverá a re s u lta r que, a condición que la ecuación d e reg re
sión sea efectivam ente de la m ism a form a, la ecuación de los m í
nim os cu ad rad o s re p re se n ta la m e jo r estim ación de la ecuación
de regresión. E n otros térm inos, si nos servim os d e a p a ra esti
m a r a, y de fe¿ p a ra estim a r |3¡, estas estim aciones serán insesga-
das y, al p ro p io tiem po, d e eficiencia m áxim a. P o r consiguiente,
n u e stra aten ció n p u ed e fija rs e en el análisis d e los m ín im a
cu ad rad o s com o m étodo p ráctico d e estim a r u n a ecuación teó
ric a que se aplica a la población. Si sólo h ay dos variables inde
pend ien tes, aju stare m o s u n a serie de p u n to s en el espacio trid i
m ensional con u n plan o d e m e jo r aju ste. E n u n espacio de (k +
1 ) dim ensiones, p o r su p a rte , aju stare m o s p u n to s con u n hiper-
p lan o de k dim ensiones, si es que sem ejan te fig u ra se puede
concebir.
T om ando el caso tridim ensional, reducirem os al m ínim o la can
tid ad 2 ( F - Y pp, que re p re se n ta la sum a de las desviaciones al
cu a d rad o resp ecto del plano
d e m ínim os cu ad rad o s en la
dim ensión v ertical de Y (véa
se la fig u ra X IX .2). El re
su ltad o será u n plan o único
d e m ejo r aju ste, determ inado
p o r valores específicos de a,
bx y b2. Según verem os, p u e
de u tilizarse luego u n coefi
ciente de correlación m ú lti
ple p a ra m e d ir la b o n d ad de
a ju ste de los p u n to s al plano
de m ínim os cuadrados. Se
ría tam b ién "posible, p o r su
puesto, m e d ir el grad o de
a ju s te m ed ian te u n a desvia
ción e s tá n d a r re fe rid a al pla
no, y p o d ríam os co m p arar
esta desviación con la des
viación e s tá n d a r en relación
con la Y fija (rep rese n tad a Fig. XIX.2. Plano d e m ínim os
ah o ra com o plano p erp en d i cuadrados, que reduce al m ínim o
c u la r al eje d e las Y ). Alge las sum as de las desviaciones al
b raicam en te, el caso m ás ge cuadrado en ta dim ensión
n eral es u n a am pliación di vertical Y.
re c ta del caso de tre s variables. La cantidad 2 (Y — Y p)2 se m ini
m iza, y h a b rá q ue calcular ( k + 1) coeficientes, esto es, a, bít b2,
. . . bk. El cálculo efectivo de estos coeficientes será posible exa
m in arlo m ás adelante, cuando hayam os efectuado el estudio de
la correlación parcial.
Uj ,y ty i \
ri}.k .......... ..... - .... — ( X IX .3)
V 1- V 1 _ rik2
(X IX .6)
ca) (el
•Z
X- *Y \
(</) (*) (f)
nes es causa de que éste g aste m enos dinero, lo cual d eja a su vez
sin em pleo a S m ith, etcétera. Nos quedam os entonces con sólo
ciertas relaciones causales posibles, que se h an indicado en la fi
g u ra XIX.5. Con o b jeto de re d u c ir el nú m ero de figuras de la figu
ra XIX.5, se h a decidido* a rb itra ria m e n te escoger a Y com o varia
ble dependiente, o sea com o aquella que h a d e o c u rrir com o ú ltim a
en cu a lq u ie r secuencia tem p o ral. De ahí q u e n o se hayan trazad o
flechas de Y a X o a Z. De to d as estas relaciones posibles, las
tres p rim era s n o rev isten in terés ni re q u ie ren com entario u lte
rio r. Adem ás, con o b jeto d e sim plificar la cosa, lim item os nues
tr a atención a aquellas figuras en las que sólo se h an trazado
dos flechas causales (d , e, /, g y h ).
X i—
i i
X s—
(X IX .7)
y (X IX .8)
vemos que incluso los denom inadores n o son dem asiado dispa
res en cu an to a la form a. Con todo, al em plear esta fórm ula para
ob ten er las b parciales, hay que p o n e r cuidado en distin g u ir en
tre bjk y bk¡, ya que los subíndices ya n o pueden intercam biarse.
La extensión a parciales de ord en superior es d ire c ta (véase
[5 ]). Las ecuaciones de ai.m y b inx pueden escrib irse:
bij-lc ~ (bil-k)(bij.ic)
y b im ~ i -hi-^Ku)
Ig ualm ente cierto en el cálculo de correlaciones parciales de o r
d en su p erio r a m edida que el núm ero de variables aum enta, el
em pleo de estas fórm ulas p u ed e co m p o rtar acaso considerable
m en te m ás tra b a jo que el que req u ieren los m étodos abreviados
d e D oolittle o d e la raíz c u a d rad a de Dwyer. N orm alm ente será,
p o r supuesto, m ás conveniente u tiliza r pro g ram as de com pu
tación, cu an d o se tr a te d e o b ten er esto s coeficientes.
Se p u ed e in te rp re ta r u n declive p arcial com o el cam bio h ip o
tético q u e o c u rriría en la variable d ependiente si u n a de las va
riab les in d ependientes h u b iera de cam b iar en u n a u n id ad y si las
dem ás variables perm an ecieran constantes. E sto p u ed e ser in
te rp re ta d o com o u n a m edida del efecto d irecto de la variable
in d ep en d ien te sobre la variable depen d ien te; si un declive p a r
cial es igual a cero, ello n o im plicaría u n efecto directo. P ero no
hab ien d o especificado las conexiones causales e n tre las p ro p ias
variables in dependientes y teniendo e n cu e n ta únicam ente sus
in terco rrelacio n es, n o nos es posible d ecir n a d a en relación con
el efecto to ta l d e ca d a variable. Si, p o r ejem plo, la p rim era
variab le in d ep en d iente es u n a causa de la segunda, u n cam bio
en la p rim e ra v ariable p ro d u c iría u n cam bio tam b ién e n la se
gunda, pro d u cién d ose efectos tan to directos com o indirectos. De
esta m an era no podem os v alo ra r la im p o rta n c ia re la tiv a de cada
variable, a m enos que conozcam os m ás acerca de la e stru c tu ra
causal del sistem a en su totalidad. E sto re q u e riría tra b a ja r con
to d o u n grupo d e ecuaciones, u n a p o r cada variable que sea to
m ad a com o dep endiente d e cualesquiera d e las otras. P o r des
gracia, los m ínim os cu adrados o rd in ario s no son en general ade
cuados p a ra tal sistem a de ecuaciones (véanse [4 ] y [ 1 2 ]).
E n ta n to n o estem os interesados en generalizar m ás allá d e los
lím ites d e u n a sola población, en ocasiones es deseable ob ten er
u n a m ed id a asim étrica de los efectos directos de cada variable
in d ependiente, q ue n o dependa de las unidades d e m edida u tili
zadas. O btenem os así, e n efecto, u n a m ed id a del efecto d irecto
real en el caso p a rtic u la r de la población que estudiam os, dado
que algunas variables independientes v arían m ás que o tras. U na
v ariable p u ed e se r m ed id a en dólares, o tra en años. C arecería de
sen tid o co m p arar la u n id ad de cam bio en u n a con la u n id ad
de cam bio en la o tra.
Si cad a v ariable es estandarizada, dividiéndola p o r su desvia
ción están d a r, en la m ism a fo rm a que se aplicó p a ra o b ten er la
cu rva n o rm al está n d a r obtendrem os declives aju stad o s, com pa
rables de u n a v ariab le a la siguiente. M edim os así los cam bios
en la v ariable dep endiente en función d e unidades d e desviación
e stá n d a r p a ra cada u n a d e las o tras variables, lo que nos asegura
una m ism a v ariabilidad en cad a u n a de estas variables. E stos
declives p arciales aju stad o s re su lta n así bes (b ) estandarizadas,
llam adas frecu en tem en te ponderaciones beta, siendo denom ina
dos coeficientes d e curso en los m as sim ples m odelos causales,
en los que está im plicada u n a d e term in a n te de causa en u n a sola
dirección (véase [14]).
P or desgracia, u n a vez m as nos vem os envueltos en incongruen
cias de notación. E n efecto, estas ponderaciones de b e ta n o son
las m ism as q u e las de las (3 en la ecuación d e regresión, que se
refieren a ca racterísticas de la población y no h an sido aju stad as
en relación con las diferencias d e variabilidad. Las p o n d eracio
nes de b eta se obtienen d e los dato s de la m uestra y son sim ples
funciones de las b parciales. Las fórm ulas generales de 13•• v
P .^ s o n : itrky
=&«•*— (X IX .11)
y
Pyw = — (X IX .12)
Si
Así, pues, la p o n d eració n de b e ta puede obtenerse m ultiplicando
la b co m p arab le p o r la razón de la desviación e stá n d a r de la
variable ind ep endiente (no co n tro la d a) a la de la variable de
pendiente.
La co m p arab iíidad de las ponderaciones de b e ta y los coeficien
tes de correlación parcial p u ed e verse en la fó rm u la :
o ’ r ilcrjJc .
P ií* = — ------- — (X íX .i3 )
1 —V
Las dos m edidas sólo difieren en los denom inadores. D'e hecho,
vemos in m ed iatam en te q u e :
Y p = a + b iX i + b2X 2 + . . . + b¡¿Xk
O tr a m a n e r a d e c o n c e b ir la c o r re la c ió n m ú ltip le e s tá e n q u e
r e p r e s e n t a l a correlación d e orden cero é n t r e l o s valores reales
o b t e n i d o s p a r a l a v a r i a b l e d e p e n d i e n t e y l o s valores anticipados
a p a rtir de la ecuación de m ínim os cuadrados. S i to d o s lo s p u n
to s se e n c u e n tra n e x a c ta m e n te e n la s u p e rfic ie d e m ín im o s c u a
d r a d o s , lo s v a lo re s r e a l y a n tic ip a d o c o in c id ir á n , y la c o r re la c ió n
m ú ltip le s e r á la u n id a d . Y c u a n to m a y o r s e a la d is p e rs ió n a lr e
d e d o r d e la e c u a c ió n d e m ín im o s c u a d r a d o s ta n to m á s b a ja s e r á
la c o r re la c ió n e n tr e lo s v a lo r e s r e a l y p r e d ic h o .
L a f ó r m u la d e la c o r re la c ió n m ú ltip le p u e d e d e s a r r o lla r s e f á
c ilm e n te s irv ié n d o s e d e l h e c h o d e q u e e l c u a d r a d o d e l m ú ltip le
s e r á ig u a l a l p o r c e n ta je d e la v a r ia c ió n e x p lic a d a p o r to d a s la s
v a r ia b le s in d e p e n d ie n te s . C o n v ie n e r e c a lc a r u n a v e z m á s q u e s e
s u p o n e u n m o d e lo d e tip o lin e a l. A l e s c r ib ir la f ó r m u la d e la c o
r r e la c ió n m ú ltip le , d e ja m o s p r im e r o q u e u n a d e la s v a r ia b le s
in d e p e n d ie n te s e x p liq u e to d o lo q u e p u e d e . D e ja m o s lu e g o q u e la
s e g u n d a v a r ia b le in d e p e n d ie n te h a g a lo p r o p io e n r e la c ió n c o n
la p o r c ió n d e la v a r ia c ió n n o e x p lic a d a p o r la p r im e r a . S in e m
b a rg o , c o n o b je to d e e v ita r d u p lic a c ió n , h e m o s d e c o n tr o la r e n
r e la c ió n c o n e s ta p r im e r a v a ria b le in d e p e n d ie n te . D e ja m o s a c o n
ti n u a c i ó n q u e la t e r c e r a e x p liq u e to d o lo q u e p u e d e d e l r e s to ,
c o n tro la n d o ' a h o r a e n re la c ió n c o n la s d o s p r im e ra s v a ria b le s
in d e p e n d ie n te s . E l p r o c e d im ie n to p u e d e p r o lo n g a rs e d e m a n e r a
in d e f in id a .
D e m o m e n to , s in e m b a rg o , n o s lim ita m o s a l c a s o d e tr e s v a r ia
b le s , q u e s ó lo c o m p o r ta d o s v a r ia b le s in d e p e n d ie n te s . S i to m a
m o s ’la p r im e r a v a ria b le c o m o la v a ria b le d e p e n d ie n te , y d e s ig n a
m o s e l c o e fic ie n te d e c o r re la c ió n m ú ltip le p o r R ^ g , p o d r e m o s
e s c rib ir:
^1-23 — r12 + ^13-2 (1 ~ ^12)
Proporción\ /proporción \ / proporción \ / proporción \
( explicada I = I explicada I + / adicional \ I no explica- 1
por 2 y 3 / \ por 2 / I explicada I \ da por 2 /
\ P°r 3 / (X IX .14)
R^-jk — A } + Ah-¡ ( 1 ~ A j)
= 4 + 4 , (1 -4 ) (XIX .15)
E sto nos p erm ite v er la relación e n tre los coeficientes de las co
rrelaciones m ú ltip les y parciales b a jo u n a p erspectiva algo dis
tin ta. E n el n u m era d o r hem os su straíd o la pro p o rció n de la va
riación de 1 explicada p o r la 2 sola, de la pro p o rció n explicada
p o r 2 y 3 actu an d o ju n ta s (R ? .^ ). E l re su ltad o es el increm ento
explicado p o r 3, después de h a b e r p erm itid o a c tu a r a 2. Si dicho
increm ento se divide en tre la pro p o rció n de variación d ejad a sin
explicar p o r 2, obtenem os la p arcial e n tre 1 y 3 co n trolando en
relación con 2. E sto concuerda con n u e stra in terp re tació n ante
rio r del coeficiente de la correlación parcial.
De la ecuación (X IX .14) pueden derivarse diversas fórm ulas
altern ativ as p ero equivalentes d e üif.23. S ustrayendo am bos m iem
b ro s de dicha ecuación de la unidad, o b ten em o s:
o bien, en g e n e ra l:
d 2 r i¡ + r iTc ~ 2f ifcí'jfc y iy 1o \
K i . f t — ------------ ------- ------------- ( A lA .i o ;
1 —P
H2 — r 2 O- r 2
&1-2Z = r¡2 + r ? 3 .2 ( 1 - r ? 2 ) = ( . 5 3 6 ) 2 + ( . 3 3 2 H 1 - ( . 5 3 6 ) 2 ]
= .2873 + (.1102) (.7127) = .3658
D e a h í: R 1.2S = .6 0 5
P or consiguiente, el p o rc en taje urbano explica m uy poca variación
p o r encim a y p o r debajo de aquella explicada p o r el p o rcen taje
de negros.
A títu lo de control de nu estro s cálculos, observam os que el
m ism o resu ltad o d eb erá obtenerse si dejam os que actúe p rim ero
el p o rcen taje urbano.
O btenem os en este c a s o :
y p o r lo ta n to : # 1-23 = -605
(X IX .19)
^ 1 -2 3 4 5 = R l-2 8 4 + , 'l 5 - 2 3 4 ( I — ^ 1 - 2 3 4 )
D 2 ___
*Vl'234 *Vl*2¡3
( X IX .20)
1 - i?2
1-23
indicando que la parcial e n tre 1 y 4, controlando en relación con
2 y 3, puede in te rp re ta rse com o la razón de la p roporción de
variación adicional explicada p o r 4, adem ás d e la explicada p o r
2 y 3, a la p ro p o rció n de variación d e ja d a sin explicar p o r estas
dos últim as variables. Podem os tam bién ex ten d er la ecuación
(X IX .17) p a ra com prender m ás variables. Así, p o r ejem plo:
1 ^ 1 -2 8 4 — ( 1 r1 2 )0 Í"l3- 2 )( 1 — ^"l4'23 )
y, en general,
= ••• (XIX.21)
2 _ -^1-234 — rli
r i ( 2 8 ) .4 1 _ r 2
14
r2 - (X IX .22)
1i(jk. 1 —R2
l.til-'-W
P o r e je m p lo :
■**3*12456 ~~ **3«124
3(5«).124 1 _í?2
L 3.124
Y = a + b 1X + b2X 2
y = a. H- b iX i + b2X 2
N - ( k + l) = N - k - l
Sumas de Grados
de Estimación de la
cuadrados libertad variancia
Total 2xia N - 1
Explicada
por 2 rufSxi* 1
Inexplicada
por 2 (1 — nfyZx? N -2
Explicada
por 3 W ( l - r a,*)2*i* 1 ra-i{ 1 -
Inexplica
da por 3 ( 1 - W ) ( 1- r ^ S’ x f N~ 3 (1 - fW )(l - ra*)2xx* ra -i(N - 3)
N- 3 1
13'2 —(A i- 3 )
1 ~ rh:2
(.332)2
(147) = 18.21
1 - (.332)2
s
(X IX .26)
1
= .......................
V ^ -3
z zl --z—1.9600 zu = z + l-%a¡¡ ri ru
Ri’2s — .605 .7010 .5388 .8632 .492 .698
— .332 .3451 .1829 .5073 .181 .468
Glosario
Ponderaciones de beta
Correlación múltiple
Correlación parcial-múltiple
Ecuación de regresión múltiple
Distribución normal multivariable
Correlación parcial
Ecuación polinomial
E je r c ic io s
B ibliografía
1. Althauser, R. P .: "Multicollinearity and Non-Additive Regression
Models”, en H. M. Blalock (ed.), Causal Modets in the Social
Sciences, Aldine Publishing Company, Chicago, 1971, cap. 26.
2. Blalock, H. M.: Causal Inferenees in Nonexperimental Research,
University of North Carolina Press, Chapel Hill, 1964, cap. 3.
3. Blalock, H. M .: "Per Cent Non-white and Discrimination in the
South", American Sociological Review, vol. 22, pp. 677-682, 1957.
4. Christ, Cari: Econometric Models and Methods, John Wiley &
Sons, Inc., Nueva York, 1966, Parte III.
5. Cowden, D. J . : "A Procedure for Computing Regression Coeffi-
cients”, Journal of the American Statistical Association, vol. 53,
pp. 144-150, 1958.
6. Croxton, F. E., y D. J. Cowden: Applied General Statistics, 3? ed.
Prentice-Hall, Inc., Englewood Cliffs, N. J., 1967, cap. 21.
7. Davis, J. A.: "A Partial Coefficient for Goodman and Kruskal’s
Gamma", Journal of the American Statistical Association, vol. 62,
pp. 189-193, 1967.
8. Draper, N. R., y H. Sm ith: Applied Regression Analysis, John
Wiley & Sons, Inc., Nueva York, 1966, caps. 5-10.
9. Dwyer, P. S.: Linear Computations, John Wiley & Sons, Inc., Nueva
York, 1951.
10. Gordon, Robert: "Issues in Múltiple Regression”, American Jour
nal o f Sociology, vol. 73, pp. 592-616, 1968.
11. Hagood, M. J., y D. O. Price: Statistics for Sociologists, Henry
Holt and Company, Inc., Nueva York, 1952, cap. 25.
12. Johnston, J.: Econometric Methods, McGraw-Hill Book Company,
Nueva York, 1963.
13. Kendall, M. G.: Rank Correlation Methods, Hafher Publishing
Company, Inc., Nueva York, 1955, cap. 8.
14. Land, K. C.: "Principies of Path Analysis”, en Edgar Borgatta
(ed.), Sociological Methodology 1969, Jossey-Bass, Inc., Publíshers,
San Francisco, 1969, cap. 1.
15. Morris, R. N., "Múltiple Correlation and Ordinally Scaled Data”,
Social Forces, vol. 48, pp. 299-311, 1970.
16. Quade, Dana: Nonparametric Partial Correlation, University of
North Carolina, Institute of Statistics Mimeo Series, núm. 526,
1967.
17. Reynolds, H. T .: Making Causal Inferences w ith Ordinal Data,
University of North Carolina, Institute for Research in Social
Science, Chapel Hill, 1971.
18. Simón, H. A.: "Spurious Correlation: A Causal Interpretation”,
Journal of the American Statistical Association, vol. 49, pp. 467-
479, 1954.
19. Somers, R. H.: "An Approach to the Multivariate Analysis of
Ordinal Data”, American Sociological Review, vol. 33, pp. 971-
977, 1968.
20. Wilson, T. P .: "A Critique of Ordinal Variables”, Social Forces,
vol. 49, pp. 432-444, 1971.
X X . A N Á L IS IS D E COVARIANCIA Y V A R IA B LES
SIM ULADAS
puestos serán esencialm ente los que req u ieren el análisis de va
rian cia y el de correlación. E n líneas generales, esto es lo que
hacem os en el p ro blem a del p rim e r tip o de análisis d e covarian
cia. Veam os ah o ra m ás de cerca los detalles del procedim iento.
Con o b je to de o b ten er u n a visión clara de lo que puede suceder
cuando em pleam os el análisis de covariancia p a ra co n tro lar en re
lación con u n a v ariable de escala nom inal, considerem os dos tipos
extrem os de situaciones. E n la figura X X .l tenem os u n a situación
en la que se d a u n a correlación ligeram ente negativa general o to
tal (in d icad a p o r la re c ta co n tin u a) e n tre la variable dependiente
Y y u n a variable independiente X . Si nos fijam os separadam ente
en cad a u n a de las categorías (A lt A2 y As ) de la variable d e con
tro l A, vem os que d en tro de cada clase se d a u n a relación posi
tiva m ás bien fu e rte e n tre X y Y . E n este caso, las m edias en X
d en tro de las diversas categorías son lo b a s ta n te diferentes com o
p a ra oscu recer la relación b ásica e n tre X y Y .
Si fuéram os a su p erp o n er las m edias de las tres categorías
u n a so b re o tra, m overíam os en realid ad las ecuaciones de in
traclase de tal m odo que qu ed aran u n a encim a de o tra, con lo que
ob ten d ríam o s e n tre X y Y u n a relación m ucho m ás fuerte. E n
esencia, esto es lo que hacem os cuando obtenem os u n coeficiente
p rom edio d e correlación intraclase. U na m an era de re p re se n ta r
se el p roceso consiste en p en sa r en térm inos de h a b e r aju stad o
n o sotros las diferencias e n tre las categorías A, sacando la fuente
de variación d ebida a la variable d e control. H abiendo aju stad o
en relación con A m ediante superposición de las m edias d e X y Y,
podem os c o m p arar ah o ra las relaciones en tre X y Y d en tro de las
categorías, investigando las diferencias e n tre las pendientes in-
x
Fig. XX.2 Datos hipotéticos que indican una fu erte correlación
total entre X y Y, pero correlaciones m ás débiles dentro de las
categorías d e A.
X u - X . . = ( X tJ - X . ¡ ) + { X . j - X . . )
y
Y tj — Y.. = ( Y is - Y.i) + ( Y . ¡ - Y . . )
podem os e sc rib ir:
(.Xi j - X . . ) ( Y t f - Y . . )
= [ (X y - X. j) + (X.¡ - X . .) ][ ( Y a - Y.,) + (Y ., - ? . . ) ]
Si sum am os todos los casos y efectuam os la m ultiplicación, obte
nem os cu a tro térm inos, d e los cuales, sin em bargo, los dos cen
trales se elim inan. Como re su ltad o podem os e sc rib ir:
S 2 ( X i} - X ..) ( y 4, — Y. . ) = s 2 ( Xi , - X . j K Y i , - Y,¡)
i } i j
Sum a to tal de p ro d u cto s = sum a de p ro d u cto s " d e n tro ”
(n o explicada)
+22(x./-x..)(y.i -F..)
* í
+ sum a de p ro d u cto s "en tre"
(explicada)
Aquí tam bién, lo m ás p ráctico consiste en servirse de las fó rm u
las de cálculos de las sum as to ta l y e n tre de productos, obte
niendo la cifra in te rio r p o r sustracción. E stas fó rm u las de cálcu
lo re su ltan se r exactam ente análogas a las que se em plearon p ara
o b ten er las sum as de cuadrados, excepto en que u n valor de Y
reem plaza a u n valor de las X , de m odo que obtenem os p roductos
cruzados, y n o cuadrados. Así tenem os, p u es:
(2 2 X iy)(22Fiy)
i i i ¡
S um a to tal de p roductos = 2 2 1 ^ 7 ^ -------------- —----------
(X X .l)
( S X y X S Y i,)
i i
Sum a de p ro d u cto s entre = 2 ---------------------
' N,
(2 2 X ^ ( 2 2
i i i ¡
------------------------------ ( X X.2)
N
(2 F )2 „ (74 938)2
= 2 F 2 - ------— = 40 399 788 - -----------
7 N 150
= 40 399 788 - 37 438 026 = 2 961 762
* Adaptada de [4], cuadro 74, pp. 486-487, con la amable autorización del editor.
Para el cálculo de covariackmes pendientes Explicada No explicada Para el cálculo de
(col. 13) por X por X correlaciones
Clase b=
(1) 2XY (2X)(2Y)/iVy ’S.xy (Xxy^/'S.x* (2xyP
2xy/2x2 2V2 (2xy)2 (18) =
(12) = (13) = (15) = 2x2 2*22y2
(11) (3)(7)/(2) (14) =
(11)—(12) (13)/(10) (13)(14) ( 16)=(6)—(15) (17) = ±V(17)
(15)/(6)
Florida 1601 644 1579311 22333 .24690 5 514 49475 .10027 .317
Alabama 1894209 1 696 126 198 083 .36203 71 712 67 074 .51671 .719
Arkansas 1 579 758 1479629 100129 .48689 48 752 51622 .48570 .697
Georgia 7 765 621 7 281 881 483 740 .51811 250 630 151 672 .62299 .789
Kentucky 217349 210 353 6996 .72693 5 086 61552 .07632 .276
Louisiana 2700374 2620089 80285 .43894 35 240 164904 .17607 .420
North Carolina 3 203 824 2 884 457 319367 .33665 107 515 165 754 .39344 .627
Mississippi 6 620 545 6 358 716 261 829 .42539 111 379 25 963 .81096 .900
South Carolina 2 737 694 2 536 517 201177 .53035 106694 27795 .79333 .891
Tennessee 464 348 394098 70250 .71924 50 527 32347 .60968 .781
Sumas 28 785 366 27 041 177 1744189 798158
Totales 28785366 25759688 3 025 678 .50068 1 514 896 1446866 .51148 .715
Entre clase
(explicada por
A) 1 281 489 614189
Dentro de clase
(no explicada
por A) 1744189 .43489 758 530 832 677 .47670 .690
Para calcular el ajuste de las Y (col. 23)
Sumas
Totales X.. = 343.747 Y.. = 499.59
esperábam os sobre la base de sus efectos separados, tiene m uy
escaso objeto, teóricam ente, estu d ia r los efectos de u n a de ellas
controlando la otra. En otros té rm in o s : la relación e n tre u n a de
las variables independientes y la variable dependiente difiere se
gún el v alo r de la variable de control. Si tal es el caso, la rela
ción d eberá estu d iarse separadam ente en el in terio r de cada una
de las categorías de la variable de control. E n el análisis de co
variancia nos enfrentam os a u n problem a sim ilar, aunque, en lu-
-gar de p en sa r en térm inos del supuesto de adicionalidad, nos
en contram os ah o ra com parando las pendientes de las ecuaciones
de los m ínim os cuadrados en el in terio r de cada u n a de las cate
gorías. O bservem os p rim ero el paralelism o e n tre el supuesto de
adicionalidad y el de pendientes iguales. E starem o s luego en m e
jo res condiciones de com prender la naturaleza d e la p ru eb a de
interacción en el análisis de covariancia.
E n el cap ítu lo xvi, que tr a ta del análisis de variancia, nos ser
vimos del siguiente ejem plo num érico con o b jeto de ilu s tra r la
adicionalidad:
Ai A2 •^3
Bi 5 10 20
b2 10 15 25
Bs 25 30 40
I n e x p l i c a d a p o r X y A, s u
p o n ie n d o a u s e n c ia d e in
te ra c c ió n 832 677 N ~ ( k + 1 ) = 139
E x p lic a d a p o r i n te r a c c ió n 34 519 k - 1=9 3 835.4
< 1 .0
E rro r 7 9 8 158 AT — 2 ¿ = 13Q 6 1 3 9 .7
758 530
.47670 = (.690)2 = ■
1 591 207
Suma de Grados„ de
. Estimación D
cuadrados “ « “■ J tf* . F
No explicada por A 1 591 207 N - k = 140
No explicada por A,
pero explicada por X 758 530 1 758 530
E rror (suponiendo au 126.6
sencia de interacción) 832 677 N —(fc + l) = 139 5990.5
= Y. f - b w( X. J - X . . ) (XX .3)
La segunda de e sta s form as, que sólo com porta la inversión del
ord en de las X .. y X.¡ y el cam bio co rresp o n d ien te d e signos, es la
fo rm a que se h a em pleado p a ra el cálculo de la Y a ju sta d a en
el cu ad ro X X .l. O bsérvese que, en este ejem plo concreto, la pen
diente es positiva, siéndolo tam b ién el cam bio de X.¡ a X.., tal
com o lo m u e stra la figura XX.5. Los m ism os re su ltad o s alge-
Fig. XX.5. In terp reta ció n geom étrica de los cálculos de las
m edias Y ajustadas.
Estimación
Suma de Grados de de la F
cuadrados libertad variancia
Y ~ a + b xX x + b.^X<
>+ c tZ¡ -f- c2Z2 + C3Z3
Y = (a + cx) + b] X1 + b2X 2
Y ~ a -f- b^X i -f- CiZx + C2Z 2 'í (■';:?:! ~b d^iX^Z^ -j- cl\ -f- d ^ X
E jercicios
1. Compruébense tantos cálculos del cuadro XX.l como sean necesa
rios para comprender cómo se obtuvieron las cifras en cuestión.
2. Tómense los datos del ejercido 1, cap. xvu y descompóngase el
índice de heterogeneidad en las siguientes categorías: 10.0 a 14.9, 15.0
a 19.9, 20.0 a 24.9, 25.0 a 29.9 y 30.0 a 49.9. Designando la integración
moral con Y, la movilidad con X y la heterogeneidad con A :
a. Verifiqúese la interacción. Respuesta, F — 2.17.
b. Obténgase rZY-¿. y verifiqúese la significación. Respuesta, F - 13.6.
c. Ajústense las medias de las categorías en Y en relación con dife
rencias respecto de X.
á. Verifiqúese la significación de las diferencias entre las Y ajusta
das. Respuesta, F = 2.71.
e. Obténgase la correlación parcial intraclase r i 7 A-x-
B ibliografía
1. Boyle, R. P.: "Patb. Analysis and Ordinal Data", American Journal
of Sociology, vol. 75, pp. 461-480, 1970.
2. Christ, Cari: Econometric Models and Methods, John Wiley & Sons,
Inc., Nueva York, 1966, Parte III.
3. Dixon, W. J., y F. J. Massey: Introéuction to Statistical Analysis,
3‘ ed., McGraw-Hill Book Company, Nueva York, 1969, cap. 12.
4. Hagood, M. J., y D. O. Price: Statistics for Sociologists, Henry
Holt and Company, Inc., Nueva York, 1952, cap. 24.
5. Johnson, P. O.: Statistical Methods in Research, Prentice-Hall, Inc.,
Englewood Clills, N. J., 1949, caps. 10 y 11.
6. Johnston, J . : Econometric Methods, McGraw-Hill Book Company,
Nueva York, 1963.
7. Schuessler, K arl: "Covariance Analysis in SocicJogical Research",
en Edgar Borgalta (ed.), Sociologicat Methodology 1969, Jossey-
Bass, Inc., Pufollshers, San Francisco, 1969, cap. 7,
8. Sonquist, J. A., y J. N. Morgan: The Detection of Interaction
Effects, Institute for Social Research, University of Michigan, Aun
Arbor, 1964.
9. Suits, Daniel: “The Use of Dummy Variables in Regression Equa-
tions”, Journal of the American Statistical Association, vol. 52, pp.
548-551, 1957.
Quinta Parte
MUESTREO
Todas las p ruebas que hem os exam inado, lo m ism o que los p ro
cedim ientos em pleados p a ra o b ten er intervalos de confianza, h an
req u erid o el supuesto de m u estreo aleatorio, y de hecho el lec
to r pu ed e h ab erse fo rm ad o acaso la im presión de que la m u estra
aleato ria e ra la ú n ica clase respetable de m u estra utilizada p o r
el estadígrafo, lo cual dista m ucho d e se r así. Existen, en efec
to, cu a tro tipos básicos de m u estreo de p ro babilidad q u e se exa
m in an en el p re sen te capítulo, a sa b e r: la m u estra aleatoria, la
m u e stra sistem ática, la m u estra estra tific ad a y la m u e stra p o r
conglom erados. Según verem os, es posible servirse de la induc
ción estad ística con cad a uno de estos cu a tro tipos de m uestreo
de p robabilidad, si b ien es cierto, p o r desgracia, que al p resen te
estam os m uy lim itados p o r lo que se refiere al núm ero d e tipos
d iferen tes de p ru eb as que pueden efectu arse con m u estras no
fo rtu itas de pro b ab ilidad. Sobre todo en el caso de las m u estras
ag rupadas, n u estro s cálculos se hacen al propio tiem po m ucho
m ás com plicados. P or lo tanto, en u n texto general com o el
p resen te, será im posible h acer m ucho m ás que in d icar algunas
consideraciones generales de estrateg ia p a ra escoger el tipo de
m u estreo que re su lte m ás apropiado en vista de una situación
d eterm inada.
Acabam os de in d icar que hay cuatro tipos básicos de m uestreo
de p ro b abilidad, u n o de los cuales es el m u estreo aleatorio. ¿Qué
es, pues, la m u estra de probabilidad? La característica d istin ti
va de la m u estra de p ro b ab ilid ad es que todo individuo h a de
ten er u n a p ro b ab ilid ad conocida de q u ed ar incluido en la m ues
tra. E n la m u e stra al azar, ya vimos que todas las com binaciones
de individuos tienen iguales posibilidades de figurar. P ero al
fo rm u lar inducciones estadísticas no es absolutam ente necesario
que to d as las pro b ab ilidades sean iguales, ya que, si la pro b ab i
lid ad de selección es conocida, será posible a ju sta r en relación
con pro b ab ilid ad es desiguales m ediante algún procedim iento de
pond eració n de u n a clase u o tra. Es esencial, sin em bargo, que
las p ro babilidades sean conocidas, con o b jeto de llegar a los
pesos apropiados. Si las probabilidades se desconocen, será im
posible servirse legítim am ente de la inducción estadística. E n
efecto, con un m u estreo caren te d e probabilidad, podem os aca
so o b ten er u n a m u e stra efectivam ente m uy representativa, pero
n o estarem o s en condiciones de ap re c ia r los riesgos d e e rro r
im plicados. Después de d escrib ir y co m p arar cada uno de los
c u a tro tipos de m u estreo de probabilidad, exam inarem os breve
m en te algunos casos en los que es pro b ab le que se obtengan
m u estras sin p robabilidad.
Se h a recalcado que en el m u estreo al azar no sólo h a de tener
cada individuo u n a op o rtu n id ad igual d e ser seleccionado, sino
que todas las com binaciones h a n de se r adem ás igualm ente pro
bables. H em os indicado tam bién que p o r lo re g u lar re su lta m ás
conveniente seleccionar sin reposición. Los especialistas d e la
selección suelen d esignar la m u e stra de esta clase com o "m ues
tr a sencilla ale a to ria ”. O bsérvese que después de cada extracción
sucesiva la p ro b ab ilid ad p a ra u n individuo de se r seleccionado
au m enta ligeram ente debido al hecho de que q u ed arán cada vez
m enos individuos n o seleccionados en la población. Si en rela
ción con u n a extracción determ in ad a las probabilidades de todos
los individuos re sta n te s en cu an to a se r seleccionados son igua
les, independientem ente de los individuos seleccionados a n terio r
m ente, entonces tenem os u n a m u e stra sencilla aleatoria. En
efecto, tenem os independencia de u n a extracción a la siguiente,
excepto en cu an to al hecho de que ningún individuo puede ser
seleccionado dos veces.
¿P or cuál p rocedim iento m ecánico se seleccionan las m u estras
al azar? Se su p o n e a veces erró n eam en te que casi to d o m étodo
de selección de "c a ra o cruz” d ará u n a m u estra al azar. E sto
d ista m ucho d e se r así. E n efecto, tales m étodos conducen casi
invariablem ente a u n a m u estra sesgada, debido al elem ento
hum ano im plicado. Con objeto de aseguram os que todos los in
dividuos, incluidos los atípicos o los que son difíciles d e localizar,
tienen efectivam ente la m ism a posibilidad de aparecer en la
m uestra, hem os de observar p o r lo reg u lar m uchas condiciones
al pro ced er a la extracción. P rim ero, en efecto, hem os d e ase
gurarnos de que cada individuo fig u ra en la lista y de que aparece
únicam ente en ella u n a sola vez. Podem os luego asociar u n nú
m ero a cad a p u esto de la lista y serv im o s de algún procedim ien
to m ecánico, p o r el estilo del que se em plea en el juego de bingo,
con objeto d e aseg u rar probabilidades iguales de selección. Exa
m inem os p rim ero algunos problem as que pueden p re sen tarse en
relación con la m ism a confección de la lista, o lo que los especia
listas en m u estreo denom inan "arm azón de la m u estra".
P o d rá p en sa rse acaso que el hecho d e obtener u n a lista es p o r
lo reg u lar asu n to de poca m onta. Sin em bargo, en la m ayoría
de los casos p rácticos esto no es así. A m enudo ni siquiera exis
ten listas. P o r ejem plo: no existe lista alguna de los residentes
de los E stados Unidos o del estado d e Michigan. Es casi seguro
que tam poco h a b rá lista alguna de los negros o los niponorte-
am ericanos que viven en u n a localidad determ inada. Y si no hay
lista, p u ed e re s u lta r m uy costoso confeccionar una. Si ta l es el
caso, hay otros m étodos de m u estreo d e probabilidad que son p re
feribles a la m u estra sim ple aleatoria. P or o tra p arte, p u ed e acaso
h ab er listas, p ero es posible que no estén al día. Algunos indivi
duos p o d rá n no e sta r incluidos, m ien tras que o tro s h ab rán dejado
e n tre tan to de p erten ecer a la población considerada. Los direc
torio s locales, que a p rim e ra vista parecen co n stitu ir la fuente
ideal p a ra aquel que desea e x tra er u n a m u estra aleatoria de los
residentes, pueden acaso re su lta r ta n anticuados en el m om ento
de su publicación, que ya p rácticam en te no sirvan. Los indivi
duos acabados d e llegar esta rá n excluidos de la lista y no ten
drán, p o r consiguiente, pro b ab ilid ad alguna de ser seleccionados.
Y en la m edida en que dichas personas difieran del re sto de la
población en cu an to a las características o b jeto del estudio, el in
vestigador o b ten d rá u n a m u estra sesgada y resultados engaño
sos. O tras listas, tales com o los directorios telefónicos o los re
g istros de los vehículos o autom óviles, pueden e sta r sesgadas
en el sen tid o de que los grupos de ingresos inferiores estarán
p ro b ab lem en te subrepresentados. Cabe decir, p o r lo tanto, que
p o r m ucho que u n a lista parezca e sta r cuidadosam ente confec
cionada, deberem os investigar siem pre h a sta qué p u n to resu lta
apropiada. Una lista deficiente puede re s u lta r p eo r que la fa lta
total de la m ism a, si conduce a una m u estra excepcionalm ente
sesgada.
¿Qué podem os h acer si la lista es inadecuada? Si la lista es
com pleta p ero contiene duplicaciones, el problem a es relativam en
te sencillo, a condición, p o r supuesto, que las duplicaciones se
p uedan d escu b rir fácilm ente. P or ejem plo: si la lista com prende a
todos los niños de u n a escuela determ in ad a y querem os seleccio
n a r u n a m u estra aleatoria d e los padres, descubrirem os, sin duda
alguna, q u e ciertos pad res tienen m ás de u n niño que va a dicha
escuela. P o r consiguiente, si dam os a la ficha de cada niño la
m ism a p ro b ab ilid ad de selección, algunos p ad res ten d rá n m ayo
res p ro b abilidades de ser seleccionados que otros. Con o b jeto de
rem ed iar esta situación, podríam os d esc artar las fichas de todos
los herm anos de p ad re y m ad re m enos una, o podríam os selec
cionar u n p a d re solam ente en el caso de que fu e ra seleccionada
la ficha de su h ijo m ayor, descartándolo, en cam bio, si salía la
ficha de alguno de sus o tro s hijos.
Debe observarse que si se seleccionara el segundo o el te rc e r
hijo de Jones y n o incluyéram os, p o r consiguiente, a Jones en la
m uestra, no sería legítim o rem plazar a Jones p o r el p ad re que
fig u rara a continuación en la lista. E n efecto, si se hiciera así,
las p ersonas de fichas vecinas a las de los pad res de m ás de un
niño ten d ría n m ayores probabilidades de selección. El procedi
m ien to correcto consistirá, en tal caso, en p re sc in d ir de Jones
y p a sa r a la próxim a ficha seleccionada p o r m étodos de p ro b a
bilidad. O tra alternativa, posible teóricam ente p ero susceptible
de c rear problem as adicionales p a ra el análisis, consistiría en
inclu ir a Jones si salía la ficha de cualquiera de sus hijos, pero
atribuyéndole m en o r peso en el análisis. Así, p o r ejem plo, si
tien e tres h ijo s y, p o r lo tan to , tre s veces la p ro b ab ilid ad gene
ra l de ser seleccionado, d aríase a sus m arcas u n a te rc e ra p arte
del peso atrib u id o al p ad re de u n solo hijo.
E n la m ayoría d e los problem as, sin em bargo, lo m ás probable
es que la lista sea incom pleta o que incluya nom bres de indivi
duos que ya n o son m iem bros de la población. Aquí será tam
bién posible d e p u ra r la liáta h a sta que sea correcta. P ero si esto
no es practicab le, p o d rá re su lta r deseable red efin ir la población
ligeram ente, p a ra ad a p ta rla a la lista. Supóngase que se sabe que
u na lista de em pleados es com pleta y exacta a la fecha del día
p rim ero del año. E n lugar de o b ten er los nom bres de todas las
p ersonas em pleadas desde entonces, será tal vez posible lim itar
n u e stra atención a las personas que tra b a ja b a n en la em presa
con an terio rid ad a la fecha en cuestión y que siguen tra b a ja n d o
en ella. Luego, to d as las personas incluidas en la m u e stra pero
que re su ltan h a b e r dejado e n tre ta n to la em presa p o d rá n des
cartarse. Obsérvese, sin em bargo, que la población estu d iad a no
co n stará de todos los em pleados presentes, y el lecto r h a de per-
cartarse bien de ello.
Una vez o b ten id a u n a lista correcta, es relativam ente sencillo
ex traer u n a m u estra aleatoria. T eóricam ente p o d ría em plearse
to d a u n a serie d e m edios m ecánicos p a ra aseg u rar probabilida
des iguales de selección. P odría utilizarse u n juego de naipes bien
b arajad o , o ex traerse núm eros de un som brero. Tal vez una
esfera con bo las num eradas d aría resultados m ás seguros, debido
a la tendencia de las cartas o los pedacitos de papel a pegarse
cuando se los b a ra ja o m ezcla. E n realidad, sin em bargo, el in
vestigador no n ecesita seguir u n proceso ta n com plicado, ya que
se han confeccionado con tal o b jeto tablas de núm eros aleatorios.
E sta s tablas se h an confeccionado sirviéndose de m edios m ecá
nicos com o los que se acaban de indicar. Así, p o r ejem plo, po
d ría ponerse u n nú m ero igual de bolas con los dígitos 0, 1, 2, . . . ,
9 en u n a cesta y p ro ced er a extraerlas, reponiéndolas y mezclán
dolas cada vez a fondo. Los dígitos re su ltan tes p o d rían luego
serv ir p a ra confeccionar u n cu ad ro de núm eros al azar, com o el
del cuadro B del apéndice 2.
Al servirnos de u n cu ad ro de núm eros aleatorios, no im porta
que sigam os las colum nas de a rrib a abajo o que procedam os
a través de las hileras, ni que em pecem os con u n a de las colum
nas o hileras con preferencia a otra, a condición, sin em bargo,
que n u estra decisión se adopte an tes d e exam inar los datos. P ara
ilu stra r el em pleo del cuadro de núm eros aleatorios, suponga
m os que se q u iere ex traer u n a m u estra de tam añ o 100 de una
población que consta de 736 individuos. Toda vez que el núm ero
736 consta de tres dígitos, re su lta rá conveniente escoger tres
colum nas adyacentes (cu alesq u iera), eligiendo o tras tre s al lie-
gar al pie de la página. Supóngase, p o r ejem plo, que decidi
m os servirnos de las tre s p rim era s colum nas de la p rim e ra p á
gina del cu ad ro B. Como p rim e r caso de la m u e stra escogem os
el p rim e r n ú m ero que aparece en tre 001 y 736. E ste n ú m ero es
100. E n otro s térm in o s: el centésim o individuo fig u ra rá en la
m u estra. Seguim os ah o ra las colum nas 1 a 3 abajó, y obtenem os
los n ú m ero s 375 y 084. Llegam os luego al nú m ero 990. E sto
co rresp o n d ería al individuo noningentésim o nonagésim o de la po
blación, pero, com o q uiera que este individuo no existe, pasam os
al próxim o núm ero, que es 128.
D espués de u n ra to em pezam os a en c o n tram o s con n ú m ero s
que y a h an sido seleccionados. Toda vez q u e estam os seleccio
n an d o sin reposición, hem os de o m itir dichos núm eros, h a sta
h ab e r seleccionado finalm ente los 100 casos. E sto es to d o lo que
hay que h acer. La razón de que el p roceso sea tan sencillo y
que p u ed a d ecidirse a rb itra ria m e n te el em pleo de las colum nas
o h ileras está, p o r supuesto, en q u e los n ú m eros que fig u ran en
el cu ad ro son to talm e n te aleatorios. .De hecho, es casi im posible
servirse d e u n a d e estas tab las in co rrectam en te, a m enos que se
re p ita n las colum nas (o las h ilera s) o que se h ag a tram p a, deci
diendo, p o r ejem plo, que se quiere o b ten er en la m u e stra el caso
ducentésim o decim onono y buscando d eliberadam ente u n a co
lu m n a que lo contenga.
C orrección de la m u estra sin reposición. Y a se m encionó en el
cap ítu lo xx, relativo a la p robabilidad, que cuando se saca u n a
m u e stra sin reposición violam os el su p u esto de independencia
y que, e stricta m e n te hablando, hem os de m odificar, p o r consi
guiente, n u estra s fórm ulas p a ra te n e r en cu en ta dicho hecho.
P o r lo reg u lar, esto no constituye p ro b lem a grave alguno, ya que
la m u e stra seleccionada no es m ás que u n pequeño fragm ento
de la población y, p o r lo tan to , la pro b ab ilid ad de que u n indivi
d u o d eterm in ad o re su lte seleccionado dos o m ás veces es m ás
b ien p equeña. Sin em bargo, si la m u e stra llega a co m p ren d er
h a s ta u n q u in to d e los individuos d e la población, será conve
n ien te in tro d u c ir facto res de corrección, siem pre que tales fac
to res sean conocidos. P o r desgracia, sólo se conocen fa cto res
exactos de corrección p a ra los tipos de problem as m ás sencillos.
Con todo, este hecho sólo ra ra m e n te re su lta p e rtu rb a d o r, ya que,
si fu éram o s a seleccionar u n a m u e stra que co m p o rta ra el tercio
o la m ita d de la población, estaríam os de todos m odos en con
diciones de seleccionar tam bién la población entera. El em pleo
del fa c to r d e corrección p a ra fórm ulas que co m p o rtan el e rro r
e stá n d a r de la m edia se exam ina m ás abajo. E n casos m ás com
plicados, h ab rem o s de referirn o s a algún texto especial sobre
m u estreo, au n q u e p robablem ente n o se encu en tre en los m ism os
un exam en d e los facto res de corrección aplicado a las diversas
p ru eb as n o p aram étricas. P o r o tra p arte , dichos textos tien en su
m ay o r aplicación a las m u e stra s pequeñas, en los que el p ro b le
m a de la rep o sición reviste m en o r im portancia.
La fó rm u la q ue habrem os de ap licar efectivam ente p a ra la co
rrecció n del e r ro r e stán d a r de la m edia, si seleccionam os sin re
posición, es la siguiente:
= (X X I.l)
J i - J L
J M
Se echa de v er in m ed iatam en te que si el tam año de la m u estra
es relativ am en te pequeña en com paración con M, el valor del
fa cto r de corrección se hace aproxim adam ente igual a la unidad,
y tiene, p o r consiguiente, escaso o b jeto o nulo el servirse de él.
Así, p o r ejem plo, si se selecciona u n a m u estra de 500 de una
población de 10 000, la fracción de m u estreo es 1/20, y el valor
del fa c to r de corrección es de .975. O bsérvese que, toda vez
q ue el fa c to r de corrección h a d e ser m en o r que la u n id ad tra
tán d o se de poblaciones finitas, el valor corregido del e rro r están
d a r será siem p re m en o r que el de la cifra sin corregir. Así, pues,
si deseam os u n e rro r está n d a r pequeño, com o suele se r el caso,
nos en co n trarem o s del lado conservador no sirviéndonos de la
corrección. A m enos que la fracción de m u estreo sea del orden
de u n q u in to o m ás, ra ra m e n te la tenem os en cuenta.
E ste m ism o fa c to r de corrección p u ed e em plearse en o tras
fórm ulas que co m p o rtan e rro res e stá n d a r de m edias o p ro p o r
ciones. Así, si h u biéram os de servirnos de u n a estim ación, recu
rriría m o s a la fó rm u la :
0- = V H ( — | = V H ( — -— | ( x x i .2)
\y/N / \y/N - 1 /
E n u n a p ru e b a d e diferencia de m edias, h ab rá dos fracciones de
selección, y la fó rm u la b ásica de la estim ación del e rro r están
d a r de la diferen cia de las m edias s e r á :
O tro tipo de m u estreo de uso m uy frecuente se confunde fácil
m ente con el de m u estreo aleatorio y, de hecho, se em plea a m e
n u d o com o intercam biable con éste. E n el m u estreo sistem ático,
en lu g ar de servirnos de u n cu ad ro de núm eros aleatorio, reco
rrem o s sim plem ente u n a lista y tom am os cada /c-ésimo individuo,
em pezando con u n caso escogido aleato riam en te en tre los p rim e
ro s k individuos. Así, p o r ejem plo, si deseáram os seleccionar u n a
m u e stra de 90 personas de e n tre u n a lista de 1 800, tom aríam os
cada vigésim a p erso n a de la lista. Sin em bargo, n u e stra p rim era
elección h a de d eterm in a rse p o r algún procedim iento al azar,
com o el em pleo, p o r ejem plo, de un c u a d ro de núm eros aleato
rios. Supóngase que se eligiera el individuo undécim o. E ntonces
la m u e stra co n staría de los individuos 11, 31, 51, 71, 91, . . .
El m u estreo sistem ático es m anifiestam ente m ucho m ás senci
llo que el m u estreo aleatorio, siem pre que la lista sea sum am ente
larga o que haya que e x tra er u n a m u e stra m uy grande. Si nos p u
diéram os serv ir legítim am ente, p o r ejem plo, de u n directorio tele
fónico o del directorio de u n a ciudad, se concibe fácilm ente la
dificu ltad de b u sc a r los individuos 512, 1 078 y 15 324. Si la o rd e
nación em pleada en la com pilación de la lista puede considerarse
esencialm ente com o al azar con respecto a la variable que se está
m idiendo, el m u estreo sistem ático será equivalente al m u estreo
sencillo aleatorio. P o r e je m p lo : la m ayoría d e las listas están
confeccionadas p o r ord en alfabético. Los apellidos, p o r supuesto,
no son casuales. Así, pues, u n m arido y m u je r registrados sepa
ra d am en te n o ten d ría n p rácticam en te p ro b ab ilid ad alguna de
fig u ra r ju n to s en la m u estra, a m enos que su apellido fu e ra su
m am en te com ún. Algunos grupos étnicos tienen u n a proporción
elevada de n o m b res que em piezan con la m ism a le tra ( O’B rien,
O'Neil, etcé tera ). E n realidad, en el caso de las listas alfabéticas
tenem os algo que se aproxim a al m u estreo estratificad o (véase
m ás ad elan te), en el que los grupos étnicos p re sen tan cierta
ten den cia a u n irse. El hecho de to m a r cada fc-ésimo indivi
duo tiene, p o r lo tan to , probabilidades de p ro p o rcio n ar u n a re
p resen tació n ap ro p iad a d e cada grupo. E n la p ráctica, sin
em bargo, com o q u iera que la ordenación alfabética es esencial
m ente irrelev an te desde el p u n to de vista de la m ayoría de las
variables estu d iadas, n o solem os p o r lo re g u la r c o rre r riesgo
alguno al co n sid erar la m u e stra sistem ática com o equivalente al
m u estreo sencillo aleatorio. Sin em bargo, se h an desarrollado
p a ra el p rim ero algunas fórm ulas algo d istin tas, que p a rte n de
su p u esto s d iferentes. E n la m ayoría de los casos, con todo, ape
n as v ald rá la p en a to m arse ese tra b a jo adicional.
H ay dos tipos de situaciones en las que la selección sistem ática
p ro d u ce sesgos considerables. A fortunadam ente, éstas no se p re
sen tan con frecuencia en los problem as sociológicos. Prim era:
los individuos pueden h ab erse o rdenado de m an era que se p ro
duzca u n a tendencia. E n efecto, si las personas se h an reg istrad o
p o r profesiones, prestigio, o edad, la posición de la salida al azar
puede afectar los resultados. Supóngase, p o r ejem plo, que la
fracción de m u estreo sea de 1/30. Dos perso n as pueden extraer
m u estras sistem áticas con p a rtid a s aleatorias m uy diferentes.
Una p a rtid a al azar de dos, p o r ejem plo, d a rá u n a m arc a pro
m edia co n siderablem ente m ás elevada (si los individuos están
ordenados de m ayor a m en o r) que la d e 27, ya que cada individuo
de la p rim e ra m u estra e sta rá situ ad o 25 lugares ad elan te de la
p erso n a co rresp o n d ien te de la segunda m u estra. Si se observa
u n sesgo de esta clase, h a b rá que m ezclar algo la lista, o servirse
de u n a " p a rtid a m ed ia” (o sea, em pezando con los individuos
15 o 16).
El segundo tip o de situación que hay que ev itar es aquel en
que la lista p re se n ta cierta c a rac te rístic a periódica o cíclica co
rresp o n d ien te a la fracción de m uestreo. Así, p o r ejem plo, en un
edificio o u n a casa de d ep artam en to s cada octavo de éstos form a
esquina. Si éste es algo m ayor que los restan tes, cabe e sp e rar
que sus o cu pantes difieran asim ism o. P or lo tan to , si se d a el
caso de que la fracción de m u estreo sea tam bién d e 1/8, podría
ob ten erse u n m u estreo con to d o d e esquinas o, inversam ente, sin
ninguna, según el p u n to de p a rtid a aleatorio. Con o b je to de evi
ta r esta tram p a, p o d ría cam biarse ligeram ente la fracción de
m uestreo, to m án d ola com o 1/7 o 1/9, o cab ría servirse de varios
p u n to s de p a rtid a tom ados al azar. Así, p o r ejem plo, u n a vez
seleccionados diez departam entos, p o d ría escogerse o tro núm ero
aleato rio y seleccionar o tras diez residencias, e x tra er o tro núm e
ro, y así sucesivam ente.
La selección sistem ática se em plea a m enudo en com binación
con otros p ro cedim ientos en los estudios sociales, debido a su
sencillez. Al p ra ctican te inexperto de u n a encuesta, p o r ejem
plo, es m ás fácil indicarle que visite cada terc era casa de una
m anzana q ue decirle que em plee u n cu ad ro de n úm eros alea
torios. Sin em bargo, lo m ism o que en el caso del m u estreo sen
cillo aleatorio, la lista h a de ser com pleta y p recisa. Si el que
realiza la en c u esta o m itiera los d ep artam en to s m ás pequeños
o algunas residencias de las avenidas lejanas, p o d rían re su lta r de
ello graves erro res. Es im p o rta n te p ercatarse de que en toda
Clase de m u estreo de p robabilidad h a n de darse ta n to u n elem en
to fo rtu ito com o algún tipo de re g istro com pleto. Sin em bargo,
según verem os en seguida, la n atu ra leza de las lista s req u erid as
puede d ife rir de u n p ropósito a otro, siendo algunas de ellas
m ucho m ás fáciles de o b ten er que o tras. El investigador h a de
exam inar siem pre su lista cuidadosam ente y h a de sab e r cóm o se
h a confeccionado y cuáles son sus defectos.
E n ta n to que en térm inos de ah o rro de costos o de problem as de
análisis las diferencias e n tre las m u estras aleatorias sencillas y
las sistem áticas son p o r lo* regular relativam ente secundarias, los
o tro s dos tipos básicos de m uestreo, en cam bio, difieren de
los p rim ero s que acabam os de v er en algunos aspectos fundam en
tales. Según verem os, ta n to el m u estreo estratificado com o el
conglom erado pueden em plearse en determ inadas circunstancias
p a ra a u m en ta r la eficacia del diseño de m uestreo. E n o tro s té r
m in o s: pueden concebirse p a ra conseguir m ayor precisión con
los m ism os costos o bien, si se p refiere, cuestan m enos y com
p o rta n la m ism a precisión. Se verá tam bién que am bos procedi
m ientos req u ieren fórm ulas distin tas de aquellas de las que nos
hem os servido anteriorm ente.
E n el m u estreo estratificad o dividim os p rim ero todos los in
dividuos en grupos o categorías y seleccionam os luego m u estras
independientes d en tro de cada estrato . Es im p o rtan te que los
estrato s se definan de tal m odo que cada individuo figure en
u n o y sólo en u n o de ellos. E n los tipos d e m u estreo estra tifi
cado m ás sencillos y de em pleo m ás frecuente, tom am os una
m u estra aleato ria sencilla o sistem ática de cada u n o de los e stra
tos. Las fracciones d e m u estreo de los d istin to s estrato s pueden
ser iguales, en cuyo caso hablam os de u n m u estreo estratificad o
proporcional, o puede tra ta rse , p o r el contrario, de u n m uestreo
estratificad o no proporcional.
Una de las razones en cuya v irtu d estratificam os a m enudo una
m u estra es la de que pueden h ab erse em pleado m étodos o listas
de m u estreo p a ra cada estra to . Así, p o r ejem plo, los estrato s
pu ed en con sistir en fábricas, escuelas o dorm itorios distintos,
cada uno de los cuales se h a estudiado en m om entos distintos
p o r d istin tas personas. Es posible que h u b iera sido to talm en te
im p racticab le co m binar las listas de los d istin to s e stra to s selec
cionando luego u n a m u e stra sencilla aleatoria de todos ellos. O tra
razón im p o rtan te de la estratificación, fren te a la m u e stra alea
to ria sencilla, consiste en la reducción de los casos requeridos
p a ra la obtención de u n determ inado grado de precisión. E n la
m edida en que los e stra to s son hom ogéneos con resp ecto a las
variables estudiadas, podem os m e jo ra r la eficacia del diseño.
Al exam inar las m u estras estratificad as proporcionales y n o p ro
porcionales, ap reciarem os m ejo r algunas d e las ventajas p artic u
lares de este m uestreo fre n te al m u estreo sencillo aleatorio.
M uestreo estratificado proporcional. El m u estreo estratificad o
pro p o rcio n al se em plea a m enudo p a ra asegurarse u n a m u estra
m ás rep resen tativ a de la que cabría e sp e rar de las m u estras
aleatorias sencillas o sistem áticas. Supóngase, p o r ejem plo, que
hay 600 p ro testan tes, 300 católicos y 100 judíos en u n a población
determ inada. Si se fu e ra a e x tra er u n a m u estra aleato ria de tam a
ño 100, no esp eraríam os ciertam en te o b ten er exactam ente 60 p ro
testan tes, 30 católicos y 10 judíos. La proporción d e los judíos,
en p artic u la r, p o d ría re su lta r fácilm ente o dem asiado grande o de
m asiado pequeña. Supóngase ah o ra que nos in tere sa b a estu d iar
alguna variable, tal com o la asisten cia a la iglesia, íntim am ente
ligada a la confesión. Supóngase, adem ás, que nos interesaba
estim ar el n ú m ero prom edio de veces que las p erso n as de la
población asistían a la iglesia. R esulta fácil ver intuitivam ente
que u na m u e stra estratificad a con p roporción al tam año en el que
las fracciones de m uestreo fu eran de 1/10 p a ra los tre s estrato s
(o sea que co n staran de 60 p ro testan te s, 30 católicos y 10 judíos)
nos pro p o rcio n aría, p o r lo regular, resultados m ás seguros que
la m u estra sencilla aleatoria.
Tenem os aquí, en efecto, u n p ro b lem a análogo al del análisis
de variancia. E n la m u estra aleato ria hay dos fuentes de varia
ción. Puede h a b e r e rro res de selección dentro de cada estrato,
y puede hab erlo s entre los estrato s en relación con los respectivos
núm eros seleccionados. No sólo podríam os seleccionar judíos
o católicos m uy atípicos, sino que podríam os seleccionar, ade
m ás, dem asiados o m uy pocos de cada tipo. En el m uestreo
estratificado, en cam bio, hem os elim inado la variación en tre es
tra to s y n o s qu eda sólo la variación dentro. Si los estrato s
fu eran to talm en te hom ogéneos, el m u estreo proporcional nos da
ría siem pre re su ltad o s correctos, e n tan to que no sería así con
el m uestreo sencillo aleatorio. P or o tra p arte, si los estra to s fue
ra n ta n hom ogéneos com o p o d ría esp erarse del azar, n ad a ga
naríam os estratifican d o . E n o tro s térm in o s: si las diferencias
en tre los grupos son pequeñas en com paración con las diferen
cias d en tro , la estratificación d e n ad a sirve. Así, pues, la ven
ta ja re su ltan te de e stra tific a r es proporcional en líneas genera
les a la correlación de in traclase e n tre las dos variables. Por
consiguiente, si el criterio en favor de la estratificación se rela
ciona m uy ín tim am ente con la variable estudiada, la ventaja
p ued e se r acaso considerable. Al gan ar el control sobre el n ú
m ero de casos de cada estra to , cosa que n o era posible en el
m uestreo aleatorio, podem os asegurarnos m ayor precisión en re
lación con u n tam añ o d eterm inado de la m uestra.
No debe p o r ello esperarse dem asiado del m u estreo e stra tifi
cado p ro p o rcio n al. Si el tam año d e la m u estra es relativam ente
grande, esperam os, p o r supuesto, que el solo fa c to r azar nos
asegure ap ro x im adam ente proporciones correctas de cada estra
to. Y como q u iera que los problem as de análisis no se com plican
dem asiado a consecuencia d e la m u e stra estratificada, poco p er
dem os en realid ad al estratificar. P or lo regular, no es ni nece
sario n i p racticab le esforzarse en o b ten er u n solo crite rio "m ejor"
p a ra estratificar. P ara o b ten er u n a m u estra estratificad a pro-
porcional, h ay que conocer los tam años de los estrato s de pobla
ción, y sólo será posible, p o r supuesto, estra tific ar conform e a
variables a cuyo p ropósito la inform ación se desprende de las
listas en el m om ento de la extracción d e la m uestra. E sto signi
fica a m en u d o que nos vem os lim itados a variables ta n sencillas
com o el sexo, la edad, la ocupación o el á re a de residencia. Algu
nas de estas variables pueden incluso utilizarse com binadas,
si se desea, si bien ra ra vez re su lta rá ventajoso estra tific a r con
m ás de dos o tre s variables a u n tiem po. Sin em bargo, com o
q u iera que la estratificación constituye u n procedim iento ta n
sencillo, sus posibilidades deberían exam inarse siem pre.
M uestreo estratificado no proporcional. E n el m u estreo e stra
tificado no p roporcional nos servim os de d istin ta s fracciones de
m u estreo p a ra m an ip u lar el núm ero de casos seleccionado, con
o b jeto de au m en ta r todavía m ás la eficacia del diseño. H ay di
versos tipos de situaciones en los que esta fo rm a de m uestreo
re su lta indicada. A m enudo, en efecto, n u estro in terés puede
c e n tra rse m ás en las diversas subpoblaciones rep resen tad as p o r
los estra to s que en la población c o n ju n ta m ism a. Supóngase,
p o r ejem plo, que deseáram os com parar los tre s grupos religiosos
principales en relación con la asistencia a la iglesia. Es obvio
que ta n to el m u estreo sencillo aleatorio com o el estratificad o
p roporcional nos d aría n dem asiados pocos ju díos en la m u estra
p a ra p o d er estab lecer com paraciones significativas. P or consi
guiente, podríam os acaso decidir seleccionar núm eros iguales de
cad a grupo, dando así a cada ju d ío u n a p robabilidad de selec
ción igual a tres veces la de los católicos y seis veces la de los
p ro testan tes. Si seleccionáram os 50 de cada grupo, las fracciones
de selección respectivas serían así de 1/12, 1/6 y 1/2. Y si luego
quisiéram os generalizar a la población en te ra con o b jeto de
a p reciar la cifra m edia de la asistencia, habríam os de p o n d erar
las m edias de los tre s estrato s, a fin de com pensar el hecho de
que los ju d ío s h an sido sobreseleccionados. E ste procedim iento
d e p onderación se describe m ás adelante.
P ero incluso si n u e stro objetivo está en generalizar a la po
blación e n tera y no en c o m p arar diversas subpoblaciones, aun
así p u ed e re s u lta r indicado servirnos de la m u e stra estra tific ad a
n o proporcional, siem pre q u e : 1) las desviaciones e stá n d a r den
tro de los distin tos e stra to s difieran considerablem ente e n tre sí,
o 2) que los costos de re u n ir los datos varíen su stancialm ente
d e u n e stra to a otro. H a b rá siem pre u n a distribución óptim a en
relación con la cual el p ro p ó sito del m u estreo p re se n ta rá una
eficacia m áxim a. E n o tro s térm in o s: h a b rá u n a determ inada;
com binación de fracciones de m u estreo que p ro p o rcio n ará el
m en o r e rro r de m u estreo al m en o r costo posible. Y podem os
o b ten er esta distribución óptim a si hacem os la fracción de m a e s
treo de cada estrato directam ente proporcional a la desviación
estándar d en tro del estrato e inversam ente proporcional a la raíz
cuadrada del costo de cada caso dentro de su estrato. Veam os
in tu itiv am en te p o r qué esto es así, exam inando p rim ero la cues
tión de las desviaciones están d ar.
Si u n d eterm in ad o e stra to p a rtic u la r es excepcionalm ente ho
m ogéneo con respecto a la variable estudiada, no será necesario
ex tra er d e la m ism a u n a m u e stra m uy grande p a ra conseguir un
grado d eterm in ad o de precisión. P or o tra p arte , será indicado
to m a r u n a m u e stra m ucho m ayor de u n e s tra to m uy heterogéneo.
Como q u iera que n u e stra precisión co n ju n ta v en d rá determ inada
a n te todo p o r el grado de precisión del eslabón m ás débil de la
cadena, p o r así decir, im p o rta que no tengam os u n o o dos e stra
tos con e rro res grandes de selección. E sto es p artic u la rm en te
así si los e s tra to s suelen se r grandes. No te n d ría objeto, en
efecto, so sten er u n a precisión p erfec ta en algunos de los estrato s
m ás pequeños, con u n e rro r de m u estreo m uy grande, en cam
bio, en o tro e stra to . P or consiguiente, si tom am os relativam ente
m ás casos de los estrato s heterogéneos y m enos, en cam bio, de
los hom ogéneos, podem os salir del paso con m enos casos. Según
se d em u estra m atem áticam ente, las fracciones de selección de
seadas son proporcionales a las desviaciones e stá n d a r respecti
vas, y no a las variancias.
Conviene h ac er aquí u n a advertencia. E n efecto, u n determ i
n ad o e s tra to p o d rá ser acaso m uy hom ogéneo en relación con
u na de las variables estudiadas y m uy heterogéneo, en cambio,
en relación con o tra. Toda vez que los proyectos de investiga
ción co m portan p o r lo regular m ás de u n a variable, puede acaso
re su lta r m uy difícil e n c o n tra r distribuciones que sean óptim as, o
ap ro xim adam ente tales, p a ra m ás de u n a variable a la vez. Y de
hecho, u n diseño m uy eficaz en relación con u n a variable puede
acaso ser su m am ente ineficaz en relación con o tra. P or consi
guiente, lo m e jo r será co n su ltar u n especialista en m ateria de
m uestreo, p ercatán d o se bien de cuáles son las variables im por
tantes, an tes de servirse de la distribución no proporcional. En
caso de duda, la estim ación pro p o rcio n al será m ucho m ás segura.
H asta aq u í las consideraciones relativas a los costos n o se han
tenido en cuenta, debido al hecho d e que hem os venido supo
niendo im p lícitam ente que los costos de la reu n ió n de datos
eran iguales p a ra todos los individuos. Supóngase, sin em bargo,
que esto no sea así, y que algunos estra to s com porten costos m ás
elevados que otros. D iferentes adm inistradores, p o r ejem plo,
pueden p e rm itir acaso el em pleo de diversas técnicas de recopi
lación de datos, o ta l vez las condiciones m ateriales de los diver
sos estrato s sean tales que la en cu esta tom e m ás tiem po en uno
de ellos que en los dem ás. E n igualdad de los dem ás factores,
será obviam ente m enos costoso seleccionar u n n ú m ero relativa
m en te m ayor de casos de los e stra to s m ás b arato s. Puede de
m o strarse m atem áticam en te que la distrib u ció n óptim a se ob
te n d rá si las fracciones de m u estreo se tom an inversam ente
prop o rcio n ales a la raíz cu a d rad a de los factores de los costos.
O bsérvese que en el caso especial en que todos los costos sean
iguales y en que to d as las desviaciones e stá n d a r d en tro d e los
e stra to s sean asim ism o iguales, las fracciones de m u estreo serán
asim ism o iguales, y tenem os así la situación en que la estra tifi
cación pro p o rcio nal nos dé la d istribución óptim a. E n general,
suele se r indicado seguir la regla de servirse de la estratificación
p roporcional, a m enos que las diferencias de costos sean m uy
grandes, o a m enos que las desviaciones e stá n d a r de los estrato s
sean su stan cialm ente diferentes. Según verem os m ás adelante, el
em pleo del m u estreo n o proporcional tien d e a com plicar los
p roblem as del análisis y debería, p o r consiguiente, d escartarse,
a m enos que p re se n ta ra ventajas realm en te m uy claras.
H a sta aquí to davía n o nos hem os en fren tad o a u n a cuestión
im p o rtan te. E n efecto, ¿cóm o podem os servirnos d e cálculos de
costos y d e las desviaciones e stá n d a r relativas, siendo así que
estos elem entos no se conocen todavía en el m om ento de e x tra er
la m u estra? La re sp u esta obvia es que h an de apreciarse, lo m is
m o que hem os de efectu ar anticipaciones lógicas en relación con
los valores d e determ inados p arám etro s antes de ap reciar el ta
m año de la m u e stra que necesitarem os. H em os de te n e r presen
te, sin em bargo, que la clase de estim aciones que necesitam os no
es del tip o d e las que form ulam os a p a r tir de las estadísticas
de las m u estras. Sin duda, sería posible efectu ar u n estudio de
ensayo con o b jeto de o b ten er dichas estim aciones, pero, a m e
nos que el estu d io haya de ser sum am ente vasto y costoso, se
m ejan te gasto de d in ero n o será pro b ab lem en te conveniente. P or
lo tan to , n u e stra s estim aciones h an de b asa rse en la experiencia
de los p erito s o en estudios an terio res. Con todo, la situación
n o es ta n difícil com o parece, ya que re su lta p o r lo re g u la r posi
ble o b ten er aproxim aciones m uy satisfacto rias de la distribución
ó p tim a m ed ian te anticipaciones m uy generales e n cu an to a los
costos y las desviaciones están d a r. E n otros té rm in o s : si existe
alguna razón p a ra sospechar que se dan diferencias sensibles
e n tre los e stra to s en relación con el uno o el o tro d e los factores
en cuestión, u n a anticipación inteligente nos d a rá probablem en
te un diseño casi ta n eficaz com o el que se o b ten d ría con valores
exactos.
Cálculos relativos a las m uestras estratificadas. Cuando calcu
lam o s estim aciones de m edias y estim am os e rro res e stá n d a r a
p a r tir de m u estras estratificad as, hem os de calcular valores se
p arad o s p a ra cada u n o de los estra to s y ponderarlos luego de
acu erd o con el tam añ o relativo del e s tra to en la población. Si
indicam os con W t (w eig h t = p eso ) el peso del i-ésimo e stra to de
la población y ponem os 2W* = 1, reduciendo así los pesos a p ro
porciones, podem os esc rib ir la fó rm u la p a ra la estim ación de la
m edia de la población com o sigue:
X = 2 W jC i
i= i
Ni
S .
— J = í
y tam bién
M N
Ni
2 X íj
- * N i í” 1 1 * Ni
ten e m o s: X = 2 ----------------- — 2 2 Xu
^ N Ni
E sta doble su m a to tal significa sim plem ente que hem os sum ado
todas las X . Y to d a vez que luego dividim os esta sum a e n tre el
nú m ero to tal de casos p a ra o b ten er X, vem os así que, en el caso
de m u estra estra tific ad a proporcional, podríam os h a b e r obtenido
la estim ación de exactam ente1en la m ism a fo rm a que en el caso
d e la m u estra alea to ria sim ple. P o r esta razón designam os la
estratificación proporcional com o autoponderada. E n o tro s té r
m inos : cada e stra to h a recibido su p ro p io peso. Y si la estra tifi
cación^ no h a sido proporcional, entonces hem os de m ultiplicar
cada X i p o r el peso de dicho e s tra to en la población.
Al ap reciar el e r ro r e stán d a r de la m edia, n u estro s cálculos no
resu ltan ta n sencillos. E n efecto, hem os de a p reciar prim ero el
e rro r están d a r p a ra cada e stra to y ju n ta r luego los resultados,
com o lo hicim os en la p ru eb a d e la diferencia de las m edias y en
el análisis de variancia. Se re c o rd a rá que, en lu g ar de sum ar
desviaciones están d ar, operam os con las variancias y las sum as
M U ESTREO 545
Distrito
Total
1 2 3
M e d ia d e la m u e s tr a (X ¿ ) 3100 4300 3 80 0
D e s v ia c ió n e s tá n d a r d e la m u e s
tr a (s^ 50 0 400 300
Error de muestreo
Error no de muestreo
Fig. X X I.l. Relación en tre el error total y tos errores de
m uestreo y no de m uestreo.
Glosario
Muestreo por conglomerados
Fracción de m uestreo
Muestreo sencillo al azar
Muestreo estratificado
Muestreo sistemático
B ibliografía
1. Cochran, W. G., Sampling Techniques, John Wiley & Sons, Inc.,
Nueva York, 1953.
2. Hansen, M. H., W. N. Hurwitz y W. G. Madow, Sampie Survey
Methods and theory, vol. 1, John Wiley & Sons, Inc., Nueva York,
1953.
3. Kish, L., "Confidence Intervals for Clustered Samples”, American
Sociological Review, vol. XXII, pp. 154-165, abril de 1957.
4. Kish, L., "Selection of the Sampie”, en L. Festinger y D. Katz
(eds.), Research Methods in the Behaviorat Sciences, The Dryden
Press, Inc., Nueva York, 1953, cap. 5.
5. Kish, L .: Survey Sampling, John Wiley & Sons, Inc., Nueva York,
1965.
6. Lazerwitz, B em ard: “Sampling Theory and Procedures”, en H. M.
Blalock y Ann B. Blalock (ed.), Methodólogy in Social Research,
McGraw-Hill Book Company, Nueva York, 1968, cap. 8.
APÉNDICES
T o d a vez que la m ayoría d e los estudiantes h a b rá n olvidado m u
cho de lo que ap ren d iero n en el álgebra elem ental, u n breve
resu m en de algunas de las operaciones algebraicas básicas les
re su lta rá sin du d a ú til. Algunas de estas reglas serán expuestas
m ás ad elan te en fo rm a m uy concisa. Si se necesita u n repaso m ás
extenso, d eb erá co n su ltarse un texto sobre álgebra.
Una de las cosas básicas que hay que re c o rd a r a propósito de
las operaciones aritm éticas y algebraicas es que el orden en que
dichas operaciones se efectúan reviste sum a im portancia. En
té rm in os generales, en p resencia de u n a expresión relativam ente
com plicada se o p era del in te rio r al exterior. C onvendrá re te n er
m ás o m enos las siguientes reglas.
\ / a 2 + la b + b2 = \ / ( a + b )2 — a + b
■\ / a 2 + b2 = a + b
a a
------ o ------
b+c b —c
A s í, p o r e j e m p l o : ------------ ¥ • --------1—
b+ c b c
3. D ivisión entre una fracción. Si el denom inador es él m ism o
una fracción, podem os p o n er el denom inador del denom inador
en el n u m era d o r com o sigue:
a c ac
b /c b b
a /b a d ad
Y en fo rm a a n á lo g a :
c /d b e be
c+d a (c + d )
— a-
b / ( c + d)
X cX b = I« + íy X * x 2 = X»
P ero : + X» + y X* + X 2 = X ? (X + 1)
Xa X*
-------- = : X a -¡> y ---------- - X l - X
Xi y *2
E n p a rtic u la r:
Xa
■= = X o= 1
Xa
1 1
X -« = ------ y X ~ 2= ■
Xa X2
a — b — c = a — (b + c)
y a — b + c — d = (a — b) + (c — d ) = —(& — a) — (d — c)
2 X i = X t + X 2 + X s + .. . + X N
i= i
Las notaciones a rrib a y abajo de la 2 se em plean p a ra indicar
que i tom a todos los valores sucesivos 1, 2, 3, e tc é te ra h asta N.
E n fo rm a análoga, podríam os esc rib ir:
2 X t = X3 ++ X s + X0+ X 7+ X 8
i= 3
E n este ú ltim o caso, los sím bolos nos indican que hem os de adi
cionar las m arcas de las observaciones tres a ocho.
Si seguim os las reglas generales del álgebra, podem os d erivar
c iertas reglas que h an de aplicarse a las sum as totales. La m a
y o ría d e estas reglas se en u n c ia rán con poca o nin g u n a explica
ción, y a que re su lta n obviam ente de la definición de 2 y de re
glas m uy sencillas del álgebra.
2. 2 X iY i = X 1Y 1 + X 2Y 2 + X 3Y 3 + • • • + X NY N
i—1
2 k X i — kXx + k X 2 + ■ ■ ■+ kXjf
<=»i
= k ( X 1 + Xo + • • • + X N) = k 2 X¡
t= i
7. ( 2 X ¡)2 = (X j -(- X 2 + ■ ■ ■+ X¡f )2
.<=i
= X*2 + + • • • + Z v2 + 2 X xX 9
+ 2 X ^ 3 + • • • + 2XN_ 1X N
¥ ' X 12 + X 2z + • • • + X J
Y en fo rm a análoga:
I (2 X 4,-)2 = 2 (X 41 + X i2 + • • • + X iM)2
<=i i i=i
^/ÍO 2k - io»
en tan to que
1 3 = 1.3 x 1 0 -1
.13 = ——
10
1.3 1.3
loo =ToT=L3x I0^
'00M3 = w W = 1 3 x l ° - ‘
Número Cuadrado Raiz'Cuadrade Número Cuadrado RaíziCuadrada
1 1 1.0000 3l 9 61 5.5678
2 4 1.4142 32 10 24 5.6569
3 9 1.7321 33 10 89 5.7446
4 16 2.0000 34 1156 5.8310
5 25 2.2361 35 12 25 5.9161
6 36 2.4495 36 12 96 6.0000
7 49 2.6458 37 13 69 6.0828
8 64 2.8284 38 14 44 6.1644
9 81 3.0000 39 15 21 6.2450
10 100 3.1623 40 16 00 6.3246
U 121 3.3166 41 16 81 6.4031
12 144 3.4641 42 17 64 6.4807
13 169 3.6056 43 18 49 6.5574
14 196 3.7417 44 19 36 6.6332
15 2 25 3.8730 45 20 25 6.7082
16 2 56 4.0000 46 21 16 6.7823
17 2 89 4.1231 47 22 09 6.8557
18 3 24 4.2426 48 23 04 6.9282
19 3 61 4.3589 49 24 01 7.0000
20 4 00 4.4721 50 25 00 7.0711
21 4 41 4.5826 51 2601 7.1414
22 4 84 4.6904 52 27 04 7.2111
23 5 29 4.7958 53 2809 7.2801
24 5 76 4.8990 54 2916 7.3485
25 625 6.0000 55 3025 7.4162
26 676 5.0990 56 3136 7.4833
27 7 29 5.1962 57 32 49 7.5498
28 7 84 5.2915 58 33 64 7.6158
29 841 5.3852 59 34 81 7.6811
30 900 5.4772 60 3600 7.7460
F u e n t e : H. Sorenson, Statistics for Students Psychology and Education,
McGraw-Hill Book Company, Nueva York, 1936, cuadro 72, pp. 347-359, con
la amable autorización del autor.
Número Cuadrado Raíz Cuadrada Número Cuadrado Raíz Cuadrada
61 37 21 7.8102 101 102 01 10.0499
62 38 44 7.8740 102 1 04 04 10.0995
63 39 69 7.9373 103 1 0609 10.1483
C4 40 96 8.0000 104 10816 10.1980
65 42 25 8.0623 105 1 10 25 10.2470
66 43 56 8.1240 106 1 12 36 10.2956
67 44 89 8.1854 107 1 14 49 10.3441
68 46 24 8.2402 108 1 16 64 10.3923
69 47 61 8.3066 109 1 18 81 10.4403
70 49 00 8.3666 110 12100 10.4881
71 50 41 8.4261 111 123 21 10.5357
72 51 84 8.4853 112 125 44 10.5830
73 53 29 8.5440 113 127 69 10.6301
74 54 78 8.6023 114 129 96 10.8771
75 56 25 8.6603 115 132 25 10.7238
78 57 76 8.7178 118 134 58 10.7703
77 59 29 8.7750 117 136 89 10.8167
78 60 84 8.8318 118 139 24 10.8628
79 62 41 8.8882 119 141 61 10.9087
80 8400 8.9443 120 144 00 10.9545
81 65 81 9.0000 121 146 41 11.0000
82 87 24 9.0554 122 148 84 11.0454
83 88 89 9.1104 123 15129 11.0905
84 70 56 9.1652 124 153 78 11.1355
85 72 25 9.2195 125 156 25 11.1803
88 73 96 9.2736 128 158 78 11.2250
87 75 69 9.3274 127 16129 11.2694
88 77 44 9.3808 128 163 84 11.3137
89 79 21 9.4340 129 166 41 11.3578
90 8100 9.4868 130 169 00 11.4018
91 82 81 9.5394 131 17161 11.4455
92 84 64 9.5917 132 174 24 11.4891
93 88 49 9.6437 133 176 89 11.5326
94 8836 9.6954 134 179 56 11.5758
95 9025 9.7468 135 182 25 11.6190
S6 9216 9.7980 136 184 96 11.6619
97 94 09 9.8489 137 187 69 11.7047
98 96 04 9.8995 138 190 44 11.7473
99 9801 9.9499 139 193 21 11.7808
100 100 00 10.0000 140 19600 11.8322
úme Cuadrado Raíz Cuadrada Número Cuadrado Raíz Cuadrada
141 198 81 11.8743 181 3 27 61 13 4536
142 2 0164 11.9164 182 3 31 24 13.4907
tO fcO to to co to to to to
59 68 00 04 78 75 66 87 88 00 88 33 5S 44 86 23 76 SO 61 50 04 11 10 84 08
33 50 80 73 41 23 79 34 87 63 CO 82 29 70 22 17 71 90 42 07 96 95 44 99 53
30 69 27 06 63 94 68 81 61 37 56 19 68 00 91 82 06 70 34 00 06 46 26 92 00
85 44 39 66 69 18 28 83 74 37 48 83 22 40 41 08 33 70 66 70 96 29 99 08 36
27 20 76 02 84 13 19 27 22 94 07 47 74 40 08 en9 11
17 98 64 9 97 34 13 03 68
©1 30 70 68 Oí 19 07 32 42 10 38 69 95 37 28 28 82 53 67 93 28 97 66 62 52
m 43 49 46 88 84 47 31 80 22 62 12 69 84 08 12 84 38 26 90 09 81 69 31 46
48 SO 81 58 77 64 74 62 45 Si 35 70 00 47 54 83 82 45 26 92 64 13 05 61 60
06 91 34 61 97 42 67 27 80 01 11 88 30 95 23 63 01 19 89 01 14 97 44 03 44
10 46 61 60 19 14 21 03 37 12 Si 34 23 78 21 83 32 68 08 51 43 66 77 08 83
12 88 39 73 43 65 02 70 11 84 04 23 60 13 92 17 97 41 60 77 90 71 22 67 69
21 77 83 09 76 38 80 73 69 61 31 64 94 20 93 63 28 10 20 23 03 81 64 74 49
19 52 35 95 15 65 12 25 96 59 83 28 36 82 58 09 67 21 37 98 16 43 59 16 29
67 24 66 26 70 35 58 31 65 63 79 24 68 68 86 76 46 33 42 22 26 66 69 08 02
60 68 44 73 77 07 60 03 79 92 45 13 43 68 29 26 76 08 86 37 41 32 64 43 44
68 86 34 13 77 36 00 69 48 60 68 83 87 38 69 49 36 47 33 81 96 24 04 36 42
24 63 73 87 36 74 38 48 03 42 62 62 30 79 92 12 30 91 86 01 03 74 28 38 73
83 08 01 24 51 38 99 22 28 16 07 78 96 17 77 97 37 72 75 85 61 97 23 78 67
16 44 42 43 34 36 16 10 90 73 27 49 37 09 39 85 13 03 26 62 64 84 66 47 69
00 79 01 81 67 67 17 86 57 02 11 16 17 86 76 45 81 96 29 79 66 13 00 48 60
03 99 11 04 61 93 71 61 68 94 66 08 32 46 63 84 60 05 82 32 88 61 81 91 61
38 65 59 55 64 32 88 05 97 80 08 36 66 08 60 29 73 54 77 62 71 29 92 38 63
17 54 07 37 04 92 05 24 02 16 55 12 12 92 81 69 07 60 79 36 27 95 46 89 09
32 64 35 23 61 96 81 90 68 31 00 91 19 89 36 76 35 69 37 79 80 86 30 05 14
69 67 26 87 77 39 61 03 69 06 14 06 04 08 19 29 64 96 96 16 33 66 46 07 80
24 12 26 66 91 27 09 90 04 94 14 84 64 66 72 01 96 87 71 00 90 89 97 67 64
61 19 63 02 31 92 90 20 17 73 41 83 95 63 82 17 26 77 09 43 78 03 87 02 67
30 63 22 17 04 10 27 41 22 02 39 68 62 33 09 10 06 10 88 29 66 98 66 64 86
03 78 89 75 99 76 80 72 07 17 74 41 66 31 66 36 20 83 33 74 87 63 90 88 23
48 22 86 33 70 85 78 34 70 19 63 16 26 74 33 35 66 36 29 72 16 81 86 03 11
60 36 69 40 63 36 07 63 30 40 42 61 42 92 07 01 91 82 83 16 98 95 37 32 31
83 79 94 24 02 60 62 33 44 42 34 99 44 13 74 70 07 11 47 36 09 95 81 80 66
32 96 00 74 06 30 40 98 32 32 09 38 64 16 00 U 13 30 76 86 16 91 70 62 63
10 32 25 38 45 67 02 «6 26 06 66 49 76 86 46 78 13 m 66 69 19 64 09 94 13
ti 22 09 47 47 07 39 03 74 08 4$ 60 92 39 29 27 48 24 64 76 86 24 43 61 69
31 76 !S 72 00 08 08 00 63 39 16 47 04 83 66 88 66 12 26 96 03 15 21 92 21
88 49 20 93 82 14 46 40 46 04 20 09 49 89 77 74 84 39 34 13 22 10 97 85 08
30 03 44 77 44 07 48 18 38 28 73 78 80 65 33 28 69 78 04 05 94 20 62 03 80
22 38 84 88 m 27 49 00 87 48 60 63 04 61 28 74 02 28 46 17 82 03 71 02 68
78 21 21 09 03 36 00 20 13 86 44 37 21 64 89 66 74 11 40 14 87 48 13 72 20
41 84 1)8 45 47 48 85 05 23 26 34 67 75 83 00 74 91 06 43 45 19 32 58 15 49
40 35 23 30 49 69 24 89 34 60 45 30 50 75 21 61 31 83 18 55 14 41 37 09 51
i i 08 79 62 94 14 01 33 17 92 59 74 76 72 77 76 50 33 45 13 39 66 37 75 44
62 70 10 83 37 56 30 38 73 15 56 52 06 06 76 11 65 49 98 93 02 18 16 81 61
£7 27 53 68 93 81 30 44 85 85 68 65 22 73 76 92 85 25 58 66 88 44 80 35 84
20 83 77 31 £6 70 28 42 43 26 79 37 69 52 20 01 15 96 32 67 10 62 24 83 91
16 63 38 49 24 90 41 59 36 14 33 52 12 66 65 55 82 34 76 41 86 22 53 17 04
92 69 44 82 97 39 90 40 21 15 59 58 94 90 67 66 82 14 15 75 49 76 70 40 37
77 61 31 SO 19 88 15 20 00 80 20 55 49 14 09 96 27 74 82 57 50 81 69 76 16
88 63 83 24 80 45 13 46 35 45 59 40 47 20 59 43 94 75 16 80 43 85 25 96 93
25 18 30 18 89 70 01 41 50 21 41 29 06 73 12 71 85 71 59 57 58 97 11 14 03
SS 23 10 76 29 37 23 93 32 95 05 87 00 11 19 92 78 42 63 40 13 47 76 56 22
SS 81 54 36 25 18 63 73 75 09 82 44 49 90 05 04 92 17 37 01 14 70 79 39 97
64 39 71 16 92 05 32 78 21 62 20 24 78 17 59 45 19 72 53 32 83 74 52 25 67
04 51 62 56 24 95 09 66 79 40 43 46 08 55 58 15 19 11 87 82 16 93 03 33 61
83 76 16 08 73 43 25 38 41 45 60 83 32 59 83 01 29 14 13 49 20 36 80 71 20
14 33 70 63 45 80 85 40 92 79 43 52 90 63 18 38 38 47 47 61 41 19 63 74 80
51 32 19 22 46 80 08 87 70 74 88 72 25 67 36 63 16 44 94 31 66 91 93 16 78
72 47 20 00 08 80 se 01 SO02 94 81 33 19 00 54 15 58 34 36 35 35 25 41 31
06 49 65 63 06 93 12 81 84 64 74 45 79 05 61 72 84 81 18 34 79 98 20 84 16
39 62 87 24 84 82 47 42 55 93 48 54 53 52 47 18 61 91 36 74 18 61 U 92 41
81 01 61 87 11 53 34 24 42 76 75 12 21 17 24 74 62 77 37 07 58 31 91 59 97
07 63 61 61 20 82 64 12 28 20 92 90 41 31 41 32 39 21 97 63 61 19 96 79 40
90 n 70 42 35 13 57 41 72 00 69 90 26 37 42 78 46 42 25 01 18 62 79 08 72
40 13 82 81 93 29 59 38 86 27 94 97 21 15 98 62 09 53 67 87 00 44 15 89 97
34 41 43 21 67 86 88 75 50 87 19 15 20 00 23 12 30 28 07 83 32 62 46 86 91
63 43 97 53 63 44 98 91 68 22 36 02 40 09 67 76 37 84 16 05 65 96 17 34 88
67 04 90 90 70 93 39 94 55 47 94 45 87 42 84 05 04 14 98 07 20 28 83 40 60
76 49 £0 41 46 52 16 29 02 86 54 15 83 42 43 46 97 83 54 82 59 36 29 59 38
01 70 43 05 52 04 73 72 10 31 75 05 19 30 29 47 66 56 43 82 99 78 29 34 78
Fracciones del área total (10 000) bajo la curva normal, correspondientes a
distancias entre la media y las ordenadas situadas a Z unidades de desvia
ción estándar de la media.
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 0000 0040 0089 0120 0159 0199 0239 0279 0319 0359
0.1 0398 0438 0478 0517 0557 0596 0633 0675 0714 0753
0.2 0793 0832 0871 0910 0948 0987 1026 1064 1103 1141
0.3 1179 1217 1255 1293 1331 1368 1406 1443 1480 1517
0.4 1554 1591 1628 1684 1700 1738 1772 1808 1844 1879
0.5 1915 1950 1985 2018 2054 2088 2123 2157 2190 2224
0.6 2257 2291 2324 2357 2389 2422 2454 2486 2518 2549
0.7 2580 2612 2642 2673 2704 2734 2764 2794 2823 2852
0.8 2881 2910 2939 2967 2995 3023 3051 3078 3103 3133
0.9 3159 3186 3212 3238 3264 3289 3315 3340 3365 3389
1.0 3413 3438 3461 3485 3508 3531 3554 3577 3599 8621
1.1 3643 3665 3686 3713 3729 3749 3770 3790 3810 3830
1.2 3349 3869 3888 3907 3925 3944 3962 3980 3997 4015
1.3 4032 4049 4066 4083 4099 4115 4131 4147 4162 4177
1.4 4192 4207 4222 4236 4251 4265 4279 4292 4306 4319
1.5 4332 4345 4357 4370 4382 4394 4406 4418 4430 4441
1.6 4452 4463 4474 4485 4495 4505 4515 4525 4535 4545
1.7 4554 4564 4573 4582 4591 4599 4608 4616 4625 4833
1.8 4641 4649 4656 4664 4671 4678 4686 4693 4699 4706
1.9 4713 4719 4726 4732 4738 4744 4750 4768 4762 4767
2.0 4773 4778 4783 4788 4793 4798 4803 4808 4812 4817
2.1 4821 4826 4830 4834 4838 4842 4846 4850 4854 4857
2.2 4861 4865 4868 4871 4875 4878 4881 4884 4887 4890
2.3 4893 4896 4898 4901 4904 4906 4909 4911 4913 4916
2.4 4918 4920 4922 4925 4927 4929 4931 4932 4934 4936
2.5 4938 4940 4941 4943 4945 4946 4948 4949 4951 4952
2.6 4953 4955 4Ü56 4957 4959 4960 4961 4962 4963 49G4
2.7 4965 4960 .4067 4968 4969 4970 4971 4972 4973 4974
2.8 4974 4975 4976 4977 4977 4978 4979 4980 4980 4981
2.9 49S1 4982 4983 4984 4984 4984 4985 4985 4986 4986
3.0 4988.5 4987 4987 4988 4988 4988 4989 4989 4989 4990
3.1 4990.0 4991 4991 4991 4992 4992 4992 4992 4993 4993
3.2 4993.129
3.3 4995.166
3.4 4996.631
3.5 4997.674
3.6 4998.409
3.7 4998.922
3.8 4999.277
3.9 4999.519
4.0 4999.G83
4.5 4999.966
5.0 4999.997133
Fuente : Harold O. Rugg, Statistical Methods Applied to Educaticm, Hough-
ton Mifflin Company, Boston, 1917, apéndice al cuadro III, pp. 389-390, con
la amable autorización del editor.
Cuadro D. D istribución de t
Nivel de significación para la prueba de una sola cola
.10 .05 .025 .01 .005 .0005
OI
Nivel de significación para la prueba de dos colas
.20 .10 .05 .02 .01 .001
1 3.078 6.314 12.706 31.821 63.657 636.619
2 1.886 2.920 4.303 6.965 9.925 31.598
3 1.638 2.353 3.182 4.541 5.841 12.941
4 1.533 2.132 2.776 3.747 4.604 8.610
5 1.476 2.015 2.571 3.365 4.032 6.859
6 1.440 1.943 2.447 3.143 3.707 5.959
7 1.415 1.895 2.365 2.898 3.493 5.405
8 1.397 1.860 2.306 2.896 3.355 5.041
9 1.383 1.833 2.262 2.821 3.250 4.781
10 1.372 1.812 2.228 2.764 3.169 4.587
11 1.363 1.796 2.201 2.718 3.106 4.437
12 1.356 1.782 2.179 2.681 3.055 4.318
13 1.350 1.771 2.160 2.659 3.012 4.221
14 1.345 1.761 2.145 2.624 2.977 4.140
15 1.341 1.753 2.131 2.602 2.947 4.073
16 1.337 1.746 2.120 2.583 2.921 4.015
17 1.333 1.740 2.110 2.567 2.898 3.085
18 1.330 í .734 2.101 2.552 2.878 3.922
19 1.328 1.729 2.093 2.539 2.861 3.883
20 1.325 1.725 2.086 2.528 2.845 3.850
21 1.323 1.721 2.080 2.518 2.831 3.819
22 1 321 1.717 2.074 2.508 2.819 3.792
23 1.319 1.714 2.069 2.500 2.807 3.767
24 1.318 1.711 2.064 2.492 2.797 3.745
25 1.316 1.708 2.060 2.485 2.787 3.725
26 1.315 1.706 2.056 2.479 2.779 3.707
27 1.314 1.703 2.052 2.473 2.771 3.690
28 1.313 1.701 2.048 2.467 2 >83 3.674
29 1.311 1.699 2.045 2.462 2.756 3.659
30 1.310 1.697 2.042 2.457 2.750 3.646
40 1.303 1.684 2.021 2.423 2.704 3.551
60 1.296 1.671 2.000 2.390 2.660 3.460
120 1.289 1.658 1.980 2.358 2.617 3.373
oo 1.282 1.645 1.660 2.326 2.576 eazsF.SEewHmix-scr
3.291*.»»
Fuente: El cuadro D es una abreviación del cuadro III de Statistical
Tables for Biological, Agricultural and Medical Research (ed. 1948), de R. A.
Fisher y F. Yates; publicada por Oliver & Boyd, Ltd., Edimburgo y Lon
dres, con la autorización de los autores y editores.
Cuadro E . Valores críticos de r en la prueba de las
secuencias P = .05
En la prueba de las secuencias de las muestras, cualquier valor de r igual
o menor que el que figura en el cuerpo del cuadro es significativo al nivel
de .05 con dirección no anticipada, o al nivel .025 con dirección anticipada.
2 3 4 6 6 7 8 9 10 11 12 13 14 -15 16 17 18 19 20
4 2
6 2 2 3
6 2 3 3 3
7 2 3 3 4 4
8 2 2 3 3 4 4 5
9 2 2 3 4 4 5 5 6
10 2 3 3 4 5 5 6 6 6
11 2 3 3 4 5 6 6 6 7 7
12 3 3 4 4 5 6 6 7 7 8 S
13 2 3 4 4 5 6 6 7
14 2 3 4 5 5 6 7 W
ff
8
8
8
8
9
9
9
9 10
15 2 3 4 S 6 6 7 8 8 9 e 10 10 11
16 2 3 4 5 6 6 7 8 8 9 10 10 11 11 11
17 2 3 4 5 0 7 7 8 9 9 10 10 11 11 12 12
18 2 3 4 6 7 8 8 9
5 10 10 11 11 12 12 13 13
19 O
2 O 4 5 6 7 8 8 9 10 10 11 12 12 13 13 14 14
20 2 O 4 5 S 7 8 9 9 10 11 31 12 12 13 13 14 14 15
Nt ** 5 N'i =» 6
0 .167
2
.047
3
.018
4
.008
5
.004
Xj
0
1
.143
2
.036
3
.012
4
.005
5
.002
6
.001
3 .333 .095 .036 .016 .008 i .286 .071 .024 .010 .004 .002
2 .600 .190 .071 .032 .016 2 .428 .143 .048 .019 .009 .004
3 .667 .286 .125 .056 .028 3 .571 .214 .083 .033 .015 .008
4 .429 .196 .095 .048 4 .321 .131 .057 .026 .013
6 .571 .286 .143 .075 5 .429 .190 .086 .041 .021
8 .393 .206 .111 6 .571 .274 .129 .063 .032
7 .500 .278 .155 7 .357 .176 .089 .047
8 .607 .365 .210 8 .452 .238 .123 .066
9 452 .274 9 .548 .305 .165 .090
10 .548 .345 10 .381 .214 .120
11 .421 11 .457 .268 155
12 .500 12 .545 .331 .197
13 .579 13 .396 .242
14 .465 .294
15 .535 .350
16 .409
17 .469
18 .531
F u e n t e : H. B. Mann y D. R. Whitney, "On a Test of Whether One of
Two Random Variables is Stochastically Larger than the Other”, Annals
of Mathematical Statistics, vol. 18, pp. 52-54, 1947, con la amable autorización
de los autores y el editor.
* Si ]a dirección no ha sido anticipada se duplicarán las probabilidades.
Cuadro F [continuación ]
Ns = 7
NJVi 1 2 3 4 5 6 7
U\
0 .125 .028 .008 .003 .COI .001 .000
1 250 .056 017 .006 .003' .001 001
2 .375 .111 .033 .012 .005 .002 .001
3 .500 .167 .058 .021 .009 .004 .002
4 .625 .250 .092 .036 .015 .007 .003
5 .333 .133 .055 .024 .011 .006
6 .444 .192 .082 .037 .017 .009
7 .556 .253 .115 .053 .026 .013
8 .333 .158 .074 .037 .019
9 .417 .206 101 .051 .027
10 .500 .264 .134 .069 .036
11 .583 .324 .172 .090 .049
12 .394 .216 .117 .064
13 .464 .265 147 .082
14 .538 .319 .183 .104
15 .378 .223 .130
16 .438 .267 .159
17 .500 .314 .191
18 .562 .365 .228
19 .418 .267
20 .473 .310
21 .527 .355
22 .402
23 .451
24 .500
25 .649
CUADROS
Cuadro F [conclusión]
N2 = 8
V /. 1 2 3 4 5 6 7 8
u\
0 .111 .022 .006 .002 .001 .000 .000 .000
i .222 .044 .012 .004 .002 .001 .000 .000
2 .333 .089 .024 .008 .003 .001 .001 .000
3 .444 .133 .042 .014 .005 .002 .001 .001
4 .656 .200 .067 .024 .009 .004 .002 .001
5 .267 .097 .036 .015 .006 .003 .001
6 356 .139 .055 .023 .010 .005 .002
7 .444 .188 .077 .033 .015 .007 .003
8 .656 .248 .107 .047 .021 .010 .005
9 .315 .141 .064 .030 .014 .007
10 .387 .184 .085 .041 .020 .010
11 .461 .230 .111 .054 .027 .014
12 .639 .285 142 .071 .036 .019
13 .341 177 .091 .047 .025
14 .404 .217 .114 .060 .032
15 .467 .262 .141 .076 .041
16 .633 .311 .172 .095 .052
17 .362 .207 .116 .065
18 .416 .245 .140 .080
19 .472 .286 .168 .097
20 .528 .331 .198 .117
21 .377 .232 .139
22 .426 .268 .164
23 .475 .306 .191
24 .525 .347 .221
25 .389 .253
26 .433 .287
27 .478 .323
28 .622 .360
29 .399
30 .439
31 .480
32 .520
Cuadro G. Cuadro de valores críticos de U en la prueba
de M ann-W hitney
Valores críticos de U a a = .001 con dirección anticipada, o a a = -002
c.on dirección sin anticipar.
\JV» 9 10 11 12 13 14 15 16 17 18 19 20
1
2
3 0 0 0 0
4 0 0 0 1 1 1 2 2 3 3 3
5 1 1 2 2 3 3 4 6 5 6 7 7
6 2 3 4 4 5 6 7 8 9 10 11 12
7 3 5 6 7 8 9 10 11 13 14 15 16
8 S 6 8 9 11 12 14 15 17 18 20 21
9 7 8 10 12 14 15 17 19 21 23 25 26
10 8 10 12 14 17 19 21 23 25 27 29 32
11 10 12 15 17 20 22 24 27 29 32 34 37
12 12 14 17 20 23 25 28 31 34 37 40 42
13 14 17 20 23 26 29 32 35 38 42 45 48
14 15 19 22 25 29 32 36 39 43 46 50 54
15 17 21 24 28 32 36 40 43 47 51 55 59
16 19 23 27 31 35 39 43 48 52 56 60 65
17 21 25 29 34 38 43 47 52 57 61 66 70
18 23 27 32 37 42 46 51 56 61 66 71 76
19 25 29 34 40 45 50 55 60 66 71 77 82
20 26 32 37 42 48 54 59 65 70 76 82 88
Fuente: D. Auble, “Extended Tables for the Mann-Whitney Statistics”,
Bulletin of the Institute of Educational Research at Indiana University,vol.
1, núm. 2, cuadros 1, 3, 5 y 7, 1953, con la amable autorización del editor;
tal como ha sido adaptada por S. Siegel, en Nonparametric Statistics, Mc-
Graw-Hill Book Company, Nueva York, 1956, cuadro K.
VAT,
v ,\ 9 10 11 12 13 14 15 16 17 18 19 20
1
2 0 0 0 0 0 0 1 1
3 1 1 1 2 2 2 3 3 4 4 4 5
4 3 3 4 5 5 6 7 7 8 9 9 10
5 5 6 7 S 9 10 11 12 13 14 15 16
6 7 8 9 11 12 13 15 16 18 19 20 22
7 9 11 12 14 16 17 19 21 23 24 26 28
8 11 13 15 17 20 22 24 26 28 30 32 34
9 14 16 18 21 23 26 28 31 33 36 38 40
10 16 19 22 24 27 30 33 36 38 41 44 47
IX 1S 22 25 28 31 34 37 41 44 47 SO 53
12 21 24 28 31 35 38 42 46 49 83 56 60
13 23 27 31 35 39 43 47 51 55 59 63 67
14 26 30 34 38 43 47 51 56 60 65 69 73
15 28 33 37 42 47 51 56 61 66 70 75 80
16 31 36 41 46 51 56 61 66 71 76 82 87
17 33 38 44 49 55 60 66 71 77 82 88 93
18 36 41 47 53 59 65 70 76 82 88 94 100
19 38 44 50 56 63 69 75 82 88 94 101 107
20 40 47 53 60 67 73 80 87 93 100 107 114
ViV, 9 10 11 12 13 14 15 16 17 18 19 20
VN
i
2 0 0 0 1 1 1 1 1 2 2 2 2
3 2 3 3 4 4 5 5 6 6 7 7 8
4 4 5 6 7 8 9 10 n 11 12 13 13
5 7 8 9 11 12 13 14 15 17 18 19 20
6 10 11 13 14 16 17 19 21 22 24 25 27
7 12 14 16 18 20 22 24 26 28 30 32 34
8 15 17 19 22 24 26 29 31 34 36 38 41
9 17 20 23 26 28 31 34 37 39 42 45 48
10 20 23 26 29 33 36 39 42 45 48 52 55
11 23 26 30 33 37 40 44 47 51 55 58 62
12 26 29 33 37 41 45 49 53 57 61 65 69
13 28 33 37 41 45 60 54 69 63 67 72 76
14 31 36 40 45 50 55 59 64 67 74 78 83
15 34 39 44 49 54 59 64 70 75 80 85 90
16 37 42 47 53 59 64 70 75 81 86 92 98
17 39 45 51 57 63 67 75 81 87 93 99 105
18 42 48 55 61 67 74 80 86 93 99 106 112
19 45 52 58 65 72 78 85 92 99 106 113 119
20 48 55 62 09 76 83 90 98 105 112 119 127
9 10 11 12 13 14 15 10 17 18 rj 20
1 0 0
2 1 1 1 2 2 2 3 3 3 4 4 4
3 3 4 5 5 8 7 7 8 9 9 10 11
4 6 7 8 9 10 11 12 14 15 16 17 18
5 9 11 12 13 15 16 18 19 20 22 23 25
6 12 14 16 17 19 21 23 25 26 28 30 32
7 15 17 19 21 24 26 28 30 33 35 37 39
8 18 20 23 26 28 31 33 36 39 41 44 47
9 21 24 27 30 33 36 39 42 45 48 51 54
10 24 27 31 34 37 41 44 48 51 55 58 62
11 27 31 34 38 42 46 50 54 57 61 65 69
12 30 34 38 42 47 51 55 60 64 68 72 77
13 33 37 42 47 51 56 61 65 70 75 80 84
14 36 41 46 51 56 61 66 71 77 82 87 G2
15 39 44 50 55 61 66 72 77 83 88 94 100
16 42 48 54 60 65 71 77 83 89 95 101 107
17 45 51 57 64 ‘70 77 83 89 96 102 109 115
18 48 55 61 68 75 82 88 95 102 109 116 123
19 51 58 65 72 80 87 94 101 109 116 123 130
20 54 62 69 77 84 92 100 107 115 123 130 138
C uadro H. C uadro de valores críticos de T en la prueba de pares
asociados y órdenes provistos de signo, de W ilcoxon
df .99 .93 .95 .90 .80 .70 .50 .30 .20 .10 .05 .02 M .001
1 .03157 .0*628 .00393 .0158 .0642 .148 .455 1.074 1 642 2.706 3.841 5.412 6.635 10.G27
2 .0231 .0104 .103 .211 .440 713 1.386 .%2.408 3.219 4.605 5.991 7.824 9.210 13.815
3 .115 .185 .352 .584 1.005 1 424 2.366 3.665 4.642 6.25Í 7.815 9.837 11.341 16.268
4 .297 .429 .711 1.064 2.649 2.195 3.367 4.878 5.989 7.779 9.488 U 668 13.277 18.465
5 .554 .752 1 145 1.610 2.343 3 000 4.351 6.064 7.289 9.236 11.070 13.388 15.086 20.£’7
6 .872 1.134 1.635 2.204 3.070 3.828 5.348 7.231 8.558 10.645 12.592 15.033 16.812 22.457
7 1.229 1.564 2.167 2.833 3.822 4.671 C.346 8 383 9.803 12.017 14.067 16 622 18.475 24.322
8 1.646 2.032 2.733 3.490 } 594 5.527 7.344 9.524 11.030 13.362 15.507 18.168 20.090 26.125
9 2.038 2.532 3.325 4.168 5.380 6.393 8 343 10.656 12.242 14.C84 16.919 19.679 21.666 27.877
10 2.558 3.059 3.940 4.865 6.179 7.267 9.342 1J.781 13.442 15.SS7 18.307 21.161 23.209 39.588
11 3.C53 3.609 4.575 5.578 C.989 8.148 10.341 12.899 14.631 17.275 19.675 22.618 24.725 3I.2C4
12 3.571 4 178 5.226 6.304 7.807 9 034 11.340 14.011 15.812 18:549 21.026 24.054 20.217 32.800
13 4.107 4.765 5.892 7.042 S.634 9.926 12.340 15.119 16.985 19.812 22.362 25.472 27.G88 34.528
14 4.650 5.308 6.571 7 790 9.4S7 10 S21 13.339 16.222 18.151 21.064 23.68$ 26.873 29.141 33.123
15 5.229 5.985 7.261 8.547 10.307 11.721 14.339 17.322 19.311 22.307 24.996 28.259 30.578 37.CP?
16 5 812 8.JB14 7.962 9.312 11 152 12.624 15.338 18.418 20.465 23-542 26.296 29.633 32.C00 39.252
17 6.408 7.255 8.672 10.085 12.002 13.531 16 338 19 511 21.615 24.769 27.587 30.995 33.409 40.790
18 7 015 7.906 9 290 10.865 12 357 14.440 17.338 20.601 22.760 25.989 28.889 S2.346 34.805 42.312
19 7 633 3.567 10.117 11 651 12 716 15 352 18 338 21.689 23.900 27.204 30.144 33.687 38.191 43.620
20 8 260 9.237 10.851 12.443 14 578 10 266 19 337 22.775 25.038 28.412 31.410 35.020 37.566 4S.315
21 8.857 9.935 11.591 13.240 15 445 17.1S2 20 337 23.858 23.171 29 615 32.871 36.343 38.932 48.797
22 9 542 10.600 12 338 14.041 16.314 18.101 21.337 24 939 27.301 30 813 33.924 37.659 49.289 48.268
23 10.196 11.293 13.091 14.848 17.187 19.021 22.337 26 018 28.429 32.007 35.172 38.968 41.638 49.728
24 10.836 11 992 13.848 15.659 18.062 19.943 23 337 27.096 29.553 33.196 36.415 40.270 42.980 51.179
25 11.524 12.657 14.611 16.473 18.940 20.8G7 24.337 23.172 30.675 34.382 37.652 41.566 44.314 52.620
26 12.198 13.409 15.379 17.292 19.820 21.792 25.339 29.246 31 795 35 563 38.835 42.856 45.642 64.052
27 12.879 14.126 19.151 18.114 20.703 22.719 26.336 30.319 32.912 36.741 40.113 44.140 46.963 55.476
28 13.565 14.847 16.928 18.-039 21 588 23.647 27.336 31.391 34.027 37.916 41.337 45.419 48.278 56.893
29 14.258 15.574 17 708 19.788 22 475 24.577 28.323 32.461 35.139 39.087 42.557 46.693 49.588 58.302
30 14.953 16.200 13.493 20.599 23.364 25.508 29.336 33.530 36.250 40.256 43.773 47.9C2 50.892 59.703
A. Fisher y F. Yates, publicada por Oliver & Boyd, Ltd., Edimburgo y Lon
dres, con autorización de los autores y los editores.
Cuadro J. D istribución d e F
p = .05
\» 1 1 2 3 4 5 6 8 24 (O
n s\
1 161.4 199.5 215.7 224.6 230.2 234.0 23S .'3 243.9 249.0 254.3
2 18.51 19.00 19.16 19.25 19.30 19.33 19.37 19.41 19.45 19.58
3 10.13 9.55 9.28 9.12 9.01 8.94 8.84 8.74 8.64 S.S3
4 7.71 6.94 6.59 6.39 6.26 6.16 6.04 5.91 5.77 5.63
5 6.61 5.79 5.41 5.19 5.05 4.95 4.82 4.68 4.53 4.36
G 5.99 5.14 4.76 4.53 4.39 4.28 4.15 4.00 3.84 3.67
7 5,59 4.74 4.35 4.12 3.97 3.87 3.73 3.57 3 A l OO•¿«V »
t<l>
8 5.32 4.46 4.07 3.84 3.69 3.58 3.44 3.28 3.12 2.93
9 5.12 4.2Q 3.86 3.63 3.48 3.37 3.23 3.07 2.90 2.71
10 4.96 4.10 3.71 3.48 3.33 3.22 3.07 2.91 2.74 2.54
11 4.84 3.98 3.59 3.36 3,20 3.09 2.95 2.79 2.61 2.40
12 4 75 3.88 3.49 3.26 3.11 3.00 2.85 2.69 2.50 2.30
13 4 67 3.80 3.41 3.18 3.02 2.92 2.77 2.60 2.42 2.21
14 4.60 3.74 3.34 3.11 2.96 2.85 2.70 2.53 2.35 2.13
15 4.54 3.68 3.29 3.06 2.90 2.79 2.64 2.48 2.29 2.07
16 4 49 3.63 3.24 3.01 2.85 2.74 2.59 2.42 2.24 2.01
17 4 45 3.59 3.20 2.96 2.81 2.70 2.55 2,38 2.19 1.96
18 4:41 3.55 3.16 2.93 2.77 2.60 2.51 2.34 2.15 1.92
19 4.38 3.52 3.13 2.90 2.74 2.63 2.48 2.31 2.11 1.88
20 4.35 3.49 3.10 2.87 2.71 2.60 2.45 2.28 2.08 1.84
21 4.32. 3.47 3.07 2.84 2.68 2.57 2.42 2.25 2.05 1.81
22 4.30 3.44 3.05 2.82 2.66 2.55 2.40 2.23 2.03 1.78
23 4.28 3.42 3.03 2.80 2.64 2.53 2.38 2.20 2.00 1.76
21 4.26 3.40 3.01 2.78 2.62 2.51 2.36 2.18 1.98 1.73
25 4.24 3.38 2.99 2.76 2.60 2.49 2.34 2.16 1.93 1.71
26 4.22 3.37 2.98 2.74 2.59 2.47 2.32 2.15 1.95 1.69
27 4.21 3.35 2.96 2.73 2.57 2.46 2.30 2.13 1.93 1.67
28 4.20 3.34 2.95 2.71 2.56 2.44 2.29 2.12 1.91 1.65
29 4.18 3.33 2.93 2.70 2.54 2.43 2.28 2.10 X.90 1.64
30 4.17 3.32 2.92 2.69 2.53 2.42 2.27 2.09 1.89 1.62
40 4.08 3.23 2.84 2.61 2.45 2.34 2.18 2.00 1.79 1.51
60 4.00 3.15 2.76 2.52 2.37 2.25 2.10 1.92 1.70 1.39
120 3,92 3.07 2.68 2.45 2.29 2.17 2.02 1.83 1.61 1.25
OO 3.84 2.99 2.60 2.37 2.21 2.09 1.94 1.75 1.52 1.00
Los valores de nx y n.¿ representan los grados de libertad asociados a las
estimaciones mayores y menores respectivamente de la variancia.
Fuente: El cuadro J es una abreviación del cuadro V de Statistical Tables
for Biological, Agricultural and Medical Research (ed. 1948), de R. A. Fisher
y Yates, publicada por Oliver & Boyd, Ltd., Edimburgo y Londres, con
autorización de los autores y los editores.
C u a d ro J [ c o n tin u a c ió n ]
p = .01
sim tm n n E
2 3 4 6 8 12 24 eo
6
1 4052 4999 5403 6625 5764 5853 5981 6108 6234 6366
2 93 49 99 o í 99 .17 99 25 99 30 99.33 39.36 89 42 99 46 99 50
3 34 12 S!) 81 29 46 28 71 28 24 27 91 27 49 27 05 26 60 26 12
4 21 20 18 00 16 69 15 98 15 52 15 21 14 80 14 37 13 §3 13 46
5 16 26 13 27 12 06 11 39 10 97 10 67 10 27 9 80 9 47 9 02
6 13 74 10 92 9 78 9 15 8 75 8 47 8 10 7 72 7 31 6 88
7 12 25 9 55 8 45 7 85 7 46 7 19 6 84 6 47 6 07 5 65
8 11 26 8 65 7 59 7 01 6 63 6 37 6 03 5 67 5 28 4 86
9 10 56 8 02 6 99 6 42 6 06 5 80 5 47 5 11 4 73 4 31
10 10 04 7 56 6 55 6 99 5 64 5 39 5 06 4 71 4 33 3 91
11 9 65 7 20 6 22 5 67 S 32 5 07 4 74 4 40 4 02 3 60
12 9 33 6 93 5 95 5 41 8 03 4 82 4 SO 4 16 3 78 3 36
13 9 07 6 70 5 74 5 20 4 86 4 62 4 30 3 96 3 59 3 16
14 8 86 6 51 5 56 5 03 4 69 4 46 4 14 3 80 3 43 3 OCf
15 8 68 6 30 5 42 4 89 4 56 4 32 4 co 3 67 3 28 2 87
16 8 53 6 23 5 29 4 77 4 44 4 20 3 89 3 S5 3 18 2 75
17 8 40 6 11 5 18 4 67 4 34 4 10 3 79 3 45 3 08 2 65
18 8 28 6 01 5 09 4 58 4 25 4 01 3 71 3 37 3 00 2 57
19 8 18 5 83 5 01 4 60 4 17 3 94 3 63 3 30 2 92 2 43
20 8 10 5 85 4 94 4 43 4 10 3 87 3 55 3 23 2 86 2 42
21 8 02 5 78 4 87 4 37 4 04 3 81 O 51 3 17 2 80 2 36
22 7 94 5 72 4 82 4 31 3 69 3 76 3 45 3 12 2 75 2 31
23 7 88 5 66 4 76 4 26 3 94 3 71 3 41 3 07 2 70 2 26
24 7 82 5 81 4 72 4 22 3 90 3 67 3 36 3 03 2 66 2 21
25 7 77 5 57 4 68 4 18 3 83 3 63 3 32 2 99 62 2 .17
2
26 7 72 5 53 4 64 4 14 3 82 3 59 3 29 2 95 2 58 2 13
27 7 68 5 49 4 60 4 11 3 78 3 56 3 26 2 93 2 55 2 10
28 7 64 5 45 4 57 4 07 3 75 3 53 3 23 2 90 2 52 2 06
29 7 60 5 42 4 54 4 04 3í 3 50 3 20 2 87 2 49 2 03
30 7 56 5 39 4 51 4 02 3 70 3 47 3 17 2 84 2 47 2 01
40 7 31 5 18 4 31 3 83 3 51 3 29 2 99 2 66 2 29 i 80
60 7 08 4 98 4 13 3 65 3 34 3 12 2 82 2 50 2 12 i 60
120 8 85 4 79 3 95 3 48 3 17 2 98 2 63 2 34 1 95 i 38
QO 6 64 4 60 3 78 3 32 3 02 2 80 2 51 2 18 1 79 i 00
rtgaumuw itfso rzesí
»«\ 1 2 3 4 8 0 3 32 i 24 03
i 405284 500000 540378 662E00 576405 585S37 598144 610667 Ó23497 636'íl.5
2 998.5 899.0 999.2 939.2 899.3 S99.3 999.4 999.4 999.5 (999.5
3 167.6 148.5 141.1 137.1 134.S 132.8 130.6 123.3 125.9 ¡123.5
4 74.14 61.25 66.18 63.44 51.71 50.53 49.00 47.41 45.77 44.í>5
5 47.04 38.61 33.20 31.09 29.75 28.84 27.84 26.4f; 25.14 23.78
6 35.51 27.00 23.70 21.00 20.83 20.03 19.03 17.99 16.89 15.75
7 29.22 21.69 18.77 17.19 16.21 15.52 14.83 13.71 12.73 11 .í>9
8 25.42 18.49 15.83 14.39 13.49 12.86 12.04 11.19 10.30 9.24
9 22.86 16.39 13.90 12.56 11.71 11.13 10.37 9.57 8,72 7.81
10 21.04 14.91 12.55 XI.28 10.48 9.92 9.20 8.45 7.64 6.76
11 19.89 13.81 11.53 10.35 0.58 9.0o 8.35 7.63 6.85 6.00
12 18.64 12.97 10.80 9.63 8.89 8.38 7.71 7.00 6.25 5.42
13 17.81 12.31 10.21 9.07 8.35 7.86 7.21 6,52 5.78 4.97
14 17.14 11. 0.73 8.62 7.92 7.43 6.80 6.13 5.41 4.60
15 16.59 11.34 9.34 8.25 7.57 7.09 6.47 5.81 5.10 4.31
16 16.12 10.97 9.00 7.94 7.27 6.81 6.19 5.55 4.85 4.06
17 15.72 Í0.6S 8.73 7.68 7.02 6.56 5.96 5.32 4.63 3.85
18 15.38 10.39 8.49 7.46 6.81 6.35 5.76 5.13 4.45 3.67
19 15.08 30.13 8.28 7.26 6.61 6.18 5.59 4.97 4.29 3.52
20 14.82 9.95 8.10 7 40 6.46 6.02 5.44 4.82 4.15 3.33
21 14.59 9.77 7.94 6.95 6.32 5.88 5.31 4.70 4.03 3.2G
22 14.38 9.61 7.80 6.81 6.19 5.76 5.19 4.58 3.92 3.15
23 14.19 9.47 7.67 6.69 6.08 5.65 5.06 4.48 3.82 3.05
24 14.03 9.34 7.55 6.69 5.98 5.55 4.99 4.39 3.74 2.97
25 13.88 9.22 7.45 6.49 6.88 5.46 4.91 4.31 3.66 2.89
26 13.74 9.12 7.33 6.41 5.80 5.38 4.83 4.24 3.59 2.82
27 13.61 9.02 7.27 6.33 5.73 5.31 4.76 4.17 2.52 2.75
28 13.50 8.93 7.19 6.25 5.66 5.24 4.69 4.11 3.46 2.70
29 13.39 8.85 7.12 6.19 5.59 5.18 4.64 4.05 3.41 2.64
30 13.29 8.77 7.05 6.12 5.63 5.12 4.58 4.0Q 3.36 2.59
40 12.61 8.25 6.60 5.70 5.13 4,73 4.21 3.24 3.01 2.23
60 11.97 7.76 6.17 B.31 4.76 4.37 3.87 3.31 2.69 1.90
120 11.38 7.31 5.79 4.95 4.42 4.04 3.55 3.02 2.40 1.56
00 10.83 6.91 6.42 4.62 4.10 3.74 3.27 2.74 2.13 1.00
,,
Los valores de n, y rt2 representan los grados de libertad asociados a las
estimaciones mayores y menores respectivamente de la variancia.
C u a d ro K . V a lo r e s d e z p a ra v a lo r e s d a d o s d e r
r .000 .001 r002 ,C03 .004 .005 .006 .007 .008 .009
.000 .0000 .0010 .0020 .0030 .0040 .0050 ,0060 .0070 .0030 ,0090
.010 .0100 .0110 .0120 .0130 .0140 .0150 .0160 .0170 .OlSQ .0190
.020 .0200 .0210 .0220 .0230 .0240 .0250 .0260 .0270 .0280 .0290
.030 .0300 .0310 .0320 .0330 .0340 .0350 .0360 .0370 .0380 .0390
.0 4 0 .0400 .$410 .0420 .0430 .0440 .0450 .0460 .0470 .0480 .04 9 0
.050 .0501 .0511 .0521 .0531 .0541 .0551 .0561 .0571 .0581 .0591
.060 .0601 .0611 .0821 .0631 .0641 .0651 .0631 .0671 .0681 .0691
.070 .0701 .0711 .0721 .0731 .0741 .0751 .,0761 .0771 .0783 .0792
,080 .0802 .0812 .0822 .0832 .0842 .0852 .0862 .0872 .0882 .0892
.000 .0902 , ;0912 .0922 .0933 .0943 .0953 .0963 .0973 .0983 .0993
.100 .1003 .1013 .1024 .1034 .1044 .1054 .1064 .1074 .1084 .1094
.110 .1105 .1115 .1125 .1135 .1145 .1155 1165 .1176 .1185 .1195
.120 .1206 .121$ .1226 .1236 .1246 .1257 .1267 .1277 .1287 .1297
.130 .1308 .1318 .1323 .1338 .1348 . 1358 .1368 .1379 .1389 .1399
.140 . J.409 .1419 .1430 .1440 .1450 .1460 .1470 .1481 .1491 .1501
.150 .1511 .1522 .1532 .1542 .1552 .1563 .1573 .1583 .1593 .1604
.160 .1614 .1624 .1634 .1844 .1655 .1665 .1676 .1686 .1698 .1706
.170 .1717 .1727 .1737 . 1748 .1758 .1763 .1779 .1789 .1799 .1810
.180 .1820 .1830 ♦1841 .1851 .1861 .1872 .1882 .1892 .2903 .1913
.190 .1923 .1934 !l944 . 1054 .1965 .1975 .1986 .1996 .2007 .2017
.200 .2027 .2038 .2048 .2059 .2069 .2079 .2090 .2100 .2111 .2121
.210 .2132 .2142 ,2153 .2163 .2174 .2184 .2194 .2205 .2215 .2226
.220 .2237 .2247 .2258 .2268 .2279 .2289 .2300 .2310 .2321 .2331
.230 .2342 .2353 >2363 .2374 .2384 .2395 .2405 .2416 .2427 .2437
.240 .2448 .2458 .2469 .2480 .2490 .2501 .2511 .2522 .2533 .2543
.250 .2554 .2565 .2575 ;2586 .2597 .2608 .2618 .2629 .2640 .2650
.260 .2661 .2672 .2682 .2693 .2704 .2715 .2726 .2736 .2747 .2758
.870 .2769 .2779 .2760 .2801 .2812 .2823 .2833 .2844 .2855 .2866
.280 .2877 *2888 .2898 .2909 .2920 .2931 ,2842 .2953 .2964 2975
.290 .2986 .2927 .3008 .3019 .3029 .3040 .3051 .3062 .3073 .3084
.800 .3095 .310$ .3117 .3128 .3139 .3150 .3161 .3172 .3183 .3105
.810 .3206 .3217 .3228 .3239 .3250 .3261 .3272 .3283 .3294 .3305
.330 .3317 .3328 .3339 .3350 .3361 .3372 .3384 .3395 .3406 .3417
.330 .3428 .3439 .3451 .3462 .3473 .3484 .3490 .3507 .3518 .3530
.340 .3541 .3552 ,3564 .3575 .3586 .3597 .3609 .3620 .3632 .3643
.350 .3654 .3666 .3677 .3689 .3700 .3712 .3723 .3734 .3743 .3767
.360 .3769 .3780 .3792 .3803 .3815 .3826 .3838 .3S5Ó .3861 .3873
.370 .3884 .3896 .3907 .3919 .3931 .3942 .3954 .3966 .3977 .3989
.330 .4001 .4012 .4024 .4036 .4047 .4059 .4071 .4083 .4094 .410$
.390 .4118 .4130 .4142 .4153 .4165 .4177 .4189 .4201 .4213 .4225
.400 .4230 .4243 .4260 .4272 .4284 .4298 .4308 .4320 .4332 .4344
.410 .4350 .4308 .4380 .4.392 .4404 .4418 .4429 .4441 .4453 .4405
.420 .4477 .4489 .450! .4513 .4526 .4538 .4550 .4562 .4574 .4587
.430 .4599 .4611 .4623 .4636 .4648 .4660 .4673 .4685 .4607 .4710
.440 .4722 .4735 .4747 .4760 .4772 .4784 .4797 .4809 .4822 .4835
.450 .4847 .4860 .4872 .4885 ,4897 .4910 .4923 .4935 .4948 .4961
.460 .4973 .4985 .4999 .5011 .5024 .5037 .5049 .6062 .6075 .6083
.470 .5101 .5114 .5126 .5139 .51512 .5165 .6178 .5191 .6204 .6217
.430 .5230 .5243 .5256 .5279 .5282 .5285 .5308 .5321 .6334 .5347
.490 .5361 •53j 4 .5387 .5400 .5413 .6427 .6440 .5453 .6466 .5480
500 5493 5506 5520 .6533 5547 .ssr.o .5573 .5587 .5000 .5614
510 5027 5041 5054 S f ifiS . 508 1 5095 . 5709 .5722 . 5730 .5750
520 57G3 5777 5791 5805 .5818 . 5832 . 5840 . 5800 . 5874 .583S
530 .5901 591r> .5929 51'4 3 . 5957 .5971 5985 .5999 .0013 .0027
540 6012 0056 6070 .0084 .0098 0112 .0127 .6141 .6155 .6170
550 6184 6198 .6213 .6227 0241 .6256 .6270 .6285 .6299 .6314
500 «32S 0343 .0353 6372 6387 .6401 .6416 .6431 .0440 .0400
570 0475 6490 .6505 6520 . 6535 .0550 .G5G5 .6579 . 0594 .6610
580 0025 .0640 0055 6070 0085 . 6700 .0715 .6731 .6746 .6761
590 6777 0792 C807 6823 0838 . 0354 .6869 .6835 .6900 .6916
600 .6931 .6947 6963 .6978 .6994 .7010 .7020 .7042 .7057 .7073
.610 7089 .7105 7121 7137 7153 7109 .7185 .7201 .7218 .7234
620 7250 .7206 7283 7299 .7315 .7332 .7348 .7364 .7381 .7393
630 7414 .7431 .7447 7464 .7481 .7497 .7514 .7531 .7548 .7565
<340 7582 7599 7616 7033 7650 .7667 .7084 .7701 .7718 .7736
.650 .7753 7770 7788 7805 .7823 .7840 .7858 .7875 .7803 .7910
CGO 7928 7940 .79G4 7981 .7999 .8017 .8035 8053 .8071 .8039
670 8107 812G 8144 8102 .8180 .8199 .8217 .8236 .8254 .827»
080 8291 8310 8328 .8347 8300 .8385 .8404 .8423 .8442 .8461'
690 8480 8Í99 8518 .8537 .8550 .8576 .8595 .8614 .8034 .8653
700 8073 8003 87 *2 .8732 .8752 .8772 .8792 .8812 .8832 .8852
710 8872 8S92 -8912 8933 .8953 .8973 .8994 .9014 .9035 .9058
720 9070 9007 9118 9139 9160 .9181 .9202 .9223 .9245 .9260
730 .9287 9309 .9330 9352 .9373 .9395 .9417 .9439 .9461 .9483
740 9505 9527 0549 .9571 .9594 .9610 .9039 9601 .9684 .9707
750 9730 .9752 .9775 .9799 .9822 .9845 .9808 .9892 .9915 .9939
760 9902 9986 1.0010 1.0034 1.0058 1.0082 1.0100 1.0130 1.0154 1.0179
770 i 0203 1 0228 1.0233 I .0277 1.0302 1.0327 1.0352 '1 .0 3 7 8 1.0403 5.0428
780 1 0454 l 0479 1 0505 i 0531 1.0557 1.0583 1.0009 1.0035 1.0601 1.0688
790 1 0714 l 0741 1.0708 1.0795 1.0822 1.0849 1.0876 1.0903 1.0931 í.o o sa
800 1 0986 1.1014 t .1041 1.1070 1.1098 1.1127 1.1155 1.1184 1.1212 1.1241
850 l 1270 I 1299 1.1329 1 1358 1.1388 1 1417 1.1447 1.1477 1.1507 1.1538
820 1 1568 1 1599 1 1030 1.1600 1 1092 l . 1723 1.1754 1.1786 l . 1817 1.1849
830 1 1870 1 1913 1.1946 1 1979 1.2011 1.2044 1.2077 12111 1.2144 1.2178
840 1.2212 1.2246 1 2280 1.2315 1.2349 1.2384 1.2419 1.2454 1.2490 1.2526
850 1.2561 1 2598 1.2634 1 2670 1.2708 1.2744 1.2782 1.2819 1.2857 1 .2S95
.SCO l 2934 1.2972 1.3011 1 3050 1.3089 1.3129 1.3168 1.3209 1.3249 1.3290
.870 1 3331 l .3372 l 3414 1 3456 1.3498 1.3540 1.3583 1.2620 I . 3670 1.3714
880 1 3758 I 3S02 1 3847 1.3892 1.3938 1.3984 1.4030 1.4077 1.4124 1.4171
.890 1 4219 1.4268 1 4310 1 4300 1.4415 1.4405 1.4516 1. .4566 1.4018 1.4670
.900 1 4722 1.4775 1.4828 1.4883 1.4937 1.4992 1.5047 1.5103 1.5100 1.5217
.910 1 5275 1 5334 l .5393 1.5453 1.5513 1.5574 1.5030 1.5093 1 .57G2 1.5825
.920 1 5890 1.5950 1 .0022 l 0089 1.0157 1.6226 1.6290 1.6300 1.0438 1.6510
.930 1.6584 l.GG59 1.6734 1.0821 1.0888 1.0907 1.7047 1.7129 1.721L 1.7295
.940 í .7380 1,7407 1.7555 1.7045 1.7736 1.7828 1.7923 1.8019 1.8117 1.8216
.950 1.8313 1.3421 1.8527 l 8035 1.8745 1.8857 1.8972 1.9090 1.9210 1.9333
.960 1.9459 1.9588 1 .9721 1.9857 1.9990 2.0140 2.0287 2.0439 2.0595 2.0756
.970 2 0923 2 .1095 2.1273 2 1457 2 .1649 2.1847 2.2054 2.2209 2.2494 2,2729
.980 2.2076 2.3223 2 3507 2.3790 2.4101 2.4426 2.4774 2 .5147 2.5 5 5 0 2.5988
.990 2.0407 2 .6990 2.7587 2 8257 2.9032 2.9945 3.1 0 6 3 3 .2504 3.4 5 3 4 3.8002
L ......
r 2
.9999 4.95172
.99999 6.10303
IV .l. H istogram a de intervalos iguales . . . . . . 61
IV .2. H istogram a de intervalos desiguales y altu ras p ro
porcionales a las f r e c u e n c ia s .....................................62
ÍV.3. H istogram a de intervalos desiguales y áreas p ro
porcionales a las f r e c u e n c ia s .....................................62
IV.4. Polígono de f r e c u e n c i a ................................................. 63
IV .5. Ojiva que re p resen ta u n a distribución de frecuen
cia ac u m u la tiv a ................................................................. 64
V.l. Relación en tre la asim etría y las posiciones rela
tivas de la m edia y la m e d i a n a . ...............................83
V.2. Una distribución b i m o d a l ...........................................86
V II.1. Com paraciones de curvas lisas con histogram as de
am plitudes diferentes de i n t e r v a l o ........................ 105
VII.2. C om paración de las áreas debajo de la curva y de
b a jo del r e c t á n g u l o .......................................................106
VII.3. F orm a general de la curva n o r m a l ........................ 107
VII.4. Com paración de curvas norm ales de igual desvia
ción e stán d a r pero de m edias diferentes . . . 108
VII.5. C om paración de dos curvas norm ales de m edias
iguales pero con desviaciones e stán d a r diferentes 109
VII.6. Com paración de una curva norm al con curvas de
su m ism a desviación están d a r pero d istin tas en
cuanto a las c i m a s ....................................................... 109
VII.7. Áreas debajo de la curva n o r m a l ...............................110
VII.8. C om paración de las form as e stá n d a r y general de
la curva n o r m a l .............................................................112
VII.9. Curva norm al, con porción achurad a rep resen tan
do el área en u n a sola c o l a ...........................................113
V II. 10. Curva norm al, con porciones achuradas p resen tan
do áreas en am bas c o l a s ...........................................114
V II.ll. Curva n orm al con porción achurada, represen tan
do el área en tre dos ordenadas . . . . . . 114
IX .1. Oscilación de la proporción de éxitos aproxim án
dose al lím ite de . 5 0 ....................................................... 130
IX.2. R epresentación geom étrica de probabilidades, con
áreas proporcionales a P(A), P( B) y P( A & B ) . . 136
599
X .l. C om paración de las regiones críticas de pru eb as
de u n a sola cola y de dos colas, em pleando el ni
vel de significación de . 0 5 ..........................................174
X I.l. C om paración de las distribuciones norm ales de
m u estreo p a ra m u estras de tam año diferente . . 188
X I .2. C om paración en tre las distribuciones de la pobla
ción y de la m u e s t r a ...................................................... 189
XI.3. D istribución de la población de las probabilidades
de o b ten er caras de 1, 2, 3, 4, 5 o 6 con un dado
p e r f e c to .............................................................................. 192
XI.4. D istribución de m u estreo de las m edias de las ca
ras, con dados perfectos y m uestras de tam año 2 192
XI.5. D istribución de m uestreo de las m edias de las ca
ras, con dados perfectos y m u estras de tam año 3 193
XI.6. D istribución norm al de m uestras, con área achu
ra d a rep resen tan d o un a región crítica de u n a sola
cola al nivel de significación de . 0 5 ........................197
X II.1. Com paración de las distribuciones de m u estreo de
u n a estim ación sesgada, con alta eficiencia, y una
estim ación no sesgada, de eficacia m enor . . . 214
XII.2. C om paración de intervalos de confianza con la dis
tribu ción de m uestreo de la m edia, m ostrando p o r
qué los intervalos de confianza del 95 p o r ciento
com prenden ¡x el 95 p o r ciento de las veces . . . 217
X II.3. D istribución de intervalos variables de confianza
con resp ecto a un valor fijo del parám etro u . . 218
XII.4, C om paración de un intervalo de confianza del 95
p o r ciento con pru eb as de hipótesis al nivel de .05
m o stran d o el no rechazo de la m edia hip o tética jij,
que queda dentro! del intervalo1, y el descarte de la
(i2 hipotética, que queda fu era del intervalo . . 220
X IV .l. Funciones de potencia p a ra p ruebas de dos colas,
con a = .05, p ara m u estras de tam año variable . . 258
XIV.2. D erivación de la fuerza com o función de ([i — [x0) 260
XIV.3. C om paración de funciones de potencia p a ra p ru e
b as de u n a y dos colas, con a = .05. a) R echace si
Z > 1.645. b) Rechace si Z < — 1.645. c) Rechace
si Z > 1.96 o si Z < - 1.96 ........................................... 261
X V II.l. F orm a general de la regresión de Y sobre X, o cur
so de las m edias de los valores de Y p a ra valores
fijos de X ..........................................................................380
XVII.2. La ecuación lineal de regresión, m o stran d o in te r
pretacio nes geom étricas de a y ¡3 ...............................382
XVII.3. La d istrib u ció n n o rm al b i v a r i a b l e ........................ 385
XVII.4. D iagram a de d ispersión y re c ta de m ínim os cu a
d rad o s ............................................................. ...... 386
XVI 1.5. E cuación de m ínim os cuadrados, que m inim iza las
sum as de los cu adrados de las distancias vertica
les y estim a la regresión de Y so b re X . . . . 388
XVII.6. D iagram a de dispersión y re c ta de m ínim os cua
d rad o s p a ra los datos del cu ad ro X V II.1 . . . 392
XVI 1.7. D iagram a de dispersión que m u e stra las diferentes
fuerzas y direcciones de las relaciones en tre X y Y 393
XVII.8. D iagram a de d ispersión de u n a relación no lineal
perfecta, en que r — 0 ................................................. 395
XVII.9. D iagram as de dispersión que m u estran los efectos
posibles de valores extrem os de I . . . . . 398
XVII.10. D iagram a de dispersión que no m u estra relación
alguna den tro de u n reco rrid o lim itado de v aria
ción de X, pero con relación positiva sobre el re
corrido to ta l.........................................................................399
X V II.11. R epresentación geom étrica que m u e stra las desvia
ciones resp ecto de la m edia Y com o u n a sum a de
desviaciones resp ecto de la re c ta de m ínim os cua
d rad os y desviaciones de la re cta de m ínim os
cuadrados respecto d e la Y ........................................... 408
X V III.1. R epresentación geom étrica del hecho de que la
hipótesis de {3 = 0 es equivalente a la hipótesis
Hi = (Ja = • ■• = M*..........................................................
X V III.2. B anda de confianza con respecto de la recta de
m ínim os c u a d r a d o s .................................................... 422
XV III.3. Ecuación logarítm ica de m ínim os cuadrados de la
fo rm a Y = a + b log X .............................................. 427
X V III.4. C om paración de las desviaciones respecto de la rec
ta de m ínim os cuadrados con las desviaciones re s
pecto de las m edias de las c a te g o rías......................428
X IX .l. In terp retac ió n geom étrica de la regresión m últiple
de Y sobre I ] y I 3 .....................................................449
XIX.2. Plano de m ínim os cuadrados, que reduce al m íni
m o las sum as de las desviaciones al cuadrado en
la dim ensión vertical Y .............................................. 450
XIX.3. R ectas de m ínim os cu ad rados indicando los resi
du o s e n tre : a) Y y X 2, y b) e n tre X x y X 2 . . . 451
XIX.4. Las seis flechas causales posibles en tre X , Y y Z . 462
XIX.5. Relaciones causales posibles en tre X, Y y Z, to
m an d o a Y com o variable dependiente y excluyen
do la causalidad en dos d ir e c c io n e s .........................463
XIX .6. F o rm as de polinom ios de segundo, terc ero y cuar
to g r a d o s ..........................................................................480
XIX.7. D atos hipotéticos con u n a p arábola de m e jo r aju ste 481
XX. 1. D atos hipotéticos que indican u n a débil correlación
to tal e n tre X y Y, p e ro correlaciones m ás fu ertes
d en tro de las categorías de A .....................................493
XX.2. D atos hipotéticos que indican u n a fu e rte correla
ción to tal en tre X y Y, p ero correlaciones m ás dé
biles d en tro de las categorías de A .........................494
XX.3. R ectas de pendientes iguales, que indican no in
teracció n ................................... .......................................... 503
XX.4. C om paración e n tre re ctas separadas de m ínim os
cu ad rad o s y rectas a través de las m edias de cate
gorías, p ero todas tienen la m ism a p endiente bw . 505
XX.5. In te rp re ta c ió n geom étrica de los cálculos de las
m edias Y a j u s t a d a s ....................................................... 512
XX.6. In terp retac ió n geom étrica de las m edias aju stad as
de Y m ediante deslizam iento de las m edias de ca
tegorías paralelam ente a la re cta de pendientes b,„ 513
X X I.1. R elación e n tre el e rro r to tal y los erro res de m ues
treo y no de m u e s t r e o ................................................. 554
111.1. N úm ero de delincuentes y de no delincuentes en
dos localidades hipotéticas . ..................................... 44
111.2. Proporciones de delincuentes y de 110 delincuentes
en dos localidades h ip o té tic a s .................................... 44
111.3. D istribución de los núm eros y porcentajes de ca
sos trata d o s p o r tres agencias hipotéticas de servi
cios d o m é s t i c o s ............................................................. 46
111.4. D istribución en porcentajes de los casos tratad o s
p o r tres agencias hipotéticas de servicios dom és
ticos, con los porcentajes dispuestos verticalm ente 47
111.5. D istribución en p o rcentajes de los casos tratados
p o r tres agencias hipotéticas de servicios dom és
ticos, con los porcentajes calculados horizontal-
m ente .......................................................................48
IV. 1. D istribución d e la frecuencia, con datos agrupados
en intervalos de 5 p o r c i e n t o .............................. 55
IV.2. D istribución de la frecuencia, con datos agrupados
en intervalos de 10 p o r ciento . . . . . . . 55
IV.3. D istribución de las frecuencias con datos agrupa
dos en intervalos de 20 p o r c i e n t o .................. 56
IV.4. D istribución de frecuencia cum ulativa . . . . 60
V .l. Cálculo de la m edia de datos agrupados p o r el m é
todo l a r g o .................................................................. 75
V.2. Cálculo de la m edia de datos agrupados p o r el m é
todo c o r t o .................................................................. 77
V.3. Cálculo de la m edia da datos agrupados por el m é
todo corto y de las desviaciones graduales . . 78
V.4. Cálculo de la m ediana de datos agrupados . . . 79
VI. 1. Cálculo de la desviación e stán d a r utilizando datos
a g r u p a d o s ............................................................... 100
XIV. 1. Cálculos p ara la p ru eb a de dos m uestras de Smir-
nov ............................................................................280
XIV.2. Cálculos de la p ru eb a de W ilcoxon de pares aso
ciados ..................................................................... 282
XV .l. Cálculos de la ^ - c u a d r a d a ................................ 294
XV.2. Cálculo de la x-cuadrada sirviéndose de la fórm ula 295
603
XV.3. Cálculo de la ^-cuadrada p a ra una tabla de contin
gencia de 3 x 3 ...................................................299
XV.4. C uadro m aestro p a ra correlacionar cuatro variables 322
XV.5. Serie de tablas de contingencia que relacionan dos
variables con dos controles sim ultáneos . . . . 323
XV .o.................................................................................................... 324
X V I.l. D atos p a ra el análisis de v a r ia n c i a .............. 333
XVI.2. R epresentación sim bólica de los datos p a ra el aná
lisis de la v a r i a n c i a .............................................335
XVI.3. Cálculos p a ra el análisis de la variancia . . . . 342
XVI.4. D atos p a ra el análisis de variancia en dos form as 350
XVI.5. Cálculos p a ra el análisis de variancia, de dos fo r
m as con p ru e b a de i n t e r a c c i ó n .............................. 357
XVI.6. Cálculos p a ra el análisis de variancia en dos fo r
m as, con la interacción añadida den tro del térm i
no de e r r o r ....................................................... 359
XVI.7. D atos y cálculos p a ra el análisis de variancia con
rangos d e K ru s k a l-W a llis ...........................................366
XVI.8. D atos y cálculos p a ra la p ru eb a de F riedm an . . 369
XVII. 1. D atos p a ra un p roblem a de correlación . . . . 390
XVII.2. D atos clasificados cruzados p a ra o b ten er correla
ciones de datos a g r u p a d o s ...........................................404
XVII.3. Cálculos de la correlación de datos agrupados . . 405
XVII.4. Relaciones num éricas e n tre r, r2, 1 — r2 y ■y'l — 411
X V III.l. P ru eb a de análisis de variancia de la hipótesis g= 0 416
XVIII.2. P ru eb a de análisis de variancia p a ra el caso de no
l i n e a l i d a d ......................................................................... 429
XVIII.3. Cálculo del coeficiente de S pearm an de la correla
ción de r a n g o ................................................................... 435
XVIII.4. Datos com parados p a ra el cálculo de la ta u de
K endall a p a rtir de datos a g r u p a d o s ........................ 440
X IX .l. P rueba de análisis de variancia p a ra la significa
ción de la correlación m ú ltip le . . . . . . 485
XIX.2. P ru eb a de análisis de variancia p a ra la significa
ción de la correlación p arcial rls..¿ ........................ 486
XX. 1. Cálculos p a ra el análisis de covariancia . . . 499-501
XX.2. P ru eb a de análisis de variancia p a ra la interacción 506
XX.3. P rueba de análisis de variancia p a ra la significa
ción de la correlación prom edio intraclase ( q Z t -a ) 509
XX.4. P ru eb a de análisis de variancia p a ra la significa
ción de las diferencias en tre m edias ajustadas . . 515
X X I.1. D atos p a ra calcular estim aciones de p arám etro s
de m u estras e s tr a tif ic a d a s .......................................... 545
A. C uadro de cuadrados y raíces cuadradas . . 565-577
B. N úm eros a l e a t o r i o s ................................................. 578-581
C. Áreas b ajo la curva n o rm a l..................................................582
D. D istribución de t ....................................................................583
E. V alores críticos de r en la p ru eb a de las secuen
cias P = .05 ..................................................................................... 584
F. C uadro de probabilidades asociadas a valores tan
pequeños com o los valores observados de V en la
p ru e b a de M ann-W hitney (con dirección antici
p a d a ) .............................................................................. 585-587
G. C uadro de valores críticos de U en la p ru eb a de
M ann-W hitney............................... .............................. 588-591
H. C uadro de valores críticos de T en la pru eb a de
p ares asociados y órdenes provistos de signo, de
W i l c o x o n ..................................................................................592
I. D istribución de la x2 ............................................................ 593
J. D istribución de F ....................................................... 594-596
K. Valores de la z p a ra valores dados de r . . . 597-598
Prefacio .................................................................................................................................... 9
1 .1 . F u n c i o n e s d e l a e s t a d í s t i c a . . . . . . . 16
1 .2 . E l l u g a r d e l a e s t a d í s t i c a e n e l p r o c e s o d e l a
i n v e s t i g a c i ó n ....................................................................................... 19
1 .3 . A d v e r t e n c i a ........................................................................................ 2 0
B ib l io g r a f í a ................................................................................................. 21
I I . T e o r í a , m e d i c i ó n y m a t e m á t i c a s .............................................. 2 2
1 1 .1 . T e o r í a e h i p ó t e s i s : d e f i n i c i o n e s o p e r a t i v a s . . 22.
1 1 .2 . E l n i v e l d e m e d i c i ó n : e s c a l a s n o m i n a l e s , o r d i
n a l e s y d e i n t e r v a l o ............................................................... 2 6
1 1 .3 . M e d i c i ó n y e s t a d í s t i c a .......................................................3 2
1 1 .4 . O r g a n i z a c i ó n d e l l i b r o .......................................................3 7
B i b l io g r a f í a .................................................................................................4 0
S e g u n d a P arte
E s t a d ís t ic a d e s c r ip t iv a u n iv a r ia d a
I I I . E s c a la s n o m ín a le s : p ro p o rc io n e s , p o r c e n ta je s y ra
z o n e s ............................................................................................... .43
1 1 1 .1. P r o p o r c i o n e s ................................................................................4 3
1 1 1 .2 . P o r c e n t a j e s .................................................................................. 4 5
1 1 1 .3 . R a z o n e s ..............................................................................................4 9
B i b l io g r a f í a .................................................................................................5 2
IV . E s c a la s d e in te r v a lo : d is tr ib u c io n e s d e f re c u e n c ia
y r e p r e s e n t a c i ó n g r á f i c a ...............................................................53
I V . 1. D i s t r i b u c i o n e s d e f r e c u e n c i a : a g r u p a m i e n t o d e
l o s d a t o s ....................................................................................... 53
I V .2 . D i s t r i b u c i o n e s d e f r e c u e n c i a c u m u l a t i v a . . 60
I V .3 . P r e s e n t a c i ó n g r á f i c a : h i s t o g r a m a s , p o l í g o n o s
d e fre c u e n c ia y o jiv a s , ............................................ 61
B i b l io g r a f í a .................................................................................................6 6
606
V .l. La m edia aritm é tic a . ...................................... 67
V.2. La m e d i a n a ................................................................. 71
V.3. Cálculo de la m edia y la m ediana de datos ag ru
p ados .............................................................................73
V.4. Com paración de la m edia y la m ediana . . . 81
V.5. O tras m edidas de tendencia c e n tral . . . . 85
V.6. Deciles, cuartiles y p e r c e n tile s ...........................86
B i b l io g r a f í a ........................................................................ 88
T ercera P a rte
E s t a d ís t ic a in d u c t iv a
IX . P r o b a b ilid a d ...................................................... I
IX .l. P robabilidad a p r i o r i ........................ I
IX.2. P ropiedades m atem ática* ti» Ihn |ir<ili«ltilltlnil>*i I \1
IX.3. P e r m u t a s ....................................................................145
IX.4. V alores e s p e r a d o s ................................................. 151
IX.5. In dependencia y m uestreo aleatorio . . . . 153
B ibliografía . ....................................................................159
C u a rta P a rte
E s t a d í s t i c a s b iv a ria d a s y m u l ti v a r i a d a s
X III. P ruebas d e dos m u e s tra s : diferencia de las m edias
y las p ro p o rcio n es................................................ 231
X II I.l. P ru eb a de la d iferencia de las inedias . . 231
X III.2. D iferencia d e p r o p o r c io n e s ...............................240
X III.3. In terv alo s de c o n f ia n z a .....................................245
X III.4. M uestras d ep en d ien tes: pares asociados . . 246
X III.5. C om entarios a p ro p ó sito de los esquem as ex
p erim entales y p ru e b as de significación . . 248
XIV. E scalas o rd in ales: p ru e b as n o p aram étricas de dos
m u e s tra s ................................................................................ 256
X IV .l. F uerza y eficiencia de la f u e r z a ..................... 257
XIV.2. La p ru e b a de las secuencias ( r u n s ) de Wald-
W o l f o w i t z ............................................................263
XIV.3. La p ru e b a de M ann-W hitney o de W ilcoxon 269
XIV.4. La p ru e b a de Kolm ogorov-Sm irnov . . 277
XIV.5. La p ru e b a de W ilcoxon de p ares asociados y
órdenes provistos de s i g n o ............................280
XIV.6. R e s u m e n ................................................................ 284
B i b l i o g r a f í a ....................................................................... 288
Q u in ta P a rte
M u e s tr e o
XXI. M u e s t r e o ................................................................................ 531
X X I.1. M uestreo aleatorio s e n c illo ........................... 532
XXI.2. M uestreo s is te m á tic o ........................................537
XXI.3. M uestreo e s tra tif ic a d o ......................................539
XXI.4. M uestreo p o r c o n g lo m e r a d o s ..................... 546
XXI.5. M uestreo sin p r o b a b i l i d a d ........................... 552
XXI.6. E rro res no de m u estreo y tam año de la
m u e s t r a .................................................................... 553
B ib l io g r a f í a ...........................................................................554
Apén d ices
I. R esum en de operaciones a lg e b r a ic a s .........................559
Indice de f i g u r a s ................................................................................599
ín d ice de c u a d r o s ..............................................................................603
Este libro se terminó de imprimir y encuadernar
en el mes de junio de 1994 en los talleres de En
cuadernación Progreso, S. A. de C. V. (iepsa),
Calz. de San Lorenzo, 244; 09830 México, D. F.
Se tiraron 2 000 ejemplares.