Está en la página 1de 243

-­e

-­ o
~
e
o :;:,
a:
C-tn
tn
eu

t)
e
!I !!"
r-=l
°ru
IT"
rn
..D
~~~~~",~
o
N r-=l
I
0
==--=='Oru
0 ,
..- 0
°N Z
• °00 lD
~~~~~I'-
Vl
H
ESTADISTICA
para las CIENCIAS SOCIALES
ESTADISTICA
para las CIENCIAS SOCIALES

RICHARD P. RUNYON
AUDREY HABER

Version en espanol de
Hugo Pereyra
Uniuersidad National de Ingenierla
Lima, Peru

can la colaboraci6n de
Carmen Gonzalez Hieras
Universidad National Autonoma de Mexico
Mexico

...
TT ADDISON·WESLEY IBEROAMERICANA
Argentina> Brasil· Chile· Colombia . Ecuador . Espana
Estados Unidos . Mexico'> Peru Puerto Rico : Venezuela
>
[v]

Version en espanol de la obra titulada Fundamentals of Behavioral Statistics, Fourth Edi­


Prefacio

tion, de Richard P. Runyon y Audrey Haber, publicada originalmente en ingles POI'


Addison-Wesley Publishing Company, Inc., Reading, Massachusetts, E.U.A. Copyright
a la cuarta edici6n

© 1980,1976,1971,1967.
Esta edicion en espanol es la (mica autorizada.
En la preparaci6n de la cuarta edici6n de un texto hay algo que es en gran medida un reto y
una satisfacci6n. La satisfacci6n proviene del hecho de que el libro, y sus ediciones pre vias,
ha resistido bien una prueba de larga duraci6n. B;l rete proviene de la necesidad de conservar
las cualidades que nos hicieron ganar tantos amigos leales, a la vez que introducir los nuevos
desarrollos en el campo de la estadistica y las sugerencias hechas pOI' colegas.
A continuaci6n indicamos algunas de las modificaciones que hemos hecho en la presente
edici6n:
Reconociendo la importancia fundamental de las definiciones, las hemos presentado en un
glosario en el apendice VI.
Hemos recurrido directamente a las Fuentes para obtener much os de los ejemplos y
ejercicios que aparecen en el texto. De esta manera proporcionamos a los estudiantes los datos
originales de trabajos de investigacion, publicados e ineditos, dando ocasi6n para que manejen
dichos datos tanto en el nivel descriptivo como en el inferencial. Creemos que estos ejemplos
constituiran para el estudiante experiencias ricas y comprensibles en el analisis de la
investigaci6n actual.
A 10 largo de nuestros afios de enseiianza hemos notado frecuentemente que las tablas
estadisticas que aparecen en el apendice no reciben siempre el cuidado y la atenci6n que se Ie
suele dar al resto del material del texto. A veces los estudiantes calculan correctamente el
estadigrafo de una prueba y luego fallan al relacionarlo con una tabla estadistica. Hemos
intentado disefiar las tablas de modo que sean una ayuda y no un elemento de frustraci6n. Asi,
donde consideramos que es apropiado, indicamos los casos en que se trata de valores de
probabilidad uni 0 bilaterales. Mas aun, hemos incluido en las tablas ejemplos que ilustran
su uSO.
Tambien hemos ampliado algunas de ellas. POI' 10 que sabernos, en ningun otro texto
actualmente disponible se muestran las probabilidades binomiales para N ~ 49 cuando
P =1= Q (Tabla N), dan do los valores criticos uni y bilaterales de la prueba binomial hasta
N = 50 cuando P = Q (Tabla M), y se presentan los valores criticos de la variable F (Tabla
D tl en cada una de las colas de la distribuci6n.
EI uso casi generalizado de las calculadoras de bolsillo ha hecho que sea virtualmente
innecesario el calculo de varios estadigrafos inexactos a partir de distribuciones de frecuencias
© 1984 POI' Fondo Educativo Interamericano, S.A. agrupadas. Aun con grandes masas de datos es relativamente Iacil colocar los valores de la
variable en la calculadora y hallar la media y la desviacion estandar. En consecuencia, se han
© 1992 POI' Addison-Wesley Iberoamericana, S.A. eliminado del texto los metodos para obtener la media y la desviaci6n estandar en las
Wilmington, Delaware, E.U.A. distribuciones de frecuencias agrupadas. Ya que hablarnos de las calculadoras de bolsillo, cabe
sefialar que el Libro de Ejercicios para el alumno contiene programas detallados para el
calculo de la mayor parte de las operaciones estadisticas indicadas en el texto. Aunque estos
programas han sido hechos con base en las funciones mas simples de la calculadora, se
presentan sugerencias para mejorarlos cuando se dispone de calculadoras mas complejas.
Reservados todos los derechos. Ni todo el libro ni parte de el pueden ser reproducidos, Ciertarnente, se alienta a los estudiantes para que elaboren sus propios programas. Si 10 hacen
archivados 0 transmitidos en forma alguna 0 mediante algun sistema electronico, asi, incrementa ran su habilidad en 10 referente a procedimientos de calculo.
mecanico de fotorreproducci6n, memoria 0 cualquier otro, sin permiso pOI' escrito del Se ha marcado con asteriscos todos los ejercicios de fin de capitulo que constituyen una
editor. base para discusiones ulteriores. Aunque parezca obvio, vale decir que es de suma importancia
Impreso en E.D.A. Printed in U.S.A. para el estudiante completar estos ejercicios, de modo que sea posible una transicion suave
ISBN 0-201-06392-1 hacia conceptos de mayor complejidad.
2 345 6 7 8 9-AL-96 95 9493 92
vi ESTADfSTICA PARA LAS CIENCIAS SOCIALES [vii]

Finalmente, hemos notado que los procedimientos para normalizar una distribucion no
normal constituyen un arte casi olvidado. A pesar de ello, frecuentemente se los mencionan en Prefacio

text os basicos de muchos campos, incluyendo los de Educacion, Psicologia y Sociologia,


Hemos incluido en el apendice IV del texto una ilustracion detallada de las tecnicas de
norrnalizacion.
a la primera edici6n en Ingles

Tenemos una deuda de gratitud con muchos colegas que nos hicieron valiosas sugerencias
para esta edicion. Pero estamos particularmente agradecidos a las siguientes personas, cuyas
contribuciones fueron especialmente lucidas y profundas:
En los afios que llevamos impartiendo cursos introductorios de estadistica para estu­
diantes de las ciencias sociales, cometimos el error -si se trata de un error- de cam­
Robert 1. Grissom Victor E. Montgomery biar los textos que usabarnos con bastante frecuencia. Nuestras experiencias en este
San Francisco State University University of Idaho sentido no han sido (micas; en conversaciones con colegas de otras instituciones,
Steve Harkins Steven E. PoItrock hemos descubierto dificultades similares para decidirse en adoptar un texto unico de
Northeastern University University of Denver estadistica. Estas opiniones han revelado dos tipos frecuentes de inquietudes.
Frederick L. Kitterle David M. Snuttjer 1. Los textos actuales tratan de ser compendios superficiales 0 bien, libros con
The University of Toledo Calvin College mucho rigor que agravian la formaci6n del estudiante rnatematico, superior a los
conocimientos adquiridos por la mayor parte de los alumnos que estudian ciencias
Willard D. Larkin Russell Veitch
sociales,
University of Maryland Bowling Green State University
2. Muchos de los textos actuales no reflejan los ultimos adelantos en estadisticas de
Neil Macmillan L. Carl Volpe muestras pequefias 0 las ventajas, ya mas generalizadas en las universidades, de los
Brooklyn College Northeastern University equipos de calculo automaticos de alta velocidad.
Scott E. Maxwell Phyllis A. Walrad Para empezar, nos oponemos firmemente a los textos con enfoque de "recetario
University of Houston Macomb County Community College de cocina" al analisis estadistico. Ademas de menospreciar la creatividad del estu­
Karin C. Meiselman Kathleen Dillon diante, dichos textos tienden a convertirse en el "manual bueno para todo" del estu­
Pitzer College Western New England College dioso de este campo 0 del joven alumno. Este tipo de libros facilmente puede llevar
al estudiante a determinar que la estadistica es un "potro de tortura", donde uno
Lawrence E. Melamed demuestra su capacidad para soportar el dolor de memorizar f6rmulas esotericas y
Kent State University reglas diversas para su aplicacion, Por otro lado, reconocemos que un enfoque es­
Expresamos tambien nuestro agradecimiento, en forma especial, al doctor Joseph Wingard 'trictamente matematico a la estadistica introductoria hace que muchos estudiantes
(U.C.L.A.), quien contribuy6 con muchos ejemplos relacionados con la investigacion. capaces se ahoguen en un pantano de abstracciones y simbolos matematicos, de
Agradecemos tambien al albacea literario del extinto Sir Ronald A. Fisher, F.R.S., doctor poca relevancia en aplicaciones practicas. Hemos intentado lograr un equilibrio
Frank Yates, F.R.S. y a Longman Group Ltd., de Londres, por la autorizacion para reproducir entre estos dos enfoques. Asi, aunque elegimos ejemplos sencillos para ilustrarel
la tabla III de su libro Statistical Tables for Biological, Agricultural and Medical Research calculo de los distintos estadisticos, no dudamos en incluir demostraciones algebrai­
(Sexta edicion, 1974). cas que esten al alcance de la mayoria de los estudiantes de ciencias sociales, y com­
Tucson R.P.R. prueben tener una relaci6n fundamental.
Los Angeles A.H. Respecto al segundo punto, donde muchos textos actuales no reflejan los ultimos
adelantos estadisticos y cam bios tecnologicos, hemos realizado un gran esfuerzo
para eliminar toda materia que, segun nuestra experiencia, raramente se utilice
ahora. En consecuencia, en este libro no se encontraran metodos de puntuacion
codificada, que fueron vitales cuando se realizaban estadisticas de muestras grandes
y antes de la llegada de las maquinas programables de alta velocidad. A pesar de que
algunos profesores, en un momento de profunda nostalgia, posiblemente lamenten
la perdida de esta reliquia de los alegres dias de la estadistica, sentimos que la ense­
fianza de los metodos de puntuaci6n codificada es una perdida de tiempo, pues com­
plicala actividad del estudiante, quien llega a creer que el conocimiento de formulas
es la esencia de la estadistica, y no Ie facilita ninguna informacion especial sobre la
naturaleza del analisis estadistico. EI uso de correlogramas ha sufrido un final simi­
lar, por la misma razon, A los criticos, solo diremos que nunca tuvimos ocasion, en
nuestras investigaciones, de emplear los metodos de puntuacion codificada 0 los
correlogramas y j nunca hemos conocido alguien que 10haga!
viii ESTADISTICA PARA LAS CIENCIAS SOCIALES PREFACIO ix

Por otra parte, no hemos dudado en introducir tecnicas estadisticas nuevas que Expresamos nuestro sincero reconocimiento a la doctora Nancy Wiggins, por sus
representan -pensamos- un avance sobre los metodos citados. Por esto, se estudia excelentes y estimulantes comentarios proporcionados en distintas etapas durante la
el estadigrafo A de Sandler, que es equivalente algebraicamente al cociente t de preparacion del manuscrito. Tarnbien, estamos profundamente agradecidos a Milli­
Student para muestras correlacionadas, porque reduce radicalmente los procedi­ cent Cowit, Ruth DeMarco, Norma Morrow y Fleeta Runyon, por sus esmerados
mientos de computacion requeridos para to mar una decision estadistica. esfuerzos al mecanografiar un manuscrito que, con formulas y simbolos poco fami­
Aim mas, en el examen de hipotesis, hemos intentado preservar la distincion entre liares, debe haberles ocasionado muchos momentos de angustia y frustracion.
parametres poblacionales y estadigrafos muestrales. Ya que nuestro enfoque es con­ Por ultimo, queremos expresar nuestra gratitud a los autores y editores que nos
sistente a 10 largo del libro, esperamos eliminar parte de la confusion que algunas han permitido adaptar 0 reproducir materiales originalmente publicados por ellos.
veces se da en este contexto. Hemos citado cada fuente donde aparece este material. Agradecemos al albacea lite­
Unas palabras sobre la organizacion de esta obra. Muchos libros modernos de rario del finado sir RonaldA. Fisher, F.R.S., Cambridge, al doctor Frank Yates,
estadistica han relegado la estadistica descriptiva a un plano de importancia secun­ F.R.S., Rothamsted y a los senores Oliver y Boyd, Ltd., Edinburgo, por su permiso
daria. Aunque no creamos que las tecnicas estadisticas descriptivas representen algo para publicar y adaptar tab las de su libro, Statistical Tables For Biological, Agricul­
mas que los fundamentos del analisis estadistico, el dominio de estas tecnicas es tural, and Medical Research.
prerrequisito para entender y aplicar los conceptos y procedimientos implicados en
la estadistica inferencial. Hemos buscado demostrar la continuidad de estas dos Greenvale, L. [., N. Y. R.P.R.
ramas de la estadistica. A.H.
Las tablas estadisticas en el Apendice IV han sido cuidadosamente preparadas
para reducir al minima las dificultades del estudiante al usarlas. Por ejemplo, la
mayoria de las tablas van precedidas de una breve descripcion de los procedimientos
que su aplicacion implica. Adernas, donde resulta propio, se muestran valores criti­
cos para rechazar la hipotesis nula con valores que tienen en cuenta las dos colas de
la distribucion en diferentes niveles de significacion, Finalmente, se ha reducido la
cornplejidad de algunas tablas, haciendo posible la localizacion de informacion rele­
vante en un periodo mas corto de tiempo y con menor probabilidad de error. Por
ejemplo, el estadigrafo U de Mann- Whitney se muestra comunmente en diez tablas
diferentes. Para complicar aun mas las cosas, algunas de las tablas dan valores exac­
tos de probabilidad, mientras que otras proporcionan valores criticos para rechazar
la hipotesis nula en los diferentes niveles de significacion, Hemos reducido estas
tab las a cuatro, indicando unicarnente los valores criticos requeridos para rechazar
la hipotesis nula. Ademas, estas tablas muestran los valores de U y U', para que el
estudiante no tenga necesidad de especificar, cuando emplea la prueba Mann­
Whitney, cual de los estadigrafos es el que se ha calculado.
Los ejercicios al final de cada capitulo son parte extremadamente importante e
integral del libro, ya que, ademas de ilustrar relaciones fundamentales, requieren
que el estudiante formule por si mismo muchos conceptos estadisticos significativos.
El orden dado a este texto es tal que los primeros quince capitulos constituyen, en
nuestra opinion, una introduccion minuciosa a los fundamentos de la estadistica
descriptiva y la inferencial. Para el profesor que desee metodos estadisticos mas
avanzados, hemos incluido, en los cuatro ultimos capitulos, temas tales como ana­
lisis de la varianza, potencia y eficiencia de una prueba estadistica y varias pruebas
no pararnetricas de significacion, utilizadas usualmente.
En resumen, hemos intentado escribir un libro de texto para un curso, semestral,
introductorio de estadistica para estudiantes de ciencias sociales. Esperamos que
ellos apreciaran la utilidad del metodo estadistico en su campo profesional; que
obtendran un buen entendimiento de las conjeturas y la logica implicitas en la apli­
cacion de las herramientas estadisticas; que podran elegir la tecnica estadistica apro­
piada y efectuar los calculos necesarios, y finalmente, que sabran como interpretar y
entender los resultados de sus esfuerzos.
Estamos muy agradecidos con muchas personas que han contribuido a este libro.
[xi]

Indice general
Prefacio a la cuarta edicion v

Primera parte. INTRODUCCION 1

1 Definicion de analisis estadistico 3

1.1 i,Que es la estadistica? 3

1.2 Definiciones de terminos cornunmente usados en estadistica 6

1.3 Estadistica descri pti va 8

1.4 Estadistica inferencial 10

1.5 Una advertencia al lector 10

Resumen del capitulo 12

Terrninos pararecordar 12

Ejercicios 12

2 Conceptos maternaticos fundamentales 15

2.1 Introducciori 15

2.2 La grarnatica de la notacion maternatica 15

2.3 Reglas de la sumatoria 18

2.4 Tipos de nurneros y de escalas 20

2.5 Escalas continuas y discontinuas 26

2.6 Redondeo 28

2.7 Razones, frecuencias, proporciones y porcentajes 29

Resumen del capitulo 31

Terrninos para recordar 31

Ejercicios 31

Segunda parte. ESTADISTICA DESCRIPTIVA 37

3 Distribucion de frecuencias y tecnicas de representacion grafica 39

3.1 Agrupacion de datos 39

3.2 Frecuencias y distribuciones porcentuales acumuladas 44

3.3 Tecnicas de representacion grafica 45

3.4. Empleo erroneo de las tecnicas de representacion grafica 45

3.5 Variables de escala nominal 47


3.6 Variables de escala ordinal 47
3.7 Variables de escala por intervalos y de razones 49

3.8 Formas de las curvas de frecuencias 52


3.9 Otras representaciones graficas 54

Resumen del capitulo 56

Terminos para recordar 57

Ejercicios
57

4 Percentiles 63

4.1 Introduccion 63
4.2 Percentiles acumulados y ran go percentil 63

4.3 Rango percentil y grupo de referencia 69


xii ESTADISTICA PARA LAS CIENCIAS SOCIALES INDICE GENERAL xiii

Resumen del capitulo 71 9 Regreslon y prediccion 143


Terrninos para recordar 72
Ejercicios 72 9.1 Introduccion a la prediccion 143
9.2 Regresion lineal 146
9.3 Varianza residual y error estandar de la estimacion 152
5 Medidas de tendencia central 76 9.4 Variacion explicada y no explicada 157
5.1 Introduccion 9.5 Correlacion y causalidad 159
76
5.2 Media aritrnetica Resurr del capitulo 161
77
5.3 Mediana Terrninos para recordar 162
81
5.4 Moda 83 Ejercicios 162
5.5 Comparacion de la media, la mediana y la moda 83
5.6 Media, mediana y sesgo 84 Revision de la segunda parte. ESTADISTICA DESCRIPTIVA 169
Resumen del capitulo 85
Terrninos para recordar 86
Ejercicios 86 Tercera parte. ESTADISTICA INFERENCIAL 171
A. Pruebas parametricas de siqnificacion 171
6 Medidas de dispersion 92
6.1 Introduccion 92 10 Probabilidad 173
6.2 Rango 93
6.3 Rango semi-intercuartil
10.1 Introduccion a la teoria de la probabilidad 173
93 10.2 Concepto de aleatoriedad 175
6.4 Desviacion media 96 10.3 Enfoques del concepto de probabilidad 178
6.5 Varianza (S2) y desviacion estandar (s) 97 10.4 Propiedades formales de la probabilidad 179
6.6 Interpretacion de fa desviacion estandar 102 10.5 Probabilidad y variables continuas 187
Resumen del capitulo 102 10.6 La probabilidad y el modelo de la curva normal 187
Terrninos para recordar 103 10.7 Valores de p uni y bilaterales 189
Ejercicios 103 Resumen del capitulo 191
Terrninos para recordar 193
7 Desviacion estandar y distribuclen normal estandar 107 Ejercicios 193
7.1 Introduccion 107
7.2 El concepto de valor estandarizado 107 11 Introduccion a la inferencia estadistica 198
7.3 La distribucion normal estandar 111 11.1 i,Por que se toman muestras? 198
7.4 Problemas ilustrativos 114 11.2 Concepto de distribuciones muestrales 199
7.5 La desviacion estandar como estimacion del error y de la precision 117 11.3 Examen estadistico de hipotesis: nivel de significacion 202
7.6 La transforrnacion a valores Z 118 11.4 Examen estadistico de hipotesis: hipotesis nula e hipotesis alternativa 205
Resumen del capitulo 119 11.5 Examen estadistico de hipotesis: los dos tipos de error 207
Terrninos para recordar 119 Resumen del capitulo 210
Ejercicios 120 Terrninos para recordar 211
Ejercicios 211
8 Correlacion 122

8.1 El concepto de correlacion 122 12 Inferencia estadistica y variables continuas 214


8.2 La r de Pearson y los valores z 126 12.1 Introduccion 214
8.3 Calculo de la r de Pearson 128 12.2 Distribucion muestral de la media 216
8.4 Advertencia 130 12.3 Examen estadistico de hipotesis: media y desviacionestandar poblacio­
8.5 Variables de escala ordinal y rs 133 nales conocidas 219
Resumen del capitulo 135 12.4 Estirnacion de parametres: estirnacion puntual 221
Terrninos para recordar 136 12.5 Examen estadistico de hipotesis con parametres desconocidos: la t de
Ejercicios 136 Student 226
xiv ESTADiSTICA PARA LAS CIENCIAS SOCIALES iNDICE GENERAL xv

12.6 Estimacion de parametres: estimacion por intervalos 230 Tercera parte. ESTADISTICA INFERENCIAL 303
12.7 Intervalos de confianza y limites de confianza 231
12.8 Ensayo de la significacion para la r de Pearson: caso de una sola B. Pruebas no parametricas de significaci6n 303
muestra 234

Resumen de"! capitulo 237

Terrninos para recordar 237


16 Potencia y eficiencia de una prueba estadistica 305
Ejercicios 237
16.1 Concepto de potencia 305
16.2 Calculo de la potencia: caso de una muestra 309
13 Inferencia estadistica con dos muestras independientes 243 16.3 Efecto del tarnafio de la muestra sobre la potencia 310
13.1 Distribucion muestral de la diferencia entre medias 243 16.4 Efecto del nivel ex sobre lapotencia 311
13.2 Estirnacion de a.v,-x, a partir de los datos muestrales 245 16.5 Efecto de la naturaleza de HI sobre la potencia 312
16.6 Pruebas pararnetricas versus pruebas no pararnetricas: potencia 312
13.3 Examen estadistico de hipotesis: la t de Student 246
16.7 Calculo de la potencia: caso de dos muestras 313
13.4 Estirnacion del grado de asociacion entre la variable experimental y la
16.8 Efecto de las medidas correlacionadas sobre la potencia 315
variable dependiente 248
16.9 Potencia, errores de los tipos I y II 316
13.5 EI cociente t y la homogeneidad de la varianza 250
16.10 Eficiencia de una prueba estadistica 316
Resumen del capitulo 251
Resumen del capitulo 317
Terrninos para recordar 252
Terrninos para recordar 318
Ejercicios 252
Ejercicios 318

14 Inferencia estadistica con muestras correlacionadas 259


17 Inferencia estadistica con variables categ6ricas 320
14.1 lntroduccion 25q
14.2 Error estandar de la diferencia entre medias para grupos correlacio­ 17.1 Introduccion 320
~m ~ 17.2 Prueba binomial 321
14.3 Metodo de la diferencia directa: el cociente t de Student 264 17.3 Calculo aproximado de valores binomiales mediante la curva normal 325
14.4 EI estadigrafo A de Sandler 267 17.4 La X2 en el caso de una variable 326
Resumen del capitulo 268 17.5 La prueba l de la independencia de variables categoricas 328
Terrninos para recordar 268 17.6 Limitaciones en el uso de la l 331
Ejercicios 268 Resumen del capitulo 333
Terrninos para recordar 333
IS Introducci6n al analisis de la varianza 276 Ejercicios \ 334

15.1 Comparaciones de varios grupos 276


15.2 EI concepto de sumas de cuadrados 277 18 Inferencia estadlstica con variables de escala ordinal 337
15.3 Obtencion de estimaciones de 1a varianza 282
18.1 Introduccion 337
15.4 Conceptos fundamentales del analisis de la varianza 283
18.2 La prueba U de Mann-Whitney 337
15.5 Un ejemplo que involucra tres grupos 284
15.6 Interpretacion de F 286 18.3 Pruebas no parametricas con muestras correlacionadas 342
18.4 Prueba del signo 342
15.7 Estimacion del grado de asociacion entre la variable experimental y la
18.5 Prueba del signo-rango de Wilcoxon para observaciones apareadas 343
variable dependiente 287
Resumen del capitulo 345
15.8 Analisis de la varianza cuando hay clasificacion doble: el diseiio
Terrninos para recordar 346
facto rial 288
Ejercicios 346
Resumen del capitulo 296

Terrninos para recordar 297

Ejercicios 297

Revision de la tercera parte. ESTADISTICA INFERENCIAL 349

B. Pruebas no parametricas de significaci6n 349


Revision de la tercera parte. ESTADISTICA INFERENCIAL 301

A. Pruebas parametricas de siqnificacion 301 Referencias 350


xvi ESTADiSTICA PARA LAS CIENCIAS SOCIALES

Apeodices 353
I. Repaso de rnatematicas basicas 355
II. Glosario de simbolos 362
III. Tablas 366
IV. Tratamiento de las distribuciones no normales 409 PRIMERA PARTE
V. Lista de formulas 416
VI. Glosario de terrninos
Respuestas a ejercicios seleccionados
420
427 Introducci6n
Iodice de materias 459
[3]

Definicion
1 de analisis estadistico

1.1 l Que es la estadistica?


Piense por un momenta en los miles de cosas increiblemente complejas que usted
hace en el curso de un dia, y asombrese luego de la maravilla que esto representa.
Usted es absolutamente unico. Nadie posee sus facciones, sus cualidades intelectua­
les, sus caracteristicas de personalidad ni su escala de valores. Sin embargo, como
miles de millones de otros de su especie, usted es el instrumento estadistico mas
sutilmente afinado y de mayor satisfaccion que hayan producido las fuerzas de la
naturaleza. Cada momenta de su vida da testimonio de su capacidad para cap tar,
integrar y procesar una enorme cantidad de datos captados por los sentidos y para
actuar luego instantaneamente, basandose en esa informacion, y generar toda una
gama de probabilidades relativas a los posibles comportamientos. Para ilustrar 10
dicho, imaginese que esta conduciendo en un trafico denso. Us ted apreciara
permanentemente las condiciones de la pista, observando la velocidad relativa de los
coches que la preceden, la posicion y la velocidad de aproximacion de los vehiculos
que van detras .y la presencia de automoviles en la proxima calle. Si usted es un
conductor atento, estara reuniendo permanentemente esta informacion descriptiva, a
menudo sin palabras 0 inconscientemente. Imagine luego que, sin previo aviso, el
coche que va delante frena subitamente, En un instante se vera obligado a actuar de
acuerdo con esta informacion estadistica previa. Puede frenar su automovil, virar a la
izquierda, girar a la derecha 0 rezar. Su mecanismo probabilistico le sefialara
instantaneamente varias formas de actuar alternativas: Si frena, l,cual es la posibili­
dad de que se detenga a tiempo? l,Esta el coche que le sigue a distancia suficiente para
evitar que choque con la parte posterior de su vehiculo? l,Puede evitar un accidente
girando hacia la calle de la izquierda 0 hacia ellado derecho de la pista? La mayor
parte de las veces es correcta la decision tomada basandose en los datos sensoriales.
A ello se debe que la mayor parte de nosotros lleguemos a alcanzar una edad
avanzada. En esta situacion, como en muchas otras durante el transcurso de la vida,
usted ha evaluado con precision las probabilidades y ha adoptado la decision
correcta. Y tomamos estas decisiones incontables veces en todos y cada uno de los
dias de nuestras vidas. Por esta razon, usted deberia considerarse a si mismo como
un excelente mecanismo de generacion de decisiones estadisticas, En este sentido, ya
es usted un estadistico,
4 ESTAOISTIcA PARA LAS CIENCIAS SOCIALES DEFINICI6N DE ANA.USIS ESTADISTICO 5

Recuadro 1.1
t,1970
. * 1900
1. NEUMONIA (TOOAS LAS FORMAS) 1. ENFERMEDADES DEL CORAZON

V GRIPE

2. TUBERCULOSIS (TOOAS LAS FORMAS) 2. CANCER V OTROS TUMORES


MALIGNOS
3. OIARREA. ENTERITIS V ULCERACION 3. ENFERMEDADES
DE LOS INTESTINOS CEREBROVASCULARES
4. ENFERMEDADES DEL CORAZON 4. ACCIDENTES

5. LESIONES INTRACRANEALES DE 5. GRIPE V NEUMONIA


ORIGEN VASCULAR
5. NEFRITIS (TODAS LAS FORMAS) 6. ALGUNAS ENFERMEDADES DE LA
PRIMERA INFANCIA
7. ACCIDENTES DE TODD TIPO 7. DIABETES MELLITUS

B. CANCER V OTROS TUMORES B. ARTERIOESCLEROSIS

MALIGNOS

9. SENILIDAO 9. CIRROSIS HEPATICA

10. OIFTERIA 10. BRONQUITIS. ENFISEMA Y ASMA

o 50 100 400
* 1940
(DECESOS POR CADA 100000 'HABITANTES)
1. ENFERMEDADES DEL CORAZON

2. CANCER V OTROS TUMORES

MALIGNOS

3. LESIONES INTRACRANEALES DE

ORIGEN VASCULAR

4. NEFRITIS (TODAS LAS FORMAS)

5. NEUMONIA (TODAS LAS FORMAS)

La estadistica es uno de los recursos de uso mas generalizado tanto en las ciencias del
Y GRIPE
comportamiento, como en las sociales, medicas y fisicas. Se reune informacion estadisti­
6. ACCIDENTES (EXCLUYENDO LOS

AUTOMOVILISTICOS)
ca de practicamente todos los aspectos de la vida. A menudo se hacen las observaciones
7. TUBERCULOSIS (TODAS LAS FORMAS) en momentos diferentes para que sea posible comparar los cambios a 10 largo del
B. DIABETES MELLITUS tiempo. Los datos que se presentan en las figuras ilustran el hecho de que desde
9. ACCIDENTES AUTOMOVILISTICOS comienzos de siglo las principales causas de muerte han cambiado dramaticamente,
10. NACIMIENTO PREMATURO
Observese, por ejemplo, que la neumonia y la tuberculosis fueron en 1900 las causas de
un gran numero de decesos, mientras que en 1970 se atribuyeron relativamente pocos
350 400
de ellos a esas mismas causas. Aunque no se muestra en las graficas, es interesante
(DECESOS POR CADA 100 000 HABITANTES)
sefialar el hecho de que la esperanza de vida se ha incrementado de 47 afios en 1900, a
71 afios en 1970.

• De «The Ills of Man». por J. H. Dingle. Copyright © 1973 por Scientific American. Inc. Todos los t De «Mortality for leading causes of death; U.S.», 1976. CA-A Cancer Journal for Clinicians, enero/Iebrero
derechos reservados. 1979, 29 (1).

En la vida diaria nuestro funcionamiento estadistico es de ordinario informal y l.Que es, entonces, la estadistica? Aunque seria practicamente imposible obtener
esta vagamente estructurado. Nos comportamos estadisticamente, aunque sin tener un consenso general ace rca de su definicion, es factible distinguir entre dos de sus
plena conciencia de las leyes formales de la probabilidad. definiciones.
En este curso intentaremos hacer conocer allector algunos de los procedimientos
empleados para recolectar y analizar datos y para tomar decisiones y hacer 1. A la estadistica se la considera frecuentemente como una coleccion de hechos
deducciones basadas en estos analisis. Ya que frecuentemente desarrollaremos los numericos expresados en terminos de proposiciones concisas, y que han sido
tern as en torno a sus experiencias previas, el lector se sentira casi siempre en un recopilados mediante varias observaciones, 0 a partir de otros datos numericos.
terreno familiar: «[Vaya, ahora resulta que he estado calculando medias aritmeticas Desde esta perspectiva, la estadistica constituye una coleccion de proposiciones tales
casi toda mi vida al determinar mi nota media en una asignatura 0 el promedio de Como: «El coeficiente intelectual (CI) medio de los niiios de 5.° de primaria es...», 0
goles de mi equipo favorito!», Si ellector recurre constantemente a sus conocimientos «Siete de cada diez personas prefieren la marca X ala marca Y», 0 «Los campeones
previos y relaciona las materias del curso con 10 que Ie es familiar en la vida diaria, la mundiales de futbol marcaron 15 goles en su ultima gira».
estadistica no tendra por que serle, y no 10sera, algo terrible tal como frecuentemente 2. La estadistica puede ser considerada tambien como un metodo para manejar los
se la describe. datos. Esta definicion destaca el punto de vista de que la estadistica es una
6 ESTADfSTICA PARA LAS CIENCIAS SOCIALES DEFINICION DE ANAuSIS ESTADfSTICO 7

herramienta para la recopilacion, organizacion y analisis de hechos nurnericos 0 de Muestra. Un subconjunto de la poblacion 0 universo.
observaciones.
Muestra aleatoria. Un subconjunto de la poblacion 0 universo seleccionado en
Esta segunda definicion es la que constituye el objeto de esta obra. forma tal que cada miembro de la poblacion tenga igual oportunidad de ser elegido.
Se puede hacer una distincion entre las dos funciones del metodo estadistico: las
tecnicas estadisticas descriptivas y las tecnicas estadisticas inferenciales 0 inductioas, Estadigrafo. Numero resultante de la manipulacion de los datos de la muestra de
El proposito principal de la estadistica descriptiva es el de presentar la informa­ acuerdo con ciertos procedimientos especificos. Para estimar el parametro referente a
~i6n en .una forma comoda, utilizable y comprensible. Por otra parte, la estadistica una poblacion usamos generalmente un estadigrafo que se calcula a partir de una
inferencial se ocupa de la generalizacion de esta informacion 0 en forma mas muestra; por ejemplo, para estimar la proporcion de democratas en la totalidad de la
especifica, de hacer deducciones acerca de las poblaciones basandose en muestras pcblacion de votantes se emplea una muestra de norteamericanos en edad de votar.
tomadas de elIas. Debe tenerse en cuenta que para cada estadigrafo que describe algun aspecto de una
Al describir las funcio.n.es de la estadistica han aparecido ya ciertos terminos que muestra existe un pararnetro correspondiente que describe el mismo aspecto de
pueden resultar 0 no familiares allector. Antes de ahondar en las diferencias entre la una poblacion. Asi, para el estadigrafo «media de una muestra» existe el parametro
e~ta~istica descriptiva y la inductiva, es importante aprender el significado de ciertos «media de la poblacion». Emplearernos letras cursivas (por ejemplo X, s) para
terminos que se emplearan reiteradamente a 10 largo del texto. representar estadigrafos muestrales. Asi, observando la notacion estadistica podernos­
distinguir entre muestras y poblaciones. En el texto se arnpliara 10 referente al
interesante problema del muestreo.

1.2. Definiciones de terrninos


Ejemplo. Imagine ellector que ha sido contratado como consultor estadistico por
el organismo gobernante de una gran ciudad. Su tarea es la de obtener informacion
corminmente usados en estadistica
estadistica acerca de un problema medico-psicologico que surgi6 en la pasada
decada y que es el de la drogadiccion en los recien nacidos. El tratamiento de estas
Variable. Cualquier caracteristica de una persona, medio ambiente 0 situacion inocentes victimas del abuso de las drogas requiere cierto equipo especializado y
experimental, que pueda variar de persona a persona, de un medio ambiente a otro, 0 supervision medica permanente. La tarea inmediata es la de estimar la extension y los
de una situacion experimental a otra. Asi, el peso, el CI y el sexo son variables, ya tipos de la drogadiccion neonatal, de modo que las diversas clinicasy hospitales de la
que toman valores diferentes al observar distintos individuos. Una variable es ciudad puedan tomar decisiones adecuadas ace rca del equipo y del personal
diferente de una constante cuyo valor no cambia, por ejemplo el numero pi. necesarios en el afio entrante. Como es usual, su presupuesto operacional y la
disponibilidad de ayudantes capacitados son limitados. Por tanto; no existe
Datos. Numeros 0 medidas obtenidos como resultado de observaciones, Pueden ninguna posibilidad de estudiar los registros medicos de todos los nifios nacidos el
ser recuentos (datos de frecuencias) tales como el numero de personas que manifies­ afio anterior. Todo 10 mas se podra seleccionar solamente una parte pequefia del
tan su ~refe~encia por el candidato liberal ala presidencia de la republica; 0 pueden total de registros y analizarlos a fondo. Estos registros seleccionados constituyen la
ser calificaciones, como las que se obtienen en las pruebas psicologicas 0 de muestra. Si se selecciona la muestra de modo que cada registro tenga la misma
examenes, A los datos de frecuencias se les llama tarnbien datos enumerativos 0 probabilidad de ser escogido, decimos que el proceso es una seleccion aleatoria. La
categoricos, variable de interes es el estado de drogadicci6n de cada neonato. Para nuestro
proposito supondremos que cada registro indica la presencia 0 la ausencia de
~oblaci6n 0 universe, Conjunto completo de individuos, objetos 0 medidas que drogadiccion, Los datos son los numeros de nifios drogadictos y no drogadictos en la
tienen alguna caracteristica cornun observable. Asi, todos los nifios nacidos en muestra. Cuando se manipulan los datos de acuerdo a ciertas reglas para producir
determinado afio pueden constituir una poblacion. Sin embargo, una poblacion una informacion resumida (tal como la proporcion de neonatos drogadictos), el valor
tambien puede ser un conjunto teorico de observaciones potenciales en vez de un numerico resultante constituye un estadiqrafo. La poblacion acerca de la cual nos
~(con~unto cornpleto». Por ejemplo, podemos ampliar la poblacion anterior para interesa hacer una generalizacion esta formada por todos los nifios nacidos en la
incluir a todos los nifios, independientemente de que hayan nacido 0 esten por nacer. ciudad ·durante el afio anterior. La «verdadera» proporcion de neonatos adictos en
la poblacion es el pararnetro (fig. 1.1). N6tese que es casi imposible lIegar a conocer el
Paflime~ro. Cualquier caracteristica medible de una poblacion; por ejemplo, la parametro, pues para hallario se requeriria examinar los registros medicos de todos
proporcion real de dernocratas inscritos entre todos los ciudadanos norteamericanos los nifios nacidos en la ciudad en el periodo de un aiio. Ya que este generalmente no
en edad de votar. En este texto seguiremos la practica generalmente aceptada de es posible por razones econ6micas y de otro tipo, es raro que se realice el estudio
emplear letras griegas (por ejernplo u, 0") para representar parametres que hacen exhaustivo de una poblacion, En consecuencia, casi nunca se conocen los pararne­
referencia a poblaciones. tros; pero, como veremos, se los suele estimar partiendo de muestras estadisticas.
8 ESTADfSTICA PARA LAS CIENCIAS SOCIALES DEFINICION DE ANALISIS ESTADfSTICO 9

/"""-----4l> DATOS segun su preferencia por determinados candidatos a cargos politicos), 0 bien datos de
• (estado de drcqadiccion de cada nino en la
• .. muestra) escala (pesos que contienen las cajas de un popular cereal para el desayuno, 0 los CI

" • • •
..
!ll
de un grupo de colegiales). En su forma original, es decir, tal como aparecen al ser
recopilados, estos datos son general mente un amasijo de marcas, conteos de
• '!l
••
• • • •• e • • •
EsTADlsTICA DEsCRIPTIVA

·
1/11
frecuencia, etc. Al realizar la funcion descriptiva el estadistico formula reglas y

.
(proporcion de nifios en la rnuestra nacidos
procedimientos para la pi esentacion de los datos en una forma mas util y signifi­
• .. .. • e • .. • "
con droqadiccidn)
a
cativa.
•• • • • • lIP Asi, establece normas para la representacion grafica de los datos. Tarnbien

• • • e • • EsTADlsTICA INFERENCIAL
(prcporcion estimada de ninos drogadictos formula reglas para eI calculo de diversos estadigrafos a partir de bloques de datos en
en la poblaclon total de neonatos en Ia bruto.
cludad)
Imaginemos que en su calidad de cientifico del comportamiento, el lector
proporciona algunos instrumentos de medida (por ejemplo pruebas de inteligenci'a,
inventarios de personalidad, pruebas de aptitud) a un grupo de estudiantes de
Fig. 1.1 Se selecciona una //lUestra aleatoria de alguna poblacion, Los puntos representan
secundaria. i,Que podra hacer con las medidas 0 punteos resultantes para cumplir las
todos los nacidos durante el afto, Los puntos grises representan la muestra. Los datos se
funciones descriptivas?
recopilan y resumen empleando la estadistica descriptiva. En la estadistica inferencial

intentamos estimar uno 0 mas parametros poblacionales (par ejemplo, Ja proporcion de

nifios drogadictos entre todos los recien nacidos en la ciudad).


1. Puede reordenar los punteos y agruparlos en varias formas para que sea posible
tener a primera vista una imagen global de los datos (capitulo 3, Distribucion de
frecuencias y tecnicas de representaci6n grafica»),
Es posible, por supuesto, definir una poblacion muy pequefia restringiendo la
definicion de la «caracteristica cornun observable» a algo asi como <dodos los 2. Puede construir tablas, graficas y figuras que permitan visualizar los resultados
estudiantes que asistieron hoy a la clase de Psicologia en el Colegio Pitzer». En este (secci6n 3.3, «Tecnicas de representacion grafica», en el capitulo 3).
caso el calculo de un parametro (tal como la nota media del grupo obtenida en el
examen efectuado hoy) no presenta dificultad alguna. Para poblaciones pequefias 3. Puede convertir los datos originales en formas que sean mas utiles para
como est a, no hay raz6n para seleccionar muestras y calcular estadigrafos mues­ prop6sitos especificos. Asi, puede transformar estas calificaciones en porcentajes,
trales. . calificaciones estandar 0 grados. En el texto se estudiaran tam bien otros tipos de
Desde el punto de vista del profesor, las observaciones acerca de los estudiantes conversion (capitulo 4, «Percentiles», y capitulo 7, «Desviacion estandar y dis­
en la clase de Psicologia en el Colegio Pitzer pueden ser de suma importancia. Sin tribucion normal estandar»),
embargo, tales poblaciones limitadas son de pequefio interes teorico. Generalmente,
en el afanoso mundo real, el cientifico del comportamiento est a interesado en 4. Puede calcular promedios para saber algo ace rca del rendimiento tipico de los
for~ular proposiciones de validez general sobre un amplio dominio y para ello debe estudiantes (capitulo 5, «Medidas de tendencia central»),
estimar el. ?animetro poblacional. Esta estimaci6n se basa en el estadigrafo que se
calcula utilizando la muestra. Asi, podriamos emplear las observaciones realizadas en 5. Tomando el promedio como punto de referencia, puede describir la dispersion de
los estudiantes del Colegio Pitzer como base para estimar los parametres de una las calificaciones respecto a este punto central. A los estadigrafos que cuantifican est a
poblaci6n mayor. dispersi6n se les llama medidas de variabilidad 0 medidas de dispersion (capitulo 6,
Vol vamos a las dos funciones del analisis estadistico con objeto de efectuar una «Medidas de dispersion»),
apreciacion mas intima.
6. Se puede obtener una relacion entre dos instrument os de medida diferentes. Al
estadigrafo usado para describir la magnitud de la relacion se Ie llama coeficiente de
correlacion. Tales coeficientes son de gran utilidad para el cientifico que se ocupa del
1.3 Estadistica descriptiva comportamiento. Por ejemplo, puede tratarse de determinar la relaci6n entre
inteligencia y calificaciones obtenidas, entre medidas de personalidad y aptitudes, 0
entre medidas de interes y de personalidad. Una vez establecidas est as relaciones, se
Cuando un cientifico del comportamiento dirige un estudio, suele recolectar una gran pueden emplear las calificaciones obtenidas con un instrumento de medida para
cantidad de informacion numerica 0 datos acerca del problema en cuesti6n. Los predecir el rendimiento en otro (capitulo 8, «Correlacion», y capitulo 9, «Regresion
datos pueden tomar diversas formas: datos de frecuencias (recuentos de votantes y prediccion»),
10 ESTADiSTICA PARA LAS CIENCIAS SOCIALES DEFINICI6N DE ANALISIS ESTADiSTICO 11

1.4 Estadistica inferencial interesantes temas de estudio ya que, virtualmente, tiene aplicaciones en -todas las
areas del quehacer humano y se relaciona con incontables campos del saber. H. G.
Para el cientifico del comportamiento, el trabajo comienza justamente al haber Wells, el profeta del siglo XIX, sefialo que «el pensamiento estadistico sera algun dia
completado la funcion descriptiva. De hecho, se esta mas cerca del comienzo que del tan necesario para el eficiente desenvolvimiento ciudadano como la facultad de leer y
fin de la tarea. La razor es obvia, si consideramos que el proposito de la investigacion escri bir».
es a menudo el de explorar hipotesis de naturaleza general y no simplemente el de Tengase constantemente presente esta idea. EI curso sera mucho mas intere­
comparar algunas muestras limitadas. sante y provechoso si el lector desarrolla el habito de «pensar estadisticarnente».
Imaginemos que interesa determinar los efectos de cierta droga sobre la capaci­ Procurese siempre aplicar los conceptos estadisticos a todas las actividades dia­
dad para realizar un trabajo que requiere coordinacion psicomotora. En consecuen­ rias sin importar cuan rutin arias puedan ser. AI detenerse en un cruce de calles por
cia, se prepara un estudio que incluya dos situaciones: una experimental y otra de el que pasa frecuentemente, observe ellector el tiempo que permanece en rojo la luz
control. Se suministra la droga a los sujetos experimentales en periodos especificos del semaforo. Obtenga alguna estimacion de la duracion de la luz verde. Si la luz roja
de tiempo antes de empezar la tarea que sirve de criterio. Para excluir los «efectos de dura tres minutos y la luz verde dos, cabe esperar que al lIegar al cruce la
placebo» se suministra a los sujetos de control una pildora que contiene ingredientes probabilidad de encontrar luz roja sea de tres a cinco. Corniencese a coleccionar
mertes, Despues de que todos los sujetos hayan sido sometidos a la prueba, se efectua datos. Se encuentra la luz roja el 60 ~/~ de las veces como era de esperar. Si no es
la funcion descriptiva y se encuentra que «por terrnino medio» los sujetos experimen­ asi, locual es la razon? Quizas se haya hecho inconscientemente algun ajuste en la
tales no actuaron tan bien como los sujetos de control. En otras palabras, la media manera de conducir el automovil con el fin de modificar las probabilidades esta­
aritmetica de los datos del grupo experimental resulta menor que la del grupo de disticas.
control. En consecuencia, se plantea la pregunta: loCabe deducir que la droga Un concepto erroneo mantenido por los profanos en estadistica es el de que esta
produjo la diferencia entre los dos grupos? 0 bien, de forma mas general, loPuede es simplemente un metodo sofisticado de fabricar mentiras 0 falsear nuestras
asegurarse que la droga produce un efecto adverso sobre la realizacion de la tarea descripciones de la realidad. Los autores no niegan que algunas personas carentes de
que sirve de criterio en la investigacion? Para responder a estas preguntas no basta escnipulos empleen la estadistica para esos fines. Sin embargo, tales usos de la
contar con la estadistica descriptiva. estadistica son vituperados por el cientifico del comportarniento, quien tiene como
. Puede decirse: «Des~ues de todo, incluso si la droga careciera de efecto, seria muy meta el establecimiento de la verdad. De vez en cuando se aludira a las diversas
Improbable que las medias de los dos grupos resultasen identicas, Alguna diferencia tecnicas empleadas para falsificar resultados sirviendose de la estadistica, Nuestro
se habria observado», La intervencion de variables incontrolables (Ilamadas a veces proposito, empero, no es el de instruir a nadie en estas tecnicas, sino prevenir contra
en forma imprecisa «factores de azar» producira, sin duda alguna, disparidad entre el intencionado mal uso del analisis estadistico, de modo que una persona no Ilegue
las medias de los grupos. La pregunta crucial, desde el punto de vista de la estadistica inadvertidamente a «decir una mentira», y este capacitado para saber cuando otros
inferencial, sera: loEs la diferencia suficientemente grande como para descartar ·Ia la dicen.
variacion incontrolada en el experimento como una explicacion suficiente? Dicho en Cuando el lector yea publicada alguna informacion estadistica, desarrolle ante
otra forma, si repitiesemos el experimento, l,podriamos predecir con seguridad que ella una saludable actitud de escepticismos. Formule siempre algunas preguntas
la misma diferencia (0 sea, que la media del grupo de control resulta mayor que la pertinentes.
media del grupo experimental) se presentara sistematicarnente? Si una revista envia una atractiva periodista para entrevistar a diez especia­
Tan pronto como surgen estas preguntas, nos introducimos en el area fascinante listas en dietas alimenticias y recibe de cada uno de ellos una prescripcion
del analisis estadistico conocida como estadistica inductiva 0 inferencial. Como el innecesaria, no concluya inmediatamente que todos los especialistas cometen fraude.
lector vera despues, la mayor parte de esta obra esta dedicada a los procedimientos lamas diga: «Despues de todo, diez sobre un total de diez es una proporcion muy
que emplea el investigador para lograr conclusiones que se extiendan mas alla de las alta», negandose a realizar mas indagacion, Pregunte en que forma se obtuvo la
muestras estadisticas mismas. muestra. loFue aleatoria, 0 es posible que los especialistas fueran seleccionados
basandose en una informacion previa de que eran descuidados en su practica
profesional? Pregunte constantemente, pero reserve el juicio hasta obtener las
respuestas.
1.5 Una advertencia al lector Observe la publicidad de la television, lea los anuncios del periodico. Cuando el
locutor asegure: «Este producto es mas eficaz», preguntese, «lomas eficaz que cual?
loQue prueba se tiene de ello?»,
EI estudio de la estadistica no tiene por que convertirse en una serie de ejercicios Si se hace del pensamiento estadistico un habito cotidiano, no solo se encontrara
progresivos de calculos tediosos. Si nos acercamos a ella con la actitud mental que el estudio de la estadistica resulta mas interesante, sino tarnbien que el mundo
adecuada, encontraremos que la estadistica puede constituir uno de los mas en que se vive parecera diferente y quizas mas atractivo.
12 ESTADfSTICA PARA LAS CIENCIAS SOCIALES DEFINICION DE ANALISIS ESTADfsTICO 13

Resumen del capitulo b) Basandose en una muestra aleatoria de 250 asalariados de Campolandia, se cree que
el ingreso medio de todos los asalariados en esta ciudad es aproximadamente de
145000 pesos.
En este capitulo se ha establecido la diferencia entre dos definiciones del analisis c) EI proyectil de un rifle calibre 0.22 puede lIegar a la distancia de 1.6 kilometres.
estadistico: una que presenta a la estadistica como una coleccion de hechos d) Este afio mis gastos por ensefianza fueron de 45 800 pesos.

nurnericos, y otra que la describe destacando su caracter de metodo 0 herrarnienta e) EI programa especial de television emitido el lunes ultimo fue visto por 23 500 000

para la recoleccion, organizacion y analisis de los hechos numericos. Hacia la segunda personas.
definicion esta dirigido el contenido de esta obra.
2. Muchas poblaciones estudiadas en condiciones experimentales son te6ricas. Dense
Se distinguen dos funciones del rnetodo estadistico, la descriptiva y la de analisis
algunos ejemplos de poblaciones teoricas que puedan presentarse en la investigacion,
estadistico inferencial. La prirnera se refiere a la organizacion y presentacion de datos
en una forma cornoda, util y de facil comunicacion. La segunda se orienta hacia el 3. Indiquese en cada uno de los casos siguientes si se trata de una variable 0 de una:
problema de lograr generalizaciones amplias e inferencias, tratando de obtener constante:
informacion sobre una poblacion a partir de los datos de una muestra. a) Numero de dias del mes de agosto.

Se definieron algunos terrninos empleados en el analisis estadistico. b) Numero de acciones negociadas en la Bolsa de Buenos Aires en varios dias del afio,

Finalmente se sefialo que, con frecuencia, se emplea la estadistica para «decir c) Edad de los estudiantes de primer afio de una universidad.

rnentiras». Estas practicas van en contra de nuestro objetivo de encontrar una base d) Tiempo requerido para completar un ejercicio.

de hechos reales que sirva para establecer nuestras conclusiones y decisiones e) Edad en que una persona adquiere el derecho a votar en unas elecciones generales.

r) Calificaciones obtenidas en un examen que contiene 100 preguntas.

apoyadas en la estadistica. Sin embargo, el lector debe estar al tanto de las tecnicas
g) Maxima calificaci6n posible en el examen anterior.

usadas para mentir estadisticamente, evitando asi que Begue a «mentir» inadvertida­ h) Cantidad de dinero gastada anualmente en libros por estudiantes.
mente, adquiriendo adem as la capacidad de reconocer cuando alguien miente de esta
forma. 4. El profesor Norman Yetman de la Universidad de Kansas esta investigando la posible
Con los terrninos 0 concept os nuevos que se introduzcan en un capitulo se hara discriminaci6n econ6mica contra los atletas de color por parte de los medios de comunica­
ci6n*. Con ese fin analiz6 las oportunidades que tienen de figurar en anuncios comerciales,
una relacion que figurara al final del mismo y tarnbien un glosario de terrninos (pags,
hacer apariciones como invitados en television y obtener trabajos fuera de la temporada
420 a 426). Algunos de estos terrninos se definiran con mayor precision en otros deportiva. Dos de sus constataciones son las siguientes:
capitulos y, en consecuencia, podran volver a aparecer. a) De 351 anuncios comerciales relacionados con acontecimientos deportivos de Nueva
York, en el otofio de 1966, aparecieron atletas negros solamente en 2 de ellos.
b), Un analisis de las oportunidades que tuvieron los integrantes de un equipo profesio­
nal de futbol en los medios de publicidad en 1971 revel6 que en una muestra de 11
Terminos para recordar blancos, 8 tuvieron una oportunidad, pero en cambio solamente 2 de 13 atletas
negros tuvieron una oportunidad analoga,
datos muestra Indiquese si estos ejemplos proporcionan parametres, datos 0 inferencias estadisticas.
5. Los comentarios de futbol suelen presentar tablas como la siguiente:
estadigrafo muestra aleatoria
estadistica parametro EQUIPO A EQUIPO B
estadistiea descriptiva poblacion 0 universo
Goles 3 2
estadistica inferencial 0 inductiva variable Tiros en areo 12 9
Tiros Iibres 7 5
Tiros indireetos 2 4
Tiros de esquina 3 3
Saques laterales B 6
Posicion adelantada 1 4
Tarjetas amarillas o 2
Ejercicios
i,Son estadigrafos estos numeros? Si no es asi, i,que son?
1. Indiquese en cada uno de los casos siguientes si se trata de un estadigrafo, un dato 0 una
inferencia estadistica. Los ejercicios 6 all se basan en 10 siguiente: Imaginese una firma industrial comprometida en
la producci6n de articulos metalicos para la industria espacial. Entre sus productos hay
a) Una muestra de 250 asalariados en Campolandia sefialo un ingreso per capita de
14460 dolares. • Tornado de: Gary Lehman, escritor deportivo de la AP, 22 de agosto de 1975.
[15]
14 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

Conceptos matematicos
tornillos para los cuales existen estrechos margenes de tolerancia respecto a la anchura. Como
una parte de los procedimientos de control de calidad, se selecciona cierto numero de tornillos
de la produccion diaria y se los mide cuidadosamente.
6. Los tornillos seleccionados para su estudio constituyen: (a) la poblacion, (b) un
estadigrafo, (c) un parametro, (d) la muestra.
2 fundamentales
7. Las anchuras de todos estos tornillos constituyen: (a) un estadigrafo, (b) una variable,
(c) un pararnetro, (d) la muestra.
8. La medida de cada tornillo constituye: (a) un dato, (b) la muestra, (c) un estadigrafo, (d) la
poblacion,
9. La anchura promedio de los tornillos de la muestra constituye: (a) un parametro, (b) un
,estadigrafo, (c) una variable, (d) un dato.
10. :i,~e desea generalizar el resultado obtenido mediante la muestra para ampliarlo a: (a) el
2.1 Introduccion
dato.Tb) la variable, (c) el estadigrafo, (d) la poblacion.
«Yo no estoy muy fuerte en maternaticas, ~Como podria en estas condiciones
11. La anchura media de todos los tornillos producidos en un dia constituye: (a) el
aprabar estadistica?» Los autores de este libra han escuchado tales palabras de
parametro, (b) la variable, (c) el dato, (d) la poblacion,
labios de gran numero de estudiantes. Para muchos de ellos esta es una preocupacion
legitima, basada en experiencias desalentadoras que han tenido previamente con las
matematicas. Una breve ojeada a este libra podria tan solo servir para aumentar esta
\ansiedad, puesto que a primera vista muchas de sus formulas dan la impresion de ser
verdaderamente indescifrables para el principiante y pueden parecerle imposibles de
dominar. Por tanto, es muy importante aclarar bien las cosas desde un principio.
El lector no necesita ser un genio matematico para dominar los principios
estadisticos presentados en esta obra. El caudal de conocimientos matematicos
, necesario para dominar los fundamentos de la estadistica ha sido frecuentemente
exagerado. En realidad, 10 que se requiere para aprender estadistica es tan solo una
buena dosis de calculo aritmetico, logica y teson para no pasar un punta hasta
haberlo dominado por completo. Segun Carlyle, el exito en el aprendizaje de la
estadistica depende de po seer una capacidad ilimitada de paciencia. Aparte de estos
modestos requisitos, solo se precisa un conocimiento adecuado de diversos procedi­
mientos algebraicos y aritrneticos que la mayo ria de los estudiantes aprenden en el
transcurso de su bachillerato. En este capitulo se revisa la gramatica de la notacion
matematica, se discuten varios tipos de escalas numericas y se adoptan ciertas reglas
para el redondeo de numeros.
El estudiante que desee repasar sus conocimientos matematicos elementales
puede acudir al apendice I, que contiene una revision de los conceptos necesarios
para dominar este texto.

2.2 La gramatica de la notaci6n matematica


A traves del libra iremos encontrando nuevos simbolos matematicos. La mayor
parte se definiran cuando aparezcan por primera vez. Sin embargo, nay en esa
simbolizacion tres notaciones que, por aparecer con mucha frecuencia, queda
16 ESTADISTICA PARA LAS CIENCIAS SOCIALES CONCEPTOS MATEMATICOS FUNDAMENTALES 17

justificado que sean tratadas ahora por separado. Estas notaciones son: L (lease
Recuadro 2.1 sigma), X y N. A la vez que definimos estos simbolos e indicamos el modo de
utilizarlos, revisemos 10 que denominaremos gramatica de la notacion matematica.
ENTREVISTADOS AFIRMATIVO NEGATIVO SIN OPINION
No es sorprendente descubrir que muchos estudiantes se yen tan atrapados por la
% % % marana de simbolos matematicos, formulas y operaciones, que no llegan a darse
cuenta de que las matematicas tienen una forma de gramatica similar a la del
Blanco 88 8 4
lenguaje hablado. En efecto, las matematicas tienen sus sustantivos, adjetivos, verbos
Ne~ro 77 18 5
y adverbios.
Menos de 30 afios 96 3 1
Sustantivos maternatic os, Comunrnente se emplean en matematicas simbolos para
Mas de 30 afios 82 12 6
representar cantidades. La notacion que utilizaremos con mayor frecuencia en
estadistica para representar una cantidad (0 resultado) es X, aunque ocasionalmente
Ingreso familiar anual

Menos de 15 000 d61ares 72 20 8


usaremos tarnbien Y. Ademas, X e Y se usan para identificar variables; por ejemplo,
Mas de 15 000 d61ares 95 5
si el peso y la estatura fueran dos variables a estudiar, se podria usar X para
representar el peso e Y para la estatura. Otro «sustantivo» utilizado con frecuencia
ProtestanteT 86 9 4
es el simbolo N, que representa el numero de cantidades que estamos manejando.
Cat6lico 83 12 5
Asi, si tenemos diez cantidades,
JudioT 98 0 3

Sin religi6nT 95 6 0

N = 10.
Republicano 88 7 5

Dem6crata 84 12 4

Independiente 89 8 3
Adjetivos matematicos, Cuando queremos modificar un sustantivo matematico
para identificarlo con mayor precision, empleamos cornunmente subindices. Por
Noreste 85 11 4
tanto, si tenemos una serie de observaciones 0 resultados, podemos representarlos
Sur 85 10 5

88
como X l' X 2' X 3' X 4' etc. Tarnbien hallaremos frecuentemente la expresion Xi' en la
Norte central 8 4

Oeste 88 9 3
que el subindice puede tomar el valor que deseemos.
Verbos matematicos. Las notaciones que encaminan allector a efectuar algo tienen
Todos 87 9 4
las mismas caracteristicas que los verbos en el lenguaje cornun. Uno de los «verbos»
* Porcentaje menor que 0.5.
mas importantes es el simbolo L al cual nos hernos referido anteriormente. Esta
t En alqunas categorias. los porcentajes no suman exactamente 100. Esto se debe a

pequenos errores de redondeo.


notacion nos indica que debemos sumar todas las cantidades u observaciones que
siguen al simbolo. Asi,

Muchos de los datos recopilados en las ciencias sociales y del comportamiento


provienen de recuentos, 0 sea, numero de personas pertenecientes a diversas categorias.
Para describir tales datos se usan frecuentemente porcentajes y proporciones. Las indica que debemos sumar todas estas cantidades desde Xl hasta X 5' Otros «verbos»
encuestas de opini6n acerca de varios aspectos representan una de las muchas que encontraremos frecuentemente son J,que nos lleva a extraer la raiz cuadrada,
aplicaciones de la tecnica del «recuento». y los exponentes (XQ) que nos dicen que hemos de elevar una cantidad a la potencia
La tabla adjunta presenta los resultados de una encuesta realizada con mas de 1700 indicada. A los verbos maternaticos se les conoce cornunmente como operadores.
hombres y mujeres de 16 afios 0 mas. A todos se les formul6 la siguiente pregunta:
«j,Piensa usted que el gobierno debe proporcionar informaci6n acerca del control de la Adverbios matematicos, Estas son notaciones que, como en el lenguaje cotidiano,
natalidad a todos los hombres y mujeres que 10 deseen?», . modifican los verbos. Veremos con frecuencia que los simbolos de suma es­
tan modificados por notaciones adverbiales. Imaginemos que vamos a indicar que
Lipson, G., y W. Solman, "Polling Americans on birth control and population», Family Plallllillg las siguientes cantidades deberan ser sumadas:
Perspectives, enero 1972, 4 (I), 39-42. (La tabla I aparece en la pag, 39.) Reimpreso con permiso de Family
Planning Perspectives, vol. 4, ruirn. I, 1972.
18 ESTADISTICA PARA LAS CIENCIAS SOCIALES CONCEPTOS MATEMATICOS FUNDAMENTALES 19

Simbolicamente representamos esta operacion de la manera siguiente: Asi, si c = 5 y Xl = 2, X 2 = 3, X 3 = 4,


N

I CXi = (5)(2) + (5)(3) + (5)(4) = 45.


i= 1

Las notaciones colocadas abajo y arriba del simbolo de suma sefialan que i Tambien,
tomara sucesivamente los valores 1, 2, 3, 4, 5, ... hasta N. La notacion indica que se N

han de sumar todas las cantidades de X empezando en i = 1 (que es Xl) y


prosiguiendo hasta i = N (que es X N ) .
C I
i= 1
Xi = 5(2 + 3 + 4) = 45.

Algunas veces esta forma de notacion puede decirnos que debemos sumar Generalizacion 3. La suma de los oalores de una variable mas una constante es igual a
unicamente cantidades seleccionadas; asi, la suma de los ualores de la variable mas N veces esa constante. Simbolicamente,
5 N N

I Xi = X 2 + X3 + X4 + x ; I (Xi + c) = I Xi + Nc.
i=2 i= 1 i= 1

Imaginemos una muestra en la que N = 3 y Xl = 3, X 2 = 4 y X 3 = 6. La suma


de los tres valores de la variable se puede indicar por

2.3 Reglas de la sumatoria N

IX;=X 1 + X2 + X 3
i= 1
EI simbolo sumatorio es uno de los operadores de mayor uso en estadistica, = 3+4 + 6.
Resumamos algunas de las reglas que rigen el empleo de este simbolo.
Para representar la suma de los valores de una variable cuando se ha sumado una
Generalizacion 1. La suma de N term inas de valor constante es igual a N veces esa constante (c = 2) a cada uno de ellos, escribiremos
constante. Simbolicamente, N
N I (Xi + c) = (3 + c) + (4 + c) + (6 + c)
Ic=Nc. i= 1
i= 1 = 3+4 + 6 + (c + c + c)
Sea c una constante. Entonces, si c = 10 y N = 5, = 3 + 4 + 6 + (2 + 2 + 2)
= 13 + 3c = 13 + 3(2)
N
= 19.
I c = (10 + 10 + 10 + 10 + 10) = 5(10) = 50.
i= 1 Generalizacion 4. La suma de los valores de una variable menos una constante es igual
a la suma de los valores de la variable menos N veces esa constante. En sirnbolos,
Analogamente, si X es la constante y X= 20, N = 15,
N N

N I(Xi-c)= IXi-Nc.
I
i= 1
X = NX = (15)(20) = 300. i= l i= 1

Para representar la suma de los valores de una variable cuando se ha restado una
Constante a cada uno, hagamos Xl = 3, X 2 = 4, X 3 = 6 y c = 2.
Generalizacion 2. La suma de los productas de una constante por cada uno de los N
valores de una variable es igual a la suma de los valores de la variable multiplicada por
la constante. Simbolicamente,
I
i= 1
(Xi - c) = (3 - c) + (4 - c) + (6 - c)

N N = 3 + 4 + 6 - (c + c + c)
IcXi=c I Xi. = 3 + 4 + 6 - 3c
i= 1 i= 1 = 13 - 3(2) = 7.
20 ESTADisTICA PARA LAS CIENCIAS SOCIALES CONCEPTOS MATEMATICOS FUNDAMENTALES 21

Ejemplo. Estas generalizaciones son a menudo utiles en estadistica, en particular no tiene sentido sumarlos, restarlos, multiplicarlos 0 dividirlos. Ejemplos adicionales
cuando se trata de sumar cantidades con grandes valores numericos; por ejemplo a los anteriormente mencionados pueden ser el numero de serie de un aparato
electrodornestico, el mimero del apartado postal, el numero del telefono, el mimero
Xl = 100465, X 2 = 100467, X3 = 100469, X4 = 100472. de la casa, el numero de matricula del autornovil y la clave de un libro de la
biblioteca.
Para sumar estos cuatro numeros, se puede restar 100000 de cada uno, sumar los Lo importante de sefialar es que los numeros se usan de varias formas para lograr
resultados y afiadir despues 4 veces 100000. Se tiene muchos objetivos diferentes. Muchas veces estos objetivos no incluyen la representa­
cion de una cantidad. De hecho, hay tres formas fundamentales distintas de utilizar
4

I
i=1
Xi = 465 + 467 + 469 + 472 + 4(100 000)
los numeros:
1. Para designar inumeros nominales).
= 1873 + 400000 2. Para representar la posicion en una serie inumeros ordinaless.
= 401873.
3. Para representar una cantidad inumeros cardinales).
Medir es asignar numeros a objetos 0 sucesos de acuerdo con un conjunto de
reglas predeterminadas (0 arbitrarias). Los diferentes niveles de medida que estudia­
2.4 Tipos de mimeros y de escalas remos representan distintos niveles de informacion numerica contenida en un
conjunto de observaciones (datos) tales como: una serie de numero de casas, el orden
Antropologos, psicologos y sociologos han llamado la atencion repetidas veces de llegada en una carrera de caballos, un conjunto de calificaciones de CI 0 el precio
acerca de la tendencia del hombre a explorar el mundo que esta mas alejado de sus por accion de varios valores bursatiles. El tipo de escala obtenida depende de las
experiencias primarias, antes de investigar 10 que Ie es mas proximo. Asi, mientras clases de operaciones matematicas que se pueden efectuar legitimamente con los
indaga las estrellas lejanas, describiendo con sorprendente exactitud sus movimien­ numeros,
tos aparentes y sus interrelaciones, ignora muchas cosas sobre la sustancia que Ie En las ciencias sociales se dan casos de mediciones en todos estos niveles.
permite vivir, el aire que inhalamos y exhalamos mas de cuatrocientos millones de Debe sefialarse que hay otros criterios para clasificar los mimeros y las formas de
veces al afio. De acuerdo con la experiencia de los autores, algo semejante sucede a utilizarlos. En esta obra se usa la clasificacion nominal-ordinal-cardinal porque se
los estudiantes en relacion con el manejo de los mimeros y el concepto que tienen de adapta mejor a los tipos de datos que obtenemos en las ciencias del comportamiento.
ellos. Como se vera, contamos, colocamos en posicion relativa y obtenemos calificaciones
En nuestra civilizacion occidental, tan orientada hacia 10 cuantitativo, la ma­ cuantitativas. Debe notarse tam bien que la asignacion a categorias no siempre es
yoria de los estudiantes emplean y manipulan numeros mucho antes de que sean tajante y sin ambiguedades. Hay casos en que los expertos no se ponen de acuerdo.
cap aces de calcular el promedio de aciertos en el tiro a gol de su jugador favorito. No Para ilustrar este punto, preguntemos: l,Es el mimero de su casa nominal u ordinal?
obstante, pidales que definan un numero 0 que describan las maneras en que se La respuesta depende de las propias necesidades. En ciertos casos se Ie puede
emplean los numeros, y encontrara en ellos expresiones de sorpresa y desconcierto. considerar nominal, tal como ocurre cuando se 10 usa como nombre de un
Es posible que respondan: «Nunca se me ocurrio antes pensar en ello». Despues domicilio.
de un os cuantos minutos de profunda reflexion, probablemente digan algo acerca de Otras veces se Ie puede considerar ordinal, ya que los numeros colocan a su
que los numeros son simbolos que denotan cantidades de cosas que se pueden sumar, casa en una posicion relativa respecto a otras casas de la manzana. Asi, 8 puede
restar, multiplicar y dividir. Todos estos son conceptos artimeticos familiares, pero estar a la izquierda de 12 y a la derecha de 4.
~agotan todos los usos posibles de los numeros? Con el riesgo de sumir a nuestros Los requisitos fundamentales de la observacion y de la medida son reconocidos
estudiantes en una total confusion, se Ie podria pregun tar: «~Es un numero de este por todas las ciencias fisicas y sociales y tarnbien por cualquier empresa moderna
tipo el simbolo 7 que lleva un jugador de futbol en su camiseta? ~Que puede decir mteresada en mejorar su posicion competitiva. A las cosas que observamos se las
acerca del numero de su casa? ~Y del canal 2 de su receptor de television? ~Indican llama frecuentemente variables 0 variantes. A cualquier observacion particular se la
estos numeros cantidades de cosas? ~Seria razonable sumarlos, restarlos, multiplicar­ denomina valor de la variable. Veamos dos ejemplos: Si se trata de estudiar el precio
los 0 dividirlos? lPodria usted multiplicar el numero que lleva en la espalda cualquier de las acciones en la Boisa de Nueva York, nuestra variable es el precio. Asi, si el
jugador de futbol por cualquier otro numero y obtener un valor con algun precio de venta de una accion es 8!, el valor de la variable es 8.50 dolares, Si
significado?», Un analisis cuidadoso de nuestro uso de los numeros en la vida diaria interesa determinar si una cierta empresa discrimina basandose en consideraciones
revela un hecho muy interesante: la mayo ria de los mimeros que empleamos no raciales, la variable es entonces la clasificacion racial de los empleados. Esta variable
poseen las propiedades aritmeticas que ordinariamente les atribuimos; esto es, puede tener varios valores tales como negro, hispano y blanco.
22 ESTADiSTICA PARA LAS CIENCIAS SOCIALES CONCEPTOS MATEMATICOS FUNDAMENTALES 23

Recuadro 2.2

Datos imaginarios que muestran el nurnero de hombres y mujeres que postula­

ron a cargos docentes en varias categorias, el mimero de personas admitidas y el

porcentaje correspondiente*.

CATEGORIA
DEL HOMBRES MUJERES
TRABAJO: N." DE N." % N." DE N." %
PROFESOR POST. ADM. ACEP. POST. ADM. ACEP.

Grados 13-14 150 30 20 40 16 40


Grades 11-12 200 70 35 50 35 70
Grados 9-10 100 15 15 50 15 30
Grados K-8 50 2 4 600 48 8
Total 500 117 23 740 114 15

Una forma muy cornun de presentacion de datos es la que se obtiene por la tecnica del cada categoria, el porcentaje de mujeres admitidas fuera el doble que el porcentaje de
«recuento», que consiste en registrar el numero de individuos, objetos u observaciones hombres admitidos. A pesar de ella, cuando se hacen los calculos con los totales resulta
comprendidos en las diversas categorias. Para dar mayor sentido a estos datos es usual que el porcentaje general de hombres admitidos (23 %) es mayor que el de mujeres (15 %).
convertir los recuentos en proporciones 0 porcentajes. Sin embargo, en ciertas circuns­ ~Como es posible llegar a esta especie de prestidigitacion numerica? Muy sencillo. Si
tancias, tales porcentajes pueden ocasionar confusion 0 error. se examina la tabla nuevamente, se encontrara que la mayor parte de las aspirantes
Lo que sigue es un fragmento de Winning with Statistics que ilustra el problema de ferneninas, 600, fueron para cargos de los grados K a 8. Inversamente, hubo muy pocos
los «porcentajes paradojicos», aspirantes masculinos para esos cargos. Resulta que el numero de vacantes para los
Vamos a presentar algunos datos imaginarios en los que la proporcion de mujeres grados K a 8 es el mas pequefio. Lo que se tiene, entonces, es una situacion en la que
admitidas en cada categoria de trabajo es realmente mayor que la proporcion de una abrumadora mayoria de las mujeres aspiraron a cargos «dificiles de obtener», Por
hombres admitidos en cada una de estas categorfas. Sin embargo, cuando se combina otra parte, la mayor parte de los hombres aspiraron a cargos donde ~I numero de
sobre todas las categorfas las proporciones de hombres y mujeres admitidos, se vacantes era mayor. Al combinar todas las categorfas en las que hay diferentes numeros
encuentra, como por arte de magia, que a las mujeres les corresponde una proporcion de solicitantes, para las diferentes posiciones, el porcentaje mas bajo de mujeres en el
general mucho menor de admisiones. Asi, si se observara las cifras totales se llegarfa grupo K-8 es totalmente desfavorable para las profesoras. ~Por que? Mas del 80 ~~ de
inexorablemente a la conclusion de que hay discriminacion en contra de las mujeres. Sin las profesoras solicitaron precisamente los cargos donde el numero de vacantes era
embargo, si se examinara la misma prueba categorfa por categorfa se llegarfa precisa­ extremadamente bajo en relacion con el numero de aspirantes.
mente a la conclusion opuesta, 0 sea, que hay discriminacion en contra de los hombres. De aqui se deduce una moraleja. Es mejor aspirar a un cargo donde pocos son los
Observense los datos de Ja tabla anterior. llamados pero muchos (relativamente hablando) los escogidos, que pretender ser
Examinemos cuidadosamente la tabla. Se prepare a proposito de modo que, en admitido donde muchos son los llamados pero pocos los escogidos.
-.Runyon, R. P., Wi""ing with Statistics. Addison-Wesley. Reading, Mass., 1977.

2.4.1 Escalas nominales hem bras expuestas a la radiacion atomica durante el embarazo, el sexo seria la
variable a determinar. Hay solamente dos valores posibles de esta variable: macho y
Cuando se trata de mediciones, la mayor parte de las personas imaginan, probable­ hem bra (se descarta una imprevista mutacion capaz de producir un tercer sexo). Si se
mente, costosos e increiblemente complejos instrumentos que ciertos hombres utilizara una computadora para analizar los resultados, podriamos asignar un
extraordinarios, con batas blancas, manipulan para obtener medidas precisas de la numero a cada valor de la variable. Asi, al sexo masculino se Ie podria asignar un cero
variable en estudio. La realidad, sin embargo, muestra que no todas las medidas y al femenino un uno. Nuestros datos consistirian en e1 numero de observacio­
requieren tal precision. Si se tratara de estudiar el sexo de la descendencia de ratas nes en cada una de estas dos c1ases. Notese que no pensamos en que esta variable
24 ESTADfsTICA PARA LAS CIENCIAS SOCIALES CONCEPTOS MATEMATICOS FUNDAMENTALES 25

pueda dar lugar a una serie ordenada de val ores, como ocurre con la estatura, el 2.4.3 Escala de intervalos y de cocientes 0 razones
peso, la velocidad, etc. Un organismo femenin no tiene un valor mayor de la
variable, el sexo, que un organismo masculino. Finalmente, el nivel mas alto de las medici ones cientfficas se obtiene por medio de
Las observaciones de variables no ordenadas constituyen un nivel de medida escalas que emplean numeros cardinales iescalas de intertalos J' de razones). Los
muy bajo y corresponden a una escala nominal de medida. Como hemos visto, es valores nurnericos asociados con estas escal as son efectivamente cuantitativos y, por
posible asignar valores numericos para representar las diferentes cIases en una escala tanto, permiten el uso de operaciones aritrneticas tales como suma, resta, multiplica­
nominal, pero estos numeros no tienen propiedades cuantitativas y sirven unicamen­ ci6n y divisi6n. En las escal as de interval os y de razones las diferencias iguales entre
te para identificar las cIases. punt os de cualquier parte de la escal a son iguales entre si. Asi, la diferencia entre 4
Los datos empleados con las escalas nominales consisten en conteos de frecuen­ metros y 2 metros es igual a la diferencia entre 9231 y 9229 metros.
cias 0 tabulaciones del numero de sucesos en cada cIase de la variable en estudio Como se recorda-a, al tratar con escalas ordinales no podemos asegurar que la
(vease el recuadro 2.2). En el estudio mencionado anteriormente, ace rca de las ratas diferencia entre el primer lugar y el segundo sea igual a la diferencia entre el segundo
sometidas a radiaci6n, el numero de machos y de hembras en la descendencia y el tercero.
constituirian los datos. Tales datos reciben indistintamente el nombre de datos de Hay dos tipos de escal as que se basan en los numeros cardinales: la de intervalos
[recuencias, datos enumeratioos, datos de atributos 0 datos de categoria. Las unicas y la de razones. La escala de intervalos se diferencia de la de razones en la posici6n
relaciones matematicas adecuadas a las escalas nominales son las de equivalencia (=) del cero. En una escala de intervalos el punto cero est a arbitrariamente determinado,
o no equivalencia (=1=). Asi, una persona u objeto particular tiene la caracteristica que y no representa la ausencia completa del atributo que se mide. EI calendario es un
define la cIase (=) 0 no la tiene (=1=). ejemplo de escala de intervalos, pues el afio cero no indica la ausencia de tiempo
antes de este afio, En cambio, el cero en una escal a de razones representa la ausencia­
completa del atributo que interesa. Una longitud igual a cero significa que no hay
2.4.2 Escalas ordinales longitud. Como consecuencia de esta diferencia en la posici6n del punto cero,
solamente la esc'll a de razones es la que permite formular proposiciones referentes a
Al pasar al nivel inmediatamente superior de medici6n, encontramos variables en las las razones de nurneros en la escala. Por ejemplo, 4 metros es a 2 metros como 2
cuales las clases representan de hecho una serie ordenada de relaciones. Asi, las clases metros es a 1 metro. La distinci6n entre estas escal as se puede aclarar examinando
en las escalas ordinales no son s610 diferentes entre si (caracteristica que define a las una esc'll a de intervalos muy conocida como es la escal a de temperatura de Celsius.
escalas nominales), sino que mantienen alguna clase de relaci6n entre ellas. Mas La escala de temperaturas de Fahrenheit es tarnbien una escala de intervalos.
especificamente, las relaciones se expresan en terrninos del algebra de las desigualda­ EI punta cero en la escala de Celsius 110 representa la ausencia completa de calor.
des: a es menor que b (a < b) 0 a es mayor que b (a> b). Entonces, las relaciones De hecho, este punta es simplemente aquel en que se produce la congelaci6n del agua
encontradas son tales como mayor, mas rapido, mas inteligente, mas maduro, mas al nivel del mar; es decir, se trata de un cero arbitrario. El cero real, conocido como
prestigioso, mas perturbado, etc. Los numerales empleados en conexi6n con las cero absoluto, corresponde aproximadamente a - 273 DC. Ahora bien, si dijeramos
escalas ordinales no son cuantitativos. Ellos indican solamente la posicion en una que 40 os:es a 20 DC como 20 ° es a 10 "C, parecerfa que hacemos una afirmaci6n
serie ordenada y no «cuanta» diferencia existe entre posiciones sucesivas en la escala. correcta.Ipero en realidad estariamos cometiendo un error porque 40°C representa
Ejemplos de aplicaci6n de escalas ordinales son: el ordenamiento de jugadores de real mente 273" + 40" de temperatura, 20 DC representa 273 c + 20° de temperatura y
10 representa 273" + 10". Es claro que la raz6n 313:293 es muy diferente de 293 :283.
0

futbol de acuerdo a su «valor para el equipo», el ordenamiento de candidatos a


cargos politicos segun su «popularidad» y el ordenamiento de candidatos a puestos Estos hechos se pueden apreciar mejor en forma grafica. En la figura 2.1 se han
administrativos de acuerdo a sus cualidades de «liderazgo». N6tese que las posicio­ represent ado las tres ternperaturas como distancias al cero real, que es - 273°C. En
nes se asignan segun el ordenamiento de los individuos dentro de la clase. Asi, al esta grafica se ve que la distancia de - 273°C a 40°C no es el doble de la distancia de
candidato mas popular le correspondera la posici6n 1, al siguiente la posici6n 2, y 'lsi -273 D a 20°C. Asi, 40 DC no indica el doble de temperatura que 20°C, y la
sucesivamente hasta llegar al candidato de menor popularidad. De hecho, no proporci6n 40°C es a 20 DC como 20°C es a 10°C no resulta valida,
importa que asignemos al candidato mas popular el rango numerico mas alto 0 el -273° -200° -100° 0° 100°
mas bajo, siempre que seamos consecuentes al dar a los indiuiduos su posicion relatiua.
adecuada en la serie ordenada. Sin embargo, se ha generalizado la costumbre de
asignar los rangos numericos mas bajos (1.°, 2.°, 3.°) a los «mas altos» en la escala.
Asi, el ganador recibe el rango de «primero» en un concurso de canciones y el
ganador de la copa es el «prirnero» del campeonato. El hecho de que no siempre CERO

seamos consecuentes con esta forma de adjudicar los rangos queda ilustrado por ABSOLUTO

ciertas expresiones populares tales «idiota de primera clase» 0 «granuja de primera», Fig. 2.1 Relaciones en varios puntas de lu escala Celsius can el cera absolute,
26 CONCEPTOS MATEMATICOS FUNDAMENTALES 27
ESTADfSTICA PARA LAS CIENCIAS SOCIALES

Aparte de la diferencia en la naturaleza del punto cero, las escalas de intervalo y necesariamente incluyen solamente numeros enteros. Sin embargo, la mayor parte de
de raz6n tienen las mismas propiedades y seran tratadas en la misma forma a 10 largo las escalas discontinuas usadas por los cientificos de las ciencias sociales y del
del texto. comportamiento, se expresan generalmente en terminos de numeros enteros. Por
Debe sefialarse que una de las metas mas perseguidas por los cientificos del ejernplo, un psicologo registra el numero de. personas con pulso irregular, 0 el
comportamiento es la de obtener rnedidas cuya naturaleza sea por 10 menos la de numero de nifios que asisten al jardin de infancia y que provienen de unidades
intervalos. Ciertamente, para la mayor parte de las pruebas estadisticas presentadas jamiliares de diferentes tamafios. Esta claro que en cada uno de estos ejemplos se
en este libro se considera que las mediciones corresponden a una escala de intervalos. trabaja con numeros enteros. En cambio, una escala continua es aquella en que hay
un nurnero ilimitado de valores posibles entre dos valores adyacentes cualesquiera de
Aunque es discutible que muchas de las mediciones efectuadas por los cientificos del
la escala. Asi, si la variable es altura medida en pulgadas, entonces 4 pulgadas y 5
comportamiento lleguen al nivel de una escala de intervalos, estan de acuerdo en
suponer que asi es. pulgadas sedan dos valores adyacentes de la escala. Sin embargo, existe un mimero
Una de las caracteristicas de las escalas de orden superior es que se las puede infinito de valores intermedios tales como 4.5 pulgadas, 4.7 pulgadas, etc. Si la
transformar facilmente en escalas de orden mas bajo. Asi, el resultado de una carrera variable es la altura medida en decirnas de pulgada, entonces 4.5 pulgadas y 4.6
d.e una milla se puede expresar en unidades de tiempo (escala de razones), por pulgadas son dos valores adyacentes de la escala, pero puede haber todavia un
ejernplo 3 :56,3 :58 y 4:02. Los tiempos que pueden entonces transformar en datos de numero infinito de valores intermedios tales como 4.53 pulgadas, 4.59 pulgadas, etc.
una escala ordinal, por ejemploprimero, segundo y tercer lugar en el orden de Es muy importante tener en cuenta que, asi como la medida de variables discretas
llegada. Sin embargo, no es posible efectuar la transformaci6n inversa. Si, por es siempre exacta, la medida de variables continuas es siempre aproximada. Por
ejemplo, conocemos unicamente el orden de llegada en una carrera, no podemos ejemplo, si estuviesemos midiendo la estatura de los hombres de un determinado
expresar los resultados en terrninos de una escala de razones (tiernpos). Aunque es pais, cualquier medida obtenida seria inexacta, porque siempre podriamos imaginar
admisible transformar las marcas de una escala de mayor nivel a otra de menor nivel, un instrumento de medida mas preciso que el anterior. Asi, al sefialar que la estatura
no es recomendable hacerlo, por 10 general, ya que se pierde informaci6n cuantitativa de un hombre es de 172 em, queremos decir que es de 172 ern con una tolerancia de
precisa. medio centimetro. Si nuestra escala nos proporciona aproxirnacion hasta las
decirnas, podemos imaginar otra escala aun mas exacta que nos de aproxirnacion
hasta las centesimas 0 milesirnas. La caracteristica basica de las escalas continuas es
entonces, la igualdad de las unidades de medida. Por ejemplo, si empleamos el
2.5 Escalas continuas y discontinuas centimetro como unidad de medida, esta unidad perrnanecera identica a traves de
toda la escala. Son ejemplos de variables continuas la longitud, la velocidad, el
Imaginemos que se trata de determinar el promedio de hijos de la familia estadouni­ tiernpo, el peso, etc.
dense. La escala de medida cornenzara en cero (ningun hijo) y se incrernentara de uno Consideremos una observacion mas. A menudo, las variables continuas se
en uno hasta llegar quizas a quince 0 veinte. N6tese que al pasar de un valor de la expresan en nurneros enteros, dando la impresion de ser discontinuas. Asi, alguien
escala al siguiente, utilizamos numeros enteros y no fracciones. Asi, una familia puede puede decir que tiene 172 ern de estatura y 68 kg de peso, que su padre tiene 175 ern
tener 0, 1, 2 0 mas hijos. A pesar de la abstracci6n estadistica de que en los Estados de estatura y un peso de 87 kg, y que su madre tiene 160 em de estatura y un peso de
Unidos el promedio obtenido es aproximadamente de un hijo y tres cuartos, no se 55kg. Sin embargo, fue porque decidio expresar las estaturas con aproximaci6n al
conoce ninguna pareja que haya alcanzado este maravilloso estado de planificaci6n centimetro mas cercano y los pesos con aproximaci6n al kilogramo mas cercano.
familiar. No existe la posibilidad de hacer una elecci6n como esta cuando se trata de cosas
A tales escalas se las llama discontinuas 0 discretas, y tienen como caracteristica tales como el rnimero de hijos de una familia. Estos datos se presentan necesaria­
basica la igualdad de sus unidades de con teo. Asi, cuando se estudia el nurnero de mente como numeros enteros.
hijos por familia, todos los hijos son iguales, pues cada uno representa una unidad de
conteo. A estas escalas se las considera cardinales por cuanto permiten el uso de 2.5.1 Variables continuas, errores de medida
operaciones aritmeticas tales como la suma, resta, multiplicaci6n y divisi6n. Asi,
podemos decir que una familia con cuatro hijos tiene el doble que una familia con y «limites verdaderos» de los mimeros
dos. Las observaciones correspondientes a variables discretas son siernpre exactas si
los procedimientos de con teo empleados son precisos. Ejemplos de variables En nuestra exposici6n anterior, sefialamos que las variables distribuidas en forma
discontinuas son: el ritmo cardiaco (numero de latidos por minuto) en los adultos, el continua pueden tomar un mimero infinito de valores intermedios. En consecuencia,
numero de gl6bulos blancos que se encuentran en un centimetro cuadrado, el mi­ nunca podremos especificar el valor exacto de cualquier medicion, pues es posible
mero de particulas alfa observadas en un segundo, etc. que un instrumento de medida mas preciso pueda incrementar ligeramente la
P01" 10 expresado anteriormente no se debe suponer que las escalas discretas exactitud de nuestras medidas. Por esta razon decimos que los valores numericos de
28 ESTADfSTICA PARA LAS CIENCIAS SOCIALES CONCEPTOS MATEMA.TICOS FUNDAMENTALES 29

las variables que se distribuyen en forma continua son solamente aproximados. Sin Asi, si los datos originales estan en unidades enteras, redondearemos nuestra
embargo, es posible especificar los limites dentro de los cuales se encuentra el valor respuesta hasta el segundo decimal. Si se trata de numeros que incluyen decimas,
real; por ejemplo, los limites »erdaderos de un valor de una variable continua son debemos redondear hasta el tercer decimal, y asi sucesivamente.
iguales a ese numero mas 0 menos la mitad de la unidad de medida correspondiente. Una vez decidido el numero de lugares decimales que contendran nuestros datos
Veamos algunos ejemplos. Supongamos que ellector tiene una balanza en su bafio, finales, nos queda todavia el problema de como presentar la ultima cifra. Afortuna­
cuya escala esta graduada en kilogramos. Cuando sube en ella para pesarse, damente, la regia para su determinacion es muy sencilla y categorica, Si el resto que
normalmente el fiel de la balanza quedara por encima 0 por debajo de alguna de las aparece despues de esa cifra es mayor de 5, se aumentara hasta la cifra inmediata­
divisiones de la escala. A pesar de ello, aproximara su peso al kilogramo mas cercano. mente superior. Si el resto que aparece despues de esa cifra es menor de 5,
Asi, si el fiel esta colocado aproximadamente a 3/4 de la distancia entre n y 73 permanecera sin modificacion alguna. Veamos algunos ejemplos. En cada caso,
kilogramos, usted did que su peso es de 73 kilogramos. Quedara sobreentendido que redondearemos hasta la segunda cifra decimal:
los limites «verdaderos» de su peso, aceptando que la balanza este graduada
correctamente, seran de n.5 kg y 73.5 kg. Otro ejemplo: si se trata de expresar el 6.546 se convierte en 6.55
peso de unas ballenas, es probable que se emplee una unidad de medida mayor, 6.543 se convierte en 6.54
digamos 100 kg. Asi, al indicar que el peso de una ballena es de 14000 kg, se quiere
1.967 se convierte en 1.97
decir en realidad que el peso oscila entre 13 950 y 14050 kg. Si la escala estuviese ­
dividida en unidades de 1000 kg, los limites verdaderos del peso de la ballena sedan 1.534 se convierte en 1.53
13 500 kg y 14500 kg.
Cabria preguntarse: «~Que sucederia si en los ejemplos anteriores la cifra del
tercer lugar decimal fuera 5?».
Primero habria que determinar si el resto representado por esta cifra es exacta­
2.6 Redondeo mente 5. Si es 5 mas un resto por minimo que sea, la regia anterior se aplica y se
debera afiadir uno a la cifra del segundo lugar decimal. Si fuese casi, pero no
rigurosamente 5, la cifra del segundo lugar perrnanecera sin alteracion alguna. Si es
Imaginemos que se han obtenido algunos datos y que en el curso de nuestro analisis
exactamente 5, sin ningun resto, se aplica un convenio arbitrario aceptado universal­
estadistico necesitamos dividir un numero por otro. En este texto apareceran
mente por los maternaticos, que consiste en redondear la cifra del segundo lugar
innumerables ocasiones en que tendremos que efectuar esta operacion aritmetica, En
decimal hasta numero par mas proximo. Si esta cifra es ya par, no sufre cambio
algunos cas os, la respuesta sera un numero con infinitos decimales. Por ejemplo, si
alguno. Si es impar, sumele uno para convertirla en par. Veamos algunos ejemplos en
expresaramos la fraccion 1/3 en forma decimal, el resultado seria 0.33333 +. Es obvio
los que se redondea hasta el segundo lugar decimal:
que no podemos prolongar indefinidamente esta secuencia de numeros. Deberemos
terminarla en algun punto y asignar un valor al ultimo numero de la serie de modo
6.545001 se convierte en 6.55. ~Por que?
que refleje el resto de la mejor manera posible. Al hacerlo, se presentan dos
problemas: 6.545000 se convierte en 6.54. ~Por que?
1.9652 se convierte en 1.97. ~Por que?
1. ~Cuantos lugares decimales habra de contener la respuesta?
2. ~Que decision tomamos del ultimo numero de la serie? 0.00500 se convierte en 0.00. ~Por que?
La respuesta a la primera pregunta se da frecuentemente en terrninos del numero 0.01500 se convierte en 0.02. ~Por que?
de cifras significativas. Sin embargo, existen buenas razones para no seguir al pie de 16.89501 se convierte en 16.90. ~Por que?
la letra la rigidez maternatica. Para simplificar y por comodidad, adoptaremos el
siguiente criterio respecto al redondeo:
Para la obtencion de la respuesta final, debemos redondear hasta dos lugares mas de .

2.7 Razones, frecuencias, proporciones


los que habia en los datos oriqinales. Nose debe redondear en los pasos inter­
medias". y porcentajes
• Puesto que gran parle de los lectores utilizaran calculadoras, deberan tener en cuenta las pequeiias diferencias que
pueden presenlarse en la respuesla final. Cabe atribuir eslas diferencias al hecho de que las diversas calculadoras realizan De todas las estadisticas de uso cotidiano, probablemente las peor entendidas y mal
los pasos interrnedios con diferentes nurneros de decimales. Asl, una calculadora que efectua los pasos intermedios con 4
decimales producira probablernente una respuesta ligerarnente diferente de la que se obtiene con una calculadora que empleadas son las que implican la representacion de razones, proporciones y
lrabaja con 14 decimates. porcentajes. Estas estadisticas son la base de los mas engafiosos y fraudulentos
30 ESTADfsTICA PARA LAS CIENCIAS SOCIALES CONCEPTOS MATEMATICOS FUNDAMENTALES 31

asertos. Asi, es posible que un diputado, tratando de impresionar al gran publico, Sustituyendo en la f6rmula anterior, se obtiene:
para demostrarle su interes por los problemas de los consumidores, denuncie que un
determinado laboratorio farmaceutico esta obteniendo una ganancia del 300 % en y-x 6
- y - x 100 = 8" x 100 = 75%.
sus vent as al por menor; y, ala vez, ellaboratorio, valiendose de los mismos datos
estadisticos, podra replicar con justa indignacion que su beneficio es solo del 75 %.
~Como puede ser esto? Veamos.
Supongase que el costa de produccion de cierto farrnaco es de 2 pesos por
unidad, y que a la vez la unidad se vende al por menor a 8 pesos. La razon del
beneficio (8 - 2 = 6) al costa de produccion es de 6:2, 0 sea, 3:1. Expresando esta
Resumen del capitulo
razon en forma de porcentaje (multiplicando por 100), resulta una ganancia del
300 %, 10 que parece indicar que el diputado esta en 10 cierto. Sin embargo, el En este capitulo hemos sefialado que para seguir con exito este curso no se requiere
laboratorio Iarmaceutico replica: «EI precio de venta es de 8 pesos y nuestra un conocimiento avanzado de las matematicas. Si se dominan las matematicas de
ganancia es de 6 pesos, de modo que la razon de la ganancia al precio de venta es de bachillerato, y se trabaja asiduamente, se lograra familiriarizarse con los conceptos
6.8,0 sea, 0.75 /~. Expresada como porcentaje, nuestra ganancia es tan solo el 75 %del fundamentales expuestos en este texto.
precio de venta. Considerando los cost os de investigacion y explotacion, y los riesgos Para ayudar al estudiante que no haya tenido reciente contacto con las matemati­
financieros, la ganancia no parece excesiva». cas, se han repasado algunos de sus conceptos fundamentales. Se incluye en este
~Cual de las dos explicaciones describe mejor los hechos? Realmente, ambas son repaso : (1) gramatica de la notacion matematica, (2) tipos de numeros, (3) tipos de
correctas. La confusion reside en que se han empleado diferentes valores (2 y 8) como escalas numericas, (4) escalas continuas y discontinuas, (5) redondeo y (6) frecuencias,
base, 0 denominador, para calcular los porcentajes. Ninguno de los procedimientos proporciones y porcentajes. Los estudiantes que necesiten una revision mas extensa
es erroneo, siempre y wando quede perfectamente claro que base se empleo en los de las maternaticas pueden consultar el apendice I.
calculos iniciales. Conocida la base, podremos pasar facilmente de una cifra a la otra
sin ninguna confusion. Asi, si sabemos que el diputado uso como base el costa de
produccion, podemos usar el algebra elemental para convertir su aserto en otro
donde se use como base el precio de venta. Sean: Terrninos para recordar
x = Costo de produccion = 2 pesos
datos de frecuencias (datos de atributos, escalas discontinuas
y = Precio de venta = 8 pesos
datos cateqoricos, datos enumeratitos} (escalas discretas]
La ecuacion siguiente representa el porcentaje de beneficio tomando como base el escala de intertalos limites verdaderos de un numero
costa de produccion: escala de razones medicion
escala nominal nameros cardinales
y-x
- - x 100 = Porcentaje de beneficio (tomando como escala ordinal numeros nominales
x base el costa de produccion), escalas continuas nameros ordinales
Utilizando los valores anteriores y sustituyendo en la ecuacion, hallamos: variable

y-x 8-2
- - x 100 = -- x 100 = 300%.
x 2

La f6rmula para calcular el porcentaje de beneficio empleando como base el


Ejercicios
precio de venta es Los ejercicios siguientes se basan en este capitulo y en el apendice I.
1. Con frecuencia se ha comentado que la actitud de los californianos frente a los riesgosde
y-x los terremotos consiste simplemente en no pensar en ellos. EI profesor Ralph H. Turner,
- - x 100 = Porcentaje de beneficio (referido al precio de venta).
y soci610go y director del Instituto de Investigacion en Ciencias Sociales de la UCLA, ha
32 ESTADfSTlCA PARA LAS CIENCIAS SOCIALES CONCEPTOS MATEMATICOS FUNDAMENTALES 33

recopilado datos que refuerzan esta creencia general. Veamos a continuaci6n los da­ 8. Redondear los siguientes numeros hasta la segunda cifra decimal.
tos recopilados junto con algunas preguntas de una encoesta referente a la informaci6n
que proporcionan los medios de comunicaci6n masiva ace rca de los seismos. a) 99.99500 b) 46.40501
Hallense la proporci6n y el porcentaje de personas que respondieron en cad a una de las c) 2.96500 d) 0.00501
categorias a las preguntas formuladas en la encuesta. e) 16.46500 f) 1.05499
i.Confirman las respuestas el punto de vista general de que los californianos evitan pensar g) 86.2139 h) 10.0050
en los terremotos? 9. En 1973 se suicidaron 15840 hombres y 4625 mujeres. Hallar la proporci6n de suicidios
de hombres y de mujeres (redondear hasta el segundo decimal).
a) Los medios de informaci6n se ocupan b) i.Que piensa ace rca de la informaci6n
muy poco, demasiado 0 en forma su­ que se da en cuanto a los preparativos 10. En 1973 fueron asesinadas 17 123 personas por: armas de fuego, 11 249; arma blanca,

ficiente acerca de 10 que se debe hacer para el caso de un terremoto? 2895; estrangulaci6n 0 golpes, 1445; objetos contundentes, 848; incendio provocado, 173;

al producirse un terremoto? otros, 423. Hallar las proporciones correspondientes a estas causas de muerte (redondear hasta

eI segundo decimal).

NUMERO NUMERO 11. En 1973 hubo 20465 suicidios Y 17123 homicidios. Hallar la proporci6n correspondiente
DE RESPUESTAS DE RESPUESTAS
a los suicidios y tarn bien .la correspondiente a los homicidios (redondear hasta eI cuarto
Muy poco 386 Muy poco 357
decimal).
Suficiente 103 Suficiente 121
12. En la tabla siguiente se muestra eI nurnero de hombres y de mujeres que fueron victimas de
Demasiado 8 Demasiado 14
homicidio entre los afios 1968 y 1973.
Sin opini6n 3 Sin opinion 8

NUMERO DE HOMBRES NUMERO DE MUJERES


ANO VICTIMAS DE HOMICIDIO VICTIMAS DE HOMICIDIO
c) i.LoS medios de informaci6n se ocu­ d) i.Que piensa de la atenci6n que la
pan sulicientemente de las medidas prestan los medios de informaci6n a 1968 5106 1700

tomadas por el gobierno para el caso las predicciones no cientilicas de los 1969 5215 1801

de terremoto? terremotos? 1970 5865 1938

1971 6455 2106

1972 6820 2156

NUMERO NUMERO 1973 7411 2575

DE RESPUESTAS DE RESPUESTAS

Muy poco 413 Muy poco 126


a) Del mimero total de hombres victimas de homicidio durante los afios de 1968 a

Suficiente 67 Suficiente 142


1973, hallar el porcentaje para cada afio,

Demasiado 10 Demasiado 215


b) Del numero total de mujeres victimas de homicidio durante los afios de 1968 a 1973,

Sin opini6n 10 Sin opini6n 17


hallar el porcentaje para cada afio,

13. Determinar el valor de las siguientes expresiones, donde X 1 = 4, X2 = 5, X3 = 7,

2. Hallar a sabiendo que b = 10, C = 4 y a+ b + C = 19. X4 = 9,Xs =


10, X 6 =
11, X 7 14.
=
3. Hallar J' sabiendo que N = 4 y que 20 + N = y + 2. 4 7 6

it) IX.= b) Ix;= c) IX;=


4. Hallar L: X sabiendo que N = 20, X = 60, siendo X = L: X/No i=1 i=l i=3
S .'I .'I
5. Hallar N sabiendo que X = 90, L: X = 360, siendo X = L: X/No d) IX.= e) IX;= f) Ix;=
6. Hallar N sabiendo que i=2 i=l i=4

Expresar 10 que sigue usando el simbolo sumatorio.


DX-X)2
ItX- X)2 = 640, Sl = 16, donde S2 =
a) Xl + Xl + X 3 b) X 1 + X l+",+X N

N
c) X~ + Xi + X~ + X?, d) xi + X~ +". + X,~

7. Hallar Sl sabiendo que


i.En que escala de medida se basan las respuestas al siguiente cuestionario?

ItX- X)2 = 240, N = 12, donde S2 =


ItX- xy a) i.Cmil es su estatura?

N b) i.Cu:il es su peso?

CONCEPTOS MATEMATICOS FUNDAMENTALES 35


34 ESTADiSTICA PARA LAS CIENCIAS SOCIALES

b) Numero de periodicos vendidos en determinada ciudad el 19 de diciembre de 1979.


c) i,CWil es su ocupacion?

c) Cambio en el peso de 5 mujeres durante un periodo de 4 semanas.


d) i,C6mo compara este curso con otros que usted ha seguido?

d) Nurnero de goles marcados por 10 jugadores seleccionados durante el campeonato


16. En los siguientes ejernplos, identificar la escala de medida y determinar si la variable de liga de 1980. .
escrita en letra cursiva es continua 0 discontinua. e) Numero de acciones de la Bolsa de Nueva York que aumentaron su precro el 3 de
a) Distancia recorrida de la casa a la escuela por 50 estudiantes diferentes. enero de 1980.
b) Numero de nii'ios nacidos en diferentes horas del dia.
23. A continuacion aparece una lista en la que figura el numero de nacimientos en Estados
c) Numero de votos obtenidos por cada uno de los tres candidatos a un cargo politico.
Unidos (expresados en millares) entre 1950 y 1~70. (Tom.ad.o de: The ~orld Almanac, 1975,
17. Determinar las raices cuadradas de los siguientes numeros con dos cifras decimales. adaptado. Publicado por Newspaper Enterprise Association, Inc., pag. 951.) Calcular el
a) 160 b) 16 c) 1.60 d) 0.16 e) 0.016 porcentaje de hombres y de mujeres para cada afio.
18. Indicar los Iimites verdaderos de los siguientes numeros, ANO HOMBRES MUJERES
a) 0 b) 0.5 c) 1.0 d) 0.49 e) - 5 f) -4.5
1950 1824 1731
19. Usando los valores de Xi dados en el ejercicio 13, demostrar que 1955 2074 1974
1960 2180 2078
1965 1927 1833
1970 1915 1816

20. i,Cuales de los enunciados siguientes representan escalas continuas y cuales representan 24. Eugene J. Kanin* ha estudiado varios aspectos del cornportamiento de varones sexual­
.escalas discretas de medida? mente agresivos. La agresividad sexual se definio como «un intento de contacto sexual con una
a) Numero de bombillas vendidas diariamente en una tienda. mujer en actitud de rechazo, durante el cual se utiliza violencia fisica en grado tal que da lugar
b) Ingresos mensuales de los estudiantes graduados. a reacciones que denotan ofens a en la mujer» (pag. 429). Cuando sus resultados fueron
c) Temperatura registrada cada dos horas en la seccion de venta de carnes de un comparados con los correspondientes a una muestra de varones no agresivos, se formula la
supermercado. hipotesis de que los varones no agresivos pudieron utilizar tecnicas de seduc~i6n en lugar ~e
d) Pesos de palomas registrados cada 24 horas en un laboratorio experimental. tecnicas agresivas con mas frecuencia que los varones agresivos como medio de conseguir
e) Tamafios de recien nacidos registrados en la seccion de maternidad de un hospital. contacto sexual.
f) Numero de libros de texto existentes en la Iibreria de una universidad. Una muestra de 254 varones no agresivos y 87 varones agresivos revelo las siguientes
frecuencias en que los sujetos admitieron el uso de tecnicas de seduccion.
21. Usando los datos de la tabla siguiente, responder a las siguientes preguntas:
a) De todos los estudiantes que se graduan en cad a area academica, i,cual es el
porcentaje de mujeres? VARONES VARONES
NO AGRESIVOSt AGRESIVOSt
b) Considerando unicamente los hombres, i,que porcentajes se encuentran en cada area
acadernica?
Intento de embriagar a la chica 23 33
c) Considerando unicamente las mujeres, i,que porcentajes se encuentran en cada area 19 7
Falsa promesa de matrimonio
academica? 37 39
Amor fingido
d) De todos los estudiantes que se graduan en las cinco areas, i,cual es el porcentaje de Amenaza de terminar las relaciones 9 8
hombres y cual el de mujeres?
EI mimero de estudiantes graduados en cada una de cinco areas acadernicas, conforme a su Numero total de varones entrevistados N = 254 N= 87
sexo, es:
t La suma de las frecuencias no as igual a N. porque algunos sujetos admitieron que empleaban
mas de una tecrnca Y otros manifestaron que nunca usa ban tales tecnlcas.
AREA ACADEMICA HOMBRES MUJERES
a)Hallar el porcentaje de varones agresivos y no agresivos que admiten usar cada una
Administraci6n de empresas 400 100
de las tecnicas de seduccion.
Enseiianza 50 150
*b) Construya diagramas de barras para mostrar los porcentajes de varones agresivos y
Humanidades 150 200
no agresivos que emplean cada tecnica,
Ciencias 250 100
c) i,Se tiene la impresion de que la hipotesis tiene fundamento?
Ciencias sociales 200 200

* (Tornado de: Kanin, E. J., «An examination of sexual aggression as a response to sexual frustration», Jot/mal oj
22. Indicar cuales de las siguientes variables representan escalas discretas 0 continuas.
Marriage and tile Family, 1967, 29, 428,433.) Copyright © 1967 par el National Council on Family Relations.
Reproducido con permiso.
a) Tiempo que se emplea en resolver estos problemas.

36 ESTADfsTiCA PARA LAS CIENCIAS SOCIALES

25. A continuacion se muestran los metodos de suicidio usados por estudiantes de la


Universidad de California en Berkeley (1952-1961)y de Yale (1920-1955). (Tornado de: Seiden,
R. H., «Campus tragedy: A story of student suicide», Journal oj Abnormal and Social

Psychology, 1966, 71, 389-399.)

BERKELEY YALE SEGUNDA PARTE


Armas de fuego 8 10

Envenenamiento
Asfixia
Ahorcamiento
6
4

Estadistica descriptiva
Saito desde lugares elevados 2
1

Instrumentos cortantes
1 o
Total de suicidios N = 23 N = 25

Calcular el porcentaje de suicidios correspondientes a los medias de autodestruccion indica­


dos, para cad a una de las dos instituciones. Redondear al porcentaje mas proximo.
[39J

Distribucion de
3 frecuencias y tecnicas
de representacion grafica

3.1 Agrupaci6n de datos


Imaginemos que ellector acaba de aceptar el cargo de jefe de estudios de un colegio
importante. Su responsabilidad es preparar un plan de estudios acorde con las
necesidades y preferencias de los estudiantes y que, al mismo tiempo, estimule sus
capacidades intelectuales. Desde luego, cae fuera del alcance del texto resolver este
problema tan interesante y complejo. Sin embargo, no se puede avanzar hacia una
solucion sin evaluar antes las capacidades intelectuales del cuerpo estudiantil. En
consecuencia, ellector acude a los archivos y «extrae informacion» al azar (es decir,
de manera que cada miembro de la poblacion estudiantil tenga igual oportunidad de
ser elegido) de 110 expedientes que contienen informacion personal y academica.
Puesto que por el momenta se trata de valorar la capacidad intelectual, se dirigira la
atencion hacia la informacion sobre el «CI estimado». Al anotar estos datos, se
obtendran las cifras seiialadas en la tabla 3.1.
Reflexionando acerca de elias, se hara evidente que no tienen «pies ni cabeza» a
menos que se organicen de manera sistematica. Es posible ordenar todos los
resultados en forma descendente y luego colocar despues de cada uno una rayita
vertical cada vez que se presente (tabla 3.2). EI numero de rayitas representa,
entonces, la frecuencia con que aparece cada resultado.
Al proceder de esta forma, se habra construido una distribucion de frecuencias de
los resultados. Adviertase que, en el presente ejemplo, los datos son muy dispersos;
algunos tienen una frecuencia nula y no existe una indicacion «visual» clara de una
tendencia central. En estas condiciones, la mayoria de los investigadores acostum­
bran a agrupar los datos en 10 que se llama intervalos de clase, para obtener una
distribucion de frecuencias de «datos agrupados»,

3.1.1 Agrupacion en intervalos de c1ase


EI agrupamiento en intervalos de clase implica una especie de «ruptura de la escala»
en la cual asignamos los datos aclases mutuamente excluyentes en donde estas se
definen en terrninos de los intervalos de agrupamiento empleados. Las razones para
hace- este tipo de agrupaciones son dobles: (1) A menos de que dispongamos de
DISTRIBUCION DE FRECUENCIAS Y TECNICAS DE REPRESENTACION GRAFICA 41
40 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

Tabla 3.1 C I de 110 estudiantes seleccionados al azar.


Recuadro 3.1 122 100 113 119 121 128 112 93
154 131
133 119 115 117 110 104 125 85 120 135
116 103 103 121 109 147 103 113 107 98
80 80 89 143 108 142
128 93 90 105 118 134
85 108 108 136 115 117 110 80 111 127
70 123 126 119 122 102 100 106
100 100 114
105 111 127 106 91 123 132 97 110
108 I
96 111 101
50
69 137 124
~::
150 130 87
w

...., 118 104 127 101 125 129 131 110


I 107
~ 50
97 135 108 94[
139 133 115 83 109 116
w
110 113 112 82 114 112 113 142 145 123
I
~ 40
1

oa..
30
Tabla 3.2 Distribucion de frecuencias de CI de X I X I X I
X I
20 110 estudiantes seleccionados al azar.
154 I 135 II 116 II 97 II
10 115 96 I
153 134 I IIII
152 133 II 114 II 95
o 151 132 I 113 1111 94 I
SIN SEPARACION SEPARACION 1A7 MAS DE
IN = 1371 PROLONGADA DIAS
7 DIAS 150 I 131 II 112 11\ 93 II
(N=501 (N = 37)
IN = 20) 149 130 I 111 III 92
148 129 \ 110 11111 91 I
147 I 128 II 109 II 90 I
PREFERENCIA POR EL LADO IZQUIERDO i"} 146 127 III 108 I 1111 89 II
• PREFERENCIA POR EL LADO DERECHO ,;j-' 145 I 126 I 107 II 88
144 125 II 106 II 87 I
143 I 124 I 105 II 86
142 II 123 III 104 II 85 II
141 122 II 103 III 84
140 121 II 102 I 83 I
Los psicologos creen en la posibilidad de que los latidos del corazon de la madre sean 139 I 120 I 101 II 82 I
reconfortantes para el bebe. Si se mantiene al nino en el lado Izquierdo de la madre, el 138 119 III 100 1I11 81
sonido de los latidos es mas pronunciado. Un investigador estudio las diversas 137 I 118 II 99 80 I
circunstancias en que las mad res manifiestan una preferencia por sostener a sus hijos en 136 I 117 II 98 I
ellado Izquierdo 0 en el derecho. Algunas mad res tienen acceso a sus bebes inmediata­
mente despues del nacimiento (sin separacion), mientras que otras 10 tienen despues de
un periodo de por 10 menos 24 horas (separacion prolongada). Las graficas resumen los calculadoras autornaticas, es antieconomico y pOCO practice manejar un gran
resultados obtenidos en una muestra de 197 madres.
numero de datos dispersos. (2) Algunos de los datos tienen asociada una frecuencia
Las mad res de primogenitos que no fueron separadas de sus nifios mostraron una
tan baja que no se justifica mantenerlos como entidades distintas y separadas.
marcada preferencia a sostener a sus bebes en ellado Izquierdo. En cambio, las mad res
de primogenitos con los cuales no tuvieron contacto inmediato tendieron a preferir el Como factor negativo esta naturalmente el hecho de que al agrupar los datos se
lado derecho. (Vease la grafica de la parte superior izquierda.) . pierde inevitablemente parte de la informacion. Por ejemplo, las calificaciones
Cualquier separacion (por un dia 0 mas) parece producir una preferencia por ellado individuales pierden su identidad cuando se las agrupa en intervalos de clase, y son
derecho. Cuanto mas prolongada es la separacion, mayor es la preferencia por el la­ inevitables algunos pequefios errores en los estadigrafos calculados en base a datos
do derecho, como se ve en la segunda grafica, Estos resultados se basan en datos de 57 agrupados.
mad res que no tuvieron acceso a sus bebes inmediatamente despues del nacimiento. La pregunta que surge ahora es: «~Cl.ial sera nuestro criterio de decision acerca
De «The Role of the Hearthbeat in the relations between Mother and Infant». par L A. Salk. Scientific Ameri­
de los intervalos de agrupamiento que vamos a emplear?». Evidentemente, los
can, mayo 1973, 228 (5),24-29. Copyright © por Scientific American, Inc., 1973. Todos los derechos reservados, intervalos seleccionados no deben ser tan amplios que perdamos la discriminacion
proporcionada por nuestra medida original. Por ejemplo, si dividieramos los CI
DlSTRIBUCION DE FRECUENCIAS Y TECNICAS DE REPRESENTACION GRAFICA 43
42 ESTADfSTICA PARA LAS CIENCIAS SQCIALES

Tabla 3.3 Distribucion de frecuencias agrupadas de los CI en base a los datos


recopilados en dos clases, la de los inferiores a 100 y los iguales 0 superiores a 100, se
de la tabla'3.2.
perderia practicamente toda la informacion contenida en los datos originales. Por
otra parte, los intervalos de clase no deben ser tan pequeiios que se desvirtue el INTERVALO INTERVALO INTERVALO
DE CLASE f DE CLASE f
objetivo que se busca con la agrupacion, No hay, desgraciadamente, ninguna norma DE CLASE

general aplicable en todos los casos para responder a nuestra pregunta. La mayoria 150-154 2 125-129 9 100-104 12
de las veces, la eleccio.i del numero -de intervalos debe representar una decision j... 145-149 2 120-124 9 95-99 4
basada en considerar de una parte los efectos del agrupamiento sobre la posibilidad + 140-144 3 115-119 13 90-94 5
de discriminar los datos y de otra la economia de la presentacion, No obstante, se 135-139 5 110-114 17 85-89 5
130-134 7 105-109 14 80-84 3
acepta generalmente que buena parte de los datos que se manejan en las ciencias del
comportamiento pueden ser agrupados entre 10 a 20 intervalos de clase. Por razones N = 110
de uniformidad, consideraremos aproximadamente 15 intervalos de clase para los
datos que se analizan en este texto.
Una vez decidido el mimero apropiado de intervalos para un conjunto de datos,
resulta que los procedimientos para asignar los puntajes a los intervalos de clase son que hay concentracion de frecuencias en los intervalos de clase comprendidos entre
muy sencillos. Aunque se puede elegir entre varias tecnicas, para ser consecuentes 110 y 119. Se destaca tarnbien que el numero de datos en los extremos tiende a
emplearemos solamente una. EI procedimiento es el siguiente: disminuir. Resulta que se ha alcanzado uno de los objetivos del agrupamiento: lograr
una ordenaci6n de datos que sea econornica y manejable.
Paso 1. Hallese la diferencia entre el mas alto y el mas bajo de los datos originales.
Afi.ada 1 para obtener el numero total de datos 0 de datos potenciales. En el presente Adoertencia: La mayor parte de los datos con los que trabaja el cientifico del
+
ejemplo, el resultado es (154 - 80) 1 = 75. comportamiento vienen expresados por numeros enteros y no por decimales. Por
esta razon, en nuestros ejemplos usamos enteros. Sin embargo, en ciertos casos los
Paso 2. Dividase este mimero por 15 para obtener el rnimero de datos 0 de datos datos estan expresados en forma decimal (por ejemplo, el tiempo de reacci6n). EI
potenciales en cada intervalo. Si el valor resultante no es un numero entero, y procedimiento mas sencillo consiste en tratar los datos como si n~ existiera el punto
~i generalmente no 10 es, los autores prefieren redondear al numero impar mas decimal. En otras palabras, hay que tratar a cada dato como SI fuera un numero
pr6ximo, de manera que en el centro del intervalo de clase se encuentre un numero entero.
entero. Sin embargo, esta practica esta lejos de ser universal, y no se comete ningun Los puntos de los decimales se vuelven a colocar en el paso final. Si en el ejemplo
r~. error si se redondea al numero mas proximo. En el presente ejemplo, el numero de antenor el dato mayor hubiera sido 1.54 y el menor 0.80, los calculos habrian sido
-> datos para cada intervalo de clase es 75/15, 0 sea,S. A la amplitud del intervalo exactamente iguales. Sin embargo, en el ultimo paso el intervalo superior tend ria que
~
de clase la designaremos por el simbolo i. En este ejemplo, i = 5. haber sido cambiado a 1.50-1.54 y el intervalo inferior a 0.80-0.84, procediendo
analogamente con los otros intervalos. La amplitud del intervalo de clase habria sido
Paso 3. Tornese el dato mas bajo de los datos originales como limite inferior del igual a 0.05.
primer intervalo. Sumese i - I para obtener ellimite superior del primer intervalo de
clase. Asi, el primer intervalo en nuestro caso es 80-84.
Lirnites verdaderos de un intervalo de c1ase
Piiso 4. EI siguiente intervalo de clase comienza en el entero que sigue al extremo
superior del primer intervalo. En el presente ejemplo, el entero siguiente es 85. Siga En nuestro estudio previo de los «limites verdaderos» de un numero (secci6n 2.5.1),
las mismas etapas indicadas en (3) para obtener el limite superior del segundo indicamos que el «verdadero» valor de un ruimero es igual a su valor aparente mas y
intervalo de clase. Prosiga con este procedimiento para cad a uno de los intervalos de menos la mitad de la unidad de medida. Por supuesto, 10 mismo ocurre con estos
clase sucesivos, hasta que todos los datos queden incluidos en sus apropiados valores aun despues de haberlos agrupado en intervalos de clase. Asi, aunque
intervalos de clase. .escribimos los limites del intervalo de clase inferior como 80-84, los Iimites verdade­
ros del intervalo son 79.5-84.5 (0 sea, el limite real inferior de 80 y el limite real
Paso 5; Asignese cada uno de los datos obtenidos al intervalo de clase dentro del
cual esta incluido. La distribucion de frecuencias agrupadas que aparece en la tabla 3.3 superior de 84, respectivamente).
Es importante recordar que los limites verdaderos de un intervalo de clase no son
se obtuvo empleando el procedimiento indicado.
mismo que los llmites aparentes. Posteriormente, al calcular la media.na y los
percentiles con datos agrupados, haremos uso de los limites verdaderos del intervalo
Se observara que por medio del agrupamiento podemos obtener una «imagen»
inmediata de la distribucion de los CI de los estudiantes. Por ejemplo, observamos clase.
44 ESTADiSTICA PARA LAS CIENCIAS SOCIALES
DISTRIBUCION DE FRECUENCIAS Y TECNICAS DE REPRESENTACION GRAFICA 45

3.2 Frecuencias y distribuciones


se obtiene dividiendo cada entrada de la columna de frecuencias acumuladas por N.
porcentuales acumuladas
Cuando se multiplica cada proporcion acumulada por 100, se obtiene una distribu­
cion de porcentajes acumulados. Notese que la entrada de la parte superior debe ser
igual al 100 %, ya que todos los casos estan debajo del limite superior verdadero del
A menudo conviene convertir los datos de una distribucion de frecuencias en una mayor intervalo.
distribucion de frecuencias acumuladas. Ademas de ayudar a la interpretacion de
la distribucion de frecuencias, una distribucion de frecuencias acumuladas constituye
una gran ayuda p,ara la obtencion de la mediana y de los percentiles, tal Como
veremos en el capitulo 4. 3.3 Tecnicas de representacion grafica
.La distribucion de frecuencias acumuladas se obtiene de una manera muy sencilla
y direeta. Observemos los datos de la tabla 3.4. Las entradas en la distribucion de Acabamos de examinar algunos de los procedimientos empleados para hacer que
frecuencias indican el mimero de estudiantes que caen dentro de cada uno de los adquiera sentido un conjunto de datos no organizados. Como se sefialo, general­
intervalos de clase. Cada entrada de la distribucion de frecuencias acumuladas indica mente el trabajo apenas estara iniciado cuando se haya obtenido la distribucion de
el numero de todos los casos 0 frecuencias por debajo del limite superior verdadero frecuencias. EI paso siguiente es el de presentar los datos mediante un dibujo, de tal
de ese intervalo. Asi, en el tercer intervalo de clase, partiendo de abajo hacia arriba, modo que el lector pueda percibir facilmente las caracteristicas esenciales de una
en la tabla 3.4, la entrada «13» en la distribucion de frecuencias acumuladas indica distribucion de frecuencias y comparar una distribucion con otra, si 10. desea. Estos
que un total de ~3 estudiantes obtuvo una marca mas baja que el limite superior dibujos, llamados graficas, no deben ser considerados como sustitutivos del trata­
verdadero de ese intervalo, que es 94.5. Las entradas de la distribucion de frecuencias miento estadistico de los datos, sino mas bien como ayudas visuales para pensar en
acumuladas se obtienen por un simple proceso de adicion sucesiva de las entradas de los problemas estadisticos y para discutirlos.
la col.umna de frecuenc~as. Asi, la frecuencia acumulada correspondiente al limite
supenor verdadero del intervalo 104.5-109.5 se obtiene por la adicion sucesiva de
3 + 5. + 5 + 4 + 12 + 14 = 43. Adviertase que la entrada que aparece en la parte 3.4 Empleo err6neo de las tecnicas
sup~nor de la columna de frecuencias acumuladas es siempre igual a N. Si no se
obtiene este resultado, quiere decir que se ha producido un error al acumular las de representaci6n grafica
frecuencias y Se debera revisar el trabajo,
La distribuci6n de proporciones acumuladas, que tambien aparece en la tabla 3.4, Como es bien sabido, las graficas han sido empleadas algunas veces en los negocios
comerciales para tratar de confundir allector. Por ejemplo, si se manipulan intencio­
Tabla 3.4 Distribucion de frecuencias agrupadas y distribucion de frecuencias nadamente los ejes de una grafica, el vertical (de las ordenadas 0 eje Y) y el horizontal
acumuladas tomando como base los datos de la tabla 3.3. N = 110. (de las abscisas 0 eje X), es posible dar la impresion que se desee. La figura 3.1 ilustra
esta aplicacion tendenciosa de las tecnicas de representacion grafica. En ella se
INTERVALO PROPORCION
DE CLASE f f ACUMULADA
muestran dos diagramas de barras (basados en los mismos datos) en los cuales
ACUMULADA % ACUMULADO
se alargaron las ordenadas y las abscisas, respectivamente, para causar dos impresio­
150-154 2 110 1.00 100
nes distintas.
145-149 2 108 0.98 98 Se notara que la grafica (a) tiende a exagerar la diferencia entre las frecuencias de
140-144 3 106 0.96 96 las tres clases, mientras que la (b) tiende a reducirla al minimo,
135-139 5 103 0.94 94 Las diferencias pueden exagerarse aun mas utilizando el artificio que Darrell Huff
130-134 7 98 0.89 89
125-129 9
e Irving Geis Haman diagrama «[Gee Whiz!» en su excelente obra How to Lie with
91 0.83 83
120-124 9 82 0.75 75
Statistics (como ensefiar con la estadistica). Este procedimiento consiste en eliminar
115-119 13 73 0.66 66 la frecuencia cero en el eje vertical y empezar con una frecuencia superior a cero. La
110-114 17 60 0.55 55 figura 3.2 ha sido tomada dellibro citado, e ilustra muy claramente la forma en que
105-109 14 43 0.39 39 pueden emplearse his graficas con un proposito engafioso.
100-104 12 29 0.26 26
95-99
Es evidente que el uso de tales artificios es totalmente opuesto al proposito de un
4 17 0.15 15
90-94 5 13
estadistico, que es el de presentar los datos con una claridad tal que las interpretacio­
0.12 12
85-89 5 8 0.07 7
nes equivocas sean minimas. Puede eliminarse la segunda de las fuentes de error
80-84 3 3 0.03 3 l1Ulsh~adlas anteriormente, considerando en el eje Y la frecuencia cero. Sin embargo,
aun queda el primer problema: la eleccion de escalas para representar las unidades en
46 ESTADiSTICA PARA LAS CIENCIAS SOCIALES DISTRIBUCION DE FRECUENCIAS Y TECNICAS DE REPRESENTACION GRAFICA 47

ALZA EN LOS SALARIOS DEL SECTOR PUBLICO

90
Ul
80 w
a:
70 :5o 20
60 a
w
50
a
Ul
w
40 Z
o
...J
30 ...J
~ 19.5
20
10

JUN. JUL. AGO. SEP. OCT. NOV. DIC.


o
1937
A B c
(a)
ESTABILIDAD DE LOSSALARIOS DEL SECTOR
PUBLICO

90 ~ 30 --------- -----------------
a:
:5o
60 a
w 20 ~------------------
a .......

Ul
w
30 Z
g
...J
10~--------------------------
~
o '--_---J

A B c
I _ _...L..
OL-_..--LI _ _--L_---'-
I I
I _ _l...-_--l
(b) JUN. JUL. AGO. SEP. OCT. NOV. DlC.
1937
Fig. 3.1 Diagrarna de barras que representan los rnisrnos datos pero
producen irnpresiones diferentes por la variacion de las longitudes relati­ Fig.3.2 Utilizaciori de la grafica «[Gee Whiz!» para exage­
vas de 1a ordenada y de la abscisa. rar las diferencias en las ordenadas. (Tornado del libra
de D. Huff e I. Geis HoII' to Lie with St atistics. Nueva
York: W. W. Norton & Co., Inc., 1954, con Ia autori­
los ejes horizontal y vertical. Por supuesto, la eleccion de estas unidades es arbitraria, zaci6n correspondiente.)
y quien decida dar a las ordenadas doble de la longitud que a las abscisas estara
procediendo tan correctamente como quien decida 10 contrario. Sin embargo, para
evitar una anarquia en la tecnica de representacion grafica, es necesario adoptar un
convenio para minimizar la posibilidad de interpretaciones erroneas. La mayor
parte de los estadisticos coinciden en que la altura de la grafica debe ser aproximada­
3.5 Variables de escala nominal
mente 0.75 de su longitud, siendo aceptable que esta proporcion este comprendida
entre 0.70 Y 0.80. £1 diagrama de barras, ilustrado en la figura 3.3, es un recurso grafico empleado para
La ventaja que se consigue con este convenio es la de eliminar los factores representar los datos correspondientes a una escala nominal u ordinal. Para cada
subjetivos y, posiblemente, los prejuicios personales que pueden influir en las categoria se traza una barra vertical*, y la altura de la barra representa el nurnero de
decisiones acerca de la proporcion relativa de las abscisas y las ordenadas en la
• A veces se colocan las barras de estas graficas horizontalrnente. Ello results veniajoso cuando el numero de casos
representacion grafica. £1 uso de este convenio se ilustrara en la proxima seccion que (oclases) es grande y una lisladeellas puede ocupar toda la pagina. Sin embargo,la forma vertical (come rnuestra ia fig. 3.3)
se ocupa de los diagramas de barras. Tambien se aplico esta regia a todas las graficas se Usa mas lrecuentemente porque resulta mas facil de interpretar a simple vista y porque es adaptable a un histograma 0
que aparecen en el resto del capitulo. una curva de frecuencia (ver figs. 3.6 y 3.7).
DlSTRIBUCION DE FRECUENCIAS Y TECNICAS DE REPRESENTACION GRA.FICA 49
48 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

30..-- ----------------------,
160'r-------------------.-----------,

140 ­ 25­

120­
(f)
sa:
o

ti

o 4 5
2
ADMINISTRACION HUMANIDADES CIENCIAS CIENCIAS
CIENCIAS
POSICION DE SALIDA
DE EMPRESAS BIOLOGICAS FISICAS
SOCIALES

Fig. 3.4 Carreras ganadas en una pista circular por caballos que partieron de ocho posiciones
Fig.. 3.3 Nurnero de estudiantes inscritos en cursos preliminares de economia, y que estan de salida. (De S. Siegel, NOll-Parametric Statistics. Nueva York: McGraw-Hill. 1956. Adaptado
siguiendo otros estudios academicos (datos hipoteticos). con permiso.)

miembros de esa clase. Si fijamos arbitrariamente la anchura de cada barra como una 3.7 Variables de escala por intervalos

unidad, puede darse el area de cada barra para representar la frecuencia de cada
categoria. Asi, el area total de todas las barras es igual a N. y de razones

En la preparacion de distribuciones de frecuencias de variables de escala nominal


se deberan tener en cuenta dos cosas : ' 3.7.1 Histograma
1. No se presupone ningunorden adjudicable a las variables de escala nominal. Se recordara que las variables de escala por intervalos (y razones) difieren de las
Asi, las diversas categorias pueden quedar representadas a 10 largo del eje de variables de escala ordinal en un aspecto importante: las diferencias iguales entre dos
las abscisas en cualquier orden que se elija. Los autores prefieren ordenar las puntos en cualquier parte de la escala son iguales entre si, Esto significa que es
categorias alfabeticarnente, para ser consecuentes con su deseo de eli­ admisible que las barras verticales esten en contacto en las representaciones graficas
minar cualquier posibilidad de que tendencias personales intervengan en la distribuciones de frecuencias en escalas por intervalos (y razones). A una grafica
decision. se le llama un histograma y sustituye al diagrama de barras empleado con las
2. Las barras deben quedar separadas y no en contacto, para evitar cualquier variables nominales y ordinales. La figura 3.5 ilustra el uso del histograma con
implicacion de continuidad entre las categorias. una variable que toma valores discretos en una escala de razones.
Se hizo observar anteriormente (seccion 3.5) que cabe representar la frecuencia ya
sea por el area de una barra 0 por su altura. Sin embargo, hay muchas aplicaciones
graficas en que la altura de la barra, 0 sea, la ordenada, puede dar una informacion
3.6 Variables de escala ordinal erronea acerca de la frecuencia. Consideremos la figura 3.6 que muestra el histogra­
rna resultante cuando se agrupan los datos en intervalos de clase desiguales. El uso de
Recordemos que los valores de una escala ordinal implican un orden que puede intervalos de clase desiguales se utiliza con mayor frecuencia cuando hay relativa­
expresarse en terrninos del algebra de las desigualdades (mayor que, menor que). En mente pocos datos en uno u otro de los extremos de una distribucion. Por ejemplo,
concordancia con nuestra discusion anterior, debe tratarse a las variables de escala . los datos de ingresos familiares contienen cornunmente muy pocos casos extremos
ordinal en la misma forma que a las variables de escala nominal, excepto que al tales como los ingresos anuales comprendidos entre muchos cientos de miles y
colocar las categorias en el eje de las abscisas se 10 debe hacer en su orden de millones de pesos. Se acostumbra a reunir estos valores extremos en una sola
ocurrencia natural. En la figura 3.4 se ilustra el uso del diagram a de barras en el caso categoria mas amplia.
de una variable de escala ordinal. Si se piensa en la frecuencia en funcion de la altura de laordenada, puede llegarse
50 ESTADfSTICA PARA LAS CIENCIAS SOCIALES DISTRIBUCION DE FRECUENCIAS Y TECNICAS DE REPRESENTACION GRAFICA 51

140 138 unidades. Analogamente, en el intervalo 6-8 hay 24 unidades de frecuencia distribui­
das sobre 3 unidades de datos; asi, la altura de la ordenada debera ser igual a 8
120
unidades.
EI problema que se presenta con los intervalos de clase desiguales puede ser
100 facilmente evitado utilizando intervalos de clase iguales siempre que sea posible. La
figura 3.7 muestra la grafica de faltas al trabajo con intervalos de clase iguales.
80
En general, es aconsejable que consideremos la frecuencia en funci6n del area al
manejar variables en las cuales puede suponerse continuidad.

40

20 40 NUMERO DE DIAS
DE AUSENCIA FRECUENCIA
4
24-26 3
o
o 23456 7 8 21-23 10
18-20 4
NUMERO DE HIJOS POR FAMILIA 5
30 15-17
12-14 3
Fig'. 3.5 Distribucion de frecuencias del ruimero de hijos por familia entre 389 9-11 6
familias encuestadas en una pequefia comunidad suburbana (datos hipoteticos). 6-8 24
3-5 15
20 0-2 41
a la conclusi6n err6nea de que el intervalo 15-25 incluye solamente dos casos. Sin
embar~o, si ~e representa cada dato por una unidad en la escala de frecuencias y por
un.a umdad igual en la escala de datos, el area total para cada dato es igual a uno. En 10
el intervalo 15-25 hay 22 unidades de frecuencias distribuidas sobre 11 unidades de
datos; asi, para este intervalo la altura de la ordenada sera de 22/11, 0 sea, 2

18,----------------------------, o 0-2 3-5 6-8 9-11 12-14 15-17 18-20 21-23 24-26

16 IIlI1 NUMERO DE DIAS


FALTAS DE ASISTENCIA AL TRABAJO
II DE AUSENCIA FRECUENCIA
14 15-25 22 Fig. 3.7 Histograma basado en la figura 3.6, pero con intervalas de clase iguales.
12-14 3
12 9-11 6
6-8 24
10 3-5 15 Curva de frecuencias*
2 13
8 1 17 Podemos transformar facilmente un histograma en otra forma de representaci6n
o
grafica cornunmente empleada, la curva de frecuencias, uniendo los puntos medios d~
11
6
las barras mediante segmentos rectilineos. No es necesario, sin embargo, construir
4
previamente histograma para obtener una curva de frecuencias. S610 se precisa
2 dibujar puntos en los lugares que hubieran ocupado las partes superiores de las
o
7 10 •• 13

FALTAS DE ASISTENCIA AL TRABAJO


20
parras, y unir luego esos puntos. En la practica, los autores prefieren reservar el uso
el histograma para distribuciones discretas y la curva de frecuencias para distribu­
siones en las cuales la continuidad es explicita 0 puede ser supuesta. Cuando se
somparan dos 0 mas distribuciones de frecuencia, la curva de frecuencias proporcio­
Fig. 3.6 Histogram~ d?nde se emplean intervalos de c1ase desiguales (datos hipoteticos), Los a una visi6n mas clara. La figura 3.8 muestra una curva de frecuencias basada en la
cuadrad?s fueron afiadidos con fines ilustrativos, Cada cuadrado representa una unidad de
frecuencia en un data determinada. El numero total de cuadros es igual a N (suma de todas
istribuci6n de frecuencias agrupadas que aparece en la tabla 3.3.
las frecuencias),
• Muchos autores Ie dan el nombre mas adecuado de poligono de rrecuencias. (N. del 7:)
DlSTRIBUCION DE FRECUENCIAS Y TECNlCAS DE REPRESENTACION GRAFICA 53
52 ESTADfSTICA PARA LAS CTENCIAS SOCIALES

18 r---------------------------~
•...-100

16
110­
/ ~--- 90
100 -
14 90 - // 80 g
::5
~

//

80 - 70
12
::>
70 - 60 ~
10 w
f
60 -
50 3
z
8

50 -

40 -

30 -
/1 40

30
~
a:
~
- 20
4

2
20 -

10 - "..,.­
// 10

oL,.....o-~1 I' I I I I I I I I 0
79.5 84.5 89.5 94.5 99.5 104.5 109.5114.5 119.5 124.5 129.5134.5139.5 144.5 149.5 154.5
97 102 107 112 117 122 127 132 137 142 147 152
DATOS DEL C.1. (L1MITES SUPERIORES VERDADEROS)
PUNTOS MEDIOS DE LOS INTERVALOS DE CLASE
Fig. 3.9 Curva de freeueneias y poreentajes aeumulados basada en las distribueiones de freeuencias
Fig. 3.8 Curva de freeueneias basada en los datos que apareeen en la tabla 3.3.
y poreentajes aeumulados que apareeen en la tabla 3.4.

3.7.3 Curva de frecuencias acumuladas


En la secci6n 3.2 indicamos los procedimientos para la obtenci6n de la distribuci6n
de frecuencias y porcentajes acumulados. Las representaciones graficas correspon­
dientes son la curva de frecuencias acumuladas y la curva de porcentajes acumula­
dos. Estas dos graficas estan representadas simultaneamente en la figura 3.9,
sefialando el eje vertical de la izquierda las frecuencias acumuladas y el de la derecha (a) (b) (e)
los porcentajes acumulados. Fig. 3.10 Tres formas de distribueiones aeampanadas: [a] [eptocurtica, (b) mesoeurtiea y (e)
Hay dos cuestiones importantes que es necesario recordar: (1) a las frecuencias platicurtica.
acumuladas se les hace corresponder en la grafica los limites superiores cerdaderos de
los intervalos; y (2) el valor maximo en el eje Y para la curva de frecuencias Se dice que la curva normal es una distribucion simetrica, porque si se la dobla
acumuladas es N, y para la curva de porcentajes acumulados es 100. por la mitad, ambas partes coinciden. Sin embargo, no todas las curvas simetricas
tienen forma de campana. En la figura 3.11 se muestran algunas cur vas simetricas di-
ferentes.
A ciertas distribuciones se les ha dado nombres particulares; por ejemplo, a la
3.8 Forrnas de las curvas de frecuencias que esta representada en la figura 3.11(a) se le llama distribucion rectangular, y a

Las curvas de frecuencias pueden tomar un numero ilimitado de formas. No


obstante, muchos de los procedimientos estadisticos estudiados en este texto
suponen una forma particular de distribucion que es la curva normal que toma
«forma de carnpana»,
La figura 3.10 muestra varias formas de distribuciones acampanadas. Ala curva
(a), caracterizada por una concentracion de datos en el centro de Ia distribucion, se la
lI~m~ dis.t~·ibuci611 lep~ocurtica. En la curva (c), donde predomina el caso opuesto, la (a)
(b) (e)

?IstnbuclOn es conocida como platicurtica. Y, finalmente, la curva (b) toma la forma


Fig. 3.11 I1ustraeiones de algunas eurvas de freeueneias simetricas no normales.
Ideal de la curva normal y es conocida como distribucion mesocurtica.
DISTRIBUCION DE FRECUENCIAS Y TECNICAS DE REPRESENTACION GRAFICA
55
54 ESTADISTICA PARA LAS CIENCIAS SOCIALES

A menudo interesa comparar varios grupos 0 situaciones respecto a una


I~ q~e a~~rece en la figura 3.11(b) se Ie llama distribucion en U. Se presenta una caracteristica dada. Estos grupos 0 situaciones constituyen la cariable independiente
distribuciori bi~odal, como la que aparece en la figura 3.11(c), cuando las distribucio­
'(0 experimentaT), en tanto que a la caracteristica que estamos midi~ndo se Ie l.lama
nes d~ frecuencias d~ d?s P?,blaciones difer~ntes se representan en una sola grafica..
criterio 0 variable dependiente. En la figura 3.13 se compara el numero medio de
P~r ejernplo, una distribucion de frecuencias de hombres y mujeres adultos de la
respuestas de apretar los barrotes, dadas por tres grupos de animales que recibieron
mI~ma edad nos daria probablemente una curva similar a la de la figura 3.11(c) si el
tres tipos de estimulo olfativo, tales como olor de ratas hem bras, olor de ratas
atnbuto en consideracion fuera la fuerza del apreton de manos. '
machos y control de ausencia de olor (Runyon y Kosacoff, 1965). Debe notarse que la
. ~uan~,o una di~t~ibuci6n no es simetrica se dice que es sesgada. AI decir que una variable experimental esta representada a 10 largo del eje X y la variable dependiente
distribucion es positioomente sesgada, querernos indicar que decae hacia el extrema
derecho del eje horizontal y que relativamente hay un numero menor de frecuencias o de criterio en el eje Y.
En la figura 3.14 puede verse una grafica lineal que representa la relacion entre
en ese extrem? Si, P?r el contrario, decimos que la distribucion es negativamente dos variables en un estudio de tipo social (Runyon y Turner, 1964). En este
sesgada, se quiere indicar que hay relativamente menos datos asociados con ellado experimento se colocaron a la vez cuatro ani males en un ambiente casi natural y
iz.qui.erd~ del eje horizontal. En la figura 3.12 se present a algunas formas de
distribuciones sesgadas. 200
en
UJ

a
a:
a:
<l:
l:ll 150
UJ
C
en
UJ
z
a
Vi 100
UJ
a:
o,
(a) (bl (c) UJ
c
Fig. 3.12 Ilustraciones de algunas curvas de frecuencias sesgadas. a 50
c
UJ
:2
La figura 3.12(a) representa la Hamada curva en J, y la figura 3.12(b) muestra la aa:
a,
lI~m~da. ojiva. U,na distribuci6~. de frecuencias acumuladas de datos normalmente
0'---­
distribuidos dara lugar a una ojiva 0 a una distribucion en forma de S. Notese que DIA 1 DIA 2 DIA 1 DIA 2 DIA 1 DIA 2

a~n~ue l?~ datos de la tabla 3.4 corresponden solamente en forma aproximada a una ESTIMULO FEMENINO ESTIMULO MASCULINO AUSENCIA DE ESTIMULO
distribucion en forma de campana, la curva acumulada toma la forma de una ojiva Fig.3.13 Promedio de presiones de barrotes en tres grupos de ratas blancas (Runyon y Kosacoff,
(fig. 3.9).
1965).
La curva de .Ia figura 3.12(c) es positivamente sesgada y la figura 3.12(a) representa
un sesgo negatIvo extremo. ~
c
No siempre es posible determinar a simple vista si una distribucion es 0 no z
UJ
sesga~a. Existe un metodo ,matematico preciso para determinar la direccion y f­
l:ll
magnitud del sesgo; pero esta fuera del alcance de este libro realizar una discusion a
en
detailada de este punto. Sin embargo, en el capitulo 5 esbozaremos el procedimiento ~
:i
para determinar la direccion, si bien no la magnitud, del sesgo. a
l:ll
UJ
C
Z
a
3.9 Otras representaciones graficas U
a:
a

Fig. 3.14 Proporcion de bolitas de a
Hemos estudiado en este capitulo la representacion grafica de las distribuciones de a:
alimentos obtenidas por animales en o,

frecuen~ias. Sin embargo, los cientificos del comportamiento recogen frecuentemente cada categoria de la jerarquia OBA
1 2 3 4
otros tipos de datos. Se estudiaran brevemente otras representaciones graficas de (para nueve animales en cada catego­

ria). (Runyon y Turner, 1964.)


CATEGORIA DENTRO DE LA JERARQUIA
tales datos.
DISTRIBUCION DE FRECUENCIAS Y TECNICAS DE REPRESENTACION GRAFICA 57
56 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

altamente competitivo y se estudiaron varias dimensiones del comportamiento. Para Terminos para recordar
determinar si una medida, olfateo de la bandeia con alimentos (OBA), era una
medida valida del control alimentario, los anirnale-s fueron ordenados por categorias distribucum negativamente sesgada
desde el superior hasta el inferior en funcion del numero de OBAs observados. Se abscisa ( eje X)
deterrnino enseguida el mimero de bolitas de alimento obtenidas por los animales en al azar (aleatoria) distribucion platicurtica
cada categoria. La figura 3.14 revela una clara tendencia decreciente en el numero de curva de frecuencias distribucion positivamente sesgada
bolitas de alimento obtenidas por los animales que fueron sucesivamente inferiores distribucum sesgada
curva normal
en la jerarquia correspondiente al OBA. frecuencia acumulada
diagrama de barras
distribu~ion de frecuencias histograma
distribucion de frecuencias acumuladas mutuamente excluyente
Resumen del capitulo distribucion de frecuencias agrupadas ojiva
distribucion de porcentajes acumulados ordenada (eje Y)
En este capitulo se trato de los procedimientos empleados para «dar sentido» a una distribucion de proporciones acumuladas porcentaje acumulado
masa de datos. Se mostro la forma de obtener las distribuciones de frecuencias de proporcion acumulada
distribucion Ieptocurtica
datos y se presentaron varias tecnicas de representacion grafica, Cuando los datos
estan muy dispersos, a muchos de ellos les corresponde una frecuencia cero; y si no distribucion mesocurtica
hay indicacion clara de tendencia central, se acostumbra agrupar los datos en
intervalos de clase. A la distribucion resultante se le llama distribucion de frecuencias
agrupadas.
Se discutieron y determinaron las bases para lIegar a una decision acerca de las
unidades de agrupamiento que se deben emplear y los procedimientos para construir
una distribucion de frecuencias agrupadas. Se vio que los limites verdaderos de un in­
tervalo de clase se obtienen en la misma forma que los limites verdaderos de un 1. Hallar los limites verdaderos, los puntos medios y la amplitud de intervalopara cada uno
dato. Se mostraron los procedimientos para convertir una distribucion de frecuencias de los siguientes intervalos de clase.
en una distribucion de frecuencias acumuladas y en una distribucion de porcentajes b) 6-7 c) 0-2 d) 5-14
a) 8-12
acumulados. e) (- 8)-( - 2) f) 2.5-3.5 g) 1.50-1.75 h) (-3)-(+3)
Se revisaron tarnbien las diferentes tecnicas de representacion grafica empleadas
en las ciencias del comportamiento. La finalidad basica de la representacion grafica 2. Para cada uno de los siguientes conjuntos de medidas, encontrar: (a) I~ mejor amplitud
consiste en proporcionar ayudas visuales para pensar y discutir los problemas de intervalo de clase (i), (b)los lirnites aparentes del intervalo inferior, (c) los limites verdaderos
estadisticos. El objetivo primario es el de presentar los datos de una manera clara y de ese intervalo, (d) el punto medio de ese intervalo.
sin ambigiiedades, de modo que ellector pueda captar a simple vista las relaciones i) 0 a 106 ii) 29 a 41 iii) 18 a 48

que se desea describir. IV) - 30 a + 30 v) 0.30 a 0.47 vi) 0.206 a 0.293

Se ha estudiado:
3. Dada la siguiente lista de calificaciones obtenid~s e~ u~ ,examen de es.ta~istica: utilicese
1. Los artificios empleados por personas carentes de escnipulos para engafiar al i = 5paralos intervalos de clase y: (a)encuentrense.la distribucion de :recuencIas, ~b) ?all~~se los
lector inexperto. lfmites verdaderos y el punto medio de cada intervalo; (c) obtengase la distribucion de
2. El uso del diagrama de barras con variables de escalas nominales y ordinales. frecuencias acumuladas; y (d) hallesela distribuci6n de porcentajes acumulados.
3. EI uso del histograma y de la curva de frecuencias con variables continuas y
discontinuas de escalas de razones 0 de intervalos. CALIFICACIONES EN UN EXAM EN DE ESTADISTICA
4. Varias formas de datos normalmente distribuidos, distribuciones simetricas no
88 79 92 86 87 83 78 40 67
normales, y distribuciones asimetricas 0 sesgadas. 63
76 46 81 92 77 84 76 70 66
68
5. Finalmente, se han estudiado y mostrado algunas representaciones graficas de 75 98 81 82 81 87 78 70 60
77
datos, diferentes a las distribuciones de frecuencias, que se emplean comunmente 52 82 77 81 77 70 74 61
94 79
en las ciencias del cornporramiento.
DlSTRIBUCION DE FRECUENCIAS Y TECNICAS DE REPRESENTACION GRAFICA 59
58 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

4. Utilizando los datos del ejercicio 3, hallense distribuciones de frecuencias con:


14. Dibujense las representaciones graficas apropiadas para cada uno de los tres ejemplos del
a) i =' 1 (distribucion de frecuencias no agrupadas) b) i = 3 ejercicio 16, capitulo 2, usando sus propios datos hipoteticos.

c) i = 10 d) i = 20
Discutanse las ventajas y desventajas del empleo de estas amplitudes. 15. Tomar un par de dados, lanzarlos 100 veces y anotar la suma de los numeros que
aparecen en la cara superior de los dos dados en cad a lanzamiento. Construir luego un
5. Dada la siguiente Iista de mimeros: (a) construir una distribucion de frecuencias
diagrama de barras que muestre el numero de veces que ocurre cad a suma.

agrupadas; (b) indicar 101 verdaderos Iimites y el punto medio de cad a intervalo (indicar la

amplitud de intervalo empleado); y (c) comparar los resultados con los de los ejercicios 3 y 4.

16. Los mimeros que siguen corresponden a las ventas mensuales realizadas por cinco
6.3 8.8 7.9 9.2 8.6 8.7 8.3 7.8 4.0 6.7 empleados de un establecimiento comercial:
6.8 7.6 4.6 8.1 9.2 7.7 8.4 7.6 7.0 6.6
7.7 7.5 9.8 8.1 8.2 8.1 8.7 7.8 7.0 6.0
9.4 7.9 5.2 8.2 7.7 8.1 7.7 7.0 7.4 6.1 VENOEDOR VENTAS($)
VENOEDOR VENTAS ($)
6. Algunos intervalos de c1aseen una distribucion de frecuencias que muestra el rendimien­
Srta. Reyes 22500 Sr. Gonzalez 22100
to del maiz por hectarea cultivada, son 15-21,8-14,1-7. (a) i,Cual es la amplitud de intervalo?
Sr. Martinez 17900 Srta. Parra 20700
(b) i,Cuales son los Iimites verdaderos inferior y superior de cada intervalo? (c) i,Cual es el
punto medio de cada intervalo? Srta. Perez 21400

7. Partiendo del presupuesto anual del gobierno de su pais para el presente afio, muestrese
la asignacion de fondos a los divers os sectores de la administracion por medio de un diagrama
Dibujar graficas para tratar de dar verosimilitud a los siguientes propositos:
de barras.
a) El gerente de ventas quiere dar la impresion al duefio de la tienda de que todos los
8. Construir una distribucion de frecuencias agrupadas, utilizando 5-9 como intervalo de vendedores a su cargo trabajan con la misma eficiencia maxima.
c1ase inferior, para los niimeros de la siguiente tabla. Hallar la amplitud, el punto medio y los b) EI gerente de ventas desea estimular al senor Martinez para que realice un mayor
Iimites verdaderos del intervalo de c1ase superior. esfuerzo.
c) El duefio de la tienda quiere incitar al gerente de ventas a obtener mejores resultados.
67 63 64 57 56 55 53 53 54 54

45 45 46 47 37 23 34 44 27 44

Dibujar una grafica con los datos del ejercicio 16 que presente el estado real del negocio.
45 34 34 15 23 43 16 44 36 36

35 37 24 24 14 43 37 27 36 26

25 36 26 5 44 13 33 33 17 33
18. A continuacion se muestran las calificaciones obtenidas por dos grupos de escolares en
una pruebade aptitud para la lectura.

9. Repitase el ejercicio 8, utilizando 3-7 como intervalo de c1ase inferior. Comparese la


distribucion de frecuencias resultan te con la de los ejercicios 8, 10 y 11.
INTERVALO GRUPO A GRUPO B INTERVALO GRUPO A GRUPO B
10. Repetir el ejercicio 8, utilizando 4-5 como intervalo de c1ase inferior. f
DE CLASE f f DE CLASE f
11. Repetir el ejercicio 8, utilizando 0-9 como intervalo de c1ase inferior.
50-52 5 2 29-31 9 22
12. Dar un ejemplo de cada una de las siguientes distribuciones: 11
47-49 12 3 26-28 6
a) normal b) en forma de U c) positivamente sesgada 9
44-46 18 5 23-25 4
d) negativamente sesgada e) rectangular f) bimodal
3 6
41-43 19 8 20-22
38-40 26 12 17-19 1 4
13. Dada la siguiente distribucion de frecuencias de los pesos de 96 estudiantes (en libras),
35-37 19 24 14-16 2 2
dibujar el histograma correspondiente.
32-34 13 35 -
-
137 143
INTERVALO INTERVALO

DE CLASE DE CLASE

160-164 1 130-134 17 a) Construir en la misma grafica una curva de frecuencias para cada uno de estos
155-159 3 125-129 11
grupos.
150-154 10 120-124 8
b) Describir y comparar las distribuciones.
145-149 6 115-119 3

140-144 14 110-114 1

22

Describir los tipos de distribuciones que se esperaria obtener al representar graficarnente:


135-139
a) EI ingreso anual de las familias espaiiolas.

60 ESTADiSTICA PARA LAS CIENCIAS SOCIALES DlSTRIBUCI6N DE FRECUENCIAS Y TECNlCAS DE REPRESENTACI6N GRAFICA 61

b) Las estaturas de los varones espafioles adultos.


PORCENTAJE DE NINOS CUYO PESO AL NACER
c) Las estaturas de las espafiolas adultas.
FUE MENOR DE 2500 GRAMOS
d) Las estaturas de los espafioles, varones y mujeres, combinadas en una sola grafica,

flESULTADO GENERAL
HIJOS DE MADRES DROGADICTAS EN EL HOSPITAL·
20. Dada la siguiente distribucion de frecuencias de las calificaciones obtenidas por 73 ANO
estudiantes en un examen parcial, dibujar una curva de frecuencias.
1960 69.0 13.9
1961 52.7 15.9
1962 56.8 15.8
INTERVALO INTERVALO

1963 40.9 15.1


DE CLASE f DE CLASE f

1964 29.0 14.4


1965 50.0 12.6
95-99 2 65-69 11

1966 54.8 14.2


90-94 2 60-64 6

1967 52.0 14.7


85-89 5 55-59 3

1968 45.6 14.6


80-84 9 50-54 0

1969 48.0 12.7


75-79 16 45-49 1

70-74 18
.. Se incluye a los babes drogadictos.

24. Los siguientes datos corresponden al numero de botellas de leche vendidas en un


21. Para los datos del ejercicio 20, dibujar una curva de frecuencias acumuladas,
supermercado en 52 sabados consecutivos.
22. Un equipo de investigadores del New York Metropolitan Medical Center (Zelon, Rubio
y Wasserman, 1971) reunio datos acerca de la incidencia de la drogadiccion entre las madres de 67 75 63 71 65 73 71 88 61
nifios recien nacidos y tambien entre los propios nifios. La tabla siguiente muestra el total 65 56 62 58 72 66 76 77 75
de nifios que nacieron vivos en un periodo de diez afios, y tambien el mimero de mad res 61 70 64 71 63 61 63 64 62
drogadictas. Calcular el porcentaje de mad res drogadictas para cad a afio. Representar 69 60 66 78 92 64 64 69 64
graficamente la incidencia porcentual en el periodo de diez afios, lHubo al parecer algun 65 75 72 67 88 74 65 73
cambio en la incidencia de drogadiccion de las madres en este periodo de diez afios? 78 62 68 69 67 57 65 58

a) EI gerente decide poner en venta solamente 70 botellas durante los sab.a.dos.


TOTAL NII'iiOS Suponiendo que estos resultados se repitan el proximo afio, lcual es la probabilidad
AI'iiO NACIDOS VIVOS TOTAL MADRES DROGADICTAS (0 sea, el porcentaje de las veces) en que no se pueda satisfacer la demanda?
b) Agrupar los datos de las ventas en una distribucion de frecuencIas tomando como
1960 4284 26 intervalo de c1ase inferior 56-68.
1961 4396 36 c), Preparar una distribucion de frecuencias acumuladas y una distribucion de porcen­
1962 4290 43 tajes acumulados basandose en la anterior distribucion de frec~encias.
1963 4335 44 d) Agrupar los datos de las ventas en una distribucion de frecuencias tomando como
1964 3923 31
intervalo de c1ase inferior 55-59. Preparar una distribucion de frecuencias acumula­
1965 3615 28
das y una distribucion de porcentajes acumulados tomando como base esta distr~bu­
1966 3089 31
cion de frecuencias. Comparar las distribuciones resultantes con las obtemdas
1967 2688 47
1968 2283 46 anteriormente.
1969 2367 50 25. Dibujar una curva de frecuencias para la distribucion de frecuencias obtenida en el
ejercicio 8.
23. Ademas de ser drogadictos al nacer, muchos hijos de mad res drogadictas parecen 26. Dibujar una curva de frecuencias para la distribucion de frecuencias obtenida en el
desarrollar ciertas diferencias respecto a los hijos de mad res no drogadictas. La tabla siguiente ejercicio 9. Cornparar con la que se obtuvo en el ejercicio 25.
muestra el porcentaje de bebes drogadictos cuyo peso al nacer fue rnenor de 2500 gramos, as! 27. Dibujar una curva de frecuencias acumuladas para la distribucion de frecuencias del
como los porcentajes de nifios nacidos con un peso rnenor que 2500 gramos dentro del total de
ejercicio 8.
bebes nacidos en el hospital. Dibujar una grafica que muestre el porcentaje de nifios con bajo
peso entre los hijos de mad res drogadictasy entre todos los nifios nacidos en el hospital 28. Dibujar una curva de frecuencias acumuladas para la dist:ib~c!on de frecuencias
durante el periodc de diez afios, lExiste una diferencia coherente entre ambos porcentajes? obtenida en el ejercicio 9. Comparar con la que se obtuvo en el ejercicio 27.
[63J
62 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

29. Los datos acerca de la tasa de nacimientos se expresan general mente en mimero de
nacimientos por mil habitantes. La tabla adjunta muestra la tasa de nacimientos al final de
cada decada desde el comienzo del siglo, redondeando al entero mas proximo. (Tornado de:
Commission on Population Growth and the American Future.)
Percentiles

NUMERO DE NACIMIENTOS

ANO POR 1000 HABITANTES

1900 32

1910 30

1920 28

1930 21

1940 19

1950
1960
24

24

Introduccion
1970 18

Supongamos que un escolar regresa del colegio y exclama: «.Obtuve. ~na califi.c~ci6n
de 127 puntos en mi prueba de aptitud», (,Cual seria la reaccion familiar? (,Fellclt~rle
a) Expresar estos datos en una' grafica lineal. por haber obtenido tan magnifica calificacion? (,Censurarleyor no ~a~er c?~segUldo
b) i,Se aprecia alguna tendencia general en la tasa de nacimientos? una nota mas alta? (,0 no decir nada hasta conocer mejor la distribucion de las
*30. Imaginese que tenemos una poblacion formada par siete numeros: 0, 1, 2, 3, 4, 5, 6. calificaciones dentro de su clase 0 grupo? Si el lector ha seguido con provecho 10
Escribase cada uno de estos nurneros en una pequefia tarjeta y coloquense todas las tarjetas expuesto hasta ahora, elegiria sin duda la ultima de estas tre~ alternati~as:
dentro de una bolsa. Luego se extrae una de elias, se anota el numero, y se vuelve a a introducir Debe quedar claro que una calificacion carece por si misma de ~lgmfi~a~o.
en la bolsa. Despues se saca una segunda tarjeta y se suma el numero resultante al primero. Se Unicamente 10 adquiere cuando se la compara con una escala 0 base patron. AS1, SI el
continua extrayendo en esta forma pares de tarjetas y sumando los resultados hasta haber escolar voluntariamente agrega: «El 79 % de los estudiantes obtuvo una calificacion
obtenido todas las combinaciones posibles de estos siete numeros tornados dos ados. menor que la mia», estara proporcionando un marco de referencia para interpretar la
La siguiente tabla muestra todos los resultados posibles al extraer muestras de N = 2 de calificacion, Realmente habra citado el rango percentil de su calificacion. Entonces, el
esta poblacion de siete numeros. Los valores que aparecen en la tabla corresponden a la surna
ranqo percentil de una calificacion representa el porcentaje de los c~sos d~ntro de un
de los dos numeros.
grupo que alcanzaron valores iquales a menores que el citado. AS1, decir que una
calificacion de 127 tiene un rango percentil de 79 significa que el 79 % del grupo '
PRIMERA EXTRACCION obtuvo una calificacion igual 0 menor que 127. Digamos de paso que cada
calificacion se considera como un punto hipotetico sin dimension, de manera que
z 0 1 2 3 4 5 6
a seria igualmente significativo decir que el 21 % del grupo obtuvo una calificacion
U
u 0 0+0=0 1+0=1 2+0=2 3+0=3 4+0=4 5+0=5 6+0=6 superior a 127.
«
a: 1 0+1 = 1 1+ 1= 2 2+1=3 3+1=4 4+1=5 5+1=6 6+ 1=7
~
LU 2 0+2=2 1+2=3 2+2=4 3+2=5 4+2=6 5+2=7 6+2=8
«
Cl
3 0+3=3 1+ 3= 4 2+3=5 3+3=6 4+3=7 5+3=8 6+3=9
4 0+4=4 1+4=5 2+4=6 3+4=7 4+4=8 5+4=9 6 + 4 = 10
Z
=>
(:J 5 0+5=5 1+5=6 2+5=7 3+5=8 4+5=9 5 + 5 = 10 6 + 5 = 11
Percentiles acumulados y rango percentil
LU
en 6 0+6=6 1+6=7 2+6=8 3+6=9 4 + 6 = 10 5+6=11 6 + 6 = 12

Obtencion del rango percentil de calificaciones


a) Obtener una distribucion de frecuencias no agrupadas de las 49 sumas. a partir de una practica de porcentajes acumulados
b) Construir un histograma para la distribucion de frecuencias.
c) Observese que la distribucion original de sumas fue rectangular porque todas elias se En el capitulo 3, se estudio como construir distribuciones de frecuenci~s a~um~.ladas
presentan con la misma frecuencia. Comparar la forma de la distribucion original y de porcentajes acumulados. Si representaramos graficamente la distribucion de
con la forma de la distribucion de frecuencias de las sumas. porcentajes acumulados, podriamos leer los rangos percentiles directamente en la
rafica, ya que el porcentaje acumulado correspondiente a una calificacion dada es 10
• Todos los ejercicios que se utilizan en futuras discusiones van precedidos de un asterisco.
64 ESTAOISTICA PARA LAS CIENCIAS SOCIALES PERCENTILES 65

mismo que el rango percentil de esa calificaci6n. Notese que tambien es cierto el
Recuadro 4.1 reciproco; 0 sea, que dado un rango percentil podriamos leer la calificaci6n
100 r " " - - - - - - - - - - - - -.......- - - ,
correspondiente. La figura 4.1 muestra en forma grafica la distribuci6n de porcenta­
jes acumulados presentada en la tabla 3.4.
o
o
:)
:l
~ 100
:l PERCENTIL 90
U
<{
50 0
W
0
~ :):J' 80

Z :If=
W ~z
U :lw
a: UU
o0.. <{ffi
60 -
wo..

""'0
~t.9
zz
W<{
127
18SEMANA ua: 40 -
a: ~
DE EXAMENES 0
FINALES 0..

SEMESTRE ACADEMICO (EN SEMANAS) 20

I I
89.5 94.5 99.5 104.5 109.5 114.5 119.5 124.5 129.5 134.5 139.5 144.5 149.5 154.5
CALIFICACION EN EL LIMITE SUPERIOR VERDADERO DE CADA INTERVALO

Fig. 4.1 Representacion grafica de una distribucion de porcentajes acumulados. (Nola: EI


porcenlaje acumulado correspondienle a una calificacion dada es igual al rango percentil de
esa calrficacion.)

Como ilustracion, imaginemos que se trata de determinar el rango percentil de


una calificaci6n de 127. Localizamos el 127 en el eje de las abscisas y levantamos una
perpendicular en ese punto, la cual corta a la curva. Para el punto de interseccion, se
lee directamente en la escala de la izquierda que el rango percentil es aproximada­
mente 79. Por otra parte, si desearnos conocer la calificaci6n correspondiente a un
percentil dado, podriamos invertir el procedimiento. Por ejemplo, l,cual es la
calificaci6n correspondiente al percentil 90? Situamos el percentil 90 en el eje de
ordenadas, trazamos una horizontal hasta encontrar a la curva, y desde este punta
dibujamos una recta perpendicular al eje de las abscisas para leer en este el valor
buscado en la escala de calificaciones. En el presente ejemplo, puede verse que la
Se ha afirrnado frecuentemente que los suicidios de estudiantes son resultado de la
calificaci6n correspondiente al percentil 90 es aproximadarnente igual a 135.
tension producida por los exarnenes linales. En un prolongado estudio realizado en la
Universidad de California, Berkeley, se investigaron diversos factores relacionados con
tales. suicidios. La figura de la parte superior muestra que el porcentaje de suicidios fue Obtencion directa del rango percentil
maxlI~o en. las semanas iniciales del sernestre, se estabilizo a mediados del mismo y
mostro un incremento moderado durante su ultimo tercio. AS1, al contrario de 10 que de una calificacion
supone la gente, el periodo de mayor peligro parece ser el del comienzo y no el dellinal
del semestre. menudo se pide determinar el rango percentil de una calificaci6n sin la ayuda de
una curva de porcentajes acumulados, 0 con una precision mayor de la que es posible
Seiden, R. H., "Camp~~ tragedy: a st~ry of student suicide», Journal oj Abllormllllllld Social Psychology, 1966, obtener mediante una representaci6n grafica. Para hacerlo, es necesario de ordinario
71. 389-399. Copynght (g por la Amencan Psychological Association. Reproducido con autorizaci6n. terpolar dentro de la columna de frecuencias acumuladas para ccterminar la
Cuencia acumulada precisa que corresponde a una calificaci6n dada.
66 ESTADfsTICA PARA LAS CIENCIAS SOCIALES PERCENTILES 67

Utilizando la distribucion de frecuencias agrupadas de la tabla 4.1, determinemos casos que caen en 0 por debajo del limite inferior verdadero. Sumando estos dos
directamente el rango percentil de una calificaci6n de 127, valor que antes hemos -. . eros encontrarnos que a la calificaci6n de 127 Ie corresponde exactamente una
num , . I
determinado de forma aproximada por medio de la curva de porcentaje acurnu­ frecuencia acumulada de 86.5. Sustituyendo 86.5 en la formula (4.1), obtenemos 0
lados. Lo primero que debemos tener en cuenta es quela calificacion de 127 esta dentro siguiente:
del intervalo 125-129. La frecuencia acumulada total por debajo de ese intervalo es
86.5
82. Puesto que el rango percentil de una calificacion se define simbolicarnente como Rango percentil de 127 = - x 100 = 78.64
110
Jacum Observara ellector que cuando se redondea est a respuesta al percentil m~s. cerc~no,
Rango percentil = x 100 (4.1)
N concuerda con la aproximaci6n obtenida mediante el uso de la representacion grafica
de una distribucion de porcentajes acumulados (fig. 4.1). .
INTERVALO Tabla 4.1 Distribucion de frecuencias agrupadas y La figura 4.2 resume graficamente los procedimientos utilizados en la obtencion
DE CLASE f f ACUMULADA distribucion de frecuencias acumuladas de calificacio­ de la frecuencia acumulada correspondiente a una calificacion dada. Se advertira que
nes obtenidas en una prueba escolar (datos hipote­
150-154 2 110 el intervalo 124.5-129.5 esta dividido en 5 unidades iguales que cor~espon.de? .a .Ias
ticos).
145-149 2 108 calificaciones dentro del intervalo, mientras que la escala de frecuencias est a dividida
140-144 3 106 en 9 unidades iguales correspondientes a las 9 frecuencias dentro de ese intervalo. Lo
135-139 5 103 que de hecho estamos realizando, al obtener la frecuencia .corre.spondiente a una
130-134 7 98
calificaci6n es una transformacion lineal de una escala de calificaciones a una escala
125~129 . 1-­ -9 91
120-124- ' 9 62 de frecuenc'ias, 10 que es analogo a convertir grados Fahrenheit a grados Celsius, 0
115-119 13 73 viceversa.
\.110-114, 60 ESCALA DE
17
CALIFICACIONES DENTRO
( 105-109 J 14 43
DEL INTERVALO
100-104 12 29
124.5 129.5
95-99 4 17
90-94 5 13
85-89 5 8
ESCALA DE FRECUENCIAS
80-84 3 3 fACUM EN 0 DEBAJO DEL
DENTRO DEL INTERVALO
INTERVALO IGUAL A 82

N = 110 a
4.5 9

Fig. 4.2 Representacion grafica de los procedimientos utilizados en la obtencion de la frecuencia

acumulada correspondiente a una calificacion dada.

es necesario encontrar la frecuencia acumulada precisa correspondiente a la califica­


cion de 127. Es claro que la frecuencia acumulada correspondiente a UDa calificacion La expresion (4.2) constituye una formula generalizada para calcular el rango

de 127 esta situada entre 82 y 91, que son las frecuencias acumuladas en los dos percentil de una calificacion dada.

extremos del intervalo. Es preciso ahora interpolar dentro del intervalo 125.5-129.5
X - Xli)
para hallar la frecuencia acumulada exacta que corresponde a una calificacion de III acum + ( - - i- (Ii)
127. Al hacerlo asi, estamos realmente tratando de determinar la proporcion de ia x 100, (4.2)
Rango percentil = N
distancia que debemos recorrer dentro del intervalo para hallar el rnimero de casos
que esten incluidos hasta una calificacion de 127.
Una calificacion de 127 esta situada 2.5 unidades por encima del limite real donde
inferior del intervalo (esto es, 127 - 124.5 = 2.5). Puesto que hay 5 unidades de ill acum =frecuencia acumulada en el limite inferior verdadero del intervalo
calificacion dentro del intervalo, una calificacion de 127 esta a 2.5/5 de la distancia que contiene a X,
total del intervalo. Haremos ahora una suposicion muy importante, y es que los
X = calificacion dada,
casos 0 frecuencias dentro de un intervalo particular estan uniformemente distribui­
Xli = calificacion en ellimite inferior verdadero del intervalo que contie­
dos en dicho intervalo. Puesto que hay 9 casos dentro del intervalo, podemos ahora
calcular que una calificaci6n de 127 es (2.5/5) x 9,0 sea, el caso que ocupa ellugar 4.5 ne a X,
dentro del intervalo. En otras palabras, la frecuencia 4.5 en el intervalo corresponde i = longitud del intervalo,
exactamente a una calificacion de 127. Hemos visto ya, sin embargo, que hay 82 Ii = numero de casos dentro del intervalo que contiene a X.
68 ESTADfSTICA PARA LAS CIENCIAS SOCIALES PERCENTILES . 69

4.2.3 Obtencion de la calificacion correspondiente

a un valor percentil dado


XII = calificacion en e1limite inferior verdadero del intervalo que contie­
ne af acum,
Imaginemos que el escalar, en vez de indicar su calificacion, presenta su rango i = longitud del intervalo,
percentil, y dice que su calificacion esta en el percentil 96. l,Cual es la calificacion? f acum = frecuencia acumulada de la calificacion,
Para obtener la respuesta, debemos interpolar en sentido inverso, de la escala de
fll = frecuencia acumulada en el limite inferior verdadero del intervalo
frecuencias acumuladas a la escala de calificaciones. Lo primero que es preciso
que contiene a f acum,
conocer es la frecuencia acumulada correspondiente al percentil 96. Se deduce
algebraicamente de la formula (4.1) que Ii = mimero de casos dentro del intervalo que contiene a f acum.
Para ilustrar el uso de la formula, utilizaremos un ejemplo que nos es ya familiar.
rango percentil x N
f acum = . (4.3) l,Cual es la calificacion correspondiente al percentil 78.64? En primer lugar, emplean­
100 do la formula (4.3), obtenemos
Puesto que interesa una calificacion en el percentil 96 y el valor de N es 110, la 78.64 x 110
frecuencia acumulada de una calificacion en el percentil 96 es f acum = = 86.50
100
96 x. 110
f acum = = 105.6 La calificacion en el limite inferior verdadero del intervalo que contiene a la
100 frecuencia 86.50 es 124.5; i es 5;facum en ellimite inferior verdadero del intervalo es
82; y el numero de casos dentro del intervalo es 9. Sustituyendo estos valores en la
En la tabla 4.1 se ve que la frecuencia 105.6 esta en el intervalo cuyos limites
verdaderos son 139.5-144.5. De hecho, son 2.6 frecuencias dentro del intervalo, formula (4.4), obtenemos:
puesto quefacumulada en ellimite inferior verdadero del intervalo es 103, que es 2.6 5(86.50 - 82)
menor que 105.6. Hayen total tres casos dentro del intervalo. Asi, la frecuencia 105.6 Calificacion en eI percentil 78.64 = 124.5 + 9
esta a 2.6/3 dentro del intervalo cuyo limite inferior verdadero es 139.5 y cuyo limite
= 124.5 + 2.50 = 127.00.
superior verdadero es 144.5. En otras palabras, esta a 2.6/3 en el recorrido formado
por 5 unidades de calificacion. Entonces, expresando 10 anterior en terrninos de Notese que esta es la calificacion de la cual obtuvimos previarnenteel rango percentil
unidades de calificacion, resulta que es necesario recorrer (2.6/3) x 5, 0 sea, 4.33 78.64; y que esta formula ilustra, de paso, un buen procedimiento para comprobar la
unidades de calificacion a partir del limite inferior verdadero del intervalo. Sumando exactitud de nuestros calculos, En otras palabras, siempre que se determina el rango
4.33 a 139.5, obtenemos la calificacion en el percentil 96, que es 143.83. percentil de una calificacion, puede tomarse esa respuesta y determinar la calificacion .
La figura 4.3 representa graficarnente el procedimiento seguido para efectuar la correspondiente a ese valor percentil. Debera obtenerse la calificacion original.
transformacion lineal de unidades en la escala de frecuencias a unidades en la escala
Analogamente, siempre que se obtenga una calificacion correspondiente a un rango
de calificaciones. Para quienes interese un metodo general de determinar la califica­
percentil dado, puede partir de esa respuesta y determinar eI rango percentil de esa
cion correspondiente a un percentil dado, resultara util la formula (4.4):
calificacion. Debera volverse siempre al rango percentil original. Si no ocurre asi, ella
indica que se ha cometido un error. Es preferible entonces repetir el procedimiento
. " .
Calificacion en un percentil dado = XII + i(f acum - fll acum)
,(4.4) sin tener en cuenta la respuesta precedente, en vez de intentar hallar el error cometido
Ii al obtener la solucion anterior. Estos errores son frecuentemente del tipo del
«corrector de pruebas»; no son Iaciles de descubrir, y se tarda mucho tiempo en
f ACUM EN 0 DEBAJO DEL
INTERVALO IGUAL A 103
ESCALA DE FRECUENCIAS localizarlas, 10 que produce una gran frustracion,
DENTRO DEL INTERVALO
a 3

ESCALA DE
CALIFICACIONES DENTRO
Rango percentil y grupo de referenda
DEL INTERVALO
139.5 143.83 144.5
Asi como una calificacion carece de sentido en abstracto, tampoco 10 tiene un rango
Fig. 4.3 Representacion grafica del procedimiento utilizado para la obtencion de la calificacion pel~cel1til.
Este ultimo debe estar siempre relacionado con algun grupo de referencia.
correspondiente a una Irecuencia dada dentro del intervalo. si un compaiiero afirma que ha obtenido un rango percentil de 93 en una prueba
70 ESTADfsTICA PARA LAS CIENCIAS SOCIALES PERCENTILES 71

de matematicas, no debera impresionarnos demasiado si el grupo de referencia esta Resumen del capitulo
formado por personas que solamente han recibido ensefianza primaria. Por el
contrario, si el grupo de referencia esta formado por personas que poseen un Se ha visto en este capitulo que una calificacion carece de significado por si misrna a
doctorado en maternaticas, nuestra actitud debera ser muy distinta. menos que se la compare con una escala 0 base patron. A menudo se transforman las
Muchas pruebas normalizadas que se emplean en psicologia, ensefianza e calificaciones en unidades de la escala de ranges percentiles para disponer de una
industria dan normas separadas para diversos grupos de referencia. La tabla 4.2 base sencilla y cornprensible de interpretacion y comparacion.
muestra las calificaciones originales equivalentes a datos percentiles seleccionados Vimos que:
en una prueba ampliamente utilizada en el ingreso, a centros de ensefianza
superior. El rango percentil correspondiente a una calificacion y la calificacion correspon­
Podra observarse que una persona que obtiene una calificaci6n de 50 en esta diente a un percentil dado pueden obtenerse en forma aproximada por medio de
prueba, tendra rangos percentiles de 25,35,40 y 50 cuando se hace la comparaci6n su­ una grafica de porcentajes acumulados.
cesiva con los grupos de referencia de ciencias biol6gicas, ciencias medicas, agricultura El metodo de calculo directo perrnite una localizacion mas precisa del rango
y asistencia social, respectivamente. percentil de una calificacion y de la calificacion correspondiente a un percentil
dado. Estos metodos se discutieron y aplicaron en el texto. (Ver tablas 4.3 y 4.4.)
Un ran go percentil carece de sentido de modo abstracto. Siempre debe estar
Tabla 4.2 Calilicaciones originales equivalentes a datos percentiles seleccionados en la Prueba de
re1acionado con algun grupo de referencia.
Analogias de Miller para ocho grupos universitarios y de estudios tecnicos. (Reproducida con permiso.
Copyright por la Psychological Corporation, Nueva York, N.Y. Todos los derechos reservados.) Tabla 4.3 Resumen del procedimiento: obtencion de la caiiflcacion correspondiente a un range
percentil dado.
<{
c: Ul
::> <{ <{
--' t­ <{ c: INTERVALO f Problema: HaJlarla calificaci6n correspondiente a un rango percentil de 75.17.
f= Ul --' UlU UlUl Li ::> 0
....I

~
(/)(/)
::> <{­ <{w Ul DE CLASE f ACUM
Z <{(/) <{<{ _l'J ---' z--' <{ !;( I
w
U Lit) U -U
U_ uO U<{ ~<{ ~ c:
U
w
UJ
0 PASOS:
c: Z_ c: ZCl Z--' ZU- (/)­
_U o w c: c:
w(/) o Ww wO w
_0 (/)0 - t- w 41-43 98
w
n, uU: <{ Li~ Lim UUl <{(/) 9>-:J Cl
UJ
n, 1. Sumar la columna f para obtener N. N = 98
2. Hallar las frecuencias acumuladas por adici6n sucesiva de las frecuencias
99 93 89 92 88 90 81 87 84 99 38-40 2 97
desde el intervalo inferior hasta el superior. La ultima frecuencia acumu­
95 91 86 83 87 85 76 84 79 95 lada debe ser igual a N.
90 88 77 78 86 82 67 80 73 90 35-37 4 95
3. Multiplicar 75.17 por N y dividir por 100. Asi,
85 85 72 76 80 79 64 76 66 85
80 82 67 74 76 76 61 74 63 80 32-34 9 91
75.17 x 98
75 80 64 71 70 74 60 73 60 75 ---=73.67.
70 78 61 67 68 69 58 68 58 70 29-31 10 82 100
65 76 59 64 67 67 57 66 55 65
60 74 57 60 65 64 54 65 53 60 26-28 13 72 Esta es la frecuencia acumulada correspondiente a la calificaci6n desco­
55 70 56 58 63 63 nocida.
52 61 51 55
50 68 54 57 61 61 50 59 49 50 23-25 18 59 4. Hallar el intervalo de c1ase que contiene la frecuencia acumulada 73.67.
45 65 51 55 58 58 47 56 47 45 5. Restar del valor obtenido en el paso 3 la frecuencia acumulada en el
40 63 50 53 55 56 46 53 45 40 20-22 14 41 limite superior verdadero del intervalo contiguo inferior. 0 sea.
35 60 48 50 53 53 45 51 42 35 73.67 - 72 = 1.67. Estevalor nos indica que la calificaci6n buscada esta
30 58 43 47 52 51 41 46 40 30 17-19 11 27 1.67 frecuencias dentro del intervalo 28.5-31.5.
25 55 40 45 50 49 39 43 37 25 6. Dividir el valor encontrado en el paso 4 por la longitud del inter­
20 51 37 43 48 46 37 41 35 20 14-16 8 16 valo y multiplicar por la frecuencia observada en el paso 5. Asf,
15 47 34 41 47 44 32 38 32 15 (1.67/10) x 3 = 0.50.
10 43 31 34 41 39 27 11-13 5 8
35 30 10 7. Anadir el valor encontrado en el paso 6 a la calificaci6n en ellfmite inferior
5 39 26 30 37 32 22 29 25 5 verdadero del intervalo que contiene a la 73.67-esirna frecuencia acumu­
1 28 5 24 28 18 9 7 18 1 8-10 2 3 lada. As], 28.5 + 0.5 = 29.0, que es la soluci6n del problema.

N 251 125 103 84 229 116 145 558 N 5-7


MEDIA 66.7 53.6 57.6 61.5 60.2 49.4 57.7 49.6 MEDIA
OS 16.6 17.3 16.2 15.6 16.0 15.2 17.4 16.1 OS ;= 3 98
72 ESTADfSTICA PARA LAS CIENCIAS SOCIALES PERCENTILES 73

Tabla 4.4 Resumen del procedimiento: obtencion del rango percentil de una calificacion, 4. Empleando la tabla 4.1, calcular las calificaciones correspondientes a los percentiles
dados en el ejercicio 3.
INTERVALO f Problema: Hallar el rango percentil de una calificaci6n de 29.
DE CLASE ACUM 5. Un escolar nos informa de que ha obtenido una calificacion de 130 en una prueba patron
PASOS: de vocabulario. i,Que informacion adicional necesitaremos para interpretar esta calificacion?
41-43 98

1. Sumar la columna f para obtener N. N = 98. 6. Se hace referencia al ejercicio 18 del capitulo 3.
38-40 2 97
2. Hallar las frecuencias acumuladas por adici6n sucesiva de las frecuencias, a) Un estudiante del grupo A obtuvo una calificacion de 45 en la prueba de lectura.
desde el intervalo inferior hasta el superior. La ultima frecuencia acumu­
lada debe ser igual a N.
i,Cmil es su ran go percentil en el grupo?
35-37 4 95
b) i,CuaJ es el rango percentil de un estudiante del grupo B que tambien obtuvo la
3. Identificar el intervalo que contiene a la calificaci6n: 29.

calificacion de 45?
32-34 9 91 4. Restar de 29 la calificaci6n en ellfmite inferior verdadero de ese intervalo:
c) Combinar ambos grupos dentro de una sola distribucion de frecuencias y obtener el
29 - 28.5 = 0.5

rango percentil de una calificacion de 45. i,Que pasa con el rango percentil del
29-31 10 82
5. Observar la frecuencia dentro de ese intervale: 10. estudiante del grupo A? i,Que sucede con el rango percentil del estudiante del grupo
6. Dividir el valor encontrado en el paso 4 por la longitud del intervalo B? i,Por que?
26-28 13 72
y multiplicar por la frecuencia observada en el paso 5. Ast,

(0.5/3) x 10 = 1.67. Este valor representa la frecuencia dentro del inter­


7. Si colocasemos todas las calificaciones que aparecen en la tabla 4.1 en el interior de una
23-25 18 59 valo 28.5-31.5 correspondiente a una calificaci6n de 29.
bolsa, i,cual seria la probabilidad de que, haciendo una seleccion al azar, obtuvierarnos:
7. Observe la frecuencia acumulada que aparece en el intervalo contiguo
a) una calificacion igual 0 mayor que 131?
20-22 14 41 inferior: f acum = 72.
b) una calificacion igual 0 menor que 131?
8. Sumar el valor encontrado en el paso 6 al valor encontrado en el paso 7. c) una calificacion igual 0 menor que 84?
17-19 11 27
Asf, 1.67 + 72 = 73.67. d) una calificacion igual 0 mayor que 154?
14-16
9. Dividir el valor encontrado en el paso 8 por N y multiplicar por 100. As], e) una calificacion comprendida entre 117 y 133?
8 16

(73.67/98) x 100 = 75.17, que es la soluci6n del problema).


f) una calificacion igual 0 mayor que 148 0 igual 0 menor que 82?
11-13 5 8
8. Las siguientes preguntas se basan en la tabla 4.2.
a) Juan anuncia con satisfaccion que ha obtenido un ran go percentil «mayor» que el de
8-10 2 3

su amigo Pedro. Al investigar el hecho se encuentra que su calificacion en la prueba


fue realmente baja. i,Debe llegarse a la conclusion de que Juan mintio, 0 hay otra
5-7

explicacion posible?
i = 3 98
b) Maria obtuvo un rango percentil de 65 en la escala correspondiente a asistencia
social. i,Cual fue su calificacion? i,Que calificacion deberia haber obtenido para
alcanzar el mismo rango percentil en la escala correspondiente a ciencias fisicas?
c) La Escuela Mundial de Leyes emplea la Prueba de Analogias de Miller como uno de
los elementos para decidir sobre la admision. Ningun aspirante que obtenga un
Terminos para recordar
rango percentil inferior a 75 es tenido en cuenta para la admision, independientemen­
te de sus otras calificaciones. Asi, al percentil 75 se Ie puede llamar punto de
percentiles rango percentil «eliminacion». i,Que grupo de referencia esta mas comprometido en la decision?
i,Que calificacion constituye el punta de eliminacion para esta distribucion?
d) Una facultad de Medicina emplea tam bien el percentil 75 como punto de elimina­
cion. Un aspirante obtuvo una calificacion original de 62. i,CuaIes son sus posibilida­
des de ser tenido en cuenta para la adrnision?
Ejercicios
En la tabla de la pagina siguiente se muestra una distribucion de frecuencias de las estimaciones
hechas por la Agencia para la Protecci6n Ambiental, acerca del rendimiento en millas por galon
1. Empleando la figura 4.1, estirnar el percentil de las siguientes calificaciones:

de 60 autom6viles. En los ejercicios 9 a 14, damos el rendimiento en millas por gal6n de


a) 104.5 b) 112 c) 134

seis modelos. Determinar el rango percentil de cada uno.


2. Utilizando la tabla 4.1, calcular el rango percentil de las calificaciones dadas en el
ejercicio 1.
9. Chevette, 22 mpg. 10. Hornet wagon, 16 mpg.
3. Empleando la figura 4.1, estimar las calificaciones correspondientes a los siguientes
percentiles: Audi Fox, 24 mpg. 12. Vega Kammback, 19 mpg.
a) 25 b) 50 c) 75 Cadillac Eldorado, 11 mpg. 14. Toyota Corolla, 20 mpg.
PERCENTILES 75
74 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

b) i,Cual es la probabilidad (porcentaje de vec~s) de obtener una suma ~~yor que ~ 0


INTERVALO DE CLASE INTERVALO DE CLASE menor que 1O? [Sugerencia: el porcentaje acumulado para el limite supenor
verdadero de 9 es 88; por debajo, el limite superior de 5 es 43.]
L1MITES L1MITES f L1MITES L1MITES f
c) 'Que porcentaje de veces se obtendra una suma igual 0 menor que 2?
d)
~Que porcentaje de veces se obtendra una suma igual 0 mayor que 1O? .
APARENTES VERDADEROS f ACUM APARENTES VERDADEROS ACUM

28-29 27.5-29.5 1 60 18-19 17.5-19.5 6 46


e)
~Que porcentaje de veces se obtendra una suma igual 0 menor que 2? i,E igual 0
26-27 25.5-27.5 1 59 16-17 15.5-17.5 10 40
mayor que 10?

24-25 23.5-25.5 2 56 14-15 13.5-15.5 6 30

22-23 21.5-23.5 3 56 12-13 11.5-13.5 10 24

20-21 19.5-21.5 7 53 10-11 9.5-11.5 14 14

If = 60

Utilizando la misma tabla, hallar las millas por galon correspondientes a los rangos percentiles

dados en los ejercicios 15 a 20.

15. Rango percentil de 10. 16. Rango percentil de 75.


17. Rango percentil de 25. 18. Rango percentil de 18.
19. Rango percentil de 84. 20. Rango percentil de 16.
21. Supongase que el gerente de una empresa trata de compararlas calificaciones de 25

de sus empleados en una prueba de matematicas. Asignando una letra a cada empleado,

obtiene los siguientes resultados:

A. 55 F. 40 K. 50 P. 40 U. 40
B.50 G. 60 L. 45 Q. 35 V. 30
C. 35 H. 45 M. 25 R. 25 W. 45
D. 45 1. 50 N. 35 S. 20 X. 35
E. 40 J. 30 O. 55 T. 30 Y. 40
Calcular el rango percentil para cada empleado, utilizando i = 5 Ytomando como intervalo de

clase inferior 20-24.

22. EI gerente estudia ademas el numero de problemas de maternaticas que los empleados

resuelven por dfa, Para los mismos empleados, encuentra los siguientes resultados (a cad a

individuo Ie corresponde la misma letra del problema anterior):

A. 45 F. 30 K. 40 P. 30 U. 30
B. 40 G. 50 L. 35 Q. 25 V. 20
C. 25 H. 35 M. 15 R. 15 W. 34
D. 35 1. 40 N. 25 S. 10 X. 25
E. 30 J. 20 O. 45 T. 20 Y. 30
Calcular el rango percentil para cada persona y comparar con los rangos del ejercicio 21.
*23. Con referencia al ejercicio 30 del capitulo 3, construir las distribuciones de frecuencias
acumuladas y de porcentajes acumulados de las 49 sumas.
*24. Revisar el experimento de muestreo descrito en el ejercicio 30 del capitulo 3. Volver luego
a la distribucion de porcentajes acumulados del ejercicio 23 de este capitulo. Responder a las
siguientes preguntas.
a) "Cual es la probabilidad (porcentaje de veces) de que una suma igual 0 menor que 11

haya sido obtenida en una muestra de N = 2 de la poblacion original de siete

numeros?

[76] MEDIDAS DE TENDENCIA CENTRAL 77

5 Medidas
de tendencia central
Existen dos caracteristicas observadas por los estadisticos que se presen~an en
muchas distribuciones de frecuencias y para las cuales han desarrollado metodos
cuantitativos de descripcion: (1) A menudo los datos se acu~ulan alrededor ~e un
valor central situado entre los dos valores extremos de la vanable que se estudia. (2)
r-
Los
datos pueden tender a dispersarse y distribuirse alrededor del valor ce~tral, en
.. L d
forma tal que esta tendencia puede ser especificada cuantItatIvamente., a prl1I~era e
tas caracteristicas (la tendencia central) es el tema del presente capitulo, mientras
que la segunda (la dispersion) sera estudiada en el 6. ca~itulo
.
La posibilidad de localizar un punta de tendencia central, particularrnente
an do al mismo tiempo existe una descripcion de la dispersion de los datos respecto
cu . P . 1
a ese punto, puede ser muy util para los cientificos del comporta~11le~to. or ejemp 0,
odran reducir una mas a de datos a un simple valor cuantitativo capaz de ser
5.1 Introducci6n p
comunicado en forma comprensible . .
a otros cientiIfiICOS. . ,
Anteriormente dijimos que a menudo se pide al cientifico del comportamiento
Una de las mayores causas de confusi6n entre la gente no entendida en la materia, y comparar las medidas obtenidas a partir de dos 0 mas gru~os de 'personas. con el fin
quizas un motivo para hacerle sospechar que la estadistica es mas un arte que una de establecer inferencias acerca de los efectos de una vanable independiente, Las
ciencia, gira en torno a la ambigiiedad con que se usa el termino «promedio». Los medidas de la tendencia central simplifican mucho la tarea de establecer conclu­
sindicatos y los gerentes hablan de salarios promedios y citan frecuentemente valores siones.
numericos que muestran entre si un gran desacuerdo. Segun se dice, los programas
de televisi6n y los anuncios comerciales, se preparan pensando en el televidente
promedio. Los politicos se interesan vivamente por las opiniones del votante pro­ 5.2 Media aritmetica
medio. El tamafio de la familia promedio se da frecuentemente en valores frac­
cionarios, como abstracci6n estadistica que parece -ridicula a algunos y absurda a
otros. El termino «promedio» se emplea comunmente como sin6nimo de «normal». 5.2.1 Metodos de calculo
El servicio rnetereologico de la TV nos informa que tendremos un dia promedio 0
que la precipitaci6n pluvial del mes esta por encima 0 por debajo del promedio. Sin Es probable que el lector este muy familiarizado con la media a~itmetic~, 'p~rque
duda, el terrnino «promedio» tiene tantas connotaciones populares que muchos siempre.que obtiene un «prornedio» de calificaciones, sumand.o las.clfr,a~ y dividiendo
estadisticos prefieren suprimirlo del vocabulario tecnico y referirse, en cambio, a el resultado por el numero de elIas, esta calculando la media antmet~ca. En. ~o~as
medida de tendencia central. Definiremos una medida de tendencia central Como un palabras, la media es igual a la suma de los datos 0 val ores de una vanable dividida
indice de localizaci6n central empleado en la descripci6n de las distribuciones de por su numero. Expresado en forma algebraica:
frecuencias. Puesto que el centro de una distribuci6n puede definirse de diferentes - XI + X 2 + . ,. + X N LX
maneras, habra tambien diferentes medidas de tendencia central. En este capitulo nos x= N =N' (5.1)
ocuparemos de las tres mas frecuentemente empleadas: la media, la mediana y la
moda. donde
x= media (se lee X barra)*,
N = numero de datos, y ,
5.1.1 l.Por que describir la tendencia central? L = verba matematico que nos ordena sumar todas las observaciones,
A 10 largo de los cuatro primeros capitulos dellibro nos hemos ocupado principal­ Asi, la media aritrnetica de 9, 12, 15, 19, 24 es X= 78/5 = 15.60.
mente de la organizaci6n de los datos en una forma util y significativa. Sin embargo,
a partir de aqui, se trata de describir los datos en forma tal que puedan formularse Obtenci6n de la media en una distribuci6n de frecuencias no agrupadas, ,Recordemos
proposiciones cuantitativas. Una distribuci6n de frecuencias representa una organi­ que ya fue construida con anterioridad una distribucion de frecuencias como ~n
zacion de datos, pero no nos permite por si misma establecer proposiciones medio de eliminar la repeticion constante de datos que se presentan con frecuencia
cuantitativas, ya sea para describir la distribucion 0 comparar dos 0 mas distribu­
ciones. • En la seccion 1.2 se indica que empleariarnos letras cursivas para representar los estadigrafos mu~strales, Y,letras
griegas para representar los parametres poblacionales. Se usara la letra griega II para representar la media poblacional.
MEDIDAS DE TENDENCIA CENTRAL 79
78 ESTADiSTICA PARA LAS CIENCIASSOCIALES

variable, con objeto de tener una sola entrada en la columna de frecuencias que
Recuadro 5.1 represente el mimero de veces que aparece cualquiera de los datos. Asi, en la tabla 5.1,
observando la columna encabezada por f, sabemos que el dato 8 se repite 6 veces.
SALARIOS
Entonces, al calcular la media no es necesario sumar seis veces 8, pues podemos
ANUALES DE LA

COMPANIA XYZ
multiplicar el dato por su frecuencia y obtener el mismo valor de 48. Puesto que cada
dato se multiplica por su correspondiente frecuencia, antes de efectuar la suma,
30 000
podemos representar la media en las distribuciones de frecuencias como sigue:
24000
14000
10 000 + - - Media - IfX
x=--· (5.2)
9000 N
9 000
9 000 Tabla 5.1 Procedimiento seguido para calcular la media
f IX
X
7 000 <----- Mediana en distribuciones de frecuencias no agrupadas.

6000 12
12 1
6000
6000
11 2 22 - Dx
X=­
10 5 50 N
5000} 9 4 36
5000 232
8 6 48 X=­
5 000 +-- Moda 29
7 4 28
5 000 18 X = 8.00
6 3
5 2 10
4 2 8

N = 29 Dx = 232

Propiedades de la media aritmetica


EI termino «promedio» es usado frecuentemente por medios de cornunicacion sindica­ Una de las propiedades mas importantes de la media es la de ser el punta en una
tos, corporaciones, anunciantes, politicos y estudiantes para describir datos o valores distribuci6n de medidas 0 datos respeeto del eualla suma de las desoiaciones es iqual a
num~ricos. en la parte central de una distribucion. Desafortunadamente, hay tres
cera. En' otras palabras, si restaramos la media de cada una de las observaciones y
medlda~dlferentes de tendencia central que, para una distribucion dada, pueden diferir
Illego sumaramos las resultantes desviaciones respecto a la media, esta suma seria
sustancialmente una de otra. Esta disparidad da lugar a menudo a enojosos desacuer­
dos entre personas que centran su atencion en una 0 en otra medida de tendencia igual a cera. Simbolicamente,
central. Mucha gente se siente confusa por estas disputas y por la interminable
present~~lon de estadisticas confiictivas. Entonces pueden Ilegar, desalentados, a la
co~c1uslOn de que «las estadisticas no son significativas y que puede hacerse 10 que se
L(X - 1')=0. (5.3)

qUIera con elias».


demostracion algebraica de esta propiedad es la siguiente:
. L~ ~abla adju~ta muestra un ordenamiento de los salarios anuales pagados por una
hlp~tetlca .peq~ena empresa que da ernpleo a quince personas, presidente y vice­
presidente 1~c1U1dos. Recientemente se produjo una huelga en la compafiia, El dirigente
de los trabajadores se queja de salarios bajos, mencionando el salado mas frecuente (la
L (X - X) = LX - LX
modal, y gnta en incontrolado arrebato: «EI salario promedio es de cinco mil pesos». =N1'-NX
El ge.rente,. re~riend.~se al promedio aritrnetico (la media) de todos los salarios, replica = o.
con Justa indignacion: «[Absurdo! El salario prornedio es de diez mil pesos». Un
mediador, teniendo a la vista los rnisrnos datos, pero centrando su atencion en el salario Examinando esta demostracion, es importante notar que: (1) de
central (la mediana), lo~ reconvie~e desdefiosarnente: «[Falsol Ambos estan equivoca­
dos. EI salano prornedio es de srete mil pesos».
[De este modo la estadistica nos convierte a todos en mentirososl - IX
x=--,
N
80 ESTADiSTICA PARA LAS CIENCIAS SOCIALES MEDIDAS DE TENDENCIA CENTRAL 81

se sigue ~ue. L: X = _NX; Y(2) haciendola suma L: X se obtiene el mismo resultado cuadrados y la suma de los cuadrados de las desviaciones, cuando estas se toman
que multiplicando X por N.' 0 sea, N X (vease generalizacion 1, capitulo 2). respecto a la media y a otros datos en una distribucion, Puede verse que la suma de
Por consiguiente, la media es un dato 0 dato potencial que se puede considerar los cuadrados es menor en la columna 4, donde las desviaciones se toman respecto a
como un pu~to de equilibrio para todos los datos que estan a uno y otro lado de ella. la media.
En este sentido, es analoga al punta de apoyo de un columpio. EI lector habra Esta propiedad nos perrnite definir tambien la media como la medida de
~ot~do que e~ est~ juego es posible para un individuo liviano equilibrar otro pesado tendencia central que hace minima la suma de los cuadrados de las desviaciones
situandose mas lejos del apoyo. De est a forma, si un joven quisiera equilibrar a un .respecto a ella. EI metodo de localizacion de la media mediante la busqueda del valor
hermano 0 hermana.menor (suponiendo que fueran menos pesados que el), tendria minimo de la suma de cuadrados recibe el nombre de metodo de los minimos
que desplazarse bacia el centro de la tabla. De est a analogia se desprende una cuadrados. Este metodo es de considerable valor en Estadistica, particularmente
segunda caracteristica importante de la media: La media es muy sensible a las: cuando se aplica al ajuste de curvas.
mediciones extremas cuando estas no estan equilibradas a ambos lados de ella.
Observense las dos ordenaciones de datos en la tabla 5.2. Una ordenacion es una
disposicion de los datos de acuerdo con su magnitud, desde el valor menor hasta ef 5.2.3 Media ponderada
mayor. Adviertase que todos los datos en am bas distribuciones son los mismos
excepto al final ?onde aparece "" dato muy grande en la columna X 2' Este valo; Imaginemos que en cuatro clases de sociologia se obtuvieron las siguientes califica­
extremo es' suficiente para duplicar el tarnafio de la media. La sensibilidad de la ciones medias en el examen final: 75, 78, 72 y 80. l.Seria valido sumar estas cuatro
~edi.a a. los valores extremos es una caracteristica que contiene importantes medias y dividir por cuatro para obtener la media general de las cuatro clases juntas?
implicaciones que regiran su uso. Estas implicaciones se estudiaran en la seccion 5.5, Solamente 10 seria si todas las clases tuvieran el mismo numero de alumnos (N).l.Que
cuando comparemos las tres medidas de tendencia central. ocurriria si el numero de alumnos en las clases indicadas fueran de 30, 40, 25 Y 50,
Una tercera caracteristica importante de la media es que fa suma de los cuadrados ~~W~~ ~
de las desviaciones respecto a la media aritmetica es menor que la suma de los cuadra­ La suma total de las calificaciones se puede obtener multiplicando cada media
dos de las desoiaciones respecto a cualquier otro dato 0 dato potencial. por su respectivo N, y sumando los resultados.
Para ilustrar est a caracteristica de la media, en la tabla 5.3 se muestran los Asi,

GRUPO 1
X,
GRUPO 2
X2
Tabla 5.2 Comparacion de las medias de dos ordenaciones de datos
uno de los cuales contiene un valor extremo. '
I (N . X) = 30(75) + 40(78) + 25(72) + 50(80)
= 11170.
2 2 La media ponderada Xw' se expresa como la suma de los productos de la media de
3 3
5
cad a grupo, multiplicada por sujionderacion respectiva (la N de cada grupo),
5
7 7
dividida por la suma de las ponderaciones (0 sea, L: w = L: N; = N).
8 33
X = L(w . X) = =L,----(N--,--i_.X_)
LXI = 25 L::X2 = 50 w LW N
Xl = 5.00 Xl = 10.00
- 30(75) + 40(78) + 25(72) + 50(80)
K; = 145
1 2 3 4 Tabla 5.3 Cuadrados y suma de
5 6
X (X - 2)' (X - 3)' (X - X)' (X - 5)' (X - 6)1 cuadrados de las desviaciones 10­
madas respecto a varios datos en = 11170 = 77.03.
2 a una distribucion, 145
1 4 9 16
3 1 a 1 4 9
4 4 1 a 1 4
5 9 4 1 a 1
6 16 9 4 1 a 5.3 Mediana
I
I
Totales 30 15 10 15 I
30
N=5 En las distribuciones de frecuencias agrupadas, se define la mediana como el dato 0
X=4 dato potencial de una distribucion, por arriba y por abajo del cual caen la mitad'de las
{recuencias. No es extrafio que esta definicion resulte allector un tanto familiar. La
82 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
MEDIDAS DE TENDENCIA CENTRAL 83

mediana es sencilla~ente un caso especial del rango percentil. En efecto, la mediana es


X fACUM X f ACUM
el dato correSp?ndIente al per~entil 50. Debe quedar claro que los procedimientos
general~s estudiados en el capitulo 4 para determinar los datos en varios rangos 20 1 20 10 1 13
percentiles, pueden ser aplicados para calcular la mediana 19 2 19 9 1 12
Modificandn la formula (4.4) para su aplicacion al caso especial de la mediana 18 0 17 8 4 11
o btiene: ' se 17 1 17 7 2 7
16 0 16 6 0 5
Mediana = XII + i(N/2) - fil acum 15 1 16 5 1 5
(5.4) 15 1 15 4 1 4
Ji 13 0 14 3 2 3
12 1 14 2 1 1
Usando en esta formula los datos de la tabla 4.1 (seccion 4.2.2), se obtiene:
11 0 13
Mediana = 109.5 + 5 (110/2) - 43
17
= 109.5 + 5 (55 - 43) = 109.5 + 5 (12)' 5.3.2 Caracteristicas de la mediana
17 17 Una caracteristica destacada de la mediana en su insensibilidad a las calificaciones
= 109.5 + 3.53 = 113.03. extremas. Consideremos el siguiente conjunto de calificaciones: 2, 5, 8, 11, 48. La
mediana es 8. Esto se cumple a pesar de que el conjunto contiene la calificacion
5.3.1 Mediana de una ordenacion de datos extrema 48. Si en vez de 48 se hubiera tenido 97, la mediana seguirria siendo la
misma. Esta caracteristica de la mediana la hace muy util para describir la tendencia
A ve~es ~era necesario obtener la mediana cuando el tamafio de N no sea suficiente central en ciertos tipos de distribuciones en las cuales la media es una medida
para Just.lfic~r lao ~usion de los d.atos en la forma de una distribucion de frecuencias 0 inaceptable de tendencia central por su sensibilidad a las calificaciones extremas.
de un~ dIst.nbuclOn de frecuencias agrupadas. Consideremos la siguiente ordenacion Trataremos este punto con mayor amplitud en la seccion 5.5, donde discutiremos los
de cahficaclOnes: 5, 1.9, 37, 39,45. Observese que las calificaciones estan ordenadas de usos de las tres medidas de tendencia central.
acue.rdo a su magnitud, y que N es un nurnero impar. La calificacion 37 es la
mediana, ~uesto que hay do~ calificaciones por encima y dos por debajo de ella*. Si
N es un numero par, la mediana es la media aritmetica de los dos val ores centrales.
Los
it dos
,. valores
d centrales en la ordenacion 8' 26 , 35 , 43 , 47 , 73 son 35 y 43 . L a me diIa 5.4 Moda
an rnetica e est~s do~ ~alores es (35 + 43)/2, 0 sea, 39. Por tanto, la mediana es 39.
A. v~ces la cah~caclOn central de una ordenacion coincide con otras calificacio­ De todas las medidas de tendencia central, la moda es la que se determina mas
nes. l,Como especIficaremos la mediana en este caso? facilmente, puesto que se obtiene a simple vista y no mediante el calculo. La moda es,
Consideremos la sig~ie~te orde,nac,i~n: 2, 3; 3,4,5, 7, 7, 8, 8, 8, 8, 9,10,12, 14, 15, simplemente, la calificacion que se presenta con mayor frecuencia. En el caso de
1t, I?, 1~" 20. El proced~mIento mas facil consiste en convertir la ordenacion en una datos agrupados, la moda se designa como el punto medio del intervalo al que
dIstnbuc.lO~ de frec.uenclas no agrupadas, y aplicar la formula (5.4). Sin embargo, se corresponde la mayor frecuencia. En la tabla 4.1, la moda es 112, 0 sea, el punto
puede eliminar la I del numerador por ser igual a 1. medio del intervalo 110-114, que contiene la frecuencia mayor.
En algunas distribuciones, que no consideraremos aqui, podra haber dos punios
M e dilana -- X II + (N12 - acum iii) de frecuencia maxima que en la grafica produzcan la apariencia de dos jorobas,
Ii . similares a la de la espalda de un camello. Tales distribuciones se denominan
= 7.5 + (20/2 - 7) bimodales. Una distribucion que contenga mas de dos jorobas se llama multimodal.
4
3
= 7.5 + 4" = 8.25 5.5 Comparaci6n de la media, la mediana y la moda
* Cuando se trata de una ordenacion de mimeros donde N es impar la definicion de la di
'I'd P . I I ' , m e lana no es enterarnente Hemos visto que la media es una medida de tendencia central en la cualla suma de
~a Ia. or ejemp 0, e~ e caso ~nlenor en que la mediana es 37, hay dos calificaciones por debajo y dos por encima de 37
~I qude se oponl~da la Idea eSlncla. de I~ mitad de N. Sin embargo, si se considera a 37 descompueslo en dos milade~ las desviaciones en un lado es igual a la suma de las desviaciones en el otro. Por otra
SI ua as a un a 0 y otro, esta disparidad desaparece.
parte, la mediana divide el area situada bajo la curva en dos mitades, de manera que
MEDIDAS DE TENDENCIA CENTRAL 85
84 ESTADfsTICA PARA LAS CIENCIAS SOCIALES

ara determinar si una distribuci6n es 0 no sesgada y para determinar la direcci6n


el numero de calificaciones por debajo de la mediana es igual al numero de calificacio­ p . xiste El hecho fundamental que debe tenerse en cuenta es que la
nes par encima de ella. del sesgo, SI es que e . . di
media se desplaza en la direcci6n del sesgo, no ocurriendo aSI. con la me lana que no
En general, la media aritrnetica es el estadigrafo preferido para representar la ueda afectada por los valores extremo~.. Asi, cuan.d? la media es ma~or que la me­
tendencia central, porque su funci6n es mas versatil. En primer lugar, la media ~. e puede decir que la distribucion es positivarnente sesgada: y c~ando \a
pertenece a un sistema maternatico que permite su uso en analisis estadisticos mas ~:~~ ~s menor que la mediana, puede decirse que la .distribuci6~ es nega.tlv~me~te
avanzados. Hemos usado las desviaciones respecto a la media para demostrar dos de sesgada. La figura 5.1 muestra l~ relacion entre la media y la mediana en distribucio­
sus caracteristicas mas importantes: la suma de las desviaciones es igual a cera, y
nes con sesgo positivo y negative.
la suma de los cuadrados de las desviaciones es minima. Las desviaciones respecto a la
media proporcionan una valiosa informaci6n acerca de cualquier distribucion. En
10 sucesivo haremos frecuente uso de las desviaciones. En cambio, las desviaciones
respecto a la mediana y los correspondientes cuadrados de las desviaciones s610
tienen aplicaciones limitadas en consideraciones estadisticas mas avanzadas, Otra
caracteristica importante de la media es la de ser la mas estable 0 fiable de las
medidas de tendencia central. Si tornaramos muestras repetidas de una poblacion
dada, la media generalmente mostraria una menor fluctuacion que la correspondien­
te ala mediana 0 ala moda. En otras palabras, la media praporciona de ordinario
una mejor estimacion del correspondiente parametro poblacional. MEDIA
Por el contrario, hay ciertos casos en los que se prefiere la mediana como medida <a)
(b)
de tendencia central. Cuando una distribucion es simetrica, la media y la mediana
son identicas, En estas circunstancias, debera emplearse la media. Sin embargo, como Relaci6n entre la media y la mediana en una distribucion con sesgo: (a) positivo y (b) negativo.
Fig. 5.1
hemos visto, cuando la distribucion es marcadamente asimetrica, la media propor­
cion a una estimaci6n inadecuada de la tendencia central. En la columna X 2 de la
tabla 5.2, la media es 10, si bien cuatro de las cinco calificaciones son menores que
este valor. El ingreso anual por familia es una variable comunrnente estudiada en la Resumen del capitulo
que se prefiere usar la mediana en vez de la media, porque la distribucion de esta
variable se inclina en la direccion de los salarios altos, con el resultado de que la En este capitulo se han estudiado, calculado y comparado los tres indi~es .de t~ndencia
media sobreestima e1 ingreso obtenido por la mayoria de las familias. central que se emplean mas a menudo en la descripci6n de las distribuciones de
La mediana es tambien la medida que se elige en las distribuciones en las cuales frecuencias: la media, la mediana y la moda.
hay va/ores indeterminados. Consideremos este ejemplo: Cuando se trata de hacer Vimos que la media puede definirse de varias maneras: como la suma de los
caminar ratas por un laberinto, habra ocasiones en que una 0 varias de elias no ca­ valores dividida por su numero, como el punto de la distribucion respecto al cU~lla
minen. Sus tiempos quedaran, por tanto, indeterminados. Sus «calificaciones» no suma de las desviaciones es igual a cero, 0 como el punto ~e la distribucion pa:~ el
pueden ser sin mas despreciadas, ya que la caracteristica de su inmovilidad puede ser cual la suma de los cuadrados de las desviaciones es minima. La medla~a divide
de una significacion considerable al evaluar los efectos de la variable independiente. el area situada bajo la curva en dos partes iguales, de modo .q.ue ~l numero de
En estas circunstancias, se debe emplear la mediana como medida de la tendencia calificaciones menores que la mediana es igual al numero de calificaciones mayor~s
central. que ella. Finalmente, la moda se define como la calificacion que se presenta ~on mas
La moda es el estadigrafo apropiado cuando se desee una estimacion aproximada frecuencia. Se indica el metodo para obtener la media ponderada de un conJu~to de
y rapida de la tendencia central, 0 cuando interese unicamente el caso tipico, La medias cuando cada una de las medias individuales esta basada en un N (numero
moda rara vez se usa en las ciencias del comportamiento.
de observaciones) diferente. . . '
Por las propiedades. especiales que posee, la media .es la medida de tendencia
central mas usada. Sin embargo, la sensibilidad de la medIa a los valor.es extremos .no
5.6 Media, mediana y sesgo compensados a ambos lados de la distribucion, hace que sea la mediana la me~l.da
usual cuando las distribuciones tienen un marcado sesgo. La moda rara vez se utiliza
en las ciencias del comportamiento. . '
En el capitulo 3 mostramos varias formas de distribuciones sesgadas. Sefialamos, sin Finalmente, mostramos la relacion existente entre la media y la mediana en las
embargo, que el sesgo no siempre puede ser determinado a simple vista. Si ellector distribuciones con sesgo positivo y negativo.
ha comprendido las diferencias entre la media y la mediana, podra sugerir un metodo
86 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
MEDIDAS DE TENDENCIA CENTRAL 87

Terminus para recordar


b) Restar la misma constante a cada dato. Volver a calcular la media.
Generalizaci6n: i,Cual es el efecto producido sobre la media al restar una constante
media metodo de los minimos cuadrados a todos los datos? .
media ponderada moda c) Sumar y restar alternativamente la misma constante, por ejemplo 2, a I~ ordenaci6n
mediana de datos (o sea, 3 + 2, 4 - 2, 5 + 2, etc.). Calcular de nuevo la media.
ordenacion Generalizaci6n: i,Cual es el efecto producido sobre la media al sumar y restar una
medida de tendencia central suma de cuadrados de las desviaciones constante un numero igual de veces en una disposici6n de datos?
d) Multiplicar cada dato por una constante, por ejemplo 2. Calcu.lar de nue~o .Ia media.
Generalizaci6n: i,CuaI es el efecto producido sobre la media al multiplicar cada
dato por unaconstante?
Ejercicios e) Dividir cada dato por la misma constante. Calcular de nuevo la media.
Generalizaci6n: i,Cual es el efecto producido sobre la media al dividir cada dato
por una constante?
1. Hallar la media, la mediana y la mod a para cada uno de los siguientes conjuntos de
medidas. Demostrar que L (X - X) = O. 11. Se hace referencia al ejercicio 18 del capitulo 3. i,Cual es fa rnedida de tende~cia central
que puede utilizarse para describir mejor el grupo A? i, Y el grupo B? i,Por que?
a) 10, 8, 6, 0, 8, 3, 2, 5, 8, O.

b) 1, 3, 3, 5, 5, 5, 7, 7, 9.
12. En la seccion 5.5 se indic6 que la media, por 10 general, es mas fiabl~ que la mediana, 0
c) 119, 5, 4, 4, 4, 3, 1, O.
sea, que esta menos sujeta a fluctuaciones. S~p6ngase ~ue. se efectua un expenrnento
consistente en lanzar 30 veces tres dados, obteniendo los siguientes resultados:
2. i,En cual de los conjuntos de medidas del ejercicio 1, es la media una medida de 6, 6, 2 5, 4, 3 4, 3, 2 2, 1, 1 6, 5, 3 6, 5,4

tendencia central deficiente? Expliquese por que. 4,1,1 4,4,3 6,4,1 5,4,3 5,1,1 6,2,1

3. Para cada uno de los conjuntos de medidas del ejercicio 1, demostrar que la suma de los 6, 5, 5 6, 6, 4 6, 4, 2 5, 4, 4 6, 5, 2 5, 4, 3

cuadrados de las desviaciones respecto a la media aritrnetica es rnenor que la suma de 6, 4, 3 5, 3, 2 5, 1, 1 4, 3, 1 6, 3, 3 5, 4, 1

los cuadrados de las desviaciones respecto a cualquier otro dato 0 dato potencial. 4, 2, 1 6, 3, 3 6, 5, 4 4, 2, 2 6, 6, 5 6, 3, 1

4. Se han calculado las velocidades maxirnas de varios autom6viles. Despues se descubre a) Calcular las treinta medias y las treinta medianas.
que todos los velocimetros marcaban 5 kil6metros mas por hora. i,C6mo seran las medidas de b) Tomando como primer intervalo 0.5-1.5, agrupar las medias y las medianas en

tendencia central calculadas con los datos corregidos al compararlas con las calculadas con distribuciones de frecuencias separadas. . .

los datos originales? c) Dibujar histogramas para las dos distribuciones. i,Confirman.estas graficas el,aserto

5. Se han calculado las rnedidas de tendencia central para los pesos de unas truchas, con los de que la media es un estimador mas estable de la tendencia central? ~xphquelo.
datos expresados en onzas. Posteriormente se decide hacer nuevamente los calculos dividiendo d) Si colocaramos por separado las medias y las medianas en d~s. bolsas diferentes, y
previamente todos les pesos por 16 para que queden expresados en libras. i,C6mo afectara esto sacaramos al azar una de cadas bolsa, i,cual seria la probabilidad de obtener un
a las medidas de tendencia central? estadigrafo? :
i) i,mayor que 5.5?,

6. Calcular la rnediana y la moda para los datos de los ejercicios 13 y 20 del capitulo 3. ii) i,menor que 1.5?,

7. Si en el ejercicio l{c) anterior, se cambiara 119 por 19, i,c6mo quedarian afectadas las iii) i,mayor que 5.5 0 men or que 1.5?

medidas de tendencia central? 13. Si supierarnos que la media y la mediana de un conjunto de datos son iguales, i,que
8. Basandose en las siguientes medidas de tendencia central, digase si existe evidencia de podriamos decir acerca de la forma de la distribucion?
sesgo y, en caso afirrr::ativo, indiquese :Ia direccion del mismo. 14. En el transcurso del aiio, un inversionista ha comprado valores bur~~tiles por las
a) X = 56 Mediana = 62 : Moda = 68 siguientes cantidades y precios: 150 a 3 pesos la accion, 400 a 2.50 pesos la accion, 100 a 4.25
b) X = 68 Mediana = 62 Moda = 56
pesos la accion, y 200 a 3.50 pesos la acci6n. , . .
c) X = 62 Mediana = 62 Moda = 62
a) i,Si vendiera todas las acciones a un precio. unic~, i,~ual ~ebena s.er? dicho precio
d) X = 62 Mediana = 62 Moda = 30, Moda = 94
(precio de compensaci6n) para que no hubiera perdida rn ganancia: .
9. i,Cual es la naturaleza de las distribuciones de los ejercicios 8{c) y (d)? b) Si las comisiones fueron de 13.50, 30.00, 12.75 y 21.00 pesos, respectivarnente,
calcular el punta de cornpensacion teniendo en cuenta la comisi6n. [Sugerellcia:
10. Calcular la media de la siguiente ordenaci6n: 3, 4, 5, 5, 6, 7.
a) Sumar una constante, por ejemplo 2, a cada numero, Calcular de nuevo la media.
Afiadase la suma de las comisiones a LIV . X antes de dividir.]

Generalizaci6n: i,Cual es el efecto producido sobre la media al aiiadir una constan­ 15. En un examen final, las calificaciones medias de grupos formados por 25, 40, 30,45, 50 Y
te a todos los datos? 20 alumnos fueron: 72.5, 68.4, 75.0, 71.3, 70.6 Y 78.1. .
a) i,Cual es la media general correspondiente a todos los grupos juntos?
88 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
MEDIDAS DE TENDENCIA CENTRAL 89

b) Dibujar una grafica lineal que muestre el tamafio de los grupos en abscisas y las 21. A continuacion se presentan las diferencias entre la presion sanguinea en la sesion de
medias correspondientes en ordenadas. l,Parece existir alguna relacion entre el control y en la sesion de acondicionarniento para cada uno de los sujetos:
tamafio del grupo y la calificacion media en el examen final?
SUJETO 2 3 4 5 6 7
16. Presentar ejemplos en los cuales la medida de tendencia central mas adecuada sea:

a) la media, b) la mediana, c) la moda.

Diferencia -3.5 -33.8 -29.2 -16.5 16.1 0.9 17.3


17. En un estudio efectuado por Grinspoon (1969), se aplico a nueve personas normales la
) Calcular la diferencia media para los siete sujetos, . ..
prueba de sustitucion de digitos, Los resultados obtenidos fueron considerados como medidas
de referencia, A los sujetos se les practico la prueba 15 minutos despues de haber fumado una ~) Hallar la diferencia entre las medias del ejercicio 19 y del ejercrcio 20, y comparar el
fuerte dosis de marihuana. En otra sesion se les practico la misma prueba: 15 minutos despues resultado con la diferencia media obtenida aqui. l,Que es 10 que se descubre?
de haber fumado algo que no era marihuana (placebo). A los resultados obtenidos en ambos 22; Basandose en los resultados de un examen, un profesor identifica los siguientes grupos de
casos se les resto los resultados de referencia, Las diferencias result antes aparecen a continua­ estudiantes: ' .
cion. Un signo negativo significa que el dato fue menor que el dato de referencia. a) aquellos que tienen un rango p~rcentIl de 90 0 mas,
SUJETO b) los que tienen un rango percentil de .10 0 menos,
2 3 4 5 6 7 8 9 c) aquellos que tienen un rango pe.rcentil entre 40 y 49,
Placebo -3 10 -3 d) los que tienen un rango percentil entre 51 y 60. . .

3 4 -3 2 -1 -1
Dosis fuerte 5 -17 -7 .A nivel de que grupo deberia trabajar el profesor si quisiera inc~em~~tar ~I rendimiento

~ediano del grupo total? l,A nivel de que grupo deberia trabajar Sl quisiera mcrementar el

-3 -7 -9 -6 1 -3
Hallar la diferencia media bajo las condiciones de (a) placebo, y (b) dosis fuerte. rendimiento media del grupo total?
18. En el mismo estudio citado en el ejercicio 17, ocho fumadores habituales de marihuana 23. l,CuM de las medidas de tendencia central esta mas afectada por el grado de asimetria
fueron sometidos a la prueba 15 minutos despues de una fuerte dosis. Las diferencias fueron las (sesgo) de la distribucion. Expliquese.
siguientes:
24 .Que cabe decir acerca de las relaciones entre la media, la mediana y la moda en una
. {,
distribucion ..
negativamente sesgada, y en otra posrtivamen te sesgada?.
SUJETO 2 3 4 5 6 7 8
25. Los datos que aparecen a continuacion corresponden a la poblacion ya su tasa anual de
Diferencia -4 11 crecimiento para seis regiones geograficas. (Fuente: L. Rocks y R. P. Runyon. The .E~ergy
3 -2 -6 -4 3
Crisis. Nueva York: Crown Publishers, 1972.) Calcular la tasa porcentual de crecimiento
Hallar la diferencia media para este grupo. ponderada para las seis regiones.
19. En un estudio acerca de los efectos de las condiciones operativas sobre la presion
sanguinea sistolica (Benson y col., 1971), los investigadores registraron las siguientes presiones POBLACION ACTUAL TASA ANUAL DE CRECIMIENTO
sanguineas* de siete sujetos durante las sesiones de control (donde no se les dio ningun REGION (EN MILLONES) (PORCENTAJE)
refuerzo).
Norteamerica 225 1.1
SUJETO Sudamerica 276 2.9
2 3 4 5 6 7 Europa 456 0.8
Presi6n sanguinea sis.onca 139.6 Rusia 241 1.0
213.3 162.3 166.9 157.8 165.7 149.0 Africa 344 2.4
Calcular la presion sanguinea media de los siete sujetos durante la sesion de control. Asia 1990 2.0

20. En el mismo estudio citado en el ejercicio 19, se registro la presion sanguinea de estos
mismos sujetos durante las sesiones de acondicionamiento. El senor A vende un promedio de 1.75 aspiradoras por dia en 4 dias.

EI senor B vende un promedio de 2.0 por dia en 5 dias.

SUJETO
2 3 4 5 6 7
EI senor C vende un promedio de 2.4 por dia en 5 dias.

EI senor D vende un promedio de 2.5 por dia en 4 dias.

Presi6n sangufnea sist61ica 136.1 179.5 133.1 150.4 141.7 166.6 131.7 EI senor E vende un promedio de 2.0 por dia en 3 dias.

El senor F vende un promedio de 1.67 por dia en 3 dias, .

Calcular la presion sanguinea media de estos siete sujetos durante las sesiones de acondiciona­ l,Cual es el numero medio de aspiradoras por vendedor en un dia?

miento.
27. Supongase que un comerciante vende el siguiente numero de manzanas de lunes a
sabado:
• Las medidas fueron realmente la presion media sanguinea durante las cinco iiltimas sesiones de control, y durante a) 30, 30, 30, 30, 30, 30
las cinco tiltimas sesiones de acondicionamiento.
l,Cuales son la media, la mediana y la moda?
MEDIDAS DE TENDENCIA CENTRAL 91
90 ESTADfSTlCA PARA LAS CIENCIAS SOCIALES

Construir una distribucion de frecuencias de las medias calculadas en el ejercicio 35.


b) 25, 30, 35, 30, 35, 25

loCuales son la media, la mediana y la rnoda?


*37. Seleccionando muestras de N = 2, como se hizo en el ejercicio 30 ?el capitul~ 3, loque
c) 10, 25, 30, 36, 25, 30
porcentaje de veces se esperaria obtener (redondeando al porcentaje mas cercano).

loCuales son la media, la mediana y la rnoda?


a) louna media igual a 6?,

b) louna media mayor 0 igual que 5.5?,

28. a) En el ejercicio 27(c), demostrar que L (X - X) = O. c) louna media menor 0 igual que 2.5?, . ?

b) Demostrar que la suma de las desviaciones respecto de la mediana y de la moda no d) louna media mayor 0 igual que 5.5, 0 menor 0 igual que 0.5.
es igual a cera. 38. Calcular la media de las medias del muestreo del ejercicio 37. [St~gerellc.ia: .Co~siderese
c) loPor que la suma de las desviaciones respecto a la media es igual a cera, en tanto que cada media como un dato, y sigase el procedimiento de calc~lar la media .en distribucionea de
la suma de las desviaciones respecto a la mediana y a la moda no 10 es? frecuencias no agrupadas.] loQue relacion existe entre la media de las medias del muestreo y la
29. Calcular la media, la mediana y la mod a para cada uno de los siguientes conjuntos: media de la poblaci6n original?
a) 3, 4, 5, 5, 6, 6, 6, 7, 7, 7, 7, 8, 8, 8, 9, 9, 10, 11
b) 5,5,6,6,6, 7, ~ 7, ~ 7, ~ 7, 7, &8,8,9,9
c) 5, 6, 6, 6, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 8, 8, 8, 9
Dibujar curvas de Irecuencias que representen la distribucion de estos datos. Comparar sus
formas.
30. Determinar la media, la mediana y la moda para la siguiente ordenacion:

31. Durante un determinado mes, una persona compra tres docenas de huevos a 0.50
pesos, una docena a 0.45 pesos, dos docenas a 0.55 pesos y una docena a 0.40 pesos. loCual es el
precio medio por docena?
32. Un escritor gana un promedio de 5.00 pesos por hora durante 4 horas de trabajo, 7.50
pesos por hora durante dos horas, 3.33 pesos hora durante 3 horas y 4.00 pesos por hora
durante 1 hora. loCua] es su ganancia media por hora?
33. Dos fabricantes de frigonficos aseguran que el «prornedio» de vida desus praductos es de
siete afios. Sin embargo, mediante un muestreo aleatorio, una persona encuentra que las vidas
(en afios) de 20 frigorificos del fabricante A son:
5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9, 9

Otro muestreo aleatorio de frigorlficos del fabricante B indico las siguientes duraciones:

2, 3, 4, 5, 5, 5, 5, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 20, 20, 20

l.A que medida «prornedio» se referfa cada fabricante? loQue maquina representaria la mejor
inversion? loCon que maquina se sentiria usted mas segura al afirmar que su vida «prornedio»
es de 7 afios?
34. A cornienzos de 1972 habia en los Estados Unidos 27 centrales nucleares con una
produccion media de 436.5 megavatios. Estaban en construccion 54 centrales con una pro­
duccion media de 847.8 megavatios. Finalmente, estaba prevista la construccion de 52
centrales adicionales con una produccion media de 991.7 megavatios.
a) loCual es la produccion media prevista, en megavatios, de las 133 centrales nucleares?
b) loCuM sera la produccion total de las 133 centrales?
*35. En el ejercicio 30 del capitulo 3, se describio un experimento de muestreo en el cual se
extraian muestras de N = 2 de una poblacion de siete datos. Se construyo una tabla de las
sumas de todas las combinaciones posibles de los siete datos tornados dos ados. Puesto que
N = 2 en cada muestra, la suma se puede convertir en una media dividiendo POI' 2. Construir
una tabla donde aparezcan las 49 medias.
[92] MEDIDAS DE DISPERSI6N 93

6 Medidas de dispersion

distribuidas en forma compacta alrededor de la misma media. Esta es una distribu­


cion mas hornogenea. En consecuencia, la calificacion 128 esta localizada casi en el
maximo de la distribucion y se la puede considerar, por tanto, como una calificacion
muyalta.
Asi pues, puede verse que para la interpretacion de calificaciones individuales
debemos hallar una informacion adicional que acornpafie a la media 0 ala mediana.
Esta informacion adicional debe, en alguna forma, expresar el grado de dispersion de
las calificaciones respecto a la medida de tendencia central. Discutiremos aqui cinco
de tales medidas de dispersion 0 variabilidad: el rango, el rango semi-intercuartil, la
desviacion media, la varianza y la desviacion estandar, De las cinco encontraremos
que la desviacion estandar (llamada tarnbien desviacion tipica) es la medida de
dispersion mas util, tanto en la estadistica descriptiva como en la inferencial. En la
6.1 Introducci6n estadistica inferencial avanzada, como en el analisis de la varianza (capitulo 15),
resultara mas util la varianza como medida de la variabilidad.
~n I.a introduc~ion al capitulo 4, vimos que una calificacion carece por si misma de
significado, y solo 10 adquiere cuando se la compara con otras calificaciones u otros
estadigrafos. Asi, si conocemos la media de la distribucion de una variable dada 6.2 Rango
~od.emos determinar si una califica~ion particular es mayor 0 menor que ella. Pero,
/,cuanto mayor 0 menor? Resulta evidente alllegar aqui que una medida de tendencia Al calcular las diferentes medidas de tendencia central, localizamos un punta
central como la media proporciona solamente una cantidad limitada de informacion determinado en la escala de calificaciones y 10 identificamos como la media, la
Para describir .una ?~stribuci~n en forma mas completa 0 para interpretar con ma~ mediana 0 la moda. Sin embargo, cuando nuestro interes se centra en las medidas de
detalle un~ cah.ficaclOn, necesitaremos informacion adicional acerca de la dispersion dispersion, debemos buscar un indice de la variabilidad que indique la distancia a 10
de las cahficaclOnes respecto a nuestra medida de tendencia central.
largo de la escala de calificaciones.
Obs~rvemos la~ partes (a) y (b) de la figura 6.1. En ambos ejemplos de curvas de Una de las primeras medidas de distancia que se nos ocurre es el rango. Elrango
frecuencias, la. medl~ de la ~istribucion. ~s exactamente la misma. Sin embargo, hay es, con mucho, la mas sencilla y directa de las medidas de dispersion. Se trata
que n~taI' I~ dlferen~la en la interpretacicn de la calificacion 128. En (a), debido a que simplemente de la distancia en la escala entre las calificaciones mayor y menor. Asi, si
I~s calificaciones est~n bastante dispersas respecto a la media, una calificacinn de 128 la mayor calificacion es 140 y la menor es 30, el rango es 110.
s~lo 'pue~~ ser con~lderada moderamente alta. Un buen numero de individuos en la Aunque el rango tiene un significado muy claro, se utiliza poco a causa de su
~lstnbuclOn obtuvieron una calificacion por encima de 128 (como indica el area marcada inestabilidad. Notese que si hay un valor extrema en la distribucion, se
situada a la derecha de 128). En (b), por el contrario, las calificaciones estan tendra la irnpresion de que la dispersion es grande cuando, en realidad, si hicierarnos
caso omiso de esa calificacion extrema, podriamos encontrar que dicha distribucion
es, por el contrario, una distribucion «compacta». Hace varios aiios, un enfermo
mental recluido en una institucion para personas retardadas obtuvo un CI de 140.
Imaginemos la conclusion erronea a la que podriamos llegar si el rango de las
calificaciones de coeficientes de inteligencia para los enfermos mentales fuese
considerado con un valor de, por ejemplo, 140-20, 0 sea, 120. Dicho en otras pala­
bras, el rango rel1eja unicarnente las dos calificaciones extremas de la distribucion,

X
110

128

X 128 6.3 Rango semi-intercuartil


110
ESCALA DE CALIFICACIONES
ESCALA DE CALIFICACIONES Con el fin de superar la inestabilidad del rango como medida de dispersion, se emplea
(a)
(b) a veces el ranqo semi-intercuartil. Este estadigrafo se calcula simplemente restando la
Fig. 6.1 calificacion correspondiente al percentil 25 (llamado primer cuartil 0 Ql) de la ca­
Dos curvas de frecuencias con medias identicas pero diferente dispersion 0 variabilidad.
lificaci6n correspondiente al percentil 75 (llamado tercer cuartil 0 Q3) y dividiendo
94 ESTADfSTICA PARA LAS CIENCIAS SOCIALES MEDIDAS DE DISPERSION 95

Recuadro 6.1
AI h~lla: una medid.a ~e te??encia central, se da un primer e importante paso en la
0

desc:lpclOn de una d~~tnbuclO.n. ~ara completar la descripcion, hemos de hallar alguna


media de cornparacion que indique algo acerca de cuan dispersos estan los datos
respe~t~ del v~lor central. EI estudio de la dispersion es mas que un simple ejercicio
academico reahz.ad? por los estadisticos en sus ratos de ocio. Los fragmentos siguientes
to~ad.o.s de WlIllllng with Statistics sefialan que las consideraciones acerca de la
variabilidad son de importancia fundamental en los asuntos diarios del mundo real.

Rebajar la cumbre es reducir la variabilidad


A veces nuestra preocupacion por los promedios nos hace perder de vista el hecho de actualidad. Debido al hecho de la carga maxima ciertos servicios publicos trabajan muy
que muchas de las decisiones cotidianas mas importantes se basan en la consideracion poco durante ciertos periodos de tiempo y estan congestionados en otros. Suponiendo
d~ los. extremos de una distribucion y no de su centro. Imaginemos como seria la que en los an os venideros haya una demanda continuamente creciente de recursos tanto
vida si: naturales como humanos, no podremos por mucho tiempo permitirnos el lujo de
- N uestras carreteras estuvieran construidas para resistir la circulacion de vehicu­ «planificar hasta la curnbre»,
los de peso medio. La alternativa consiste en elevar los valles y bajar las cumbres de la demanda. En
- Los sistemas .de trans~orte masivo estuvieran disefiados para transportar terrninos estadisticos, el objetivo es obtener el mismo promedio reduciendo la variabili­
solamente el prornedio de pasajeros (0 sea, el total diario de pasajeros dividido por 24 dad. Haciendolo asi, podremos incrernentar y mejorar nuestro usa de los recursos
horas) durante cada hora del dia. existentes. A modo de ilustracion, explicate 10 observado por mi familia y yo cuando
- ~os puentes, las casas y los edificios industriales y comerciales estuvieran visitamos Paris hace algunos afios para promover la edicion francesa de The Energy
construidos para resistir el viento medio 0 el terremoto medio. Crisis (La crisis de La energia). Pasamos una gran parte de nuestro tiempo viajando
- L~s !ineas y centrales telefonicas fueran las suficientes para atender solamente el por el maravilloso Metro (el sistema de transporte subterraneo de Paris). Adernas de
prornedio de llamadas telefonicas por hora. la tranquilidad de los viajes y de la belleza de las estaciones (la del Louvre tiene magnificas
o La cornpafiia de electricidad calculara el promedio anual de demanda de fluido
--: reproducciones de grandes obras de arte), nos maravillo 10 descongestionados que van
electnco y construyera los elementos necesarios para proporcionar solamente esta los trenes en las horas de mayor afluencia. Bastaron unas pocas indagaciones para
demanda promedio. obtener la explicacion: el comercio y la industria en Paris operan bajo un sistema
- Los servicios de ernergencia proporcionaran personal y facilidades promedio escalonado de horas de apertura y cierre. Mientras Jean-Paul aun duerrne, Jacques va
durante todas las horas del dia y en todas las estaciones del afio, camino a su trabajo. El resultado de esta estrategia de «rebajar la cumbre» es el de
- Los programas espaciales proporcionaran recursos de emergencia solamente distribuir de modo mas uniforme la afluencia de viajeros en la manana y en la tarde,
para el tipo promedio de fallos. consiguiendose asi un uso mas eficiente del material rodante y un alivio para los nervios
EI mundo seria un completo caos. De hecho, todos los esfuerzos humanos han de excitados.
tender a. cubri~ las condiciones extrernas conocidas como cargas maxirnas. Si ellector Traten de encontrar medios para resolver el problema permanente del incremento
n~ ~onsldera importante mi divagacion, debo decirle que el problema de la carga de los precios buscando la forma de uniformizar la demanda diurna y estacional de
maxima constituye uno de los mas grandes desafios con que nos enfrentamos en la electricidad.

Tornado de Winning with Statistics • R. P , Runyon'. Addison - Wesley P U bliIS hi109 C 0., Rea di109, M ass" 1977.

el result~do par 2 (ver ~g. 6.2). Esta. medida de la variabilidad se usa con mayor dispersion, respectivamente. Ademas, ambos estadigrafos se usan a menudo con
frecuencia para acompanar a la mediana, cuando la presencia de valores extremos datos de escala ordinal. Aunque esta medida de la variabilidad de las calificaciones es
hace. po.~o rec~mendable el uso de la media Como medida de tendencia central y de la mucho mas significativa que el rango, tiene dos defectos importantes: (1) 10 mismo
desviacion estandar Como medida de dispersion. En las ciencias del comportamiento que el rango, no permite hacer una interpretacion precisa de una calificacion dentro
s~ encuent~a que l.as curv~s de frecuencias correspondientes a tiernpos de reaccion, de la distribucion, y (2) como la mediana, no puede hacersele intervenir en ninguna de
ntmo car~Jaco y cifras de ingresos son suficientemente sesgadas para justificar el uso las relaciones matematicas «importantes» de la inferencia estadistica. En consecuen­
de la mediana y del rango semi-intercuartil como medidas de tendencia central y de cia, no dedicaremos aqui mas atencion al estudio del rango semi-intercuartil.
MEDIDAS DE DISPERSI6N 97
96 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

. Tabla 6.1 Procedimiento para calcular x (IX- xi) CALCULO


la D.M. de una ordenacion de datos.
RANGO SEMI-INTERCUARTIL = 73-60 = 6 5 9 1+ 41 LlIX - XI)" (6.1)
2 .
1+31 D.M. = N
8
• 7 1+21
D.M. = ~ = 1.73
7 1+21
7 1+ 21
5 I 0/
Fig. 6.2 EI rango semi-intercuartil y 5 I 01
una distribucion sesgada. AI igual que 5 I 01
la mediana (Q2)' el rango semi-inter­ 5 I 01
cuartil no es sensible a los val ores extre­ 1-11
4
mos en uno u otro lado de Ja distribu­ 1-11
4
cion.
3 1-21
3 1- 21
2 1-31
1 1-41

6.4 Desviaci6n media LX = 75 LlIX- XI) =26 N = 15


X=5
* Para datos ordenados en la forma de una distribuci6n de frecuen­
En el capitulo 5 se hizo ver que, cuando se trabaja con datos provenientes de po­ clas, debe usarse la siguiente f6rmula:

blaciones normalmente distribuidas, la media es la mas util entre las medidas de C.M. = ~)(IX - "'lllN.
tendencia central. Obtenemos la media sumando todas las calificaciones y dividiendo
el resultado por N. Avanzando un paso mas, podemos restar la media de cada una de Se preguntara ellector por que nos hemos molestado en presentar la desviaci?n
las calificaciones, sumar las desviaciones respecto a la media, y obtener asi una media siendo de tan poco uso en el analisis estadistico. Co~~ ~eremo~, ~a desvl~­
estimacion de la cantidad tipica de desviacion respecto a la media. Dividiendo por N, cion estandar y la varianza, que son de gran. v~l?r en e~ analisis estadistico, estan
tendriamos una medida analoga a la media aritrnetica, excepto que representaria la relacionadas muy estrechamente con la desviacion media.
dispersion de las calificaciones respecto a la media aritrnetica.
Si pens amos un momenta en las caracteristicas de la media, discutidas en el
capitulo anterior, encontraremos una seria dificultad. La suma de las desviaciones
respecto a la media es igual a cero. Asi, si definimos la desoiacion media (D.M.) co­ Varianza (S2). Y desviaci6n estandar (s)*
mo esta suma dividida por N, resultaria que la desviacion media tendria que ser
cero. Recordemos que con anterioridad habiamos utilizado la propiedad de que
Al efectuar una lectura cuidadosa de la tabla 6.1, el lector podria hacerse es~a
~)X - X) = 0 para llegar a una de las varias definiciones de la media.
reflexion: «Hubirnos de tratar los numeros de la columna encabezada por (X -. X)
Ahora bien, si sumaramos todas las desviaciones sin considerar el signa y
Como valores absolutes porque de otra manera su suma era igual a cero. "Por que no
dividierarnos por N, tendriamos todavia una medida que refleja la desviacion media
elevamos al cuadrado cada (X - X) y luego sumamos los cuadrados de las
de las observaciones respecto a la media aritmetica, Por supuesto, el estadigrafo
desviaciones? De esta forma habriamos eliminado de un mo?o perfectamente
resultante estaria basado en el valor absoluto de las desviaciones. EI valor absoluto de
legitimo el signo menos, conservando al mismo tiernpo la informacion inherente a las
un mimero positivo 0 de cero es el mismo nurnero. EI valor absoluto de un numero
negativo se obtiene cambiando el signo de negativo a positivo. Asi, el valor absoluto desviaciones.» . C d
La respuesta es: Cabe hacerlo, si de esta forma obtenemos un estadigra 0 e
de + 3 0 de - 3 es 3. EI simbolo de valor absoluto es II. Asi, 1- 3/ = 3.
mayor valor para juzgar acerca de la dispersion que el de aquellos otros que hemos
Los calculos para obtener la desviacion media aparecen en la tabla 6.1.

estudiado hasta el momento. Afortunadamente, la desviacion estandar, bas~da en lo~


La desviacion media tiene algun valor como base de cornparacion de la disper­

cuadrados de estas desviaciones, es de inrnenso valor en tres aspectos diferentes:


'sion de varias distribuciones. Por ejemplo, cuanto mayor sea la desviacion media,
mas grande sera la dispersion de las calificaciones. Sin embargo, para interpretar las • Recordamos que las letras italicas se usan para representar los estadigrafos mu.eslrales, y q~e 1~>I- letras gri:~~: ~~
calificaciones dentro de una distribucion, la desviacion media es menos util, puesto . I P . I 2 epresenta la vananza poblacionc Y(f repres
ernplean para representar parametres poblaclOnaes. ~r eJe.m.p 0, CI r d ' 1 . tros poblacionales por
que no existe una relacion maternatica precisa entre la desviacion media, como tal, y desviacion estandar poblacional. En el capitulo 12 se discutira el problema e estimar os para me
la situacion de las calificaciones dentro de una distribucion. medio de valores muestrales.
MEDIDAS DE DISPERSION 99
98 ESTADfsTICA PARA LAS CIENCIAS SOCIALES

I d calcular la desviacion
1. La desviacion estandar rel1eja la dispersion de las calificaciones, de modo que se La tabla 6.2 muestra los procedimientos. e~p ea o~ para
puede comparar la variabilidad de diferentes distribuciones en terminos de este ind ar, utilizando el metodo de la deSVlaClOn media.
estan
estadigrafo (s).
Tabla 6.2 procedimiento para calcular s usando el metodo de la desviacion
2. La desviacion estandar permite una interpretacion precisa de las calificaciones
media en una ordenaci6n de datos.
dentro de una distribucion.
3. La desviacion estandar, como la media, pertenece a un sistema matematico que x x-x (X - Xl'

perrnite su uso en aspectos estadisticos mas avanzados. Asi, al continuar


avanzando en la estadistica inferencial, utilizaremos medidas basadas en s. 9
8
+4
+3
16
9
4
s= JlJ X 2

N Xl = ft
7 +2
Despues de que hayamos mostrado la forma de calcular s, podremos decir mas 4 = ../72/15
7 +2
acerca de su significado. 4
7 +2 = J4.8o
0 0
5
0 0 = 2.19
5
6.5.1 Calculo de la varianza y de la desviacion estandar, 5 0 0
0 0
metodo de la desviacion media, 5
4 -1 1
1
con datos no agrupados 4 -1
4
3 -2
La varianza se define como la suma de los cuadrados de las desviaciones respecto a la -2 4
3
-3 9
media, dioidida por N. Simbolicamente se representa asi: 2
-4 16
1

lJX ­ Xl2 - 7 2 N ..·15


(6.2)* LX = 75 lJX - Xl = 0
X=5

L
Se recordara que la suma de las (X - X}2 [que es (X - X)2] es conocida como
la suma de los cuadrados de las desviaciones y que tiene un valor minimo cuando las
desviaciones se han tornado respecto a la media. A partir de ahora, encontraremos en Se ex uso el metodo de la desviacion media unicamente par~ dest~car el hecho de
el cur so estas sumas de cuadrados con regularidad. Tomaran varias formas distintas, 1 d p. .on estandar se basa en las desviaciones de las cahficacIOne~ respecto a
segun losprocedimientos que elijamos para calcularlas. Sin embargo, es importante ~~e~i:s~~~~lmetodo es extremadamente. incomodo para el ~al~ulo, p~rtI~ula~~~n:~

recordar que, cualquiera que sea su forma, la suma de cuadrados representa la suma cuando la media tiene un valor fraccionano, que es el caso mas rec~en 1e. la suma de

de los cuadrados de las desviaciones respecto a la media. Por comodidad, usaremos e1 los parrafos siguientes examinaremos algunas otras formas para ca cu ar

simbolo SC para representar L


(X - X}2. Asi, cuadrados.

SC = L(X:- XY (6.3)
6.5.2 Calculo de la desviacion estandar
La varianza resulta, entonces, en el caso de datos originales no agrupados
2 =SC Se puede demostrar matematicamente que
S -. (6.4)
N"
. La desuiacion estandar es la raiz cuadrada de la varianza y se la define como (6.6)

.r: (6.5)

• En el capitulo 12 se discutird la importante diferencia existente entre la estimaci6n sesgada de la varianza


donde

poblacional ~::<X- X)'/N y la estimacion no sesgada de la misma L (X - Xl'/(N - I).


100 ESTADfSTICA PARA LAS CIENCIAS SOCIALES MEDIDAS DE DISPERSION 101

Tabla 6.3 Procedimiento para calcular s en una


ordenaci6n de datos originales, ' 6.5.3 Calculo de la desviacion estandar en e1 caso de
X
los datos originales en una distribucion
X'
CALCULO
de frecuencias no agrupadas
9 81

8 SC = IX2 _ {I:)2 Si tomamos los datos de la tabla 6.2 y los ordenamos en una distribucion de
64

7 49
trecuencias no agrupadas, obtenemos

7 49 (75)2

= 447 - - ­
7 49
15
x
X
5
25

5 25
= 447 - 375= 72

9 1
4 2

5 25
8 1

2SC 3 2

5 25 5=­ 7 3
2 1

N
4 16
6 a
1 1

4 16 = 11 = 4.80
5 4

3
9

3 9 5= J4.8O = 2.19
2 4
Para calcular SC, multiplicamos cada data par su correspondiente frecuencia y

1
1
luego sumamos. Esto nos da IIX. A continuaci6n, para hallar IIX 2 , elevamas al
IX = 75 IX 2 = 447
cuadrado cada data, 10 multiplicamos par su correspondiente frecuencia y sumamos.
N = 15

X=5 Estos valores se llevan a la formula de la suma de cuadrados.

Pero, I X = N x* y I X2 = N X2 (ver generalizacion 1, capitulo 2). Asi,

Fina/mente, sustituimos este valor en la f6rmula de fa desviaci6n estandar:

Sc= IX2_2NX2+NX2

= IX 2
- NX
2

= IX 2
- N(~Xr
= ~ X2 _ N(IX)2 La tabla 6.4 resume el procedimiento para la obtenci6n de la desviaci6n estandar
c. N 2
en una distribuci6n de Irecuencias no agrupadas.

= I x 2_(I:)2. Tabla 6.4 Procedimiento para calcular Ia desviacion estandar con datos de una
distribucion de lrecuencias no agrupadas,

Dividiendo la suma de cuadrados par N se obtiene la varianza X IX x' IX' CALCULO

S
2
=-.
sc 9
8
1
1
9
8
81
64
81

64

SC = L rx 2 _ (I:)2

N 7 3 21 49 147

6 a a 36 a
(75)2
= 447 - - ­
Ala vez, extrayendo la raiz cuadrada de la varianza se obtiene la desviacion estandar 5 4 20 25 100 N

16

s=!i.
4 2 8 32

3 2 6 9 18
= 447 - 375 = 72
2 1 2 4 4
SC
1 1 1 1 1
52 = - = 11 = 4.80
N
En la tabla 6.3 se resume el procedimiento de calculo. Observese que los
resu!tados concuerdan can los que se obtuvieron par el metoda de la desviaci6n 5=~=2.1S
media.
N = 15 I!X = 75 Irx2 = 447

• Puesto que X = I X/N, se deduce que I X = NX.

MEDIDAS DE DISPERSI6N 103


102 ESTADiSTICA PARA LAS CIENCIAS SOCIALES

dirni t esurnido:. Calculo de la varianza y de la desviaei6n estandar de una ordenaei6n de


6.5.4 Errores a evitar P roee rrrnen 0 r

Al calcular la desviacion estandar en el caso de datos originales, es frecuente que los PASOS
X'
estudiantes confundan los terrninos de aspecto semejante LX 2 (0 IJ X 2) Y (LX)2 x
Contar el nurnero de datos para obtener N. N 12.
(0 [Lf xy). Es importante recordar que el primero representa la suma de 1. =
7 49
los cuadrados de los datos individuales, mientras que el segundo representa el 6 36 2. Sumar los datos que aparecen en la columna X para obtener LX.
6 36
cuadrado de la suma de los datos. Por definicion, es imposible obtener una suma p=48.
5 25
de cuadrados negativos 0 una desviacion estandar negativa. Si se obtiene un valor 25 3. Elevar al cuadrado cada dato y colocar el resultado en la columna
5
negativo bajo el signo radical, es probable que haya habido confusi6n entre estos 5 25 siguiente.
2
dos terrninos. 4 16 4. Sumar los nurneros de la columna X2 para obtener "X
L..
= 242 •
Una regia practica para estimar la desviacion estandar consiste en que la razon 4 16 Sustituir los valores encontrados en los pasos 2 y 4 en la f6rmula de la
5.
del rango ala desviacion estandar es muy raras veces menor que 2 0 mayor que 6. En 3 9 suma de cuadrados:
2 4
el ejemplo anterior, la razon es 9/2.19 = 4.11. Si obtenemos una desviacion estandar ("X)2 2304
para la cual est a razon es mayor que 6 0 menor que 2, podemos estar casi seguros de
1
0
1
0
SC =
I X2 - _L.._
N
= 242 ­ - ­ = 50
12
haber cometido un error. 6. Sustituir SC en las f6rmulas de 52 Y 5.

L:X = 48 LX 2 = 242 2 SC 50 s= J4.ff = 2.04


s =-=-=4.17
(LX
)2 = 48 2 N 12 .
= 2304

6.6 Interpretacion de la desviacion estandar

Una adecuada cornprension del significado de la desviacion estandar depende del Terrninos para recordar

conocimiento de la relaci6n existente entre ella y la distribucion normal. Asi, para rango semi-intercuartil
poder interpretar las desviaciones estandar calculadas en este capitulo, sera necesario desviacion esuindar
examinar la relaci6n entre los datos originales, la desviaci6n estandar y la distribu­ desviacion media (desviacion promedio) suma de cuadrados
cion normal. valor absoluto de un numero
dispersion
Trataremos esta cuesti6n en el capitulo siguiente. varianza
rango

Resumen del capitulo


Hemos visto que para describir por completo una distribucion de valores se necesita
1. Calcular 52 y S para la siguiente ordenacion de datos: 3'14, 5, 5, ~' 2 5 rSerian
a) Sumar una constante, por ejemplo 2, a cada dato. Vo ver a ca cu ar 5 y . ~
i'
algo mas que una medida de tendencia central. Debemos poder describir la forma diferentes los resultados si se hubiese sumado una constante mayor, por ejemplo
en que est os valores estan dispersos respecto a la medida de tendencia central. 200?
Para satisfacer esta necesidad, estudiamos cinco medidas de dispersi6n: rango, Ge~eralizacion: l.Que efecto se produce en 5 y s2\cuando se suma una ~nstante a
rango semi-intercuartil, desviaci6n media, desviaci6n estandar y varianza. (Ver la los datos de una ordenacion? l.Crecela variabilidad al incrementar la magnitud de los
tabla 6.5.) datos? 2 "
Para las variables normalmente distribuidas, las dos medidas que se basan en los b) Restar la misma constante de cada dato. Volver a calcular 5 y 5. ?Senan dlfe;entes
cuadrados de las desviaciones respecto a la media (la varianza y la desviaci6n tipica) los resultados sise hubiese restado una constante mayor, por ejemplo 200. d
Generalizacion: l.Que efecto se produce en 5 y S2 cuando se resta una constante e
son extremadamente utiles. Hemos discutido y demostrado los procedimientos para
calcular la desviaci6n estandar empleando el rnetodo de la desviacion media y el los datos de una ordenacion?
c) Sumar y restar alternadamente la misma constante a cada dato (pot ejemplo, 3 ~ 2,
metodo de los datos originales en distribuciones de frecuencias no agrupadas. 4 _ 2, 5 + 2, etc.), Volver a calcular s Y S2. l.Serian diferentes los resultados Sl se
Sefialamos tam bien varios de los errores que se cometen con frecuencia al calcular la
hubiese sumado y restado una constante mayor?
desviacion estandar,
MEDIDAS DE DISPERSION 105

104 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

Geueralizaclon: ~Que efecto se produce en 5 y 52 cuando se suma y resta una 14. Indicar al menos tres casos especfficosen que una medida de variabilidad fue importante
con stante a los datos de una ordenacion? (Nota: Esta generalizacion es extremada­ para describir un grupo. . ., .
mente importante en relacion con los capitulos siguientes donde se estudia el efecto 15. Indicar al menos tres casos especificos en que una medida de variabilidad fue importante
de los errores aleatorios en las medidas de variabilidad.) para comparar grupos de personas. .
d) Multiplicar cada dato por una constante, por ejemplo 2. Volver a calcular 5 y 52. 16 L s siguientes datos corresponden a temperaturas maxirnas diarias registradas en la
Generalizacion: ~Que efecto se produce en 5 y 52 cuando se multiplica cada dato ci~dad Ode Nueva York durante los meses de enero y mayo en 1965 y 1966*. Para cada rnes y
por una constante?
afio, efectuar 10 indicado en a), b) y c).
e) Dividir cada dato por la misma constante. Volver a calcular 5 y 52.
Generalizacion: ~Que efecto se produce en 5 y 52 cuando se divide cad a dato por a) Hallar la media.

una constante? b)
Hallar el rango y la desviacion media.

2. Comparar las generalizaciones anteriores con las que se hicieron en relacion con la media c) Hallar la desviacion estandar y la varianza.

(ver ejercicio 10, capitulo 5).


3. Una definicion rigurosa de una medida de variacion como un estadigrafo descriptivo, MAY. 1965
MAY. 1966

DIA ENE. 1965 ENE. 1966


incluiria las siguientes propiedades: (a) si se suma 0 se resta una constante a cada uno de los
datos u observaciones, la medida de variacion no sufre alteracion alguna; (b) si se multiplica 1 35 62 71
66

o se divide cada dato par una constante, la medida de variacion queda tam bien multiplicada 0 2 29 52 77
60

dividida por ese numero, Com pro bar si los siguientes estadigrafos satisfacen estas condiciones: 32 46 71 68

3
i) la media ii) la mediana iii) la moda 39 45 90
59

4
Iv) la desviacion media v) la desviacion estandar vi) la varianza. 5 43 53 62 70

44 47 78 83

Si se ampliasen las propiedades que definen las medidas de dispersion, para incluir las 6
7 44 47
52 66

potencias de la constante por la cual se multiplica cada dato, ~quedaria calificada la varianza 61

8 49 44
60
como una medida de dispersion? 52

9 55 30 78

4. ~Como quedaria afectada la desviacion estandar por los casos descritos en los ejercicios 4
10 40
48 92
57

y 5 del capitulo 5?
35
42 88
63

11
27
78 57

5. ~Cual es la naturaleza de una distribucion si 5 = O? 12 36


41 32
80 67

6. Calcular la desviacion estandar para los siguientes conjuntos de medidas:


13
14 37
42 74
64

a) 10, 8, 6, 0, 8, 3, 2, 2, 8, 0 b) 1, 3, 3, 5, 5, 5, 7, 7, 9
41 82
74

15 19

c) 20, 1, 2, 5, 4, 4, 4, 0 d) 5, 5, 5, 5, 5, 5, 5, 5, 5, 5
26
87 71

16 17
16 39
83 68

7. ~Por que es tan grande la desviacion estandar en la parte (c) del ejercicio 6? Describir el 17
18 25 38
73 66

efecto que tienen las desviaciones extremas sobre 5.


25
35 70
64

8. Deterrninar el rango para los conjuntos de medidas del ejercicio 6. ~Para cual de ellos es 19
38
44 80
84

20
el rango una medida engafiosa de variabilidad y por que? 42 72 85

21 36
9. En los ejercicios 17 y 18 del capitulo 5, hallar la varianza y la desviacion estandar de las 22 50 39
80 75

47
37 79
85

diferencias de datos correspondientes a sujetos normales en condiciones de (a) placebo y (b) 23


24 32
38 70
80

dosis fuerte; y los correspondientes a los (c) fumadores cronicos en el estudio efectuado por
25 38 32 79 76

Grinspoon. [Sugerencia: Para facilitar los calculos cuando hay datos negativos, se suma a 84

26 44 26
94
todos los datos una constante mayor 0 igual que el valor absoluto del mayor dato negativo.] 82

27 42
36 92

10. Calcular la media y la desviacion estandar para el conjunto de 40 numeros del ejercicio 5, 38 19 83 73

28
capitulo 3. 27 23
68 82

29
20 38
67 73

11. Una compradora compara los precios de las ciruelas en varios supermercados, y
30
30
28 74
68

encuentra los siguientes precios por 500 gramos: 56, 65, 48, 73, 59, 72, 63, 65, 60, 63, 44,
31
79, 63, 61, 66, 69, 64, 71, 58, 63. a) Hallar la media. b) Hallar el rango, el ran go semi­

intercuartil y la desviacion media. c) Hallar la desviacion estandar y la varianza.

12. Indicar una ventaja de la desviacion estandar sobre la varianza. Citar un ejemplo.
13. Con referencia al ejercicio 24 del capitulo 3, hallar la media y la desviacion estandar del • Los datos para este problema provienen de, Tile World Almanac, pags. 558-559.N~eva York: Newspaper Enterprise
ruimero de botellas de leche vendidas en el supermercado. ssociation, lnc., 1967. Reproducido con perrmso.
106 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
[107J

17. . S~~6nga~e que un co~erciante ven?e una botella de leche por 0.40 pesos y que la
d~svlaclOn estand~r del ~reclO durante el ultimo mes fne igual a O. lCual fue el precio en los
dfas tercero y decimoquinto?
Desviacion estandar
18. Calcular el rango, la varianza y la desviaci6n estandar correspondientes a los dos
fabricantes del ejercicio 33, capitulo 5. y distribucion normal estandar
19. Precipitacion normal mensual t.

ESTACIONES ENE. FEB. MAR. ABR. MAY. JUN. JUL, AGO. SEP. OCT. NOV.DIC.

Barrow, Alaska 0.2 0.2 0.1 0.1 0.1 0.4 0.8 0.9 0.6 0.5 0.2 0.2
Burlington, VI. 2.0 1.8 2.1 2.6 3.0 3.5 3.9 3.4 3.3 3.0 2.6 2.1
Honolulu,
Hawaii 3.8 3.3 2.9 1.3 1.0 0.3 0.4 0.9 1.0 1.8 2.2 3.0
Seattle-Tacoma,
Washington 5.7 4.2 3.8 2.4 1.7 1.6 0.8 1.0
Introduccion
2.1 4.0 5.4 6.3

Anteriormente vimos que las calificaciones obtenidas mediante escalas carecen, por
Determinar la varianza y la desviacion estandar para los datos del afio en cada ciudad.
10 general, de significado intrinseco para los cientificos del comportamiento. A fin de
'20. Con referencia al ejercicio 36 del capitulo 5, calcular la desviacion estandar de la que 10 adquieran, es necesario compararlas con la distribucion de calificaciones
distribucion de frecuencias de las medias muestrales. [Sugerencia: Tratar cada media como un de algun grupo de referencia. Ciertamente, las calificaciones obtenidas a partir de
dato y usar el metodo de los datos originales para obtener la desviaci6n estandar de una
distribuci6n de frecuencias no agrupadas.] cualquier escala, inc1uyendo las que emplean los fisicos, lIegan a tener mayor
significado cuando se las com para con un grupo de referencia de personas u
21. Hallar la varianz? y l.a .desviaci6n estandar para la presion sanguinea (Benson y col., 1971) objetos.
que a~~recen ~n los eJercl~IOS 19 a 21 del capitulo 5: (a) sesiones de control, (b) sesiones de Asi, si nos dijeran que un pescador canadiense capture un lucio de 22 kilos,
acondlclOnamlento y (c) diferencias,
quedariamos sorprendidos 0 no, segun sean nuestros conocimientos acerca del peso
usual de estos peces de agua dulce. Sin embargo, una vez establecido el grupo de
referencia, dicha medicion adquiere sentido. Puesto que la mayoria de los lucios
pesan alrededor de 4.5 kilos y en raras ocasiones alcanzan los 10 kilos, el logro de
nuestro pescador anonimo debe considerarse excesivamente exagerado.

El concepto de valor estandarizado


AI interpretar una calificacion aislada, tratamos de situarla en cierta posicion
respecto a una coleccion de calificaciones de algun grupo de referencia. En el capi­
tulo 4, aprendimos a ubicar una calificacion en su posicion respectiva, determinando
su rango percenti\. Se recordara que el rango percentil de una calificacion da eI
porcentaje de calificaciones que son men ores. Otro camino para la interpretacion de
una calificacion podria ser el de observarla en relacion con un punto central, tal como
la media.
Asi una calificacion de 20 en una distribucion con media de 23 podria ex­
presar;e como - 3. Finalmente, cabria expresar esta desviacion en terrninos de
unidades de desviacion estandar. Asi, si la desviacion estandar es de 1.5, la califica­
t Fuente: National Climatic Center, NOAA, U.S. Department of Commerce.
cion de 20 estaria dos desviaciones estandar por debajo de la media (0 sea, - 3/1.5 =
- 2). Este proceso de dividir la desviacion de una calificacion respecto a la media
108 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
DESVIACI6N ESTANDAR Y DISTRIBUCI6N NORMAL ESTANDAR 109

Recuadro 7.1
Como dijimos anteriormente, una calificacion carece de significado por si misma. En
este capitulo veremos que la transformacion a valores z proporciona un medio preciso
para interpretar cualquier valor de una variable cuando se trata de valores normalmen­
te distribuidos. EI siguiente fragmento de Winning with Statistics ilustra el uso de la
transformacion a valores z para la interpretacion de las calificaciones obtenidas en
examenes y pruebas psicologicas,

Interpretacion de la calificacion obtenida


PORCENTAJE DE CAUFICACIONES PORCENTAJE DE CAUFICACIONES
en una prueba
POR ENCIMA Y POR DEBAJO DE UNA POR ENCIMA Y POR DEBAJO DE UNA
CAUFICACION z DADA CAUFICACION z DADA

A continuacion se indica, paso a paso, el procedimiento requerido para eliminar toda A B C A B C


dificultad acerca de la interpretacion de las calificaciones obtenidas en examenes Y
pruebas psicologicas. PORCENTAJE PORCENTAJE PORCENTAJE PORCENTAJE
. DE CASOS DE CASOS DE CASOS DE CASOS
z POR DEBAJO DE POR ENCIMA DE z POR DEBAJO DE POR ENCIMA DE
1. Determmese la media y la desviacion estandar correspondiente a la prueba. A veces
se dan diferentes medias y desviaciones estandar para grupos de diferente edad, -2.2 1
99
0.1 54
46

Aseguresede hallar estas dos medidas para el grupo de edad en que interesa, Las fuentes -2.1 2
98
0.2 58
42

de informacion son el manual de la prueba (test) que se esre aplicando 0 algtin tratado -2.0 2
98
0.3 62
38

especializado en este tipo de pruebas*. -1.9 3


97
0.4 66
34

-1.8 4
96
0.5 69
31

2. Transformese la calificacion que se desea interpretar en un dato z, usando la


siguiente fOrmula: -1.7 4
96
0.6 73
27

-1.6 5
95
0.7 76
24

-f5 7
93
0.8 79
21

calificacion - media -1.4 8


92
0.9 82
18

z = desviacion estandar -1.3 9


91
1.0 84
16

-1.2 12
88
1.1 86
14

-1.1 14
86
1.2 88
12

Si interesa interpretar una calificacion de 40, y se sabe que la media y la desviacion

estandar son 30 y 9, respectivamente, se obtendra que


-1.0 16
84
1.3 91
9

-0.9 18
82
1.4 92
8

-0.8 21
79
1.5 93
7

z = ~O - 30 = 10 = 1.1
-0.7 24
76
1.6 95
5

9 9
-0.6 27
73
1.7 96
4

-0.5 31
69
1.8 96
4

3. Busquese en la columna B de la tabla adjunta el valor correspondiente a 1.1 y se -0.4 34


66
1.9 97
3

-0.3 38
62
2.0 98
2

encontrara el numero 86. Esto significa que el 86 % de las personas en el grupo de


-0.2 42
58
2.1 98
2

comparacion tendran calificaciones menores que 86. Solarnente el 14 % (columna C) -0.1


tendran calificaciones mas altas. 46
54
2.2 99
1

EI metodo resulta facil, 0.00 50


50

Tornado de Winning with Statistics, R. P. Runyon; Addison-Wesley Publishing Co., Reading, Mass., 1977.
* En realidad, el autor rnenciona dos publicaciones especializadas: e1 Administratian Booklet y el Buros
Mental Measurement Yearbo9k. (N. del T)
110 ESTADfSTICA PARA LAS CIENCIAS SOCIALES DESVIACI6N ESTANDAR Y DISTRIBUCI6N NORMAL ESTANDAR 111

por la desvi~ciO? .estandar es la Hamada transforrnacion a calificaciones estandar 0 Puesto que Lz 2


= N, resulta
valores z. 51mbohcamente, z se define como
2 N
Sz = N = 1.
x-x
s (7.1 ) i,Cmil es el interes de la transformacion a un valor z? La conversion a valores z
produce siempre una media nula y una desviacion estandar igual a 1, pero no
Se observara que todo dato en la distribuci6n puede ser transforrnado en un «normaliza» una distribucion que no sea normal. Sin embargo, si la poblacion de
valor z, en cuyo ~aso z representara la desviaci6n de una calificaci6n especifica calificaciones de una variable dada es normal, podemos expresar cualquier califica­
respecto a la media, expresada en unidades de desviacion estandar. cion como un rango percentil, refiriendo nuestra z a la distribucion normal estandar,
1. La surna de los valores z es igual a cera. Simbolicamente, Ademas, puesto que los valores z representan numeros abstractos, en oposicion a los
valores concretos de las calificaciones originales (centimetros, kilos, etc.) podemos
I z = o. (7.2)
comparar la posicion de una persona en una variable con su posicion en una segunda
variable. Para comprender estas dos importantes caracteristicas de los valores z,
2. La media de los valores z es igual a cero. A si,' hemos de referirnos a la distribucion normal estandar.

~ Iz O.
-N=
- = (7.3) 7.3 La distribuci6n normal estandar
3. La suma de .los cuadrados de los valores z es igual a N*. Asi,
La distribucion normal estandar tiene una J1 de 0, una (J de 1 y un area total igual a
I z2 = N. (7.4)
1.00*. Hay una proporcion fija de casos entre las perpendiculares (ordenadas)
.levantadas en dos puntos cualesquiera del eje de las abscisas. Tomando algunos
Esta caracteristica puede demostrarse matematicamente: puntos de referencia a 10 largo de la curva normal, podemos enunciar 10 siguiente:
1. Entre la media y una desviacion estandar a la derecha de ella se encuentra el
34.13 % de los casos. Analogamente, el 34.13 % de todos los casos estan entre la
media y una desviacion estandar a la izquierda de ella. Dicho de otro modo, el
34.13 % del area situada bajo la curva se encuentra entre la media y 1 desviacion
estandar (a la derecha), y el 34.13 % del area esta comprendida entre la media y -1
desviacion estandar.
2. Entre la media y 2 desviaciones estandar a la derecha de ella se encuentra el
=N. 47.72 % de los casos. Puesto que la curva normal es simetrica, el 47.72 % del area
4. La desviacion estandar y la varianza de los valores z son iguales a Ja unidad. Asi, tambien esta comprendida entre la media y - 2 desviaciones estandar.

* Se recordara que las letras griegas Il Y a representan, respectivamente, la media Y la desviaci6n estandar
(7.5) poblacionales. La ecuacion de la curva mormal es:
Demostracion:
Ni -(X-Ill'
Y=--e ,
uj2ii 2u'
donde

Y = la frecuencia (ordenada) en un valor dado de X.


Dado que z= 0, se tiene a = la desviaci6n estandar de la distribucion,
rr = una constante aproximadamente igual a 3.1416,
e = aproximadamente 2.7183
N = frecuencia total de la distribuci6n,
Il = la media de la distribucion,
i = la longitud del intervalo,
• Esta propiedad de los valores - es importante ' , d X = cualquier dato (abscisa) en la distribucion.
emplean para calcular el coeficient -d I'" padra compren er una de, las muchas formulas alternativas que sc
e e corre acion r e Pearson (ver la seccion 8.2), Debe quedar claro que hay una familia de curvas a la que se Ie llama normal. Haciendo Ni =. I, se genera una
distribuci6n en la que Il = 0 y el area total bajo 1a curva es igual a 1.
112 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
DESVIACI6N ESTANDAR Y DISTRIBUCI6N NORMAL ESTANDAR 113

3. Finalmente, entre la media y 3 desviaciones estandar a la derecha de ella se


de 24.65. Notese que ahora cabe interpretar esta calificacion como un rango percentil
encuentra el 49.87 % de los casos. Analogamente, el 49.87 % de los casos esta entre la
media y - 3 desviaciones estandar. Asi, el 99.74 % de los casos cae entre ± 3 de 95.82.
desviaciones estandar. Estas relaciones se ilustran en la figura 7.1. Supongamos que otra persona obtu~o u~~ calific~cion de 7.35 en la misma
variable normalmente distribuida. Su calificacion z sena

z = 7.35 - 16 = -1.73.
5

Puesto que la curva normal es simetrica, en la tabla A se dan I~s areas


correspondientes unicamente a los valores positivos de .z. A los valores negat~vos de z
les corresponderan exactamente las mismas proporcrones qu.~ a sus :qUlvalentes
positivos. Asi, el area entre la media y una z d~ -1.73 es tarnbien 45.82 %. EI rango
Fig. 7.1 Areas situadas bajo la curva percentil de una calificacion menor que la media se puede obtener y.a sea restando el
normal entre puntos seleccionados. 45.82 % del 50 %, 0 bien directamente de la columna (C). En cualquier caso, el rango
percentil de una calificacion de 7.35 es 4.18. . . . .
Ahora bien, al transformar los valores de una variable normalmente distribuida
Debe observarse con atencion que est as relaciones se aphcan exclusivarnente a las
en valores z, expresamos en realidad estos valores en unidades de la curva normal
calificaciones que proceden de poblaciones normalmente distribuidas. La tr~nsfor­
estandar, Para cualquier valor dado de X, con cierta proporcion de area a su
macion de calificaciones originales en calificaciones estandar no altera, de nmguna
derecha, existe un valor correspondiente de z con la misma proporcion de area a
manera la forma de la distribucion original. EI unico cambio consiste en transformar
su derecha. Asi, si tenemos una poblacion en la que J1. = 30 y (1 = 10, la z correspon­
la media en cero y la desviacion estandar en uno. Asi, si la distribucion original de las
diente a la media (X = 30) sera igual acero, y los valores de z correspondientes a los
calificaciones no es normal, la distribucion de las calificaciones z sera no normal. En
puntos situados una desviacion estandar a la derecha y a la izquierda de la media
(X = 40 Y X = 20) seran + 1.00 y -1.00, respectivamente.
otras palabras, la transformacion a z no convertira una distribucion no normal en
una distribucion normal*.
La figura 7.2 aclara aun mas las relaciones entre las calificaciones ?ri~in~les, las
7.3.1 Obtencion del area entre dos valores dados calificaciones z y los rangos percentiles de una variable normalmente distribuida, En
ella se toman J1. = 50 y (1 = 10.
Para facilitar la exposicion, restringimos la discusion anterior del area situada bajo la
curva normal a algunos puntos escogidos. A efectos practices, sin embargo, es
posible determinar el area entre dos puntos cualesquiera, haciendo uso de los valores
tabulados del area bajo la curva normal (ver el apendice III, tabla A). La columna de
la izquierda, encabezada por z, representa la desviacion respecto a la media
expresada en unidades de desviacion estandar, Refiriendonos a la parte central de la
tabla, podemos determinar el area entre un valor dado y la media (columna B), yel
area a la derecha de un valor dado (columna C). Asi, si una persona obtuvo una
calificacion de 24.65 en una variable normalmente distribuida con J1. = 16 Y (1 = 5,

su calificacion z seria

24.65 - 16 CALIFICACION ORIGINAL 20 30 40 50 60 70 80


z= 5, = 1.73.
VALOR z -1 o +1 +2 +3

Remitiendonos a la columna (B) de la tabla A, encontramos que 0.4582, 0 sea, el RANGO PERCENTIL 0.13 2.28 15.87 50.00 84.13 97.72 99.87
45.82 %* del area esta situada entre dicha calificacion y la media. Puesto que en una
distribucion simetrica el 50 % del area esta situada a la izquierda de la media, Fig. 7.2 Relaciones entre calificaciones originales, valores z y rangos percentiles de una variable
normalmente distribuida en la cual f1. = 50 y a = 10.
podemos concluir que el 95.82 % del area total esta a la izquierda de una calificacion

• Las ~re~s situadas bajo la curva n~rmal se expresan en fraceiones de area. Para convertir en porcentajes de area,
basta multiplicar por 100, 0 desplazar simplernente el punto decimal dos lugares a Ja derecha. - . En el apendice IV, pagina 409. se resumen los procedimientos para transformar una distribucion de frecuencias no
normal en una distribucion normal.
DESVIACION ESTA.NDAR Y DISTRIBUCION NORMAL ESTA.NDAR 115
114 ESTADiSTICA PARA LAS CIENCIAS SOCiALES

7.4 Problemas ilustrativos EI signo menos indica que la calificaci6n es menor que la medi.a. B~s.cando 0.44 en la
columna (c), hallamos que el 33.00 % de los casos tienen calificacion menor que la.
Consideremos varios problemas en los que suponemos que la variable corresponde a suya. Asi, su rango percentil es de 33.00.
calificaciones obtenidas en una prueba para la determinacion del CI, donde la media
Problema 3. l,Que porcentaje de los casos estan entre una calificacion de 120 y otra
poblacional u es igual a 100 y la desviacion estandar (J es igual a 16. Se supone que la
variable se distribuye normal mente. de 88? (fig. 7.5). di idi
Notese que para responder a est a pregunta ~? restamo~ 88 de 120 y I~I, imos
Problema 1. Un estudiante obtuvo una calificacion de 125 en una prueba de CI. por (J. Las areas en una curva normal de probablhdades estan dadas en relacion a la
l,Que porcentaje de casos se encuentran entre su calificacion y la media? l,Cmil es su media, que se toma como punto fijo de r~feren.c.ia. Par tanto, ~ebemos caIcular .por
rasgo percentil en la poblacion? separado el area entre la media y una califlcacton de 120 y el area ~ntre la me,dta y
Para comenzar, es conveniente construir un diagrama simple que represente las una calificacion de 88. Para resolver eI problema sumamos despues las dos areas.
relaciones en cuestion. Asi, en el presente ejernplo, el diagrama seria como el que
aparece en la figura 7.3. Para hallar el valor de z correspondiente a X = 125,
restamos la media poblacional de 125 y dividimos por 16. Asi,

125 - 100
~ - ~-1~6~ = 1.56.

Fig. 7.5 Proporcion de area entre

A REA TOTAL las calificaciones de 88 Y 120 en una

I A LA IZQUIERDA
DE 125
distribucion normal con II = 100 Y

(J = 16.

Procedimiento:
Paso 1. Hallar la z correspondiente a X = 120.
Fig. 7.3 Proporcion de area a la
izquierda de J25 en una distribucion
125 normal con )1 = 100 Y (J = 16.
7 = 120 - 100 = 1.25.
J1
~ 16
Buscando 1.56 en la columna (B) de la tabla A, hallamos que 44.06 % del area esta
situada entre la media y 1.56 desviaciones estandar a la derecha de la media. EI rango Paso 2. Hallar la z correspondiente a X = 88.
percentil de dicho estudiante es, por tanto, de 50 + 44.06, 0 sea, 94.06.
Problema 2. Otro estudiante obtiene una calificaci6n de 93 en una prueba de CI. _= 88 - 100 = -0.75.
~ 16
l,Cual es su rango percentil en la poblaci6n? (fig. 7.4).
93 - 100 Paso 3. Hallar las areas requeridas en la columna (B) de la tabla A.
z = --16-'- = - 0.44.
EI area entre la media y z = 1.25 es de 39.44 %

EI area entre la media y z = -0.75 es el 27.34 %

I AREA A LA IZQUIERDA
DE UNA
CALIFICACION DE 93
Paso 4.. Sumar las dos areas obtenidas.
Asi, eI area entre 88 y 120 = 66.78 %.
Problema 4. l,Que porcentaje de area hay entre las calificaciones de 123 y 135?
Fig. 7.4 Proporcion de area a la
izquierda de una calificacion de 93 en (fig. 7.6). b I 11 el
una distribucion normal con u = 100
De nuevo, no podemos obtener la respuesta en forma dir~cta. De emos ia ar
93 J1 Y (J = 16. area entre la media y 123, Y restarla del area entre la media y 135.
116 ESTADfSTICA PARA LAS CIENCIAS SOCIALES DESVIACI6N ESTANDAR Y DISTRIBUCI6N NORMAL ESTANDAR 117

7.5 La desviacion estandar como estimacion


I
AREA ENTRE LAS
CALIFICACIONES
DE123Y135
del error y de la precision
A falta de cualquier informacion especifica, l,cual es nuestro mejor y mas sencillo
Fig. 7.6 Proporcion de area entre
fundamento para predecir la calificacion de cualquier persona dada? Si los datos
las calificaciones de 123 y 135 en una se obtienen de una poblacion normalmente distribuida, resulta que la media
distribucion normal con J.l = 100 Y (0 cualquier otra medida de tendencia central) es nuestro mas sencillo pronosticador.
J1 123 135 a = 16. Cuanto mas compacta sea la forma en que se distribuyen las calificaciones respecto a
Procedimiento: la media, mas pequefios seran enpromedio nuestros errores en la prediccion, A la
Paso 1. Hallar la z correspondiente a X = 135. inversa, cuanto mayor sea la dispersion de las calificaciones respecto a la media,
mayores seran en promedio nuestros errores en la prediccion, si utilizamos la media
135 - 100 para estimar 0 predecir calificaciones. Puesto que la desviacion estandar refleja la
16 = 2.19. dispersi6n de las calificaciones, resulta, en cierto sentido, una estimaci6n del error.
Por la misma razon, la desviaci6n estandar es tam bien una medida de la precision. Si
Paso 2. Hallar la z correspondiente a X = 123.
dos distribuciones tienen la misma media pero diferentes grados de dispersion,
123 - 100 aquella con menor desviaci6n estandar proporciona en promedio medidas mas
16 = 1.44. precisas (0 sea, medidas mas cercanas a la media).
Paso 3. Hallar las areas requeridas en la columna B.
EI area entre la media y z = 2.19 es el 48.57 %
EI area entre la media y z = 1.44 es el 42.51 %
Paso 4. Restar para obtener el area entre 123 y 135. EI resultado es

48.57 - 42.51 = 6.06 %.

Problema 5" Dijirnos anteriormente que la transforrnacion a valores z permite


comparar una posicion individual en una variable con su posicion en otra. Ilustre­
mos esta importante aplicacion de los valores z.
En una prueba de aptitud, cierto candidato obtuvo una calificacion de 245 en la
prueba de relaciones verbales, y de 175 en la prueba de relaciones maternaticas. Las
medias y las desviaciones estandar en cada una de estas pruebas normalmente
distribuidas, s~n las siguientes: verbal, J1. = 220, (J = 50; maternaticas, J1. = 150, ({ICAPITAN, TENGO ALGUNAS BUENAS Y MALAS NOTICIAS QUE DARLE. LAS MALAS NOTICIAS
(J = 25. l,En cual de las dos pruebas obtuvo el aspirante mejor calificacion? Lo unico SON QUE PRIMERO NOS PASAMOS 150 METROS DEL BLANCO Y LUEGO NOS QUEDAMOS
que hemos de hacer es comparar las calificaciones z obtenidas por el aspirante en CORTOS EN 150 METROS; DESPUES NOS QUEDAMOS CORTOS EN 75 METROS Y DESPUES
NOS PASAMOS EN 75 METROS. NI UN SOLO #"1#" OISPARO 010 EN EL BLANCO. LA BUENA
cada variable. As]: NOTICIA ES QUE, EN PROMEDIO, ESTAMOS PRECISAMENTE EN EL BLANCOI».

245 ­ 220 . . 175 ­ 150


z ver ba I = - - - ­ z matematica = ---­ A modo de ilustraci6n, imaginemos que se trata de comparar dos unidades de
50 25 artilleria, la bateria A y 1;,1 bateria B. Un dato de cero significa que se dio en el blanco,
= 0.50 = 1.00. un dato positivo significa que el disparo fue largo, y un dato negativo significa que el
disparo fue corto. En la tabla 7.1 se resumen los resultados.
Podemos deducir, por tanto, que el aspirante obtuvo mejor calificacion en la Aunque a ambas baterias les corresponde la misma media, esta claro que la
pa~te m~tematica de la prueba de aptitud. Por supuesto, si se desea, cabe expresar las bateria B consigui6 mas disparos cercanos al blanco que la bateria A. Eri otras
calificaciones como rangos percentiles. As!, en este ejernplo el rango percentil es de palabras, el fuego de la bateria B fue mas preciso, Esta mayor precisi6n se refleja en la
84.13 en la prueba maternatica y solo de 69.15 en la prueba verbal. . rnenor desviacion estandar de la bateria B.
118 ESTADfSTICAPARA LAS CIENCIAS SOCIALES DESVIACI6N ESTANDAR Y DISTRIBUCI6N NORMAL ESTANDAR 119

Tabla 7.1 Resultados hipoteticos obtenidos por Facilmente podemos convertir los datos Z en unidades de la curva normal
DISTANCIA FRECUENCIA dos baterias de artilleria al disparar a un blanco.
AL BLANCO estandar:
(EN METROS) BATERIA A BATERIA B Z-2
z=---·
10
200 2 o
150 4 1 Asi, una persona que obtuvo un Z de 84.8 tend ria un correspondiente z de
100 5 5
50 7 10 z = 84.8 - 100 = _ 15.2 = -1.52.
o 9 13
10 10
-50 7 10
-100 5 5 Empleando la curva normal estandar, se encuentra que a este valor le corresponde
-150 4 1
un rango percentil de 6.53. .,
-200 2 o Para eliminar los decimales, podriamos usar una transforrnacion tal como
X= 0 o Z = 500 + 100z.
s = 102.74 65.83*

... Obsarvese que, si bien las dos baterias tienen ta misma precision Un valor z de -1.52 se convierte en
media, los disparos de la bateria B muestran una dispersion menor.
Z = 500 + 100( -1.52)
= 500 - 152
= 348.
7.6 La transformaci6n a valores Z
Muchos examenes y pruebas psicol6gicas han sido realizadas a proposito para ob­
tener una distribucion normal de datos z. Mas aun, existenprocedimientos para Resumen del capitulo
transformar distribuciones no norrnales en una distribucion normal estandar. Estos
procedimientos se indican en el apendice IV, pagina 409. Recuerdese, sin embargo, En este capitulo, mostramos la importancia de la desviacion estandar para. cornparar
que los datos z incluyen much os valores negativos y estan expresados en forma la dispersion de las calificaciones en diferentes distribuciones de una van able, para
decimal. Puesto que a menu do resulta incornodo y confuso trabajar con numeros interpretar una calificacion respecto a una distribucion, y para. cOIr~para~ las
negativos y decimales, los datos z de variables norrnalmente distribuidas son calificaciones en dos 0 mas variables. Vimos la forma de convertir calificaciones
frecuentemente convertidos en valores Z, empleando la siguiente ecuacion de originales en unidades de la curva normal estandar (transformaci6n ~ valores z), .y
transforrnacion: tambien se explico las caracteristicas de la curva norma! est.andar. Mediante un.a, sene
Z* = 100 + lOz. de problemas resueltos se mostraron las diversas aphcacIOnes de la conversion de
variables normalmente distribuidas en valores z.
Esta transforrnacion da lugar a una distribucion con media de 100 y desviacion Finalmente se estudio la desviacion estandar como una estimaci6n del error y de
estandar de 10, y quedan eliminados todos los valores negativos. Asi, una calificacion la precision. M~stramos el uso de la transformaci6n Z como un metodo con~enie~te
con una z correspondiente a -1.52 se convierte en . para eliminar los valores negativos que se presentan cuando se expresan las calificacio­
INcr;,::: ll?\P~ec").,,,. -4- ) nes en terrninos de z.
Z = 100 + 1O( - 1.52)
= 100 - 15.2 = 84.8.
Se acostumbra redondear al numero entero mas proximo, con 10 cual se eliminan los
decimales. Terminus para recordar
* La transforrnacion puede incluir la sustitucion de constantes cualesquiera en la ecuacion. Asi, si se desea obtener
una media de 100 y una desviacion estandar de 20, la ecuacion de transforrnacion tendra que ser: 100 + 20z. Hay una calijicacion esuindar (z)

transformacion a calificaciones Z que normaliza las distribuciones no normales. Los procedimientos correspondientes
caen fuera del alcance de este libra. Como referencia puede verse: Walker, Helen M. y Joseph Lev, Elemelltary Statistical distribucion normal estandar

Methods (3.' ed., 1969). Nueva York: Holt, Rinehart and Winston, Inc.
120 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
DESVIACION ESTA.NDAR Y DISTRIBUCION NORMAL ESTA.NDAR 121

Ejercicios 6. Si construyeramos una curva de frecuencias para cada uno de los casos siguientes, l,cual
se aproximarfa a una cur va normal? '
1. Dada una distribucion normal con media de 45.2) Jesviacion estandar de 10.4, Milar las
calificaciones estandar equivalentes para las siguientes calificaciones:
a) La estatura de una gran muestra representativa de los varones norteamericanos
a) 55 b) 41 c) 45.2
adultos.
d) 31.5 e) 68.4 f) 18.9
b) Las medias de un gran numero de muestras con N fijo (por ejemplo, N = 100),
extraidas de una poblacion de 'calificaciones normalmente distribuida.
2. Hallar la proporcion de area situada bajo la curva normal entre la media y los siguientes c) Las medias de un gran mimero de muestras con N fijo (por ejemplo, N = 100),
valores z: extrafdas de una poblacion de calificaciones con distribucion moderadamente
a) -2.05 b) -1.90 c) -0.25
sesgada. .
d) +0.40 e) + 1.65 f) + 1.96
d) Los pesos, en gramos, de mazorcas de maiz seleccionadas al azar en un maI~~l.
g) +2.33 h) +2.58 i) +3.08
e) EI ingreso anual, en pesos, del cabeza de familia de un gran mimero de familias
mexican as seleccionadas al azar.
3. Dada una distribucion normal basada en 1000 casos, con una media de 50 y una
desviacion estandar de 10, hallar: f) EI peso, en gramos, de todos los peces obtenidos en un concurso de pesca.
a) la proporcion de area y el mimero de casos entre la media y las siguientes 7. En una distribuci6n normal con J1 = 72 y a = 12:

calificaciones: a) l,Cual es la calificacion correspondiente al percentil 25?

b) l,Cual es la calificaci6n correspondiente al percentil 75?

60, 70, 45, 25; c) l,Cual es la calificaci6n correspondiente al percentil ?O? " .

b) la proporcion de area y el numero de casos a la derecha de las siguientes calificacio­ d) Encontrar el porcentaje de cas os que tienen una calificacion supenor a 80.

nes: e) Encontrar el porcentaje de casos que tienen una calificaci6n inferior a 66.

60, 70, f.)l,Entre que calificaciones se encuentra el 50 % central de los casos?· ,

45, 25, 50;


g) loA partir de que calificaci6n se encuentra el 10 % mas extremo?

c) la proporcion de area y el numero de casos entre las siguientes calificaciones: h) l,A partir de que calificaci6n se encuentra el 1 % mas extremo?

60-70, 25-60, 45-70, 25-45. 8. Responder a las preguntas anteriores, desde la a) hasta la h), para

a) J1 = 72 y a = 8;

4. A continuacion se presentan las calificaciones obtenidas por un alumno, asi como la b) J1 = 72 y a = 4;

media y la desviacion estandar en cad a una de tres pruebas normalmente distribuidas: c) J1 = 72 Y a = 2.

9. Basandose en la siguiente informaci6n, determinar si Raul obtuvo mejorresultado en la


I' a CALIFICACION
PRUEBA DEL ALUM NO prueba I 0 en la prueba II. l,En que prueba respondi6 mejor Alicia?
Aritmetica 47.2 4.8 53 ----------
Comprensi6n verbal PRUEBA PRUEBA
64.6 8.3 71 I II
Geograffa 75.4 11.7 72
500 24
a 40 1.4
a) Convertir cada una de las calificaciones del alumno en calificaciones estandar?
Calificaciones de Raul 550 26
b) loEn que prueba obtuvo mejor resultado? loEn que prueba obtuvo peor resultado? 25
Calificaciones de Alicia 600
c) loQue proporcion de la poblacion sobrepaso su calificacion en aritmetica? loy en
comprension verbal? loy en geografia?
10. loSe distribuyen normalmente todos los valores z? l,Por que?
5. En una prueba normalmente distribuida de aptitud en matematicas, se tiene para
alumnas 11. l,Existe mas de una distribuci6n normal?
12. Transformar los siguientes valores z en valores Z, usando la transformaci6n Z = 50 +
J1 = 60, a = 10,
+ lOz. Redondear al entero mas pr6ximo.
y para alumnos a) - 2.43 b)1.50

c) - 0.50 d) 0.00

J1 = 64, a = 8.
13. La transformaci6n a valores Z da lugar a los siguientes valores cuando Z = 500 + 100z.
a) Un alumno obtuvo una calificacion de 62. loCual es su rango percentil en relacion con Regresar a los valores z originales.
ambas normas, la masculina y la femenina? a) 230 b) 500 c) 780 d) 640 e) 460
b) EI rango percentil de una alumna es de 73 en la norma femenina. loCual es su rango
14. l,En que sentido se puede considerar a la desviaci6n estandar como una medida de
percentil en la norma masculina?
precision?
[122J CORRELACI6N 123

8
Tabla 8.1 Diversos tipos de coeficientes de correlacion y escalas numericas con que son utilizados.

ESCALA SIMBOLO SE USA CON

Correlaci6n
Nominal r phi' (coeficiente phi)
rb'
Dos variables dicotornicas.
(r biserial) Una variable dicotomica cuva continuidad se
admite; una variable que puede tomar mas de
dos valores.
r'
r (r tetracorica) Dos variables dicotornicas cuva continuidad se
puede admitir.

Ordinal r, (r de Spearman) Datos ordenados sequn su rango. Si una varia­


ble es propiamente ordinal V la segunda es de
lntervalo/razon, se las debe expresar a las dos
sequn su rango antes de calcular la r de Spear­
man.
8.1 EI concepto de correlacion rl (tau de Kendall, 0 Datos ordenados sequn su rango.
coeficiente de correlacion
por rangos)
Hast~ .ahora n?s. hemos ocupado del calculo de diversos estadigrafos que han
perrnitido describir en forma completa la distribucion de los valores de una variable lntervalo/razon r de Pearson Escalas de intervalos V/o de razones.
unica, y relacionar estos estadigrafos con la interpretacion de calificaciones indivi­
• Ver A. L. Edwards, Statistical Methods. 3.' ed. Nueva York: Holt, Rinehart and Winston. 1973.
duales. Sin embargo, como es bien sabido, muchos de los problemas de los que se t Ver S. Siegel, Nonparametric Statistics. Nueva York: McGraw-Hili. 1956.
ocupan las ciencias del comportamiento van mas alla de la descripcion de una
variable tinica en sus varias y diferentes ramificaciones. Con frecuencia se nos pide Sea cual sea la tecnica de correlacion que se use, 10 fundamental es que todas
d~terminar las relaciones entre dos 0 mas variables. Asi, por ejernplo, los centros tengan ciertas caracteristicas comunes.
directivos de las universidades muestran gran interes por la relacion existente entre
los promedios de calificacion obtenidos en la ensefianza media, 0 las calificaciones 1. Se obtienen dos conjuntos de rnedidas en los misrnps individuos (0 sucesos) 0 en
logradas en el examen de ingreso a la universidad, y el rendimiento en la inisma. parejas de individuos que tengan alguna forma de relacion,
~Los estudiantes que obtienen calificaciones altas en los centros de ensefianza media 2. Los valores de los coeficientes de correlacion varian entre + 1.00 y - 1.00.
o en el examen de ingreso obtienen tarnbien notas altas en la universidad? Reciproca­ Ambos. extremos representan relaciones perfectas entre las variables, y 0.00
mente, ~los estudiantes que obtienen calificaciones bajas en ensefianza media 0 en el representa .la ausencia de relacion,
examen de ingreso tienen un rendimiento bajo en la universidad? ~Tiende a cumplirse 3. Una relacion positiva significa que los individuos que obtienen calificaciones
que los p~?res de una g~a~ inteligencia tengan sus hijos igualmente dotados? ~Hay altas en una variable tienden a obtener calificaciones altas en la otra. La
una relacion entre los dividendos de las acciones y su valor en boIsa? ~Existe una aseveracion contraria tambien es valida; es decir, los individuos que obtienen
relacion entre el nivel socio-econornico y la reincidencia en el delito? calificacion baja en una variable tienden a obtener calificacion baja en la otra*.
. Tan pronto como tratamos de buscar relaciones entre diversas variables, nos 4. Una relacion neqatioa significa que los individuos que obtienen calificacion
encontramos dentro del area fascinante de la correlacion, Para expresar cuantitativa­ baja en una variable tienden a obtener calificacion alta en una segunda variable.
mente el grado en que dos variables estan relacionadas, es necesario calcular un
Reciprocarnente, los individuos que obtienen calificacion alta en una variable
coeficiente de correlacion. Existen rnuchos tipos de coeficientes de correlacion, La
tienden a obtener calificacion baja en la segunda variable*.
decision de cual se ha de emplear para un conjunto especifico de datos depende de
facto res tales como: (1) el tipo de la escala de medida en que cada variable esta La figura 8.1 muestra una serie de diagramas de dispersion que ilustran varios
expresada; (2) la naturaleza de la distribucion (continua 0 discreta); y (3) la grados de relacion entre dos variables X e Y. Al interpretar las figuras, es importante
caracteristica de la distribucion de las calificaciones (lineal 0 no lineal). La tabla 8.1 recordar que cada punta representa dos valores: la calificacion de una persona en la
muestra algunos de los coeficientes de correlacion cuyo empleo resulta adecuado con variable X y la calificacion para la misma persona en la variable Y. <Como se indico
varios tipos de escalas. Eneste texto introducimos dos coeficientes de correlacion: la anteriormente (seccion 3.4), la variable X se representa en el eje de las abscisas y la
r de Pearson, ~ coeficiente de correlacion del producto-momenta de Pearson, que se variable Y en el eje de las ordenadas.
emplea con vanables medidas en escalas de intervalo 0 de razon; y el coeficiente r , 0
coeficiente de correlacion por.ranqos de Spearman, que se emplea con datos ordenados
segun su rango. * Estas caracteristicas son verdaderas para los coeficientes de correlacion que miden la relacion lineal, pero no 10son
para todos los coeficientes de correlacion,
CORRELACI6N 125
124 ESTADfsTICA PARA LAS CIENCIAS SOCIALES

Recuadro 8.1
75,-------------------------------..,

70
TINA

65

(J) 60
o
'2
«
15 55
;3'y
s
w 50
Q
«
N
2
« 45
0:
w

0)
w
40

35

30
0 100 300 400 500 600 700 800 900 1000 1100 1200 1300 1400
X
PRODUCTO NACIONAL BRUTO PER CAPITA (DOLARES)

i,Existe una relacion entre el praducto nacional bruto (PNB) per capita, expresado en de los paises no desarrollados con un alto PNB per capita tienen una larga esperanz~ de
dolares, y la esperanza de vida de los nifios nacidos actualmente en los paises no vida. Los ciudadanos de los paises con bajo PNB tienen una co.rta espe~a,nza de Vida.
desarrdllados? Tarnbien se aprecia que la relacion no es lineal (linea recta), sma curvlhnea.
En la tabla adjunta se muestran los ingresos per capita y la esperanza de vida en PNB PER CAPITA ESPERANZA
dieciseis naciones. A est as variables las hernos lIamado X e Y, donde X cs cI valor EN DOLARES DE VIDA, Al'i10S
X Y
en dolares del PNB, e Y el valor de 1'1 esperanza de vida. Notese que para cada nacion PAIS
hay dos valores, uno para la variable X y otro para la variable Y. Afganistan 75 40
Para ayudar a visualizar estas relaciones, se ha dibujado un diagrarna de dispersion, Nigeria 135 39
Es tradicional representar los valores de la variable X en el eje horizontal (Ilamado Nepal 87 43
tam bien eje X 0 eje de las abscisas) y los valores de la variable Y en el eje vertical Zaire 90 45
(llarnado tam bien eje Yo eje de las ordenadas). Los puntos que aparecen en el diagrama Tanzania 120 4<1
de dispersion adjunto representan los pares de valores X e Y para cada nacion. Veamos Indonesia 80 48
el procedimiento para construir un diagrama de dispersion. Uganda 140 49
Observese que el valor de X para Alganistan es 75, y que el correspondiente valor de China 170 53
Vietnam del Sur 245 54
Yes 40. Situemos en el eje X el valor de 75. Levantemos una perpendicular al eje X en
Iran 370 54
este punta. Situemos ahara el valor de 40 en el eje Y, Tracemos por este punto una 57
Turqula 760
perpendicular al eje Y. EI punto en que se cortan arnbas rectas representa el valor de 63
Brasil
500
cada variable, X e Y, para Afganistan. 69
Taiwan
460
Los diagramas de dispersion son utiles para representar la relacion entre dos 770 . 64
Mexico
variables. En el diagrama anterior se aprecia que hay una relacion real entre X e Y 1000 66
Venezuela

(0 sea, que los valores bajos en X estan generalmcnte asociados a valores bajos de Y, y los 1300 67
Argentina

valores altos de X 10 estan con valores altos en n.


Dicho de tro modo, los ciudadanos
126 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
CORRELAcr6N 127


• ,. Tabla 8.2 Calificaciones originales y sus correspondientes valores z de 7 individuos con respecto ados

•• • • •
• ••
.. variables (datos hipoteticos),

y
• y
• y INDIVIDUO X X-X (X ­ X)' z, Y v _ '(2 (Y _ 9)' z" z,;z.\.

• • • • •
• • • A 1 -6 36 -1.5 4 -9 81 -1.5 2.25
• • • • B 3
5
-4
-2
16
4
-1.0
-0.5
7
10
-6
-3
36
9
-1.0
-0.5
1.00
0.25
C
X X D 7 0 0 0 13 0 0 0 0
X
r » LOO E 9 2 4 0.5 16 3 9 0.5 0.25
r = 0,82 r = 0.57
F 11 4 16 1.0 19 6 36 1.0 1.00
G 13 6 36 1.5 22 9 81 1.5 2.25

•• •• ••• •• LX=49 sc, = 112 LY= 91 SC y = 252 Lz..zy = 7.00


• •• • • • • •• • X = 7.00 e; =Jlf1= 4.00 Y = 13.00 Sy ~ .pfI = 6.00
• •• • • •• •• • •
• • • •• • • • •••• • • •
y y y
• •• • • • • • Debe notarse que para el calculo de una I' de Pearson no es necesario que X e Y
•• • •• • • •• •• esten medidas en la misma escala. En el ejemplo, vemos que X varia de 1 a 13,
mientras que Y varia de 4 a 22. Esta independencia de I' respecto ala escala especifica
• de valores permite investigar las relaciones entre una gran cantidad de vari.ables.
X X X
~Podemos incluso, si se nos antoja, relacionar la longitud del dedo gordo del pie con
r = 0.00 r = -0,38 r = -LOO el CI?
Fig. 8.1 Diagramas de dispersion que muestran varios grados de relacion entre dos variables. Notese tarnbien, como ya 10 sefialarnos anteriormente, que las calificaciones z de
cad a individuo en cada variable son identicas en el caso de una correlacion positiva
perfecta. Si hubierarnos invertido el orden de los valores de cualquiera de las
variables, haciendo corresponder, por ejemplo, 1 con 22, 3 con 19, etc., los valores z
8.2 La r de Pearson y los valores z seguirian siendo identicos, pero de signo opuesto. En este ultimo caso, nuestra
correlacion tendria un valor maximo negativo (I' = -1.00).
Si multiplicamos nuestras parejas de valores z y sumamos.despues los resu1t~dos,
Un valor positivo alto de la I' de Pearson indica que cada individuo obtiene,
solamente obtendremos valores maximos cuando la correlacion sea de 1.00. Cierta­
aproximadamente, las mismas calificaciones z en ambas variables. En una correla­
mente cuando la correlacion se aproxima acero, la suma de los productos de las
cion positiva perfecta (I' = 1.00), cada individuo obtiene exactamente la misma
calificacion z en ambas variables. parejas de valores z tarnbien se aproximara a cero. Notese que cuando la correl~ci6n
es perfecta, la suma de los productos de las parejas de valores z es igual a .N, siendo
Con una I' negativa alta, cada individuo obtiene aproximadamente la rmsrna
calificacion z en ambas variables, pero con signos diferentes. N el numero de parejas 0 al numero de mediciones efectuadas en cualquiera de las
variables X 0 Y. Estos hechos conducen a una de las muchas formulas distintas, pero
Recordando que el valor z represent a una medida de posicion relativa en una
algebraicamente equivalentes, para 1':
variable dada (es decir, un valor .positivo alto de z representa una alta calificacion
relativa al resto de la distribucion, y un valor negativo alto de z representa una baja
calificacion relativa al resto de la distribucionj, es posible, ahora, generalizar el (8.1)
significado de la I' de Pearson.

La I' de Pearson es una medida del qrado en que los mismos indioiduos 0 sucesos En la seccion 7.2, sefialamos que ~)2 = N. Se notara que, cuando la correlacion
ocupan la misma posicion relatioa respecto a dos variables. es perfecta, cada valor z en la variable X es identico a su correspondiente valor z en la
variable Y. Asi, LZxz = LZ~ = LZ;, cuando I' = 1.00. En otras palabras, en una
Con el fin de investigar las caracteristicas fundamentales de la I' de Pearson, correlacion perfecta, fzxzy = N. La I' de Pearson toma entonces el valor NIN, 0 sea,
examinemos un ejemplo simplificado de una correlacion positiva perfecta. En la tabla 1.00.
8.2 encontramos las parejas de valores para 7 individuos respecto a dos variables Sugerimos allector que tome los datos de la tabla 8.1, los reagrupe de di~erentes
XeY.
forrnas y calcule 1', empleando la formula (8.1). De est a manera llegara a un
128 ESTADisTICA PARA LAS CIENCIAS SOCIALES CORRELACION 129

conocimiento mas completo del significado de r que si se limita, simplemente, a la L s procedimientos de calculo que emplean el metodo de la desviacion media
lectura del texto. (Por supuesto, esto no quiere decir que deje de hacer esto ultimo.) debe~ ser familiares al lector. Ya encontramos anteriormente_la .SC x y la SC y al
Sucede que est a formula no es manejable en la practica, puesto que requiere el estudiar la desviacion estandar, De hecho, al calcular r hemos afiadido solamente.!In
calculo de los valores z separados para cada individuo. [Irnagmese la titanica tarea paso que consiste en obtener la suma de los pro?u~~OS cruzados ~(X -:- Y). x:)(r: --:
que representa calcular r cuando N excede de los 50 casos, como frecuentemente Esto se consigue facilmente multiplicando la desVlaClOn?e cada c~lifi~.~clOn mdlvl.dual
sucede cuando se investiga en las ciencias del comportamiento! respecto a la media de la variable X por su correspondiente deSVIaCl~n ~n la vanable
Por esta razon se emplean diferentes formulas de calculo, En esta obra, ilustrare­ y. umando luego todos los productos cruzados. Debe observarse incidentalmente
mos el uso de dos de ellas: (1) la formula de la desviacion media, y (2) la formula de , Ys. d "(X - X-)(Y - Y-) con "(z . 10
z) que vimos en la seccion 8.2. Todo
L... ~ y.'
1a semejanza e L,
las calificaciones originales. dicho respecto a I~ relacion entre las vanac~ones e~ L(zx~y) y r puede ~ph~arse
tambien a L(X - X)(Y - Y) y r. Notese que Slse hubler~n alm~ado las deSVIaCl.ones
maxirnas en X con las desviaciones maximas ~n Y, y ~Sl suce.slv~me~te a traves de
toda la ordenaci6n de calificaciones, L(X - X)(Y - Y) habria sido 19~~l a 168.00,
8.3 Calculo de la r de Pearson que es el valor del denominador, y se habria producido una correlacion de 1.00.

8.3.1 Metodo de la desviacion media 8.3.2 Metodo de las calificaciones originales


Los cientificos que estudian el comportamiento no emplean a menudo el metodo de Ya hemos visto que la formula para calcular la suma de los cuadrados de los datos
la desviacion media para calcular la r de Pearson, ni tampoco la formula de los
originales es
valores z dada anteriormente, porque suponen mas tiempo y esfuerzo que otras
tecnicas de calculo, No obstante, 10 exponemos aqui principalmente porque arroja SC = ~ XZ _ (LX)Z
mas luz acerca de las caracteristicas de la r de Pearson. Sin embargo, con una N
x L. N
pequefia esta formula es tan cornoda como cualquier otra, a menos de que disponga­ y
mos de una calculadora automatica. Empleando el metodo de la desviacion media, la
formula de calculo para la r de Pearson es SC = ~ Yz _ (LY)z.
y L. N

(8.2) Por analogia*, la formula de los datos originales para la suma de los productos
cruzados es
Ilustremos el metodo de la desviacion media, empleando los datos de la tabla 8.2
pero ordenados en una secuencia distinta (tabla 8.3). L(X - X)(Y - ¥) = L XY - (LX~LY). (8.3)

Al calcular la r de Pearson por el metodo de las calificaciones originales, ~e ~iene


Tabla 8.3 Procedimiento para calcular Ia r de Pearson ernpleando eI rnetodo de Ia desviacion
media (datos hipoteticos).. la opcion de calcular por separado todos los valores antes mencionados y sustituirlos

INDIVIDUO X (X - Xl (X-X)' Y (y- 1') (y _ 1')' (X - xJ.lY ­ 1') • Ver la seccicn 6.5.2 para la demostracion de SC = LX2 - (LXj2jN.

A 1 -6 36 7 -6 36
L(X - X)(Y- ?)= L X Y- LX? - L YX + L XY

36
B 3 -4 16 4 -9 81 36 Puesto que

LX = NX, L Y = NY,

C 5 -2 4 13 0 0 0 y

0 7 0 0 16 3 9 0 LX j' = NX j' (generalizaci6n 1, capitulo 2),

E 9 2 4 10 -3 9 -6 Se deduce que:
F 11 4 16 22 9 81 36 L(X - X)(Y - Y)= LXY - NXY - NYX + 'NXY
G 13 6 36 19 6 36 36
= LXY - NXY
SC,=112 SC y = 252 DX - X)(Y - Y) = 138
= LX Y - N(L:)(2:~)
DX-X)(Y- Y) 138 138
r=
JSC,· SC" .J (112)(252)
--=0.82
168.00 = L X Y _ (D'~2:Y).
CORRELACI6N 131
130 ESTADfsTICA PARA LAS CIENCIAS SOCIALES

Tabla 8.4 Procedimientos para calcular la r de Pearson empleando el metodo de las calificaciones
en la formula (8.2), 0 bien definir r en funcion de las calificaciones originales como en originales (datos hipoteticos).
la formula (8.4), del modo siguiente:
Xy
I XY - Q:X~LY)
INOIVIOUO X

1
x'
1
Y

7
y'

49 7
A
r= ~~
J[I x» - (L:)2J[I y2 - (I;)2J B
C
0
3
5
7
9
25
49
4
13
16
16
169
256
12
65
112
9 81 10 100 90
E
Una formula alternativa muy util para el calculo de la r de Pearson cuando las 11 121 22 484 242
F
medias y las desviaciones estandar han sido ya calculadas para otros fines, es 13 169 19 361 247
G

IXY -Xl' IX = 49 LX 2 = 455 LY = 91 Ly 2 = 1435 LXY = 775


N (8.5)
r=----­ 2. Usando la f6rmula (8A):
SxSy 1. Utilizando la f6rmula (8.2):

La tabla 8.4 resume los procedimientos para calcular r por el metoda de las r = IIX - X)(Y - Y) ;
calificaciones originales. Aqui hallamos exactamente el mismo coeficiente que ..)SC x SC, 0

habfamos encontrado antes. Como en el metoda de la desviacion media, todos los (LX)(LY)
procedimientos, excepto los que se emplean para la obtencion de los productos L (X - X)(Y - Y) = I XY- N
cruzados, resultan familiares porque habian sido empleados en la formula de las
= 775 - 637 (49)(91)
calificaciones originales para obtener la desviacion estandar, La cantidad LXY se 775---­
halla multiplicando simplemente cad a valor de X por su correspondiente valor de Y,
= 138; 7

y sumando estos productos. SC = ~ X2 _ (LX)2 h( (49)~\ ( (91)2.\


x L.. N yl455 - -7-) 1435 - -7-)
(49)2 775 - 637
=455--­
8.4 Advertencia 7 J(112)(252)
= 112;
138

Cuando se encuentran correlaciones bajas, se cae en la tentacion de concluir que la SC = ~ y2 _ (Ly)2 168
relacion es pequeiia 0 no existe relacion alguna entre las dos variables en estudio. Sin '0 c: N
= 0.82.
embargo, debe recordarse que la r de Pearson refieja solamente la relacion lineal (91)2
= 1435 - - ­
entre dos variables. El no encontrar evidencia de una relacion entre dos variables 7
puede deberse a una de estas dos posibilidades: (1)al hecho de que las dos variables no = 252;
estan relacionadas; (2) a que las variables estan relacionadas en forma no lineal. r= ~L::e:(~X:::::-::::X=)::;(Y:::::-:-Y~)
En este ultimo caso, la r de Pearson no seria una medida apropiada para establecer el ..)SC x . SC y
grado de relacion entre las variables. Como ilustracion, si hicieramos la grafica de la
138 138
relacion entre la edad y la fuerza de la mano, obtendriamos un dibujo parecido al de
la figura 8.2. ..)112 0252
168
Examinando el diagrama de dispersion, es posible generalmente determinar si = 0.82.
hay un apartamiento sustancial de la linealidad. Si la distribucion de los puntos en el
diagrama de dispersion es eliptica, sin mostrar la desviacion notable que presenta la
posibilidad; y, como parte del procedimiento, se debe construir un diagrama de
figura 8.2, puede suponerse con certeza que la relacion es lineal. Algunas pequeiias
desviaciones de la linealidad no tendran gran infiuencia en la magnitud del coeficien­ dispersion antes de calcular la r de Pearson. .. .. .,
La suposicion de que existe una relacion lineal es el requisite mas Important!=
te de correlacion.
Por otra parte, cuando existe una marcada curvatura, como en la figura 8.2, un
wrPfl.ra justificar el uso de la r de Pearson como una m~dida de la relacion e~~re.d~~
Y~J!ables. No es necesario calcular r solamente con vanables normalmen.te ?ls.tnbUl
coeficiente de correlacion curvilineal representarfa mejor la relacion existente entre
'd.ils. Mientras que las distribuciones sean unimodales y relativamente simetncas: el
las dos variables que se investigan. Aunque el estudio de los coeficientes de
correlacion no lineal esta fuera del alcance de este texto, debe tenerse presente esta calculo de la r de Pearson se considerara legitimo.
132 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
CORRELACI6N 133

o
z
«
::2
:5 •••
"
...::
••.
•••••• ••
••
Variables de escala ordinal y rs

UJ •••• 'lIe ••• Supongamos que ellector es profesor de ensefianza primaria. Despues de varios afios
Cl
••••
•••• •• de observacion en la clase, llega a tener la firme sospecha de que la inteligencia y la

..••••••
Ill• • II

:e • ••
aptitud de mando son variables relacionadas. En un esfuerzo para comprobar su
hipotesis, obtiene estimaciones del CI de todos los nifios de su clase. Sin embargo, se
encuentra con el hecho de que no hay escalas disponibles para medir la aptitud de
Fig. ~.2 Diagrama de dispersion de dos variables que estan
mando y no encuentra una manera satisfactoria de cuantificar esta variable. A pesar
EDAD relacionadas en una forma no lineal (datos hipoteticos], de todo, de acuerdo con numerosas observaciones de los nifios en diferentes

pro~~:~ ~:s~a .~~:tr~~il~g~:1 ~a~Og~~~nlt~: ~:locroeSrredleacion


situaciones de liderazgo, se siente capacitado para ordenar a los nifios desde el que
dindelbidam.ente bajos tiene mayor aptitud de mando hasta el que tiene men os. La medida resultante
. 1 . una e as variables Po constituye, por supuesto, una escala ordinal. Aunque podriamos obtener una r de
~:~p ~6 Sl~os In~ere~a~e enco.ntrar la relacion entre la edad y la estatura de los ~ino~ Pearson con datos ordenados, una variante del coeficiente de correlacion producto­
alto :ntrea~~:~~~::a~::~~:.l~~U:~I:~geontseupu~coeficiente de ~orr.~lacion mas bien momento, conocida como la r de Spearman, '., 0 coeficiente de correlacion por
d d ' ongase que restrIngleramOs el
d;l ~~:fic~e:~:~t~~Stvariables. l.Que efecto t.endria esta restriccior, sobre la ma::i~~~
rangos, da la misma respuesta, pero reduce el calculo necesario para obtener la
correlacion. La r de Spearman es apropiada cuando una de las escalas de medida es
pero Con nin~s de e:~~~: ::t~~e~ta I~ ml~ma relacion entre la edad y la estatura, ordinal y la otra es ordinal 0 de intervalo/razon. Sin embargo, antes de aplicar la
coeficiente mas bien baj Ob y 0 a~os, probablemente encontrariamos un formula de '. se deben expresar ambas escalas como rangos.
. 0: . servemos graficamente este hecho. Comprendiendo que su conocimiento de los CI de ios nifios pudiera «perturbar»
Se notara que la relacion general ilustrada en la figura 8.3 es mas bien alt L
~:~~:~e~~;e~: eqn~: ~r~~ superiordde Ida.grafi~~ muestra I? que sucede al restrin~'ir e~ su estimacion de sus cualidades de mando 0 liderazgo, pide a un compaiiero que le
proporcione un ordenamiento por rangos de sus alumnos basado en sus aptitudes
iagrama e ispersron contemdo 1
representa una correlacion sumamente baja. A esta restriccio:~etr ~arte separada de mando. Luego obtiene una estimacion .de los CI independiente de los rangos.
frecuentemente rango truncado EI proble d 1 a go se la llama Enseguida procede a ordenar los CI de mayor a menor.
investigaciones sobre el com ortarnient rna e rango truncado no es raro en las Para calcular el coeficiente de correlacion por rangos es preciso obtener las
~~:g~~S rn~~!verSi?ades, dotcte lo~ indi~d~~~S~~nq~~:;;:e~:~e~~i~~:~~~~:a;~~:r~: . diferencias entre los rangos, elevarlos al cuadrado, sumar los cuadrados de estas
diferencias, y sustituir luego el valor resultante en la formula
. e igencia y otras variables relacionadas. Asi re resent
relativamente hornogeneo respecto a estas variables En' p ~n un- grupo
6ID 2
~~~e~~: ~;%~~::;;~a r~~~~~~~id:~t~eI:sa~~~~ci~:c:~::s'como~~::e~~l~~~~~i~::~n~~~~
'5 = 1 - N(N2 _ 1)' (8.6)
coeficiente resultante suele quedar disminuido a causa ~~~:m~as en la umversl?ad: el en la cual D = rango de X - rango de Y.
puede esperarse que las correlaciones sean menores . a go trun~ado: Mas aun, La tabla 8.5 muestra los datos hipoteticos y el procedimiento utilizado en el
seleccionan sus estudiantes dentro de un ra dPar.adaquellas.umv~rsldades que calculo de r s-
ngo re UCI 0 de calificacioneg,
Como habito, debera obtenerse ID, aunque no se la utiliza en ninguno de los
calculos, pues constituye una comprobacion util de la exactitud de los mismos, ya
que ID debe ser igual a cero. Si se obtiene un valor diferente de cero, deben
comprobarse los rangos originales y las restas subsiguientes.
«
cr:
::::l

S
en
UJ
Rangos empatados
A veces, cuando es necesario convertir las calificaciones en rangos, se encuentran dos
o mas calificaciones empatadas. En este caso, se asigna a cada uno de ellos la media
de los rangos empatados. La calificacion siguiente en la ordenacion recibe el rango
Fig. 8.3 Diagrama de dispersion que ilustra una correlacion
que normalmente Ie corresponde. Asi, los rangos de las calificaciones 128, 122, 115,
EDAD
alta par~.el rango completo de los valores de X e Y, pero una
correlacion baja cuando se trunca el rango (datos hipoteticos). 115, 115, 107, 103 serian 1,2,4,4,4,6, 7; Ylos rangos de las calificaciones 128, 122,
15, 115, 107, 103 serian 1, 2, 3, 3.5, 3.5, 5, 6.
CORRELACION 135
134 ESTADfsTICA PARA LAS CIENCIAS SOCIALES

Paso 1. Hallar la suma de los productos cruzados.

Tabla 8.~ ~r?cedimiento para calcular r, a partir de variables ordenadas

(datos hipoteticos),

RANGO RANGO DE APTITUD


~)X - X)(Y - Y) = I XY - (LX~'LY)
DE CI DE MAN DO D D2
= 277.75 - 225

1 4 -3 9
r, = 1
6LD 2
= 52.75
2 2 0 0
N(N 2 - 1)

3 9 -6 36

Paso 2. Hallar la suma de cuadrados de los rangos de X.

4 1
-2
3 9

4
=1-~
5 7 15(224)

6 10 -4 16
SCx = ('L X)2 _ ('L;)2
-1 1
1224

7 8 = 1-­
8 13 -5 25 3360

9 5 4 16
= 1 - 0.36
= 2825 _ (45)2
10 3 7 49

. 9

11 11 0 0
= 0.64
12 6 6 36
= 282,5 - 225
13 12 1 1

15 -1 1

= 57.5
14
15 14 1 1

Paso 3. Hallar la suma de cuadrados de los rangos de Y.

LD=O LD 2
= 204
y)2
SC = "y2 _ ('L
y L, N

= 284.5 - 225
, Cuando se producen empates en una de las variables X e y. 0 en ambas la
form~la ~e Spearman exagera el valor del coeficiente de correlaci6n' particularm:nte = 59.5
~uan 0 e n/umedro de empates es grande. En caso de empates, deberi~ aplicarse la r de
earson a os atos ordenados por ranqos. Paso 4. Sustituir en la formula de la r de Pearson.
52.75
Ejemplo r = --;::====
.J(57.5)(59.5)
RANGO RANGO

DE X )(2 DE Y Y2 XY

= ~~::~ = 0.90
1 1 2 4 2

2 4 3 9 6

3.5 12.25 1 1 3.5

3.5 12.25 4.5 20.25 15.75 i Resumen del capitulo


5 25 4.5 20.25 22.5

7 49 6 36 42

7 49 8 64 56 En este capitulo se ha estudiado el concepto de correlaci6n ymostrado la forma de

7 49 7 49 49 calcular dos coeficientes de correlaci6n: la r de Pearson, que se usa con datos en

9 81 9 81 81
escalas de intervalo 0 de razon; y r s, que se usa con variables ordinales.
Ly Vimos que la correlacion sirve para determinar el grado en que dos variables
LX 45 Lx 2
- 282.5 LY= 45 2
= 284.5 LXY = 277.75 estan relacionadas 0 tienden a variar conjuntamente. La expresion cuantitativa del
grado de relacion viene dada en terrninos de la magnitud del coeficiente de
correlaci6n.EI valor de los coeficientes de correlaci6n varia entre -1.00 Y + 1.00;
r = ~)X - X)(Y - Y) ambos extremos representan relaciones perfectas. Un coeficiente igual a cero indica la
JSCx'SC y
ausencia de relaci6n entre dos variables.
136 ESTAnfsTICA PARA LAS CIENCIAS SOCIALES
CORRELACI6N 137

Hemos observado que la r de Pearson es apropiada exclusivamente para

variables relacionadas de una manera lineal. Con datos ordenados, el coeficiente de NOTA EN NOTA EN

ESTADISTICA PROMEDIO ESTADISTICA PROMEDIO


correlacion por rangos de Spearman es el equivalente exacto de la r de Pearson. Las ESTUDIANTE X FINAL, Y ESTUDIANTE X FINAL, Y
diversas formulas para calcular la r de Pearson pueden emplearse en el catcuto de a 's
partir de datos ordenados. Sin embargo, se dio una formula para obtener 's' que A 90 2.50 F 70 1.00
simplifica considerablemente los calculos, B 85 2.00 G 70 1.00
C flO 2.50 H 60 0.50
0 7:5 2.00 I 60 0.50
E 70 1.50 J 50 0.50
Terminos para recordar
coeficiente de correlacion relacion positiva
correlacion
r de Pearson (coeficiente de correlacion
diagrama de dispersion RANGO RANGO
producto-momento) SEGUN EL SEGUN EL
rango truncado OBSERVADOR OBSERVADOR
r de Spearman (r s 0 coeficiente ANIMAL A B ANIMAL
relado« negativa
de correlacion por ranqos)
A 12 15 I 6 5
B 2 1 J 9 9
C 3 7 K 7 6
o 1 4 L 10 12
E 4 2 M 15 13
Ejercicios F 5 3 N 8 8
G 14 11 0 13 14

(0)0'
~shtdiantes
\
datos siguientes 'om'pond'n a 1" <alifimcion" obtenidas por on grupo de 2<l
en un examen de ingreso a la universidad y en una prueba de comprensi6n verbal.
H 11 10 P 16

. e el lector con sus propias palabras el 'significado de correlacion. .

16

Hacer un diagrama de dispersion y calcular la r de Pearson para estos datos.


4. Exphqu . " 1identifiquese una posible Ifuente
d I . I s presentados a contmuacron, "
5. En cadauno e os ejemp o. " dis resultados de un analisis de corre acron,
EXAMEN de error en la recopilacion y/o la mterprettc:on e ~e reaccion para individuos con edades
DE INGRESO EXAMEN
a) La relacion entre la edad y e tiempo _ d d d
ALA PRUEBA DE
DE INGRESO
I t es meses y los 65 an os e ea. . .
UNIVERSIDAD COMPRENSION
ALA PRUEBA DE b) comprendidas
La correlacion entre os CIr y las ca lificaci
entre los mcaciones de los mejores estudiantes urnversita-
.
ESTUDIANTE (X) UNIVERSIDAD
VERBAL (YJ . ESTUDIANTE COMPRENSION
(X) VERBAL (Y) rios.relacion entre voca b uIano
c) La ' y velocidad de lectura entre nifios de una comunidad
A 52 49 K de bajo nivel econornico. I d
B 49 64 53
49 L
C 26 28 17 6. Para un grupo de 50 personas, LZxZy = 41.3, t,.cual es la correlacion entre as os
17 M
0 28 49 40

34 N
E 63 43
41 variables? . . tudiantes en dos pruebas.
52 0 ificaci f eron obtenidas por cinco es
F 44 30 15 7. Las siguientes cali icaciones u " IN) C nvertir las calificaciones en rangos y
41 P Calcular la r de Pearson (usando r = L,ZXZy • 0
G 70 65 50
45 Q calcular r S'
H 32 35 28
32 R
I 49 60 55
29 S 'PRUEBA PRUEBA
J 51 49 37
49 T ESTUDIANTE X Y
66 50
A 5 1
B 5 3
2. Los datos de la tabla siguiente representan las calificaciones obtenidas por 10 estudiantes C 5 5
en un examen de Estadistica y su promedio final. Hacer un diagrama de dispersion y calcular o 5 7
la r de Pearson para estos datos.
E 5 9
CORRELACION 139
138 ESTADISTICA PARA LAS CIENCIAS SOCIALES

Generalizacion: loCuli! es el efecto de los em pates sobre r.? LATiTUD

REDONDEADA AL
TEMPERATURA
GRADO MAS TEMPERATURA
8. Demostrar algebraicamente que MEDIA ALTA MEDIA BAJA
CIUDAD PROXIMO

\' - - = L,..XY
L,..(X - X)(Y - Y)
\' - -IXIY
N-' 31 23
Acapulco 17
30 23
Accra 6
24 22
9. loQue efecto tiene sobre la r de Pearson una desviacion de la linealidad? Argel 37
12 8
Amsterdam 52
17 7
10. loComo afecta el rango de las calificaciones consideradas a la magnitud del coeficiente de Belgrado 45 4.4
53 13
correlaci6n? Berlin 19 10
Bogota 5 23
19 31
II. En el ejercicio 15 del capitulo 5, se dieron las calificaciones medias de grupos con diversos Bombay
17 6
numeros de alumnos. loCmil es la correlacion entre el tamafio del grupo y las calificaciones Bucarest 44 21.1
22 32
promedio en el exarnen final? Calcuta 13
34 22
Casablanca 5
56 11
(ii\ Los siguientes datos corresponden a las calificaciones obtenidas en un examen de ingreso Copenhague
15 29 21,1
~ universidad y las calificaciones promedio obtenidas en el primer semestre. loCmil es la Dakar
53 13 6
relacion entre estas dos variables? Dub.lin 2
60 8
Helsinki 20
22 25
Hong Kong 10
41 18
Estambul 12
32 23
Jerusah~n 21.1
EXAM EN NOTAS 25 31
Karachi 0.6
DE INGRESO PROMEDIO 60 8
Leningrado 13
39 19
Lisboa 14 7
440 1.57 52
Londres 8
448 1.B3 40 19
Madrid 32 23
455 2.05 15
460 1.14 Manila 29 23
Monrovia 6 2
473 2.73 46 10
Montreal 2
485 1.65 60 10
489 2.02 Oslo 11 0
Otawa 45 6
500 2.98 49 15
Paris 23
512 1.79 12 32
Pnom Penh 6
518 2.63 50 12
528 2.08 Praga 23
17 32
550 2.15 Rangun 11
42 22
582 3.44 Roma 23
11 32.2
569 3.05 Saigon 12
31 21
585 3.19 Shangai
593 3.42
620 3.87
650 3.00
690 3.12 .. lnea de siete
' ., 19 20 del capitulo 5 presentamos datos de la presion sangui
14. En Ios ejercrcros y ' . . iento
sujetos durante las sesiones de control y de acondlcl.onaml .
) Hallar la r de Pearson para estas dos medidas.

~) Transformar ambos conjuntos de datos en rangos y calcular rs•

13. Los siguientes datos indican la latitud de 35 ciudades en el hemisferio norte y las medias
alta y baja de sus temperaturas anuales. ,. 'I acientes recibieron medicamentos para
IS. En el estudio sobre la presl~n sa~~ume~, d~s P I 0 den por rangos de la cantidad de
a) loCUli! es la correlacion entre la latitud y la temperatura media alta? . . . A c nbnuaclOn se 1D rca e r di .
controlar la hlpertenslo n. 0 . d I I mayor) y la diferencia (aeon rcrona­
b) loCuli! es la correlacion entre la latitud y la temperatura media baja? medicamentos recibidos por cada paciente ( e menor a
c) loCulil es la correlaeion entre las temperaturas alta y baja? miento-control) para cada persona.
140
ESTADfSTICA PARA LAS CIENCIAS SOCIALES CORRELACI6N 141

Paciente 2 3 4

16. La tabla anterior corresponde a los dividendos por accion de 37 empresas industriales y
5 6 7

Rango de 2 6 1 el precio por accion al cierre en 15 de febrero de 1968.


5 3 4

la cantidad a) Hallar la correlacion entre el precio por accion y los dividendos obtenidos en 1967.
de medicamento b) Expresar los dividendos como porcentajes del coste por accion,
Diferencia -3.5 -33.8 -29.2 c) i,Hay alguna correlacion entre el porcentaje de dividendos y el precio por accion?
-16.5 -16.1 0.9 -17.3
17. Explicar la diferencia entre r = 0.76 y r = -0.76.
18. Supongase que se desea estudiar la relacion entre la eficacia en economia de trabajo de
Ordenar las diferencias segun sus rangos desde la menor (0.9) hasta la (_ 33 8) ciertas maquinas que posee un fabricante y el precio promedio de los cinturones de cuero que
calcular r s• mayor . y
con elias se produce. A causa de la dificultad para ordenar la calidad de las maquinas en una
escala de razones, se las ordena por rangos en una escala ordinal, de modo que el rango 15

corresponde a la mejor maquina, La relacion de precios y tipos de maquinas resulta ser la


PRECIO siguiente:
DIVIDENDOS POR ACCION 15 $3.50 10 $4.25 5 $4.95
POR ACCION (REDONDEADO) 14 $3.75 9 $4.50 4 $5.50
0.13 34

13 $3.50 8 $4.45 3 $5.75


0.56 23

12 $4.00 7 $4.75 2 $5.45


0.08 11 $3.95 6 $5.00 1 $6.00
7

0.09 6
Determinar la "s entre la calidad de las maquinas y el precio.
2.00 48
19. El propietario de una tienda registra el mimero de veces que los clientes solicitan 0
1.95 22
compran un articulo determinado. A esto Ie llama la demanda. Cada mes tiene a la venta 15

1.77 28
articulos. El propietario registra adem as el precio del articulo cada meso
0.07 20
a) Determinar la relacion entre la demanda y el precio, utilizando la r de Pearson.
3.61 46

1.67
b) Determinar la relacion entre la demanda y el precio, utilizando r s•
22

0.93 21

MES DEMANDA PRECIO MES DEMANDA PRECIO


0.94 14

1.68 27
Enero 25 $0.50 Julio 13 $0.80
0.86 41
Febrero 10 .90 Agosto 19 .70

0.70 19
Marzo 12 .80 Septiembre 18 .72

2.87 41
Abril 18 .75 Octubre 16 .74

2.14 37
Mayo 11 .85 Noviembre 15 .75

0.84 28
Junia 20 .70 Diciembre 15 .75

2.37 29

0.33 15

20. Con referencia al ejercicio 13 (de este capitulo), determinar la correlacion entre la latitud y
0.36 14

1.57
la temperatura media alta para aquellas ciudades cuya latitud sea menor 0 igual a 25 grados.
40

3.04
Comparar esta correlacion con la que se obtuvo en el ejercicio 13(a). i,Por que son diferentes
30

1.15 los coeficientes de correlacion?


8

0.68 44
21. Con referencia de nuevo al ejercicio 13, determinar la correlacion entre la latitud yla
0.73 11
temperatura media alta para aquellas ciudades cuya latitud sea mayor 0 igual a 45 grados.
0.69 34
Comparar esta correlacion con las obtenidas en los ejercicios 13(a) y 20. i,Por qui: son
0.16 35
diferentes? 8/>'>'<"7
0.88
1.22
17

16

22. Comprobar q~~'LD2 = , para los siguientes pares de rangos:


1.47 42
, ; 1 1

1.60 40
/ 2 2

3.67 50
<:/' ~ 3 .3

0.35 18
'> \ ) 4 4

3.86 45
// J 5 5

c>:
1.59 34
6 6

1.05 12
7 7

8 8

142 ESTADfSTICA PARA- LAS CIENCIAS SOCIALES [143]

23. Calcular rs con los datos del ejercicio 22.


24. Construir un diagrama de dispersion para cada uno de los siguientes conjuntos de datos:

a) X Y b) X Y c) X Y d)X Y Regresi6n y predicci6n

1.5 0.5 0.5 5.0 0.5 0.5 0.5 1.0


1.0 0.5 0.5 4.5 1.0 1.0 0.5 2.5
1.0 2.0 1.0 3.5 1.0 1.5 0.5 4.5
1.5 1.5 1.5 4.0 1.5 2.5 1.0 3.5
1.5 2.0 1.5 2.5 1.5 3.5 1.5 1.0
2.0 2.0 2.0 3.0 2.0 2.5 1.5 2.5
2.5 2.5 2.5 2.0 2.0 3.5 1.5 4.0
2.5 3.2 2.5 3.5 2.5 4.5 2.0 1.0
3.0 2.5 3.0 2.5 3.0 3.5 3.0 2.0
3.0
3.5
3.5
3.5
3.0
3.5
2.0 3.5 3.0 3.0 3.5 Introducci6n a la predicci6n
2.0 3.5 2.5 3.0 4.5
3.5 4.5 3.5 2.5 3.5 2.0 3.5 1.0
4.0 3.5 4.0 1.5 4.0 2.5 3.5 1.0 Conocido el CI de una persona, l,que cabe decir de sus posibilidades para completar
4.0 4.5 4.0 0.7 4.0 2.0 3.5 3.5 satisfactoriamente sus estudios? Sabiendo la forma en que voto en ocasiones
4.5 4.5 5.0 0.5 4.5 1.0 4.0 3.5
5.0 5.0
anteriores, l,podemos hacer alguna conjetura logica acerca de su voto en las
5.0 1.0 4.0 4.5
5.0 0.5
elecciones proximas? Conociendo su grado de aptitud para las matematicas, l,es
4.5 2.5
4.5 1.0
posible estimar su rendimiento en un curso de estadistica?
Veamos un ejemplo. Supongase que se trata de predecir la calificacion de un
estudiante en el examen final. Si la unica informacion.disponible es que la calificacion
25. Examinar los diagramas de dispersion del problema anterior y determinar cual repre­ promedio de su clase en el examen final fue de 75 (Y = 75), la mejor conjetura que
senta: podremos hacer es que obtendra una calificacion de 75 en el examen final*. Sin
a) Una relacion curvilinea entre X e Y.
embargo, con frecuencia se dispone de mas informacion. Por ejemplo, podemos saber
b) Una correlacion positiva entre X e Y.
c) Una correlacion baja 0 nula entre X e Y.

que obtuvo una calificacion de 62 en el examen parcial de mitad de curso. l,Como


d) Una correlacion negativa entre X e Y.
podemos utilizar esta informacion para predecir mejor su nota en el examen final? Si
sabemos que la calificacion promedio obtenida por la clase eli ese examen parcial fue
de 70 (X = 70), podriamos inferir que a una calificacion inferior a la media en el
examen parcial debe seguirle una calificacion inferior a la media en el examen final.
Ahora, parece que nos acercamos mas a una prediccion correcta de la nota- del
estudiante. l,Como podriamos mejorar aun mas la precision de nuestra prediccion?
Saber simplemente que este estudiante tuvo una calificacion por debajo del promedio
en el examen parcial, no nos proporciona una imagen muy clara de la realidad en
cuanto a su posicion relativa en el examen. No obstante, si conocemos la desviacion
estandar de las not as en el examen parcial, podriamos expresar su calificacion en
terminos de su posicion relativa, es decir, su calificacion z. Imaginemos que la
desviacion estandar en el examen parcial fue de'4 (s, = 4). Puesto que el obtuvo una
califlcacion correspondiente a 2 desviaciones estandar por debajo de la media (zx =
= - 2),l,estaria justificado predecir que obtendra una calificacion correspondiente a 2
desviaciones estandar por debajo de la media en el final (Zy = - 2)? Es decir, si Sy = 8,
l,podemos pronosticar una calificacion de 59 en el examen final? [No! Notese que

* Ver la secci6n 5.2.2,en la que demostramos que la suma de las desviaciones respecto a la media es if,ual acero, y que
la suma de los cuadrados de las desviaciones respecto a la media aritmetica es menor que 1asuma de 10:. cuadrados de las
desviaciones respecto a cualquier otro valor real 0 potencial.
REGRESION Y PREDICCION 145
144 ESTADisTICA PARA LAS CIENCIAS SOCIALES

Recuadro 9.1
Una de las ventajas de los datos correlacionados es que los matematicos han desarrolla­
do formas de predecir los valores de una variable cuando se conocen los valores de otra
variable correlacionada con ella. A este metodo se Ie conoce con el nombre de amilisis de 43.4 - •
fa reqresion.
EI siguiente fragrnento de Winning with Statistics muestra como pueden utilizarse
datos correlacionados para orientar la decision cuando se trata de cornprar un
40.2 ­
automovil de ultimo modelo. • •

El analisis de la regresion en la vida diana


La utili dad de los datos correlacionados, particularmente cuando la relacion es alta,
como en el caso del peso de un autornovil y su rendimiento en minas por galen, consiste
en que los maternaticos han desarrollado metodos para predecir valores de una variable
una vez conocidos los val ores de otra variable correlacionada con ella. Al metodo se Ie
conoce como ancilisis de la regresi6n. No debemos dejarnos impresionar por el nombre. "­
Podemos llegar a una excelente comprensi6n de la regresi6n sin tener que penetrar en vi
oc:
los arcanos de la matematica, t­
::i
Observemos la ligura adjunta. Ella muestra un diagrama de dispersion de pesos de
c:
automoviles y millas por galen. Notese que se ha trazado una linea que une la media de o
n,
millas por galen en cada peso de coche. La linea resultante es una aproximaci6n Ul
o
bastante buena de 10 que los matematicos Haman la linea de regresion para predecir los c:

valores de Y (millas por galen] conociendo los valores de X (peso del coche). Para w
:2:
nuestros lines, trataremos a esta linea como si fuera la linea de regresion. En ellenguaje o
--'
matematico se Ie llama la recta de regresion de Y sobre x.. Pero esto no es 10 ;.<
importante, Lo que interesa es que cuando la relacion entre X eYes alta, podemos usar
la linea de regresion para predecir los valores de Y partiendo de valores conocidos de X,
y obtener sorprendentes grados de exactitud. (Tarnbien podrfamos predecir en sentido
opuesto obteniendo otra linea de regresion, la recta de regresion de X sobre Y. Pero esta
es otra cuestion.]
Veamos como funciona el metodo. Imaginemos que se desea comprar un automovil y
que hay dos tipos para elegir. EI de la marca A es de color rojo brillante y pesa 1450
kilogramos con todo su equipo. EI otro, de marca B, es dorado y pesa 1088 kilogramos.
Se puede tener una idea bastante precisa acerca del rendimiento de los automoviles de
marca A observando la ligura y trazando una vertical en el punto correspondiente a
1450 kilogram os hasta cortar la linea de regresion. Miremos ahora hacia la derecha
para hallar los correspondientes kilometres por litros. Su mejor deduccion es que el
11.2 ­
I I I I I I

I I
.
r

I
automovil de 1450 kilogramos tendra un rendimiento promedio cercano a los 24.1 1 1 1 1 1 1 2 2 2
kilometres por litro. Repitamos el mismo procedimiento para la marca B, trazando una 9 0 1 2 3 5 8 0 2 4
0 1 3 4 6 8 1 4 6 9
vertical en el pun to correspondiente a 1088 kilogramos. Se determinara que el
7 0 4 6 0 7 4 1 8 5
rendimiento es de aproximadamente 32.1 kilometres por litro, 10 que signilica una
superioridad del 33 %, tomando 24.1 kilometres por litro como base. PESO DEL AUTOMOVIL, X

Como se ve, el analisis de la regresion puede ser importante en la vida diaria. De hecho, Aproximaci6n de la linea de regresion para predecir el rendi­
aunque no nos hayamos percatado de ella, hemos suministrado durante nuestra vida miento en kilometres par litro a partir del peso del autom6vil
(regresi6n de Y sabre Xl. La linea se obtiene uniendo los
un valor numerico en mas de una ecuacion de regresion, si es que alguna vez hemos
puntos correspondientes al promedio de kilometres par litro
aspirado al ingreso en una universidad, pasado por una serie de pruebas para conseguir
para cada peso de autornovil.
un trabajo, 0 lIenado una solicitud para el seguro de vida.
REGRESIC>N Y PREDICCIC>N 147
146 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

falta una parte importante de la informacion, 0 sea, la correlacion entre el examen


parcial y el examen final. Se recordara de nuestra discusion de la correlacion", que la vi 8000
o
Vl
r de Pearson indica en que grado los mismos individuos 0 sucesos ocupan la misma UJ
n,
7000
posicion relativa en dos variables. Por tanto, solo se justifica predecir una calificacion Z
UJ
exacta de 59 en el examen final cuando la correlacion es perfecta (es decir, cuando -'
« 6000
r = + 1.00). Supongamos que la correlacion es igual a cero. En ese caso, ciertamente, ::J
Z
resulta obvio que no tenemos justificacion alguna para predecir una calificacion de «
o 5000
59. Seria mas prudente regresar a nuestra prediccion original de ]5 (es decir, Y). Vl
UJ
a::
Resumiendo, cuando r = 0, nuestra mejor estimacion es 75 (Y); cuando r = (:J 4000
Z
= + 1.00, nuestra mejor prediccion es 59 (z, = zx)' Resulta claro que para los valores Fig. 9.1 Relacion entre los sala­
intermedios de r (entre 0 y + 1.00), nuestras predicciones estaran comprendidas entre rios mensuales y los mgresos 400 450 500
59 y 75t. anuales de ocho trabajadores de SAlARIO MENSUAL EN PESOS. X
Asi vemos que una ventaja relevante de un analisis de correlacion consiste en su una firma electronica.
aplicacion a problemas en que hay que hacer predicciones de valores de una variable
basadas en los valores de otra. Psicologos, educadores, biologos, .sociologos y 9.2.1 Formula para las relaciones lineales'
economistas han de realizar constantemente este tipo de trabajo. Para facilitar una La formula que relaciona el salario mensual con el ingreso anual se puede representar
explicacion adecuada de r, y para ilustrar sus aplicaciones especificas, es necesario
adentrarse en el analisis de la regresion lineal. por
y = 12X.

9.2 Regresion .lineal


AI sustit~ir cUlalq~ierl vsaa\~~i~e ;e~~::ltad~o~~~I~~~~~~~n~u~~ee~:~~~t;:~;:I~~
de Y. Por ejernp 0, Sl e

ingreso an ual seria

Para simplificar nuestro estudio, comencemos con un ejemplo de dos variables que, Y = 12 . 700 = 8400.

generalmente, estan perfecta 0 casi perfectamente relacionadas: el salario mensual y


el ingreso anual. La tabla 9.1 muestra el salario mensual yel ingreso anual de ocho reguemos un terrnino mas a esta relacion lineal. Supongam.os que la'de~dPrdesa
Ag .' b onsecuenCla ha d eCI I 0 ar
trabajadores de una pequefia fabrica de material electronico, Estos datos estan ha tenido un afio extraordmanamente ueno y que, ~n :. 'L',
representados graficamente en la figura 9.1. Se acostumbra.Ilamar al eje horizontal a cada uno de sus empleados una gratificaclon navidefia de 500 pesos. a ecuacion
eje X 0 eje de las abscisas, y al eje vertical eje Y 0 eje de las ·oidenadas. Si las variables seria ahora

estan relacionadas con el tiempo, a la que se presenta primero se la representa en el Y = 500 + 12X.

eje X. Observese que las parejas de valores estan representados sobre una linea recta
que se extiende diagonalmente de abajo hacia arriba y de izquierda a derecha. Remontandonos a nuestros dias de estudiantes de bachillerato, .t~1 vez po~adm~s
Tabla 9.1 Salarios mensuales e ingresos anuales de ocho traba­ identificar la formula anterior como un caso particular de la ecuacion genera e. a
SALARIO INGRESO jadores de una firma electronica (datos hipoteticos),
EMPLEADO MENSUAL ANUAl recta, es decir:
(9.1)
Y = a + byX,
A 400 4800
B 450 5400 X re resent an variables que cambian de un indivi?uo a otro, yay bv so~
C
D
500
575
6000
6900
~~~~:~e~ paraPun conjunto particular de datos. Mas especIlicamente, ~y rep~se~
E 600 7200 ta la pendiente de una recta que relaciona los valores de Y con los va ore~ e I .
F 625 7500 A esta relacion se la conoce como la·'regresi6n de Y sobr~ X. En nuestro eJ~;p~;
G 650 7800 la pendiente de la recta es 12,10 que significa que Y cambia end un;a~t~ de p
cada cambio en X. La letra a representa ~I va:or dte : cU~~d~ con~de~arse como
H 675 8100
Podemos observar, igualmente, que la formu a an enor ~d d X Cuando la
• Ver la secci6n 8.2.
t Suponemos que Ia correlacion es positiva, Si Ia correlacion fuera de -1.00, nuestra mejor predicci6n seria una
iun metodo para predecir Y a partir de valores co~o~~ os eerfe~ta
correlacion es 1.00 (como en el presente caso), la pred1ccIOn es P .
calificaci6n de 91, es decir, Zy = -z,.
REGRESION Y PREDICCION 149
148 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

9.2.2 Prediccion de X e Y mediante datos en dos variables r fN2 S2 . S2


b = -";1 .< y

En .la investigacion del comportamiento, sin embargo, las correlaciones obtenidas y Ns.~
C~Sl nunca son perfectas. En consecuencia, hemos de encontrar la recta que mejor se Ns"sy
ajuste a nuestros datos y .nues~ras predicciones se basaran en esa recta. Pero, l,que se =r--
Ns~
debe. e~~ender. por «mejor ajuste»? Recordemos que, al estudiar la media y la
desviacion estandar, definimos la media como aquel punto de una distribucion (9.3)
respecto al cualla suma de los cuadrados de las desviaciones tiene un valor minimo
(sum a de cuadrados minima). Cuando se aplica el metodo de los minimos cuadrados
a la co~r~lacion y ala regresion, la linea de mejor ajuste se define como aquella que La constante a esta dada por la formula
hace mmima la suma de los cuadrados de las desviaciones a uno y otro lado de ella. A a = Y - b.,X. (9.4)
esta recta se la llama recta de reqresion.
Al calcular r", resulta muy laborioso obtener cada uno de estos valores por
Este es el momento adecuado para hacer no tar que el termino «prediccion», tal
separado y sustituirlos en la ecuacion de la recta. Sin embargo, combinando
como se 10emplea en Estadistica, no implica necesariamente alguna deduccion hacia
algebraicamente las formulas (9.3) y (9.4) y relacionando el resultado con la formula
el futuro, sino que se refiere simplemente al hecho de que usamos la informacion
(9.1), obtenemos una formula mucho mas uti! para calcular Y':
acerca de una variable para obtener informacion respecto a otra. Asi, si conocemos la
nota promedio de un estudiante en la universidad, podemos utilizar esta informacion Y' = Y + I' Sy (X _ X).* (9.5)
para .«predeci~» su inteligencia (que con nuestro talante mas generoso suponemos s"
antenor a su mgreso a la universidad).
Si nos fijamos en el segundo terrnino del segundo miembro de la formula (9.5),
I~troduciremos aho~a dos simbolos nue,vos: X' e y', que se deben leer «x prima e
podemos ver que cuanto mayor sea r, mayor sera el termino en su totalidad. Este
Y prima», «X e Y predichas» 0 «X e Y estimadas». Usamos estos simbolos siempre
termino representa tambien la desviaci6n predicha respecto a la media muestral
que e~pleamos la recta de regresion 0 la ecuacion de regresion para estimar 0
resultante de la reqresion de Y sobre X. Asi, podemos deducir que cuanto mayor sea la
predecir el valor de una variable a partir del valor conocido de otra.
correlaci6n, mayor sera la desviacion predicha respecto a la media muestral. En el
Vol~iendo a la ecuacion de la recta, nos encontramos con el problema de
caso de una correlacion perfecta, la desviacion predicha es maxima. Por el contrario,
determl~ar b y a para un conjunto. particular de datos, y con ello poder obtener Y'.
cuando r = 0, la desviacion predicha es tarnbien igual a cero. Asi, cuando r = 0,
La formula para hallar la pendiente de la recta que relaciona Y con X conocida
tenemos que Y' = Y. Todo esto no es sino otra manera de expresar que, en ausencia
como recta de regresion de Y sobre X, es '
de una correlacion entre dos variables, nuestra mejor prediccion para cualquier valor
de una variable dada es la media de la distribucion de esta variable.
b _L(X-X)(Y-Y) (9.2) Hasta aqui hemos centrado nuestra atencion en la regresion de Y sobre X, 0 sea,
y - SCx . la prediccion de valores de Y (Y') a partir de valores conocidos de X. Hay tambien
otra formula de regresion para predecir valores de la variable X a partir de valores de
De la formula (9.2) podemos deducir otra formula util para determinar la la variable Y. La pendiente de la recta de regresion de X sobre Y puede expresarse
pendiente de la recta de Y sobre X. Puesto que [formula (8.2)] como
DX - X)(Y - Y) (9.6)
r=L(X-X)(Y- Y) b, = SC
y
)SC x ' SC y ,

se deduce que (9.7)

• Puesto que Y' = a + b"X, a = Y- b"X Y by = 1'(5)5,), se tiene


y de la formula (6.4), donde S2 = SC/N, se sigue que
Y' = y _ I' (:.:)
s,
X +,. ("r)
.'1,1:
X = Y +,. (2)
'~$
(X - Xl,
150 ESTADfsTICA PARA LAS CIENCIAS SOCIALES
REGRESION Y PREDICCION 151

par:ro~~a;~f~r~: ~:7aU~a~:~~ r;g::si6n para predecir valores de la variable X a Supongamos, por ejemplo, que el presidente de la junta de admisi6n de una
universidad, prepar6 un examen de ingreso que ha venido aplicando a todos los
X' = X + r ;x (Y - 17). (9.8) aspirantes durante un periodo de varios afios. Durante ese tiempo acumul6 mucha
y
Las f6rmulas siguientes resultan a d ' , informaci6n referente ala relaci6n que existe entre las calificaciones de ingreso y las

:: ~:~:~a~el~ul~ ~~d~~~~:~:~tidadesq~:~uel~a%~~r~~:~~:~:~~~~~:s:r:~~:;~:; calificaciones sucesivas en la universidad y juzga que es posible utilizar ahora las ca­
lificaciones de ingreso (variable X) para predecir las calificaciones en la universidad
(variable Y), y mas adelante usar esta informaci6n para establecer nuevas normas de
Y' = 17 + NIXY - CIX)(IY) ­ ingreso para futuros aspirantes.
NIX2 _ Q=X)2 (X - X). (9.9) Ya que se ha insistido repetidamente en la relaci6n que existe entre la r de
Analogamente, la f6rmula para predecir X es Pearson y los valores z, debe resultar evidente que las f6rmulas de predicci6n se
pueden expresaren terrninos de valores z. Puede demostrarse* matematicamente que

(9.10) (9.11)
donde Zy' = Y', expresado en terrninos de un valor z.
9.2.3 Problemas ilustrativos acerca de la regresion Volviendo al problema 1, la calificaci6n de 62 que obtuvo el estudiante en el
examen parcial puede expresarse como z = - 2.00. Asi, Zy' = 0.60( - 2.00) = -1.20.
Resolvamos dos problemas usando los datos de la secci6n 9.1. Para asegurarse de que las f6rmulas de predicci6n (9.5) y (9.11) son comparables,
Problema 1.. Como, se recordara, un estudiante obtuvo una calificaci6n de 62 en el debe transformarse la calificaci6n Zy' en la calificaci6n original Y'.
ext~~n ~arcIaI: l,<;ual es nuestra predicci6n acerca de su nota en el examen final? Los
es a igra os mas Import-antes se reproducen a continuaci6n. .
9.2.4 Construccion de las rectas de regresion
PARCIAL FINAL

(VARIABLE Xl (VARIABLE Y)

Volvamos al problema de la construcci6n de rectas de regresi6n para predecir

valores de las variables X e Y. Como se indic6 anteriormente, la recta de regresi6n no

X = 70 y= 75

pasara por todos los puntos que representan las parejas de calificaciones. De hecho,

s,= 4
s, = 8
pasara entre estos puntos de forma tal que se minimice la suma de los cuadrados de

r = 0.60 las desviaciones entre la recta de regresi6n (calificaciones predichas) y las calificacio­

nes obtenidas. Indicamos antes que la media es el punto en la distribuci6n que hace

minima a la suma de los cuadrados de las desviaciones. En este estudio, la recta de

Empleando la f6rmula (9.5), encontramos que


regresi6n es analoga a la media, porque la suma de las desviaciones respecto a la

+ 0.60 (~:) (62 - 70) = 75 - 9.60 = 65.40.

yo = 75 . recta de regresi6n es igual acero, y la suma de los cuadrados de estas desviaciones es

Pro~le~a 2. Otro alum~o,.~n el mismo examen parcial, obtuvo una calificaci6n de


minima, como demostraremos.
76. l,Cual es nuestra prediccion acerca de su nota en el examen final? Utilizand I
Se recordara que todos los valores necesarios para calcular valores predichos se
datos que aparecen en el problema 1, obtenemos el siguiente resultado: 0 os
encuentran al calcular r; esto es, X, Y, sx' Sy' Para construir ahora nuestra recta de
regresi6n a fin de estimar Y a partir de X, to do 10 que necesitamos hacer es tomar
. Y' = 75 + 0.60 (£) (76 - 70) = 75 + 7.20 = 82.20. dos valores extremos de X, predecir Y para cada uno de estos valores, y luego unir
Si .nuestro problema hubiese sido el de predecir valores de X a pa ti d I estos dos puntos en el diagrama de dispersi6n. La recta que pasa por estos dos
conocldo,s de Y, el procedimiento habria sido igual al anterior salvo qruelreme vIa o~es puntos viene a ser la recta de regresi6n para predecir Y a partir de X, ala cual se la
mos la formula (9.8). , p eana-
llama tam bien recta de regresi6n de Y sobre X. Analogamente, para construir la
AI I1egar a este punto,_una observaci6n razonable que cabe hacer es la si uiente: recta de regresi6n utilizada para predecir X a partir de Y, tomamos dos valores
;<Puesto que conocemos Y y Sy en los problemas anteriores, debemos presu~ir qu~ extremos de Y, predecimos X para cada uno de estos valores, y luego unimos los dos
enemos a nuestro alcance todos los datos observados . Para '
t t deci .c que queremos por
~n 0, pre ecir Y a partir .de X?». Es necesario hacer no tar que el pro 6sito de ~stos • y' = Y + r(s,!s,)(X - Xj. Por trans posicion de terrninos se obtiene
eiemplos fue el de familiariza- allector con las f6rmulas de predicci6n ~ I icti
Sill embargo, las tecnicas de correlaci6n se emplean comunme~ten :~ra~a~:;
Y' - Y (X - Xl X-X Y' - Y
- - = r--, pero --=z~ y --=Zy'.

predicciones acerca de muestras futuras , donde Y es d esconociida. P Sy s, s, s,


Par tanto, Zy' = rz X "
REGRESI6N Y PREDICCI6N 153
152 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

VARIACION EXPLICADA
VARIAGION TOTAL
DESVIAGIONES DE Y' RESPECTO
puntos correspondientes en el diagrama de dispersion. Esto es precisamente 10 que DESVIACIONES DE LOS
Ii All
hicimos en la figura 9.2 para construir las dos rectas de regresi6n a partir de los datos VALORES DE Y RESPEGTO A
de la tabla 8.2.
22
22
Y
RECTA DE PREDIGCION DE x
I - - - t - A PARTIR DE VALORES 19
22 GONOCIDOS DE Y 19

16
19 RECTA DE PREOIGCION DE Y 16
AP~-----+--A PARTIR DE VALORES

16 GONOCIDOS DE X

13 -I------1'~-7IIP1<.--f------- 10
10

10

4
3
3
3 5 7 9 11 13 X :EIY'-y)=o
:ElY - y) = 0
Fig. 9.2 Diagrama de dispersion que representa parejas de calificaciones en dos variables IIY' - 1')2= 169.44
L(Y- Y12= 252
(b)
y las rectas de regresion para predecir X a partir de Ye Y a partir de X. Notese que la recta (al
para predecir Y a partir de X minimiza las desviaciones verticales de los puntos
VARIACION NO EXPLIGADA
correspondientes a los datos [representadas en negro). Por eI contrario, la recta para
predecir X a partir de Yminimiza las desviaciones horizontales (representadas tenuemente). '1 DESVIACIONES DE LOS
VALORES OBTENIDOS
RESPECTO A LOS VALORES
Observese que ambas rectas de regresion se cortan exactamente en el punta que PREDICHOS
representa a las medias de X y de Y. AI juzgar la relacion entre las rectas de regresion
y la magnitud de r, es util imaginar que las rectas de regresion giran en el plano 22
alrededor del punto cornun que representa las medias de X e Y. Cuando r = 1.00,
ambas rectas de regresion tienen pendientes identicas y se superpondran, puesto que 19
pasan por todos los puntos que representan las parejas de observaciones. Sin embargo,
al hacerse r mas pequefia, las rectas de regresion giran alejandose una de la otra de 16
manera que en el caso limite, cuando r = 0, son perpendiculares. Entonces, la recta
de regresion para predecir X a partir de valores conocidos de Y es ft, y la Y
131-----+---,f-'--+--------j
I'
recta de regresion para predecir Ya partir de valores conocidos de X es Y.
10

9.3 Varianza residual y error estandar Fig.9.3 Diagrama de dispersion de parejas de valores en
des variables, recta de regresion para predeclr valores de Y ~
de la estimacion partir de valores conocidos de X, y media de los valores de }
(f); r = 0.82 (obtenida can los datos de la tabla 8.3). (a)
Desviaciones (Y - Y) de las calilicaciones respecto a la 3
La figura 9.3 muestra una serie de diagramas de dispersion, reproducidos cada uno media de Y, variacion total. (b) Desvia~_iones (Y' - Y) .de .l~s IIY-Y')=O
de la figura 9.2, en los que aparece solamente una recta de regresion: la que sirve para calilicaciones predichas respecto a la media de Y,. van~clOn 1:IY - y')2 = 81.96
predecir Y a partir de valores conocidos de X. Aunque nuestro estudio se referira explicada. (e) Desviaciones (Y - V') de las cahli~aclOnes
Ie)
solamente por ahora a esta recta de regresion, todas las conclusiones que obtenga­ especto a la recta de regresion, variacion no exphcada.
REG RESION Y PREDICCION 155
154 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

desviaci6n estandar de los valores respecto a la recta de regresi6n, en vez de respecto


mos seran tambien aplicables a la recta que sirve para predecir X a partir de valores
I dia de la distribuci6n. , . lif d
conocidos de Y. a ap~: fortuna, como sucedio anteriormente en el texto, hay un metodo SImp 1 rca 0
La recta de regresion representa nuestro mejor fundamento para predecir valores
de Y a partir de valores conocidos de X. Como puede verse, no todos los puntos que para ca Icu Iar Sesl y Y Sest x' q ue viene dado por
.

representan las calificaciones caen sobre la recta de regresion. Sin embargo, si la (9.16)
correlacion hubiese sido de 1.00, todos los puntos tendrian que haber estado sobre
Sesty = Sy ~,*
ella. Las desviaciones (Y - Y') de la figura 9.3 representan los errores de la
prediccion, (9.17)
Se observara la analogia que existe ~ntre Y - Y' (desviaci6n de las calificaciones
respecto a la recta de regresion) e Y - Y (desviacion de las calificaciones respecto a - 0 I que significa que no existen
Notese que cuando r = ± 1.00 ,Sesly - , 0 I

la media). La suma algebraica de estas desviaciones respecto a la recta de regresion es desviaeiones respecto a la recta de regresion y, por tant~, hay er~o.res en a
??
igual a cero. Anteriormente se vio que la suma algebraica de las desviaciones respecto predicci6n. Por otra parte, euando r = 0, los errores de pred1cclOn son maX1mOS para

a la media es tambien igual a cero. Entonces, la recta de regresion es, en cierto modo,
una especie de «media flotante» que toma diferentes valores dependientes de los. la distribuci6n dada, 0 sea, que Sest)' = sY' ., di f .
Con los datos del ejercicio 1, capitulo 8, se calcularon los siguientes esta igra os:
valores de X que se emplean en la prediccion,
Se recordara tarnbien que al calcular la varianza, S2, elevamos al cuadrado las
EXAMEN DE COMPRENSION
desviaciones respecto a la media, sumamos estos valores, y dividimos el resultado por EXAMEN DE INGRESO
A LA UNIVERSIDAD VERBAL
N. Por ultimo, la raiz cuadrada de la varianza nos proporciono la desviacion (VARIABLE Y)
(VARIABLE X)
estandar. Si elevasemos ahora al cuadrado y sumasemos las desviaciones de las
calificaciones respecto a la recta de regresion, ~)Y - Y'f, tendrfamos una base para x= 47.65 y = 39.15
Sy = 12.35
calcular otra varianza y otra desviacion estandar. A la varianza con respecto a la s; = 13.82
recta de regresion se la conoce como varianza residual, y se la define de la manera r = 0.85
siguiente:
'DY - y')2
(9.12)
N
Cuando las predicciones se hacen de Y a X, la varianza residual de X es 2
S
est y
= 12.35J1 - 0.85
= 12.35(0.5268) = 6.51.
(9.13)
Como se dij 0 anteriormente, el error estandar de la estimacion tiene propie~addes
La desviacion estandar respecto a la recta de regresion (Hamada error estandar de . ., , d C t ' pequefio sea el error estan ar
la estimaci6n) es, por supuesto, la rafz cuadrada de la varianza residual. Asi,
analogas a las de la desv1aclOn estan ar. uan 0 mas I t de
de la estimaci6n, tanto menor sera la dispersion de los puntos respecto a a rec a

- J2J
Sesty - ~
Y-
N
yy (9.14) re gr
pesi6n.

d I de X hay una distribuci6n de valores de la variable Y. La media


ara ca a va or , .' , desvi , tandar de cada

de cada una de estas distribucioncs es Y, Y la eSV1aClOn es .


Cuando las predicciones se hacen de Y a X, el error estandar de la estimacion de distribuci6n es Sesl ,. Cuando las distribuciones d~ l~s. valores d,e Y correspond1en~~sl:
Xes los diversos valor~s de X tienen la misma variabilidad. d~cl1t~oS que se cump les
. . Ad' . tas distribuciones son norma ,
_J'DX N
Sestx -
_X')2
(9.15)
propiedad de homoscedastlcldad.
,, ibl
emas, Sl es, d d I t ' aci6n y la curva
podemos establecer relaciones entre el error estan ar de ~ es im I de Y para
ejemplo pre ecir un va or
normal (ver seccion 7.3). Es pOS1. ~, for . t' ala dentro del cual es posible
cualquier valor dado de X, y describir ue~o unl~~ ~:~iables normalmente distribui­
Ellector puede sentirse justificadamente alarmado ante la cantidad de calculos que se encuentre el verdadero valor de Y. ara
requeridos en las formulas anteriores para hallar el error estandar de la estimacion,
Sin embargo, como ha sido norma en este texto, se han presentado las formulas . d' III As' para r - 0 82 se tiene
* L id ~l r se pueden obtener directarnente en la tabla H, apen Ice ' I, - , ,
basicas de manera que ellector pueda adquirir una base conceptual apropiada acerca os va ores e y 1 - ,­ 1
del significado del error estandar de la estimacion, Se trata, como se ha visto, de la ~ =0,5724.
156 ESTADfsTICA PARA LAS CIENCIAS SOCIALES
REGRESl6N Y PREDICCl6N 157

das, aproxi~ad~men~e el 68;6 de las veces el valor verdadero de Y (0 sea Y) t '


dentro del sigurente mtervalo: ' T es ara 9.4 Variaci6n explicada y no explicada *

I ntervalo que incluye a Y.T. = Y' -+ Sesty J +_ +


1 1
N
W
(X:=}l
SS .
1
S+
'lr

(918)*
.
Si se observa de nuevo la figura 9.3, puede verse que hay tres sumas de cuadrados
distintas que pueden calcularse a partir de los datos. Estas son:
Asi, si p~decimos
un valor dQ
39.15 para
Y = 39.15, X = 47.65, sex = 190.99--y'N = 20:
X 4765. , y
= x.
Sl Sesty -
_
6.51,
1. Variacion de los valores con respecto a la media de la muestra [fig. 9.3(a)]. Esta
variacion esta dada por (Y - y)2 yes, por supuesto, basica para la determinacion de
la varianza y de la desviacion estandar de la muestra.
2. Variacion de los valores con respecto a la recta de regresion (0 valores predichos)
Intervalo que incluye a YT = 39.15 ± 6.51)1 + ~ + ~47.65 - 47.6W· [fig. 9.3(c)]. Esta variacion esta dada por (Y - y')2 Y se Ie llama la variaci6n no
20 190.99 explicada. Es la diferencia entre el valor predicho y el valor obtenido. Hay que aclarar
= 39.15 ± 6.67 el porque de esta terminologia. Si la correlacion entre dos variables es de ± 1.00,
En otras palabras, cuando X = X = 47.65 alrededor del 68 por ciento de las todos los valores caen en la recta de regresion, En consecuencia, hemos explicado
veces ~I. verdadero valor de Y estara comprendido entre 32.48 y 4582 toda la variacion de Yen terminos de la variacion en X; y, reciprocamente, toda la
UtJhz~ndo datos como estos, podemos trazar dos curvas, una por encima otra variacion de X en terrninos de la variacion en Y. En otras palabras, cuando existe una
p.or debajo de la recta de regresion de Y sobre X (fig 94) En el cas d ~ bl relacion perfecta, no existe variacion no explicada. Sin embargo, cuando la correla­
I distri . . . 0 e vana es
norma mente istribuidas, el 68 % de las veces, aproximadamente los valores cion es menos que perfecta, muchos de los puntos no caen exactamente, tal como
verdaderos ?e Y se encontraran entre estas cur vas, cuando usemos la f6rmula (918) hemos visto, en la recta de regresion. Las desviaciones de estos valores respecto a
para predecir Y a partir de diversos valores de X. Notese que las curvas estan mas la recta de regresion representan variaciones que no pueden explicarse mediante la
separadas en las zonas co~respondientes a los valores extremos de X. La distancia correlacion entre ambas variables. De ahi el uso del terrnino «variacion no expli­
ml~lma entre las curv~s tiene lugar en el punto correspondiente a la media de X. cada»,
(Notese que estas relaciones se refieren a las distribuciones de ambas variables X e Y.) 3. Variacion de los valores estimados respecto a la media de la distribucion. Esta
variacion esta dada por (Y' - y)2 Y se la conoce con el nombre de oariacion
explicada. Es la diferencia entre la media y el valor estimado. EI empleo de esta
60 terminologia se debe a razones que deben resultar c1aras a partir de nuestra discusion
del parrafo previo y de nuestra anterior referencia a la desviacion predicha (seccion
50 9.3). EI lector recordara nuestra observacion previa de que cuanto mayor sea la
correlacion, tanto mayor sera la desviacion predicha respecto a la media muestral. Se
40
deduce ademas que cuanto mayor sea la desviacion predicha tanto mayor sera la
Y variacion explicada. Cuando la desviacion predicha es maxima, la correlacion es
30
perfecta, y el 100 % de la variacion queda explicada.
Puede demostrarse matematicarnente que la suma total de cuadrados consta de
dos componentes que pueden sumarse. Estas dos componentes representan la varia­
20
cion explicada y la variacion no explicada, respectivamente. Asi,

10
I (Y - y)2 = I (Y - y')2 + I (Y' - Y)2. (9.19)
Variacion Variacion Variacion
total no explicada explicada
x
Estos calculos estan indicados en la figura 9.3. EI lector observara que la suma de
Flg, 9.4 Recta de regresion acompaiiada por dos curvas que delimitan los la variacion explicada (169.44) y la variacion no explicada (81.96) es igual a la
mtervalos de confianza que incluyen a YT , para diversos valores de X. variacion total. La ligera discrepancia que se observa en este ejemplo se debe al
redondeo de r a 0.82, previo al calculo de los valores estimados.
* Notese que si deseamos obtener intervalos de confianza d 95 '/ 0
d 99 '/ . .
(9.18) por 1.96 0 2.58, respectivamente. e e I" podemos mulhphcar s,,, y en la formula
10
* Aunque e1 analisis de la varianza no se estudia hasta el capitulo 15, una gran parte del material de esta seccion
servira como introduccion a alguno de los conceptos basicos de dicho tema.
158 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
REGRESI6N Y PREDICCION 159

~hora bien, cuando r = 0.00, entonces ~)Y' - y')2 = 0.00 (~Por que? Ver la EI lector habra, sin duda, observado que la raiz cuadrada del coeficiente de
se~cl6n 9.2). En consecuencia, la variaci6n total es igual a la variaci6n no explicada. determinacion proporciona otra definicion de r. Asi,
D1Cho ?e otro modo, cuando r = 0, toda la variaci6n es no explicada. Por el
contrano, .cuando r = 1.00, entonces I(y - y')2 = 0.00, puesto que todos los Variacion explicada
puntos. estan en la recta de regresi6n. En estas circunstancias, la variaci6n total r = ± ----,---...,...,---=---.,--- = + (9.21)
Variacion total ­
es la nusma que la variaci6n explicada. En otras palabras, cuando r = 1.00 toda la
variaci6n es explicada.
Anteriormente se vio que para los datos resumidos en la figura 9.3, el coeficiente
La raz6n de la variacion explicada a la variacion total recibe el nombre de
de determinacion r 2 es igual a 0.67. La raiz cuadrada de este numero (0 sea, jOjii) es
coeficiente de determinacion y se representa por r 2 • La formula del coeficiente de
determinacion es igual a 0.82, que es el valor de r correspondiente a estos datos.
Puesto que r 2 representa la proporci6n de la variaci6n explicada, (1 - r 2 )
r 2 = Variacion explicada _ I(Y' _ y)2 * representara la proporci6n de la variacion que no es explicada en funci6n de la
Variacion total - L<Y _ y)2 . (9.20) correlacion entre X e Y. A este numero se Ie conoce como coeficiente de no
determinacion y se representa por k 2 • Asi, k 2 indica la proporcion de la variacion de Y
En la figura 9.3 se ve que la proporcion de variacion explicada respecto ala variacion que debe ser explicada por otras variables distintas de X.
total es

La relacion entre k 2 y r 2 es
2 169.44

r = 252 = 0.67.
(9.22)
Puede verse que el coeficiente de determinacion indica la proporcion de la variacion
total que esta explicada, en funcion del valor del coeficiente de correlacion, Cuando
r = 0, el coeficiente de determinacion r 2 es igual a O. Para r = 0.5, el coeficiente de
k2 + ,,2 = 1. (9.23)
d~terminacio~ es 0.25. En otras palabras, el 25 % de la variacion total es explicada. Para los datos de la figura 9.3, se puede obtener directamente k 2 :
Finalrnente, Sl r = 1.00, entonces r 2 = 1.00, 10 que indica que toda la variacion es
explicada,
Variacion no explicada 81.96
La figura 9.5 describe graficarnente la proporcion de la variacion de una variable k2 = = -- = 0.33
Variaci6n total 252 '
que es explicada por la variacion de otra variable, cuando r toma diferentes valores.

« 0, mediante la f6rmula (9.22),


0
«
u
:J
1.00 k 2 = 1 - r 2 = 1 - 0.67 = 0.33.

X

W
z 0.80

U
sc: 0.60 Correlacion y causalidad
«
>:
w
0 0.40
z Hernos visto que cuando dos variables estan relacionadas, es posible predecir una de
0 ellas basandose en el conocimiento de la otra. Esta relacion entre correlacion y
U 0.20
c:
predicci6n conduce, a menudo, a un grave error de razonamiento; esto es, la relacion
0


0
entre dos variables conlleva frecuentemente la implicacion de que una es causa de la
c: 0
0­ otra. Esto es especialmente cierto cuando existe una relacion temporal entre las
variables en cuestion, 0 sea, cuando una precede a la otra en el tiempo. Lo que
-0.80 -0.60 -0.40 -0.20 0 0.20 0.40 0.60 0.80 1.00
frecuenternente se pasa por alto es el hecho de que las variables pueden no estar
MAGNITUD DE r
unidas causalmente de una cierta manera, pero pueden variar juntas en virtud de un
Fig: 9:5 Proporcion de Ia variacion explicada en una variable, en funci6n de las vinculo cormin con una tercera variable. Por ejemplo, si el lector es aficionado a
vartaciones de otra variable correlacionada para diferentes valores de r.
observar los pajaros, notara que a medida que el numero de pajaros aument.a.en la
. * La ta bl: H del ~pend~muest.r~ varias funciones de r p~ra. diferentes valores de r, entre elias algunas muy utiles primavera, la hierba se torna progresivamente mas verde. Sin embargo, adrnitiendo
tales como r , 1 - r y Jl - r . Es uti] que el lector se farniliarice can el usa de esta tabla. .. que el mayor numero de horas de sol y el mayor calor constituyen el tercer factor que
160 ESTADiSTICA PARA LAS CIENCIAS SOCIALES
REGRESI6N Y PREDICCI6N 161

afecta a ambas variables, no se puede deducir I ..

que la hierba se vuelva verde 0 Vl'ce D que os pajaros sean la causa directa de
EI libro de Huff* incluye un excelente capitulo dedicado a la confusion de la
. , versa. esafortunada t h
particular en las ciencias del Comport a . t I men e ay muchos casos, en correlacion con la causalidad. Considera a las falsas inferencias causales, provenien­
tercer factor. mien 0, en os que no es tan facil identificar el tes de datos de correlacion, como falacias «post hoc» t. EI siguiente fragmento ilustra
Supongamos que ellector ha demostrado' ., . un ejemplo com tin de falacia post hoc.
entre el mimero de horas que los estudi t que extste una correlacion positiva alta
calificaciones obtenidas en el mi ~n ~ empl~an ~re~arando un examen y las Se han recogido multitud de paginas llenas de cifras para sefialar el costo de la
mimero de horas de estudio es cau:~~' I ue ~ s~~t1fSe mchnado a concluir que el educacion universitaria, y se han publicado cantidades enormes de folletos para
ser una conclusion perfectamente razo e ~lvanaclOn, en las calificaciones. Esta parece hacer llegar estas cifras -y las conclusiones mas 0 menos basadas en ellas- a
10 que siempre Ie dijeron sus padres yna ; y estarEa pro?ablemente de acuerdo con los posibles estudiantes. No estoy en contra del proposito, Estoy a favor de la
. . .
Ias lmphcaClones . prOlesores. xammem s is d id educacion, particularmente si incluye un curso de estadistica elemental. Ahora
de esta relacion cau I E l o m a s etem amente
horas empleadas en el estudio fue s~. n e s~puesto de que un mayor mimero de bien, estas cifras demuestran con bastante claridad que las personas que fueron a
cabria esperar que cualquier estudi:
e
t caus; d~ un aument.o en las calificaciones,
garantizada una nota alta ya uel n e que e lque. mayor tiempo al estudio tenga
la universidad ganan mas dinero que las que no 10 hicieron. Las excepciones son
numerosas, por supuesto; pero la tendencia es fuerte y clara.
calificacion inferior Este ~o e~ que ~ase menor tiempo Con sus Iibros reciba una Lo unico malo es que estas cifras y hechos conllevan una conclusion totalmente
hecho de que pUdi~ra ser el mer:;e:s~:~:~~:e eel c~so. Hemos pasado. por alto el injustificada. Estamos ante una falacia post hoc muy clara. Segun ella, estas cifras
motivacion mas poderosa, mejores habitos d ( n vl~tud de su .mayor .mteligencia, muestran que si ellector (su hijo 0 su hija) asiste ala universidad, al final ganara
tiempo al estudio y alcanzase un result d e ~stud~o, etc.) quien dedicase mayor . mas dinero del que obtendria si decidiese emplear esos cuatro alios de su vida de
pacidad. a 0 rnejor, slmplemente por su mayor ca­ cualquier otra forma. Esta conclusion injustificada tiene como base la hipotesis,
tambien injustificada, de que si las personas que recibieron una formacion
universitaria ganan mas dinero, 10 ganan porque fueron a la universidad. En
<l: realidad, no se sabe si esa misma gente hubiera ganado mas dinero aun sin haber
a:l

•• • ••
a:
w asistido a la universidad. Hay dos factores que indican de forma contundente
:I:
•••• que esto es asi. Las universidades tienen una gran cantidad de muchachos que
w
o
• •• • • pertenecen ados grupos: los de mentalidad brillante y los ricos. Los brillantes
a: • • •• seguramente ganarian buen dinero, aun sin los conocimientos universitarios. Yen
o
o
a:
••• 10 que se refiere a los ricos... el dinero llama al dinero de muchas maneras
w
> • • evidentes. Son pocos los hijos de ricos que pueden ser clasificados en los estratos
• de bajos ingresos, hayan 0 no asistido a la universidad.
NUMERO DE PAJAROS OBSERVADOS

CORRELACrON NO ES CAUSALIDAD
Resumen del capitulo
~~T~~\~U~~~AV~~~:'\N~~:~ODE PAJAROS ES PEQUENO. LA HIER­
~~1:~;f~{,~~:~~~~~~:~~H!~~~,~~~:~~R~rfo;~~~
Revisemos brevemente 10 aprendido en este capitulo. Se ha visto que es posible
«ajustar» dos rectas a una distribucion bivariada de valores : una para predecir los
valores de Y a partir de valores conocidos de X, y otra para predecir valores de X a
partir de valores conocidos de Y.
Lo que tratamos de decir es que los e t di . ,
Vimos que, cuando la correlacion es perfecta, todos los puntos caen en la recta de
establecer inferencias de causalidad L' slU .1,OS de correlaclOn no autorizan a
-regresion, Por tanto, no existe en este caso error en la prediccion, Cuanto menor sea
. . a corre aClOn es una condi " .
no suricienre para establecer una I " d '- icion necesana pero el grado de la relacion, mayor sera la dispersion de los valores alrededor de la recta
resumen, para establecer una r I~e .~clOnd e causalidad entre dos variables. En de regresion, y seran mayores los errores de prediccion. Finalmente, cuando r = 0, la
. e aClOn e causalid d '.
expenmento en el cual una variable' d di a es necesano realizar un media de la muestra constituye nuestra «mejori prediccion para una variable dada.
dor, y los efectos de estas manipulaci~~e:pen ~e~te sea manip~lada por el investiga­ Se indico que la recta de regresion es analoga a la media: la suma de las
criterio, Un estudio de c I' se re ejen en otra vanable dependiente 0 de desviaciones respecto a ella es igual acero, y la suma de los cuadrados de
independiente. orre aciones carece del requisito de la manipulacion -

* How to Lie with Statistics.

t Tipo de falacia basada en la secuencia temporal de causa y efecto, (N. del T.)

162 ESTADfsTICA PARA LAS CIENCIAS SOCIALES REGRESION YPREDICCION 163

las desviaciones es minima. Tambien se indic . . a) Una estudiante obtuvo una calificacion de 130 en la variable X. Predecir su
es analogo a la desviacion estanda 0 que el error estandar de la estimacion
. r. calificaci6n en la variable Y.
Vimos que hay tres sumas separadas de cuad d . " . b) Para otro estudiante se predijo una calilicacion de 1.28 en la variable Y. i,Cwil fue su
que pueden calcularse a partir de datos correlacionados: reflejan la variabilidad, y calificaci6n en la variable X?

c) Determinar el error estandar de la estimaci6n de Y.

1. La variaci6n respecto a la media de la distribu " da vari


variacion se la conoce como suma t t l d cdlOn para ca a vanable. A esta 3. Se efectuo un estudio para encontrar la relaci6n entre la «estabilidad emocional» y el
o a e cua rados
rendimiento en la universidad, obteniendose los siguientes resultados:
2. La variaci6n de c~d~ ;alor respecto a la recta de regres~6n. A esta variacion s I
conoce como uartacion no explicada. e a Estabilidad emocional Promedio en la universidad
Y = 1.35
3. ~ad~a~~~~~~~e~~c~:t: v:~~;a~:~i::d~ respecto a la medi~ d~ la distribucion para X =49
s, = 12 Sy = 0.50
. e a conoce como uariacion explicada.
Virnos quetotal.
la variacion la suma de la varia CIOn
'. exp lirca d a y la variacion no explicada es igual a r = 0.36
N=60
Finalmente, se vio que la razon de I .. . .
indica la prop~rci6n de la variacion total ~::~:c~~:d:~~l~:pd~c:da~~rti~Ci~n total a) Una estudiante obtuvo una calificacion de 65 en la variable X. i,Cual es nuestra
se usa para designar esta .. I a. errnmo que prediccion de su calificacion en la variable Y?
estudio el concepto inve~:~~~rclOnfze~ e dedcoeficiente de determinacion. Tambien se b) Determinar eI error estandar de la estimaci6n de X e Y.
coe iciente e no determinacion.
c) i,Que proporci6n de la variaci6n total corresponde a la variaci6n explicada?
4. Sup6ngase que X = 30, Sx = 5; Y= 45, Sy = 8. Dibujar una grafica separada para cada

par de rectas de regresion para los siguientes valores de r:

Terminos para recordar a) 0.00 b) 0.20 c) OAO

d) 0.60 e) 0.80 f) 1.00

Generalizacion: i,Cual es la relacion entre la magnitud de r y el angulo formado por las


coeficiente de determinacion (r 2) recta de reqresion (recta de «mejor ajuste»] rectas de regresi6n? Si los valores de r dados en (b) a (f) fueran todos negatives, i,cual seria la
coeficiente de no determinacion variacion explicada relacion?
S. Sabernos que la desviaci6n estandar de las calificaciones en una prueba ordinaria de
error estdndar de la estimacion »ariacion no explicada vocabulario es 15. La correlaci6n de estapruebacon los CI es de 0.80. i,Que valor es de esperar
falacia «post hoc» varianza residual tenga la desviaci6n estandar en la prueba de vocabulario si se realizara con un grupo grande
homoscedasticidad de estudiantes con el mismo Cl? Expliquese la respuesta. ­
6. Un estudiante obtiene en la prueba X una calificacion que corresponde a 1.5 desviaciones
estandar sobre la media. Predecir su calificacion estandar en el prueba Y, si r es igual a
a) 0.00, b) OAO, c) 0.80, d) 1.00, e) -0.50, f) -0,80.

Ejercicios 7. Un jefe de personal hizo un estudio de los empleados que intervienen en un aspecto del
proceso de manufactura. Encontr6 que despues de haber permanecido estos empleados en eI
trabajo durante un aiio, le era posible obtener una medida de la habilidad de dichas personas,
1. Hallar la ecuacion de la recta de regresion para los siguientes datos. que realmente reflejaba su eliciencia. De este modo ideo una prueba de selecci6n para predecir
su eventual eficiencia, y obtuvo una corr~laci6n de 0.65 con la medida de la eficiencia (Y). La
X media de la prueba fue de 50, Sx = 6, Y= 100, Sy = 10. Contestar las siguientes preguntas
I1 12 13j4 15

~ 3 I 4 2 I 1
basandose en estos hechos. (Sup6ngase que la prueba de selecci6n y la de eficiencia se
distribuyen normalmente):
2.' En un estudio referente a la relacion a) Un empleado obtuvo una calificacion de 40 en la prueba de seleccion. i,Cmil es su
siguientes datos: entre dos variables X e Y, se obtuvieron los
calificacion predicha de eficiencia?
x = 119 Y = 1.30 b) i,Que probabilidad hay de que obtenga una caliiicaci6n de 110 en la escala de
s, = 10 Sy = 0.55 eficiencia?
c) Una cauflcacion de 80 en la variable Y se considera satisfactoria para el trabajo, Y
r = 0.70 una menor es insatisfactoria. Si se usara la prueba X como recur so de selecci6n, i,que
N = 100 calificacion habria que tomar como punto de rechazo? [Sugerencia: Hallar el valor
164 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
REGRESION Y PREDICCION 165

de X que da lugar a una predicci6n de 80 en Y. A '


predicci6n apropiada.] . segurese de emplear la formula de tos tiene una media de 47.63 y una desviacion estandar de 13.82. La prueba de cornprension
d) Ot:a empleada obtuvo una calificaci6n de 30 en . verbal tiene una media de 39.15 y una desviaci6n estandar de 12.35. La correlacion entre
cahficaci6n aceptable en Y? X. i,Es probable que alcance una ambas pruebas es de 0.85.
e) Un terc~r empleado obtuvo una calificaci6n de 60 en . a) Un estudiante obtuvo una calificacion de 40 en la prueba de conocimientos. Predecir
una cahficaci6n aceptable en Y? X. i,Es probable que no alcance su calificacion en la prueba de comprension verbal.
f) Para una persona que aspira a ocupar un car 0 d ' . b) i.Que posibilidad hay de que obtenga por 10 menos 40 en la prueba de cornprension
una calificaci6n de 120 0 mas en Y. 'Q" g e supervlsor,.se consldera esencial verbal?
selecci6n del personal de supervisi , .?i, ue valor de X deberia emplearse para la c) Otro estudiante obtuvo una calificaci6n de 40 en la prueba de cornprension ver-.
S' IOn.
g) I 1000 personas obtienen una calificaci6n X bal. Predecir su calificacion en la prueba de conocimientos.
i.cuantas de elias aproxlmadamente obte de~ c~n la .cual se predice una Y= 120, d) i.Que posibilidad hay de que obtenga por 10 menos 40 en la prueba de conoci­
i.Y superiores a 130? i.E inferiores a 110~ ~yan cahfi~aclOnes en Y inferiores a 120? mientos?
. c supenores a 110? e) En la Universidad de los Andes se encontro que los estudiantes que obtienen por 10
8. , El propietarin de una oficina c1asificadora de envi . .
envies se embarcan dentro de las 24 h '. lOS postales anuncla que todos sus menos 45 en la prueba de cornprension verbal son los que alcanzan mayor exito,
d oras slgUlentes a su recepci ' P i.Que calificaci6n en la prueba de conocimientos se debe usar como punto de rechazo
s~ epartamento de embarque se contrata di . on. uesto que el personal de
Por
numero de envios contenidos en cad a lot d ia, de~ importante que pueda predecir el para la selecci6n?
,. . e e correo lano c b' d f) Un tercer estudiante obtuvo una calificacion de 55 en la prueba de conocimientos.
sunciente personal para el dia . . t T . ' on 0 jeto e poder contratar
. siguien e. uvo la Idea de d' i.Podria ser admitido a la Universidad de los Andes? i.Cuales son sus probabilidades
correlaclOnar el peso con el mimero d . E . pesar ca a dia los envios y
siguientes resultados: e envios, nun periodo de 30 dias sucesivos, obtuvo los. de alcanzar una calificacion aceptable en la prueba de cornprension verbal?
g) Una estudiante obtuvo una calificaci6n de 60 en el examen de conocimientos.
i.Podria ser aceptada por la Universidad de los Andes? i.Que posibilidad hay de que
PESO EN NUMERO
KILOGRAMOS DE ENVIOS
PESO EN NUMERO no alcance una calificacion aceptable en la prueba de cornprension verbal?
KILOGRAMOS DE ENVIOS
11. Basandose en los datos obtenidos (ver mas abajo), un investigador afirma que a medida
20 5400 26 5400 que un nifio adquiere mas edad, es menor el numero de respuestas inadecuadas que da en una
15 4200 21 5000 situacion experimental.
23 5800 24
17
5400 a) Determinar si esta conclusion es valida,
5000 16
12 4300 b) Una nina de 13 afios de edad, participo en eI experimento. i.Cual es el numero mas
3500 34
35 6700 probable de respuestas inadecuadas que el investigador podria predecir para ella?
6400 28 6100
29 6000 15
21 3600
5200 11 3200 NUMERO DE RESPUESTAS NUMERO DE RESPUESTAS
10 4000 18
13 5300 EDAD INADECUADAS EDAD INADECUADAS
3800 27
25 5800
5700 30 5900 2 11 7 12
14 4000 22 3 12 9 8
18 5500
4800 20 4 10 9 7
5200
30 6200 24 4 13 10 3
33 5000
6600 13 5 11 11 6
3700
5 9 11 5
6 10 12 5
7 7
a) Hallar la correlaci6n entre el peso del correo el ' , .
calcular la correlaci6n no se te y numero de envios, [Sugerencia' AI
~~ra facilitar las oper~ciones.] ngan en cuenta las dos cifras finales en la variabl~ y,
12. i.Por que hay dos rectas de regresion? i.En que circunstancias seran identicas las rectas de
b) I se requieren 10 personas para manejar 1000 en ' , regresi6n?
debe contratar para maneia- 22 kil d VIOS por dia, l,cuantas personas
S . " l O S e correo? i.Y 15? .y 30? Y 38? [ 13. EI producto nacional bruto per capita (PNB) tiene amplio reconocimiento como
upongase que los empleados s610 pued . . i, . i. . Nota:
, en contratarse en grupos de 10] estimaci6n del nivel de vida de los habitantes de un pais. Se afirma que el consumo de energia
9.. Examinese 10 que se dice en el suplemento dominical d " . . per capita es, a la vez, una buena prediccion del PNB per capita. La tabla adjunta indica eI
radio y televisi6n, para encontrar ejemplos d ' I ' . e su periodic- y en las revistas,
" e ra acias post hoc PNB (expresado en dolares per capita) y el consumo de energia per capita (expresado en
10 S . .
• upongase que para su ingreso en la unive id d I . rnillones de BTU per capita) de varios paises.
dos pruebas a elegir. Ambas pruebas s lme a , ?S ~studlantes tienen que someterse a a) Construir un diagrarna de dispersion para los datos indicados.

on norma mente dlstnbuidas . La prueba de conocnrnen-


"
b) Determinar la correlacion entre el PNB y el consumo de energia.

166 ESTADfSTICA PARA LAS CIENCIAS SOCIALES


REGRESION Y PREDICCION 167

c) Construir la recta de regresion para predecir el PNB ,. .


de energia per capita. per capita a partir del consumo b) Para una fiesta de 35 personas, estimar el numero de piezas de pan necesarias.
d) Los siguientes paises no estuvieron representados en la mu .. c) "Culil es el SeSl y?
consumos de energia per capita son' Chil 21' I I d . e.stra original, Sus
PNB per capita para cad a uno de es't r
e: 'C an a, 49; BelgIca, 88. Predecir el NUMERO NUMERO
os parses ornparar esas di DE PERSONAS DE PIEZAS
vaIores reales que son 400 630 1400 . . pre icciones con los
, y , respectIvamente.
X= 50 ¥=5
s, = 15 Sy = 1.2
CONSUMO DE ENERGIA PNB
PAIS (EN MILLONES DE BTU) (DOLARES)
India 18. En un estudio reciente, Thornton (1977) explore la relacion de la felicidad conyugal con
3.4 55
Ghana la frecuencia de las relaciones sexuales y con la frecuencia de las discusiones. Veintiocho
3.0 270
Portugal parejas de casados se prestaron voluntariamente a comprobar su frecuencia diaria de
7.7 240
Colombia relaciones sexuales y el mimero de discusiones durante 35 dias consecutivos, y despues hicieron
12.0 290
Grecia
12.0
una apreciacion de su felicidad conyugal utilizando una escala de 7 puntos ordenada desde
Mexico
390 muy infeliz (1) hasta perfectamente feliz (7). Algunos de los resultados se muestran a
23.0 310
Jap6n
30.3 continuacion:
Rusia 550
69.0 BOO
Parses Bajos FELICIDAD RELACIONES
75.0 1100
Francia CONYU GAL SEXUALES DISCUSIONES
5B.0 1390
Noruega
67.0 1330
Alemania Occidental Media 5.32 13.46 6.15
90.0 1410
Australia s 1.66 7.32 4.19
BB.O 1525
Reino Unido
113.0 1400
Canada Correlaci6n entre felicidad y discusiones = - .740
131.0 1900
Estados Unidos Correlaci6n entre felicidad y relaclones = .705
lBO.O 2900

14. Demostrar algebraicamente que a) "Que grado de felicidad se le podria predecir a una pareja que manifiesta haber
tenido 10 discusiones durante los 35 dias?
by = NL:XY - (L:X)(lY) b) "Que grado de felicidad se le podria predecir a una pareja que manifiesta haber
NL:X 2 - (L:X)2 tenido una relacion sexual diaria durante los 35 dias?
15. Demostrar algebraicamente que c) "Culil es la frecuencia mas 'probable de relaciones sexuales para una pareja que
manifiesta que son muy infelices (valor en la escala = 1.0)?
d) "Cual es el error estandar de la estimacion para la felicidad conyugal cuando se
utiliza como vaticinio la frecuencia de relaciones sexuales? "Cual es el error estandar
de la estimacion cuando el vaticinio es la frecuencia de las discusiones?
16. X3456789 e) "Que proporcion de la variabilidad en las calificaciones de la felicidad conyugal
10 11

Y 4 3 5 6 8 7 9
queda explicada por la frecuencia de las relaciones sexuales? "Que proporcion queda
9 11 explicada por la frecuencia de las discusiones?
f) "Cual es el coeficiente de no determinacion cuando la felicidad conyugal se predice a
a) Deter~inar la cor~elacion entre l~s anteriores datos.
partir de la frecuencia de relaciones sexuales? "CuM es el coeficiente de no determina­
b) vCaolOnrOCdIdayl~ antenodr correlacion, y despues de calcular la media de
cion cuando la felicidad conyugal se predice a partir de la frecuencia de las
e para ca a X. Y, predecir el
c) Calcular Ley _ Y)2.
discusiones?
d) Calcular la varianza no explicada.

e) Calcular la varianza explicada.

f) Calcular el coeficiente de dete . . .

es igual a r. rmmacion, Demostrar que la raiz cuadrada de ese valor

17. £1 administrador de una tienda de suminist d . .

entre el mimero de personas asistent fie e viveres encontro una correlacion de 0 70

a) Para una fiesta de 60 perso~s a u~~ lesta y las piezas de pan consumidas. .
as, es imar el nurnero de piezas de pan necesarias.
[169J

REVISION DE LA SEGUNDA PARTE

Estadistica descriptiva

En los nueve capitulos precedentes se ha visto que hay muchos modos distintos de
describir los datos. La aplicaci6n de las diversas tecnicas descriptivas a los dos
conjuntos de datos presentados a continuaci6n dara al lector una oportunidad de
observar c6mo pueden integrarse estas tecnicas para la descripci6n de datos.

Problema de repaso n,? 1

NUM~RO
CLASIFICACION DE JUEGOS
FINAL HOME RUNS SIN CARRERA

Minnesota 150 3
Chicago 125 9
Baltimore 125 12
Detroit 162 11
Cleveland 156 15
New York 149 16
California 92 16
Washington 136 14
Boston 165 11
Kansas City 110 10

A. Dibujar una grafica para ilustrar la relacion entre la clasificacion final y el numero de
home runs bateados en la Liga Americana.
B. Calcular:
1) La media de las veces en que los equipos de la Liga Americana no hicieron carreras.
2) El numero median a de home runs bateados en la Liga Americana.
3) La desoiacion estdndar de la distribucion de los juegos sin carrera.
c. Deterrninar la relacion entre:
1) EI mimero de home runs y la clasificacion final.
2) EI numero de home runs y el mimero de juegos sin carrera.
170 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

Problema de repaso n." 2*


COSTO PROMEDIO ESTANCIA COSTO PROMEDIO ESTANCIA
DE HOSPITALIZACION PROMEDIO DE HOSPITALIZACION PROMEDIO
POR PACIENTE EN EL HOSPITAL POR PACIENTE EN EL HOSPITAL TERCERA PARTE
Y POR DIA (EN DIAS) Y POR DIA (EN DIAS)

1946
1947
1948
s 9.39
11.09
13.09
9.1
8.0
8.7
1955
1956
1957
$23.12
24.15
26.02
7.8
7.7
7.6
Estadistica inferencial

1949 14.33 8.3 1958 28.27 7.6


1950 15.62 8.1 1959 30.19 7.8
1951 16.77 8.3 1960 32.23 7.6
1952 18.35 8.1 1961 34.98 7.6
1953 19.95 7.9 1962 36.83 7.6
1954 21.76 7.8 1963 38.91 7.7

A. Dibujar una grafica que ilustre los cam bios en el costo diario promedio por paciente en el
hospital, desde 1946 hasta 1963.
B. Dibujar una distribucion de frecuencias de la estancia promedio en el hospital, usando los
datos de la tabla adjunta. Describir la distribucion.
C. Para el periodo de 18 an os desde 1946 a 1963, calcular la media y la desviacion estandar
de la estancia promedio en el hospital.
D. Determinar la relacion entre el costa promedio por paciente y por dia y la estancia
promedio en el hospital.

1) ~Cuanto cabe esperar que le cueste en promedio diariamente su estancia a una


persona que pasa una semana (siete dias) en el hospital?
2) Basandose en estos calculos, el paciente X llega a la conclusion de que cuantos mas
dias permanezca en el hospital menos Ie costara por dia, Decide que si puede
prolongar su estancia en el hospital por 10 dias, podra esperar un costo promedio A. Pruebas parametricas de significacion
diario de ? ~Cual es la falacia en esta conclusion? [Sugerencia: Analizar
esta inferencia haciendo uso de los conocimientos adquiridos sobre correlacion y
causalidad.]
\
'[

* Los datos para este problema fueron tornados del Reader's Digest Almanac, pag, 489. Nueva York. Con permiso de
Reader's Digest Association, 1966.
[173J

10 Probabilidad

10.1 Introduccion a la teoria de la probabilidad


En los capitulos anteriores nos hemos ocupado principalmente de la exposici6n de
las tecnicas empleadas por los estadisticos para describir y pres entar los datos en la
forma mas concisa y significativa posible. Sin embargo, en el capitulo 1 sefialamos
que el interes de los cientificos va mas alla de la simple descripci6n de las obser­
vaciones.
Para la estrategia de la ciencia es fundamentalla formulaci6n de proposiciones
generales acerca de las poblaciones 0 acerca del efecto de las condiciones experi men­
tales sobre las variables de criterio. Asi, como hemos sefialado anteriormente, los
cientificos no se dan generalmente por satisfechos con informar unicamente que la
media aritrnetica en la variable X de un grupo al cual se le aplic6 determinado
farmaco en via experimental es mayor 0 menor que la media del grupo placebo en la.
misma variable. Desean, ademas, poder hacer enunciados tales como: «la diferencia
entre los dos grupos es de tal magnitud que no podemos considerarla como
proveniente s610 del azar. En forma mas especifica, este efecto se debi6..., etc.»,
El problema de la variaci6n debida al azar es muy importante. Todos sabemos
que en las ciencias del comportamiento, la variabilidad de los datos genera el riesgo
de llegar a una conclusi6n err6nea. Considerese el siguiente ejemplo.
Basandose en observaciones casuales, el investigador A formula la hip6tesis de
que el CI de las nifias de primer afio de primaria es mas alto que el de los nifios, Para
probar su hip6tesis, somete a cuatro nifios y cuatro nifias de primer afio a una
prueba de inteligencia, y encuentra para las nifias una media de 110 y para los nifios
una media de 103. ~Cabe deducir de ello que el investigador A ha confirmado su
hip6tesis? La respuesta es, obviamente, negativa. Pero, wor que? Despues de todo,
hay una diferencia entre las medias muestrales, ~no es cierto? Intuitivamente
podemos arguir que la variabilidad de la inteligencia entre los alumnos es tan grande,
y que el N de elementos en la muestra tan pequefio, que son inevitables algunas
diferencias entre las medias como consecuencia de nuestro proceso de selecci6n. Las
preguntas decisivas a que debe responder la inferencia estadistica son: (1) ~Es digna
de confianza la aparente diferencia de inteligencia entre estos estudiantes de primer
afio? (esto es, ~aparecera regularmente esta diferencia al repetir varias veces la
investigacion'') 0 (2) ~Es la diferencia resultado de factores no sistematicos que
174 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
PROBABILIDAD 175

Recuadro 10.1
variaran de un estudio a otro y, por tanto, produciran conjuntos de diferencias no
coherentes?
La teoria de la probabilidad es la base de I disti '. Una funcion primordial de la inferencia estadistica es la de proporcionar
interpretacion de los datos apenas podria ir :::~I~s~I~~ m~ere~claI. ~m ella, n~estra procedimientos rigurosos y logicamente seguros para contestar a estas preguntas.
en cuenta su importancia sorprende c b a simp e conjetura, Temendo
Como se vera en los capitulos siguientes, la teoria de la probabilidad proporciona una
de la .probabilidad han invadido la ~~~;~ d~ que algunos conceptos erroneos acerca
base logica para escoger entre todas las alternativas de interpretacion de los datos
«falacia del jugador» descrita en este fragmentomdueChwas. pe.rsona.s Uno. d~ ellos es la
tnninq wit h· Statistics. provenientes de una inve, tigacion.
La teoria de la probabilidad no es tan desconocida como pudiera pensarse.
Ciertamente, en la vida diaria nos vemos constantemente obligados a emitir juicios
probabilisticos, aunque no nos demoscuenta de que 10 son. Por 'ejemplo, suponga­
mos que, por diversas razones, un alumno no tiene preparada la clase de hoy. Ha de
considerar por ello la posibilidad de faltar a clase. ~Que factores influiran en su
decision? Evidentemente, una consideracion sera la posibilidad de que el profesor
descubra su falta de preparacion, Si el riesgo es alto, el alumno decide faltar a clase; si
Ahara S1 que me toea ganar
el riesgo es pequefio, decide ir.
(la falacia del jugador)
Veamos este ejemplo en terminos un poco diferentes. Hay dos alternativas
posibles:
!Dec~Sionles peligros.as! Adquieren muchas formas e invaden muchos ca U Suceso A: Su falta de preparacion sera descubierta.
Juga or anza al aire una moneda . d mpos. n
razonamiento de que perder cinco veces ~~er.~ cuatro veces seguidas. Haciendo el Suceso B: Su falta de preparacion no sera descubierta.
ofertas en contra = 3125'1) decid gur asI es extremadamente raro (p = 0.031,
. ., e aumentar a apuesta Ah . Existe incertidumbre en este caso porque hay mas de una alternativa posible. Su
:aan~~)~~:~~:~aC~~adamente. !'!uestro jugador favorito d~ ~eis:~~ v: p~~~ie:o t~~~
1
decision acerca de asistir 0 no asistir a clase depende del grado de seguridad que el
debe acertar», Un iua:~ar por quinta vez, estamo~ lIenos de confianza: «Ahora si que alumno asocie con cada una de estas alternativas. Asi, si esta bastante seguro de que
libres. Usted se m~e~ra °e:pdeer:na~~~~:st~ dell e~U1~o con.trario ha acertado seis tiros prevalezca la primera alternativa, decidira no ir a clase.
. « n e srguiente tiro debe fallar», Supongase que el profesor pide frecuentemente a los estudiantes que participen
Aunque estos ejernplos no son identicos, tienen una ' . . activamente en la clase. De hecho, el alumno ha observado que la mayo ria de. los
los sucesos tienen memoria Es co . I' d cosa en comun: la creencia de que
mo
recordar que salio cara cuat~o vece Sl ~ Juga or r~zonara: .«La moneda tendra que estudiantes son interrogados en cada clase. Este es un ejemplo en el cual hay un alto
saliendo cruz el proximo lanzami:~;gUldEastY tratara de segurr la ley de los promedios grado de certeza asociada con la primera alternativa. Dicho de otro modo, la
0». s 0 carece por completo d tid S' I probabilidad del suceso A es mayor que la probabilidad del suceso B. Por consi­
moneda es «honesta», habra la misma posibilidad d I e sen I o. I a

en el proximo lanzamiento, 0 en cual uier otr e que sa ga cara? ~e que salga cruz
guiente, el alumno decide no ir a clase.
independencia, el resultado de un ex e . q t ~ A esta caractenstIca la llarnamos
Aunque no utilize ninguna de las leyes formales de la probabilidad, torno en este
cual es otra forma de negar que ~o~:en °dn~ ecta a los posteriores resultados; 10
ejemplo una decision basada en un empleo intuitivo de la probabilidad.
memoria. as, a os, cartas 0 ruedas de ruleta tengan

Es posible que ellector se haya dado cuenta de que muchas de las preguntas de
los ejercicios comienzan con: «~Cual es la probabilidad de que...'I». Estas preguntas
~I.g~~~~~eent~noc:~:e ~u~;;ob~~r~ta 1e actividades relacionadas con el comportamien­ sirven de preparacion para el estudio formal de la probabilidad que haremos en los

~~:P~::~~~~~~:e~~~:~;:r:sa~~c~~~;~~::~i:~~;;:~~~:,:~~t~;:d~;t~:a~o~:li~~ds~~ dos proxirnos capitulos. Sin embargo, antes de estudiar los elementos de la teoria de
la probabilidad, es conveniente comprender uno de los conceptos mas importantes
consecutivas al marco contrario simp~ POt e futbol fodnan haber llegado siete veces de la estadistica inferencial: el concepto de aleatoriedad.
Sin embargo, es incorrecto citar la «ley d~~~se;~rqu;. a defensa contrar~a es muy debiI.
algo diferente en la proxima oportunidad La Ie ~e llOs» como ~na raz~n para esperar
que la respaJde, ni hay una Corte Su re~a u/sue os.promedlOs.no .tIene. una fuerza
«decisiones». Ciertamente I ,.
imparcialidad.
P q. pervise la constItuclOnahdad de sus
' a urnca cosa que tiene en comun con la jurisprudencia es su
10.2 Concepto de aleatoriedad
Se recordara que al discutir el papel de la estadistica inferencial sefialamos el hecho
Tornado de Winning with Statistics, R. P. Runyon: Addison-Wesley Publishing Co., Reading, Mass., 1977. de que los parametros poblacionales son raramente conocidos 0 conocibies, Por esta
razon nos vemos obligados general mente a extraer muestras de una poblacion dada
176 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
PROBABILIDAD 177

y usarlas para estirnar el valor de los aramet E' .'


nar estas muestras de modo que p tros. videntemente, deseamos seleccio­ (tabla Q del apendice III). Puesto que los mimeros de esta tabla se obtienen de forma
provienen. Una forma de consegUirs:~~a ::P::::~~:~li:~~ de la poblacion de donde aleatoria, se consigue el mismo efecto que ellogrado al mezclar los papeles. A cada
aleat~rio simple, que consiste en seleccionar I~uestras de n~:d es la de ;sar el muestreo uno de los 87 nifios Ie asignamos un numero de 01 a 87. Podemos comenzar en
taman? dado tenga exactamente la misma probabilidad de s 0 qU~ c~ a~nuestra de un cualquiera de las filas 0 columnas de digitos de la tabla Q.
seteccionar los elementos de la muestra de modo er e1egz a, 0, e otro modo, Despues de escoger 29 mimeros que corresponden a 29 nifios diferentes, tene­
probabili~ad de ser elegido en una muestra de tQ/~~~oc~:~:lemento tenga la misma mos el primer grupo. Se continua de la misma manera hasta completar los tres
, Conslderemos la seleccion de muestras de N _ . . ., . grupos de 29 nifios cada uno. Por ejemplo, si comenzamos en la fila 15 yescogemos
numeros: 0 1 2 3 4 S' " - 2 en una poblacion de CInCO pares consecutivos de numeros, obtenemos 10 siguiente: 65,48,11,76,74,17, y asi
ser elegid~ ~u~ ~U~lq'Ui~~~~~~Ut:llqUler ~azon, a!gun.1lI1 mero tiene mas posibilidad de
Por ejemplo, si por alguna ra;on e~u:~;;on~
igual al doble de la probabilidad de cual ui
z: igual probabi!i?ad de ser elegida.
VIera, una proba~lhdad de ser elegido
sucesivamente. Si aparece un numero superior a 87 0 si se repite algun numero,
prescindimos simplemente de el.
La raz6n de la importancia capital de los procedimientos de muestreo quedara
cia de las muestras que contienen el num~r le~ ~ro numero,h~b~la una preponderan­ aclarada en los dos capitulos siguientes, y se basa fundamentalmente en un hecho
les llama sesgados. En el tipo natural d~ e~tu~~tos pr~cedlmlen~osde muestreo se fascinante de la estadistica inferencial, a saber: no se puede predecir un suceso cuando

~~e:~:~::~fao~~~:e;r:1 ;;e~;~~~ibks~iertas ~araclte~~stf~~~~~ou~~~~I~I:~~:t,e~1 ~~~~~~


se 10 considera aislado, pero las colecciones de sucesos aleatorios pueden tomar formas
predecibles. La distribucion binomial, que se estudiara detenidamente en la seccion
una muestra de automoviles a 'par:it~;1 e:;~~ 0, no nos ~treve.r~mos a seleccionar 11.3, ilustra este hecho. Si tornaramos, por ejemplo, 20 monedas identicas y las
una calle de la ciudad Los pelig d g r ro de matnculaclOn, 0 «al azar » en Ianzararnos al aire, no podriamos predecir exactamente la proporcion de las mismas
obtenidos con una mu'estra selec~:na~:~:e;:t izar al total de la p~blacion lo~ datos que caerian de «cara», Sin embargo, si lanzasemos estas 20 monedas un gran mimero
para ellector. A menos que se cumpla la condic~ ~or:a 1eben.ser, SIn duda, evidentes de veces, anotararnos el mimero de caras en cada lanzamiento y construyeramos una
saber a que poblacion podriamos li on e a eatonedad, nunca podremos distribuci6n de frecuencias de los resultados, colocando en el eje horizontal todos los
muestras ~o aleatorias, encontramos g;~:~:SI~:;I:su~~t;~~r~~~~'~~o~Mas aun, con valores comprendidos entre 0 caras y 20 caras, la grafica obtenida tend ria una forma
Ademas, las pruebas estadisticas presentadas en est I I ~ no se cumplen. caracteristica y predecible conocida como distribucion binomial. Empleando el
aleatorio independiente. Se dice que dos suces . e texto. requle~en un muestreo modelo binomial, podriamos predecir con considerable exactitud, para un rnimero
uno no afecta a la seleccion del t P d os son Independlentes si la seleccion de considerablemente grande de lanzamientos, el porcentaje de veces en que ocurriran
oro. 0 remos comprend . I .
dependencia si pensamos en los j d er rnejor e concepto de In­ los diversos resultados. Lo que es quiza mas fascinante es el hecho de que la
forma honesta. EI hecho de conoce~:~~:su~t ~a~ ~~Ponien.do que se los realiza de" distribuci6n de los resultados de esta variable se aproxima cada vez mas a la curva
lanzamiento de un dado del nu e a 0 ~ anzamiento de una moneda, del normal cuando N (numero de lanzamientos de una moneda 0 numero de monedas
una carta extraida de u'n mazo~re~ e~a~~~a~e detiene ~na ruleta 0 de la seieccion de lanzadas simultaneamente) va tomando valores cada vez mayores. De hecho, cuando
despues de la extracci6n) no nos d J . 0 (suponiendo que se repone la carta N es grande podemos utilizar la curva normal para describir la propiedad de los
resultados. ' ayu a m un apice en la predicci6n de futuros diversos resultados de una variable binomial.
Cuando nos interese realizar un experiment d b
EI mismo razonamiento es valido respecto al modelo de la curva normal. En
pr~sente la aleatoriedad en dos etapas del estud~' ~ em os asegura~nos de que este
ausencia de cualquier informacion especifica, podria ser que no fueramos capaces de
sujetos de la poblacion de interes I h I~. ~mos de selecczonar al azar los
predecir la situaci6n de una persona en relacion a una caracteristica dada (inteligen­
condiciones experimentales. ,y uego ernos e astqnar al azar estos sujetos a las
cia, estatura, peso, etc.). Sin embargo, como ya sabemos, las distribuciones de
Esta fuera del alcance de este texto el f di
frecuencias de estas calificaciones toman cornunmente la forma de la curva normal.
muestreo, ya que esta materia exige . pro un rzar en los procedimientos de
Asi podemos predecir la proporcion de individuos que obtienen una calificaci6n
embargo, veamos un ejernplo que ilu~~:~~:o ~omp!et? para su estud.io a fondo. Sin comprendida entre dos dadas,
podemos obtener aleatoriedad en la . p .~ce~mlentos por medio de los cuales Lo que tal vez tenga mayor importancia, desde el punta de vista de la estadistica
experimentales. asrgnacion e los sUJetos a las condiciones inferencial, es el hecho de que las distribuciones de los estadigrafos muestrales (X, s,
Supongamos que interesa cornparar tres 't d di mediana, etc.), basados en muestras aleatorias provenientes de una poblacion, toman
nifios en etapa preescolar. Hay 87 nifios ue d 0 os Iferentes. de ensefiar a leer a igualmente formas altamente predecibles. EI capitulo 11 trata del concepto de
iguales. La asignacion debe hacerse I q eben ser repartidos en tres grupos distribuciones muestrales, que son distribuciones probabilisticas teoricas de un
U ' . a azar.
n metodo para consegutr la aleatoriedad seria escribir el nombre d d ._ estadigrafo que resultarian de la extracci6n de todas las muestras posibles de un ta­
en un trozo de papel, mezclar estos troz I '" e ca a rnno rnafio dado en una determinada poblaci6n.
Otro metodo alt ti . " os y uego dlstnbUIrlos en tres grupos iguales. Con esta breve introducci6n al concepto de aleatoriedad, estamos en condiciones
, erna IVO conslstIna en el uso de la tabla de nu meros al '
eatonos de estudiar la teoria de la probabilidad.
178 ESTADISTICA PARA LAS CIENCIAS SOCIALES
PROBABILIDAD 179

10.3 Enfoques del concepto de probabilidad


robabilidad de que en una muestra de diez estudian~es, ext~aida al azar ,d.e la
poblacion estudiantil, tres 0 mas tengan ojos negros? 0 bl.en, Lcual es ~~ probabJ11~ad
La probabilidad puede ser considerada como una teoria referente a los resultados p que un es t u diante
de 1 determinado , elegido al azar de dicha poblacion, tenga ojos
posibles de los experimentos. Los experimentos han de ser potencialmente repetiti­
Si en una muestra aleatoria de 100 estudiantes hallarnos ~ue
vos; es decir, hernos de poder volverios a realizar bajo condiciones similares, Debe negros? 30 . . egros
tienen ojos n. .'
ser factible enumerar todos los resultados posibles, y hemos de ser capaces de podriamos estimat que la proporcion de estudiantes con ojos negros en la umversi­
establecer las frecuencias relativas de estos resultados. dad es de 0.30 empleando la formula (10.1):
Es el metodo de asignar frecuencias relativas a los resultados posibles 10 que
distingue el enfoque clasico del enfoque empirico en la teoria de la probabilidad. p(ojos negros) = 13000 = 0.30.

Asi, la probabilidad de que el estudiante elegido te~ga ojos negros e~ deIO.?o.


10.3.1 Enfoque clasico Nota: Esta es una probabilidad
I empirica, porque
. se ha asignado la frecuencia re ativa
s erada basandose en resultados empiricos. bilid d
La teo ria de la probabilidad ha estado siempre asociada con los juegos de azar. e p Aun ue en nuestra futura discusion acerca de las pro~iedades?e ~a,proba.
II a
Supongase, por ejemplo, que se desea conocer la probabilidad de que una carta emplea~os un modele idealizado, podemos aplicar los mismos pnncipios a diversos
extraida de un mazo de 52 cartas sea un as de espadas. Hay 52 resultados posibles. problemas practices.
Admitimosuna situacion ideal en la que se espera que todos los resultados tengan la
misma probabilidad de ocurrir. Asi, la probabilidad de elegir un as de espadas es n.
Razonamientos de esta clase han Ilevado a la siguiente definicion clasica de la
probabilidad:
10.4 Propiedades formales de la probabilidad
Niimero de resultados favorables al suceso A
ptA) = , (10.1)
Numero total de sucesos (favorables a A + no favorables a A) 10.4.1 Las probabilidades varian entre 0 y 1.00
Debe notarse que la probabilidad se define como una proporcion (p). EI punto De acuerdo con la definicion clasica de probabilidad, p esta siempre comprendida
mas importante de la definicion clasica de probabilidad es la hipotesis de una
situacion ideal en la que la estructura de la poblacion es conocida; es decir, se conoce
entre 0 y 1, incluidos ambos nurneros. Si la realizacion de ~? suceso es se~ura, IS:
probabilidad es 1; si hay certeza de que no ocurra, su p~obab~hd~d es O. Por ejemp-..1..-'
el numero total (N) de resultados posibles. Se Ilega a la frecuencia relativa esperada
la probabilidad de extraer el as de espadas de una baraja ordinaria de ~2 cart:~t~d~~
de cada resultado a traves de un razonamiento deductivo, Asi, la probabilidad de un
La robabilidad de sacar un as de espadas rojo es cero, porque no ay res
suceso se interpreta como la frecuencia relativa teorica (0 idealizada) con que se
presentara dicho suceso. En el ejemplo anterior, el mimero total de resultados
pos~les que favorezcan este suceso.. Si todos los resultados favorece~ ~ ~s:uc:~~
( , 10 sacar una carta con cierta marca en ella), entonces p - . . ' ~
posibles fue de 52 (todas las cartas del mazo) y se adrnitio que todos los resulta­ por ejempsuceso A se cump Ie que 0 ""'~" p(A) """,.,
cualquier s: 100 donde el simbolo ~ significa
dos tenian la misma probabilidad de ocurrir. De este modo, p(as de espadas) = 512;
«menor 0 igual que»>,
p(rey de corazones) = 512; y asi sucesivamente.

10.4.2 Expresion de la probabilidad


10.3.2 Enfoque empirico
Ademas de expresar la probabilidad como una proporcion, ha.y.otras formas que se
Aunque generalmente es facil asignar frecuencias relativas esperadas a los resultados utilizan frecuentemente. A veces es comodo expresar la probabilidad como porcent a­
posibles de los juegos de azar, no es igualmente facil hacerlo en la mayoria de los ie 0 sea como el Il!imero de posibilidades en 100.
experimentos de la vida real. En los casos reales, se asigna la frecuencia relativa , A m~do de ilustracion: si la probabilidad de un suceso es de 0.05, esper~~~~ ~~~
esperada basandose en resultados empiricos. Asi, podemos no conocer la proporci6n este suceso ocurra el 5 % de las veces, 10 que equivale a expresar que las POSll 1 l.a a
exacta de estudiantes de una Universidad que tienen ojos azules, pero cabe estudiar de que este suceso ocurra son d e 5 en 100 . Tambien puede expresarse aI mism ceso
una muestra aleatoria de estudiantes y estimar la proporci6n de los que tendran ojos probabilidad diciendo que las oportunidades estan 95 a 5 en contra de que e su
azules. Una vez que hayamos Ilegado a una estimacion, podemos emplear la teoria ocurra, 0 sea, 19 a 1 en contra.
clasica de la probabilidad para responder a preguntas tales como: ~cuales la
• El simbolo ;;, significa «mayor 0 igual que».
180 ESTADiSTICA PARA LAS CIENCIAS SOCIALES
PROBABILIDAD 181

I No.tese. ~ue cuando expresamos la probabilidad como oportunidades en contra de Dividiendo cad a frecuencia por N x' se obtiene una distribucion de probabilida­
a realizacion de un suceso, usamos la siguiente formula:
des de las medias de las muestras de tamafio N = 2. Notese que ahora estamos en
Oportunidades en, contra del suceso A = (numero total de resultados _ condiciones de responder a preguntas tales como: en una extraccion simple de una
- numero de resultados que favorecen al suceso A) media cuando N = 2, ~cmil es la probabilidad de obtener una media igual acero,
a numero de resultados que favorecen al suceso A. (10.2)
igual a 2, 0 igual a 5.5? Las respuestas son, respectivamente, 0.0204, 0.1020 y 0.0408.
En la estadistica inferencial interesa a menudo determinar la probabilidad de uno
~;\ S;~(A) = 0.01, las oportunidades en contra de la realizacion del suceso A son de entre varios sucesos diferentes. Por ejemplo, podemos tratar de responder a pregun­
tas tales como: ~cmil es la probabilidad de obtener una media cornprendida entre 4.5
y 5.0, 0 bien una media que sea igual 0 mayor que 5.0? Cabe sospechar que la
probabilidad buscada se puede deterrninar hallando la probabilidad de obtener una
10.4.3 RegIa de Ia adicion media de 4.5 0 5, que es (449 + 19)' y sumando este valor a la probabilidad de obtener
En los ejercicios propuestos al final de los capitulos 3 4 5 y 6 t una media mayor 0 igual que 5.00, que es (439 + 19 + 419)' Esto nos daria 449 +
experiment t I I " , presen amos un + 19 + 19 + 19 + 19 = ~~.Notese,sinembargo,queparallegaraesteresuitado hemos
. 0 mues ra en e .~ue consideramos todas las muestras posibles de N = 2
provementes de una poblacion de siete mimeros. EI proposito de este ejercicio fue el tenido en cuenta dos veces el mismo suceso (una media de 5.0). Evidenternente,
de slentar la base p~ra, un~ discusion de la teoria de la probabilidad y posteriormente deberiamos haberlo considerado solo una vez. Para ello, podriamos sumar todas las
de a prueba de hipotesis, " probabilidades y restar el numero que participa de ambas caracteristicas, ya que 10
. ~evisemos brevemente este experimento. Partimos de una poblacion con los hemos considerado dos veces. Asi, la probabilidad buscada se convierte en:
sigurentes
. elementos'. 0, I , 2, 3, 4, 5, 6. E scnibilmos ca d a uno de estos mimeros en una
ta,rJeta, y col~camos las tarjetas en un sombrero. Extraemos una tarjeta anotamos el p = 449 + 19 + 439 + 19 + 19 - 19 = ~g = 0.20.
nu~ero y rellltegram~s la tarjeta ~I sombrero. Luego extraemos aleato;iamente otra Esto nos lleva a la formulacion general de la regia de la adicion.
tarjeta, sumamos el numero obtemdo al anterior y calculamos la media dividiend I
o
s;:~a por 2. Despues d.e c?nst~~ir una tabla para todas las muestras posibles d: Si A y B son sucesos, la probabilidad de que ocurra cualquiera de ellos es iqual a la
- 2, obtenemos la distribucion de frecuencias de las 49 medias ibl probabilidad de A mas la probabilidad de B menos la probabilidad de su realizacion
muestra la tabla 10.1. POSI es, como
conjunta.
x p(Xj
En forma simbolica, esto se expresa asi:
6.0 1 0.0204 p(A 0 B) = p(A)+ p(B)- p(A y B). (10.3)
5.5 2 0.0408
5.0 3 0.0612
4.5
Notese que si los sucesos son mutuamente excluyentes (0 sea, que ambos, sucesos
4 0.0816
4.0 no pueden ocurrir simultaneamente), el ultimo terrnino desaparece. Asi, la regia de la
5 0.1020
3.5 6 0.1224
adicion para sucesos mutuamente excluyentes es
3.0 . 7 0.1429
2.5 6 0.1224 p(A 0 B) = p(A) + p(B) (10.4)
2.0 5 0.1020
1.5 4 0.0816 Veamos un ejemplo que se refiere a sucesos mutuamente excluyentes. Si extrae­
1.0 3 0.0612 mos una muestra de N = 2, ~cuaI es la probabilidad de obtener una media mayor 0
0.5 '2 0.0408
0.0 1
igual que 5? Para responder a esta pregunta, sumamos simplemente las probabilida­
0.0204
des de los sucesos que estan incluidos en la proposicion «mayor 0 igual que 5»,
puesto que son mutuamente excluyentes (0 sea, que dos 0 mas de ellos no pueden
ocurrir simultaneamente). En el presente ejemplo, estos sucesos, corresponden a las
* Usamas N'x para representar el ruime­
ra total de medias obtenidas en el experi­ medias que tienen los valores de 5.0, 5.5 y 6.0. Notese que estos sucesos son
mento muestral, distingurendolo de N mutuamente excluyentes. Si en una extraccion se obtiene una media de 5.5, no puede
Que es el nurnem de valores en que se
basa cada media. obtenerse en esa extraccion una media con otro valor.
t LP(X) deberia ser igual a 1.000. La Tabl.a 10.1 Distribucion de frecuencias y de probabilidades de I 'La probabilidad de obtener una media mayor 0 igual que 5 resulta ser
discrepancia de 0.0003 proviene de erro­ medias de muest d t - as
res de redondeo. . . ras e arnano N = 2, provenientes de una poblacion
de siete numeros (0, 1, 2, 3, 4, 5, 6).
p(X = 5) + p(X = 5.5) + p(X = 6.0) = 0.0612 + 0.0408 + 0.0204 = 0.1224.
182 ESTADfsTICA PARA LAS CIENCIAS SOCIALES
PROBABILIDAD 183

Observese que podemos formular y responder preguntas adicionales tales como: 10.4.4 RegIa de Ia multiplicacion
en la extraccion de una muestra de N = 2, ~cll(il es la probabilidad de obtener una
media menor 0 igual que 2?
En la seccion anterior nos ocupamos de la determinacion de la probabilidad de
En forma simbolica:
obtener un suceso u otro bas an dose en una extraccion simple respecto a un conjunto
de 49 medias. En la estadistica inferencial se presenta a menudo el problema de
p(X:;.;; 2.0) = p(X = 2) + p(X = 1.5) + p(X = 1.0) + p(X = 0.5) + p(X = 0)
averiguar la probabilidad de la realizacion conjunta 0 sucesiva de dos 0 mas sucesos
= 0.1020 + 0.0816 + 0.0612 + 0.0408 + 0.0204 referentes a mas de una extraccion,
= 0.3060.
Caso del muestreo con reposicion. Vol vamos a nuestro experimento muestral.
Cabe tarnbien preguntar: ~cll(il es la probabilidad. de escoger una media com­ Recordemos que al obtener las medias muestrales basadas en N = 2, sacamos una
prendida entre 3.5 y 5.5, incluyendo estos valores? Simplemente, sumamos las tarjeta del sombrero, anotamos el valor que en ella esta escrito, volvemos a
probabilidades separadas de los siguientes sucesos: introducir la tarjeta en el sombrero y elegimos aleatoriamente una segunda tarjeta.
Imaginemos que en ambas extracciones obtenemos un valor igual a cero. Cab ria
p(X = 3.5) + p(X = 4.0) + p(X = 4.5) + p(X = 5.0) + p(X = 5.5) preguntar: ~cuaI es la probabilidad de obtener por azar una media igual a cero en dos
= 0.1224 + 0.1020 + 0.0816 + 0.0612 + 0.0408 extracciones sucesivas de la poblacion de siete valores? De hecho, obtuvimos antes
= 0.4080. esta respuesta al construir la tabla 10.1 (distrihucion de frecuencias y de probabilida­
des de las medias de muestras de tamafio N = 2, provenientes de una poblacion de
La Formula (10.4) se puede generalizar a cualquier mirnero de sucesos mutuamen­ siete numeros), Hal1amos una probabilidad igual a 0.0204.
te excluyentes. Asi,
Se puede obtener el mismo resultado mediante un rnetodo aiternativo, que
consiste en aplicar la regia de la multiplicacion. Esta regia establece que:
p(A 0 B 0 ... Z) = p(A) + p(B) + ... + p(Z).
La probabilidad de realizacion simultanea 0 sucesiva de dos sucesos es igual al
En los capitulos 11 y 17 encontraremos problemas que se basan en poblaciones producto de las probabilidades separadas de cada WlO.
dicotomicas, de si-no, 0 de dos cateqorias, donde los sucesos no solo son mutuamente
excluyentes, sino tambien exhaustioos. Por ejemplo, en el experimento muestral con Expresado simbolicamente:
el que hemos estado trabajando, ~cll(il es la probabilidad de obtener una media
mayor 0 igual que 5, 0 una media menor que 5? No solo es imposible que los dos
p(A Y B) = p(A)p(B) (10.9)
sucesos ocurran simultanearnente (son mutuamente excluyentes), sino que adem as no
es posible que se presente un resultado diferente a la media mayor 0 igual que 5 0 a la
media menor que 5. En el caso de sucesos mutua mente excluyentesy exhaustivos, se Puesto que hay siete numeros, la probabilidad de obtener cero en la primera
obtiene la sigiiiente formula: extraccion es p(A) = ~. La probabilidad de obtener cero en la segunda.extraccion es
tambien p(B) = i-. Asi,
p(A) + p(B) = 1.00. (10.5)
p(A YB) = (~)(~)
Al tratar con poblaciones dicotornicas, se acostumbra usar los simbolos P y Q
para representar, respectivamente, la probabilidad de la realizacion de un suceso y la
= i9 = 0.0204.
probabilidad de la no realizacion de un suceso. Asi, si lanzamos una moneda,
podemos representar por P a la probabilidad de que salga cara, y por Q a la En el ejemplo anterior, la realizacion de A no depende de la realizacion de B, y
probabilidad de que no salga cara (0 sea, que salga cruz). Estas consideraciones nos viceversa. En este caso, se dice que los sucesos son independientes. Solamente cuando
l1evan a tres formulaciones Miles: los sucesos son independientes es valida la regia de la multiplicacion expresada par la
formula (10.9). La razon de que los dos sucesos anteriares sean independientes, es que
P +Q= 1.00, (10.6) hemos efectuado un muestreo con reposicion. Recordemos que, despues de cada
extraccion, volvimos a introducir la tarjeta en el sombrero. Puesto que se mezclan las
P = 1.00 - Q, (10.7)
tarjetas despues de cada extraccion, el resultado de la primera extraccion no puede
Q = 1.00 - P, (l0.8) afectar al resultado de la segunda.
Antes de pasar al caso en que los sucesos no son independientes, veamos dos
las cuales se cumplen cuando los sucesos son mutuamente excluyentes y exhaustioos.
ejernplos mas.
184 ESTADfSTICA PARA LAS CIENCIAS SOCIALES PROBABILIDAD 185

Ejemplo 1. ~CU(i1 es la probabilidad de obtener cero en la primera extracci6n Dados dos sucesos A y B, la probabilidad de que ocurran conjuntamente ambos es
(suceso A) y 6 en la segunda extraccion (suceso r;? igual al producto de la probabilidad de que ocurra uno de ellos por la probabilidad
condicional de que ocurra el otro, dado que ocurri6 el primero.
p(A) = ~; p(B) = ~;
p(A y B) = H)(~) Expresado simbolicamente:
= ig = 0.0204.
p(A y B) = p(A)p(B I A) = p(B)p(A I B). (10.10)
Ejemplo 2. ~Cual es la probabilidad de obtener una media igual a 3 en dos
Los simbolos p(A I B) y p(B I A) reciben el nombre de probabilidades condicionales.
extracciones sucesivas de la poblacion de siete numeros? La respuesta a esta pregunta
El simbolo p(B I A) representa la probabilidad de B dado que ocurrio A. El terrnino
no es tan inmediata, porque hay varias formas diferentes de obtener una media igual
a 3. A continuacion se indican estos casos. probabilidad condicional tiene en cuenta la posibilidad de que la probabilidad de B
pueda depender 'de que el suceso A haya 0 no ocurrido, e inversamente para p(A I B).
[Nota: Cualquiera de los dos sucesos puede ser designado por A 0 B, pues los
PRIMERA SEGUNDA simbolos tan solo representan un lenguaje conveniente para la discusion, sin implicar
EXTRACCION EXTRACCION peA Y B) un orden en el tiempo de realizacion.]
Si efectuaramos un muestreo sin reposicion de la poblacion de siete rnimeros,
0 y 6 0.0204
1 y 5 0.0204
obtendriamos las medias que se indican en la tabla 10.2 para N = 2.
2 y 4 0.0204
3 y 3 0.0204 Tabla 10.2 Totalidad de resultados po­
PRIMERA EXTRACCION
4 y 2 0.0204 sibles que cabe obtener extrayendo mues­
5 y 1 0.0204 tras de N = 2, sin reposicion, de una
poblacion de siete numeros. z o 2 3 4 5 6
6 y 0 0.0204 a
U
u 0 0.5 1.0 1.5 2.0 2.5 3.0
~ 1 0.5 1.5 2.0 2.5 3.0 3.5
Se pregunta ahora, ~cual es la probabilidad de obtener 0 y 6 0 1 Y5, 02 y 4, etc.? S 2 1.0 1.5 2.5 3.0 3.5 4.0
Para responder a esta pregunta hemos de combinar las reglas de la multiplicacion y « 3 1.5 2.0 2.5 3.5 4.0 4.5
de la adicion: ~ 4 2.0 2.5 3.0 3.5 4.5 5.0
i5 5 2.5 3.0 3.5 4.0 4.5 5.5
p(X = 3) = p(O + 6) + p(l + 5) + p(2 + 4) + p(3 + 3) ~L3_.0 3.5 4.0 4.5 5.0 5.5
_
+ p(4 + 2) + p(5 + 1) + p(6 + 0) * Las rayas Que aparecen en los lugares de la diagonal indican Que estos
sucesos no pueden ocurrir cuando S8 hace un muestreo sin reposicion.
=rnrn+~rn+rnrn+rnrn+rnrn+rnrn+~~
= 419 + i9 + ig + ig + 4~ + ig + ig A partir de la tabla 10.2 es posible construir la distribucion de frecuencias y de
= 4
79
= 0.1429. probabilidades de las medias para muestras de tamafio N = 2 (ver tabla 10.3).
Notese que una media de 0 tiene asociada una probabilidad de O. Esto se debe al
Notese que est a respuesta concuerda con la probabilidad de obtener una media hecho de que al haberse obtenido 0 en la primera extraccion, no se puede obtener
igual a 3 que aparece en la tabla 10.1. nuevamente 0 en la segunda. En forma simbolica, p(B I A) = O. Asi, la probabilidad
de obtener una media de 0 es:
Caso del muestreo sin reposicion, Veamos la diferencia entre el muestreo con
reposicion y la tecnica conocida como muestreo sin reposicion, Imaginemos que p(X = 0) = p(A)p(B IA) = (~)(O) = O.
despues de extraer la primera tarjeta no la volvemos a colocar en el sombrero. Seria,
entonces, imposible obtener el mismo resultado en la segunda extraccion, Ciertamen­ Lo mismo se cumple respecto a la probabilidad de obtener una media de 6
te, seria imposible obtener una media igual a 6 0 una media igual a O. ~Por que? cuando se hacen extracciones sin reposicion de la poblacion de siete numeros. ~Por
AI hacer un muestreo sin reposicion, el resultado de la primera extraccion influye que?
en los resultados posibles de la segunda. En este caso, se dice que los sucesos son no i Hay un segundo hecho importante en el muestreo sin reposicion: despues de
independientes. haber obtenido un resultado en la primera extraccion, es mayor la probabilidad de
Para sucesos relacionados 0 no independientes, la regIa de la multiplicacion se cada uno de los resultados restantes que seran seleccionados en la segunda extrac­
convierte en: cion, En la poblacion de siete numeros, la probabilidad de que cualquier numero
186 ESTADfSTICA PARA LAS CIENCIAS SOCIALES PROBABILIDAD 187

X pIX) Tabla 10.3. Distribucion de frecuencias y de probabilidades de medias Notese que este valor concuerda con el que aparece en la tabla 10.3 para una media
correspondlent.e.s a muestras de tamafio N = 2, ext raid as sin reposicion igual a 1.0.
6 0 de una poblacion de siete numeros,
0.0000 Debe tenerse en cuenta que la diferencia entre el muestreo con y sin reposicion es
5.5 2 0.0476
5') despreciable cuando la poblacion es grande respecto al tamaiio de la muestra. Por
2 0.0476
4.5 4 0.0952
ejernplo, si se selecciona muestras de N = 2 de una poblacion constituida por un
4.0 4 0.0952 millon de ntimeros, la probabilidad de obtener el mismo mimero dos veces es 0 en el
3.5 6 0.1429 muestreo sin reposicion y 0.0000000000001 en el muestreo con reposicion. De hecho,
3.0 6 0.1429 en las encuestas de opinion publica se emplea el muestreo sin reposicion, pues no
2.5 6 0.1429 tiene sentido entrevistar dos veces ala misma persona, salvo cuando se trata de un
2.0 4 0.0952
1.5 4
seguimiento. Sin embargo, puede emplearse con seguridad un modelo basado en el
0.0952
1.0 2 0.0476 muestreo con reposicion por el gran ntimero de personas que usualmente constitu­
0.5 2 0.0416 yen la poblacion de interes,
0.0 0 0.0000

N x = 42 2::P{X} = 0.9999

10.5 Probabilidad y variables continuas


dado sea sel~ccionado en la primera extraccion es igual a t. Sin embargo, despues de
hab~r obtenido este numero, la probabilidad de que en la segunda extraccion sea Hasta aqui se ha considerado la probabilidad en funcion de la frecuencia relativa
elegido alguno de los numeros restantes es igual a -!J. esperada de un suceso. De hecho, como se recordara, se definio la probabilidad en
Veamo~ dos ej~~~los en que se usa la regIa de la multiplicacion al hacer un funcion de la frecuencia y se la expreso en la forma [formula (10.1)]:
muestreo Sill reposicion en la poblacion de siete numeros,

Ejemplo 1. i,Cmil es la probabilidad de obtener sucesivamente los valores 0 y 2? Numero de resultados favorables al suceso A
p(A) = ,
Llarnemos suceso A a la obtencion de 0 y suceso B a la obtencion de 2. Numero total de resultados

p(A) = t, Sin embargo, esta definicion presenta una dificultad cuando se trata de variables
p(B) = p(BI A) =-!J, continuas. Como se indico en la seccion 3.7.1, es generalmente aconsejable represen­
p(A y B) = (t)(-!J) = i2 = 0.0238. tar la frecuencia en funcion de areas situadas bajo una curva cuando se manejan
variables continuas. Asi, si esto ocurre, podemos expresar la probabilidad en la
Ejemplo 2. i,Cual es la probabilidad de obtener una media igual a 1.0? forma:
P~~~ responder a est a pregunta, combinamos las reglas de la multiplicacion y de Area bajo una parte de la curva
la a~lcl.on. Hay tres combinaciones posibles de numeros que pueden producir una p= (10.11)
media igual a 1.0, que son las que se indican a continuacion: Area total bajo la curva

Puesto que el area total en una distribucion de probabilidades es igual a 1.00,


PRIMERA SEGUNDA
EXTRACCION EXTRACCION definimos p como la fraccion del area total situada bajo una parte de la curva.
pIA y B)
En los capitulos 11 a 15 se emplea como modelo probabilistico la curva normal
a y 2 (+l W = 0.0238 estandar, Examinemos la relacion probabilidad-area en relacion con este modelo.
2 y a (+){t) = 0.0238
1 y 1 (t}(O) = 0.0000

Asi,
10.6 La probabilidad y el modelo de la curva normal
p(X) = p(O y 2) + p(2 y 0) + p(1 y 1)
En la seccion 7.3 establecimos que la distribucion normal estandar tiene f.l igual a 0, (J
= (Wi) + (t)(-!J) + @(O) igual a 1 y un area total igual a 1.00. Vimos que al transformar en valores z las
= 4~ + 4
12
+ 0 = l2 = 0.0476. calificaciones de una variable normalmente distribuida estamos, de hecho, expresan­
PROBABILlDAD 189
188 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

do estas calificaciones en unidades de la curva normal estandar. Esto perrnite EI valor z correspondiente a X = 92 es
expresar la diferencia entre dos calificaciones cualesquiera como fracciones del area
__ 92 - 100 = -0.50.
total bajo la curva. Asi, cabe establecer valores probabilisticos en funcion de estas - - 16
razones, como en la formula (10.11).
Veamos varios ejemplos que ilustran la aplicacion de los conceptos de probabili­ . , de area a la izquierda de - = -0.50 es 0.3085. Por tanto. la
La fraccion -.. d I 92 es
dad al modelo de la curva normal. probabilidad de elegir al azar una persona con una calificacion e por 0 menos

p = 1.00 - 0.3085 = 0.6915.


10.6.1 Problemas ilustrativos*
La fig. 10.2 ilustra esta relncion.
Para todos estos problemas supondremos que f1 = 100 y (J = 16.
Problema 1. i,Cual es la probabilidad de elegir al azar, de la poblacion general, una
persona con CI de por 10 menos 132? La respuesta a est a pregunta esta dada por la
fraccion de area bajo la curva a la derecha de 132 (fig. 10.1).

I AREA A LA DERECHA DE
UNA CALIFICACION

DE 132
Fig.l0.2 Fraccion de area a la dere­

cha (P) y a la izquierda (Q) de una

calificacion de 92 en una distribucion

normal con I' = 100 Y G = 16.

Fig. 10.1 Fraccion de area ala dere­ P oblema 3. Veamos un ejemplo en el cual se aplica la ley de l~ .multiplicacion.

cha de una calificacion de 132 en una Dado que se emplea un muestreo con reposicion, i,cual es la probabilidad de escoger

distribucion normal con J1 = 100 Y . al azar tres personas con CI igual 0 superior a 124? Para este problema suponemos

100 132 11 = 16.


nuevamente que f1 = 100 y (J = 16,

EI valor z correspondiente a X = 124 es

Primero debemos hallar el valor z correspondiente a X = 132.


z = 124 - 100 = 1.5.
Z = 132 - 100 = 200 16
16 ..
En la columna (C), tabla A, hallamos que 0.0668 del area esta a la derecha de
En la columna (C) de la tabla A, apendice III, hallamos que 0.0228 del area est a a la X = 124. Por tanto,

derecha de una z de 2.00. Par tanto, la probabilidad de elegir al azar una persona con p(A, B, C) = (0.0668)3 = 0.0003.

una calificacion de por 10 menos 132 es de 0.0228.


Problema 2. i,Cual es la probabilidad de elegir al azar una persona con CI de por
10 menos 92?
Estamos en el caso de dos areas bajo la curva que son mutuamente excluyentes y 10.7 Valores de p uni y bilaterales
exhaustivas. EI area a la derecha de 92 es P y el area a la izquierda de 92 es Q. AI
resolver el problema debemos, por tanto, emplear la formula (10.7): En el problema 1 se busco la probabilidad de e1egir al azar una persona con CI de
por 10 menos 132. Se resolvio el problema examinando sol~mente uno de los I~dos ?e
P = 1.00 - Q.
la distribuci6n, 0 sea, el de las calificaciones igua~es 0 super~ores a 132. Por esta r'~~~e~
nos referimos al valor probabilistico que obtuvimos Hamandolo un valor p um
Expresando la calificaci6n de 92 en terrninos de su correspondiente z, podernos
obtener la fraccion de area a la izquierda de X = 92 (que es Q) directamente de la ral 0 de una cola. . ., . I enudo las
Tanto en la estadistica como en la investigacion, se formu an muy a m .
columna (C), tabla A. siguientes preguntas: «i,Cmi! es la probabilidad de una calificacion (0 un estadigrafo)
• Ver seccion 7.4.
que se desvie tanto de la media... 0 una calificacion (0 estadigrafo) tan rara como... a
190 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
PROBABILIDAD 191

u.n resultado .tan P?CO frecuentel», Esta claro que cuando la distribuci6n de frecuen­
Ejemplo 1. "Cual es la probabilidad de obtener una media tan pequefia como 0.5
eras de las cal~ficacIOnes es simetrica, una calificaci6n de 68 0 menor esta tan desviada
(0 sea, una media igual a 0.5 0 menor)?
de. una. media d.e 100 como. 10 esta una calificacion de 132. Esto es, am bas
Hallamos la probabilidad de obtener una media de 0.5 y una media de 0.0 (que es
calificaciones estan ados unidades de desviaci6n estandar respecto a la di
C d I . me ra. la unica media inferior a 0.5), y sumamos estas probabilidades para obtener el valor p
.ua~ 0 ~~presamos e. valor de la probabilidad teniendo en cuenta las dos colas de la
distribucion, n~s refenmos al valor p como bilateral. En las distribuciones sirnetricas,
unilateral:
los. valores p .bllaterales se pueden obtener simplemente duplicando el valor del p(X :::; 0.5) = p(X = 0.5) + p(X = 0.0)
unilateral, A.SI, en.:1 problema anterior, la probabilidad de seleccionar a una person~ = 0.0408 + 0.0204 = 0.0612.
con una calificacion tan rara 0 poco usual Como 132 es 2 x 0.0228 = 0.0456.
A~lararemos la diferencia entre los valores p uni y bilaterales reliriendonos al Ejemplo 2. "Cual es la probabilidad de obtener una medi~ tan desviada (0 mas)
respecto a la media de la distribuci6n como 10 es una media muestral de 0.5?
expe~lmento muestral que hemos venido usando en el texto. La figura 10.3 representa
U? histograrna de probabili~ades basado en la tabla 10.1. Recordemos que esta
La respuesta a esta pregunta requiere eI usa de un valor p bilateral obtenido pOI'
dlstn~ucIOn se obtuvo seleCCIO?ando c?n reposici6n todas las muestras posibles de aplicaci6n de la regIa de la adici6n:
tamano N = 2 de una poblacion de siete nurneros.
p(X = 0.0) + p(X = 0.5) + p(X = 5.5) + p(X = 6.0).
0. 15 r-- - - - - - - - - - _ "ii""1'L;;q --,
Sin embargo, puesto que la distribuci6n es simetrica y las medias con valores de 5.5 y
6.0 estan igualmente desviadas que las medias con valores de 0.5 y 0.0, respectiva­
mente, necesitamos solamente duplicar eI valor de p obtenido en el ejemplo 1:

~ 0.10 p(X :::; 0.5) + p(X ;:, 5.5) = 2(0.0612)


o
::::; = 0.1224.
lXl
«
lXl
o La distinci6n entre los valores de probabilidad uni y bilaterales tendra mayor
a:
a. 0.05
importancia cuando avancemos en el estudio de la estadistica inferencial.

Resumen del capitulo


0.00
4.5 5.0 5.5 6.0
En este capitulo centramos nuestra atenci6n en cinco puntos:
Fig. 10.3 Histograma. probabilistico de las medias basad as en muestras de tamafio 'N = 2
1. Importancia del concepto de aleatoriedad en la inferencia estadistica. La aleato­
obtenidas con reposicron, de una poblacion de siete nurneros, '

. riedad se refiere ala selecci6n de los elementos de la muestra de modo que todos ellos
tengan la misma probabilidad de ser elegidos en una muestra de tamafio dado. El
Si. pr:guntamos,. «"cual es la probabilidad de obtener una media igual a cero?», muestreo independiente se refiere al hecho de que la selecci6n de un elemento no
necesltanamos refenrnos solamente a la cola izquierda del histograma de probabili­ afecta a Ia selecci6n de otro. Aunque no es posible predecir un suceso cuando se
dades para e?~ontrar que la respuesta es 0.0204. Sin embargo, si preguntamos, «"cual considera aisladamente, las colecciones de sucesos aleatorios adquieren caracteristi­
~s la probabilidad de obtener un resultado tan desviado Como una media muestral cas y formas predecibles. Se mencionaron, al respecto, la distribuci6n binomial y la
igual a cero?», tendriamos qu~ observar ambas colas, la de la derecha y la de la curva normal.
IzqUIer~a. ~ue~t.o que una media de 6 esta igualmente desviada respecto a la media 2. Teoria de la probabilidad, que se relaciona con los resultados de los experimentos.
de la distribucion, usarnos la regIa de la adici6n para obtener el valor bilateral: Aprendimos a distinguir entre las probabilidades establecidas porIa admisi6n de
frecuencias relativas idealizadas, y aquellas otras establecidas empiricamente poria
pIX = 00 .Y = 6) = pIX = 0) + p(X = 6) determinaci6n de frecuencias relativas. La probabilidad se defini6 como
= 0.0204 + 0.0204 = 0.0408.
Numero de resultados favorables a un suceso
Veamos dos ejemplos mas.
p= Numero total de resultados
192 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
PROBABILIDAD 193

3. Propiedades formales de la probabilidad.


a) Las probabilidades varian entre 0 y 1.00. V· la forma de emplear los valores z y la curva normal estandar para calcular
1mos . ibuid
varias probabilidades referentes a variables normalmente distri U1 as.
b) RegIa de la adicion:
Forma de distinguir entre los valores de probabilidad uni y bilaterales.
Si A y B son dos sucesos, la probabilidad de que'ocurra cualquiera de ellos es
igual a la probabilidad de A mas la probabilidad de B menos la probabilidad
de su realizacion conjunta. Asi,

peA 0 B) = peA) + pCB) - peA y B). Terminos para recordar


Si los sucesos A y B son mutuamente excluyentes, la regIa de la adicion se
convierte en distribucion muestral probabilidad condicional
exhaustivos realizacion conjunta
peA 0 B) = peA) + PCB).
independencia sesgo
Si los dos sucesos son mutuamente excluyentes y exhaustivos, se obtiene muestreo aleatorio valores de p bilaterales
peA) + pCB) = 1.00. mutuamente excluyentes valores de p unilaterales
Representando por P la probabilidad de la realizacion y por Q la probabili­ probabilidad
dad de la no realizacion, hallamos tres formulaciones adicionales que
resultan utiles en el caso de dos sucesos mutuamente excluyentes y exhaus­
tivos:

P +Q= 1.00, P = 1.00 - Q, Q = 1.00 - P.

c) RegIa de la multiplicacion:

Cuando los sucesos son independientes. En el caso del muestreo con reposi­ *1/ Se tiene una poblacion formada por los mimeros 0, 3,.6 y 9. .
cion, la seleccion de un elemento es independiente de la seleccion de otro. 7 a) Construir una distribucion de probabilidades y un.~~togram~ para todas las medias
Dados dos sucesos A y B, la probabilidad de su realizacion simultanea 0 posibles, cuando se efectua un muestreo con repostcion, N = _. . . .
b) Construir un histograma de probabilidades para todas las medias posibles, cuando
sucesiva es igual al producto de la probabilidad de que ocurra uno de ellos
se efecttia un muestreo con reposicion, N = 3. [Sugerencia: La tabla para hallar las
por la probabilidad de que ocurra el otro, 0 sea, medias es la que aparece a continuacion, Los valores dentro de las celdas representan
las medias de las tres extracciones.]
peA y B) = p(A)p(B).

Cuando los sucesos no son independientes. En el caso del muestreo sin PRIMERA
0 3 6 9
reposicion, la seleccion de un elemento afecta a la probabilidad de la se­ EXTRACCION
leccion de los elementos sucesivos. Asi, dados dos sucesos (A y B), la SEGUNDA 0 3 6 9 0 3 6 9
0 3 6 9 3 6 9 0
EXTRACCION
probabilidad de que ocurran A y B conjunta 0 sucesivamente es igual z
al producto de la probabilidad de que ocurra cualquiera de estos sucesos par <Q 0 0 1 2 3 1 2 3 4 2 3 4 5 3 4 5 6
a:u 1 2 3 4 2" 3 4 5 3 4 5 6 4 5 6 7
la probabilidad condicional de que ocurra el otro, supuesto que ocurrio Wu 3
u<
a: a: 6 2 3 4 5 3 4 5 6 4 5 6 7 5 6 7 8
el primero. SimbOlicamente, w~
~x 9 3 4 5 6 4 5 6 7 5 6 7 8 6 7 8 9
W
peA y B) = p(A)p(B IA) = p(B)p(A IB).

4. Aplicacion de la teoria de la probabilidad a las variables continuas. La probabili­ t2. La poblacion original de los cuatro mimeros del ejercicio 1 fue rec~~ngular (todos tenian
dad se expresa en terminos de la fraccion de area situada bajo una curva. Asi, Una frecuencia asociada de 1). Comparar las distribuciones de .prob~~Ihdad enco~tra~~s en
l(a) y l(b), e intentar una generalizacion acerca de la forma y la dispersion de la distribucion de
Area bajo una parte de la curva as medias muestrales cuando aumentamos el tamafio de la muestra.
p=
Area total bajo la curva : Responder a las siguientes preguntas basadas en los histogramas de probabilidades
btenidos en el ejercicio 1.
194 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
PROBABILIDAD 195

a) Si se extrae una muestra de N = 2, locUli) es la probabilidad de obtener una media g) una diferencia entre medias tan rara 0 infrecuente c~mo - 3?
igual a cero? Comparar este resultado con la probabilidad de obtener aleatoriamente h) una diferencia entre medias igual 0 rnenor que 2, 0 igual 0 mayor que - 2?
una media igual a cero cuando N = 3.
b) Para cada una de las distribuciones, determinar la probabilidad de obtener una 8. Confeccionar una lista de todos los resultados posibles al lanzar una moneda tres veces.
muestra con una media tan rara 0 infrecuente como 9. Calcular la probabilidad de obtener
c) En cada uno de los histogramas de probabilidades, determinar la probabilidad de a) 3 caras b) 3 cruces

obtener una muestra con una media menor 0 igual que 3.


c) 2 caras y una cruz d) 2 caras por 10 menos
d) En cada uno de los histogramas de probabilidades, determinar la probabilidad de ,,: Se extrae al azar una carta de una
baraja compuesta por 52 naipes. loCual es la
obtener una media muestral tan desviada de la media poblacional como 10 es una
probabilidad de obtener
media de 3.
a) el as de espadas? b) un as?

*4. Para la distribucion de probabilidades correspondiente a N = 2 [ejercicio l(a)], hallar c) un as 0 una figura d) una espada o una figura?

a) p(X < 6), b) p(X ~ 7.5), c) p(X = 4.5).


10. Expresar las probabilidades obtenidas en los ejercicios 8 y 9 en terminos de probabilida­
*.5/.
I-
Para Ia d'l~tri b ucion de probabilidades correspondiente a N = 3 [ejercicio l(b)], hallar
des en contra.
a) p(3 ~ X ~ 6), b) p(4 ~ X ~ 5), c) pIX = 2 0 X = 8). . En un lanzamiento de dos dados, locual es la probabilidad de obtener

a) un 7?

*6. Imaginemos un tipo diferente de experimento muestral. Se han seleccionado todas las
b) dos mimeros iguales?
muestras posibles de N = 2 a partir de una poblacion de numeros encontrandose las si­
c) dos numeros iguales 0 un 8?
guientes medias: 1, 2, 2, 3, 3, 3, 4, 4, 5. Se escribe ahora cada una de estas medias en una
d) un numero par?
pequefia tarjeta y se colocan las tarjetas en un sombrero. Se extrae una tarjeta, se anota el re­
sultado y se vuelve a introducir en el sombrero. Se extrae una segunda tarjeta, se resta el 12. En una maquina tragaperras hay tres rued as en cad a una de las cuales estan dibujadas
mimero correspondiente del numero anterior y se repone la tarjeta. En la tabla que aparece a cinco frutas diferentes y una estrella. Despues de colocar una moneda y pulsar la palanca, las
continuacion se describen todas las posibles diferencias entre las medias, cuando N = 2. tres ruedas giran independientemente varias veces antes de detenerse. loCUlil es la probabilidad
. de que
a) aparezcan tres Iimones?
PRIMERA MEDIA OBTENIDA
b) aparezcan tres figuras iguales?
2 2 3 3 3 4 4 5 c) aparezcan dos Iimones y una estrella?
-c
a 1 a 1 1 2 d) aparezcan dos Iimones y cualquier otra fruta?
z 2 2 3 3 4
UJ
2 -1 a a 1 1 1
e) no aparezca ninguna estrella?
l-
ID
2 2 3
0 2 -1 a a 1 1 1 2 2 3 13. Se extraen al azar (sin reposicion) tres cartas de una baraja de 52 naipes. loCUlil es la
< 3 -2 -1 -1 a a a 1 1
is 2 probabilidad de que
UJ 3 -2 -1 -1 a a a 1 1
:;E 2 a) las tres sean corazones?
3 -2 -1 -1 a a a 1
< 1 2 b) ninguna de las tres cartas sea corazon?
a 4 -3 -2 -2 -1 -1 a
z -1 a 1 c) las tres sean figuras?
4 -3 -2 -2 -1 -1 a
:;)
(ll
-1 a 1
5 -4 -3 -3 -2 -2 -2 Calcular las probabilidades indicadas en el ejercicio 13 si las extracciones se hacen con
UJ
en -1 -1 a
reposici6n.
a) Construir una distribucion de frecuencias de las diferencias entre medias. 15. Las calificaciones obtenidas en una conocida prueba de inteligencia se distribuyen
b) Construir una distribucion de probabilidades de las diferencias entre medias. norrnalmente con una media de 100 y con una desviaci6n tipica de 16.

c) Hallar la media y la desviacion estandar de las diferencias entre medias.


a) loCUlil es la probabilidad de que una persona escogida al azar tenga un CI de 1220
J'l. Basandose en las respuestas al ejercicio 6, responder a las siguientes' preguntas. Si se
mas?
b) Hay cocientes de inteligencia tan altos que se presentan en una muestra aleatoria de
extraen dos muestras al azar y con reposicion de la poblacion de medias y se resta la segunda
personas solamente con una probabilidad de 0.05. loA que valor son superiores esos
media de la primera, locual es la probabilidad de encontrar .
CI?
a) una diferencia entre medias igual a cero?
c) Hay cocientes de inteligencia de valor tan extrema (muy altos 0 muy bajo~). que se
b) una diferencia entre medias igual 0 menor que 10 igual 0 mayor que -I? [Nota: -2,
presentan en una muestra aleatoria de personas solamente con una probabilidad de
- 3, - 4 son menores que -1.]
0.05. loA que valores son superiores 0 inferiores esos CI?
c) una diferencia entre medias igual a - 4?
d) La pr6xima vez que vaya de compras encontrara indudablemente a alguien compl~­
d) una diferencia entre medias tan rara 0 tan desviada Como -4?
tamente extrafio para usted. loCual es la probabilidad de que su CI este cornprendi­
e) una diferencia entre medias igual 0 mayor que 3?
do entre 90 y lID?
f) una diferencia entre medias igual 0 menor que - 3?
e) loCuM es la probabilidad de seleccionar al azar dos personas:
196 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
PROBABILIDAD 197

i) con cocientes de inteligencia de 122 0 mas? 23. Si se hacen extracciones con reposicion de la bolsa descrita en el ejercicio 21, l.cual es la
ii) con cocientes de inteligencia entre 90 y 11O? probabilidad de que:
iii) una con CI de 122 0 mas, y la otra con CI entre 90 y 1107 a) de tres bolas seleccionadas las tres sean azules?
f) l.Cual es la probabilidad de que, al salir de la clase, el primer estudiante que b) de dos bolas seleccionadas las dos sean verdes?

encuentre tenga un CI inferior a 120? l.Puede responder a esta pregunta basandose c) de cuatro bolas seleccionadas ninguna sea roja?

en la informacion proporcionada anteriormente? En caso negativo, l.por que no? 24. El 40 % de los estudiantes de cierta universidad cursan adrninistracion de emp:esas. EI
16. l.Cual de las siguientes tecnicas de seleccion dara lugar a muestras aleatorias? Explique 70 %de ellos son hombres y el 30 % mujeres. El 70 % de los estudiantes de la universidad son
las respuestas. varones. l.Cual es la probabilidad de que:
a) Poblacion: espectadores de un programa de television dado. Tecnica de muestreo: en a) un estudiante elegido al azar curse ad~inistracion de em~r~sas? ,
una noche determinada, entrevistar a una de cada cinco personas asistentes al b) una persona elegida al azar sea una mujer que curse administracion de empresas?
auditorio. c) dos estudiantes elegidos al azar cursen administracion de empresas?
b) Poblacion: un pastel hecho en casa. T'ecnica de muestreo: una porcion en forma de d) dos personas elegidas al azar sean estudiantes de administracion de empresas y sean
cufia cortada en cualquier parte del pastel. de distinto sexo?
c) Poblacion: todos los nifios de una escuela primaria. Tecnica de muestreo: cada uno de 25. 'Cu~il es la probabilidad de que una calificacion tomada al azar de una poblacion
los profesores a cargo de una seccion escoge un alumno para que integre la muestra.: norrnalmente distribuida con una media de 66 y una desviacion estandar de 8 sea:
17. En un estudio para determinar la agudeza visual, se presentan al sujeto cuatro matices de a) mayor que 707
un color que varian ligeramente en su brillo. l.Cual es la probabilidad de que la persona, por b) menor que 60?
simple azar, coloque los matices en orden de mayor a menor brillo? c) comprendida entre 60 y 70?
18. En cierta ciudad, la proporcion de personas con sangre de tipo A es de 0.20. l.Cual es d) alrededor de 70?
e) igual 0 menor que 54 0 igual 0 mayor que 72?

la probabilidad de que:
f) menor que 52 0 comprendido entre 78 y 84?

a) una persona dada, seleccionada al azar, tenga sangre de tipo A?


b) si se seleccionan dos personas, las dos tengan sangre de tipo A? g) entre 56 y 64 0 entre 80 y 86?

c) una persona dada no tenga sangre de tipo A? l.Que se entiende por muestreo aleatorio?
d) si se seleccionan dos personas, no tengan las dos sangre de tipo A?
19. En un proceso de fabricacion, la proporcion de articulos defectuosos es de 0.10. i,Cual es
la probabilidad de que:
a) en una muestra de cuatro articulos ninguno sea defectuoso?
b) en una muestra de cuatro articulos todos sean defectuosos?
c) uno 0 mas, pero no los cuatro, sean defectuosos?
20. En la Iabricacion de tornillos para la industria espacial, se producen diariamente miliones
de tornillos con una medida de 0.010 em. La desviacion estandar es de 0.001. Se considera que
un tornillo es defectuoso si su diferencia respecto a 0.010 es de 0.002 0 mas. Admitiendo
normalidad, i,cual es la probabilidad de que:
a) un tornillo seleccionado al azar sea defectuoso?

b) de dos tornillos seleccionados los dos sean defectuosos?

c) un tornillo seleccionado al azar no sea defectuoso?

d) de dos tornillos seleccionados ninguno sea defectuoso?

e) un tornillo seleccionado al azar sea demasiado largo?

f) de dos tornillos seleccionados los dos sean demasiado cortos?

21. Una bolsa contiene 6 bolas azules, 4 bolas rojas y 2 bolas verdes, Si se extrae al azar una
bola de la bolsa, i,cual es la probabilidad de que sea:
a) roja? b) azul? c) verde? d) blanca?
22. Si se efectuan extracciones sin reposicion de la bolsa descrita en el ejercicio 21, i,cual es la
probabilidad de que:
a) de tres bolas seleccionadas las tres sean azules?
b) de dos bolas seleccionadas las dos sean verdes?
c) de cuatro bolas seleccionadas ninguna sea roja?
[198J
INTRODUCCION A LA INFERENCIA ESTADfSTICA 199

Introducci6n

11
a la inferencia estadistica *
existe. Intentamos hallar algo referente a las caracteristicas de esa poblaci6n como
si existiese. Por ejemplo, cuando administramos cierta medicina a un grupo de
sujetos (la muestra), deseamos generalizar nuestros resultados a todos los que po­
tencialmente podrian recibir dicha medicina. Esta poblacion es, I!aturalmente, hipo­
tetica,
Puesto que rara vez se puede estudiar exhautivamente a las poblaciones, depen­
demos necesariamente de las muestras para llegar a una hip6tesis referente a di­
versas caracteristicas 0 parametres de la poblaci6n. N6tese que nuestro in teres
no es el de describir los estadigrafos per se, sino el de hacer inferencias a partir
de los datos. Asi, si preguntamos a 100 personas c6mo piensan votar en la
pr6xima eleoeion, nuestro interes primario no es el de conocer la forma en que
votaran estas 100 personas, sino hacer una estimaci6n de la forma en que llenaran
11.1 zPor que se toman muestras? las papeletas de sufragio todos los integrantes de la poblaci6n de electores.
Casi toda investigaci6n conlleva la observaci6n y medida de un numero limitado
de individuos 0 de sucesos. Se supone que estas medidas nos diran algo acerca
Un lider de un qrupo reliqioso, con objeto de planificar la captaci6n de nuevos
de la poblaci6n. Para comprender la forma en que podemos hacer inferencias
miernbros.idesea conocer la proporci6n de adultos en su pais cuyo deseo de perte­
ace rca de una poblaci6n a partir de una muestra, es necesario introducir el con­
necer a una Iglesia es manifiesto. i,C6mo podria obtener esta informaci6n?
cepto de distribuci6n muestral.
A un psicoloqo que hace investigaciones con ratas, Ie in teresa saber la relaci6n que
existeentre la fuerza de la motivaci6n y el aprendizaje. Especificamente, i,cuales
son los efectos de la duraci6n del hambre sobre el nurnero de intentos requeridos
para que una rata aprenda a conocer un laberinto? Concepto de distribuciones muestrales
Se trata de un socioloqo que desea estudiar las diferencias entre la educaci6n dada
En la practica, las inferencias ace rca de los parametres de una poblaci6n se hacen
por los padres a los nifios delincuentes y a los que no 10 son.
basandose en estadigrafos que se calculan mediante una muestra de N observa­
Un inoestiqador de mercados desea conocer la proporci6n de personas que pre­ ciones tomadas al azar en esta poblaci6n. Si continuaramos tomando muestras de
fieren ciertos colores de autom6viles y sus diversas combinaciones. tamafio N de esta poblaci6n, no deberia sorprendernos encontrar algunas diferen­
cias entre los valores de los estadigrafos muestrales obtenidos. Seria extremada­
El encarqado de una pistade patinaje, trata de determinar si la capa de hielo es mente raro que encontraramos siempre el mismo conjunto de observaciones. En
suficientemente gruesa para que la gente pueda patinar sin peligro. una ocasi6n podriamos obtener por azar un conjunto de observaciones en que la
Un juqador desea determinar si un juego de dados esta «manipulado», mayo ria de los datos fueran altos. En otra ocasi6n cabria obtener una mayoria
de datos bajos. Y todavia en una tercera ocasi6n podriamos obtener una buena
i,Que tienen todos estos problemas en cornun? Un encuestador esta haciendo mezcla de datos altos y bajos. Ciertamente, es este examen el que nos lleva al con­
preguntas referentes al pararnetro de una poblaci6n, a la cual desea generalizar cepto de distribucion muestral.
sus respuestas, pero no tiene ninguna posibilidad de estudiar la totalidad de la
Una distribucion muestral es aquella distribucion teorica de probabilidades de los
poblaci6n. Anteriormente (seccion 1.2)* definimos una poblacion como un conjunto
valores posibles de alqun estadigrafo muestral que ocurriria si obtuoieramos todas
completo, real 0 te6rico, de individuos, objetos 0 medidas que tienen alguna carac­
las muestras posibles, de un tamaiio fijo, de una poblacion dada.
teristica comun observable. Generalmente es imposible estudiar a todos los miern­
bros de una poblaci6n dada porque la poblaci6n, tal como se la ha definido, tiene Hay una distribuci6n muestral para cada estadigrafo tal como la media, la
un numero infinito de elementos 0 es tan grande que imposibilita un estudio desviaci6n estandar, la varianza, la proporci6n, la mediana, etc. Se trata de uno
exhaustivo. Mas aun, cuando hablamos de «la poblacion», nos referimos a menudo a e los conceptos mas importantes de la estadistica inferencial EI lector esta ya
una entidad hipotetica, En el caso experimental tipico, la poblaci6n real no familiarizado con varias distribucionesmuestrales, aunque anteriormente no les
imos este nombre. Recordemos los diversos problemas muestrales que hemos pre­
• Es conveniente estudiar de nuevo la seccion 1.2 a fin de revisar varias definiciones que apareceran en este ~entado en los anteriores capitulos. En uno de los ejemplos, partimos de una po­
capitulo.
blaci6n de siete numeros y seleccionamos sin reposici6n muestras de N = 2. Ob­
200 ESTADISTICA PARA LAS CIENCIAS SOCIALES INTRODUCCI6N A LA INFERENCIA ESTADISTICA 201

tuvimos todas las combinaciones posibles de estos numeros tomados dos a la vez,
Recuadro 11.1 y luego hallamos la media para cada una de estas muestras. En seguida cons­
truirnos una distribucion de frecuencias y la distribucion de probabilidades de las
Se tiende a pensar que el muestreo es una actividad propia solamente de un pufiado
de profesionales: encuestadores, cientificos de laboratorio, demografos, por citar unos medias correspondientes a las muestras de tamaiio N = 2 provenientes de esa
cuantos. Tal como se demuestra en el siguiente fragmento de Winning with Statistics, poblacion.
el muestreo y la toma de decisiones se hallan entre las actividades mas generalizadas Recordemos tambien que en el ejercicio 1, al final del capitulo 10, construimos
de los organismos vivos. distribuciones muestrales basadas en la extraccion, con reposicion, de todas las
muestras posibles de N = 2 YN = 3 de una poblacion de cuatro mimeros (0, 3, 6, 9).
La tabla 11.1 muestra estas dos distribuciones muestrales y ademas la distribucion
muestral de la media cuando N = 4.

Tabla 11.1 Distribuciones muestrales correspondientes a medias de


muestras de JIi= 2,N, ;" 3YN = 4 tomadasdeuna poblaci6nde cuatro
numeros (0, 3, 6, 9; ~ = 4.5, G = 3.94).
£1 muestreo es una cuestion de supervivencia
N=2 N=3 N= 4
Tenemos tres perros en nuestro rancho en las afueras de Tucson, Arizona. El mas
pequefio de los tres, Millie Muffin, es una perrita de aguas, blanquinegra, de ocho X p(X) X p(X) X p(X)
meses de edad. Aunque muy traviesa, resulta total mente encantadora. Siempre esta ex­
plorando la flora y la fauna del desierto con la infatigable curiosidad de un nino de 9.0 0.0625 9.0 0.0156 9.0 0.0039
tres afios, Cuando nota que algo se mueve y se ha posado sobre su cuerpo (como 7.5 0.1250 8.0 0.0469 8.25 0.0156
una araiia gigante, mejor conocida como tarantula), se pone a dar saltos de algo asi 6.0 0.1875 7.0 0.0938 7.50 0.0391
como sesenta centimetros, con las orejas y el pelaje en movimiento, y retrocede algunos 4.5 ­ 0.2500 6.0 0.1562 6.75 0.0781
3.0 0.1875 5.0 0.1875 6.00 0.1211
pasos ladrando como un fiero Doberman. Pero yo la conozco muy bien. En realidad,
1.5 0.1250 4.0 0.1875 5.25 0.1562
es la mas cobarde del mundo. Les contare como 10 se.
0.0 0.0625 3.0 0.1562 4.50 0.1719
Cuando revolotea alrededor de la gigante pitahaya, del ocotillo, de la cholla y de 2.0 0.0938 3.75 0.1562
otras varias exoticas plantas del desierto, me deslizo cautelosamente tras de ella. Luego 1.0 0.0469 3.00 0.1211
me alzo sobre las puntas de los pies, extiendo los brazos hacia adelante y avanzo hacia 0.0 0.0156 2.25 0.0781
ella arrastrando los pies en mi mejor estilo de monstruo Frankenstein. Cuando se da 1.50 0.0391
cuenta de mi presencia ianza un «yip» de sorpresa, da un saIto e inicia una retirada .75 0.0156
0.00 0.0039
. acompaiiada de ladridos. Pero, mientras tanto, su nariz esta probando el aire en un
olfato constante, tomando muestras en forma desesperada para hacer inferencias acerca
de la naturaleza del intruso. Al observar la actitud de Millie, me puse a pensar que X= 4.5 X= 4.5 X= 4.5
estas acciones de tomar muestras y hacer inferencias estan muy generalizadas entre s:< = 2.37 = 1.94
s:< s:< = 1.68
los mamiferos. Nuestro perro favorito, el gato de fa casa, el leon en la selva, el gorila
en el humedo bosque y el esposo, esposa, hijo, hija, hombre de negocios, doctor,
abogado y jefe indio tienen esta caracteristica en comun, Estan probando continua­ l,Por que es tan importante el concepto de distribucion muestral? La res­
mente diversos aspectos del medio ambiente, contrapesando los riesgos y las ganancias, puesta es sencilla. Una vez que ha resultado posible describir la distribucion
haciendo juicios acerca de los rumbos alternativos del comportamiento, y siguiendo muestral de cualquier estadigrafo (media, desviacion estandar, proporcion), se esta
las lineas de accion que parecen mas adecuadas para lograr los objetivos deseados. en condiciones de considerar y examinar diversas hipotesis. Por ejemplo, se ex­
Con 10 dicho no pretendo afirmar que toda esta labor de muestreo y de evaluacion trae al azar una muestra de cuatro mimeros de una cierta poblacion y se ob­
probabilistica sea consciente y deliberada. Los cierto es que la naturaleza nos ha dise­ tiene una media de 6.00. Cabe entonces preguntar: «l,Constituye esta media un
fiado a todos como finisimas maquinas probabilisticas. Sin la habilidad para obtener
suceso ordinario 0 un suceso raro?». Si no se dispone de un marco de referencia,
muestras y luego hacer una apreciacion del peligro, de la disponibilidad de alimentos,
o de la receptividad sexual de la pareja, todas las especies que actualmente habitan la pregunta carece de sentido. Sin embargo, si se conoce la distribucion muestral
la tierra jamas habrian existido. de este estadigrafo, se tendra el marco de referencia necesario y sera posible
obtener una respuesta inmediata. Sabiendo que la distribucion muestral apropiada
Tornado de Winning with Statistics, R. P. Runyon: Addison-Wesley Pub. Co., Reading Mass., 1977. es la de la tabla 11.1 cuando N = 4, no habria dificultad para responder a la
pregunta. Una media de 6.00 se obtendra aproximadamente el 12 % de las veces
202 ESTADfSTICA PARA LAS CIENCIAS SOCIALES INTROOUCCION A LA INFERENCIA ESTAofsTICA 203

(p = 0.1211); y una media mayor 0 igual que 6.00 ocurrira casi el 26 % de las Volviendo al problema de la moneda, vemos c1aramente que para determinar
veces (p = 0.1211 + 0.0781 + 0.0391 + 0.0156 + 0.0039 = 0.2578). si la moneda es 0 no sesgada, tenemos que obtener una muestra del «cornpor­
Siempre que estimemos un pararnetro poblacional mediante una muestra, ha­ tarniento» de esa moneda y lIegar a alguna generalizaci6n acerca de su posible
remos preguntas tales como: «~Que calidad tiene la estimaci6n obtenida? ~Cabe sesgo. Por ejemplo, si lanzamos la moneda 10 veces y obtenemos 5 caras y 5 cruces,
lIegarse a la conclusi6n de que el ,pan'tmetro poblacional es identico al estadigrafo ~comenzariamos a sospechar que nuestra moneda es sesgada? Por supuesto que
muestral, 0 es posible que exist a alguna discrepancia? Si es asi, ~cmil es la mag­ no, ya que este resultado es exactamente del 50 010 al 50 ~o, y concuerda con la
nitud de esta discrepancia 'l», Para responder a cada una de estas preguntas, hip6tesis de que la moneda no es sesgada. i..Y si obtenemos 6 caras y 4 cruces?
compararemos los resultados muestrales con los resultados «esperados», Los resul­ Nuevamente, este no es un resultado raro. De hecho, cabe responder a la pregunta
tados esperados estan dados, a la vez, por la distribuci6n muestral apropiada. de con que frecuencia, dada una moneda te6ricamente perfecta, puede esperarse un
Pero, ~c6mo es la distribuci6n de un estadigrafo particular? ~C6mo podemos cono­ resuItado que tenga una diferencia igual al menos a la obtenida respecto a una
cer la forma de la distribuci6n y cuales son, por tanto, los resultados esperados? repartici6n de 50 a 50. Refiriendonos a la fig. 11.1, donde se representa la dis­
Puesto que las inferencias que vamos a hacer implican el conocimiento de la tribuci6n te6rica de probabilidades de los diversos nurneros de caras cuando
forma de la distribuci6n muestral, es necesario establecer ciertos modelos idealizados. N = 10, encontramos que los desvios respecto a una repartici6n de 50 a 50 son
La curva normal y la distribucion binomial son dos modelos cuyas propiedades bastante frecuentes. Ciertamente, cuando obtenemos 6 0 mas caras, 0 4 0 menos
matematicas se conocen. En consecuencia, estas dos distribuciones se emplean caras, nos estamos apartando de un resultado de 50 a 50. Tales desvios ocurriran
frecuentemente como modelos para describir determinadas distribuciones mues­ el 75.4 % de las veces cuando se lanza una moneda perfecta en una serie de
trales. Asi, por ejemplo, si sabemos que la distribuci6n muestral de determinado 10 lanzamientos.
estadigrafo toma la forma de una distribuci6n normal; podemos usar las propiedades
conocidas de esta distribuci6n para hacer inferencias y predicciones acerca del
estadigrafo.
0,24

En las siguientes secciones se aclararan estas importantes cuestiones,

0.20

11.3 Examen estadistico de hipotesis:


0.16

nivel de significacion
P
0.12

Supongamos que el lector tiene una moneda favorita que utiliza constantemente 0,08
para decidir entre dos alternativas. Por ejemplo, se pregunta: «~Debo estudiar
esta noche para el examen de estadistica, 0 me voy al cine?». Si sale cara, 0,04
estudio; si sale cruz, no. Pasado un tiempo, el lector tiene la sensaci6n de que
la decision va mas a menudo «contra el» que «a su favon> (en otras palabras, 0.001 0.001
0.00
el estudio resulta mas frecuente que la diversi6n). Entonces comienza a dudar de 0 3 4 5 6 10
la exactitud y adecuaci6n de la moneda. ~Sale cara con mayor frecuencia que NUMERO DE CARAS
cruz? ~C6mo podriamos saberlo?
Fig. 11.1 Histograma de la distribucion binomial del nurnero de caras obtcnidas al lanzar
Una cosa esta clara. lamas se podra saber la verdadera proporci6n de caras diez veces una nioneda perfecta (N = 101.0 al lanzar diez rnonedas a la vez.
y cruces que caracteriza a esta moneda. Se podria cornenzar a lanzar la moneda
en este preciso instante y continuar lanzandola durante un mill6n de afios (supo­ l.Que ocurre si obtenemos 9 caras y 1 cruz? Evidentemente, comenzamos a
niendo una vida inmensamente larga y una moneda de duraci6n notable) y aun sospechar que la moneda no es perfecta. l.Por que? i..En que punto pasamos de
asi no se agotaria la poblaci6n de los resultados posibles. En este ejemplo, la aceptar a rechazar la honestidad de la moneda? Esta pregunta nos conduce a la
verdadera proporci6n de caras y cruces no puede conocerse porque el universo 0 parte crucial del problema de la inferencia estadistica. Se ha visto que cuanto mas
poblaci6n es ilimitado. raro 0 infrecuente sea el suceso, mayor sera nuestra tendencia a buscar una ex­
EI hecho de que no pueda conocerse el uerdadero valor no nos impide tratar plicaci6n no aleatoria al mismo. Al obtener 6 caras en 10 lanzamientos de la
de hacer una estimaci6n. Ya se ha indicado anteriormente que dado que las po­ moneda, no sentimos la necesidad de hallar una explicaci6n a su desvio de un
blaciones s610 en raras ocasiones pueden ser estudiadas exhaustivamente, tenemos resultado de 5 caras y 5 cruces que no sea la de que este desvio ocurre con
que depender de las muestras para estimar los parametres. frecuencia «por azar». Sin embargo, cuando obtenemos 9 caras dudamos mucho
204 ESTADiSTICA PARA LAS CIENCIAS SOCIALES INTRODUCCION A LA INFERENCIA ESTADfSTICA 205

de la honestidad de la moneda. Nueve caras en 10 lanzamientos es un suceso Por tanto, la probabilidad bilateral de un suceso tan raro como 9 caras en 10 lan­
tan raro que comenzamos a sospechar que la explicacion debe encontrarse mas zamientos es 2(0.010 + 0.001) = 0.022 0 2.2 %.
en las caracteristicas de la moneda que en las llamadas «leyes del azar». La pregunta Utilizando el nivel de significacion de 0.05 (C( = 0.05), deberiamos deducir que
crucial es i,donde trazamos la linea que determina la inferencia que hagamos la moneda es sesgada (0 sea que los resultados se deben a factores no aleatorios).
respecto a la moneda? Sin embargo, si usamos el nivel de significacion de 0.01 (C( = 0.01), no podriamos
La respuesta a esta pregunta revela la naturaleza basica de la ciencia: su orien­ afirmar que estos resultados se deben a facto res no aleatorios.
tacion mas bien probabilistica que absoluta. En las ciencias sociales, la mayoria Debe seiialarse e insistir en que no es admisible que el lector realice un es­
de los investigadores han adoptado como base para inferir la intervene ion de fac­ tudio, analice los resultados, llegue a un valor de probabilidad y luego decida
tores no aleatorios, uno de los dos puntos de separacion siguientes: el nivel a. Este nivel debe especificarse previamente al estudio como una parte de la
1. Cuando el suceso, u otro que represente una mayor desviacion, ocurre por azar el estrategia general del diseiio del experimento.
5 % 0 menos de las veces, algunos investigadores estan dispuestos a afirmar que
los resultados se deben a factores ajenos al azar. A esto se le llama el nivel de
siqnificacion de 0.05, 0 el nivel de siqnificacion del 5 ~~.

2. Cuando el suceso, u otro que representa una mayor desviacion, ocurre por azar el
11.4 Examen estadistico de hipotesis:
1 % de las veces 0 menos, otros investigadores estan dipuestos a afirmar que los hipotesis nula e hipotesis alternativa
resultados se deben a facto res ajenos al azar. A esto se Ie llama el nioel de
siqnificacion de 0.01, 0 el nivel de siqnificacion del 1.00 %.
Al llegar a este punto, muchos estudiantes se sienten desilusionados por la na­
El nivel de significacion adoptado por el investigador para inferir la intervencion turaleza arbitraria de la toma de decisiones en la ciencia. Examinemos un poco
"de facto res no aleatorios es conocido como nivel alfa (C(). Asi, cuando empleamos mas la logica de la inferencia estadistica y veamos si es po sible despejar algunas
el nivel de significacion de 0.05, C( = 0.05; Y si se emplea el nivel de significacion de las dudas. Antes de comenzar cualquier experimento, el investigador establece
de 0.01, C( = 0.01. dos hipotesis mutuamente excluyentes:
Para determinar en el experimento de la moneda si los resultados se deben
a facto res no aleatorios, necesitamos calcular la probabilidad de obtener un suceso La hipotesis nula (H 0), que especifica valores hipoteticos para uno 0 mas de los
tan raro como 9 caras en 10 lanzamientos. Para determinar la rareza de un suceso, parametres poblacionales.
hemos de considerar el hecho de que el suceso raro puede ocurrir en ambos La hipotesis alternatina (HI), donde se afirma que el parametro poblacional
sen tid os (por ejemplo 9 cruces y 1 cara) y que ello incluye sucesos mas extremos. tiene un valor distinto al hipotetico.
En otras palabras, la probabilidad de un suceso tan raro como 9 caras en 10 lan­
zamientos es igual a En el presente experirnento de la moneda, estas dos hipotesis son:

p(9 caras) + p(lO caras) + p(l cara) + p(O caras).


H0: la moneda es perfecta (0 sea P = Q= t)
HI: la moneda es sesgada (0 sea P i= Q i= t).
Puesto que esta distribucion es simetrica,
.La hipotesis aIternativa puede ser direccional 0 no direccional. Cuando HI afirma
solamente que el pararnetro poblacional es diferente del hipotetico, se dice que es
p(9 caras) = p(l cam) y p(lO caras) = p(O caras). una hipotesis no direccional 0 bilateral (por ejemplo, P i= Q i= t).

Asi, Ocasionalmente, HIes direccional 0 unilateral. En este caso, ademas de indicar que
el para metro poblacional es diferente del hipotetico, sefiala la direccion de la dife­
p(9 caras) + p(lO caras) + p(l cara) + p(O caras) rencia (por ejemplo, P > Q 0 P < Q).
= 2 [p(9 caras) + p(lO caras)].
1 evaluar el resultado de un experirnento, se deben emplear los valores unilate­
ales de probabilidad cuando la hipotesis aIternativa sea direccional.
Estos valores de p pueden obtenerse de la fig. 11.1 como sigue:
Ademas, cuando la hipotesis aIternativa es direccional, tambien 10 es la hipo­
sis nula. Por ejemplo, si la hipotesis alternativa es P > Q, la hipotesis nula sera
p(9 caras) = 0.010, y p(10 caras) = 0.001. ~ Q. Reciprocamente, si HIes P < Q, H 0 sera P ~ Q.
206 ESTAOfSTICA PARA LAS CIENCIAS SOCIALES INTROOUCCI6N A LA INFERENCIA ESTAOfSTICA 207

11.4.1 La nocion de prueba indirecta Por las razones mencionadas anteriormente, el eminente estadistico ingles R. A.
Fisher dijo: hi .
Un analisis cuidadoso de la 16gica de la inferencia estadistica revel a que la hipotesis En relaci6n a cualquier experimento, podemos hablar de esta ipotesis c~mo
nula no puede probarse nunca. Por ejemplo, si hubiesernos obtenido 5 caras en la «hipotesis nula», y debe notarse que la hip6tesis nula nunca. se prueba m se
10 lanzamientos de una moneda, wrobaria esto que la moneda no es sesgada? t blece pero es po sible rechazarla en el transcurso del expenmento. Se puede
La respuesta es un categ6rico «[no l». Un sesgo, si es que existe, puede tener una ~:c~r que'todo experimento existe solamente con el proposito de dar a los hechos una
magnitud tan pequeiia, que no podarnos detectarlo en 10 lanzamientos. Pero, oportunidad de rechazar la hipotesis nula",
~que pasa si lanzamos la moneda 100 veces y obtenemos 50 caras? ~Este resultado
no probaria ya algo? De nuevo, son valid as las mismas consideraciones. No im­
porta cuantas veces lancemos la moneda, jarnas lograremos agotar la poblaci6n
de los resultados posibles. Podemos afirmar, sin embargo, que no existe funda­ 11.5 Examen estadfstico de hipotesis:
mento para rechazar la hip6tesis de que la moneda no es perfecta.
Entonces, ~c6mo podemos probar la hip6tesis alternativa de que la moneda
los dos tipos de error
es sesgada? Una vez mas, no podemos demostrar directamente la validez de la
hip6tesis alternativa. Pensemos por el momenta en la 16gica implicada en el si­ Podemos preguntarnos ahora, «~no corremos el riesgo de equivoc.arnos al rechazar
guiente problema. la hip6tesis nula? ~No es posible que de hecho hayamos obtemdo por azar una
Dibujense dos segmentos rectilineos y determinese si sus longitudes son diferentes. rara ocurrencia estadistica?»,
Al compararlas se dice: «Bien, en verdad no son iguales. Por tanto, deben tener La respuesta a esta pregunta debe ser un sencillo y mode~to .«Si». Esto ~s
longitudes diferentes», Al rechazar la igualdad (que en este caso es la hip6tesis precisamente 10 que queremos decir cuando afirrr~am?~ que la ciencia es probabi­
nula) se afirma que existe una diferencia.. listica. Si existe algun enunciado absoluto que los cientificos tengan derecho a hacer,
La 16gica estadistica opera exactamente del mismo modo. No podemos pro bar es que no podemos asegurar jamas con una confia~za absoluta ~ue ?uestr?s .des­
la hip6tesis nula, ni tarnpoco podemos pro bar directamente la hip6tesis alterna­ cubrimientos 0 proposiciones son verdaderas, Existen en I~s crencias . mu~tIples
tiva. Sin embargo, si podemos rechazar la hip6tesis nula, podemos afirmar la ejemplos en los que se ha tenido que ~odifica~ una. conclusion en apanencia fir­
validez de su alternativa, 0 sea que el pararnetro poblacional tiene un valor dis­ memente establecida en vista de posteriores evidencias,
tinto al valor hipotetico, Aplicado al problema de la moneda, si podemos re­ En el experirnento de la moneda, aunque todos los lanzamientos hubiesen re­
chazar la hip6tesis nul a de que P = Q = t, podremos asegurar la validez de la sultado caras es todavia posible que la moneda .no sea sesgada. Por azar, una
hip6tesis alternativa, 0 sea P i= Q i= t. N6tese que el apoyo a la hip6tesis alter­ vez de cada 1024 experimentos «en prornedio», se obtendran 1.0 caras en 10 la~­
nativa es siempre indirecto. La hemos apoyado rechazando la hip6tesis nula. Por zamientos. Cuando usamos el nivel de confianza de 0.05, aproximadarnente el 5 %
el contrario, puesto que la hip6tesis alternativa no puede ser probada ni rechazada de las veces cometeremos un error al rechazar la hip6tesis nula y aceptar su al­
directamente, no podremos probar mmca la hipotesis nula rechazando la hip6tesis al­ ternativa. .
ternativa. La afirmaci6n mas fuerte que podemos hacer a este respecto es que fra­ Estos son algunos de los hechos fundamentales en la realidad ~el r~zonamlento
casamos en rechazar la hipotesis nula. En la practica, muchos investigadores usan inductivo a los que el lector debe ajustarse. EI estudi~nte de cIe.ncI.as del com­
indistintamente las expresiones «fracasar en rechazar la hipotesis nula» y «aceptar
portamiento que antes de emitir una opini6n sobre algun asunto mSIst~ en tener
la hip6tesis nula»,
una seguridad absoluta del mismo, es un estudiante que ha perman~cIdo mudo
durante muchos aiios y que seguira estandolo par el resto de su vida (proba­
~Cuales son entonces las condiciones para rechazar la hip6tesis nula? Sim­
plemente estas: utilizando el nivel de significaci6n de 0.05 se rechaza la hip6tesis blemente). , .
Las consideraciones anteriores han llevado a los estadisticos a formular dos
nula cuando un resultado ocurre por azar el 5 % de las veces 0 menos; y usando
tipos de errores que pueden presentarse en la inferencia estadistica.
el nivel de significaci6n de 0.01, se rechaza la hip6tesis nula cuando un resul­
tado dado ocurre por azar el 1 % de las .veces 0 menos. En estas circunstancias
se acepta, por supuesto, la hip6tesis alternativa.
11.5.1 Error de tipo I (error de tipo a)
En otras palabras, se rechaza la hip6tesis nula cuando los resultados ocurren
par azar el 5 % de las veces 0 menos (0 el 1 % de las veces 0 menos), suponien­ En un error de tipo I, rechazamos la hip6tesis nula cuando e.n realidad e.s v~r~
do que la verdadera distribucion es la que corresponde a la hipotesis nula. Esto es, dadera. La probabilidad de cometer un error tipo I es a. Ante.no~~en~~ se indico
se supone que la hip6tesis nula es verdadera, se ca1cula la probabilidad en base ue si establecemos nuestro punta de rechazo en el nivel de significacion de 0.05,
a est a suposici6n y, si la probabilidad es pequeiia, se rechaza 10 supuesto.
-----. (EI subrayado es nuestro). Fisher, R. A., The Design of Experiments. Edinburgh: Oliver & Boyd, 1935, pogo 16.
208 ESTADISTICA PARA LAS CIENCIAS SOCIALES
INTRODUCCI6N A LA INFERENCIA ESTADfsTICA 209

rechazaremos err6neamente H 0 aproximadamente el 5 % de las veces. Pareceria Tabla 11.2 Tipo de error cometido, te­
niendo en cuenta el estado real de H o y la ESTADO REAL DE Ho
entonces que para evitar este tipo de error deberiamos elegir el nivel de rechazo
10 mas bajo posible. Por ejemplo, si tomararnos ex = 0.001, el riesgo de cometer decision estadistica tomada. A modo de
[lustracicn, si Hoes verdadera (colum­ Ho Ho
un error de tipo I seria aproximadamente s6lo de un caso en cada mil. Debe na 1) y rechazamos H o (fila 2), cometemos
VERDADERA FALSA
advertirse que el nivelde 0.05 es de uso casi rutinario en las ciencias sociales un error de tipo I. Si Hoes falsa (columna 2)
Corrects Error tipo II
y del comportamiento, y puede utilizarse a menos que haya una raz6n particular y rechazamos H o' nuestra decision es co­ A Cept ar Ho
1­ C( p
para. ser extrem~damente precavido ante el hecho de cometer error de tipo 1. rrecta.
Decision
Supongase, por ejernplo, que estamos comparando un metodo de enseiianza comple­ { Error tipo I Correcla
Rechazar H o
tamente nuevo con otro metodo clasico. Admitase tarnbien que la hipotesis nula sea C( 1-P
realmente verdadera, 0 sea, que no existe diferencia entre ambos metodos. Si se
cometiera un error de tipo I y la hipotesis nula fuera indebidamente rechazada cabe = 005 examen bilateral. Se obtuvo p = 0.03, valor bilateral.

H o.. /1 1 -- /1 2, N
CA. .,

imaginar que ello conducina a la sustitucion del rnetodn habitual de ensefianza, con Decision estadistica: Hoes falsa. Estado real de H 0: Verdadera.

el consiguiente gasto de dinero y de tiempo, por otro metodo que de hecho no es


Error: Tipo I, se rechaza una H 0 verdadera.

mejor, En casos como este, pudiera ser que deseasernos fijar un nivel de confianza
mas conservador (por ejernplo, ex = 0.01). Para que ellector se familiarice con el uso = /12, ex = 0.05, examen bilateral. Se obtuvo p = 0.04, valor bilateral.
H o : /11
de ambos niveles ex, hemos usado arbitrariamente ex = 0.01 y ex = 0.05 en los Decisi6n estadistica: H o es falsa. Estado real de H o : Falsa.

ejemplos que se presentan en el texto. Sin embargo, hay que tener presente que Error: No se ha cometido ningun error. Se lIeg6 a una conclusi6n correcta

cuanto menor tomemos ex, mayor sera la probabilidad de co meter un error de tipo II. puesto que Hoes falsa y la decisi6n estadistica fue de que Hoes falsa.

= /12, ex = 0.01, examen bilateral. Se obtuvo p = 0.10, valor bilateral.

H o : /11
11.5.2 Error de tipo II (error de tipo {3) Decisi6n estadistica: no se puede rechazar H o- Estado real de H 0: Falsa.

Error: Tipo II, no se rechaza una H o falsa.

En un error de tipo II, dejamos de rechazar la hip6tesis nula cuando en realidad


es falsa. Beta (p) es la probabilidad de cometer un error de tipo II. Este tipo de 4. H 0: /11 = /12, ex = 0.01, examen bilateral. Se obtuvo p = 0.006, valor bilateral.
Decisi6n estadistica: Se rechaza H o- Estado real de H 0: Falsa.

error es mas frecuente que el de tipo 1. Por ejernplo, si usamos el nivel de sig­
nificaci6n de 0.01 como base para rechazar la hip6tesis nula, y luego realizamos Error: No se ha cometido ningun error ya que la decisi6n estadistica fue

un experimento en que el resultado obtenido podria haber ocurrido por azar la de rechazar H 0 siendo realmente falsa.

solamente en el 2 % de las veces, no podemos rechazar la hipotesis nula. En con­ Cabe ahora preguntarse: «l.Como podemos saber, en la practica, si se esta
secuencia, no podemos afirmar que existe un efecto experimental, aunque en rea­ cometiendo un error de tipo lode tipo II?» La respuesta es sencilla: [No po­
lidad pudiera ser asi,
demos! Si se examina una vez mas la 16gica de la inferencia estadistica vere­
Queda claro, entonces, que cuanto menor sea el nivel de rechazo, menor sera
mos por que. Ya se ha dicho que, salvo raras excepciones, ~o co?ocemos 0 n?
la probabilidad de cometer un error de tipo I, y mayor sera la probabilidad
podremos conocer los verdaderos parametres de una poblacion. Sin este c?nocl­
de cometer un error de tipo II. A la inversa, cuanto mayor sea el nivel de rechazo,
mien to, l.c6mo es posible saber si los estadigrafos muestrales se han apro~lI~ad~
mayor sera la probabilidad de cometer un error de tipo I, y menor sera la
o no al valor real? l.C6mo se puede saber si hemos rechazado, 0 no; una hipotesis
probabilidad de cometer un error de tipo II.
ula equivocadamente? Si conocierarnos el valor. poblacional, podriam?s .saber si
El hecho de que el nivel de rechazo se tome tan bajo es una muestra del hemos cometido 0 no un error; pero, en tales circunstancias queda ehmmada la
espiritu precavido de los cientificos, quienes prefieren cometer un error al dejar
necesidad de emplear un estadigrafo muestral. Tomamos muestras y hacemos in­
de proclamar un resultado, que cometerlo al recabar un resultado equivocado.
ferencias a partir de elIas solamente porque los valores poblacionales .nos son
La tabla 11.2 resume los tipos de error cometido, teniendo en cuenta el estado desconocidos por una u otra raz6n. Cuando dichos valores son conocidos, no
real de la hip6tesis nula y la decisi6n tomada. Debe notarse que los errores de
existe la necesidad de una inferencia estadistica.
tipo I y tipo II son errores muestrales y se refieren a muestras tomadas de pobla­
ciones hipoteticas, l.No hay manera entonces de saber que experimentos proporci~n.an resu!tad~s
significativos y precisos y cuales no? La respuesta es un «Si» condicional, SI repi­
Veamos algunos ejemplos en los que, con fines ilustrativos, damos la siguiente
tieramos el experimento y obtuvieramos resultados similares, tendriamos mayor
informacion relativa a la poblacion en estudio: H o, nivel ex, p obtenida, decision
confianza de no estar cometiendoun error de tipo 1. Por ejemplo, si hicierarnos
estadistica tomada y estado real de H o. Sefialernos el tipo de error cometido,
si ha habido alguno. una segunda serie de 10 lanzamientos de nuestra moneda y obtuvierarnos 9 car~s,
nos sentiriamos mas inclinados a creer que la moneda es sesgada. Entre paren­
INTRODUCCION A LA INFERENCIA ESTADfsTICA 211
210 ESTADfsTICA PARA LAS CIENCIAS SOCIALES

tesis, la repeticion de los experimentos es una de las areas mas debiles de la Terminos para recordar
investigacion en las ciencias sociales. La actitud general es la de que un estudio
no es bueno a menos que sea «diferente» y constituya por tanto una nueva con­ I,ipotesis nula (Ho )
tribuci6n. Con frecuencia, la repetici6n de los experimentos, si es que se !leva a distribucion binomial
distribucion muestral muestra
cabo, no se publica. En consecuencia, podemos sentimos seguros de que en los
estudios donde se emplea un nivel de significacion de 0.05, aproxirnadamente error de tipo I( error de tipo rx) nivel alfa [a]
en uno de cada 20 se comete un error de tipo I al rechazar la hip6tesis nula*. error de tipo II (ermr de tipo P) nivel de significacion
hipotesis alternativa ( HI) poblacion
valor de probabilidad bilateral
hiplJtesis direccional
Resumen del capitulo hipotesis no direccional
valor de probabilidad unilateral

Hemos visto que uno de los problemas fundamentales de la estadistica inferen­


cial es el de la estirnacion de los para metros mediante estadigrafos muestrales.
En la estadistica inferencial tenemos frecuentemente que comparar los valores Ejercicios
obtenidos con los val ores esperados. Los valores esperados vienen dados por la
distribucion muestral apropiada, que es una distribuci6n tea rica de probabilidades Ex li ue el estudiante con sus propias palabras la naturaleza de la deduc~ion de infe­
de los valores posibles de un estadigrafo muestral. r~~eias ~n ia ciencia del comportamiento. Asegurese de espec~fic~r los tipos :een::~s~~ ~:it~~
Hemos visto la forma de utilizar las distribuciones muestrales para interpretar asurnen y los modos como el investigador intenta mantener IC os nesgos
los estadigrafos muestrales. especificables.
Hemos visto tarnbien que a cada experimento correspond en dos hipotesis es­ 2. Dar ejemplos de estudios experiment~les en los queI :d t' II'
tadisticas exhaustivas y mutuamente excluyentes: la hip6tesis nula (H 0) Y la hipo­ a) se considere el error de tipo I mas grave que e e I~O ,
tesis alternativa (H d. b) se considere el error de tipo II mas grave que el de upo 1. . .
Si el resultado de un experimento es raro (aqui se define «raro» como un . e com letar un estudio experimental, un psicologo llega a la ~I~ulente co~-
valor de probabilidad arbitrario pero aceptable), rechazamos la hipotesis nula c~~si~~~;~~sd~mostr~o que no ex.i~te difereneiad Signific~ti~~g~~~r~:~se~~asb~:~~~~~oesd:X~~~~:
y aceptamos su alternativa. Si el suceso no es raro (0 sea, que el valor de probabi­ mentales». Critiquese esta conclusion de acuer 0 con a
lidad es mayo/' que aquel que aceptamos como significativo), dejamos de rechazar rencias cientilicas. . . 1
la hip6tesis nula. Sin embargo, en ningun caso nos esta permitido afirmar que 4. Expliquese el significado del siguiente aserto: «Puede. d~cir~e que el proposito de eua­
hemos demostrado H o- quier experimento es el de tener la ocasion de rechazar la hipotesis nula». .
El investigador se enfrenta con dos tipos de errores al establecer un valor
extrema de probabilidad que acepta como significativo: :;la~:,;:;:6~~;6~:;i:~:t:: ~:~::~i~~:;;'~l~~ :,~ "~~: ;::li~~~ti;':t:, ap;:b;:~'::'
Tipo I: rechazar la hip6tesis nula siendo verdadera. pleando dos niveles diferentes de estimulo. Formulense Ho y i­

Tipo II: dejar de rechazar (<<aceptar») la hip6tesis nula siendo falsa. ldentifiquese HoY HI en los sigui~ntes ~asos:
a) La media poblacional en inteligencia es 100. ' . 0 50
El sentido precavido de los cientificos determina que hayan establecido un bajo b) La proporcion de dernocratas .en un condado no es igual a . .
nivelde significacion, 10 que les hace co meter con mayor frecuencia errores de e) La media poblacional en intehgencla no es igual a .100. 50
tipo II que de tipo I. d) La proporcion de dernocratas en un condado es igual a O. .
Sin repetir los experimentos carecemos de base para saber cuando se ha cornetido
7. Suponga el lector que es un jefe de persona~ a quie~ corresponde ~~:~:;;~~~ la pro­
un error de tipo I, y aun con la repetici6n no podernos recabar el conocimiento de la rnocion de un empleado a un nivcl ejecutivo superior. i,Que !l~0 de error?
verdad absoluta. a) la hipotesis de que esta capacitado (H 0) se acepta .erroneame~te.
Por ultimo, y esto es quizas 10 mas importante, hemos visto que el cono­ b) la hipotesis de que esta capacitado se rechaza erroneamente.
cimiento cientifico es probabilistico y no absoluto. c) la hipotesis de que esta capacitado se acepta correctamente?
• La proporcion es probablemente mayor. porque nuestros rnetodos de aceptacion de los informes de investigaciones
d) la hipotesis de que esta capacitado se rechaza correctamente?
. d rente la compra 0 la venta de ac­
8. Un analista del mercado de valores re~o:len a a s~e~ ~alor futuro de las mismas. i,Que
para su publicacion dependen mucho de la significacion estadistica de los resultados. Asi, si se lIevaran a cabo
independienternente cuatro estudios identic os y solamente en uno se obtuvieran resultados que perrnitieran rechazar la
nipotesis nula, seria este lrabajo el que tendria mayor posibiJidad de ser publicado. Virtualrnente no hay manera de que ciones segun las hipotesis que haya formu a 0 aeerca. . ., d ?
los cientificos conozcan en general los tres estudios en que no se pudo rechazar la hipotesis nula. tipo de error cornete si declara 10 que sigue en las condIciones indica as.
INTRODUCCION A LA INFERENCIA ESTADiSTlCA

213
212 ESTADISTICA PARA LAS CIENCIAS SOCIALES

id un error en la decision estadistica tomada. En caso afirrnativo, sefialar


a) H«: Las acciones perrnaneceran estables. Realidad: Su valor sube bruscamente. ha cornell 0, 0 no,
b) H 0: Las acciones perrnaneceran estables. Realidad : Su valor baja bruscamente. el tipo de error. .
c) H 0: Las acciones perrnaneceran estables. Realidad: Su valor muestra solamente pe­ 19. H 0: P == Q, (J. == 0.01, examen estadistico unilateral. Se obtuvo p == 0.008, valor unilateral
queiias fluctuaciones respecto al promedio. ( una direccion predicha). Estado real de H o: Verdadero.
~ 9. Un investigador establece (J. == 0.01 para rechazar H o- Realiza un estudio en el que ob­ en H' P _ Q == 005 examen estadistico bilateral. Se obtuvo P == 0.08, valor bilateral.
20. o. - ,(J. .,

tiene un valor p de 0.02 y deja de rechazar H o. Discutase: ~Es mas probable que este acep­
Estado real de Il «: Verdadero. .

tando una H0 verdadera, 0 una falsa?


. P - Q == 005 examen . ' bil
extadistico latera.I Se 0 bt u va p -
- 006
. , valor bilateral,
21. H o- - , rY. .,
10. Comentese: Un estudiante de psicologia ha recopilado una masa de datos para examinar Estado real de H 0: Falso. .
estadisticamente 100 hipotesis nulas diferentes. Al completar el analisis encuentra que 5 de 22: H«: P == Q, rY. == 0.05, examen estadistico bilateral. Se obtuvo p == 0.03, valor bilateral.
las 100 cornparaciones dan valores de p ::;; 0.05, y llega a la siguiente conclusion: «Usando
Cl == 0.05, encontre una verdadera diferencia en cinco de las cornparaciones».
Estado real de H«: Falso. .
. P - Q - 001 exarnen estadistico bilateral. Se obtuvo p == 0.005, valor bilateral.
11. Comentese: Un investigador ha hecho pruebas con 500 personas diferentes para buscar 23. H o' - ,rY. - • ,

evidencias de percepcion extrasensorial (PES). Usando Cl == 0.01, Ilega a la siguiente conclusion:


Estado real de H 0: Falso.
«Encontre 6 personas con PES».
Si rY. == 0.05, ~cual es la probabilidad de corneter un error de tipo I?
12. ~La hipotesis nuJa en un examen estadistico unilateral es diferente de la hipotesis nula

en uno bilateral?

13. ~La hip6tesis alternativa en un examen estadistico unilateral es diferente de la hipotesis

alternativa en uno bilateral? Dar un ejemplo.

14. Para rechazar la hipotesis nula en un examen estadistico unilateral, ~se tienen en cuenta

por igual todas las desviaciones? Expliquese.

I)) 15. Supongase que se desea examinar estadisticamente la hipotesis de que no hay igual nu­
mero de hombres y de mujeres en los cargos ejecutivos de una gran empresa. La hipotesis
nula apropiada seria:
a) Hay mas mujeres que hombres en los cargos ejecutivos.

b) Hay igual nurnero de hombres y de mujeres en los cargos ejecutivos.

c) Hay mas hombres que mujeres en los cargos ejecutivos.

16. Supongase que un experto en eliciencia encuentra una diferencia signilicativa entre el

tiempo que tardan las personas en leer un dial circular y el que tardan en leer uno rec­

tangular. Aunque o: == 0.05 y rY. == 0.01 se consideran normalmente como niveles de significa­

cion aceptables, esta eleccion es arbitraria. Para cada uno de los siguientes niveles de sig­

nificacion, indiquese cuantas veces de cada 1000 se espera que esta diferencia ocurra por

azar.

a) 0.001 b) 0.01 c) 0.005 d) 0.06

e) 0.05 r) 0.095 g) 0.004 h) 0.10

17. Con referencia al ejercicio 16, indicar a que nivel de significacion sedan mas probables
los siguientes enunciados:

a) Existe una diferencia significativa entre los tiempos de lectura de ambos diales.

b) No se puede llegar a la conclusion de que haya una diferencia signiJicativa entre

los tiempos de lectura de ambos diales.


18. Con referencia de nuevo al ejercicio 16, indicar que nivel de significacion daria lugar

con mayor probabilidad a los siguientes errores. Identificar el tipo de cada error.

a) Hay una diferencia significativa entre los tiempos de lectura de ambos diales. Realidad :

No hay diferencia.

b) No se puede Jlegar a la conclusion de que hay una diferencia significativa entre

los tiempos de lectura de los dos diales. Realidad: Hay una diferencia.

En los ejercicios 19 a 23, se dan H o, rY., P obtenido y el estado real de H o. Indicar si se


INFERENCIA ESTADiSTICA Y VARIABLES CONTINUAS 215
[214]

1 Inferencia estadistica 0.20 (N=3l

y variables continuas 0.15

p
0.10

0.05

0.00 '-----.........

o 2 3 456

12.1 Introduccion MEDIA MUESTRAL


(b)

En el capitulo 11 mostramos el uso de una distribuci6n muestral para una variable


nominal dicot6mica (la distribuci6n binomial) y para todas las medias posibJes 0.20
cuando se extraen muestras con N fijo de una poblaci6n constituida por cuatro 0.1719
numeros, "La tabla ILl ofrece las distribuciones de probabilidades de las medias
cuando, de una poblaci6n d~Guatro numeros, se seleccionan todas las muestras posi­ 0.15
bles de un tarnafio dado. La fig. 12.1 representa los histogramas de probabilidades,
p
donde aparecen tam bien las curvas que pasan por los puntos medios de las bases
superiores de los rectangulos, 0.10

Antes de proseguir con el estudio de las distribuciones muestrales para variables


correspondientes a escalas de intervalos 0 de razones, examinaremos cuidadosamente 0.05
la tabla 11.1 y la fig. 12.1. Yea el lector si es capaz de responder a las siguientes
preguntas:
0.00L--,""","'"
0.00 1.50 3.00
MEDIA MUESTRAL
0.2500 (e)
0.25

Fig. 12.1 Histograma de probabilidades basado e~,la distribuci6n, de las medias de


0.20 muestras obtenidas, con reposicion, de una poblacion .de cuatro numeros, tomando
como tamafio de las muestras N = 2, N = 3 y N = 4.

0.15
.Que comparaci6n puede hacerse entre la media de cada distribuci6n muestral
p de medias y la media de la poblaci6n de la cual proceden las muestras?
~C6mo cambia la variabilidad 0 la dispersi6n de las medias muestra~es ~ua~~o
0.10 incrementarnos el tarnafio de las muestras en que se basa cada distribucion
muestral?
0.05 Compare ahora sus respuestas con las nuestras:
La media de la poblaci6n forrnada por cuatro numeros es, 4.5. La ~edia de
0.00 cada una de las distribuciones muestrales de las medias es 4.5. ASI, la media de una
0 1.5 3.0 4.5 6.0 7.5 9.0 distribuci6n muestral de medias es igual a la media de la poblaci6~ de donde
MEDIA MUESTRAL provienen las muestras. Esto es valido para todos los valores posibles de N.
(a) Figura 12.1
216 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
INFERENCIA ESTADfSTICA Y VARIABLES CONTINUAS 217

En otras palabras, Ja media de fa distribuci6n muestraf


de la muestra. no varia con el tarnaiio numeros 3 y 6. Calculamos la media muestral y encontramos que j{ = 4.5.
2. Conforme se incrementa el tamano de I ' .. Supongarnos ahora que continuamos extrayendo muestras de N = 2 (por ejemplo,
dias muestrales se hace menor, Cuando N :re~~uestra, la dispersion ~: las me- podriamos obtener los numeros 2, 8; 3, 7; 4, 5;' 5, 6; etc.) hasta tener un numero
medias estan pr6ximas a la media poblaci I ' una ma~or. proporcron de las indefinidamente grande de muestras. Si calculamos la media muestral correspon­
raras Pa . . acionar, y las desviaciones extremas son diente a cada una de las muestras obtenidas, y tratamos a cad a una de las
.' ra comprobar estas afirmaciones, verifique la probabilidad de obtene medias muestrales como un valor original, podremos establecer una distribuci6n
med ia tan rara como 0 6 9 c dif _ r una
" . on I erentes tamanos de muestras. N6tese tarnbie de frecuencias de estas medias muestrales.
que la proporcIOn de medias en el centro de la distrib . . h n
conforme crece el tamafio de la muestra Por ei uCIOn.. se ace mayor Repitamos los procedimientos anteriores con muestras de tarnafio cada vez
comprendidas entre 3 y 6 inc! does jernplo, la proporcion de las medias mayor, por ejemplo, N = 5, N = 15. Tenemos ahora tres distribuciones de fre­
d 06874 ' uyen 0 estos extremos, es de 0.6250 cuando N = 2 cuencias de medias muestrales correspondientes a tres tarnafios muestrales diferentes.
e '. para N = 3 y de 0,7265 cuando N = 4. '
l.C6mo cabe esperar intuitivamente que fueran estas distribuciones? Puesto que
Finalmente, la desviaci6n estandar de las medias muestrales '
adelante lIamaremos error estandar de fa media) indica que la dl;ue ~: a~U1 n
medias muestrales decrece conforme crece el tamafio d I persion e as
t estamos tomando al azar muestras de la poblaci6n, deberiamos esperar que la
media de la distribucion de las medias muestrales fuera aproximadamente igual a
En la f 122' e a muestra. la media de la poblacion,
ig, . se aprecia la magnitud decreciente d e
tp:mano ~e la ~uestra. Se indica la desviaci6n estandar de la P~~I~c~~~d~o:~~~~id~
l.C6mo se podria comparar la dispersi6n de estas medias muestrales con la
r cua ro numeros y el error estandar de la diIa, . . . variabilidad en la distribuci6n original de los valores? En la distribuci6n original,
muestrales correspondientes a N = 2 N = 3 N _ ;Oeb para las dIstnbu~I~nes cuando N = 1 la probabilidad de obtener un resultado tan extrema como, por
to no es lineal. , y -. servese que el decrecimien­ ejemplo, 8 es 4/1000, 0 sea, 0.004 (ver tabla 12.1). La probabilidad de obtener una
media muestral igual a 8 cuando N = 2 (0 sea, sacando los datos de 8 y 8) es igual
a 0.004 x 0.004 = 0.000016 [f6rmula (10.9)]. En otras palabras, la probabilidad de
4.00
sc seleccionar una muestra con una media de valor extrema es menor que la proba­
w bilidad de seleccionar un dato aislado tambien de valor extremo. l.Que ocurrira si
:::E incrementamos el tarnafio de la muestra a N = 4? La probabilidad de obtener
:5
w 3.00
resultados de valor tan extrema como el anterior (j{ = 8) es sumamente pequefio,
c
a saber (0.004)4 = 0.0000000003. Generalizando, la probabilidad de obtener valores
cr

C3
(2.37)
extremos de la media muestral es menor a medida que N crece. Puesto que la

~(1.94)
z
desviaci6n estandar es una funci6n directa del numero de valores extremos (ver
~
en 2.00
w

capitulo 6), se desprende que una distribuci6n que contenga proporcionalmente


cr
~8) pocos valores extremos tendra una desviaci6n estandar menor. Por tanto, si tratamos
a
cr a cada una de las medias muestrales como un valor original y calculamos luego
cr
w
1.00 la desviacion estandar ((Jx, conocida como el error estandar de la media*), esta

Tabla 12.1 Una poblaci6n de distribuci6n aproximadamente


2 3 4 normal con J1 = 5.00 Y (J = 0.99.
x pIX)
TAMANO DE LA MUESTRA
2 4 0.004
Fig. 1.2.2 Magnitud del error estandar de la media en funci6n del

tamano de la muestra.
3 54 0.054
4 242 0.242
5 400 0.400
6 242 0.242
12.2 Distribuci6n muestral de la media 7 54 0.054
B 4 0.004

Imaginemos que se esta llevando a cabo un experimento muestral en N = 1000 I)(X) = 1.000
extraemos al azar (con reposici6n)* una muestra de d o ' d el ~~e
en la ue - 500 s numeros e una poblacion
q Il - . Y (J = 0.99 (ver tabla 12.1). Por ejemplo, podriamos obtener los
• Esta notaci6n representa la desviaei6n estandar de una dislribuci6n muestral de medias. Se refiere a un
• Si la poblaci6n es inlinita 0 muy grande la djferenci I eoneepto puramente te6rieo, pues con un nurnero inlinito de medias muestrales no es po sible asignar un valor
• J erencia entre e muestreo, con 0 sin reposicion, es despreciable.
espeeltico al mimero de medias muestrales involueradas.
218 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
. INFERENCIA ESTADfsTICA Y VARIABLES CONTINUAS 219

claro que ~onforme aumente el tarnano de la muestra disrninuirn la variabilidad distribucion de las medias muestrales tiende a convertirse en una distribucion
de las medias muestrales.
normal con media u, oarianza (J2jN yierror estdndar (Jjp.
Si realmente s~ efectuasen estos experimentos muestrales, se obtendrian las
curvas de Irecuencias que se representan en la fig. 12.3. Simb6licamente,

(12.1)
N= 15

N= 5 y

N= 2 (J'
os = ;N' (12.2)

Examen estadistico de hip6tesis: media


5 y desviacion estandar poblacionales conocidas
/1­
x
Fig. 12.3 Curvas de frecuencias de medias de muestras provenientes de una
la que u = 5.00 Y a = 0.99. pohlacion en 12.3.1 Calculo de la probabilidad de que una media
Hay tr~s cuestiones importantes que pueden aprenderse examinando cuidadosa­
muestral caiga dentro de cierto rango de valores
mente la fig, 12.3:
Examinemos brevemente algunas implicaciones de las relaciones que acabamos
1. La distribuci6n. d~ la.s medias de muestras provenientes de una poblaci6n de estudiar.
normalmente distribuida, es de forma acampanada 0 «normal». De hecho Cuando se conocen Jl y (J para una poblaci6n dada, es po sible describir la
se p~e~e d~~ostrar que aun cuando la distribuci6n fundamental sea sesgada' forma de la distribuci6n de las medias muestrales, si N es grande (independiente­
la distribucion de las medias muestrales tendera a ser normal. ' mente de la forma de la distribuci6n original). Sera una distribuci6n normal
2. La media de la~ medias muestrales (Jlg) es igual a la media de la poblaci6n ( ) con media (Jlx) igual a Jl y error estandar ((Jx) igual a (Jj.jN. Resulta ahora
. de la cual provienen las muestras. Jl posible determinar los val ores de la probabilidad como areas situadas bajo la
curva normal. Asi, podemos usar las relaciones conocidas de la curva normal para
3. La ~istribuci6n de las medias muestrales se vuelve mas y mas compacta a
determinar las probabilidades asociadas con cualquier media muestral (de tamafio
~edlda q~e aument.a el ta~ano de la muestra. Este es un punto de mucha dado N) proveniente de est a poblaci6n.
Impor~ancIa en la inferencia estadistica, y pronto insistiremos mucho mas
sobre el. Ya se ha visto (secci6n 7.3) que cualquier variable normal mente distribuida
puede ser transformada en una variable z con distribuci6n normal estandar,
Si, basamos nuest~~ estimaci6n de la media poblacional en una sola muestra Tarnbien vimos (secci6n 10.6) que es posible establecer los val ores de probabilidad
extralda, de la poblacion, nuestra aproximaci6n al pararnetro sera probablemente teniendo en cuenta la relaci6n entre los valores z y las areas situadas bajo la curva
t~nto ~as cercana ~uant~ ,mayor sea el tarnafio de la muestra. En otras palabras, normal. Esto es, para cualquier valor original (X) con cierta proporci6n de area a su
Sl es ~Ierto que la dispersion de las medias muestrales decrece cuando aumenta el derecha, existe un valor correspondiente de z con la misma proporci6n de area
tam~no de la IT,'uestra, de ello .se desprende que la media de cualquier muestra a su derecha. Analogarnente, para cualquier valor dado de una media muestral (X)
partrcu.l~r tendra ma,yor probabilidad de estar tanto mas pr6xima a la media de la con cierta proporci6n de area a su derecha, existe un correspondiente valor de z
poblacion cuanto mas aumente el tarnafio de la muestra. con la misma proporci6n de area a su derecha. Asi, suponiendo que la forma de la
Estas tres.observaci?nes ilustran un teorema bastante sorprendente que tiene distribuci6n de las medias muestrales sea normal, podemos hallar los val ores de
f~n?amental ImportancIa en la estadistica inferencial. Nos referimos al teorema del la probabilidad usando las relaciones entre los valores z y las areas situadas bajo la
limite central, el cual establece que: curva normal.
Si de cualquier poblacion (independientemente de la forma de distribucion que Como ejemplo: sea una poblaci6n con Jl = 250 Y (J = 50, de la cual tomamos
tenqa ) se extraen muestras aleatorias de tamaiio N fijo, a medida que N crece la .aleatoriamente 100 valores (N = 100); l,cutll es la probabilidad de que la media
muestral (X) sea igual 0 mayor que 255? Asi, H o:j.i = J./o = 250.
220 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
INFERENCIA ESTADisTICA Y VARIABLES CONTINUAS 221

EI valor de z correspondiente a j{ = 255 se obtiene de la manera siguiente:


por aquellos valores de ZO.OI que dejan en los extremos el 1 por ciento del area.
X - flo Refiriendonos nuevamente a fa columna (C) de la tabla A, encontramos que el
z=----, (12.3) area a la derecha de z = 2.58 es aproximadamente igual a 0.005. Duplicamos 0.005
ax
para tener en cuenta las dos colas de la distribuci6n. En la fig. 12.4 apare,ce.la
donde flo = valor de la media poblacional bajo H 0, regi6n critica para el rechazo de H 0 cuando :x = 0.01 en un examen estadistico
bilateral.
a 50 255 - 250
ax = -
IN
= - - = 5.00
.J100 '
y
z = 5.00 = 1.00. I REGION CRITICA

Buscando una z igual a 1.00 en la columna (C) de la tabla A, apendice III,


encontramos que el 15.87 por ciento de las medias muestrales estan a la derecha
de j{ = 255. Por tanto, hay aproximadamente 16 posibilidades entre 100 de obtener
una media muestral igual 0 mayor que 225 a partir de esta poblaci6n, cuando
N = 100.
- 2.58 a
ESCALA z
12.3.2 Examen estadistico de hip6tesis relativas

Fig. 12.4 Region critica para rechazar H0 cuando = 0.01,


a la media muestral
examen estadistico bilateral.
(X

Extendamos la 16gica empleada anteriormente a un caso en el cual no se conoce de


Por tanto, para rechazar H 0 a un nivel de significaci6n de 0.01, el, valor
que poblaci6n se ha extraido la muestra. Sospechamos que fue tomada de la
absoluto de la z obtenida debe ser igual 0 mayor que Izo.oll 0 sea 2.58. Analoga­
poblacion anteriormente descrita con fl = 250 y a == 50, pero no estamos seguros
mente, para rechazar H 0 a un nivel de significaci6n de 0.05, el valor absoluto
de ello. Se desea examinar estadisticamente la hip6tesis de que la media muestral
de la z obtenida debe ser igual 0 mayor que 1=0.051,0 sea, 1.~6.
proviene de esta poblaci6n. Imaginemos que se ha obtenido X = 263 para N = 100.~ En el presente ejemplo, el valor de z correspondiente a X = 263 es '
~Es razonable admitir que esta muestra fue extraida de la poblaci6n anterior?
EI planteamiento de este problema en terrninos estadisticos formales incluye los Z = X- flo = 263 - 250 = 2.60.
siguientes pasos que se repiten en todos los casos analogos: ax 5.00
1. H ipotesis nula (H 0): La media de la poblaci6n (fl) de la cual se extrajo la Decision Puesto que el Z obtenido cae en la regi6n critica (ya que 2.60 > zo.od,
muestra es igual a 250, 0 sea fl = flo = 250. podemos rechazar H 0 a un nivel de significaci6n de 0.01.
2. Hipotesis alternativa (HI): La media de la poblaci6n de la cual se extrajo la
muestra no es igual a 250; fl # flo. N6tese que HI no es direccional; en
consecuencia, debera emplearse un examen estadistico bilateral.
3. Examen estadistico: Se usara la variable z ya que a es conocida. 12.4 Estimaci6n de parametros : estimacion puntual
4. Nivel de siqnificacion: IX = 0.01. Rechazaremos H o si la diferencia entre la
media muestral y la media poblacional especificada es tan extrema que la Hasta ahora nos hemos ocupado del examen estadistico de hip6tesis cuando los
probabilidad asociada con su realizaci6n bajo H o es igual 0 menor que 0.01. parametres poblacionales son conocidos. Sin embargo, en este li?ro hemo~ tenido
5. Distribucion muestral: La curva de probabilidad normal. la precauci6n de indicar que s610 en raras ocasiones se co.nocen dichos para~etros,
particularmente cuando la poblaci6n es muy grande. Siempre que se. reahza un
6. Region critica para el rechazo de H«: [z] ~ /zo.oll = 2.58*. Una region critica
censo nacional estamos cerca de conocer los parametres correspondientes a las
es fa porcion de area bajo la curva· que incluye aquellos valores de un esta­
digrajo que nos /levan al rechazo de 'fa hipotesis nula. variables en estudio. Pero el conocimiento de los para metros no es 10 usual.
Sin embargo, el hecho de no conocer los valores poblacionales no nos impide
La regi6n critica se fija en correspondencia con el nivel de significaci6n elegido. utilizar la 16gica desarrollada en la secci6n 12.3. . .
Asi, para IX = 0.01 en un examen estadistico bilateral, la regi6n critica esta limitada Cada vez que hacemos inferencias acerca de los parametros poblacionales
• Puesto que ZO.Ol = ±2.58,lz! ;;. IZO.Oll equivale a expresar.que Z ;;. 2.580 Z :;; -2.58.
mediante datos muestrales, comparamos los resultados muestrales con los.res~lta~?s
esperados que vienen dados por la distribuci6n muestral adecuada. Una distribucion
222 ESTAOiSTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTAOiSTICA Y VARIABLES CONTINUAS 223

Recuadro 12.1

Estimador no sesgado de la varianza poblacional


A 10 largo de este libro, hernos reeurrido a un experimento muestral eada vez que Se eneuentra que la varianza media es 10/16 = 0.625. Reeordemos que la va.ria~za
deseabarnos ilustrar un eoneepto de fundamental importancia en el anal isis estadistieo. de la poblacion es 1.25. En este experimento muest~al, empleando N en el denomm~ or
Observemos la formula de la varianza y demostremos que con el denominador N _ 1 de la formula de la varianza, la varianza medIa. de todas las muestras posl~I:~
se obtiene un estimador no sesgado de la varianza poblaeional, en tanto que con el de N = 2 subestima la varianza poblaeional. General~zando, eua~do se emplea N e
denominador N se llega a un valor subestimado de la misma. denominador de la formula de la varianza, se obtiene un estimador sesgado de la
Imaginemos el siguiente experimento muestral. Coloquemos en una bolsa la poblacion varianza poblaeional. .
eonstituida por los numeros '1, 2, 3, 4. La media de esta poblacion es 2.5 y la Repitamos ahora el mismo proeedimiento usando N - 1 para ealcular la vananza
varianza 1.25. Se seleeeionan, con reposicion, todas las muestras posibles de N = 2 Y se de eada muestra.
ealcula la varianza de eada muestra, usando N y N - 1 en el denominador. Tal como
antes, eoloeamos la media de eada muestra en la posicion eorrespondiente a ambas Varianza de cad a muestra cuando se usa N - 1 en el denominador
extraeciones, y situamos ahora la varianza de eada muestra en los lugares adeeuados. (N = 2)
Sigamos primero este proeedimiento usando N en el denominador al calcular eada una
de las varianzas muestrales. PRIMERA EXTRACCION
3 4
Varianza de cada muestra cuando se usa N en el denominador
(N = 2)
0.00 0.50 2.00 4.50
0.50 0.00 0.50 2.00
PRIMERA EXTRACCION
2.00 0.50 0.00 0.50
2 3 4 4.50 2.00 0.50 0.00
-c ~I 0.00
Cl ­ 1 0.25 1.00 2.25
z U 2 0.25 0.00
::JU 0.25 1.00
e -c 3 1.00 0.25
UJ!l: 0.00 0.25 La distribucion de freeuencias y la media de las varianzas muestrales apareeen
cn~4 2.25 1.00
UJ 0.25 0.00 en la euarta tabla.

5' 152
Construyamos ahora una distribucion de freeuencias de estas varianzas y ealculemos
la varianza media.
4.50 2 9.00
2.00 4 8.00
0.50 6 3.00
52
152 0.00 4 0.00

2.25 2 4.50 l/= 16 l/S2 = 20.00


1.00 4 4.00
0.25 6 1.50
0.00 4 0.00
.
Ahora Ia vananza
. media es 20/16 - 1.25. Notese que este valor es.
identico
. al ded la
l/= 16 l/S2 = 10.00 .
vananza de I poblacionAsi
a. , usando N - 1 en el denominador se obtiene un estima .or
no sesgado de la varianza poblaeional.
224 ESTAOfSTICA PARA LAS CIENCIAS SOCIALES
INFERENCIA ESTADfSTICA Y VARIABLES CONTINUAS 225

muestral hipotetica de las medias muestrales esta asociada con cualquier media mues­
no ses ado de la varianza (82 ) como el mejor estimador que tenem~s ~ara.}a
tral. Esta distribucion tiene una media us Y una desviacion estandar ax.
acionar,I ASI' , la formula para determinar la varianza de la distribucion
. g po blaci
vananza
Hasta ahora, para obtener los valores de /lx Y ax hemos tenido que conocer /l y a.
uestral de la media a partir de datos muestrales es
En el caso de no conocer los valores exactos de los parametres, nos vemos m -2
obligados a estimar los valores de /l y a mediante estadigrafos calculados a . 2 S
aJe estImada = Sx = N' (12.6)
partir de datos muestrales. Ya que en la practica rara vez tomamos mas de una
muestra, nuestras estimaciones se basan generalmente en los estadigrafos calculados Estimamos eI error estandar de la media extrayendo la raiz cuadrada de este valor:
mediante una sola muestra. Tales estimaciones en las que se usan los valores de una
sola muestra reciben el nombre de estimaciones puntuales.
. 8 fF
ax estimado = sx = '.) N = )N' (12.7)

12.4.1 Estimaci6n de (Jx a partir de los datos muestrales


Si se usa la varianza muestral (no el estimador no sesgado), podemos estimar ax del

Se recordara que definimos la varianza de una muestra en la formula (6.2) como


siguiente modo:

ax estimado = ss = ~ =
s
'IN -1
~)X - X? _
N(N - 1) -
SC
N(N - 1)
. (12.8)* J
2 Dx-xy
s ==----­ La formula (12.8) es la que se emplea mas frecuente~ente en las cienc~as del
N .comportamiento para estimar el error estandar de la media. Nosotros seguiremos
y se obtuvo la desviacion estan dar s hallando la raiz cuadrada de este valor. esta practica, d tili do
Estas definiciones son perfectamente apropiadas cuando se trata solamente de Antes de proseguir, revisemos los simbolos que. hemo~ esta 0 u I.Iz~n .
describir la variabilidad de una muestra. Sin embargo, cuando 10 que interesa es E I tabla 122 se presentan los simbolos para las medias, vananzas y.desvIaclOnes
estimar la varianza poblacional a partir de los valores muestrales encontramos es~a~dar, seg~n se trate de los parametres poblacionales, de los estimadores no
que la definicion anterior es inadecuada, ya que DX - X)2/N tiende en promedio a sesgados 0 de estadigrafos muestrales.
subestimar la varianza poblacional. En otras palabras, es un estimador sesgado
de la varianza poblacional, siendo necesario disponer de un estimador no sesgado.
Definiremos un estimador no sesgado como aquel que es igual, en promedio, ESTIMADORES
POBLACIONALES
al valor del pararnetro, Esto es, cuando afirmamos que un estadigrafo es un PARAMETROS NO SESGADOS
DE LA PARA LA
estimador no sesgado, estamos diciendo que la media de la distribucion de un mi­ DISTRIBUCION DISTRIBUCION
me TO muy grande de estadigrafos muestrales, calculados mediante muestras PARAMETROS MUESTRAL MUESTRAL ESTADIG RAFOS
POBLACIONALES DE LA MEDIA DE LA MEDIA MUESTRALES
provenientes de una poblacion dada, tiende a centrarse en el correspondiente
(TEOIilICOS) (TEORICOS) (EMPIRICOS) (EMPIRICOS)
valor del parametro, Se ha demostrado (recuadro 12.1) que es posible obtener un

MEDIAS II, 110


estimador no sesgado de la varianza poblacional dividiendo la suma de cuadrados

por N - 1. Utilizaremos el simbolo 82 para representar una varianza muestral que


VARIANZAS
constituye un estimador no sesgado de fa uarianza poblacional, y el simbolo 8 para

representar una desviacion estandar muestral basada en un estimador no sesgado de


DESVIACIONES (J S,Sx S
la varianza. Asi, ESTANDAR

Estimador no sesgado de a 2 = 82 =
l)X _X)2
N _ 1 . • La siguiente demostracion algebraica prueba como se llega a este estimador de a.. :
(12.4)
I(X -X)'
5C 52 = 1

Y 5= N
multiplicando ambos miembros de la ecuacion por N/IN - I) obtenemos
N NI(X - X)' _,
a estimada = 8 = p. (12.5)
- - 52
N -I
=
N(N-I)
=5 Ever formula (12.4)]
Asi, segun formula (12.7),

Podemos ahora estimar ai y ax a partir de datos muestrales. Emplearemos


los simbolos s~' y Sx
para referirnos a la varianza estimada y al error estandar de
N
la media, respectivamente. Puesto que no conocemos a 2 , aceptamos el estimador Sustituyendo 5'2 = - - 52, encontramos
N-I
226 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
INFERENCIA ESTADfsTICA Y VARIABLES CONTINUAS 227

12.5 Examen estadistico de hipotesis con parametres se usa el estadigrafo z, la distribuci6n muestral apro'pia~a es la curv~ normal
desconocidos: la t de Student estandar. Para el estadigrafo t hay una familia de distribuciones que vanan como
una funci6n de los grados de libertad (gl). .
EI terrnino «grados de libertad» se refiere al nurnero de valores que son hbres
Anteriormente indicamos que cuando los parametres de una poblaci6n son cono­
de variar una vez que se han impuesto ciertas restricciones a los datos. A modo ~e
cidos, es posible describir la forma de la distribuci6n de las medias muestrales.
ilustraci6n, consideremos los numeros 18, 23, Z7 y 32. Su suma es 1O? y la media
Sera una distribuci6n normal con ax igual a a/JN. Empleando la relaci6n entre
X = 100/4 = 25. Recordemos que si de cada nume~o restamos la ~edia tendremos
la escala z y la distribuci6n normal, podemos examinar estadisticamente hip6tesis
usando un conjunto de cuatro desviaciones cuya suma es igual a cero. ASI,

(X - /10) (18 - 25) +(23 - 25) + (27 - 25) + (32 - 25) = (- 7) +( - 2) + 2 + 7 = O.


Z=--­
ax N6tese tarnbien que las cuatro desviaciones no son independientes. Despues de hab.er
como estadigrafo del examen. Cuando no se conoce a, estamos obligados a estimar impuesto Ia restricci6n de que las desviaciones se toman re~pe~to a la media,
su valor mediante datos muestrales. En consecuencia, la ax estimada (que es sx) solamente quedan libres para variar 10 valores de tres de las desviaciones, En c.uanto
debe basarse en la a estimada (que es s), de modo que se conocen tres de las desviaciones, la cuarta queda completamente determmada.
Dicho de otra forma, solamente tienen libertad de variar los valores de tres
s- desviaciones. Por ejemplo, si sabemos que tres de las desviaciones son - 7, - 2 y 7,
Sg = - - .
~ podemos calcular la desviaci6n desconocida utilizando la igualdad

Ahora, si sustituyendo s por a obtenemos una aproximaci6n razonablemente (Xl - X) + (X 2 - X) + (X 3 - X) + (X 4 - X) = o.


buena de la distribuci6n de las medias muestrales, podriamos continuar utilizandoz Por tanto,
c~m~ estadigrafo del exame~ y la curva normal como modelo para nuestra
distribucion muestral. En reahdad, este no es el caso. A comienzos de siglo un
estadistico Ilamado William Gosset, que escribia bajo el seud6nimo de Student
observ6 que la aproximaci6n de s a a es deficiente, sobre to do para. muestras En el presente ejemplo,
pequeiias. Esta falta de aproximaci6n se debe al hecho de que, con muestras pe­ (X 4 - X) = 0 - (-7) + (-2) + 2
queiias, s tiende a subestimar a a mas de la mit ad de las veces. En consecuencia, = 0 +7- 2 + 2 = 7.
el estadigrafo

X - /10 Generalizando: Para cualquier muestra dada en la que hemos impuesto una sola
restricci6n, el numero de grados de libertad es N - 1. En el ejemplo anterior,
s/~ N = 4; por tanto los grados de libertad son 4 -.1 = 3.
tendera a dispersarse mas que la distribuci6n normal. N6tese que cuando se emplea s/~ [formula (12.8)J ~ara obtener sx, e~
La mayor contribuci6n de Gosset a la estadistica consisti6 en su descripci6n numero (N - 1) bajo el signo radical representa los grados de hbertad. ..
de una familia de distribuciones que permiten el examen de hip6tesis con muestras Anteriormente indicamos que el usa de la t de Student depende de adrnitir que.la
provenientes de poblaciones normalmente distribuidas, euando a es desconocida. poblaci6n basica tiene distribuci6n normal. Esta condici6n provie~e de una. propie­
Estas distribuciones se conocen como distribuciones tot de Student. EI cociente dad unica de las distribuciones normales. Dado que las obseroaciones son indepen­
empleado en el examen de hip6tesis es conocido como cociente t, y es dientes y aleatorias, las medias muestrales y las oarianzas muestrale.s s~lamente son
independientes cuando la poblacion tiene distribucion 11.0rmal., Como indicamos ante­
x- /10 . riormente dos datos 0 estadigrafos son independientes solamente euando los
valores de uno no dependen de los valores del otro ~ viceversa. ~as pruebas
t= , (12.9)
Sg
de significaci6n de las medias requieren que las medias y las van~nzas. s~an
donde /10 es el valor de la media poblacional bajo H o..
independientes entre si, Ellas no pueden variar juntas de una forma. siste:nah~a;
EI estadigrafo t es similar en muchos aspectos a la z anteriormente estudiada. ello ocurriria, por ejemplo, si las varianzas crecieran al crecer las medias. SI vanan
Ambos estadigrafos estan expresados como la desviaci6n de la media muestral
en forma sistematica, la poblaci6n basica no puede ser normal, y las pruebas ~e
respecto a la media poblacional (conocida 0 admitida por hip6tesis) en funci6n significaci6n que se basan en la suposici6n de normalidad .p~eJen quedar sm
del error estandar de la media. Tomando como referencia la distribuci6n muestral validez. Por est a raz6n la suposici6n de normalidad es un requisito para el uso del
apropiada, podemos expresar esta desviaci6n en terrninos de probabiJidad. Cuando cociente t de Student.
228 ESTADisTICA PARA LAS CIENCIAS SOCIALES
INFERENCIA ESTADiSTlCA Y VARIABLES CONTlNUAS 229

. Not~ final: E,l c.ociente t de .Student es un examen fuerte, 10 que significa que las descrita por It I ?: 1.96 incluye aproximadamente ellS por ciento del area total.
l~ferencIas estadisticas son posiblernente validas aun cuando la distribuci6n pobla­
En consecuencia, si emplearamos la curva normal para examinar estadisticamente
cional se aparte, m~cho de la .normalidad. Esta fortaleza es otra consecuencia
hip6tesis cuando N es pequefio (y por tanto gl es tambien pequefio) y (J es desconocida,
del teore~a del limite ~entral. SI tenemos serias dudas acerca de la normalidad de
correriamos el serio peligro de co meter un error del tipo I, 0 sea, de rechazar H 0
la poblacion, es aconsejable aumentar el tamafio N de fa muestra.
siendo verdadera. Obviamente, se requiere un valor mucho mayor de t para determi­
nar los limites de la region critica 0 de rechazo. Ciertarnente, cuando gl = 3, el valor
absoluto de la t obtenida debe ser igual 0 mayor que 3.18 para rechazar H 0 al
12.5.1 Caracteristicas de las distribuciones t nivel de significacion 0.05 (examen bilateral). Sin embargo, cuando gl crece, las
Comparem~s las caracteristicas de las distribuciones t con las que tiene la curva diferencias en las proporciones de area bajo la curva normal y bajo la distribucion t
n.or~~J estandar que nos es ya familiar. Primero, ambas distribuciones son de Student se hacen insignificantes,
s~metncas respecto a una media de cero. Por tanto, la proporci6n de area A diferencia de nuestra utilizacion de la curva normal, los valores tabulados
sltu,ada a la ~ere~ha ?e un valor pos~tivo particular de t es iguaJ a la proporci6n para t (tabla C, apendice III) son valores criticos, es decir, SOil aquellos valores que
de area a la izquierda del correspondiente valor negativo de t. limitan las regiones de rechazo correspondientes a varios niveles de siqnificacion.
Segundovlas distribuciones t son mas dispersas que la curva normal. En Asi, al usar la tabla de las distribuciones t, localizamos en la columna de la
consecuencia, l~, proporcion d,e are~ mas alla de un valor especifico de t es mayor izquierda el numero adecuado de grados de libertad, y encontramos luego en la
que la proporcion de area mas aH~ del valor correspondiente de z. Sin embargo, columna correspondiente el rt. elegido. Los valores tabulados representan el valor
cua~to mayores sean los grados de libertad, mayor sera la semejanza entre las distri­ de t requerido para la significaci6n. Si el valor absoluto del cociente t obtenido es
buciones t ~ l~ cu~va normal estandar, Para que pueda apreciarse la diferencia igual 0 mayor que este valor, podemos rechazar H o­
entre l~s dlstnbuclO?es. t ~ la curva normal, hemos representado tres curvas
en la fig, 12.5: las distribuciones muestraJes de t cuando gl = 3, Y gl = 10 la
curva normal. ' y 12.5.2 Problema ilustrativo: la t de Student
Un exa~en de la fig. 12.5 permite hacer varias observaciones interesantes. Exarninemos ahora un caso hipotetico referente a una muestra pequefia,
Ya hemos VI~tO que,~n .la cu.r,va normal estandar, Izi
?: 1.96 define la region de A un grupo de 17 estudiantes de cuarto afio de bachillerato, seleccionados
rechazo al myel de significacionOjjy, Sin embargo, cuando gl = 3, una regi6n
basandose en su expresado «interes» por la ciencia, se les aplic6 una prueba
para medir su conocimiento de los conceptos cientificos basicos. La prueba fue
gl = 3
ideada para obtener una distribucion normal con una media igual a 78 al ser
aplicada a alumnos de cuarto afio, Los resultados del estudio fueron

x= 84, s = 16, N = 17.

~Es razonable adrnitir que estos alumnos de cuarto afio son representativos
de una poblacion en la que 11 = 78?
Planteemos este problema en terrninos estadisticos mas formales.
1. Hipotesis nula (H o): La media de la poblaci6n de la cual proviene la muestra
es igual a 78 (11 = 110 = 78).
2. Hipotesis alternatiua (HI): La media de la poblaci6n de la cual proviene la
I
muestra no es igual a 78 (11 #- 110)' [Nota: Esta es una alternativa no direccional.J
3. Examen estadlstico: Se elige el cociente t de Student porque estamos tratando
con una variable normal mente distribuida en la que se desconoce (J.
4. N ivel de siqnificacion: rt. = 0.05.
z
5. Distribucion muestral: La distribucion muestral es la distribucion t de Student
con gl = 16. [Nota: gl = N - 1.J
Fig. 12.5 Distribuciones muestrales de t = (X - uo);'~7: cuando gl = 3 y gl = 10 .co d
con la curva normal estandar. ' mpara as 6. Region critica: Ito.051 ?: 2.12. Puesto que HI es no direccional, la region critica
consta de todos los valores de t tales que t ?: 2.12 Y t ,:::; -2.12.
230 ESTADisTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADisTICA Y VARIABLES CONTINUAS 231

En el presente ejemplo, el valor de t correspondiente a X = 84 es vacilar ligeramente, «Bien, quizas su peso se encuentre entre 85 y 115 kilos.
De cualquier modo, estoy completamente segura de que su verdadero peso esta
t =
x - flo = 84 - 78
= 1.50. entre 80 y 120 kilos». Notese que cuanto mayor sea el tamafio del intervalo,
Sx 16/JI6 mayor confianza tendremos de que el verdadero valor este comprendido entre estos
!imites. Notese tambien que al establecer estos !imites de confianza estamos
Decision Puesto que la t obtenida no cae en la region critica (esto es, 1.50 < to,os), haciendo dos cosas: (1) establecemos los !imites entre los cuales creemos que se
no podemos rechazar H o- En otras palabras, no tenemos justificacion estadistica encuentra el verdadero peso del individuo, y (2) rechazamos la posibilidad de que su
para creer que esta muestra proviene de una poblacion en la que la media tiene un verdadero peso este fuera de estos !imites. Asi, si alguien pregunta, «l.Se puede
valor diferente a 78. concebir que este hombre pese mas de 130 kilos 0 menos de 70 kilos 'l», nuestra
respuesta seria negativa.

12.6 Estimaci6n de parametres:


12.7 Intervalos de confianza y limites
estimacion por intervalos
de confianza
Hemos sefialado reiteradamente que uno de los problemas basicos en la inferencia
estadistica es el de la estimacion de los para metros de una poblacion por medio En el ejemplo anterior tratamos, en cierto sentido, el problema de la estimacion
de estadigrafos calculados a partir de una muestra. Este problema incluye, a la vez, de los limites de confianza. En efecto, intentamos determinar el intervalo dentro
dos subproblemas: (1) La estimacion puntual, y (2) la estimacion par interoalos. del cual alguna hipotesis referente al peso del hombre podria considerarse po sible
Cuando estimamos los parametres empleando valores muestrales simples, a estos y fuera del cual tal hipotesis se consideraria imposible. Al intervalo dentro del
valores se les llama estimaciones puntuales. Un valor aislado que se calcula cual consideramos que la hipotesis es posible se le llama interoalo de confianza,
mediante una muestra proveniente de una poblacion proporciona una estimacion y a los !imites que definen al intervalo, limites de confianza.
del parametro poblacional. Pero, l.cual es la calidad de esta estirnacion? Si la Veamos un problema muestral y apliquemos nuestros conceptos estadisticos
poblacion tuviera una media de 100, l.constituiria una buena estimacion una media a la estimacion de los interval os de confianza.
muestral de 60? i. Y una media muestral de 130, 105, 98 0 99.4? l.Bajo que Un distrito escolar esta tratando de decidir sobre la viabilidad de establecer un
condiciones consideraremos que un estimador es buenc ? Puesto que sabemos programa de entrenamiento vocacional en el «curriculum» de sus escuelas publicas
que los pararnetros poblacionales son casi siempre desconocidos y que general mente de ensefianza secundaria. La decision dependera, en parte, de las estimaciones
empleamos muestras para estimar estos parametres, l.hay algun modo de determinar del CI promedio de los estudiantes de secundaria del distrito. Ya que existe
la magnitud del error que posiblemente cometeremos? La respuesta a esta pregunta solamente un psicologo escolar en el distrito, es imposible so meter a una prueba
es negativa. Sin embargo, es posible no solamente estimar el para metro poblacional individual a cad a estudiante. En consecuencia, debemos contentarnos con aplicar
iestimacion puntuali, sino tarnbien establecer un rango de valores dentro de los la prueba a una muestraaleatoria de estudiantes y basar en ella nuestros estimadores.
cuales esperamos que este el pararnetro iestimacion par interoalos. Mas aun, Aplicamos la prueba para medir el CI a una muestra aleatoria de 26 estudiantes y
podemos expresar nuestra confianza en terrninos de probabilidades. obtenemos los siguientes resultados:
Supongamos que hemos de estimar el peso de un hombre, basando nuestra
estimacion en un examen fisico. Admitamos que no nos es posible colocarlo en una
x= 108, s = 15, N = 26.
balanza y que tampoco podemos preguntarle su peso, Este problema es parecido Nuestra mejor estimacion de la media poblacional (0 sea el CI medio de los
a muchos de los encontrados en este texto. No podemos conocer el valor poblacional estudiantes dentro del distrito escolar) es 108. Sin embargo, aunque los estadigrafos
(el verdadero peso del hombre) y por tanto nos vemos obligados a estimarlo. muestrales nos proporcionan los mejores estimadores de los parametres poblacio­
Digamos que tenemos la impresion de que su peso es de 100 kilos. Si se nos nales, admitimos que tales estimaciones estan sujetas a error. Como en el caso del
preguntara, «l.Que confianza tiene usted en que el peso del hombre sea exactamente problema del peso, seria mucha suerte que el CI medio de la poblacion de estudiantes
de 100 kilos?», probablemente responderiamos: «Dudo que pese exactamente 100 ki­ de secundaria fuera realmente de 108. Por otra parte, si hemos empleado proce­
los. Si este es el peso, crearne que tuve una suerte increible para adivinarlo. dimientos adecuados de seleccion aleatoria, tenemos derecho a creer que nuestro
Sin embargo, puedo estar razonablemente seguro de que su peso esta entre 90 valor muestral debe estar muy proximo a la media poblacional. La pregunta
y 100 kilos». Al hacer esto, hemos establecido el intervalo dentro del cual importante que surge es: l.Entre que !imites consideraremos sostenibles las hipotesis
confiamos este el verdadero peso. Despues de un momenta de reflexion, podriamos referentes al valor de la media poblacional (fl) en inteligencia?
232 ESTADfSTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADfsTICA Y VARIABLES CONTINUAS 233

Hem~s visto que la IJo1~dia de la.~istribuci6~ de las medias muestrales (fly) es igual Igualmente, para el limite inferior
a la media ~e la poblacion. T~mbl~n se ha VIStO que, puesto que para cualquier N
dado, es posible deterrninar cuan alejadas es probable que esten las medias muestrales limite inferior flo = X- to.0 5(Sy ). (12.11)
de cualquier valor dado 0 hipotetico de u, podemos determinar tarnbien la
probabilidad de que una X particular provenga de una' poblaci6n con media flo, Para obtener los Iimites del intervalo de confianza del 99 por ciento, sustituimos
donde flo representa el valor de la media poblacional bajo R o. Ahora bien, simplemente t o.O! en las formulas anteriores.
dado que no conocemos el valor de la media poblacional, quedamos Iibres para Notese que estas formulas se derivan algebraicamente de la formula (12.9):
formular cualquier valor que deseemos.
Debe quedar claro que podriamos considerar un numero ilimitado de hip6tesis . X- flo
referentes a la media poblacional y a continuacion rechazarlas, 0 dejar de rechazarlas t o.05 = SJ{ , por tanto flo = X- t o.05(sx).
basim?ose en la magnitud ~e los cocientes t. Por ejemplo, en el problema present~
seleccionarnos algunas medias poblacionales hipoteticas. Podemos usar el nivel de Empleando la formula (12.10), hallamos que en el problema anterior el limite
significaci6n de 0.05 (examen estadistico bilateral), y examinar la hip6tesis de que superior del intervalo de confianza del 95 p'or 100 es
flo = 98. EI valor de t correspondiente a X = 108 es

108 - 98 limite superior flo = 108 + (2.060)(3.0)


t = = 3.333. = 108 + 6.18 = 114.18.
15/J25
Analogamente, empleando la formula (12.11), hallamos que ellimite inferior del inter­
En la tabla C. hallamos que para 25 gl el valor de t o.05 es 2.060. Puesto que el
valo de confianza es
valor de t obtemdo es mayor que este valor critico, rechazamos la hip6tesis de
que flo = 98. En otraspalabras, es improbable que X = 108 provenga de una limite inferior Ilo = 108 - (2.060)(3.0)
poblaci6n con media igual a 98.

= 108 - 6.18 = 101.82.


Nuestra hip6tesis siguiente es que flo = 100, 10 cual da

108 - 100 .
Habiendo encontrado que los Iimites inferior y superior son 101.82 y 114.18,
t = 3 = 2.667.
respectivamente, podemos lIegar a la siguiente conclusion: Basandose en la media
y en la desviacion estandar halladas, que fueron calculadas a partir de valores
Puesto que 2.667 > t o.05 (0 2.060), podemos rechazar la hip6tesis de que la obtenidos de una poblacion cuya media es desconocida, afirmamos que es pro­
media poblacional es 100. bable que la media poblacional se halle dentro del intervalo que hemos esta­
Si formulamos la hip6tesis de que flo = 102, la t resultante es 2.000, valor que es blecido.
menor que t o.05· En consecuencia, podemos considerar como admisible la hipotesis Haremos algunas advertencias en cuanto a la interpretacion del intervalo de
flo .~ ~02 ..Analogamente, cal~~lando los valores apropiados de t, hallariamos que confianza. AI establecer el intervalo dentro del cual creemos que se halla la media
la hipotesis flo = 114 es adrnisible, en tanto que para valores mayores que 114 las poblacional, no se ha establecido ninguna probabilidad de que la media obtenida
hipotesis no son admisibles. Asi, X = 108 proviene probablemente de una poblacion sea la correcta. En otras palabras, no podemos afirmar que las probabilidades
cuya ~edia se halla en el intervalo 102-114 (notese que estos Iimites, 102 y 114, son son de 95 en 100 de que la media poblacional sea igual a 108. Nuestras afirmaciones
aproximados pues ~e trata de los enteros mas cercanos). Se puede rechazar la son validas solamente respecto al intervalo y no respecto a cualquier valor
hipotesis de que X = 108 proviene de una poblacion con fl < 102 0 fl > 114, particular de la media muestral. Ademas, puesto que la media poblacional es un
a un nivel de significacion de 0.05. AI intervalo en el cual se halla probablemente valor fijo y no tiene una distribucion, nuestras afirmaciones de probabilidad
la media poblacional se Ie llama interoalo de confianza, y a los extremos de este nunca se refieren a fl.
intervalo, limites de corfianza. Puesto que hemos estado empleando rx = 0.05, La probabilidad de que hablamos se refiere al intervalo, 0 sea, a la probabilidad
lollamaremos interualo de confianza del 95 por ciento. Analogarnente, si emplearamos de que el intervalo contenga a fl.
rx = 0.01, podriamos obtener el interoalo de confianza del 99 por ciento. Finalmente, al establecer el intervalo de confianza de la media, no estamos
No es necesario efectuar todos los calculos anteriores para obtener los Iimites indicando que la probabilidad de que el intervalo particular que hemos hallado
de confianza. Podemos calcular directamente los Iimites exactos del intervalo de .contenga a la media poblacional es de 0.95. Debe quedar claro que si tornaramos
confianza del 95 por ciento. Estos Iimites son: varias muestras de una poblacion, la media muestral y la desviacion estandar
variarian de muestra a muestra. En consecuencia, los intervalos de confianza
limite superior flo = X + t o.05(Sy ). (12.10) tambien variarian de una a otra. AI establecer el intervalo de confianza del
INFERENCIA ESTADfSTICA Y VARIABLES CONTINUAS 235
234 ESTADfsTICA PARA LAS CIENCIAS SOCIALES

95 por ciento para fa media, 10 que estamos diciendo es que si de una poblaci6n
12.8.1 .Examen estadistico de H 0: p = 0
se tomaran repetidas muestras de un tamafio dado, el 95 por ciento de los intervalos Para examinar la hipotesis nula c!.tC que e1 coeficiente de corre1aci6n poblacional
calculados inc1uirian a la media poblacional. es igual acero, se puede usar la v~ariable

(12. J 2)
12.8 Ensayo de la significacion para
la r de Pearson: caso de una sola muestra EI numero de grados de libertad en este caso es igual a N - 2.
Veamos un ejemplo i1ustrativo: Un grupo de psicologos sociales desarroll6
En el capitulo 8 se estudi6 el calculo de dos estadigrafos (Ia I" de Pearson y una escala para medir el grado de acatamiento a la autoridad. Las calificaciones
la I"s de Spearman) comunrnente empleados para describir el grado de relaci6n obtenidas por 15 personas en esta escala fueron corre1acionadas con las calificaciones
entre dos variables. Se recordara que el coeficiente de correlaci6n varia entre que obtuvieron en una prueba que reveleba el grado de prejuicio hacia los grupos
± 1.00, indicando I" = 0.00 la ausencia de relaci6n. Es facil descuidar el hecho de que minoritarios. Se obtuvo una I" de Pearson igual a 0.60. ~Puede llegarse a la
los coeficientes de correlaci6n basados en datos muestrales son solamente estima­ conclusi6n de que no es probable que la correlaci6n obtenida provenga de una
dores del correspondiente pararnetro poblacional y, como tales, tend ran una distri­ poblaci6n donde e1 coeficiente de corre1aci6n es igual a cero?
buci6n alrededor de dicho para metro. Asi, es muy posible que una muestra Planteemos este problema en terrninos estadisticos formales.
obtenida de una poblaci6n en la que la correlaci6n es cero pueda dar lugar,
1. Hipotesis nula (H D): EI coeficiente de correlaci6n de la poblaci6n de la cual
pOI" azar, a una correlaci6n positiva 0 negativa alta. La hipotesis nula que se
proviene la muestra es igual a 0.00 (p = 0.00).
investiga con mayor frecuencia en el caso de una muestra unica es la de que et
coeficiente de correlacion poblacional (p) sea igual a cero. 2. Hipotesis alternatiua (H d: El coeficiente de correlaci6n de la poblaci6n de la
Esta claro que se necesita aplicar una prueba de significaci6n. Sin embargo, cual proviene la muestra no es igual a cero. (p #- 0.00).
el examen estadistico es complicado por el hecho de que la distribuci6n de p es Examen estadistico: La prueba t con N - 2 grados de libertad.
usualmente no normal, particularmente cuando p tiende a los valores Iimites
de ± 1.00. Consideremos el caso en que p es igual a + 0.80. Esta claro que los N ice! de siqnificacion : rJ. = 0.05, examen bilateral.
coeficientes de correlaci6n muestrales provenientes de esta poblaci6n se distribuiran Distribucion muestral: La distribuci6n t de Student con gl = 13.
alrededor de +0.80 y podran tomar cualquier valor entre -':"-1.00 y + 1.00. Sin It
Region critica: 0.051 ?: 2.160. Puesto que H 1 es no direccional, la regi6n
embargo, es igualmente evidente que existe una restricci6n definida en el rango critica consta de todos los valores de t ?: 2.160 y t :E;; - 2.160.
de valores que pueden tomar los estadigrafos muestrales mayores que +0.80,
mientras que no existe una restricci6n similar para los valores menores que En e1 presente ejemplo,
+0.80. EI resultado es una distribuci6n muestral negativamente sesgada. La desvia­
ci6n respecto a la normalidad sera menor a medida que au mente e1 nurnero de t = 0.60 jl3 = 2.70.
parejas de valores en la muestra. Si el coeficiente de correlaci6n de la poblaci6n 0.80
de la cual proviene la muestra es igual acero, la distribuci6n muestral tiene
mayor probabilidad de ser normal. Estas relaciones se pueden apreciar en la fig. 12.6, Decision Puesto que t > to. os. esta en la regi6n critica y se debe rechazar H o­
donde estan representadas las distribuciones muestrales del coeficiente de correlaci6n Asi, se puede lIegar a la conclusi6n de que la muestra proviene de una poblaci6n
cuando p = -0.80,0 Y +0.80. en la que p > 0.00. .

Examen estadistico de otras hipotesis nulas


referentes a p
Fig. 12.6 Represcntaci6n grafica No se debe usar la variable t para examinar hip6tesis diferentes a p = 0.00
de las distribuciones mucstralcs porque, como sefialamos antes, la distribuci6n muestral no es normal para valores
de los coeficicntes de correlaci6n de p diferentes de cero.
cuando p = -0.80 y cuando Fisher describi6 un procedimiento para transformar la I" muestral en un
- 1.00 . 0.80 0.80 1.00 1"= +O.HO.
236 ESTAOfSTICA PARA LAS CIENCTAS SOCIALES INFERENCIA ESTAOfSTICA Y VARIABLES CONTINUAS 237

estadigrafo z., cuya distribuci6n es aproximadamente normal, aun para muestras Puesto que el r, obtenido de 0.64 es mayor que el valor critico al nivel
en que N es pequefio. de 0.05, podemos llegar a la conclusi6n de que el valor del coeficiente de correla­
EI estadigrafo empleado para el examen es la desviaci6n normal Z, en la cual ci6n de Spearman en la poblacion de la cual proviene la muestra es mayor que 0.00.
::,. - Z,.
z- (12.13)
)l/(N- 3)'
donde Resumen del capitulo
z; = valor transformado de hi r muestral, y Hemos visto que si tomamos muestras de una poblaci6n dada, entonces:
Z, = valor transformado del coeficiente de correlacion poblacional especificado
bajo n.: 1. La distribucion de las medias muestrales tiende a ser normal.
2. La media de estas medias muestrales (j.J.x) es igual a la media de la po­
Usando el mismo ejemplo anterior, examinaremos la hipotesis H 0 de que la p de la blaci6n (j.J.).
poblacion de la cual proviene la muestra es igual a 0.25. Recordemos que
3. EI error estandar de la media (ax) es igual a a/JN. Cuando N crece,
r = 0.60 y N = 15.
la variabilidad decrece.
La obtenci6n de z; se simpJifica grandemente utilizando la tabla F del apendice II,
ya que dicha tabla proporciona el valor de z; correspondiente a cada valor de r, Usamos estas relaciones en el examen estadistico de hip6tesis (por ejemplo,
de 0.01 en 0.01, desde 0.00 hasta 0.99. Asi, refiriendonos a la tabla F, vemos que a j.J. = j.J.o) cuando se conoce. la desviaci6n estandar de la poblaci6n, por medio
una r de 0.60 Ie corresponde una z; de 0.693. del estadigrafo Z y la curva normal estandar,
Analogarnente, a una p de 0.25 Ie corresponde una Z, de 0.256. Sustituyendo Para el caso en que a sea desconocida, presentamos el empleo de los estadigrafos
estos valores en la formula de Z, obtenemos muestrales para estimar estos parametres. Usamos estos valores estimados de los
parametres para examinar hipotesis, empleando el cociente t de Student y las
0.693 - 0.256 0.437 correspondientes distribuciones muestrales. Comparamos estas distribuciones t, que
JT/(15---=-3j = 0.289 = 1.51. varian en funci6n de los grados de libertad (gl), con la curva normal estandar,
! ! / '
Usamos el cociente t como base para obtener intervalos de confianza.
Decision Al nivel de 0.05, examen e~tadistico bilateral, se requiere que h.051 ;): 1.96 Finalmente, estudiamos el examen de la significacion para la r de Pearson y para
para que el resultado sea significativo. Puesto que Z = 1.51 es menor que los . la r, de Spearman en el caso de una muestra.
valores criticos, no podemos rechazar H o- Es posible entonces que la muestra
provenga de una poblaci6n en la que el coeficiente de correlaci6n es igual a 0.25.

Terminos para recordar


12.8.3 Examen estadistico de la significaci6n de r s :
caso de una sola muestra .cociente t grados de libertad
En la tabla G del apendice III se presentan los valores crfticos de r s , en los ca­ distribuciones t intervalo de confianza
sos de exarnenes uni y bilaterales, para valores seleccionados de N desde 5 hasta 30. error esuindar de la media limites de confianza
En la secci6n 8.5 se vio el calculo de r s para 15 parejas de valores ordenadas
estimacion por intervalo region critica
segun su rango. Se encontr6 una correlaci6n de 0.64.
Puesto que N = 15 no aparece en la tabla G, es necesario interpolar empleando estimacienpumual teorema del limite central
los valores criticos correspondientes a N = 14 y N = 16. Al nivel de 0.05 en un estimador no sesgado de un pardmetro valores criticos de t
examen bilateral, el valor critico para N = 14 es 0.544, y para N = 16 es 0.506.
UtiJizando una interpolaci6n lineal, podemos encontrar en forma aproximada eI
valor critico correspondiente a N = 15.
COil la tabla G, la interpolaci6n lineal consiste simplemente en sumar los Ejercicios
valores extremos de r, Ydividir por 2. Asi,

0.544 + 0.506 1. Describir 10 que sucede con la distribucion de las medias muestrales cuando

1",(0.05) = - - - 2 - - - = 0.525. a) se incrementa el tamaiio de cada muestra,

b) se incrementa el nurnero de muestras.

238 ESTADfsTTCA PARA LAS CTENCTAS SOCTALES INFERENCIA ESTADfSTlCA Y VARIABLES CONTINUAS 239

2. Explicar por que raz6n la desviacion estandar de una muestra subestima generalmente 11. Es axiornatico que cuando se seleccionan al azar parejas de individuos y se correlacionan
la desviacion estandar de la poblacion, Dar un ejemplo. las calificaciones obtenidas en una prueba de inteligencia por los primeros miembros de las
3. Sabiendo que X = 24 y s = 4 para N = 15, utilizar la distribuci6n t para hallar parejas con las obtenidas por los segundos, se tiene p = 0.00.
a) los lirnites de confianza del 95 por ciento para /1,
a) Se seleccionan al azar 39 parejas de hermanos, y se encuentra para ellos, en
b) los Iimites de confianza del 99 por ciento para /1.
cuanto a inteligencia, que r = +0.27. i,Tienen los herrnanos mayor semejanza res­
pecto a inteligencia que los individuos que no tienen ninguna relaci6n entre si?
4. Sabiendo que X = 24 y s = 4 para N = 121, usar la distribuci6n t para hallar

b) En un estudio de 28 parejas de gemelos univitelinos, se obtuvo al analizar sus


a) los Iimites de confianza del 95 por ciento para /1,

calificaciones en una prueba de inteligencia, que r = +0.91. i,Cual es la conclusion?


b) los Iimites de confianza del 99 por ciento para /1.

Comparar los resultados con los del ejercicio 3.


Los directivos de cierta universidad afirman que, en razon de los mejores servicios que
ofrecen y de 13 supervision mas estricta de los trabajos, sus estudiantes completan el
5. Un profesor hace una prueba en la que /1 = 78 Y a = 7, de acuerdo con su experiencia programa de doctorado en tiempo mas breve que el usual. Basan esta afirrnacion en el hecho
de afios anteriores. Su clase actual de 22 alurnnos obtiene una nota media de 82. i,Es de que la edad media de los estudiantes que terminan el doctorado en el pais es de 32.11,
correcto admitir que se trata de una c1ase sobresaliente? Utilice Ci. = 0.01, examen bilateral. mientras que los 26 estudiantes que culminaron el doctorado en su universidad 10 hicieron a
Un profesor hace una prueba .en la que /1 = 78, de acuerdo con su. experiencia de una edad media de 29.61 con s = 6.00. Examinar la validez de la afirmacion.
afios anteriores. Su c1ase actual de 22 alumnos obtiene X = 82 y s = 7. i,Es correcto 13. Usando los datos del ejercicio anterior, hallar el intervalo de confianza del 95 ~~
admitir que esta es una clase sobresaliente? Use Ci. = 0.01, examen bilateral. ~i~r~ la verdadera media poblacional (edad promedio para el doctorado en dicha universidad),
7. Expliquese la diferencia entre los ejercicios 5 y 6. i,Que variable se emplea en cada uno '14.: Un sociologo afirma que la duraci6n promedio de la etapa de noviazgo es mayor
de los examenes y por que? i,Por que son diferentes las decisiones? 3.~tes de un segundo matrimonio que antes del primero. Basa su afirmaci6n en el hecho de que
el promedio para efectuar un primer matrimonio es de 265 dias, mientras que el promedio
Generalizacien: i,Cmil es el efecto que produce el conocimiento de a sobre la probabili­ para efectuar un segundo matrimonio (10 constato en 626 individuos) es de 268.5 dias
dad de cometer un error del tipo II? con s = 50. Examinar la validez de su afirmaci6n.
15. Usando los datos del ejercicio anterior, hallar el intervalo de confianza del 99 por ciento
8. EI director de cierto distrito escolar afirma que los nmos de su distrito son mas
para la verdadera media poblacional (dias de noviazgo antes de un segundo matrimonio).
brillantes, en promedio, que la poblacion general de estudiantes. Se llevo a cabo un estudio
para determinar el CI de los escolares del distrito. Los resultados aparecen en la tabla 16. Se toman muestras aleatorias de tamafio 2 de una poblacion finita formada por los
adjunta. La media de la poblacion general de escolares es de 106. Expresar esta situaci6n siguientes numeros: 1,3,5,7,9 Y 11.
en terrninos estadisticos mas formales (0 sea, H o, HI. etc.) y lIegar a las conclusiones a) Calcular la media y la desviaci6n estandar de la poblaci6n.
apropiadas. Usar un examen unilateral, Ci. = 0.05. b) Construir un histograma para la distribuci6n muestral de las medias cuando N = 2.
EI muestreo usado es sin reposici6n.
CALIFICACIONES
c) Construir un histograma para las medias de todas las muestras posibles que se
EN LAS PRUEBAS
pueden tomar en un muestreo con reposici6n.
17. Utilizando la parte (b) del ejercicio 16, contestar a 10 siguiente: Tomando una muestra
105

109

con N = 2, i,cual es la probabilidad de que


115
a) se obtenga una media tan alta como 10?
112
b) se obtenga una media tan baja como 2?
124
c) se obtenga una media tan desviada como 8?
115
d) se obtenga una media tan baja como I?
103
18. Usando la parte (c) del ejercicio 16, contestar a 10 siguiente: Tomando una muestra
110

con N = 2, i,cual es la probabilidad de que


125

a) se obtenga una media tan alta como 1O?


99

b) se obtenga una media tan baja como 2?


c) se obtenga una media tan desviada como 8?
9. Para una poblaci6n particular con /1 = 28.5 y a = 5.5, i,cual es la probabilidad de que, d) se obtenga una media tan baja como I?
en una muestra de 100, X sea
a) menor 0 igual que 30.0? b) menor 0 igual que 28.0?
19. Un analista de la bolsa de valores afirma que posee un metoda excepcionalmente
c) igual 0 mayor que 29.5? d) comprendida entre 28.0 y 29.0
preciso para pronosticar las subidas de la cotizaci6n de las acciones. En un periodo de
tiernpo dado, las acciones cuya compra recomend6 tuvieron las siguientes subidas en su
10. Sabiendo que X = 40 para N = 24, de una poblaci6n en la que a = 8, hallar cotizacion: $1.25, $2.50, $1.75, $2.25, $3.25, $3.00, $2.00, $2.00. Durante el mismo periodo
a) los Iimites de confianza del 95 por ciento para /1, el mercado mostro un alza media de $1.83. Plantear y examinar la H ° de que las acciones
b) los limites de confianza del 99 por ciento para /1. indicadas se escogieron al azar de la poblaci6n de acciones durante el periodo especificado.
240 ESTADfsTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADisTICA Y VARIABLES CONTINUAS 241

20. Con el fin de probar un aditivo para la gasolina, se estudi6 el rendimiento de 10 MEDIAS TOMADAS DE LA POBLACION 1
autom6viles bajo una supervisi6n rigurosa. Los rendimientos observados fueron de 15 12 13
16.' 17, 11, 14, 15, 13 Y 14 kil6metros por litro de gasolina. En miles de pruebas anterior;s c~n I~
3 5 5 6 6 6 B 9

~lIsma gasolina, pero sin el aditivo, se obtuvo un rendimiento medio de 12.63 kilornetros por 0 3 4 5 5 6 6 6 7 7 8 9
htro. Usando C( = 0.05, i,se puede liegar a la conclusion de que el aditivo mejora el numero de :5 1 2 3 4 4 5 5 5 6 6 7 8
kilo metros por Iitro? w 2 1 2 3 3 4 4 4 5 5 6 7
0
rn N 2 1 2 3 3 4 4 4 5 5 6 7
21. EI propietario de un restaurante c1asific6 a sus 17 camareros de acuerdo con su velocidad «2 4 4 5 6
00 3 0 1 2 2 3 3 3
y eficiencia en el trabajo. AI correlacionar estos rangos con el total de las propinas recibidas «­
~u 3 0 1 2 2 3 3 3 4 4 5 6
por cada uno en una semana, encontr6 que r. = 0.438. i,Cual es la conclusi6n? 0:5 3 0 1 2 2 3 3 3 4 4 5 6
t-lD
22. El propietario de una cornpafiia de alquiler de autom6viles hizo la c1asificaci6n de rn 0 4 -1 0 1 1 2 2 2 3 3 4 5
«"­ 2 2 2 3 3 4 5
25 c1ientes con respecto a la pulcritud y cuidado general del coche alquilado durante un Ci 4 -1 0 1 1
w 1 1 1 2 2 3 4
periodo de tres meses. Correlaciono estos rangos con el mimero de kil6metros recorridos por ~
5 -2 -1 0 0
6 -3 -2 -1 -1 0 0 0 1 1 2 3
cada c1iente en el mismo periodo de tiempo, y obtuvo que r, = -0.397. Empleando C( = 0.05,
examen bilateral, i,cual es la conclusion?
23. Como requisito de ingreso en cierta universidad, un aspirante ha de someterse a un
examen estandarizado de selecci6n. La correlaci6n entre el rendimiento en este examen y las N6tese que la media de las medias de la poblaci6n 1 es igual a 6, y que esta media para la

notas obtenidas en la universidad fue de 0.43. poblaci6n 2 es igual a 3.

a) EI presidente del tribunal de ingreso afirma que un procedimiento mejor de predecir a) Construyase una distribuci6n de frecuencias y de probabilidades de las diferencias

el exito en la universidad es el de usar las notas promedio obtenidas en el bachillerato, entre medias (X I - X 2)'

Para respaldar su afirrnacion, seleccion6 aleatariamente 52 estudiantes y correlacion6 b) Basandose en la intuici6n, estimese cual seria la media de estas diferencias. Calculese

sus notas en la universidad con sus notas en eI bachillerato, y obtuvo que r = 0.54. ahora la media de las diferencias. i,Fue muy precisa la estimaci6n? Formulese una

i,Cual es la conclusi6n? generalizaci6n acerca de la media de la distribuci6n muestral de las diferencias

b) El ayudante del director prepara una prueba que considera es mejor para predecir entre medias.

el exito en la universidad que la usada cornunmente, Selecciona al azar 67 estudiantes


*31. Modifiquemos Iigeramente el experimento muestral anterior. Imaginese que sabemos que

y correlaciona sus calificaciones promedio con el rendimiento en dicha prueba, la primera bolsa contiene la poblaci6n de medias a la que hemos llamado poblaci6n 1.

y obtiene r = 0.61. i,Cual es la conclusi6n? Sin embargo, la poblacion de medias de la segunda bolsa nos es completamentedesconocida,

24. i,CU<lles son los estadigrafos usados para describir la distribuci6n de una muestra? Tomamos una muestra de cada una de las bolsas y calculamos las medias muestrales,

i,Cuales para un estadigrafo muestral? Restando la segunda media de la primera, obtenemos una diferencia entre medias muestrales.

25. i,Es 52 un estimador no sesgado de (J2? i,Por que? a) i,Cual es la hip6tesis estadistica mas adecuada que debemos examinar?

b) i,Cual es la distribuci6n muestral frente a la cual deberiamos examinar H a :Ill = 1l2?

26. i,Es 52 un estimador no sesgado de (J2? i,Por que? c) Construir una distribuci6n de frecuencias y probabilidades de las diferencias entre

27. i,Que es un intervalo de confianza? medias bajo la hip6tesis H o :Ill = 1l2' [Sugerellcia: Sup6ngase que la poblaci6n 2 es

identica a la poblaci6n 1, y hallense todas las diferencias posibles entre las medias.]

28. Dar un ejemplo que muestre el efecto del nivel C( en la precisi6n de un intervalo de A esta distribuci6n de probabilidades se la conoce como distribuci6n muestral de las

confianza.
diferencias entre medias, donde la hip6tesis nula es que estamos tomando muestras de

29. i,En que se diferencian las distribuciones t de la distribucion normal? i,Son alguna vez poblaciones identicas.

iguales?
2. Usando la distribuci6n muestral bajo Ho:1l1 = 112 (del ejercicio 31 anterior), hallar la

*30. Imaginemos el siguiente experimento muestral. Se tienen dos poblaciones de medias


robabilidad de obtener una diferencia entre las medias muestrales tal que

formadas por los siguientes valores:


a) 5::;; XI - X 2 ::;; -5 b) XI - X 2 2': 6

Poblacion 1: 3, 4, 5, 5, 6, 6, 6, 7, 7, 8, 9 Poblacion 2: 0, 1, 2, 2, 3, 3, 3, 4, 4, 5, 6 c)X I - X 2 ::;; - 3 d)6::;;X 1 - X 2::;;-6

e) XI - X 2 = -6
Se escriben estos numeros en tarjetas y se las coloca por separado en dos bolsas (una
para cada poblaci6n). Se elige una tarjeta de la poblaci6n 1, se anota la media correspon­ Imaginemos que la verdadera situaci6n es la distribuci6n muestral de las diferencias
diente, y se repone la tarjeta en la bolsa; luego se elije una tarjeta de la poblaci6n 2, se ntre medias que se encontr6 al resolver el ejercicio 30. Hallar la probabilidad de obtener
anota la media correspondiente, y se devuelve la tarjeta a la bolsa. Se resta la media a diferencia entre las medias muestrales tal que
proveniente de la poblaci6n 2 de la media proveniente de la poblacion 1 para obtener una a) 5::;;X I - X 2::;;-5 b) X I - X 22':6

diferencia entre medias. En la tabla siguiente se muestran todas las diferencias posibles entre c) X I - X 2 ::;; - 3 d) 6::;; XI - X 2 ::;; - 6

rr.edias, e) X I - X 2 = - 6
242 ESTADfsTICA PARA LAS CIENCIAS SOCIALES [243]

Inferencia estadistica
13
*34. <?omparar los valores de la probabilidad obtenidos como respuesta a los ejercicios 32 y 33.
Ver s~ pueden formularse observaciones mas generales acerca de las diferentes respuestas
obtenidas,

35. Supongase que las secretarias escriben como promedio 50 palabras por minuto. Un grupo con dos muestras
de secretanas que aprendi6 mecanografia en determinada escuela obtuvo las siguientes
velocidades (palabras por minuto): independientes
55 50 45 75 80 75 80 80
85 60 50 65 60 50 80 50
Calcular el valor de t. lSe puede lIegar a la conclusi6n de que las secretarias preparadas
por esa escuela son superiores en cuanto a su habilidad de escribir a maquina?
36. U~ aficionado a I.~s deportes encontr6 una r. de 0.15 entre los promedios de bateo
de 20 jugadores de beisbol y la cantidad de vitaminas que contienen los cereales que
consumen. lSe puede lIegar a la conclusi6n de que esta correlaci6n es significativa? Distribucion muestral de la diferencia
37. Una pers_~na afirma que ~u cu.r~o de preparaci6n para agentes de seguros de vida permite entre medias
a una cornpanra contratar mas pohzas que la compafiia «prornedio». EI promedio mensual
de co?tr~taci6n de todos los agentes de seguros es de $100000. Una muestra de 10 agentes
que siguieron el curso de preparaci6n dio los siguientes resultados (en miles de pesos): realizamos un experimento referente al aprendizaje del recorrido de un
'Jaberinto, lcmil es el efecto obtenido cuando se usa una droga, comparado con el que
$100 $120 $130 $120 $125 resulta sin dicha droga?
$ 90 $130 $135 $140 $110 lLa tasa de reincidencia de los delincuentesjuveniles con «problemas familiares» es
Si ellector fuera el supervisor de los agentes, ladoptaria el curso propuesto por esa persona? diferente a la de aquellos que no tienen esos problemas?
Calcular el valor de t. lEs distinto el rendimiento en examenes estandarizados de las c1ases donde
38. En .un e~tudio del exito y del fracaso matrimonial, Bentler y Newcomb (1978) dieron asisten alumnos de diferentes edades y de las c1ases donde los alumnos tienen edades
un cuesnonario para rellenar con datos personales a 162 parejas de recien casados. Cuatro analogas?
afios despues, se localiz6 a 77 de las parejas de la muestra original. De elias, 52 seguian Cada uno de los problemas anteriores requiere la comparaci6n de dos muestras
casadas y ?4 se habian se~~rado 0 divorciado. Entre el grupo de los que seguian casados Jmenos. Hasta aqui, con propositos heuristicos, hemos restringido nuestro examen
se encontro que la c?rrelaclOn entre las calificaciones obtenidas por los esposos y esposas en stadistico de hipotesis al caso de una muestra. Sin embargo, la mayor parte de las
una escala de atractivo personal era de 0.59, y la correlaci6n entre sus calificaciones en una investigaciones sobre el comportamiento requieren la comparacion de dos 0 mas
escala de generosidad era de 0.23. Entre el grupo de divorciados estas correlaciones fueron uestras para determinar si es razonable, 0 no, considerar que estas muestras
de 0.07 y 0.13, respectivamente.
provienen de la misma poblaci6n. Si las medias de las dos muestras difieren,
a) Usando Ct. = 0.05, formular y examinar la hipotesis nula de que la correlaci6n ldebemos conc1uir que estas muestras provienen de dos poblaciones distintas?
entre las calificacio.nes de las parejas casadas sobre atractivo personal es igual a cero.
Recordemos nuestra discusion previa acerca de la distribucion' de las medias
Fo~mul~r y exarmnar adernas la hipotesis nula de que la correlaci6n entre las
calificaciones de las parejas divorciadas sobre atractivo personal es igual a cero. muestrales (seccion 12.2). Vimos que debe esperarse alguna variabilidad en los
b) Usand.o Ct. ': 0.05, formular y examinar la hip6tesis nula de que la correlaci6n entre estadigrafos muestrales, aun cuando estas muestras se hayan extraido de la misma
las ca.hficaclOnes de las parejas casadas sobre generosidad es igual a cero. Formular y oblacion. Podemos describir esta variabilidad en funcion de la distribucion de las
exarrunar ademas la hip6tesis nula de que la correlaci6n entre las calificaciones de las edias muestrales. Para conceptuar esta distribucion, imaginamos entonces que se
parejas divorciadas sobre generosidad es igual a cero. xtraia de una poblaci6n un numero muy grande de muestras del mismo tamafio,
ara obtener la distribucion de las medias muestrales. En el caso de dos muestras,
deberemos imaginar que se extraen parejas de muestras, que se halla la diferencia
entre las medias de cada pareja y que se obtiene la distribucion de estas diferencias.
La distribucion resultante sera la distribucion muestral de la diferencia entre medias.
Para ilustrar 10 dicho, supongamos que de la poblacion descrita en la tabla 12.1,
la que J1 = 5.00 y (J = 0.99, extraemos al azar (con reposicion) dos muestras a la
z. Supongamos, adernas, que la primera muestra contiene dos elementos (N I = 2)
que la segunda muestra contiene tres elementos (N 2 = 3). Por ejemplo, la primera
INFERENCIA ESTAOISTICA CON DOS MUESTRAS INOEPENDIENTES 245
244 ESTAOISTICA PARA LAS CIENCIAS SOCIALES

muestra podria estar constituida por los numeros 5 y 6, y la segunda por los mimeros
Recuadro 13.1 4, 4 Y 7. Asi, X I = 5.5, X 2 = 5.0 Y X t - X 2 = 0.5. Supongamos finalmente que
continuamos extrayendo muestras de tamaiios N 1 = 2 y N 2 = 3 hasta obtener un
numero indefinidamente grande de parejas de muestras. Si calculamos las diferencias
+ 20­
entre las parejas de medias muestrales y tratamos a cada una de estas diferencias
sfil (13.41
como un dato original, podemos construir una distribucion de frecuencias de estas
:2 diferencias. Juzgando intuitivarnente, ~que aspecto cabe esperar que tenga esta
:s
a:
+ lO­ distribuci6n? Puesto que tomamos al azar parejas de muestras de la misma
a: poblaci6n, deberiamos esperar una distribucion normal con media igual a cero.
::>
0­ Dando un paso mas, podemos describir la distribucion de la diferencia entre
~ parejas de medias muestrales aun cuando las muestras no provengan de la misma
ffJ 0­
poblacion. Esa distribucion sera normal con media (Mxl-x,) igual a MI - M2' Y con
::>

Ul desviacion estandar (ux -x, Hamada error estandar de fa diferencia entre medias)
UJ
a: . f""
igual a V Ux I + U>: z'
1_

-10­ Asi, la distribucion muestral del estadigrafo

FOTOGRAFIA FOTOGRAFIA
z = (X t - X 2) - (PI - ~12)
DE UN HOMBRE DE UNA MUJER

uK -s,
I
TIPO DE FOTOGRAFIA

es normal y, par tanto, podemos emplear la curva normal estandar en el examen


Se ha dicho ~ue los ojos son las «ventanas del alma». La investigacion ha demostrado estadistico de hipotesis,
que los camblOs.en el.tamafio de las pupilas se pueden tomar como indicacion de 10 que
las personas «sintonizan». Las pupilas de los varones aumentan de tamaiio al ver
fotografias de mujeres y, reciprocamente, las pupilas de las mujeres aumentan de
tarnafio al ver fotografias de varones.
Las cuestiones que surgieron en un estudio fueron: l.Presentan los varones homose­
Estimaci6n de (1 x _x-
1 2
a partir de los datos
xuales una mayor respuesta pupilar ante las fotografias de hombres 0 ante las
fotografias de mujeres? l.Que resulta al cornparar su respuesta pupilar con la de los
muestrales
varones heterosexuales?
. La grafica adjunta* muestra los cambios medios de la respuesta pupilar correspon­ EI estadigrafo z se emplea solamente cuando la desviacion estandar poblacional es
diente ados grupos de sujetos (varones homosexuales y heterosexuales) al ver fotogra­ conocida. Dado que es raro que se conozca el valor de este parametro, nos vernos
fias de hombres y de mujeres. obligados nuevamente a estimar el error estandar que nos interesa, 0 sea, Ux -x' I ,
Puede plantearse varias preguntas interesantes relacionadas con la inferencia
Historicarnente, el error estandar estimado de la diferencia entre medias se definio
estadistica. Consideremos las siguientes:
Como
1. l.Existe una diferencia estadisticamente significativa entre la respuesta pupilar
media de los varones heterosexuales y la de los varones homosexuales al ver
fotografias de hombres?
2. l.Hay una diferencia estadisticamente significativa entre la respuesta pupilar media Sin embargo, con esta formula se obtiene un estimador sesgado cuando Nino es
de I.os varones heterosexuales y la de los varones homosexuales al ver fotografias de
mujeres?
gual a N 2'
Si seleccionamos al azar una muestra de Nt observaciones procedentes de una
S~ pl~~tean otras preguntas en los ejercicios que aparecen al final del capitulo 13 poblaci6n con varianza desconocida, y una segunda muestra aleatoria de N 2
(ejercicios 31 y 32) y al final del capitulo 14 (ejercicios 23 y 24). observaciones tarnbien de una poblacion can varianza desconocida, tendremos que
el siguiente es un estimador no sesgado del error estandar de la diferencia. Este
. * Fuente: Hess, E. H., A. L. Seltzer y 1. M. Shlien, «Pupil response of hetero- and homosexual males to estimador, para el que se admite que las dos muestras provienen de poblaciones con
pictures of men an w.omen: A pilot st~dy», J. Abn. Psych., 70,1965,165-168. Copyright 1965 por The American
Psychological Association, Reproducido con permiso. varianzas iguales, reiine las sumas de cuadrados y los grados de libertad de ambas
uestras, obteniendose asi un estimador unificado del error estandar de la diferencia.
246 ESTADfSTICA PARA LAS CIENCIAS SOCIALES 247
INFERENCIA EST ADfSTICA CON DOS MUESTRAS INDEPENDIENTES

El estimador de que hablamos es


13.3.1 Problema ilustrativo: la t de Student
Uninvestigador desea deterrninar si una droga tiene 0 no efecto en las calificaciones
(13.1 )*
obtenidas por personas que ejecutan una prueba de coordinacion psicomotriz. Se
eligen al azar veinte personas y se las asigna aleatoriamente a una 0 a otra de las dos
Cuando N 1 = N z = N, la formula (13.1) se convierte en condiciones experimentales. Antes de iniciar el estudio, uno de los sujetos se retira
SCI + SC z por razones ajenas a la investigacion. Las nueve personas del grupo 1 (grupo
(13.2)* experimental) reciben oralmente una dosis de la droga antes de efectuar la prueba.
N(N - 1)
Las diez personas del grupo 2 (grupo de control) reciben al rnismo tiempo un
Para obtener la suma de cuadrados de los dos grupos, aplicaremos a cada muestra la placebo.
formula (6.6), y asi Planteemos este problema en terminos estadisticos formales. Los resultados del

SCI = I xi - (L: d
1
2
, y SC z = I x~ - (L: 2)
2

experimento estan indicados en la tabla 13.1.


Tabla13.1 Calificacionesde dos grupos de personas en una
prueba de coordinacion psicomotriz. GRUPO 1
GRUPO 2

EXPERIMENTAL CONTROL

x, xr X 2 X~
13.3 Examen estadistico de hip6tesis: 12 144 21 441

la t de Student 14 196 18 324

10 100 14 196

8 64 20 400

El estadigrafo empleado en el examen estadistico de hipotesis cuando se desconocen 16 256 11 121

las desviaciones estandar poblacionales es nuestro ya conocido cociente t: 5 25 19 361

3 9 8 64

(X 1 - X 2) - (/11 - /12) 9 81 12 144

t = , (13.3)
SXI-Xl 11 121 13 169

15 225

donde (/11 - /12) es el valor esperado de acuerdo a la hipotesis nula.


La hipotesis nula examinada con mayor frecuencia es aquella segun la cual ambas ~)8 996
L151 2445

muestras provienen de la misma poblacion de medias; es decir, (/11 - /12) = O. Sin


embargo, hay veces en que la hipotesis nula puede especificar que existe una N 2 = 10

diferencia entre las medias poblacionales. Imaginemos, por ejemplo, que se conoce la )(2 = 15.100

diferencia entre las estaturas medias de los hombres y mujeres adultos (0 que te­
nemos un estimador adecuado de dicha diferencia). Imaginemos tambien que Hipotesis nula (H o): No hay diferencia entre las medias poblacionales del grupo

tenemos razones para creer que en una localidad determinada esta diferencia puede que recibe la droga, y del grupo que no la recibe, en la prueba de coordinacion

quedar afectada por factores ambientales 0 por el tipo de alimentacion. En este caso, psicomotriz. Esto es, J1.1 = J1.2 0 J1.1 - J1.2 = O.

la hipotesis nula deberia especificar la diferencia conocida entre las estaturas. Asi, si
Hipotesis alternativa (HI): Existe una diferencia entre las medias poblacionales
se sabe que la estatura media de los hombres es 12 em mayor que la de las mujeres, la
hipotesis nula seria de los dos grupos en la prueba de coordinacion psicomotriz. Notese que la
hipotesis alternativa no es direccional. En consecuencia, se empleara un examen
H o : /1M - /1F = 12 ern. bilateral, esto es, J1.1 =1= J1.z·
Recuerdese que en la tabla C del apendice III se obtienen los valores criticos de t Prueba estadistica: Puesto que estamos comparando dos medias muestrales
correspondientes a varios niveles de IX. Puesto que los grados de libertad de las que, segun se presume, provienen de poblaciones normalmente distribuidas con
muestras son N 1 - 1 y N 2 - 1, en el caso de dos muestras el numero total de grados varianzas iguales, resulta adecuado el uso del cociente t de Student para el caso
de libert ad es N 1 + N 2 - 2. de dos muestras.
Nivel de siqnificacion: IX = 0.05.

• Se puede expresar esta formula en funcion de los valores originales. Ver paginas finales de este libra.
Distribucton muestral: La distribucion t de Student con gl = N 1 + Nz - 2,0 sea,

9 + 10 - 2 = 17.

248 ESTADisTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADiSTICA CON DOS MUESTRAS INDEPENDIENTES 249

6. Region critica: It 1 ~ 2.110. Puesto que HinD es direccional, la region critica Una forma de aclarar la «significancia» de una diferencia estadisticamente
consta de todos los valores de t tales que t ~ 2.110 y t s; -2.110. significativa, consiste en averiguar el grado en que las variaciones en la variable
Dado que N 1 "1= N 2 Y se admite que las vari~nzas poblacionales son iguales, experimental (el tratamiento administrado) explican las variaciones que se producen
emplearemos la formula (13.1) para estimar el error estandar de la diferencia entre las en la medida dependiente. En general, cuanto mayor sea el grado de relacion, mayor
medias. La suma de cuadrados para el grupo 1 es sera la importancia del hallazgo. Una medida de asociacion es OJ2 (omega al
cuadrado), cuyo valor estimado es
(88)2
SCI = 996 - -9- = 135.56. t2 - 1
OJ2 est* - ~------ (13.4)
Analogamente, la suma de cuadrados para el grupo 2 es
- t
2
+ NI + N2 - 1
Ejemplo. En elejemplo anterior encontramos que t = - 2.758 con N 1 = 9 y N 2 =
(151)2 = 10. Entonces.
SC 2 = 2445 - ----yo = 164.90.
2 7.61 - 1
OJ est = - - - - - - ­
El valor de t en este problema es 7.61 + 9 + 10 - 1
6.61
=-2 6 =0.26.
5. 1
Este resultado puede interpretarse casi de la misma forma que el coeficiente de
determinacion (r 2 ) que se estudio en el capitulo 9 (ver seccion 9.4). Recuerdese que un
(9.778 - 15.100) - 0 -5.322 coeficiente de determinacion de 0.26 significaria que, segun estimamos, el 26 % de la
1.93 = -2.758. varianza de Yha sido tenido en cuenta por las variaciones en X. Analogamente, OJ2 =
)(135.56 + 164.90) (~ ~) = 0.26 puede interpretarse en el sentido de que el 26 % de la varianza en la medida
17 9+10 dependiente ha sido tenida en cuenta en funcion de las variaciones en la variable del
tratamiento. Si consideramos la multitud de variables que tienen general mente
Decision. Puesto que la t obtenida cae en la region critica (esto es, 1- 2.7581 > influencia en las medidas dependientes, el hallazgo de una variable que tenga en
> 2.110, 0-2.758 < -2.110), rechazamos H o. El valor negativo de t indica cuenta el 26 % de la varianza nos indicara que describe un efecto real e importante.
simplemente que la media del grupo 2 es mayor que la media del grupo 1. Al N6tese que no podernos juzgar la magnitud de la asociaci6n por la simple
referirnos a la tabla C, prescindimos del signo del cociente t obtenido. observaci6n del valor de t. Por ejemplo, imaginemos que se ha encontrado el mismo
De acuerdo con los resultados obtenidos, llegariamos ala conclusi6n de que la valor de t de - 2.758 con N I = N 2 = 75. La diferencia es con toda claridad
droga afecta adversamente a la coordinaci6n psicomotriz, puesto que la calificaci6n estadisticamente significativa. Sin embargo, ~indica un mayor grado de asociaci6n
media en coordinaci6n psicomotriz del grupo que recibi6 la droga es significativa­ entre la variable experimental y la variable dependiente? Veamos.
mente menor que la del grupo placebo. Cuando t = -2.758 y N 1 = N 2 = 75,

2 7.61 - 1
OJ est = - - - - - - ­
7.61 + 75 + 75 - 1
13.4 Estimacion del grado de asociacion
entre la variable experimental =~~=0.04.
156.61
y la variable dependiente A pesar del alto valor de t, estimamos que la variable experimental solamente
tiene en cuenta alrededor del 4 % de la varianza en la variable dependiente. Estos
La obtenci6n de un valor de t estadisticamente significativo implica que existe algun ejemplos ilustran el hecho de que un valor significativo de t con N pequefia puede
grado de asociaci6n entre la variable experimental y la variable dependiente. Sin uy bien estar describiendo un efecto mas importante de la variable experimental
embargo, el hecho de que un resultado sea estadisticamente significativo no confiere ue un valor significativo de t con una N mayor.
automaticarnente «importancia» a 10 obtenido. Si N es suficientemente grande,
* Si ItI es menor que 1.00, w 2 sera negativa. Puesto que una w 2 carece de significado, hacemos arbitrariamente w 2 = 0
incluso una diferencia trivial puede resultar estadisticamente significativa. ando ItI :$ 1.00.
250 ESTADiSTICA PARA LAS CIENCIAS SOCIALES 251
INFERENCIA ESTADiSTICA CON DOS MUESTRAS INDEPENDIENTES

13.5 EI cociente t y la homogeneidad de la varianza anteriormente, el cociente t es un examen eficiente. Nuestras conclusiones podrian
sufrir alteracion solamente para desvios muy grandes respecto a las hipotesis
Las hipotesis fundamentales para el usa de las distribuciones t son las siguientes: adrnitidas de homogeneidad de las varianzas y de normalidad.
~Por que, entonces, nos interesa un analisis de las varianzas? Frecuentemente,
I.. La distribucion muestral de la diferencia entre medias es normal. una diferencia significativa en las varianzas (en particular cuando la varianza del
2. La ax,-x, estimada (0 sea, sx,-x,) se basa en la estimacion no sesgada de la grupo experimental es significativamente mayor que la del grupo de control) indica
varianza poblacional. un efecto dual de las condiciones experimentales. Una mayor varianza indica mas
3. Ambas muestras provienen de poblaciones cuyas varianzas son iguales. A esta valores extremos ell las dos colas de una distribucion. EI investigador atento toma­
hipotesis se Ie da el nombre de homogeneidad de la varianza. ra estos hechos como base para explorar la posibilidad de que existan efectos
duales.
En ocasiones, y por razones que pueden no estar muy claras, las calificaciones de Por ejemplo, hace varios afios se estudio con detenimiento, y resultados bastante
uno de los grupos pueden estar distribuidas con mayor amplitud que las del otro ambiguos, la cuestion siguiente: «~Mejora 0 perjudica la ansiedad el rendimiento en
grupo. Esto nos puede llevar a la conclusion de que las muestras provienen de dos las tareas psicologicas complejas?», Recientemente se ha comprobado que los
distribuciones diferentes. Pero la pregunta crucial es: dos distribuciones diferentes estados inducidos de ansiedad tienen efectos duales que dependen de muchos
~en que, en las medias 0 en las varianzas? ' factores, por ejemplo las variables de personalidad. Un aumento en la ansiedad
Para determinar si dos varianzas difieren 0 no significativamente una de otra, determina que algunas personas se orientan mejor en la tarea que tienen entre
debemos hacer referencia a otra distribucion: la distribucion F. Quien primero manos, en tanto que otras «fracasan», por decirlo asi. Un estudio de las varianzas de
describio esta distribucion fue el estadistico R. A. Fisher. La distribucion F es diferente nuestros grupos experimentales puede facilitar la revelacion de efectos teoricamente
a las otras distribuciones que hasta hoy hemos visto, ya que es de naturaleza tan importantes e interesantes como los duales.
tridimensional. Para usar la tabla F (tabla 01' apendice III), debemos comenzar
buscando en la primera fila el mimero de grados de libertad del grupo con varianza
mayor, y mirar hacia abajo en esa columna hasta llegar a la fila correspondiente al
numero de grados de libertad del grupo con varianza menor. En la interseccion
hallaremos el valor critico de F requerido para rechazar la hipotesis nula de que no
Resumen del capitulo
hay diferencia en las varianzas. EI cociente F se define del modo siguiente:
Hemos visto que si se toman algunas parejas de muestras de la misma poblacion 0 de
§2 (varianza mayor) dos poblaciones diferentes, se tiene que:
F = --::----,-------:..
§2 (varianza menor) La distribucion de las diferencias entre parejas de medias muestrales tiende a ser
normal.
EI examen es bilateral, pues interesa determinar si las varianzas difieren significa­
tivamente entre si. Seria unilateral solamente en el caso de que interesara determinar La media de estas diferencias entre medias (l1x, -x,) es igual ala diferencia entre
si una varianza especifica es significativamente mayor que la otra. Esta es una las medias poblacionales, 0 sea, 111 - 112'
comparacion diferente. Puesto que la tabla 01 se refiere a probabilidades unilatera­ EI error estandar de la diferencia entre medias (ax,-x,! es igual a J al + at.
les, el uso del valor critico al nivel 0.025 nos da el nivel de significacion bilateral de
0.05. En el problema muestral anterior, la varianza para el grupo 1 es igual a Presentamos formulas para estimar ax,-x, a partir de los datos muestrales.
135.56/8 = 16.94, Y para el grupo 2 es igual a 164.9/9 = 18.32. EI cociente F resul­ Us ando el valor estimado de ax-I -x- 2 (0 sea, sx I -x)2 mostramos el uso de la t de
ta ser Student para examinar hipotesis en el caso de dos muestras.
18.32 Presentamos tambien un metoda para estimar el grado de asociacion entre una
F =~-= 1.08 gl = 9/8.
16.94 ' variable experimental y la medida dependiente. Omega al cuadrado (ru2 ) proporciona
una estimacion de la varianza en la variable dependiente explicada por las variacio­
En la tabla 01' para 9 y 8 gl, hallamos que una F ~ 4.36 es significativa al nivel nes de la variable experimental.
0.05. Podemos, por tanto, concluir que es razonable admitir que am bas mues­ Una hipotesis fundamental para el uso dela distribucion t es que ambas muestras
tras provienen de poblaciones con la misma varianza. rovienen de poblaciones con varianzas iguales. Aunque es probable que la falta de
~Que ocurre si encontramos una diferencia significativa en las varianzas? ~Se homogeneidad de las varianzas no afecte seriamente nuestras interpretaciones, el
incrementaria la posibilidad de rechazar la hipotesis nula de que no hay diferencia echo de la heterogeneidad de las varianzas puede tener importantes implicaciones
entre las medias? Con gran probabilidad, muy poco. Como hemos seiialado eoricas,
252 ESTADfsTICA PARA LAS CIENCIAS SOCIALES
INFERENCIA ESTAOfSTICA CON DOS MUESTRAS INOEPENDIENTES 253

Terminos para recordar a) Plantear este estudio en terrninos estadisticos formales y llegar a las conclusiones
apropiadas usando ex. = 0.01.
cociente F b) l,Hay evidencia de heterogeneidad de la varianza?
homogeneida.d de la varianza
5. Se dan dos poblaciones normales tales que
error estandar de la diferencia entre medias omega al cuadrado ((JJ2)
Jl2 = 77, (J2 = 6.
Si de la poblacion 1 se extrae una muestra de 36 elementos y de la poblacion 2 se extrae una
muestra de 36 elementos, l,cual es la probabilidad de que
a) XI-X2~5? b) XI-X2~0?

Ejercicios c) xI-X2~b? d) XI-X2~ -5?

6. Considerando las dos poblaciones indicadas en el ejercicio 5, calcular la probabilidad de


1. Dos clases de estadistic~, cada una con 25 estudiantes, obtuvieron los siguientes que XI - X 2 ~ 0, cuando
r~s~lta~os en el examen final: X I = 82, SCI = 384.16; X2 = 77, SC 2 = 1536.64. Examinar la a) N I = N 2 = 4, b) N I = N 2=9,

hipotesis de que las dos clases son igualmente aptas, usando ex. = 0.01. c) N I = N 2 = 16, d)
N 1 = N2=25.
2. ~n un experimento realizado para estudiar los efectos de cierta droga sobre los errores 7. Expresar graficarnente las probabilidades anteriores como una funcion de N. l,Podria
cornetidos por las ratas al desplazarse en un laberinto, se obtuvieron los siguientes resultados: formularse alguna generalizacion acerca de la probabilidad de encontrar una diferencia en la
direccion correcta entre las medias muestrales (esto es, X I - X2 ~ 0, cuando /11 > /12) como
una funcion de N?
GRUPO CON DROGA GRUPO PLACEBO
8. Un fabricante de gasolina realiza pruebas para determinar el rendimiento relativo de los
IXI = 324 IX2 = 256
.automoviles, empleando dos aditivos diferentes. Los resultados son los siguientes (en millas
IXi = 6516
IXi = 4352
por galen de gasolina):
N I = 18
N2 = 16
Aditivo 1: 12, 17, 15. 13, 11, 10. 14, 12

Aditivo 2: 16,14,18,19,17,13,11,18

Plantea! este experi.mento en terrninos estadisticos formales, usando ex. = 0.05, Yobtener las Plantear y examinar la hipotesis nul a apropiada.
conclusiones <l;propladas referentes al efecto de la droga en el numero de errores.
9. Dos analistas de mercado aseguran que su capacidad para predecir el alza <je las acciones
3. En una actividad psicomotriz en la que se tira ados blancos de diferente tamafio se bursatiles es mejor que la de su rival. En un periodo determinado de tiempo, cada uno
obtuvieron los siguientes resultados: ' selecciono diez acciones para las que predijo un aumento de valor. Cuando se conocieron
posteriormente los incrementos en los precios de las acciones, se llego a los resultados
GRUPO 1 GRUPO 2
siguientes :
Analista 1: $1.25, $2.50,$1.75, $2.25, $2.00, $1.75, $2.25, $1.00, $1.75, $2.00

9 6

Analista 2: $1.25, $0.75, $1.00, $1.50, $2.00, $1.75, $0.50, $1.50, $0.25, $1.25

6 7

8 7
Plantear y examinar la hipotesis nula apropiada.
8 9

9 8
10. El fabricante de cierto dentifrico afirma que los nmos que se limpian los dientes
diariamente con su producto (marca A) tienen menos caries que los nifios que utilizan el
entffrico de marca X. En un estudio cuidadosamente supervisado, se compare el mimero de
aries en un grupo de nifios que empleaban su dentifrico con el numero de caries en otro grupo
Plantear este experimento en terminos estadisticos formales, usando ex. = 0.05, Yobtener las e nifios que empleaban el dentifrico X. Los resultados fueron los siguientes:
conclusiones apropiadas.
. 4. Se. realize un estudio para determinar si la obtencion de una respuesta esta 0 no Marca A: 1,2,0,3,0,2,1,4,2,3,1,2,1,1

influenciada por los efectos de una droga. La. variable de criterio fue el numero de intentos Marca X: 3,1,2,4,1;5,2,0,5,6,3,2,4,3

requeridos para llegar a dominar la tarea (X I es el grupo experimental y X 2 es el grupo de aminar la afirrnacion del fabricante.
control). "
1. En un estudio longitudinal del desarrollo de los adolescentes, 582 jovencitos y 1052
qvencitas, que cursaban los primeros afios de bachillerato, rellenaron un cuestionario para
btener medidas de la personalidad y del uso de drogas (Wingard, Huba y Bentler, en prensa).
3
la escala de personalidad referente a «generosidad», se obtuvieron los siguientes datos:
254 ESTADfSTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADfSTICA CON DOS MUESTRAS INDEPENDIENTES 255

VARONES MUJERES
15. En un estudio acerca del desarrollo de la memoria, Wingard, Buchanan y Burnell (1978)
seleccionaron un conjunto de dibujos clasificables en cinco categorias semanticas (aliment os,
L:X, = 10371 IX2 = 20609

vestidos, juguetes, muebles, ani males). Se presentaron aleatoriamente los dibujos a 64 nii'ios de
IXi = 198503 IX~ = 427 764

cuatro afios y a 64 nifios de cinco afios, y se les pidio recordar tantos como les fuera posible.
N, = 582 N2 = 1052

Los autores midieron la tendencia de los nifios a agrupar los dibujos de la misma categoria
semantica para recordarlos. Para los nifios de cuatro afios se encontro X = 0.192y 8 = 0.302
a) Utilizando ex = 0.05, plantear y examinar la hipotesis nula de que los varones y las en agrupacion semantico, en tanto que para los de cinco afios se encontro X = 0.291 y
mujeres no difieren en la escala de generosidad. Hallar w 2 • 8 = 0.359. Plantear y examinar la hipotesis nula de que los nifios de cinco afios no hacen mas
Mediante una escala de cinco punto que va desde «nunca usa la droga» (1) hasta «usa la droga agrupacion semantica que los de cuatro afios. Puesto que la hipotesis alternativa es direccional
regularmente» (5), se obtuvieron los siguientes datos: (se espera que los niiios de cinco afios hagan mas agrupacion como consecuencia de su mayor
desarrollo cognoscitivo), utilicese cx = 0.05, examen unilateral. Calcular w 2 •
VARONES MUJERES 16. Si encontramos una diferencia significativa entre medias a nivel de significacion del 5 %,
de ello se seguiria que (verdadero 0 falso):
IX I = 1024 IX 2 = 1694
a) Esta diferencia es significativa a nivel de significacion del 1 %.
Pi = 2712 IX~ = 4318
b) Esta diferencia es significativa a nivel de significacion del 10 %.
N, = 582 N 2 = 1052

c) La diferencia observada entre las medias es la verdadera diferencia.


Para los ejercicios 17 a 21, se dan las siguientes poblaciones finitas de numeros:
b) Usando ex = 0.05, plantear y examinar la hipotesis nula de que los varones y las
mujeres no difieren en la frecuencia de uso de la marihuana. Hallar w 2 • Poblacion 1: 2,4,6,8

Poblacion 2: 1, 3, 5, 7

12. En un estudio acerca de las preferencias sobre television de los nifios en edad preescolar,
Friedrich y Stein (1973) pidieron a 52 nifios y a 45 nifias indicar sus programas favoritos. *17. De cada poblacion se toman aleatoriamente muestras de tamafio 2 (sin reposicion),
Luego los autores tuvieron en cuenta los programas considerados violentos y agresivos, y Construir un histograma que muestre la distribucion muestral de las diferencias entre las
obtuvieron los siguientes datos:
medias muestrales.
i,Cual es la probabilidad de que
NINOS NINAS a) XI-X2~0? b) XI-X2~1? c) Xl - X 2 ~ O?

d)XI-X2~-I? e)X\-X2~4? f)XI-X2~-4?

Ix, = 71 IX 49

2 = g) Xl - X 2 ~ 2 0 Xl - X 2 ~ - 2?
Pi = 185 P~ = 147

N, = 52 N 2 = 45
Calcular la media y la desviacion estandar de cada poblacion,
'*20. Si de la poblacion 1 se extrae una muestra de 25 elementos y de la poblacion 2 se extrae
una muestra de 25 elementos, i,cual es la probabilidad de que
Plantear y examinar la hipotesis nula de que los nifios y las nifias no difieren en el mimero de
a) Xl-X2~0? b) X I-X 2 ~ I? c) ~1-~2~0? _ _
programas violentos que sefialaron como favoritos. Utilicese ex = 0.05.
d) XI-X2~-I? e) Xl-X2~4? f) Xl-X2~1 0 Xl-X2~-I?
13. Un director de adiestramiento de una gran ernpresa industrial afirma que los empleados g) x, -X2~2 0 X I-X 2 s -2?
que toman su curso de preparacion tienen mejor rendimiento en su trabajo comparados con
los que no 10 reciben. De 30 empleados recien contratados se seleccionaron 15 al azar para Calcular la probabilidad de que Xl - X2 ~ 0, cuando
a) N l = N 2=4, b) N l = N 2=9,
recibir adiestramiento. A los otros 15 se los torno como sujetos de control. Seis meses despues,
c) N l = N 2=16, d) N l = N 2=36.
en las pruebas de evaluacion del trabajo, se obtuvieron los siguientes estadigrafos para el
grupo adiestrado: Xl = 24.63, 8 1 = 3.53. Para el grupo de control se obtuvo X, = 21.45 Y 22. Un fabricante registro el numero de trajes producidos diariamente, durante un periodo
8 2 = 4.02. Plantear y examinar la apropiada hipotesis nula usando ex = 0.05. ­ de 10 dias, por un grupo de 26 trabajadores (grupo A) que operaba con un sistema de salarios
14. Un editor afirma que los estudiantes que reciban instrucci6n en matematicas usando un fijos. Luego introdujo un plan de incentivos salariales para otros 26 trabajadores (grupo B) y
texto que acaba de publicar, obtendran una calificaci6n final cinco puntos mayor por 10 menos registr6 su produccion durante 10 dias. EI numero de vestidos producidos diariamente fue
que la de los estudiantes que emplearon eJ texto anterior. Se eligen al azar 36 estudiantes para COmo sigue:
asignarles ados clases: el grupo experimental, que emplea el J,luevo texto para su instruccion; y
Grupo A: 75 72 73 76 78 72 80 74 76 75

el grupo de control, que utiliza el texto anterior. En el examen final, para el grupo experimental
Grupo B: 80 83 84 78 79 81 84 85 78 86

se obtiene Xl = 83.05 Y 8 1 = 6.04; y para el grupo de control, X 2 = 76.85 Y 8 2 = 5.95.


Plantear y examinar la hipotesis nula apropiada usan do ex = 0.01, examen unilateral. [Nota: Los salarios pagados a los dos grupos son iguales. i,Puede el fabricante llegar a la conclusion
Recuerdese que el numerador en el estadigrafo del exam en es (Xl - X 2) - (Ill - 112).] de que el plan de incentivos salariales es mas eficaz? Calcular el valor de t.
INFERENCIA ESTADfsTICA CON DOS MUESTRAS INDEPENDIENTES
257
256 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

de hombres y de mujeres. En la tabla siguiente se indica e1 camb~o en el tarnafio de la pupila de


La compafiia A halla que sus bombillas duran en promedio 1200 horas con ai
= 100.
cinco heterosexuales Y de cinco homosexuales al ver fotografias de un hombre.
En la .compania B la duracion media es de 1250 horas con ai
= 125. lEs probable' que las
bombillas de las dos compaiiias provengan de la misma pobl~ci6n? lCmi! es el valor de z?
HETEROSEXUALES SUJETO HOMOSEXUALES
SUJETO
24. De los registros de personal, dos grandes compafiias tomaron muestras relativas al
numero de aiios que las secretarias permanecieron en ellas. Usando muestras de 25 empleadas 1 -00.4 6 +18.8
cada una, la compafiia A encontro que SCI = 42 Y X I = 40, y la compafiia B encontro que 2 -54.5 7 -04.6
SC 2 = 58 Y X 2 = 50. lEs significativa la diferencia al nivel de 0.05? lCual es el valor de t? 3 +12.5 8 +18.9
+06.3 9 +18.2
25. Un jefe de oficina encuentra que el mimero de errores cometidos por los empleados 4
-01.5 10 +15.8
aumenta a medida que el dia avanza, alcanzando su maximo entre las 3:00 y las 5:00. Divide 5
entonces una muestra de 20 empleados en dos grupos. Un grupo continua con e1 mismo
horario de trabajo, mientras que al otro se Ie concede un descanso de 15 minutos, entre las 2:45 Formular H y H . bilateral. Usando la t de Student para muestras independientes, determi­

y las 3:00, para tomar cafe. EI nurnero de errores cometidos entre las 3 :00 y las 5:00 fue como nar si puedeorech~arse H o al nivel I:i. = 0.05. [Sugerencia: ~a~a facili~ar.los calculos cuando

se indica a continuacion: hay numeros negativos, sumese 55 a cada dato, Este procedmll~nto elimina todos los valores

negativos y hace uso de la generalizacion indicada en la seccion 2.3.]

Grupo sin descanso intermedio: 5 6 7 4 8 9 6 5 7 6


Para calcular la media de cada grupo,

Grupo con descanso intermedio: 2 3 4 3 4 4 3 1 5 4


5 5
I Xi I Xi - 5(55)
lPodria afirmarse que el descanso intermedio reduce el mimero de errores? Calcular el va­ ~ '-i=---'I'--- _

lor de t. N N
26. Determinar si las varianzas son homogeneas en el ejercicio anterior. Calcular el va­ Nota: Al sumar 55 a todos los datos no carnbiara la diferencia ent~e las medias ni el err?r
lor de F. estandar de la diferencia, ya que se mantienen las diferencias relativas entre los datos. Sin
embargo, la media de cada grupo tendra un incremento de 55.
27. Los bancos A y B utilizan dos formas diferentes de registrar los cheques girados. Dichos
bancos encontraron que durante los ultimos 10 aiios se devolvio e1 siguiente numero de 32. En la tabla siguiente se muestra el cambio en el tamano de.la pupila de c~nco varones
cheques a 15 clientes por carecer de fondos: heterosexuales Y de cinco varones homosexuales al ver fotograflas de una mUJer.

SUJETO HOMOSEXUALES
Banco A: 4 8 3 0 3 5 3 4 0 5 2 4 6 2 0
SUJETO HETEROSEXUALES
Banco B: 2 0 1 2 1 1 3 3 4 3 1 4 0 5 0

1 +05.9 6 +11.2
Determinar si hay una diierencia significativa entre el numero de cheques devueltos en cada 2 -22.4 7 -38.0
+19.2 8 + 18.1
banco. Usar a = 0.05. 3
4 +39.0 9 -05.6
'28. En el estado A se encuentra que el numero medio de cigarrillos consumidos semanalmen­ +23.1 10 +21.5
5
te por los fumadores es de 120, con a~, = 10. En el estado B, el impuesto a los cigarrillos es
$0.05 mayor por paquete; y el numero medio de cigarrillos consumidos semanalmente es de
at
110, con. = 9.lExiste una diferencia significativa entre el mimero de cigarrillos consumidos Formular u; YHI' examen bilateral. Usando la t de Student para.muestras i~depe~dientes,
en ambos estados? lCU<i! es el valor de z? determinar si puede recharzarse H 0 al nivel de ex = 0.05. [Sugerencla: Para evitar el inconve­
mente de los numeros negatives, sumese 39 a cada dato.]
29. Los gerentes de dos tiendas de comestibles encuentran que tienen un exceso de latas de
33. En un estudio acerca de los efectos de los campos de concentracion en las.victimas de los
salsa para tallarines. Los precios y las cantidades vendidas en ambas tiendas son identicos, EI
nazis, Dor-Shav (1978)compare 43 supervivientes de dichos campos con 21 sujetos de co~t.r.ol
gerente A mantiene las latas en su lugar habitual, en tanto que el Bias coloca durante un mes
que tenian edad, antecedentes Y educaci6n analogos, pero que se escaparon. de la pnsion
cerca de los mostradores donde se comprueba el importe de la compra. Los gerentes
durante la Segunda Guerra Mundial. Se aplic6 a ambos grupos una sen~ de .pruebas
determinaron el mimero de latas vendidas durante 10 dias, con los siguientes resultados:
psicologicas, incluida la prueba de Rorschach de las manchas de ti~ta y el cue.stl~nano de lo~
A: 19 20 20 21 18 20 19 21 23 17 16 factores de la personalidad. En la prueba de Rorschach se obtuvleron los slgUientesdatos.
B: 26 24 25 23 25 24 22 26 27 25
SUPERVIVIENTES CONTROLES

lHay una diferencia significativa entre el numero de latas vendidas? lCual es el valor de t? IX
IX, = 17 2 = 39
30. Determinar si las varianzas son homogeneas en el ejercicio 29. Calcular F. LXi = 81 p~ = 357
Nt = 43 N 2 = 21
31. Al comienzo de este capitulo, presentamos una grafica correspondiente a una investiga­
cion acerca de la reaccion de la pupila de los varones hetero y homosexuales al ver fotografia s
258 ESTADisTICA PARA LAS CIENCIAS SOCIALES
[259]

a) Y.~ando ex = 0.05: plantear y examinar la hip6tesis nula de que los supervivientes no


Inferencia estadfstica con
14
I eren de los sujetos de control en el mimern de respuestas abstractas dadas en la
prueba de Rorschach. Hallar w 2 •
E~ elcuestionariode los factores de la personalidad, 14supervivientes de 50 ­
sUJetlos
esca a dde
cont~dol tambien de 50 afios, 0 menos, mostraron los sigUiente:~~:~~::~o:~YI~
e sagaci ad:
muestras correlacionadas
SUPERVIVIENTES CONTROLES

LX, = 182 LX, = 52


l:xf = 2396 l:X~ = 552
N, = 14 N, = 5

b) I.!sando ex = 0.05~ plantear Yexaminarla hipotesis nula de que los supervivientes no


difieren de los sujetos de control en la escala de sagacidad del cuestionario de I Introduccion
factores de la personalidad. Hallar w2. os
Uno de los problemas fundamentales con que se enfrentan cornunmente los cien­
tificos del comportamiento es la extrema variabilidad de sus datos. Ciertamente,
se debe a esta variabilidad que se interesen tanto por el campo de la estadistica
inferencial.
Cuando se realiza un experimento, se obtienen datos para comparar dos 0 mas
grupos, se encuentra una diferencia en cierta medida de tendencia central, y se
formula luego la pregunta: ~es la diferencia de tal magnitud que resulta improbable
se deba a factores de azar? Como hemos visto, un examen a simple vista de los datos
no es por 10 general suficiente para responder a esta pregunta, porque hay mucho
solapamiento de los grupos experimentales. El solapamiento se debe, a la vez, al
hecho de que los sujetos experimentales manifiestan una amp Iia diversidad de
aptitudes y capacidades en relacion con el criterio de medida. En un experimento,
cabe pensal' que la calificacion de cualquier sujeto en la variable de criterio refleja al
menos tres factores: (1) la capacidad del individuo y/o su eficiencia respecto ala tarea
que sirve de criterio ; (2) los efectos de la variable experimental; y (3) el error aleatorio
debido a una amplia variedad de distintas causas; POI' ejemplo, las variaciones
menores que se presentan de vez en cuando en los procedimientos 0 'en las
condiciones experimentales, 0 bien las fluctuaciones mornentaneas en cosas tales
como el intervalo de tiempo que dura la atencion y la motivacion de los sujetos
experimentales. Es poco 10 que puede hacerse acerca del error aleatorio, salvo
mantener un control tan estricto como sea posible sobre las condiciones experimen­
tales. Los efectos de la variable experimental son, por supuesto, 10 que nos interesa
evaluar.
En la mayo ria de los estudios, las diferencias indiciduales entre los sujetos
son, con mucha, el factor mas significativo que contribuye a las calificaciones
y a la variabilidad de las mismas sobre la variable de criterio. Todo 10 que pueda
hacerse para tener en cuenta este factor 0 para «eliminar estadisticamente» sus
efectos mejorara nuestra capacidad para estimar los efectos de la variable experi­
mental sabre las calificaciones de criterio. Este capitulo se ocupa de una tecnica
comunmente empleada para cumplir con este objetivo: el uso de las muestras
correlacionadas.
261
INFERENCIA ESTADfSTICA CON MUESTRAS CORRELACIONADAS
260 ESTAOfsTICA PARA LAS CIENCIAS SOCIALES

Recuadro 14.1

a
35 l- •
U
.f= l-
<{<{
I-­
[52

1-0
I-­
l-

UJI­ 30
I-
a:::>
a:<{

t3[l i­ •
zO -
i­ • •
UJ<{
z9
AU
25 -
Y --
,. •
--'0
<{--'
(,9UJ
a:UJ
~o
>
20
-
-
-<It
-
.. •
•• •
'"
",Q -- ••
::SCll -
--,2
-<{
2U
15 - I I I I I
--
15 20 25 X 30 35 40

MILLAS POR GALON EN CARRETERA­

CAMBIO DE VELOCIDADES MANUAL

En el capitulo 13 vimos que sX,-x, es una especie de hito respecto al cual calcularnos la TIPO DE CAMBIO DE VELOCIDAD
diferencia entre medias. Si este mimero es relativamente grande comparado con la
AUTOMATICO DIFERENCIA
diferencia media, nos vemos menos inclinados a rechazar H o que si dicho numero es
MODELO MANUAL
pequefio respecto a la misma diferencia entre medias.

7
Si existiera alguna forma legitima de reducir el tarnafio del terrnino de error (sx -x ), Gremlin 26 19
-4
nuestro hito seria mas sensible. Esto es precisamente 10 que se consigue con el adalisis Hornet 16 20
4
de la correlacion. Recordemos del capitulo 9 que cuanto mayor sea la correlaci6n entre Audi Fox 36 32
2
dos variables, mayor sera la oariacion explicada y menor la no explicada 0 variaci6n Skyhawk 26 24
3
Vega 30 27
aleatoria. Puesto que la variacion no explicada representa el error, el analisis de la 6
Datsun 210 41 35
correlaci6n proporciona una forma legitima de disminuir la variaci6n no explicada y, 3
Datsun 280 25 22
por tanto, de reducir tam bien el error. 5
Fiat 131 30 25
La tabla adjunta indica el rendimiento en carretera, medido en millas por gal6n, de Mustang II 24 20
4
veinte autom6viles con cambio de velocidades manual y de veinte coches con cambio -1
Granada 20 21
automatico. Cada pareja corresponde al mismo modelo de autom6vil. En otras 4
Capri II 27 23
palabras, los dos coches de cada pareja son identicos salvo el tipo de cambio de -1
Monarch 20 21
2
velocidad. Cuando se trata de muestras correlacionadas, se toma como base la ~~ffi ~ ~
3
diferencia entre las parejas de valores para calcular el terrnino de error. Si la correlaci6n Valiant/Duster 23 20
2
es baja, estas diferencias son grandes, y tambien 10 es el terrnino de error basado en Sunbird 26 24
3
dichas diferencias. Si r es alto, las diferencias son pequefias. Cuanto mayor sea la Lemans 21 18
9
correlaci6n, menores seran las diferencias entre las parejas de valores y el terrnino de Corolla 35 26
4
error se reduce analogamente, Corona MK. II 22 18
4
El diagrama de dispersi6n adjunto sugiere que la correlaci6n entre las parejas de Volvo 27 23
4
observaciones es muy alta. De hecho, se tiene que r = 0.89. EI terrnino de error LUV pickup 32 28
. t ejas de autom6viles. Cada
resultante, al que se denomina error estandar de la diferencia media (sJj), es mucho Cantidad de millasrecorridas en carretera par vel" e par. din
pareja consta de un cache con cambia manual y otro del rmsmo mo eo perc co
rnenor que el terrnino de error (sx -x) que es el que habriamos utilizado si las muestras
cambia autom6tico.
no estuvieran correlacionadas. ' 2
263
INFERENCIA ESTADfsTICA CON MUESTRAS CORRELACIONADAS
262 ESTADisTICA PARA LAS CIENCIAS SOCIALES

. se obtiene al usar muestras correlacionadas,


14.2 Error estandar de la diferencia entre medias Para comprender la ventaja qut 1 1 error estandar de la diferencia entre
veamos un proble~a mue~ai y cas~u ~~s:~: en grupos no apareados, y la f6rmula
para grupos correlacionados medias usando la formula sx, + X>, 1" La tabla 141 muestra los datos
(14.1) dond.e se tiene en cuenta la.~~r: a~~~:dos de acuerd~ con una variable que

En nuestro estudio previo de la t de Student, mostramos la formula para la correspondle~tes ados grupos.deblsuJd 't~ io Los miembros de cada pareja fueron

sera correlaclOnada con la vana e e cn no. .

estimacion no combinada del error estandar de la diferencia entre medias, que era asignados aleatoriamente a las condiciones expenmentales.

Tabla 14.1 Calificaciones de dos gru~os _de sujetos en


un experimento donde se emplea el disefio de grupos
Una formula mas general para el error estandar de la diferencia es apareados (datos hipoteticos).
LV 'f

- - - r:Is~
S X,-X2--V"'X, + s£:<2--7/'S-X,X
s- 2' ":l/ s: (14.1)
PAREJAS
RELACIONADAS XI xi X, x~ X,X,

2 4 4 16 8
Suprimimos el ultimo terrnino siempre que los sujetos de la muestra se asignen a las A
9 9
B 3 9 3
condiciones experimentales al azar, por la sencilla razon de que cuando las califica­ 5 25 20
C 4 16
ciones son apareadas al azar, la correlacion entre las dos muestras debera tener un 5 25 6 36 30
0
promedio cero. Cualquier correlacion observada sera falsa, puesto que representani
una asociacion casual, En consecuencia, cuando se asignan al azar los sujetos a las 14 54 18 86 67
L
condiciones experimentales, el ultimo terrnino se reduce a cera (puesto que r = 0).
Sin embargo, hay muchas situaciones experimentales en las que no asignamos al
azar los sujetos a cada condicion experimental. La mayor parte de estas situaciones Para calcular el error estandar de la ~iferencia e~tre m~~i~s en el caso de grupos
pueden c1asificarse dentro de ana de las dos c1ases siguientes: no apareados, se siguen los pasos inclmdos a contllluaClOn.
1. Diseiio antes-despues, Se hace una lectura en los mismos sujetos antes y despues Paso 1. La suma de cuadrados para el grupo 1 es
de la introduccion de la variable experimental. Se supone que cada individuo
perrnanecera relativamente consecuente consigo mismo. Existira asi una correlacion SCI = 54 - (14)2/4 = 5.
entre la muestra antes y la muestra despues. Notese que cada sujeto puede haber side
La desviaci6n estandar para el grupo 1 es
seleccionado al azar de un grupo de personas; pero, puesto que el sujeto participa en
las dos condiciones, no podemos decir que los sujetos han sido asignados aleatoria­
mente a las condiciones experimentales.
SI = J5!4 = 1.1180.
El error estandar de la media para el grupo 1 es
2. Diseiio de grupo apareado. Los sujetos disponibles para el estudio se clasifican
par parejas de acuerdo con alguna variable que sera correlacionada con la variable SI _ 1.1180 = 0.6455*.
dependiente 0 de criterio. El resultado es un conjunto de sujetos apareados en el que sx, = .jN 1 - 1- J3
los dos miembros de cad a pareja obtienen aproximadamente la misma calificacion en
cuanto a la variable que sirvio para formar las parejas. Uno de los miembros de la AnaIogamente, el error estandar de la media para el grupo 2 es
pareja es asignado aleatoriamente a la condicion experimental yel otro es asignado SX- = 0.6455.
2 •
al grupo de control, Asi, por ejemplo, si se tratase de determinar el efecto de cierta
El error estandar de la diferencia entre medias para grupos independieu­
droga sobre la capacidad de resolver un problema matematico, podriamos formar
parejas de individuos basandose en los CI estimados, en la cantidad de preparaci6n
maternatica, en los conocimientos estadisticos 0 en el rendimiento alcanzado en la - -
S x,-x, = .jsx~ , + s1 2
= 0.91.
resolucion de otros problemas matematicos, Este disefio tiene dos ventajas:
a) Proporciona seguridad de que los grupos experimentales son «equivalentes» en , did' leando la formula (12.8), 0 sea,
• Se puede oblener direclamente el error estandar e a me ra emp
cuanto a la capacidad inicial.
b) Permite sacar provecho de la correlacion basada en la capacidad inicial con 10 sx,=
JJ sc
N,(N,-l)
(5 = 0.6455.
"j4(3j
que se consigue eliminar una fuente de error procedente de nuestras medidas.
265
INFERENCIA ESTADfSTICA CON MUESTRAS CORRELACIONADAS
264 ESTAOfSTICA PARA LAS CIENCIAS SOCIALES

'todo de la diferencia directa consiste en hallar las


Para calcular el error estandar de la diferencia entre medias en el caso de grupos Brevemente expues t 0, e1 me . d . t s

apareados, se dan los siguientes pasos: diferencias entre las calificaciones de criter.io ob.tenidas p~ra lcad~~a:f~C~O ee~u:e~od~

. t est as diferencias como si fuesen calificaciones origina es. , d

t ra ar d d t s en un caso e una
Paso 1. Empleando la formula (8.2)*, hallamos que la correlacion entre los dos de la diferencia directa transforrna un caso e os n;ues rab d desvia­
grupos es di uestral y un error estandar asa 0 en una
:~:s~:~i~~~~~:~~no~e~~ ~.~l: es queri
a
~~~::n~b~:n~~: ~~s~:i:~~~::u:~:=ll~:
~::~~~:~~~::e~~/ ~~ ~:~:~~~:~~:~; qJe~a diferencia media (JlD) tiene algun valor
Paso 2. El error estandar de la diferencia entre medias para grupos pareados es especifico. La t que se usa para decimar H 0: Jl[5 = 0 es

l5 - IIlJ jj (14.2)
t=---=-·
SlJ SlJ
= JOA167 + 0.4167 - 2(0.80)(0.6455)(0.6455) = 0.41.
. .. 1 lcular Ia suma de cuadrados de la
La formula de calificaclOnes ongina es para ca cu ar

Notese que la formula (14.1), que tiene en cuenta la correlacion, proporciona un


termino de error notablemente reducido para estimar la significacion de la diferencia diferencia de calificaciones es

entre medias. En otras palabras, proporciona una prueba mas sensible de esta
diferencia y nos da mayor probabilidad de rechazar la hipotesis nula cuando esta es
SCD = L D2 - (L~)2 , (143)

falsa. En el lenguaje de la estadistica inferencial, es un examen mas potente. En el


capitulo 16 estudiarernos con mas amplitud el concepto de potencia. Por supuesto, la -. . .' d P c nsiguiente la desvia-
d on d e D es la diferencia entre calificaciones
. .
aparea as. or 0 ,
mayor potencia 0 sensibilidad de la formula (14.1) esta directamente relacionada con cion estandar de la diferencia de cahficaclOnes es

el exito que se tenga en el apareamiento de los sujetos respecto a la variable que se


correlaciona con la variable de criterio, Cuando res grande, S5(,-5(, sera correspon­
~ (14.4)
dientemente pequefio. A medida que r se aproxima a cero, la ventaja del empleo de SD = ~~1)'
muestras correlacionadas se vuelve progresivamente menor.
Contrapesada con el incremento de la sensibilidad del error estandar de la Se puede obtener ademas el error estttndar de fa diferencia media sfj dividiendo la
diferencia entre medias cuando r es grande, esta la perdida de grados de libertad.
Mientras que el numero de grados de libertad en el caso de muestras no apareadas es formula (14.4) por )N. Asi,
N 1 + N 2 - 2, cuando se emplean muestras correlacionadas el mimero de grados de (14.5)
libertad es igual al mimero de parejas menos uno, 0 sea, (N - 1). Esta diferencia
puede ser critica cuando el numero de grados de libertad es pequefio, ya que, como
vimos en la seccion 12.5.1, cuando el mimero de grados de libertad es pequefio se (14.6)*
requieren mayores valores de t para lograr significacion.

Problema muestral
14.3 Metodo de la diferencia directa: Los directores de una pequefia universidad privada se enc~entran con q~~ es
el cociente t de Student necesario aumentar el tamano de las aulas. Una pelicula especl~l, don~e se ttIhZ~~
las tecnicas mas avanzadas de propaganda, presenta las ventajas de as cases ,
- Se evalua la actitud de un grupo de diez estudiantes antes y despues
Por fortuna, no es realmente necesario determinar la correlacion entre las muestras mayor t amano. 1 t ., n de la pelicula
de la proyeccion de esta pelicula. Se preve q~e a. presen ~ClO

para hallar SX,-](,' Hay otro metodo que perrnite el calculo directo del error determinara actitudes mas favorables (0 sea, cah,fi~aclOnes mas ~ltas).

estandar de la diferencia. A este procedirniento 10 Ilamarernos metoda de fa diferencia Planteemos este problema en terminus estadlstlCoS formales.

directa, y representaremos por S1) al error estandar de la diferencia.

• Notese que (X, - X,) reemplaza a (Y - V) en la formula (8.2). • Una formula allernaliva para obtener Sjj es Sjj ~ sn/~ , donde Sn ~ ..J SCn/N:
266 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
INFERENCIA ESTADfSTICA CON MUESTRAS CORRELACIONADAS 267

Hip6t~sis nula (H o): ~a diferencia entre las actitudes de los estudiantes antes Y
1.
Paso 4. El valor de t en el presente problema es
despues de ver la pelfcula es mayor 0 igual que cero, 0 sea, J1.D ~ O.
2. Hip6t~sis alternativa .(H 1 ) : La actitud de los estudiantes sera mas favorable 15 3.70
despues de ver la pelicula, 0 sea, J1.D < O. Notese que la hipotesis alternativa es t=-= - - = -1.81.
Sfj 2.04
direccional y, en consecuencia, se debera emplear un examen unilateral.
3. Prueba estadistica; Dado que estamos utilizando un disefio antes-de p . Decision. Puesto que la t obtenida no cae en la region critica (esto es, -1.81 >
. daa Ia
result a apropia art de S tudent para muestras correlacionadas. sues,
> t o.0 1) ' no podemos rechazar H o- No esta justificado llegar a.la ~oncl.usion de que la
4. Nivel de significaci6n: IX = 0.01. pelicula produce un cambio de actitudes estadisticamente significativo.
5. Distribucton muestral: La distribucion muestral es la t de Student Con gl =N
- 1, 0 sea, lO - 1 = 9.
6. Regi~~ ~ritica: t o;OI S;. - 2.821. Puesto que HI predice que las calificaciones en la
condicion despues seran mayores que las correspondientes a la condicion antes 14.4 EI estadigrafo A de Sandler
esp~~amo.s.que las diferencias entre las calificaciones sean negativas. Por tanto, la
region critica consta de todos los valores de t tales que t s; -2.821.
Hace algunos afios, un psicologo llamado Joseph Sandler ideo un procedimiento
. La ~abl~ 14.2 muestra los resultados de este experimento. En el metodo de la muy sencillo para obtener valores de la probabilidad x en todos los casos en que H 0:
diferencia directa se emplean los siguientes pasos: J1.1 - J1.2 = 0 y resulta apropiado el uso de la t de Student para muestras correlacio­
nadas. Ciertamente, puesto que el estadigrafo A de Sandler se deriva rigurosamente
Paso 1: La suma de los cuadrados de la diferencia de las calificaciones es del cociente t de Student*; los valores de la probabilidad son identicos a los valores
p de Student.
(-37)2
SC D = 511 -1:0 = 374.10. El estadigrafo A se define del modo siguiente:

Paso 2. El error estandar de la diferencia media es Suma de los cuadrados de las diferencias LD 2
A= =--. (14.7)
Cuadrado de la sum a de las diferencias (LD)2
Sjj = J374.l0/lO(9) = 2.04. Haciendo referencia a la tabla de A (tabla E, apendice III) bajo (N - 1) grados de
libertad, puede determinarse si la A obtenida es igual 0 menor que los valores
~aso 3. El valor de jj es 15 = -37/lO = -3.70. (Para comprobar la exactitud de tabulados a diversos niveles de significacion.
D
L. , restamos LX 2 de LXI' 0 sea, LXI - LX 2 = LD, 171 - 208 = -37.) Ilustremos el calculo de A en el ejemplo anterior. Se recordaria que LD 2 = 511 Y
LD = - 37. El valor de A resulta ser
ANTES OESPUES
Tabla 14.2 Calificaciones de diez individuos en un
OlFERENCIA
experimento en que se emplea un diseiio antes- A = 511/(-37)2 = 0.373.
INOIVIOUO x, X, D D'
despues (datos hipoteticos).
Refiriendonos a la tabla E, bajo 9 grados de libertad, encontramos que se requiere
1 25 28 -3 9 una A igual 0 menor que 0.213 para que el resultado sea significativo al nivel de 0.01
2 23 19 4 16 (examen unilateral). Puesto que 0.373 es mayor que el valor tabulado, no podemos
3 30 34 -4 16
4 rechazar la hipotesis nula. Notese que nuestra conclusion es precisamente la misma a
7 10 -3 9
5 3 6 -3
la que se llego usando la t de Student. Esto ha de ser asi, naturalmente, ya que ambos
9
6 22 26 -4 16 procedimientos son matematicamente equivalentes. Dado que el calculo de A
7 12 13 -1 1
8 30 47 -17 289 * Formula para pasar de t a A:
9 5 16 -11
10 14 9
121 -I N
I
5 25 A=--+-
Nt? N
I 171 208 -37 511
1= JANN=-_\'
268 ESTADfsTICA PARA LAS CIENCIAS SOCIALES
INFERENCIA ESTADfSTI CA CON MUESTRAS CORRELACIONADAS 269

requiere mucho menos tiempo y trabajo que el empleado para calcular el valor de t,

la distribucion A de Sandler puede sustituir a la t de Student siempre que se utilicen


Plantear esta prueba en termmo~
" esta diIS tiICOS for males , usando ex = 0.01 (examen bilateral),
muestras correlacionadas.
y formular las conclusiones apropiadas,

i=~- S SEGUROS S INSEGUROS

XI = 14.2 X, = 12.9
Resumen del capitulo 51 = 2.0 5, = 1.5
NI = 17 N, = 17

Una formula general para calcular el error estandar de la diferencia es un disefio de grupos apareados (esto es, si r = 0.00), ~se
emPlle~?O
.,
2. Si lIegado
habria no hubieramos
a una cone usion diferente?
I' 2 .
Expliquese. [Sugerencia: Para caIcular sx,-x,'
S
X'-X
-
2 - ""x, + ·'.r,2 - -)/.",,­
/,,2 0
"5.',"-"2' , "I
empleese la rormuia sx,_x,
= Vs~
X,
X,
+ s- .J
. A . dijo que la Liga
3. EI entrenador de un equipo e. a ~q .
. d I P uefia Liga en la Liga mencana
Es evidente que apareando las muestras respecto a una variable correlacionada con I D terminar la validez de esta afirrnacion en
la variable de criterio, es posible reducir la magnitud del error estandar de la Americana es mas poderosa que la L(~~) :c~onaa' co~tinuacion. Emplear la t de Student para
base a los numeros de «horneruns» a os
diferencia y proporcionar, por tanto, un examen mas sensible de la diferencia entre muestras correlacionadas y la A de Sandler, ex = 0.05.
medias. Por supuesto, cuanto mayor sea la correlacion, mayor sera la reduccion en el
error estandar de la diferencia.
POSICION FINAL EN L1GA NUMERO L1GA NUMERO
Vimos el uso del metodn de la diferencia directa para determinar la significacion LA L1GA RESPECTIVA AMERICANA DE HR NACIONAL DE HR
de la diferencia entre las medias de muestras correlacionadas.
1 Minnesota 16 Los Angeles 18
Finalmente, vimos el uso de un examen matematicamente equivalente, que es el 2 Chicago 17 San Francisco 11
de la A de Sandler. Debido a la sencillez de su calculo, la prueba de Sandler 3 Baltimore 15 Pittsburgh 14
reemplaza Con ventaja a la t de Student cuando se emplean muestras correlacio­ 4 Detroit 12 Cincinnati 10
nadas. 5 Cleveland 11 Milwaukee 12
6 New York 9 Philadelphia 13
7 California 13 SI. Louis 8
8 Washington 16 Chicago 10
Terminos para recordar 9
10
Boston
Kansas City
18
14
Houston
New York
9
15

disciio antes-despue» . a eados basandose en su posicion final en la liga


error esttfndar de la diferencia media 4. En el ejercicio 3, los equlpos. fueron ap r existe una correlacion entre la posicion
respectiva. La tecnica de aparearniento pr~s~pone qUh~ 't .?
diseiio de grupos apareados estadfgrajo A de Sandler ' d h uns»' Es valida esta IpO esis.
final y el numero e « omer .c .d dientes usando los datos del ejercicio 3.
5. Calcular una t de Student 'par~ muestras I~ epe~, n de rechazo que la respuesta dada al
~Por que el valor obtenido esta mas cercano a a regio

ejercici~ 3? . . . _ . en el cual forma parejas de sujetos respecto a una


6. Cierto investigador disefia un es.tudl~
Ejercicios la variable de criterio Suponiendo que H es
variable que, segun cree, esta correlaciona a con d I tipo II (si se compara con el uso de la to de
falsa zcual es la probabilidad de cometer un error e. . ?

Student para muestras no cor~e acrona


,,, I' das) en los siguientes casos.
. t 0 esta correlacionada con la variable
1. Cierto investigador emplea un procedimiento experimental en el cual cada individuo (S) a) La variable que se uso para el aparearruen 0 n
efecnia una tarea que requiere la cooperacion de un compaiiero. Por acuerdo previo, el
cornpafiero desernpefia el papel de socio critico con actitud de rechazo. AI terminar la tarea, se b) de
La criterio.. . t 0 est'a alta mente correlacionada con la
variable q~e s.e usa para el apareamien
pide a S que repita algunas de las criticas formuladas por su cornpafiero, Antes del
variable de cnteno. d ida que el hombre.
experimento, los sujetos S fueron examinadosy c1asificados como seguros 0 inseguros en 10 que
7. Se ha dicho a menudo que ~a mujer iene do
. ti ayor esperanaza e VI
se refiere a las relaciones interpersonales, y luego apareados de acuerdo con su inteligencia. _ aas determinar la validez de esta
Usando los datos de la tabla adjunta y toman 0 ex - . ,
A partir de los datos que indica ban eI mimero de criticas recordadas, se obtuvo la afirmacian para
informacion que aparece en la tabla siguiente. Ademas, r = 0.55 entre el mimero de criticas a) los norteamericanos blancos,
recordadas y la inteligencia.
b) los norteamericanos no blancos, . blancas
c) los varones blancos comparados con las mujeres no .
270' ESTADiSTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADiSTICA CON MUESTRAS CORRELACIONADAS .271

Esperanza de vida en los Estados Unidos* diferencias y sumarlas [ED 2 ] , y sustituir finalmente estos valores en la formula del estadigrafo
A, que es A = ED 2j(ED)2. EI numero de grados de Iibertad es N - 1. Examinar la hipotesis
NO BLANCO
(PRINCIPALMENTE
NO BLANCO H 0: /10 = 100 millas para los tacometros de cada fabricante. Comparar los resultados de este
(PRINCIPALMENTE examen con los del examen anterior.
BLANCO NEGRO)
BLANCO NEGRO)
EDAD HOMBRE MUJER HOMBRE MUJER EDAD HOMBRE MUJER HOMBRE MUJER
u, En un estudio disefiado para determinar la eficacia de una nueva diet a, una compafiia de
seguros selecciono una muestra de 12 hombres con exceso de peso y edades comprendidas
0 67.5 74.4 60.9 66.5 11 58.6 65.2 53.5 58.7 entre 40 y 50 afios, Obtuvo sus pesos antes de iniciar la dieta y sesenta dias despues, Plantear y
1 68.2 74.8 62.9 68.0 12 57.6 64.2 52.6 57.7 examinar la hipotesis nula apropiada, usando C( = 0.05.
2 67.3 73.9 62.1 67.2 13 56.7 63.2 51.6 56.7
3 66.4 73.0 61.2 66.3 14 55.7 62.2 50.7 55.7
4 65.4 72.0 60.3 65.4 15 54.7 61.3 49.7 54.8 INDIVIDUO PESO INDIVIDUO PESO
5 64.4 71.0 59.3 64.5 16 53.8 60.3 48.8 53.8
6 63.5 70.1 58.4 63.5 17 52.8 ANTES DESPUES ANTES
59.3 47.8 52.8 DESPUES
7 62.5 69.1 57.4 62.5 18 51.9 58.3 46.9 51.9
8 61.6 68.1 56.5 61.6 19 91.6 81.6 94.8 92.9
51.0 57.4 46.0 50.9 1 7
9 60.6 67.1 55.5 60.6 20 50.1 2 107.5 100.2 8 86.6 82.9
56.4 45.1 50.0
10 59.6 66.2 54.5 59.6 78.4 79.3 9 90.7 83.9
3
4 73.0 71.6 10 85.7 84.8
5 83.9 81.6 11 80.2 78.0
8. Numerosa~ organizaciones de consumidores han criticado a la industria automovilistica 6 95.2 89.3 12 83.4 84.3
por emplear tacometros que muestran grandes variaciones de un instrumento a otro y de una
marca a ~tra. Para comprobar si se puede 0 no. considerar que los tacometros producidos por
dos ~abncantes. c~mpehdores pueden ser consideradns como provenientes de una poblacion 12. Una dificultad para interpretar los resultados del ejercicio 11 consiste en la falta de un
comun; ~e eq.mpo a once coches con dos taco metros, uno de cada fabricante. Todos los grupo de control. Es posible que un grupo seleccionado al azar de hombres con exceso de peso
a~tomoviles cI~cularon sobre una pista de 100 kilo metros y se fabularon las lecturas de los ta­ revele perdidas de peso en un periodo de dos meses. Un grupo de control, apareado en cuanto
cometros. Aphcar el examen adecuado para ver si es significativa la diferencia entre las al peso con los sujetos experimentales del ejercicio 11, mostro los siguientes cam bios antes­
lecturas de los tacornetros de cada fabricante, usando C( = 0.01. despues. Plantear y exarninar la hipotesis nula apropiada para el grupo de control. Emplear
C( = 0.05.

FABRJCANTE FABRICANTE
INDIVIDUO PESO INDIVIDLJO PESO
AUTOMOVIL A B AUTOMOVIL A B
ANTES DESPUES ANTES DESPUES
1 104 102 7 97 99
2 112 106 8 107 102 1 92.0 93.8 7 94.8 97.5
3 103 107 9 100 98 8 87.0 97.5
2 106.5 104.7
4 115 110 10 104 101 9 91.1 83.4
3 79.3 78.0
5 99 93 11 108 102 10 84.8 88.9
4 72.1 74.3
6 104 101 11 80.7 83.4
5 83.0 84.8
6 95.2 92.5 12 83.9 78.4

9. O~ra queja de las organizaciones de consumidores es la de que los tacometros estan


co~stru~dos para exagerar, a proposito, la distancia recorrida con el fin de abultar las 13. Empleando iinicamente el peso «despues» para los sujetos apareados de los ejercicios 11
estlm.aclOnes del conductor acerca de la distancia cubierta en relacion con el consumo de y 12, examinar la significacion de la diferencia entre las dos condiciones, usando C( = 0.05.
gasohna. Como repaso del capitulo 12, examinar la hipotesis H o : /10 = 100 kilo metros para
el producto de cada uno de los fabricantes. 14. Obtener la diferencia antes-despues para cada sujeto en los ejercicios 11 y 12. Efectuar un
analisis de «parejas relacionadas» de las diferencias, usando C( = 0.05. Comparar los resulta­
10. Runyon (1968) dem~stro que se puede emplear una sencilla generalizacion de la prueba A dos de este ana/isis con los del analisis anterior.
de Sandler como un sustituto algebraicarnente equivalente del cociente t de Student en el caso
de ~na ~.uestra. La tecnica consiste en restar el valor de la media, bajo la hipotesis H , de cada 15. Un gran almacen que ofrece «rebajas» anuncia que sus precios son inferiores a los de su
o
calificacion, sumar las diferencias y elevar al cuadrado [(ED)2], elevar al cuadrado las mayor competidor. Para examinar la validez de esta afirmacion, se seleccionaron al azar 15
articulos y se compararon sus precios. l,Cual seria la conclusion, si los precios son los que se
* Fuente: Reader's Digest 1966 Almanac, pag, 492, Nueva York: con autorizaci6n de Reader's Digest Association. indican en la tabla adjunta?
272 ESTADisTICA PARA LAS CIENCIAS SOCIALES
INFERENCIA ESTADiSTICA CON MUESTRAS CORRELACIONADAS 273

AlMACEN
DE «REBAJAS» COMPETIDOR DIA ANTES DESPUES

$3.77 $3.95 lunes 150 200


7.50 7.75 Martes 175 180
4.95 4.99 Miercoles 140 180
3.18 3.25 Jueves 180 175
5.77 5.98 Viernes 170 190
2.49 2.39 Sabado 160 175
8.77 9.49
6.99 6.49
2.99 2.95 i,Fue efectiva la nueva presentacion de los escaparates para atraer posibles compradores?
1.98 2.49 i,Cual es el valor de A?
0.49 0.52 19. Con eI fin de aumentar su venta de discos, un establecimiento anuncia que 5 discos estan
5.50 5.62 rebajados. En una muestra de 10 albumes no rebajados, se encuentra que las cantidades
0.99 0.98 vendidas un dia antes de la venta especial, y durante ella, son las siguientes:
6.49 6.66
5.49 5.55
DISCO ANTES DESPUES DISCO ANTES DESPUES

A 25 30 F 5 5
16. Una empresa acaba de adoptar un regimen de trabajo de cuatro dias a la semana. Se B 15 17 G 0 1
conto.el numero de unidades producidas semanalmente por 10 ernpleados antes y despues del C 10 13 H 40 45
cambio. Usando la prueba A de Sandler, examinar la hipotesis nula a un nivel de significacion D 25 30 I 50 45
de IX = 0.05. E 30 25 J 35 40

i,Aumento la venta de los otros discos como consecuencia de la venta especial? i,Cual es el
N.D DE UNIDADES valor de A?
EMPlEADO ANTES DESPUES 20. Un comerciante registro el numero de paquetes de cigarrillos de cinco marcas vendidos
en tres ocasiones diferentes: un mes antes de que se estableciera un impuesto de $0.04 por
A 25 23 paquete, un dia despues de la subida y un mes despues del impuesto.
B 26 24
C 27 26
ANTES DEL IMPUESTO UN DIA DESPUES UN MES DESPUES
D 22 23
E 29 30 Marca A 50 45 49
F 25 24 Marca B 40 35 42
G 29 26 Marca C 60 57 59
H 30 32 Marca D 65 67 67
I 25 25 Marca E 50 40 47
J 28 29

i,Existeuna diferencia significativa entre el mimero de paquetes vendidos antes de establecer eI


17. Con referencia al ejercicio 25 del capitulo 13, supongase que los dos grupos fueron impuesto y un dia despues? i,Cual es el valor de A?
apareados basandose en sus capacidades antes de la implantaci6n del descanso para tomar 21. Con referencia al ejercicio anterior, i,existeuna diferencia significativa entre eI niimero de
cafe. Supongase que las parejas estan en identico orden para ambos grupos. Determinar eI paquetes vendidos un mes antes y un mes despues de establecer el impuesto? i,Cual es el valor
error estandar de la diferencia entre las medias y los valores de t. Comparar los valores de A?
obtenidos con los del ejercicio 25 del capitulo 13.
22. Con referencia de nuevo al ejercicio 20, i,existe una diferencia significativa entre el numero
18. . Un comerciante desea increm~nt~r el numero de c1ientes. Durante una semana, registra qe paquetes vendidos un dia y un mes despues de establecer el impuesto? Calcular el valor
el numero de person~s que entran diariamente, Luego contrata a un experto en preparacion de eA.
escaparates para mejorar los de su establecimiento, y en la semana siguiente efecnia el mismo 23. A continuacion se muestran los resultados de un estudio preliminar para determinar si la
registro que habia hecho antes. Los registros muestran 10 siguiente:
respuesta pupilar de los varones heterosexuales y homosexuales difiere cuando se les muestran
274 ESTADiSTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADiSTICA CON MUESTRAS CORRELACIONADAS 275

fotografias de hombres y de mujeres. Los valores criticos dados en la cuarta y en la octava laboratorio se Ie inyecto una sustancia placebo y luego se la coloco en una caja junto a otra
columna. Una calificaci6n positiva significa mayor respuesta pupilar ante la fotografia de una rata. Se midio la cantidad de «agresion patologica» (ataques con las patas delanteras,
mujer; una calificaci6n negativa significa mayor respuesta pupilar ante la fotografia de un mordiscos y empujones) por parte de las ratas experimentales durante cierto periodo, Luego. se
hombre. inyect6 a las ratas experimentales una dosis ~e mescalina,. ~e las co~0~6 nuevame?te en cajas
con otras ratas y se midio nuevamente la cantidad de agresion patologica, En la pnmera etapa
se encontro que X = 1.31 y s = 0.92 agresiones patol6gicas, en tanto. que desp~e~ de
HETEROSEXUALES HOMOSEXUALES
haberseles inyectado mescalina se encontro que X = 2.13 y s = 1.78 agresiones patologicas.
RESPUESTA TOTAL RESPUESTA TOTAL La correlaci6n entre los resultados para ambos periodos fue de r = 0.56.
a) Usando CJ. = 0.05, plantear y examinar la hip6tesis nula de que la .correla.ci6n entre la
ANTE ANTE ANTE ANTE
agresion patologica antes y despues de la inyeccion de mescahna es. 19ua~ a cer?
FOTOGRA- FOTOGRA- RESPUESTA FOTOGRA- FOTOGRA- RESPUESTA
FIAS DE FIAS DE RELATIVA FIAS DE FIAS DE RELATIVA
b) Utilizando CJ. = 0.05, plantear y examinar la hipotesis nula de que no existe ~lferencIa
INDIVIDUO I HOMBRES MUJERES H vs. M INDIVIDUO HOMBRES MUJERES H vs. M entre la cantidad de agresi6n antes y despues de la inyeccion de mescahna.
c) Determinar los intervalos de confianza del 95 % para la agresi6n patologica media
1 - 0.4 + 5.9 + 6.3 6 + 18.8 + 11.2 - 7.6
antes y despues de la inyecci6n de mescalina.
2 -54.5 -22.4 +32.1 7 - 4.6 -38.0 -33.4
3 + 12.5 + 19.2 + 6.7 8 + 18.9 + 18.1 - 0.8
4 + 6.3 +39.0 +32.7 9 +18.2 - 5.6 -23.8
5 - 1.5 +23.1 +24.6 10 +15.8 +21.5 + 5.7

a) Efectuar una prueba con la A de Sandler entre las diferencias de las calificaciones
(ultima columna) de la muestra de heterosexuales. Usar CJ. = 0.05, examen bilateral.
i,Queda justificado el punto de vista de que los varones heterosexuales tienen
diferente respuesta pupilar ante las fotografias de mujeres y de hombres?
b) Efectuar una prueba con la A de Sandler sobre las diferencias de las calificaciones de
la muestra de homosexuales. Usar CJ. = 0.05, examen bilateral. i,Queda justificado el
punto de vista de que los varones homosexuales tienen diferente respuesta pupilar
ante las fotografias de hombres y de mujeres?
c) Efectuar una prueba t de muestras independientes, usando las diferencias de
calificaciones de los varones heterosexuales versus los varones homosexuales. Usar
CJ. = 0.05, examen bilateral. i,Existe base para afirmar que existe una respuesta diferente
de los heterosexuales y de los homosexuales ante las fotografias de hombres y de
mujeres, respectivamente? [Sugerencia: Para facilitar los calculos evitando numeros
negativos, sumar 34 a cada una de las calificaciones. Este procedimiento elimina
todos los mimeros negativos y hace uso de la generalizacion indicada en la secci6n
2.3.]
Para calcular la media de cada grupo utilicese la formula,

5 5
L Xi L Xi - 5(34)
;=1 i=J
--=-----.
N N

Nota: Al sumar 34 a todas las calificaciones no se altera la diferencia entre las medias ni el error
estandar de la diferencia, puesto que se conservan las diferencias relativas entre las calificacio­
nes. Sin embargo, la media de cada grupo tendra un aumento de 34.
24. En el ejercicio anterior, se rechaza la hipotesis nula en dos de las tres comparaeiones.
Desde el punto de vista de la estadistica, i,estaria mas justificado rechazar H o si se hubieran
obtenido los mismos valores de A y t con una N mayor? (Hess, 1965).
25. Los efectos de la droga alucinogena llamada mescalina sobre el comportamiento agresivo
fueron investigados por Sbordone, Wingard, Elliot y Jervey (1978). A cada una de 45 ratas de
[276] INTRODUCCI6N AL ANALISIS DE LA VARIANZA 277

Introducci6n
ser significativas a un nivel de 0.05?; desde luego que no. Sin duda pensariamos que

15
al analisis de la varianza
«con 1000 comparaciones seria sorprendente que no obtuviesemos aproximadamen­
te 50 comparaciones significativas por azar (0 sea, por errores predecibles de
muestreo)).
El analisis de la varianza es una tecnica de analisis estadistico que per mite superar
la ambigiiedad que se presenta al estimar diferencias significativas cuando se realiza
mas de una comparacion. Este analisis permite responder a la pregunta: i,Existe una
indicacion general de que los tratamientos experimentales han producido diferencias
entre las medias de los diversos grupos? Aunque el analisis de la varianza puede
utilizarse en el caso de dos muestras (don de proporciona los mismos valores de
probabilidad que la t de Student), su usa mas general se presenta cuando estan
involucrados tres 0 mas grupos. Sin duda, el metodo tiene su maxima utilidad en el
estudio de dos 0 mas variables independientes. Con el proposito de exponer las
15.1 Comparaciones de varios grupos caracteristicas fundamentales del analisis de la varianza, nuestro material ilustrativo
inicial correspondera al caso de dos muestras con grupos independientes. Los
Hemos revisado en este libro, y en varias ocasiones, el disefio clasico de los procedimientos que se indican a continuacion podran generalizarse a cualquier
experimentos. Este estudio clasico se realiza con dos grupos, uno experimental y mimero de grupos independientes.
otro de control. El proposito de la inferencia estadistica consiste en examinar
hipotesis especificas; por ejemplo, si es razonable considerar que los dos grupos
provienen de la misma poblacion [ver el capitulo 13).
Aunque este disefio clasico de investigacion se emplea aun en muchos estudios, 15.2 EI concepto de sumas de cuadrados
tiene evidentes limitaciones. Restringir siempre nuestras observaciones ados grupos,
es menospreciar la enorme complejidad de los fenomenos que estudia el cientifico. Es
Se recordara que anteriormente definimos el estimador 110 sesgado de la varianza
muy raro que los sucesos de la naturaleza se ordenen convenientemente en dos
grupos, uno experimental y otro de control. Las preguntas que con mayor frecuencia como
hacemos a la naturaleza son del tipo siguiente: i,Cual de los diversos esquemas -z I(X - xy SC
alternativos de reforzamiento conduce a una mayor resistencia contra la extincion s = N-l =N-(
experimental? i,Cual de los cinco metodos diferentes para ensefiar a operar con
Tambien se recordara que, cuando las desviaciones de las calificaciones respecto a la
fracciones en los grados primarios tiene mas exito? i,Que tipo de psicoterapia
media (X - X) son grandes, la varianza y, por tanto, la variabilidad de las
produce una mayor recuperacion del paciente?
calificaciones, es tambien grande. Cuando las desviaciones son pequefias, la varianza
Es evidente que el disefio de investigacion necesario para proporcionar respuestas
es correspondientemente pequefia.
a las preguntas anteriores, requerira necesariamente la comparacion de mas de dos
Ahora bien, si volvemos a pensar en la t de Student, notaremos que tanto el
grupos. Cabria pensar: i,Cual es la dificultad para hacer una comparacion entre
numerador como el denominador nos dan una estimacion de la variabilidad:
varios grupos? i,No podemos comparar simplemente la media de cada grupo con la
media de cada uno de los otros y obtener una t de Student para cada comparacion? Xl - x,
t = -----''------=
Por ejemplo, si tuvieramos cuatro grupos experimentales A, B, C y D, i,no podrfamos SX,-X,
calcular valores de la t de Student para comparar A con B, C y D; B con C y D; y C
con D? Se recordara que el denominador, al que llamamos error estandar de la diferencia
Si se piensa un momento en los errores de la inferencia, que ya hemos discutido entre medias, se basa en la estimacion combinada de la variabilidad dentro de cada
ampliamente, se recordara que nuestra mayor preocupacion fue la de evitar errores grupo experimental; 0 sea,
del tipo I. Cuando se establece la region de rechazo al nivel 0.05, estamos reconocien­
do que aceptamos el riesgo de estar equivocados hasta en un 5 % de las veces al SC 1 + SC Z ( 1 1)
rechazar la hipotesis nula. Ahora bien, i,que ocurre cuando tenemos que hacer sx,-x,= N +N
l z-2 N I + N z .
numerosas comparaciones? Poniendo un ejemplo extrerno, supongase que estamos
realizando un estudio que requiere el calculo por separado de 1000 valores de la t de Sin embargo,el numerador es tambien una medida de la variabilidad, que en este
Student. i,Nos causaria una gran sorpresa que, por ejemplo, 50 de las t demostraran caso es la variabilidad entre las medias. Cuando la diferencia entre las medias es
278 ESTADisTICA PARA LAS CIENCIAS SOCIALES INTRODUCCI6N AL ANALISIS DE LA VARIANZA 279

Recuadro 15.1

13- CARACTERISTICAS DE LOS SUJETOS

AUTOESTIMACION
PROMEDIO
12­

11­
<{
f=
,
,
<{ lO­
a.
::;E , MUCHA AUTOESTIMACION
u;

" ,,
,
8-


, POCA AUTOESTIMACION
sL---1---------------I-------------'
COM PETENTE COM PETENTE
NO COMETE TORPEZA COMETE TORPEZA
CARACTERISTICAS DE LA PERSONAS QUE
ACTUAN COMO ESTIMULO

Uno de los atractivos de la tecnica del analisis de la varianza es que libera al macron, Algunos sujetos de cada uno de estos grupos vieron corneter una torpeza
investigador de las Iimitaciones del tradicional disefio experimental de los dos grupos. (derramar una taza de cafe) a una persona competente. Ante los restantes sujetos, la
No solamente proporciona un metodo para analizar los efectos de un mimero ilimitado persona competente no cornetio ninguna torpeza. La medida dependiente Iue una
de niveles de tratamiento de una variable experimental, sino que tam bien constituye calificacion de «simpatia» hacia la persona que actua como estfmulo.
una base estadfstica para el analisis de algunos disefios muy complejos con dos 0 mas La figura muestra una clara interaccion, Para los sujetos de poca y mucha
variables independientes. EI interes del investigador en tales experimentos va a menudo autoestimacion, el hecho de ver a la persona-estimulo cometiendo una torpeza
mas alia de la pregunta «l,CuMes son los efectos de cada variable experimental?», La deterrnino que disminuyera su simpatfa 0 aprecio hacia dicha persona. En cambio, las
mayoria de las veces, al investigador Ie interesa saber si tiene lugar 0 no, una interaccion personas de autoestimacion promedio sintieron mayor simpatfa por la persona­
entre dos 0 mas variables independientes. Se dice que dos variables interactuan si los estfmulo que cornetio Ia torpeza. Interacciones, como esta, afiaden un poco de picante a
efectos de una de elias dependen del nivel de la otra. Cuando se intenta forrnar unjuicio, la dieta insipida de muchos esfuerzos para hacer investigacion.
resulta de gran ayuda la representacion grafica de los resultados experimentales.
En la figura adjunta se resume un conjunto de resultados experimentales obtenidos Attraction toward the competent stimulus person, with higher scores indicating grater attraction.
(R. Helrnreich, E. Aronson y J. LeFan, «To err is human-sometimes: ElTects of self-esteem,
como parte de un estudio referente a los efectos que se producen al ver corneter una
competence, and a pratfall on interpersonal attraction», Journal oj Personality and Social
torpeza a una persona que aetna como estfmulo. Se dividio a los sujetos en tres grupos:
Psychology, 16 (1970): 262. Copyright 1970 by the American Psychological Association. Reprodu­
los de poca autoestimacion, los de autoestimacion promedio y los de mucha autoesti­ cido con permiso.)

grande respecto a sx ,_x la t de Student es grande. Si la diferencia entre las medias es


2
'
la distribucion F por nuestro estudio anterior de la homogeneidad de la varianza,
pequefia respecto a sx,-x" la t de Student es tam bien pequefia. seccion 13.5.)Si la estimacion de la varianza entre grupos es grande (la diferencia entre
El analisis de la varianza consiste en la obtencion de dos estimaciones indepen­ las medias es grande) respecto ala estimacion de la varianza dentro de los grupos, la F
dientes de la misma, una basada en la variabilidad entre grupos (varianza entre resulta grande. Inversamente, si la estimacion de la varianza entre grupos es pequefia
qrupos) y la otra basada en la variabilidad dentro de los grupos (varianza dentro de respecto a la estimacion de la varianza dentro de los grupos, la F sera pequefia.
los grupos). La significacion de la diferencia entre estas dos estimaciones de la Un concepto basico en el analisis de la varianza es la suma de cuadrados. Ya
varianza esta dada por las distribuciones F de Fisher. (Ya estamos familiarizados con hemos encontrado antes la suma de cuadrados al calcular la desviacion estandar, la
280 ESTADfSTICA PARA LAS CIENCIAS SOCIALES INTRODUCCI6N AL ANAuSIS DE LA VARIANZA 281

varianza y el error estandar de la diferencia entre medias. Se trata simplemente del La suma de cuadrados dentro de los grupos es simplemente la suma de la suma
numerador en la formula para la varianza, 0 sea, Sc. Como se recordara, la formula de cuadrados obtenida dentro de cada grupo, 0 sea,
para calcular la suma de cuadrados es
SC w = SCI + SC 2 (15.3)

SCI = ~ xi _ (IX I)2


c. NI
La ventaja de la tecnica del analisis de la varianza es que podemos partir la suma (16)2
total de cuadrados (SC ta t ) en dos componentes: la suma de cuadrados dentro de = 94 - - = 94 - 64 = 30
4 '
los qrupos (SC w) y la suma de cuadrados entre qrupos (SC E). Antes de continuar,
aclaremos estos conceptos con un ejemplo sencillo. SC = ~ X~ _ (IX 2)2
Supongase que se ha completado un estudio para comparar dos tratamientos
2 c. N2
experimentales y que se han obtenido los datos indicados en la tabla 15.1. (32)2
= 266 - -4- = 266 - 256 = 10,
Tabla 15.1 Calificaciones de dos grupos de personas en
GRUPO 1 GRUPO 2
un experimento hipotetico SC w= 30 + 10 = 40.
Xl xi x, X3
1
Finalmente, la suma de cuadrados entre grupos (SC E) puede obtenerse restando
1 6 36
2 4 7 49 la media general de la media de cada grupo, elevando el resultado al cuadrado,
5 25 9 81 multiplicando por la N de cada grupo y sumando los resultados de todos los grupos.
8 64 10 100 Asi,
I16 94 32 266 (15.4)
N, = 4, Xl = 4 N 2 = 4, X2 = 8
IX,o, = 48, N = 8, X,O' = 6, donde N, es el tamafio del i-esimo grupo Y Xi es la media del i-esimo grupo,

SCE = 4(4 - 6)2 + 4(8 - 6)2 = 32.

La media para el grupo 1 es 4: y para el grupo 2 es 8. La media general, Xtat, es La formula para calcular la suma de cuadrados entre grupos con los datos
488 = 6. Si restaramos ahora la media general de cada calificacion y elevaramos originales es
al cuadrado, obtendriamos la suma total de cuadrados:
(15.5)
(15.1)
y en nuestro ejemplo,
(16)2 (32)2 (48)2
La formula alternativa, basada en los datos originales, es SCE = -4- + -4- - -8­

= 64 + 256 - 288
SC = ~ X2 _ Q:XtoY
tot ~ tot N (15.2) = 320 -',288 = 32.
Notese que la suma total de cuadrados es igual a la suma de la suma de
Para los datos de la tabla 15.1, la suma total de cuadrados es
cuadrados entre grupos y la suma de cuadrados dentro de los grupos. En otras
palabras,
sc.; = 360 _ (4:V (15.6)

= 360 - 288 = 72. En el ejemplo anterior, SC ta t = 72, SCw = 40 Y SCE = 32. Asi, 72 = 40 + 32.
282 ESTADfsTICA PARA LAS CIENCIAS SOCIALES INTRODUCCION AL ANALISIS DE LA VARIANZA 283

15.3 Obtencion de estimaciones de la varianza resultado sea significativo al nivel 0.05. Entonces, en el presente problema no
podemos rechazar la hipotesis nula. Notese que la tabla D proporciona valores
bilaterales. El examen del analisis de la varianza para significacion es autornatica­
Para lIegar ahora a las estimaciones de la varianza a partir de las sumas de
mente bilateral puesto que cualquier diferencia entre las medias muestrales aumen­
cuadrados entre los grupos y dentro de los grupos, solo es necesario dividir cada una
tara la totalidad del valor de F y no solamente la diferenqia que interesa al inves­
de elias por el numero de grados de libertad apropiado*. Los grados de libertad entre'
tigador.
grupos son, simplemente, el nurnero de grupos (k) menos 1.

glE = k - 1. (15.7)

Para dos grupos, k = 2; por tanto, gl = 2 - 1 = 1. Asi, nuestra estimacion de la


15.4 Conceptos fundamentales del analisis
varianza entre grupos en el problema que est amos estudiando es de la varianza
-2 SCE 32
sE = - - = - = 32 gl = 1. ( 15.8) En estas pocas paginas hemos examinado todos los conceptos basicos necesarios
glE 1 ' para comprender el analisis simple de la varianza. Antes de proseguir con un ejemplo
en que intervienen tres grupos, repasemos brevemente estos conceptos fundamen­
EI numero de grados de libertad dentro de los grupos es igual a N menos el mimero tales.
de grupos. Asi,
glw N - k.
1. Hemos visto que en un experimento que incluye dos 0 mas grupos es posible
= ( 15.9)
identificar dos bases diferentes para estimar la varianza poblacional: la varianza
entre grupos y la varianza dentro de los grupos.
En nuestro problema, glw = 8 - 2 = 6, y la estimacion de la varianza dentro de los
grupos resulta ser: a) La estimacion de la varianza entre grupos refleja la magnitud de la diferencia
2 SCw 40 entre las medias de los grupos. Cuanto mayor sea la diferencia entre las medias,
Sw = - - = - = 6.67, gl = 6. (15.10) mayor sera la varianza entre grupos.
glw 6
b) La estimacion de la varianza dentro de los grupos refleja la dispersion de las
Lo unico que falta ahora es calcular el cociente F y determinar si aceptamos 0 no calificaciones dentro de cada grupo de tratamiento. La varianza dentro de los
que nuestras dos estimaciones de la varianza provienen de la misma poblacion. Si grupos es analoga a la SX,-X2 en la t de Student. Se la llama comunmente el
no es asi, llegarernos a la conclusion de que la varianza entre grupos es significativa­ termino del error.
mente mayor a causa del efecto de las condiciones experimentales. En otras palabras,
lIegaremos a la conclusion de que los tratamientos experimentales produjeron una 2. La hipotesis nula consiste en que las muestras provienen de la misma poblacion,
diferencia significativa entre las medias. EI cociente F en el analisis de la varianza es o sea, que J.l.l = J.l.2 = ... = J.l.k·
igual a la estimacion de la varianza entre grupos dividida por la estimacion de la
varianza dentro de los grupos. Simbolicamente, 3. La hipotesis alternativa consiste en que las muestras no provienen de la misma
poblacion, esto es, J.l.l =F J.l.2 =F ... =F J.l.k·
-2
SE
F =-2- (15.11 ) 4. EI cociente F se obtiene al dividir la estimacion de la varianza entre grupos por la
Sw
estimacion de la varianza dentro de los grupos. Consultando la tabla D de la dis­
En nuestro problema, el cociente F es
tribucion F, podemos determinar si es po sible, 0 no, aceptar razonablemente la
32 hipotesis nula de la igualdad de las medias poblacionales. En el caso de que el valor
F---480
- 6.67 - . , gl = 1/6. de F sea significativo, podemos lIegar a la conclusion de que no todas las medias de
los grupos son estimaciones de una media poblacional comun.
Observando en la tabla D del apendice III la F correspondiente a 1 y 6 grados de
libertad, encontramos que se requiere una F igual 0 mayor que 5.99 para que el 5. En el caso de dos muestras, el cociente F proporciona val ores de probabilidad
identicos a los de la t de Student. De hecho, en eI caso de un grado de libertad (0 sea,
cuando k = 2), t = ft, 0 sea, t 2 = F. Se puede comprobar esto calculando la t de
. • En la seccion 12.5 se estudio 10 referente a los grades de libertad, Lo mismo se aplica en este caso. Los grados de
hbertad representan el nurnero de valores que pueden variar librernente despues de haber impuesto ciertas restricciones a
los datos. Student para el ejemplo que acabamos de ver.
284 ESTADfSTICA PARA LAS CIENCIAS SOCIALES INTRODUCCION AL ANALISIS DE LA VARIANZA 285

15.5 Un ejemplo que involucra tres grupos Paso 3. La suma de cuadrados dentro de los grupos puede obtenerse aplicando la
formula (15.3) para tres grupos:
Supongase que acabamos de terrninar un estudio concerniente a la determinacion de
la influencia de varios niveles de motivacion en la adquisicion de conocimientos de SCw = (292 _ (4~)2) + (756 _ (7:)2) + (168 __(3:)2) = 176.45'.
aritmetica. Veintisiete nifios de primaria fueron asignados aleatoriamente a tres
grupos iguales, usando uno de los metodos descritos en la seccion 10.2. El grupo 1, SCw = SC lol - SCE = 291.41 - 114,96 = 176.45.
que sirvio de control, recibio una pequefia cantidad de motivacion en clase. Los
integrantes del grupo 2 recibieron un nivel de motivacion que fue calificado de
La estimacion de la varianza entre grupos es
intermedio por personas de criterio independiente. Finalmente, los alumnos del
grupo 3 recibieron un alto nivel de motivacion.
-2 . 114.96
Al terminar el periodo de instruccion, se hizo a todos los nifios un examen que gl E = k - 1 = 2,' sE = - - = 57.48.
tiene el nombre de «Inventario de Aritmetica Basica». En la tabla 15.2 se presentan 2
los resultados de este estudio hipotetico,
La estimacion de la varianza dentro de los grupos es

Tabla 15.2 Calificaciones de -2 176.45


GRUPO 1 GRUPO 2 GRUPO 3 tres grupos de sujetos en un glw = N - k = 24, Sw = - - = 7.35.
Xl xi X2 x22 X, X~ experimento hipotetico,
24

4 16 12 144 1 1 Usando la formula (15.11), hallamos que el valor de F es


5 25 8 64 3 9
4 16 10 100 4 16
3 9 5 25 6 '36 F = 57.48 = 782 gl = 2/24.
6 36 7 49 8 64 7.35 .,
10 100 9 81 5 25
1 1 14 196 3 9 Para resumir estos pasos se emplea la disposicion indicada en la tabla 15.3.
8 64 9 81 2 4
5 25 4 16 2 4
Tabla 15.3 Tabla resumen
FUENTE DE SUMA DE GRADOS DE ESTIMACION DE
para la presentacion de los

1 46 292 78 756 34 168


estadigrafos relevantes en los

VARIACION CUADRADOS L1BERTAD LA VARIANZA*

X1 = 5.11 N 2=9, X2 = 8.67 N 3 = 9, X3 = 3.78 problemas de analisis de la


2 57.48 7.82
Entre 9rupos 114.96
varianza. 24 7.35
Dentro de grupos 176.45
Ix,OI = 46 + 78 + 34 = 158,

IX~o, = 292 + 756 + 168 = 1216,

Total 291.41 26
N = 27.

'" En muchos textosaparece en estecasilleroel t~rmino«cuadradosmediosl,.Sinembargo, los


autores prefieren el termino «estirnacicn de Ja varianza» porque describe exactamente la
natura/aza de los valores que figuran en esta columna.

En un analisis de la varianza con tres grupos se utilizan los siguientes pasos:


Paso 1. U sando la formula (15.2), la suma total de cuadrados es Ordenando las operaciones segun 10 indicado en esta tabla, se puede comprobar
calculo de la suma de cuadrados y la asignacion de grad os de libertad. Asi, SCE +
SC IOI = 1216 - (158)2/27 = 291.41. SCw debe ser igual a SCIol' Los grados de libertad del total se encuentran por

Paso 2. Utilizando la formula (15.5) para tres grupos, la suma de cuadrados entre gllol= N -1. (15.12)
grupos es
En el presente ejemplo, el numero de grados de libertad para el total es
SC _ (46)2 (78)2 (34)2 (158)2_
E - -9- + -9- + -9- - ------r;- - 114.96. gllol = 27 - 1 = 26.
286 ESTADiSTICA PARA LAS ClENCIAS SOCIALES INTRODUCCION AL ANALISIS DE LA VARIANZA 287

15.6 Interpretacion de F Paso 1. Disponer un cuadro que muestre la media de cada estado y las diferencias
entre parejas de medias, tal como aparece en la tabla 15.4.
Cuando nos referimos ala F requerida para que hay a significacion con 2 y 24 grados Tabla 15.4 Diferencias entre medias.
de libertad, encontramos que una F mayor 0 igual a 3.40 es significativa al nivel 0.05. x,
Puesto que nuestra F de 7.86 excede a este valor, podemos concluir que no todas X, = 5.11
las medias de los tres grupos son estimaciones de una media poblacional com un,
Ahora bien, l.debemos detenernos aqui? l.No nos interesa en fin de cuentas averiguar x, = 5.11 3.56 1.33
si uno de los tres metodos para ensefiar aritmetica es superior a los otros dos? La X2 = 8.67 4.89
respuesta a la primera pregunta es negativa, y la respuesta a la segunda, afirmativa. X3 = 3.78
La verdad es que nuestro hallazgo de un cociente F significativo para el
experimento en su totalidad, permite la investigacion de hipotesis especificas. En
aso 2. En la tabla 0, para gl = 24, k = 3 Y IX = 0.05, encontramos qo.os = 3.53.
ausencia de una F significativa, cualquier diferencia significativa entre comparaciones
especificas debera considerarse como sospechosa por ser muy posible que represente aso 3. Para hallar DRS, se multiplica qo.os por Js~/N. El valor de stv se
una diferencia casual. ncuentra en la tabla 15.3 como estimacion de la varianza dentro de los grupos. En
En los ultimos alios los cientificos del comportamiento han desarrollado un gran ada estado el valor de N es 9. Asi,
numero de pruebas que permiten al investigador el estudio de hipotesis especificas
referentes a los parametres poblacionales. En lineas generales, estas pruebas son de
dos tipos: DRS = 3.53 ~ 9 fU5 = 3.53(0.90) = 3.18.
1. Comparaciones planeadas 0 a priori: Cuando se planean las comparaciones antes
de la investigacion, resulta apropiada una prueba a priori. En las pruebas a priori aso 4: Buscando en la tabla 15.4, encontramos que las diferencias entre Xl versus
no es necesario que la F general sea significativa. 2Y X 2 versus X 3 exceden a DRS = 3.18. Por tanto, podemos concluir que estas

2. Comparaciones a posteriori: Cuando las comparaciones no se planean de iferencias son estadisticamente significativas al nivel IX = 0.05. Puesto que la media
antemano, resulta apropiado el empleo de una prueba a posteriori. del grupo 2 es significativamente mayor que la media de los otros dosestados,
podemos llegar a la conclusion de que este estado produce un resultado significativa­
En el ejemplo presente ilustraremos el uso de una prueba a posteriori para mente mayor en la medida dependiente (Inventario de Aritmetica Basica), Parece,
efectuar comparaciones entre medias tomadas por parejas. pues, que los niveles de emotividad medios producen los mejores resultados en este
Tukey (1953) desarrollo una prueba de este tipo, a la que llarno prueba de la experimento hipotetico,
diferencia honestamente significativa 0 DRS (honestly significant difference, RSD).
Para poder utilizar esta prueba, la F general debe ser significativa.
Una diferencia entre dos medias es significativa a un nivel IX si es igual 0 mayor
que DRS, cuyo valor es Estimacion del grado de asociacien
(15.13) entre la variable experimental
y la variable dependiente
donde s~ = varianza estimada dentro de los grupos,
N = numero de sujetos en cada estado, n la seccion 13.4 vimos el uso de omega al cuadrado (w 2 ) para estimar la proporcion
qrx = valor que se encuentra en la tabla -0, para un nivel IX y con glw y k varianza en la medida dependiente que se puede atribuir a variaciones en la
(numero de medias) dados. iable de tratamiento. Es posible efectuar una estimaci6n similar en el analisis de
arianza con clasificacion simple:

15.6.1 Ejemplo desarrollado


(15.14)
Vamos a emplear los datos de la seccion 15.5 para ilustrar la aplicacion de la prueba
DRS. Usaremos IX = 0.05 para examinar la significacion de la diferencia entre cada
pareja de medias. En la tabla 15.3 se ve que SCE = 114.96, k - 1 = 2, s~ = 7.35 YSC IDI = 291.41.
288 ESTADfsTICA PARA LAS CIENCIAS SOCIALES INTRODUCCION AL ANALISIS DE LA VARIANZA 289

Sustituyendo estos valores en la formula (15.14), obtenemos: Asi cuando observamos un analisis de la varianza con «clasificacion simple»,
os 'que la variabilidad en la medida dependiente se debe a la variabilidad entre los
w2 est = _11_4_.9_6_-__
(2----:)(--::-70_35_) empos efectos de tratamiento) 0 ala variabilidad dentro de los grupos (dif nerencias 0

(
291.41 - 7.35 ebidas al «azar»), En el analisis de la varianza con «clasificacion doble», Ia vana bili
ru 0

1 ­

= 100.26 = 0.35. ad entre los grupos puede descomponerse aun mas:


284.06
Considerando todos los factores que influyen en el rendimiento escolar, debe VARIABILIDAD 1-_---­ EFECTOS DEL FACTOR A

considerarse importante la obtenci6n de una variable que explique el 35 % de


la varianza. Por supuesto, esta conclusi6n se basa en los datos hipoteticos, En la
investigacion del comportamiento no se obtienen a menudo valores de w 2 tan altos
como este.
VARIACION
ENTRE
GRUPOS
I...- ---'r----- EFECTOS DEL FACTOR B

EFECTOS CONJUNTOS
DE A y B

TOTAL

VARIABILIDAD
15.8 Amilisis de la varianza cuando hay DENTRO DE
LOS GRUPOS
clasiflcacion doble: el diseiio factorial
Acabamos de ver el aruilisis de la varianza con «clasificacion simple», cuyo nombre En un analisis de la varianza con clasificacion doble hay dos variables diferentes
proviene del hecho de que los diversos grupos de tratamiento representan diferentes experimentales 0 de tratamiento. Una de el~as, 0 ~as dos, puede ser ,cualitativa 0
niveles 0 diferentes categorias de una sola variable de tratamiento. Haciendo posible cuantitativa. Las variables cualitativas se diferencian en la clase mas que en el
la consideracion simultanea de varios niveles 0 categorias de una variable experimen­ «cuanto» como ocurre, por ejemplo, en los diferentes metodos de enseiianza 0 en los
tal, nos liberamos de las limitaciones del disefio tradicional de los dos grupos, el diferentes tipos de psicoterapia. Las variables cuantitatioas difieren en la cantidad,
experimental y el de control. como en la cantidad de droga 0 en la cantidad de refuerzo positivo suministrado a los
Las tecnicas avanzadas del analisis de la varianza ofrecen ventajas aun mas
sl.ljetos experimentales. . ,0 • •

profundas: (1) permiten la evaluacion de mas de una variable a la vez; (2) permiten la Si bien hay sola mente dos variables expenmentales en un analisis de la ~ananza
determinacion de posibles efectos de interaccion entre las variables; y (3) representan n clasificacion doble, puede haber cualquier numero de subclases 0 mveles de
un modo eficaz de aprovechar el tiempo y el esfuerzo empleados en la investigacion, atamiento de cada una de las variables. Un determinado estudio podria incluir dos
puesto que en muchos diseiios de analisis de la varianza cad a observacion proporcio­ iveles de una variable y cuatro niveles de una segunda variable, 0 tres niveles de
na informacion acerca de cada variable, de las interacciones entre variables y del da una de dos variables, etc. La forma tradicional de mencionar un analisis de la
error. rianza con clasificacion doble consiste en citar el numero de niveles (0 subclases) de
Detengamonos un momenta y examinemos el concepto de interaccion. Se dice a variable. A modo de ilustracion, un estudio con dos niveles de una variable y
que dos variables (0 facto res) interactuan cuando el efecto de una variable sobre
atro niveles de una segunda variable tiene un diseiio de 2 x 4. Un estudio con tres
alguna medida del comportamiento depende de la presencia 0 de la can tidad de una
eles de cada variable tiene un diseiio de 3 x 3. Un estudio con tres niveles de una
segunda variable. Supongamos, por ejemplo, que un particular metodo de enseiianza
riable y cuatro niveles de una segunda variable tiene un disefio de 3 x 4.
mejora las calificaciones obtenidas en una prueba por los sujetos de gran inteligencia,
pero no mejora las calificaciones obtenidas por los sujetos de poca inteligencia. Si los
efectos de los diferentes metodos de enseiianza fueran iguales para todos los niveles
de inteligencia, no habria interaccion. Veamos otro ejemplo. Volvamos a los datos
.8.1 El concepto de combinacion de tratamientos
presentados en el recuadro 13.1. Notese que la respuesta pupilar media (variable un diseiio factorial, a cada sujeto experimental se Ie administra algun nivel ?e c~~a
dependiente) ante las fotografias de hombres y de mujeres (variable independiente A) iable de tratamiento. Se llama combinacion de tratamientos a la combinacion
depende de la orientacion sexual (variable independiente B) de los sujetos experimen­ rticular de condiciones experimentales. Por ejemplo, en un diseiio factorial de
tales. Asi, la variabilidad en la variable dependiente (respuesta pupilar) puede 4, si a un sujeto dado se Ie administra el segundo nivel de la variabl~ A y el tercer
comprenderse mejor observando el efecto conjunto de las dos variables independien­ el de la variable B, la combinacion de tratamientos para dicho sujeto es A 2B 3 •
tes, 0 sea, la interaccion entre estos factores.
a) Combinaciones de tratamientos en un diseiio factoria de 2 x 2:
INTRODUCCI6N AL ANALISIS DE LA VARIANZA 291
290 ESTADfsTICA PARA LAS CIENCIAS SOCIALES

AI A2 onde A es el mimero de niveles de A;

B, B2 B, B2
glB = B-1
Combinaci6n
de tratamientos
AIB I AIB 2 A,B I A2B,
onde B es el numero de niveles de B;
b) Combinaciones de tratamientos en un disefio factorial de 2 x 3.

A, A2

B, B2 B, B, B2 B3
dividir la suma de cuadrados dentro de los grupos por los grados de libertad
Combinaci6n
AIB 3
propiados se obtiene una estimacion independiente de la varianza poblacional:
A,B I AIB 2 A2B I A,B2 A2B 3
de tratamientos

SCw
§~ (error) = --, glw = N - k,
EI numero total de combinaciones de tratamientos en cualquier disefio factorial es glw
igual al producto ,de los niveles de tratamiento de todos los factores 0 variables.
Ejemplos. En un disefio factorial de 2 x 2, hay cuatro combinaciones de tratamien­ onde k es el mimero de combinaciones de tratamientos.
tos.
En un disefio factorial de 2 x 3, hay seis combinaciones de tratamientos.
En disefios factoriales mas complejos, se aplica el mismo principio, En un disefio Ejemplo desarrollado usando un diseiio
factorial de 2 x 3 x 4, hay 24 combinaciones de tratamientos. factorial de 3 x 3
A,
15.8.2 Descomposicion de la suma de cuadrados AI A,

B, B, B, 8, 8, 8, 82 B,
Veamos ahora el analisis de un disefio factorial de 3 x 3. Aunque se trate de un caso B,
particular, el analisis puede generalizarse facilmente a cualquier numero de niveles 0 1 2 5 4 5 6
2 3 6
subclases de cada una de las dos variables. 4 5 7 3 5 8 5 8 10
En un analisis de la varianza con clasificacion doble, la suma total de cuadrados 5 8 9 6 7 6 3 7 12
se divide en dos componentes: la sum a de cuadrados dentro de los grupos y la suma 7 11 12 7 9 11 7 9 11
de cuadrados entre grupos, 0 sea,
Combinaci6n
AlB, A,B 2 AIB 3 A2B , A2B 2 A2B 3 A3B , A3B 2 A3B 3
SC tot = SCw + SCE' de tratamientos
30 19 29 .39
18 27 34 17 23
I
Ala suma de cuadrados entre grupos se la divide ala vez en tres componentes: la
suma de cuadrados para la variable A (SC A), la suma de cuadrados para la variable B Ix = 236
(SC B) Y la suma de cuadrados para la interaccion de las variables A y B (SC A x B)' 0
sea,
eterminemos si existe un efecto significativo de la variable A, de la variable B 0 una
teraccion entre las dos variables. Usaremos (l = 0.01.
Al dividir por el apropiado mimero de grados de libertad, cada uno de los efectos aso 1. Hallar SC tot' Elevar al cuadrado cada una de las calificaciones, sumar todos
de tratamiento proporciona una estimacion independiente de las varianzas poblacio­ tos valores, y restarle al resultado CIX)2jN:
nales:

gl, = A - 1, SC
tot
="L. X2 _ (IX)2 .
N
INTRODUCCION AL ANALISIS DE LA VARIANZA 293
292 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

En el presente ejemplo, Hallar el numero de grados de Iibert ad para la suma de cuadrados entre

SC tot = 2 2 + 4 2 + 52 + ... + 112 _ (236)2


36 glE = k - 1,
= 1842 - 1547.11
= 294.89. donde k es el numero de combinaciones de tratamientos. En el presente ejemplo,
Paso 2. Hallar gltot:
glE = 9 - 1 = 8.
gltot = N - 1
= 36-1 Paso 6. Situar la suma de cuadrados entre grupos y los grados de libertad
= 35. orrespondientes en la tabla 15.5.
Paso 3. Situar SC tot y gltot en la tabla resumen (tabla 15.5). aso 7. Comenzar la partici6n de la suma de cuadrados entre grupos hallando la
Tabla 15.5 Tabla resumen para el analisis de 1a varianza con clasificaci6n doble.
uma de cuadrados para la variable A:

FUENTE SUMA GRADOS ESTIMACION


DE VARIACION DE CUADRADOS DE L1BERTAD DE LA VARIANZA F

Entre grupos 115.39 8


variable A 12.06 2 6.03 0.91
variable B 100.06 2 50.03 7.52
AxB 3.27 4 0.82 0.12
Dentro de los 179.50 27 6.65
grupos (error) Puesto que N es igual para cad a estado A, habra menor error de redondeo si se
suman los cuadrados de cada nivel de A y luego se divide por la N de cada estado A:
Total 294.89 35

sc, = (IXAY + (IX A2)2 + (IX A,)2 _ (IX)2


Paso 4. Hallar la suma de cuadrados entre grupos. En el presente problema, NA N
2
SCE = (IA 1 Bd + (IA 1 B 2) 2 + ... + (IA 3 B 3) 2 _ (IX)2
= (79)2 + (70)2 + (87)2 _ 1547.11
N AIB I N A IB 2 N A,B, N
NA
(IW (27f (39f
= -4- + -4- + ... + -4- - 1547.11. = 18,710 _ 1547.11
12
Puesto que N es igual para cada combinaci6n de tratamientos, habra menor error de
redondeo si se suman los cuadrados de las combinaciones de tratamientos y luego se = 1559.17 - 1547.11 = 12.06.
divide por la N de cada grupo (N k): .
Hal1ar el mimero de grados de libertad para el estado A:
SC = (IA 1B 1)2 + (IA 1 B 2 ) 2 + ... + (IA 3 B 3 ) 2 _ (IXf
E Nk N
glA = A-I,
= (18)2 + (27)2 + (34)2 + (17f + (2W + (30)2 + (19)2 + (29)2 + (39)2
4 nde A es el numero de niveles de A. En el presente ejemplo,
- 1547.11
glA = 3 - 1 = 2.
6650
= -4- - 1547.11
aso 9. Situar la suma de cuadrados para la variable A y los correspondientes
= 1662.50 - 1547.11 = 115.39. ados de libertad en la tabla 15.5.
294 ESTADfSTICA PARA LAS CIENCIAs SOCIALES 295
INTRODUCCION AL ANALISIS DE LA VARIANZA

Paso 10. Hallar la suma de cuadrados de la variable B: Hallar los grados de libertad dentro de los grupos:

glw = N - k
= 36 - 9
= 27.

Paso 18. Situar la suma de cuadrados dentro de los grupos y los correspondientes
Puesto que N es igual para cada estado B, habra menor error de redondeo si se grados de libertad en la tabla 15.5.
suman los cuadrados de cada nivel de B y luego se divide por la N de cada estado: Paso 19. Comprobar que
(54)2 + (79)2 + (103)2
SC B = 12 - 1547.11
que
19,766
= -1-2- ­ 1547.11

= 1647.17 - 1547.11 = 100.06. Paso 20. Hallar la estimaci6n de la varianza de la interaccion A x B, dividiendo la
suma de cuadrados de la interaccion por glA x B:
Paso 11. Hallar el numero de grados de libertad para el estado B:
SCA xB 3.27
glB = B-1, S~xB = - - = -- = 0.82.
gl, x B 4
donde B es el nurnero de niveles de B. En el presente ejemplo,
Situar este resultado en la tabla 15.5.
glB = 3 - 1 = 2. Paso 21. Hallar la estimaci6n de la varianza de la variable B, dividiendo la suma de
cuadrados de la variable B por glB:
Paso 12. Situar la suma de cuadrados para la variable B y los correspondientes
grados de libertad en la tabla 15.5.
-2 _ SC B _ 100.06 = 003
SB - - 5. .
Paso 13. Por sustraccion, hallar la suma de cuadrados de la interacci6n: glB 2

SC AxB = SCE - (SC A + SCB) Paso 22. Hallar la estimaci6n de la varianza de la variable A, dividiendo la suma de
= 115.39 - (12.06 + 100.06) uadrados de la variable A por glA:
= 3.27.
S~ = SCA = 12.06 = 6.03.
Paso 14. Hallar el numero de grados de libertad para la surna de cuadrados de la glA 2
interacci6n:
Paso 23. Hallar la estimacion de la varianza dentro de los grupos (error) dividiendo
glAxB = (A - I)(B - 1)
a suma de cuadrados dentro de los grupos por glw:
= (2)(2) = 4.
Paso 15. Situar la suma de cuadrados de la interacci6n y los correspondientes S~ = SCw = 179.50 = 6.65.
grados de libertad en la tabla 15.5. glw 27

Paso 16. Hallar la suma de cuadrados dentro de los grupos. Este valor puede aso 24. Hallar el cociente F para la interacci6n, dividiendo la varianza estimada
obtenerse por sustraccion: e la interacci6n por la varianza estimada dentro de los grupos:
SCw = SC tot SCE
F = s~ x B = 0.82 = 0 12
-
= 294.89 - 115.39 = 179.5. s; 6.65 .,
gl = 4/27.
INTRODUCCI6N AL ANALISIS DE LA VARIANZA 297
296 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

Paso 25. Consultar la tabla D bajo 4 y 27 gl para hallar el valor critico de F para ntre si, Una estimacion de la varianza entre grupos qu~ sea grande ~n relacion con la
rechazar H o al nivel a = 0.01. Puesto que el valor calculado F = 0.12 es menor que . nza dentro de los grupos sugiere que los tratamientos expenmentales son los
ana . ifi .,
el valor tabulado F o.ol = 4.11 requerido al nivel de significancia a = 0.01, no santes de las grandes diferencias entre las medias de los grupos. La signiticativi­
podemos rechazar H o- ~:~ de la diferencia en las varianzas estimadas se obtiene utilizando la tabla para F
(tabla D, apendice III). ., .
Paso 26. Hallar el cociente F para la variable B, dividiendo la varianza estimada de Cuando se encuentra que la F general es estadisticamente significativa, qued~mos
B por la varianza estimada dentro de los grupos: 'bres para investigar las hip6tesis especificas usando una prueba de comparaclOnes
F _ s~_ 50.03 _ ultiples. .
Vim os, finalmente, que el analisis de la varianza puede aphcar~e al cas~ de
- s; - 6.65 - 7.52, gl = 2/27.
isefios mas complejos en los que se usa mas de una variable independiente. Se VlO el
Paso 27. Consultar la tabla D bajo 2 y 27 gl para hallar el valor crttico de F uso del analisis de la varianza con clasificacion doble para evaluar los efectos de dos
requerido para rechazar H o al nivel a = 0.01. PuestO' que F o.ol ~ 5.49, el valor variables independientes y la interaccion entre ellas.
obtenido de 7.52 esta en la region critica para rechazar H o- Existe un efecto
significativo de la variable B.
Paso 28. Hallar el cociente F para la variable A, dividiendo la varianza estimada de
Terminos para recordar
A por la varianza .estimada dentro de los grupos:
antilisis de la varianza homogeneidad de la varianza
F _ s1_ 6.03_ antilisis de la varianza con clasificacion doble interaccum
- s; - 6.65 - 0.91, gl = 2/27.
antilisis de la varianza con clasificacion simple suma de cuadrados
cociente F variables cualitativas
Paso 29. Consultar la tabla D bajo 2 y 27 gl para hallar el valor critico requerido variables cuantitativas
para rechazar H 0 al nivel a = 0.01. Puesto que F 0.01 ~ 5.49, la F obtenida de 0.91 no comparaciones a posteriori "
comparaciones planeadas 0 a pnort varianza dentro de los qrupos
esta dentro de la region critica, En consecuencia, no podemos rechazar H o- varianza entre grupos
diseiio factorial
Conclusion: De los tres efectos evaluados (la variable A, la variable B y la estimacion de la varianza
interaccion de A y B) solamente la variable B resulto estadisticamente significativa.
Resulta ahora adecuado utilizar una prueba de comparaciones multiples para
examinar las diferencias entre parejas de medias. Para efectuar estas comparaciones
puede usarse la prueba DHS de Tukey estudiada en la seccion 15.6.

Resumen del capitulo 1. Sirviendose de los siguientes datos, correspondientes al decenio 1955-1964, deter~inar si
hay una diferencia significativa, al nivel O.Ol,.en el indice de ~ortalidad duran!e las diferentes
estaciones. [Nota: Supongase que los indices de mortahdad para los anos dados son
Comenzamos este capitulo con la observacion de que los cientificos estan frecuente­
independientes.]
mente interesados en la realizacion de estudios mas amplios que los correspondientes
al clasico disefio con dos grupos. Sin embargo, al incluir mas de dos grupos, INVIERNO PRIMAVERA VERANO OTONO

incrementamos el riesgo de cometer un error del tipo I si aceptamos como significati­ 9.8 9.0 8.8 9.4
va cualquier comparacion que caiga dentro de la region de rechazo. En los estudios 9.9 9.3 8.7 9.4
con varios grupos, es deseable saber si existe 0 no una indicacion de un efecto general 9.8 9.3 8.8 10.3
de los tratarnientos experimentales antes de investigar las hip6tesis especificas. La 10.6 9.2 8.6 9.8
9.9 9.4 8.7 S.4
tecnica del analisis de la varianza proporciona un examen de este tipo.
10.7 9.1 8.3 9.6
En este capitulo presentamos una sencilla introducci6n a las complejidades del 8.8 9.5
9.7 9.2
analisis de la varianza. Mostramos que la suma total de cuadrados se puede partir en 10.2 8.9 8.8 9.6
dos sumas de cuadrados componentes: la suma de cuadrados dentro de los grupos Y 10.9 9.3 8.7 9.5
la suma de cuadrados entre grupos. Con estas sumas de cuadrados componentes se 10.0 9.3 8.9 9.4
pueden obtener, a la vez, estimaciones de la varianza poblacional independientes
INTRODUCCION AL ANALISIS DE LA VARIANZA 299
298 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

2. Efectuar una prueba DHS para comparar el indice de mortalidad de cada estacion Con 8. Si el cociente F resulta menor que 1.00, loculil seria la conclusion?
cada una de las otras. En cad a cornparacion, utilizar el nivel 0.01, examen bilateral. 9. Determinar si existe una diferencia significativa en el impuesto estatal de la gasolina entre
3. Efeptuar un analisis de la varianza con los datos del ejercicio 3, capitulo 13. Comprobar tres regiones geograficas dadas.
que en e! caso de dos grupos F = t 2 .
4. Cierto fabricante contrata a 10 diferentes organizaciones de investigacion para que NUEVA INGLATERRA MEDIO ESTE LEJANO OESTE
comparen la eficacia de su producto con la del producto de su principal competidor. En uno
de los 10 estudios se encuentra una diferencia significativa (nive!0.05) a favor del producto del Maine 8 New York 7 Wash. 9
fabricante que encargo la investigacion, el cual an uncia enseguida que la investigacion N. H. 7 New Jersey 7 Oregon 7
independiente ha demostrado la superioridad de su producto sobre e! de su competidor Vermont 8 Penn. 8 Nevada 6
Mass. 6.5 Delaware 7 Calif. 7
~\ principal. Critiquese esta conclusion.
R.1. 8 Maryland 7 Alaska 8
"""""- 5. Varias empresas Iarmaceuticas afirman que fabrican un analgesico que libera su Conn. 8 D. C. 7 Hawaii 5
ingrediente activo con «mayor rapidez». Una seleccion al azar de los productos de cada
fabricante revelo los siguientes tiempos (en segundos) requeridos para liberar el 50 % del
agente analgesico, Examinar la hipotesis nula de que las muestras de los analgesicos provienen
de una poblacion comun. O. Efectuar un analisis de la varianza con los datos del ejercicio 27, capitulo 13.
11. Al comparar la velocidad de escritura a maquina (en palabras por minuto) de. los
MARGA A- MARGA B MARGA C MARGA D integrantes de una muestra de 24 personas que asistieron a cuatro escuelas de secretanado
diferentes, se obtuvieron los siguientes datos:
28 34 29 22

19 23 24 31

30 20 33 18

ESGUELA A ESGUELA B ESGUELA G ESGUELA D


25 16 21 24

50 55 50 70
6. Una organizacion de consumidores selecciona al azar varias secadoras de ropa de tres 50 60 65 80
fabricantes importantes para efectuar un estudio. Se tabule el tiempo requerido por cada 55 65 75 65
maquina para secar un lote estandar de ropa. Plantear y examinar la hipotesis nula apropiada. 60 55 55 70
Usar la prueba DHS para comparar cada marca con cada una de las otras, tomando IX = 0.05. 45 70 60 75
55 65 65 60
MARGA A MARGA B MARGA C

42 52 38

'Existe una diferencia significativa entre las velocidades de escritura de los cuatro grupos?
36 48 44

47 43 33
2. Un experto en nutricion divide una muestra de ciclistas en tres grupos. Al grupo B se Ie
43 49 35
a un suplemento vitaminico, y al grupo C se Ie proporciona una dieta especial. A los del
38 51 32
rupo A se les indica que se alimenten en la forma acostumbrada. Algun tiempo despues, se
egistro el numero deminutos empleados por los ciclistas para recorrer seis kilometres. Ver ta­
7. Se se!eccionan al azar llantas de seis marcas diferentes para comparar las distancias (en la adjunta.
pies)requeridas p~ra frenar cuando el automovil se mueve a 25 kilometres por hora*. Plantear y
examinar la hipotesis nula apropiada. Usar la prueba DHS para cornparar cada marca con A B c
cada una de las otras, tomando IX = 0.01.
15 14 13
MARGA A MARGA B MARGA C· MARGA D MARGA E MARCA F 16 13 12
14 15 11
22 25 17 21 27 20
17 16 14
20 23 19 24 29 14
15 14 11
24 26 15 25 24 17
18 22 18 23 25 15

lantear la hipotesis nula apropiada y efectuar un analisis de la varianza.


* Fuente: Federal Highway Administration. The 1972 World Almanac and Book of Facts. L. H. Long(ed.). Nueva
York: Newspaper Enterprise Association, Inc., 1971, pogo 122. . Con referencia al ejercicio 12, determinar que dieta (0 dietas) es superior.
300 ESTADfsTICA PARA LAS CIENCIAS SOCIALES [301J

14. En 1971, tres equipos de beisbolobtuvieron los siguientes mimeros de home runs hechos
por sus jugadores. REVISION DE LA TERCERA PARTE
Chicago Cubs: 2 16 28 2 21 2 2 19 0 4 8 6
Houston Astros: 9 2 1 10 13 1 12 0 1 2 7 7
Cincinnati Reds: 13 39 25 9 3 0 13 27 5 1 2 Estadistica inferencial

Examinar la hipotesis de que los tres equipos provienen de la misma poblacion en cuanto a la
obtencion de home runs. (Ver The 1972 World Almanac, pags, 910-911.)
15.. Supongase que hay solamente cuatro fabricantes de pintura para casas, y que el A. Pruebas parametricas de signiflcacion
fabricante A afirma que su pintura es superior a las otras. Para examinar esta afirmacion un
investigador deter~in6 en una muestra el numero de afiosque han de transcurrir para que una
casa necesite ser pintada de nuevo, con los resultados que se muestran en la tabla adjunta.
i.Apoyan los datos la afirmacion de A? Comparar los datos de A y de B.

'A 8 C D
n la tercera parte. A (capitulos 10-15) se estudiaron los elementos de la teoria de la
4.5 4.0 2.5 3.5 robabilidad y sus aplicaciones al problema de hacer inferencias a partir de muestras
5" 4.5 3.0 ;3.0 ue se suponen elegidas de poblaciones con distribucion normal. Los problemas que
5.0 4.0 3.0 4.0
5.5 3.5 3.5
se presentan a continuacion permitiran al lector completar el conocimiento del
3.0
6.0 3.0 4.0 4.5 material tratado en esta seccion.
5.0 4.5 2.5 3.0
Considerese la siguiente poblacion de datos: 2, 3, 3, 4, 4, 4, 5, 5, 6.
16. Los datos siguientes corresponden a las calificaciones obtenidas por un grupo de a) Determinar la media y la desviacion estandar de la poblacion.
personas en un experimentofactorial de 3 x 3. Efectuar el analisis de la varianza apropiado e b) Construir una distribucion de frecuencias de las medias para N = 2, usando
indicar las conclusiones a las que conduce dicho analisis, Usar IX = 0.05. muestreo con reposicion.
c) Construir una distribucion de probabilidades de las medias para N = 2.
A, A, A3 d) Determinar (Jx usando la siguiente formula:
B, B, B3 B, B, B3 B1 B, B3 (J
(Jx = --.
8
1
10
7
12
9
5
3
9
10
16
11
6
5
10 17 IN
7 9
7 9 11 8 10 12 4 11 12 e) Determinar (Jx por calculo directo a partir de la distribucion muestral de las
9 7 5 8 6 4 10 8 6 medias.
4 8 15 6 8 10 8 10 12
12 14 15 10
f') Determinar la probabilidad de se1eccionar aleatoriamente muestras (N = 2)
12 13 13 14 14
con:
i) una media muestral de 2.0,
17. Los siguientes datos corresponden a las calificaciones obtenidas por un grupo de ii) una media muestral de por 10 menos 5.0,
personas en un experimento factorial de 2 x 3. Efectuar el analisis de la varianza apropiado e
iii) una media muestral tan rara como 3.0.
indicar las conclusiones a las que conduce dicho analisis, Usar IX = 0.05.

A, A,
Considerese una segunda po blacion de datos: 4, 5, 5, 6, 6, 6, 7, 7, 8.

B, B, B3 B1 B, B3 La persona A toma muestras (con reposicion) de la poblacion 1, y la persona B


tOrna muestras (con reposicion) de la poblacion 2. Se desea examinar la hipotesis nula
4 5 4 8 6 11 de que las muestras fueron extraidas de una poblacion comun, usando (X = 0.05,
6 8 6 7 9 9 rueba bilateral. ~En cual de los siguientes casos se cometera un error del tipo II?
7 3 2 9 12 13
9 7 5 11 8
sense solamente los estadigrafos calculados a partir de las muestras. No se utilicen
7
os valores poblacionales.
302 ESTAOfSTICA PARA LAS CIENCIAS SOCIALES

A 2 3 4 5 6

a)
B 4 5 6 6 8

A 2 3 3 4 4 4 4 4 4 6

b)
B 4 4 4 5 5 5 5 5 6 7

3. Usando los datos del ejercicio 2a) y b), tomar los datos por parejas yexaminar TERCERA PARTE
la significacion de las diferencias, utilizando IX = 0.05, prueba bilateral.
4. De tres universidades, cada una afirma que tiene los estudiantes mas brillantes.
Con objeto de demostrar su afirrnacion, cada una de ellas envia diez de sus mejores
Estadfstica inferencial

estudiantes a participar en un certamen nacional. Los resultados son los siguientes:

2 3
2 3

99 94 74 95 93 99

93 98 99 97 96 71

84 97 98 9. 96 70

89 92 99 88 91 79

72 92 97
89 90 83

Plantear y examinar la hipotesis nula apropiada.

B. Pruebas no parametricas de significacion


304 ESTADfsTICA PARA LAS CIENCIAS SOCIALES [305]

Hasta ~qu~ hemos tratado de los diversos aspectos de la Curva normal en cuanto
sus aplicaciones a la estadistica descriptiva e inferencial. A los exarnenes estadistico~ Potencia y eficiencia
en que se hace uso del modelo probabilistico normal se los denomina prueb
parametricas de siqnificacion.
Hay .muchos conjuntos de datos para los cuales no es adecuado hacer un analisis
as
de una prueba estadistica
en ~er~nos de ~a curva normal, ? que no cumplen las hip6tesis basic as para su
aphcaclOn. Consideremos un estudio en el que los datos recopilados son rangos (p
ejemplo, un ordena~iento de estudiantes por rangos segun su disposicion a coop~~
r~r). Los valores ordinales resultantes no son cuantitativos y se distribuyen, necesa­
namente: en una for~a r~cta~~ular. Resulta claro que en este caso no es posible usar
un estadigrafo con dlstnbucI~n probabilistica normal. En los ultimos afios se ha
desarrollado una notable vanedad de pruebas no parametricas aplicables a tales
datos.
Concepto de potencia
Se define u~a. pr~eba no parametrica de siqnificacion como un examen en el cual no
se hacen hlpotesl.s. acerca de la forma de la distribuci6n original 0 de la poblaci6n,
por 10 que tambien se le llama prueba de siqnificacion de distribucion libre. n las dos primeras partes de este libro solamente se hicieron breves referencias a la
otencia y a la eficiencia de una prueba estadistica (aunque no las identificamos
En esta parte final del texto describiremos varias de las pruebas estadisticas no omo tales). Antes de entrar en el estudio de las pruebas no pararnetricas de
parametricas mas importantes. ignificacion, es conveniente examinar est os conceptos con mas detalle.
En la seccion 11.5, al discutir los errores de tipo I y de tipo II, sefialamos que el
onservadorismo basico de los cientificos determina que fijen un nivel de rechazo
uficientemente bajo para conseguir que los errores de tipo I sean menos frecuentes
ue los de tipo II. En otras palabras, los cientificos prefieren cometer el error de
ceptar una hipotesis nul a falsa antes que cometer el error de rechazar una hipotesis
ula verdadera.
Sin embargo, ello no debe lIevarnos a la idea de que a los cientificos no
os inquieta la posibilidad de co meter errores del tipo II. Por el contrario, es muy
osible que muchos prometedores proyectos de investigacion hayan sido abandona­
os a causa de que el investigador no pudo rechazar la hip6tesis nula cuando era
ealmente falsa.
Hasta aqui nuestra preocupacion ha sido la de establecer un nivel de significacion
ue reduzca la probabilidad de rechazar falsamente la hipotesis nula. En otras
alabras, se ha tratado de evitar mas el error del tipo I que el error del tipo II. Sin
bargo, debe reconocerse que la prueba estadistica ideal es aquella en la que se
nsigue cierto equilibrio entre ambos tipos de error. Lo ideal seria especificar antes
e nuestro estudio la probabilidad de co meter los dos tipos de error. En la practica,
ih embargo, los investigadores se contentan con establecer solamente el valor p que
saran para rechazar la hipotesis nula. Como hemos visto, este valor p representa la
robabilidad de un error del tipo I (0 sea, (X).
Cuando comenzamos a tratar de efectuar un equilibrio entre los errores de los
ipos I y II, nos encontramos con el concepto de potencia de un examen. Se define
'mplemente Ia potencia de un examen como la probabilidad de rechazar la hipo­
sis nula cuando es en efecto falsa. Simbolicarnente, la potencia se define como
gue:

Potencia = 1 - probabilidad de un error del tipo II.


306 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
POTENCIA Y EFICIENCIA DE UNA PRUEBA ESTADfSTICA 307

Si. representa~os por 13 la probabilidad de un error del tipo II, la definicion


anterior se convierte en: abla 16.2 Distribucion muestral de las diferencias
ntrernediasbajoHo: J!l = J!2' (Nota: Hemosconside­

x, - x,
ado que la poblacion 2 es identica a la poblacion 1, 0

Potencia = 1- p. (16.1) ea, que J!l = J!2' Ysobre esta base hemos determinado 6 1
0.0083}
0.0248
las diferencias posibles entre medias.] 5 2 0.0165
Solamente podemos calcular la potencia de un examen cuando H o es falsa yestamos 4 5 0.0413
dando el verdadero valor de la media poblacional segun HI' 3 10 0.0826
2 14 0.1157
Antes de proseguir con un estudio formal de la potencia, revisemos una serie de 1 18 0.1488
problemas que figuran al final del capitulo 12 (ejercicios 30 a 33). Se recordara o 21 0.1736
s UPUSII~OS 1a extraccion
'. d e to d as las parejas
. de muestras posibles de dos poblaciones
que
-1 18 0.1488
de medias. -2 14 0.1157
-3 10 0.0826
-4 5 0.0413
Poblacion 1 de medias: 3 4 5 5 6 6 6 7 7 8 9' /11 = 6;
-5 2 0.0165}
Poblaci6n 2 de medias: 0'' l', 2', 2', 3', 3', 3', 4', 4', 5', 6:, 1/
r: 2
= 3. 0.0248
-6 1 0.0083

Se obtuvo la distribucion muestral de las diferencias entre medias que aparece en N.\', -'i', = 121 LP(X, - X2 ) = 1.0000
la tabla 16.1.

Tabla 16.1 Distribucion rnuestral de las diferencias entre


medi~s cuando todas las medias muestrales posibles se l,Con que frecuencia habriamos fallado en rechazar esta falsa H o? Dicho de otra
9 1 seleccionan, con reposicion, de dos poblaciones de medias en rma, l,con que frecuencia habriamos cometido un error del tipo II?
0.0083
8 2 las que J!l = 6 Y J!2 = 3. Esto representa la verdadera Examinemos sucesivamente cad a una de estas preguntas. Bajo H 0: /11 = /12'
0.0165
7 distribucion muestral de las diferencias entre medias para las
5 0.0413 eberemos rechazar la hip6tesis nula al nivel (J. = 0.05, examen bilateral, cuando
poblaciones indicadas de medias.
6 10 0.0826 btengamos una diferencia en las medias muestrales que sea igual 0 mayor que 5 0
5 14 0.1157
4 18
igual 0 menor que - 5. Observando la tabla 16.1, vemos que, bajo la verdadera
0.1488
3 21 0.1736
istribuci6n muestral de las diferencias, obtendriamos una diferencia entre las medias
2 18 0.1488 igual o mayor que 5 alrededor del 26 % de las veces (0.1157 +0.0826 + 0.0413 +
1 14 0.1157 0.0165 + 0.0083 = 0.2644). Bajo la verdadera distribucion, nunca obtendriamos
o 10 0.0826 a diferencia entre las medias igual 0 menor que - 5. Asi, la probabilidad de
-1 5 0.0413
-2
chazar correctamente H o es 0.2644.
2 0.0165
-3 1 l,Con que frecuencia dejariamos de rechazar H o? Cualquier diferencia entre las
0.0083
edias que sea menor que 5 no determinaria el rechazo de la hipotesis nula. Puesto
ue sabemos que H o es falsa, toda esta region representaria un error del tipo II. La
robabilidad de cometer un error del tipo II es, por tanto, 1.0000 - 0.2644 = 0.7356.
n otras palabras, fallariamos en rechazar una hip6tesis nul a falsa casi el 74 %de las
Entonces fin~~os. no conocer las caracterfsticas de la segunda poblacion y .eces. La potencia de este examen es 0.2644, 10 que significa que rechazariamos
formulamos la hipotesis nula de que la prirnera poblacion y la segunda son la misma prrectamente una hip6tesis nula falsa solamente el 26 % de las veces.
(/11 = /12)' Esta distribucion muestral de las diferencias entre medias se indica en la En la figura 16.1 se presentan los histogramas probabilisticos, tanto de la
tabla 16.2. 'stribucion bajo la hipotesis nula como de la verdadera distribucion de Xl - X2'
N6~ese que bajo la hipotesis nula de que no hay diferencia entre las medias ara el problema muestral que venimos estudiando.
poblac~onales, una diferencia igual 0 mayor que 5 0 igual 0 menor que - 5 deberia Cabria observar que el fallo en rechazar H o cuando es falsa no es solamente un
d~termmar el rechazo de H o al nivel (J. = 0.05 (0.0248 + 0.0248 = 0.0496), examen roblema estadistico y de investigaci6n, sino tambien un problema econornico. La
bilateral. vestigaci6n tiene un costo tanto en tiernpo como en dinero. Se debe poner en tela
~ olvamos ahora a la verdadera distribuci6n muestral de las diferencias entre las juicio la realizacion de un proyecto cuando es alta la probabilidad de cometer un
medl.as muestrales (tabla 16.1) Ypreguntemos: bajo H 0: /11 = /12' l,con que frecuencia ror del tipo II. En este capitulo se estudiaran varias estrategias para reducir el
habriamos rechazado esta falsa hip6tesis nula cuando (J. = 0.05, examen bilateral? sgo de un error del tipo II.

En la seccion siguiente se indica el modo de calcular la potencia. .I

308 ESTADisTICA PARA LAS CIENCIAS SOCIALES POTENCIA Y EFICIENCIA DE UNA PRUEBA ESTADisTICA 309

Calculo de la potencia: caso de una muestra


-.J
...,
0 « n psicologo que trabaja para una gran empresa industrial ha construido dos
a:
Z « UJ
0 <Xl
I- ci calas de aptitud ' que aplica en forma intercambiable a los grupos de personas'
U ::5
';<
0 ~
::J
~::5iii
ntrenadas que inician su trabajo en dicha empresa. Sabe que el rendimiento media
<Xl Qj
a: J:::JZ
uZUJ c(lJ n la escala A es de 70 y que en la escala B es de 72. En ambas escalas la desviacion
I-
en
~~~ 0 standar es de 5. Esta contrariado porque su ayudante no anoto cual de las escalas es
Ci
«
UJenx
oUJUJ

-0
"
-0
a que aplico a un grupo de 16trabajadores. Examinando los datos encuentra
ffil~'" zo,n <;j Igunas calificaciones bajas, 10 que Ie hace creer que la muestra proviene de una'
0 I 0~C!
« -J:O ~ poblacion en la que /l = 70 (0 sea, que es la escala A la que fue aplicada al grupo), de
~I~
(lJ
8::5" ::l
UJUJ
>0
e: " E odo que H o: /l = /lo = 70.


0
c.. Sin embargo, de hecho fue utilizada la escala B. Asi, puesto que sabemos que H 0
en
UJ E s falsa y conocemos el verdadero valor de /l bajo HI (/l = /l I = 72), podemos
(lJ
-.J 'iij"
« alcular la potencia del examen (0 sea, la probabilidad de que sea rechazada la falsa
a: Qj
<D I-
M en hipotesis nula).
ro­ UJ
::J "....c.
en en a :2 " Describamos este problema en terminos estadisticos formales:
::5~ en I~I
UJo s0 I Hipotesis nula (H o): La media de la poblacion de la cual proviene la muestra es
ou UJ
«::J :2 I;>':: igual a 70, a sea, /l = /lo = 70.
e:~
::Je: en (lJ
Hipotesis altematioa (HI): La media de la poblacion de la cual proviene la
01­ -0
«~
::5
UJ c'" muestra es igual a 72, 0 sea, /l = /l1 = 72.
(lJ
0-0
<D a:
0
::5 en M I-
'cr::l
00 ~ Z
UJ
Prueba estadistica: Puesto que se conoce a, la prueba estadistica apropiada

enD O· ..0
en
«
.§ corresponde a z = (X - /lo)/ax.
u -.; Nioel de siqnificacion: CJ. = 0.01 (examen unilateral).
Z
UJ
I
a: ..:s'"
UJ Distribucion muestral: Se sabe que la distribucion muestral de la media es normal.
U.
0
"
....
"c. Region critica: 20.01 2: + 2.33. Puesto que estamos usando un examen unilateral,
UJ '"
0
0
.g la region critica consta de todos los valores de z = (X - /lo)/ax 2: 2.33.
Z .~
-...,
00
}; Por tanto, el valor critico del estadigrafo muestral (valor minimo de X que
~ « N -.J
"
<Xl<Xl::l.
...,
0 «
a:
..0
0
onduce al rechazo de H 0) es
ii:1~~I~ UJ ....
l- I
« I­
c.
::l. I <Xl
en .. «
"'"E
OI~:t:D
O} ~~g
'"
I
J:::JZ
UZ W
~en:2
"
....
OIl
0
'iii
X;", (2.33)ax + /lo.

a
. -«
UJenX :i3 Asi, la potencia es igual a la probabilidad de obtener este valor critico en la
ol.Uw
to
distribucion bajo HI' Se procede de acuerdo a los siguientes pasos,
lb '
ZfJ...:g
Q:i:c:i
8::5"
a: "
-
~
IOi>

~
Calcular el valor de a x:

(J 5
a-x -
- IN -- .fl6 -- 1.-75.

Determinar el valor critico de X (CJ. = 0.01, examen unilateral):

x= (2.33)(1.25) + 70 = 72.91.
310 ESTAOiSTlCA PARA LAS CIENCIAS SOCIALES POTENCIA Y EFICIENCIA DE UNA PRUEBA ESTADfsTICA 311

Paso 3. Determinar la probabilidad de obtener este valor critico en Ja verdadera paso 1. EI valor de (Jx es
distribucion muestral bajo HI' En la distribucion bajo HI' al valor critico de X Ie
corresponde un valor z de (J 5
(Ji = IN = .J25 = 1.00.
72.91 - /11 72.91 - 72.00
Z = (Jx = 1.25 = 0.73. EI valor critico de X es

Buscando en la columna (C), tabla A, apendice III, vemos que la probabilidad de x = (2.33)(1.00) + 70 = 72.33.
rechazar correctamente Hoes del 23.27 %. Esta probabilidad es 1 - /3, 0 sea, la
potencia. Incidentalrnente, la probabilidad de co meter un error del tipo II (/3) es del En la distribucion bajo HI' el valor critico de X tiene un valor z de
76.73 %.
La figura 16.2 clarifica estas relaciones indicando la region de rechazo para H 0 en
z = 72.33 - 72.00 = 0.33.
1.00
la verdadera distribucion bajo HI' I - /3, 0 sea, la potencia. EI area sombreada
indica /3, que es la probabiJidad de aceptar falsamente H o- En la columna (C), tabla A, vemos que la potencia del examen es del 37.07 %.
En eI problema ilustrativo encontramos que cuando N = 16 la p~tencia es ,del
AREA = (3 23.27 %. Al incrementar el tamafio de la rnuestra a N = 25, la potencia aumento al
REGION
DE RECHAZO
37.07 %. Si en el ejernplo anterior calcularamos la potencia ~ara N = 100, enco~tra­
AREA = 1 - (3 rfamos un valor del 95.15 %. Asi, podemos lIegar a la conclusion de que la potencia es
funcion de N.

70 72 72.91 16.4 Efecto del nivel ex sobre la potentia


BAJO Ho BAJO H,
Fig. 16.2 Region de rechazo para
/10 /11 H 0 en la distribucion bajo HI'
En nuestros anteriores estudios sobre los errores de los tipos I y II (seccion 11.6),
indicamos que cuanto menor sea el valor que fijemos para (f., menor sera la
probabilidad de cometer un error del tipo I y mayor sera la probabilidad de com~ter
16.3 Efecto del tamafio de la muestra un error del tipo II. Puesto que /3 es la probabilidad de q.ue ocurra. un error del t~po
II, y se tiene que potencia = 1 - /3, cuanto may~r sea el nivel (f. eleg~~o, mayor sera la
sobre la potentia potencia del examen. Puede demostrarse facilmente esta re~aclOn entre (f. y la
potencia, tomando un nivel (f. diferente en el problema antenor y observando la
La potencia varia Como una funcion de varios factores distintos. Examinese el efecto variacion de la potencia.
que tiene sobre la potencia la variacion del tarnafio de la muestra. Utilicernos, por Por ejernplo, usando (f. = 0.05 (examen unilateral) con N = 16, encontramos que
ejemplo, N = 25 en el problema descrito en la seccion anterior y veamos eJ efecto que la region critica esta constituida por todos los valores
esto tiene sobre la potencia de la prueba.
Usando los mismos procedimientos descritos anteriorrnente, examinaremos la
hipotesis z = X - J.lo ~ 1.65*
(Ji
H o : II = /10 = 70,
dado que la hipotesis verdadera es Por tanto, el valor critico es X = (1.65)(Jx + J.lo = 72.06. Asi, potencia = 48'.01 %
cuando (f. = 0.05. En el ejemplo de la seccion 16.2 encontrarnos para la potencia un
valor de 23.27 % cuando (f. = 0.01.
Puesto que, con (f. = 0.01 (examen unilateral), la region critica esta constituida por
todos los valores de z = (X - /1o)/(Jx ~ 2.33, el valor critico es X = (2.33)(Jx + J.lo' • Cuando " = 0.05 (exarnen unilateral), el valor critico de 2 esta comprendido entre 1.64 y 1.65. Usaremos 2 = 1.65
Asi, como valor critico, de modo que p < 0.05, en vez de 2 = 1.64, que da p > 0.05.
312 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
POTENCIA Y EFICIENCIA DE UNA PRUEBA ESTADfsTICA 313

16.5 Efecto de la naturaleza de HI En esos casos nos vemosobligados a utilizar pruebas no parametricas que son
sobre la potencia menos potentes*.
l,Por que son menos potentes las pruebas no parametricas? Planteada en forma
escueta, la respuesta es que las pruebas estadisticas parametricas (contrariamente a 10
La potencia de un examen es tam bien funci6n de la naturaleza de la hip6tesis que ocurre con las pruebas no parametricas) utilizan al maximo toda la informaci6n
alternativa, En el cas a de que H o sea realmente falsa, la HI direccional
0 de una cola inherente a los datos cuando las poblaciones son normalmente distribuidas. Veamos
es mas potente que la prueba bilateral, mientras el parametro este en la direcci6n una ilustraci6n sencilla. Imaginemos que en el curso de un estudio se han obtenido
predicha.
los siguientes datos: 50, 34,21, 12, 10. Si convirtieramos ahora estos datos en rangos
El examen a simple vista de la tabla 16.3 revela que cuanto mayor sea el nivel ex (operaci6n que es basica en las pruebas no parametricas relativas a las escalas
men or .sen! el valor absoluto de z requerido para rechazar H o. Ya hemos visto que I~ ordinales), obtendriamos 1,2,3,4,5. N6tese que toda la informaci6n concerniente a
potencia crece cuando crece ex. Ello implica que la potencia aumenta cuando el valor las magnitudes de los datos se pierde al pasar a rangos. La diferencia entre 50 y 34
enrico de z decrece. La tabla 16.3 muestra que para cualquier nivel ex dado el va­ resulta «equivalente» a la diferencia entre 12 y 10 cuando se expresan los valores
lor critico de z es menor para un exam en unilateral que para uno bilateral. Po; tanto como rangos. Esta mayor sensibilidad de las pruebas parametricas a las magnitudes
un~ z obtenid~ que no es sign~ficativa para un examen bilateral puede serlo para un~ de los datos hace que constituyan una base mas segura para determinar los valores
umlateral. ASI, el examen umlateral es mas potente que su alternativo bilateral, a de probabilidad cuando se cumplen las hip6tesis fundamentales de la cardinalidad.
menos que ocurra que el parametro este en una direcci6n opuesta a la predicha. En
este caso, el exame~ unilateral sera menos potente.

NATURALEZA DE H,
Tabla 16.3 Valores criticos de z requeridos para
rechazar H 0' en varios niveles ex, como funcion de la
16.7 Calculo de la potencia: caso de dos muestras
naturaleza de H].
DIRECCIONAL NO DIRECCIONAL
(EXAMEN UNILATERAL) (EXAMEN BILATERAL) Hasta aqui hemos utilizado el caso de una muestra para examinar el efecto de
= 0.005 z = 2.58
diversos factores sobre la potencia. Todas las conclusiones que se han obtenido se
Cl z = ±2.81
Cl= 0.01 z = 2.33 z = ±2.58
aplican igualmente al caso de dos muestras.
Cl = 0.025 z = 1.96 z = ±2.24 LIegados a este punto sera util, a modo de ilustraci6n, desarrollar un problema
Cl = 0.05 z = 1.65 z = ±1.96 muestral en el que se calcula la potencia de un examen estadistico en e1 caso de dos
muestras.
Sup6ngase que se tienen dos poblaciones con los siguientes parametres:
fl.1 = 80, fl.z = 75,
16.6 Pruebas parametricas UI = 6, U z = 6.
Si de cada una de estas poblaciones tomamos una muestra de nueve elementos
versus pruebas no parametricas: potencia .(N I = 9, N z = 9), podemos efectuar un examen para ver si es significativa la dife­
rencia entre las dos medias muestrales obtenidas. Planteemos primero este proble­
Otro factor que determina la potencia de una prueba estadfstica es la naturaleza de ma en terrninos estadisticos formales.
dicha prueba. Cabe establecer como regIa general que para cualquier N dado, las
1. Hipotesis nula (H o): Las dos muestras provienen de poblaciones con medias
pr~e~as parametricas son mas potentes que sus equivalentes no parametricas. Es
iguales, est a es, fl.1 = fl.z.
principalmente por esta raz6n par 10 que hemos diferido el estudio de la potencia
es.tadistica ?as.ta es~~ secci6n del texto. Para cualquier N dado, las pruebas parame­ 2. Hipotesis alternatioa (HI): Las dos muestras provienen de poblaciones can
tncas .de significacion (en las que se supone que las poblaciones se distribuyen medias diferentes, esto es, fl.1 =f fl.z.
norrnalmente con la misma varianza) conllevan un riesgo menor de cometer error del 3. Prueba estadistica: Puesto que estamos comparando dos medias muestrales
tipo II, y dan mas seguridad de rechazar H o cuando es falsa. Asi, si hay que elegir provenientes de poblaciones normalmente distribuidas, can varianzas conocidas,
entre una prueba no parametrica y otra pararnetrica, se debe escoger la prueba resulta apropiado el uso de la variable z.
parametrica siempre que se cumplan las hip6tesis basicas. Sin embargo, como
verernos en los capftulos siguientes, hay numerosos casos en que la propia naturaleza * Debe insistirse en que las pruebas pararnetricas son mas potentes sola mente cuando son validas las hipotesis que
permiten su uso. Cuando estas hipotesis no se cumplen, un examen no pararnetrico puede ser tan potente como otro
de los datos excluye la posibilidad de usar una prueba parametrica de significaci6n. pararnetrico.
314 ESTADfSTICA PARA LAS CIENCIAS SOCIALES POTENCIA Y EFICIENCIA DE UNA PRUEBA ESTADfsTICA 315

4. Nivel de siqnificacion: ex = 0.01. 16.8 Efecto de las medidas correlacionadas


5. Distribucion muestral: Se sabe que el estadigrafo XI - X 2 tiene distribuci6n sobre la potencia
normal.
6. Region critica: IZo.oII ~ 2.58. Puesto que HI no es direccional, la region critica
En la seccion 14.2 indicamos que cuando se ha tenido exito en clasificar a los sujetos
esta constituida por todos los valores de Z tales que z ~ 2.58 y z ::;; - 2.58.
experimentales por parejas segun una variable correlacionad~ ,con I~ v~riable de
En otras palabras, cuando criterio, una prueba estadistica que tenga en cuenta est a co~r~laclOn sera mas potente
que otra que no la considere. Ello puede demostrarse facilrnente. .
Usando los datos del problema anterior, supongamos que los nueve sujetos
tornados de la poblacion 1 son apareados con los nueve sujetos de la poblacion 2 en
base a una variable relacionada, y que la correlacion entre estas dos variables de 0.80.
~ech?Zaremo! H o· !uesto que segun H o se tiene que PI - P2 = 0, el valor critico Puesto que, con ex = 0.01 (examen bilateral), la region critica esta formada por
inferior de (XI - X 2 ) = (-2.58)<Tx ,_ x , 1 y el valor critico superior de (XI - X 2 ) = todos los valores de z tales que
= (+2.58)<Tx -x.
Ahora bien, una vez sabido que H o es falsa (0 sea, que PI - P2 =F 0), la potencia
d~1 exa~en es igual a la probabilidad de obtener estos valores entices. Cualquier 1::1 = !(X I - X?! -_(PI - pz)1 ~ 2.58,
diferencia muestral obtenida que este comprendida entre estos valores criticos <TXI-x,
conducira a que se corneta un error del tipo II (0 sea, a aceptar una H o falsa).
Para calcular la potencia, se utilizan los siguientes pasos: los valores criticos de (XI - X2) son iguales a (±2.58)<Tx,_x 2 ,
Paso 1. Calcular el valor de <Tx I -x-2 : Paso 1. EI valor de <TX I - X 2 es

<Tx- 1-"'2
,. /(J~.+d~---=2~·dx
= 'V.;\1 .1.}
u\=
-1'2
1.26.

Paso 2. Los valores criticos de (X I - X 2) son

(X I - X 2) = (± 2.58)(1.26) = ± 3.25.
Paso 2. Determinar los valores criticos de (X I - X 2)' ex = 0.01, examen bilateral.
EI valor criti~o inferior es (X I - X2) = (- 2.58)(2.828) = -7.296. El valor entice Paso 3. EI valor critico inferior de (XI - X2 ) tiene, en la distribucion segun HI' un
superior es (X I - X 2) = 7.296. valor z de
Paso 3. Determinar la probabilidad de obtener estos valores criticos en la verdade­
ra distribucion muestral segun HI' EI valor critico superior de (X - X ) tiene un
z = (- 3.25 - 5.00) = _ 6.55.
valor z, en la distribucion segun HI' de I 2
1.26

En la tabla A encontramos que el area situada a la izquierda de -6.55 es


7.296 - PX I - X 2 7.296 - 5.0 despreciable. Por tanto, la potencia quedara determinada por el valor critico
2.828 = 0.81.
superior. _ _
Al valor critico superior de (X I - X 2) Ie corresponde un valor z de
En la columna (C) de la tabla A vemo~ que ~ area a la derecha de una z de 0.81 es
20.90 %. EI valor critico inferior de (X I - X 2) tiene un valor z de
z = 3.25 - 5.00 = -1.39.
1.26
-7.296 - 5.0
2.828 = -4.35. Para hallar la probabilidad de obtener (X I - X 2) ~ 3.25, busc~mos en la tab~a A
para hallar el area situada ala derecha de z = -1.39. Resulta asi que la poten~~a es
Ala izquierda de una z de -4.35 hay solamente una proporcion despreciable de area igual a 100.00 % - 8.23 % = 91.77 %. Puesto que potencia = 1 - fl, la probabilidad
«0.003 %). Asi, la potencia es igual al 20.90 %. de un error del tipo II (fl) es del 8.23 %.
316 ESTADfSTlCA PARA LAS CIENCIAS SOCIALES
POTENCIA Y EFICIENCIA DE UNA PRUEBA ESTADfsTICA 317

16.9 Potencia, errores de los tipos I y II tengan que utilizar pruebas no parametricas, podemos hacer que cualquiera de elIas
sea tan potente como otra parametrica usando un tarnafio muestral mayor. Asi, la
DetengamO~OS un momento para enlazar algunas de nuestras observaciones acerca prueba A puede ser mas potente que la B cuando los tarnafios N son iguales; pero B
de la potencia y de los errores de los tipos I y II. Para cornenzar, debemos destacar el puede ser tan potente como A si es que tomamos, por ejernplo, una N de 40 para B y
hecho de que sola~ente hay dos posibilidades respecto a la hipotesis nula; es decir, 0 una N de 30 para A.
e~ ver?adera (por ejemplo, /11 = /12) 0 no 10 es (por ejernplo, /11 f /12)' Estas son dos El concepto de eficiencia se refiere al incremento necesario en el tarnafio de la
situaciones mutuamente excluyentes. Ahora bien, puesto que un error del tipo I s muestra para hacer que una prueba sea tan potente como otra con la cual se la
?efine .como la probabilidad de rechazar n; cuando es verdadera, dos puntos seria~ compara. Supongamos que la prueba A es la la mas potente para el tipo de datos que
mmedIatamente ObVlOS: estamos analizando. Admitamos que la prueba B tiene igual potencia que la A
cuando sus N respectivas son de 40 y 30. Representemospor N b el tamafio N
1. Si Hoes falsa, la probabilidad de un error del tipo I es cero.
necesario para hacerla tan potente como la prueba A cuando se usa N La eficiencia
Q'

2. Sola mente cuando rechazamos H 0 existe alguna posibilidad de cometer un de la prueba B queda expresada entonces como
error del tipo I. Este error se produce solamente cuando H es verdadera en
cuyo caso la probabilidad de un error del tipo I es !X.. 0 ,
N
Eficiencia de la prueba B = 100 (16.2)
!I
_Q.

Ademas, puesto que un error del ti~o se define como la probabilidad de aceptar Nb
H0 cuando es falsa, lIegamos a las siguientes conclusiones:
Asi, en el ejemplo anterior, la eficiencia de la prueba B respecto a la prueba A es
1. Si H o es uerdadera, la probabilidad de un error del tipo II es cero.
de 100a8), 0 sea, el 75 %. Par tanto, si se cumplen todas las hipotesis para el empleo
2. Solarnente cuando aceptamns H o existe alguna posibilidad de cometer un error de A, tendrernos que usar cuatro casos de la prueba B par cada tres de la prueba A
del tip~ !I. Este error se produce solamente cuando Hoes falsa, en cuyo caso la para conseguir una potencia igual. Por supuesto, si no se cumplen las condiciones
probabilidad de u~ error del tipo II es p. Debe quedar claro, entonces, que el para el empleo de la prueba A, el concepto de eficiencia carece de significado, puesto
co~cepto de potencia, que se define en terrninos de un error del tipo II (1 - P), se que no podra emplearse la prueba A.
aplica solamente cuando H 0 no es verdadera.
La tabla 16.4 resume las probabilidades asociadas con la aceptacion 0 el rechazo
de H o de acuerdo a como sea en realidad la situacion, (Recuerdesa que esta tabla fue
presentada en la seccion 11.5.2.)
Resumen del capitulo
ESTADQ REAL DE H
Tabla 16.4 Tipo de error cornetido, tenien­
o do en cuenta el estado real de HoY la decision

r
En este capitulo se han estudiado dos conceptos importantes: el de la potencia y el de
estadistica tomada. A modo de ilustracion,
ACEPTAR H o RECHAZAR H si H o es verdadera (columna I) y rechazarnos la eficiencia. Se define la potencia como la probabilidad de rechazar H o cuando es
o
H 0 (fila 2), cometemos un error del tipo I. realmente falsa; 0 sea, potencia = 1 - p.
Correcta Error tipo II Si H o es falsa (columna 2) y rechazamos H o, Se indica la forma de calcular la potencia en los casos de una y de dos muestras,
Verdadara 1- IX
nuestra decision es correcta. cuando se sabe que Hoes falsa y se conoce el verdadero valor del pararnetro segun
{3

Decision

HI'
Error tipo I Correcta
H o Falsa Para calcular la potencia se necesita obtener:
IX 1-{3
el error estandar de la distribucion muestral tanto segun H 0 como segun HI'
el valor critico del estadigrafo muestral [X en el caso de una muestra; (X1 - X 2)
en el caso de dos muestrasJ,
16.10 Eficiencia de una prueba estadfstica la probabilidad de obtener este valor critico en la distribucion muestral segun
HI' Esta probabilidad es la potencia del examen estadistico,

E.n !a s~cci~~ 16.6 se indico que, cuando es razonable admitir que se cumplen las Se dernostro que la potencia varia como una funcion de:
hlpote~ls .baslcas, las pru:bas pararnetricas son mas potentes que las pruebas no el tarnafio de la muestra,
parametricas, para cualquier N dado. Sin embargo, tarnbien es cierto que cuando se
el nivel !X.,
318 ESTADfSTICA PARA LAS CIENCIAS SOCIALES POTENCIA Y EFICIENCIA DE UNA PRUEBA ESTADfSTICA 319

3. la naturaleza de HI' 5. Para el problema 6 del capitulo 13, ca1cular la potencia en cada uno de los cuatro
ejemplos, empleando a: = 0.01, examen unilateral. i,Que factores que influyen sobre la potencia
4. la naturaleza de la prueba estadistica,
son los que ilustran estos ejemplos?
5. el uso de medidas correlacionadas.
6. En el capitulo 14, problemas 3 a 5, vimos que el uso de muestras correlacionadas dio
La eficiencia se ~efiere al incremento en el tamaiio de la muestra para una prueba lugar a que se encuentre un valor de t mas alejado de la region de rechazo que el valor de t
basado en muestras independientes. Esto pareceria contradecir 10 dicho en la seccion 16.8.
dada que es nec~san? 'para hacerla tan potente como otra prueba en la que se emplea
Arrnonizar esta disparidad.
una N menor, Simbolicamente, la eficiencia de la prueba B respecto a la prueba A se

puede representar Como


7. Explicar por que la potencia no es solamente un problema estadistico y de investigacion,
sino tambien un problema econornico.
8. i,Por que no puede aplicarse el concepto de potencia euando la hipotesis nula es
Potencia de la prueba B = (100) N a • verdadera?
Nb
9. Explicar por que no puede cometerse un error del tipo I euando la hipotesis nula es falsa.
10. Supongase que la prueba A es la mas potente para los datos que estamos analizando.
i,CuaI es la eficiencia de la prueba B cuando N a = 20 Yse requieren los siguientes valores de N b
para que la prueba B sea igualmente potente?
Terminos para recordar a) 25 b) 30 c) 35 d) 40 e) 50
11. Resumir los diversos factores que afectan a la potencia de un examen estadistico.
eficiencia Enumerar las diferentes Iorrnas en que puede incrernentarse la potencia.
potencia de una prueba
CASO DE DOS MUESTRAS

MUESTRAS
ESCALA
DE MEDIDA I CASO DE UNA MUESTRA
MUESTRAS
RELACIONADAS INDEPENDIENTES

Ejercicios Prueba binomial l


Seccion 17.2-17.3 Prueba x.
Nominal Secci6n 17.5-17.6
Prueba x'
1. La prueba A tiene una. eficienci~ del 80 % respe~to a la prueba B. Si en la prueba B Secci6n 17.4
empleamos un total de 24 sujetos, i,cual es el N requendo para conseguir una potencia igual
con la prueba A? Prueba del signo
Secci6n 18.4
2. Empleando el problema muestral de la seccion 16.3 calcular la potencia euando U de Mann-Whitney
Ordinal
N = 100. ' Prueba del siqno-ranqo para Secci6n 18.2
observaciones pareadas
3. Empleando el pr?blema muestral de la seccion 16.7, demostrar el efecto de la naturaleza Secci6n 18.5
de HI sobre la potencia, calculando dicha potencia cuando a: = 0.01; examen unilateral, esto
es, HI: )11 > )12'
4. Emplear a: = 0.01; examen bilateral, con las dos poblaciones normales siguientes:
)11 = 100, )12 = 90,

(il = 10, (i2 = 10.

a) Si se extrae de cad a poblacion una muestra de tamafio 25, hallar:

1) la probabilidad de un error del tipo I,

2) la probabilidad de un error del tipo II,

3) la potencia del examen.

b) Si se extraen?OS muestras de tamafio 25 de la poblacion 1, hallar:

1) la probabilidad de un error del tipo I,

2) la probabilidad de un error del tipo II,

3) la potencia del examen.

[320] INFERENCIA ESTADfSTICA CON VARIABLES CATEGORICAS 321

prueba estadistica, la distribucion muestr~l y el ni~~l de significacion deben e,specifi­


Inferencia estadistica
17 con variables categoricas
carse antes de la recopilacion de datos. Si nos pusieramos a «buscar» despues de la
recolecci6n de los datos, tenderiamos a exagerar los efectos de cualquier diferencia
casual que favoreciera a una prueba mas que a otra. El re~ultado seria un incr~~ent~
sustancial de la probabilidad de cometer un error del tipo I (rechazar la hipotesis
nula cuando es verdadera).
Generalmente no se nos presenta el problema de elegir pruebas estadisticas en
relaci6n con variables categoricas, debido a que las pruebas no parametricas
solamente son convenientes para los datos enumerativos.
El problema de la eleccion de un tratamiento estadistico sepresenta general mente
euando empleamos muestras pequeiias* y/o cuando existen dudas respecto a la
normalidad de la distribucion de la poblaci6n en estudio. En el capitulo 18 veremos
varias pruebas estadisticas no parametricas que se emplean siempre que se presentan
17.1 Introduction dudas de esta clase.

En los ultimos afios se ha producido una ampliacion tanto en el objetivo como en la


penetracion de la investigacion en las ciencias del comportamiento y en las ciencias
sociales. Se ha iniciado mucha investigacion estimuladora e incitante en areas tan
diversas como la personalidad, la psicoterapia, los procesos de grupos, los pronosti­ 17.2 Prueba binomial
cos econornicos, etc. Se han aiiadido nuevas variables al arsenal del investigador,
muchas de las euales no se prestan al tratamiento estadistico parametrico tradicional, Al estudiar en la seccion 2.4, las diversas escalas de medida, seiialamos que la
ya sea a causa de las escalas de medida empleadas 0 por las flagrantes violaciones de ohservacion de variables no ordenadas constituye e1 nivel mas bajo de medida. A su
las hipotesis de estas pruebas parametricas. Por estas razones se han desarrollado vez la forma mas sencilla de escala nominal es aquella que contiene solamente dos
muchas tecnicas estadisticas muevas. En este capitulo y en el siguiente presentamos clases 0 categorias y se la denomina con varios nombres tales como poblacion
algunos platos escogidos del menu no pararnetrico. bicateg6rica 0 dicotomica. Los ejernplos de poblacion bicategorica son numerosos;
Las tecnicas parametricas son usadas preferentemente a causa de su gran asi tenemos hombre y mujer, pregunta bien y mal contestada en un examen, casado y
sensibilidad. Sin embargo, esta generalizacion no es valida euando las hipotesis soltero, delincuente y no delincuente juvenil, culto e inculto, etc. A algunas de estas
basicas son seriamente violadas. Sin duda, en ciertas circunstancias (por ejemplo, poblaciones se las puede considerar inherenternente dicotomicas (por e~e~plo,
distribuciones muy sesgadas, particularmente con pequeiios tarnafios muestrales) hombre versus mujer) y por ello no pueden ser medidas en una escala numenca ~e
una prueba no pararnetrica puede ser tan potente como su correspondiente parame­ mayor nivel; en tanto que a otras (por ejemplo, culto e inculto) se las puede concebl.r
trica*. Por consiguiente, el investigador se enfrenta a menudo con la dificil eleccion como continuas, variando desde la ausencia de la cualidad observada hast~ los di-.
de una prueba estadistica apropiada para sus datos. ferentes grados de su manifestaci6n. Evid:ntemente, siempre que sea posible, l?s
Al Ilegar a este punto, es necesario aiiadir algunas palabras de advertencia datos recopilados deben tener el mas alto myel de medlda. que pued,an alcanzar. .Sm
respecto a la eleccion de las pruebas estadisticas de inferencia. Con fines heuristicos, embargo, por diversas razones, no siempre podrem?s medir una variable e~ un myel
elegiremos un os cuantos problemas y los someteremos a analisis estadisticos emplean­ ordinal u otro superior. No obstante, con frecuencia tendremos que recopilar datos
do diferentes pruebas de significacion. Este procedimiento servira para aclarar las nominales y efectuar inferencias a partir de ellos.
diferencias entre las diversas pruebas. Sin embargo, es po sible que inadvertidamente En una poblaci6n bicategorica se define P como la proporci6n de casos
se llegue a conclusiones erroneas, en particular aquella de que el investigador recopila comprendidos en una de las clases y Q = 1 - P como la proporcion comprendida en
primero sus datos y despues «va buscando» un estadigrafo que le proporcione la la otra.
prueba mas sensitiva para detectar cualquier diferencia que pudiera existir. De hecho, En el capitulo 11 se vio el usa de la distribucion muestral bino,mial para ,ex~minar
nada puede estar mas lejos de la verdad. La hip6tesis nula, ia hipotesis alternativa, la hipotesis concernientes al valor de P segun H o- A fines ilustrativos, ~estnn~lr~m~s
nuestro estudio a H o
: P = Q = 1. Sin embargo, es posible exammar hipotesis
referentes a cualquier valor de P.

• Nurnerosos investigadores han dernostrado la solidez de las pruebas t y F, 10 eual quiere decir que, incluso
desviaciones irnportantes respeeto de las hipotesis que faeultan el usa de las pruebas pararnetricas, no afectan seriamente
a la validez de las inferencias estadistieas. Para una mayor informacion sobre esta materia, vease Haber, Runyon y Badia, • Cuando se utilizan muestras grandes, las pruebas pararnetricas son easi siernpre apropiadas en ra: on del [eorema del
Readings in Statistics, Reading, Mass.: Addison Wesley Publishing Co., Inc., 1970. limite central (seccion 12.2.).
322 ESTADiSTICA PARA .LAS CIENCIAS SOCIALES INFERENCIA ESTADiSTICA CON VARIABLES CATEG6RICAS 323

Recuadro 17.1
100.-------------------------~

90

80
70
UJ
..., 60
~
UJ 50
U
a:
~ 40

30

20
10

o
SOBREVIVIERON NO SOBREvrVIERON NO
SOBREVIVIERON SOBR EVIVIERON
TUVIERON PERRO NO TUVIERON PERRO

La conocida frase «El perro es el mejor amigo del hombre» ha sido muchas veces tema significacion apropiada (prueba Xl) permite averiguar si el ser propietario de un perro y
de canciones y de leyendas. La evidencia reciente sugiere que la presencia de un perro la supervivencia son hechos relacionados.
puede tener tambien valor terapeutico (Friedman, 1979)*. Se estudio durante un afio a
un grupo de pacientes de enfermedades coronarias a su salida del hospital. Cincuenta y
tres de estos pacientes tenian un perro y 39 no 10 tenian. Un afio despues, 11 de los
pacientes que no tenian perro fallecieron, en tanto que solamente murieron tres de SITUACION RESPECTO A TENER PERRO
los propietarios de perro.
NO
En este estudio hay dos variables nominales: situacion respecto a la posesion de un PROPIETARIOS PROPIETARIOS
perro mascota y registro de supervivencia despues de sufrir una enfermedad coronaria. UJ~
ClU SOBREVIVIO 28 7~
Hay dos valores para cada una de estas variables: poseer versus no poseer perro, y 50
z~ UN ANO
sobrevivir versus no sobrevivir a una enfermedad cardiaca, A nivel descriptivo, 0>
podriamos determinar el porcentaje de propietarios de perro versus porcentaje de los
u>
<ta:
NO
SOBREVIVIO
3 11 14
::::J UJ
1-0­
que no son propietarios de perro que sobrevivieron y que no sobrevivieron por 10 -::::J 53 39 92
(fJ(fJ
menos un afio despues de la hospitalizacion, Estos resultados aparecen en el diajrama
de barras adjunto.
A nivel inferencial, los datos pueden disponerse en forma de tabla de contingencia de
2 x 2. Leyendo hacia abajo, vernos que cincuenta de los cincuenta y tres propietarios de Tabla de contingencia de 2 x 2 que muestra el numero de propietarios de perro yel
perro sobrevivieron por 10 menos un afio, En cambio, solamente veintiocho de los numero de no propietarios de perro que sobrevivieron por 10 menos un afio despues de
treinta y nueve que no son propietarios de perro quedaban supervivientes. La prueba de aparecer una enferrnedad coronaria.

* Citado en un articulo del doctor Neil Solomon en Tile Los Anqeles Times, 25 enero 1979.
324 ESTADfsTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADfsTICA CON VARIABLES CATEGORICAS 325

Las probabilidades asociadas con resultados especificos pueden obtenerse usan­ Para deterrninar si la x obtenida cae dentro de la region cntica, debemos obtener
do la formula (17.1): la suma de las probabilidades correspondientes x = 9, x = 8, x = 7 y x = 6.
NI Como aclaracion hallamos, utilizando la formula (17.1), que la probabilidad de
pIx) = ... ~-.:._..~~ PXQN-x (17.1) x = 9, esto es, si P = 0.3 (segun H 0)' la probabilidad de que los 9 estudiantes fumen es
x!(N - x)! .'
donde 9'
p(9) = (' (0.3)9(0.7)9 - 9
9! 9 - 9)!
x =numero de objetos comprendidos en una categoria 0 nurnero de exitos,
N - x = numero de objetos en la otra categoria 0 numero de fracasos, = (0.3)9 = 0.000019683.
N = numero total de objetos 0 numero total de intentos, La probabilidad de x = 8 es
p(x) = probabilidad de que hay a x objetos en una categoria,
! el signo factorial indica que se ha de multiplicar el mimero indicado por p(8) = 9(0.W(0.7)1 = 0.000413343.
todos los enteros menores que el, pero mayo res que cero; asi, si N = 5, La probabilidad de x = 7 es
N!* = 5·4·3 ·2· 1 = 120.
p(7) = 36(0.]f(0.7)2 = 0.003857868.
Nos serviremos de un problema muestral para ilustrar el uso de la formula (17.1) en
Finalmente, la probabilidad de x = 6 es
el examen de hipotesis.
p(6) = 84(0.3)6(0.7)3 = 0.021003948.
17.2.1 Problema muestral Asi, la probabilidad de que al menos 6 de los 9 estudiantes fumen, cuando
P = 0.30, es igual a la suma de las anteriores probabilidades, 0 sea, p(x ~ 6) = 0.025.
El delegado de los estudiantes de una gran universidad manifiesta que desde que se
prohibio la venta de cigarrillos en el campus, la proporcion de estudiantes que fuman Decision: Puesto que la probabilidad obtenida es menor que 0.05, podemos
bajo a 0.30. Sin embargo, observaciones previas en otras instituciones donde tam bien rechazar H o- En otras palabras, la afirrnacion del delegado parece ser erronea,
se habia prohibido la venta de cigarrillos, indican un efecto muy pequefio sobre el
Presentamos el ejemplo anterior para ilustrar la aplicacion de la formula (17.1)
habito de fumar, 0 sea, que mucho mas del 0.30 de los estudiantes continuaron
fumando. cuando P =1= Q =1= t· Sin embargo, cuando N :s; 49 y P =1= Q =1= t, se puede emplear la
A nueve estudiantes, seleccionados al azar, se les pidio que declarasen si fumaban tabla N del apendice III para obtener directamente los valores criticos de x para
o no. Seis de ellos respondieron afirmativamente. valores seleccionados de P y Q. Refiriendonos a la tabla N, para N = 9 y P = 0.30,
Para examinar la validez de la manifestacion hecha por el delegado, represent are­ hallamos que x debe ser igual 0 mayor que 6 para que se rechace H o al nivel
mos por PIa proporcion de estudiantes que fuman y por Q la proporcion de los que no (J. = 0.05.
fuman. Digamos de paso que, cuando P = Q = t y N :s; 50, la tabla M proporciona los
valores criticos de x, tanto en el caso unilateral como en el bilateral, correspondientes
1. Hipotesis nula (H o): P s 0.30, Q ~ 0.70. a los niveles (J. = 0.01 y (J. = 0.05, donde x se define como la mayor de las frecuencias
2. Hipotesis alternativa (HI): P> 0.30, Q < 0.70. Notese que HI es direccional. observadas. Por ejernplo, si lanzamos una moneda diez veces (N = 10),hallamos que
se requiere un valor de x = 9 para rechazar H o (P = Q = t) con (J. = 0.05, examen
3. Prueba estadistica: Puesto que estamos tratando con una poblacion bicategorica,
la prueba binomial es apropiada. bilateral.
4. Nivel de siqnificacion: (J. = 0.05.
5. Distribucion muestral: La distribucion muestral esta dada por el desarrollo
binomial, formula (17.1).
6. Region critica: La region critica esta formada par todos los valores de x que son
17.3 Calculo aproximado de valores binomiales

suficiente~ente grandes para que la probabilidad de su realizacion segun H o sea mediante la curva normal

menor 0 igual que 0.05. Puesto que HIes direccional, la region critica es de una
cola. A medida que N aumenta, la distribucion binomial se acerca a la distribucion
• Al obtener las probabilidades binomiales, es importance recordar que O! = 1 Yque cualquier valor diferente de cero normal. La aproximacion es mas rapida cuando P y Q tienen valores proximos a t·
elevado a la potencia cero es igual a 1, 0 sea, XO = 1. Por otra parte, cuando P 0 Q tienen valores cercanos a 0, la aproximacion ala curva
326 ESTADfsTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADfsTICA CON VARIABLES CATEGORICAS 327

normal se hace mas deficiente para cualquier valor de N dado. Una buena regIa los tres jabones estan hechos con distintas formulas, y que las colores distintos de las
practica, cuando se considere la aproximacion normal a la binomial, es que el envolturas sirven solamente para ayudar a la identificacion de cada jabon. Un mes
producto NPQ debe ser igual por 10 menos a 9 cuando P tenga un valor proximo a 0 despues se informa a cada ama de casa que recibira gratuitamente una caja del jabon
01, y que N debe ser igual 0 mayor que 25 cuando P = Q = 1. Sin embargo, aun con que haya elegido. Los resultados se presentan a continuacion.
valores mas pequeiios de N la aproximacion es excelente. Aceptando estas restriccio­
COLOR DE LA ENVOLTURA
nes, vemos que la distribucion muestral de x, definida como el numero de objetos
comprendidos en una categoria, es normal, con media igual a N P y desviacion BLANCO CASTANO TOTAL
estandar igual a J N PQ.
ROJO

Para examinar la hipotesis nula, llevamos x a la forma estandarizada: Preferencias de las amas de casa 200 300 100 600

x-NP
(17.2) Este es el tipo de problema para el que resulta idealla prueba X2 * en una variable. En
Z= JNPQ' las aplicaciones de una sola variable, la prueba X2 se describe como la tecnica de la
«bondad de ajuste», que permite determinar si existe, 0 no, una diferencia significati­
La distribucion de z es aproximadamente normal con una media igual a cero y
va entre el numero observado de casos que cae en cada cat egoria y el mimero de
una desviacion estandar igual a uno. Asi, la probabilidad de cualquier x dada es igual
casos esperados, en base a la hipotesis nula. En otras palabras, permite responder a la
a la de su correspondiente valor z.
siguiente pregunta: «loSe ajusta bien la distribucion observada a la distribucion
Veamos un ejemplo en el que x = 5, N = 20, P = Q = 1 y IX = 0.05, examen
bilateral. Para obtener la probabilidad de que x :-s; 5, llevamos x a la forma teorica?»,
Lo que se requiere, entonces, es una hipotesis nula que permita especificar las
estandarizada y tenemos
frecuencias que han de esperarse en cada categoria y, posteriormente, un examen de
5 - 10 esta hipotesis nula. La hipotesis nula puede ser examinada mediante
Z = ~--;'(=20=)(=0.5=)(=0.=5) k

X2 = ~ (fa - fe)2
-5.00 -5.00 (17.3)
=--_=--=
.j5IJ0 2.24
-2.23. L
i= 1
fe
donde
~ecordemos que para que el resultado sea significativo se requiere que [z] ~ 1.96
fo = numero observado dentro de una categoria dada,
al mvel IX = 0.05, examen bilateral. Puesto que la z obtenida de - 2.23 excede al valor
critico, podemos rechazar H o- fe = numero esperado en esa categoria,
Notese que si buscamos el resultado en la tabla M, bajo N = 20 y IX = 0.05, k

exam en bilateral, hallaremos que para rechazar H o se requiere que N - x ~ 15. En


L = indica que hay que sumar estos cocientes de todas las k categorias.
i= 1
el presente problema, N - x = 15, de modo que rechazamos la hipotesis nula y
admitimos HI' Esta es precisamente la misma decision que tomamos utilizando la Como se ve facilmente, si existe una coincidencia grande entre las frecuencias
aproximacion normal para los valores binomiales. Puesto que en la tabla M se observadas y las frecuencias esperadas, la / resultante sera pequeiia, 10 que llevara a
presentan los valores criticos hasta N = 50, recomendamos usar la aproximacion la imposibilidad de rechazar la hipotesis nula. A medida que aumenta la discrepancia
normal para la binomial solamente cuando N es mayor que 50. (fo - fe), el valor de X2 aumenta. Cuanto mayor sea la X2, mayores probabilidades
tendremos de rechazar la hipotesis nula.
En el ejemplo anterior, la hipotesis nula consistiria en que hay igual preferencia
por los tres colores; 0 sea, que la frecuencia esperada en cada categoria seria de 200.
17.4 La X2 en el caso de una variable Asi,
2 (200 - 200)2 (300 - 200)2 (100 - 200)2
Supongamos que el lector es un investigador de mercados contratado por un X = 200 + 200 + 200,
fabricante de jabones para efectuar una investigacion acerca de la envoltura de su = 0 + 50.00 + 50.00
producto. Considerando que el color puede ser un factor importante en la eleccion
hecha por el consumidor, se efectua el siguiente estudio. Mediante una tecnica
= 100.00.
. • EI simbolo x' se utilizara para designar la prueba de significacion y tambien la cantidad obtenida al apl.ica~ I~
adecuada de muestreo, se seleccionan 600 amas de casa. A cada una de ellas se le dan prueba a las frecuencias observadas, en tanto que la expresion «chi cuadrado» se referira a la distribucion teorica chi
tres pastillas de jabon de la misma marca, pero con distinta envoltura. Se les dice que cuadrado,
328 ESTAOfsTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTAOfsTICA CON VARIABLES CATEGORICAS 329

Cuando estudiamos el cociente t de Student (seccion 12.5), vimos que las nominales en las que (2)los datos consisten en frecuencias que se tabulan y se colocan
distribuciones muestrales de t variaban en funcion de los grados de libertad. Lo en casillas apropiadas.
mismo ocurre para X2 . Sin embargo, la asignacion de grados de libertad para la t de Estos ejemplos tienen tambien una caracteristica adicional y mas importante: (3)
Student se bas a en N, en tanto que para X2 los grados de libertad estan en funcion del no hay un modo inmediato y evidente de asignar valores de frecuencias esperadas a
numero de categorias (k). En el caso de una variable, gl = k - 1*. En la tabla B cada categoria. Sin embargo, como se indicara en breve, 10 que debemos hacer es
del apendice III figuran los val ares criticos de X2 para diversos niveles (x. Si el basar nuestras frecuencias esperadas en las frecuencias obtenidas.
2
valor obtenido de X excede del valor critico a un nivel de probabilidad dado, se Veamos un ejemplo real. Las personas que llegan de visita a los paises subdesa­
puede rechazar la hipotesis nula a ese nivel de significacion. rrollados sienten en muchos casos una afeccion intestinal conocida como «diarrea del
En el ejemplo anterior, k = 3. Por tanto, gl = 2. Usando (X = 0.01, encontramos viajero», De hecho, a menudo se posterga el viaje por el riesgo relativamente elevado
en la tabla B que se requiere para X2 un valor igual 0 mayor que 9.21 para que el de pasar una buena parte de las vacaciones en el cuarto de bafio, Un equipo de
resultado sea significativo. Puesto que el valor obtenido de 100.00 es mayor que 9.21, investigadores medicos hizo recientemente una evaluacion de la eficacia de una droga
podemos rechazar la hipotesis nula y afirmar, en cambio, que el color de la envoltura Hamada doxycylina para detener la incidencia de esta enfermedad. Participaron en e1
es un factor significativamente determinante en la seleccion preferencial del jabon por estudio 39 voluntarios del Cuerpo de Paz en Kenya. En un periodo de tres semanas,
parte de las amas de casa. 18 voluntarios recibieron la droga, en tanto que los 21 restantes recibieron un
placebo (sustancia inerte de aspecto parecido al de la droga). Los resultados de este
estudio se resumen en la tabla 17.1.

17.5 La prueba X2 de la independencia Tabla 17.1 Tabla de contingencia de 2 x 2 que muestra el mimero de
voluntarios del grupo que recibio la droga, y del grupo que recibio el
de variables categoricast placebo, que tuvieron desordenes intestinales en un periodo de tres
sernan as.

Hasta ahora nos hemos ocupado, en este capitulo, del caso de una variable. En la RESULTADO DEL ESTUDIO

practica, empleando variables categoricas, no suele presentarse con mucha frecuen­


CONDICION CONTRAJO LA NO CONTRAJO
cia este caso de una variable. Mas a menudo se formulan preguntas referentes a las EXPERIMENTAL ENFERMEDAD LA ENFERMEDAD TOTALES
interrelaciones entre variables. Por ejernplo, cabe preguntar:
~Existe alguna diferencia en la tasa de delincuencia de los nifios procedentes de a) b)
1 17 18
diferentes niveles socioeconornicos? (En otras palabras, ~Ia tasa de delincuencia es Grupe de la droga

independiente del nivel socioeconomico 0 depende en parte de este nivel?) d)


c)
Si se tratara de una encuesta de opiniones, lPodriamos determinar si existe una

j
Grupo del placebo 9 12 21
diferencia entre las opiniones de los hombres y de las mujeres respecto a determinado
asunto? (Dicho de otra forma, lla opinion acerca de determinado asunto depende en 10 29 39
alguna medida del sexo del entrevistado?)
Estos son solamente dos ejemplos de problemas en los que se aplica la tecnica X2 •
Podria, indudablemente, ampliarse esta lista para incluir multiples actividades, tales Debemos ahora aplicar un examen de significacion. En terrninos estadisticos
como la actitud de los miernbros de una asociacion estudiantil versus la actitud de los formales:
que no pertenecen a la misma, en relacion con algunos asuntos basicos (par ejemplo,
1. H ipotesis nula (H 0): No hay diferencia en la incidencia del desorden intestinal
copiar en los examenes), 0 las diferencias en los sistemas de calificacion entre
entre los que recibieron la droga y los que recibieron el placebo.
profesares de diversos departamentos de estudio. Todos los problemas anteriores
tienen algunas cosas en comun: (1) en ellos intervienen dos 0 mas categorias 2. Hipotesis alternativa (Hi): Hay una diferencia en la incidencia de la enfermedad
entre las personas que recibieron la droga y las que recibieron el placebo.
• Dado que el total marginal es fijo, solamente k - 1 categorias tienen Iibert ad para variar. Puesto que el total es de 3. Prueba estadistica: Puesto que ambos grupos (droga y placebo) son independien­
600, en cuanto se conozcan los valores correspondientes a dos casillas a categorias, la tercera queda cornpletamente
determinada. Asi, hay solamente dos grados de libertad: sabiendo que al raja Ie corresponde 200 y al blanco 300, al
tes y los datos son frecuencias en categorias discretas, la prueba X2 de indepen­
castano le debe corresponder 100. dencia es el examen estadistico apropiado.
t En la mayoria de los textos se recomienda utilizar la correccion de Yates par continuidad y tambien se indica que
las frecuencias esperadas deben ser iguales a mayores que 5 cuando gl = 1. Basandonos en una evidencia convincente 4. Nivel de siqnificacion: (X = 0.05.
(Dunlap, 1974; Camilli y Hopkins, 1978), hernos omitido dichas recomendaciones en esta edici6n.
5. Distribucion muestral: Es la distribucion X2 con gl = (r - l)(c - 1).
INFERENCIA ESTADfSTICA CON VARIABLES CATEOORICAS 331
330 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

aplicarse para determinar la frecuencia esperada de una casilla dada: multipliquense


Pu~sto ~ue lo~ totales marginales son fijos, sola mente la frecuencia de una de
las frecuencias marginales comunes a esa casilla y dividase por N.
las casillas tiene h.bertad para variar. Por tanto, tenemos una situaci6n en la que
En la tabla 17.2 aparecen los resultados obtenidos, con las frecuencias esperadas
hay un grado de hbertad. La regia general pan; hallar los grados de libertad en el 2
en el lado inferior derecho de cada casilla. Solo falta ahora calcular el valor de X •
caso ~e dos variables es gl,= (r - l)(e - 1),. donde r = nurnero de filas y
e = numero de columnas. ASI, en el presente ejernplo, gl = (2 - 1)(2 - 1) = 1.
Tabla 17.2 Nurnero de voluntaries del grupo que recibio la droga y del
6. Region crltica: La tabla B (en el apendice III) indica que para gl = 1 o: = 0.05 la grupo que recibio el placebo que tuvieron desordenes intestinales en un
regi6n critica consiste en todos los valores tales que X2 ;::: 3.84. EI v~lor de X2' se periodo de Ires semanas (frecuencias esperadas entre parentesis).
calcula mediante la formula
RESULTADO DEL ESTUDIO

CONDICION
CONTRAJO LA NO CONTRAJO
(l7.4) EXPERIMENTAL ENFERMEDAD LA ENFERMEDAD TOTALES

17 18
donde Grupo de la droga (4.62) (13.38)
r C

II
9 12 21
Grupe del placebo (5.38) (15.62)
r~ I c= I

10 29
indica que hemos de sumar este cociente a 10 largo de las filas y de las columnas.
EI ~roblema prineip~l consiste ahora en decidir acerca del procedimiento para
determinar las frecuencias esperadas correspondientes a cada casilla. Concentrerno­ Puede verse que enfermaron en total diez sujetos. De estos, solamente uno estuvo
nos por un momento en la casilla (a). Los dos totales marginales comunes a la casilla en el grupo que recibio la droga. Los nueve restantes se encontraron en el grupo
(a) .so~ los :orrespondientes a la fila y a la columna 1. Si la hipotesis nula es correcta y placebo 0 de control. l.Es suficientemente grande esta diferencia para que quede
la incidencia de la enfermedad es independiente de la condicion, deberiamos esperar justificada la conclusi6n de que la droga fue eficaz?
que hubiera I~ ~isma proporcion de sujetos que contrajeron la dolencia en el grupo
2 (1 - 4.62)2 (17 - 13.3W (9 - 5.38)2 (12 - 15.62)2
de los que recibieron la droga que en el grupo de los que recibieron el placebo. Puesto X = + + + ')
que del total de 39 sujetos experimentales 18 recibieron la droga, deberiamos esperar 4.62 13.38 5.38 15.6~
que en la casilla (a) hubiera (18/39) x 10, 0 sea, 4.62. Puesto que el valor 7.09 de X2 es mayor que el valor 3.84 requerido para que
Puesto que tenemos una situacion con un grado de libertad, las frecuencias exista significacion al nivel 0.05, cabe rechazar H o- En otras palabras, podemos llegar
esperadas en todas las demas casillas quedaran determinadas tan pronto como se a la conclusion de que la droga es eficaz para disminuir la incidencia de la «diarrea
hay a calculado la frecuencia esperada de una casilla. En consecuencia obtenemos del viajero».
to~as las dernas ~recuencias esperadas restando de los totales marginales'apropiados. Cuando se investiga, se encuentra a menudo que tenemos mas de dos subgrupos
ASI, para la casilla (b) tenemos 18 - 4.62 = 13.38, para la casilla (c) 10 - 4.62 = dentro de una clase nominal. Por ejemplo, podemos tener tres categorias en una
= 5.3~, y para la casilla (d) 29 - 13.38 = 15.62. Para estar seguros de no haber escala y cuatro en otra, resultando una tabla de contingencia de 3 x 4. El procedi­
cometl~o un error al calcular la frecuencia esperada correspondiente a la casilla (a),es miento para obtener las frecuencias esperadas es igual al empleado en la tabla de
co~vemente calcul~r por separado la frecuencia esperada para eualquiera de las contingencia de 2 x 2. Por supuesto, los grados de libertad seran mas de 1 (por
casillas restantes. SI este numero coincide con el resultado obtenido por sustraccion, ejemplo, en las tablas de contingencia de 3x 4, gl = 6).
pode~os confiar en .no haber cometido ningun error. Asi, la frecuencia esperada para
la casilla (d), obtenida por calculo directo, es

21
39 x 29 = 15.62. Limitaciones en el uso de la X2
Una hipotesis fundamental para el empleo de la X2 es que cada observacion 0
Pues.to que este numero coincide con el resultado obtenido por sustraccion, debemo s
frecuencia es independiente de todas las otras observaciones. En consecuencia, no
contmuar con nuestro calculo del valor de X2 .
eben hacerse varias observaciones en el mismo individuo y tratar a cada una como
Seguramente el lector habra observado que hay una regia sencilla que puede
332 ESTADisTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADisTICA CON VARIABLES CATEG6RICAS 333

si fuera independiente de las demas, Tal error produce 10 que se llama una N injIada; Notese que para Xl se ha obtenido el valor 2.72 < 3.84, por 10 cual debe aceptarse
o sea, que, en cuanto a los datos, se cree tener mayor mimero de observaciones H o- EI hecho de no haber trabajado con respuestas independientes dio lugar a un
independientes de las que hay en realidad. Este error es extremadamente grave y grave error en la primera conclusion. Seguramente, el lector observara que el
puede conducirnos facilmente a rechazar la hipotesis nula cuando, de hecho, es requisito de independencia dentro de una casilla 0 condicion es fundamental para
verdadera. todas las pruebas estadisticas. Hemos mencionado este punta especificamente en
Considerese el siguiente ejemplo hipotetico. Supongamos que ellector estudia un relacion con la prueba Xl, porque tales anomalias pueden presentarse en forma tan
curso de sociologia y que, Como trabajo de final de curso, decide hacer una encuesta sutil que no sea posible reconocerlas facilmente.
entre .Ios estudiantes para determinar si las opiniones de los muchachos difieren de
las de las muchachas respecto a cierto tema de actualidad. A cada uno de los 15
miembros de la clase se le pide obtener respuestas de 10 entrevistados, 5 hombres Resumen del capitulo
y 5 mujeres. Los resultados aparecen en la tabla 17.3.
En este capitulo se estudiaron cuatro pruebas de significacion que se usan con
variables categoricas; a saber, la prueba binomial, la aproximacion normal a la
binomial, la prueba Xl de una variable y la prueba Xl de dos variables.
1. Vimos que la binomial puede emplearse para examinar la hip6tesis nula cuando
las frecuencias estan distribuidas entre dos categorias 0 casillas. Si P = Q = t y
N ::; 50, la tabla M proporciona los valores criticos uni y bilaterales para IX = 0.05 y
IX = 0.01. Cuando P =1= Q, pueden obtenerse las probabilidades utilizando la formula
(17.1) que se basa en el desarrollo binomial. Si N ::; 49, la tabla N proporciona los
valores criticos para valores seleccionados de P y de Q. Una regIa practica es que
N PQ debe ser igual 0 mayor que 9, cuando P se aproxima a 0 0 a 1, para permitir el
uso de la aproximacion normal a la binomial.
2. La prueba Xl de una variable fue descrita como una tecnica de «bondad de
Usando IX = 0.05, hallamos que la region critica esta constituida por todos los ajuste» que per mite determinar si existe, 0 no, diferencia signilicativa entre el numero
valores tales que Xl ;;:: 3.84. Puesto que para Xl se ha obtenido el valor 10.71 > 3.84, observado de casos en cada categoria y el numero esperado de casos especilicados
se rechaza la hipotesis nul a de que no hay diferencia de opiniones entre los alumnos y segun la hipotesis nula.
las alumnas respecto al tema en cuestion, Puede concluirse, en cambio, que la 3. EI caso Xl de dos variables puede emplearse para determinar si dos variables
aprobacion del asunto planteado depende del sexo del entrevistado. estan relacionadas 0 si son independientes. Si el valor de Xl es significativo, podemos
Despues de realizar el estudio, el lector descubre que algunos estudiantes fueron llegar a la conclusion de que las variables son dependientes 0 relacionadas. En este
inadvertidamente entrevistados dos 0 tres veces por diferentes miembros de la c1ase. capitulo, restringimos nuestro estudio a las tablas de contingencia de 2 x 2. Sin
En consecuencia, las frecuencias dentro de las casillas no son independientes, ya que embargo, pueden generalizarse facilmente los procedimientos para incluir mas de dos
algunos individuos contribuyeron con dos 0 tres respuestas. Rehaciendo el analisis categorias dentro de cada variable.
de los datos, de modo que solo se permita una respuesta por entrevistado, se 4. Finalmente, se estudio una limitacion importante en el uso de la prueba Xl: las
obtuvieron los resultados que aparecen en la tabla 17.4. frecuencias deben ser independientes entre si. El incumplimiento de esta condici6n da
lugar a un error conocido como de la N injIada y puede lIevar al rechazo de la
Tabla 17.4 hipotesis nula cuando es verdadera (error del tipo I).
RESPUESTA A LA PREGUNTA

SEXO APRUEBA DESAPRUEBA

28 37 65
Terminus para recordar
Hombre (32.5) (32.5)
32 23 55 N inflada
Mujer (27.5) (27.5)
poblacion bicateqorica [dicotomica]
60 60 120
prueba Xl de una variable (tecnica de la «bondad de ajuste»)
x2 = 2.72

334 ESTADfsTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADfsTICA CON VARIABLES CATEGORICAS 335

Ejercicios 8. Construir la distribucion muestral de la binomial cuando P = 0.20, Q = 0.80 y N = 6.


9. Al sacar 300 piezas fundidas de un molde dado, se encontro que 27 eran defectuosas. Con
1. En 9 lanzamientos de una moneda,
otro molde se produjeron 31 piezas defectuosas en un total de 500. Determinar si existe una
a) i.cu~i1 es la probabilidad de obtener exactamente 7 caras?
diferencia significativa en la proporcion de piezas defectuosas producidas con ambos moldes.
b) i.cuaI es la probabilidad de obtener hasta 8 caras?
10. Emplear la prueba x',caso de una variable, para el ejemplo que aparece en la seccion 17.3
c) i.cual es la probabilidad de obtener un resultado tan raro como 8 caras?
del texto. Comprobar que Xl = Zl en el caso de un grado de libertad.
2. Resulta una revelacion para muchos estudiantes la sorprendentemente baja probabilidad 11. En un estudio referente a preferencias respecto a la envoltura de las patatas fritas, se
de obtener una nota aprobatoria en una prueba de seleccion multiple, cuando la seleccion se entrevisto a 100 personas pertenecientes al grupo de altos ingresos y a 200 personas
basa exclusivamente en el factor suerte (0 sea, sin poseer ningun conocimiento de la materia pertenecientes al grupo de bajos ingresos, Los resultados obtenidos fueron los siguientes:
abarcada en el examen). Si se considera el 60 %como la calificacion aprobatoria en un examen
con 40 preguntas de seleccion multiple, determinar la probabilidad de aprobar cuando hay
a) cuatro alternativas, b) tres alternativas, c) dos alternativas. GRUPO GRUPO
PREFERENCIA INDICADA DE ALTOS INGRESOS DE BAJOS INGRESOS
3. Con referencia al ejercicio 4 del capitulo 15, indicar la forma en que pudiera emplearse la
tabla N para determinar los valores criticos de varios mimeros de exitos (0 sea, el rechazo de Envoltura de papel rnetallco 36 84
H 0 al nivel IX = 0.05) en diez intentos.
Envoltura de papel parafinado 39 51
4. Se realizo un estudio con tres grupos de ratas (5 por grupo) en los cuales se utilizaron tres Envoltura de papel celotan 16 44
esquemas diferentes de reforzamiento (l00 %, 50 %y 25 %). A continuacion se indica el numero No tiene preferencia 9 21
de respuestas (presiones sobre cierta barra) obtenidas mientras duro el reforzamiento:

i.Que conclusiones podrian extraerse de estos datos?


100% 50% 25%
615 843 545 12. Supongase que 100 extracciones al azar de una baraja producen 28 corazones, 19
treboles, 31 diamantes y 22 espadas. i.Se consideraria este resultado como poco usual?
13. AI entrevistar a 46 personas escogidas al azar de una poblacion determinada, encontra­
Criticar el uso de la chi-cuadrado como tecnica estadistica apropiada en este caso.
rnos que 28 estan a favor y 18 en contra de cierto trazado para una carretera. Examinar la
5. La Serie Mundial puede durar de cuatro a siete juegos. Durante el periodo 1922-1979, la hipotesis de que Ja muestra fue tomada de una poblacion en la que P = Q = 1- Usese
distribucion del numero de partidos jugados fue la siguiente: IX = 0.05, examen bilateral.

Numero de partidos ~ 6 ~
14. Supongase que se realizo un estudio para comparar los tipos de inversiones hechas por
I
Frecuencia de realizacion 1i-[i1l11T25
115 personas a las que se considera conservadoras y por 125 personas a quienes gusta correr
riesgos. i.Que conclusion puede deducirse de los siguientes resultados?
Para estos datos, examinar la hipotesis de que cada numero de partidos tiene igual probabili­
dad de ocurrir.
TIPO DE PERSONA
6. En una gran universidad, un estudio de la cornposicion del consejo estudiantil revelo que
6 de sus ocho miembros eran estudiantes de ciencias politicas. De la totalidad de los 1200 TIPO DE INVERSION CONSERVADOR ARRIESGADO
estudiantes, 400 son alumnos de ciencias politicas. Plantear este estudio en terrninos estadisti­
cos formales y extraer las conclusiones apropiadas. Bonos del gobierno 75 45

7. Se realize un estudio para determinar si existe una relacion entre la clase socioeconomica Acciones 40 80

y las actitudes hacia un programa de rernodelacion urbana. Los resultados se indican a


continuacion:
15. Una empresa fabrico el mismo numero de archivadores de tres tipos distintos. La
capacidad de los tres modelos era igual, pero el disefio diferente. Los primeros 300 com prado­
CLASE
SOCIOECONOMICA
res pidieron 125 del tipo A, 100 del By 75 del C. i.Debe la empresa continuar produciendo el
DESAPRUEBA APRUEBA
rnismo numero de cada modelo?
Media 90 60 16. En el ejercicio 15, si los primeros 300 compradores hubieran pedido 115 del tipo A, 95 del
Baja 200 100 B y 90 del C, i.deberia la empresa continuar con su politica actual de produccion?
17. Se prueba un dado para determinar si es correcto. En 90 lanzamientos se obtiene 13 veces
Plantear este estudio en terrninos estadisticos formales y extraer la conclusion apropiada. el uno, 18 veces el dos, 13 veces el tres, 23 veces el cuatro, 9 veces el cinco y 14 veces el seis.
i.Cual seria la conclusion?
336 ESTADfsTICA PARA LAS CIENCIAS SOCIALES [337]

18. En el ejercicio 17 supongase que ellector trata de cornparar el mimero de veces que salen
Inferencia estadistica con
nurneros impares y el de veces que salen numeros pares. Usando la variable Z, i,Puede lIegarse a
la conclusion de que el dado es correcto?
19. Utilicese la X2 para responder a las preguntas del ejercicio 18.
20. Supongase que una cornpafiia productora de discos esta interesada en determinar el tipo
de cubierta que debe poner a un album. Para ello envia el mismo disco con tres diferentes
18 variables de escala ordinal
cubiertas a una tienda. Transcurrido un mes, encuentra que las ventas fueron como se indica a
continuacion:

CUBIERTA CUBIERTA CUBIERTA

TIPO A TIPO B TIPO C

41 50 20
18.1 Introducci6n
i,Puede determinar la cornpafiia el tipo de cubierta que debe usar? Se dijo en el capitulo anterior que el investigador se enfrenta a menudo con el dilema
21. En el ejercicio 4 del capitulo 1, se presento un estudio efectuado por el profesor Yetman de saber cual es la prueba estadistica apropiada para sus datos. Recordara ellector
referente al nurnero de atletas blancos y de color que tuvieron una oportunidad de aparecer en que esto no constituye realmente un problema con respecto a las variables categori­
anuncios cornerciales. En la siguiente tabla de 2 x. 2 se da un resumen de los resultados: cas, debido a que las pruebas no pararnetricas solamente son adecuadas para datos
de escalas nominales.
APARICION EN ANUNCIOS COMERCIALES En este capitulo estudiaremos varias tecnicas estadisticas que se emplean
frecuentemente como alternativas a las pruebas parametricas.
NO TUVIERON TUVIERON
OPORTUNIDAD OPORTUNIDAD

CARACTERISTICA RACIAL Blanco 3 8


DE LOS ATLETAS
No blanco 11 2
18.2 La prueba U de Mann-Whitney

La prueba U de M ann- Whitney es una de las pruebas estadisticas no parametricas


Examinar la hipotesis nula de que la oportunidad de aparecer en anuncios comerciales es
independiente de las caracteristicas raciales (0 sea, que blancos y no blancos tienen igual mas potentes, ya que utiliza la mayor parte de la informacion cuantitativa que poseen
oportunidad de aparecer]. los datos. Es la que se emplea con mayor frecuencia como alternativa para la t de
Student cuando las medidas no llegan a tener la calidad correspondiente a una escala
22. Utilizando los datos presentados al comienzo de este capitulo, examinar la hipotesis nula
de que el hecho de tener un perro no tiene relacion con la supervivencia,
de interval os, 0 cuando el investigador desea evitar las hipotesis de la equivalente
parametrica.
23. En el ejercicio anterior encontramos una relacion significativa entre el hecho de tener un Sup6ngase que se han tornado dos muestras independientes consistentes en N 1 Y
perro y la supervivencia despues de una enfermedad coronaria. Critiquese la siguiente
N 2 observaciones. La hipotesis nula es que ambas muestras provienen de poblacio­
conclusion: «El hecho de tener un perro determina una mayor tasa de supervivencia de los que
nes con las mismas distribuciones. La hipotesis alternativa bilateral, frente a la cual
padecen enfermedades coronarias». Hagase la critica basandose en 10 tratado acerca de
correlacion y causalidad. examinamos la hipotesis nula, es que las poblaciones originales de las cuales se
extrajeron las muestras son distintas, Supongase, ademas, que combinamos las N 1 +
+ N 2 observaciones y que asignamos el rango 1 al valor mas pequefio, el rango 2 al
siguiente, continuando asi hasta haber asignado rangos a todas las observaciones.
Denorninemos a nuestros dos grupos E y C, respectivamente. Si tuviesemos que
con tar el numero de veces que cada C precede a cada E en los rangos, esperariamos,
bajo la hipotesis nula, que fuera igual el numero de veces que cada E precede a C. En
otras palabras, si no hay diferencia entre los dos grupos, el orden de las E que
preceden a las C, y viceversa, debera ser aleatorio. Sin embargo, si la hip6tesis nula
338 ESTADfsTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADfsTICA CON VARIABLES DE ESCALA ORDINAL 339

no es verdadera, podemos esperar un exceso de calificaciones E 0 de calificaciones C La tecnica de conteo para determinar V puede ser tediosa, particularmente
precediendo a un mimero opuesto. uando las N son grandes, y conduce frecuentemente a que se cometan errores. Un
Citemos un ejemplo. Supongase ellector que ha formulado la hipotesis de que el rocedimiento alternativo, que proporciona identicos resultados, consiste en asignar
liderazgo es una cualidad que puede adquirirse mediante un adiestramiento. Se rangos a los grupos combinados, como se hizo anteriormente, y emplear luego
forman dos grupos; un.o q~e recibe. ~n adiest~amiento especial para formar lideres (E) cualquiera de las siguientes formulas para obtener V y/o V'.
y el otro que no recibe mstruccion especial (C). Despues del entrenamiento, se
obtuvieron estimaciones independientes de las cualidades de lider de todos los (18.2)
sujetos. Los resultados fueron:

Calificaciones E 12 18 31 45 47
Calificaciones C 2 8 15 19 38
(18.3)

Al emplear la prueba de Mann-Whitney, nos encontramos con la distribucion


muestral del estadigrafo «V». Para hallar V, debemos clasificar primero por rangos
todas las calificaciones, desde la menor hasta la mayor, manteniendo la identidad de
cada calificacion como E 0 C (tabla 18.1). R I = suma de los rangos asignados al grupo con tamaiio muestral N l'
R 2 = suma de los rangos asignados al grupo con tarnafio muestral N 2'
Tabla 18.1
RANGO 2 3 4 5 6 7 8 9 10 Supongase que se ha realizado un estudio para determinar los efectos de una
raga sobre el tiempo de reaccion ante un estimulo visual. Puesto que el tiempo de
Calificaci6n 2 8 12 15 18 19 31 38 45 47 accion y las medidas relacionadas (tales como latencia, tiempo de recorrido de un
amino dado, etc.) est an cornunmente sesgadas hacia la derecha debido a las
Condici6n C C E C E C E C E E
restricciones en el lado izquierdo de la distribucion (esto es, ninguna calificacion
puede ser menor que cera), y a la ausencia de restricciones en ellado derecho de la
<iistribucion (esto es, las calificaciones pueden tomar cualquier valor mayor que cera),
Notese que el numero de las E que preceden a las C es menor que el mimero de
e eligio Ja prueba Ude Mann-Whitney con preferencia a Ja t de Student. Los
las C que preceden a las E. £1 paso siguiente consiste en contar el mimero de veces
esultados del hipotetico estudio y los procedimientos de calculo se indican en la
que E precede a C. Obsrvese que la primera E (calificacion de 12) precede a tres C
(calificaciones de 15, 19 y 38, respectivamente). La segunda E (calificacion de 18) abla 18.2.
precede ados C (calificaciones de 19 y 38). La tercera E (calificacion de 31) precede a
una C (calificacion de 38). Finalmente, las dos ultimas E no preceden a ninguna C. U Tabla 18.2 Calculo de la U de Mann-Whitney empleando la formula (18.2) (datos
es la suma del mimero de veces que cada E precede a una C. Asi, en nuestro problema hipoteticos).
hipotetico, V = 3 + 2 + 1 + 0 + 0 = 6. Si hubieramos analizado el mimero de
veces que C precede a E, habriamos encontrado una suma de 5 + 5 + 4 + 3 + 2 = EXPERIMENTAL I
CONTROL

= 19. A est a suma mayor la llamaremos V'. Segun la hipotesis nula, U y V' deberian
TIEMPO EN TIEMPO EN
ser iguales. La cuestion es si la magnitud de la diferencia observada es suficiente para MILISEGUNDOS RANGO MILISEGUNDOS RANGO CALCULO .
garantizar el rechazo de la hipotesis nula.
La distribucion de V bajo la hipotesis nula es conocida. Las tablas II a 14 140 4 130 1 N (N + 1)
U = N 1 N2 + 1
2I - 81
muestran los valores de U y V' que son significativos a varios niveles ex. Para ser 147 6 135 2
153 8 138 3
significativa a un nivel ex dado, la U obtenida debe ser igual 0 men or que el valor
160 10 144 5 = 56 + 8(9) - 81
tabulado, 0 bien la U' obtenida debe ser igual 0 mayor que su correspondiente valor 165 11 148 7 2
critico. Usando ex = 0.05, examen bilateral, hallamos (tabla 13 ) que para N I = 5 Y 170 13 155 9
= 56 + 36 - 81
N 2 = 5 se requiere que V ::s; 2 0 que V' ;;::: 23 para rechazar H o- Puesto que el valor 171 14 168 12
obtenido para V es de 6 > 2, no podemos rechazar la hipotesis nula. 193 15 = 11.
Puede emplearse la formula (18.1) para comprobar los valores obtenidos de U
R I = 81 R 2 = 39
y V': N2 = 7
N1 =8
V = N IN 2 - U'. (18.1)
340 ESTADfSTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADfSTICA CON VARIABLES DE ESCALA ORDINAL 341

Para com pro bar los calculos anteriores debemos obtener primero el valor de V', no alcanza el nivel lX que hemos establecido para rechazar la hip6tesis nula, debe
empleando la f6rmula (18.3): consultarse la fuente bibliografica indicada a pie de pagina anterior, para recalcular
la V de Mann-Whitney con correcci6n por empates.
(N + 1)
V' = N N 1 2+ N 2; - 39 = 45.
La prueba U de Mann-Whitney

Como comprobaci6n de nuestros calculos utilizamos la f6rmula (18.1):


cuando N 1 Y/ 0 N 2 exceden de 20

Las tablas II a 14 proporcionan los valores crfticos de V para tamaiios muestrales


V = N IN 2 - V' con valores maximos N I = 20 y N 2 = 20. ~ Que prueba de significaci6n deberfa
= 56 - 45 = 11. usarse cuando N IoN 2 son superiores a 20? Como ocurre con otros estadigrafos, la
distribuci6n se aproxima a la curva normal cuando el tamaiio muestral crece. Si
Empleando lX = 0.01, examen bilateral, para N 1 = 8 y N 2 = 7, hallamos (tabla 1d ambas N son aproximadamente iguales y una de elIas excede a 20, se podra usar la
que se requiere una V ~ 6 para rechazar H o- Puesto que la V obtenida de 11 es curva normal y la variable z para evaluar la significaci6n de la diferencia entre
mayor que este valor, aceptamos H o. Carecemos de una base estadistica valida para rangos. La z toma la siguiente forma:
afirmar que la droga afecta al tiempo de reacci6n. VI - U
Las tablas 11 a 14 se han confeccionado de tal manera que no es necesario calcular z = - - -E,
Su
V y V'. Adernas, ni-siquiera es necesario identificar cual de estos estadigrafos ha sido
calculado. Para cualesquiera N I Y N 2 dados, a un nivel lX determinado, los valores donde U I es la suma de los rangos del grupo 1, U E es la suma esperada segun HoY Su
tabulados representan los lfmites superior e inferior de la regi6n crftica. El estadigra­ es el error estandar del estadigrafo U.
fo obtenido, ya sea V 0 V', debe caer fuera de estos lfmites para ser significativo. Asi, A la vez,
no es necesario indicar cual de los estadigrafos es el que se ha calculado.

18.2.1 La prueba U de Mann-Whitney


con rangos empatados Su =

Un problema que presentan a menudo los datos es que varias calificaciones pueden ser Imaginemos que un investigador ha completado un estudio en el que N I = 22 y
exactamente iguales. Aunque la dimensi6n fundamental en la que se basan nuestras = 22. La suma de los rangos es 630. Al nivel « = 0.05, examinar la hip6tesis nula
medidas sea continua, son, en su mayor parte, bastante imperfectas. Por ello, aunque de que ambos grupos provienen de poblaciones con e1 mismo rango medio. Los
en teorfa no deberfa haber empates (si tuvierarnos instrumentos de medida suficiente­ valores criticos de z son ± 1.96.
mente sensibles), en la practica ocurren con bastante frecuencia. Si bien los empates El error estandar de los rangos es
dentro de un grupo no constituyen ningun problema (la V no queda afectada), se nos
presenta alguna dificultad cuando los empates ocurren entre dos 0 mas observacio­ (22)(22)(22 + 22 + 1)
nes de ambos grupos. Se dispone de una f6rmula para corregir el efecto de los Su = 12
em pates. Desafortunadamente, el empleo de esta f6rmula es un tanto complicado y
por ello esta fuera del alcance de este texto elemental*. En todo caso, al no efectuar la = )21780 = 42.60.
correcci6n de los empates, la prueba resulta mas «conservadora», 0 sea, disminuye 12
la probabilidad de un error del tipo I (rechazar la hip6tesis nula cuando no deberfa
El rango esperado segun Hoes
ser rechazada). Se recomienda efectuar la correcci6n por empates solamente cuando
su proporci6n es alta y cuando la V no corregida se aproxima al nivel de significa­ U = 22(22 + 22 + 1) = 990 = 495.
E
cion: previamente establecido. 2 2
En el caso de que se presenten varios empates, recomendamos calcular la V de valor de z resulta ser
Mann-Whitney sin la correcci6n por empates. Si la V no corregida se aproxima pero
7 = 630 - 495 = 3.17.
• Ver Siegel (1956), pags. 123-125, para las correcciones cuando se presenta un nurnero grande de empates. - 42.60
342 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
INFERENCIA ESTADfsTICA CON VARIABLES DE ESCALA ORDINAL 343

Puesto que el valor 3.17 de z excede al valor critico de 1.96, podemos rechazar la Las escalas de c1asificaci6n parecen ser extremadamente imperfectas y nos
hip6tesis nula y afirmar que el tratamiento experimental produjo una diferencia imposibilitan para afirmar que las calificaciones tienen propiedades cuantitativas
significativa entre las condiciones. precisas. La unica hip6tesis que podriamos hacer justificadamente es que cualquier
diferencia que exista entre dos calificaciones apareadas es un indicador valido de la
direccion y no de la magnitud de la diferencia,
18.3 Pruebas no parametricas En la tabla 18.3 hay 13 parejas de observaciones. Puesto que la pareja M esta
empatada y, por consiguiente, no hay indicacion de diferencia en un sentido 0 en
con muestras correlacionadas otro, omitimos estas observaciones apareadas. De las 12 parejas restantes deberia­
mos esperar, basandonos en la hip6tesis nula, que la mitad de los cambios son en la
AI estudiar, en el capitulo 14, la t de Student para muestras correlacionadas y su direcci6n positiva y la otra mitad en la negativa. En otras palabras, segun H o' la
equivalente algebraico, el estadigrafo A de Sandler, hicimos notar las ventajas de probabilidad de que cualquier diferencia sea positiva es igual a la probabilidad de
emplear muestras correlacionadas siempre que fuera posible. Las mismas ventajas se que sea negativa. Puesto que tratamos con una poblaci6n bicateg6rica (diferencias
obtienen en las pruebas no parametricas con muestras apareadas 0 correlacionadas. positivas y diferencias negativas), puede expresarse H o precisamente en la misma
En las secciones siguientes se estudiaran dos de tales pruebas para variables de escala forma que en la prueba binomial cuando P = Q = 1- Esto es, en este problema, H o :
ordinal, que son la prueba del signo y la prueba del siqno-ranqo de Wilcoxon. P = Q = t. En verdad, la prueba del signa es solamente una variaci6n de la prueba
binomial presentada en la secci6n 17.2.
En el presente ejemplo, de las 12 comparaciones que muestran una diferencia
(N = 2), 9 son positivas y 3 son negativas. Puesto que P = Q = t, nos dirigimos a la
18.4 Prueba del signo tabla M, bajo x = 9, N = 12, y encontramos que el valor critico al nivel rx = 0.05,
xamen bilateral, es 10. Dado que x es menor que el valor critico, no podemos
Supongamos que se repite el experimento del liderazgo, con el cual iniciamos el echazar H o.
capitulo, empleando muestras mas grandes. Con la esperanza de que la inteligencia y Las hipotesis en que se basa la prueba del signo son que las parejas de medidas
la aptitud para ellideazgo sean variables correlacionadas, tomamos dos grupos, uno eben ser independientes entre si y que estas medidas deben corresponder, por 10
experimental y otro de control, que se aparean basandose en la inteligencia. Al . enos, a una escala ordinal.
completar el curso de entrenamiento para lideres, se pide a unos observadores Una de las desventajas de la prueba del signo es que elimina por completo
independientes que evahien las calidades de lider de cada uno de los sujetos segun alquier informaci6n cuantitativa que pueda ser inherente a los datos (por ejemplo,
una escala de 50 puntos. Los resultados se indican en la tabla 18.3. 8 = - 7 = - 6, etc.). La prueba del signo trata a todas las diferencias positivas
mo si fueran iguales y 10 mismo hace con todas las diferencias negativas.
Tabla 18.3 Clasificacion de dos grupos de sujetos apareados en cuanto a Si esta es la unica hip6tesis garantizada por la escala de medida empleada, no nos
las cualidades de lider (datos hipoteticos),
eda otro camino que utilizar la prueba del signo. Si, por el contrario, los datos
CALIFICACION DE L1DERAZGO rmiten hacer aseveraciones cuantitativas tales como «una diferencia de 8 es mayor
SIGNO
DE LA DIFERENCIA que una de 7, y una diferencia de 7 es mayor que una de 6, etc.», se pierde potencia al
PAREJA EXPERIMENTAL CONTROL (E - C) emplear la prueba del signo.

A 47 40 +
B 43 38 +
C 36 42
D 38 25 + Prueba del signo-rango de Wilcoxon
E 30 29 + para observaciones apareadas
F 22 26
G 25 16 +
H 21 18 + os visto que la prueba del signo utiliza simplemente la informacion concerniente
I 14 8 +
J 12 4 + direccion de las diferencias entre parejas. Si puede tenerse en cuenta tanto la
K 5 7 nitud como la direccion de estas diferencias, es factible emplear una prueba mas
L 9 3 + ente. La prueba del signo-rango de Wilcoxon para observaciones apareadas alcanza
M 5 5 (0) or potencia al utilizar la informaci6n cuantitativa inherente a la c1asificaci6n de
iferencias.
344 ESTADfSTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADISTICA CON VARIABLES DE ESCALAORDINAL 345

Con fines heuristicos, volvamos a los datos de la tabla 18.3 y hagamos una Se recordara que la prueba del signo aplicada a estos mismos datos no conduce al
hipotesis diferente acerca de la escala de medida empleada, Supongase que la escala rechazo de la hipotesis nula. La razon debe resultar obvia, ya que 00 podemos sacar
con que hicimos la evaluaci6n no es tan imperfecta como habiamos imaginado; esto ventaja de toda la informacion inherente a nuestros datos cuando empleamos la
es, no solamente proporciona medidas en la escala ordinal, sino tam bien diferencias prueba del signo,
entre estas medidas ordinales. La tabla 18.4 reproduce estos datos, con una columna
adicional que indica la magnitud de las diferencias.
18.5.1 Hipotesis fundamentales en la prueba
Tabla 18.4 Clasificaci6n de dos grupos de sujetos apareados en cuanto a las cualidades de lider (datos del signo-rango de Wilcoxon
hipoteticos).
para observaciones apareadas
CALIFICACION DE L1DERAZGO RANG OS
POSICION DE RANGO DE LA CON LAS SUMAS Una hipotesis involucrada en el uso de la prueba del signo-rango de Wilcoxon es que
LOS EQUIPOS EXPERIMENTAL CONTROL DIFERENCIA DIFERENCIA MAS PEQUENAS la escala de mediciones es por 10 menos de naturaleza ordinal. En otras palabras, la
hipotesis consiste en que las calificaciones permiten el ordenamiento de los datos
A 47 40 +7 9 segun las relaciones de mayor que y de menor que. Sin embargo, la prueba del signo­
B 43 38 +5 5
36 42 -6
rango requiere una hipotesis adicional que la puede excluir de algunas de sus
C (-)7 -7
D 38 25 + 13 12 aplicaciones potenciales; esta hipotesis consiste en admitir que las diferencias entre
E • 30 29 +1 1 las calificaciones corresponden tarnbien a una escala ordinal. No siempre queda claro
F 22 26 -4 (-)4 -4 cuando es, 0 no, valida esta hipotesis para un conjunto dado de datos. Tomese, por
G 25 16 +9 11 ejemplo, una escala de personalidad hecha a proposito para medir la «ansiedad
H 21 18 +3 3 manifiesta» en un examen. l,Podemos asegurar de forma valida que una diferencia
I 14 8 +6 7
J 12 4 +8 10
entre observaciones apareadas de, por ejemplo, 5 puntos en una parte de la escala es
K 5 7 -2 (-)2 -2 mayor que una diferencia de 4 puntos en otra parte de la misma? Si no tenemos
L 9 3 +6 7 certeza del cumplimiento de esta hipotesis, debemos emplear otra forma de analisis
M 5 5 (0) estadistico, aun cuando ella signifique pasar a una prueba de significacion menos
sensible. Una vez mas, nuestro conservadorismo basico como cientificos nos hace
T= -13 preferir un error del tipo II a otros del tipo I.

Observese que la columna de diferencias representa las diferencias en las


calificaciones en vez de los rangos. La columna siguiente representa los rangos de
estas diferencias, del menor al mayor, prescindiendo del signo algebraico. Hemos Resumen del capitulo
colocado el signo negativo entre parentesis para identificar a las diferencias que
llevan signos positivos y negativos. Ahora bien, si la hipotesis nula fuera correcta,
deberiamos esperar que la suma de los rangos positivos y la suma de los negativos Hagamos una breve revision de 10 tratado en este capitulo.
estuvieran equilibrados. Cuanto mas preponderantemente posit iva 0 negativa sea la Hemos sefialado que los cientificos de las ciencias del comportamiento no
suma de los rangos, mayor probabilidad tendremos de rechazar la hipotesis nula. recopilan previa mente los datos y luego los «manejan» hasta hallar una prueba
El estadigrafo T es la suma de los rangos que tienen menor suma. En el problema estadistica para determinar la significacion de las diferencias entre condiciones
anterior, T es igual a -13. La tabla J, apendice III, muestra los valores criticos de T experimentales. El investigador ha de especificar con anterioridad al experimento
para tamafios muestrales de hasta 50 parejas. Todas las entradas son para el valor la hipotesis nula, la hipotesis alternativa, la prueba de significacion y el valor de la
absoluto de T. En el presente ejemplo, encontramos que se requiere una T de 13 0 probabilidad que considera aceptable como base para rechazar la hipotesis nula.
menos para que sea significativa al nivel de 0.05 (examen bilateral) cuando N = 12. Vimos el uso de la prueba U de Mann-Whitney como una alternativa de la t de
N6tese la omision en nuestros calculos de la pareja M, debido a que, como en la Student cuando las mediciones no logran alcanzar la escala de intervalos 0 cuando el
prueba del signo, una diferencia cero en las calificaciones no puede ser considerada investigador desea evitar las hipotesis de la equivalente pararnetrica. Es una de las
como cambio, ni positivo ni negativo. Puesto que la T que obtuvimos fue igual a 13, pruebas no parametricas mas potentes, puesto que utiliza la mayor parte de la
podemos rechazar la hipotesis nula. Nuestra conclusion es que el entrenamiento en informacion cuantitativa inherente a los datos.
liderazgo produce los efectos deseados en los sujetos experimentales. Hemos visto que es po sible aumentar la sensibilidad de nuestra prueba estadistica
346 ESTADISTICA PARA LAS CIENCIAs SOCIALES INFERENCIA ESTADISTICA CON VARIABLES DE ESCALA ORDINAL 347

teniendo en cuenta la correlacion entre sujetos respecto a una variable correlaciona­ 2. En un estudio para determinar el efecto de una droga sobre la agresividad, el grupo A
da con la medida de criterio. recibio la droga y el grupo B recibio un placebo. Inmediatamente despues de administrar la
La prueba del signo cumple con este objetivo empleando medidas antes-despues droga y el placebo, se realize una prueba para com pro bar la agresividad. Las calificaciones
en los mismos individuos. obtenidas fueron como sigue (a mayor calificacion, mayor agresividad]:
Vimos tarnbien que la prueba del signo, si bien obtiene ventaja de la direcci6n de Grupo A 6
~as diferencias implicadas en las medidas ordinales, falla al no hacer uso de la Grupo B
informacion referente a las magnitudes de las diferencias.
La prueba del signo-rango de Wilcoxon para observaciones apareadas tiene en Plantear este estudio en terrninos estadisticos formales y establecer una conclusion res paId ada
cuenta tanto la magnitud Como la direccion implfcitas en las mediciones ordinales con por la evidencia estadfstica.
~ue.stras cor~elacionadas. Cuando se cumplen las hipotesis basicas de la prueba, la 3. El jefe de personal de una gran cornpafiia de seguros dice que los agentes de seguros que
tecnica de WIlcoxon es una base extremadamente sensible para obtener valores de reciben un entrenamiento en relaciones publicas dan una impresion mas favorable entre los
probabilidad. posibles clientes. Para comprobar esta hipotesis se seleccionaron al azar 22 individuos entre
los contratados mas recientemente y se asigno la mitad de ellos al curso de relaciones publicas.
Los 11 individuos restantes fueron asignados al grupo de control. Despues del perfodo de
entrenamiento se observe a los 22 individuos en una entrevista simulada con un cliente, y se
Terminus para recordar los clasifico segun una escala de diez puntos (0-9) de acuerdo a su desenvoltura en el
establecimiento de relaciones. A mayor calificacion, mejor clasificacion. Plantear y examinar
H 0 usando la prueba estadistica apropiada. Utilicese (J. = 0.01.
prueba del signo
Grupo experimental: s 7 9 4 7 9 3 7 8 9 3
prueba del signo-rango de Wilcoxon para observaciones apareadas Grupo de control: 5 6 2 6 0 2 6 5 1 0 5
prueba U de Mann- Whitney 4. Supongase que los individuos del ejercicio 3 fueron apareados respecto a una variable de
la cual se sabe que esta correlacionada con la variable de criterio. Emplear la prueba
estadfstica apropiada para examinar H o- Utilicese (J. = 0.01.
5. A quince parejas de casados se les hizo una encuesta para estimar sus actitudes en
Ejercicios relacion con un asunto politico particular. Los resultados fueron los siguientes (a una mayor
calificacion corresponde una actitud mas favorable):

.1. . Par~ los datos presentados en la tabla adjunta, determinar si hay una diferencia
significativa en el numer? de «bases robadas» obtenidas por dos ligas, empleando ESPOSO ESPOSA ESPOSO ESPOSA
a) la prueba del signo,

37 33 32 46
b) la prueba de Wilcoxon para observaciones apareadas,

46 44 35 32
c) la prueba U de Mann-Whitney,

59 48 39 29
l,Cueil es la mejor prueba estadistica para estos datos? l,Por que?
17 30 37 45
41 56 36 29
36 30 45 48
NUMERO DE BASES ROBADAS
29 35 40 35
POSICION
DE LOS EQUIPOS L1GA 1
38 38
L1GA 2

1 91 81 l,Cual es la conclusion?
2 46 51
3 108 63 6. Supongase que en las ultirnas competiciones en pista no hubo diferencia entre la
4 99 51 velocidad media de los corredores de dos universidades. Supongase tam bien que en este afio
5 110 46 los equipos estan formados por las mismas personas que en ocasiones anteriores.
6 105 45 Para la cornpeticion de este afio, el equipoA entrena en la forma habitual. Sin embargo, el
7 191 66 encargado del equipo B introduce los recorridos en bicicleta como parte del entrenamiento.
8 57 64 Los corredores de las dos universidades obtuvieron los siguientes tiempos (en minutos):
9 34 90
10 81 28 A 10.2 11.1 10.5 10.0 9.7 12.0 10.7 10.9 II.5 lOA
B 9.9 10.3 11.0 10.1 9.8 9.5 .10.8 10.6 9.6 904
348 ESTAOfsTICA PARA LAS CIENCIAS SOCIALES [349]

Examinar la hip6tesis nula de que los recorridos en bicicleta no afectan a la velocidad del
corredor. REVISION DE LA TERCERA PARTE
7. Imaginese que en el ejercicio 6 los integrantes de cada equipo han sido previamente
apareados de acuerdocon la velocidad alcanzada en las prirneras 50 yardas. Las parejas est'
forma.das como se indica en .la lista anterior. Usando la prueba del signo y la del signo-ran;:
de Wilcoxon para observaciones apareadas, plantear y examinar la hipotesis nula.
Estadistica inferencial
8. U~ i~vestigador trata de medir la eficacia de un anuncio para prornocionar cierta marca
de dentJfn~o. Para este fin, c1asifica por parejas su muestra de consumidores (ninguno de los B. Pruebas no parametricas de significacion
cual~s .habla comprado antes dentifrico de esa marca) de acuerdo con eJ nurnero de tubos de
dentIrnc.o que sU~len comprar en seis meses. Teniendo la muestra dividida en dos grupos,
presento el anuncio a uno de ellos. Despues de seis meses, el investigador hall6 que el rnimero
d.e tubos de su ma:ca: cornprados per los integrantes de la muestra durante ese tiernpo, habia
sido tal como se indica a continuacion:

Grupo que observe el anuncio 443 I 2 0 o


En los dos capitulos precedentes el lector encontro diversas formas de manejar los
Grupo que no observe eJ anuncio 1 2 0 201 o
datos para los cuales no son apropiadas las pruebas pararnetricas de significacion, A
~Fue eficaz el anuncio? continuacion se ofrecen unos datos basados en un experimento hipotetico. Formular
9: . Supongase que a' un superintendente Ie interesa aumentar la eficacia de sus empleados. la hipotesis nula, la hipotesis alternativa y realizar el analisis estadistico apropiado
Divide a. 20 empJe~dos en dos grupos y a uno de ellos Ie da un programa especial de para las hipotesis enumeradas en cada problema.
entr~namlen.to. ~ebldo a que el trabajo es diversificado, no hay una escala disponible para
rnedir la eficiencia, Per ello, torna los servicios de un experto en eficiencia quien observa a los Experimental 5
20 empleados y los c1asifica segun su rendimiento en el trabajo, obteniendo los siguientes Control
resultados (el rango «uno» corresponde al mas eficiente):
Grupo COil entrenamiento I 2 4 5 6 78 10 11 12
1. Los sujetos son asignados aleatoriamente a ambos grupos. La escala de medida
Grupo de control
3 9 13 [4 15 16 17 [8 19 20
es ordinal y la poblacion no se distribuye normalmente.

~A que conclusion llegara eJ superintendente en cuanto a la eficacia del


2. Se asocia a los sujetos por parejas de acuerdo con una variable de la cual se sabe
programa de que esta correlacionada con la variable de criterio. Sin embargo, no puede
entrenamiento?
considerarse que las diferencias entre las calificaciones representen magnitudes de
diferencias, sino tan solo direcci6n.
3. Los individuos estan apareados. Las calificaciones se basan en una escala
ordinal. Se supone que las diferencias en las calificaciones son ordinales. Sin
embargo, la poblacion de calificaciones no se distribuye normalmente.
4. Determinar en que medida fueron eficaces las tecnicas de apareamiento.
REFERENCIAS 351

MANN, H. B., yD. R. WHITNEY (1947): «On a test of whether one of two random variables is

stochastically larger than the other», Ann. Math. Statist., 18, 52-54.

McNEMAR, Q. (1962): Psychological Statistics. Nueva York: John Wiley and Sons, Inc.

Referencias MERRINGTON, M., y C. M. THOMPSON: Tables of Percentage Points of the Inverted Beta

Distribution, Biometrika, 33, 73, 1943.

OLDS, E. G. (1949): «The 5 percent significance levels of sums of squares of rank differences

and a correction», Ann. Math. Statist., 20, 117-118.

PEARSON, E. S., Y H. O. HARTLEY (1958): Biometrika Tables for Statisticians, vol. 1, 2." ed.,

Nueva York: Cambridge.

RAND CORPORATION (1955): A Million Random Digits. Glencoe, Ill.: The Free Press of

Glencoe.

ROCKS, L., y R. P. RUNYON: The Energy Crisis. Nueva York: Crown Publishers, 1972.

RUNYON, R. P. (1968): «Note on use of the A-statistic as a substitute for t in the one-sample

AUBLE, D '.(1953): «Extended tables for the Mann-Whitney statistic», Bulletin of the Institute case», Psychological Reports, 22, 361-362.

Educational Research at Indiana University, 1, num, 2.


RUNYON, R. P. (1977): Winning with Statistics. Reading, Mass.: Addison-Wesley Publ. Co.

BENSON, H., D. SHAPIRO, B. TURSKY Y G. E. SCHWARTZ (1971): «Decreased systolic blood


RUNYON, R. P. (1977): Non-Parametric Statistics. Reading, Mass.: Addison-Wesley Publ. Co.

pressure through operant conditioning techniques in patients with essential hypertensions


RUNYON, R. P., Y M. KOSACOFF (1965): Olfactory Stimuli as Reinforcers of Bar Pressing

Science, 173, 740-742.


' Behavior. Documento presentado a la reunion de la Eastern Psych. Assn.

BENTLER, P. M., Y ¥. D. NEWCOMB (1978): «Longitudinal study of marital success


and RUNYON, R. P., Y W.1. TURNER (1964): A Study of the Effects of Drugs on the Social Behavior of

failure», Journal of Consulting and Clinical Psychology, 46, 1053-1070.


White Rats. Nueva York: Long Island University.

BINGHAM, W. V. (193.1): Aptitudes and Aptitude Testing. Nueva York: Harper and Bros.
SALK, L.: «The role of the heartbeat in the relations between mother and infant», Scientific

DINGLE, 1. H.: «The Ills of man», Scientific American, 229 (3), septiembre 1973, 77-84.
American, 228 (5), mayo, 1973, 26-29.

DOR-S~A~, ~. K. (1978): «On the long-range effects of concentration camp internment


SANDLER, 1. (1955): «A test of the significance of the difference between the means of correlated

NaZI victims: 25 years later», Journal of Consulting and Clinical Psychology, 46,
I-II. measures, based on a simplification of Student's t», Brit. J. Psychol.; 46, 225-226.

DUNLAP, J. W., Y A. K. KURTZ (1932): Handbook of Statistical Nomoqraphs, Tables,


and
SBORDONE, R. 1., 1. A. WINGARD, M. L. ELLIOTT, Y J. 1ERVEY (1978): «Mescaline produces
Formulas. Nueva York: World Book Company.
pathological aggression in rats regardless of age or strain», Pharmacology, Biochemistry
EDWARDS, A. L. (1950): Experimental Design in Psychological Research, 3." ed., Nueva York:
and Behavior, 8, 543-546.
Rinehart.
SEIDEN, R. H. (1966): «Campus tragedy: A story of student suicide», J. Abn. Soc. Psych.; 71,

EDWARDS, A. L. (1969): Statistical Analysis, 3." ed., Nueva York: Holt, Rinehart and Winston, 389-399.

Inc. SIEGEL, S. (1956): Non-Parametric Statistics. Nueva York: McGraw-Hill.


FISHER, R. A. (1935): The Design of Experiments. Edimburgo: Oliver and Boyd, Ltd. SNEDECOR, G. W., Y W. G. COCHRAN (1956): Statistical Methods, 6." ed., Ames, Iowa: Iowa
FISHER, R. A. (1950): Statistical Methods jor Research Workers. Edimburgo: Oliver and Boyd, State University Press.
Ltd. THORNTON, B. (1977): «Toward a linear prediction model of marital happiness», Personality
FISHER, R. A., y F. YATES (1948): Statistical Tables for Biological, Agricultural, and Medical and Social Psychology Bulletin, 3, 674-676.
Research. Edimburgo: Oliver and Boyd, Ltd. . TUKEY,1. W. (1953): «The Problem of Multiple Comparisons». Ditto, Princeton University,
FRIEDRICH, L. K., YA. H. STEIN (1973): «Aggressive and prosocial television programs and the
396 pags.
natural behavior of preschool children», Monographs of the Society for Research in Child
WALKER, HELEN, Y 1. LEV (1953): Statistical Inference. Nueva York: Henry Holt & Co., Inc.
Development, nurn. de serie 151, 38.
WILCOXON, F., S. KATIE, yR. A. WILCOX (1963): Critical Values and Probability Levelsfor the
GRINSPOON, L. (1969): «Marihuana», Scientific American, 221 (6), 17-25. Wilcoxon Rank-Sum Test and the Wilcoxon Signed-Rank Test. Nueva York: American
HABER, A., R. P. RUNYON Y P. BADIA (1970): Readings in Statistics. Reading, Mass.: Addison­ Cyanamid Co.
Wesley Publishing Co., Inc. WILCOXON, F., YR: A. WILCOX (1964): Some Rapid Approximate Statistical Procedures. Nueva
HESS, E. H., A. L. SELTZER Y 1. M. SHLlEN: «Pupil response of hetero- and homosexual males York: Lederle Laboratories.
to pictures of men and women: A pilot study», J. Abn. Soc. Psych., 70, 1965, 165-168.
WINGARD, 1. A., 1. P. BUCHANAN, Y A. BURNELL (1978): «Organizational changes in the
HUFF, D. (1954): How to Lie with Statistics. Nueva York: W. W. Norton and Co., Inc.
memory of young children», Perceptual and Motor Skills, 46, 735-742.
KANIN, E. J. (1967): «An examination of sexual aggression as a response to sexual frustration»!
WINGARD, J. A., G. J. HUBA, Y P. M. BENTLER: «The relationship of personality structure to
J. Marriage Family, 29, 428-433.
patterns of adolescent substance use», Multivariate Behavioral Research.
KIRK, R. E. (1968): Experimental Design: Procedures for the Behavioral Sciences. Califorilia ZELSON, C, E. RUBIO, Y E. WASSERMAN (1971): «Neonatal narcotic addiction: lO-year
Brooks/Cole. observation», Pediatrics, 48 (2), 178-188.
LIPSON, G., y D. WOLMAN: «Polling Americans on birth control and population» Famil

Planning Perspectives, 4 (1), enero, 1972, 39-42. '

[353]

Apendices
I. Repaso de matematicas basicas
II. Glosario de simbolos
III. Tablas
IV. Tratamiento de las distribuciones no normales
V. Lista de formulas
VI. Glosario de terminos
[355]

Repaso
I de matematicas basicas

Operaciones aritmeticas
El lector ya conoce que la suma se indica por el signo « + », la resta por el signo «- »,
la multiplicacion por cualquiera de los modos siguientes, 2 x 4, 2(4) 0 2·4, y Ia
division por una diagonal «[», una barra «-» 0 el simbolo « -+ ». Sin embargo, no es
raro que se olviden las reglas referentes a la suma, resta, multiplicacion y division,
particularmente cuando estas operaciones aparecen en un solo problema.

Suma y resta
Al sumar mimeros, el orden de los sumandos no tiene ninguna influencia en el
resultado de la suma. Asi, podemos sumar 2 + 5 + 3 en cualquiera de las siguientes
formas:
2 + 5 + 3, 5 + 2 + 3, 2 + 3 + 5,
5 + 3 + 2, 3 + 2 + 5, 3 + 5 + 2.
Si se suma una serie de mimeros dotados de signos positivos 0 negativos, el orden
de los sumandos tampoco influye en la suma. Sin embargo, es conveniente a menudo
agrupar todos los numeros precedidos por signos positivos, agrupar los que esten
precedidos por signos negativos, sumar cada uno de los grupos por separado y restar
el ultimo del primero. Asi, ,
-2+3+5-4+2+1-8

se puede sumar mejor agrupando los numeros en la siguiente forma:


+3
+5 -2
+2 -4
+1 -8
+11 -14=-3.
Por otra parte, para restar un valor numerico mayor de otro valor numerico
menor, como en el ejemplo anterior (11 - 14), se prescinde de los signos, se resta el
356 ESTADfsTICA PARA LAS CIENCIAS SOCIALES REPASO DE MATEMATICAS BASICAS 357

numero menar del mayor y se da a la suma el signa del nurnero mas grande. ASi, del mismo signo, el resultado siempre es positivo; cuando los mimeros tienen sign as
-14+11=-3. diferentes, el cociente siempre es negativo.

L a multiplicaclon como una suma sucesiva. Muchos estudiantes. tienden


A'
a olvidar
Multiplicacion que la multiplicacion es una forma particular de la suma sucesiva, SI,

EI orden en que los nurneros se multiplican no afecta al producto. En otras palabras, 15 + 15 + 15 + 15 + 15 = 5(15)
2x3x4=2x4x3=3x2x4
= 3 x 4 x 2 = 4 x 2 x 3 = 4 x 3 x 2 = 24. (15 + 15 + 15 + 15 + 15) + (16 + 16 + 16 + 16) = 5(15) + 4(16).
Cuando la suma, la resta y la multiplicaci6n se presentan en la misma expresi6n, Esta formulacion es iitil para cornprender las ventajas de «agrupar» dat.os en las
es preciso desarrollar ciertos procedimientos para indicar que operaciones han de llamadas distribuciones de frecuencias. Al obtener la suma de un conjunto de
realizarse primero.
calificaciones, algunas de las cua~es se repiten un c~erto mimero de veces, resulta
En la expresion
cornodo multiplicar cada calificacion por la frecuencia con que se presenta.y s.umar
2 x 4 + 7 x 3 - 5, despues los productos. Asi, si tuvierarnos que obtener la suma de las siguientes
calificaciones
se efecttia primero la rnultiplicacion. Asi, la expresion anterior es igual an
12, 13, 13, 13, 14, 14, 14, 14, 15, 15, 15, 15,
I) 2 x 4 = 8, 2) 8 + 21 - 5 = 24. . 15, 15, 15, 16, 16, 16, 17, 17, 17, 17, 18,
7 x 3 = 21,
seria ventajoso formar la correspondiente distribucion de frecuencias:
-5 = -5,
No se puede sumar prirnero y luego multiplicar, Asi, 2 x 4 + 7 no es igual a X IX
2(4 + 7), 0 sea, 22.
Si un problema implica hallar el producto de un mimero por una segunda 12 1 12
13 3 39
expresion que inc1uye dos 0 mas terrninos que a su vez, hay que sumar 0 restar,

14 4 56
podemos multiplicar prirnero y luego sumar, 0 bien sumar primero y luego multipli­
15 7 105
car. Asi, la solucion al siguiente problema es
16 3 48
17 4 68
8(6 -> 4) = 8 x 6 - 8 x 4 18 1 18
= 48 - 32
= 16, N = 23 L/X = 346
o
8(6 - 4) = 8(2) .
= 16.
Operaciones algebraicas
Sin embargo, en la mayor parte de los casos es mas comedo reducir primero Transposicion
expresion dentro de parentesis, Asi, la segunda solucion que aparece arriba se
utilizara, mas frecuentemente, en general. Para transponer un terrnino de un lado de una ecuacion al otro, bast~ con cambiar
Por ultimo, si se multiplican numeros que tienen signos iguales, el product(j de signo el terrnino transpuesto.. Las siguientes expresiones son equivalentes:
siempre es positivo; por ejernplo, (+2) x (+4) = +8 Y (-2) x (-4) = +8. Si se
a + b = c,
multiplican dos rnimeros que tienen signos diferentes, el producto siemprc
negativo; por ejemplo, a = c - b,
b=c-a,
(+2)x(-4)=-8 y (-2) x (+4) = -8.
0= c - a - b,
La misma regia se aplica tam bien a la division: al obtener el cociente de dos nume~ 0= c - (a + b).
358 ESTAOisTICA PARA LAS CIENCIAS SOCIALES REPASO DE MATEMATICAS BASICAS 359

Resolucion de ecuaciones que contienen fracciones puede pasar al otro miembro de la misma dividiendo al numerador de ese otro
lado,
Muchas de las dificultades que se encuentran al resolver ecuaciones que contienen x x
fracciones pueden evitarse recordando un importante principio maternatico: ab = x puede convertirse en a=- 0 b =-.
b a
lquales multiplicados por iquales SOil iquales. Se ha visto as! que todas las expresiones siguientes se equivalen:
Veamos algunos problemas como ejemplo. a a
b=-, a= bx, x =-.
1. Resolver la siguiente ecuacion en x: x b
Analogamente,
a
b =-.
x LX ­
L!=N.
-=X
N ' X
AI tratar de obtener x, se desea expresar su valor en funcion de a y de b. En otras Division por una suma 0 una diferencia. Es cierto que
palabras, deseamos que la ecuacion final se lea x = .
Notese que podemos multiplicar ambos miembros de la ecuacion por xlb y x+y = ~ +~ y x- y = ~ _ ~.
obtener asi: z z z z z z
x a X Sin embargo, no es posible simplificar tan facilmente las expresiones siguientes:
h '-- = -.. '-.
h X b
x x
que se reduce a o
y+z y-z
a
x = b' Asf,
x x x
2. Resolver la ecuacion anterior para a. --#-+-,
y+z Y z
Analogamente, si deseamos resolver la ecuacion para obtener a, podriamos
multiplicar los dos miembros por x. Asi, donde =1= significa «diferente de».

a
b :x = .x
x
Simplificacion de fracciones
que se convierte en bx = a, 0 sea, a = bx.
En cada una de las soluciones anteriores se notara que el efecto final de la Un corolario de la regla que dice que iguales multiplicados por iguales son iguales es:
multiplicacion por una constante ha sido la reordenacion de terminos en el
numerador y en el denominador de las ecuaciones. De hecho, cabe establecer dos Desiguales multiplicados por iguales permanecen proporcionales.
reglas generales que perrnitiran resolver los problemas anteriores sin tener que
ernplear la multiplicacion por iguales (aunque la rnultiplicacion por iguales queda . ., 1.
implicita en las operaciones aritmeticas):
t
Asi, si multiplicaramos por t, el produc~o, 382' esta en la ml~ma proporcion que 4'
Este corolario es util al simplificar fracciones, Veamos un ejemplo.
a
a) Un mimero que est en el denominador de uno de los miembros de una ecuacion
Ejemplo. Simplificar

puede pasar al otro miembro de la misma multiplicandolo por el numerador de


ese otro miembro, Asi, alb ~ _:.

cld 0 b' d

x Notese que al multiplicar tanto el numerador como el denominador por


-=b se convierte en x = ab.
a
un
b) Un mimero que esta en el numerador de uno de los miembros de una ecuaciou bd/l '
360 ESTADfSTICA PARA LAS CIENCIAS SOCIALES REPASO DE MATEMATICASBASICAS 361

se obtiene Si X = i, a = 2 Y b = 3,
(a/b) . (bd/l)
(e/d)· (bd/l)'
xa.Xb=xa+b=(_61)2+3 =(_61)5-_165 5 -
1
7776'

que se convierte en ad/be. Para dividir X elevada a la potencia a por X elevada a la potencia b, se resta
Sin embargo, obtendriamos el mismo resultado invirtiendo el divisor y multipl], simplemente el exponente del denominador del exponente del n~m~rado~ y se el.e,va
cando. Asi, X a la potencia (a - b)*. La razon de restar queda clara en la siguiente ilustracion,

alb a d ad XU X5 X· X . X . X . X _ 3 _ 3 _
-b
=-= -X -3 -27.
e/d b ' -c = be' X Xl X· X

Podemos enunciar ahora una regIa general para dividir una fraccion por otra
Si X = t, a = 4, b = 2, entonces
fraccion, Para dividir fracciones, .se invierte el divisor y se multiplica. Asi,
Xu = x-:» = X4-l = Xl.
x/y bx
xb
se convierte en que es igual a
al/b ~2y Sustituyendo t en vez de X, tenemos

Como aclaracion: si a = 5, b = 2, x = 3 e y = 4, las expresiones anteriores se


con vierten en 1

3/4 3 2 2·3 6
52/2 -4' 52 = 4 X 52 = 100'

Extraccion de raices cuadradas


Una practica general que debe seguirse cuando se sustituyen valores numericos
en expresiones fraccionarias, consiste en simplificarlas antes de hacer las sustitu­ La raiz cuadrada de un numero es el valor que multiplicado por si mismo es igual al
ciones.
numero dado. El apendice III contiene una tabla de raices cuadradas.
La dificultad usual que se encuentra al calcular raices cuadradas es la de­
cision sobre cuantos digitos preceden al decimal. Por ejernplo, J25 000 000 =
Multiplicacion y division de terminos can exponentes = 5000, y no es igual a 500 0 a 50 000; 0 sea, hay cuatro digitos antes del ,decimal. Para
determinar el numero de digitos que preceden al decimal, se cuenta slmplem~n.te el
Un exponente indica cuantas veces ha de multiplicarse un numero por si mismo.
5 nurnero de pares de cifras que hay a la izquierda del decimal en el numero original:
Por ejemplo, X significa que X debe multiplicarse por si misma 5 veces, 0 sea,
Nurnero de pares = nurnero de digitos.
X 5 = X . X . X . X . X.
Si X = 3, Sin embargo, si hay un nurnero impar de digitos, entonces el nu~er~ de digi.tos que
X5 = 3 . 3 . 3 . 3 . 3 = 243 y
1
(X
)5 IS 1.1.1.1.1 1 preceden al decimal es igual al numero de pares mas 1. Los siguientes ejernplos
ilustran este pun to :
= X5 = 3 . 3 . 3 . 3 . 3 = 243 .
50,0 5.0 15,8 1.58
Para multiplicar X elevada a la potencia a (xa)'por X elevada a la potencia b, se
suman los exponentes y se eleva X a la potencia (a + b). La razon de sumar los
a) )2500,"00' J25.00· b) J250.00' fiSOOO'
exponentes queda clara en el siguiente ejemplo. _. * Esto conduce a una anornalia intcresante de lu regia de que un exponente indica el ruimero de veces que un nurnero
Si a = 3 y b = 5, entonces es multiplicado par si mismo. Estn es,

X" . x» = X 3 X 5 = (X . X . X)(X . X . X . X . X),


sin embargo,
que es igual a X 8 • xN
XN= I: par tanto, XO = I.
Ahora, si X = 5, a = 3 y b = 5, entonces
b Cualquier nurnero elevado a la potencia cera es igual I.
X": X = x-:» = X3+5 = X 8 = 58 = 390625.
[362] GLOSARIO DE SfMBOLOS 363

II
Simbolo Definicion Paqina
Media de la distribucion de las medias muestrales 218

/lx
Glosario de simbolos /lx, -x, Media de la distribucion de la diferencia entre parejas
de medias muestrales 245

/ljj Media de la diferencia entre calificaciones apareadas 265

15
2
Varianza poblacional 97

15 Desviacion estan dar poblacional 97

15
f5~ - ­
x - N Varianza de la distribucion muestral de la media 219

15

f5 x= IN Error estandar verdadero de la media tomada de


muestras aleatorias con una N fija 216

Error estandar verdadero de la diferencia entre me­

dias 245

A continuacion se dan las definieiones de los simbolos que aparecen en el texto, Omega al cuadrado; grado de asociacion entre la
seguidas por el numero de la pagina en que se haee referencia al simbolo por primera variable dependiente y la variable independiente 249

vez.

Las letras griegas y las italicas apareeen en listas separadas y en orden alfabetico Letras italicas
aproximado. Los operadores matematicos figuran en primer lugar. Estadigrafo empleado para la prueba de hipotesis con
muestras correlacionadas 267

Simbolo Definicion Terrnino constante en una ecuacion de regresion 147

Paqina
Pendiente de una recta que relaciona valores de Y con
Operadores matematicos valores de X
147

c Numero de columnas en una tabla de contingencia 330

=1= Diferente de 24

a<b a es menor que b


facum Frecuencia acumulada 44

24

a>b a es mayor que b


fll acum Frecuencia acumulada en el limite inferior verdadero
24
67

-s Menor 0 igual que del intervalo que contiene a X


179
45

~ Mayor 0 igual que 179


%acum Porcentaje acumulado
(I) Rango en la variable X - rango en la variable Y
JX· Rafz cuadrada 17

17
(formula de rs) 133

X elevada a la potencia a D
N! Factorial: multiplicar N por todos los mimeros ente­ {
(2) Calificacion en la variable X - calificacion en la
variable Y, (X - Y) 265

ros menores que N, pero mayores que cero:


i5 Media de las diferencias entre las calificaciones apa­

(N)(N - 1)(N - 2) '" (2)(1) 324


readas 265

gl Grados de libertad: numero de valores que tienen

Valor absoluto de X 96

libertad de variar despues de imponer ciertas rest ric­


Suma de todas las cantidades 0 calificaciones que le 227

siguen 17
ciones a los datos
F Cociente de dos varianzas 250

Suma de todas las cantidades desde X I hasta X N :


41

f Frecuencia
XI + X 2 + .... + X N 18
Ii Numero de casos dentro del intervalo que contiene
aX 67

Letras griegas
fe Numero esperado en una categoria dada 327

Probabilidad de cometer un error del tipo I, probabi­


Numero observado en una categoria dada 327

fo
lidad de rechazar H 0 cuando es verdadera 204
fX Calificacion multiplicada por su correspondiente fre­
f3 . Probabilidad de cometer un error del tipo II, probabi­ cuencia 79

lidad de aceptar H 0 cuando es falsa 208


Hipotesis nula; hip6tesis realmente investigada 205

Chi cuadrado 327


Hip6tesis alternativa; hipotesis que se admite al ser
Media poblacional 77
205

rechazada H 0
Valor de la media poblacional segun H o 220
Longitud del intervalo de clase 42

Valor de la media poblacional segun HI 309


k Numero de grupos, categorias 0 casillas 282

364 ESTADfSTICA PARA LAS CIENCIAS SOCIALES GLOSARIO DE SfMBOLOS 365

Simbolo Definicion Ptiqinn Definicion Paqina


Simbolo
k2 Coeficiente de no determinacion Error estandar de la estimacion cuando se predice Y
159
{I
Sest y
D.M. Desviaci6n media mediante X 154
96
Numero de pares 127 sesLx Error estandar de la estimaci6n cuando se predice X
N (2) Tamafio de la muestra mediante Y 154
245
(3) Numero total de calificaciones 0 cantidades 17 SC = DX ­ X)2 Suma de cuadrados, suma de los cuadrados de las
Nx Numero total de medias obtenidas en un experimento desviaciones respecto a la media 98
muestral 181 SC A x B Suma de cuadrados correspondiente a la interaccion 290
p Probabilidad 178 sc., Suma total de cuadrados, suma de los cuadrados de
p(A) Probabilidad del suceso A 178 las desviaciones de cada calificacion (X) respecto a la
p(B I A) Probabilidad de B dado que A ha ocurrido 280
p
{(I) Probabilidad de la realizacion de un suceso
(2) Proporcion de casos en una de las c1ases de una
185
182 SCw
media general (X t o t )
Suma de cuadrados dentro de los grupos, suma de los
cuadrados de las desviaciones de cada calificacion (X)
poblaci6n bicateg6rica 281
Q
{(I) Probabilidad de la no ocurrencia de un suceso
(2) Proporcion de casos en la otra c1ase de una
321
182 SCE
respecto a la media de su propio grupo (Xi)
Suma de cuadrados entre grupos, suma de los cuad~-
dos de las desviaciones de la media de cada grupo (Xi)
poblacion bicategorica 321 respecto a la media general (X t o t) muItiplicada por la
QI Primer cuartil, percentil 25 93 N de cada grupo 280
(t3
r
fl)
Tercer cuartil, percentil 75
Coeficiente de correlaci6n de Pearson del pro-
ducto-rnomento
93

122
T
t
Suma de los rangos con el signo menos frecuente
Estadigrafo empleado para examinar hipotesis cuan­
do (J es desconocida
344

226
(2) Numero de filas en una tabla de contingencia 330 U,U' Estadigrafo en la prueba de Mann-Whitney 338
r2 Coeficiente de determinacion 158 X, Y Variables; cantidades 0 calificaciones de variables 17
r, Coeficiente de correlacion por rangos de Spearman 122 X i, 1'; Cantidades especificas indicadas por el subindice i 18
R1 Suma de los rangos asignados al grupo cuyo tarnafio X,Y Medias aritrneticas 77
muestral es N 1 (formula U de Mann-Whitney) 339 Xi Media del i-esimo grupo 281
R2 Suma de los rangos asignados al grupo cuyo tamafio
muestral es N 2 (formula U de Mann-Whitney)
X _ IX to t Media general 280
339 101­ N
SC
S2 =_ Varianza muestral 98 Desviaci6n de una calificacion respecto a la media 79
(X - X)
N
x Nurnero de objetos en una categoria 0 numero de

S=~ Desviacion estandar muestral 98


IX 2
exitos
Suma de los cuadrados de las calificaciones originales
324
99
DX ­ X)2 SC (IX)2 Cuadrado de la suma de las calificaciones originales 99
52 = =-­ Estimador no sesgado de la varianza poblacional 224
N -1 N -1 XII Calificacion en ellimite inferior verdadero del interva­
10 que contiene a X 67
5=J
rI
Desviacion estandar muestral basada en el estimador X', Y' Calificaciones predichas por las ecuaciones de regre­
SC
N-I no sesgado de la varianza 224 sion 148
s~ Varianza estimada de la distribucion muestral de la YT Verdadero valor de Y que se encuentra en un interva­
x
media 224 10 en torno a la recta de regresion 156
S S Desviacion d' U~ calificacion especffica respecto
Sx = IN = .J N - 1 Error estandar estimado de la media 216 a la media, expresada en unidades de desviaci6n
Z estandar 110
SXI-X2 Error estandar estimado de la diferencia entre medias 245 (2) Estadigrafo empleado para examinar hip6tesis
sD Desviacion estandar de la diferencia de caJificaciones 265 cuando (J es conocida 219,245
sj) Error estandar estimado de la diferencia entre medias, ZO.OI = ± 2.58 Valor critico de z, minima Z requerida para rechazar
rnetodo de la diferencia directa 264 H 0 aJ nivel de significaci6n 0.01, examen bilateral 220
-2 Estimador de Ia varianza entre grupos
SE 282 ZO.05 = ± 1.96 Valor minimo de Z requerido para rechazar H o al
-2
Sw Estimador de la varianza dentro del grupo 282 nivel de significacion 0.05, examen bilateral 221
SA xB Estimador de la varianza por interacci6n 291 Zy' Y' expresada en terminos de Z 151
[366] TABLAS 367

III Tablas
Agradecimientos

Los autores expresan su agradecimiento a los autores y editores enumerados a


continuaci6n por permitir el uso de las siguientes tablas.

Tabla B R. A. Fisher, Statistical Methods for Research Workers (14." ed.). (Metodos
estadisticos para intiestiqadores.] Reproducida, con permiso, de Macmillan
Publishing Company, Inc. Copyright 1970, University of Adelaide.
Tabla C Tabla III de R. A. Fisher y F. Yates. Statistical Tablesfor Biological, Agricultural,
and Medical Research (Tablas estadisticas para la investigaci6n bioloqica, agricola y
A medica). Edimburgo: Oliver and Boyd, Ltd., 2." ed., 1974.
Proporciones de area bajo la curva normal 369 Tabla D G. W. Snedecor y William G. Cochran, Statistical Methods 6." ed., (Metodos
B Tabla de X2 estadisticos), Ames, Iowa: Iowa State University Press, 1967.
372
C Valores criticos de t Tabla E J. Sandler, «A test of the significance of the ditTerence between the means of
373 correlated measures, based on a simplification of Student's t» (Una prueba de
D Valores criticqs de F 374 significacion de la diferencia entre las medias de medidas correlacionadas, basada
D1 Valores criticos de F que corresponden al 2.5 % superior y al en una simplificacion de la t de Student), Brit. J. Psychol., 46, 225-226, 1955.
2.5 % inferior de las distribuciones F 378
Tabla F Q. McNemar, tabla B de Psychological Statistics (Estadistica aplicadaa la
psicoloqia). Nueva York: John Wiley and Sons, Inc., 1962.
E Valores criticos de A 380 Tabla G E. G. Olds, «The 5 percent significance levels of sums of squares of ditTerences and
F Transformacion de r a zr a correction» (Los niveles de significacion del 5 por ciento de las sumas de
381 cuadrados de las diferencias y una correccion), Ann. Math. Statist., 20, 117-118,
G Valores criticos de rs 382
1949. E. G. Olds, «Distributions of sums of squares of rank differences for small
H Funciones de r
383 numbers of individuals» (Distribuciones de las sumas de cuadrados de las
I Valores criticos de U y U' diferencias de rangos para numeros pequefios de individuos). Ann. Math. Statist., 9,
385 133-148, 1938.
J Valores criticos de T 389 Tabla H W. V. Bingham, tabla XVII de Aptitudes and Aptitude Testing ( Aptitudes y pruebas
K Factoriales de los numeros dell al 20 390 de aptitud). Nueva York: Harper and Bros., 1937.
L Coeficientes binomiales Tabla I H. B. Mann y D. R. Whitney, «On a test of whether one of two random variables is
390 stochastically 'larger than the other» (Acerca de una prueba para averiguar si una
M Valores criticos de x 0 de N - x (el que sea mayor) a los de dos variables aleatorias es estocasticamente mayor que la otra). Ann. Math.
niveles 0.05 y 0.01, cuando P = Q = ! 391 Statist., 18, 52-54, 1947.
N Valores criticos de x para varios valores de P y de Q cuando D. Auble, «Extended tables for the Mann-Whitney statistic» (Tablas ampliadas
para el estadigrafo de Mann-Whitney). Bulletin of the Institute of Educational
N ~49 392 Research at Indiana University, 1, mim, 2, 1953.
0 Puntos porcentuales del ran go studentizado 398 Tabla J F. Wilcoxon, S. Katti, y R. A. Wilcox, Critical Values and Probability Levelsfor the
P Wilcoxon Rank Sum Test and the Wilcoxon Signed Rank Test (Valores criticos y
Cuadrados, raices cuadradas y reciprocos de los mimeros dell
niveles de probabilidad para la prueba Wilcoxon de la suma de rangos y para la
al 1000 399 prueba Wilcoxon de los rangos con signo). Nueva York: American Cyanamid Co.,
Q Numeros aleatorios 405 1963.
F. Wilcoxon y R. A. Wilcox, Some Rapid Approximate Statistical Procedures
(Algunos procedimientos estadisticos de aproximacion rapid a). Nueva York:
Lederle Laboratories, 1964.
Tabla L S. Siegel, Nonparametric Statistics (Estadistica no parametrica). Nueva York:
McGraw-Hili, 1956.
Tabla M R. P. Runyon, tabla A de N onparametric Statistics (Estadistica nl) parametrica),
Reading, Mass.: Addison-Wesley Publishing Co., 1977.
368 ESTADfsTICA PARA LAS CIENCIAS SOCIALES TABLAS 369

Tabla N R. P..Runyon, tabla ~ de Nonparametric Statistics (Estadistica no parametrica},

Tabla 0
Reading, Mass.: Addison-Wesley Publishing Co., 1977.
E. S. Pearson y H. O. Hartley, Biometrika Tables for Statisticians vol. 1, 2.8 ed.
U SO de la tabla A
(Tablas de Biometrica para estadisticos). Nueva York: Cambridge, 1958.
Tabla P A. L. Edwards, Statistical Analysis 3." ed. ( Analisis estadistico). Nueva York: Holt
Rinehart and Winston, Inc., 1969. ' El uso de la tabla A requiere que la calificacion original sea transformada en un valor
J. W. Dunlap y A. K. Kurtz, Handbook oj Statistical Nomographs, Tables, and z, y que la variable tenga distribucion normal.
Formulas (Manual de nomogramas, tablas y formulas estadisticas). Nueva York: Los valores de la tabla A representan la proporcion de area bajo la curva normal
World Book Company, 1932. estandar, que tiene una media de 0, una desviacion estandar de I y un area total
Tabla Q RAND Corporation, A million Random Digits (Un mil/on de numeros aleatorios), tambien iguaJ a 1.
Glencoe, III.: Free Press of Glencoe, 1955. Puesto que la curva normal es simetrica, basta con indicar las areas correspon­
dientes a valores positivos de z. A los valores negativos de z les corresponderan las
mismas proporciones de area que a sus equivalentes positivos.
La columna B representa la proporcion de area entre la media y una z dada.

0.5000 DEL
AREA TOTAL

MEDIA Z -Z MEDIA

!
La columna C representa la proporcion de area comprendida entre la media y una z
dada.

MEDIA Z -Z MEDIA
370 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
TABLAS 371

Tabla A Proporciones de area bajo la curva normal.


Tabla A. (continuacion)
(A) (6), (e) (A) (6) (e) (A) (6) (e)
z Area entre la Area a la z Area entre la
(A) (6) (e) (A) (6) (e) (A) (6) (e)
Area a la z Area entre la Area a la
media y derecha de media y derecna de z Area entre la Area a la z Area entre la Area a la z Area entre la Area a la
; media y derecha de
z z z z media y derecha de media y derecha de media y .derecha de
z z z z z z z z
0.00 .0000 .5000 0.55 .2088 .2912 1. 10
0.01 .3643 .1357
1.65 .4505 .0495 2.22 .4868 .0132 2.79 .4974 .0026
.0040 .4960 0.56 .2123 .2877 1. II .3665
0.02 .OOBO .4920 0.57 .1335
1.66 .4515 .0485 2.23 .4871 .0129 2.BO .4974 .0026
.2157 .2843 1.12 .3686 .1314

0.03 .0120 .4800 0.58 .2190 .2810 1.67 .4525 .0475 2.24 .4875 .0125 2.81 .4975 .0025
1. 13 .3708 .1292
.4535 .0465 2.25 .0122 2.82
0.04 .0160 .4840 0.59 .2224 .2776 1.14 1.68 .4878 .4976 .0024
.3729 .1271
1.69 .4545 .0455 2.26 .4881 .0119 2.83 .4977 .0023
0.05 .0199 .4BOI ,0.60 .2257 ,2743 1.15 .3749
0.06 .0239 .4761 .1251
1.70 .4554 .0446 2.27 .4884 .0116 2.84 .4977 .0023
0.61 .2291 " .2709 1.16 .3770 .1230
1. 71 .4564 .0436 2.28 .4887 .0113 2.85 .4978
0.07 .0279 A721 0.62' .0022
0.08 . 2374• .2676 1.17 .3790 .1210
1.72 .4573 .0427 2.29 .4890 .0110 2.86 .4979 .0021
.0319 .4681 0.63 .2357 .2643 1. 18 .3810 .1190
_1...73, __ .4§llg, 2.30 .4979
0.09 .0359 .4641 0.64 .Mill.('- _ .4893 .0107 2.87 .0021
.2389 .2611 1. 19 .3830 .1170
1:74 .4591 .0409 2.31 .4896 .0104 2.88 .49BO .0020
0.10 .0398 .4602
, . ,
0.65 .2422 .2578 1.20 .3849 .1151
1.75 .4599 .0401 2.32 .4898 .0102 2.89 .4981 .0019
0,11 '­ .0438 .4562 0.66 .2454 .2546 1.21 1.76 .4608 .0392 2.33 .4901 .0099 2.90 .4981 .0019
.3869 .1131

0.12 .0478 .4522 0.67 .2486 .2514 1. 22 .3888 1.77 .4616 .0384 2.34 .4904 .0096 2.91 .49Q2 .0018
0.13 .0517 .1112

.4483 0.68 .2517 .2483 ' 1.23 .3907 .1093


1.78 .4625 .0375 2.35 .4906 .0094 2.92 .4982 . .0018
0.14 .0557 .4443 0.69 .2549 .2451 1.24 .3925 1.79 .4633 .0367 2.36 .4909 .0091 2.93 .4983 .0017
.1075

0.15 .0596 .4404 0.70 .25BO .2420 1.25 .3944


1.80 .4641 .0359 2.37 .4911 .0089 2.94 .4984 .0016
0.16 .1056
1.81 .4984
.0636 .4364 0.71 .2611 .2389 1.26 .3962
.1038
.4649 .035J 2.38 .4913 .0087 2.95 .0016
0.17 .0675 .4325 0.72 .2642 .2358 1.27 .3980
1.82 .4656 .0344 2.39 .4916 .0084 2.96 .4985 .0015
0.18 .1020
.4985
.0714 .4286 0.73 .2673 .2327 1.28 .3997
.1003
1.83 .4664 .0336 2.40 .4918 .0082 2.97 .0015
0.19 .0753 .4247 0.74 .2704 .2296 1.29 .4015
1.84 .4671 .0329 2.41 .4920 .0080 2.98 .4986 .0014
.0985

0.20 .0793 .4207 0.75 1.85 .4678 .0322 2.42 .4922 .0078 2.99 .4986 .0014
.2734 .2266 1.30 .4032
.0968
1.86 .4686 .0314 2.43 .4925 .0075 3.00 .4987 .0013
0.21 .0832 .4168 0.76 .2764 .2236 1.31 .4049

0.22,. .0871 .0951


1.87 .4693 .0307 2.44 .4927 .0073 3.01 .4987 .0013
.4129 0.77 .2794 .2206 1.32 .4066
.0934

0.23 .0910 .4090 0.78 1.88 .4699 .0301 2.45 .4929 .0071 3.02 .4987 .0013
.2823 .2177 1.33 .4082
.0918
1.89 .4706 .0294 2.46 .4931 .0069 3.03 .4988 .0012
0.24 .0948 .4052 0.79 .2852 .2148 1.34 .4099
.0901

"
1.90 .4713 .0287 2.47 .4932 .0068 3.04 .4988 .0012
0.25 .0987 .4013 0.00 .2881 .2119 1.35 .4115 1.91 .0281 2.48 3.05 .4989 .0011
0.26 .0885
.4719 .4934 .0066
":: . 1026 .3974 0.81 .2910 .2090 1.36 .4131 .0869
1.92 .4726 .0274 2.49 .4936 .0064 3.06 .4989 .0011
0.27 .1064 .3936 0.82 .2939 .2061 1.37 .4147
'r
1.93 .0268 2.50 .4989 .0011
0.28 .0853
.4732 .4938 .0062 3.07
.1103 .3897 0.83 .2967 .2033 1.38 .4162 .0838
1.94 .4738 .0262 2.51 .4940 .0060 3.08 .4990 .0010
0.29 .1141 .3859 0.84 .2995 .2005 1.39 .4177 .0823

1.95 .4744 .0256' 2.52 .4941 .0059 3.09 .4990 .0010


0.30
0.31
.1179 .3821 0.85 .3023 - .@) 1.40 .4192
.0808 ,.. 1 96 .4750 .0250 2.53 .4943 .0057 3.10 .4990 .0010
.1217 .3783 0.86 .3051 .1949 1.41 .4207
.0793 1.97 .4756 .0244 ' 2.54 .4945 .0055 3.11 .4991 .0009
0.32 .1255 .3745 0.87 .3078 .1922 1.42 .4222
1.98 .4761 .0239 2.55 .4946 .0054 3.12 .4991 .0009
0.33 .0778
.1293 .3707 0.88 .3106 .1894 1.43 .4236
.0764 1.99 .4767 .0233 2.56 .4948 .0052 3.13 .4991 .0009
0.34 .1331 .3669 0.89 .3133 .1867 1.44 .4251
.0749 2.00 .4772 .0228 2.57 .4949 .0051 3.14 .4992 .0008
0.35 . 1368 .3632 0.90 .3159 .1841 1.45 2.01 .4778~ .0222 2.58 .4951 .0049 3.15 .4992 .0008
.4265
.0735 2.02 .0217 2.59' .4952 .0048 .4992 .0008
0.36 .1406 .3594 0.91 .3186 .1814 1.46 .4279
.4783 3.16
0.37 .0721 2.03 .4788 .0212 2.60 .4953 .0047 3.17 .4992 .0008
.1443 .3557 0.92 .3212 .1788 1.47 .4292
.0708
0.38 .1480 .3520 0.93 .3238 .1762 1.48 2.04 .4793 .0207 2.61 .4955 .0045 3.18 .4993 .0007
.4306
.0694
0.39 .1517 .3483 0.94 .3264 .1736 1.49 .4319
.0681 2.05 .4798 .0202 2.62 .4956 .0044 3.19 .4993 .0007
0.40 .1554 .3446 0.95 2.06 .4803 .0197 2.63 .4957 .0043 3.20 .4993 .0007
.3289 .1711 1.50 .4332 .0668 2.07 .4808 .0192 2.64 .4959 .0041 3.21 .4993 .0007
0.41 .1591 .3409 0.96 .3315 .1685 1.51 .~5 .0655 2.08 .4812 .0188 2.65 .4960 .0040 3.22 .4994 .0006
0.42 .1628 .3372 0.97 .3340 .1660 . 1.52
0.43 .1664
.4357
.064'3 2.09 .4817 .0183 2.66 .4961 .0039 3.23 .4994 .0006
.3336 0.98 .3365 .1635 1.53 .4370
.0630
0.44 .1700 .3300 0.99 .3389 .1611 1.54 .4382
, 2.10 .4821 .0179 2.67 .4962 .0038 3.24 .4994 .0006
.0618
2.11 .4826 .0174 2.68 .4963 .0037 3.25 .4994 .0006
0.45 .1736 .3264 , '1.00 . '.3413 .1587 1.55 .4394' 2.12 .0170 2.69 .0036 3.30 .4995 .0005
0.46 .0606 .4830 .4964
.1772 .3228 1.01 .3438 .1562 1.56 ~'IJI06' 2.13 .4834 .0166 2.70 .4965 .0035 3.35 .4996 .0004
0.47 .IB08 .3192 :039''­
1.02 .3461,­ .1539 1.57 .4418 .0582 2.14 .4838 .0162 2.71 .4966 .0034 3.40 .4997 .0003
0.48 .1844 .3156 1.03 .3485 .1515 1.58 .4429
0.49 .0571
.1879 .3121 1.04 .3508 .1492 1.59 .4441 .0559 2.15 .4842 .0158 2.72 .4967 .0033 3.45 .4997 .0003
2.16 .4846 .0154 2.73 .4968 .0032 3.50 .4998 .0002
0.50 .1915 .3085 1.05 .3531 .1469 1.60 .4452 2.17 .4850 .0150 2.74 .4969 .0031 3.60 .4998 .0002
0.51 .1950 .0548
.3050 1.06 .3554 .1446 1.61 .4463 .0537 2.18 .4854 .0146 2.75 .4970 .0030 3.70 .4999 .0001
0.52 .1985 .3015 1.07 .3577 .1423 1.62 .4474 2.19 .4857 . .0143 2.76 .4971 .0029 3.BO .4999 .0001
0.53 .0526
.2019 .2981 1.08 .3599 .1401 1.63 .4484 .0516
0.54 .2054 .2946 1.09 .3621 .1379 1.64 2.20 .4861 .0139 2.77 .4972 .0028 3.90 .49995 .00005
.4495 .0505 2.21 .4864 .0136 2.78 .4973 .0027 4.00 .49997 .00003
372 ESTAOfSTICA PARA LAS CIENCIAS SOCIALES
TABLAS 373

Tabla B
Tabla de X2 ,
Tabla C
Los valores tabulados corresponden a una prueba
Valores criticos de t.

bilateral.
Para cualquier nurnero dado de gl, la tabla presenta los valores de t correspondientes a varios niveles

Grados
de probabilidad. La t obtenida es significativa a un nivel dado si es igual 0 mayor que el valor indicado

de .10 .05
en esta tabla.

.02 .01
Iibertad
gl Nivel de significaci6n para una prueba unilateral

1 2.706 3.841 5.412 6.635 .10 .05 .025 .01 .005 .0005
2 4.605 5.991 7.824 9.210
3 6.251 7.815 9.837 11.341 Nivel de sig~ificaci6n para una prueba bilateral
4 7.779 9.488 11.668 13.277
5 9.236 11.070 13.388 15.086 gl .20 .10 .05 .02 .01 .001
6 10.645 12.592 15.033 16.812 I 3.078 6.314 12.706 31.821 63.657 636.619
7 12.017 14.067 16.622 18.475 2 1.886 2.920 . 4.303 6.965 9.925 31.598
8 13.362 15.507 18.168 20.090 3 1.638 2.353 3.182 4.541 5.841 12.941
9 14.684 16.919 19.679 21.666 4 1.533 2.132 2.776 3.747, 4.604 8.610
10 15.987 18.307 21.161 23.209 5 1.476 2.015 2.571 3.3~ 4.032 6.859
11 17.275 19.675 22.618 24.725 1.440 1.943 2.447 3.1~ 3.707 5.959
6
12 18.549 21.026 24.054 26.217 7 1.415 1.895 2.365 2.998 3.499 5.405
13 19.812 22.362 25.472 27.688 8 1.397 1.860 2.306 2.896 3:355 5.041
14 21.064 23.685 26.873 29.141 9 1.383 1.833 . 2.262 • 2.821 3.250 4.781
15 22.307 24.?96 28.259 30.578 10 1.372 1.812 2.228 2.764 3.169 4.587
16 23.542 26.296 29.633 32.000 11 1.363 1.796 2.201 2.718 3.106 4.437
17 24.769 27.587 30.995 33.409 2.179 2.681 3.055 4.318
18 12 1.356 1.782
25.989 28.869 32.346 34.805 13 1.350 2.160 2.650 3.012 4.221
19 '.771
27.204 30.144 33.687 36.191 14 .­ 1.345 1.761 2.145 '" 2.624 2.977 4.140
20 28.412 31.410 35.020 37.566 15 1.341 1. 753 2.131 2.602 2.947 4.073
21 29.615 32.671 36.343 38.932
22 30.813 33.924 16 1.337 1.746 2.120 2.583 2.921 4.015
37.659 40.289 , .740 2.110 2.567 2.898 3.965
23 32.007 35.172 38 •.968 17 1.333
41.638 18 1.330 1.734 2.101 2.552 2.878 3.922
24 33.196 36.415 40.270 42.980
25 19 1.328 1.729 2.093 2.539 2.861 3.883
34.382 37.652 41.566 44.314 2.086 2.528 2.845 3.850
20 1.325 1. 725
26 35.563 38.885 42.856 45.642
27 36.741 40.113 44.140 46.963 .21 1.323 I. 721 2.080 2.518 2.831 I,
3.819
28 37.916 41.337 45.419 48.278 22 1.321 1.717 2.074 2.508 2.819 3.792
29 39.087 42.557 46.693 23 1.319 1. 714 2.069 2.500 2.807 3.767
49.588 2.064 2.492 2.797 3.745
30 40.256 43.773 47.962 50.892 24 1.318 1.711
25 1.316 1.708 2.060 2.485 2.787 3.725

26 1.315 1.706 2.056 2.479 2.m 3.707


27 1.314 1.703 2.052 2.473 2.771 3.690
28 1.313 1. 701 2.048 2.467 2.763 3.674
29 1.311 1.699 2.045 2.462 2.756 3.659
30 1.310 1.697 2.042' 2.457 2.750 3.646
40 1.303 1.684 2.021 2.423 2.704 3.551
60 1.296 1.671 2.000 2.390 2.660 3.460

dZ;~~.
2.358 3.373
,'Y':p< <
»> :;?~'·P.
....•: 2.326 I> P·. ~;~~~ • .3;.291 j

La tabla C ha sido tomada de la tabla III (pag, 46) de las «Statistical Tables for Biological, Agricultural
and Medical Research», publicadas par Longman Group Ltd., Londres (publicadas anteriormente por
Oliver and Boyd, Edimburgo), con permiso de los auto res y de los editores.
Tabla D W
-..J
Valores criticos de F .j>.

La F obtenida es significativa a un nivel dado si es igual 0 mayor que el valor indicado en la tabla. Las filas superiores (nurneros c1aros) y las filas
inferiores (nurneros oscuros) corresponden a los niveles 0.05 y 0.01. respectivamente. tTl
Los valores indicados son para la cola derecha de la distribuci6n que se obtiene dividiendo el estimador de la varianza mayor por el estimador de la Vl
-l
varianza menor. Para hallar ellado izquierdo complementario. 0 sea. la cola inferior, dados los gl y el nivel x, inviertanse los grados de libertad y con >
ellos se encorurara en la tabla F el reciproco del valor buscado. Por ejernplo. el valor a cuya derecha esta el 5 ~·o del area, para 7 y 12 gl, es 2.85. Para C'
hallar el punto a cuya izquierda esta el 5 "~ del area, se busca en la tabla en J. = 0.05 con 12 y 7 gl y se obtiene 3.57. EI reciproco de este nurnero es 1/3.57 =
~'
= 0.28. Asi, el 5 nn del area esta a la izquierda de F = 0.28. n
>
Grados de liberrad en el numeradci "C
>
;:l:l
1 2 3 4 5 6 7 8 9 10 11 12 14 16 20 24 30 40 50 75 100 200 500 OC
>
1 161 200 216 225 230 234 237 239 241 242 243 244 245 246 248 249 250 251 252 253 253 254 254 254 r
4052 4999 5403 5625 5764 5859 5928 5981 6022 6056 6082 6106 6142 6169 6208 6234 6258 6286 6302 6323 6334 6352 6361 6366 >
Vl

2 18.51 19.00 19.16 19.25 19.30 19.33 19.36 19.37 19.38 19.39 19.40 19.41 19.42 19.43 19.44 19.45 19.46 19.47 19.47 19.48 19.49 19.49 19.50 19.50 Q
98.49 99.01 99.17 99.25 99.30 99.33 99.34 99.36 99.38 99.40 99.41 99.42 99.43 99.44 99.45 99.46 99.47 99.48 99.48 99.49 99.49 99.49 99.50 99.50 tTl
Z
3 10.13 9.55 9.28 9.12 9.01 8.94 8.88 8.84 8.81 8.78 8.76 8.74 8.71 8.69 8.66 8.64 8.62 8.60 8.58 8.57 8.56 8.54 8.54 8.53 n
34.12 30.81 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23 27.13 27.05 26.92 26.83 26.69 26.60 26.50 26.41 26.30 26.27 26.23 26.18 26.14 26.12 ;;
Vl
(; 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.93 5.91 5.87 5.84 5.80 5.77 5.74 5.71 5.70 5.68 5.66 5.65 5.64 5.63 Vl
-0
ro 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.54 14.45 14.37 14.24 14.15 14.02 13.93 13.83 13.74 13.69 13.61 13.57 13.52 13.48 13.46 o
E
c;
n
g 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.78 4.74 4.70 4.68 4.64 4.60 4.56 4.53 4.50 4.46 4.44 4.42 4.40 4.38 4.37 4.36 sr
"
-0 16.26 13.27 12.06 11.39 10.97 10.67 10.45 10.27 10.15 10.05 9.96 9.89 s.rr 9.68 9.55 9.47 9.38 9.29 9.24 9.17 9.13 9.07 9.04 9.02 tTl
0; Vl
c 6 5.99 5.14 4.76 4.~3 4.39 4.28 4.21 4.15 4.10 4.06 4.03 4.00 3.96 3.92 3.87 3.84 3.81 3.77 3.75 3.72 3.71 3.69 3.68 3.67
" 13.74 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.79 7.72 7.60 7.52 7.39 7.31 7.23 7.14 7.09 7.02 6.99 6.94 6.90 6.88
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.63 3.60 3.57 3.52 3.49 3.44 3.41 3.38 3.34 3.32 3.29 3.28 3.25 3.24 3.23
12.25 9.55 8.45 7.85 7.46 7.19 7.00 6.84 6.71 6.62 6.54 6.47 6.35 6.27 6.15 6.07 5.98 5.90 5.85 5.78 5.75 5.70 5.67 5.65
8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.34 3.31 3.28 3.23 3.20 3.15 3.12 3.08 3.05 3.03 3.00 2.98 2.96 2.94 2.93
11.26 8.65 7.59 7.01 6.63 6.37 6.19 6.03 5.91 5.82 5.74 5.67 5.56 5.48 5.36 5.28 5.20 5.11 5.06 5.00 4.96 4.91 4.88 4.86
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.13 3.10 13.07 3.02 2.98 2.93 2.90 2.86 2.82 2.80 2.77 2.76 2.73 2.72 2.71
10.56 8.02 6.99 6.42 6.06 5.80 5.62 5.47 5.35 5.26 5.18 5.11 5.00 4.92 4.80 4.73 4.64 4.56 4.51 4.45 4.41 4.36 4.33 4.31
10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.97 2.94 2.91 2.86 2.82 2.77 2.74 2.70 2.67 2.64 2.61 2.59 2.56 2.55 2.54
10.04 7.56 6.55 5.99 5.64 5.39 5.21 5.06 4.95 4.85 4.78 4.71 4.60 4.52 4.41 4.33 4.25 4.17 4.12 4.05 4.01 3.96 3.93 3.91
11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.86 2.82 2.79 2.74 2.70 2.65 2.61 2.57 2.53 2.50 2.47 2.45 2.42 2.41 2.40
9.65 7.20 6.22 5.67 5.32 5.07 4.88 4.74 4.63 4.54 4.46 4.40 4.29 4.21 4.10 4.02 3.94 3.86 3.80 3.74 3.70 3.66 3.62 3.60

12 4.75 3.88 3.49 3.26 3.11 3.00 2.92 2.85 2.80 2.76 2.72 2.69 2.64 2.60 2.54 2.50 2.46 2.42 2.40 2.36 2.35 2.32 2.31 2.30
9.33 6.93 5.95 5.41 5.06 4.82 4.65 4.50 4.39 4.30 4.22 4.16 4.05 3.98 3.86 3.78 3.70 3.61 3.56 3.49 3.46 3.41 3.38 3.36

13 4.67 3.80 3.41 3.18 3.02 2.92 2.84 2.77 2.72 2.67 2.63 2.60 2.55 2.51 2.46 2.42 2.38 2.34 2.32 2.28 2.26 2.24 2.22 2.21
9.07 6.70 5.74 5.20 4.86 4.62 4.44 4.30 4.19 4.10 4.02 3.96 3.85 3.78 3.67 3.59 3.51 3.42 3.37 3.30 3.27 3.21 3.18 3.16
14 4.60 3.74 3.34 3.11 2.96 2.85 2.77 2.70 2.65 2.60 2.56 2.53 2.48 2.44 2.39 2.35 2.31 2.27 2.24 2.21 2.19 2.16 2.14 2.13
8.86 6.51 5.56 5.03 4.69 4.46 4.28 4.14 4.03 3.94 3.86 3.~ 3.70 3.62 3.51 3.43 3.34 3.26 3.21 3.14 3.11 3.06 3.02 3.00
15 4.54 3.68 3.29 3.06 2.90 2.79 2.70 2.64 2.59 2.55 2.51 2.48 2.43 2.39 2.33 2.29 2.25 2.21 2.18 2.1'5 2.12 2.10 2.08 2.07
8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.~ 3.73 3.67 3.56 3.48 3.36 3.29 3.20 3.12 3.07 3.00 2.97 2.92 2.89 2.87
16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.45 2.42 2.37 2.33 2.28 2.24 2.20 2.16 2.13 2.09 2.07 2.04 2.02 2.01
8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.61 3.55 3.45 3.37 3.25 3.18 3.10 3.01 2.96 2.89 2.86 2.80 2.n 2.75

17 4.45 3.59 3.20 2.96 2.81 2.70 2.62 2.55 2.50 2.45 2.41 2.38 2.33 2.29 2.23 2.19 2.15 2.11 2.08 2.04 2.02 1.99 1.97 1.96
(; 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.52 3.45 3.35 3.27 3.16 3.08 3.00 2.92 2.86 2.79 2.76 2.70 2.67 2.65
-0
ro
e 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.37 2.34 2.29 2.25 2.19 2.15 2.11 2.07 2.04 2.00 1.98 1.95 1.93 1.92
'E 18 3.44 3.37 3.27 3.19 3.07 3.00 2.91 2.83 2.78 2.71 2.68 2.62 2.59 2.57
c
0 8.28 6.01 5.09 4.58 4.25 4.01 3.85 3.71 3.60 3.51
-0 " 19 4.38 3.52 3.13 2.90 2.74 2.63 2.55 2.48 2.43 2.38 2.34 2.31 2.26 2.21 2.15 2.11 2.07 2.02 2.00 1.96 1.94 1.91 1.90 1. 88
0;
e 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.36 3.30 3.19 3.12 3.00 2.92 2.84 2.76 2.70 2.63 2.60 2.54 2.51 2.49
-0 "ro 1.84
t:
20 4.35 3.49 3.10 2.87 2.71 2.60 2.52 2.45 2.40 2.35 2.31 2.28 2.23 2.18 2.12 2.08 2.04 1.99 1.96 1.92 1.90 1.87 1.85
8.10 5.85 4.94 4.43 4.10 3.87 3.71 3.56 3.45 3.37 3.30 3.23 3.13 3.05 2.94 2.86 2.n 2.tH 2.63 2.56 2.53 2.47 2.44 2.42
"
@
" -0 21 ~ '~.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.28 2.25 2.20 2.15 2.09 2.05 2.00 1.96 1.93 1.80 1.87 1.84
4.€ 5.78 .~.87 4.37 4.04 3.81 3.65 3.51 3.40 3.31 3.24 3.17 3.07 2.99 2.88 2.~ 2.72 2.63 2.58 2.51 2.47 2.42
8.02
1.82 1.81
2.38 2.36
'"
0
-0 .'
e 22 <l.05 2.82 2.66 2.55 2.47 2.40 2.35 2.30 2.26 2.23 2.18 2.13 2.07 2.03 1.98 1.93 1.91 1.87 1.84 1.81 1.~ 1. 78
~ 4.30' .3..M­
7.94 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.18 3.12 3.02 2.94 2.83 2.75 2.67 2.58 2.53 2.46 2.42 2.37 2.33 2.31

23 4.28 3.42 3.03 2.80 2.64 2.53 2.45 2.38 2.32 2.28 2.24 2.20 2.14 2.10 2.04 2.00 1.96 1.91 1.88 1.84 1.82 1.79 I.n 1.76
7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 3.21 3.14 3.1;7 2.97 2.89 2.78 2. i'O 2.62 2.53 2.48 2.41 2.37 2.32 2.28 2.26

24 4.26 3.40 3.01 2.78 2.62 2.51 2.43 2.36 2.30 2.26 2.22 2.18 2.13 2.09 2.02 1.98 1.94 1.89 1.86 1.82 1.80 1.76 1. 74 1.73
7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.25 3.17 3.09 3.03 2.93 2.85 2.74 2.66 2.58 2.49 2.44 2.36 2.33 2.27 2.23 2.21
25 4.24 3.38 2.99 2.76 2.60 2.49 2.41 2.34 2.28 2.24 2.20 2.16 2.11 2.06 2.00 1.96 1.92 1.87 1.84 1.80 1.77 1.74
2.70 2.62 2.54 2.45 2.40 2.32 2.29 2.23
1.72 1. 71
2.19 2.17 ~
7.n 5.57 4.68 4.18 3.86 3.63 3.46 3.32 3.21 3.13 3.05 2.99 2.89 2.81 Cll
r
26 4.22 3.37 2.89 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.18 2.15 2.10 2.05 1.99 1.95 1.90 1.85 1.82 1.78 1. 76 1.72 1.70 1.69
2.15 2.13
~
7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.17 3.09 3.02 2.96 2.86 2.n 2.66 2.58 2.50 2.41 2.36 2.28 2.25 2.19
27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.30 2.25 2.20 2.16 2.13 2.08 2.03 1.97 1.93 1.88 1.84 1.80 1.76 1.74 1. 71 1.68 1.67
W
7.68 5.49 4.60 4.11 3.79 3.56 3.39 3.26 3.14 3.06 2.98 2.93 2.83 2.74 2.63 2.55 2.47 2.38 2.33 2.25 2.21 2.16 2.12 2.10 -..J
VI
Tabla D (contilJuaci6n) VJ

-..I
Puntas de la distribucion F correspondientes a los niveles 0.05 (nurneros claros) y 0.01 (numeros oscuros) 0\

Grados de libertad en el numerador


1 2 3 4 5 6 7 8 9 1011 12 14 16 20 24 30 40 50 75 100 200 500 CIJ rn
I:Il
28 4.20 3.34 2.95 2.71 2.56 2.44 2.36 2.29 3.24 2.19 2.15 2.12 2.06 2.02 1.96 1.91 1.87 1.81 1. 78 1. 75 1.72 1.69 1.67 1.65 -l
7.64 5.45 4.57 4.07 3.76 3.53 3.36 3.23 3.11 3.03 2.95 2.90 2.~ 2.71 2.60 2.52 2.44 2.35 2.30 2.22 2.18 2.13 2.09 2.06
:>
t:l
29 4.18 3.33 2.93 2.70 2.54 2.43 2.35 2.28 2.22 2.18 2.14 2.10 2.05 2.00 1.94 1.90 1.85 1.80 1.77 1. 73
<:ii'
1.71 1.68 1.65 1.64 -l
7.60 5.52 4.54 4.04 3.73 3.50 3.32 3.20 3.08 3.00 2.92 2.87 2.77 2.68 2.57 2.49 2.41 2.32 2.27 2.19 2.15 2.10 2.06 2.03 n
:>
30 4.17 3.32 2.92 2.69 2.53 2.42 2.34 2.27 2.21 2.16 2.12 2.09 2.04 1.99 1.93 1.89 1.84 1.79 1.76 1.72 1.69 1.66 1.64 1.62 "C
7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.06 2.98 2.90 2.84 2.74 2.66 2.55 2.47 2.38 2.29 2.24 2.16 2.13 2.07 2.03 2.01 :>
::0
32 4.15 3.30 2.90 2.67 2.51 2.40 2.32 2.25 2.19 2.14 2.10 2.07 2.02 1.97 1.91 1.86 1.82 1.76 1.74 1.69 1.67 1.64 1. 61 1.59 :>
7.50 5.34 4.46 3.97 3.66 3.42 3.25 3.12 3.01 2.94 2.86 2.~ 2.70 2.62 2.51 2.42 2.34 2.25 2.20 2.12 2.08 2.02 1.98 1.96 t""'
:>
I:Il
34 4.13 3.28 2.88 2.65 2.49 2.38 2.30 2.23 2.17 2.12 2.08 2.05 2.00 1. 95 1.89 1.84 1.80 1. 74 1. 71 1.67 1.64 1. 61 1.59 1.57
<; 7.44 5.29 4.42 3.93 3.61 3.38 3.21 J.08 2.97 2.89 2.82 2.76 2.66 2.58 2.47 2.38 2.30 2.21 2.15 2.08 2.04 1.98 1.94 1.91 o
~
@
c: 36 4.11 3.26 2.86 2.63 2.48 2.36 2.28 2.21 2.15 2.10 2.06 2.03 1.89 1. 93 1. 87 1.82 1. 78 1.72 1.69 1.65 1.62 1.59 1.56 1.55 Z
'E o
0
c:
'"
-0
7.39 5.25 4.38 3.89 3.58 3.35 3.18 3.04 2.94 2.86 2.78 2.72 2.62 2.54 2.43 2.35 2.26 2.17 2.12 2.04 2.00 1.94 1.90 1.87
s
I:Il
a; 38 4.10 3.25 2.85 2.62 2.46 2.35 2.26 2.19 2.14 2.09 2.05 2.02 1.96 1.92 1.85 1.80 1.76 1. 71 1.67 1.63 1.60 1.57 1.54 1. 53 I:Il
c: 7.35 5.21 4.34 3.86 3.54 3.32 3.15 3.02 2.91 2.82 2.75 2.19 2.59 2.51 2.40 2.32 2.22 2.14 2.08 2.00 1.97 1.90 1. 86 1.84 o
.'" o
-0

"'"
40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.07 2.04 2.00 1. 95 1.90 1.84
7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.88 2.~ 2.73 2.66 2.56 2.49 2.37
1.79 1. 74 1.69
2.29 2.20 2.11
1. 66 1.61 1.59 1.55 1. 53 I. 51
2.05 1.97 1.94 1.88 1.84 1.81
s
~ ~
I:Il
'"
-0 42 4.07 3.22 2.83 2:59 2.44 2.32 2.24 2.17 2.11 2.06 2.02 1.90 1.94 I. 89 1.82 1. 78 1.73 1.68 1.64 1.60 1.57 1.54 1. 51 1.49
'"0 7.27 5.15 4.29 3.80 3.49 3.26 3.10 2.96 2.86 2.77 2.70 2.64 2.54 2.46 2.35 2.26 2.17 2.08 2.02 1.94 1.91 1.85 1.80 , .78
~
i5 44 4.06 3.21 2.82 2.58 2.43 2.3\ 2.23 2.16 2.10 2.05 2.01 1. 98 1.92 1. 88 1.81 I. 76 1.72 1.66 1.63 1.58 1.56 1.52 1.50 1.48
7.24 5.12 4.26 3.78 3.46 3.24 3.07 2.94 2.84 2.75 2.68 2.62 2.52 2.44 2.32 2.24 2.15 2.06 2.09 1.92 1.88 1. 82 1. 78 1.75
46 4.05 3.20 2.81 2.57 2.42 2.30 2.22 2.14 2.09 2.04 2.00 , .97 1. 91 1.87 1.80 1. 75 1.71 1.65 1.62 1.57 1.54 1.51 1.48 1.46
7.21 5.10 4.24 3.76 3.44 3.22 3.05 2.92 2.82 2.73 2.66 2.60 2.50 2.42 2.30 2.22 2.13 2.04 1.98 1.90 1.86 1.80 1. 76 1.72
48 4.04 3.19 2.80 2.56 2.41 2.30 2.21 2.14 2.08 2.03 1.99 1. 96 1.90 1. 86 1.79 1. 74 1. 70 1.64 1.61 1.56 1.53 1.50 1.47 1.45
7.19 5.08 4.22 3.74 3.42 3.20 3.04 2.90 2.~ 2.71 2.64 2.58 2.48 2.40 2.28 2.20 2.11 2.02 1.96 1.88 1.84 1.78 1.73 1.70
50 4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13 2.07 2.02 1.98 1. 95 1.90 1.85 1. 78 1. 74 1.69 , .63 1.60 1.55 1.52 1.48 1.46 1.44
7.17 5.06 4.20 3.72 3.41 3.18 3.02 2.88 2.78 2.70 2.62 2.56 2.46 2.39 2.26 2.18 2.10 2.00 1.94 1.86 1.82 1. 76 1. 71 1.68
55 4.02 3.17 2.78 2.54 2.38 2.27 2.18 2.11 2.05 2.00 1. 97 1.93 1. 88 1.83 1. 76 1.72 1.67 1.61 1.58 1.52 1.50 1.46 1.43 1.41
7.12 5.01 4.16 3.68 3.37 3.15 2.98 2.85 2.75 2.66 2.59 2.53 2.43 2.35 2.23 2.15 2.06 1.96 1.90 1.82 1. 78 1.71 1.66 1.64

60 4.00 3.15 2.76 2.52 2.37 2.25 2.17 2.10 2.04 1.99 1.95 1.92 1.86 1.81 1. 75 1.70 1.65 1.59 1.56 1.50 1.48 1.44 1.41 1.39
7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.56 2.50 2.40 2.32 2.20 2.12 2.03 1.93 1.87 1.79 1.74 1.68 1.63 1.60
65 3.99 3.14 2.75 2.51 2.36 2.24 2.15 2.08 2.02 1.98 1.94 1.90 1.85 1.80 1.73 1.68 1.63 1.57 1.54 1.49 1.46 1.42 1.39 1.37
7.04 4.95 4.10 3.62 3.31 3.09 2.93 2.79 2.70 2.61 2.54 2.47 2.37 2.30 2.18 2.09 2.00 1.90 1.84 1.76 1. 71 1.64 1.60 1.56

70 3.98 3.13 2.74 2.50 2.35 2.32 2.14 2.07 2.01 1. 97 1.93 1.89 1.84 1.79 1.72 1.67 1.62 1.56 1.53 1.47 1.45 1.40 1.37 1.35
7.01 4.92 4.08 3.60 3.29 3.07 2.91 2.77 2.67 2.59 2.51 2.45 2.35 2.28 2.15 2.07 1.98 1.88 1.82 1.74 1.69 1.62 1.56 1.53
<;
~ 80 3.96 3.11 2.72 2.48 2.33 2.21 2.12 2.05 1.99 1.95 1.91 1.88 1.82 1.77 1.70 1.65 1.60 1.54 1.51 1.45 1.42 1.38 1.35 1.32
c: 6.96 4.88 4.04 3.56 3.25 3.04 2.87 2.74 2.64 2.55 2.48 2.41 2.32 2.24 2.11 2.03 1.94 1.84 1. 78 1.70 1.65 1.57 1.52 1.49
'E
0
~ 100 3.94 3.09 2.70 2.46 2.30 2.19 2.10 2.03 1.97 1.92 1.88 1.85 1.79 1.75 1.68 1.63 1.57 1.51 1.48 1.42 1.39 1.34 1.30 1.28
a; 6.90 4.82 3.98 3.51 3.20 2.99 2.82 2.19 2.59 2.51 2.43 2.36 2.26 2.19 2.06 1.98 1.89 1.79 1.73 1.64 1.59 1.51 1.46 1.43
c:
~ 125 3.92 3.07 2.68 2.44 2.29 2.17 2.08 2.01 1.95 1.90 1.86 1.83 1.77 1.72 1.65 1.60 1.55 1.49 1.45 1.39 1.36 1.31 1.27 1.25
. 6.84 4.78 3.94 3.47 3.17 2.95 2.79 2.65 2.56 2.47 2.40 2.33 2.23 2.15 2.03 1.94 1.85 1.75 1.68 1.59 1.54 1.46 1.40 1.37
"'"
.c
'-= 150 3.91 3.06 2.67 2.43 2.27 2.16 2.07 2.00 1.94 1.89 1.85 1.82 1.76 1. 71 1.64 1.59 1.54 1.47 1.44 1.37 1.34 1.29 1.25 1.22
'"
-0 6.81 4.75 3.91 3.44 3.13 2.92 2.76 2.62 2.53 2.44 2.37 2.30 2.20 2.12 2.00 1.91 1.83 1.72 1.66 1.56 1.51 1.43 1.37 1.33
8
~200 3.89 3.04 2.65 2.41 2.26 2.14 2.05 1.98 1.92 1.87 1.83 1.~ 1.74 1.69 1.62 1.57 1.52 1.45 1.42 1.35 1.32 1.26 1.22 1.19
i5 6.76 4.71 3.38 3.41 3.11 2.90 2.73 2.60 2.50 2.41 2.34 2.28 1.17 2.09 1.97 1.88 1.79 1.19 1.62 1.53 1.48 1.39 1.33 1.28
-l
400 3.86 3.02 2.62 2.39 2.23 2.12 2.03 1.91, 1.90 1.85 1.81 1.78 1.72 1.67 1.60 1.54 1.49 1.42 1.38 1.32 1.28 1.22 1. 16 1.13 :>
6.70 4.66 3.83 3.36 3.06 2.85 2.19 2.55 2.46 2.37 2.29 2.23 2.12 2.04 1.92 1.84 1.74 1.64 1.57 1.47 1.42 1.32 1.24 1.19 I:li

:>
1000 3.85 3.00 2.61 2.38 2.22 2.10 2.02 1.95 1.89 1.84 1.~ 1.76 1.70 1.65 1.58 1.53 1.47 1.41 1.36 1.30 1.26 1. 19 1.13 1.08 I:Il
6.66 4.62 3.80 3.34 3.04 2.82 2.66 2.53 2.43 2.34 2.26 2.20 2.09 2.01 1.89 1.81 1. 71 1.61 1.54 1.44 1.38 1. 28 1.19 1.11
ex. 3.84 2.99 2.60 2.37 2.21 2.09 2.01 1.94 1.88 1.83 1.79 1.75 1.69 1.64 1.57 1.52 1.46 1.40 1.35 1.28 1.24 1. 17 1.11 1.00 VJ
6.64 4.60 3.78 3.32 3.02 2.~ 2.64 2.51 2.41 2.32 2.24 2.18 2.07 1.99 1.87 1.79 1.19 1.59 1.52 1.41 1.36 1.25 1.15 1.00 -..I
-..I
Tabla n, Yo)
-.l
Valores criticos de F que corresponden al 2.5 % superior y al 2.5 % inferior de las distribuciones F 00

Una diferencia en las varianzas es significativa al nivel n = 0.05, con gil y gIl' si es igual 0 mayor que el valor superior en cad a casilia 0 si es igual 0 menor
que el valor inferior en esa casilla. Por ejemplo, si §i = 8.69, gl = 12 y §~ = 2.63, gl = 9, F = 3.30. Los valores criticos para gIll y gig son 0.291 y 3.87. tTl
Puesto que la F obtenida esta comprendida entre estos valores, no podemos rechazar la hipotesis de la homogeneidad de las varianzas. Nota: Si hubierarnos ~
calculado F con §1 en el denominador, los valores criticos inferior y superior para 9 y 12 gl habrian sido 0.259 y 3.44. ;I>
eJ\ 0
"(j'j'
91 2 3 4 5 6 7 8 9 10 11 12 15 20 24 30 40 50 60 100 200 500

...,
n
;I>
r.c'\") .002 .026 .057 .082 .100 .113 .124 .132 .139 .144 .149 .153 .161 .1W .175 .180 .184 .187 .189 .193 .196 .198 -e
'Vi 1 648 800 864 900 922 937 948 957 963 969 973 977 985 993 997 1000 1010 1010 1010 1010 1020 1020 ;I>

:0=

;I>

.001 .026 .062 .094 .119 .138 .153 .165 .175 .183 .190 .196 .210 .224 .232 .239 .247 .251 .255 .261 :266 .269 r­
;I>
2 38.5 39.0 39.2 39.2 39.3 39.3 39.4 39.4 39.4· 39.4 39.4 39.4 39.4 39.4 39.5 39.5 39.5 39.5 39.5' 39.5 39.5 39.5 tn
o

3
.001
17.4
.026
16.0
.065
15.4
.100
15.1
.129
14.9
.152
14.7
.170
14.6
.185
14.5
.197
14.5
.207
14.4
.216
14.4
.224
14.3
.241
14.3
.259
14.2
.269
14.1
.279
14.1
.289
14.0
.295
14.0
.299
14.0
.308
14.0
.314
13.9
.318

13.9 ~
;;
tn
.001 .026 .066 .104 .135 .161 .181 .198 .212 .224 .234 .243 .263 .284 .296 .308 .320 .327 .332 .342 .351 .356 tn
4 12.2 10.6 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84 8.79 8.75 8.66 8.56 8.51 8.46 8.41 8.38 8.36 8.32 8.29 8.27 o
o
.001 .025 .067 .107 .140 .167 .189 .208 .223 .236 .248 .257 .280 .304 .317 .330 .344 .353 .359 .370 .380 .386

sr­
5 10.0 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62 6.57 6.52 6.43 6.33 6.28 6.23 6.18 6.14 6.12 6.08 6.05 6.03
gJ

.001 .025 .068 .109 .143 .172 .195 .215 .231 .246 .258 .268 .293 .320 .334 .349 .364 .375 .381 .394 .405 .415

6 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46 5.41 5.37 5.27 5.17 5.12 5.07 5.01 4.98 4.96 4.92 4.88 4.86

.001 .025 .068 .110 .146 .176 .200 .221 .238 .253 .266 .277 .304 .333 .348 .364 .381 .392 .399 .413 .426 .433

7 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76 4.71 4.67 4.57 4.47 4.42 4.36 4.31 4.28 4.25 4.21 4.18 4.16

.001 .025 .069 .111 .148 .179 .204 .226 .244 .259 .273 .285 .313 .343 .360 .377 .395 .407 .415 .431 .442 .450

8 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30 4.24 4.20 4.10 4.00 3.95 3.89 3.84 3.81 3.78 3.74 3.70 3.68

.001 .025 .069 .112 .150 .181 .207 .230 .248 .265 .279 .291 '.320 .352 .370 .388 .408 .420 .428 .446 .459 .467

9 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96 3.91 3.87 3.77 3.67 3.61 3.56 3.51 3.47 3.45 3.40 3.37 3.35

.001 .025 .069 .113 .151 .183 .210 .233 .252 .269 .283 .296 .327 .360 .379 .398 .419 .431 .441 .459 .474 .483

10 6.94 5.46 4.B3 4.47 4.24 4.07 3.95 3.B5 3.7B 3.72 3.66 3.62 3.52 3.42 3.37 3.31 3.26 3.22 3.20 3.15 3.12 3.09

.001 .025 .069 .114 .152 .185 .212 .236 .256 .273 .288 .301 .332 .368 .386
.407 .429 .442 .450 .472 .485 .495

3.12 3.06 3.03 3.00 2.96 2.92 2.90


11 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53 3.47 3.43 3.33 3.23 3.17

.001 .025 .070 .114 .153 .186 .214 .238 .259 .276 .292 .305 .337 .374 .394
.416 .437 .450 .461 .481 .498 .508

2.96 2.91 2.87 2.85 2.80 2.76 2.74


12 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37 3.32 3.28 3.18 3.07 3.02

.433 .458 .474 . .485 .508 .526 .538

.001 .025 .070 .116 .156 .190 .219 .244 .265 .284 .300 .315 .349 .389 .410

2.64 2.59 2.55 2.52 2.47 2.44 2.41


15 6.20 4.76 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06 3.01 2.96 2.86 2.76 2.70

.456 .484 .503 .514 .541 .562 .575

.001 ,025 .071 .117 .158 .193 .224 .250 .273 .292 .310 .325 .363 .406 .430

2.35 2.29 2.25 2.22 2.17 2.13 2.10


20 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77 2.72 2.68 2.57 2.46 2.41

.498 .518 .531 .562 .585 .599

.001 .025 .071 .117 .159 .195 .227 .253 .277 .297 .315 .331 .370 .415 .441 .468

2.152.11 2.08' 2.02 1.98 1.95


24 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64 2.59 2.54 2.44 2.33 2.27 2.21

.482 .515 .535 .551 .585 .610 .625

.001 .025 .071 .118 .161 .197 .229 .257 .281 .302 .321 .337 .378 .426 .453

2.07 2.01 1.97 1.94 1.88 1.84 1.81


30 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51 2.46 2.41 2.31 2.20 2.14

.498 .533 .556


.573 .610 .641 .662

.001 .025 .071 .119 .162 .199 .232 .260 .285 .307 .327 .344 .387 .437 .466

1.80 1.74 1.69 1.66


40 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39 2.33 2.29 2.18 2.07 2.01 1.94 1.88 1.83 ...,
;I>
.581 .600 .641 .680 .704 I:ll
.001 .025 .071 .120 .163 .202 .235 .264 .290 .313 .333 .351 .396 .450 .481 .515 .555 t"'
1.60 1.54 1.51 ;I>
60 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27 2.22 2.17 2.06 1.94 1.88 1.82 1.74 1.70 1.67 tn

.536 .580 .611 .633


.684 .729 .762

.001 .025 .072 .120 .165 .204 .238 .268 .295 .318 .340 .359 .406 .464 .498
Yo)
1.69 1.61 1.56 1.53 1.45 1.39 1.34 -.l
120 5.15 3.80 3.23 2.89 2.67 2.52 2.39 2.30 2.22 2.16 2.10 2.05 1.95 1.82 1.76 \0
380 ESTADfSTICA PARA LAS CfENCIAS SOCIALES TABLAS 381

Tabla E Tabla F

Valores criticos de A Transforrnacion de r a z,

Para cualquier valor de N - I, la tabla indica los valores de A correspondientes a diferentes niveles de
probabilidad. A es significativa a un nivel dado si es igual 0 menor que el valor indicado en 1a tabla. r z r z r zr ­
r r
2
Ejemplo: si ID = 60, (ID)2 = 200, (1. = 0.05, prueba bilateral, y N - I = 28, A = 0.300. Puesto
que este valor no es igual 0 menor que 0.265, requerido para el rechazo de H 0' no pod emos rechazar la . .01 .010 .34 .354 .67 .811
hipotesis nula.
.02 .020 .35 .366 .68 .829
Nivel de significaci6n para una prueba unilateral
.03 .030 .36 .377 .69 .848
.05 .025 (
.01 .005 .0005 .04 .040 .37 .389 .70 .867
Nivel de significaci6n para una prueba bilateral
.05 .050 .38 ,400 .71 .887
N-I* .10 .05 .02 .01 .001 N-l* .06 .060 .39 .412 .72 .908
1 0,5125 0.5031 0.50049 0.50012 0.5000012 1
2 0.412 0.369 0.347 0.340 0.334 2
t .07 .070 .40 .424 .73 .929
3 0.385 0.324 0.286 0.272 0.254
4 0.376 0.304 0.257 0.238 0.211
3
4
.08 .080 .41 .436 .74 .950
5 0.372 0.293 0.240 0.218 0.184 _ 5 .09 .090 .42 .448 .75 .973
6 o.ao 0.286 0.230 0.205 0.167
7 0.369 0.281 0.222 0.196 0.155
6
7
.10 .100 .43 .460 .76 .996
8 0.368 \ 0.278 0.217 0.190 . 0.146 8 .11 .110 .44 .472 .77 1.020
9 0.368 0.276 0.213 0.185 0.139 9
10 0.368 0.274 0.210 0.181 0.134 10 .12 · 121 .45 .485 .78 1.045
11 0.368 0.273 0.207 0.178 0.130
12 0.368 0.271 0.205 0.176 0.126
11
12
.13 · 131 .46 .497 .79 1.071
13 0.368 0.270 0.204 0.174 0.124 13
14 0.368 0.270 0.202 0.172 0.121 14
.14 .141 .47 .510 .80 1.099
15 0.368 0.269 0.201 o.rn 0.119 15 .15 .48 .523 .81 1.127
· 151
16 0.368 0.268 0.200 0.169 0.117 16
17 0.368 0.268 0.199 0.168 0.116 17 .16 •161 .49 .536 .82 1.157
18 0.368 0.267 0.198 0.167 0.114 18
19 0.368 0.267 0.197 0.166 0.113 19 .17 .172 ;50 .549 .83 1. 188
20 0.368 0.266 0.197 0.165 0.112 20
.18 .181 .51 .563 .84 1.221
21 0.368 0.266 0.196 0.165 0.111 21
22 0.368 0.266 0.196 0.164 0.110 22 .19 .192 .52 .577 .85 1.256
23 0.368 0.266 0.195 0.163 0.109 23
24 0.368 0.265 0.195 0.163 0.108 24 .20 .203 .53 .590 .86 1.293
25 0.368 0.265 0.194 0.162 0.108 25
.21 .214 .54 .604 .87 1.333
26 0.368 0.265 0.194 0.162 0.107 26
27 0.368 0.265 0.193 0.161 0.107 27 .22 .224 .55 .618 .88 1.376
28 0.368 0.265 0.193 0.161 0.106 28
29 0.368 0.264 0.193 0.161 0.106 29 .23 .234 .56 .633 .89 1.422
30 0.368 0.264 0.193 0.18:> 0.105 30
.24 .245 .57 .648 .90 1.472
40 0.368 0.263 0.191 0.158 0.102 40
8:> 0.369 0.262 0.189 0.155 0.099 8:> .25 .256 .58 .663 .91 1.528
120 0.369 0.261 0.187 0.153 0.095 120
o: o.an 0.28:> 0.185 0:151 0.092 o: .26 .266 .59 .678 .92 1.589
..N = nurnero de parejas. .27 .277 .60 ..693 .93 1.658
.28 .288 .61 .709 .94 1.738
.29 .299 .62 .725 .95 1.832
.30 .309 .63 .741 .96 1.946
.31 .321 .64 .758 .97 2.092
.32 .332 .65 .775 .98 2.298
.33 .343 .66 .793 .99 2.647
382 ESTADiSTICA PARA LAS ClENCIAS SOCIALES TABLAS 383

TablaG
Tabla H
Valores criticos de rs
Funciones de r
Un valor dado der, esestadisticamente significativo si es igual 0 mayor que el
v~lor tabulado, de ac~e.rdo con el ?ivel ~ y a la N dada. Para interpolar, r .Jr ,2 ~ ~ 1 - ,2 ~ 100(1 -k) r

s~~ense los valor~s entices q~~ estan encima y debajo de la N de interes y k % Ef.
dividase por 2. As], el valor cnnco al nivel IX = 0.05, prueba bilateral, cuando
N = 21 es (0.450 + 0.428)/2 = 0.439. 1.00 1.0000 1.0000 O.COOO 0.0000 0.0000 0.0000 100.00 1.00
.99 .9950 .9801 .0995 .1000 .0199 .1411 85.89 .99
Nivel de significaci6n para una prueba unilateral .98 .9899 .9604 .1400 .1414 .0396 .1990 80.10 .98
.97 .9849 .9409 .1706 .1732 .0591 .2431 75.69 .97
.05 .025 .01 .005 .96 .9798 .9216 .1960 .2000 .0784 .2800 72.00 .96
Nivel de siqniflcacion para una prueba bilateral
.95 .9747 .9025 .2179 .2236 .0975 .3122 68.78 .95
N' .10 .05 .02 .01 .1164 .3412 65.88 .94
.94 .9695 .8836 .2375 .2449
.93 .9644 .8649 .2551 .2646 .1351 .3676 63.24 .93
5
6
.900
.829
1.000 1.000 -­ .92 .9592 .8464 .2713 .2828 .1536 .3919 60.81 .92
.886 .943 1.000 .91 .9539 .8281 .2862 .3000 .1719 .4146 58.54 .91
7 .714 .786 .893 .929
8 .643 .738 .833 .881 .4359 56.41 .90
.90 .9487 .8100 .3000 .3162 .1900
9 .600 .683 .783 .833 54.40 .89
.89 .9434 .7921 .3129 .3317 .2079 .4560
10 .564 .648 .746 .794 .4750 .88
.88 .9381 .7744 .3250 .3464 .2256 52.50
12 .506 .591 .712 .777 .87
.87 .9327 .7569 .3363 .3606 .2431 .4931 50.69
14 .456 .544 .645 .715 .86
.86 .9274 .7396 .3470 .3742 .2604 .5103 48.97
16 .425 .506 .601 .665
18 .399 .475 .564 .625 .2775 .5268 47.32 .85
20
22
.377 , .450 .534 .591
.85
.84
.9220
.9165
.7225
.7056
.3571
.3666
.3873
.4000 .2944 .5426 45.74 .84
.359 .428 .508 .562 .3111 .5578 44.22 .83
24 .83 .9110 .6889 .3756 .4123
.343 .409 .485 .537 .3276 .5724 42.76 .82
26 .82 .9055 .6724 .3842 .4243
.329 .392 .465 .515 .3923 .4359 .3439 .5864 41.36 .81
28 .81 .9000 .6561
.317 .377 .448 .496
30 .306 .364 .432 .478 .80 .8944 .6400 .4000 .4472 .3600 .6000 40.00 .80
.79 .8888 .6241 .4073 .4583 .3759 .6131 38.69 .79
• N = numero de parejas. .78 .8832 .6084 .4142 .4690 .3916 .6258 37.42 .78
.77 .8775 .5929 .4208 .4796 .4071 .6380 36.20 .77
.76 .8718 .5776 .4271 .4899 .4224 .6499 35.01 .76

.75 .8660 .5625 .4330 .5000 .4375 .6614 33.86 .75


.74 .8602 .5476 .4386 .5099 .4524 .6726 32.74 .74
.73 .8544 .5329 .4440 .5196 .4671 .6834 31.66 .73
.72 .8485 .5184 .4490 .5292 .4816 .6940 30.60 .72
.71 .8426 .5041 .4538 .5385 .4959 .7042 29.58 .71

.70 .8367 .4900 .4583 ,5477 .5100 .7141 28.59 .70


.69 .8307 .4761 .4625 .5568 .5239 .7238 27.62 .69
.68 .8246 .4624 .4665 .5657 .5376 .7332 26.68 .68
.67 .8185 .4489 .4702 .5745 .5511 .7424 25.76 .67
.66 .8124 .4356 .4737 .5831 .5644 .7513 24.87 .66

.65 .8062 .4225 .4770 .5916 .5775 .7599 24.01 .65


.64 .8000 .4096 .4800 .6000 .5904 .7684 23.16 .64
.63 .7937 .3969 .4828 .6083 .6031 .7766 22.34 .63
.62 .7874 .3844 .4854 .6164 .6156 .7846 21.54 .62
.61 .7810 .3721 .4877 .6245 .6279 .7924 20.76 .61

.60 .7746 .3600 .4899 .6325 .6400 .8000 20.00 .60


.59 .7681 .3481 .4918 .6403 .6519 .8074 19.26 .59
.58 .7616 .3364 .4936 .6481 .6636 .8146 18.54 .58
.57 .7550 .3249 .4951 .6557 .6751 .8216 17.84 .57
.56 .7483 .3136 .4964 .6633 .6864 .8285 17.15 .56

.55 .7416 .3025 .4975 .6708 .6975 .8352 16.48 .55


.54 .7348 .2916 .4984 .6782 .7084 .8417 15.83 .54
.53 .7280 .2809 .4991 .6856 .7191 .8480 15.20 .53
.52 .7211 .2704 .4996 .6928 .7296 .8542 14.58 .52
.51 .7141 .2601 .4999 .7000 .7399 .8602 13.98 .51

.50 .7071 .2500 .5000 .7071 .7500 .8660 13.40 .50


384 ESTADfsTICA PARA LAS CIENCIAS SOCIALES TABLAS 385

Tabla II
Tabla H (colltinuacion) Valores criticos de U y de U' para una prueba unilateral al nivel ex = 0.005 0 para una prueba

bilateral al nivel cx = 0.01.

r .fr ,2 ../, - ,2 ~ 1 - ,2 ~ 100(1 - k) r


Dados N I Y N 2, para que sea significativa: la U obtenida debe ser igual 0 menor que el valor indi­

cado en la tabla. La U' obtenida debe ser igual 0 mayor que el valor indicado en la tabla.
k % Ef. Ejemplo: Si cx = 0.01, prueba bilateral, N I = 13, N 2 = 15 Y se ha obtenido U = 150, no se
.50 .7071 .2500 .5000 .7071 .7500 .8660 13.40 .50 puede rechazar H o porque la U obtenida esta dentro de los valores criticos superior (153)
.49 .7000 .2401 .4999 .7141 .7599 .8717 12.83 .49 e inferior (42).
.48 .6928 . 2304 .4996 .7211 .7696 .8773 12.27 .48
.47
.46
.6856
.6782
.2209
.2116
.4991
.4984
.7280
.7348
.7791
.7884
.8827
.8879
11. 73
11.21
.47
.46 ~ I 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

1 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
.45 .6708 .2025 .4975 .7416 .7975 .8930 10.70 .45
.44 .6633 .1936 .4964 .7483 .8064 .8980 10.20 ,44
.43
.42
.6557
.6481
.1849
.1764
.4951
.4936
.7550
.7616
.8151
.8236
.9028
.9075
9.72
9.25
.43
.42
2 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 0 0
.41 .6403 .1681 .4918 .7681 .8319 .9121 8.79 .41 -38 -40
.40 .6325 .1600 .4899 .7746 .8400 .9165 8.35 .40 3 -- -- -- -- -- -- -- -- 0 0 0 1 1 1 2 2 2 2 3 3
.39 .6245 .1521 .4877 .7810 .8479 .9208 7.92 .39 27 ~ 33 35
-38 -41 -43 -46 -49 -52 54
- ­57
.38 .6164 .1444 .4854 .7874 .8556 .9250 7.50 .38
.37 .6083 .1369 .4828 .7937 .8631 .9290 7.10 .37 4 -- -- -- -- -- 0 0 1 1 2 2 3 3 4 5 5 6 6 7 8
.36 .6000 .1296 .4800 .8000 .8704 .9330 6.70 .36 ~ 28 31 ~ -38 42
- -45 -49 52
-
55
-59 -62 -66 -69 ­ 72
.35 .5916 .1225 .4770 .8062
.8124
.8775 .9367
.9404
6.33 .35
.34
5 -- -- -- -- 0 1 I 2 3 4 5 6 7 7 8 9 10 11 12 13
.34
.33
.5831
.5745
.1156
.1089
.4737
.4702 .8185
.8844
.8911 .9440
5.96
5.60 .33 -25 -29 34
-
38
- -42 -46
50
- -54 -58 -63 -67 -71 75
- -79 -83 -87
.32 .5657 .1024 .4665 .8246 .8976 .9474 5.25 .32
.31 .5568 .0961 .4625 .8307 .9039 .9507 4.93 .31 6 -- -- -- 0 1 2 3 4 5 6 7 9 10 11 12 13 15 16 17 18
-24 -29 -34 -39 -44 -49 54
- -
59
-63 -68 -73 -78 -83 87
- -92 -97 -102
.30 .5477 .0900 .4583 .8367 .9100 .9539 4.61 .30
.29 .5385 .0841 .4538 .8426 .9159 .9570 4.30 .29 7 -- -- -- 0 1 3 4 6 7 9 10 12 13 15 16 18 19 21 22 24
.28 .5292 .0784 .4490 .8485 .9216 .9600 4.00 .28 -28 -34 -39 45
- -50 -56 -61 67
- -72 -78 -83 89
- -94 100 105 -111
- -116
.27 .5196 .0729 .4440 .8544 .9271 .9629 3.71 .27
.26 .5099 .0676 .4386 .8602 .9324 .9656 3.44 .26 8 -- -- -- I 2 4 6 7 9 II 13 15 17 18
94
20 22 24 26 28 30
106 112 118 -124 -130
.0625 .4330 .8660 .9375 .9682 3.18 .25 -31 -38 -44 -50 -57 -63 69
- -75
81
- -87 - -100 - -
.25 .5000
.24
.23
.4899
.4796
.0576
.0529
.4271
.4208
.8718
.8775
.9424
.9471
.9708
.9732
2.92
2.68
.24
.23
9 -- -- 0 1 3 5 7 9 11 13 16 18 20 22
97 104
24 27 29 31
111 117 124 131
33 36
138 144
.22 .4690 .0484. .4142 .8832 .9516 .9755 2.45 .22
27 35 42
- - - -49 -56 -63 -70' -77 -83 -90 - - - - - -
.21 .4583 .0441 .4073 .8888 .9559 .9777 2.23 .21
10 -- -- 0 2 4 6 9 11 13 16 18 21 24 26 29
151 158
31 34 37 39 42
.20 .4472 .0400 .4000 .8944 .9600 .9798 2.02 .20 -30 -38 -46 -54 -61 -69 -77 -84 -92 -99 -106 -114 -121 -129 -136 -143 - -
.19 .4359 .0361 .3923 .9000 .9639 .9818 1.82 .19
.18 .4243 .0324 .3842 .9055 .9676 .9837 1.63 .18 11 -- -- 0 2 5 7 10 13 16 18 21 24 27 30 33 36 39 42 45 48
132 140 148 156 -164 -172
.17 .4123 .0289 .3756 .9110 .9711 .9854 1.46 .17
.16
33 42 50
- - - 59
- 67
- 75
- -83 -92 -100 -108 -116 124
- - - - -
.16 .4000 .0256 .3666 .9165 .9744 .9871 1. 29
12 -- -- 3 6
I 9 12 15 18 21 24 27 31 34 37 41 44 47 51 54
169 -177 186
.15
.14
.3873
.3742
.0225
.0196
.3571
.3470
.9220
.9274
.9775
.9804
.9887
.9902
1. 13
.98
.15
.14
35 45 54
- - 63
- -72 -81 -90
143 151
-99 -108 -117 -125 -134 - - -160 - -
.0169 .3363 .9327 .9831 .9915 .85 .13
.13
.12
.3606
.3464 .0144 .3250 .9381 .9856 .9928 .72 .12 13 -- -- I 3 7 10 13 17 20 24 27 31 34 38
125 -125 144
42 45 49 53 56 60
153 163 172 -181 -191 -200
.11 .3317 .0121 .3129 .9434 .9879 .9939 .61 .11
38 49 58
- - - -68 -78 -87 -97 -106 -116 - - - -

.10 .3162 .0100 .3000 .9487 .9900 .9950 .50 .10 '14 -- -- I 4 7 11 15 18 22 26 30 34 38 42 46 50 54 58 63 67
.09 .3000 .0081 .2862 .9539 .9919 .9959 .41 .09 41 52 63 73 83 94 104 114 124
- -
134 144 -154
- - - 164 174
-- -184 -194 203
-
213
-
.08 .2828 .0064 .2713 .9592 .9936 .9968 .32 .08
.07 .2646 .0049 .2551 .9644 .9951. .9975 .25 .07 15 -- -- 2 5 8 12 16 20 24 29 33 37 42 46
153 164
51 55 60 64 69 73
174 185 -195 206 216 227
.06 .2449 .0036 .2375 .9695 .9964 .9982 .18 .06
-43 -55 -67 -78 -89 -100 111 121 132
- - -143 - - - -
.05 .2236 .0025 .2179 .9747 .9975 .9987 .13 .05 16 -- -- 2 5 9 13 18 22 27 31 36 41 45 50 55 60 65 70 74 79
.04 .2000 .0016
.0009
.1960 .9798
.9849
.9984
.9991
.9992
.9995
.08
.05
.04
.03 -46 -59 -71 -83 -94 -106 -117 -129 140
-
196 207 218
-151 -163 -174 -185 - - - 230
- -241
.03 .1732 .1706
.0004 .1400 .9899 .9996 .9998 .02 .02
.02 .1414
.0001 .0995 .9950 .9999 .9999 .01 .01 17 -- -- 2 6 10 15 19 24 29 34 39 44 49 54 60 65 70 75 81 86
.01 .1000
-49 -62 -75 -87
100 112 124 148 148
- - - - -160 -172 -184 -195 207
- -219 -231 -242 -254
.00 .0000 .0000 .0000 1.0000 1.0000 1.0000 .00 .00
18 -- -- 2 6 11 16 21 26 31 37 42 47 53
218
58 64 70 75 81 87 92
231 -243 ­ 255 268
-52 66 79
- - -92 105
-118 -131 -143 -156 -169 -181 -194 -206 - - -
19 -- 0 3 7 12 17 22 28 33 39 45 51
151 164 177
56 63
191 203
69 74 81 87 93 99
216 230 242 -255 ­ 268 281
38 54 69 83
- - - - 97
- -111 -124 -138 - - - - - - -
20 -- 0 3 8 13 18 24 30 36 42 48 54 60 67 73 79 86 99 105 92
116 130 144 158 172 186 200 ~ 227 241 -254 -268 281 -295
-40 57
-72 87 102
- - - - - - -
TAB LAS 387
386 ESTADfSTICA PARA LAS CIENCIAS SOCIALES

Tabla 12
Tabla 13

Valores criticos de U y de U' para una prueba unilateral al nivel IX = 0.01 0 para una prueba Valores criticos de U y U' para una prueba unilateral al nivel IX = 0.025 0 para una prueba
bilateral al nivel x = 0.02. bilateral al nivel IX = 0.05.

Dados N 1 Y N 2, para que sea significativa: la U obtenida debe ser igual 0 menor que el valor Dados N, y N 2
, para que sea significativa: la U obtenida debe ser igual 0 menor que el valor

indicado en la tabla. La U' obtenida debe ser igual 0 mayor que eJ valor indicado en la tabla.
indicado en la tabla. La U' obtenida debe ser igual 0 mayor que el valor indicado en la tabla.

~
N, 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
~
N, 1 2 3
4 5 6 7 8 9 10 11 12 13 14 IS 16 17 18 19 20

-- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
I
-- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 1

2
-- -- -- -- -- -- -- -- .- -- -- -- 0 0 0 0 0 0 1
2
-- -- -- -- -- -- -- 0 0 0 0 1 1 I 1 1 2 2 2 2

26 28 30 32 34 36 37
I
39

16 lB
- -20 -22 23
- -25 -27 -29 31
-
32
-
34
- -36 -
38

- - - - - - -
7 7 8

3
-- -- -- -- -- -- 0 0 I 1 1 2 2 2 3 3 4 4 4 5

3
-- -- -- -- 0 I 1 2 2
3 3 4 4 5 5 6 6
52

21 24 26 29 32 34 37 40 42 45 47 50 52
55 .
15
-17 20
- 22
- 25
- -27 30
- -32 -35 ­ 37 -40 42
-
45
- -47 -50 ­
- - - - - - - - - - - - - ­ I

4
-- -- -- -.. 0 I 1 2 3 3 4 5 5 6 7 7 8 9 9
4
-- -- -- I 0 ! 1 2 3 4 4 5 6
7 8 9 10 11 11 12 13
63
\ 3

33 40
10
I\ - 16 ,'19
-
22
- 25
-
28
-32 35
- -38 -41 44
-
47
- -50 -53 57
- ­
60
- ­ 67

20
-
23
-,
27
-
30
- --
37
- - 43
- 47
- 50
-
53
- 57
- ~ 63
-
67
- ­ 70

-"
-,

13 14 15 17 18 \9 20
5
_. -- -- 0 I 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

5
-- -- 0 1 2 3 5 6 7 8
9 11 12
72 76 80

20 24 28 32 36 40 44 48 52 56 60 64 68 72 76 80 84

15
- 19
- -23 -27 -30 34
-
38
-
42
- -46 -49 53
-
57
- -61 65
- -68 - ­
- - - - - - - - - - - - - - - -
17 19 21 22 24 25 27

6
-- -- -- 1 2 3 4 6 7 8 9 . 11
12 13 15 \6 18 19 20 22
6
-- -- I 2 3 5 6 8 10 11 13 14 16
62 67 71 75 80 84 89 93

31 I~-~ 44 49 53 58
23 28 38 42 47 52 -17 22 -27 - - - - - - - - - - - ­
- - ;£ - - - - -57 --61 66 71
-
75
- 80
- 84
- 89
- 94
- - 93

7 -- -- 0 1 3 4 6 7 9 11 12 14 16 17 19 21 23 24 26 28
7
-- -- I 3 5 6
_41
B 10 12 14 16 18 20 22
76
24
81
26
-86
28
91
30
96
32
101
-106

34

2\ 27 32 38 43 49
- 54 59 65 70 75 81 86 91 96 102 107 112
-20 -25 -30 36 46 51
- -56 -61 -66 -71 - - - - -
- - - - - - - - - - - - - - - - t/7'>{-\ 19 22 24 26
29 3\ 34 36 3B 41

8
-- -- 0 2 4 6 7 9 11 13 15 17 20 22 24 26 28 30 32 34
8
-- 0 2 4 6 81i111O(P13
\~
15 17
91
-97 -102 -108 111 119

24 30 36
- 42 49 55 61 67 73 79 84 90 96 102 108 \ 14 120 126
.. 16 22
- 28 34
- 40 \' '46' 1{)51
\'\~;~~~t- -63 69
- -74 -80 -
86
- ­
- - - - - - - - - - - - - - - - - - -
20 23
26 28 31 34 37 39 42 45 48

9 -- -- I 3 5 7 9 II 14 16 18 21 23 26 28 31 33 36 38 40
9
-- 0 2 4 7 10 12" 15 17
126
26 33 40 47 54 61 67 74 81 87 94 100 107 113 \20 126 133 140
18
-25 51
-32 -38 -44 - -57 64
- -70 -76 -82 -89 -95 -
101 107
-
114
-
120
- -132

- - - - - - - - - - - - - - - - - - -
55

10 -- -- I 3 6 8 11 .13 16 19 22 24 ?7 30 33 36 38 41 47

44 10 -- 0 3 5 8 11 14 17 20 23 26 29
33 36 39 42
118
45
125
48
132
52
138 145

29
- 37
-
44
- 52
-
59
-
67
-- 74
- -- 81 88
-
96
- 103
-
110
- 117 124
-- -
132
-
139
- -146 -153

20
- -
27 35
- 42
- 49
-
56
- -63 70
- 77
- - 84 91
- -97 104
- -111 - -
- -
30 33
37 40 44 47 51 55 58 62

11 -- .- 1 4 7 9 12 15 18 i2 25 28 31 34 37 41 44 47 50 53
11 -- 0 3 6 9 13 16 19 23 26
121 136 143 151 158

40 81 22
- -30 38
- 46
- 53
- - 61
- 69 76
-
84 91
- -99 106
-
114
- - -129 - - - ­
32
- - -48 57
-
65
-
73
- _.
88
- 96
-
104
- 112
-- 120
- -
128 135
- -
143 151
- 159 167

-
37 41
45 49 53 57 61 65 69

12 -" -- 2 5 8 II 14 17 21 24 28 31 35 38 42 46 49 53 56 60
12 -- I 4 7 11 14 18 22 26 29 33
34 43 52 61 70 79 87 96 \04 113 121 130 138 146 155 163 180
23 32
-
41
- 49
- 58
- 66
-74 82
-91 -99
107
-
115 -123 131
-
139 147
- -155 -163 -171

- - - - - - - - - -- - - - - - -
172
- - 63 67 72 76

13 -- 0 2 5 9 12 16 20 23 27 31 35 39 43 47 51 55 59 63 67
13 -- I 4 8 12 16 20 24 28
89
33
97
37
41
106 \15
45
124
50
132
54
141
59
149 158 167 -175 184

26
-
37
-
47
-
56
-
66
- 75
- 84
-
94
-
103
-
112
-- 121
-
130
-
139
- 148 157
-
166
-
175
-
184 193

- -
25
- - 35
-44 -53 -62 71
- -80 - - - - - - - - - -
40
45 50 55 59 64 67 74 78 83

14 -- 0 2 6 10 13 17 22 26 30 34 38 43 47 51 56 60 65 69 73
14 -- I 5 9 13 17 22 26 31 36
151 -160 171 178 188 197

104 114 123 -132 -14\


28
-
40 50
- - 60
-
71
- 81
- 90
- 100 110
- -
120
-
130
- 139
-
149
-
159 168
- - -
178 187
- - 197 207
-27 -37 -47
51
-67 -76 -86 -95 - - - - - - ­
44 49 54 59 64 70 75 80 85 90

15 -- 0 3 7 11 15 19 24 28 33 37 42 47 51 56 61 66 70 75 80
15 -­ I 5 10 14 19 24 29 34 39
30 42 53 64 75 86 96 107 117 128 138 148 159 169 179 189 200 210 220

81
-29 -40 -50 -61 -71 -
121 131
-91 -101 -111 - - 141 151 161 170
- - - - -
180
-190 -200 -210

16 --
-
0
-
3 7
- -
12
-

16
-
21 26
- --
31
-

36
-
41 46 51
- -
56
. -
61
-

66 71
- -

76
-
B2 87

-
16 -- I 6 11 15 21 26 31
97
37
107
42 47
118 -129
53
139
59 64
70 75
149 -160 -\70 -181
81
.!2.!. -202
86 92
212
98

222

32
- -45 -57 68 80 91 102
-
113 124 135 ~ -157
-
168
-
179 190 -201
- uz ­ 222 233
-31 -42 -53 ~ -75 -86 - - ­
45 51 57 63
67 75 81 87 93 99 105

17 -- 0 4 8 13 18 23 28 33 38 4449 55 60 66 71 77 82 88 93
17 -- 2 6 11 17 22 28 34 39
147 158 -17\ 180 191 202 213 224 235

32 45 57 68 80 9\ 102 114 125 136 - - - - -


34 47 60 72 84 96 108 120 132 143 155 166 178 189 201 212 224 234 247
-
- - - - - - - -
- - - - - - - - - - - - - - - - - - -
93 99 106 112

18 -- 0 4 9 14 19 24 30 36 41 47 53 59 65 70 76 82 88 94 \00
18 -- 2 7 12 18
24 30 36 42 48 55 61 67 74 80 86
36 50 63 76 89 102 114 126 139 15\ 163 175 187 200 212 224 236 248 260

-
34
-47 60
-
72 84
- - 96
- 108
- -
120 132
- -
143
-
155 167
-
178 190 202 213
- - - -
225
-
236
- ­248

- - - - - - - - - - - - - - - - - - -
106 113 119

19 -- I 4 9 15 20 26 32 38 44 50 56 63 69 75 82 88 94 101 107
19 -- 2 7 13 19 25 32
101
38
114
45
126
52
138
58
151
65
163
72
175
78
188
85
92
200 -212
99
224 236 248 261

37 53 67 80 94 107 120 133 146 159 172 184 197 210 272 235 248 260 273
36 50 63 76 89
- - - - -
- - - - ­
- - - - - - - - - - - - - - - - - - - - - - - - - -
119 127

20 -- I 5 10 16 22 28 34 40 47 53 60 67 73 80 87 93 100 107 114


20 -- 2 8 13 20 27
34 41 48 55 62 69 76 83 90 98 105 112
273

39
- 55
- 70
- 84 98
- - 112
- 126
-
140
-
153 167
- --
180
-
193 207
-
220 233
- -
247
-
260
- -
273 286
38
-
52
- 67
- -80
-93 -106 -
119 \32
-
145
-
158
-
171
- -
184 197 -210
- -
222
-235 -248 -261 ­
(Los gulones en el cuerpo de la tab\a indican la imposibilidad de tomar una decisi6n al nivel de significaci6n indlcado.]
(Los quionas en 81 cuerpo de la tabla indican la imposibilidad de tamar una decisi6n al nival de significaci6n indicado.)
TABLAS 389
388 ESTADfsTICA PARA LAS CIENCIAS SOCIALES

Tabla 14
Tabla J
Valores criticos de U y de U' para una prueba unilateral al nivel C( = 0.05 0 para una prueba Valores criticos de T
bilateral al nivel C( = 0.1O. El simbolo T representa la surna men or de rangos asociados con diferencias que tienen todas el mis~o
Dados N 1 Y N 2, para que sea significativa: la U obtenida debe ser igual 0 menor que el valor rango. Para cualquier N dado (mirnero de diferencias ordenadas de acuerdo a su rango), la T obtenida
indicado en la tabla. La U' obtenida debe ser igual 0 mayor que el valor indicado en la tabla.
es significativa a un nivel dado si es igual 0 rnenor que el valor indicado en la tabla. Todas las entradas
de la tabla se refieren al valor absoluto de T.

~1
N, I 2 3 4 5 6 7 8 9 10 II 12 13 14 15 16 17 18 19 20

Nlvet de significaci on para una prueba unilateral


Nlvel de significacior. para una prueba unilateral
1 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- a a
-19 -20
.05 .025 .01 .005
f-­
.05 .025 .01 l .005

2
-- -- -- -- a a a I 1 1 1 2 2 2 3 3 3 4 4 4
Nive\ de slqnificacion para una prueba bilateral
Nivel de siqnificaclon para una prueba bilateral
10
- -12 14
- -15 17
-19 -21 -22 -24 26
- -27 -29 31
-
32
- 34
- -
36

.05 .02 .01 ,V .10


.05 .02 .01
N .10

3
-- -- a a I 2 2 3 3 4 5 5. 6 7 7 8 9 9 10 II

~ -12 -14 16
-
19
-
21
-
24
-
26 28
-
31
-33 35
- 38
-
40
-
42
- 45
-
47
- ­ 49
5
a -- -- -- 28
130
116
101
91

6
2
0
-- -- 29
140
126
110
100

4
-- -- a I 2 3 4 5 6 7 8 9 10 II 12 14 15 16 17 18

2
0
-- 30
151
137
120
109

21 42 7
3

-12 -15 -18 - 24


-
27
- 30
- 33
- 36
- 39
- -
45
- 48
-
50
- 53
- 56
-
59
-
62

-
3
1
a 31
163
147
130
118

8
5

140
128

5
-- a I 2 4 5 6 8 9 II 12 13 15 16 18 19 20 22 23 25

9
8
5
3
1
32
175
159

10 14 18 21 29 32 36 39 43 47 50 54 57 61 65 68 72 75

- - - - 25
- - - - - - - - - - - - - - 10
10

- 8 5
3
33
187
170
151
138

200
182
162
148

6
-- a 2 3 5 7 8 10 12 14 16 17 19 21 23 25 26 28 30 32
11
13
10
7
5
34

12 16 21 25 29 34 38 42 46 50 55 59 63 67 71 76 "80 84 88
213
195
173
159

- - - - \- - - - - - - - - - ­ 12
17
13
9
7
35

227
208
185
171

36

7
-- a 2 4 6 8 11 13 15 17 19 21 24 26 28 30 33 35 37 39
13
21
17
12
9

-n
14 19 24 29 34 38 43 48 53 58 63 67 77 82 86 91 96 101
241
221
198
182

- - - - - - - - - - - - - - - - - - 14
25
21
15
12
37

235
211
194

19
15
38
256

8
-- I 3 5 8 10 13 15 18 20 23 26 28 31 33 36 39 41 44 47
15
30
25

249
224
207

-ss 39
271

-60
15 21 27 32 38 43 49 54 76 81 87 92 97 103 113

- - - - - - - 70
- - - - - 108
- - 16
35
29
23
19

40
286
264
238
220

17
41
34
27
23

9
-- I 3 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54

41
302
279
252
233

32
27

17
- 24
- 30
- 36 42
-
48
- 54
- -60 -66 72
- 78
- 84
- -90 96
- 102
-
108
- 114
-
120
-
126

- 18
47
40

42
319
294
266
247

19
53
46
37
32

10
-- I 4 7 II 14 17 20 24 27 31 34 37 41 44 48 51 55 58 62

52
43
37
43
336
310
281
261

20
60

19
-
26
-
33
-
39
-- - 46 53
- -60 -66 73
-
79
- 86
-
93
- 99
- 106
- 112
-
119
-
125
-
132
-
138

- 49
42
44
353
327
296
276

21
67
58

11
-- 5 8 12 16 19 23 27 31 34 38 42 46 50 54 57 61 65 69
371
343
312
291

I 65
55
48
45

22
75

21
- 28
- 36
-
43
- 50
- 58
- -es 72
- 79
- 87
- 94
-
101
-
108 115
-
122
-
130
-
137
-
144
-
151

- 23
83
73
62
54
46
389
361
328
307

407
378
345
322

12
-- 2 5 9 13 17 21 26 30 34 38 42 47 51 55 60 64 68 72 77
24
91
81
69
61
47

39 47 55 70 78 86 94 102 109 117 125 132 140 148 156 163


339

22
-
31
- - - - 63
- - - - - - - - - - - 25
100
89
76
68
48
426
396
362

355

49
446
415
379

13
-- 2 6 10 15 19 24 28 33 37 42 47 51 56 61 es 70 75 80 84
26
110
98
84
75

24 33 42 50 59 67 76 84 93 101 109 118 126 134 143 151 159 167 176
466
434
397
373

83
50

- - - - - - - - - - - - - - - 27
119
107
92

14
-- 2 7 II 16 21 26 31 36 41 46 51 56 61 66 71 77 82 87 92

[Podran encontrarse pequeiias discrepancias entre los valores criticos que aparecen en la tabla
-26 -35 -45 -54 -63 72
- -81 90
- -99 -108 -117 126
-
135
-
144
-
153
-
161
-
170
- -179 -188
anterior y los que figuran en la tabla 2 de la revision de 1964 del trabajo titulado Some Rapid

15
-- 3 7 12 18 23 28 33 39 44 50 55 61 66 72 77 83 88 94 100
Approximate Statistical Procedures, de F. Wilcoxon y N. A. Wilcox (Nueva.York: Lederle L,a.borat?­
-27 38
- -48 57
- -67 -77 -87 -96 -106 -115 125
-
134
-
144
-
153 163
-
172
-
182
- -191 -200
ries). La discrepancia refleja la tendencia actual de estos aut ores de seleccionar el valor entice mas
cercano a un nivel de significacion dado, sobrepasando ocasionalmente ese nivel. Por ejemplo, para
16 -- 3 8 14 19 25 30 36 42 48 54 60 os '71 77 83 89 95 101 107

29 92 193 213

- -40 -50 -61 -71 -82 - -102 112


-
122
-
132
-
143
- -153 163
-
173
-
183
- -
203
- - N = 8.
17
-- 3 9 15 20 26 33 39 45 51 57 64 70 77 83 89 96 102 109 115

la probabilidad de una T de 3 = 0.0390 (prueba bilateral),


42 es 193 214
-31 - -53 -
76 86
- 97
- 108
-
119
-
130
-
140
-
151
-
161 172
-
183
- -
204
- -
225

-
y

18
-- 4 9 16 22 28 35 41 48 55 61 68 75 82 88 95 102 109 116 123

la probabilidad de una T de 4 = 0.0546 (prueba bilateral).


32 45 56 68 80 91 103 114 123 137 148 159 170 182 193 204 215 226 237

- - - - - - - - - - - - - - - - -
Wilcoxon y Wilcox seleccionan una T de 4 como. valor critico al nivel de significacion de 0.05 (prueba
19
a 4 10 17 23 30 37 44 51 58 os n 80 87 94 101 109 116 123 130

19 34 47 59 72 84 96 108 120 132 144 156 167 179 191 203 214 226 238 250
bilateral), mientras que la tabla J refleja una actitud mas conservadora indicando una T de 3 como
- - - - - - - - - - - - - - - - - -
valor critico a este nivel.]
20
0 4 II 18 25 32 39 47 54 62 69 77 84 92 100 107 115 123 130 138

20 36 49 62 75 88 101 113 126 138 151 163 176 188 200 213 225 237 250 262

- - - - - - - - - - - - - - - - - - -
(Los guiones en el cuerpo de la tabla indican la imposibilidad de tamar una decision al nivel de siqnificacion indicado.)
390 ESTADISTICA PARA LAS CIENCIAS SOCIALES
TAB LAS 391

Tabla K

Tabla M
Factoriales de los numeros del I al 20

Valores criticos de x 0 de N - x (el que sea mayor) a los nive1es 0.05 y 0.01,

N Nl cuando P = Q = l

xes la lrecuencia en la categoria P, y N - x es la lrecuencia en la categoria Q.

0 1
La x, 0 la N - x, obtenida debe ser iqual a mayor que el valor indicado para

1
1
que sea significative al nivel escogido. Los guiones indican que es imposible
2
2

3
6
tomar una decision para N al nivel rx dado.
4
24

PRUEBA UNILATERAL PRUEBA BILATERAL


5
120
N 0.05 001 005 0.01
6
720

7
5040
5 5

8
40320

9
6 6 6

362880

7 7 7 7

10
3628800
8 7 8 8

11
39916800
9 8 9

12
9 8
479001600

13
6227020800
10 9 10 9 10

14
87178291200
11 9 10 10 11

12 10 11 10 11

15
1307674368000

16
20922789888000
13 10 12 11 12

17
355687428096000
14 11 12 12 13

18
6402373705728000
15 12 13 12 13

19
121645100408832000
14 13 14

16 12
20
2432902008176640000
17 13 14 13 15

18 13 15 14 15

19 14 15 15 16

20 15 16 15 17

21 15 17 16 17

22 16 17 17 18

23 16 18 17 19

24 17 19 18 19

25 18 19 18 20

Tabla L 26 18 20 19 20

Coeficientes binomiales 27 19 20 20 21

28 19 21 20 22

N (~) (~) (~) (~) (~) (~) (~) (~) (~) (~) (~) 29 20 22 21 22

30 20 22 21 23

0 1
31 21 23 22 24

1
1 1
24 23 24

2
32 22
1 2 1

3
1 3 3 1
33 22 24 23 25

4
1 4 6 4 1
34 23 25 24 25

35 23 25 24 26

5
1 5 10 10 5 1

6
1 6 15 36 24 26 25 27

20 15 6 1

7
1 7 21 35 35 21 7 1
37 24 27 25 27

8
1 8 28 56 70 56 28 8 1
38 25 27 26 28

9
1 9 36 84 126 126 84 • 36 9 1
28 27 28

39 26
10
1 10 45 120 210 252 210 40 26 28 27 29

120 45 10
1

11
1 11 55 165 330 462 462 330 165 55 11
41 27 29 28 30

12
1 12 66 220 495 792 924 792 495 220 66
42 27 29 28 30

13
1 13 78 286 715 1287 1716 1716 1287 715 286

14
1 14 91 43 28 30 29 31

364 1001 2002 3003 3432 3003 2002 1001

44 28 31 29 31

15
1 15 105 455 1365 3003 5005 6435 6435 5005 3003
45 29 31 30 32

16
1 16 120 560 1820 4368 B008 11440 12870 11440 8008
32 31 33

17
1 136 46 30
17 6BO 2380 6188 12376 19448 24310 24310 19448

18
1 18 153 816 3060 8568 18564 31824 43758 47 30 32 31 33

48620 43758

19
1 19 171 969 3876 11628 27132 50388 75582 92378 92378
48 31 33 32 34

49 31 34 32 35

20
1 20 190 1140 4845 15504 38760 77520 125970 167960 184756
50 32 34 33 35

392 ESTADfSTICA PARA LAS CIENCIAS SOCIALES TABLAS 393

Uso de la tabla N
Esta tabla fue preparada para facilitar la torna de decision cuando se manejan
poblaciones binomiales en las que P +- Q. Ejemplo: Un investigador efectuo doce
repeticiones independientes del mismo estudio, usando a = 0.01. Cuatro de estos
estudios resultaron estadisticamente significativos. ~Es este resultado (cuatro casos
significativos entre doce) estadisticarnente significativo en si mismo, 0 esta dentro de
10 que cabe esperar por accion del azar? En la columna encabezada por .01, y frente a
N = 12, hallamos que dos 0 mas diferencias significativas al nivel a = .01 es por si
mismo significativo al nivel a = .01. Asi, el investigador puede llegar a la conclusion
de que los resultados generales de su investigacion justifican el rechazo de H o-

Tabla N
Valores criticos de x al nivel a: = 0.05 (tipc claro) y a: = 0.01 (tipo oscuro) con diferentes valores de P y Q y
para N desde 2 hasta 49.
Un valor dado de x es significativo a un nivel a: dado si es igual 0 mayor que el valor critico indicado en la
tabla. Todos los valores presentados son unilaterales. Puesto que la binomial no es simetrica cuando
P f Q 0/= t, no hay una forma sencilla de obtener valores bilaterales.

N P
Q
.01
.99
.0'
.98
.03
.97
.04
.96
.05
.95
.06
.94
.07 .08
.93 .9'
.09
.9'
.10
.90
.11
.89
.,
.88
. .13 .'4
.87
.86
.'5
.85
.16
.84
.17 .'8
.83 .8'
.19
.8'
.z0
.80
.z,
.79
...
.78
.z3
.77
.'4
.76
.z5
.75

.z6 .z7
.74 .73
.'8
.7'
.'9 .30
.71 .70
.31
.69
.3'
.68
.33
.67
.34 .35
.66 .65
.36
.64
.37 .38 .39 .40
.63 .6' .6' .60
.4'
.59
.4' .43 .44
.58 .57 .56
.45
.55
.46
.54
.47 .48
.53 .5'
.49 .50

.51 .50

1 1 2 2 2 2 2 2 2

1 2 2 2 2 2 2 2 2

1 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3

3 ­
2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3

1 2 2 2 2 2 2 2 2 3 3 3 4 4 4 4 4 4

3 3 3 3 3 3 3 3 3 3 3 3 4

2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 4 4 4

3 3 4 4 4 4 4 4 4 4 4 4 4

1 2 2 2 2 2 2 3 3 4 4 4 4 4 4 4 4 4 5 5 5

3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4

2 2 2 3
3 3 3 3 3 3 4 4 5 5 5 5 5 5 5 5 5 5 5 5

4 4 4 4 4 4 4 4 4 4 5 5 5

2 2 2 2 2 2 3 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 6 6 6 6 6

3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 5 5

2 2 3 3 3 3 3 5 5 5 5 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6

3 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5

2 2 2 2 2 3 3 5 5 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6 6 6 6 6 6 7 7 7

3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 5 5
5

2 2 3 3 3 3 4
6 6 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7

3 4 4 4 4 4 4 5 5 5 5 5 5 6 6 6 6 6

2 2 5 5 5 6 6 6 6 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 7 7

2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 5 5 5 5 5 5

3 6 6 6 6 7 7 7 7 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8

2 3 3 3 3 4 4 4 4 4 4 5 5 5 5 5 5 5 6
6 6 6 6 6

2 2 6 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 7 7 8 8 8 8 8 8

2 2 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5
5

9
7 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 8 8 9 9 9 9 9

2 3 3 3 3 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6

2 2 2 3 3 6 6 6 6 6 7 7 7 7 7 7 7 7 7 8 8 8 8 8 B B B 8 B 9

3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6

10 7 7 7 7 8 8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 9 9 9 10

2 3 3 3 4 4 4 4 4 5 5 5 5 5 5 6 6 6 6 6 6 7 7 7 7

6 6 7 7 7 7 7 7 7 B 8 B B B B 8 B B 9 9 9 9 9 9 9

2 2 2 3 3 3 3 4 4 4 4 4 4 5 5 5 5 5 5 6 6 6 6 6 6

11
7 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 9 10 10 10 10 10 10 10 10

2 3 3 3 4 4 4 4 5 5 5 5 5 6 6 6 6
6 6 7 7 7 7 7 7

7 7 7 7 7 7 B B B B B B B B 9 9 9 9 9 9 9 9 10 10 10

2 2 2 3 3 3 3 4 4 4 4 5 5 5 5 5 5 6 6 6 6 6
6 7

12
8 8 8 8 8 9 9 9 9 9 9 9 10 10 10 10 10 10 10 10 10 11 11 11 11

2 3 3 4 4 4 4 5 5 5 5 6 6 6 • 6 6 7 7 7 7 7 7 8 8

7 7 7 B B B 8 B B B 9 9 9 9 9 9 9 10 10 10 10 10 10 10 10

2 2 3 3 3 3 4 4 4 4 4 5 5 5 5 6 6 6 6 6 6 7 7 7

13 8 8 9 9 9 9 9 9 10 10 10 10 10 10 10 10 11 11 11 11 11 11 11 11 12

2 3 3 4 4 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 8 8 8 8

7 B 8 B B 8 B 9 9 9 9 9 9 9 10 10 10 10 10 10 11 11 11 11 11

2 2 3 3 3 3 4 4 4
4 5 5 5 5 6 6 6 6 6 7 7 7 7 7

14 9 9 9 9 9 10 10 10 10 10 10 10 11 11 11 11 11 11 11 12 12 12 12 12 12

2 3 3 4 4 4 5 5 5 5 6 6 6 7 7 7 7 7 8 8 8 8 8 9

8 8 8 8 9 9 9 9 9 9 10 10 10 10 10 10 10 11 11 11 11 11 11 12 12

2 2 3 3 3 4 4 4 5 5 5 5 6 6 6 6 6 7
7 7 7 8

15 9 9 9 10 10 10 10 10 10 11 11 11 11 11 11 12 12 12 12 12 12 12 13 13 13

2 3 3 4 4 5 5 5 6 6 6 7 7 7 7 8 8 8 8
9 9 9

394 ESTADfSTICA PARA LAS CIENCIAS SOCIALES TABLAS 395

Tabla N (colltilluacioll)
.06 .07 .08 .09 .10 .11 ,12 .13 .14 .ts .16 .17 .18 .19 .20
.21 .22 .23 .24 .25
.26 .27 .28 .29 .30 .31 .32 .33 ,34 .35 .36 .37 .38 .39 .40 .41 .42 .43 .44 .45 .46 .47 .48 .49 .50

.94 .93 .92 .91 .90 .89 .88. .87 .86 .85
.84 .83 .82 .81 .80
.79 .78 .77 .76 .75
.14 .73 .72 .71 .70 .69 .68 .67 .66 .65 .64 .63 .62 .61 .60 .59 .58 .57 .56 .55 .54 .53 .52 .51 .50

2 2 3 3 3 4 4 4 5
55566
16 6 6 7 7 7
7 7 8 8 8
88999 9 9 9 10 10 10 10 10 10 " 11 11 11 1, 11 12 12 12 12 12

3 3 4 4 4 5
5 6 6 6 6 7 7 7
7 8 8 8 8
89999
9 10 10 10 10 10 11 11 11 11 11 11 12 12 12 12 12 12 13 13 13 14 14 14 14

2 2 3 3 4 4
4 4 5 5 5 5 666
17 6 7 7 7 7 7 8 888
8 9 999 9 10 10 10 10 10 11 11 11 11 11 12 12 12 12 12 12 13 13 13

3 3 4 4 4 5 5 5 6 6 6 7 777 88889
9 9 9 9 10
10 10 10 10 11 11 11 11 11 12 12 12 12 12 13 13 13 13 13 13 14 14 14 14 14

2 2 3 3 4 4 4 5 5 5 5 6 6 6 6
18 7 7 7 8
8 8 8 8 9
9 9 9 9 10 10 10 10 10 11 11 11 11 11 12 12 12 12 12 13 13 13 13 13 13

3 3 4 4 5 5 5
6 6 6 77778
8 8 8 9 9
9 9 10 10 10
10 10 11 11 11 11 12 12 12 12 12 13 13 13 13 13 13 14 14 14 14 14 14 15 15

2 3 3 3 4 4 4
5 5 5 6 6 6 6 7

19 7 7 7 8 8 8 8 9 9 9
9 9 10 10 10 10 10 11 11 11 11 12 12 12 12 12 13 13 13 13 13 13 14 14 14

3 3 4 4 5 5 5
6 6 6 7 7 788 88999
9 10 10 10 10
11 11 11 11 12 12 12 12 12 13 13 13 13 13 14 ·14 14 14 14 15 15 15 15 15 15

2 3 3 3 4 4 4 5 5 5 6 6 7 7
20 7 7 8 8 8 8 9 9 9 9
10 10 10 10 10 11 11 11 11 12 12 12 12 12 13 13 13 13 13 14 14 14 14 14 15

3 3 4 4 5 5 6 6 6 7 7 7 888 8 9 9 9 9
10 10 10 10 11
11 11 11 12 12 12 12 13 13 13 13 14 14 14 14 14 15 15 15 15 15 16 16 16 16

2 3 3 3
4 4 5 5 5 6 6 6 6 7 7
21 7 8 8 8 8
9 9 9 9 10
10 10 10 11 11 11 11 12 12 12 12 12 13 13 13 13 14 14 14 14 14 15 15 15 15

3 3
4 4 5 5 6 6 6 7 7 7 8 8 8 9 9 9 10 10
10 10 11 11 11
11 12 12 12 12 13 13 13 13 14 14 14 14 14 15 15 15 15 16 16 16 16 16 17 17

2 3 3 4 4 4 5 5 5 6
6 6 7 7 7
22 8 8 8 8 9 9 9 9 10 10
10 10 11 11 11 11 12 12 12 12 13 13 13 13 14 14 14 14 15 15 15 15 15 16 16

3 3 4 5 5 5 6 6 7 7 7 8 8 8
9 9 9 10 10 10 10 11 11 11 11
12 12 12 13 13 13 13 14 14 14 14 15 15 15 15 15 16 16 16 16 17 17 17 17 17

2 3 3 4 4 4
5 5 6 6 6 6 7 7 7
23 88899
9 9 10 10 10
11 11 11 11 12 12 12 12 13 13 13 13 14 14 14 14 15 15 15 15 16 16 16 16 .16

3
4 4 5 5 6 6 6 7 7 7 8 8 9 9
9 9 10 10 10 11 11 11 12 12
12 12 13 13 13 13 14 14 14 15 15 15 15 15 16 16 16 16 17 17 17 17 18 18 18

2
3 3 4 4 5 5 5 6 6 6 7 7 7 8

24 88999 9 10 10 10 11
11 11 11 12 12 12 13 13 13 13 14 14 14 14 15 15 15 15 16 16 16 16 17 17 17

3 4 4 5 5 6 6 7 7
7 8 8 8 9 9 9 10 10 10 11 11 11 12 12 12
13 13 13 13 14 14 14 14 15 15 15 15 16 16 16 16 17 17 17 17 18 18 18 18 19

25
2 3 3 4 4
5 5 5 6 6 6 7 7 8 8 8 8 9 9 9 10 10 10 11 11
11 12 12 12 12 13 13 13 13 14 14 14 15 15 15 15 16 16 16 16
3 17 17 17 17 18

4 4 5 5 6 6 7 7 7 8 8 9 9 9
10 10 10 11 11 11 12 12 12 13
13 13 13 14 14 14 15 15 15 15 16 16 16 17 17 17 17 18 18 18 18 19 19 19 19

2
3 3 4 4 5 5 6 6 6 7 7 7 8 8

26 8 9 9 9 10 10 10 11 11 11
12 12 12 12 13 13 13 14 14 14 14 15 15 15 16 16 16 16 17 17 17 17 18 18 18

3 4 4 5 5 6 6 7 7
8 8 8 9 9 10 10 10 11 11 11 12 12 12 13 13
13 14 14 14 14 15 15 15 16 16 16 16 17 17 17 18 18 18 18 19 19 19 19 20 20

2 3 3 4 4 5 5 6 6 6 7 7 8 8
8
27 9 9 9 10 10 10 11 11 11 12
12 12 12 13 13 13 14 14 14 15 15 15 15 16 16 16 17 17 17 17 18 18 18 18 19

3 4 4 5 6 6 6
7 7 8 8 9 9 9 10
10 11 11 11 12 12 12 13 13 13
14 14 14 15 15 15 15 16 16 16 17 17 17 18 18 18 18 19 19 19 19 20 20 20 20

2 3 4 4 4 5 5
6 6 7 7 7 8 8 8

28 9 9 10 10 10 11 11 11 12 12
12 13 13 13 13 14 14 14 15 15 15 16 16 16 16 17 17 17 18 18 18 18 19 19 19

3 4 4 5 6 6 7 7 8 8 8 9 9 10 10 10 11 11 12 12 12 13 13 13 14
14 14 15 15 15 16 16 16 17 17 17 17 18 18 18 19 19 19 19 20 20 20 21 21 21

2 3 4 4 5 5 5 6 6 7 7 8 8 8
9
29 9 9 10 10 10 11 11 12 12 12
13 13 13 14 14 14 14 15 15 15 16 16 16 17 17 17 18 18 18 18 19 19 19 20 20

3 4 5 5 6 6 7
7 8 8 9 9 9 10 10 11 11 11 12 12 13 13 13 14 14
14 15 15 15 16 16 16 17 17 17 18 18 18 19 19 19 19 20 20 20 21 21 21 21 22

2 3 4 4
5 5 6 6 6 7 7 8 8 8 9

30 9 10 10 10 11 11 11 12 12 13
13 13 14 14 14 15 15 15 16 16 16 17 17 17 17 18 18 18 19 19 19 20 20 20 20

3 4 5 5 6 6 7 7 8 8
9 9 10 10 10 11 11 12 12 12 13 13 14 14
14
15 15 15 16 16 16 17 17 17 18 18 18 19 19 19 20 20 20 21 21 21 21 22 22 22

2 3 4 4 5 5 6 6 7 7 7 8 8 9 9

31 9 10 10 11 11 11 12 12 12 13
13 14 14 14 15 15 15 16 16 16 17 17 17 18 18 18 19 19 19 20 20 20 20 21 21

3 4 5 5 6
6 7 7 8 8 9 9 10 10 11 11 12 12 12 13 13 14 14 14 15
15 15 16 16 16 17 17 17 18 18 19 19 19 19 20 20 20 21 21 21 22 22 22 23 23

2 3 4 4 5 5
6 6 7 7 8 8 899
32 10 10 10 11 11 12 12 12 13 13
14 14 14 15 15 15 16 16 16 17 17 17 18 18 18 19 19 19 20 20 20 21 21 21 22

3 4 5 5 6 7 7
8 8 9 9 10 10 10 11
11 12 12 13 13 13 14 14 15 15
15 16 16 16 17 17 18 18 18 19 19 19 20 20 20 21 21 21 22 22 22 22 23 23 24

2 3 4 4 5 5 6 6 7 7 8 8 9 9 9
10
33 10 11 11 12 12 12 13 13 13
14 14 15 15 15 16 16 16 17 17 17 18 18 19 19 19 20 20 20 21 21 21 22 22 22

3 4 5 5 6 7 7 8 8
9 9 10 10 11 11 12 12 12 13 13 14 14 15 15 15
16 16 16 17 17 18 18 18 19 19 19 20 20 20 21 21 21 22 22 22 23 23 23 24 24

2 3 4 4 5 6 6 7 7 7 8 8 9 9
10
34 10 11 11 11 12 12 13 13 13 14
14 15 15 15 16 16 16 17 17 18 18 18 19 19 19 20 20 20 21 21 21 22 22 22 23

3 4 5 6 6 7 7
8 8 9 9 10 10 11 11
12 12 13 13 14 14 14 15 15 16
16 16 17 17 17 18 18 19 19 20 20 20 21 21 21 22 22 22 23 23 23 24 24 24 25

2 3 4 5
6 6 6 7 7 8 8 9 9 9 10

35 10 11 11 12 12 12 13 13 14 14
14 15 15 16 16 16 17 17 18 18 18 19 19 19 20 20 21 21 21 22 22 22 23 23 23

3 4 5 6 6 7 7 8 9 9 10 10 11 11 12
12 13 13 13 14 14 15 15 16 16
16 17 17 18 18 18 19 19 20 20 20 21 21 21 22 22 23 23 23 24 24 24 25 25 25

3 3 4 5 5 6 6 7 7 8
8 9 9 10 10
36 11 11 11 12 12 13 13 14 14 14
15 15 16 16 16 17 17 18 18 18 19 19 20 20' 20 21 21 21 22 22 22 23 23 24 24

3 4 5 6 6 7 8 8 9 9 10 10 11 11 12 12 13 13 14 14
15 15 15 16 16
17 17 18 18 18 19 19 20 20 20 21 21 22 22 22 23 23 23 24 24 25 25 25 26 26

3 3 4 5 5
6 6 7 7 8 8 9 9 10 10
37 11 11 12 12 13 13 13 14 14 15
15 16 16 16 17 17 18 18 18 19 19 20 20 20 21 21 22 22 22 23 23 23 24 24 24

3 4 5 6 6 7 8 8 9 9 10 11 11 12 12 • 13 13 13 14 14 15 15 16 16 17
17 18 18 18 19 19 20 20 20 21 21 22 22 22 23 23 24 24 24 25 25 25 26 26 27

396 ESTADfsTlCA PARA LAS CIENClAS SOCl~LES TABLAS 397

Tabla N (colltilluacioll)
p .01 .02 .03 .04 .05 .06 .07 .08 .09 .10 .11 .40 .41 .42 .43 .44 .45 .46 .47 .48 .49 .50
N Q .12 .13 .14 .15 .16 .17 .18 .19 .20 .21 .22 .23 .24 .25 .26 .27 .28 .29 .30 .31 .32 .33 .34 .35 .36 .37 .38 .39
.99 .98 .97 .96 .95 .94 .93 .92 .91 .90 .89 .88 .87 .86 .85 .84 .83 .82 .66 .65 .64 .63 .62 .61 .60 .59 .58 .57 .56 .55 .54 .53 .52 .51 .50
.81 .80 .79 .78 .77 .76 .75 .74 .73 .72 .71 .70 .69 .68 .67

3 5 5 6 6 7 B B 9 9 10 24 25
3B
3 6
10 10 11 11 12 12 13 13 14 14 15 15 15 16 16 17 17 1B ts 1B 19 19 20 20 20 21 21 22 22 22 23 23 24 24 25

7 7 8 8 9 10 10 11 11 12 12 13 13 14 14 15 21
22 22 23 23 23 24 24 24 25 25 26 26 26 27 27

15 16 16 17 17 17 18 18 19 19 20 20 20 21
3 3 4 5 5 6 6 7 B B 9
9 10 10 11 11 12 12 22 22 22 23 23 24 24 24 25 25 26

39 13 13 14 14 14 15 15 16 16 17 17 17 1B 1B 19 19 20 20 20 21 21
3 4 5 6 7 7 8 9 9 10 10 11 11 12 12 13 13 14 24 25 25 25 26 26 27 27 27 28

14 15 15 16 16 17 17 18 18 19 19 20
20 20 21 21 22 22 23 23 23 24
3 3 4 5 5 6 7 7 8 B
9 9 10 10 11 11 12 12 22 23 23 23 24 24 25 25 25 26 26
40 13 13 14 14 15 15 16 16 17 17 17 1B 1B 19 19 20 20 20 21 21 22
3 4 5 6 7 7 8 9 9 10 10 11 12 12 13 13 14 14 25 26 26 26 27 27 28 28 28
15 15 16 16 17 17 18 18 19 19 20 20 20 21 21 22 22 23 23 23 24 24 25
3 3 4 5 6 6 7 7 B B 9 10 10 11 11 12 12 13 23 23 24 24 25 25 26 26 26 27
41 13 14 14 15 15 15 16 16 17 17 1B 1B 19 19 20 20 20 21 21 22 22 23
3 4 5 6 7 8 8 9 9 10 11 11 12 12 13 13 14 14 15 16 24 24 25 25 26 26 26 27 27 28 28 28 29
16 17 17 18 18 18 19 19 20 20 21 21 22 22 23 23 23

3 4 4 5 6
6 7 7 B 9 9 10 10 I 11 11 12 24 24 25 25 26 26 26 27 27
42 12 13 13 14 14 15 15 16 16 17 17 lB 1B 19 19 19 20 20 21 21 22 22 23 23 23
3 4 5 6 7 8 B 9 10 10 11 11 12 12 13 14 14 25 26 26 27 27 27 28 28 29 29 29
15 15 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 23 24 24 25
3 4 4 5 6 6 7 B B 9 9 10 10 11 11 12 13 13 24 25 26 26 27 27 27 2B
43 14 14 15 15 16 16 17 17 1B 1B 1B 19 19 20 20 21 21 22 22 23 23 24 24 25
3 5 5 6 7 8 8 9 10 10 11 12 12 13 13 14 14 28 28 2B 29 29 30 30
15 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 23 24 24 25 25 26 26 27 27
3 4 4 5 6 6 7 B 8 9 9 10 11 11 12 12 27 27 2B 28 28
44 13 13 14 14 15 15 16 16 17 17 18 1B 19 19 20 20 21 21 22 22 23 23 24 24 24 25 25 26 26
3 5 5 6 7 8 9 9 10 11 11 12 12 13 14 14 15 28 29 29 30 30 31
15 16 16 17 17 18 18 19 19 20 21 21 21 22 22 23 23 24 24 25 25 26 26 27 27 28 28
3 4 4 5 6 7 7 B 8 9 10 10 11 11 12 12 13 13 25 26 27 27 28 28 29 29
45 14 15 15 16 16 17 17 lB 18 19 19 20 20 21 21 22 22 23 23 24 24 24 25 26
4 5 6 6 7 8 9 9 10 11 11 12 13 13 14 14 15 15 28 28 29 29 29 30 30 31 31
16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 24 24 25 25 26 26 27 27
3 4 4 5 6 7 B 9 9 10 10 11 11 12 13 13 14 26 26 27 27 2B 28 29 29 30
46 14 15 15 16 16 17 17 1B 18 19 20 20 21 21 22 22 22 23 23 24 24 25 25
4 5 6 6 7 9 9 10 11 11 12 13 13 14 15 15 16 27 28 28 29 29 30 30 30 31 31 32
16 17 17 18 19 19 20 20 21 21 22 22 23 23 24 24 25
25 26 26 27
3 4 5 5 6
'{ 7 8 9 9 10 10 11 12 12 13 13 14 15 24 24 25 25 26 26 27 27 28 28 29 29 30 30
47 15 16 16 17 17 1B 18 19 19 20 20 21 21 22 22 23 23
4 5 6 7 7 8 9 10 10 11 12 12 13 14 14 15 15 29 29 30 30 31 31 31 32 32
16 17 17 18 18 19 19 20 21 21 22 22 23 23 24 24 25 25 26 26 27 27 2B 28
3 4 5 5 6 7 7 B 9 9 10 11 11 12 12 13 14 14 15 26 26 27 27 28 28 29 29 30 30 31
4B 15 16 16 17 1B 1B 19 19 20 20 21 21 22 22 23 23 24 24 25 25
4 5 6 7 7 B 9 10 10 11 12 12 13 14 14 15 16 16 17 27 28 29 29 30 30 31 31 32 32 33 33
17 18 19 19 20 20 21 21 22 22 23 24 J4 25 25 26 26 27 28
3 4 5 5 6 7 8 8 9 10 10 11 11 12 13 13 14 14 27 28 28 29 29 30 30 31 31
49 15 16 16 17 17 18 18 19 19 20 21 21 22 22 23 23 24 24 25 25 26 26 27
4 5 6 7 B 8 9 10 11 11 12 13 13 14 15 15 16 16 30 30 31 31 32 32 33 33 34
17 18 18 19 19 20 21 21 22 22 23 23 24 24 25 26 26 27 27 28 28 29 29
398 ESTADfSTICA PARA LAS CIENCIAS SOCIALES TABLAS 399

Tabla 0
Tabla P
Puntos porcentuales del rango studentizado Cuadrados, rafces cuadradas y reciprocos de los numeros enteros comprendidos entre I y lOOO.

k - numero de medias a numero de pasos entre medias ordenadas N N2 .IN lIN N N2 IN lIN N N2 iN lIN
Error
gl a 2 3 4 5 6 1 1.0000 1.000000 61 3721 7.8102 .016393 121 14641 11.0000 .00826446
7 8 9 10 11 1
2 4 1.4142 .500000 62 3844 7.8740 .016129 122 14884 11.0454 .00819672
5 .05 3.64 4.60 5.22 5.67 6.03 6.33 6.58 3 9 1.7321 .333333 63 3969 7.9373 .015873 123 15129 11.0905 .00813008
6.80 6.99 7.17
.01 5.70 6.98 7.80 8.42 8.91 9.32 9.67 9.97 4 16 2.0000 .250000 64 4096 8.0000 .015625 124 15376 11.1355 .00800452
10.24 10.48
6 .05 3.46 4.34 5 25 2.2361 .200000 65 4225 8.0623 .015385 125 15625 11.1803 .00800000
4.90 5.30 5.63 5.90 6.12 6.32 6.49 6.65
.01 5.24 6.33 7.03 7.56 7.97 8.32 8.61 8.87 9.10 9.30 6 36 2.4495 .166667 66 4356 8.1240 .015152 126 15876 11.2250 .00793651
7 .05 3.34 4.16 4.68 5.06 5.36 5.61 5.82 7 49 2.6458 .142857 67 4489 8.1854 .014925 127 16129 11.2694 .00787402
.01 6.00 6.16 6.30
4.95 5.92 6.54 7.01 7.37 7.68 7.94 8.17 8 64 2.8284 .125000 68 4624 8.2462 .014706 128 16384 11.3137 .00781250
8.37 8.55
8 .05 3.26 4.04 9 81 3.0000 .111111 69 4761 8.3066 .014493 129 16641 11.3578 .00775194
4.53 4.89 5.17 5.40 5.60 5.77 5.92 6.05 10 100 3.1623 .100000 70 4900 8.3666 .014286 130 16900 11.4018 .00769231
.01 4.75 5.64 6.20 6.62 6.96 7.24 7.47 7.68 7.86 8.03
9 .05 3.20 3.95 4.41 4.76 5.02 5.24 5.43 5.59 11 121 3.3166 .090909 71 5041 8.4261 .014085 131 17161 11.4455 .00763359
.01 5.74 5.87 5184 8.4853 .013889 132 17424 11.4891 .00757576
4.60 5.43 5.96 6.35 6.66 6.91 7.13 7.33 7.49 12 144 3.4641 .083333 72
7.65 169 .076923 73 5329 8.5440 .013699 133 17689 11.5326 .00751880
10 .05 3.15 3.88 13 3.6056
4.33 4.65 4.91 5.12 5.30 5.46 5.60 5.72 14 196 3.7417 .071429 74 5476 8.6023 .013514 134 17956 11.5758 .00746269
.01 4.48 5.27 5.77 6.14 6.43 6.67 6.87 7.05 18225 11.6190 .00740741
7.21 7.36 15 225 3.8730 .066667 75 5625 8.6603 .013333 135
11 .05 3.11 3.82 4.26 4.57 4.82 5.03 5.20 5.35
.01 5.49 5.61 16­ 256 4.0000 .062500 76 5776 8.7178 .013158 136 18496 11.6619 .00735294
4.39 5.15 5.62 5.97 6.25 6.48 6.67 6.84 6.99 7.13 17 289 4.1231 .058824 77 5929 8.7750 .012987 137 18769 11.7047 .00729927
12 .05 3.08 3.77" 4.20 4.51 4.75 4.95 5.12 5.27 18 324 4.2426 .055556 78 6084 8.8318 :012821 138 19044 11.7473 .00724638
5.39 5.51
.01 4.32 5.05 . 5.50 5.84 6.10 6.32 6.51 6.67 6.81 19 361 4.3589 .052632 79 6241 8.8882 .012658 139 19321 11. 7898 .00719424
6.94
13 .05 3.06 3~73 4.15 4.45 4.69 20 400 4.4721 .05ODOO 80 6400 8.9443 .012500 140 19600 11.8322 .00714286
4.88 5.05 5. \9 5.32 5.43
.01 4.26 4.96 5.40 5.73 5.98 6.19 6.37 6.53 6.67 6.79 21 441 4.5826 .047619 81 6561 9.0000 .012346 141 19881 11.8743 .00709220
14 .05 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13 22 484 4.6904 .045455 82 6724 9.0554 .012195 142 20164 11.9164 .00704225
5.25 5.36
.01 4.21 4.89 5.32 5.63 5.88 6.08 6.26 6.41 6.54 23 529 4.7958 .043478 83 6889 9.1104 .012048 143 20449 11.9583 .00699301
6.66
15 .05 3.01 3.67 24 576 4.8990 .041667 84 7056 9.1652 .011905 144 20736 12.0000 .00694444
4.08 4.37 4.59 4.78 4.94 5.08 5.20 5.31 145 12.0416 .00689655
.01 4.17 4.84 25 625 5.0000 .040000 85 7225 9.2195 .011765 21025
5.25 5.56 5.80 5.99 6.16 6.31 6.44 6.55
16 .05 3.00 3.65 4.05 4.33 4.56 4.74 4.90 5.03 5.15 26 676 5.0990 .038462 86 7396 9.2736 .011628 146 21316 12.0830 .00684932
.01 5.26 .037037 .011494 147 21609 12.1244 .00680272
4.13 4.79 5.19 5.49 5.72 5.92 6.08 6.22 6.35 6.46 27 729 5.1962 87 7569 9.3274
17 .05 28 784 5.2915 .035714 88 7744 9.3808 .011364 148 21904 12.1655 .00675676
2.98 3.63 4.02 4.30 4.52 4.70 4.86 4.99 5.11 5.21 29 841 .034483 89 7921 9.4340 .011236 149 22201 12.2066 .00671141
.01 4.10 4.74 5.3852
5.14 5.43 5.66 5.85 6.01 6.15 6.27 6.38 30 900 5.4772 .033333 90 8100 9.4868 .011111 150 22500 12.2474 .00666667
18 .05 2.97 3.61 4.00 4.28 4.49 4.67 4.82 4.96 5.07 5.17 31 961 5.5678 .032258 91 8281 9.5394 .010989 151 22801 12.2882 .00662252
.01 4.07 4.70 5.09 5.38 5.60 5.79 5.94 6.08 6.20 6.31 32 1024 5.6569 .031250 92 8464 9.5917 .010870 152 23104 12.3288 .00657895
19 .05 2.96 3.59 3.98 4.25 4.47 4.65 4.79 4.92 5.04 5.14 1089 5.7446 .030303 93 8649 9.6437 .010753 153 23409 12.3693 .00653595
.01 33
4.05 4.67 5.05 5.33 5.55 5.73 5.89 6.02 6.14 6.25 34 1156 5.8310 .029412 94 8836 9.6954 .010638 154 23716 12.4097 .00649351
20 .05 2.95 3.58 3.96 4.23 4.45 4.62 4.77 35 1225 5.9161 .028571 95 9025 9.7468 .010526 155 24025 12.4499 .00645161
4.90 5.01 5.11
.01 4.02 . 4.64 5.02 5.29 5.51 5.69 5.84 5.97 6.09 6.19 36 1296 6.0000 .027778 96 9216 9.7980 .010417 156 24336 12.4900 .00641026
24 .05 2.92
U~
,3.90 4.17 4.37 4.54 4.68 4.81 4.92 5.01 37 1369 6.0828 .027027 97 9409 9.8489 .010309 157 24649 12.5300 .00636943
.01 3.96 4.91 5.17 5.37 5.54 5.69 5.81 5.92 6.02 38 1444 6.1644 .026316 98 9604 9.8995 .010204 158 24964 12.5698 .00632911
3D .05 2.89 3.49' 3.85 4.10 39 1521 6.2450 .025641 99 9801 9.9499 .010101 159 25281 12.6095 .00628931
4.30 4.46 4.60 4.72 4.82 4.92 .025000 25600 12.6491 .00625000
.01 3.89 4.45 , 4.80 5.05 5.24 5.40 40 1600 6.3246 100 10000 10.0000 .010000 160
5.54 5.65 5.76 5.85
40 .05 2.86 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.73 4.82 41 1681 6.4031 .024390 101 10201 10.0499 ,00990099 161 25921 12.6886 .00621118.
.01 3.82 4.37 4.70 4.93 5.11 5.26 5.39 5.50 5.60 5.69 42 1764 6.4807 .023810 102 10404 10.0995 .00980392 162 26244 12.7279 .00617284
60 .05 43 1849 6.5574 .023256 103 10609 10.1489 .00970874 163 26569 12.7671 .00613497
2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65 4.73 .022727 12.8062 .00609756
.01 3.76 4.28 44 1936 6.6332 104 10816 10.1980 .00961538 164 26896
4.59 4.82 4.99 5.13 5.25 5.36 5.45 5.53 2025 .022222 105 11025 10.2470 .00952381 165 27225 12.8452 .00606061
45 6.7082
120 .05 2.80 3.36 3.68 3.92 4.10 4.24 4.36 4.47 4.56 4.64
.01 3.70 4.20 4.50 4.71 4.87 5.01 5.12 5.21 46 2116 6.7823 .021739 106 11236 10.2956 .00943396 166 27556 12.8841 .00602410
5.30 5.37 .00934579 27889 12.9228 .00598802
47 2209 6.8557 .021277 107 11449 10.3441 167
.05 2.77 3.31 3.63 3.86 4.03 4.17 4.29 4.39 4.47 4.55 .020833 108 11664 10.3923 .00925926 168 28224 12.9615 .00595238
00

.01 48 2304 6.9282


3.64 4.12 4.40 4.60 4.76 4.88 4.99 5.08 5.16 5.23 49 .020408 109 11881 10.4403 .00917431 169 28561 13.0000 .00591716
2401 7.0000
50 2500 7.0711 .020000 110 12100 10.4881 .00909091 170 28900 13.0384 .00588235
51 2601 7.1414 .019608 111 12321 10.5357 .00900901 171 29241 13.0767 .00584795
52 2704 7.2111 .019231 112 12544 10.5830 .00892857 172 29584 13.1149 .00581395
53 2809 7.2801 .018868 113 12769 10.6301 .00884956 173 29929 13.1529 .00578035
54 2916 7.3485 .018519 114 12996 10.6771 .00877193 174 30276 13.1909 .00574713
55 3025 7.4162 .018182 115 13225 10.7238 .00869565 175 30625 13.2288 .00571429
56 3136 7.4833 .017857 116 13456 10.7703 .00862069 176 30976 13.2665 .00568182
57 3249 7.5498 .017544 117 13689 10.8167 .00854701 177 31329 13.3041 .00564972
58 3364 7.6158 .017241 118 13924 10.8628 .00847458 178 31684 13.3417 .00561798
59 3481 7.6811 .016949 119 14161 10.9087 .00840336 179 32041 13.3191 .00558659
60 3600 7.7460 .016667 120 14400 10.9545 .00833333 180 32400 13.4164 .00555556
400 ESTADfSTlCA PARA LAS CfENCIAS SOCIALES
TABLAS 401

Tabla P (continuacion)

..
Ta bla P (con ti!/luaClon)

N N2 -..IN 1/N N N2 ,IN 1/N N N2 .IN 1/N N N 2 ,.IN 1/N N N2 .IN 1/N N N2 -iN 1/N
181 32761 13.4536 .00552486 241 58081 15.5242 .00414938 301 90601 17.3494
182 33124 13.4907 .00549451 242 58564 15.5563 .00332226 361 130321 19.0000 .00277008 421 177241 20.5183 .00237530 481 231361 21.9317 .00207900
183 33489 .00413223 302 91204 17.3781 .00331126
13.5277 .00546448 243 59049 15.5885 .00411523 362 131044 19.0263 .00276243 422 178084 20.5426 .00236967 482 232324 21. 9545 .00207469
184 33856 J3.5647 303 91809 17.4069 .00330033 233289 21.9773 .00207039
.00543478 244 59536 15.6205 .00409836 363 131769 19.0526 .00275482 423 178929 20.5670 .00236407 483
185 34225 13.6015 304 92416 17.4356 .00328047 20.5913 .00235849 484 234256 22.0000 .00206612
.00540541 245 60025 15.6525 .00408163 305 364 132496 19.0788 .00274725 424 179776
93025 17.4642 .00328947 19.1050 .00273973 425 180625 20.6155 .00235294 485 235225 22.0227 .00206186
365 133225
186 34596 13.6382 .00537634 246 60516 15.6844
187 .00406504 306 93636 17.4929 .00326797
34969 13.6748 .00534759 247 61009 15.7162 366 133956 19.1311 .00273224 426 181476 20.6398 .00234742 486 236196 22.0454 .00205761
188 .00404858 307 94249 17.5214 .00325733
35344 13.7113 .00531915 248 61504 15.7480 367 134689 19.1572 .00272480 427 182329 20.6640 .00234192 487 237169 22.0681 .00205339
189 .00403226 308 94864 17.5499 .00321675
35721 13.7477 .00529101 249 62001 15.7797 368 135424 19.1833 .00271739 428 183184 20.6882 .00233645 488 238144 22.0907 .00204918
190 .00401606 309 95481 17.5784 .00323625
36100 13.7840 .00526316 250 62500 15.8114 .00400000 369 136161 19.2094 .00271003 429 184041 20.7123 .00233100 489 239121 22.1133 .00204499
310 96100 17.6068 .0032258) 490 240100 22.1359
370 136900 19.2354 .00270270 430 184900 20.7364 .00232558 .00204082
191 36481 13.8203 .00523560 251 63001 15.8430
192 36864 .00398406 311 96721 17.6352 .00321543
13.8564 .00520833 252 63504 )5.8745 .00396825 371 137641 19.2614 .00269542 431 185761 20.7605 .00232019 491 241081 22.1585 .00203666
193 37249 13.8924 312 97344 17.6635 .00320513
.00518135 253 64009 15.9060 .00395257 313 372 138384 19.2873 .00268817 432 186624 20.7846 .00231481 492 242064 22.1811 .00203252
194 37636 13.9284 .00515464 97969 17.6918 .00319489
254 64516 15.9374 .00393701 314 373 139129 19.3132 .00260097 433 187489 20.8087 .00230947 493 243049 22.2036 .00202840
195 38025 13.9642 98596 17.7200 .00318471
.00512821 255 65025 15.9687 .00392157 315 99225 374 139876 19.3391 .00267380 434 188356 20.8327 .00230415 494 244036 22.2261 .00202429
17.7482 .00317460 495 245025 22.2486 .00202020
375 140625 19.3649 .00266667 435 189225 20.8567 .00229885
196 38416 14.0000 .00510204 256 65536 16.0000
197 38809 .00390625 316 99856 17.7764 .00316456
14.0357 .00507614 257 66049 16.0312 .00389105 376 141376 19.3907 .00265957 436 190096 20.8806 .00229358 496 246016 22.2711 .00201613
198 39204 14.0712 317 100489 17.8045 .00315457
.00505051 258 66564 J6.0624 .00387597 318 101124 17.8326 377 142129 19.4165 .00265252 437 190969 20.9045 .00228833 497 247009 22.2935 .00201207
199 39601 14.1067 .00502513 259 67081 16.0935 .00314465 378 142884 19.4422 .00264550 438 191844 20.9284 .00228311 498 248004 22.3159 .00200803
200 40000 .00386100 319 101761 17.8606 .00313480
14.1421 .00500000 260 67600 16.1245 .00384615 379 J43641 19.4679 .00263852 439 192721 20.9523 .00227790 499 249001 22.3383 .00200401
320 102400 17.8885 .00312500 300 144400 19.4936 .00263158 440 193600 20.9762 .00227273 500 250000 22 .3607 .00200000
201 40401 14.1774 .Q0497512 261 68121
202 16.1555 .00383142 321 103041 17.9165 .00311526
40804 14.2127 .00495050 262 68644 16.1864 441 194481 21.0000 .00226757 501 251001 22.3830 .00199601
203 .00381679 322 103684 17.9444 .00310559 381 145161 19.5192 .00262467
41209 14.2478 .00492611 263 69169 16.2173 382 145924 19.5448 .00261780 442 195364 2J .0238 .00226244 502 252004 22.4054 .00199203
204 41616 .00380228 323 104329 17.9722 .00309598
14.2829 .00490196 264 69696 16.2481 .00378788 383 146689 19.5704 .00261097 443 196249 21.0476 .00225734 503 253009 22.4277 .00198807
205 42025 14.3178 324 104976 18.0000 .00308642
.00487805 265 70225 16.2788 .00377358 325 105625 18.0278 384 147456 19.5959 .00260417 444 197136 21.0713 .00225225 504 254016 22.4499 .00198413
.00307692 198025 21.0950 .00224719 505 255025 22.4722 .00198020
206 42436 385 J48225 19.6214 .00259740 445
14.3527 .00485437 266 70756 16.3095 .00375940
207 42849 14.3875 326 106276 18.0555 .00306748
.00483092 267 71289 16.3401 .00374532 327 386 148996 19.6469 .00259067 446 198916 21.1187 .00224215 506 256036 22.4944 .00197628
208 43264 14.4222 106929 18.0831 .00305810
.00480769 268 71824 16.3707 .00373134 328 387 149769 19.6723 .00258398 447 199809 21.1424 .00223714 507 257049 22.5167 .00197239
209 43681 14.4568 107584 18.1108 .00304878
.00478469 269 72361 16.4012 .00371747 329 388 150544 19.6977 .00257732 448 200704 21. 1660 .00223214 508 258064 22.5389 .00196850
210 44100 14.4914 .00476190 108241 18.1384 .00303951
270 72900 16.4317 .00370370 330 108900 18.1659 389 151321 19.7231 .00257069 449 201601 21. 1896 .00222717 509 25908J 22.5610 .00196464
.00303030 510 260100 22.5832 .00196078
211 44521 390 152100 19.7484 .00256410 450 202500 21.2132 .00222222
14.5258 .00473934 271 73441 16.4621 .00369004
212 44944 14.5602 331 109561 18.1934 .00302115
.00471698 272 73984 16.4924 .00367647 332 110224 18.2209 391 152881 19.7737 .00255754 451 203401 21.2368 .00221729 511 261121 22.6053 .00195695
213 45369 14.5945 .00469484 273 .00301205
74529 16.5227 .00366300 333 110889 18.2483 392 153664 19.7990 .00255102 452 204304 21.2603 .00221239 512 262144 22.6274 .00195312
214 45796 14.6287 .00467290 274 .00300300
75076 16.5529 .00364964 334 111556 18.2757 393 154449 19.8242 .00254453 453 205209 21.2838 .00220751 513 263169 22.6495 .00194932
215 46225 14.6629 .00465116 275 75625 .00299401
16.5831 .00363636 335 112225 18.3030 .00298507 394 155236 19.8494 .00253007 454 206116 21.3073 .00220264 514 264196 22.6716 .00194553
216 395 156025 19.8746 .00253165 455 207025 21.3307 .00219870 515 265225 22.6936 .00194175
46656 14.6969 .00462963 276 76176 16.6132
217 47089 .00362319 336 112896 18.3303 .00297619
14.7309 .00460829 277 76729 16.6433 .00361011 396 156816 19.8997 .00252525 456 207936 21. 3542 .00219298 516 266256 22.7156 .00193798
218 47524 14.7648 337 113569 18.3576 .00296736
.00458716 278 77284 16.6733 .00359712 338 397 157609 19.9249 .00251889 457 208849 21.3776 .00218818 517 267289 22.7376 .00193424
219 47961 14.7986 .00456621 114244 J8.3848 .00295858
279 77841 16.7033 .00358423 339 114921 18.4120 398 158404 19.9499 .00251256 458 209764 21.4009 .00218341 518 268324 22 .7596 .00193050
220 48400 14.8324 .00454545 280 .00294985
78400 16.7332 .00357143 340 115600 18.4391 399 159201 19.9750 .00250627 459 210681 21.4243 .00217865 519 269361 22.7816 .00192678
.00294118
221 48841 400 160000 20.0000 .00250000 460 211600 21.4476 .00217391 520 270400 22.8035 .00192308
14.8661 .00452489 281 78961 16.7631 .00355872
222 49284 14.8997 341 116281 18.4662 .00293255
.00450450 282 79524 16.7929 .00354610 342 116964 401 160801 20.0250 .00249377 461 212521 21.4709 .00216920 521 271441 22.8254 .00191939
223 49729 14.9332 .00448430 18.4932 .00292398
283 80089 16.8226 .00353357 343 117649 402 161604 20.0499 .0024875 6 462 213444 21.4942 .00216450 522 272484 22.8473 .00191571
224 50176 14.9666 .00446429 18.5203 .0029J545
284 80656 16.8523 .00352113 344 118336 403 162409 20.0749 .0024813 9 463 214369 21.5174 .00215983 523 273529 22.8692 .00191205
225 50625 15.0000 .00444444 18.5412 .00290698
285 81225 16.8819 .00350877 345 119025 18.5742 404 163216 20.0998 .0024752 5 464 215296 21.5407 .0021551 7 524 274576 22.8910 .00190840
.00289855
226 51076 15.0333 405 164025 20. J246 .0024691 4 465 216225 21.5639 .00215054 525 275625 22.9129 .00190476
.00442478 286 81796 16.9115 .00349650 346 119716 18.6011
227 51529 15.0665 .00440529 287 .00289017
82369 16.9411 . 00348132 347 120409 18.6279 .00288184 406 164836 20.1494 .00246305 466 217156 21.5870 .00214592 526 276676 22.9347 .00190114
228 5J984 15.0997 .00438596 288 82944
229 52441 15.1327
16.9706 .00347222 348 121104 18.6548 .00287356 407 165649 20.1742 .0024570 o 467 218089 21.6102 .00214133 527 277729 22.9565 .00189753
.00436681 289 83521 17.0000 .00346021 349 121801 18.6815 219024 .0021367 5 528 278784 22.9783 .00189394
230 52900 15.1658 .00434783 .00286533 408 166464 20.1990 .0024509 8 468 21.6333
290 84100 17.0294 .00344828 350 122500 18.7083 409 167281 20.2237 .0024449 9 469 219961 21.6564 .00213220 529 279841 23.0000 .00189036
.00285714
231 53361 15.1987 .00432900 291 410 168100 20.2485 .0024390 2 470 220900 21.6795 .00212766 530 280900 23.0217 .00188679
84681 17.0587 .00343643 351 123201 18.7350 .00284900
232 53824 15.2315 .00431034 292 85264 17.0880 .00342466 352 123904 18.7617 .00284091 41 I 168~21 20.2731 .0024330 9 471 221841 21.7025 .0021231 4 531 281961 23.0434 .00188324
233 54289 15.2643 .00429185 293 85849 17.1172
234 54756 .00341297 353 124609 18.7883 .00283286 412 169744 20.2978 .0024271 8 472 222784 21.7256 .00211864 532 283024 23.0651 .00187970
15.2971 .00427350 294 86436 17.1464 .00340136
235 55225 15.3297 354 125316 18.8149 .00282486 413 170569 20.3224 .0024213 1 473 223729 21.7486 .0021141 6 533 284089 23.0868 .00187617
.00425532 295 87025 17.1756 .00338983 355 126025 18.8414 .00281690 414 171396 20.3470 .0024154 6 474 224676 21.7715 .00210970 534 285156 23.1084 .00187266
236 55696 15.3623 .00423729 296 87616 17.2047 415 172225 20.3715 .002409 64 475 225625 21.7945 .0021052 6 535 286225 23.1301 .00186916
237 56169 .00337838 356 126736 18.8680 .00280899
15.3948 .00421941 297 88209 17.2337 .00336700
238 56644 15.4272 357 127449 18.8944 .00280112 416 173056 20.3961 .0024038 5 476 226576 21.8174 .002JOO84 536 287296 23.1517 .00186567
.00420168 298 88804 17.2627 .00335570 358 128164 18.9209
239 57121 15.4596 .00418410 .00279330 417 173889 20.4206 .0023980 8 477 227529 21.8403 .00209644 537 288369 23.1733 .00186220
299 89401 17.2916 .00334448 359 128881 18.9473 .00278552
240 57600 15.4919 .00416667 418 174724 20.4450 .002392 34 478 228484 21.8632 .0020920 5 538 289444 23.1948 .00185874
300 90000 17.3205 .00333333 360 129600 18.9737 .00277778 419 175561 20.4695 .002386 63 479 229441 21.8861 .0020876 8 539 290521 23.2164 .00185529
420 176400 20.4939 .00230095 480 230400 21.9089 .0020833 3 540 291600 23.2379 .00185185
402 ESTAnfSTICA PARA LAS CIENCIAS SOCIALES
TABLAS 403

Tabla P (colltilluaciOIl)
Tabla P (contilluacioll)
N N2 .s: 1/N N N2 .IN 1/N N N2 .IN 1/N
N N2 ,.iN 1/N N N2 ,IN 1/N N N2 ,IN 1/N
541 292681 23.2594 .00184843 601 361201 24.5153 .00166389 661
542 436921 25.7099 .00151286
293764 23.2809 .00184502 602 302404 24.5357 .00166113 662 438244
543 25.7294 .00151057 721 519841 26.8514 .00138696 781 609961 27.9464 .00128041 841 707281 29.0000 .00ll8906
294849 23.3024 .00184162 603 363609 24.5561 .00165837 663 439569
544 25.7488 .00150830 722 521284 26.8701 .00138504 782 611524 27.9643 .00127877 842 708964 29.0172 .00118765
295936 23.3238 .00183824 604 364816 24.5764 .00165563 664 440896
545 25.7682 .00150602 723 522729 26.8887 .00138313 783 613089 27.9821 .00127714 843 710649 29.0345 .00118624
297025 23.3452 .00183486 605 366025 24.5967 .00165289 665 442225 784 614656
25.7876 .00150376 724 524176 26.9072 .00138122 28.0000 .00127551 844 712336 29.0517 .OOll8483
546 298116 23.3666 725 525625 26.9258 .00137931 785 616225 28.0179 .00127389 845 714025 29.0689 .00118343
.00183150 606 367236 24.6171 .00165017 666 443556 25.8070
547 299209 23.3880 .00182815 607 368449 .00150150
24.6374 .00164745 667 444889 25.8263 .00149925 726 527076 26.9444 .00137741 786 617796 28.0357 .00127226 846 715716 29.0861 .00118203
548 300304 23.4094 .00182482 608 369664 24.6577 .00164474 668
549 446224 25.8457 .00149701 727 528529 26.9629 .00137552 787 619369 28.0535 .00127065 847 717409 29.1033 .00118064
301401 23.4307 .00182149 609 370881 24.6779 .00164204 669
550 447561 25.8650 .00149477 728 529984 26.9815 .00137363 788 620944 28.0713 .00126904 848 719104 29.1204 .00117925
302500 23.4521 .00181818 610 372100 24.6982 .00163934 670 448900 25.8844 .00149254 729 531441 27.0000 .00137174 789 622521 28.0891 .00126743 849 720801 29.1376 .00117786
551 303601 23.4734 .00181488 611 373321 24.7184 .00163666
730 532900 27.0185 .00136986 790 624100 28.1069 .00126582 850 722500 29.1548 .oou 7647
671 450241 25.9037 .00149031
552 304704 23.4947 .00181159 612 374544 24.7386 .00163399 672 451584 25.9230 .00148810 731 534361 27.0370 .00136799 791 625681 28.1247 .00126422 851 724201 29.1719 .00117509
553 305809 23.5160 .00180832 613 375769 24.7588 .00163132 673
554 306916 452929 25.9422 .00148588 732 535824 27.0555 .00136612 792 627264 28.1425 .00126263 852 725904 29.1890 .00117371
23.5372 .00180505 614 376996 24.7790 .00162866 674 454276 25.96J5 733 537289 27.0740 .00136426 793 628849 28.1603 .00126103 853 727609 29.2062 .00117233
555 308025 23.5584 .00180180 615 .00148368
378225 24.7992 .00162602 675 455625 25.9808 .00148148 734 538756 27.0924 .00136240 794 630436 28.1780 .00125945 854 729316 29.2233 .oou 7096
556 309136 23.5797 735 540225 27.1109 .00136054 795 632025 28.1957 .00125786 855 731025 29.2404 .00116959
.00179856 616 379456 24.8193 .00162338 676 456976 26.0000 .00147929
557 310249 23.6008 .00179533 617 380689 24.8395 .00162075 677 458329 541696 27.1293 .00135870 796 633616 28.2135 .00125628 856 732736 29.2575 .00116822
26.0192 .00147710 736
558 311364 23.6220 .00179211 618 381924 24.8596 .00161812 678 459684 737 543169 27.1477 .00135685 797 635209 28.2312 .00125471 857 734449 29.2746 .00116686
559 312481 26.0384 .00147493
23.6432 .00178891 619 383161 24.8797 .00161551 679 461041 26.0576 738 544644 27.1662 .00135501 798 636804 28.2489 .00125313 858 736164 29.2916 .00116550
560 313600 23.6643 .00147275
.00178571 620 384400 24.8998 .00161290 680 462400 26.0768 739 546121 27.1846 .00135318 799 638401 28.2666 .00125156 859 737881 29.3087 .00116414
.00147059
561 314721 740 547600 27.2029 .00135135 800 640000 28.2843 .00125000 860 739600 29.3258 .00116279
23.6854 .G0178253 621 385641 24.9199 .00161031 681 463761 26.0960
562 315844 23.7065 .00146843
.00177936 622 386884 24.9399 .00160772 682 465124 26.1151 .00146628 741 549081 27.2213 .00134953 801 641601 28.3019 .00124844 861 741321 29.3428 .00116144
563 316969 23.7276 .00177620 623 388129 24.9600 .00160514 683 466489 26.1343 .00146413 742 550564 27.2397 .00134771 802 643204 28.3196 .00124688 862 743044 29.3598 .00116009
564 318096 23.7487 .00177305 624 389376 24.9800 .00160256 684 467856 26.1534 .00146199 743 552049 27.2580 .00134590 803 644809 28.3373 .00124533 863 744769 29.3769 .00115875
565 319225 23.7697 .00176991 625 390625 25.0000 .00160000 685 469225 26.1725 .00145985 744 553536 27.2764 .00134409 804 646416 28.3549 .00124378 864 746496 29.3939 .00115741
566 320356 23.7908 71,5 555025 27.2947 .00134228 805 648025 28.3725 .00124224 865 748225 29.4109 .00115607
.00176678 626 39J876 25.0200 .00159744 686 470596 26.1916 .00145773
567 321489 23.8118 .00J76367 627 393129 25.0400 .00159490 687 471969 26.2107 .00145560 746 556516 27.3130 .00134048 806 649636 28.3901 .00124069 866 749956 29.4279 .00115473
568 322624 23.8328 .00176056 628 394384 25 .0599 .00159236 688 473344
569 26.2298 .00145349 747 558009 27.3313 .00133869 807 651249 28.4077 .00123916 867 751689 29.4449 .00115340
323761 23.8537 .00175747 629 395641 25.0799 .00158983 689 474721 748 559504 27.3496 .00133690 625864 28.4253 .00123762 .00115207
570 26.2488 .00145138 808 868 753424 29.4618
324900 23.8747 .00175439 630 396900 25.0998 .00158730 690 476100 749 561001 27.3679 .00133511 809 654481 28.4429 869 755161 29.4788 .00115075
26.2679 .00144928 .00123609
571 326041 23.8956 750 562500 27.3861 .00133333 810 656100 28.4605 .00123457 870 756900 29.4958 .00114943
.00175131 631 398161 25.1197 .00158479 691 477481 26.2869
572 327184 23.9165 .00144718
.00164825 632 399424 25.1396 .00158228 692 478864 26.3059 751 564001 27.4044 .00133156 811 657721 28.4781 .00123305 871 758641 29.5127 .00114811
573 328329 23.9374 .00144509
.00174520 633 400689 25.1595 .00157978 693 480249 26.3249 752 565504 27.4226 .00132979 812 659344 28.4956 .00123153 872 760384 29.5296 .00114679
574 329476 23.9583 .00144300
.00174216 634 401956 25.1794 .00157729 694 481636 26.3439 .00144092 753 567009 27.4408 .00132802 813 660969 28.5132 .00123001 873 762129 29.5466 .00114548
575 330625 23.9792 .00173913 635 403225 25.1992 .00157480 695 874 763876 29.5635 .00114416
483025 26.3629 .00143885 754 568516 27.4591 .00132626 814 662596 28.5307 .00122850
576 331776 755 570025 27.4773 .00132450 815 664225 28.5482 .00122699 875 765625 29.5804 .00114286
24.0000 .00173611 636 404496 25.2190 .00157233 696 484416 26.3818
577 332929 24.0208 .00143678
.00173310 637 405769 25.2389 .00156986 697 485809 26.4008 .00143472 756 571536 27.4955 .00132275 816 665856 28.5657 .00122549 876 767376 29.5973 .00114155
578 334084 24.0416 .00173010 638 407044 25 .2587 .00156740 698 487204 26.4197 .00143266 757 573049 27.5136 .00132100 817 667489 28.5832 .00122399 877 769129 29.6142 .00114025
579 335241 24.0624 .00172712 639 408321 25.2784 .00156495 699 878 770884 29.6311 .00113895
580 488601 26.4386 .00143062 758 574564 27.5318 .00131926 818 669124 28.6007 .00122249
336400 24.0832 .00172414 640 409600 25.2982 .00156250 700 490000 759 576081 27.5500 .00131752 819 670761 28.6182 .00122100 879 772641 29.6479 .00113766
26.4575 .00142857
581 337561 760 577600 27.5681 .00131579 820 672400 28.6356 .00121951 880 774400 29.6848 .00113636
24.1039 .00172ll7 641 410881 25.3180 .00156006 701 491401
582 338724 24.1247 26.4764 .00142653
.00171821 642 412164 25.3377 .00155763 702 492804 26.4953 .00142450 761 579121 27.5862 .00131406 821 674041 28.6531 .00121803 881 776161 29.6816 .00113507
583 339889 24.1454 .00171527 643 413449 25.3574 .00155521 703 27.6043 .00131234 822 675684 28.6705 .00121655 882 777924 29.6985 .00113379
494209 26.5141 .00142248 762 580644
584 341056 24.1661 .00171233 644 414736 25.3772 .00155280 704 27.6225 .00131062 823 677329 28.6880 .00121507 883 779689 29.7153 .00113250
495616 26.5330 .00142045 763 582169
585 342225 24.1868 .00170940 645 416025 25.3969 .00155039 705 824 678976 28.7054 .00121359 884 781456 29.732J .00113122
497025 26.5518 .00141844 764 583696 27.6405 .00130890
586 343396 24.2074 765 585225 27.6586 .00130719 825 680625 28.7228 .00121212 885 783225 29.7489 .00112994
.00170648 646 417316 25.4165 .00154799 706 498436 26.5707 .00141643
587 344569 24.2281 .00170358 647 418609 25.4362 .00154.ll6O 707 499849 826 682276 28.7402 .00121065 784996 29.7658 .00112867
26.5895 .00141443 766 586756 27.6767 .00130548 886
588 345744 24.2487 .00170068 648 419904 25.4558 .00154321 708 .00120919 887 786769 29.7825 .00112740
501264 26.6083 .00141243 767 588289 27.6948 .00130378 827 683929 28.7576
589 346921 24.2693 .00169779 649 421201 25.4755 .00154083 709 502681 788544 29.7993 .00112613
26.6271 .00141044 768 589824 27.7128 .00130208 828 685584 28.7750 .00120773 888
590 348100 24.2899 .00169492 650 422500 25.4951 .00153846 710 504100 28.7924 .00120627 889 790321 29.8161 .00112486
26.6458 .00140845 769 591361 27.7308 .0013003 9 829 687241
591 349281 770 592900 27.7489 .00129870 830 688900 28.8097 .00120482 890 792100 29.8329 .00112360
24.3105 .00169205 651 423801 25.5147 .00153610 711 505521 26.6646
592 350464 .00140647
24.3311 .00168919 652 425104 25.5343 .00153374 712 506944 26.6833 .00140449 771 594441 27.7669 .0012970 2 831 690561 28.8271 .00120337 891 793881 29.8496 .001 I 2233
593 351649 24.3516 .00168634 653 426409 25.5539 .00153139 713 .00112108
508369 26.7021 .00140252 772 595984 27.7849 .0012953 4 832 692224 28.8444 .00120192 892 795664 29.8664
594 352836 24.3721 .00168350 654 427716 25.5734 .00152905 29.8831 .00111982
714 509796 26.7208 .00140056 773 597529 27.8029 .0012936 6 833 693889 28.8617 .00120048 893 797449
595 354025 24.3926 .00168067 655 429025 25.5930 .00152672 715 29.8998 .001) 1857
511225 26.7395 .00139860 774 599076 27.8209 .0012919 9 834 695556 28.8791 .00119904 894 799236
596 355216 24.413) 775 600625 27.8388 .0012903 2 835 697225 28.8964 .00119760 895 801025 29.9166 .00111732
.00167785 656 430336 25.6125 .00152439 716 512656 26.7582 .00139665
597 356409 24.4336 .00167504 657 431649 25.6320 .00152207 717 776 602176 27.8568 .0012886 6 836 698896 28.9137 .00119617 896 802816 29.9333 .00111607
598 514089 26.7769 .00139470
357604 24.4540 .00167224 658 432964 25.6515 .00151976 718 515524 777 603729 27.8747 .0012870 o 837 700569 28.9310 .00119474 897 804609 29.9500 .00111483
599 358801 24.4745 26.7955 .00139276
.00166945 659 434281 25.6710 .00151745 719 516961 26.8142 .00139082 778 605284 27.8927 .0012853 5 838 702244 28.9482 .0011933 2 898 806404 29.9666 .00111359
600 360000 24.4949 .00166667 660 435600 25.6905 .00151515 779 606841 27.9106 .0012837o 839 703921 28.9655 .00119190 899 808201 29.9833 .00111235
720 518400 26.8328 .00138889
780 608400 27.9285 .0012820 5 840 705600 28.9828 .0011904 8 900 810000 30.0000 .00111111
404 ESTADISTICA PARA LAS CIENCIAS SOCIALES TABLAS 405

Tabla P (cone/lIye)
Tabla Q
Numeros aleatorios
N N' -iN 1/N N N' .IN I/N N N' .IN lIN NL1mero
901 811801 30.0167 .00110988 936 876096 30.5941 de fila
.00106838 971 942841 31.1609 .00102987
902 813604 30.0333 .00110865 937 877969 30.6105 .00106724 972 944784 31.1769 .00102881 00000 10097 32533 76520 13586 34673 54876 80959 09117 39292 74945
903 815409 30.0500 .00110742 938 879844 30.6268 .00106610 973 946729 31.1929 .00102775 00001 37542 04805 64894 74296 24805 24037 20636 10402 00822 91665
904 817216 30.0666 .00110619 939 881721 30.6431 .00106496 974 948676 31. 2090 .00102669 00002 08422 68953 19645 09303 23209 02560 15953 34764 35080 33606
905 819025 30.0832 .00110497 940 883600 30.6594 .00106383 975 95062" 31. 2250 .00102564 00003 99019 02529 09376 70715 38311 31165 88676 74397 04436 27659
906 820836 30.0998 .00110375 00004 12807 99970 80157 36147 64032 36653 98951 16877 12171 76833
941 885481 30.6757 .00106270 976 952576 31. 2410
907 822649 30.1164 .00110254 .00102459
942 887364 30.6920 .00106157 977 954529 31. 2570 00005 66065 74717 34072 76850 36697 36170 65813 39885 11199 29170
908 824464 30.1330 .00110132 .00102354
943 889249 30.7083 .00106045 978 956484 31.2730 31060 10805 45571 82406 35303 42614 86799 07439 23403 09732
909 826281 30.1496 .00110011 .00102249 00006
944 891136 30.7246 .00105932 979 958441 31.2890 65692 68665 74818 73053 85247 18623 88579
910 828100 30.1662 .00102145 00007 85269 77602 02051
.00109890 945 893025 30.7409 .00105820 980 960400 31.3050 .00102041 00008 63573 32135 05325 47048 90553 57548 28468 28709 83491 25624
911 829921 30.1828 .00109769 946 894916 00009 73796 45753 03529 64778 35808 34282 60935 20344 35273 88435
30.7571 .00105708 981 962361 31. 3209 .00101937
912 831744 30.1993 .00109649 947 896809 30.7734 .00105597 982 964324 31. 3369 .00101833 00010 98520 17767 14905 68607 22109 40558 60970 93433 50500 73998
913 833569 30.2159 .00109529 948 898704 30.7896 .00105485 983 966289 31.3528 .00101729 00011 11805 05431 39808 27732 50725 68248 29405 24201 52775 67851
914 835396 30.2324 .00109409 949 900601 30.8058 .00105374 984 968256 31. 3688 .00101626 00012 83452 99634 06288 98033 13746 70078 18475 40610 68711 77817
915 837225 30.2490 .00109290 950 902500 30.8221 .00105263 985 970225 31.3847 .00101523 00013 88685 40200 86507 58401 36766 67951 90364 76493 29609 11062
916 839056 30.2655 .00109170 951 904401 30.8383 00014 99594 67348 87517 64969 91826 08928 93785 61368 23478 34113
.00105152 986 972196 31.4006 .00101420
917 840889 30.2820 .00109051 952 906304 30.8545 .00105042 987 974169 31.4166 .00101317 00015 65481 17674 17468 50950 58047 76974 73039 57186 40218 16544
918 842724 30.2985 .00108932 953 908209 30.8707 .00104932 988 976144 31. 4325 .00101215 00016 80124 35635 17727 08015 45318 22374 21115 78253 14385 53763
919 844561 30.3150 .00108814 954 910116 30.8869 .00104822 989 978121 31. 4484 .00101112 00017 74350 99817 77402 77214 43236 00210 45521 64237 96286 02655
920 846400 30.3315 .00108696 955 912025 30.9031 .00104712 990 980100 31.4643 .00101010 00018 69916 26803 66252 29148 36936 87203 76621 13990 94400 56418
921 848241 30.3480 .00108578 956 913936 30.9192 00019 09893 20505 14225 68514 46427 56788 96297 78822 54382 14598
.00104603 991 982081 31.4802 .00100908
922 850084 30.3645 .00108460 957 915849 30.9354 .00104493
923 992 984064 31.4960 .00100806 00020 91499 14523 68479 27686 46162 83554 94750 89923 37089 20048
851929 30.3809 .00108342 958 917764 30.9516 .00104384 993 986049 31.5119 .00100705 00021 80336 94598 26940 36858 70297 34135 53140 33340 42050 82341
924 853776 30.3974 .00108225 959 919681 30.9677 .00104275 994 988036 31. 5278 .00100604 00022 44104 81949 85157 47954 32979 26575 57600 40881 22222 06413
925 855625 30.4138 .00108108 960 921600 30.9839 .00104167 995 990025 31. 5436 .00100503 28707
00023 12550 73742 11100 02040 12860 74697 96644 89439 25815
926 857476 30.4302 .00107991 961 923521 31.0000 00024 63606 49329 16505 34484 40219 52563 43651 77082 07207 31790
.00104058 996 992016 31.5595 .00100402
927 859329 30.4467 .00107875 962 925444 31.0161 .00103950 997 994009 31.5753 .00103842 00025 90446 47774 51924 33729 65394 59593 42582 60527
928 861184 30.4631 .00107759 963 927369 31.0322 61196 26457
.00103842 998 996004 31.5911 .00100200 79953 59367 83848 82396 10118 33211 59466
929 863041 30.4795 .00107643 964 929296 31.0483 00026 15474 45266 95270
.00103734 999 998001 31.6070 .00100100 54387 54622 44431 91190 42592 92927 45973
930 864900 30.4959 .00107527 965 931225 00027 94557 28573 67897
31.0644 .00103627 1000 1000000 31. 6228 .00100000 25701 46670
00028 42481 16213 97344 08721 16868 48767 03071 12059
931 866761 30.5123 .00107411 966 933156 31.0805 00029 23523 78317 73208 89837 68935 91416 26252 29663 05522 82562
.00103520
932 868624 30.5287 .00107296 967 935089 31.0966 .00103413
933 870489 30.5450 .00107181 968 937024 31. 1127 00030 04493 52494 75246 33824 45862 51025 61962 79335 65337 12472
.00103306
934 872356 30.5614 .00107066 969 938961 31.1288 00031 00549 97654 64051 88159 96119 63896 54692 82391 23287 29529
.00103199
935 874225 30.5778 .00106952 970 940900 31.1448 00032 35963 15307 26898 09354 33351 35462 77974 50024 90103 39333
.00103093
00033 59808 08391 45427 26842 83609 49700 13021 24892 78565 20106
00034 46058 85236 01390 92286 77281 44077 93910 83647 70617 42941

00035 32179 00597 87379 25241 05567 07007 86743 17157 85394 11838
00036 69234 61406 20117 45204 15956 60000 18743 92423 97118 96338
00037 19565 41430 01758 75379 40419 21585 66674 36806 84962 85207
00038 45155 14938 19476 07246 43667 94543 59047 90033 20826 69541
00039 94864 31994 36168 10851 34888 81553 01540 35456 05014 51176

00040 98086 24826 45240 28404 44999 08896 39094 73407 35441 31880
00041 33185 16232 41941 50949 89435 48581 88695 41994 37548 73043
00042 80951 00406 96382 70774 20151 23387 25016 25298 94624 61171
00043 79752 49140 71961 28296 69861 02591 74852 20539 00387 59579
00044 18633 32537 98145 06571 31010 24674 05455 61427 77938 91936

00045 74029 43902 77557 32270 97790 17119 52527 58021 80814 51748
00046 54178 45611 80993 37143 05335 12969 56127 19255 36040 90324
00047 11664 49883 52079 84827 59381 71539 09973 33440 88461 23356
00048 48324 77928 31249 64710 02295 36870 32307 57546 15020 09994
00049 69074 94138 87637 91976 35584 04401 10518 21615 01848 76938

00050 09188 20097 32825 39527 04220 86304 83389 87374 64278 58044
00051 90045 85497 51981 50654 94938 81997 91870 76150 68476 64659
00052 73189 50207 47677 26269 62290 64464 27124 67011\. 41361 82760
00053 75768 76490 20971 87749 90429 12272 95375 05871 93823 43178
00054 54016 44056 66281 31003 00682 27398 20714 53295 07706 17813

00055 08358 69910 78542 42785 13661 58873 04618 97553 31223 08420
00056 28306 03264 81333 10591 40510 07893 32604 60475 94119 01840
00057 53840 86233 81594 13628 51215 90290 28466 68795 77762 20791
00058 91757 53741 61613 62669 50263 90212 55781 76514 83483 47055
00059 89415 92694 00397 58391 12607 17646 48949 72306 94541 37408
406
ESTADfsTICA PARA LAS CIENCIAS SOCIALES
TABLAS 407

Tabla Q (continuacionj
Numero
Tabla Q (continuacionj
de fila NLimero
de fila
00060 77513 03820 86864
29901 68414
00061 82774
5J908 13980
72893 55507
00120 41849 84547 46850 52326 34677 58300 74910 64345 19325 81549

19502 37174 69979 20288 55210


29773

00062 21818 59313 74287 75251


65344 67415
00121 46352 33049 69248 93460 45305 07521 61318 31855 14413 70951

93278 81757 05686 73156


07082 85046

00063 51474 66499 68107 23621 31853 38452


00122 11087 96294 14013 31792 59747 67277 76503 34513 39663 77544

94049 91345
42836 09191
00064 99559 68331
62535 24170 08007 45449
00123 52701 08337 56303 87315 16520 69676 11654 99893 02181 68161

69777 12830
74819 78142
43860 72834
00124 57275 36898 81304 48535 68652 27376 92852 55866 88448 03584

00065 33713 48007


93584 72869 51926 64721 58303 29822
93174 93972

00066 85274 86893


11303 22970
00125 20857 73156 70284 24326 79375 95220 01159 63267 10622 48391

28834 34137 73515 90400


71148 43643

00067 84133 89640 44035 52166


00126 15633 84924 90415 93614 33521 26665 55823 47641 86225 31704

73852 70091 61222 60561


62327 18423

00068 56732 16234 17395 96131


00127 92694 48297 39904 02115 59589 49067 66821 41575 49767 04037

10123 91622 85496 57560


81604 18880

00069 65138 56806


87648 85261
00128 77613 19019 88152 00080 20554 91409 96277 48257 50816 97616

34313 65861 45875 21069


85644 47277
00129 38688 32486 45134 63545 59404 72059 43947 51680 43852 59693

00070 38001
02176 81719 11711 71602 92937 74219 64049
65584 49698

00071 37402 96397 01304 77586


00130 25163 01889 70014 15021 41290 67312 71857 15957 68971 11403

56271 10086 47324 62605


40030 37438

00072 97125 40348


87083 31417 00131 65251 07629 37239 33295 05870 01119 92784 26340 18477 65622

21815 39250 75237 62047


15501 29578

00073 21826 41J34 47143 34072


00132 36815 43625 18637 37509 82444 99005 04921 73701 14707 93997

64638
85902 49139 06441
03856 54552

00074 73135 42742 95719


09035 00133 64397 11692 05327 82162 20247 81759 45197 25332 83745 22567

85794 74296
08789 88156
64691 19202
00134 04515 25624 95096 67946 48460 85558 15191 18782 16930 33361

00075 07638 77929 03061 18072

00076 96207 44156


23821 99538
04713 66994

60528 83441 07954 19814


00135 83761 60873 43253 84145 60833 25983 01291 41349 20368 07126

00077 59175 20695


05533 52139
61212 06455
83596 35655 06958 92983
00136 14387 06345 80854 09279 43529 06318 38384 74761 41196 37480

05128 09719 77433 53783 92301 50498

00078 10850 62746 99599 10507


00137 51321 92246 80088 77074 88722 56736 66164 49431 66919 31678

00079 13499 06319 53075 71839


06410 19362

39820 98952
43622 63147
00138 72472 00008 80890 18002 94813 31900 54155 83436 35352 54131

64421 80814
43800 09351 31024 73167
00139 05466 55306 93128 18464 74457 90561 72848 11834 79982 68416

00080 59580 06478 1


75569 78800
88835 54486 23768 06156 04111 08408
19241

00081 38508 07341 23793 48763 00140 39528 72484 82474 25593 48545 35247 18619 13674 18611
90822 97022
17719 04207 95954
00082 30692 70668
94688 16127
49953
00141 81616 18711 53342 44276 75122 11724 74627 73707 58319 15997

56196 80091 82067 63400


05462 69200

00083 65443 95659


18238 27437
00142 07586 16120 82641 22820 92904 13141 32392 19763 61199 67940

49632 24041 08337 65676 96299 90836

00084 27267 50264 13192 72294


00143 90767 04235 13574 17200 69902 63742 78464 22501 18627 90872

07477 44606
17985 48911 97341
30358
00441 58997

00144 40188 28193 29593 88627 94972 11598 62095 36787


00085 91307 06991 19072 24210 36699 53728
28825 35793
28976 66252

00086 68434 94688


84473 13622
00145 34414 82157 86887 55087 19152 00023 12302 80783 32624 68691

62126 98408
12843 82590
09815 93146

00087 48908 15877 54745


24591 00146 63439 75363 44989 16822 36024 00867 76378 41605 65961 73488

35700 04754
83824 52692
54130 55160

00088 06913 45197 42672 78601


00147 67049 09070 93399 45547 94458 74284 05041 49807 20288 34060

11883 09528 63011 98901


14974 40344

00089 10455 16019 14210 33712 00148 79495 04146 52162 90286 54158 34243 46978 35482 59362 95938

91342 37821 88325 80851


43667 70883
00149 91704 30552 04737 21031 75051 93029 47665 64382 99782 93478

00090 12883 97343


65027 61184
04285 01392 17974 15077
90712 26769

00091 21778 30976


38807 36961
00150 94015 46874 32444 48277 59820 96163 64654 25843 41145 42820

31649 42096 63281 02023


08816 47449

00092 19523 59515


65122 59659
00151 74108 88222 88570 74015 25704 91035 01755 14750 48968 38603

86283 68258 69572 13798


16435 91529

00093 67245
52670 35583 16563
00152 62880 87873 95160 59221 22304 90314 72877 17334 39283 04149

79246 86686 76463 34222


26655 90802

00094 60584 47377


07500 37992
00153 11748 12102 80580 41867 17710 59621 06554 07850 73950 79552

45134 26529 26760 83637


41326 44344
00154 17944 05600 60478 03343 25852 58905 57216 39618 49856 99326

00095 53853 41377


36066 94850
58838 73859 49364 73331 96240 43642

00096 24637 38736 74384 89342 00155 66067 42792 95043 52680 46780 56487 09971 59481 37006 22186

52623 07992
12369 18601 03742 83873

00097 83080 12451 38992 22815


07759 00156 54244 91030 45547 70818 59849 96169 61459 21647 87417 17198

51777 97377 27585 51972 37867

00098 16444 24334 36151 99073 27493 00157 30945 57589 31732 57260 47670 07654 46376 25366 94746 49580

70939
85130 32552
54846 54759

00099 60790
18157 57178 65762
11161 00158 69170 37403 86995 90307 94304 71803 26825 05511 12459 91314

78576 45819 52979 65130 04860


00159 08345 88975 35841 85771 08105 59987 87112 21476 14713 71181

00100 03991 10461


93716 16894
66083 24653 84609 58232
88618 19161

00101 38555 95554 32886 59780


00160 27767 43584 85301 88977 29490 69714 73035 41207 74699 09310

08355 60860 29735 47762 71299 23853

00102 17546 73704 92052 46215


00161 13025 14338 54066 15243 47724 66733 47431 43905 31048 56699

55121 29281 59076 07936 27954 58909

00103 32643 52861


95819 06831 00162 80217 36292 98525 24335 24432 24896 43277 58874 11466 16082

00911 98936
76355 93779
80863 00514
00104 69572 68777
39510 35905 00163 10875 62004 90391 61105 57411 06368 53856 30743 08670 84741

14060 40619
29549 69616
33564 60780
00164 54127 57326 26629 19087 24472 88779 30540 27886 61732 75454

00105 24122 66591 27699


06494 14845 46672 , 61958
77100 90899 75754

00106 61196 30231


92962 61773
00165 60311 42824 37301 42678 45990 43242 17374 52003 70707 70214

41839 55382
17267 70943 78038 70267

00107 30532 21704 10274 12202


00166 49739 71484 92003 98086 76~68 73209 59202 11973 02902 33250

39685 23309
10061 68829 55986 66485

00108 03788 97599


75867 20717
00167 78626 51594 16453 94614 39014 97066 83012 09832 25571 77628

74416 53166
35208 33374 87539 08823

00109 48228 63379


85783 47619
00168 66692 13986 99837 00582 81232 44987 09504 96412 90193 79568

53152 67433
35663 52972
16818 60311
00169 44071 28091 07362 97703 76447 42537 98524 97831 65704 09514

00110 60365 94653


35075 33949
42614 29297
01918 28316 98953 73231
06905

00111 83799 42402


56623 34442
00170 41468 85149 49554 17994 14924 39650 95294 00556 70481
34994 41374
70071 14736
09958 18065
66986 34099 74474 20740

00112 32960 07405 36409 83232


00171 94559 37559 49678 53119 70312 05682
99385 41600
11133 07586 15917 06253 11436 38072

00113 19322 53845


57620 52606
00172 41615 70360 64J14 58660 90850 64618 80620 51790
66497 68646
78138 66559 19640 99413
77535 99892

00114 11220 94747


07399 37408
00173 50273 93113 41794 86861 24781 89683 55411 85667
48509 23929
27482 45476 85244 35159
28102 57816

00174 41396 80504 90670 08289 40902 05069 95083 06783


00115 31751 57260 68980 05339
15470 48355
88651 22596 03152 19121
98884 08583

00116 88492 99382 14454 04504


00175 25807 24260 71529 78920 72682 07385 90726 57166
20094 98977
74843 93413 22109 78508
89747 98882

00117 30934
47744 07481 83828 00176 06170 97965 88302 98041 21443 41808 68984 83620
73788 06533 28597 20405 94205 20380

00118 22888 48893 27499


98748 00177 60808 54444 74412 81105 01176 2883~ 36421 16489 18059 51061

60530 45128 74022 84617 82037 10268


67054 16067

00119 78212 16993 35902


91386
00178 80940 44893 10408 36222 80582 71944 92638 40333
I 44372 15486
65741 14014 87481 37220
77501 97427

00179 19516 90120 46759 71643 13177 55292 21036 82808


408 ESTADfSTICA PARA LAS CIENCIAs SOCIALES [409]

Tabla Q (concluye)
Tratamiento de las
Nurnero
de fila

00180
00181
00182
00183
00184
49386
06312
60942
92329
77936
54480
88940
00307
98932
63574
23604
15995
11897
78284
31384
23554
69321
92674
46347
51924
21785
47458
40405
71209
85561
41101
64809
68032
92061
29671
91178
98189
96717
39448
58137
10174
81851
54244
93136
17820
29420
29651
10701
25722
22751
90438
84215
41393
08564
36518
IV distribuciones no normales
00185 38101 77756 11657 13897 95889 57067 47648 13885 70669 93406
00186 39641 69457 91339 22502 92613 89719 11947 56203
00187 19324 20504
84054 40455 99396 63680 67667 60631 69181 96845
00188 38525 11600
47468 03577 57649 63266 24700 71594 14004 23153
00189 69249 05747
43321 31370 28977 23896 76479 68562 62342 07589 08899 05985
00190 64281 61826 18555 64937 13173 33365 78851 16499 87064 13075
00191 66847 70495 32350 02985 86716 38746 26313 77463 55387 72681
00192 72461 33230 21529 53424 92581 02262 78438 66276 18396 73538
00193 21032 91050 13058 16218 12470 56500 15292 76139 59526 52113
00194 95362 67011 06651 16136
00195 49712 97380 10404 55452
01016 00857 55018 56374 35824 71708
Transformaci6n de distribuciones de frecuencias
34030 60726 75211 10271 36633 68424
00196
00197
58275
89514
61764
11788
97586
68224
54716
23417
50259
73959
46345
76145
87195
30342
46092
40277
26787
11049
60939
72049
no normales en areas de la curva normal estandar
00198 15472 50669 48139 36732 46874 37088 63465 09819 58869 35220
00199 12120 86124 51247 44302 60883 52109 21437 36786 49226 77837
\ Existen varias tecnicas para normalizar una distribucion de frecuencias de calificacio­
nes. Todas elias conducen mas 0 menos a los mismos resultados. El metodo expuesto
aqui es uno de los preferidos por los autores.
Para ilustrar el procedimiento de normalizacion de distribuciones de frecuencias,
emplearemos una distribucion de frecuencias agrupadas (i = 2) de rendimientos en
millas por galon de sesenta automoviles modelo 1976. Los datos son los que figuran
a continuacion, Notese el exagerado sesgo positivo,

L1MITES VERDADEROS f
DEL INTERVALO DE CLASE f ACUM

27.5-29.5 1 60
25.5-27.5 1 59
23.5-25.5 2 58
21.5-23.5 3 56
19.5-21.5 7 53
17.5-19.5 6 46
15.5-17.5 10 40
13.5-15.5 6 30
11.5-13.5 10 24
9.5-11.5 14 14

Paso A. Relacionar todos los enteros desde el mayor en el intervalo de clase


superior (X = 29) hasta el menor en el intervalo de clase inferior (X = 10).Vease la
columna (A) de la tabla IV.1 que se muestra a continuacion,
Paso B. Elegir un valor cercano allimite superior verdadero del intervalo mas alto
(29.4) y otro valor cercano al limite inferior verdadero del intervalo mas bajo (9.6).
Esto se hace para disponer de puntos de «anclaje» al trazar la grafica,
410 ESTADfsTICA PARA LAS CIENCIAS SOCIALES TRATAMIENTO DE LAS DlSTRIBUCIONES NO NORMALES 411

Paso Ct' ~allalr la calificacion a la que Ie corresponde el rango percentil de 50 En el EI rango percentil de 19 es
presen e eJemp 0: .

a) 50 x 60 : 100 = 30 (1.5/2)6 + 40 x 00 = 44.5 100


60 1 60 x
b) la 30-esima calificacion se encuentra en ellimite superior verdadero del int I
13.~-15.~; Asi, la calificacion correspondiente al percentil 50 es 15 5 er~ato = 74.17
calificacion correspondera a la media mediana y moda de la di tr lb .s, a
li d E ' . ' IS n ucion
norma iza a. stara situada entre 15 y 16 en la tabla IV.1. Paso E. Volver a la tabla A, apendice III. Hallar en el cuerpo de la tabla el rango
percentil que mas se aproxime a los rangos percentiles relacionados en la columna (B)
Tabla IV.l de la tabla IV.1. Por ejemplo, la calificacion 12 tiene un rango percentil de 27.50. EI
valor mas cercano a este es 27.43. La z correspondiente a 27.43 es -0.60. Inscribir
(A) (B) (C) (D) cad a z en la columna (C).
z CORRESPONOIENTE
RANGO BAJO LA CURVA ALTURA
CALIFICACION PERCENTIL NORMAL ESTANOAR DE LA OROENAOA Ejemplos
29.4 99.92 3.14 0.0029
1. Una calificacion de 28 esta en el percentil 98.75. La z correspondiente a este
29 99.58 2.64 0.0122 rango percentil es 2.24.
28 98.75 2.24 0.0325
27 2. Una calificacion de 15 esta en el percentiI47.50. EI valor mas proximo a este en el
97.92 2.04 0.0498
26 97.08 1.89
cuerpo de la tabla es 47.61. A este valor Ie corresponde una z de -0.06.
0.0669
25 95.83 1.73 0.0893
24 94.17 1.57 0.1163
23 92.08 1.41 0.1476
22 89.58 1.26 0.1804
21
20
85.42
79.58
1.05 0.2299 Transformacion a valores T
0.83 0.2827
19 74.17 0.65 0.3230
18 69.17 0.50 Tenemos ahora transformada la distribucion de frecuencias no normal en una
0.3521
17 62.50 0.32 0.3790 distrihucion normal con media 0 y desviacion estandar 1. Sin embargo, la mayor
16 54.17 0.10 0.3970
15.5 50.00
parte de las calificaciones contienen valores decimales y todas las calificaciones a la
0.00 0.3989
15 47.50 -0.06
izquierda de la media son negativas. De ordinario es deseable expresar los valores de
0.3988
14 42.50 -0.19 0.3918 una variable normalmente distribuida en terminos de numeros positives. Esto puede
13 35.83 -0.36 0.3739 conseguirse mediante una simple transformacion:
12 27.50 -0.60 0.3332
11 17.50 -0.93 0.2589
10 05.83 -1.57 0.1163
T= a + bz
9.6 01.17 -2.27 0.0303
La eleccion de las constantes a y b depende de la media y de la desviacion estandar
que se desean para la distribucion transformada final. Por ejemplo, si se desea que la
media de la distribucion transformada sea igual a 500, debe tomarse a igual a 500. Si
Paso D: Usar el procedimiento expuesto en el capitulo 4 para hallar el rango se desea que los valores de la distribucion transformada sean numeros enteros, debe
percentil de cada una de las calificaciones.
tomarse b igual a 100 0 mas.
EjempJos. EI rango percentil de la calificacion 29.4 es
Ejemplos. Obtener la transformacion T necesaria para producir una media igual a
50 y una desviacion estandar igual a 5.
(1.9/2)1 + 59 59.95
60 x 100 =60 x 100
T = a + bz
= 99.92 = 50 + 5z
412 ESTADfSTICA PARA LAS CIENCIAS SOCIALES TRATAMIENTO DE LAS DISTRIBUCIONES NO NORMALES 413

Obtener la transforrnacion necesaria para producir una media de 500 y una A continuacion se muestran las transforrnaciones a valores T de todos los valores
desviacion estandar de 100. normalizados de los datos correspondientes a las millas por galon.

T = a + bz

= 500 + 100z
VALOR
z CORRESPONDIENTE REDONDEADO
BAJO LA CURVA TRANSFORMACION T AL ENTERO
Transformemos ahora las millas por galen en valores T, de modo que obtengamos CALIFICACION NORMAL ESTANDAR (T = 50 + 10z) MAS CERCANO
una media igual a 50 y una desviacion estandar igual a 10.
29.4 3.14 81.4 81

Paso A.' Tomar la z correspondiente a cada calificacion y multiplicarlo por b = 10.


29 2.64 76.4 76
28 2.24 72.4 72
Ejemplos. La z correspondiente a una calificacion de 29.4 es 3.14. 27 2.04 70.4 70
26 1.89 68.9 69
25 1.73 67.3 67
b x 3.14 = 10 x 3.14 65.7 66
24 1.57
= 31.4 23 1.41 64.1 64
22 1.26 62.6 63
La z correspondiente a la calificacion media, 15.5, es O. 21 1.05 60.5 60
20 0.83 58.3 58
19 0.65 56.5 56
b x 0 = 10 x 0 18 0.50 55.0 55
17 0.32 53.2 53
=0 0.10 51.0 51
16
15,5 0.00 50.0 50

Paso B. Sumar la constante a = 50 a cada bz para obtener el valor transformado T.


15 -0.06 49.7 50
La calificacion de 29.4 se convierte en 14 -0.10 48.1 48
13 -0.36 46.4 46
12 -0.60 44.0 44
T = a + bz 11 -0.93 40.7 41
10 -1.57 34.3 34
= 50 + 31.4 -2.27 27.3 27
9.6
= 81.4.

(Nota: En muchas aplicaciones practicas de la transformacion T, se redondea el Cualquier valor transformado puede interpretarse facilmente convirtiendolo a
numero al entero mas cercano de modo que la Teste expresada como un mimero unidades de la curva normal estandar,
entero positivo.)
Ejemplos
Ejemplos. La T de la media se convierte en
1. Una calificacion de 81.9 da lugar a 10 siguiente:
T = a + bz 81.9 - 50 31.9
= 50+0 z = 10 = 10 = 3.19.
= 50.
En la tabla A se encuentra que el correspondiente rango percentil es 99.93.
La T de una calificacion de 11 se convierte en 2. Una calificacion de 37.8 conduce a 10 siguiente:

T = a + bz z = 37.8 - 50 = - 12.2 = -1.22.


10 10
= 50 + 10( - 0.93)

= 40.7.
En la tabla A se encuentra que el correspondiente rango percentil es 11.12.
414 ESTADfsTICA PARA LAS CIENCIAS SOCIALES TRATAMIENTO DE LAS DISTRIBUCIONES NO NORMALES 415

Trazado de la grafica de una distribucion Paso C. Trazar el eje vertical 0 eje Y de modo que puedan representarse numeros
desde 0.00 hasta 0040, con dos decirnales,
norrnalizada
Paso D. Situar cada valor z en el eje horizontal y desplazarse verticalme?te. hacia
arriba hasta hallar el valor correspondiente que representa la ordenada. Dibujar un
Para ilustrar el procedimiento de construccion de la grafica de una distribucion punto en este lugar,

norrnalizada de valores z, utilizarernos los datos de millas por galen que fueron

Paso E. Despues de haber efectuado 10 anterior c~n ~odo~. los valores y una vez
transformados previamente. Dichos datos son los que se reproducen a continuaci6n.
unidos los puntos obtenidos se tiene la grafica ~e la dlstnbucl.O? normal de los d~tos
transformados. Puede resultar adecuado afiadir los dato~ ongmales correspondien­
(A) (B) (C) tes y sus valores transformados. (Ver la fig. IV.I, que sigue.)
z CORRESPONDIENTE

BAJO LA CURVA
ALTURA

CALIFICACION NORMAL ESTANDAR


DE LA ORDENADA
«
o
29.4 3.14
~ .3
29 2.64 w
28 2.24 o
a:
27 2.04
o
26
\ 1.89 :5
25 w
1.73 o

24
1.57 «
a:
23 1.41 ::J
22 1.26 ~
«
21 1.05

20
0.83
19 0.65 -2.0 -1.0 0.0

18
0.50 z
17 0.32
16 0.10 Fig. IV.I Grafica que representa una distribucion no~~alizada de datos
15.5 0.00
en millas por galon correspondientes a sesenta automoviles modelo 1976.
15 -0.06

14 -0.19

13 -0.36

12 -0.60

1~ -0.93

10 -1.57

9.6 -2.27

Paso A. Buscar en la columna (D) de la tabla IV:!. En ella se puede ver la ordenada
correspondiente a cada valor z. Hallar la ordenada correspondiente a cada z en la
tabla anterior y colocar el resultado en la columna (C).

Ejemplos
1. La ordenada correspondiente a z = 3.14 es 0.0029.
2. La ordenada correspondiente a z = 0 es 0.3989.
3. La ordenada correspondiente a z = -1.57 es 0.1163.
Paso B. En una hoja de papel cuadriculado, trazar el eje horizontal 0 eje X de
modo que los valores comprendidos entre - 304 y 304 esten igualmente espaciados.
[416] LISTA DE FORMULAS 417

v Lista de formulas
Numero

(7.1)
Formula

z=-­
s
X-x
110

r.(X - X)(Y - y)
Paqina

(8.2) r=------;:::=====- 128


)SCx'SC y

- - (r.X)(r. Y)
(8.3) r.(X - X)(Y - Y) = r.XY - N 129

r.XY _ (r.X)(r.Y)
Numero Formula Pagina N

J[
(8.4) r = --;::===========~ 130

(4.1) Rango percentil


i acum
- - - x 100 66
r.X 2 - (r.~)2J [r. y2- (r.;)2J
N
r.XY __
in acum + (X -i Xn)cfi) ---XY
N
(4.2) Rango percentil = x 100 (8.5) r=---- 130
67
N

. rango percentil x N 6r.D 2


(4.3) j acum = 68 (8.6) r s = 1 - N(N2 _ 1)
133
100

(4.4)
. . .. .
Calificacion en un percentil dado = X n + i(f acum - in acum) 68
_ Sy ­
(9.5) Y' = Y + r - (X - X) 149
fi Sx

(5.1)
-
X:».
XI + X2 + ... + XN IX
=-, 77 , _ - mXY - (r.X)(r. Y) (X _ X)
(9.9) 150
N N Y - Y + mx2 - (r.X)2

- r.rx (9.11) 151


(5.2) X=-'­ 79
N
(9.16) 155
. i(N/2 - in acum)
(5.4) Mediana = X II + 82 peA) + pCB) cuando A y B son mutuamente exclu­
. fi (10.4) peA 0 B) =
yentes 181
(6.3) SC = r. (X - X)2 98
(10.6) P +Q= 1.00 cuando los sucesos son mutuamente excluyentes
y exhaustivos 182
(6.5) s=/fi 98
(10.9) peA y B) = p(A)p(B) cuando los sucesos son independientes 183

(6.6) SC = r.x2 _ (r.X)2 (10.10) peA y B) = p(A)P(BIA) = p(B)p(AIB) cuando los sucesos no son
99
N independientes 185
418 ESTADisTICA PARA LAS CIENCIAS SOCIALES LISTA DE F6RMULAS 419

Numero Formula Paqina Paqina


Numero Formula

(12.8)
(Ix estimado
.
=Sx =~ =J~(X-Xf /SC
N(N _ 1) ='11 N0V=1)
S
225 (15.5) 281

(12.9)
X- Ilo (15.6) SC to t = SCw + SC a 281
t = 226
Sx
(15.7) glE =k- 1 282
(12.10) Limite superior Ilo = X + to.05(sx) 232
-z SCE
(12.11) Limite inferior Ilo =X- to.05 (sx ) 233 (15.8) SE= - 282
gh
(13.1)
Sx,-x, = J( SCI + SC z ) ( 1
N I+N
z-2
1)
r:r;+N;
(15.9) glw = N - k

z SCw
282

282
(15.10)
~Xy + I:xD - (NIXy + NZX~)(_I_ + _1_),
Sw=-­
glw
N I+N z - 2 N1 «. -z
SE
NI # Nz 246 (15.11) F =-z
­ 282
Sw
SCI + SC z (15.12) gltOI = N - 1 285
(13.2)
N(N - 1)

2
I:Xy + I:X~ -
N(N - 1)

N(Xi + X~)

246
(15.13) DHS = qa.
JfSw
N 286

SCE - (k - 1)s~
(Xl - Xz) - (Ill - Ilz)
(15.14) Z
est = 287
(13.3) t = -------.:~---.::....=:. 246
W
SC to t -
1
Sw
sx, - X,

Z t Z
- 1 (16.1) Potencia = 1 ­ f3 306
(13.4) W est = z N N (para dos muestras independientesj 249
t+ 1+ z-1 Nu
(14.1) (16.2) Eficiencia de la prueba B = 100_ 317
262 Nb

f5 - Iljj f5 NI
(14.2) t=--=­ 265 (17.1) p(x) = I(N ~ ) I pXQN-x
Sjj Sjj x. x. 324

(14.3) SCD = LDz _ ~D)Z 265 x - NP


N (17.2) Z= 326
)NPQ
rsc;;­
(14.5) Sjj = 'II N0V=1) 265
XZ = i ±(fo - fe)Z 330
(17.4)
r=1 c=l Ie
A = Suma de los cuadrados de las diferencias = LD z
(14.7) 267
Cuadrado de la suma de las diferencias (LD)Z (18.1) 338

(15.2) SC = I:X 2 _ ~Xlolf 339


tot tot N 280 (18.2)
[420] GLOSARIO DE TERMINOS 421

VI Glosario de terminos
Datos de frecuencias (datos de atributos, datos
categoricos, datos enumerativos). Tabulacio­
nes del nurnero de presentaciones en cada
clase de una variable dada.
Desviaeion estandar, Medida de dispersion de

gran utilidad. Se la define como la raiz cua­

su magnitud, una distribucion de frecuencias


muestra el numero de veces que aparece cada
uno de dichos valores.
Dlstribncion de frecuencias acumuladas. Una
distribucion que muestra la frecuencia acu­
mulada por debajo del limite superior verda­
drada de la suma de los cuadrados de las
dero del correspondiente intervalo de clase,
desviaciones respecto a la media, dividida
Distribucion de frecuencias agrupadas. Una
por N.
distribucion de frecuencias en la que los valo­
Desviacion media (desviacion promedio), Su­
res de la variable han sido agrupados en
rna de las desviaciones de las calificaciones
intervalos de clase,
respecto a la media, prescindiendo del signo,

Distnbucion de porcentajes aeumulados, Una


dividida por el mimero de calificaciones.

Abscisa (eje X). Eje horizontal de una grafica, distribucion que muestra el porcentaje acu­
hipotesis nula (caso de una muestra). Su usa
Diagrama de barras, Una forma de grafica mulado debajo del limite superior verdadero
AI azar (0 aleatorio). Un metodo para selec­ esta indicado cuando se desconoce la desvia­
donde se emplean barras para indicar la del correspondiente intervalo de clase.
cionar muestras de modo que cada muestra cion estandar poblacional (0 las desviaciones
frecuencia de las observaciones dentro de
de un tamafio dado tenga la misma oportuni­ estandar poblacionales). Distrlbncion de proporciones acumuladas.
cada categoria nominal u ordinal.
dad de ser elegida. Coeficiente de correlacien. Una medida que Una distribucion que muestra la proporcion
1
expresa el grado en que dos variables estan Diagrama de dispersion. Recurso grafico em­ acumulada debajo del limite superior ver­
Amilisis de la varianza. Un metoda, descrito pleado para representar la variacion en dos dadero del correspondiente intervalo de
inicialmente por R. A. Fisher, para descom­ relacionadas.
variables. clase.
poner la suma de cuadrados de los datos Coeficiente de determinacion (r 2 ) . EI cociente
experimentales en cornponentes conocidas de de la variacion explicada entre la variacion Diseiio antes-despues, Un disefio de muestras Distnbucion leptoeurtica, Distribucion en for­
variacion, total. correlacionadas en el que se mide a cada ma de campana, caracterizada por una con­
individuo, en cuanto a la tarea de criterio, centracion de datos en su centro.
Amilisis de la varianza con clasificacion doble, Coeficiente de no determinacion. Proporcion antes y despues de la introduccion de las
Analisis estadistico de varias categorias 0 de la variacion no explicada en terminos de la condiciones experimentales. Dlstrlbueion mesocurtica. Distribucion en
niveles de dos variables de tratamiento. correlacion entre las dos variables. forma de campana; forma «ideal» de una
Diseiio de grupo pareado. Un disefio de mues­ curva normal.
Analisis de la varianza con claslflcacion sim­ Comparaciones a posteriori. Comparaciones
tras correlacionadas en el que los individuos
ple. Analisis estadistico de varias categorias 0 no planeadas de antemano para investigar Distribucion muestral. Distribucion teorica
se clasifican por parejas de acuerdo con una
niveles de una sola variable de tratamiento. hipotesis especificas referentes a los parame­ de probabilidades de un estadigrafo, que re­
variable que sera correlacionada con la medi­
tros poblacionales. sulta de obtener todas las muestras posibles,
da de criterio. A cada miembro de la pareja se
Comparaciones planeadas 0 a priori. Compa­ Ie asignan diferentes condiciones experimen­ de un tamafio dado, de alguna poblacion.
raciones planeadas previamente a la investi­ tales. Distribueion negativamente sesgada. Distribu­
Calificacion estandar, Un valor que represen­ gacion de hipotesis especificas referentes a los
Diseiio factorial. Un disefio de investigacion cion que tiene relativamente pocas frecuen­
ta la desviacion de una calificacion especifica parametres poblacionales.
en el que a cada sujeto se Ie administra algun cias en el extremo Izquierdo del eje hori­
respecto a la media, expresada en unidades de Correlacion. Relacion entre dos variables.
desviacion estandar, nivel de cada variable de tratamiento. zontal.
Curva de frecuencia. Una forma de grafica Distrlbucion normal estandar. Distribucion
Cociente F. Un cociente entre varianzas Dispersion. EI esparcimiento 0 variabilidad
que representa una distribucion de frecuen­ normal con media 0, desviacion estandar 1, y
muestrales. de las calificaciones alrededor de la medida
cias, en la cual se usa una linea continua para area total igual a 1.00.
de tendencia central.
Cociente F. La estimacion de la varianza indicar la frecuencia de los correspondientes
entre grupos dividida por la estimacion de la datos. Djsposleien. Ordenamiento de datos de Distribucion platiciirtica. Distribucion de fre­
varianza dentro de los grupos. acuerdo a su magnitud, desde el valor menor cuencias caracterizada por un achatamiento
Curva normal. Una curva de frecuencia con
Cociente t. Una prueba estadistica para de­ hasta el mayor. en la parte central.
una caracteristica forma de campana.
terminar la significacion de una diferencia Distrtbucioa binomial. Modelo con propieda­ Distribucion positivamente sesgada. Distri­
entre las medias (caso de dos muestras) 0 des maternaticas conocidas que se usa para bucion que tiene relativamente pocas fre­
para exarninar estadisticamente la hipotesis describir ciertas distribuciones muestrales. cuencias en el extremo derecho del eje hori­
de que una media muestral dada se obtuvo de Datos. Numeros 0 mediciones obtenidas co­ zontal.
una poblacion con media especificada por la Dlstrjbueion de frecuencias. Cuando los valo­
mo resultado de observaciones,
res de una variable se ordenan de acuerdo a Distrfbueion sesgada. Distribucion que se ini­
422 ESTADisTICA PARA LAS CIENCIAS SOCIALES GLOSARIO DE TERMINOS 423

cia en forma simetrica y que se extiende hacia guardan una relacion entre sf, la cual se son exhaustivos, si ago tan todos los resulta­ la realizacion de un suceso dado no afecta a
uno de los extremos. expresa en terrninos del algebra de las desi­ dos posibles. Simbolicamente, p(A 0 B 0 ... ) = la probabilidad de la realizaci6n de otro
Distribuciones t. Distribuciones muestrales gualdades: a es menor que b, 0 a es mayor = 1.00. suceso.
teoricas de forma simetrica con media igual a que b (estas proposiciones se escriben en
Interaccion, Efecto conjunto de dos 0 mas
cero y desviacion estan dar que se hace mas notacion algebraica como a < b, 0 a > b).
factores en la variable dependiente, aparte de
pequefia conforrne aumentan los grados de Escalas continuas. Aquellas en que las varia­ Falacia «post hoc». Falsa inferencia causal los efectos separados de cualquier factor.
Iibertad (gl). Se las utiliza en relacion con el bles pueden tomar un mirnero ilimitado de proveniente de datos de correlacion,
cociente t de Student. Intervalo de confianza. Intervalo dentro del
valores intermedios. Frecuencia acumulada, EI numero de casos cual consideramos posible que se halle el
Escalas discontinuas (escalas discretas). Aque­ (frecuencias) en y debajo de un punto dado. parametro poblacional. Los intervalos de
lias en que las variables pueden tomar sola­ confianza mas frecuentes son los de 9S % y
mente un cierto numero finito de valares. 99%.
Error del tipo I (error de tipo IX). Consiste en
rechazar H 0 cuando real mente es verdadera, Estadigrafo. Numero resultante de la mani­ Grados de Iibertad (gl). El numero de valores
La probabilidad de cometer un error del tipo I pulacion de los datos muestrales de acuerdo que tienen libertad para variar despues que se
esta dada por el nivel IX. con ciertos procedimientos especificos. han impuesto ciertas restricciones a los datos.
Limites de confianza. Lirnites que definen el
Error del tipo II (error de tipo {3). Ocurre Estadigrafo A de Sandler. Un estadigrafo ri­ intervalo de confianza.
cuando se acepta H o siendo realmente falsa. gurosamente derivado del cociente t de Stu­
La probabilidad de un error del tipo II esta dent para examinar diferencias significativas Limites verdaderos de un mimero, Los limites
Hipotesis alternativa (H 1)' Una proposicion
dada par {3. \ entre muestras correlacionadas. verdaderos de un valor de una variable conti­
en la que se especifica que el parametro po­
nua son iguales a ese numero mas 0 men os la
Error estandar de Ja diferencia entre medias. Estadistica. Colecci6n de hechos numericos blacional tiene algun valor diferente al especi­
mitad de una unidad de medida.
Desviacion estandar de la distribucion mues­ expresados mediante proposiciones concisas; ficado en la hip6tesis nula,
tral de la diferencia entre medias. rnetodo para trabajar con los datos: una Hipotesis direccional. Una hipotesis alternati­
herramienta para recopilar, organizar y ana­ va donde se indica la direccion en que el
Error estandar de la diferencia media. Error
lizar hechos numericos u observaciones. parametro poblacional difiere de 10 especifi­ Media. Suma de los datos 0 valores de una
estandar que se basa en un disefio de mues­
Estadistica descriptiva. Procedimientos em­ cado en H o. variable dividida por su numero,
tras correJacionadas. Se utiliza en la t de
Student para muestras correlacionadas. plead os para organizar y presentar datos en Hipotesis no direccional, Una hipotesis alter­
Media ponderada. Suma de los productos de
forma conveniente, utilizable y comunicable. nativa (H 1) donde se afirma solamente que el
Error estandar de la estimacion, Desviacion la media de cada grupo por su ponderacion
parametro poblacional tiene un valor diferen­
estandar de los valores respecto a la recta de Estadistica inferencial 0 inductiva. Procedi­ respectiva (la N de cad a grupo), dividida por
te al especificado en H o-
regresion. mientos empleados para liegar a mayores la suma de las ponderaciones (N total).
Hipetesis nula (H o)' Una proposici6n que
generalizaciones 0 inferencias acerca de po­ Mediana. Dato 0 dato potencial de una dis­
Error estandar de Ja media. Una desviacion especifica valores hipoteticos para uno 0 mas
blaciones, basandose en datos muestrales. tribucion, arriba y abajo del cual caen la
estandar teorica de las medias correspondien­ de los pararnetros poblacionales. Frecuente­
tes a muestras de tamafio dado, provenientes Estimacion de la varianza. Suma de los cua­ mente, aunque no necesariamente, incluye la mit ad de los datos.
de alguna poblacion especificada. Cuando se drados de las desviaciones respecto a la me­ hipotesis de «no diferencia». Medicion. Asignacion de mimeros a objetos 0
basa en el valor conocido de la desviacion dia dividida por los grados de libertad.
Histograma. Una forma del diagrama de ba­ sucesos de acuerdo con conjuntos de reglas
estandar de la poblacion, ax = a/.JN; cuan­ Estimacion por intervalo. La determinacion rras que se usa para representar las distribu­ predeterminadas (0 arbitrarias).
do se estima su valor mediante una muestra, de un intervalo dentro del cual se presume ciones de frecuencias en escalas por intervalos
Sx = s/JFT=l. que este el parametro poblacional. (Compa­ Medida de tendencia central. Indice de locali­
(0 de razones).
rar con la estimacion puntual.) zacion central ernpleado en la descripcion de
Escala de intervalos. Escala cuantitativa que Homogeneidad de las varianzas. Condicion las distribuciones de frecuencias.
permite el uso de operaciones aritmeticas. EI Estimacion puntual. Estimacion de un para­ que existe cuando dos 0 mas varianzas mues­
punto cero en esta escala es arbitrario. metro poblacional constituido par un valor trales provienen de poblaciones con varian­ Metodo de los minimos cuadrados. Metodo de
aislado, obtenido mediante el criterio del zas iguales. localizaci6n de la media mediante la busque­
Escala de razones. Igual que la escala de «mejor estimador», (Cornparar con la estima­ da del valor minimo de la suma de cuadra­
intervalos, excepto que tiene un punto cero Homoscedasticidad. Propiedad que se refiere
cion par intervalo.) a que varias distribuciones tienen igual varia­ dos.
verdadero.
Estimador no sesgado de un parametro, Un bilidad (la misma varianza). Moda. Calificacion que se presenta con ma­
Escala nominal. Observaciones de variables estimador que es igual, en promedio, al valor yor frecuencia.
no ordenad as. del parametro.
Muestra. Subconjunto de una poblacion 0
Escala ordinal. Escala en la que las c1ases Exhaustivos. Se dice que dos 0 mas sucesos Independencia. Condicion que existe cuando universo,
424 ESTADfSTICA PARA LAS CIENCIAS SOCIALES GLOSARIO DE TERMINOS 425

Muestra aleatoria, Subconjunto de la pobla­ Parametro. Cualquier caracteristica medibJe a la magnitud de las diferencias entre parejas los valores bajos de una variable estan aso­
cion 0 universo seleccionado en forma tal que de una poblacion, de calificaciones. ciados con valores altos de la otra.
cada miembro de la poblacion tenga igual
Percentiles. Numeros que dividen una distri­ Prueba U de Mann-Whitney. Potente prueba Relacion positiva. Se dice que dos variables
oportunidad de ser elegido.
bucion en 100 partes iguales. estadistica no parametrica, comunmente em­ tienen una relacion positiva cuando los valo­
Muestreo aleatorio. Eleccion de muestras en pleada como una alternativa para la t de res altos de una de elias estan acompafiados
tal forma que cada muestra de tamaiio dado Poblaeion 0 universe, Conjunto completo de de valores altos de la otra. Reciprocamente,
Student euando las mediciones no alcanzan
tiene precisamente la misma probabilidad de individuos, objetos 0 mediciones que tienen los valores bajos de una variable estan aso­
la calidad de una escala por intervalos.
ser e1egida. alguna caracteristica cornun observable, 0
ciados con valores bajos de la otra.
un conjunto teorico de observaciones poten­
Mutuamente excluyentes. Se dice que los su­ ciales.
cesos A y B son mutuamente excluyentes si
Poblackin bicategorica (dicotomica), La for­ Rango. Medida de dispersion definida como
no pueden ocurrir simultaneamente, Simboli­
ma mas simple correspondiente a la escala la distancia en la escala entre las calificacio­ Sesgo. Se presenta en el muestreo cuando las
camente, para sucesos mutuamente excluyen­
tes se tiene que p(A y B) = 0.00. nominal, pues contiene soJamente dos c1ases nes mayor y menor. selecciones favorecen a ciertos sucesos 0 a
o categorfas. Rango percentil. Numero que representa eI ciertas colecciones de sucesos.
Porcentaje acumulado. EI porcentaje de casos porcentaje de los casos en un grupo que Suma de cuadrados, Suma de los cuadrados
(frecuencias) en y por debajo de un punta alcanzo valores iguales 0 menores que el de las desviaciones respecto a la media. Se la
N inflada. Error que se produce al hacer dado. citado. representa por SC.
varias observaciones sobre el mismo indivi­ Potencia de una prueba. Probabilidad de re­ Rango semi-intercuartil. Medida de variabili­ Suma de cuadrados de las desviaciones. Des­
duo y tratarlas COmo si fueran observaciones chazar la hipotesis nula cuando es falsa. dad que se obtiene restando la calificacion viaciones respecto a la media, e1evadas al
independien tes. correspondiente al percentil 25 de la califica­
Probabilidad. Teoria referente a los resulta­ cuadrado y sumadas.
Nivel alfa (IX). Nivel de significacion estableci­ dos posibles de los experimentos. cion correspondiente al percentil 75 y divi­
do por el investigador para inferir la interven­ diendo el resultado por 2.
cion de factores no aleatorios. Probabilidad condicional. La probabilidad de
un suceso, dado que ha ocurrido otro suceso. Rango truncado. Restriccion del rango de una

Nivel de significacion. Valor de probabilidad .0ambas variables, que resulta en una corre­ Teorema del limite central. Si de cualquier
Se la representa por p(A I B): la probabilidad
considerado tan raro en la distribucion mues­ lacion sumamente baja entre esas variables.
poblacion (independientemente de la distri­
de A, dado que ha ocurrido B.
tral especificada bajo la hipotesis nula, que bucion que tenga) se extraen muestras aleato­
Proporclon acumulada. La proporcion de ca­ Realizacion conjunta. Realizacion simultanea rias de tarnafio N fijo, a medida que N crece
nos inclina a aceptar la intervencion de facto­ de dos sucesos. Tales sucesos no pueden ser
res no aleatorios. Los niveles de significacion sos (frecuencias) en y por debajo de un punto la distribucion de las medias muestrales tiende
dado. mutuamente excluyentes. a la normalidad.
comunmente aceptados son 0.05 y 0.01.
Prueba X2 en una variable [tecnica de la «OOn­ Recta de regresion (recta de «mejor ajuste»).
Numeros cardinales. Niimeros usados para
dad de ajuste»). Prueba para determinar si Recta que hace minima la suma de los cua­
representar cantidades.
existe, 0 no, una diferencia significativa entre· drados de las desviaciones respecto a ella.
Numeros nominales. Numeros usados para el numero observado de casos en cada cate­ r de Pearson (coeficiente de correlacion pro­ Valor absoluto de un mimero. EI valor de un
denorninar. goria y el nurnero esperado de casos, basan­ ducto-momento). Coeficiente de correlacion numero prescindiendo del signo.
Numeros ordinales. Numeros usados para dose en la hipotesis nula. empleado con variables correspondientes a Valor de la probabilidad bilateral. Valor de la
representar posicion u orden en una serie. Prueba del signo. Prueba estadistica no para­ escalas de intervalos 0 de razones. probabilidad que tienen en cuenta las dos
metrica para variables de escala ordinal, que r de Spearman (r s 0 coeficiente de correlacion colas de la distribucion,
se usa con muestras apareadas 0 correlacio­ por ranges), Coeficiente de correlacion que se Valor de la probabilidad unilateral. Valor de la
nadas. La prueba del signo utiliza simple­ usa con datos ordenados 0 jerarquizados por probabilidad obtenido considerando sola­
Ojiva. Representacion grafica de una distri­ rangos.
mente la informacion referente a la direccion mente una cola de la distribucion.
bucion de frecuencias acumuladas de datos
de las diferencias entre parejas de califica­ Region cntica, Aquella porcion de area situa­
normal mente distribuidos. Valores crfticos de i. Valores que limitan las
ciones. da bajo la curva que incluye los valores de un
2 regiones de rechazo correspondientes a va­
Omega al cuadrado (w ) . Una estimacion de estadigrafo que nos lIevan al rechazo de la
Prueba del signo-rango de Wilcoxon para ob­ rios niveles de significacion,
Ja proporcion de Ja varianza en la variable hipotesis nula.
servaciones apareadas. Prueba estadistica no
dependiente que es tenida en cuenta por las Valores de p unilaterales. Valores de la proba­
pararnetrica para variables de escala ordinal Relacion negativa. Se dice que dos variables
variaciones en la variable independiente 0 bilidad obtenidos examinando solamente
que se usa con muestras apareadas 0 correla­ tienen una relacion negativa cuando los valo­
variable experimental. uno de los lados (cola) de la distribucion,
cionadas, Es mas potente que la prueba del res altos de una de elias estan acompafiados
Ordenada (eje Y). Eje vertical de una grafica. signo porque utiliza la informacion referente de valores bajos en la otra, Reciprocamente, Valores de p bilaterales. Valores de la proba­
426 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
[427]

bilidad en los cuales se tienen en cuenta las


dos colas de la distribucion,
Variacidn no explicada. Variaci6n de los valo­
res respecto a la recta de regresion.
Respuestas a ejercicios
Variable 0 variante. Una caracteristica o feno­
rneno que puede tomar diferentes valores.
Varianza, Suma de los cuadrados de las des­
viaciones, dividida por N.
seleccionados
Variables cualitativas. Variables que difieren Varianza dentro de los grupos. Estimacion de
en cuanto a su clase, como ocurre con el sexo. la varianza basada en la variabilidad dentro En los problemas que incluyen muchos pasos es posible encontrar en ocasiones discrepancias
Variables cuantitativas. Variables que difieren de los grupos. entre las respuestas obtenidas por el lector y las que se presentan aquf. Cuando las
en el «cuanto», como en el caso de los niveles Varianza entre grupos. Estimacion de la va­ discrepancias sean pequefias, pueden deberse a errores de redondeo. En la actualidad estas
de inteligencia. rianza basada en la variabilidad entre los disparidades son mas frecuentes a causa de las apreciables diferencias existentes en los
grupos. rnetodos empleados, 0 sea, los diversos grados de sofisticacion de las calculadoras, maquinas
Variacidn explicada. Variacion de los valo­
res estimados respecto a la media de la distri­ de sumar y calculos hechos a mano.
Varianza residual. Varianza respecto a la rec­
bucion, ta de regresion,

Capitulo 1
1. a) estadigrafo b) inferencia estadistica c) dato

d) dato e) inferencia estadistica

3•. a) con stante b) variable c) variable d) variable

e) constante f) variable g) constante h) variable

4. a) datos b) datos
5. No son estadigrafos, son datos. Los estadigrafos que pueden calcularse basandose en
estos datos incluyen la proporcion 0 porcentaje de tiros al arco convertidos en goles, etc. Para
una discusion de las proporciones y porcentajes, ver capitulo 2.)
6. (d) 7. (b) 8. (a) 9. (b) 10. (d) 11. (a)

Capitulo 2
1. a) PROPORCION PORCENTAJE b) PROPORCION" PORCENTAJE'

Muy poco 0.77 77 Muy poco 0.71 71

Suficiente 0.21 21 Suficiente 0.24 24

Demasiado 0.02 2 Demasiado 0.03 3

Sin opinion 0.01 1 Sin opinion 0.02 2

PROPORCION PORCENTAJE d) PROPORCION" PORCENTAJE'


c)
Muy poco 0.83 83 Muy poco 0.25 25

Suficiente 0.13 13 Suficiente 0.28 28

Demasiado 0.02 2 Demasiado 0.43 43

Sin opini6n 0.02 2 Sin opini6n 0.03 3

... La pequeria disparidad respecto a 1.00 y 100 sa debe


a los errores de redondeo.

Resulta que la mayoria de los encuestados desean tener mas informacion acerca de los
seismos y como prepararse para afrontarlos. Asi, los resultados contradicen el punto de vista
de que los californianos prefieren no pensar en los seismos.

2. a =5 3. y=22 4. LX = 1200 5. X = 4 6. N=40


428 ESTADisTICA PARA LAS CIENCIAS SOCIALES RESPUESTAS A EJERCICIOS SELECCIONADOS 429

7. S2 = 20 c) 13.33 d) 58.33 hombres


21. a) Adrninistracion de empresas 20.00 % b) 38.10
8. a) 100.00 b) 46.41 c) 2.96 d) om
Educacion 75.00 % 4.76 20.00 41.67 %mujeres
e) 16.46 f) 1.05 g) 86.21 h) 10.00
Humanidades 57.14 % 14.29 26.67
9. hombres = 0.77; mujeres = 0.23 Ciencias 28.57% 23.81 13.33
Ciencias sociales 50.00% 19.05 26.67
10. Armas de fuego = 0.66; arma blanca = 0.17; estrangulacion 0 golpes = 0.08; objetos
contundentes = 0.05; incendio intencionado = 0.01; otros = 0.02 22. a) continua b) discreta c) continua d) discreta e) discreta

11. suicidios = 0.5445; homicidios = 0.4555 % HOMBRES % MUJERES


23. ANO
12. (a) (b)
1950 51.31 48.69

PORCENTAJE DE HOMBRES' PORCENTAJE DE MUJERES'

ANO VICTIMAS DE HOMICIDIO 1955 51.24 48.76

VICTIMAS DE HOMICIDIO

1960 51.20 48.80

1968 13.85 13.85


1965 51.25 48.75

1969 14.14 14.67


1970 51.33 48.67

1970 15.91 15.79

1971 17.51 17.16


24. a)
1972 18.50 VARONES VARONES
17.56

AGRESIVOS NO AGRESIVOS
1973 20.10 20.98

(PORCENTAJE) (PORCENTAJE)
* La pequefta disparidad resrecto a t 00.00 S8 debe a errores de redondeo.

Intento de embriagar 37.9 9.1


a la chica
13. a) 25 b) 60 c) 37 d) 31 e) 60 f)44 Falsa promesa de matrimonio 8.0 7.5
3 N 6 N Amor fingido 44.8 14.6
14. a) IX
i=l
i b) IX
i=l
i c) IXI
i=3
d) IXI
i=4
Amenaza de terminar
la relacion
9.2 3.5

15. a) de razones b) de razones c) nominal d) ordinal


b)
16. a) de razones; continua
VARONES NO AGRESIVOS
b) Si la hora del dia se considera en el sentido restringido (de mediodia a medianoche), 50
VARONES AGRESIVOS
se pueden formular proposiciones relativas a una escala de razones respecto al
periodo de 24 horas. Si la hora del dia se toma en el sentido de un intervalo en el
tiempo cosmico, la escala es de intervalos y la variable es continua. 40

c) nominal; discontinua
...,
UJ

«

17. a) 12.65 b) 4.00 c) 1.26 d) 0.40 e) 0.13 zUJ 30
o
r:r:
18. a) -0.5 a +0.5 b) 0.45 a 0.55 c) 0.95 a 1.05 0
n,
d) 0.485 a 0.495 e) -4.5 a - 5.5 f) - 4.45 a - 4.55 20

N
19. I Xl = 4 2 + 52 + 72 + 92 + 102 + 112 + 142 = 588
10
i=l

(t xf = (4 + 5 + 7 + 9 + 10 + 11 + 14)2
INTENTO FALSA AMOR AMENAZA
60 2 = 3600,
= DE EMBRIAGAR PROMESA FINGIDO DE TERMINAR
A LA CHICA DE LA RELACION
588 =I- 3600 MATRIMONIO

20. a) discreta b) discreta c) continua d) continua c) Los resultados no respaldan la hipotesis. De hecho estan en una direccion opuesta a
e) continua f) discreta la de la hipotesis,
430 ESTADisTICA PARA LAS CIENCIAS SOCIALES RESPUESTAS A EJERCICIOS SELECCIONADOS 431

25. 4. b) i = 3
BERKELEY YALE
INTERVALOS INTERVALOS
Armas de fuego 35 40 DE CLASE DE CLASE
Envenenamiento 26 12

Asfixia 17 20
97-99 1 67-69 2
Ahorcamiento 9 24 94-96 1 64-66 1
Saito desde lugares elevados 9 4 91-93 2 61-63 2
Instrumentos cortantes 4 o 88-90 1 58-60 1
85-87 3 55-57 0
82-84 4 52-54 1
79-81 6 49-51 0
76-78 8 46-48 1
Capitulo 3 73-75 2 43-45 0
70-72 3 40-42 1

1. L1MITES PUNTO

VERDADEROS MEDIO LONGITUD


d) i = 20
c) i = 10
a) 7.5-12.5 10 5 INTERVALOS
INTERVALOS
b) 5.5-7.5 6.5 2 DE CLASE
DE CLASE
c) (- 0.5)-( + 2.5) 1 3

d) 4.5-14.5 9.5 10
90-99 4 80-99 16
e) (- 8.5)-( -1.5) -5 7 80-89 12 60-79 21
f) 2.45-3.55 3 1.1 70-79 15 40-59 3
g) 1.495-1.755 1.625 0.26 60-69 6

h) (-3.5)-(+3.5) 0 7
50-59 1
40-49 2

2. L1MITES L1MITES PUNTO


LONGITUD APARENTES VERDADEROS MEDIO
5. INTERVALOS L1MITES PUNTO
DE CLASE VERDADEROS MEDIO
i) 7 0-6 -0.5-6.5 3
ii) 1 29 28.5-29.5 29 1
9.6-9.9 9.55-9.95 9.75
iii) 2 18-19 17.5-19.5 18.5
9.2-9.5 9.15-9.55 9.35 3
iv) 4 (- 30)-( - 27) (- 30.5)-( - 26.5) -28.5
8.8-9.1 8.75-9.15 8.95 1
v) 0.01 0.30 0.295-0.305 0.30 4
8.4-8.7 8.35-8.75 8.55
vi) 0.006 0.206-0.211 0.2055-0.2115 0.2085
8.0-8.3 7.95-8.35 8.15 7
7.6-7.9 7.55-7.95 7.75 10
7.2-7.5 7.15-7.55 7.35 2
INTERVALOS L1MITES PUNTO f %
3. 6.8-7.1 6.75-7.15 6.95 4
DE CLASE VERDADEROS MEDIO ACUM ACUM
6..4-6.7 6.35-6.75 6.55 2
95-99 94.5-99.5 6.0-6.3 5.95-6.35 6.15 3
97 1 '40 100.0%

90-94 89.5-94.5· 5.6-5.9 5.55-5.95 5.75 0


92 3 39
97.5

85-89 84.5-89.5 5.2-5.5 5.15-5.55 5.35 1


87 4 36
90.0

80-84 79.5-84.5 4.8-5.1 4.75-5.15 4.95 0


82 8 32
80.0

75-79 74.5-79.5 4.4-4.7 4.35-4.75 4.55 1


77 11 24
60.0

70-74 69.5-74.5 4.0-4.3 3.95-4.35 4.15 1


72 4 13 32.5

65-69 64.5-69.5 67 3 9 22.5


60-64 59.5-64.5 62 3 6 15.0 Amplitud = 0.4
55-59 54.5-59.5 57 0 3 7.5
50-54 49.5-54.5 52 1 3 7.5 6. a) i = 7 b) 14.5-21.5 c) 18

45-49 44.5-49.5 47 1 2 5.0


7.5-14.5 11

40-44 39.5-44.5
42 1 1 2.5 0.5-7.5 4
432 ESTAOfsTICA PARA LAS CIENCIAS SOCIALES RESPUESTAS A EJERCICIOS SELECCIONAOOS 433

8. INTERVALOS INTERVALOS 13. 24.------------- ---,


OE CLASE DE CLASE
20

65-69 1 30-34 6
60-64 2 25-29 5
16

55-59 3 20-24 4
50-54 4 15-19 3 f
12 -

45-49 5 10-14 2
40-44 6 5-9 1
35-39 8 8

9. INTERVALOS INTERVALOS
OL----""­
OE CLASE DE CLASE f 112 117 122 127 132 137 142 147 152 157 162
63-67 3 28-32 o PESOS (EN LIBRAS)
58-62 o 23-27 9 14. a) histograma
53-57 7 18-22 o b) histograma 0 curva de frecuencias
48-52 o 13-17 5 c) diagrama de barras
43-47 11 8-12 o
38-42 o1 3-7 1 18.
33-37 14 GRUPO B
351­

10. INTERVALOS
OE CLASE
INTERVALOS
DE CLASE f
::~ I\~\'OA

::~ ,..--;t ,:'\

66-67 1 34-35 4
64-65
62-63
60-61
1
1
o
32-33
30-31
28-29
3
o
o
ll
58-59 o 26-27 4

o ~;"t""l I I 33I I I 451'1"'" 51


56-57 2 24-25 3
54-55 3 22-23 2 15 21 27 39
52-53 2 20-21 o
50-51 o 18-19 o 19. a) positivamente sesgada
48-49 o 16-17 2 b) normal
46-47 2 14-15 2 c) normal
44-45 7 12-13 1 d) bimodal
42-43 2 10-11 o 20. 18.--------_..---------,
40-41 o 8-9 o
38-39 o 6-7 o 16
36-37 7 4-5 1 14­

12­
11. INTERVALOS
10­
DE CLASE

60-69 3
50-59 7 6­
40-49 11 4­
30-39 14
20-29 9
10-19 5 1 I I
67 77 87 97
0-9 1
CALIFICACION
434 ESTADfSTlCA PARA LAS CIENCIAS SOCIALES RESPUESTAS A EJERCICIOS SELECCIONADOS 435

21. 24. a) 34.62% b) INTERVALOS c) f d) INTERVALOS f


80­ DE CLASE ACUM DE CLASE ACUM

70­ 92-94 1 52 90-94 1 52


60­ 89-91 0 51 85-89 2 51
86-88 2 .51 80-84 0 49
50­ 0 49 75-79 7 49
83-85
40 - 80-82 0 49 70-74 9 42
77-79 3 49 65-69 14 33
30 -
74-76 5 46 60-64 15 19
20­ 71-73 7 41 55-59 4 4
68-70 5 34
10­
65-67 10 29
62-64 11 19

59-61 4 8

56-58 4 4

22.
25.
8

oe{
wU 6
-,z
oe{w
1-0

wU
UZ 4
0::­
ow
a.O
2

I I I I I
17 27 37 47 57 67
ANO
PUNTOS MEDIOS

DE LOS INTERVALOS DE CLASE

0
m 26. 16...------------------,
23. w
a.
z - MAD RES DROGADICTAS
80
0
u ........ RESULTADO GENERAL 12
m 70
EN EL HOSPITAL
Om
1-0 60
oe{:;E
Zoe{ 8
50
80::
z(:J
40
wo
0° 4
LO 30
w N


;;foe{
1-0::
Zo
W -
20
10
..-.- ... Uli&ilii::fi ....ww ili£ o
uo::
o::w I
OLL 0
a.~ 1960
PUNTOS MEDIOS

ANO DE LOS INTERVALOS DE CLASE

436 ESTADfsTICA PARA LAS CIENCIAS SOCIALES RESPUESTAS A EJERCICIOS SELECCIONADOS 437

27. 50...--------------::"'" *30. a) SUMA DE DOS


NUMEROS f
40
12 1

11 2

:2 30­
10 3

::J
U 9 4

:: 20­ 8 5

7 6

10­ 6 7

5 6

I I I I I I I 4 5

19.5 29.5 39.5 49.5 59.5 69.5 3 4

LIMITE SUPERIOR VERDADERO


2 3

DE LOS INTERVALOS DE CLASE


1 2

0 1

N = 49

b) 8

f

0
8 9

SUMA DE DOS NUMEROS

Capitulo 4

29. a) rJl 35

o 2. a) 26.36 b) 46.82 c) 88.45



ZrJl
UJUJ
-t­ 4. a) 103.88 b) 113.03 c) 124.78
:2z
U~ 6. a) 81.02 b) 94.76 c) 88.04
«­
ZaJ
UJ«
oJ: 16.9 93.1
08 7. a) 1iO = 15.36% b) 1iO = 84.64%
0:0 15­
UJ~

:20:
c) 2.45% d) 0.18% e) 26.73% f) 3.73.%
::Jo
Zc.. 1940 1960 1980
8. b) 57, 76 c) Derecho, 60

ANO

9. 89.58 10. 54.17 11. 94.17 12. 74.17


13. 17.50 14. 79.58 15. 10.36 16. 19.17
b) Parece existir una tendencia general decreciente 17. 11.70 18. 11.04 19. 20.76 20. 10.87
438 ESTAOisTICA PARA LAS CIENCIAS SOCIALES
RESPUESTAS A EJERCICIOS SELECCIONAOOS 439

21. y 22. 12. b) MEDIANAS d) Sacando de las medias: i) fa ii) 301 iii) lo

MEDIAS
A. 88.8 F. 42.0 K. 77.2 P. 42.0 U. 42.0 f f Sacando de las medianas: i) 3 4
ii) 30 iii) 7

30 30

B. 77.2 G. 96.4 L. 61.6 Q. 25.6 V. 13.2


C. 25.6 H. 61.6 M. 4.8 R. 4.8 W. 61.6 6 1 3

D. 61.6 I. 77.2 N. 25.6 S. 0.4 X. 25.6


5 6 5

E., 42.0 J. 13.2 O. 88.8 T. 13.2 Y. 42.0


4 11 9

3 7 6

*23. 2 4 3

f %

1 1 4

SUMA f ACUM ACUM

13. La distribucion es simetrica 14. a) $3.03 b) $3.12


12 1 49 100

11 2 48 98
15. a) 71.9 b)
78
10 3 46 94

Ul
9 4 43 88
s
Cl 76
8 5 39 80
w
~
7 6 34 69
74
Ul
6 7 28 57
w
z
5 6 21 43
0 72
u
4 5 15 31
«
10 20
u
3 4 u,
2 3 6 12
::::;
«
u
1 2 3 6

0 1 1 2

I I I I I

'20 25 30 35 40 45 50

N = 49

TAMANO DE LOS GRUPOS

*24. a) 98% b) 45% c) 12% d) 12% e) 24% 17. a) 0.89 b) -5.11 18. 0.25 19. X = 164.94 20. X = 148.44

21. a) X = - 16.50 b) La diferencia entre las medias es igual a la diferencia media

Capitulo 5
22. incrernentar mediana: (c) 25. 1.83% 26. 2.08
incrementar media: (b)
1. a) X = 5.0 mediana = 5.5 mod a = 8 2. (c)
27. a) media = 30 mediana = 30 moda = 30

b) X = 5.0 mediana = 5.0 mod a = 5.0


b) media = 30 mediana = 30 mod a = 25; 30; 35

c)X=17.5 mediana = 3.83 mod a = 4


c) media = 26.0 mediana = 27.5 moda = 25; 30

4 Todas las medidas de tendencia central estaran reducidas en 5 unidades. MEDIANA MODA MODA
28. a) x (X - X) b) x (X - 27.5) (X - 25) (X - 30)
5. Todas las medidas de tendencia central quedaran divididas por 16.
6. Capitulo 3, problema 13
10
-16 10 -17.5 -15 -20

mediana = 136.32; moda = 137


25 -1 25 -2.5 0 -5

Capitulo 3, problema 20
30 4 30 2.5 5 0

36 10 36 8.5 11 6

mediana = 73.81; moda = 72

25
-1 25 -2.5 0 -5

7. X = 5.0; la mediana no cambia, la moda no cambia 30 4 30 2.5 5 0

8. a) sesgo negativo b) sesgo positivo c) no hay evidencia de sesgo


DX-X} = 0 I-9.0 6 -24
d) no hay evidencia de sesgo
9. 8(c) simetrica 8(d) bimodal 29. a) 7,7,7 b) 7,7,7 c) 7,7,7
10. X = 5.0 a) X = 7.0 b) X = 3.0 c) No cambia
30. media = 6; mediana = 6.5; mod a = 7

d) X = 10.0 e) X = 2.5
32. $4.90
31. $0.49
11. grupo A: mediana; grupo B: media 33. fabricante A: media, mediana 0 moda; fabricante B: mod a
440 ESTADfSTlCA PARA LAS CIENCIAS SOCIALES RESPUESTAS A EJERCICIOS SELECCIONADOS 441

34. a) 820.56 b) 109,135.1 35.


10. X = 7.59, S = 3.01
PRIMERA EXTRACCION

11. a) X = 63.10 b) rango = 35, rango semi-intercuartil = 4.00, D.M. = 5.61


0 1 2 3 6

4 5 c) S = 7.89, S2 = 62.25
z

Q 0
0 0.5 1.0 1.5 2.0 2.5 3.0 12. La desviacion estandar esta expresada en las unidades de medida originales, en tanto que
o
~ 1
0.5 1.0 1.5 2.0 2.5 3.0 3.5 la varianza esta expresada en el cuadrado de estas unidades.
:: 2
1.0 1.5 2.0 2.5 3.0 3.5 4.0

~ 3
1.5 2.0 2.5 3.0 3.5 4.0 4.5
13. X = 68.25, S = 7.61
<{
a
z 5
:l

4
2.0
2.5
2.5
3.0
3.0
3.5
3.5
4.0
4.0
4.5
4.5
5.0
5.0
5.5
ENERO 1965 ENERO 1966 MAYO 1965 MAYO 1966 -----­
l'l 6
3.0 3.5 4.0 4.5 5.0 5.5 6.0 76.90 70.42

w 16. a) X 35.58 38.65


Ul
b) rango 39 43 42 33

*36. D.M. 7.78 7.40 7.47 7.81


c) s 9.72 9.39 9.53 9.23

6.0 1
S2 94.48 88.17 90.82 85.19

5.5 2

5.0 3

17. $0.40; $0.40 18. a) rango = 4, S2 = 1.59; S = 1.26


4.5 4

b) rango = 18, S2 = 28.09; S = 5.3


4.0 5

19. Barrow: S2 = 0.07; S = 0.27 *20. S = 1.41


3.5 6

3.0
Burlington: S2 = 0.42; S = 0.65
7

2.5
Honolulu: S2 = 1.30; S = 1.14
6

2.0
Seattle-Tacoma: S2 = 3.31; S = 1.82
5

1.5 4
21. a) S2 = 471.04, S = 21.70
1.0 3
b) S2 = 287.37, S = 16.95
.5 2
c) S2 = 133.31, S = 11.55
o 1

N= 49

Capitulo 7

1. a) 0.94 b) -0.40 c) 0.00 d) -1.32 e) 2.23 f) - 2.53


*37. a) 2% b) 6% c) 43% d) 12% *38. Las dos medias son identicas
2. a) 0.4798 b) 0.4713 c) 0.0987 d) 0.1554 e) 0.4505

f) 0.4750 g) 0.4901 h) 0.4951 i) 0.4990

Capitulo 6
3. a) i) 0.3413; 341 ii) 0.4772; 477 iii) 0.1915; 192 iv) 0.4938; 494

1. S2 = 1.66, S = 1.29
b) i) 0.1587; 159 ii) 0.0228; 23 iii) 0.6915; 692 iv) 0.9938; 994 v) 0.5000; 500

a) no cambia b) no cambia c) aumenta d) aumenta e) disminuye


c) i) 0.1359; 136 ii) 0.8351; 835 iii) 0.6687; 669 iv) 0.3023; 302

3. S~lamente la des~iaci6n estandar satisface estas condiciones. Sin embargo, si las propie­ 4. a) aritrnetica: z = 1.21; cornprension verbal: z = 0.77; geografia: z = -0.29

dades mcluyen potencias de la constante, la varianza quedaria calificada como una medida de b) aritmetica; geografla

dispersion, 5. a) 40.13; 57.93 b) 60.26


4. Ejercicio 5.4: no cambia
6. (a), (b), (c), (d)
Ejercicio 5.5: la desviacion estandar sera dividida entre 16

7. a) z = -0.67 b) z = 0.67
5. Todas las calificaciones tienen el mismo valor
X = 63.96 X = 80.04
6. a) 3.52 b) 2.31 c) 5.89 d) 0 c) z = 1.28 d) z = 0.67
X = 87.36 calificacion por encima de 25.14 %
7. La distribuci6n es extremadamente sesgada hacia la derecha. Las desviaciones extremas e) z = -0.5 f) z = - 0.67 Y z = 0.67

aumentan el valor de la desviacion estandar. calificacion por debajo de 30.85 % 63.96 - 80.04

8. a) 10 b) 8 c) 20 d) 0 g) z = ±1.64 h) z = ±2.58

debajo de 52.32 debajo de 41.04

9. a) S2 = 16.77, S = 4.10 b) S2 = 34.77, S = 5.90 c) S2 = 26.44, S = 5.14 encima de 91.68


encima de 102.96
442 ESTADISTICA PARA LAS CIENCIAS SOCIALES RESPUESTAS A EJERCICIOS SELECCIONADOS 443

8. fl = 72, (J = 8: 9. Las relaciones no lineales dan lugar a coeficientes de correlacion r de Pearson indebida­
a) 66.64 b) 77.36 mente bajos.
c) 82.24 d) z = 1.00 10. Si el rango esta muy restringido (rango truncado), la r de Pearson sera indebidamente
e) z = -0.75 calificacion por encima de 15.87 %
baja.
calificacion por debajo de 22.66 % f) 66.64 - 77.36
g) debajo de 58.88
h) debajo de 51.36 n. r = -0.7728 12. r = 0.7614
encima de 85.12
encima de 92.64 13. a) r = -0.8924 b) r = -0.8720 c) r = 0.9729
8. fl = 72, (J = 4: 14. r =
0.85; rs = 0.81. Parece que existe una alta correlacion positiva entre las presiones
a) 69.32 b) 74.68 sanguineas de los sujetos durante las sesiones de control y de acondicionamiento.
c) 77.12 d) z = 2.00 15. rs = -0.21. Parece que existe una pequefia relacion negativa entre la cantidad de
e) z = -1.5 calificacion por encima de 2.28 % medicamento y el cambio en la presion sanguinea resultante de los procedimientos de aeon­
calificacion por debajo de 6.68 % f) 69.32 - 74.68 dicionamiento.
g) debajo de 65.44 h) debajo de 61.68
16. a) r = 0.1412
encima de 78.56 encima de 82.32
b) PORCENTAJE DEL COSTO COSTO PORCENTAJE DEL COSTO COSTO
8. fl = 72, (J = 2: 9. prueba 2, prueba 1 POR ACCION POR ACCION POR ACCION POR ACCION

a) 70.66 b) 73.34
3.82 34 8.17 29
c) 74.56 d) z = 4.00
2.43 23 2.20 15
e) z = - 3.00 calificacion por encima de 0.003 %
1.14 7 2.57 14
calificacion por debajo de 0.13 % f) 70.66 - 73.34
1.50 6 3.92 40
g) debajo de 68.72 h) debajo de 66.84
4.17 48 10.12 30
encima de 75.28 encima de 77.16 14.38 8
8.86 22
10. No; los valores z rellejan simplemente la forma de la distribucion de la cual provienen. 6.32 28 1.55 44
Las variables que se distribuyen norrnalrnente daran lugar a valores z distribuidos normal­ 0.35 20 6.64 11
mente. 7.85 46 2.03 34
7.59 22 0.46 35
11. La distribucion normal incluye una familia de curvas en forma de campana, una de las
4.43 21 5.18 17
cuales es la distribucion normal estandar ().l = 0, (J = 1.0). 7.62 16
6.71 14
12. a) 26 b) 65 c) 45 d) 50 6.22 27 3.50 42
2.10 41 4.00 40
13. a) -2.7 b) 0.0 c) 2.8 d) 1.4 e) -0.4 7.34 50
3.68 19
14. Cuanto menor sea la desviacion estandar, menores seran las desviaciones de las 7.00 41 1.94 18
calificaciones respecto a la media. Cuando se usa la media para predecir una calificacion dada, 5.78 37 8.58 45
el error sera menor, en promedio, cuando la desviacion estandar sea pequefia. En el caso 3.00 28 4.68 34
limite, cuando s = 0.00, todas las calificaciones son identicas, No hay error en la prediccion. 8.75 12

17. El grado de relacion es el mismo en ambos casos. Sin embargo, la relacion es positivaen el
primero y negativa en el segundo.
Capitulo 8 b) rs = -0.9406 20. r = 0.330; rango
18. rs = - 0.9705 19. a) r = - 0.9536
1. r = 0.8466 2. r = 0.9107 3. r, = 0.906 truncado
I

5. a) relacion no lineal b) rango truncado c) rango truncado 21. ,. = - 0.598; rango truncado 23.

6. r = 0.8260 7. r = 0; rs = 0.50 24. a) b)


••• •
5.0 l- 5.0

8. L(X-X)(Y- Y)= L(XY-XY- YX+XY)= L X Y- L X Y- LYX+NXY


4.0 I- 4.0 • •
3.0 l- • ••• 3.0 •
Puesto que IX = NX Y IY= NY, se tiene que Y
2.0 l- •••
•• Y
2.0
••
•••
L(X - X)(Y - Y) = LXY - NXY - NXY + NXY = LXY - NXY 1.0 I-
• 1.0

T·l I I I
(IX~Iy) 0.0 0.0
= LXY - N(b:)(b:) = LXY - 1.0 2.0 3.0 4.0 5.0 1.0 2.0 3.0
X X
444 ESTADfsTICA PARA LAS CIENCIAS SOCIALES RESPUESTAS A EJERCICIOS SELECCIONADOS 445

24. c) d)
5.0 ­ 5.0 I­
Y
4.0 e­ • • • • •
4.0 "-- (multiPlicando IX 2 por ~)
•• • 3.0 "-- •
• ••
•• •••
3.0 -
Asi,
-• •
Y y
2.0 l­
•• • • NIXY - (IX)(IY) NIX 2 - (IX)2

.
2.0 NIXY - (IX)(IY)
1.0 e- • • •• .... •• by = N -;- N = NIX 2 - (IX)2 .
\
I I T
1.0
• •
0.0 \
0.0 I I I I I 15. Puesto que Y = a + b}'x y a == Y- byX, tenemos que
1.0 2.0 3.0 4.0 5.0 1.0 2.0 3.0 4.0 5.0
X X Y' = Y - byX + b.X 0 Y' = Y + by(X - X).
Puesto que
25. a) (c) b) (a) c) (d) d) (b)

Capitulo 9 por sustituci6n:

1. Y' = 3 - 0.9(X - 3)
16. a) r = 0.9584
2. a) 1.72 b) 118.48 c) SO'I y = 0.3928
b) Y' para 3 = 3.222 Y' para 4 = 4.139

3. a) 1.59 b) So"y = 0.47; SO'l'" = 11.20 c) 0.1296 Y' para 5 = 5.055 Y' para 6 = 5.972

Y' para 7 = 6.889 Y' para 8 = 7.806

4. Cuando r crece, el angulo formado por las rectas de regresi6n decrece, En los casos Iirnites Y' para 9 = 8.722 Y' para 10 = 9.639

(r= ± 1.00), las rectas de regresi6n coinciden. Cuando r = 0, las rectas de regresi6n forman un Y' para 11 = 10.556

angulo recto.
.c) 54.889 d) 4.473 e) 50.424 f) 0.919
5. 9.0; la desviaci6n estandar para un grupo con el mismo CI es el error estandar de la 17. a) 5.56 b) 4.16 c) 0.857
estimaci6n: Se't)' = SyJ1="? = 9. 18. a) 4.19, 0 moderadamente feliz.
b) 8.76, 0 perfectamente feliz, porque la calificacion predicha esta mas alia del limite
6. a) 0 b) 0.60 c) 1.20 d) 1.5 e) -0.75 f) -1.20 superior de la escala.
7. a) Y' = 89.17 c) 0.03, 0 menos que una vez en el periodo de estudio de 35 dias,
b) La proporcion (p) de area correspondiente a una calificacion de 110 0 mayor es de d) 1.18 cuando el predictor es la frecuencia de relaciones sexuales, y 1.12 cuando el
0.0031

8.a)r=0.9398
c) X = 31.54
g) 500,93,93, 907
d) p = 0.4129 e) p < 0.00003

b) 50,40,60,70
C
f) X = 68.64

.
1/. t
01 Vvu.Oy
C'0.Jl/,L LI Q(\ L:;>/C)
!...!)...rye v'
(':':e 1Y\\I.\'r\-'~Y'OI'\ Y'19) ~
~
I J ~ '::,
predictor es la frecuencia de las discusiones.
e) 49.7 % queda explicada por la frecuencia de relaciones sexuales, y 54.7 % queda
explicada por la frecuencia de las discusiones. .
f) 0.50 tomando como predictor la frecuencia de relaciones sexuales, y 0.45 tomando
10. a) 33.35 b) p = 0.1539 c) 46.82 e) 53.19 . como predictor la frecuencia de las discusiones.
f) si: p = 0.4840 g) Iii; p = 0.2912
11. a) r = -0.8450 b) 3.78 Revision de la segunda parte - Estadistica descriptiva
12. Las rectas de regresion seran identicas cuando r = ± 1.00 1. A. 200

13. b) r = 0.9658 d) Chile: 429.858 Irlanda: 831.364 Belgica: 1390.606


14. b = ~)X - X)(Y - Y) 150
y SS", [formula (9.2)J

Segun la f6rmula (8.3),

50­
Puesto que NIN = 1, podemos multiplicar IXY por NIN sin cambiar su valor. Asi,
I I I I
2 3 4 5 6 7 8 9 10
POSICION FINAL
446 ESTAOisTICA PARA LAS CIENCIAS SOCIALES RESPUESTAS A EJERCICIOS SELECCIONAOOS 447

1. B. (1) 11.70 (2) 142.5 (3) 3.74 C. (1) r s = 0.106 (2) r = -0.185 b)
0.20
2. A. 40,-----------------~

0.16
C
30 «
c
:::J 0.12
cc
«
cc
20 0
a: 0.08
e,

0.04

0.00 9
0 2 3 4 5 6 7 8
'54 '58 '60 '62
MEDIA MUESTRAL CUANDO N =3
ANO
2. Una desviacion extrema es mas rara conforme aumenta el tamafio de la muestra.
2. B.
3. a) 0.0625;0.0156 b) 0.1250;0.0312 c) 0.3750;0.3125 d) 0.7500;0.6250
5

4. a) 0.6250 b) 0.1875 c) 0.2500


4
5. a) 0.6874 b) 0.3750 c) 0.1407

f 3
6. (a) y (b) c) Media = 0.00;

Desviacion estandar = 1.63

2 x pIX)

4 1 0.0123

3 4 0.0494

O'--------L----'-----4--!!::=:=:!I'-----40-.....J:--¥------.J 2 10 0.1235

7.6 7.8 8.0 8.2 8.4 8.6 8.8 9.0 9.2 1 16 0.1975

PERMANENCIA PROMEDIO EN EL HOSPITAL o 19 0.2346

-1 16 0.1975

2. C. X = 7.961, s = 0.409 D. ,. = -0.7855 (I) 39.273


-2 10 0.1235

-3 4 0.0494

Capitulo 10 -4 1 0.0123

I. a) Nx = 81 ij(Xj = 1.000

7. a) 0.2346 b) 0.6296 c) 0.0123 d) 0.0246

0.20 e) 0.0617 f) 0.0617 g) 0.1234 h) 0.8766

a ,
«
a 8. a) 0.1250 b) 0.1250 c) 0.3750 d) 0.5000
:::J
0.15
rn
d) 0.4231
« 9. a) 0.0192 b) 0.0769 c) 0.3077
co

0
0.10
a:
n, 10. Problema 1: a) 7 a 1 en contra, b) 7 a 1 en contra
Problema 2: a) 51 a 1 en contra, b) 12 a 1 en contra
0.05
II. a) 0.1667 b) 0.1667 c) 0.2778 d) 0.5000

12. a) 0.0046 b) 0.0278 c) 0.0139 d) 0.0556 e) 0.5787


o 1.5 3.0 4.5 6.0 7.5 9.0
MEDIA MUESTRAL CUANDO N = 2 13. a) 0.0129 b) 004135 c) 0.0100
448 ESTADiSTICA PARA LAS CIENCIAS SOCIALES
RESPUESTAS A EJERCICIOS SELECCIONADOS 449

14. a) 0.0156 b) 0.4219 c) 0.0123 13. Sf. HI bilateral: hay diferencia en la velocidad de acuerdo con los diferentes niveles de
15. a) 0.0838 b) 126.40 c) <68.64 y > 131.36 d) 0.4648
estimulo, HI unilateral: la velocidad es mayor cuando el estfmulo es mas fuerte.
e) i) 0.0070 ii) 0.2160 iii) 2(0.3895) = 0.0779
14. No. Las unicas desviaciones que se tiene en cuenta son las que estan en la direccion
16. (b) 17. p = l4 especificada por HI'
= 0.20 = 0.04 15. (b)
18. a) p b) p c) p = 0.80 d) p = 0.64
16. a) 1 b) 10 c) 5 d) 60 e) 50 f) 95 g) 4 h) 100
19. a) 0.6561 b) 0.0001 c) 0.3438
17. a) (h) b) (a) 18. a) (h), tipo I b) (a), tipo II
20. a) p = 0.0456 b) p = 0.0021 c) p = 0.9544

19. Basandonos en los datos, rechazariamos H o. Sin embargo, puesto que H o es verdadera,
d) p = 0.9109 e) p = 0.0228 f) p = 0.000520

cometeriamos un error del tipo I 0 tipo 0:.


21. a) t b) t c) i d) 0 20. Basandonos en los datos, no podriamos rechazar H o- Puesto que Hoes verdadera,
22. a) 1\ b) l6 c) ~ habriamos tornado una decision correcta.

23. a) t b) l6 c) ~~ 21. No podemos rechazar H o. Puesto que H o es falsa, no hemos podido rechazar una falsa
H o- Por tanto, hemos cometido un error del tipo II 0 tipo p.
24. a) 0.40 b) 0.12 c) 0.16 d) 2(0.0336) = 0.0672 22. Rechazamos H o. Puesto que H o es falsa, hemos tornado una decision correcta.
25. a) p = 0.3085 b) p = 0.2266 c) p = 0.4649

d) p = 0.2564 e) p.= 0.2934

23. Rechazamos H o. Puesto que H o es falsa, hemos tornado una decision correcta.
f) p = 0.0947 g) p = 0.3296
24. La probabilidad de cometer un error del tipo I es igual a 0:. En el caso presente, 0: = 0.05.
Capitulo 11
Capitulo 12
2. a) En el caso de que este involucrado un aspecto teorico critico, el hecho de cometer un 1. a) Cuando se incrementa el tamaiio de la muestra, la dispersion de las medias muestrales
error del tipo I podria llevar a una conclusion falsa respecto a la validez de la teoria. decrece.
b) En muchos casos en los que se estudian los efectos toxicos de nuevas drogas, la b) Cuando se incrementa el mimero de muestras, es mayor la posibilidad de obtener
hipotesis nula consiste en que la droga no tiene efectos adversos. En el caso de un valores extremos de la media muestral. Por ejemplo, supongase que la probabilidad de
error del tipo II, podria ocurrir que una droga toxica quedase introducida en el obtener una media muestral de un valor dado es 0.01. Si el numero de muestras
mercado.
extraidas es 10, no se obtendra probablemente ninguna media muestral con ese valor.
3. No puede demostrarse la validez de la hipotesis nula. EI hecho de no poder rechazar la Sin embargo, si se extraen 1000 muestras, deberia esperarse obtener aproximadamen­
hipotesis nula no constituye demostracion de que es correcta. te 10 medidas muestrales con valores tan extremos como el valor dado, de modo que
4. Todos los experimentos incluyen dos hipotesis estadisticas: la hipotesis nula y la hipotesis la probabilidad de su realizacion seria 0.01.
alternativa. Se proyecta el experimento de modo que el rechazo de la hipotesis nula lleve a la 2. Supongase que tenemos una poblacion en la que la media es igual a 100 y la desviacion
afirrnacion de la hipotesis alternativa. estandar es igual a 10. La probabilidad de obtener valores tan extremos como 80 0 menos, 0
5. H o : La velocidad es igual bajo los diferentes niveles de estimulo.
1200 mas (±2 desviaciones estandar) es 0.0456, menos del 5 %. La probabilidad de obtener
HI: Hay diferencia en la velocidad segun sean los niveles de estimulo.
valores aun mas extremos (por ejemplo, 50, 60, 70 0 130, 140, 150) es todavia menor. Asi,
deberiamos esperar que en una muestra dada se presentasen muy pocos (si es que hubiera
6. a) H o b) HIe) HId) H o alguno) de estos valores extremos. Puesto que el valor de la desviacion estandar es una funcion
7. a) tipo II b) tipo I c) no hay error d) no hay error directa del numero de valores extremos, la desviacion estandar de una muestra subestimara de
ordinario la desviacion estandar de la poblacion,
8. a) tipo II b) tipo II c) no hay error
3. a) 21.71-26.29 b) 20.82-27.18 4. a) 23.28-24.72 b) 23.05-24.95
9. Es mas probable que se este aceptando una falsa H o, puesto que es bastante pequeiia la
probabilidad de que el suceso observado ocurra por azar (p = 0.02). 5. Se rechaza H o : z = 2.68, donde ZO.OI = ±2.58
10. Simplemente por azar, cab ria esperar que cinco diferencias fueran estadisticamente 6. Se acepta H o ; t = 2.618, donde t o.OI = ±2.831, gl = 21
significativas al nivel 0.05. 7. En el problema 5 se conoce el valor de la desviacion estandar poblacional; podemos
11. Simplemente por azar, cabria esperar que cinco diferencias fueran estadisticamente emplear asi el estadigrafo Zy determinar los valores de la probabilidad en terminos de areas
significativas al nivel 0.01. bajo la curva normal. En el problema 6 se desconoce el valor de la desviaci6n estandar
12. Sf. poblacional, y debemos estimarlo mediante los datos muestrales. Asi, el estadigrafo empleado
es el cociente t.
450 ESTADfSTICA PARA LAS CIENCIAS SOCIALES 451
RESPUESTAS A EJERCICIOS SELECCIONADOS

Puesto que las distribuciones t son mas dispersas que la curva normal, la proporcion de area a
29. Las distribuciones t son mas dispersas que la curva normal. Asi, la proporcion de area a la
la derecha de un valor especifico de t es mayor que la proporcion de area a la derecha del
derecha de un valor especifico de t es mayor que la proporcion de area a la ~erecha del
correspondiente valor de z. Se requiere asi un mayor valor de t para marcar los hmites de la
correspondiente valor de z. Conforme aumenta el mimero de grados de libertad, las
region critica 0 de rechazo. En el problema 5, el valor absoluto de la z obtenida debe ser igual 0
distribuciones t se aproximan cada vez mas a la curva normal.
mayor que 2.58. En el problema 6, el valor absoluto de la t obtenida debe ser igual 0 mayor
que 2.83.
30. a) X, - x2 pIX, - J(2) cs!
Generalizando: la probabilidad de cometer un error del tipo II es menor cuando conocemos la
desviacion estandar poblacional. 9 1 0.0083
8 2 0.0165
8. Se rechaza H 0; t = 2.134, donde t o.0 5 = 1.833 (prueba unilateral), gl = 9
7 5 0.0413
9. a) z = 2.73, p = 0.9968 b) z = -0.91, p = 0.1814
6 10 0.0826
c) z = 1.82, p = 0.0344 d) p = 0.6372
5 14 0.1157
4 18 0.1488
10. a) 36.70-43.20 b) 35.79-44.21 I l. a) t = 1.706 b) t = 11.19
3 21 0.1736
12. t == 2.083, gl = 25 13. 27.14-32.08 14. t = 1,75, gl = 625 15. 263.34-273.66 2 18 0.1488
1 14 0.1157
16. a) Ji = 6.0, a = 3.42 17. a) p = /5 b) P = h c) p = 1
85
d) P =0
0 10 0.0826
18. a) p = /2 b) P = /2 c) P = ~ d) p = -if; -1 5 0.0413
-2 2 0.0165
19. X- Jio = 0.42, Sx = 0,2315, t = 1.814, gl = 7
-3 0.0083
1
20. X- Jio = 1.38, S.Y = 0.58, t = 2.379, gl = 9
Nil, -II, = 121 L.PIX1 - X2 ) = 1.0000
21. La conclusion depende de la naturaleza de la hipotesis alternativa. Si HIes direccional y
usamos o: = 0.05, rechazamos H 0 ya que el valor 0.438 obtenido para r s es mayor que el valor
requerido (interpolando para N = 17, el valor critico de r s para o: = 0.05, prueba unilateral, es b) La media de las diferencias es igual a 3. La media de la distribucion muestr~l de las
0.412). Sin embargo, si usamos una prueba bilateral, debernos aceptar H o­ diferencias entre medias es igual a la diferencia entre las medias de las poblaciones de
22. EI valor critico de rs para N = 25 (rx. = 0.05, prueba bilateral) puede obtenerse por las cuales provienen estas muestras.
interpolacion: 0.409 para N = 24, 0.392 para N = 26; asi, el valor critico para N = 25 es · -
31. a) H 0'Jil-Ji2'. 0 sea , son iguales las dos poblaciones de medias de las cuales se toman
00400. Puesto que el valor absoluto de la I"s obtenida es menor que el valor critico, aceptamos las muestras. . . ..'
u.. b) La distribucion muestral de las diferencias entre las medias bajo la hipotesis nula.
23. a) z = 1.01 b) z = 1.99
24. Los estadigrafos usados para describir la distribucion de una muestra son X (media) y S c) XI - X, p(XI - X,l
(desviacion estandar). El estadigrafo usado para describir la distribucion de un estadigrafo
6 1 0.0083
muestral son la media (Jix) y el error estandar de la media (ax).
5 2 0.0165
25. S2 no es un estimador no sesgado de a 2 . Cuando usamos N en el denominador de la 4 5 0.0413
formula de la varianza, subestimamos la varianza poblacional (S2 = SCIN). 3 10 0.0826
2 14 0.1157
26. 52 es un estimador no sesgado de a 2 puesto que se usa N - I en el denominador de la
1 18 0.1488
formula S2 = SCj(N - 1).
0 21 0.1736
27. Al intervalo dentro del cual es probable que este la media poblacional se Ie llama intervalo -1 18 0.1488
de confianza. -2 14 0.1157
-3 10 0.0826
28. Usando el ejernplo dado en la seccion 12.7 del texto, obtenemos el intervalo de confianza -4 5 0.0413
de 99 %: -5 2 0.0165
-6 1 0.0083
limite superior = 108 + (2.787)(3.0) = 116.36,
limite inferior = 108 - (2.787)(3.0) = 99.64.
32. a) 0.0496 b) 0.0083 c) 0.1487 d) 0.0166 e) 0.0083

Asf, los limites del intervalo de confianza de 991'~ son 99.64-116.36, en tanto que los limites del 33. a) 0.2644 b) 0.1487 c) 0.0083 d) 0.1487 e) 0.0000
intervalo de confianza de 95 % son 101.82-114.18.
35. t = 4.28 36. '1"(0.05) = 0.450 37. t=4
452 ESTAOfSTICA PARA LAS CIENCIAS SOCIALES RESPUESTAS A EJERCICIOS SELECCIONAOOS 453

38. a) Casados: t = 5.219, gl = 51, p < 0.05 18. a) p = 0.7778 b) p=0.6111 c) p = 0.3889 d) p = 0.2222
Divorciados: t = 0.329, gl = 22, no significativo e) p = 0.0833 f) p = 0 g) p = 0.4722
b) Casados: t = 1.688, gl = 51, no significativo

19. PI = 5.0, (JI = 2.24; /1z = 4.0, (Jz = 2.24


Divorciados: t = 0.615, gl = 22, no significativo

20. a) z = -1.59, p = 0.9441 b) z = 0.00, p = 0.5000


c) z = -1.59, p = 0.0559 d):: = - 3.18, p = 0.0007
Capitulo 13 e) z = 4.76, p = 0.00003 f) p = 0.5007 g) P = 0.0559
1. t = 2.795, se rechaza H o 2. t = 1.074, se acepta H o 3. t = 0.802, se acepta H 21. a) :: = -0.63, p = 0.2643 b) z = -0.94, p = 0.1736
o
c) z = -1.27, p = 0.1020 d):: = -1.92, p = 0.0274
4. a) t = 3.522, se rechaza Hob) F = 3.00, se acepta H 0
5. a) z = 1.41, p = 0.0793 b) z = - 2.12, p = 0.9830
22. t = - 5.399 23. z = 3.33 24. t = 24.50
c) z = - 2.12, p = 0.0170 d) z = - 5.66, p < 0.00003
25. t = 5.02 26. F ='1.66 27. t = 1.76
6. a) z = -0.71, p = 0.7611 b) z = -1.06, p = 0.8554

c) z = -1.41, p = 0.9207 d) z = -1.77, p = 0.9616


28. :: = 2.29 29. t=-6.88 30. F = 1.27

7. 31. t = 1.63, gl = 8; se acepta H o 32. t = 0.77, gl = 8; se acepta H 0


33. a) SCI = 74.28, SC z = 284.57 b) SCI = 30.00, SC z = 11.2
X I = 0.40 X z = 1.86 Xl = 13.00, X z = 10.40
p t = 2.281, gl = 62 t = 3.206, gl = 17

La probabilidad de encontrar una diferencia en la direc­ (1Jz = 0.328


cion correcta entre medias muestrales aumenta cuando ui = 0.062

0.500
N crece.

Capitulo 14
l. t = 3.027, gl = 16; se rechaza H O'
16 25
N 2. t = 2.08. gl = 32; se acepta H o­
8. t = 2.148, gl = 14 9. t = 2.913, gl = 18 10. t = 2.304, gl = 26 3. t = 1.571, A = 0.465, gl = 9; se acepta H o·
11. a) SCI =13696.06, SC z = 24027.66 b) SCI = 910.32, SC z = 1590.21 4. r s entre la posicion final y los home runs en la Liga Americana es 0.04; para la Liga
Xl = 17.82, K z = 19.59 K t = 1.75, X z = 1.61 Nacional es 0.36. Ambas correlaciones son demasiado bajas para que se justifique eI uso de
t = 7.080, gl = 1632 t = 2.333, gl = 1632 muestras correlacionadas.
(1Jz = 0.029 (jJz = 0.003
5. t = 1.590, gl = 18, se acepta H o- EI cociente t obtenido esta mas cercano a la region de
12. SCI = 88.06, SC z = 93.64 13. t = 2.224, gl = 28 14. t = 0.583, gl = 34
X I = 1:37, X z = 1.09
rechazo porque el nurnero de grados de Iibertad es mayor (18 frente a 9) cuando usamos
t = 0.994, gl = 95
muestras independientes.
15. t = 1.864, gl = 126, p < 0.05, prueba unilateral, (1Jz = 0.019 6. a) Mayor riesgo de un error del tipo II a causa de la perdida de grados de libertad.
16. a) falso b) verdadero c) falso b) Menor riesgo de un error del tipo II a causa de la mayor sensibilidad del error estandar
de la diferencia.
17. 9 X, - Xl
7. a) A = 0.048 b) A = 0.048 c) A = 0.778 8. A = 0.199
8
5 1
... 104.82 - 100
4 2 9. Fabricante A: t = - -1.63
- - - = 2.96' ~ul = 10'.
6 3 5
f 5 2 6 101.91 -100
1 8 Fabricante B: t = - -1.39
- - - = 1.37. ~ul = 10.
4
0 6
3 -1 5 Usando = 0.05 (prueba bilateral), aceptamos H o para By rechazamos H o para A.
IX
-2 2
2 10. Fabricante A: A = 0.195; fabricante B: A = 0.573 11. A = 0.216 12. A = 5.480
-3 1
13. A = 0.226 14. A = 0.230 15. A = 0.422 16. A = 1.625 17. t = 8.22
0
-3 -2 -1 0 1 2 3 4 5 18. A = 0.3056 19. A = 0.6406 20. A = 0.3696 21. A = 19
X'-X2 22. A = 0.295
454 ESTAOiSTICA PARA LAS CIENCIAS SOCIALES RESPUESTAS A EJERCICIOS SELECCIONAOOS 455

23. a) A = 0.266, gl = 4. Puesto que este valor es menor que el valor critico de 0.304, 10. FUENTE SUI\.A GRADOS ESTIMACION
rechazamos H o' Los varones heterosexuales muestran mayor respuesta pupilar ante DE VARIACION DE CUJ\DRADOS DE L1BERTAD DE LA VARIANZA
las fotograffas de mujeres que ante las fotografias de hombres.
b) A = 0.494, gl = 4. Puesto que este valor es mayor que el valor crftico de 0.304, no Entre grupos 12.067 1 12.067 3.102
podemos rechazar H o· No hay evidencia estadistica significativa de que los varones Dentro de grupos 108.934 28 3.8905
hornosexuales muestren mayor respuesta pupilar ante las fotograffas de hombres que
Total 121.0 29
ante las fotografias de mujeres.
c) t = 3.472, gl = 8. Puesto que este valor es mayor que el valor critico de 2.306,
rechazamos H o- Existe una respuesta diferente de los varones heterosexuales y de los
varones homosexuales ante las fotografias de hombres y de mujeres.
11. FUENTE SUMA GRADOS ESTIMACION
24. Como estadistico, el lector queda impresionado al rechazar H o con una N pequefia. La
DE VARIACION DE CUADRADOS DE L1BERTAD DE LA VARIANZA
razon es que el efecto del tratamiento ha de ser grande, en relacion con el error estandar de la
diferencia, para rechazar H 0 cuando N es pequefia. Dada una N bastante grande, serian Entre grupos 919.793 3 306.598 6.43
rechazadas virtualmente todas las hipotesis nulas. En muchos casos el efecto descrito seria Dentro de grupos 954.167 20 47.708
trivial.
Total 1873.96 23
25. a) t = 4.432, gl = 43, p < 0.05 b) t = 3.69, gl = 44, p < 0.05
c) Antes: limite inferior = 1.04; limite superior = 1.59. Despues: limite inferior = 1.60;
limite superior = 2>.67

12. FUENTE SUMA GRADOS ESTIMACION

Capitulo 15 DE VARIACION DE CUADRADOS DE L1BERTAD DE LA VARIANZA

Entre grupos 26.80 2 13.4 9.348


1. F = 47.02; se rechaza H o. Dentro de grupos 17.20 12 1.43

2. Todas las comparaciones son significativas al nivel 0.01. Esta claro que el menor indice de Total 44.00 14
mortalidad corresponde al verano, y luego siguen, en orden creciente, la prirnavera, el otofio y
el invierno.

3. F = 0.643 13. La unica cornparacion significativa al nivel 0.01 es entre el grupo C y el grupo A.
4. Cuando usamos el nivel 0.05, una de cada veinte comparaciones sera significativa por
azar. Asi, una diferencia significativa, al nivel 0.05, en uno de cada diez estudios puede ser
14. FUENTE SUMA GRADOS ESTIMACION

atribuida al azar.
DE VARIACION DE CUADRADOS DE L1BERTAD DE LA VARIANZA

5. F = 0.30, gl = 3/12.
Entre grupos 285.431 2 142.716 1.606
6. F = 10.43, gl = 2/12, DHS = 7.16 Dentro de grupos 2843.312 32 88.854

7. F = 12.99, gl = 5/18, DHS = 6.02 Total 3128.743 34

8. Si el cociente F es menor que 1.00, concluimos que los gfupos provienen probablemente
de la misma poblacion,

9. 15. FUENTE SUMA GRADOS ESTIMACION

FUENTE SUMA GRADOS DE VARIACION DE CUADRADOS DE L1BERTAD DE LA VARIANZA

ESTIMACION
DE VARIACION DE CUADRADOS DE L1BERTAD DE LA VARIANZA
Entre grupos 15.8645 3 5.288 15.57
Entre grupos 1.083 2 Dentro de grupos 6.7917 20 0.3396
0.5415 0.6228
Dentro de grupos 13.042 15 0.8695
Total 22.6562 23
Total 14.125 17
Comparaci6n de A y 8 DHS = 1.19 para a. = 0.01.
456 ESTAOfSTICA PARA LAS CIENCIAS SOCIALES
RESPUESTAS A EJERCICIOS SELECCIONAOOS 457

16. FUENTE SUMA GRADOS


DE VARIACION DE CUADRADOS
ESTIMACION Paso 2: el valor critico de X es 71.165.

DE L1BERTAD DE LA VARIANZA Paso 3: el valor critico de X tiene un valor z en la distribucion bajo H 1 de -1.67.

Combinaciones de tratamientos 169.04 8


Asi, la potencia de la prueba es 95.25.

Variable A 7.37 2 3.68 0.35 3. 28.77%.


Variable B 161.37 2 80.68
A x B
7.64 4. a) (1) 0; (2) P = 0.1685; (3) Potencia = 0.8315

0.30 4 0.08 0.01


Dentro (error) 475.33 45 10.56 b) (1) IX; (2) P = 0; (3) EI concepto de potencia no se aplica.

5. a) 5.26 % b) 10.20 % c) 17.88 % d) 28.77 %


Total 644.37 53
6. Puesto que la correlacion es tan baja, perdemos la ventaja de usar muestras correlacio­
nadas.
17. FUENTE SUMA GRADOS ESTIMACION
DE VARIAC ION
7. La realizacion de una investigacion consume tiempo, esfuerzos y dinero. Cuando la
DE CUADRADOS DE L1BERTAD DE LA VARIANZA potencia para rechazar una falsa hipotesis nula es baja, solamente estaremos malgastando eI
Combinaciones de tratamientos 95.33 5
dinero. A veces un pequefio incremento del tiempo, de los esfuerzos y de los gastos puede ser
Variable A 80.66 1 80.66
suficiente para incrementar 'Ia potencia de una prueba a niveles que justifiquen el riesgo.
17.31
Variable B 1.13 2 0.56 00.12 8. La potencia es la probabilidad de rechazar una hipotesis nula falsa. Si la hipotesis nula es
AXB 13.54 2 6.77 1.45 verdadera, no existe hipotesis nula falsa que podamos rechazar.
Dentro (error) 84.00 18 4.66
9. Cuando la hipotesis nula es falsa, su rechazo es la decision estadistica correcta. EI
Total 179.33 23 concepto de error del tipo I no es simplemente aplicable.
10. a) 80 b) 67 c) 57 d) 50 e) 40
11. Factores que afectan la potencia:
Revision de la tercera parte - Estadistica inferencial (1) Tamafio de la muestra: cuando N crece, la potencia crece.
(2) Nivel z: cuanto mayor sea el nivel a que fijemos, mayor sera la potencia de la prueba.
A. Pruebas parametricas (3) Naturaleza de la hipotesis alternativa: la prueba unilateral es mas potente que la
1. a) J1 alternativa bilateral (a menos que eI parametro este en una direccion opuesta a la
= 4, (J = 1.15
predicha).
b) x c) x p d) 0.82 e) 0.82 f) i) 0.0123
(4) Naturaleza de la prueba estadistica: las pruebas parametricas son mas potentes que
sus correspondientes no parametricas (suponiendo que sean validas las hipotesis
2 ii) 0.1852 que facuItan el uso de la prueba parametrica),
1 2 0.0123
2.5 4 2.5 0.0494
iii) 0.3704 (5) Medidas correlacionadas: cuando los sujetos han sido acertadamente apareados
3 10 3 0.1235
respecto a una variable correlacionada con la variable de criterio, una prueba
3.5 16 3.5 0.1975
estadistica que tenga en cuenta esta correlacion es mas potente que otra que no la
4 19 4 0.2346
tome en cuenta.
4.5 16 4.5 0.1975
La potencia puede incrementarse:
5 10 5 0.1235
(1) Aumentando el tamafio de la muestra.
5.5 4 5.5 0.0494
(2) Tomando un IX mayor (por ejemplo, 0.05 en vez de 0.01).
6 1 6 0.0123
(3) Empleando una hipotesis alternativa unilateral.
, (4) Empleando pruebas parametricas en vez de no parametricas.
2. a) t = 1.856, gl = 8; se acepta H o• b) t = 2.727, gl = 18; se rechaza H o• (5) Empleando medidas correlacionadas, si es apropiado.
3. a) A = 0.210, gl = 4; se rechaza H o• b) A = 0.111, gl = 9; se rechaza H o•
4. F = 1.64, gl = /7'
Capitulo 17
Capitulo 16 1. a) p = 0.070 b) p = 0.020 c) p = 0.040
2. a) p < 0.0003 b) p= 0.0003 c) p = 0.1335
1. N. = 30
2
4. N hinchada 5. X = 6.00, gl = 3
2. Paso 1: el valor de (Jx es 0.5.
6. Prueba binomial, N = 8, x = 6, P = 1, Q = t; se rechaza H o al nivel IX = 0.05.
458 ESTAOISTICA PARA LAS CIENCIAS SOCIALES [459]

7. X2 = 1.941, gl = 1

8. P = 0.20 (1/5), Q = 0.80 (4/5), N = 6

Iodice de materias
6 5 4
3 2 o
A de Sandler, 267
potencia, 309, 310

1 , 24 240 1280 3840 6144 equivalencia con el cociente t para mues­


Caso de una variable, prueba binomial, 321­

4095
15625 15625 15625 15625 tras correlacionadas, 267, 268
325

15625 15625 15625


grados de libertad, 267
aproximacion de la curva normal a la bi­

0.000 I 0.002 0.015 0.082 0.246 0.393 0.262


I tabla de valores criticos, Tabla E, 380
nomial, 325, 326

Abscisa, 41, 43, 147


chi-cuadrado, 326-328

9. X2 = 2.185, gl = 1
Analisis de la varianza (vease tarnbien Co­
Causalidad y correlacion, 159-161

10./0= 5 15
ciente F), 276-300
Cero, absoluto, 25

J. = 10 10
clasificacion:
arbitrario, en escalas de intervalos, 25, 26

.2 _ (5 - 10)2 (15 - 10)2


doble, 288-290
Cociente F (vease tambien Amllisis de la va-

Z - 10 + 10 = 5.00.
simple, 287, 288
I'ianza)

cociente F y, 250, 251, 282, 283


distribucion, 250

EI valor de Z2 es: cornparacion:


en comparaciones de varios grupos, 276

de dos grupos, 277-283


formulas, 282

z
2
=
((5 - 10))2
,)5.00 = 5.00 = <. de tres grupos, 284, 285

comparaciones de varios grupos en, 276,

grados de libertad, 282, 283, 285

homogeneidad de la varianza, 250, 251

relacion con el cociente r, 277, 278, 283

n. X2 = 6.00, gl = 3 12. X2 = 3.60, gl = 3


277

conceptos fundamentales, 283


tabla de valores criticos, Tabla D, 374

13. x = 28, N = 46 (tabla M), valor entice = 31; no podemos rechazar H 0 descomposicion de la sum a de cuadrados,
Coeficiente (vease tam bien I' de Pearson: rs de
2 290-296
Spearman)
14. X = 20.452, gl = 1 15. Z2 = 12.5, gl = 2 16. 7. 2 = 3.5, gl = 2

disefio factorial, 288-290


de correlacion (veanse Correlacion, r de
2

17. X = 7.86, gl = 5 18. z = 2.108 19. = 4.44, gl = 1


1.: estimaciones de la varianza, 277-280, 282,
Pearson, Reqresion y prediccion, rs de
2
20. 7. = 12.81, gl = 2 2
21. X = 8.077, gl = I 22. X2 = 8.869, gl = I 283
Spearman)
hipotesis nula en el, 283
de correlacion del producto-momento
omega al cuadrado y, 287, 288
(vease r de Pearson)

Capitulo 18
pruebas de comparaciones multiples, 286
de determinacion, 158

prueba DRS, 286


de no determinacion, 159

suma de cuadrados, 277-281


Coeficientes binomiales, tabla de, Tabla L,
1. a) Prueba del signo N = 10, x = 7 b) N = 10, T= 10 c) U = 23, U' = 77

sum a total de cuadrados, 277-281


390

2. = 9.5, U' = 62.5


U 3. U = 18, U' = 103 4. T= 11.5 5 T= 48
varianza entre grupos, 278-280, 282
Cornparacion de varios grupos, 276, 277

6. U = 25, U' = 75 7. Prueba del signo N = 10, x = 6; Wilcoxon, T= -12


Aproximacion normal a la binomial, 325, 326
Comparaciones:

Areas, region critica, 220, 221


a posteriori, 286

8. T = - 7.5 9. U' = 89, U = 11

bajo la curva normal estandar, 111-113


prueba DRS, 286

para representar frecuencias, 47, 48, 51,52


a priori 0 planeadas, 286

probabilidades para variables continuas,


Continuidad, correccion para, chi-cuadrado,

Revision de la tercera parte - Estadistica inferencial 187


327, 328

... aproximacion normal a la binomial, 325,

B. Pruebas no pararnetricas 326

Bilateral, definicion, 425

hip6tesis, 208, 209


Coordenadas, 46, 147

1. U = 54.5, U' = 89.5 2. Pruebadel signo, N = 12, x = 2


3. T= 11
Correccion para rangos empatados, prueba

probabilidad, 189-191

Bondad de ajuste, 327


U de Mann-Whitney, 340, 341

por continuidad (vease Continuidad, co­


Caso de una muestra:
rreccioll para)

parametres:
Correlaci6n (veanse tambien r de Pearson,

conocidos, 219-221
reqresion y prediccioll, rs de Spearman),

desconocidos: t de Student, 226-230


122-142

460 ESTADfSTICA PARA LAS CIENCIAS SOCIALES fNDICE DE MATERIAS 461

concepto de, 122-126


examen estadistico de hipotesis, 219, 221
Ejes de coordenadas, 45, 46, 146, 147

simetrica, 53

definicion, 420
formulas, 98-101
Enfoque, de la probabilidad:
t, 226-229

diagrama de dispersion, 126, 132


interpretacion, 102
clasico, 178

Distribuci6n binomial, distribucion muestral


relacion:
varianza, 97-102
em pi rico, 178, 179

y, 177, 202

negativa, 123
y distribuci6n normal estandar, 1'07-121
Error alfa (ex), 207, 208

definicion, 421

positiva, 123
Desviacion media, 97
aleatorio, 259

tabla de probabilidades asociadas, Tabla

tabla de funciones de 1', Tabla T, 383


calculo de la, 96
contribucion de las diferencias individua­
M,391
tabla de valores criticos de la r s de Spear­
calculo de la I' de Pearson por el rnetodo de
uso de (vease prueba binomial, prueba del les aI, 259

man, Tabla G, 382


la, 128, 129
de medida, 27, 28

sigllo)
transforrnacion de I' a z, Tabla F, 381
como estimacion del error, 97
Distribucion de frecuencias (vease tam bien desviacion estandar como estimacion del,
y causalidad, 159-161
definicion, 421
Graficas, tipos de), 39, 41-43
117,118
Curva de frecuencias, definicion, 420
Diagrama:
tipo I (vease Error del tipo I)
acumuladas, 44, 45

acumuladas, 52
de barras, 46, 47-49
. tipo II (vease Error del tipo II)
agru padas, 42

formas de, 52-54


de dispersion, 124, 126, 127, 132, 152, 153
Error beta (p) (vease tam bien Error del tipo
definicion, 421

normal (vease Distribucion normal)


Diferencia entre medias (vease tam bien no agrupadas, 77, 79
II), 208

M uestras correlacionadass porcentajes acumulados, 45


Error estandar de la diferencia:
distribucion muestral de la, 243
Distribucion de frecuencias acumuladas, 44,
definicion, 422

Chi-cuadrado, 326-333
media, 243
estimacion, 245, 246

45

bondad de ajuste, 327


error estandar, 245
rnetodo de la diferencia directa, 264, 265

definicion, 421

caso de dos variables, 328-331


Disei'io:
Error estandar de la estimacion, 152-165

ojiva, 54

caso de una variable, 326-328


de experimentos, 10
cornparacion con la desviacion est an dar,
Distribucion muestral, 199, 201, 202

grados de libertad, 328


factorial, 288-290
154

definicion, 421

hipotesis nula en, 327


Dispersion, definicion, 421
definicion, 422

de la diferencia entre medias, 243, 245

Iimitaciones de la, 331-333


medidas de la, 92-106
homoscedasticidad, 155

de la media, 216-219

prueba de independencia, 328, 331


Disposiciones, 80
Distribuci6n normal, areas bajo la curva,
relacion con la varianza residual, 154

tabla de valores criticos, Tabla I, 385


Distribucion:
Error estandar de la media, 217

111-1/3

bimodal,54
tabla de proporciones, Tabla A, 369
definicion, 422

binomial, 202
calificaciones estandarizadas, 107, 110,
muestras correlacionadas, 262, 263

Datos, definicion, 420


de frecuencias, 39-43
Error debido al azar, 276, 277

111

agrupados, 39-43
acumuladas, 44
Error del tipo I:
ecuaci6n, 111

en intervalos de clase, 42
agrupadas, 42
probabilidad, 187-188
definici6n, 422

categoricos, 6, 24
no agrupadas, 77, 79
propiedades, 52, Ill, 112
prueba de hipotesis y, 208-210

de atributos, 24
del cociente F, 250
representaci6n grafica, 53
y comparaciones de varios grupos, 276,

de escala, 8
en forma de J, 54
277

valores z, 110, III

de frecuencias, 6, 8, 24
en forma de U, 54
Y desviacion estandar, 107-119
y potencia, 305, 306, 311, 316

enumerativos, 6, 24
Ieptocurtica, 52
Distribucion normal estandar, area entre Error del tipo II:
Decision en una prueba de hipotesis, 202-205
rnesocurtica, 52
dos puntos, 112, 113
definicion, 422

Dependencias (veanse tam bien Correlacion;


muestral, 177, 199, 201, 202
prueba de hipotesis y, 208-210

area bajo la, 111

Chi-cuadrado, prueba de independen­


multi modal, 83
caracteristicas de la, 111-1/3
Y potencia, 305, 306, 311, 316

cia; Muestras correlacionadass, 185


negativamente ;esgada, 54
definici6n, 421
Escala de intervalos, propiedades que la
Desigualdades, algebra de las, 24
normal, 52, 54
definen, 25

parametros de la, III

Desviacion (veanse Desoiacion media.. Desoia­


estandar, 111-113
problemas ilustrativos, 114-116
representacion grafica, 49-52

cion estandars
ojiva, 54
Escala de razones, 25

Desviacion estandar: platicurtica, 52


Escala ordinal, 24

calculo de la:
porcentaje acumulado, 45
definicion, 422

Eficiencia, 316, 317

rnetodo de la desviacion media, 98, 99


positivarnente sesgada, 54
desigualdades, algebra de las, 24

Eje:

metodo de las calificaciones originales,


probabilidad, 179-181, 190
horizontal, 45, 46, 146, 147
propiedades, 24

99-101
proporcion acumulada, 44, 45
prueba de hipotesis, 337-348

vertical, 45, 46, 146, 147

errores, 102
rectangular, 53
I' de Spearman, 133-135

X, 45, 46, 146, 147

estirnacion del error, 117, 118


sesgada, 54
rangos ernpatados, 133, 340, 341

Y, 45, 46, 146, 147

462 fNDICE DE MATERIAS 463


ESTADfSTlCA PARA LAS CIENCIAS SOCIALES

rangos y, 24
curva J, 54
Libertad, grados de (vease Grados de liber­
del tipo I, 207, 208
tad) .
representacion grafica, 50
diagrama de dispersion, 124, 126, 132,

del tipo II, 208-210

Escalas de medida:
152, 153
Lirnites, aparentes, 43

estimacion de parametros, intervalos, 230,


confianza, 231-234

continuas, 26, 27
231
frecuencias acumuladas, 44, 45

discontinuas, 26, 27
grafica «[Gee Whiz!», 45
de numeros, 27, 28

puntual, 221, 224, 225


de un intervalo de clase, 43

discretas, 26
hipotesis:
grafica lineal, 54, 55

intervalo, 25
histograma, 49-51
verdaderos, 27, 28

alternativa, 205

nominal, 22-24
ojiva, 54
Limites verdaderos de numeros, 27, 28

nula, 205
Linealidad, hipotesis de, efecto sobre la co­

ordinal, 24
porcentajes acumulados, 44

intervalos y limites de confianza, 231-234


rrelacion, 130

Escalas norninales, 22-24


Grupos apareados (vease Muestras correla­
media poblacional y desviacion estandar
Longitud del intervalo de clase, 42

representacion grafica, 47, 48


conocida, 219-221
cionadas)
Estadistica:
muestras correlacionadas, no pararnetri­

definicion, 422
ca, 342-345

descriptiva, 6, 8, 9
pararnetrica, 259, 262-267
Heterogeneidad de la varianza, 250

inferencial, 6, 10
nivel de significacion, 202-205
Media:

Hipotesis, aceptacion de la, 205-207


aproximacion normal a la binomial, 325,

mal uso de la, 11


potencia de una prueba, 305-316
error del tipo II, 208, 209, 316

Estadistica descriptiva, 37-170


prueba indirecta, 206, 207
326

alternativa, 205
error estandar de la, 216-219, 221, 224,

definicion, 422
region critica, 220, 221
direccional, 205

agrupacion de datos, 39, .41-43


225

variables categoricas, 320-336


nula, 205

Estadistica inductiva, 6, 10 \
poblacional, estimacion de la, 231-234

potencia de la prueba, 304-308


de la distribucion muestral de la dife­

Estadistica inferencial, 171-349


rechazo de la, 205-208

definicion, 422
rencia entre medias, 243, 245

Factoriales, 324
error del tipo I, 208, 316

Estimacion, error estandar de la, 152-156


de la distribucion normal estandar, 111,

tabla de, Tabla K, 390


Hipotesis alternativa (Hj), 205

varianza:
112

Falacia «post hoc», 161


Hipotesis direccional y no direccional, 205

dentro de los grupos, 282, 283


hipo tesis respecto a la, 219-221

Forma de campana de la curva normal, 52,


y potencia, 312

entre grupos, 282, 283


ponderada, 81

53
Hipotesis nula (H 0)' 205

Estimacion, intervalo, 224


Media aritmetica, calculo a partir de una

Frecuencia, 29
Histograma, 49-51

puntual, 221, 224, 225


ordenacion de calificaciones, 77

acumulada, 44
Homogeneidad de la varianza, 250, 251

Estimacion por intervalos, 230, 231


distribucion de frecuencias agrupadas,

esperada, 326-328, 330


Homoscedasticidad, 155

Estimacion puntual, 224, 225, 230, 231


79

observada, 327

Estimadores:
distribucion de frecuencias no agrupa­
relativa esperada, 178

estadigrafos como, 224


das, 77, 79

y area, 48, 49, 50

no sesgados, 224, 225


Independencia, 176
comparada con la mediana, moda, 83, 84

sesgados, 224, 225, 245


Inferencia estadistica (veanse Examen estadis­ como predictor, 97, 143

unificados, 245
tico de hipotesis, Pruebas estadisticas)
definicion, 423

Grados de libertad, analisis de la varianza,


Examen estadistico de hipotesis (vease tam­ Interaccion, 288
desviacion respecto a la, 79

entre grupos, 281

Intervalos (vease lnterualos de clase)


distribucion muestral de la, 216-219

bien Pruebas estadisticas) cociente F, 250, 282

Intervalos de clase, 39, 41-43


efecto de la distribucion sesgada, 84, 85

caso de una muestra, parametres:


dentro de grupos, 281

conocidos, 219-221
desiguales, 49-51
efecto de los valores extremos, 80

total, 284, 285

desconocidos: t de Student, 226-230


eleccion de, 39, 41, 42
error estandar de la, 217

A de Sandler, }67
distribucion muestral, 216-219
limites de, 43 \
ponderada, 81, 82

cociente t, muestras corre1acionadas 264


propiedades de la, 79-82

dos muestras independientes, 243-258


caso de una muestra, 226 '
limites verdaderos, 43

desviaciones estandar poblacionales co­


longitud de, 42
sesgo, 84, 85

dos muestras independientes, 246


suma de las desviaciones respecto a la, 79

nocidas, 243, 245


chi-cuadrado, 327
nurnero de, 42

procedimiento, 42
suma de los cuadrados de las desviaciones

desviaciones estandar poblacionales


definicion, 423

proposito de los, 39
respecto a la, 80

desconocidas, t de Student, 246-248


Grafica de porcentajes acumulados, 67

no parametrica, 304
suposiciones concernientes a la distribu­
Mediana, calculo a partir de una ordenacion

y rangospercentiles, 63

pararnetrica, 243, 245-248, 304


cion de observaciones, 66
de numeros, 82, 83

Grafica lineal, 54-56

Intervalos de confianza, 231-234


a partir de una distribucion de frecuen­

eficiencia de una prue ba, 316, 317


Graficas, tipos de, barras, 46-48

error: Iimites, 231-234


cias agrupadas, 82

curva de frecuencias, 52

464 ESTADiSTICA PARA LAS CIENCIAS SOCIALES iNDICE DE MATERIAS 465

caracteristicas de la, 83
Nivel de significacion, 202-205
acumulados, 44, 45
comparaciones a priori 0 planeadas,

com parada con la media, moda, 83, 84


eleccion del, 204
Potencia, calculo de la, caso de una muestra,
286

definicion, 423
en relacion al error del tipo I, 207, 208,
309, 310
Pruebas de significacion de distribucion li­
relacion con los rangos percentiles en, 82
305
caso de dos muestras, 313, 314
bre (vease Pruebas no parametricas)
valores indeterminados, 84
nivel alfa (IX), 204
concepto de, 305-308
Pruebas estadisticas (vease tambien Examen
y sesgo, 84, 85
y potencia, 305, 306, 311, 316
definicion, 424
estadistico de hipotesis)
Medias, diferencia entre (vease Diferencia Normalidad, hipotesis de, 112, 113
efectos de, nivel alfa, 311
eficiencia, 316, 317

entre medias; tam bien Muestras co­ Notacion maternatica, 15, 17, 18
medidas correlacionadas, 315
prueba DHS, 286

rrelacionadas, Caso de dos muestras) Numeros:


naturaleza de HI' 312
prueba del signo, 342, 343

Medicion, definicion, 423


aleatorios, Tabla Q, 405
pruebas pararnetricas us, pruebas no
prueba del signo-rango de Wilcoxon, 343­

errores de, 28
cardinales, 21
parametricas, 312, 313
345

escalas de (vease Escalas de medida)


norninales, 21
tamafio muestral, 310, 311
prueba U de Mann-Whitney, 337-342

limites verdaderos de un mimero, 28


ordinales, 21
y errores del tipo I y del tipo II, 316
significatividad de la r de Pearson, 234­

Mejor ajuste, recta de, 148


Numeros, valor absoluto de, 96
Prediccion (vease Reqresion y predicciony
237

Moda, comparada con la media, mediana,


aleatorios, tabla de, Tabla Q, 405
Probabilidad, 173-197
Pruebas no pararnetricas, 303-349

83, 84
limites verdaderos, 27, 28
aleatoriedad, 175-177
binomial, 321, 324, 325

definicion, 423
tipos de, 20, 21
condicional, 185
cornparadas con las parametricas, 312,

Modelos mate maticos, 199,201,202 (veanse


definicion, 424
313

tam bien Distribucion binomial, Distri­ enfoque clasico, 178


chi-cuadrado, 326-328

'bucion normal) 1

enfoque empirico, 178, 179


potencia, 312, 313

Muestra [vease tarnbien Muestreo aleatorio)


Observaciones apareadas, prueba de Wilco­ expresion de la, 179, 180
prueba del signo, 342, 343

sesgada, 176
xon, 343, 345
prueba del signo-rango de Wilcoxon, 343­

Ojiva, 54
modelo binomial, 321, 324, 325

tamafio de la, y potencia, 310, 311


modelo de la curva normal, 187, 188
345

M uestras correlacionadas, ventajas sobre


Omega al cuadrado, 249, 287, 288
propiedades, 179-187
U de Mann-Witney, 337-342

las muestras independientes, 259, 362


Operaciones:
regia de la adicion, 180-182
Pruebas parametricas (veanse tam bien Exa­
error estandar de la diferencia entre me­
algebraicas, 357-359

regia de la multiplicacion, 183-187


men estadistico de hipotesis, Pruebas
dias, 262, 263
aritrneticas, 355-357

sucesos independientes, 183-184


estadisticas)
pruebas no pararnetricas, prueba del sig­
Operadores, 17

unilateral y bilateral, 189-191, 205


Prueba U de Mann-Whitney, 337-342

no, 342, 343


Ordenada, 45, 146

variables continuas y, 187


calculo de U y U', tecnica de con teo, 338­

prueba del signo rango de Wilcoxon,


Promedios (vease T endencia central, medida 340

343-345
de fa) formulas, 338-340

pruebas pararnetricas, metodo de la dife­


Parametro, definicion, 424
Proporcion acurnulada, 44, 45
definicion, 425

rencia directa, 264-267


uso de las letras griegas para representar,
Prueba binomial, 321, 324, 325
problema de los rangos empatados, 340,

A de Sandler, 267, 268 .


6
aproximacion normal a la, 325, 326
341 ­
cociente t, 262-267
Percentiles:
P 1= Q 1= 1/2, 321, 324, 325
tabla de valores criticos de U y U', Tabla I,

Muestras independientes (vease Caso de dos acurnulados, 63, 65-69


problema rnuestral en, 324, 325
385 \

muestras) de la distribucion normal estandar, 107,


tabla de probabilidades asociadas y, Ta­

Muestreo, probabilidad, 175-177


110-113
bla M, 391

aleatorio, 176, 177


Poblacion (vease tam bien Estimacion de la
tabla de valores criticos cuando N ",; 10,

con reposicion, 183, 184


media poblacional)
Tabla N, 392
r de Pearson, 122 (veanse tambien Correla­
sin reposicion, 184, 185
bicategorica 0 dicotomica, 321, 324, 325
Prueba del signo, 342, 343
cion, Reqresion y prediccion)

Muestreo aleatorio
definicion, 424
Prueba del signo-rango de Wilcoxon, 343­
calculo de la, metodo de la desviacion

definicion, 424
desviacion estandar, 97
345
media, 128, 129

sesgo en el, 176


error estandar de la diferencia entre me­ Prueba DHS, 286
metodo de las calificaciones originales,

Mutuamente excluyentes, clases, 39, 41


dias, 245
tabla de rango estudentizado, Tabla 0,
129, 130

sucesos, 181, 182


error estandar de la media, 216, 225
398
coeficiente de determinacion, 158

hipotetica, 198, 199


Prueba robusta, 227
coeficiente de no determinacion, 159

parametro, 6
Pruebas de comparaciones multiples, com­
definicion, 425

N inflada, 331, 332


varianza, 97, 221
paraciones a posteriori, 286
formulas, 128

Nivel alfa (IX), 204, 311


Porcentajes, 29-31
prueba DHS, 286
hipotesis de linealidad, 130

466 ESTADiSTICA PARA LAS CIENCIAS SOCIALES iNDICE DE MATERIAS 467

prueba de significacion, 234-237


homoscedasticidad, 155
transforrnacion a, 118, 119

total, en el analisis de la varianza, 280, 281

rangos em patados, 133, 134


linealidad, hipotesis de, 130, 131
Y r de Pearson, 126-128

Y varianza, 98

relacion con la r s de Spearman, 133


problemas ilustrativos, 150, 151
Variable:

Sumatoria, notacion, 15, 17, 18

tabla de funciones de la, Tabla H, 383


recta de regresion, 148
de criterio, 55

reglas, 18-20

transformaciones a z, 236
construccion de la, 151, 152
dependiente, 54-56

y muestras correlacionadas, 262, 263


pendiente de la, 148
Variables:

y rango truncado, 130-132


regresion lineal, 146-152
categoricas, pruebas estadisticas, 320-336

y valores z, 126-128
t, distribucion, 2:'8

variacion explicada y no explicada, 157­


[veanse tambien Prueba binomial,

y variacion explicada, 157-159


A de Sandler, 267, 268

159
Chi-cuadradoi

y variacion no explicada, 157-159


caracteristicas, 228, 229

varianza residual, 152-156


continuas, 187

y variacion total, 157-159


Relacion:
caso de una muestra, 226-229

cualitativas, 289

rs de Spearman, 122
negativa, 123
grados de libertad, 227

definicion, 426

calculo, 133
positi va, 123
grados de libertad, 264

relacion:

definicion, 425
homogeneidad de la varianza, 250, 251

Reposicion, muestreo con y sin, 183-187


negativa entre, 123

rangos empatados, 133-135


metndo de la diferencia directa, 264-267

Representacion grafica de distribuciones de


positiva entre, 123

variables de escala ordinal, 133-135


omega al cuadrado, 249

frecuencias de diferentes formas, 44­


valor de, 21

Rango,93
62
prueba, muestras correlacionadas, 262­

Variables:

definicion, 425
distribucion normal, 53
267

continuas, y probabilidad, 187

serni-intercuartil, 93-95
escalas:
tabla para la, Tabla C, 373

e inferencia estadistica, 214-242

truncado, 132 1
de cocientes en, 50-52
val ores criticos, 229

cualitativas, 289

Rangos empatados, y prueba U de Mann­


nominales en, 47-49
Tecnicas de representacion grafica, mal uso

cuantitativas, 289

Whitney, 340, 341


ordinales en, 50
de las, 45-47

experimentales, 54-56

Y r de Spearman, 134, 135


por intervalos en, 50-53
regia de los tres cuartos de altura, 46

independientes, 54-56

Rangos percentiles, 63, 65-69


grafica lineal, 54-56
Tendencia central, caracteristicas de, 76, 77

Variacion:
calculo a partir de: una grafica de porcen­
rectas de regresion, 151-153
l,por que describirla?, 76

conjunta de dos variables (veanse Correla­


tajes acumulados, 65
val ores indeterminados en, 77

cion, Reg,.esion y prediccion)


datos agrupados, 65-67
Tendencia central, definicion, 423

explicada, 157-159

dato correspondiente al, 68, '69


media, 77, 79-81

no explicada, 157-159

definicion, 425
Sesgo, 176
mediana, 83, 84

y r de Pearson

formula, 67
Sesgo, de una distribucion, 54
medida de, 76-91

explicada, 157-159

grupo de referencia, 69, 70


negativo, 54
moda, 83,84

no explicada, 157-159

transforrnacion lineal, 67
positivo, 54
Teorerna del limite central, 218, 219

Varianza:

Razones, 29-31
Significaci on, nivel de, 204
Totales marginales, 328

dentro de los grupos, 278-283

Realizacion conjunta, 181


Transforrnacion lineal, y rango percentil, 67

pruebas de (vease Pruebas estadisticas)


entre grupos, 278-283

Recta de mejor ajuste, 148


Subindices, 17
y valores z, 118, 119

Varianza, analisis de la (vease Analisis de la


Recta de regresion, 148 (vease tarnbien Re­ Sucesos, igual probabilidad, 175
oarianzai
gresion y prediccion) exhaustivos, 182
definicion, 426

Redondeo, 28, 29
independientes, 183, 184
Universo, definicion, 6
homogeneidad de la, y cociente t, 250, 251

Region critica, 220, 221


mutuamente excluyentes, 181, 182
Uni y bilateral, definicion, 425
y suma de cuadrados, 98

Regresion:
relacionados 0 dependientes, 184, 185
hipotesis, 205
Varianza residual, 152-156

curvilinea, 130
Sucesos independientes, 183, 184
probabilidad, 189-191
definicion, 426

lineal: 146-152 (vease tambien Reqresion y


Sujetos de control, 10
prueba, potencia de, 311
formulas, 154, 155

prediccion)
Suma de cuadrados, y recta de mejor ajuste,
y error estandar de la estirnacion, 154

Regresion y prediccion, 143-167 (vease tam­ 148

bien Co,.relacion) definicion, 425


Valor absoluto de un numero, 96

desviacion predicha respecto a la media dentro de grupos, 277-281


Wilcoxon, prueba del signo-rango.: 343-345

Valores z, areas entre, 112, 113

muestral, 149
entre grupos, 277-281
calculo del estadigrafo T, 344

concepto de, 107, 110, 111

ecuaciones de regresion, 149, 150


media y, 79-81
hipotesis basicas, 345

propiedades de, 107, 110, 111

error estandar de la estimacion, 152-156


minima, 81

formulas de prediccion, 148-150


participacion y varianza, 290-296

También podría gustarte