Documentos de Académico
Documentos de Profesional
Documentos de Cultura
- o
~
e
o :;:,
a:
C-tn
tn
eu
.
t)
e
!I !!"
r-=l
°ru
IT"
rn
..D
~~~~~",~
o
N r-=l
I
0
==--=='Oru
0 ,
..- 0
°N Z
• °00 lD
~~~~~I'-
Vl
H
ESTADISTICA
para las CIENCIAS SOCIALES
ESTADISTICA
para las CIENCIAS SOCIALES
RICHARD P. RUNYON
AUDREY HABER
Version en espanol de
Hugo Pereyra
Uniuersidad National de Ingenierla
Lima, Peru
can la colaboraci6n de
Carmen Gonzalez Hieras
Universidad National Autonoma de Mexico
Mexico
...
TT ADDISON·WESLEY IBEROAMERICANA
Argentina> Brasil· Chile· Colombia . Ecuador . Espana
Estados Unidos . Mexico'> Peru Puerto Rico : Venezuela
>
[v]
© 1980,1976,1971,1967.
Esta edicion en espanol es la (mica autorizada.
En la preparaci6n de la cuarta edici6n de un texto hay algo que es en gran medida un reto y
una satisfacci6n. La satisfacci6n proviene del hecho de que el libro, y sus ediciones pre vias,
ha resistido bien una prueba de larga duraci6n. B;l rete proviene de la necesidad de conservar
las cualidades que nos hicieron ganar tantos amigos leales, a la vez que introducir los nuevos
desarrollos en el campo de la estadistica y las sugerencias hechas pOI' colegas.
A continuaci6n indicamos algunas de las modificaciones que hemos hecho en la presente
edici6n:
Reconociendo la importancia fundamental de las definiciones, las hemos presentado en un
glosario en el apendice VI.
Hemos recurrido directamente a las Fuentes para obtener much os de los ejemplos y
ejercicios que aparecen en el texto. De esta manera proporcionamos a los estudiantes los datos
originales de trabajos de investigacion, publicados e ineditos, dando ocasi6n para que manejen
dichos datos tanto en el nivel descriptivo como en el inferencial. Creemos que estos ejemplos
constituiran para el estudiante experiencias ricas y comprensibles en el analisis de la
investigaci6n actual.
A 10 largo de nuestros afios de enseiianza hemos notado frecuentemente que las tablas
estadisticas que aparecen en el apendice no reciben siempre el cuidado y la atenci6n que se Ie
suele dar al resto del material del texto. A veces los estudiantes calculan correctamente el
estadigrafo de una prueba y luego fallan al relacionarlo con una tabla estadistica. Hemos
intentado disefiar las tablas de modo que sean una ayuda y no un elemento de frustraci6n. Asi,
donde consideramos que es apropiado, indicamos los casos en que se trata de valores de
probabilidad uni 0 bilaterales. Mas aun, hemos incluido en las tablas ejemplos que ilustran
su uSO.
Tambien hemos ampliado algunas de ellas. POI' 10 que sabernos, en ningun otro texto
actualmente disponible se muestran las probabilidades binomiales para N ~ 49 cuando
P =1= Q (Tabla N), dan do los valores criticos uni y bilaterales de la prueba binomial hasta
N = 50 cuando P = Q (Tabla M), y se presentan los valores criticos de la variable F (Tabla
D tl en cada una de las colas de la distribuci6n.
EI uso casi generalizado de las calculadoras de bolsillo ha hecho que sea virtualmente
innecesario el calculo de varios estadigrafos inexactos a partir de distribuciones de frecuencias
© 1984 POI' Fondo Educativo Interamericano, S.A. agrupadas. Aun con grandes masas de datos es relativamente Iacil colocar los valores de la
variable en la calculadora y hallar la media y la desviacion estandar. En consecuencia, se han
© 1992 POI' Addison-Wesley Iberoamericana, S.A. eliminado del texto los metodos para obtener la media y la desviaci6n estandar en las
Wilmington, Delaware, E.U.A. distribuciones de frecuencias agrupadas. Ya que hablarnos de las calculadoras de bolsillo, cabe
sefialar que el Libro de Ejercicios para el alumno contiene programas detallados para el
calculo de la mayor parte de las operaciones estadisticas indicadas en el texto. Aunque estos
programas han sido hechos con base en las funciones mas simples de la calculadora, se
presentan sugerencias para mejorarlos cuando se dispone de calculadoras mas complejas.
Reservados todos los derechos. Ni todo el libro ni parte de el pueden ser reproducidos, Ciertarnente, se alienta a los estudiantes para que elaboren sus propios programas. Si 10 hacen
archivados 0 transmitidos en forma alguna 0 mediante algun sistema electronico, asi, incrementa ran su habilidad en 10 referente a procedimientos de calculo.
mecanico de fotorreproducci6n, memoria 0 cualquier otro, sin permiso pOI' escrito del Se ha marcado con asteriscos todos los ejercicios de fin de capitulo que constituyen una
editor. base para discusiones ulteriores. Aunque parezca obvio, vale decir que es de suma importancia
Impreso en E.D.A. Printed in U.S.A. para el estudiante completar estos ejercicios, de modo que sea posible una transicion suave
ISBN 0-201-06392-1 hacia conceptos de mayor complejidad.
2 345 6 7 8 9-AL-96 95 9493 92
vi ESTADfSTICA PARA LAS CIENCIAS SOCIALES [vii]
Finalmente, hemos notado que los procedimientos para normalizar una distribucion no
normal constituyen un arte casi olvidado. A pesar de ello, frecuentemente se los mencionan en Prefacio
Tenemos una deuda de gratitud con muchos colegas que nos hicieron valiosas sugerencias
para esta edicion. Pero estamos particularmente agradecidos a las siguientes personas, cuyas
contribuciones fueron especialmente lucidas y profundas:
En los afios que llevamos impartiendo cursos introductorios de estadistica para estu
diantes de las ciencias sociales, cometimos el error -si se trata de un error- de cam
Robert 1. Grissom Victor E. Montgomery biar los textos que usabarnos con bastante frecuencia. Nuestras experiencias en este
San Francisco State University University of Idaho sentido no han sido (micas; en conversaciones con colegas de otras instituciones,
Steve Harkins Steven E. PoItrock hemos descubierto dificultades similares para decidirse en adoptar un texto unico de
Northeastern University University of Denver estadistica. Estas opiniones han revelado dos tipos frecuentes de inquietudes.
Frederick L. Kitterle David M. Snuttjer 1. Los textos actuales tratan de ser compendios superficiales 0 bien, libros con
The University of Toledo Calvin College mucho rigor que agravian la formaci6n del estudiante rnatematico, superior a los
conocimientos adquiridos por la mayor parte de los alumnos que estudian ciencias
Willard D. Larkin Russell Veitch
sociales,
University of Maryland Bowling Green State University
2. Muchos de los textos actuales no reflejan los ultimos adelantos en estadisticas de
Neil Macmillan L. Carl Volpe muestras pequefias 0 las ventajas, ya mas generalizadas en las universidades, de los
Brooklyn College Northeastern University equipos de calculo automaticos de alta velocidad.
Scott E. Maxwell Phyllis A. Walrad Para empezar, nos oponemos firmemente a los textos con enfoque de "recetario
University of Houston Macomb County Community College de cocina" al analisis estadistico. Ademas de menospreciar la creatividad del estu
Karin C. Meiselman Kathleen Dillon diante, dichos textos tienden a convertirse en el "manual bueno para todo" del estu
Pitzer College Western New England College dioso de este campo 0 del joven alumno. Este tipo de libros facilmente puede llevar
al estudiante a determinar que la estadistica es un "potro de tortura", donde uno
Lawrence E. Melamed demuestra su capacidad para soportar el dolor de memorizar f6rmulas esotericas y
Kent State University reglas diversas para su aplicacion, Por otro lado, reconocemos que un enfoque es
Expresamos tambien nuestro agradecimiento, en forma especial, al doctor Joseph Wingard 'trictamente matematico a la estadistica introductoria hace que muchos estudiantes
(U.C.L.A.), quien contribuy6 con muchos ejemplos relacionados con la investigacion. capaces se ahoguen en un pantano de abstracciones y simbolos matematicos, de
Agradecemos tambien al albacea literario del extinto Sir Ronald A. Fisher, F.R.S., doctor poca relevancia en aplicaciones practicas. Hemos intentado lograr un equilibrio
Frank Yates, F.R.S. y a Longman Group Ltd., de Londres, por la autorizacion para reproducir entre estos dos enfoques. Asi, aunque elegimos ejemplos sencillos para ilustrarel
la tabla III de su libro Statistical Tables for Biological, Agricultural and Medical Research calculo de los distintos estadisticos, no dudamos en incluir demostraciones algebrai
(Sexta edicion, 1974). cas que esten al alcance de la mayoria de los estudiantes de ciencias sociales, y com
Tucson R.P.R. prueben tener una relaci6n fundamental.
Los Angeles A.H. Respecto al segundo punto, donde muchos textos actuales no reflejan los ultimos
adelantos estadisticos y cam bios tecnologicos, hemos realizado un gran esfuerzo
para eliminar toda materia que, segun nuestra experiencia, raramente se utilice
ahora. En consecuencia, en este libro no se encontraran metodos de puntuacion
codificada, que fueron vitales cuando se realizaban estadisticas de muestras grandes
y antes de la llegada de las maquinas programables de alta velocidad. A pesar de que
algunos profesores, en un momento de profunda nostalgia, posiblemente lamenten
la perdida de esta reliquia de los alegres dias de la estadistica, sentimos que la ense
fianza de los metodos de puntuaci6n codificada es una perdida de tiempo, pues com
plicala actividad del estudiante, quien llega a creer que el conocimiento de formulas
es la esencia de la estadistica, y no Ie facilita ninguna informacion especial sobre la
naturaleza del analisis estadistico. EI uso de correlogramas ha sufrido un final simi
lar, por la misma razon, A los criticos, solo diremos que nunca tuvimos ocasion, en
nuestras investigaciones, de emplear los metodos de puntuacion codificada 0 los
correlogramas y j nunca hemos conocido alguien que 10haga!
viii ESTADISTICA PARA LAS CIENCIAS SOCIALES PREFACIO ix
Por otra parte, no hemos dudado en introducir tecnicas estadisticas nuevas que Expresamos nuestro sincero reconocimiento a la doctora Nancy Wiggins, por sus
representan -pensamos- un avance sobre los metodos citados. Por esto, se estudia excelentes y estimulantes comentarios proporcionados en distintas etapas durante la
el estadigrafo A de Sandler, que es equivalente algebraicamente al cociente t de preparacion del manuscrito. Tarnbien, estamos profundamente agradecidos a Milli
Student para muestras correlacionadas, porque reduce radicalmente los procedi cent Cowit, Ruth DeMarco, Norma Morrow y Fleeta Runyon, por sus esmerados
mientos de computacion requeridos para to mar una decision estadistica. esfuerzos al mecanografiar un manuscrito que, con formulas y simbolos poco fami
Aim mas, en el examen de hipotesis, hemos intentado preservar la distincion entre liares, debe haberles ocasionado muchos momentos de angustia y frustracion.
parametres poblacionales y estadigrafos muestrales. Ya que nuestro enfoque es con Por ultimo, queremos expresar nuestra gratitud a los autores y editores que nos
sistente a 10 largo del libro, esperamos eliminar parte de la confusion que algunas han permitido adaptar 0 reproducir materiales originalmente publicados por ellos.
veces se da en este contexto. Hemos citado cada fuente donde aparece este material. Agradecemos al albacea lite
Unas palabras sobre la organizacion de esta obra. Muchos libros modernos de rario del finado sir RonaldA. Fisher, F.R.S., Cambridge, al doctor Frank Yates,
estadistica han relegado la estadistica descriptiva a un plano de importancia secun F.R.S., Rothamsted y a los senores Oliver y Boyd, Ltd., Edinburgo, por su permiso
daria. Aunque no creamos que las tecnicas estadisticas descriptivas representen algo para publicar y adaptar tab las de su libro, Statistical Tables For Biological, Agricul
mas que los fundamentos del analisis estadistico, el dominio de estas tecnicas es tural, and Medical Research.
prerrequisito para entender y aplicar los conceptos y procedimientos implicados en
la estadistica inferencial. Hemos buscado demostrar la continuidad de estas dos Greenvale, L. [., N. Y. R.P.R.
ramas de la estadistica. A.H.
Las tablas estadisticas en el Apendice IV han sido cuidadosamente preparadas
para reducir al minima las dificultades del estudiante al usarlas. Por ejemplo, la
mayoria de las tablas van precedidas de una breve descripcion de los procedimientos
que su aplicacion implica. Adernas, donde resulta propio, se muestran valores criti
cos para rechazar la hipotesis nula con valores que tienen en cuenta las dos colas de
la distribucion en diferentes niveles de significacion, Finalmente, se ha reducido la
cornplejidad de algunas tablas, haciendo posible la localizacion de informacion rele
vante en un periodo mas corto de tiempo y con menor probabilidad de error. Por
ejemplo, el estadigrafo U de Mann- Whitney se muestra comunmente en diez tablas
diferentes. Para complicar aun mas las cosas, algunas de las tablas dan valores exac
tos de probabilidad, mientras que otras proporcionan valores criticos para rechazar
la hipotesis nula en los diferentes niveles de significacion, Hemos reducido estas
tab las a cuatro, indicando unicarnente los valores criticos requeridos para rechazar
la hipotesis nula. Ademas, estas tablas muestran los valores de U y U', para que el
estudiante no tenga necesidad de especificar, cuando emplea la prueba Mann
Whitney, cual de los estadigrafos es el que se ha calculado.
Los ejercicios al final de cada capitulo son parte extremadamente importante e
integral del libro, ya que, ademas de ilustrar relaciones fundamentales, requieren
que el estudiante formule por si mismo muchos conceptos estadisticos significativos.
El orden dado a este texto es tal que los primeros quince capitulos constituyen, en
nuestra opinion, una introduccion minuciosa a los fundamentos de la estadistica
descriptiva y la inferencial. Para el profesor que desee metodos estadisticos mas
avanzados, hemos incluido, en los cuatro ultimos capitulos, temas tales como ana
lisis de la varianza, potencia y eficiencia de una prueba estadistica y varias pruebas
no pararnetricas de significacion, utilizadas usualmente.
En resumen, hemos intentado escribir un libro de texto para un curso, semestral,
introductorio de estadistica para estudiantes de ciencias sociales. Esperamos que
ellos apreciaran la utilidad del metodo estadistico en su campo profesional; que
obtendran un buen entendimiento de las conjeturas y la logica implicitas en la apli
cacion de las herramientas estadisticas; que podran elegir la tecnica estadistica apro
piada y efectuar los calculos necesarios, y finalmente, que sabran como interpretar y
entender los resultados de sus esfuerzos.
Estamos muy agradecidos con muchas personas que han contribuido a este libro.
[xi]
Indice general
Prefacio a la cuarta edicion v
Terrninos pararecordar 12
Ejercicios 12
2.1 Introducciori 15
2.6 Redondeo 28
Ejercicios 31
Ejercicios
57
4 Percentiles 63
4.1 Introduccion 63
4.2 Percentiles acumulados y ran go percentil 63
12.6 Estimacion de parametres: estimacion por intervalos 230 Tercera parte. ESTADISTICA INFERENCIAL 303
12.7 Intervalos de confianza y limites de confianza 231
12.8 Ensayo de la significacion para la r de Pearson: caso de una sola B. Pruebas no parametricas de significaci6n 303
muestra 234
Ejercicios 297
Apeodices 353
I. Repaso de rnatematicas basicas 355
II. Glosario de simbolos 362
III. Tablas 366
IV. Tratamiento de las distribuciones no normales 409 PRIMERA PARTE
V. Lista de formulas 416
VI. Glosario de terrninos
Respuestas a ejercicios seleccionados
420
427 Introducci6n
Iodice de materias 459
[3]
Definicion
1 de analisis estadistico
Recuadro 1.1
t,1970
. * 1900
1. NEUMONIA (TOOAS LAS FORMAS) 1. ENFERMEDADES DEL CORAZON
V GRIPE
MALIGNOS
o 50 100 400
* 1940
(DECESOS POR CADA 100000 'HABITANTES)
1. ENFERMEDADES DEL CORAZON
MALIGNOS
3. LESIONES INTRACRANEALES DE
ORIGEN VASCULAR
La estadistica es uno de los recursos de uso mas generalizado tanto en las ciencias del
Y GRIPE
comportamiento, como en las sociales, medicas y fisicas. Se reune informacion estadisti
6. ACCIDENTES (EXCLUYENDO LOS
AUTOMOVILISTICOS)
ca de practicamente todos los aspectos de la vida. A menudo se hacen las observaciones
7. TUBERCULOSIS (TODAS LAS FORMAS) en momentos diferentes para que sea posible comparar los cambios a 10 largo del
B. DIABETES MELLITUS tiempo. Los datos que se presentan en las figuras ilustran el hecho de que desde
9. ACCIDENTES AUTOMOVILISTICOS comienzos de siglo las principales causas de muerte han cambiado dramaticamente,
10. NACIMIENTO PREMATURO
Observese, por ejemplo, que la neumonia y la tuberculosis fueron en 1900 las causas de
un gran numero de decesos, mientras que en 1970 se atribuyeron relativamente pocos
350 400
de ellos a esas mismas causas. Aunque no se muestra en las graficas, es interesante
(DECESOS POR CADA 100 000 HABITANTES)
sefialar el hecho de que la esperanza de vida se ha incrementado de 47 afios en 1900, a
71 afios en 1970.
• De «The Ills of Man». por J. H. Dingle. Copyright © 1973 por Scientific American. Inc. Todos los t De «Mortality for leading causes of death; U.S.», 1976. CA-A Cancer Journal for Clinicians, enero/Iebrero
derechos reservados. 1979, 29 (1).
En la vida diaria nuestro funcionamiento estadistico es de ordinario informal y l.Que es, entonces, la estadistica? Aunque seria practicamente imposible obtener
esta vagamente estructurado. Nos comportamos estadisticamente, aunque sin tener un consenso general ace rca de su definicion, es factible distinguir entre dos de sus
plena conciencia de las leyes formales de la probabilidad. definiciones.
En este curso intentaremos hacer conocer allector algunos de los procedimientos
empleados para recolectar y analizar datos y para tomar decisiones y hacer 1. A la estadistica se la considera frecuentemente como una coleccion de hechos
deducciones basadas en estos analisis. Ya que frecuentemente desarrollaremos los numericos expresados en terminos de proposiciones concisas, y que han sido
tern as en torno a sus experiencias previas, el lector se sentira casi siempre en un recopilados mediante varias observaciones, 0 a partir de otros datos numericos.
terreno familiar: «[Vaya, ahora resulta que he estado calculando medias aritmeticas Desde esta perspectiva, la estadistica constituye una coleccion de proposiciones tales
casi toda mi vida al determinar mi nota media en una asignatura 0 el promedio de Como: «El coeficiente intelectual (CI) medio de los niiios de 5.° de primaria es...», 0
goles de mi equipo favorito!», Si ellector recurre constantemente a sus conocimientos «Siete de cada diez personas prefieren la marca X ala marca Y», 0 «Los campeones
previos y relaciona las materias del curso con 10 que Ie es familiar en la vida diaria, la mundiales de futbol marcaron 15 goles en su ultima gira».
estadistica no tendra por que serle, y no 10sera, algo terrible tal como frecuentemente 2. La estadistica puede ser considerada tambien como un metodo para manejar los
se la describe. datos. Esta definicion destaca el punto de vista de que la estadistica es una
6 ESTADfSTICA PARA LAS CIENCIAS SOCIALES DEFINICION DE ANAuSIS ESTADfSTICO 7
herramienta para la recopilacion, organizacion y analisis de hechos nurnericos 0 de Muestra. Un subconjunto de la poblacion 0 universo.
observaciones.
Muestra aleatoria. Un subconjunto de la poblacion 0 universo seleccionado en
Esta segunda definicion es la que constituye el objeto de esta obra. forma tal que cada miembro de la poblacion tenga igual oportunidad de ser elegido.
Se puede hacer una distincion entre las dos funciones del metodo estadistico: las
tecnicas estadisticas descriptivas y las tecnicas estadisticas inferenciales 0 inductioas, Estadigrafo. Numero resultante de la manipulacion de los datos de la muestra de
El proposito principal de la estadistica descriptiva es el de presentar la informa acuerdo con ciertos procedimientos especificos. Para estimar el parametro referente a
~i6n en .una forma comoda, utilizable y comprensible. Por otra parte, la estadistica una poblacion usamos generalmente un estadigrafo que se calcula a partir de una
inferencial se ocupa de la generalizacion de esta informacion 0 en forma mas muestra; por ejemplo, para estimar la proporcion de democratas en la totalidad de la
especifica, de hacer deducciones acerca de las poblaciones basandose en muestras pcblacion de votantes se emplea una muestra de norteamericanos en edad de votar.
tomadas de elIas. Debe tenerse en cuenta que para cada estadigrafo que describe algun aspecto de una
Al describir las funcio.n.es de la estadistica han aparecido ya ciertos terminos que muestra existe un pararnetro correspondiente que describe el mismo aspecto de
pueden resultar 0 no familiares allector. Antes de ahondar en las diferencias entre la una poblacion. Asi, para el estadigrafo «media de una muestra» existe el parametro
e~ta~istica descriptiva y la inductiva, es importante aprender el significado de ciertos «media de la poblacion». Emplearernos letras cursivas (por ejemplo X, s) para
terminos que se emplearan reiteradamente a 10 largo del texto. representar estadigrafos muestrales. Asi, observando la notacion estadistica podernos
distinguir entre muestras y poblaciones. En el texto se arnpliara 10 referente al
interesante problema del muestreo.
/"""-----4l> DATOS segun su preferencia por determinados candidatos a cargos politicos), 0 bien datos de
• (estado de drcqadiccion de cada nino en la
• .. muestra) escala (pesos que contienen las cajas de un popular cereal para el desayuno, 0 los CI
•
" • • •
..
!ll
de un grupo de colegiales). En su forma original, es decir, tal como aparecen al ser
recopilados, estos datos son general mente un amasijo de marcas, conteos de
• '!l
••
• • • •• e • • •
EsTADlsTICA DEsCRIPTIVA
·
1/11
frecuencia, etc. Al realizar la funcion descriptiva el estadistico formula reglas y
.
(proporcion de nifios en la rnuestra nacidos
procedimientos para la pi esentacion de los datos en una forma mas util y signifi
• .. .. • e • .. • "
con droqadiccidn)
a
cativa.
•• • • • • lIP Asi, establece normas para la representacion grafica de los datos. Tarnbien
•
• • • e • • EsTADlsTICA INFERENCIAL
(prcporcion estimada de ninos drogadictos formula reglas para eI calculo de diversos estadigrafos a partir de bloques de datos en
en la poblaclon total de neonatos en Ia bruto.
cludad)
Imaginemos que en su calidad de cientifico del comportamiento, el lector
proporciona algunos instrumentos de medida (por ejemplo pruebas de inteligenci'a,
inventarios de personalidad, pruebas de aptitud) a un grupo de estudiantes de
Fig. 1.1 Se selecciona una //lUestra aleatoria de alguna poblacion, Los puntos representan
secundaria. i,Que podra hacer con las medidas 0 punteos resultantes para cumplir las
todos los nacidos durante el afto, Los puntos grises representan la muestra. Los datos se
funciones descriptivas?
recopilan y resumen empleando la estadistica descriptiva. En la estadistica inferencial
1.4 Estadistica inferencial interesantes temas de estudio ya que, virtualmente, tiene aplicaciones en -todas las
areas del quehacer humano y se relaciona con incontables campos del saber. H. G.
Para el cientifico del comportamiento, el trabajo comienza justamente al haber Wells, el profeta del siglo XIX, sefialo que «el pensamiento estadistico sera algun dia
completado la funcion descriptiva. De hecho, se esta mas cerca del comienzo que del tan necesario para el eficiente desenvolvimiento ciudadano como la facultad de leer y
fin de la tarea. La razor es obvia, si consideramos que el proposito de la investigacion escri bir».
es a menudo el de explorar hipotesis de naturaleza general y no simplemente el de Tengase constantemente presente esta idea. EI curso sera mucho mas intere
comparar algunas muestras limitadas. sante y provechoso si el lector desarrolla el habito de «pensar estadisticarnente».
Imaginemos que interesa determinar los efectos de cierta droga sobre la capaci Procurese siempre aplicar los conceptos estadisticos a todas las actividades dia
dad para realizar un trabajo que requiere coordinacion psicomotora. En consecuen rias sin importar cuan rutin arias puedan ser. AI detenerse en un cruce de calles por
cia, se prepara un estudio que incluya dos situaciones: una experimental y otra de el que pasa frecuentemente, observe ellector el tiempo que permanece en rojo la luz
control. Se suministra la droga a los sujetos experimentales en periodos especificos del semaforo. Obtenga alguna estimacion de la duracion de la luz verde. Si la luz roja
de tiempo antes de empezar la tarea que sirve de criterio. Para excluir los «efectos de dura tres minutos y la luz verde dos, cabe esperar que al lIegar al cruce la
placebo» se suministra a los sujetos de control una pildora que contiene ingredientes probabilidad de encontrar luz roja sea de tres a cinco. Corniencese a coleccionar
mertes, Despues de que todos los sujetos hayan sido sometidos a la prueba, se efectua datos. Se encuentra la luz roja el 60 ~/~ de las veces como era de esperar. Si no es
la funcion descriptiva y se encuentra que «por terrnino medio» los sujetos experimen asi, locual es la razon? Quizas se haya hecho inconscientemente algun ajuste en la
tales no actuaron tan bien como los sujetos de control. En otras palabras, la media manera de conducir el automovil con el fin de modificar las probabilidades esta
aritmetica de los datos del grupo experimental resulta menor que la del grupo de disticas.
control. En consecuencia, se plantea la pregunta: loCabe deducir que la droga Un concepto erroneo mantenido por los profanos en estadistica es el de que esta
produjo la diferencia entre los dos grupos? 0 bien, de forma mas general, loPuede es simplemente un metodo sofisticado de fabricar mentiras 0 falsear nuestras
asegurarse que la droga produce un efecto adverso sobre la realizacion de la tarea descripciones de la realidad. Los autores no niegan que algunas personas carentes de
que sirve de criterio en la investigacion? Para responder a estas preguntas no basta escnipulos empleen la estadistica para esos fines. Sin embargo, tales usos de la
contar con la estadistica descriptiva. estadistica son vituperados por el cientifico del comportarniento, quien tiene como
. Puede decirse: «Des~ues de todo, incluso si la droga careciera de efecto, seria muy meta el establecimiento de la verdad. De vez en cuando se aludira a las diversas
Improbable que las medias de los dos grupos resultasen identicas, Alguna diferencia tecnicas empleadas para falsificar resultados sirviendose de la estadistica, Nuestro
se habria observado», La intervencion de variables incontrolables (Ilamadas a veces proposito, empero, no es el de instruir a nadie en estas tecnicas, sino prevenir contra
en forma imprecisa «factores de azar» producira, sin duda alguna, disparidad entre el intencionado mal uso del analisis estadistico, de modo que una persona no Ilegue
las medias de los grupos. La pregunta crucial, desde el punto de vista de la estadistica inadvertidamente a «decir una mentira», y este capacitado para saber cuando otros
inferencial, sera: loEs la diferencia suficientemente grande como para descartar ·Ia la dicen.
variacion incontrolada en el experimento como una explicacion suficiente? Dicho en Cuando el lector yea publicada alguna informacion estadistica, desarrolle ante
otra forma, si repitiesemos el experimento, l,podriamos predecir con seguridad que ella una saludable actitud de escepticismos. Formule siempre algunas preguntas
la misma diferencia (0 sea, que la media del grupo de control resulta mayor que la pertinentes.
media del grupo experimental) se presentara sistematicarnente? Si una revista envia una atractiva periodista para entrevistar a diez especia
Tan pronto como surgen estas preguntas, nos introducimos en el area fascinante listas en dietas alimenticias y recibe de cada uno de ellos una prescripcion
del analisis estadistico conocida como estadistica inductiva 0 inferencial. Como el innecesaria, no concluya inmediatamente que todos los especialistas cometen fraude.
lector vera despues, la mayor parte de esta obra esta dedicada a los procedimientos lamas diga: «Despues de todo, diez sobre un total de diez es una proporcion muy
que emplea el investigador para lograr conclusiones que se extiendan mas alla de las alta», negandose a realizar mas indagacion, Pregunte en que forma se obtuvo la
muestras estadisticas mismas. muestra. loFue aleatoria, 0 es posible que los especialistas fueran seleccionados
basandose en una informacion previa de que eran descuidados en su practica
profesional? Pregunte constantemente, pero reserve el juicio hasta obtener las
respuestas.
1.5 Una advertencia al lector Observe la publicidad de la television, lea los anuncios del periodico. Cuando el
locutor asegure: «Este producto es mas eficaz», preguntese, «lomas eficaz que cual?
loQue prueba se tiene de ello?»,
EI estudio de la estadistica no tiene por que convertirse en una serie de ejercicios Si se hace del pensamiento estadistico un habito cotidiano, no solo se encontrara
progresivos de calculos tediosos. Si nos acercamos a ella con la actitud mental que el estudio de la estadistica resulta mas interesante, sino tarnbien que el mundo
adecuada, encontraremos que la estadistica puede constituir uno de los mas en que se vive parecera diferente y quizas mas atractivo.
12 ESTADfSTICA PARA LAS CIENCIAS SOCIALES DEFINICION DE ANALISIS ESTADfsTICO 13
Resumen del capitulo b) Basandose en una muestra aleatoria de 250 asalariados de Campolandia, se cree que
el ingreso medio de todos los asalariados en esta ciudad es aproximadamente de
145000 pesos.
En este capitulo se ha establecido la diferencia entre dos definiciones del analisis c) EI proyectil de un rifle calibre 0.22 puede lIegar a la distancia de 1.6 kilometres.
estadistico: una que presenta a la estadistica como una coleccion de hechos d) Este afio mis gastos por ensefianza fueron de 45 800 pesos.
nurnericos, y otra que la describe destacando su caracter de metodo 0 herrarnienta e) EI programa especial de television emitido el lunes ultimo fue visto por 23 500 000
para la recoleccion, organizacion y analisis de los hechos numericos. Hacia la segunda personas.
definicion esta dirigido el contenido de esta obra.
2. Muchas poblaciones estudiadas en condiciones experimentales son te6ricas. Dense
Se distinguen dos funciones del rnetodo estadistico, la descriptiva y la de analisis
algunos ejemplos de poblaciones teoricas que puedan presentarse en la investigacion,
estadistico inferencial. La prirnera se refiere a la organizacion y presentacion de datos
en una forma cornoda, util y de facil comunicacion. La segunda se orienta hacia el 3. Indiquese en cada uno de los casos siguientes si se trata de una variable 0 de una:
problema de lograr generalizaciones amplias e inferencias, tratando de obtener constante:
informacion sobre una poblacion a partir de los datos de una muestra. a) Numero de dias del mes de agosto.
Se definieron algunos terrninos empleados en el analisis estadistico. b) Numero de acciones negociadas en la Bolsa de Buenos Aires en varios dias del afio,
Finalmente se sefialo que, con frecuencia, se emplea la estadistica para «decir c) Edad de los estudiantes de primer afio de una universidad.
rnentiras». Estas practicas van en contra de nuestro objetivo de encontrar una base d) Tiempo requerido para completar un ejercicio.
de hechos reales que sirva para establecer nuestras conclusiones y decisiones e) Edad en que una persona adquiere el derecho a votar en unas elecciones generales.
apoyadas en la estadistica. Sin embargo, el lector debe estar al tanto de las tecnicas
g) Maxima calificaci6n posible en el examen anterior.
usadas para mentir estadisticamente, evitando asi que Begue a «mentir» inadvertida h) Cantidad de dinero gastada anualmente en libros por estudiantes.
mente, adquiriendo adem as la capacidad de reconocer cuando alguien miente de esta
forma. 4. El profesor Norman Yetman de la Universidad de Kansas esta investigando la posible
Con los terrninos 0 concept os nuevos que se introduzcan en un capitulo se hara discriminaci6n econ6mica contra los atletas de color por parte de los medios de comunica
ci6n*. Con ese fin analiz6 las oportunidades que tienen de figurar en anuncios comerciales,
una relacion que figurara al final del mismo y tarnbien un glosario de terrninos (pags,
hacer apariciones como invitados en television y obtener trabajos fuera de la temporada
420 a 426). Algunos de estos terrninos se definiran con mayor precision en otros deportiva. Dos de sus constataciones son las siguientes:
capitulos y, en consecuencia, podran volver a aparecer. a) De 351 anuncios comerciales relacionados con acontecimientos deportivos de Nueva
York, en el otofio de 1966, aparecieron atletas negros solamente en 2 de ellos.
b), Un analisis de las oportunidades que tuvieron los integrantes de un equipo profesio
nal de futbol en los medios de publicidad en 1971 revel6 que en una muestra de 11
Terminos para recordar blancos, 8 tuvieron una oportunidad, pero en cambio solamente 2 de 13 atletas
negros tuvieron una oportunidad analoga,
datos muestra Indiquese si estos ejemplos proporcionan parametres, datos 0 inferencias estadisticas.
5. Los comentarios de futbol suelen presentar tablas como la siguiente:
estadigrafo muestra aleatoria
estadistica parametro EQUIPO A EQUIPO B
estadistiea descriptiva poblacion 0 universo
Goles 3 2
estadistica inferencial 0 inductiva variable Tiros en areo 12 9
Tiros Iibres 7 5
Tiros indireetos 2 4
Tiros de esquina 3 3
Saques laterales B 6
Posicion adelantada 1 4
Tarjetas amarillas o 2
Ejercicios
i,Son estadigrafos estos numeros? Si no es asi, i,que son?
1. Indiquese en cada uno de los casos siguientes si se trata de un estadigrafo, un dato 0 una
inferencia estadistica. Los ejercicios 6 all se basan en 10 siguiente: Imaginese una firma industrial comprometida en
la producci6n de articulos metalicos para la industria espacial. Entre sus productos hay
a) Una muestra de 250 asalariados en Campolandia sefialo un ingreso per capita de
14460 dolares. • Tornado de: Gary Lehman, escritor deportivo de la AP, 22 de agosto de 1975.
[15]
14 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
Conceptos matematicos
tornillos para los cuales existen estrechos margenes de tolerancia respecto a la anchura. Como
una parte de los procedimientos de control de calidad, se selecciona cierto numero de tornillos
de la produccion diaria y se los mide cuidadosamente.
6. Los tornillos seleccionados para su estudio constituyen: (a) la poblacion, (b) un
estadigrafo, (c) un parametro, (d) la muestra.
2 fundamentales
7. Las anchuras de todos estos tornillos constituyen: (a) un estadigrafo, (b) una variable,
(c) un pararnetro, (d) la muestra.
8. La medida de cada tornillo constituye: (a) un dato, (b) la muestra, (c) un estadigrafo, (d) la
poblacion,
9. La anchura promedio de los tornillos de la muestra constituye: (a) un parametro, (b) un
,estadigrafo, (c) una variable, (d) un dato.
10. :i,~e desea generalizar el resultado obtenido mediante la muestra para ampliarlo a: (a) el
2.1 Introduccion
dato.Tb) la variable, (c) el estadigrafo, (d) la poblacion.
«Yo no estoy muy fuerte en maternaticas, ~Como podria en estas condiciones
11. La anchura media de todos los tornillos producidos en un dia constituye: (a) el
aprabar estadistica?» Los autores de este libra han escuchado tales palabras de
parametro, (b) la variable, (c) el dato, (d) la poblacion,
labios de gran numero de estudiantes. Para muchos de ellos esta es una preocupacion
legitima, basada en experiencias desalentadoras que han tenido previamente con las
matematicas. Una breve ojeada a este libra podria tan solo servir para aumentar esta
\ansiedad, puesto que a primera vista muchas de sus formulas dan la impresion de ser
verdaderamente indescifrables para el principiante y pueden parecerle imposibles de
dominar. Por tanto, es muy importante aclarar bien las cosas desde un principio.
El lector no necesita ser un genio matematico para dominar los principios
estadisticos presentados en esta obra. El caudal de conocimientos matematicos
, necesario para dominar los fundamentos de la estadistica ha sido frecuentemente
exagerado. En realidad, 10 que se requiere para aprender estadistica es tan solo una
buena dosis de calculo aritmetico, logica y teson para no pasar un punta hasta
haberlo dominado por completo. Segun Carlyle, el exito en el aprendizaje de la
estadistica depende de po seer una capacidad ilimitada de paciencia. Aparte de estos
modestos requisitos, solo se precisa un conocimiento adecuado de diversos procedi
mientos algebraicos y aritrneticos que la mayo ria de los estudiantes aprenden en el
transcurso de su bachillerato. En este capitulo se revisa la gramatica de la notacion
matematica, se discuten varios tipos de escalas numericas y se adoptan ciertas reglas
para el redondeo de numeros.
El estudiante que desee repasar sus conocimientos matematicos elementales
puede acudir al apendice I, que contiene una revision de los conceptos necesarios
para dominar este texto.
justificado que sean tratadas ahora por separado. Estas notaciones son: L (lease
Recuadro 2.1 sigma), X y N. A la vez que definimos estos simbolos e indicamos el modo de
utilizarlos, revisemos 10 que denominaremos gramatica de la notacion matematica.
ENTREVISTADOS AFIRMATIVO NEGATIVO SIN OPINION
No es sorprendente descubrir que muchos estudiantes se yen tan atrapados por la
% % % marana de simbolos matematicos, formulas y operaciones, que no llegan a darse
cuenta de que las matematicas tienen una forma de gramatica similar a la del
Blanco 88 8 4
lenguaje hablado. En efecto, las matematicas tienen sus sustantivos, adjetivos, verbos
Ne~ro 77 18 5
y adverbios.
Menos de 30 afios 96 3 1
Sustantivos maternatic os, Comunrnente se emplean en matematicas simbolos para
Mas de 30 afios 82 12 6
representar cantidades. La notacion que utilizaremos con mayor frecuencia en
estadistica para representar una cantidad (0 resultado) es X, aunque ocasionalmente
Ingreso familiar anual
Sin religi6nT 95 6 0
N = 10.
Republicano 88 7 5
Dem6crata 84 12 4
Independiente 89 8 3
Adjetivos matematicos, Cuando queremos modificar un sustantivo matematico
para identificarlo con mayor precision, empleamos cornunmente subindices. Por
Noreste 85 11 4
tanto, si tenemos una serie de observaciones 0 resultados, podemos representarlos
Sur 85 10 5
88
como X l' X 2' X 3' X 4' etc. Tarnbien hallaremos frecuentemente la expresion Xi' en la
Norte central 8 4
Oeste 88 9 3
que el subindice puede tomar el valor que deseemos.
Verbos matematicos. Las notaciones que encaminan allector a efectuar algo tienen
Todos 87 9 4
las mismas caracteristicas que los verbos en el lenguaje cornun. Uno de los «verbos»
* Porcentaje menor que 0.5.
mas importantes es el simbolo L al cual nos hernos referido anteriormente. Esta
t En alqunas categorias. los porcentajes no suman exactamente 100. Esto se debe a
Las notaciones colocadas abajo y arriba del simbolo de suma sefialan que i Tambien,
tomara sucesivamente los valores 1, 2, 3, 4, 5, ... hasta N. La notacion indica que se N
Algunas veces esta forma de notacion puede decirnos que debemos sumar Generalizacion 3. La suma de los oalores de una variable mas una constante es igual a
unicamente cantidades seleccionadas; asi, la suma de los ualores de la variable mas N veces esa constante. Simbolicamente,
5 N N
I Xi = X 2 + X3 + X4 + x ; I (Xi + c) = I Xi + Nc.
i=2 i= 1 i= 1
IX;=X 1 + X2 + X 3
i= 1
EI simbolo sumatorio es uno de los operadores de mayor uso en estadistica, = 3+4 + 6.
Resumamos algunas de las reglas que rigen el empleo de este simbolo.
Para representar la suma de los valores de una variable cuando se ha sumado una
Generalizacion 1. La suma de N term inas de valor constante es igual a N veces esa constante (c = 2) a cada uno de ellos, escribiremos
constante. Simbolicamente, N
N I (Xi + c) = (3 + c) + (4 + c) + (6 + c)
Ic=Nc. i= 1
i= 1 = 3+4 + 6 + (c + c + c)
Sea c una constante. Entonces, si c = 10 y N = 5, = 3 + 4 + 6 + (2 + 2 + 2)
= 13 + 3c = 13 + 3(2)
N
= 19.
I c = (10 + 10 + 10 + 10 + 10) = 5(10) = 50.
i= 1 Generalizacion 4. La suma de los valores de una variable menos una constante es igual
a la suma de los valores de la variable menos N veces esa constante. En sirnbolos,
Analogamente, si X es la constante y X= 20, N = 15,
N N
N I(Xi-c)= IXi-Nc.
I
i= 1
X = NX = (15)(20) = 300. i= l i= 1
Para representar la suma de los valores de una variable cuando se ha restado una
Constante a cada uno, hagamos Xl = 3, X 2 = 4, X 3 = 6 y c = 2.
Generalizacion 2. La suma de los productas de una constante por cada uno de los N
valores de una variable es igual a la suma de los valores de la variable multiplicada por
la constante. Simbolicamente,
I
i= 1
(Xi - c) = (3 - c) + (4 - c) + (6 - c)
N N = 3 + 4 + 6 - (c + c + c)
IcXi=c I Xi. = 3 + 4 + 6 - 3c
i= 1 i= 1 = 13 - 3(2) = 7.
20 ESTADisTICA PARA LAS CIENCIAS SOCIALES CONCEPTOS MATEMATICOS FUNDAMENTALES 21
Ejemplo. Estas generalizaciones son a menudo utiles en estadistica, en particular no tiene sentido sumarlos, restarlos, multiplicarlos 0 dividirlos. Ejemplos adicionales
cuando se trata de sumar cantidades con grandes valores numericos; por ejemplo a los anteriormente mencionados pueden ser el numero de serie de un aparato
electrodornestico, el mimero del apartado postal, el numero del telefono, el mimero
Xl = 100465, X 2 = 100467, X3 = 100469, X4 = 100472. de la casa, el numero de matricula del autornovil y la clave de un libro de la
biblioteca.
Para sumar estos cuatro numeros, se puede restar 100000 de cada uno, sumar los Lo importante de sefialar es que los numeros se usan de varias formas para lograr
resultados y afiadir despues 4 veces 100000. Se tiene muchos objetivos diferentes. Muchas veces estos objetivos no incluyen la representa
cion de una cantidad. De hecho, hay tres formas fundamentales distintas de utilizar
4
I
i=1
Xi = 465 + 467 + 469 + 472 + 4(100 000)
los numeros:
1. Para designar inumeros nominales).
= 1873 + 400000 2. Para representar la posicion en una serie inumeros ordinaless.
= 401873.
3. Para representar una cantidad inumeros cardinales).
Medir es asignar numeros a objetos 0 sucesos de acuerdo con un conjunto de
reglas predeterminadas (0 arbitrarias). Los diferentes niveles de medida que estudia
2.4 Tipos de mimeros y de escalas remos representan distintos niveles de informacion numerica contenida en un
conjunto de observaciones (datos) tales como: una serie de numero de casas, el orden
Antropologos, psicologos y sociologos han llamado la atencion repetidas veces de llegada en una carrera de caballos, un conjunto de calificaciones de CI 0 el precio
acerca de la tendencia del hombre a explorar el mundo que esta mas alejado de sus por accion de varios valores bursatiles. El tipo de escala obtenida depende de las
experiencias primarias, antes de investigar 10 que Ie es mas proximo. Asi, mientras clases de operaciones matematicas que se pueden efectuar legitimamente con los
indaga las estrellas lejanas, describiendo con sorprendente exactitud sus movimien numeros,
tos aparentes y sus interrelaciones, ignora muchas cosas sobre la sustancia que Ie En las ciencias sociales se dan casos de mediciones en todos estos niveles.
permite vivir, el aire que inhalamos y exhalamos mas de cuatrocientos millones de Debe sefialarse que hay otros criterios para clasificar los mimeros y las formas de
veces al afio. De acuerdo con la experiencia de los autores, algo semejante sucede a utilizarlos. En esta obra se usa la clasificacion nominal-ordinal-cardinal porque se
los estudiantes en relacion con el manejo de los mimeros y el concepto que tienen de adapta mejor a los tipos de datos que obtenemos en las ciencias del comportamiento.
ellos. Como se vera, contamos, colocamos en posicion relativa y obtenemos calificaciones
En nuestra civilizacion occidental, tan orientada hacia 10 cuantitativo, la ma cuantitativas. Debe notarse tam bien que la asignacion a categorias no siempre es
yoria de los estudiantes emplean y manipulan numeros mucho antes de que sean tajante y sin ambiguedades. Hay casos en que los expertos no se ponen de acuerdo.
cap aces de calcular el promedio de aciertos en el tiro a gol de su jugador favorito. No Para ilustrar este punto, preguntemos: l,Es el mimero de su casa nominal u ordinal?
obstante, pidales que definan un numero 0 que describan las maneras en que se La respuesta depende de las propias necesidades. En ciertos casos se Ie puede
emplean los numeros, y encontrara en ellos expresiones de sorpresa y desconcierto. considerar nominal, tal como ocurre cuando se 10 usa como nombre de un
Es posible que respondan: «Nunca se me ocurrio antes pensar en ello». Despues domicilio.
de un os cuantos minutos de profunda reflexion, probablemente digan algo acerca de Otras veces se Ie puede considerar ordinal, ya que los numeros colocan a su
que los numeros son simbolos que denotan cantidades de cosas que se pueden sumar, casa en una posicion relativa respecto a otras casas de la manzana. Asi, 8 puede
restar, multiplicar y dividir. Todos estos son conceptos artimeticos familiares, pero estar a la izquierda de 12 y a la derecha de 4.
~agotan todos los usos posibles de los numeros? Con el riesgo de sumir a nuestros Los requisitos fundamentales de la observacion y de la medida son reconocidos
estudiantes en una total confusion, se Ie podria pregun tar: «~Es un numero de este por todas las ciencias fisicas y sociales y tarnbien por cualquier empresa moderna
tipo el simbolo 7 que lleva un jugador de futbol en su camiseta? ~Que puede decir mteresada en mejorar su posicion competitiva. A las cosas que observamos se las
acerca del numero de su casa? ~Y del canal 2 de su receptor de television? ~Indican llama frecuentemente variables 0 variantes. A cualquier observacion particular se la
estos numeros cantidades de cosas? ~Seria razonable sumarlos, restarlos, multiplicar denomina valor de la variable. Veamos dos ejemplos: Si se trata de estudiar el precio
los 0 dividirlos? lPodria usted multiplicar el numero que lleva en la espalda cualquier de las acciones en la Boisa de Nueva York, nuestra variable es el precio. Asi, si el
jugador de futbol por cualquier otro numero y obtener un valor con algun precio de venta de una accion es 8!, el valor de la variable es 8.50 dolares, Si
significado?», Un analisis cuidadoso de nuestro uso de los numeros en la vida diaria interesa determinar si una cierta empresa discrimina basandose en consideraciones
revela un hecho muy interesante: la mayo ria de los mimeros que empleamos no raciales, la variable es entonces la clasificacion racial de los empleados. Esta variable
poseen las propiedades aritmeticas que ordinariamente les atribuimos; esto es, puede tener varios valores tales como negro, hispano y blanco.
22 ESTADiSTICA PARA LAS CIENCIAS SOCIALES CONCEPTOS MATEMATICOS FUNDAMENTALES 23
Recuadro 2.2
porcentaje correspondiente*.
CATEGORIA
DEL HOMBRES MUJERES
TRABAJO: N." DE N." % N." DE N." %
PROFESOR POST. ADM. ACEP. POST. ADM. ACEP.
Una forma muy cornun de presentacion de datos es la que se obtiene por la tecnica del cada categoria, el porcentaje de mujeres admitidas fuera el doble que el porcentaje de
«recuento», que consiste en registrar el numero de individuos, objetos u observaciones hombres admitidos. A pesar de ella, cuando se hacen los calculos con los totales resulta
comprendidos en las diversas categorias. Para dar mayor sentido a estos datos es usual que el porcentaje general de hombres admitidos (23 %) es mayor que el de mujeres (15 %).
convertir los recuentos en proporciones 0 porcentajes. Sin embargo, en ciertas circuns ~Como es posible llegar a esta especie de prestidigitacion numerica? Muy sencillo. Si
tancias, tales porcentajes pueden ocasionar confusion 0 error. se examina la tabla nuevamente, se encontrara que la mayor parte de las aspirantes
Lo que sigue es un fragmento de Winning with Statistics que ilustra el problema de ferneninas, 600, fueron para cargos de los grados K a 8. Inversamente, hubo muy pocos
los «porcentajes paradojicos», aspirantes masculinos para esos cargos. Resulta que el numero de vacantes para los
Vamos a presentar algunos datos imaginarios en los que la proporcion de mujeres grados K a 8 es el mas pequefio. Lo que se tiene, entonces, es una situacion en la que
admitidas en cada categoria de trabajo es realmente mayor que la proporcion de una abrumadora mayoria de las mujeres aspiraron a cargos «dificiles de obtener», Por
hombres admitidos en cada una de estas categorfas. Sin embargo, cuando se combina otra parte, la mayor parte de los hombres aspiraron a cargos donde ~I numero de
sobre todas las categorfas las proporciones de hombres y mujeres admitidos, se vacantes era mayor. Al combinar todas las categorfas en las que hay diferentes numeros
encuentra, como por arte de magia, que a las mujeres les corresponde una proporcion de solicitantes, para las diferentes posiciones, el porcentaje mas bajo de mujeres en el
general mucho menor de admisiones. Asi, si se observara las cifras totales se llegarfa grupo K-8 es totalmente desfavorable para las profesoras. ~Por que? Mas del 80 ~~ de
inexorablemente a la conclusion de que hay discriminacion en contra de las mujeres. Sin las profesoras solicitaron precisamente los cargos donde el numero de vacantes era
embargo, si se examinara la misma prueba categorfa por categorfa se llegarfa precisa extremadamente bajo en relacion con el numero de aspirantes.
mente a la conclusion opuesta, 0 sea, que hay discriminacion en contra de los hombres. De aqui se deduce una moraleja. Es mejor aspirar a un cargo donde pocos son los
Observense los datos de Ja tabla anterior. llamados pero muchos (relativamente hablando) los escogidos, que pretender ser
Examinemos cuidadosamente la tabla. Se prepare a proposito de modo que, en admitido donde muchos son los llamados pero pocos los escogidos.
-.Runyon, R. P., Wi""ing with Statistics. Addison-Wesley. Reading, Mass., 1977.
2.4.1 Escalas nominales hem bras expuestas a la radiacion atomica durante el embarazo, el sexo seria la
variable a determinar. Hay solamente dos valores posibles de esta variable: macho y
Cuando se trata de mediciones, la mayor parte de las personas imaginan, probable hem bra (se descarta una imprevista mutacion capaz de producir un tercer sexo). Si se
mente, costosos e increiblemente complejos instrumentos que ciertos hombres utilizara una computadora para analizar los resultados, podriamos asignar un
extraordinarios, con batas blancas, manipulan para obtener medidas precisas de la numero a cada valor de la variable. Asi, al sexo masculino se Ie podria asignar un cero
variable en estudio. La realidad, sin embargo, muestra que no todas las medidas y al femenino un uno. Nuestros datos consistirian en e1 numero de observacio
requieren tal precision. Si se tratara de estudiar el sexo de la descendencia de ratas nes en cada una de estas dos c1ases. Notese que no pensamos en que esta variable
24 ESTADfsTICA PARA LAS CIENCIAS SOCIALES CONCEPTOS MATEMATICOS FUNDAMENTALES 25
pueda dar lugar a una serie ordenada de val ores, como ocurre con la estatura, el 2.4.3 Escala de intervalos y de cocientes 0 razones
peso, la velocidad, etc. Un organismo femenin no tiene un valor mayor de la
variable, el sexo, que un organismo masculino. Finalmente, el nivel mas alto de las medici ones cientfficas se obtiene por medio de
Las observaciones de variables no ordenadas constituyen un nivel de medida escalas que emplean numeros cardinales iescalas de intertalos J' de razones). Los
muy bajo y corresponden a una escala nominal de medida. Como hemos visto, es valores nurnericos asociados con estas escal as son efectivamente cuantitativos y, por
posible asignar valores numericos para representar las diferentes cIases en una escala tanto, permiten el uso de operaciones aritrneticas tales como suma, resta, multiplica
nominal, pero estos numeros no tienen propiedades cuantitativas y sirven unicamen ci6n y divisi6n. En las escal as de interval os y de razones las diferencias iguales entre
te para identificar las cIases. punt os de cualquier parte de la escal a son iguales entre si. Asi, la diferencia entre 4
Los datos empleados con las escalas nominales consisten en conteos de frecuen metros y 2 metros es igual a la diferencia entre 9231 y 9229 metros.
cias 0 tabulaciones del numero de sucesos en cada cIase de la variable en estudio Como se recorda-a, al tratar con escalas ordinales no podemos asegurar que la
(vease el recuadro 2.2). En el estudio mencionado anteriormente, ace rca de las ratas diferencia entre el primer lugar y el segundo sea igual a la diferencia entre el segundo
sometidas a radiaci6n, el numero de machos y de hembras en la descendencia y el tercero.
constituirian los datos. Tales datos reciben indistintamente el nombre de datos de Hay dos tipos de escal as que se basan en los numeros cardinales: la de intervalos
[recuencias, datos enumeratioos, datos de atributos 0 datos de categoria. Las unicas y la de razones. La escala de intervalos se diferencia de la de razones en la posici6n
relaciones matematicas adecuadas a las escalas nominales son las de equivalencia (=) del cero. En una escala de intervalos el punto cero est a arbitrariamente determinado,
o no equivalencia (=1=). Asi, una persona u objeto particular tiene la caracteristica que y no representa la ausencia completa del atributo que se mide. EI calendario es un
define la cIase (=) 0 no la tiene (=1=). ejemplo de escala de intervalos, pues el afio cero no indica la ausencia de tiempo
antes de este afio, En cambio, el cero en una escal a de razones representa la ausencia
completa del atributo que interesa. Una longitud igual a cero significa que no hay
2.4.2 Escalas ordinales longitud. Como consecuencia de esta diferencia en la posici6n del punto cero,
solamente la esc'll a de razones es la que permite formular proposiciones referentes a
Al pasar al nivel inmediatamente superior de medici6n, encontramos variables en las las razones de nurneros en la escala. Por ejemplo, 4 metros es a 2 metros como 2
cuales las clases representan de hecho una serie ordenada de relaciones. Asi, las clases metros es a 1 metro. La distinci6n entre estas escal as se puede aclarar examinando
en las escalas ordinales no son s610 diferentes entre si (caracteristica que define a las una esc'll a de intervalos muy conocida como es la escal a de temperatura de Celsius.
escalas nominales), sino que mantienen alguna clase de relaci6n entre ellas. Mas La escala de temperaturas de Fahrenheit es tarnbien una escala de intervalos.
especificamente, las relaciones se expresan en terrninos del algebra de las desigualda EI punta cero en la escala de Celsius 110 representa la ausencia completa de calor.
des: a es menor que b (a < b) 0 a es mayor que b (a> b). Entonces, las relaciones De hecho, este punta es simplemente aquel en que se produce la congelaci6n del agua
encontradas son tales como mayor, mas rapido, mas inteligente, mas maduro, mas al nivel del mar; es decir, se trata de un cero arbitrario. El cero real, conocido como
prestigioso, mas perturbado, etc. Los numerales empleados en conexi6n con las cero absoluto, corresponde aproximadamente a - 273 DC. Ahora bien, si dijeramos
escalas ordinales no son cuantitativos. Ellos indican solamente la posicion en una que 40 os:es a 20 DC como 20 ° es a 10 "C, parecerfa que hacemos una afirmaci6n
serie ordenada y no «cuanta» diferencia existe entre posiciones sucesivas en la escala. correcta.Ipero en realidad estariamos cometiendo un error porque 40°C representa
Ejemplos de aplicaci6n de escalas ordinales son: el ordenamiento de jugadores de real mente 273" + 40" de temperatura, 20 DC representa 273 c + 20° de temperatura y
10 representa 273" + 10". Es claro que la raz6n 313:293 es muy diferente de 293 :283.
0
seamos consecuentes con esta forma de adjudicar los rangos queda ilustrado por ABSOLUTO
ciertas expresiones populares tales «idiota de primera clase» 0 «granuja de primera», Fig. 2.1 Relaciones en varios puntas de lu escala Celsius can el cera absolute,
26 CONCEPTOS MATEMATICOS FUNDAMENTALES 27
ESTADfSTICA PARA LAS CIENCIAS SOCIALES
Aparte de la diferencia en la naturaleza del punto cero, las escalas de intervalo y necesariamente incluyen solamente numeros enteros. Sin embargo, la mayor parte de
de raz6n tienen las mismas propiedades y seran tratadas en la misma forma a 10 largo las escalas discontinuas usadas por los cientificos de las ciencias sociales y del
del texto. comportamiento, se expresan generalmente en terminos de numeros enteros. Por
Debe sefialarse que una de las metas mas perseguidas por los cientificos del ejernplo, un psicologo registra el numero de. personas con pulso irregular, 0 el
comportamiento es la de obtener rnedidas cuya naturaleza sea por 10 menos la de numero de nifios que asisten al jardin de infancia y que provienen de unidades
intervalos. Ciertamente, para la mayor parte de las pruebas estadisticas presentadas jamiliares de diferentes tamafios. Esta claro que en cada uno de estos ejemplos se
en este libro se considera que las mediciones corresponden a una escala de intervalos. trabaja con numeros enteros. En cambio, una escala continua es aquella en que hay
un nurnero ilimitado de valores posibles entre dos valores adyacentes cualesquiera de
Aunque es discutible que muchas de las mediciones efectuadas por los cientificos del
la escala. Asi, si la variable es altura medida en pulgadas, entonces 4 pulgadas y 5
comportamiento lleguen al nivel de una escala de intervalos, estan de acuerdo en
suponer que asi es. pulgadas sedan dos valores adyacentes de la escala. Sin embargo, existe un mimero
Una de las caracteristicas de las escalas de orden superior es que se las puede infinito de valores intermedios tales como 4.5 pulgadas, 4.7 pulgadas, etc. Si la
transformar facilmente en escalas de orden mas bajo. Asi, el resultado de una carrera variable es la altura medida en decirnas de pulgada, entonces 4.5 pulgadas y 4.6
d.e una milla se puede expresar en unidades de tiempo (escala de razones), por pulgadas son dos valores adyacentes de la escala, pero puede haber todavia un
ejernplo 3 :56,3 :58 y 4:02. Los tiempos que pueden entonces transformar en datos de numero infinito de valores intermedios tales como 4.53 pulgadas, 4.59 pulgadas, etc.
una escala ordinal, por ejemploprimero, segundo y tercer lugar en el orden de Es muy importante tener en cuenta que, asi como la medida de variables discretas
llegada. Sin embargo, no es posible efectuar la transformaci6n inversa. Si, por es siempre exacta, la medida de variables continuas es siempre aproximada. Por
ejemplo, conocemos unicamente el orden de llegada en una carrera, no podemos ejemplo, si estuviesemos midiendo la estatura de los hombres de un determinado
expresar los resultados en terrninos de una escala de razones (tiernpos). Aunque es pais, cualquier medida obtenida seria inexacta, porque siempre podriamos imaginar
admisible transformar las marcas de una escala de mayor nivel a otra de menor nivel, un instrumento de medida mas preciso que el anterior. Asi, al sefialar que la estatura
no es recomendable hacerlo, por 10 general, ya que se pierde informaci6n cuantitativa de un hombre es de 172 em, queremos decir que es de 172 ern con una tolerancia de
precisa. medio centimetro. Si nuestra escala nos proporciona aproxirnacion hasta las
decirnas, podemos imaginar otra escala aun mas exacta que nos de aproxirnacion
hasta las centesimas 0 milesirnas. La caracteristica basica de las escalas continuas es
entonces, la igualdad de las unidades de medida. Por ejemplo, si empleamos el
2.5 Escalas continuas y discontinuas centimetro como unidad de medida, esta unidad perrnanecera identica a traves de
toda la escala. Son ejemplos de variables continuas la longitud, la velocidad, el
Imaginemos que se trata de determinar el promedio de hijos de la familia estadouni tiernpo, el peso, etc.
dense. La escala de medida cornenzara en cero (ningun hijo) y se incrernentara de uno Consideremos una observacion mas. A menudo, las variables continuas se
en uno hasta llegar quizas a quince 0 veinte. N6tese que al pasar de un valor de la expresan en nurneros enteros, dando la impresion de ser discontinuas. Asi, alguien
escala al siguiente, utilizamos numeros enteros y no fracciones. Asi, una familia puede puede decir que tiene 172 ern de estatura y 68 kg de peso, que su padre tiene 175 ern
tener 0, 1, 2 0 mas hijos. A pesar de la abstracci6n estadistica de que en los Estados de estatura y un peso de 87 kg, y que su madre tiene 160 em de estatura y un peso de
Unidos el promedio obtenido es aproximadamente de un hijo y tres cuartos, no se 55kg. Sin embargo, fue porque decidio expresar las estaturas con aproximaci6n al
conoce ninguna pareja que haya alcanzado este maravilloso estado de planificaci6n centimetro mas cercano y los pesos con aproximaci6n al kilogramo mas cercano.
familiar. No existe la posibilidad de hacer una elecci6n como esta cuando se trata de cosas
A tales escalas se las llama discontinuas 0 discretas, y tienen como caracteristica tales como el rnimero de hijos de una familia. Estos datos se presentan necesaria
basica la igualdad de sus unidades de con teo. Asi, cuando se estudia el nurnero de mente como numeros enteros.
hijos por familia, todos los hijos son iguales, pues cada uno representa una unidad de
conteo. A estas escalas se las considera cardinales por cuanto permiten el uso de 2.5.1 Variables continuas, errores de medida
operaciones aritmeticas tales como la suma, resta, multiplicaci6n y divisi6n. Asi,
podemos decir que una familia con cuatro hijos tiene el doble que una familia con y «limites verdaderos» de los mimeros
dos. Las observaciones correspondientes a variables discretas son siernpre exactas si
los procedimientos de con teo empleados son precisos. Ejemplos de variables En nuestra exposici6n anterior, sefialamos que las variables distribuidas en forma
discontinuas son: el ritmo cardiaco (numero de latidos por minuto) en los adultos, el continua pueden tomar un mimero infinito de valores intermedios. En consecuencia,
numero de gl6bulos blancos que se encuentran en un centimetro cuadrado, el mi nunca podremos especificar el valor exacto de cualquier medicion, pues es posible
mero de particulas alfa observadas en un segundo, etc. que un instrumento de medida mas preciso pueda incrementar ligeramente la
P01" 10 expresado anteriormente no se debe suponer que las escalas discretas exactitud de nuestras medidas. Por esta razon decimos que los valores numericos de
28 ESTADfSTICA PARA LAS CIENCIAS SOCIALES CONCEPTOS MATEMA.TICOS FUNDAMENTALES 29
las variables que se distribuyen en forma continua son solamente aproximados. Sin Asi, si los datos originales estan en unidades enteras, redondearemos nuestra
embargo, es posible especificar los limites dentro de los cuales se encuentra el valor respuesta hasta el segundo decimal. Si se trata de numeros que incluyen decimas,
real; por ejemplo, los limites »erdaderos de un valor de una variable continua son debemos redondear hasta el tercer decimal, y asi sucesivamente.
iguales a ese numero mas 0 menos la mitad de la unidad de medida correspondiente. Una vez decidido el numero de lugares decimales que contendran nuestros datos
Veamos algunos ejemplos. Supongamos que ellector tiene una balanza en su bafio, finales, nos queda todavia el problema de como presentar la ultima cifra. Afortuna
cuya escala esta graduada en kilogramos. Cuando sube en ella para pesarse, damente, la regia para su determinacion es muy sencilla y categorica, Si el resto que
normalmente el fiel de la balanza quedara por encima 0 por debajo de alguna de las aparece despues de esa cifra es mayor de 5, se aumentara hasta la cifra inmediata
divisiones de la escala. A pesar de ello, aproximara su peso al kilogramo mas cercano. mente superior. Si el resto que aparece despues de esa cifra es menor de 5,
Asi, si el fiel esta colocado aproximadamente a 3/4 de la distancia entre n y 73 permanecera sin modificacion alguna. Veamos algunos ejemplos. En cada caso,
kilogramos, usted did que su peso es de 73 kilogramos. Quedara sobreentendido que redondearemos hasta la segunda cifra decimal:
los limites «verdaderos» de su peso, aceptando que la balanza este graduada
correctamente, seran de n.5 kg y 73.5 kg. Otro ejemplo: si se trata de expresar el 6.546 se convierte en 6.55
peso de unas ballenas, es probable que se emplee una unidad de medida mayor, 6.543 se convierte en 6.54
digamos 100 kg. Asi, al indicar que el peso de una ballena es de 14000 kg, se quiere
1.967 se convierte en 1.97
decir en realidad que el peso oscila entre 13 950 y 14050 kg. Si la escala estuviese
dividida en unidades de 1000 kg, los limites verdaderos del peso de la ballena sedan 1.534 se convierte en 1.53
13 500 kg y 14500 kg.
Cabria preguntarse: «~Que sucederia si en los ejemplos anteriores la cifra del
tercer lugar decimal fuera 5?».
Primero habria que determinar si el resto representado por esta cifra es exacta
2.6 Redondeo mente 5. Si es 5 mas un resto por minimo que sea, la regia anterior se aplica y se
debera afiadir uno a la cifra del segundo lugar decimal. Si fuese casi, pero no
rigurosamente 5, la cifra del segundo lugar perrnanecera sin alteracion alguna. Si es
Imaginemos que se han obtenido algunos datos y que en el curso de nuestro analisis
exactamente 5, sin ningun resto, se aplica un convenio arbitrario aceptado universal
estadistico necesitamos dividir un numero por otro. En este texto apareceran
mente por los maternaticos, que consiste en redondear la cifra del segundo lugar
innumerables ocasiones en que tendremos que efectuar esta operacion aritmetica, En
decimal hasta numero par mas proximo. Si esta cifra es ya par, no sufre cambio
algunos cas os, la respuesta sera un numero con infinitos decimales. Por ejemplo, si
alguno. Si es impar, sumele uno para convertirla en par. Veamos algunos ejemplos en
expresaramos la fraccion 1/3 en forma decimal, el resultado seria 0.33333 +. Es obvio
los que se redondea hasta el segundo lugar decimal:
que no podemos prolongar indefinidamente esta secuencia de numeros. Deberemos
terminarla en algun punto y asignar un valor al ultimo numero de la serie de modo
6.545001 se convierte en 6.55. ~Por que?
que refleje el resto de la mejor manera posible. Al hacerlo, se presentan dos
problemas: 6.545000 se convierte en 6.54. ~Por que?
1.9652 se convierte en 1.97. ~Por que?
1. ~Cuantos lugares decimales habra de contener la respuesta?
2. ~Que decision tomamos del ultimo numero de la serie? 0.00500 se convierte en 0.00. ~Por que?
La respuesta a la primera pregunta se da frecuentemente en terrninos del numero 0.01500 se convierte en 0.02. ~Por que?
de cifras significativas. Sin embargo, existen buenas razones para no seguir al pie de 16.89501 se convierte en 16.90. ~Por que?
la letra la rigidez maternatica. Para simplificar y por comodidad, adoptaremos el
siguiente criterio respecto al redondeo:
Para la obtencion de la respuesta final, debemos redondear hasta dos lugares mas de .
asertos. Asi, es posible que un diputado, tratando de impresionar al gran publico, Sustituyendo en la f6rmula anterior, se obtiene:
para demostrarle su interes por los problemas de los consumidores, denuncie que un
determinado laboratorio farmaceutico esta obteniendo una ganancia del 300 % en y-x 6
- y - x 100 = 8" x 100 = 75%.
sus vent as al por menor; y, ala vez, ellaboratorio, valiendose de los mismos datos
estadisticos, podra replicar con justa indignacion que su beneficio es solo del 75 %.
~Como puede ser esto? Veamos.
Supongase que el costa de produccion de cierto farrnaco es de 2 pesos por
unidad, y que a la vez la unidad se vende al por menor a 8 pesos. La razon del
beneficio (8 - 2 = 6) al costa de produccion es de 6:2, 0 sea, 3:1. Expresando esta
Resumen del capitulo
razon en forma de porcentaje (multiplicando por 100), resulta una ganancia del
300 %, 10 que parece indicar que el diputado esta en 10 cierto. Sin embargo, el En este capitulo hemos sefialado que para seguir con exito este curso no se requiere
laboratorio Iarmaceutico replica: «EI precio de venta es de 8 pesos y nuestra un conocimiento avanzado de las matematicas. Si se dominan las matematicas de
ganancia es de 6 pesos, de modo que la razon de la ganancia al precio de venta es de bachillerato, y se trabaja asiduamente, se lograra familiriarizarse con los conceptos
6.8,0 sea, 0.75 /~. Expresada como porcentaje, nuestra ganancia es tan solo el 75 %del fundamentales expuestos en este texto.
precio de venta. Considerando los cost os de investigacion y explotacion, y los riesgos Para ayudar al estudiante que no haya tenido reciente contacto con las matemati
financieros, la ganancia no parece excesiva». cas, se han repasado algunos de sus conceptos fundamentales. Se incluye en este
~Cual de las dos explicaciones describe mejor los hechos? Realmente, ambas son repaso : (1) gramatica de la notacion matematica, (2) tipos de numeros, (3) tipos de
correctas. La confusion reside en que se han empleado diferentes valores (2 y 8) como escalas numericas, (4) escalas continuas y discontinuas, (5) redondeo y (6) frecuencias,
base, 0 denominador, para calcular los porcentajes. Ninguno de los procedimientos proporciones y porcentajes. Los estudiantes que necesiten una revision mas extensa
es erroneo, siempre y wando quede perfectamente claro que base se empleo en los de las maternaticas pueden consultar el apendice I.
calculos iniciales. Conocida la base, podremos pasar facilmente de una cifra a la otra
sin ninguna confusion. Asi, si sabemos que el diputado uso como base el costa de
produccion, podemos usar el algebra elemental para convertir su aserto en otro
donde se use como base el precio de venta. Sean: Terrninos para recordar
x = Costo de produccion = 2 pesos
datos de frecuencias (datos de atributos, escalas discontinuas
y = Precio de venta = 8 pesos
datos cateqoricos, datos enumeratitos} (escalas discretas]
La ecuacion siguiente representa el porcentaje de beneficio tomando como base el escala de intertalos limites verdaderos de un numero
costa de produccion: escala de razones medicion
escala nominal nameros cardinales
y-x
- - x 100 = Porcentaje de beneficio (tomando como escala ordinal numeros nominales
x base el costa de produccion), escalas continuas nameros ordinales
Utilizando los valores anteriores y sustituyendo en la ecuacion, hallamos: variable
y-x 8-2
- - x 100 = -- x 100 = 300%.
x 2
recopilado datos que refuerzan esta creencia general. Veamos a continuaci6n los da 8. Redondear los siguientes numeros hasta la segunda cifra decimal.
tos recopilados junto con algunas preguntas de una encoesta referente a la informaci6n
que proporcionan los medios de comunicaci6n masiva ace rca de los seismos. a) 99.99500 b) 46.40501
Hallense la proporci6n y el porcentaje de personas que respondieron en cad a una de las c) 2.96500 d) 0.00501
categorias a las preguntas formuladas en la encuesta. e) 16.46500 f) 1.05499
i.Confirman las respuestas el punto de vista general de que los californianos evitan pensar g) 86.2139 h) 10.0050
en los terremotos? 9. En 1973 se suicidaron 15840 hombres y 4625 mujeres. Hallar la proporci6n de suicidios
de hombres y de mujeres (redondear hasta el segundo decimal).
a) Los medios de informaci6n se ocupan b) i.Que piensa ace rca de la informaci6n
muy poco, demasiado 0 en forma su que se da en cuanto a los preparativos 10. En 1973 fueron asesinadas 17 123 personas por: armas de fuego, 11 249; arma blanca,
ficiente acerca de 10 que se debe hacer para el caso de un terremoto? 2895; estrangulaci6n 0 golpes, 1445; objetos contundentes, 848; incendio provocado, 173;
al producirse un terremoto? otros, 423. Hallar las proporciones correspondientes a estas causas de muerte (redondear hasta
eI segundo decimal).
NUMERO NUMERO 11. En 1973 hubo 20465 suicidios Y 17123 homicidios. Hallar la proporci6n correspondiente
DE RESPUESTAS DE RESPUESTAS
a los suicidios y tarn bien .la correspondiente a los homicidios (redondear hasta eI cuarto
Muy poco 386 Muy poco 357
decimal).
Suficiente 103 Suficiente 121
12. En la tabla siguiente se muestra eI nurnero de hombres y de mujeres que fueron victimas de
Demasiado 8 Demasiado 14
homicidio entre los afios 1968 y 1973.
Sin opini6n 3 Sin opinion 8
tomadas por el gobierno para el caso las predicciones no cientilicas de los 1969 5215 1801
DE RESPUESTAS DE RESPUESTAS
N
c) X~ + Xi + X~ + X?, d) xi + X~ +". + X,~
N b) i.Cu:il es su peso?
20. i,Cuales de los enunciados siguientes representan escalas continuas y cuales representan 24. Eugene J. Kanin* ha estudiado varios aspectos del cornportamiento de varones sexual
.escalas discretas de medida? mente agresivos. La agresividad sexual se definio como «un intento de contacto sexual con una
a) Numero de bombillas vendidas diariamente en una tienda. mujer en actitud de rechazo, durante el cual se utiliza violencia fisica en grado tal que da lugar
b) Ingresos mensuales de los estudiantes graduados. a reacciones que denotan ofens a en la mujer» (pag. 429). Cuando sus resultados fueron
c) Temperatura registrada cada dos horas en la seccion de venta de carnes de un comparados con los correspondientes a una muestra de varones no agresivos, se formula la
supermercado. hipotesis de que los varones no agresivos pudieron utilizar tecnicas de seduc~i6n en lugar ~e
d) Pesos de palomas registrados cada 24 horas en un laboratorio experimental. tecnicas agresivas con mas frecuencia que los varones agresivos como medio de conseguir
e) Tamafios de recien nacidos registrados en la seccion de maternidad de un hospital. contacto sexual.
f) Numero de libros de texto existentes en la Iibreria de una universidad. Una muestra de 254 varones no agresivos y 87 varones agresivos revelo las siguientes
frecuencias en que los sujetos admitieron el uso de tecnicas de seduccion.
21. Usando los datos de la tabla siguiente, responder a las siguientes preguntas:
a) De todos los estudiantes que se graduan en cad a area academica, i,cual es el
porcentaje de mujeres? VARONES VARONES
NO AGRESIVOSt AGRESIVOSt
b) Considerando unicamente los hombres, i,que porcentajes se encuentran en cada area
acadernica?
Intento de embriagar a la chica 23 33
c) Considerando unicamente las mujeres, i,que porcentajes se encuentran en cada area 19 7
Falsa promesa de matrimonio
academica? 37 39
Amor fingido
d) De todos los estudiantes que se graduan en las cinco areas, i,cual es el porcentaje de Amenaza de terminar las relaciones 9 8
hombres y cual el de mujeres?
EI mimero de estudiantes graduados en cada una de cinco areas acadernicas, conforme a su Numero total de varones entrevistados N = 254 N= 87
sexo, es:
t La suma de las frecuencias no as igual a N. porque algunos sujetos admitieron que empleaban
mas de una tecrnca Y otros manifestaron que nunca usa ban tales tecnlcas.
AREA ACADEMICA HOMBRES MUJERES
a)Hallar el porcentaje de varones agresivos y no agresivos que admiten usar cada una
Administraci6n de empresas 400 100
de las tecnicas de seduccion.
Enseiianza 50 150
*b) Construya diagramas de barras para mostrar los porcentajes de varones agresivos y
Humanidades 150 200
no agresivos que emplean cada tecnica,
Ciencias 250 100
c) i,Se tiene la impresion de que la hipotesis tiene fundamento?
Ciencias sociales 200 200
* (Tornado de: Kanin, E. J., «An examination of sexual aggression as a response to sexual frustration», Jot/mal oj
22. Indicar cuales de las siguientes variables representan escalas discretas 0 continuas.
Marriage and tile Family, 1967, 29, 428,433.) Copyright © 1967 par el National Council on Family Relations.
Reproducido con permiso.
a) Tiempo que se emplea en resolver estos problemas.
Envenenamiento
Asfixia
Ahorcamiento
6
4
Estadistica descriptiva
Saito desde lugares elevados 2
1
Instrumentos cortantes
1 o
Total de suicidios N = 23 N = 25
Distribucion de
3 frecuencias y tecnicas
de representacion grafica
oa..
30
Tabla 3.2 Distribucion de frecuencias de CI de X I X I X I
X I
20 110 estudiantes seleccionados al azar.
154 I 135 II 116 II 97 II
10 115 96 I
153 134 I IIII
152 133 II 114 II 95
o 151 132 I 113 1111 94 I
SIN SEPARACION SEPARACION 1A7 MAS DE
IN = 1371 PROLONGADA DIAS
7 DIAS 150 I 131 II 112 11\ 93 II
(N=501 (N = 37)
IN = 20) 149 130 I 111 III 92
148 129 \ 110 11111 91 I
147 I 128 II 109 II 90 I
PREFERENCIA POR EL LADO IZQUIERDO i"} 146 127 III 108 I 1111 89 II
• PREFERENCIA POR EL LADO DERECHO ,;j-' 145 I 126 I 107 II 88
144 125 II 106 II 87 I
143 I 124 I 105 II 86
142 II 123 III 104 II 85 II
141 122 II 103 III 84
140 121 II 102 I 83 I
Los psicologos creen en la posibilidad de que los latidos del corazon de la madre sean 139 I 120 I 101 II 82 I
reconfortantes para el bebe. Si se mantiene al nino en el lado Izquierdo de la madre, el 138 119 III 100 1I11 81
sonido de los latidos es mas pronunciado. Un investigador estudio las diversas 137 I 118 II 99 80 I
circunstancias en que las mad res manifiestan una preferencia por sostener a sus hijos en 136 I 117 II 98 I
ellado Izquierdo 0 en el derecho. Algunas mad res tienen acceso a sus bebes inmediata
mente despues del nacimiento (sin separacion), mientras que otras 10 tienen despues de
un periodo de por 10 menos 24 horas (separacion prolongada). Las graficas resumen los calculadoras autornaticas, es antieconomico y pOCO practice manejar un gran
resultados obtenidos en una muestra de 197 madres.
numero de datos dispersos. (2) Algunos de los datos tienen asociada una frecuencia
Las mad res de primogenitos que no fueron separadas de sus nifios mostraron una
tan baja que no se justifica mantenerlos como entidades distintas y separadas.
marcada preferencia a sostener a sus bebes en ellado Izquierdo. En cambio, las mad res
de primogenitos con los cuales no tuvieron contacto inmediato tendieron a preferir el Como factor negativo esta naturalmente el hecho de que al agrupar los datos se
lado derecho. (Vease la grafica de la parte superior izquierda.) . pierde inevitablemente parte de la informacion. Por ejemplo, las calificaciones
Cualquier separacion (por un dia 0 mas) parece producir una preferencia por ellado individuales pierden su identidad cuando se las agrupa en intervalos de clase, y son
derecho. Cuanto mas prolongada es la separacion, mayor es la preferencia por el la inevitables algunos pequefios errores en los estadigrafos calculados en base a datos
do derecho, como se ve en la segunda grafica, Estos resultados se basan en datos de 57 agrupados.
mad res que no tuvieron acceso a sus bebes inmediatamente despues del nacimiento. La pregunta que surge ahora es: «~Cl.ial sera nuestro criterio de decision acerca
De «The Role of the Hearthbeat in the relations between Mother and Infant». par L A. Salk. Scientific Ameri
de los intervalos de agrupamiento que vamos a emplear?». Evidentemente, los
can, mayo 1973, 228 (5),24-29. Copyright © por Scientific American, Inc., 1973. Todos los derechos reservados, intervalos seleccionados no deben ser tan amplios que perdamos la discriminacion
proporcionada por nuestra medida original. Por ejemplo, si dividieramos los CI
DlSTRIBUCION DE FRECUENCIAS Y TECNICAS DE REPRESENTACION GRAFICA 43
42 ESTADfSTICA PARA LAS CIENCIAS SQCIALES
general aplicable en todos los casos para responder a nuestra pregunta. La mayoria 150-154 2 125-129 9 100-104 12
de las veces, la eleccio.i del numero -de intervalos debe representar una decision j... 145-149 2 120-124 9 95-99 4
basada en considerar de una parte los efectos del agrupamiento sobre la posibilidad + 140-144 3 115-119 13 90-94 5
de discriminar los datos y de otra la economia de la presentacion, No obstante, se 135-139 5 110-114 17 85-89 5
130-134 7 105-109 14 80-84 3
acepta generalmente que buena parte de los datos que se manejan en las ciencias del
comportamiento pueden ser agrupados entre 10 a 20 intervalos de clase. Por razones N = 110
de uniformidad, consideraremos aproximadamente 15 intervalos de clase para los
datos que se analizan en este texto.
Una vez decidido el mimero apropiado de intervalos para un conjunto de datos,
resulta que los procedimientos para asignar los puntajes a los intervalos de clase son que hay concentracion de frecuencias en los intervalos de clase comprendidos entre
muy sencillos. Aunque se puede elegir entre varias tecnicas, para ser consecuentes 110 y 119. Se destaca tarnbien que el numero de datos en los extremos tiende a
emplearemos solamente una. EI procedimiento es el siguiente: disminuir. Resulta que se ha alcanzado uno de los objetivos del agrupamiento: lograr
una ordenaci6n de datos que sea econornica y manejable.
Paso 1. Hallese la diferencia entre el mas alto y el mas bajo de los datos originales.
Afi.ada 1 para obtener el numero total de datos 0 de datos potenciales. En el presente Adoertencia: La mayor parte de los datos con los que trabaja el cientifico del
+
ejemplo, el resultado es (154 - 80) 1 = 75. comportamiento vienen expresados por numeros enteros y no por decimales. Por
esta razon, en nuestros ejemplos usamos enteros. Sin embargo, en ciertos casos los
Paso 2. Dividase este mimero por 15 para obtener el rnimero de datos 0 de datos datos estan expresados en forma decimal (por ejemplo, el tiempo de reacci6n). EI
potenciales en cada intervalo. Si el valor resultante no es un numero entero, y procedimiento mas sencillo consiste en tratar los datos como si n~ existiera el punto
~i generalmente no 10 es, los autores prefieren redondear al numero impar mas decimal. En otras palabras, hay que tratar a cada dato como SI fuera un numero
pr6ximo, de manera que en el centro del intervalo de clase se encuentre un numero entero.
entero. Sin embargo, esta practica esta lejos de ser universal, y no se comete ningun Los puntos de los decimales se vuelven a colocar en el paso final. Si en el ejemplo
r~. error si se redondea al numero mas proximo. En el presente ejemplo, el numero de antenor el dato mayor hubiera sido 1.54 y el menor 0.80, los calculos habrian sido
-> datos para cada intervalo de clase es 75/15, 0 sea,S. A la amplitud del intervalo exactamente iguales. Sin embargo, en el ultimo paso el intervalo superior tend ria que
~
de clase la designaremos por el simbolo i. En este ejemplo, i = 5. haber sido cambiado a 1.50-1.54 y el intervalo inferior a 0.80-0.84, procediendo
analogamente con los otros intervalos. La amplitud del intervalo de clase habria sido
Paso 3. Tornese el dato mas bajo de los datos originales como limite inferior del igual a 0.05.
primer intervalo. Sumese i - I para obtener ellimite superior del primer intervalo de
clase. Asi, el primer intervalo en nuestro caso es 80-84.
Lirnites verdaderos de un intervalo de c1ase
Piiso 4. EI siguiente intervalo de clase comienza en el entero que sigue al extremo
superior del primer intervalo. En el presente ejemplo, el entero siguiente es 85. Siga En nuestro estudio previo de los «limites verdaderos» de un numero (secci6n 2.5.1),
las mismas etapas indicadas en (3) para obtener el limite superior del segundo indicamos que el «verdadero» valor de un ruimero es igual a su valor aparente mas y
intervalo de clase. Prosiga con este procedimiento para cad a uno de los intervalos de menos la mitad de la unidad de medida. Por supuesto, 10 mismo ocurre con estos
clase sucesivos, hasta que todos los datos queden incluidos en sus apropiados valores aun despues de haberlos agrupado en intervalos de clase. Asi, aunque
intervalos de clase. .escribimos los limites del intervalo de clase inferior como 80-84, los Iimites verdade
ros del intervalo son 79.5-84.5 (0 sea, el limite real inferior de 80 y el limite real
Paso 5; Asignese cada uno de los datos obtenidos al intervalo de clase dentro del
cual esta incluido. La distribucion de frecuencias agrupadas que aparece en la tabla 3.3 superior de 84, respectivamente).
Es importante recordar que los limites verdaderos de un intervalo de clase no son
se obtuvo empleando el procedimiento indicado.
mismo que los llmites aparentes. Posteriormente, al calcular la media.na y los
percentiles con datos agrupados, haremos uso de los limites verdaderos del intervalo
Se observara que por medio del agrupamiento podemos obtener una «imagen»
inmediata de la distribucion de los CI de los estudiantes. Por ejemplo, observamos clase.
44 ESTADiSTICA PARA LAS CIENCIAS SOCIALES
DISTRIBUCION DE FRECUENCIAS Y TECNICAS DE REPRESENTACION GRAFICA 45
90
Ul
80 w
a:
70 :5o 20
60 a
w
50
a
Ul
w
40 Z
o
...J
30 ...J
~ 19.5
20
10
90 ~ 30 --------- -----------------
a:
:5o
60 a
w 20 ~------------------
a .......
Ul
w
30 Z
g
...J
10~--------------------------
~
o '--_---J
A B c
I _ _...L..
OL-_..--LI _ _--L_---'-
I I
I _ _l...-_--l
(b) JUN. JUL. AGO. SEP. OCT. NOV. DlC.
1937
Fig. 3.1 Diagrarna de barras que representan los rnisrnos datos pero
producen irnpresiones diferentes por la variacion de las longitudes relati Fig.3.2 Utilizaciori de la grafica «[Gee Whiz!» para exage
vas de 1a ordenada y de la abscisa. rar las diferencias en las ordenadas. (Tornado del libra
de D. Huff e I. Geis HoII' to Lie with St atistics. Nueva
York: W. W. Norton & Co., Inc., 1954, con Ia autori
los ejes horizontal y vertical. Por supuesto, la eleccion de estas unidades es arbitraria, zaci6n correspondiente.)
y quien decida dar a las ordenadas doble de la longitud que a las abscisas estara
procediendo tan correctamente como quien decida 10 contrario. Sin embargo, para
evitar una anarquia en la tecnica de representacion grafica, es necesario adoptar un
convenio para minimizar la posibilidad de interpretaciones erroneas. La mayor
parte de los estadisticos coinciden en que la altura de la grafica debe ser aproximada
3.5 Variables de escala nominal
mente 0.75 de su longitud, siendo aceptable que esta proporcion este comprendida
entre 0.70 Y 0.80. £1 diagrama de barras, ilustrado en la figura 3.3, es un recurso grafico empleado para
La ventaja que se consigue con este convenio es la de eliminar los factores representar los datos correspondientes a una escala nominal u ordinal. Para cada
subjetivos y, posiblemente, los prejuicios personales que pueden influir en las categoria se traza una barra vertical*, y la altura de la barra representa el nurnero de
decisiones acerca de la proporcion relativa de las abscisas y las ordenadas en la
• A veces se colocan las barras de estas graficas horizontalrnente. Ello results veniajoso cuando el numero de casos
representacion grafica. £1 uso de este convenio se ilustrara en la proxima seccion que (oclases) es grande y una lisladeellas puede ocupar toda la pagina. Sin embargo,la forma vertical (come rnuestra ia fig. 3.3)
se ocupa de los diagramas de barras. Tambien se aplico esta regia a todas las graficas se Usa mas lrecuentemente porque resulta mas facil de interpretar a simple vista y porque es adaptable a un histograma 0
que aparecen en el resto del capitulo. una curva de frecuencia (ver figs. 3.6 y 3.7).
DlSTRIBUCION DE FRECUENCIAS Y TECNICAS DE REPRESENTACION GRA.FICA 49
48 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
30..-- ----------------------,
160'r-------------------.-----------,
140 25
120
(f)
sa:
o
ti
o 4 5
2
ADMINISTRACION HUMANIDADES CIENCIAS CIENCIAS
CIENCIAS
POSICION DE SALIDA
DE EMPRESAS BIOLOGICAS FISICAS
SOCIALES
Fig. 3.4 Carreras ganadas en una pista circular por caballos que partieron de ocho posiciones
Fig.. 3.3 Nurnero de estudiantes inscritos en cursos preliminares de economia, y que estan de salida. (De S. Siegel, NOll-Parametric Statistics. Nueva York: McGraw-Hill. 1956. Adaptado
siguiendo otros estudios academicos (datos hipoteticos). con permiso.)
miembros de esa clase. Si fijamos arbitrariamente la anchura de cada barra como una 3.7 Variables de escala por intervalos
unidad, puede darse el area de cada barra para representar la frecuencia de cada
categoria. Asi, el area total de todas las barras es igual a N. y de razones
140 138 unidades. Analogamente, en el intervalo 6-8 hay 24 unidades de frecuencia distribui
das sobre 3 unidades de datos; asi, la altura de la ordenada debera ser igual a 8
120
unidades.
EI problema que se presenta con los intervalos de clase desiguales puede ser
100 facilmente evitado utilizando intervalos de clase iguales siempre que sea posible. La
figura 3.7 muestra la grafica de faltas al trabajo con intervalos de clase iguales.
80
En general, es aconsejable que consideremos la frecuencia en funci6n del area al
manejar variables en las cuales puede suponerse continuidad.
40
20 40 NUMERO DE DIAS
DE AUSENCIA FRECUENCIA
4
24-26 3
o
o 23456 7 8 21-23 10
18-20 4
NUMERO DE HIJOS POR FAMILIA 5
30 15-17
12-14 3
Fig'. 3.5 Distribucion de frecuencias del ruimero de hijos por familia entre 389 9-11 6
familias encuestadas en una pequefia comunidad suburbana (datos hipoteticos). 6-8 24
3-5 15
20 0-2 41
a la conclusi6n err6nea de que el intervalo 15-25 incluye solamente dos casos. Sin
embar~o, si ~e representa cada dato por una unidad en la escala de frecuencias y por
un.a umdad igual en la escala de datos, el area total para cada dato es igual a uno. En 10
el intervalo 15-25 hay 22 unidades de frecuencias distribuidas sobre 11 unidades de
datos; asi, para este intervalo la altura de la ordenada sera de 22/11, 0 sea, 2
18,----------------------------, o 0-2 3-5 6-8 9-11 12-14 15-17 18-20 21-23 24-26
18 r---------------------------~
•...-100
16
110
/ ~--- 90
100 -
14 90 - // 80 g
::5
~
//
80 - 70
12
::>
70 - 60 ~
10 w
f
60 -
50 3
z
8
50 -
40 -
30 -
/1 40
30
~
a:
~
- 20
4
2
20 -
10 - "..,.
// 10
oL,.....o-~1 I' I I I I I I I I 0
79.5 84.5 89.5 94.5 99.5 104.5 109.5114.5 119.5 124.5 129.5134.5139.5 144.5 149.5 154.5
97 102 107 112 117 122 127 132 137 142 147 152
DATOS DEL C.1. (L1MITES SUPERIORES VERDADEROS)
PUNTOS MEDIOS DE LOS INTERVALOS DE CLASE
Fig. 3.9 Curva de freeueneias y poreentajes aeumulados basada en las distribueiones de freeuencias
Fig. 3.8 Curva de freeueneias basada en los datos que apareeen en la tabla 3.3.
y poreentajes aeumulados que apareeen en la tabla 3.4.
a~n~ue l?~ datos de la tabla 3.4 corresponden solamente en forma aproximada a una ESTIMULO FEMENINO ESTIMULO MASCULINO AUSENCIA DE ESTIMULO
distribucion en forma de campana, la curva acumulada toma la forma de una ojiva Fig.3.13 Promedio de presiones de barrotes en tres grupos de ratas blancas (Runyon y Kosacoff,
(fig. 3.9).
1965).
La curva de .Ia figura 3.12(c) es positivamente sesgada y la figura 3.12(a) representa
un sesgo negatIvo extremo. ~
c
No siempre es posible determinar a simple vista si una distribucion es 0 no z
UJ
sesga~a. Existe un metodo ,matematico preciso para determinar la direccion y f
l:ll
magnitud del sesgo; pero esta fuera del alcance de este libro realizar una discusion a
en
detailada de este punto. Sin embargo, en el capitulo 5 esbozaremos el procedimiento ~
:i
para determinar la direccion, si bien no la magnitud, del sesgo. a
l:ll
UJ
C
Z
a
3.9 Otras representaciones graficas U
a:
a
"
Fig. 3.14 Proporcion de bolitas de a
Hemos estudiado en este capitulo la representacion grafica de las distribuciones de a:
alimentos obtenidas por animales en o,
frecuen~ias. Sin embargo, los cientificos del comportamiento recogen frecuentemente cada categoria de la jerarquia OBA
1 2 3 4
otros tipos de datos. Se estudiaran brevemente otras representaciones graficas de (para nueve animales en cada catego
altamente competitivo y se estudiaron varias dimensiones del comportamiento. Para Terminos para recordar
determinar si una medida, olfateo de la bandeia con alimentos (OBA), era una
medida valida del control alimentario, los anirnale-s fueron ordenados por categorias distribucum negativamente sesgada
desde el superior hasta el inferior en funcion del numero de OBAs observados. Se abscisa ( eje X)
deterrnino enseguida el mimero de bolitas de alimento obtenidas por los animales en al azar (aleatoria) distribucion platicurtica
cada categoria. La figura 3.14 revela una clara tendencia decreciente en el numero de curva de frecuencias distribucion positivamente sesgada
bolitas de alimento obtenidas por los animales que fueron sucesivamente inferiores distribucum sesgada
curva normal
en la jerarquia correspondiente al OBA. frecuencia acumulada
diagrama de barras
distribu~ion de frecuencias histograma
distribucion de frecuencias acumuladas mutuamente excluyente
Resumen del capitulo distribucion de frecuencias agrupadas ojiva
distribucion de porcentajes acumulados ordenada (eje Y)
En este capitulo se trato de los procedimientos empleados para «dar sentido» a una distribucion de proporciones acumuladas porcentaje acumulado
masa de datos. Se mostro la forma de obtener las distribuciones de frecuencias de proporcion acumulada
distribucion Ieptocurtica
datos y se presentaron varias tecnicas de representacion grafica, Cuando los datos
estan muy dispersos, a muchos de ellos les corresponde una frecuencia cero; y si no distribucion mesocurtica
hay indicacion clara de tendencia central, se acostumbra agrupar los datos en
intervalos de clase. A la distribucion resultante se le llama distribucion de frecuencias
agrupadas.
Se discutieron y determinaron las bases para lIegar a una decision acerca de las
unidades de agrupamiento que se deben emplear y los procedimientos para construir
una distribucion de frecuencias agrupadas. Se vio que los limites verdaderos de un in
tervalo de clase se obtienen en la misma forma que los limites verdaderos de un 1. Hallar los limites verdaderos, los puntos medios y la amplitud de intervalopara cada uno
dato. Se mostraron los procedimientos para convertir una distribucion de frecuencias de los siguientes intervalos de clase.
en una distribucion de frecuencias acumuladas y en una distribucion de porcentajes b) 6-7 c) 0-2 d) 5-14
a) 8-12
acumulados. e) (- 8)-( - 2) f) 2.5-3.5 g) 1.50-1.75 h) (-3)-(+3)
Se revisaron tarnbien las diferentes tecnicas de representacion grafica empleadas
en las ciencias del comportamiento. La finalidad basica de la representacion grafica 2. Para cada uno de los siguientes conjuntos de medidas, encontrar: (a) I~ mejor amplitud
consiste en proporcionar ayudas visuales para pensar y discutir los problemas de intervalo de clase (i), (b)los lirnites aparentes del intervalo inferior, (c) los limites verdaderos
estadisticos. El objetivo primario es el de presentar los datos de una manera clara y de ese intervalo, (d) el punto medio de ese intervalo.
sin ambigiiedades, de modo que ellector pueda captar a simple vista las relaciones i) 0 a 106 ii) 29 a 41 iii) 18 a 48
Se ha estudiado:
3. Dada la siguiente lista de calificaciones obtenid~s e~ u~ ,examen de es.ta~istica: utilicese
1. Los artificios empleados por personas carentes de escnipulos para engafiar al i = 5paralos intervalos de clase y: (a)encuentrense.la distribucion de :recuencIas, ~b) ?all~~se los
lector inexperto. lfmites verdaderos y el punto medio de cada intervalo; (c) obtengase la distribucion de
2. El uso del diagrama de barras con variables de escalas nominales y ordinales. frecuencias acumuladas; y (d) hallesela distribuci6n de porcentajes acumulados.
3. EI uso del histograma y de la curva de frecuencias con variables continuas y
discontinuas de escalas de razones 0 de intervalos. CALIFICACIONES EN UN EXAM EN DE ESTADISTICA
4. Varias formas de datos normalmente distribuidos, distribuciones simetricas no
88 79 92 86 87 83 78 40 67
normales, y distribuciones asimetricas 0 sesgadas. 63
76 46 81 92 77 84 76 70 66
68
5. Finalmente, se han estudiado y mostrado algunas representaciones graficas de 75 98 81 82 81 87 78 70 60
77
datos, diferentes a las distribuciones de frecuencias, que se emplean comunmente 52 82 77 81 77 70 74 61
94 79
en las ciencias del cornporramiento.
DlSTRIBUCION DE FRECUENCIAS Y TECNICAS DE REPRESENTACION GRAFICA 59
58 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
c) i = 10 d) i = 20
Discutanse las ventajas y desventajas del empleo de estas amplitudes. 15. Tomar un par de dados, lanzarlos 100 veces y anotar la suma de los numeros que
aparecen en la cara superior de los dos dados en cad a lanzamiento. Construir luego un
5. Dada la siguiente Iista de mimeros: (a) construir una distribucion de frecuencias
diagrama de barras que muestre el numero de veces que ocurre cad a suma.
agrupadas; (b) indicar 101 verdaderos Iimites y el punto medio de cad a intervalo (indicar la
amplitud de intervalo empleado); y (c) comparar los resultados con los de los ejercicios 3 y 4.
16. Los mimeros que siguen corresponden a las ventas mensuales realizadas por cinco
6.3 8.8 7.9 9.2 8.6 8.7 8.3 7.8 4.0 6.7 empleados de un establecimiento comercial:
6.8 7.6 4.6 8.1 9.2 7.7 8.4 7.6 7.0 6.6
7.7 7.5 9.8 8.1 8.2 8.1 8.7 7.8 7.0 6.0
9.4 7.9 5.2 8.2 7.7 8.1 7.7 7.0 7.4 6.1 VENOEDOR VENTAS($)
VENOEDOR VENTAS ($)
6. Algunos intervalos de c1aseen una distribucion de frecuencias que muestra el rendimien
Srta. Reyes 22500 Sr. Gonzalez 22100
to del maiz por hectarea cultivada, son 15-21,8-14,1-7. (a) i,Cual es la amplitud de intervalo?
Sr. Martinez 17900 Srta. Parra 20700
(b) i,Cuales son los Iimites verdaderos inferior y superior de cada intervalo? (c) i,Cual es el
punto medio de cada intervalo? Srta. Perez 21400
7. Partiendo del presupuesto anual del gobierno de su pais para el presente afio, muestrese
la asignacion de fondos a los divers os sectores de la administracion por medio de un diagrama
Dibujar graficas para tratar de dar verosimilitud a los siguientes propositos:
de barras.
a) El gerente de ventas quiere dar la impresion al duefio de la tienda de que todos los
8. Construir una distribucion de frecuencias agrupadas, utilizando 5-9 como intervalo de vendedores a su cargo trabajan con la misma eficiencia maxima.
c1ase inferior, para los niimeros de la siguiente tabla. Hallar la amplitud, el punto medio y los b) EI gerente de ventas desea estimular al senor Martinez para que realice un mayor
Iimites verdaderos del intervalo de c1ase superior. esfuerzo.
c) El duefio de la tienda quiere incitar al gerente de ventas a obtener mejores resultados.
67 63 64 57 56 55 53 53 54 54
45 45 46 47 37 23 34 44 27 44
Dibujar una grafica con los datos del ejercicio 16 que presente el estado real del negocio.
45 34 34 15 23 43 16 44 36 36
35 37 24 24 14 43 37 27 36 26
25 36 26 5 44 13 33 33 17 33
18. A continuacion se muestran las calificaciones obtenidas por dos grupos de escolares en
una pruebade aptitud para la lectura.
DE CLASE DE CLASE
160-164 1 130-134 17 a) Construir en la misma grafica una curva de frecuencias para cada uno de estos
155-159 3 125-129 11
grupos.
150-154 10 120-124 8
b) Describir y comparar las distribuciones.
145-149 6 115-119 3
140-144 14 110-114 1
22
60 ESTADiSTICA PARA LAS CIENCIAS SOCIALES DlSTRIBUCI6N DE FRECUENCIAS Y TECNlCAS DE REPRESENTACI6N GRAFICA 61
flESULTADO GENERAL
HIJOS DE MADRES DROGADICTAS EN EL HOSPITAL·
20. Dada la siguiente distribucion de frecuencias de las calificaciones obtenidas por 73 ANO
estudiantes en un examen parcial, dibujar una curva de frecuencias.
1960 69.0 13.9
1961 52.7 15.9
1962 56.8 15.8
INTERVALO INTERVALO
70-74 18
.. Se incluye a los babes drogadictos.
29. Los datos acerca de la tasa de nacimientos se expresan general mente en mimero de
nacimientos por mil habitantes. La tabla adjunta muestra la tasa de nacimientos al final de
cada decada desde el comienzo del siglo, redondeando al entero mas proximo. (Tornado de:
Commission on Population Growth and the American Future.)
Percentiles
NUMERO DE NACIMIENTOS
1900 32
1910 30
1920 28
1930 21
1940 19
1950
1960
24
24
Introduccion
1970 18
Supongamos que un escolar regresa del colegio y exclama: «.Obtuve. ~na califi.c~ci6n
de 127 puntos en mi prueba de aptitud», (,Cual seria la reaccion familiar? (,Fellclt~rle
a) Expresar estos datos en una' grafica lineal. por haber obtenido tan magnifica calificacion? (,Censurarleyor no ~a~er c?~segUldo
b) i,Se aprecia alguna tendencia general en la tasa de nacimientos? una nota mas alta? (,0 no decir nada hasta conocer mejor la distribucion de las
*30. Imaginese que tenemos una poblacion formada par siete numeros: 0, 1, 2, 3, 4, 5, 6. calificaciones dentro de su clase 0 grupo? Si el lector ha seguido con provecho 10
Escribase cada uno de estos nurneros en una pequefia tarjeta y coloquense todas las tarjetas expuesto hasta ahora, elegiria sin duda la ultima de estas tre~ alternati~as:
dentro de una bolsa. Luego se extrae una de elias, se anota el numero, y se vuelve a a introducir Debe quedar claro que una calificacion carece por si misma de ~lgmfi~a~o.
en la bolsa. Despues se saca una segunda tarjeta y se suma el numero resultante al primero. Se Unicamente 10 adquiere cuando se la compara con una escala 0 base patron. AS1, SI el
continua extrayendo en esta forma pares de tarjetas y sumando los resultados hasta haber escolar voluntariamente agrega: «El 79 % de los estudiantes obtuvo una calificacion
obtenido todas las combinaciones posibles de estos siete numeros tornados dos ados. menor que la mia», estara proporcionando un marco de referencia para interpretar la
La siguiente tabla muestra todos los resultados posibles al extraer muestras de N = 2 de calificacion, Realmente habra citado el rango percentil de su calificacion. Entonces, el
esta poblacion de siete numeros. Los valores que aparecen en la tabla corresponden a la surna
ranqo percentil de una calificacion representa el porcentaje de los c~sos d~ntro de un
de los dos numeros.
grupo que alcanzaron valores iquales a menores que el citado. AS1, decir que una
calificacion de 127 tiene un rango percentil de 79 significa que el 79 % del grupo '
PRIMERA EXTRACCION obtuvo una calificacion igual 0 menor que 127. Digamos de paso que cada
calificacion se considera como un punto hipotetico sin dimension, de manera que
z 0 1 2 3 4 5 6
a seria igualmente significativo decir que el 21 % del grupo obtuvo una calificacion
U
u 0 0+0=0 1+0=1 2+0=2 3+0=3 4+0=4 5+0=5 6+0=6 superior a 127.
«
a: 1 0+1 = 1 1+ 1= 2 2+1=3 3+1=4 4+1=5 5+1=6 6+ 1=7
~
LU 2 0+2=2 1+2=3 2+2=4 3+2=5 4+2=6 5+2=7 6+2=8
«
Cl
3 0+3=3 1+ 3= 4 2+3=5 3+3=6 4+3=7 5+3=8 6+3=9
4 0+4=4 1+4=5 2+4=6 3+4=7 4+4=8 5+4=9 6 + 4 = 10
Z
=>
(:J 5 0+5=5 1+5=6 2+5=7 3+5=8 4+5=9 5 + 5 = 10 6 + 5 = 11
Percentiles acumulados y rango percentil
LU
en 6 0+6=6 1+6=7 2+6=8 3+6=9 4 + 6 = 10 5+6=11 6 + 6 = 12
mismo que el rango percentil de esa calificaci6n. Notese que tambien es cierto el
Recuadro 4.1 reciproco; 0 sea, que dado un rango percentil podriamos leer la calificaci6n
100 r " " - - - - - - - - - - - - -.......- - - ,
correspondiente. La figura 4.1 muestra en forma grafica la distribuci6n de porcenta
jes acumulados presentada en la tabla 3.4.
o
o
:)
:l
~ 100
:l PERCENTIL 90
U
<{
50 0
W
0
~ :):J' 80
f
Z :If=
W ~z
U :lw
a: UU
o0.. <{ffi
60 -
wo..
""'0
~t.9
zz
W<{
127
18SEMANA ua: 40 -
a: ~
DE EXAMENES 0
FINALES 0..
I I
89.5 94.5 99.5 104.5 109.5 114.5 119.5 124.5 129.5 134.5 139.5 144.5 149.5 154.5
CALIFICACION EN EL LIMITE SUPERIOR VERDADERO DE CADA INTERVALO
Utilizando la distribucion de frecuencias agrupadas de la tabla 4.1, determinemos casos que caen en 0 por debajo del limite inferior verdadero. Sumando estos dos
directamente el rango percentil de una calificaci6n de 127, valor que antes hemos -. . eros encontrarnos que a la calificaci6n de 127 Ie corresponde exactamente una
num , . I
determinado de forma aproximada por medio de la curva de porcentaje acurnu frecuencia acumulada de 86.5. Sustituyendo 86.5 en la formula (4.1), obtenemos 0
lados. Lo primero que debemos tener en cuenta es quela calificacion de 127 esta dentro siguiente:
del intervalo 125-129. La frecuencia acumulada total por debajo de ese intervalo es
86.5
82. Puesto que el rango percentil de una calificacion se define simbolicarnente como Rango percentil de 127 = - x 100 = 78.64
110
Jacum Observara ellector que cuando se redondea est a respuesta al percentil m~s. cerc~no,
Rango percentil = x 100 (4.1)
N concuerda con la aproximaci6n obtenida mediante el uso de la representacion grafica
de una distribucion de porcentajes acumulados (fig. 4.1). .
INTERVALO Tabla 4.1 Distribucion de frecuencias agrupadas y La figura 4.2 resume graficamente los procedimientos utilizados en la obtencion
DE CLASE f f ACUMULADA distribucion de frecuencias acumuladas de calificacio de la frecuencia acumulada correspondiente a una calificacion dada. Se advertira que
nes obtenidas en una prueba escolar (datos hipote
150-154 2 110 el intervalo 124.5-129.5 esta dividido en 5 unidades iguales que cor~espon.de? .a .Ias
ticos).
145-149 2 108 calificaciones dentro del intervalo, mientras que la escala de frecuencias est a dividida
140-144 3 106 en 9 unidades iguales correspondientes a las 9 frecuencias dentro de ese intervalo. Lo
135-139 5 103 que de hecho estamos realizando, al obtener la frecuencia .corre.spondiente a una
130-134 7 98
calificaci6n es una transformacion lineal de una escala de calificaciones a una escala
125~129 . 1- -9 91
120-124- ' 9 62 de frecuenc'ias, 10 que es analogo a convertir grados Fahrenheit a grados Celsius, 0
115-119 13 73 viceversa.
\.110-114, 60 ESCALA DE
17
CALIFICACIONES DENTRO
( 105-109 J 14 43
DEL INTERVALO
100-104 12 29
124.5 129.5
95-99 4 17
90-94 5 13
85-89 5 8
ESCALA DE FRECUENCIAS
80-84 3 3 fACUM EN 0 DEBAJO DEL
DENTRO DEL INTERVALO
INTERVALO IGUAL A 82
N = 110 a
4.5 9
de 127 esta situada entre 82 y 91, que son las frecuencias acumuladas en los dos percentil de una calificacion dada.
extremos del intervalo. Es preciso ahora interpolar dentro del intervalo 125.5-129.5
X - Xli)
para hallar la frecuencia acumulada exacta que corresponde a una calificacion de III acum + ( - - i- (Ii)
127. Al hacerlo asi, estamos realmente tratando de determinar la proporcion de ia x 100, (4.2)
Rango percentil = N
distancia que debemos recorrer dentro del intervalo para hallar el rnimero de casos
que esten incluidos hasta una calificacion de 127.
Una calificacion de 127 esta situada 2.5 unidades por encima del limite real donde
inferior del intervalo (esto es, 127 - 124.5 = 2.5). Puesto que hay 5 unidades de ill acum =frecuencia acumulada en el limite inferior verdadero del intervalo
calificacion dentro del intervalo, una calificacion de 127 esta a 2.5/5 de la distancia que contiene a X,
total del intervalo. Haremos ahora una suposicion muy importante, y es que los
X = calificacion dada,
casos 0 frecuencias dentro de un intervalo particular estan uniformemente distribui
Xli = calificacion en ellimite inferior verdadero del intervalo que contie
dos en dicho intervalo. Puesto que hay 9 casos dentro del intervalo, podemos ahora
calcular que una calificaci6n de 127 es (2.5/5) x 9,0 sea, el caso que ocupa ellugar 4.5 ne a X,
dentro del intervalo. En otras palabras, la frecuencia 4.5 en el intervalo corresponde i = longitud del intervalo,
exactamente a una calificacion de 127. Hemos visto ya, sin embargo, que hay 82 Ii = numero de casos dentro del intervalo que contiene a X.
68 ESTADfSTICA PARA LAS CIENCIAS SOCIALES PERCENTILES . 69
ESCALA DE
CALIFICACIONES DENTRO
Rango percentil y grupo de referenda
DEL INTERVALO
139.5 143.83 144.5
Asi como una calificacion carece de sentido en abstracto, tampoco 10 tiene un rango
Fig. 4.3 Representacion grafica del procedimiento utilizado para la obtencion de la calificacion pel~cel1til.
Este ultimo debe estar siempre relacionado con algun grupo de referencia.
correspondiente a una Irecuencia dada dentro del intervalo. si un compaiiero afirma que ha obtenido un rango percentil de 93 en una prueba
70 ESTADfsTICA PARA LAS CIENCIAS SOCIALES PERCENTILES 71
de matematicas, no debera impresionarnos demasiado si el grupo de referencia esta Resumen del capitulo
formado por personas que solamente han recibido ensefianza primaria. Por el
contrario, si el grupo de referencia esta formado por personas que poseen un Se ha visto en este capitulo que una calificacion carece de significado por si misrna a
doctorado en maternaticas, nuestra actitud debera ser muy distinta. menos que se la compare con una escala 0 base patron. A menudo se transforman las
Muchas pruebas normalizadas que se emplean en psicologia, ensefianza e calificaciones en unidades de la escala de ranges percentiles para disponer de una
industria dan normas separadas para diversos grupos de referencia. La tabla 4.2 base sencilla y cornprensible de interpretacion y comparacion.
muestra las calificaciones originales equivalentes a datos percentiles seleccionados Vimos que:
en una prueba ampliamente utilizada en el ingreso, a centros de ensefianza
superior. El rango percentil correspondiente a una calificacion y la calificacion correspon
Podra observarse que una persona que obtiene una calificaci6n de 50 en esta diente a un percentil dado pueden obtenerse en forma aproximada por medio de
prueba, tendra rangos percentiles de 25,35,40 y 50 cuando se hace la comparaci6n su una grafica de porcentajes acumulados.
cesiva con los grupos de referencia de ciencias biol6gicas, ciencias medicas, agricultura El metodo de calculo directo perrnite una localizacion mas precisa del rango
y asistencia social, respectivamente. percentil de una calificacion y de la calificacion correspondiente a un percentil
dado. Estos metodos se discutieron y aplicaron en el texto. (Ver tablas 4.3 y 4.4.)
Un ran go percentil carece de sentido de modo abstracto. Siempre debe estar
Tabla 4.2 Calilicaciones originales equivalentes a datos percentiles seleccionados en la Prueba de
re1acionado con algun grupo de referencia.
Analogias de Miller para ocho grupos universitarios y de estudios tecnicos. (Reproducida con permiso.
Copyright por la Psychological Corporation, Nueva York, N.Y. Todos los derechos reservados.) Tabla 4.3 Resumen del procedimiento: obtencion de la caiiflcacion correspondiente a un range
percentil dado.
<{
c: Ul
::> <{ <{
--' t <{ c: INTERVALO f Problema: HaJlarla calificaci6n correspondiente a un rango percentil de 75.17.
f= Ul --' UlU UlUl Li ::> 0
....I
~
(/)(/)
::> <{ <{w Ul DE CLASE f ACUM
Z <{(/) <{<{ _l'J ---' z--' <{ !;( I
w
U Lit) U -U
U_ uO U<{ ~<{ ~ c:
U
w
UJ
0 PASOS:
c: Z_ c: ZCl Z--' ZU- (/)
_U o w c: c:
w(/) o Ww wO w
_0 (/)0 - t- w 41-43 98
w
n, uU: <{ Li~ Lim UUl <{(/) 9>-:J Cl
UJ
n, 1. Sumar la columna f para obtener N. N = 98
2. Hallar las frecuencias acumuladas por adici6n sucesiva de las frecuencias
99 93 89 92 88 90 81 87 84 99 38-40 2 97
desde el intervalo inferior hasta el superior. La ultima frecuencia acumu
95 91 86 83 87 85 76 84 79 95 lada debe ser igual a N.
90 88 77 78 86 82 67 80 73 90 35-37 4 95
3. Multiplicar 75.17 por N y dividir por 100. Asi,
85 85 72 76 80 79 64 76 66 85
80 82 67 74 76 76 61 74 63 80 32-34 9 91
75.17 x 98
75 80 64 71 70 74 60 73 60 75 ---=73.67.
70 78 61 67 68 69 58 68 58 70 29-31 10 82 100
65 76 59 64 67 67 57 66 55 65
60 74 57 60 65 64 54 65 53 60 26-28 13 72 Esta es la frecuencia acumulada correspondiente a la calificaci6n desco
55 70 56 58 63 63 nocida.
52 61 51 55
50 68 54 57 61 61 50 59 49 50 23-25 18 59 4. Hallar el intervalo de c1ase que contiene la frecuencia acumulada 73.67.
45 65 51 55 58 58 47 56 47 45 5. Restar del valor obtenido en el paso 3 la frecuencia acumulada en el
40 63 50 53 55 56 46 53 45 40 20-22 14 41 limite superior verdadero del intervalo contiguo inferior. 0 sea.
35 60 48 50 53 53 45 51 42 35 73.67 - 72 = 1.67. Estevalor nos indica que la calificaci6n buscada esta
30 58 43 47 52 51 41 46 40 30 17-19 11 27 1.67 frecuencias dentro del intervalo 28.5-31.5.
25 55 40 45 50 49 39 43 37 25 6. Dividir el valor encontrado en el paso 4 por la longitud del inter
20 51 37 43 48 46 37 41 35 20 14-16 8 16 valo y multiplicar por la frecuencia observada en el paso 5. Asf,
15 47 34 41 47 44 32 38 32 15 (1.67/10) x 3 = 0.50.
10 43 31 34 41 39 27 11-13 5 8
35 30 10 7. Anadir el valor encontrado en el paso 6 a la calificaci6n en ellfmite inferior
5 39 26 30 37 32 22 29 25 5 verdadero del intervalo que contiene a la 73.67-esirna frecuencia acumu
1 28 5 24 28 18 9 7 18 1 8-10 2 3 lada. As], 28.5 + 0.5 = 29.0, que es la soluci6n del problema.
Tabla 4.4 Resumen del procedimiento: obtencion del rango percentil de una calificacion, 4. Empleando la tabla 4.1, calcular las calificaciones correspondientes a los percentiles
dados en el ejercicio 3.
INTERVALO f Problema: Hallar el rango percentil de una calificaci6n de 29.
DE CLASE ACUM 5. Un escolar nos informa de que ha obtenido una calificacion de 130 en una prueba patron
PASOS: de vocabulario. i,Que informacion adicional necesitaremos para interpretar esta calificacion?
41-43 98
1. Sumar la columna f para obtener N. N = 98. 6. Se hace referencia al ejercicio 18 del capitulo 3.
38-40 2 97
2. Hallar las frecuencias acumuladas por adici6n sucesiva de las frecuencias, a) Un estudiante del grupo A obtuvo una calificacion de 45 en la prueba de lectura.
desde el intervalo inferior hasta el superior. La ultima frecuencia acumu
lada debe ser igual a N.
i,Cmil es su ran go percentil en el grupo?
35-37 4 95
b) i,CuaJ es el rango percentil de un estudiante del grupo B que tambien obtuvo la
3. Identificar el intervalo que contiene a la calificaci6n: 29.
calificacion de 45?
32-34 9 91 4. Restar de 29 la calificaci6n en ellfmite inferior verdadero de ese intervalo:
c) Combinar ambos grupos dentro de una sola distribucion de frecuencias y obtener el
29 - 28.5 = 0.5
rango percentil de una calificacion de 45. i,Que pasa con el rango percentil del
29-31 10 82
5. Observar la frecuencia dentro de ese intervale: 10. estudiante del grupo A? i,Que sucede con el rango percentil del estudiante del grupo
6. Dividir el valor encontrado en el paso 4 por la longitud del intervalo B? i,Por que?
26-28 13 72
y multiplicar por la frecuencia observada en el paso 5. Ast,
explicacion posible?
i = 3 98
b) Maria obtuvo un rango percentil de 65 en la escala correspondiente a asistencia
social. i,Cual fue su calificacion? i,Que calificacion deberia haber obtenido para
alcanzar el mismo rango percentil en la escala correspondiente a ciencias fisicas?
c) La Escuela Mundial de Leyes emplea la Prueba de Analogias de Miller como uno de
los elementos para decidir sobre la admision. Ningun aspirante que obtenga un
Terminos para recordar
rango percentil inferior a 75 es tenido en cuenta para la admision, independientemen
te de sus otras calificaciones. Asi, al percentil 75 se Ie puede llamar punto de
percentiles rango percentil «eliminacion». i,Que grupo de referencia esta mas comprometido en la decision?
i,Que calificacion constituye el punta de eliminacion para esta distribucion?
d) Una facultad de Medicina emplea tam bien el percentil 75 como punto de elimina
cion. Un aspirante obtuvo una calificacion original de 62. i,CuaIes son sus posibilida
des de ser tenido en cuenta para la adrnision?
Ejercicios
En la tabla de la pagina siguiente se muestra una distribucion de frecuencias de las estimaciones
hechas por la Agencia para la Protecci6n Ambiental, acerca del rendimiento en millas por galon
1. Empleando la figura 4.1, estirnar el percentil de las siguientes calificaciones:
If = 60
Utilizando la misma tabla, hallar las millas por galon correspondientes a los rangos percentiles
de sus empleados en una prueba de matematicas. Asignando una letra a cada empleado,
A. 55 F. 40 K. 50 P. 40 U. 40
B.50 G. 60 L. 45 Q. 35 V. 30
C. 35 H. 45 M. 25 R. 25 W. 45
D. 45 1. 50 N. 35 S. 20 X. 35
E. 40 J. 30 O. 55 T. 30 Y. 40
Calcular el rango percentil para cada empleado, utilizando i = 5 Ytomando como intervalo de
22. EI gerente estudia ademas el numero de problemas de maternaticas que los empleados
resuelven por dfa, Para los mismos empleados, encuentra los siguientes resultados (a cad a
A. 45 F. 30 K. 40 P. 30 U. 30
B. 40 G. 50 L. 35 Q. 25 V. 20
C. 25 H. 35 M. 15 R. 15 W. 34
D. 35 1. 40 N. 25 S. 10 X. 25
E. 30 J. 20 O. 45 T. 20 Y. 30
Calcular el rango percentil para cada persona y comparar con los rangos del ejercicio 21.
*23. Con referencia al ejercicio 30 del capitulo 3, construir las distribuciones de frecuencias
acumuladas y de porcentajes acumulados de las 49 sumas.
*24. Revisar el experimento de muestreo descrito en el ejercicio 30 del capitulo 3. Volver luego
a la distribucion de porcentajes acumulados del ejercicio 23 de este capitulo. Responder a las
siguientes preguntas.
a) "Cual es la probabilidad (porcentaje de veces) de que una suma igual 0 menor que 11
numeros?
5 Medidas
de tendencia central
Existen dos caracteristicas observadas por los estadisticos que se presen~an en
muchas distribuciones de frecuencias y para las cuales han desarrollado metodos
cuantitativos de descripcion: (1) A menudo los datos se acu~ulan alrededor ~e un
valor central situado entre los dos valores extremos de la vanable que se estudia. (2)
r-
Los
datos pueden tender a dispersarse y distribuirse alrededor del valor ce~tral, en
.. L d
forma tal que esta tendencia puede ser especificada cuantItatIvamente., a prl1I~era e
tas caracteristicas (la tendencia central) es el tema del presente capitulo, mientras
que la segunda (la dispersion) sera estudiada en el 6. ca~itulo
.
La posibilidad de localizar un punta de tendencia central, particularrnente
an do al mismo tiempo existe una descripcion de la dispersion de los datos respecto
cu . P . 1
a ese punto, puede ser muy util para los cientificos del comporta~11le~to. or ejemp 0,
odran reducir una mas a de datos a un simple valor cuantitativo capaz de ser
5.1 Introducci6n p
comunicado en forma comprensible . .
a otros cientiIfiICOS. . ,
Anteriormente dijimos que a menudo se pide al cientifico del comportamiento
Una de las mayores causas de confusi6n entre la gente no entendida en la materia, y comparar las medidas obtenidas a partir de dos 0 mas gru~os de 'personas. con el fin
quizas un motivo para hacerle sospechar que la estadistica es mas un arte que una de establecer inferencias acerca de los efectos de una vanable independiente, Las
ciencia, gira en torno a la ambigiiedad con que se usa el termino «promedio». Los medidas de la tendencia central simplifican mucho la tarea de establecer conclu
sindicatos y los gerentes hablan de salarios promedios y citan frecuentemente valores siones.
numericos que muestran entre si un gran desacuerdo. Segun se dice, los programas
de televisi6n y los anuncios comerciales, se preparan pensando en el televidente
promedio. Los politicos se interesan vivamente por las opiniones del votante pro 5.2 Media aritmetica
medio. El tamafio de la familia promedio se da frecuentemente en valores frac
cionarios, como abstracci6n estadistica que parece -ridicula a algunos y absurda a
otros. El termino «promedio» se emplea comunmente como sin6nimo de «normal». 5.2.1 Metodos de calculo
El servicio rnetereologico de la TV nos informa que tendremos un dia promedio 0
que la precipitaci6n pluvial del mes esta por encima 0 por debajo del promedio. Sin Es probable que el lector este muy familiarizado con la media a~itmetic~, 'p~rque
duda, el terrnino «promedio» tiene tantas connotaciones populares que muchos siempre.que obtiene un «prornedio» de calificaciones, sumand.o las.clfr,a~ y dividiendo
estadisticos prefieren suprimirlo del vocabulario tecnico y referirse, en cambio, a el resultado por el numero de elIas, esta calculando la media antmet~ca. En. ~o~as
medida de tendencia central. Definiremos una medida de tendencia central Como un palabras, la media es igual a la suma de los datos 0 val ores de una vanable dividida
indice de localizaci6n central empleado en la descripci6n de las distribuciones de por su numero. Expresado en forma algebraica:
frecuencias. Puesto que el centro de una distribuci6n puede definirse de diferentes - XI + X 2 + . ,. + X N LX
maneras, habra tambien diferentes medidas de tendencia central. En este capitulo nos x= N =N' (5.1)
ocuparemos de las tres mas frecuentemente empleadas: la media, la mediana y la
moda. donde
x= media (se lee X barra)*,
N = numero de datos, y ,
5.1.1 l.Por que describir la tendencia central? L = verba matematico que nos ordena sumar todas las observaciones,
A 10 largo de los cuatro primeros capitulos dellibro nos hemos ocupado principal Asi, la media aritrnetica de 9, 12, 15, 19, 24 es X= 78/5 = 15.60.
mente de la organizaci6n de los datos en una forma util y significativa. Sin embargo,
a partir de aqui, se trata de describir los datos en forma tal que puedan formularse Obtenci6n de la media en una distribuci6n de frecuencias no agrupadas, ,Recordemos
proposiciones cuantitativas. Una distribuci6n de frecuencias representa una organi que ya fue construida con anterioridad una distribucion de frecuencias como ~n
zacion de datos, pero no nos permite por si misma establecer proposiciones medio de eliminar la repeticion constante de datos que se presentan con frecuencia
cuantitativas, ya sea para describir la distribucion 0 comparar dos 0 mas distribu
ciones. • En la seccion 1.2 se indica que empleariarnos letras cursivas para representar los estadigrafos mu~strales, Y,letras
griegas para representar los parametres poblacionales. Se usara la letra griega II para representar la media poblacional.
MEDIDAS DE TENDENCIA CENTRAL 79
78 ESTADiSTICA PARA LAS CIENCIASSOCIALES
variable, con objeto de tener una sola entrada en la columna de frecuencias que
Recuadro 5.1 represente el mimero de veces que aparece cualquiera de los datos. Asi, en la tabla 5.1,
observando la columna encabezada por f, sabemos que el dato 8 se repite 6 veces.
SALARIOS
Entonces, al calcular la media no es necesario sumar seis veces 8, pues podemos
ANUALES DE LA
COMPANIA XYZ
multiplicar el dato por su frecuencia y obtener el mismo valor de 48. Puesto que cada
dato se multiplica por su correspondiente frecuencia, antes de efectuar la suma,
30 000
podemos representar la media en las distribuciones de frecuencias como sigue:
24000
14000
10 000 + - - Media - IfX
x=--· (5.2)
9000 N
9 000
9 000 Tabla 5.1 Procedimiento seguido para calcular la media
f IX
X
7 000 <----- Mediana en distribuciones de frecuencias no agrupadas.
6000 12
12 1
6000
6000
11 2 22 - Dx
X=
10 5 50 N
5000} 9 4 36
5000 232
8 6 48 X=
5 000 +-- Moda 29
7 4 28
5 000 18 X = 8.00
6 3
5 2 10
4 2 8
N = 29 Dx = 232
se sigue ~ue. L: X = _NX; Y(2) haciendola suma L: X se obtiene el mismo resultado cuadrados y la suma de los cuadrados de las desviaciones, cuando estas se toman
que multiplicando X por N.' 0 sea, N X (vease generalizacion 1, capitulo 2). respecto a la media y a otros datos en una distribucion, Puede verse que la suma de
Por consiguiente, la media es un dato 0 dato potencial que se puede considerar los cuadrados es menor en la columna 4, donde las desviaciones se toman respecto a
como un pu~to de equilibrio para todos los datos que estan a uno y otro lado de ella. la media.
En este sentido, es analoga al punta de apoyo de un columpio. EI lector habra Esta propiedad nos perrnite definir tambien la media como la medida de
~ot~do que e~ est~ juego es posible para un individuo liviano equilibrar otro pesado tendencia central que hace minima la suma de los cuadrados de las desviaciones
situandose mas lejos del apoyo. De est a forma, si un joven quisiera equilibrar a un .respecto a ella. EI metodo de localizacion de la media mediante la busqueda del valor
hermano 0 hermana.menor (suponiendo que fueran menos pesados que el), tendria minimo de la suma de cuadrados recibe el nombre de metodo de los minimos
que desplazarse bacia el centro de la tabla. De est a analogia se desprende una cuadrados. Este metodo es de considerable valor en Estadistica, particularmente
segunda caracteristica importante de la media: La media es muy sensible a las: cuando se aplica al ajuste de curvas.
mediciones extremas cuando estas no estan equilibradas a ambos lados de ella.
Observense las dos ordenaciones de datos en la tabla 5.2. Una ordenacion es una
disposicion de los datos de acuerdo con su magnitud, desde el valor menor hasta ef 5.2.3 Media ponderada
mayor. Adviertase que todos los datos en am bas distribuciones son los mismos
excepto al final ?onde aparece "" dato muy grande en la columna X 2' Este valo; Imaginemos que en cuatro clases de sociologia se obtuvieron las siguientes califica
extremo es' suficiente para duplicar el tarnafio de la media. La sensibilidad de la ciones medias en el examen final: 75, 78, 72 y 80. l.Seria valido sumar estas cuatro
~edi.a a. los valores extremos es una caracteristica que contiene importantes medias y dividir por cuatro para obtener la media general de las cuatro clases juntas?
implicaciones que regiran su uso. Estas implicaciones se estudiaran en la seccion 5.5, Solamente 10 seria si todas las clases tuvieran el mismo numero de alumnos (N).l.Que
cuando comparemos las tres medidas de tendencia central. ocurriria si el numero de alumnos en las clases indicadas fueran de 30, 40, 25 Y 50,
Una tercera caracteristica importante de la media es que fa suma de los cuadrados ~~W~~ ~
de las desviaciones respecto a la media aritmetica es menor que la suma de los cuadra La suma total de las calificaciones se puede obtener multiplicando cada media
dos de las desoiaciones respecto a cualquier otro dato 0 dato potencial. por su respectivo N, y sumando los resultados.
Para ilustrar est a caracteristica de la media, en la tabla 5.3 se muestran los Asi,
GRUPO 1
X,
GRUPO 2
X2
Tabla 5.2 Comparacion de las medias de dos ordenaciones de datos
uno de los cuales contiene un valor extremo. '
I (N . X) = 30(75) + 40(78) + 25(72) + 50(80)
= 11170.
2 2 La media ponderada Xw' se expresa como la suma de los productos de la media de
3 3
5
cad a grupo, multiplicada por sujionderacion respectiva (la N de cada grupo),
5
7 7
dividida por la suma de las ponderaciones (0 sea, L: w = L: N; = N).
8 33
X = L(w . X) = =L,----(N--,--i_.X_)
LXI = 25 L::X2 = 50 w LW N
Xl = 5.00 Xl = 10.00
- 30(75) + 40(78) + 25(72) + 50(80)
K; = 145
1 2 3 4 Tabla 5.3 Cuadrados y suma de
5 6
X (X - 2)' (X - 3)' (X - X)' (X - 5)' (X - 6)1 cuadrados de las desviaciones 10
madas respecto a varios datos en = 11170 = 77.03.
2 a una distribucion, 145
1 4 9 16
3 1 a 1 4 9
4 4 1 a 1 4
5 9 4 1 a 1
6 16 9 4 1 a 5.3 Mediana
I
I
Totales 30 15 10 15 I
30
N=5 En las distribuciones de frecuencias agrupadas, se define la mediana como el dato 0
X=4 dato potencial de una distribucion, por arriba y por abajo del cual caen la mitad'de las
{recuencias. No es extrafio que esta definicion resulte allector un tanto familiar. La
82 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
MEDIDAS DE TENDENCIA CENTRAL 83
b) 1, 3, 3, 5, 5, 5, 7, 7, 9.
12. En la seccion 5.5 se indic6 que la media, por 10 general, es mas fiabl~ que la mediana, 0
c) 119, 5, 4, 4, 4, 3, 1, O.
sea, que esta menos sujeta a fluctuaciones. S~p6ngase ~ue. se efectua un expenrnento
consistente en lanzar 30 veces tres dados, obteniendo los siguientes resultados:
2. i,En cual de los conjuntos de medidas del ejercicio 1, es la media una medida de 6, 6, 2 5, 4, 3 4, 3, 2 2, 1, 1 6, 5, 3 6, 5,4
tendencia central deficiente? Expliquese por que. 4,1,1 4,4,3 6,4,1 5,4,3 5,1,1 6,2,1
3. Para cada uno de los conjuntos de medidas del ejercicio 1, demostrar que la suma de los 6, 5, 5 6, 6, 4 6, 4, 2 5, 4, 4 6, 5, 2 5, 4, 3
los cuadrados de las desviaciones respecto a cualquier otro dato 0 dato potencial. 4, 2, 1 6, 3, 3 6, 5, 4 4, 2, 2 6, 6, 5 6, 3, 1
4. Se han calculado las velocidades maxirnas de varios autom6viles. Despues se descubre a) Calcular las treinta medias y las treinta medianas.
que todos los velocimetros marcaban 5 kil6metros mas por hora. i,C6mo seran las medidas de b) Tomando como primer intervalo 0.5-1.5, agrupar las medias y las medianas en
tendencia central calculadas con los datos corregidos al compararlas con las calculadas con distribuciones de frecuencias separadas. . .
los datos originales? c) Dibujar histogramas para las dos distribuciones. i,Confirman.estas graficas el,aserto
5. Se han calculado las rnedidas de tendencia central para los pesos de unas truchas, con los de que la media es un estimador mas estable de la tendencia central? ~xphquelo.
datos expresados en onzas. Posteriormente se decide hacer nuevamente los calculos dividiendo d) Si colocaramos por separado las medias y las medianas en d~s. bolsas diferentes, y
previamente todos les pesos por 16 para que queden expresados en libras. i,C6mo afectara esto sacaramos al azar una de cadas bolsa, i,cual seria la probabilidad de obtener un
a las medidas de tendencia central? estadigrafo? :
i) i,mayor que 5.5?,
6. Calcular la rnediana y la moda para los datos de los ejercicios 13 y 20 del capitulo 3. ii) i,menor que 1.5?,
7. Si en el ejercicio l{c) anterior, se cambiara 119 por 19, i,c6mo quedarian afectadas las iii) i,mayor que 5.5 0 men or que 1.5?
medidas de tendencia central? 13. Si supierarnos que la media y la mediana de un conjunto de datos son iguales, i,que
8. Basandose en las siguientes medidas de tendencia central, digase si existe evidencia de podriamos decir acerca de la forma de la distribucion?
sesgo y, en caso afirrr::ativo, indiquese :Ia direccion del mismo. 14. En el transcurso del aiio, un inversionista ha comprado valores bur~~tiles por las
a) X = 56 Mediana = 62 : Moda = 68 siguientes cantidades y precios: 150 a 3 pesos la accion, 400 a 2.50 pesos la accion, 100 a 4.25
b) X = 68 Mediana = 62 Moda = 56
pesos la accion, y 200 a 3.50 pesos la acci6n. , . .
c) X = 62 Mediana = 62 Moda = 62
a) i,Si vendiera todas las acciones a un precio. unic~, i,~ual ~ebena s.er? dicho precio
d) X = 62 Mediana = 62 Moda = 30, Moda = 94
(precio de compensaci6n) para que no hubiera perdida rn ganancia: .
9. i,Cual es la naturaleza de las distribuciones de los ejercicios 8{c) y (d)? b) Si las comisiones fueron de 13.50, 30.00, 12.75 y 21.00 pesos, respectivarnente,
calcular el punta de cornpensacion teniendo en cuenta la comisi6n. [Sugerellcia:
10. Calcular la media de la siguiente ordenaci6n: 3, 4, 5, 5, 6, 7.
a) Sumar una constante, por ejemplo 2, a cada numero, Calcular de nuevo la media.
Afiadase la suma de las comisiones a LIV . X antes de dividir.]
Generalizaci6n: i,Cual es el efecto producido sobre la media al aiiadir una constan 15. En un examen final, las calificaciones medias de grupos formados por 25, 40, 30,45, 50 Y
te a todos los datos? 20 alumnos fueron: 72.5, 68.4, 75.0, 71.3, 70.6 Y 78.1. .
a) i,Cual es la media general correspondiente a todos los grupos juntos?
88 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
MEDIDAS DE TENDENCIA CENTRAL 89
b) Dibujar una grafica lineal que muestre el tamafio de los grupos en abscisas y las 21. A continuacion se presentan las diferencias entre la presion sanguinea en la sesion de
medias correspondientes en ordenadas. l,Parece existir alguna relacion entre el control y en la sesion de acondicionarniento para cada uno de los sujetos:
tamafio del grupo y la calificacion media en el examen final?
SUJETO 2 3 4 5 6 7
16. Presentar ejemplos en los cuales la medida de tendencia central mas adecuada sea:
3 4 -3 2 -1 -1
Dosis fuerte 5 -17 -7 .A nivel de que grupo deberia trabajar el profesor si quisiera inc~em~~tar ~I rendimiento
~ediano del grupo total? l,A nivel de que grupo deberia trabajar Sl quisiera mcrementar el
-3 -7 -9 -6 1 -3
Hallar la diferencia media bajo las condiciones de (a) placebo, y (b) dosis fuerte. rendimiento media del grupo total?
18. En el mismo estudio citado en el ejercicio 17, ocho fumadores habituales de marihuana 23. l,CuM de las medidas de tendencia central esta mas afectada por el grado de asimetria
fueron sometidos a la prueba 15 minutos despues de una fuerte dosis. Las diferencias fueron las (sesgo) de la distribucion. Expliquese.
siguientes:
24 .Que cabe decir acerca de las relaciones entre la media, la mediana y la moda en una
. {,
distribucion ..
negativamente sesgada, y en otra posrtivamen te sesgada?.
SUJETO 2 3 4 5 6 7 8
25. Los datos que aparecen a continuacion corresponden a la poblacion ya su tasa anual de
Diferencia -4 11 crecimiento para seis regiones geograficas. (Fuente: L. Rocks y R. P. Runyon. The .E~ergy
3 -2 -6 -4 3
Crisis. Nueva York: Crown Publishers, 1972.) Calcular la tasa porcentual de crecimiento
Hallar la diferencia media para este grupo. ponderada para las seis regiones.
19. En un estudio acerca de los efectos de las condiciones operativas sobre la presion
sanguinea sistolica (Benson y col., 1971), los investigadores registraron las siguientes presiones POBLACION ACTUAL TASA ANUAL DE CRECIMIENTO
sanguineas* de siete sujetos durante las sesiones de control (donde no se les dio ningun REGION (EN MILLONES) (PORCENTAJE)
refuerzo).
Norteamerica 225 1.1
SUJETO Sudamerica 276 2.9
2 3 4 5 6 7 Europa 456 0.8
Presi6n sanguinea sis.onca 139.6 Rusia 241 1.0
213.3 162.3 166.9 157.8 165.7 149.0 Africa 344 2.4
Calcular la presion sanguinea media de los siete sujetos durante la sesion de control. Asia 1990 2.0
20. En el mismo estudio citado en el ejercicio 19, se registro la presion sanguinea de estos
mismos sujetos durante las sesiones de acondicionamiento. El senor A vende un promedio de 1.75 aspiradoras por dia en 4 dias.
SUJETO
2 3 4 5 6 7
EI senor C vende un promedio de 2.4 por dia en 5 dias.
Presi6n sangufnea sist61ica 136.1 179.5 133.1 150.4 141.7 166.6 131.7 EI senor E vende un promedio de 2.0 por dia en 3 dias.
Calcular la presion sanguinea media de estos siete sujetos durante las sesiones de acondiciona l,Cual es el numero medio de aspiradoras por vendedor en un dia?
miento.
27. Supongase que un comerciante vende el siguiente numero de manzanas de lunes a
sabado:
• Las medidas fueron realmente la presion media sanguinea durante las cinco iiltimas sesiones de control, y durante a) 30, 30, 30, 30, 30, 30
las cinco tiltimas sesiones de acondicionamiento.
l,Cuales son la media, la mediana y la moda?
MEDIDAS DE TENDENCIA CENTRAL 91
90 ESTADfSTlCA PARA LAS CIENCIAS SOCIALES
28. a) En el ejercicio 27(c), demostrar que L (X - X) = O. c) louna media menor 0 igual que 2.5?, . ?
b) Demostrar que la suma de las desviaciones respecto de la mediana y de la moda no d) louna media mayor 0 igual que 5.5, 0 menor 0 igual que 0.5.
es igual a cera. 38. Calcular la media de las medias del muestreo del ejercicio 37. [St~gerellc.ia: .Co~siderese
c) loPor que la suma de las desviaciones respecto a la media es igual a cera, en tanto que cada media como un dato, y sigase el procedimiento de calc~lar la media .en distribucionea de
la suma de las desviaciones respecto a la mediana y a la moda no 10 es? frecuencias no agrupadas.] loQue relacion existe entre la media de las medias del muestreo y la
29. Calcular la media, la mediana y la mod a para cada uno de los siguientes conjuntos: media de la poblaci6n original?
a) 3, 4, 5, 5, 6, 6, 6, 7, 7, 7, 7, 8, 8, 8, 9, 9, 10, 11
b) 5,5,6,6,6, 7, ~ 7, ~ 7, ~ 7, 7, &8,8,9,9
c) 5, 6, 6, 6, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 8, 8, 8, 9
Dibujar curvas de Irecuencias que representen la distribucion de estos datos. Comparar sus
formas.
30. Determinar la media, la mediana y la moda para la siguiente ordenacion:
31. Durante un determinado mes, una persona compra tres docenas de huevos a 0.50
pesos, una docena a 0.45 pesos, dos docenas a 0.55 pesos y una docena a 0.40 pesos. loCual es el
precio medio por docena?
32. Un escritor gana un promedio de 5.00 pesos por hora durante 4 horas de trabajo, 7.50
pesos por hora durante dos horas, 3.33 pesos hora durante 3 horas y 4.00 pesos por hora
durante 1 hora. loCua] es su ganancia media por hora?
33. Dos fabricantes de frigonficos aseguran que el «prornedio» de vida desus praductos es de
siete afios. Sin embargo, mediante un muestreo aleatorio, una persona encuentra que las vidas
(en afios) de 20 frigorificos del fabricante A son:
5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9, 9
Otro muestreo aleatorio de frigorlficos del fabricante B indico las siguientes duraciones:
2, 3, 4, 5, 5, 5, 5, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 20, 20, 20
l.A que medida «prornedio» se referfa cada fabricante? loQue maquina representaria la mejor
inversion? loCon que maquina se sentiria usted mas segura al afirmar que su vida «prornedio»
es de 7 afios?
34. A cornienzos de 1972 habia en los Estados Unidos 27 centrales nucleares con una
produccion media de 436.5 megavatios. Estaban en construccion 54 centrales con una pro
duccion media de 847.8 megavatios. Finalmente, estaba prevista la construccion de 52
centrales adicionales con una produccion media de 991.7 megavatios.
a) loCual es la produccion media prevista, en megavatios, de las 133 centrales nucleares?
b) loCuM sera la produccion total de las 133 centrales?
*35. En el ejercicio 30 del capitulo 3, se describio un experimento de muestreo en el cual se
extraian muestras de N = 2 de una poblacion de siete datos. Se construyo una tabla de las
sumas de todas las combinaciones posibles de los siete datos tornados dos ados. Puesto que
N = 2 en cada muestra, la suma se puede convertir en una media dividiendo POI' 2. Construir
una tabla donde aparezcan las 49 medias.
[92] MEDIDAS DE DISPERSI6N 93
6 Medidas de dispersion
X
110
128
Recuadro 6.1
AI h~lla: una medid.a ~e te??encia central, se da un primer e importante paso en la
0
Tornado de Winning with Statistics • R. P , Runyon'. Addison - Wesley P U bliIS hi109 C 0., Rea di109, M ass" 1977.
el result~do par 2 (ver ~g. 6.2). Esta. medida de la variabilidad se usa con mayor dispersion, respectivamente. Ademas, ambos estadigrafos se usan a menudo con
frecuencia para acompanar a la mediana, cuando la presencia de valores extremos datos de escala ordinal. Aunque esta medida de la variabilidad de las calificaciones es
hace. po.~o rec~mendable el uso de la media Como medida de tendencia central y de la mucho mas significativa que el rango, tiene dos defectos importantes: (1) 10 mismo
desviacion estandar Como medida de dispersion. En las ciencias del comportamiento que el rango, no permite hacer una interpretacion precisa de una calificacion dentro
s~ encuent~a que l.as curv~s de frecuencias correspondientes a tiernpos de reaccion, de la distribucion, y (2) como la mediana, no puede hacersele intervenir en ninguna de
ntmo car~Jaco y cifras de ingresos son suficientemente sesgadas para justificar el uso las relaciones matematicas «importantes» de la inferencia estadistica. En consecuen
de la mediana y del rango semi-intercuartil como medidas de tendencia central y de cia, no dedicaremos aqui mas atencion al estudio del rango semi-intercuartil.
MEDIDAS DE DISPERSI6N 97
96 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
blaciones normalmente distribuidas, la media es la mas util entre las medidas de C.M. = ~)(IX - "'lllN.
tendencia central. Obtenemos la media sumando todas las calificaciones y dividiendo
el resultado por N. Avanzando un paso mas, podemos restar la media de cada una de Se preguntara ellector por que nos hemos molestado en presentar la desviaci?n
las calificaciones, sumar las desviaciones respecto a la media, y obtener asi una media siendo de tan poco uso en el analisis estadistico. Co~~ ~eremo~, ~a desvl~
estimacion de la cantidad tipica de desviacion respecto a la media. Dividiendo por N, cion estandar y la varianza, que son de gran. v~l?r en e~ analisis estadistico, estan
tendriamos una medida analoga a la media aritrnetica, excepto que representaria la relacionadas muy estrechamente con la desviacion media.
dispersion de las calificaciones respecto a la media aritrnetica.
Si pens amos un momenta en las caracteristicas de la media, discutidas en el
capitulo anterior, encontraremos una seria dificultad. La suma de las desviaciones
respecto a la media es igual a cero. Asi, si definimos la desoiacion media (D.M.) co Varianza (S2). Y desviaci6n estandar (s)*
mo esta suma dividida por N, resultaria que la desviacion media tendria que ser
cero. Recordemos que con anterioridad habiamos utilizado la propiedad de que
Al efectuar una lectura cuidadosa de la tabla 6.1, el lector podria hacerse es~a
~)X - X) = 0 para llegar a una de las varias definiciones de la media.
reflexion: «Hubirnos de tratar los numeros de la columna encabezada por (X -. X)
Ahora bien, si sumaramos todas las desviaciones sin considerar el signa y
Como valores absolutes porque de otra manera su suma era igual a cero. "Por que no
dividierarnos por N, tendriamos todavia una medida que refleja la desviacion media
elevamos al cuadrado cada (X - X) y luego sumamos los cuadrados de las
de las observaciones respecto a la media aritmetica, Por supuesto, el estadigrafo
desviaciones? De esta forma habriamos eliminado de un mo?o perfectamente
resultante estaria basado en el valor absoluto de las desviaciones. EI valor absoluto de
legitimo el signo menos, conservando al mismo tiernpo la informacion inherente a las
un mimero positivo 0 de cero es el mismo nurnero. EI valor absoluto de un numero
negativo se obtiene cambiando el signo de negativo a positivo. Asi, el valor absoluto desviaciones.» . C d
La respuesta es: Cabe hacerlo, si de esta forma obtenemos un estadigra 0 e
de + 3 0 de - 3 es 3. EI simbolo de valor absoluto es II. Asi, 1- 3/ = 3.
mayor valor para juzgar acerca de la dispersion que el de aquellos otros que hemos
Los calculos para obtener la desviacion media aparecen en la tabla 6.1.
I d calcular la desviacion
1. La desviacion estandar rel1eja la dispersion de las calificaciones, de modo que se La tabla 6.2 muestra los procedimientos. e~p ea o~ para
puede comparar la variabilidad de diferentes distribuciones en terminos de este ind ar, utilizando el metodo de la deSVlaClOn media.
estan
estadigrafo (s).
Tabla 6.2 procedimiento para calcular s usando el metodo de la desviacion
2. La desviacion estandar permite una interpretacion precisa de las calificaciones
media en una ordenaci6n de datos.
dentro de una distribucion.
3. La desviacion estandar, como la media, pertenece a un sistema matematico que x x-x (X - Xl'
N Xl = ft
7 +2
Despues de que hayamos mostrado la forma de calcular s, podremos decir mas 4 = ../72/15
7 +2
acerca de su significado. 4
7 +2 = J4.8o
0 0
5
0 0 = 2.19
5
6.5.1 Calculo de la varianza y de la desviacion estandar, 5 0 0
0 0
metodo de la desviacion media, 5
4 -1 1
1
con datos no agrupados 4 -1
4
3 -2
La varianza se define como la suma de los cuadrados de las desviaciones respecto a la -2 4
3
-3 9
media, dioidida por N. Simbolicamente se representa asi: 2
-4 16
1
L
Se recordara que la suma de las (X - X}2 [que es (X - X)2] es conocida como
la suma de los cuadrados de las desviaciones y que tiene un valor minimo cuando las
desviaciones se han tornado respecto a la media. A partir de ahora, encontraremos en Se ex uso el metodo de la desviacion media unicamente par~ dest~car el hecho de
el cur so estas sumas de cuadrados con regularidad. Tomaran varias formas distintas, 1 d p. .on estandar se basa en las desviaciones de las cahficacIOne~ respecto a
segun losprocedimientos que elijamos para calcularlas. Sin embargo, es importante ~~e~i:s~~~~lmetodo es extremadamente. incomodo para el ~al~ulo, p~rtI~ula~~~n:~
recordar que, cualquiera que sea su forma, la suma de cuadrados representa la suma cuando la media tiene un valor fraccionano, que es el caso mas rec~en 1e. la suma de
de los cuadrados de las desviaciones respecto a la media. Por comodidad, usaremos e1 los parrafos siguientes examinaremos algunas otras formas para ca cu ar
SC = L(X:- XY (6.3)
6.5.2 Calculo de la desviacion estandar
La varianza resulta, entonces, en el caso de datos originales no agrupados
2 =SC Se puede demostrar matematicamente que
S -. (6.4)
N"
. La desuiacion estandar es la raiz cuadrada de la varianza y se la define como (6.6)
.r: (6.5)
8 SC = IX2 _ {I:)2 Si tomamos los datos de la tabla 6.2 y los ordenamos en una distribucion de
64
7 49
trecuencias no agrupadas, obtenemos
7 49 (75)2
= 447 - -
7 49
15
x
X
5
25
5 25
= 447 - 375= 72
9 1
4 2
5 25
8 1
2SC 3 2
5 25 5= 7 3
2 1
N
4 16
6 a
1 1
4 16 = 11 = 4.80
5 4
3
9
3 9 5= J4.8O = 2.19
2 4
Para calcular SC, multiplicamos cada data par su correspondiente frecuencia y
1
1
luego sumamos. Esto nos da IIX. A continuaci6n, para hallar IIX 2 , elevamas al
IX = 75 IX 2 = 447
cuadrado cada data, 10 multiplicamos par su correspondiente frecuencia y sumamos.
N = 15
Sc= IX2_2NX2+NX2
= IX 2
- NX
2
= IX 2
- N(~Xr
= ~ X2 _ N(IX)2 La tabla 6.4 resume el procedimiento para la obtenci6n de la desviaci6n estandar
c. N 2
en una distribuci6n de Irecuencias no agrupadas.
= I x 2_(I:)2. Tabla 6.4 Procedimiento para calcular Ia desviacion estandar con datos de una
distribucion de lrecuencias no agrupadas,
S
2
=-.
sc 9
8
1
1
9
8
81
64
81
64
SC = L rx 2 _ (I:)2
N 7 3 21 49 147
6 a a 36 a
(75)2
= 447 - -
Ala vez, extrayendo la raiz cuadrada de la varianza se obtiene la desviacion estandar 5 4 20 25 100 N
16
s=!i.
4 2 8 32
3 2 6 9 18
= 447 - 375 = 72
2 1 2 4 4
SC
1 1 1 1 1
52 = - = 11 = 4.80
N
En la tabla 6.3 se resume el procedimiento de calculo. Observese que los
resu!tados concuerdan can los que se obtuvieron par el metoda de la desviaci6n 5=~=2.1S
media.
N = 15 I!X = 75 Irx2 = 447
Al calcular la desviacion estandar en el caso de datos originales, es frecuente que los PASOS
X'
estudiantes confundan los terrninos de aspecto semejante LX 2 (0 IJ X 2) Y (LX)2 x
Contar el nurnero de datos para obtener N. N 12.
(0 [Lf xy). Es importante recordar que el primero representa la suma de 1. =
7 49
los cuadrados de los datos individuales, mientras que el segundo representa el 6 36 2. Sumar los datos que aparecen en la columna X para obtener LX.
6 36
cuadrado de la suma de los datos. Por definicion, es imposible obtener una suma p=48.
5 25
de cuadrados negativos 0 una desviacion estandar negativa. Si se obtiene un valor 25 3. Elevar al cuadrado cada dato y colocar el resultado en la columna
5
negativo bajo el signo radical, es probable que haya habido confusi6n entre estos 5 25 siguiente.
2
dos terrninos. 4 16 4. Sumar los nurneros de la columna X2 para obtener "X
L..
= 242 •
Una regia practica para estimar la desviacion estandar consiste en que la razon 4 16 Sustituir los valores encontrados en los pasos 2 y 4 en la f6rmula de la
5.
del rango ala desviacion estandar es muy raras veces menor que 2 0 mayor que 6. En 3 9 suma de cuadrados:
2 4
el ejemplo anterior, la razon es 9/2.19 = 4.11. Si obtenemos una desviacion estandar ("X)2 2304
para la cual est a razon es mayor que 6 0 menor que 2, podemos estar casi seguros de
1
0
1
0
SC =
I X2 - _L.._
N
= 242 - = 50
12
haber cometido un error. 6. Sustituir SC en las f6rmulas de 52 Y 5.
Una adecuada cornprension del significado de la desviacion estandar depende del Terrninos para recordar
conocimiento de la relaci6n existente entre ella y la distribucion normal. Asi, para rango semi-intercuartil
poder interpretar las desviaciones estandar calculadas en este capitulo, sera necesario desviacion esuindar
examinar la relaci6n entre los datos originales, la desviaci6n estandar y la distribu desviacion media (desviacion promedio) suma de cuadrados
cion normal. valor absoluto de un numero
dispersion
Trataremos esta cuesti6n en el capitulo siguiente. varianza
rango
Geueralizaclon: ~Que efecto se produce en 5 y 52 cuando se suma y resta una 14. Indicar al menos tres casos especfficosen que una medida de variabilidad fue importante
con stante a los datos de una ordenacion? (Nota: Esta generalizacion es extremada para describir un grupo. . ., .
mente importante en relacion con los capitulos siguientes donde se estudia el efecto 15. Indicar al menos tres casos especificos en que una medida de variabilidad fue importante
de los errores aleatorios en las medidas de variabilidad.) para comparar grupos de personas. .
d) Multiplicar cada dato por una constante, por ejemplo 2. Volver a calcular 5 y 52. 16 L s siguientes datos corresponden a temperaturas maxirnas diarias registradas en la
Generalizacion: ~Que efecto se produce en 5 y 52 cuando se multiplica cada dato ci~dad Ode Nueva York durante los meses de enero y mayo en 1965 y 1966*. Para cada rnes y
por una constante?
afio, efectuar 10 indicado en a), b) y c).
e) Dividir cada dato por la misma constante. Volver a calcular 5 y 52.
Generalizacion: ~Que efecto se produce en 5 y 52 cuando se divide cad a dato por a) Hallar la media.
una constante? b)
Hallar el rango y la desviacion media.
2. Comparar las generalizaciones anteriores con las que se hicieron en relacion con la media c) Hallar la desviacion estandar y la varianza.
o se divide cada dato par una constante, la medida de variacion queda tam bien multiplicada 0 2 29 52 77
60
dividida por ese numero, Com pro bar si los siguientes estadigrafos satisfacen estas condiciones: 32 46 71 68
3
i) la media ii) la mediana iii) la moda 39 45 90
59
4
Iv) la desviacion media v) la desviacion estandar vi) la varianza. 5 43 53 62 70
44 47 78 83
Si se ampliasen las propiedades que definen las medidas de dispersion, para incluir las 6
7 44 47
52 66
potencias de la constante por la cual se multiplica cada dato, ~quedaria calificada la varianza 61
8 49 44
60
como una medida de dispersion? 52
9 55 30 78
4. ~Como quedaria afectada la desviacion estandar por los casos descritos en los ejercicios 4
10 40
48 92
57
y 5 del capitulo 5?
35
42 88
63
11
27
78 57
a) 10, 8, 6, 0, 8, 3, 2, 2, 8, 0 b) 1, 3, 3, 5, 5, 5, 7, 7, 9
41 82
74
15 19
c) 20, 1, 2, 5, 4, 4, 4, 0 d) 5, 5, 5, 5, 5, 5, 5, 5, 5, 5
26
87 71
16 17
16 39
83 68
7. ~Por que es tan grande la desviacion estandar en la parte (c) del ejercicio 6? Describir el 17
18 25 38
73 66
8. Deterrninar el rango para los conjuntos de medidas del ejercicio 6. ~Para cual de ellos es 19
38
44 80
84
20
el rango una medida engafiosa de variabilidad y por que? 42 72 85
21 36
9. En los ejercicios 17 y 18 del capitulo 5, hallar la varianza y la desviacion estandar de las 22 50 39
80 75
47
37 79
85
dosis fuerte; y los correspondientes a los (c) fumadores cronicos en el estudio efectuado por
25 38 32 79 76
Grinspoon. [Sugerencia: Para facilitar los calculos cuando hay datos negativos, se suma a 84
26 44 26
94
todos los datos una constante mayor 0 igual que el valor absoluto del mayor dato negativo.] 82
27 42
36 92
10. Calcular la media y la desviacion estandar para el conjunto de 40 numeros del ejercicio 5, 38 19 83 73
28
capitulo 3. 27 23
68 82
29
20 38
67 73
11. Una compradora compara los precios de las ciruelas en varios supermercados, y
30
30
28 74
68
encuentra los siguientes precios por 500 gramos: 56, 65, 48, 73, 59, 72, 63, 65, 60, 63, 44,
31
79, 63, 61, 66, 69, 64, 71, 58, 63. a) Hallar la media. b) Hallar el rango, el ran go semi
12. Indicar una ventaja de la desviacion estandar sobre la varianza. Citar un ejemplo.
13. Con referencia al ejercicio 24 del capitulo 3, hallar la media y la desviacion estandar del • Los datos para este problema provienen de, Tile World Almanac, pags. 558-559.N~eva York: Newspaper Enterprise
ruimero de botellas de leche vendidas en el supermercado. ssociation, lnc., 1967. Reproducido con perrmso.
106 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
[107J
17. . S~~6nga~e que un co~erciante ven?e una botella de leche por 0.40 pesos y que la
d~svlaclOn estand~r del ~reclO durante el ultimo mes fne igual a O. lCual fue el precio en los
dfas tercero y decimoquinto?
Desviacion estandar
18. Calcular el rango, la varianza y la desviaci6n estandar correspondientes a los dos
fabricantes del ejercicio 33, capitulo 5. y distribucion normal estandar
19. Precipitacion normal mensual t.
ESTACIONES ENE. FEB. MAR. ABR. MAY. JUN. JUL, AGO. SEP. OCT. NOV.DIC.
Barrow, Alaska 0.2 0.2 0.1 0.1 0.1 0.4 0.8 0.9 0.6 0.5 0.2 0.2
Burlington, VI. 2.0 1.8 2.1 2.6 3.0 3.5 3.9 3.4 3.3 3.0 2.6 2.1
Honolulu,
Hawaii 3.8 3.3 2.9 1.3 1.0 0.3 0.4 0.9 1.0 1.8 2.2 3.0
Seattle-Tacoma,
Washington 5.7 4.2 3.8 2.4 1.7 1.6 0.8 1.0
Introduccion
2.1 4.0 5.4 6.3
Anteriormente vimos que las calificaciones obtenidas mediante escalas carecen, por
Determinar la varianza y la desviacion estandar para los datos del afio en cada ciudad.
10 general, de significado intrinseco para los cientificos del comportamiento. A fin de
'20. Con referencia al ejercicio 36 del capitulo 5, calcular la desviacion estandar de la que 10 adquieran, es necesario compararlas con la distribucion de calificaciones
distribucion de frecuencias de las medias muestrales. [Sugerencia: Tratar cada media como un de algun grupo de referencia. Ciertamente, las calificaciones obtenidas a partir de
dato y usar el metodo de los datos originales para obtener la desviaci6n estandar de una
distribuci6n de frecuencias no agrupadas.] cualquier escala, inc1uyendo las que emplean los fisicos, lIegan a tener mayor
significado cuando se las com para con un grupo de referencia de personas u
21. Hallar la varianz? y l.a .desviaci6n estandar para la presion sanguinea (Benson y col., 1971) objetos.
que a~~recen ~n los eJercl~IOS 19 a 21 del capitulo 5: (a) sesiones de control, (b) sesiones de Asi, si nos dijeran que un pescador canadiense capture un lucio de 22 kilos,
acondlclOnamlento y (c) diferencias,
quedariamos sorprendidos 0 no, segun sean nuestros conocimientos acerca del peso
usual de estos peces de agua dulce. Sin embargo, una vez establecido el grupo de
referencia, dicha medicion adquiere sentido. Puesto que la mayoria de los lucios
pesan alrededor de 4.5 kilos y en raras ocasiones alcanzan los 10 kilos, el logro de
nuestro pescador anonimo debe considerarse excesivamente exagerado.
Recuadro 7.1
Como dijimos anteriormente, una calificacion carece de significado por si misma. En
este capitulo veremos que la transformacion a valores z proporciona un medio preciso
para interpretar cualquier valor de una variable cuando se trata de valores normalmen
te distribuidos. EI siguiente fragmento de Winning with Statistics ilustra el uso de la
transformacion a valores z para la interpretacion de las calificaciones obtenidas en
examenes y pruebas psicologicas,
Aseguresede hallar estas dos medidas para el grupo de edad en que interesa, Las fuentes -2.1 2
98
0.2 58
42
de informacion son el manual de la prueba (test) que se esre aplicando 0 algtin tratado -2.0 2
98
0.3 62
38
-1.8 4
96
0.5 69
31
-1.6 5
95
0.7 76
24
-f5 7
93
0.8 79
21
-1.2 12
88
1.1 86
14
-1.1 14
86
1.2 88
12
-0.9 18
82
1.4 92
8
-0.8 21
79
1.5 93
7
z = ~O - 30 = 10 = 1.1
-0.7 24
76
1.6 95
5
9 9
-0.6 27
73
1.7 96
4
-0.5 31
69
1.8 96
4
-0.3 38
62
2.0 98
2
Tornado de Winning with Statistics, R. P. Runyon; Addison-Wesley Publishing Co., Reading, Mass., 1977.
* En realidad, el autor rnenciona dos publicaciones especializadas: e1 Administratian Booklet y el Buros
Mental Measurement Yearbo9k. (N. del T)
110 ESTADfSTICA PARA LAS CIENCIAS SOCIALES DESVIACI6N ESTANDAR Y DISTRIBUCI6N NORMAL ESTANDAR 111
~ Iz O.
-N=
- = (7.3) 7.3 La distribuci6n normal estandar
3. La suma de .los cuadrados de los valores z es igual a N*. Asi,
La distribucion normal estandar tiene una J1 de 0, una (J de 1 y un area total igual a
I z2 = N. (7.4)
1.00*. Hay una proporcion fija de casos entre las perpendiculares (ordenadas)
.levantadas en dos puntos cualesquiera del eje de las abscisas. Tomando algunos
Esta caracteristica puede demostrarse matematicamente: puntos de referencia a 10 largo de la curva normal, podemos enunciar 10 siguiente:
1. Entre la media y una desviacion estandar a la derecha de ella se encuentra el
34.13 % de los casos. Analogamente, el 34.13 % de todos los casos estan entre la
media y una desviacion estandar a la izquierda de ella. Dicho de otro modo, el
34.13 % del area situada bajo la curva se encuentra entre la media y 1 desviacion
estandar (a la derecha), y el 34.13 % del area esta comprendida entre la media y -1
desviacion estandar.
2. Entre la media y 2 desviaciones estandar a la derecha de ella se encuentra el
=N. 47.72 % de los casos. Puesto que la curva normal es simetrica, el 47.72 % del area
4. La desviacion estandar y la varianza de los valores z son iguales a Ja unidad. Asi, tambien esta comprendida entre la media y - 2 desviaciones estandar.
* Se recordara que las letras griegas Il Y a representan, respectivamente, la media Y la desviaci6n estandar
(7.5) poblacionales. La ecuacion de la curva mormal es:
Demostracion:
Ni -(X-Ill'
Y=--e ,
uj2ii 2u'
donde
z = 7.35 - 16 = -1.73.
5
su calificacion z seria
Remitiendonos a la columna (B) de la tabla A, encontramos que 0.4582, 0 sea, el RANGO PERCENTIL 0.13 2.28 15.87 50.00 84.13 97.72 99.87
45.82 %* del area esta situada entre dicha calificacion y la media. Puesto que en una
distribucion simetrica el 50 % del area esta situada a la izquierda de la media, Fig. 7.2 Relaciones entre calificaciones originales, valores z y rangos percentiles de una variable
normalmente distribuida en la cual f1. = 50 y a = 10.
podemos concluir que el 95.82 % del area total esta a la izquierda de una calificacion
• Las ~re~s situadas bajo la curva n~rmal se expresan en fraceiones de area. Para convertir en porcentajes de area,
basta multiplicar por 100, 0 desplazar simplernente el punto decimal dos lugares a Ja derecha. - . En el apendice IV, pagina 409. se resumen los procedimientos para transformar una distribucion de frecuencias no
normal en una distribucion normal.
DESVIACION ESTA.NDAR Y DISTRIBUCION NORMAL ESTA.NDAR 115
114 ESTADiSTICA PARA LAS CIENCIAS SOCiALES
7.4 Problemas ilustrativos EI signo menos indica que la calificaci6n es menor que la medi.a. B~s.cando 0.44 en la
columna (c), hallamos que el 33.00 % de los casos tienen calificacion menor que la.
Consideremos varios problemas en los que suponemos que la variable corresponde a suya. Asi, su rango percentil es de 33.00.
calificaciones obtenidas en una prueba para la determinacion del CI, donde la media
Problema 3. l,Que porcentaje de los casos estan entre una calificacion de 120 y otra
poblacional u es igual a 100 y la desviacion estandar (J es igual a 16. Se supone que la
variable se distribuye normal mente. de 88? (fig. 7.5). di idi
Notese que para responder a est a pregunta ~? restamo~ 88 de 120 y I~I, imos
Problema 1. Un estudiante obtuvo una calificacion de 125 en una prueba de CI. por (J. Las areas en una curva normal de probablhdades estan dadas en relacion a la
l,Que porcentaje de casos se encuentran entre su calificacion y la media? l,Cmil es su media, que se toma como punto fijo de r~feren.c.ia. Par tanto, ~ebemos caIcular .por
rasgo percentil en la poblacion? separado el area entre la media y una califlcacton de 120 y el area ~ntre la me,dta y
Para comenzar, es conveniente construir un diagrama simple que represente las una calificacion de 88. Para resolver eI problema sumamos despues las dos areas.
relaciones en cuestion. Asi, en el presente ejernplo, el diagrama seria como el que
aparece en la figura 7.3. Para hallar el valor de z correspondiente a X = 125,
restamos la media poblacional de 125 y dividimos por 16. Asi,
125 - 100
~ - ~-1~6~ = 1.56.
I A LA IZQUIERDA
DE 125
distribucion normal con II = 100 Y
(J = 16.
Procedimiento:
Paso 1. Hallar la z correspondiente a X = 120.
Fig. 7.3 Proporcion de area a la
izquierda de J25 en una distribucion
125 normal con )1 = 100 Y (J = 16.
7 = 120 - 100 = 1.25.
J1
~ 16
Buscando 1.56 en la columna (B) de la tabla A, hallamos que 44.06 % del area esta
situada entre la media y 1.56 desviaciones estandar a la derecha de la media. EI rango Paso 2. Hallar la z correspondiente a X = 88.
percentil de dicho estudiante es, por tanto, de 50 + 44.06, 0 sea, 94.06.
Problema 2. Otro estudiante obtiene una calificaci6n de 93 en una prueba de CI. _= 88 - 100 = -0.75.
~ 16
l,Cual es su rango percentil en la poblaci6n? (fig. 7.4).
93 - 100 Paso 3. Hallar las areas requeridas en la columna (B) de la tabla A.
z = --16-'- = - 0.44.
EI area entre la media y z = 1.25 es de 39.44 %
I AREA A LA IZQUIERDA
DE UNA
CALIFICACION DE 93
Paso 4.. Sumar las dos areas obtenidas.
Asi, eI area entre 88 y 120 = 66.78 %.
Problema 4. l,Que porcentaje de area hay entre las calificaciones de 123 y 135?
Fig. 7.4 Proporcion de area a la
izquierda de una calificacion de 93 en (fig. 7.6). b I 11 el
una distribucion normal con u = 100
De nuevo, no podemos obtener la respuesta en forma dir~cta. De emos ia ar
93 J1 Y (J = 16. area entre la media y 123, Y restarla del area entre la media y 135.
116 ESTADfSTICA PARA LAS CIENCIAS SOCIALES DESVIACI6N ESTANDAR Y DISTRIBUCI6N NORMAL ESTANDAR 117
Tabla 7.1 Resultados hipoteticos obtenidos por Facilmente podemos convertir los datos Z en unidades de la curva normal
DISTANCIA FRECUENCIA dos baterias de artilleria al disparar a un blanco.
AL BLANCO estandar:
(EN METROS) BATERIA A BATERIA B Z-2
z=---·
10
200 2 o
150 4 1 Asi, una persona que obtuvo un Z de 84.8 tend ria un correspondiente z de
100 5 5
50 7 10 z = 84.8 - 100 = _ 15.2 = -1.52.
o 9 13
10 10
-50 7 10
-100 5 5 Empleando la curva normal estandar, se encuentra que a este valor le corresponde
-150 4 1
un rango percentil de 6.53. .,
-200 2 o Para eliminar los decimales, podriamos usar una transforrnacion tal como
X= 0 o Z = 500 + 100z.
s = 102.74 65.83*
... Obsarvese que, si bien las dos baterias tienen ta misma precision Un valor z de -1.52 se convierte en
media, los disparos de la bateria B muestran una dispersion menor.
Z = 500 + 100( -1.52)
= 500 - 152
= 348.
7.6 La transformaci6n a valores Z
Muchos examenes y pruebas psicol6gicas han sido realizadas a proposito para ob
tener una distribucion normal de datos z. Mas aun, existenprocedimientos para Resumen del capitulo
transformar distribuciones no norrnales en una distribucion normal estandar. Estos
procedimientos se indican en el apendice IV, pagina 409. Recuerdese, sin embargo, En este capitulo, mostramos la importancia de la desviacion estandar para. cornparar
que los datos z incluyen much os valores negativos y estan expresados en forma la dispersion de las calificaciones en diferentes distribuciones de una van able, para
decimal. Puesto que a menu do resulta incornodo y confuso trabajar con numeros interpretar una calificacion respecto a una distribucion, y para. cOIr~para~ las
negativos y decimales, los datos z de variables norrnalmente distribuidas son calificaciones en dos 0 mas variables. Vimos la forma de convertir calificaciones
frecuentemente convertidos en valores Z, empleando la siguiente ecuacion de originales en unidades de la curva normal estandar (transformaci6n ~ valores z), .y
transforrnacion: tambien se explico las caracteristicas de la curva norma! est.andar. Mediante un.a, sene
Z* = 100 + lOz. de problemas resueltos se mostraron las diversas aphcacIOnes de la conversion de
variables normalmente distribuidas en valores z.
Esta transforrnacion da lugar a una distribucion con media de 100 y desviacion Finalmente se estudio la desviacion estandar como una estimaci6n del error y de
estandar de 10, y quedan eliminados todos los valores negativos. Asi, una calificacion la precision. M~stramos el uso de la transformaci6n Z como un metodo con~enie~te
con una z correspondiente a -1.52 se convierte en . para eliminar los valores negativos que se presentan cuando se expresan las calificacio
INcr;,::: ll?\P~ec").,,,. -4- ) nes en terrninos de z.
Z = 100 + 1O( - 1.52)
= 100 - 15.2 = 84.8.
Se acostumbra redondear al numero entero mas proximo, con 10 cual se eliminan los
decimales. Terminus para recordar
* La transforrnacion puede incluir la sustitucion de constantes cualesquiera en la ecuacion. Asi, si se desea obtener
una media de 100 y una desviacion estandar de 20, la ecuacion de transforrnacion tendra que ser: 100 + 20z. Hay una calijicacion esuindar (z)
transformacion a calificaciones Z que normaliza las distribuciones no normales. Los procedimientos correspondientes
caen fuera del alcance de este libra. Como referencia puede verse: Walker, Helen M. y Joseph Lev, Elemelltary Statistical distribucion normal estandar
Methods (3.' ed., 1969). Nueva York: Holt, Rinehart and Winston, Inc.
120 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
DESVIACION ESTA.NDAR Y DISTRIBUCION NORMAL ESTA.NDAR 121
Ejercicios 6. Si construyeramos una curva de frecuencias para cada uno de los casos siguientes, l,cual
se aproximarfa a una cur va normal? '
1. Dada una distribucion normal con media de 45.2) Jesviacion estandar de 10.4, Milar las
calificaciones estandar equivalentes para las siguientes calificaciones:
a) La estatura de una gran muestra representativa de los varones norteamericanos
a) 55 b) 41 c) 45.2
adultos.
d) 31.5 e) 68.4 f) 18.9
b) Las medias de un gran numero de muestras con N fijo (por ejemplo, N = 100),
extraidas de una poblacion de 'calificaciones normalmente distribuida.
2. Hallar la proporcion de area situada bajo la curva normal entre la media y los siguientes c) Las medias de un gran mimero de muestras con N fijo (por ejemplo, N = 100),
valores z: extrafdas de una poblacion de calificaciones con distribucion moderadamente
a) -2.05 b) -1.90 c) -0.25
sesgada. .
d) +0.40 e) + 1.65 f) + 1.96
d) Los pesos, en gramos, de mazorcas de maiz seleccionadas al azar en un maI~~l.
g) +2.33 h) +2.58 i) +3.08
e) EI ingreso anual, en pesos, del cabeza de familia de un gran mimero de familias
mexican as seleccionadas al azar.
3. Dada una distribucion normal basada en 1000 casos, con una media de 50 y una
desviacion estandar de 10, hallar: f) EI peso, en gramos, de todos los peces obtenidos en un concurso de pesca.
a) la proporcion de area y el mimero de casos entre la media y las siguientes 7. En una distribuci6n normal con J1 = 72 y a = 12:
60, 70, 45, 25; c) l,Cual es la calificaci6n correspondiente al percentil ?O? " .
b) la proporcion de area y el numero de casos a la derecha de las siguientes calificacio d) Encontrar el porcentaje de cas os que tienen una calificacion supenor a 80.
nes: e) Encontrar el porcentaje de casos que tienen una calificaci6n inferior a 66.
c) la proporcion de area y el numero de casos entre las siguientes calificaciones: h) l,A partir de que calificaci6n se encuentra el 1 % mas extremo?
60-70, 25-60, 45-70, 25-45. 8. Responder a las preguntas anteriores, desde la a) hasta la h), para
a) J1 = 72 y a = 8;
c) - 0.50 d) 0.00
J1 = 64, a = 8.
13. La transformaci6n a valores Z da lugar a los siguientes valores cuando Z = 500 + 100z.
a) Un alumno obtuvo una calificacion de 62. loCual es su rango percentil en relacion con Regresar a los valores z originales.
ambas normas, la masculina y la femenina? a) 230 b) 500 c) 780 d) 640 e) 460
b) EI rango percentil de una alumna es de 73 en la norma femenina. loCual es su rango
14. l,En que sentido se puede considerar a la desviaci6n estandar como una medida de
percentil en la norma masculina?
precision?
[122J CORRELACI6N 123
8
Tabla 8.1 Diversos tipos de coeficientes de correlacion y escalas numericas con que son utilizados.
Correlaci6n
Nominal r phi' (coeficiente phi)
rb'
Dos variables dicotornicas.
(r biserial) Una variable dicotomica cuva continuidad se
admite; una variable que puede tomar mas de
dos valores.
r'
r (r tetracorica) Dos variables dicotornicas cuva continuidad se
puede admitir.
Recuadro 8.1
75,-------------------------------..,
70
TINA
65
(J) 60
o
'2
«
15 55
;3'y
s
w 50
Q
«
N
2
« 45
0:
w
0
0)
w
40
35
30
0 100 300 400 500 600 700 800 900 1000 1100 1200 1300 1400
X
PRODUCTO NACIONAL BRUTO PER CAPITA (DOLARES)
i,Existe una relacion entre el praducto nacional bruto (PNB) per capita, expresado en de los paises no desarrollados con un alto PNB per capita tienen una larga esperanz~ de
dolares, y la esperanza de vida de los nifios nacidos actualmente en los paises no vida. Los ciudadanos de los paises con bajo PNB tienen una co.rta espe~a,nza de Vida.
desarrdllados? Tarnbien se aprecia que la relacion no es lineal (linea recta), sma curvlhnea.
En la tabla adjunta se muestran los ingresos per capita y la esperanza de vida en PNB PER CAPITA ESPERANZA
dieciseis naciones. A est as variables las hernos lIamado X e Y, donde X cs cI valor EN DOLARES DE VIDA, Al'i10S
X Y
en dolares del PNB, e Y el valor de 1'1 esperanza de vida. Notese que para cada nacion PAIS
hay dos valores, uno para la variable X y otro para la variable Y. Afganistan 75 40
Para ayudar a visualizar estas relaciones, se ha dibujado un diagrarna de dispersion, Nigeria 135 39
Es tradicional representar los valores de la variable X en el eje horizontal (Ilamado Nepal 87 43
tam bien eje X 0 eje de las abscisas) y los valores de la variable Y en el eje vertical Zaire 90 45
(llarnado tam bien eje Yo eje de las ordenadas). Los puntos que aparecen en el diagrama Tanzania 120 4<1
de dispersion adjunto representan los pares de valores X e Y para cada nacion. Veamos Indonesia 80 48
el procedimiento para construir un diagrama de dispersion. Uganda 140 49
Observese que el valor de X para Alganistan es 75, y que el correspondiente valor de China 170 53
Vietnam del Sur 245 54
Yes 40. Situemos en el eje X el valor de 75. Levantemos una perpendicular al eje X en
Iran 370 54
este punta. Situemos ahara el valor de 40 en el eje Y, Tracemos por este punto una 57
Turqula 760
perpendicular al eje Y. EI punto en que se cortan arnbas rectas representa el valor de 63
Brasil
500
cada variable, X e Y, para Afganistan. 69
Taiwan
460
Los diagramas de dispersion son utiles para representar la relacion entre dos 770 . 64
Mexico
variables. En el diagrama anterior se aprecia que hay una relacion real entre X e Y 1000 66
Venezuela
(0 sea, que los valores bajos en X estan generalmcnte asociados a valores bajos de Y, y los 1300 67
Argentina
•
• ,. Tabla 8.2 Calificaciones originales y sus correspondientes valores z de 7 individuos con respecto ados
•• • • •
• ••
.. variables (datos hipoteticos),
y
• y
• y INDIVIDUO X X-X (X X)' z, Y v _ '(2 (Y _ 9)' z" z,;z.\.
• • • • •
• • • A 1 -6 36 -1.5 4 -9 81 -1.5 2.25
• • • • B 3
5
-4
-2
16
4
-1.0
-0.5
7
10
-6
-3
36
9
-1.0
-0.5
1.00
0.25
C
X X D 7 0 0 0 13 0 0 0 0
X
r » LOO E 9 2 4 0.5 16 3 9 0.5 0.25
r = 0,82 r = 0.57
F 11 4 16 1.0 19 6 36 1.0 1.00
G 13 6 36 1.5 22 9 81 1.5 2.25
La I' de Pearson es una medida del qrado en que los mismos indioiduos 0 sucesos En la seccion 7.2, sefialamos que ~)2 = N. Se notara que, cuando la correlacion
ocupan la misma posicion relatioa respecto a dos variables. es perfecta, cada valor z en la variable X es identico a su correspondiente valor z en la
variable Y. Asi, LZxz = LZ~ = LZ;, cuando I' = 1.00. En otras palabras, en una
Con el fin de investigar las caracteristicas fundamentales de la I' de Pearson, correlacion perfecta, fzxzy = N. La I' de Pearson toma entonces el valor NIN, 0 sea,
examinemos un ejemplo simplificado de una correlacion positiva perfecta. En la tabla 1.00.
8.2 encontramos las parejas de valores para 7 individuos respecto a dos variables Sugerimos allector que tome los datos de la tabla 8.1, los reagrupe de di~erentes
XeY.
forrnas y calcule 1', empleando la formula (8.1). De est a manera llegara a un
128 ESTADisTICA PARA LAS CIENCIAS SOCIALES CORRELACION 129
conocimiento mas completo del significado de r que si se limita, simplemente, a la L s procedimientos de calculo que emplean el metodo de la desviacion media
lectura del texto. (Por supuesto, esto no quiere decir que deje de hacer esto ultimo.) debe~ ser familiares al lector. Ya encontramos anteriormente_la .SC x y la SC y al
Sucede que est a formula no es manejable en la practica, puesto que requiere el estudiar la desviacion estandar, De hecho, al calcular r hemos afiadido solamente.!In
calculo de los valores z separados para cada individuo. [Irnagmese la titanica tarea paso que consiste en obtener la suma de los pro?u~~OS cruzados ~(X -:- Y). x:)(r: --:
que representa calcular r cuando N excede de los 50 casos, como frecuentemente Esto se consigue facilmente multiplicando la desVlaClOn?e cada c~lifi~.~clOn mdlvl.dual
sucede cuando se investiga en las ciencias del comportamiento! respecto a la media de la variable X por su correspondiente deSVIaCl~n ~n la vanable
Por esta razon se emplean diferentes formulas de calculo, En esta obra, ilustrare y. umando luego todos los productos cruzados. Debe observarse incidentalmente
mos el uso de dos de ellas: (1) la formula de la desviacion media, y (2) la formula de , Ys. d "(X - X-)(Y - Y-) con "(z . 10
z) que vimos en la seccion 8.2. Todo
L... ~ y.'
1a semejanza e L,
las calificaciones originales. dicho respecto a I~ relacion entre las vanac~ones e~ L(zx~y) y r puede ~ph~arse
tambien a L(X - X)(Y - Y) y r. Notese que Slse hubler~n alm~ado las deSVIaCl.ones
maxirnas en X con las desviaciones maximas ~n Y, y ~Sl suce.slv~me~te a traves de
toda la ordenaci6n de calificaciones, L(X - X)(Y - Y) habria sido 19~~l a 168.00,
8.3 Calculo de la r de Pearson que es el valor del denominador, y se habria producido una correlacion de 1.00.
(8.2) Por analogia*, la formula de los datos originales para la suma de los productos
cruzados es
Ilustremos el metodo de la desviacion media, empleando los datos de la tabla 8.2
pero ordenados en una secuencia distinta (tabla 8.3). L(X - X)(Y - ¥) = L XY - (LX~LY). (8.3)
INDIVIDUO X (X - Xl (X-X)' Y (y- 1') (y _ 1')' (X - xJ.lY 1') • Ver la seccicn 6.5.2 para la demostracion de SC = LX2 - (LXj2jN.
A 1 -6 36 7 -6 36
L(X - X)(Y- ?)= L X Y- LX? - L YX + L XY
36
B 3 -4 16 4 -9 81 36 Puesto que
LX = NX, L Y = NY,
C 5 -2 4 13 0 0 0 y
E 9 2 4 10 -3 9 -6 Se deduce que:
F 11 4 16 22 9 81 36 L(X - X)(Y - Y)= LXY - NXY - NYX + 'NXY
G 13 6 36 19 6 36 36
= LXY - NXY
SC,=112 SC y = 252 DX - X)(Y - Y) = 138
= LX Y - N(L:)(2:~)
DX-X)(Y- Y) 138 138
r=
JSC,· SC" .J (112)(252)
--=0.82
168.00 = L X Y _ (D'~2:Y).
CORRELACI6N 131
130 ESTADfsTICA PARA LAS CIENCIAS SOCIALES
Tabla 8.4 Procedimientos para calcular la r de Pearson empleando el metodo de las calificaciones
en la formula (8.2), 0 bien definir r en funcion de las calificaciones originales como en originales (datos hipoteticos).
la formula (8.4), del modo siguiente:
Xy
I XY - Q:X~LY)
INOIVIOUO X
1
x'
1
Y
7
y'
49 7
A
r= ~~
J[I x» - (L:)2J[I y2 - (I;)2J B
C
0
3
5
7
9
25
49
4
13
16
16
169
256
12
65
112
9 81 10 100 90
E
Una formula alternativa muy util para el calculo de la r de Pearson cuando las 11 121 22 484 242
F
medias y las desviaciones estandar han sido ya calculadas para otros fines, es 13 169 19 361 247
G
La tabla 8.4 resume los procedimientos para calcular r por el metoda de las r = IIX - X)(Y - Y) ;
calificaciones originales. Aqui hallamos exactamente el mismo coeficiente que ..)SC x SC, 0
habfamos encontrado antes. Como en el metoda de la desviacion media, todos los (LX)(LY)
procedimientos, excepto los que se emplean para la obtencion de los productos L (X - X)(Y - Y) = I XY- N
cruzados, resultan familiares porque habian sido empleados en la formula de las
= 775 - 637 (49)(91)
calificaciones originales para obtener la desviacion estandar, La cantidad LXY se 775---
halla multiplicando simplemente cad a valor de X por su correspondiente valor de Y,
= 138; 7
o
z
«
::2
:5 •••
"
...::
••.
•••••• ••
••
Variables de escala ordinal y rs
UJ •••• 'lIe ••• Supongamos que ellector es profesor de ensefianza primaria. Despues de varios afios
Cl
••••
•••• •• de observacion en la clase, llega a tener la firme sospecha de que la inteligencia y la
..••••••
Ill• • II
:e • ••
aptitud de mando son variables relacionadas. En un esfuerzo para comprobar su
hipotesis, obtiene estimaciones del CI de todos los nifios de su clase. Sin embargo, se
encuentra con el hecho de que no hay escalas disponibles para medir la aptitud de
Fig. ~.2 Diagrama de dispersion de dos variables que estan
mando y no encuentra una manera satisfactoria de cuantificar esta variable. A pesar
EDAD relacionadas en una forma no lineal (datos hipoteticos], de todo, de acuerdo con numerosas observaciones de los nifios en diferentes
S
en
UJ
Rangos empatados
A veces, cuando es necesario convertir las calificaciones en rangos, se encuentran dos
o mas calificaciones empatadas. En este caso, se asigna a cada uno de ellos la media
de los rangos empatados. La calificacion siguiente en la ordenacion recibe el rango
Fig. 8.3 Diagrama de dispersion que ilustra una correlacion
que normalmente Ie corresponde. Asi, los rangos de las calificaciones 128, 122, 115,
EDAD
alta par~.el rango completo de los valores de X e Y, pero una
correlacion baja cuando se trunca el rango (datos hipoteticos). 115, 115, 107, 103 serian 1,2,4,4,4,6, 7; Ylos rangos de las calificaciones 128, 122,
15, 115, 107, 103 serian 1, 2, 3, 3.5, 3.5, 5, 6.
CORRELACION 135
134 ESTADfsTICA PARA LAS CIENCIAS SOCIALES
(datos hipoteticos),
1 4 -3 9
r, = 1
6LD 2
= 52.75
2 2 0 0
N(N 2 - 1)
3 9 -6 36
4 1
-2
3 9
4
=1-~
5 7 15(224)
6 10 -4 16
SCx = ('L X)2 _ ('L;)2
-1 1
1224
7 8 = 1-
8 13 -5 25 3360
9 5 4 16
= 1 - 0.36
= 2825 _ (45)2
10 3 7 49
. 9
11 11 0 0
= 0.64
12 6 6 36
= 282,5 - 225
13 12 1 1
15 -1 1
= 57.5
14
15 14 1 1
LD=O LD 2
= 204
y)2
SC = "y2 _ ('L
y L, N
= 284.5 - 225
, Cuando se producen empates en una de las variables X e y. 0 en ambas la
form~la ~e Spearman exagera el valor del coeficiente de correlaci6n' particularm:nte = 59.5
~uan 0 e n/umedro de empates es grande. En caso de empates, deberi~ aplicarse la r de
earson a os atos ordenados por ranqos. Paso 4. Sustituir en la formula de la r de Pearson.
52.75
Ejemplo r = --;::====
.J(57.5)(59.5)
RANGO RANGO
DE X )(2 DE Y Y2 XY
= ~~::~ = 0.90
1 1 2 4 2
2 4 3 9 6
7 49 6 36 42
9 81 9 81 81
escalas de intervalo 0 de razon; y r s, que se usa con variables ordinales.
Ly Vimos que la correlacion sirve para determinar el grado en que dos variables
LX 45 Lx 2
- 282.5 LY= 45 2
= 284.5 LXY = 277.75 estan relacionadas 0 tienden a variar conjuntamente. La expresion cuantitativa del
grado de relacion viene dada en terrninos de la magnitud del coeficiente de
correlaci6n.EI valor de los coeficientes de correlaci6n varia entre -1.00 Y + 1.00;
r = ~)X - X)(Y - Y) ambos extremos representan relaciones perfectas. Un coeficiente igual a cero indica la
JSCx'SC y
ausencia de relaci6n entre dos variables.
136 ESTAnfsTICA PARA LAS CIENCIAS SOCIALES
CORRELACI6N 137
variables relacionadas de una manera lineal. Con datos ordenados, el coeficiente de NOTA EN NOTA EN
(0)0'
~shtdiantes
\
datos siguientes 'om'pond'n a 1" <alifimcion" obtenidas por on grupo de 2<l
en un examen de ingreso a la universidad y en una prueba de comprensi6n verbal.
H 11 10 P 16
16
34 N
E 63 43
41 variables? . . tudiantes en dos pruebas.
52 0 ificaci f eron obtenidas por cinco es
F 44 30 15 7. Las siguientes cali icaciones u " IN) C nvertir las calificaciones en rangos y
41 P Calcular la r de Pearson (usando r = L,ZXZy • 0
G 70 65 50
45 Q calcular r S'
H 32 35 28
32 R
I 49 60 55
29 S 'PRUEBA PRUEBA
J 51 49 37
49 T ESTUDIANTE X Y
66 50
A 5 1
B 5 3
2. Los datos de la tabla siguiente representan las calificaciones obtenidas por 10 estudiantes C 5 5
en un examen de Estadistica y su promedio final. Hacer un diagrama de dispersion y calcular o 5 7
la r de Pearson para estos datos.
E 5 9
CORRELACION 139
138 ESTADISTICA PARA LAS CIENCIAS SOCIALES
REDONDEADA AL
TEMPERATURA
GRADO MAS TEMPERATURA
8. Demostrar algebraicamente que MEDIA ALTA MEDIA BAJA
CIUDAD PROXIMO
\' - - = L,..XY
L,..(X - X)(Y - Y)
\' - -IXIY
N-' 31 23
Acapulco 17
30 23
Accra 6
24 22
9. loQue efecto tiene sobre la r de Pearson una desviacion de la linealidad? Argel 37
12 8
Amsterdam 52
17 7
10. loComo afecta el rango de las calificaciones consideradas a la magnitud del coeficiente de Belgrado 45 4.4
53 13
correlaci6n? Berlin 19 10
Bogota 5 23
19 31
II. En el ejercicio 15 del capitulo 5, se dieron las calificaciones medias de grupos con diversos Bombay
17 6
numeros de alumnos. loCmil es la correlacion entre el tamafio del grupo y las calificaciones Bucarest 44 21.1
22 32
promedio en el exarnen final? Calcuta 13
34 22
Casablanca 5
56 11
(ii\ Los siguientes datos corresponden a las calificaciones obtenidas en un examen de ingreso Copenhague
15 29 21,1
~ universidad y las calificaciones promedio obtenidas en el primer semestre. loCmil es la Dakar
53 13 6
relacion entre estas dos variables? Dub.lin 2
60 8
Helsinki 20
22 25
Hong Kong 10
41 18
Estambul 12
32 23
Jerusah~n 21.1
EXAM EN NOTAS 25 31
Karachi 0.6
DE INGRESO PROMEDIO 60 8
Leningrado 13
39 19
Lisboa 14 7
440 1.57 52
Londres 8
448 1.B3 40 19
Madrid 32 23
455 2.05 15
460 1.14 Manila 29 23
Monrovia 6 2
473 2.73 46 10
Montreal 2
485 1.65 60 10
489 2.02 Oslo 11 0
Otawa 45 6
500 2.98 49 15
Paris 23
512 1.79 12 32
Pnom Penh 6
518 2.63 50 12
528 2.08 Praga 23
17 32
550 2.15 Rangun 11
42 22
582 3.44 Roma 23
11 32.2
569 3.05 Saigon 12
31 21
585 3.19 Shangai
593 3.42
620 3.87
650 3.00
690 3.12 .. lnea de siete
' ., 19 20 del capitulo 5 presentamos datos de la presion sangui
14. En Ios ejercrcros y ' . . iento
sujetos durante las sesiones de control y de acondlcl.onaml .
) Hallar la r de Pearson para estas dos medidas.
13. Los siguientes datos indican la latitud de 35 ciudades en el hemisferio norte y las medias
alta y baja de sus temperaturas anuales. ,. 'I acientes recibieron medicamentos para
IS. En el estudio sobre la presl~n sa~~ume~, d~s P I 0 den por rangos de la cantidad de
a) loCUli! es la correlacion entre la latitud y la temperatura media alta? . . . A c nbnuaclOn se 1D rca e r di .
controlar la hlpertenslo n. 0 . d I I mayor) y la diferencia (aeon rcrona
b) loCuli! es la correlacion entre la latitud y la temperatura media baja? medicamentos recibidos por cada paciente ( e menor a
c) loCulil es la correlaeion entre las temperaturas alta y baja? miento-control) para cada persona.
140
ESTADfSTICA PARA LAS CIENCIAS SOCIALES CORRELACI6N 141
Paciente 2 3 4
16. La tabla anterior corresponde a los dividendos por accion de 37 empresas industriales y
5 6 7
la cantidad a) Hallar la correlacion entre el precio por accion y los dividendos obtenidos en 1967.
de medicamento b) Expresar los dividendos como porcentajes del coste por accion,
Diferencia -3.5 -33.8 -29.2 c) i,Hay alguna correlacion entre el porcentaje de dividendos y el precio por accion?
-16.5 -16.1 0.9 -17.3
17. Explicar la diferencia entre r = 0.76 y r = -0.76.
18. Supongase que se desea estudiar la relacion entre la eficacia en economia de trabajo de
Ordenar las diferencias segun sus rangos desde la menor (0.9) hasta la (_ 33 8) ciertas maquinas que posee un fabricante y el precio promedio de los cinturones de cuero que
calcular r s• mayor . y
con elias se produce. A causa de la dificultad para ordenar la calidad de las maquinas en una
escala de razones, se las ordena por rangos en una escala ordinal, de modo que el rango 15
0.09 6
Determinar la "s entre la calidad de las maquinas y el precio.
2.00 48
19. El propietario de una tienda registra el mimero de veces que los clientes solicitan 0
1.95 22
compran un articulo determinado. A esto Ie llama la demanda. Cada mes tiene a la venta 15
1.77 28
articulos. El propietario registra adem as el precio del articulo cada meso
0.07 20
a) Determinar la relacion entre la demanda y el precio, utilizando la r de Pearson.
3.61 46
1.67
b) Determinar la relacion entre la demanda y el precio, utilizando r s•
22
0.93 21
1.68 27
Enero 25 $0.50 Julio 13 $0.80
0.86 41
Febrero 10 .90 Agosto 19 .70
0.70 19
Marzo 12 .80 Septiembre 18 .72
2.87 41
Abril 18 .75 Octubre 16 .74
2.14 37
Mayo 11 .85 Noviembre 15 .75
0.84 28
Junia 20 .70 Diciembre 15 .75
2.37 29
0.33 15
20. Con referencia al ejercicio 13 (de este capitulo), determinar la correlacion entre la latitud y
0.36 14
1.57
la temperatura media alta para aquellas ciudades cuya latitud sea menor 0 igual a 25 grados.
40
3.04
Comparar esta correlacion con la que se obtuvo en el ejercicio 13(a). i,Por que son diferentes
30
0.68 44
21. Con referencia de nuevo al ejercicio 13, determinar la correlacion entre la latitud yla
0.73 11
temperatura media alta para aquellas ciudades cuya latitud sea mayor 0 igual a 45 grados.
0.69 34
Comparar esta correlacion con las obtenidas en los ejercicios 13(a) y 20. i,Por qui: son
0.16 35
diferentes? 8/>'>'<"7
0.88
1.22
17
16
1.60 40
/ 2 2
3.67 50
<:/' ~ 3 .3
0.35 18
'> \ ) 4 4
3.86 45
// J 5 5
c>:
1.59 34
6 6
1.05 12
7 7
8 8
* Ver la secci6n 5.2.2,en la que demostramos que la suma de las desviaciones respecto a la media es if,ual acero, y que
la suma de los cuadrados de las desviaciones respecto a la media aritmetica es menor que 1asuma de 10:. cuadrados de las
desviaciones respecto a cualquier otro valor real 0 potencial.
REGRESION Y PREDICCION 145
144 ESTADisTICA PARA LAS CIENCIAS SOCIALES
Recuadro 9.1
Una de las ventajas de los datos correlacionados es que los matematicos han desarrolla
do formas de predecir los valores de una variable cuando se conocen los valores de otra
variable correlacionada con ella. A este metodo se Ie conoce con el nombre de amilisis de 43.4 - •
fa reqresion.
EI siguiente fragrnento de Winning with Statistics muestra como pueden utilizarse
datos correlacionados para orientar la decision cuando se trata de cornprar un
40.2
automovil de ultimo modelo. • •
Como se ve, el analisis de la regresion puede ser importante en la vida diaria. De hecho, Aproximaci6n de la linea de regresion para predecir el rendi
aunque no nos hayamos percatado de ella, hemos suministrado durante nuestra vida miento en kilometres par litro a partir del peso del autom6vil
(regresi6n de Y sabre Xl. La linea se obtiene uniendo los
un valor numerico en mas de una ecuacion de regresion, si es que alguna vez hemos
puntos correspondientes al promedio de kilometres par litro
aspirado al ingreso en una universidad, pasado por una serie de pruebas para conseguir
para cada peso de autornovil.
un trabajo, 0 lIenado una solicitud para el seguro de vida.
REGRESIC>N Y PREDICCIC>N 147
146 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
Para simplificar nuestro estudio, comencemos con un ejemplo de dos variables que, Y = 12 . 700 = 8400.
estan relacionadas con el tiempo, a la que se presenta primero se la representa en el Y = 500 + 12X.
eje X. Observese que las parejas de valores estan representados sobre una linea recta
que se extiende diagonalmente de abajo hacia arriba y de izquierda a derecha. Remontandonos a nuestros dias de estudiantes de bachillerato, .t~1 vez po~adm~s
Tabla 9.1 Salarios mensuales e ingresos anuales de ocho traba identificar la formula anterior como un caso particular de la ecuacion genera e. a
SALARIO INGRESO jadores de una firma electronica (datos hipoteticos),
EMPLEADO MENSUAL ANUAl recta, es decir:
(9.1)
Y = a + byX,
A 400 4800
B 450 5400 X re resent an variables que cambian de un indivi?uo a otro, yay bv so~
C
D
500
575
6000
6900
~~~~:~e~ paraPun conjunto particular de datos. Mas especIlicamente, ~y rep~se~
E 600 7200 ta la pendiente de una recta que relaciona los valores de Y con los va ore~ e I .
F 625 7500 A esta relacion se la conoce como la·'regresi6n de Y sobr~ X. En nuestro eJ~;p~;
G 650 7800 la pendiente de la recta es 12,10 que significa que Y cambia end un;a~t~ de p
cada cambio en X. La letra a representa ~I va:or dte : cU~~d~ con~de~arse como
H 675 8100
Podemos observar, igualmente, que la formu a an enor ~d d X Cuando la
• Ver la secci6n 8.2.
t Suponemos que Ia correlacion es positiva, Si Ia correlacion fuera de -1.00, nuestra mejor predicci6n seria una
iun metodo para predecir Y a partir de valores co~o~~ os eerfe~ta
correlacion es 1.00 (como en el presente caso), la pred1ccIOn es P .
calificaci6n de 91, es decir, Zy = -z,.
REGRESION Y PREDICCION 149
148 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
En .la investigacion del comportamiento, sin embargo, las correlaciones obtenidas y Ns.~
C~Sl nunca son perfectas. En consecuencia, hemos de encontrar la recta que mejor se Ns"sy
ajuste a nuestros datos y .nues~ras predicciones se basaran en esa recta. Pero, l,que se =r--
Ns~
debe. e~~ender. por «mejor ajuste»? Recordemos que, al estudiar la media y la
desviacion estandar, definimos la media como aquel punto de una distribucion (9.3)
respecto al cualla suma de los cuadrados de las desviaciones tiene un valor minimo
(sum a de cuadrados minima). Cuando se aplica el metodo de los minimos cuadrados
a la co~r~lacion y ala regresion, la linea de mejor ajuste se define como aquella que La constante a esta dada por la formula
hace mmima la suma de los cuadrados de las desviaciones a uno y otro lado de ella. A a = Y - b.,X. (9.4)
esta recta se la llama recta de reqresion.
Al calcular r", resulta muy laborioso obtener cada uno de estos valores por
Este es el momento adecuado para hacer no tar que el termino «prediccion», tal
separado y sustituirlos en la ecuacion de la recta. Sin embargo, combinando
como se 10emplea en Estadistica, no implica necesariamente alguna deduccion hacia
algebraicamente las formulas (9.3) y (9.4) y relacionando el resultado con la formula
el futuro, sino que se refiere simplemente al hecho de que usamos la informacion
(9.1), obtenemos una formula mucho mas uti! para calcular Y':
acerca de una variable para obtener informacion respecto a otra. Asi, si conocemos la
nota promedio de un estudiante en la universidad, podemos utilizar esta informacion Y' = Y + I' Sy (X _ X).* (9.5)
para .«predeci~» su inteligencia (que con nuestro talante mas generoso suponemos s"
antenor a su mgreso a la universidad).
Si nos fijamos en el segundo terrnino del segundo miembro de la formula (9.5),
I~troduciremos aho~a dos simbolos nue,vos: X' e y', que se deben leer «x prima e
podemos ver que cuanto mayor sea r, mayor sera el termino en su totalidad. Este
Y prima», «X e Y predichas» 0 «X e Y estimadas». Usamos estos simbolos siempre
termino representa tambien la desviaci6n predicha respecto a la media muestral
que e~pleamos la recta de regresion 0 la ecuacion de regresion para estimar 0
resultante de la reqresion de Y sobre X. Asi, podemos deducir que cuanto mayor sea la
predecir el valor de una variable a partir del valor conocido de otra.
correlaci6n, mayor sera la desviacion predicha respecto a la media muestral. En el
Vol~iendo a la ecuacion de la recta, nos encontramos con el problema de
caso de una correlacion perfecta, la desviacion predicha es maxima. Por el contrario,
determl~ar b y a para un conjunto. particular de datos, y con ello poder obtener Y'.
cuando r = 0, la desviacion predicha es tarnbien igual a cero. Asi, cuando r = 0,
La formula para hallar la pendiente de la recta que relaciona Y con X conocida
tenemos que Y' = Y. Todo esto no es sino otra manera de expresar que, en ausencia
como recta de regresion de Y sobre X, es '
de una correlacion entre dos variables, nuestra mejor prediccion para cualquier valor
de una variable dada es la media de la distribucion de esta variable.
b _L(X-X)(Y-Y) (9.2) Hasta aqui hemos centrado nuestra atencion en la regresion de Y sobre X, 0 sea,
y - SCx . la prediccion de valores de Y (Y') a partir de valores conocidos de X. Hay tambien
otra formula de regresion para predecir valores de la variable X a partir de valores de
De la formula (9.2) podemos deducir otra formula util para determinar la la variable Y. La pendiente de la recta de regresion de X sobre Y puede expresarse
pendiente de la recta de Y sobre X. Puesto que [formula (8.2)] como
DX - X)(Y - Y) (9.6)
r=L(X-X)(Y- Y) b, = SC
y
)SC x ' SC y ,
par:ro~~a;~f~r~: ~:7aU~a~:~~ r;g::si6n para predecir valores de la variable X a Supongamos, por ejemplo, que el presidente de la junta de admisi6n de una
universidad, prepar6 un examen de ingreso que ha venido aplicando a todos los
X' = X + r ;x (Y - 17). (9.8) aspirantes durante un periodo de varios afios. Durante ese tiempo acumul6 mucha
y
Las f6rmulas siguientes resultan a d ' , informaci6n referente ala relaci6n que existe entre las calificaciones de ingreso y las
:: ~:~:~a~el~ul~ ~~d~~~~:~:~tidadesq~:~uel~a%~~r~~:~~:~:~~~~~:s:r:~~:;~:; calificaciones sucesivas en la universidad y juzga que es posible utilizar ahora las ca
lificaciones de ingreso (variable X) para predecir las calificaciones en la universidad
(variable Y), y mas adelante usar esta informaci6n para establecer nuevas normas de
Y' = 17 + NIXY - CIX)(IY) ingreso para futuros aspirantes.
NIX2 _ Q=X)2 (X - X). (9.9) Ya que se ha insistido repetidamente en la relaci6n que existe entre la r de
Analogamente, la f6rmula para predecir X es Pearson y los valores z, debe resultar evidente que las f6rmulas de predicci6n se
pueden expresaren terrninos de valores z. Puede demostrarse* matematicamente que
(9.10) (9.11)
donde Zy' = Y', expresado en terrninos de un valor z.
9.2.3 Problemas ilustrativos acerca de la regresion Volviendo al problema 1, la calificaci6n de 62 que obtuvo el estudiante en el
examen parcial puede expresarse como z = - 2.00. Asi, Zy' = 0.60( - 2.00) = -1.20.
Resolvamos dos problemas usando los datos de la secci6n 9.1. Para asegurarse de que las f6rmulas de predicci6n (9.5) y (9.11) son comparables,
Problema 1.. Como, se recordara, un estudiante obtuvo una calificaci6n de 62 en el debe transformarse la calificaci6n Zy' en la calificaci6n original Y'.
ext~~n ~arcIaI: l,<;ual es nuestra predicci6n acerca de su nota en el examen final? Los
es a igra os mas Import-antes se reproducen a continuaci6n. .
9.2.4 Construccion de las rectas de regresion
PARCIAL FINAL
(VARIABLE Xl (VARIABLE Y)
X = 70 y= 75
pasara por todos los puntos que representan las parejas de calificaciones. De hecho,
s,= 4
s, = 8
pasara entre estos puntos de forma tal que se minimice la suma de los cuadrados de
r = 0.60 las desviaciones entre la recta de regresi6n (calificaciones predichas) y las calificacio
nes obtenidas. Indicamos antes que la media es el punto en la distribuci6n que hace
VARIACION EXPLICADA
VARIAGION TOTAL
DESVIAGIONES DE Y' RESPECTO
puntos correspondientes en el diagrama de dispersion. Esto es precisamente 10 que DESVIACIONES DE LOS
Ii All
hicimos en la figura 9.2 para construir las dos rectas de regresi6n a partir de los datos VALORES DE Y RESPEGTO A
de la tabla 8.2.
22
22
Y
RECTA DE PREDIGCION DE x
I - - - t - A PARTIR DE VALORES 19
22 GONOCIDOS DE Y 19
16
19 RECTA DE PREOIGCION DE Y 16
AP~-----+--A PARTIR DE VALORES
16 GONOCIDOS DE X
13 -I------1'~-7IIP1<.--f------- 10
10
10
4
3
3
3 5 7 9 11 13 X :EIY'-y)=o
:ElY - y) = 0
Fig. 9.2 Diagrama de dispersion que representa parejas de calificaciones en dos variables IIY' - 1')2= 169.44
L(Y- Y12= 252
(b)
y las rectas de regresion para predecir X a partir de Ye Y a partir de X. Notese que la recta (al
para predecir Y a partir de X minimiza las desviaciones verticales de los puntos
VARIACION NO EXPLIGADA
correspondientes a los datos [representadas en negro). Por eI contrario, la recta para
predecir X a partir de Yminimiza las desviaciones horizontales (representadas tenuemente). '1 DESVIACIONES DE LOS
VALORES OBTENIDOS
RESPECTO A LOS VALORES
Observese que ambas rectas de regresion se cortan exactamente en el punta que PREDICHOS
representa a las medias de X y de Y. AI juzgar la relacion entre las rectas de regresion
y la magnitud de r, es util imaginar que las rectas de regresion giran en el plano 22
alrededor del punto cornun que representa las medias de X e Y. Cuando r = 1.00,
ambas rectas de regresion tienen pendientes identicas y se superpondran, puesto que 19
pasan por todos los puntos que representan las parejas de observaciones. Sin embargo,
al hacerse r mas pequefia, las rectas de regresion giran alejandose una de la otra de 16
manera que en el caso limite, cuando r = 0, son perpendiculares. Entonces, la recta
de regresion para predecir X a partir de valores conocidos de Y es ft, y la Y
131-----+---,f-'--+--------j
I'
recta de regresion para predecir Ya partir de valores conocidos de X es Y.
10
9.3 Varianza residual y error estandar Fig.9.3 Diagrama de dispersion de parejas de valores en
des variables, recta de regresion para predeclr valores de Y ~
de la estimacion partir de valores conocidos de X, y media de los valores de }
(f); r = 0.82 (obtenida can los datos de la tabla 8.3). (a)
Desviaciones (Y - Y) de las calilicaciones respecto a la 3
La figura 9.3 muestra una serie de diagramas de dispersion, reproducidos cada uno media de Y, variacion total. (b) Desvia~_iones (Y' - Y) .de .l~s IIY-Y')=O
de la figura 9.2, en los que aparece solamente una recta de regresion: la que sirve para calilicaciones predichas respecto a la media de Y,. van~clOn 1:IY - y')2 = 81.96
predecir Y a partir de valores conocidos de X. Aunque nuestro estudio se referira explicada. (e) Desviaciones (Y - V') de las cahli~aclOnes
Ie)
solamente por ahora a esta recta de regresion, todas las conclusiones que obtenga especto a la recta de regresion, variacion no exphcada.
REG RESION Y PREDICCION 155
154 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
representan las calificaciones caen sobre la recta de regresion. Sin embargo, si la (9.16)
correlacion hubiese sido de 1.00, todos los puntos tendrian que haber estado sobre
Sesty = Sy ~,*
ella. Las desviaciones (Y - Y') de la figura 9.3 representan los errores de la
prediccion, (9.17)
Se observara la analogia que existe ~ntre Y - Y' (desviaci6n de las calificaciones
respecto a la recta de regresion) e Y - Y (desviacion de las calificaciones respecto a - 0 I que significa que no existen
Notese que cuando r = ± 1.00 ,Sesly - , 0 I
la media). La suma algebraica de estas desviaciones respecto a la recta de regresion es desviaeiones respecto a la recta de regresion y, por tant~, hay er~o.res en a
??
igual a cero. Anteriormente se vio que la suma algebraica de las desviaciones respecto predicci6n. Por otra parte, euando r = 0, los errores de pred1cclOn son maX1mOS para
a la media es tambien igual a cero. Entonces, la recta de regresion es, en cierto modo,
una especie de «media flotante» que toma diferentes valores dependientes de los. la distribuci6n dada, 0 sea, que Sest)' = sY' ., di f .
Con los datos del ejercicio 1, capitulo 8, se calcularon los siguientes esta igra os:
valores de X que se emplean en la prediccion,
Se recordara tarnbien que al calcular la varianza, S2, elevamos al cuadrado las
EXAMEN DE COMPRENSION
desviaciones respecto a la media, sumamos estos valores, y dividimos el resultado por EXAMEN DE INGRESO
A LA UNIVERSIDAD VERBAL
N. Por ultimo, la raiz cuadrada de la varianza nos proporciono la desviacion (VARIABLE Y)
(VARIABLE X)
estandar. Si elevasemos ahora al cuadrado y sumasemos las desviaciones de las
calificaciones respecto a la recta de regresion, ~)Y - Y'f, tendrfamos una base para x= 47.65 y = 39.15
Sy = 12.35
calcular otra varianza y otra desviacion estandar. A la varianza con respecto a la s; = 13.82
recta de regresion se la conoce como varianza residual, y se la define de la manera r = 0.85
siguiente:
'DY - y')2
(9.12)
N
Cuando las predicciones se hacen de Y a X, la varianza residual de X es 2
S
est y
= 12.35J1 - 0.85
= 12.35(0.5268) = 6.51.
(9.13)
Como se dij 0 anteriormente, el error estandar de la estimacion tiene propie~addes
La desviacion estandar respecto a la recta de regresion (Hamada error estandar de . ., , d C t ' pequefio sea el error estan ar
la estimaci6n) es, por supuesto, la rafz cuadrada de la varianza residual. Asi,
analogas a las de la desv1aclOn estan ar. uan 0 mas I t de
de la estimaci6n, tanto menor sera la dispersion de los puntos respecto a a rec a
- J2J
Sesty - ~
Y-
N
yy (9.14) re gr
pesi6n.
(918)*
.
Si se observa de nuevo la figura 9.3, puede verse que hay tres sumas de cuadrados
distintas que pueden calcularse a partir de los datos. Estas son:
Asi, si p~decimos
un valor dQ
39.15 para
Y = 39.15, X = 47.65, sex = 190.99--y'N = 20:
X 4765. , y
= x.
Sl Sesty -
_
6.51,
1. Variacion de los valores con respecto a la media de la muestra [fig. 9.3(a)]. Esta
variacion esta dada por (Y - y)2 yes, por supuesto, basica para la determinacion de
la varianza y de la desviacion estandar de la muestra.
2. Variacion de los valores con respecto a la recta de regresion (0 valores predichos)
Intervalo que incluye a YT = 39.15 ± 6.51)1 + ~ + ~47.65 - 47.6W· [fig. 9.3(c)]. Esta variacion esta dada por (Y - y')2 Y se Ie llama la variaci6n no
20 190.99 explicada. Es la diferencia entre el valor predicho y el valor obtenido. Hay que aclarar
= 39.15 ± 6.67 el porque de esta terminologia. Si la correlacion entre dos variables es de ± 1.00,
En otras palabras, cuando X = X = 47.65 alrededor del 68 por ciento de las todos los valores caen en la recta de regresion, En consecuencia, hemos explicado
veces ~I. verdadero valor de Y estara comprendido entre 32.48 y 4582 toda la variacion de Yen terminos de la variacion en X; y, reciprocamente, toda la
UtJhz~ndo datos como estos, podemos trazar dos curvas, una por encima otra variacion de X en terrninos de la variacion en Y. En otras palabras, cuando existe una
p.or debajo de la recta de regresion de Y sobre X (fig 94) En el cas d ~ bl relacion perfecta, no existe variacion no explicada. Sin embargo, cuando la correla
I distri . . . 0 e vana es
norma mente istribuidas, el 68 % de las veces, aproximadamente los valores cion es menos que perfecta, muchos de los puntos no caen exactamente, tal como
verdaderos ?e Y se encontraran entre estas cur vas, cuando usemos la f6rmula (918) hemos visto, en la recta de regresion. Las desviaciones de estos valores respecto a
para predecir Y a partir de diversos valores de X. Notese que las curvas estan mas la recta de regresion representan variaciones que no pueden explicarse mediante la
separadas en las zonas co~respondientes a los valores extremos de X. La distancia correlacion entre ambas variables. De ahi el uso del terrnino «variacion no expli
ml~lma entre las curv~s tiene lugar en el punto correspondiente a la media de X. cada»,
(Notese que estas relaciones se refieren a las distribuciones de ambas variables X e Y.) 3. Variacion de los valores estimados respecto a la media de la distribucion. Esta
variacion esta dada por (Y' - y)2 Y se la conoce con el nombre de oariacion
explicada. Es la diferencia entre la media y el valor estimado. EI empleo de esta
60 terminologia se debe a razones que deben resultar c1aras a partir de nuestra discusion
del parrafo previo y de nuestra anterior referencia a la desviacion predicha (seccion
50 9.3). EI lector recordara nuestra observacion previa de que cuanto mayor sea la
correlacion, tanto mayor sera la desviacion predicha respecto a la media muestral. Se
40
deduce ademas que cuanto mayor sea la desviacion predicha tanto mayor sera la
Y variacion explicada. Cuando la desviacion predicha es maxima, la correlacion es
30
perfecta, y el 100 % de la variacion queda explicada.
Puede demostrarse matematicarnente que la suma total de cuadrados consta de
dos componentes que pueden sumarse. Estas dos componentes representan la varia
20
cion explicada y la variacion no explicada, respectivamente. Asi,
10
I (Y - y)2 = I (Y - y')2 + I (Y' - Y)2. (9.19)
Variacion Variacion Variacion
total no explicada explicada
x
Estos calculos estan indicados en la figura 9.3. EI lector observara que la suma de
Flg, 9.4 Recta de regresion acompaiiada por dos curvas que delimitan los la variacion explicada (169.44) y la variacion no explicada (81.96) es igual a la
mtervalos de confianza que incluyen a YT , para diversos valores de X. variacion total. La ligera discrepancia que se observa en este ejemplo se debe al
redondeo de r a 0.82, previo al calculo de los valores estimados.
* Notese que si deseamos obtener intervalos de confianza d 95 '/ 0
d 99 '/ . .
(9.18) por 1.96 0 2.58, respectivamente. e e I" podemos mulhphcar s,,, y en la formula
10
* Aunque e1 analisis de la varianza no se estudia hasta el capitulo 15, una gran parte del material de esta seccion
servira como introduccion a alguno de los conceptos basicos de dicho tema.
158 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
REGRESI6N Y PREDICCION 159
~hora bien, cuando r = 0.00, entonces ~)Y' - y')2 = 0.00 (~Por que? Ver la EI lector habra, sin duda, observado que la raiz cuadrada del coeficiente de
se~cl6n 9.2). En consecuencia, la variaci6n total es igual a la variaci6n no explicada. determinacion proporciona otra definicion de r. Asi,
D1Cho ?e otro modo, cuando r = 0, toda la variaci6n es no explicada. Por el
contrano, .cuando r = 1.00, entonces I(y - y')2 = 0.00, puesto que todos los Variacion explicada
puntos. estan en la recta de regresi6n. En estas circunstancias, la variaci6n total r = ± ----,---...,...,---=---.,--- = + (9.21)
Variacion total
es la nusma que la variaci6n explicada. En otras palabras, cuando r = 1.00 toda la
variaci6n es explicada.
Anteriormente se vio que para los datos resumidos en la figura 9.3, el coeficiente
La raz6n de la variacion explicada a la variacion total recibe el nombre de
de determinacion r 2 es igual a 0.67. La raiz cuadrada de este numero (0 sea, jOjii) es
coeficiente de determinacion y se representa por r 2 • La formula del coeficiente de
determinacion es igual a 0.82, que es el valor de r correspondiente a estos datos.
Puesto que r 2 representa la proporci6n de la variaci6n explicada, (1 - r 2 )
r 2 = Variacion explicada _ I(Y' _ y)2 * representara la proporci6n de la variacion que no es explicada en funci6n de la
Variacion total - L<Y _ y)2 . (9.20) correlacion entre X e Y. A este numero se Ie conoce como coeficiente de no
determinacion y se representa por k 2 • Asi, k 2 indica la proporcion de la variacion de Y
En la figura 9.3 se ve que la proporcion de variacion explicada respecto ala variacion que debe ser explicada por otras variables distintas de X.
total es
La relacion entre k 2 y r 2 es
2 169.44
r = 252 = 0.67.
(9.22)
Puede verse que el coeficiente de determinacion indica la proporcion de la variacion
total que esta explicada, en funcion del valor del coeficiente de correlacion, Cuando
r = 0, el coeficiente de determinacion r 2 es igual a O. Para r = 0.5, el coeficiente de
k2 + ,,2 = 1. (9.23)
d~terminacio~ es 0.25. En otras palabras, el 25 % de la variacion total es explicada. Para los datos de la figura 9.3, se puede obtener directamente k 2 :
Finalrnente, Sl r = 1.00, entonces r 2 = 1.00, 10 que indica que toda la variacion es
explicada,
Variacion no explicada 81.96
La figura 9.5 describe graficarnente la proporcion de la variacion de una variable k2 = = -- = 0.33
Variaci6n total 252 '
que es explicada por la variacion de otra variable, cuando r toma diferentes valores.
W
z 0.80
U
sc: 0.60 Correlacion y causalidad
«
>:
w
0 0.40
z Hernos visto que cuando dos variables estan relacionadas, es posible predecir una de
0 ellas basandose en el conocimiento de la otra. Esta relacion entre correlacion y
U 0.20
c:
predicci6n conduce, a menudo, a un grave error de razonamiento; esto es, la relacion
0
0
0
entre dos variables conlleva frecuentemente la implicacion de que una es causa de la
c: 0
0 otra. Esto es especialmente cierto cuando existe una relacion temporal entre las
variables en cuestion, 0 sea, cuando una precede a la otra en el tiempo. Lo que
-0.80 -0.60 -0.40 -0.20 0 0.20 0.40 0.60 0.80 1.00
frecuenternente se pasa por alto es el hecho de que las variables pueden no estar
MAGNITUD DE r
unidas causalmente de una cierta manera, pero pueden variar juntas en virtud de un
Fig: 9:5 Proporcion de Ia variacion explicada en una variable, en funci6n de las vinculo cormin con una tercera variable. Por ejemplo, si el lector es aficionado a
vartaciones de otra variable correlacionada para diferentes valores de r.
observar los pajaros, notara que a medida que el numero de pajaros aument.a.en la
. * La ta bl: H del ~pend~muest.r~ varias funciones de r p~ra. diferentes valores de r, entre elias algunas muy utiles primavera, la hierba se torna progresivamente mas verde. Sin embargo, adrnitiendo
tales como r , 1 - r y Jl - r . Es uti] que el lector se farniliarice can el usa de esta tabla. .. que el mayor numero de horas de sol y el mayor calor constituyen el tercer factor que
160 ESTADiSTICA PARA LAS CIENCIAS SOCIALES
REGRESI6N Y PREDICCI6N 161
que la hierba se vuelva verde 0 Vl'ce D que os pajaros sean la causa directa de
EI libro de Huff* incluye un excelente capitulo dedicado a la confusion de la
. , versa. esafortunada t h
particular en las ciencias del Comport a . t I men e ay muchos casos, en correlacion con la causalidad. Considera a las falsas inferencias causales, provenien
tercer factor. mien 0, en os que no es tan facil identificar el tes de datos de correlacion, como falacias «post hoc» t. EI siguiente fragmento ilustra
Supongamos que ellector ha demostrado' ., . un ejemplo com tin de falacia post hoc.
entre el mimero de horas que los estudi t que extste una correlacion positiva alta
calificaciones obtenidas en el mi ~n ~ empl~an ~re~arando un examen y las Se han recogido multitud de paginas llenas de cifras para sefialar el costo de la
mimero de horas de estudio es cau:~~' I ue ~ s~~t1fSe mchnado a concluir que el educacion universitaria, y se han publicado cantidades enormes de folletos para
ser una conclusion perfectamente razo e ~lvanaclOn, en las calificaciones. Esta parece hacer llegar estas cifras -y las conclusiones mas 0 menos basadas en ellas- a
10 que siempre Ie dijeron sus padres yna ; y estarEa pro?ablemente de acuerdo con los posibles estudiantes. No estoy en contra del proposito, Estoy a favor de la
. . .
Ias lmphcaClones . prOlesores. xammem s is d id educacion, particularmente si incluye un curso de estadistica elemental. Ahora
de esta relacion cau I E l o m a s etem amente
horas empleadas en el estudio fue s~. n e s~puesto de que un mayor mimero de bien, estas cifras demuestran con bastante claridad que las personas que fueron a
cabria esperar que cualquier estudi:
e
t caus; d~ un aument.o en las calificaciones,
garantizada una nota alta ya uel n e que e lque. mayor tiempo al estudio tenga
la universidad ganan mas dinero que las que no 10 hicieron. Las excepciones son
numerosas, por supuesto; pero la tendencia es fuerte y clara.
calificacion inferior Este ~o e~ que ~ase menor tiempo Con sus Iibros reciba una Lo unico malo es que estas cifras y hechos conllevan una conclusion totalmente
hecho de que pUdi~ra ser el mer:;e:s~:~:~~:e eel c~so. Hemos pasado. por alto el injustificada. Estamos ante una falacia post hoc muy clara. Segun ella, estas cifras
motivacion mas poderosa, mejores habitos d ( n vl~tud de su .mayor .mteligencia, muestran que si ellector (su hijo 0 su hija) asiste ala universidad, al final ganara
tiempo al estudio y alcanzase un result d e ~stud~o, etc.) quien dedicase mayor . mas dinero del que obtendria si decidiese emplear esos cuatro alios de su vida de
pacidad. a 0 rnejor, slmplemente por su mayor ca cualquier otra forma. Esta conclusion injustificada tiene como base la hipotesis,
tambien injustificada, de que si las personas que recibieron una formacion
universitaria ganan mas dinero, 10 ganan porque fueron a la universidad. En
<l: realidad, no se sabe si esa misma gente hubiera ganado mas dinero aun sin haber
a:l
•• • ••
a:
w asistido a la universidad. Hay dos factores que indican de forma contundente
:I:
•••• que esto es asi. Las universidades tienen una gran cantidad de muchachos que
w
o
• •• • • pertenecen ados grupos: los de mentalidad brillante y los ricos. Los brillantes
a: • • •• seguramente ganarian buen dinero, aun sin los conocimientos universitarios. Yen
o
o
a:
••• 10 que se refiere a los ricos... el dinero llama al dinero de muchas maneras
w
> • • evidentes. Son pocos los hijos de ricos que pueden ser clasificados en los estratos
• de bajos ingresos, hayan 0 no asistido a la universidad.
NUMERO DE PAJAROS OBSERVADOS
CORRELACrON NO ES CAUSALIDAD
Resumen del capitulo
~~T~~\~U~~~AV~~~:'\N~~:~ODE PAJAROS ES PEQUENO. LA HIER
~~1:~;f~{,~~:~~~~~~:~~H!~~~,~~~:~~R~rfo;~~~
Revisemos brevemente 10 aprendido en este capitulo. Se ha visto que es posible
«ajustar» dos rectas a una distribucion bivariada de valores : una para predecir los
valores de Y a partir de valores conocidos de X, y otra para predecir valores de X a
partir de valores conocidos de Y.
Lo que tratamos de decir es que los e t di . ,
Vimos que, cuando la correlacion es perfecta, todos los puntos caen en la recta de
establecer inferencias de causalidad L' slU .1,OS de correlaclOn no autorizan a
-regresion, Por tanto, no existe en este caso error en la prediccion, Cuanto menor sea
. . a corre aClOn es una condi " .
no suricienre para establecer una I " d '- icion necesana pero el grado de la relacion, mayor sera la dispersion de los valores alrededor de la recta
resumen, para establecer una r I~e .~clOnd e causalidad entre dos variables. En de regresion, y seran mayores los errores de prediccion. Finalmente, cuando r = 0, la
. e aClOn e causalid d '.
expenmento en el cual una variable' d di a es necesano realizar un media de la muestra constituye nuestra «mejori prediccion para una variable dada.
dor, y los efectos de estas manipulaci~~e:pen ~e~te sea manip~lada por el investiga Se indico que la recta de regresion es analoga a la media: la suma de las
criterio, Un estudio de c I' se re ejen en otra vanable dependiente 0 de desviaciones respecto a ella es igual acero, y la suma de los cuadrados de
independiente. orre aciones carece del requisito de la manipulacion -
t Tipo de falacia basada en la secuencia temporal de causa y efecto, (N. del T.)
las desviaciones es minima. Tambien se indic . . a) Una estudiante obtuvo una calificacion de 130 en la variable X. Predecir su
es analogo a la desviacion estanda 0 que el error estandar de la estimacion
. r. calificaci6n en la variable Y.
Vimos que hay tres sumas separadas de cuad d . " . b) Para otro estudiante se predijo una calilicacion de 1.28 en la variable Y. i,Cwil fue su
que pueden calcularse a partir de datos correlacionados: reflejan la variabilidad, y calificaci6n en la variable X?
Ejercicios 7. Un jefe de personal hizo un estudio de los empleados que intervienen en un aspecto del
proceso de manufactura. Encontr6 que despues de haber permanecido estos empleados en eI
trabajo durante un aiio, le era posible obtener una medida de la habilidad de dichas personas,
1. Hallar la ecuacion de la recta de regresion para los siguientes datos. que realmente reflejaba su eliciencia. De este modo ideo una prueba de selecci6n para predecir
su eventual eficiencia, y obtuvo una corr~laci6n de 0.65 con la medida de la eficiencia (Y). La
X media de la prueba fue de 50, Sx = 6, Y= 100, Sy = 10. Contestar las siguientes preguntas
I1 12 13j4 15
~ 3 I 4 2 I 1
basandose en estos hechos. (Sup6ngase que la prueba de selecci6n y la de eficiencia se
distribuyen normalmente):
2.' En un estudio referente a la relacion a) Un empleado obtuvo una calificacion de 40 en la prueba de seleccion. i,Cmil es su
siguientes datos: entre dos variables X e Y, se obtuvieron los
calificacion predicha de eficiencia?
x = 119 Y = 1.30 b) i,Que probabilidad hay de que obtenga una caliiicaci6n de 110 en la escala de
s, = 10 Sy = 0.55 eficiencia?
c) Una cauflcacion de 80 en la variable Y se considera satisfactoria para el trabajo, Y
r = 0.70 una menor es insatisfactoria. Si se usara la prueba X como recur so de selecci6n, i,que
N = 100 calificacion habria que tomar como punto de rechazo? [Sugerencia: Hallar el valor
164 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
REGRESION Y PREDICCION 165
14. Demostrar algebraicamente que a) "Que grado de felicidad se le podria predecir a una pareja que manifiesta haber
tenido 10 discusiones durante los 35 dias?
by = NL:XY - (L:X)(lY) b) "Que grado de felicidad se le podria predecir a una pareja que manifiesta haber
NL:X 2 - (L:X)2 tenido una relacion sexual diaria durante los 35 dias?
15. Demostrar algebraicamente que c) "Culil es la frecuencia mas 'probable de relaciones sexuales para una pareja que
manifiesta que son muy infelices (valor en la escala = 1.0)?
d) "Cual es el error estandar de la estimacion para la felicidad conyugal cuando se
utiliza como vaticinio la frecuencia de relaciones sexuales? "Cual es el error estandar
de la estimacion cuando el vaticinio es la frecuencia de las discusiones?
16. X3456789 e) "Que proporcion de la variabilidad en las calificaciones de la felicidad conyugal
10 11
Y 4 3 5 6 8 7 9
queda explicada por la frecuencia de las relaciones sexuales? "Que proporcion queda
9 11 explicada por la frecuencia de las discusiones?
f) "Cual es el coeficiente de no determinacion cuando la felicidad conyugal se predice a
a) Deter~inar la cor~elacion entre l~s anteriores datos.
partir de la frecuencia de relaciones sexuales? "CuM es el coeficiente de no determina
b) vCaolOnrOCdIdayl~ antenodr correlacion, y despues de calcular la media de
cion cuando la felicidad conyugal se predice a partir de la frecuencia de las
e para ca a X. Y, predecir el
c) Calcular Ley _ Y)2.
discusiones?
d) Calcular la varianza no explicada.
a) Para una fiesta de 60 perso~s a u~~ lesta y las piezas de pan consumidas. .
as, es imar el nurnero de piezas de pan necesarias.
[169J
Estadistica descriptiva
En los nueve capitulos precedentes se ha visto que hay muchos modos distintos de
describir los datos. La aplicaci6n de las diversas tecnicas descriptivas a los dos
conjuntos de datos presentados a continuaci6n dara al lector una oportunidad de
observar c6mo pueden integrarse estas tecnicas para la descripci6n de datos.
NUM~RO
CLASIFICACION DE JUEGOS
FINAL HOME RUNS SIN CARRERA
Minnesota 150 3
Chicago 125 9
Baltimore 125 12
Detroit 162 11
Cleveland 156 15
New York 149 16
California 92 16
Washington 136 14
Boston 165 11
Kansas City 110 10
A. Dibujar una grafica para ilustrar la relacion entre la clasificacion final y el numero de
home runs bateados en la Liga Americana.
B. Calcular:
1) La media de las veces en que los equipos de la Liga Americana no hicieron carreras.
2) El numero median a de home runs bateados en la Liga Americana.
3) La desoiacion estdndar de la distribucion de los juegos sin carrera.
c. Deterrninar la relacion entre:
1) EI mimero de home runs y la clasificacion final.
2) EI numero de home runs y el mimero de juegos sin carrera.
170 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
1946
1947
1948
s 9.39
11.09
13.09
9.1
8.0
8.7
1955
1956
1957
$23.12
24.15
26.02
7.8
7.7
7.6
Estadistica inferencial
A. Dibujar una grafica que ilustre los cam bios en el costo diario promedio por paciente en el
hospital, desde 1946 hasta 1963.
B. Dibujar una distribucion de frecuencias de la estancia promedio en el hospital, usando los
datos de la tabla adjunta. Describir la distribucion.
C. Para el periodo de 18 an os desde 1946 a 1963, calcular la media y la desviacion estandar
de la estancia promedio en el hospital.
D. Determinar la relacion entre el costa promedio por paciente y por dia y la estancia
promedio en el hospital.
* Los datos para este problema fueron tornados del Reader's Digest Almanac, pag, 489. Nueva York. Con permiso de
Reader's Digest Association, 1966.
[173J
10 Probabilidad
Recuadro 10.1
variaran de un estudio a otro y, por tanto, produciran conjuntos de diferencias no
coherentes?
La teoria de la probabilidad es la base de I disti '. Una funcion primordial de la inferencia estadistica es la de proporcionar
interpretacion de los datos apenas podria ir :::~I~s~I~~ m~ere~claI. ~m ella, n~estra procedimientos rigurosos y logicamente seguros para contestar a estas preguntas.
en cuenta su importancia sorprende c b a simp e conjetura, Temendo
Como se vera en los capitulos siguientes, la teoria de la probabilidad proporciona una
de la .probabilidad han invadido la ~~~;~ d~ que algunos conceptos erroneos acerca
base logica para escoger entre todas las alternativas de interpretacion de los datos
«falacia del jugador» descrita en este fragmentomdueChwas. pe.rsona.s Uno. d~ ellos es la
tnninq wit h· Statistics. provenientes de una inve, tigacion.
La teoria de la probabilidad no es tan desconocida como pudiera pensarse.
Ciertamente, en la vida diaria nos vemos constantemente obligados a emitir juicios
probabilisticos, aunque no nos demoscuenta de que 10 son. Por 'ejemplo, suponga
mos que, por diversas razones, un alumno no tiene preparada la clase de hoy. Ha de
considerar por ello la posibilidad de faltar a clase. ~Que factores influiran en su
decision? Evidentemente, una consideracion sera la posibilidad de que el profesor
descubra su falta de preparacion, Si el riesgo es alto, el alumno decide faltar a clase; si
Ahara S1 que me toea ganar
el riesgo es pequefio, decide ir.
(la falacia del jugador)
Veamos este ejemplo en terminos un poco diferentes. Hay dos alternativas
posibles:
!Dec~Sionles peligros.as! Adquieren muchas formas e invaden muchos ca U Suceso A: Su falta de preparacion sera descubierta.
Juga or anza al aire una moneda . d mpos. n
razonamiento de que perder cinco veces ~~er.~ cuatro veces seguidas. Haciendo el Suceso B: Su falta de preparacion no sera descubierta.
ofertas en contra = 3125'1) decid gur asI es extremadamente raro (p = 0.031,
. ., e aumentar a apuesta Ah . Existe incertidumbre en este caso porque hay mas de una alternativa posible. Su
:aan~~)~~:~~:~aC~~adamente. !'!uestro jugador favorito d~ ~eis:~~ v: p~~~ie:o t~~~
1
decision acerca de asistir 0 no asistir a clase depende del grado de seguridad que el
debe acertar», Un iua:~ar por quinta vez, estamo~ lIenos de confianza: «Ahora si que alumno asocie con cada una de estas alternativas. Asi, si esta bastante seguro de que
libres. Usted se m~e~ra °e:pdeer:na~~~~:st~ dell e~U1~o con.trario ha acertado seis tiros prevalezca la primera alternativa, decidira no ir a clase.
. « n e srguiente tiro debe fallar», Supongase que el profesor pide frecuentemente a los estudiantes que participen
Aunque estos ejernplos no son identicos, tienen una ' . . activamente en la clase. De hecho, el alumno ha observado que la mayo ria de. los
los sucesos tienen memoria Es co . I' d cosa en comun: la creencia de que
mo
recordar que salio cara cuat~o vece Sl ~ Juga or r~zonara: .«La moneda tendra que estudiantes son interrogados en cada clase. Este es un ejemplo en el cual hay un alto
saliendo cruz el proximo lanzami:~;gUldEastY tratara de segurr la ley de los promedios grado de certeza asociada con la primera alternativa. Dicho de otro modo, la
0». s 0 carece por completo d tid S' I probabilidad del suceso A es mayor que la probabilidad del suceso B. Por consi
moneda es «honesta», habra la misma posibilidad d I e sen I o. I a
en el proximo lanzamiento, 0 en cual uier otr e que sa ga cara? ~e que salga cruz
guiente, el alumno decide no ir a clase.
independencia, el resultado de un ex e . q t ~ A esta caractenstIca la llarnamos
Aunque no utilize ninguna de las leyes formales de la probabilidad, torno en este
cual es otra forma de negar que ~o~:en °dn~ ecta a los posteriores resultados; 10
ejemplo una decision basada en un empleo intuitivo de la probabilidad.
memoria. as, a os, cartas 0 ruedas de ruleta tengan
Es posible que ellector se haya dado cuenta de que muchas de las preguntas de
los ejercicios comienzan con: «~Cual es la probabilidad de que...'I». Estas preguntas
~I.g~~~~~eent~noc:~:e ~u~;;ob~~r~ta 1e actividades relacionadas con el comportamien sirven de preparacion para el estudio formal de la probabilidad que haremos en los
~~:P~::~~~~~~:e~~~:~;:r:sa~~c~~~;~~::~i:~~;;:~~~:,:~~t~;:d~;t~:a~o~:li~~ds~~ dos proxirnos capitulos. Sin embargo, antes de estudiar los elementos de la teoria de
la probabilidad, es conveniente comprender uno de los conceptos mas importantes
consecutivas al marco contrario simp~ POt e futbol fodnan haber llegado siete veces de la estadistica inferencial: el concepto de aleatoriedad.
Sin embargo, es incorrecto citar la «ley d~~~se;~rqu;. a defensa contrar~a es muy debiI.
algo diferente en la proxima oportunidad La Ie ~e llOs» como ~na raz~n para esperar
que la respaJde, ni hay una Corte Su re~a u/sue os.promedlOs.no .tIene. una fuerza
«decisiones». Ciertamente I ,.
imparcialidad.
P q. pervise la constItuclOnahdad de sus
' a urnca cosa que tiene en comun con la jurisprudencia es su
10.2 Concepto de aleatoriedad
Se recordara que al discutir el papel de la estadistica inferencial sefialamos el hecho
Tornado de Winning with Statistics, R. P. Runyon: Addison-Wesley Publishing Co., Reading, Mass., 1977. de que los parametros poblacionales son raramente conocidos 0 conocibies, Por esta
razon nos vemos obligados general mente a extraer muestras de una poblacion dada
176 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
PROBABILIDAD 177
I No.tese. ~ue cuando expresamos la probabilidad como oportunidades en contra de Dividiendo cad a frecuencia por N x' se obtiene una distribucion de probabilida
a realizacion de un suceso, usamos la siguiente formula:
des de las medias de las muestras de tamafio N = 2. Notese que ahora estamos en
Oportunidades en, contra del suceso A = (numero total de resultados _ condiciones de responder a preguntas tales como: en una extraccion simple de una
- numero de resultados que favorecen al suceso A) media cuando N = 2, ~cmil es la probabilidad de obtener una media igual acero,
a numero de resultados que favorecen al suceso A. (10.2)
igual a 2, 0 igual a 5.5? Las respuestas son, respectivamente, 0.0204, 0.1020 y 0.0408.
En la estadistica inferencial interesa a menudo determinar la probabilidad de uno
~;\ S;~(A) = 0.01, las oportunidades en contra de la realizacion del suceso A son de entre varios sucesos diferentes. Por ejemplo, podemos tratar de responder a pregun
tas tales como: ~cmil es la probabilidad de obtener una media cornprendida entre 4.5
y 5.0, 0 bien una media que sea igual 0 mayor que 5.0? Cabe sospechar que la
probabilidad buscada se puede deterrninar hallando la probabilidad de obtener una
10.4.3 RegIa de Ia adicion media de 4.5 0 5, que es (449 + 19)' y sumando este valor a la probabilidad de obtener
En los ejercicios propuestos al final de los capitulos 3 4 5 y 6 t una media mayor 0 igual que 5.00, que es (439 + 19 + 419)' Esto nos daria 449 +
experiment t I I " , presen amos un + 19 + 19 + 19 + 19 = ~~.Notese,sinembargo,queparallegaraesteresuitado hemos
. 0 mues ra en e .~ue consideramos todas las muestras posibles de N = 2
provementes de una poblacion de siete mimeros. EI proposito de este ejercicio fue el tenido en cuenta dos veces el mismo suceso (una media de 5.0). Evidenternente,
de slentar la base p~ra, un~ discusion de la teoria de la probabilidad y posteriormente deberiamos haberlo considerado solo una vez. Para ello, podriamos sumar todas las
de a prueba de hipotesis, " probabilidades y restar el numero que participa de ambas caracteristicas, ya que 10
. ~evisemos brevemente este experimento. Partimos de una poblacion con los hemos considerado dos veces. Asi, la probabilidad buscada se convierte en:
sigurentes
. elementos'. 0, I , 2, 3, 4, 5, 6. E scnibilmos ca d a uno de estos mimeros en una
ta,rJeta, y col~camos las tarjetas en un sombrero. Extraemos una tarjeta anotamos el p = 449 + 19 + 439 + 19 + 19 - 19 = ~g = 0.20.
nu~ero y rellltegram~s la tarjeta ~I sombrero. Luego extraemos aleato;iamente otra Esto nos lleva a la formulacion general de la regia de la adicion.
tarjeta, sumamos el numero obtemdo al anterior y calculamos la media dividiend I
o
s;:~a por 2. Despues d.e c?nst~~ir una tabla para todas las muestras posibles d: Si A y B son sucesos, la probabilidad de que ocurra cualquiera de ellos es iqual a la
- 2, obtenemos la distribucion de frecuencias de las 49 medias ibl probabilidad de A mas la probabilidad de B menos la probabilidad de su realizacion
muestra la tabla 10.1. POSI es, como
conjunta.
x p(Xj
En forma simbolica, esto se expresa asi:
6.0 1 0.0204 p(A 0 B) = p(A)+ p(B)- p(A y B). (10.3)
5.5 2 0.0408
5.0 3 0.0612
4.5
Notese que si los sucesos son mutuamente excluyentes (0 sea, que ambos, sucesos
4 0.0816
4.0 no pueden ocurrir simultaneamente), el ultimo terrnino desaparece. Asi, la regia de la
5 0.1020
3.5 6 0.1224
adicion para sucesos mutuamente excluyentes es
3.0 . 7 0.1429
2.5 6 0.1224 p(A 0 B) = p(A) + p(B) (10.4)
2.0 5 0.1020
1.5 4 0.0816 Veamos un ejemplo que se refiere a sucesos mutuamente excluyentes. Si extrae
1.0 3 0.0612 mos una muestra de N = 2, ~cuaI es la probabilidad de obtener una media mayor 0
0.5 '2 0.0408
0.0 1
igual que 5? Para responder a esta pregunta, sumamos simplemente las probabilida
0.0204
des de los sucesos que estan incluidos en la proposicion «mayor 0 igual que 5»,
puesto que son mutuamente excluyentes (0 sea, que dos 0 mas de ellos no pueden
ocurrir simultaneamente). En el presente ejemplo, estos sucesos, corresponden a las
* Usamas N'x para representar el ruime
ra total de medias obtenidas en el experi medias que tienen los valores de 5.0, 5.5 y 6.0. Notese que estos sucesos son
mento muestral, distingurendolo de N mutuamente excluyentes. Si en una extraccion se obtiene una media de 5.5, no puede
Que es el nurnem de valores en que se
basa cada media. obtenerse en esa extraccion una media con otro valor.
t LP(X) deberia ser igual a 1.000. La Tabl.a 10.1 Distribucion de frecuencias y de probabilidades de I 'La probabilidad de obtener una media mayor 0 igual que 5 resulta ser
discrepancia de 0.0003 proviene de erro medias de muest d t - as
res de redondeo. . . ras e arnano N = 2, provenientes de una poblacion
de siete numeros (0, 1, 2, 3, 4, 5, 6).
p(X = 5) + p(X = 5.5) + p(X = 6.0) = 0.0612 + 0.0408 + 0.0204 = 0.1224.
182 ESTADfsTICA PARA LAS CIENCIAS SOCIALES
PROBABILIDAD 183
Observese que podemos formular y responder preguntas adicionales tales como: 10.4.4 RegIa de Ia multiplicacion
en la extraccion de una muestra de N = 2, ~cll(il es la probabilidad de obtener una
media menor 0 igual que 2?
En la seccion anterior nos ocupamos de la determinacion de la probabilidad de
En forma simbolica:
obtener un suceso u otro bas an dose en una extraccion simple respecto a un conjunto
de 49 medias. En la estadistica inferencial se presenta a menudo el problema de
p(X:;.;; 2.0) = p(X = 2) + p(X = 1.5) + p(X = 1.0) + p(X = 0.5) + p(X = 0)
averiguar la probabilidad de la realizacion conjunta 0 sucesiva de dos 0 mas sucesos
= 0.1020 + 0.0816 + 0.0612 + 0.0408 + 0.0204 referentes a mas de una extraccion,
= 0.3060.
Caso del muestreo con reposicion. Vol vamos a nuestro experimento muestral.
Cabe tarnbien preguntar: ~cll(il es la probabilidad. de escoger una media com Recordemos que al obtener las medias muestrales basadas en N = 2, sacamos una
prendida entre 3.5 y 5.5, incluyendo estos valores? Simplemente, sumamos las tarjeta del sombrero, anotamos el valor que en ella esta escrito, volvemos a
probabilidades separadas de los siguientes sucesos: introducir la tarjeta en el sombrero y elegimos aleatoriamente una segunda tarjeta.
Imaginemos que en ambas extracciones obtenemos un valor igual a cero. Cab ria
p(X = 3.5) + p(X = 4.0) + p(X = 4.5) + p(X = 5.0) + p(X = 5.5) preguntar: ~cuaI es la probabilidad de obtener por azar una media igual a cero en dos
= 0.1224 + 0.1020 + 0.0816 + 0.0612 + 0.0408 extracciones sucesivas de la poblacion de siete valores? De hecho, obtuvimos antes
= 0.4080. esta respuesta al construir la tabla 10.1 (distrihucion de frecuencias y de probabilida
des de las medias de muestras de tamafio N = 2, provenientes de una poblacion de
La Formula (10.4) se puede generalizar a cualquier mirnero de sucesos mutuamen siete numeros), Hal1amos una probabilidad igual a 0.0204.
te excluyentes. Asi,
Se puede obtener el mismo resultado mediante un rnetodo aiternativo, que
consiste en aplicar la regia de la multiplicacion. Esta regia establece que:
p(A 0 B 0 ... Z) = p(A) + p(B) + ... + p(Z).
La probabilidad de realizacion simultanea 0 sucesiva de dos sucesos es igual al
En los capitulos 11 y 17 encontraremos problemas que se basan en poblaciones producto de las probabilidades separadas de cada WlO.
dicotomicas, de si-no, 0 de dos cateqorias, donde los sucesos no solo son mutuamente
excluyentes, sino tambien exhaustioos. Por ejemplo, en el experimento muestral con Expresado simbolicamente:
el que hemos estado trabajando, ~cll(il es la probabilidad de obtener una media
mayor 0 igual que 5, 0 una media menor que 5? No solo es imposible que los dos
p(A Y B) = p(A)p(B) (10.9)
sucesos ocurran simultanearnente (son mutuamente excluyentes), sino que adem as no
es posible que se presente un resultado diferente a la media mayor 0 igual que 5 0 a la
media menor que 5. En el caso de sucesos mutua mente excluyentesy exhaustivos, se Puesto que hay siete numeros, la probabilidad de obtener cero en la primera
obtiene la sigiiiente formula: extraccion es p(A) = ~. La probabilidad de obtener cero en la segunda.extraccion es
tambien p(B) = i-. Asi,
p(A) + p(B) = 1.00. (10.5)
p(A YB) = (~)(~)
Al tratar con poblaciones dicotornicas, se acostumbra usar los simbolos P y Q
para representar, respectivamente, la probabilidad de la realizacion de un suceso y la
= i9 = 0.0204.
probabilidad de la no realizacion de un suceso. Asi, si lanzamos una moneda,
podemos representar por P a la probabilidad de que salga cara, y por Q a la En el ejemplo anterior, la realizacion de A no depende de la realizacion de B, y
probabilidad de que no salga cara (0 sea, que salga cruz). Estas consideraciones nos viceversa. En este caso, se dice que los sucesos son independientes. Solamente cuando
l1evan a tres formulaciones Miles: los sucesos son independientes es valida la regia de la multiplicacion expresada par la
formula (10.9). La razon de que los dos sucesos anteriares sean independientes, es que
P +Q= 1.00, (10.6) hemos efectuado un muestreo con reposicion. Recordemos que, despues de cada
extraccion, volvimos a introducir la tarjeta en el sombrero. Puesto que se mezclan las
P = 1.00 - Q, (10.7)
tarjetas despues de cada extraccion, el resultado de la primera extraccion no puede
Q = 1.00 - P, (l0.8) afectar al resultado de la segunda.
Antes de pasar al caso en que los sucesos no son independientes, veamos dos
las cuales se cumplen cuando los sucesos son mutuamente excluyentes y exhaustioos.
ejernplos mas.
184 ESTADfSTICA PARA LAS CIENCIAS SOCIALES PROBABILIDAD 185
Ejemplo 1. ~CU(i1 es la probabilidad de obtener cero en la primera extracci6n Dados dos sucesos A y B, la probabilidad de que ocurran conjuntamente ambos es
(suceso A) y 6 en la segunda extraccion (suceso r;? igual al producto de la probabilidad de que ocurra uno de ellos por la probabilidad
condicional de que ocurra el otro, dado que ocurri6 el primero.
p(A) = ~; p(B) = ~;
p(A y B) = H)(~) Expresado simbolicamente:
= ig = 0.0204.
p(A y B) = p(A)p(B I A) = p(B)p(A I B). (10.10)
Ejemplo 2. ~Cual es la probabilidad de obtener una media igual a 3 en dos
Los simbolos p(A I B) y p(B I A) reciben el nombre de probabilidades condicionales.
extracciones sucesivas de la poblacion de siete numeros? La respuesta a esta pregunta
El simbolo p(B I A) representa la probabilidad de B dado que ocurrio A. El terrnino
no es tan inmediata, porque hay varias formas diferentes de obtener una media igual
a 3. A continuacion se indican estos casos. probabilidad condicional tiene en cuenta la posibilidad de que la probabilidad de B
pueda depender 'de que el suceso A haya 0 no ocurrido, e inversamente para p(A I B).
[Nota: Cualquiera de los dos sucesos puede ser designado por A 0 B, pues los
PRIMERA SEGUNDA simbolos tan solo representan un lenguaje conveniente para la discusion, sin implicar
EXTRACCION EXTRACCION peA Y B) un orden en el tiempo de realizacion.]
Si efectuaramos un muestreo sin reposicion de la poblacion de siete rnimeros,
0 y 6 0.0204
1 y 5 0.0204
obtendriamos las medias que se indican en la tabla 10.2 para N = 2.
2 y 4 0.0204
3 y 3 0.0204 Tabla 10.2 Totalidad de resultados po
PRIMERA EXTRACCION
4 y 2 0.0204 sibles que cabe obtener extrayendo mues
5 y 1 0.0204 tras de N = 2, sin reposicion, de una
poblacion de siete numeros. z o 2 3 4 5 6
6 y 0 0.0204 a
U
u 0 0.5 1.0 1.5 2.0 2.5 3.0
~ 1 0.5 1.5 2.0 2.5 3.0 3.5
Se pregunta ahora, ~cual es la probabilidad de obtener 0 y 6 0 1 Y5, 02 y 4, etc.? S 2 1.0 1.5 2.5 3.0 3.5 4.0
Para responder a esta pregunta hemos de combinar las reglas de la multiplicacion y « 3 1.5 2.0 2.5 3.5 4.0 4.5
de la adicion: ~ 4 2.0 2.5 3.0 3.5 4.5 5.0
i5 5 2.5 3.0 3.5 4.0 4.5 5.5
p(X = 3) = p(O + 6) + p(l + 5) + p(2 + 4) + p(3 + 3) ~L3_.0 3.5 4.0 4.5 5.0 5.5
_
+ p(4 + 2) + p(5 + 1) + p(6 + 0) * Las rayas Que aparecen en los lugares de la diagonal indican Que estos
sucesos no pueden ocurrir cuando S8 hace un muestreo sin reposicion.
=rnrn+~rn+rnrn+rnrn+rnrn+rnrn+~~
= 419 + i9 + ig + ig + 4~ + ig + ig A partir de la tabla 10.2 es posible construir la distribucion de frecuencias y de
= 4
79
= 0.1429. probabilidades de las medias para muestras de tamafio N = 2 (ver tabla 10.3).
Notese que una media de 0 tiene asociada una probabilidad de O. Esto se debe al
Notese que est a respuesta concuerda con la probabilidad de obtener una media hecho de que al haberse obtenido 0 en la primera extraccion, no se puede obtener
igual a 3 que aparece en la tabla 10.1. nuevamente 0 en la segunda. En forma simbolica, p(B I A) = O. Asi, la probabilidad
de obtener una media de 0 es:
Caso del muestreo sin reposicion, Veamos la diferencia entre el muestreo con
reposicion y la tecnica conocida como muestreo sin reposicion, Imaginemos que p(X = 0) = p(A)p(B IA) = (~)(O) = O.
despues de extraer la primera tarjeta no la volvemos a colocar en el sombrero. Seria,
entonces, imposible obtener el mismo resultado en la segunda extraccion, Ciertamen Lo mismo se cumple respecto a la probabilidad de obtener una media de 6
te, seria imposible obtener una media igual a 6 0 una media igual a O. ~Por que? cuando se hacen extracciones sin reposicion de la poblacion de siete numeros. ~Por
AI hacer un muestreo sin reposicion, el resultado de la primera extraccion influye que?
en los resultados posibles de la segunda. En este caso, se dice que los sucesos son no i Hay un segundo hecho importante en el muestreo sin reposicion: despues de
independientes. haber obtenido un resultado en la primera extraccion, es mayor la probabilidad de
Para sucesos relacionados 0 no independientes, la regIa de la multiplicacion se cada uno de los resultados restantes que seran seleccionados en la segunda extrac
convierte en: cion, En la poblacion de siete numeros, la probabilidad de que cualquier numero
186 ESTADfSTICA PARA LAS CIENCIAS SOCIALES PROBABILIDAD 187
X pIX) Tabla 10.3. Distribucion de frecuencias y de probabilidades de medias Notese que este valor concuerda con el que aparece en la tabla 10.3 para una media
correspondlent.e.s a muestras de tamafio N = 2, ext raid as sin reposicion igual a 1.0.
6 0 de una poblacion de siete numeros,
0.0000 Debe tenerse en cuenta que la diferencia entre el muestreo con y sin reposicion es
5.5 2 0.0476
5') despreciable cuando la poblacion es grande respecto al tamaiio de la muestra. Por
2 0.0476
4.5 4 0.0952
ejernplo, si se selecciona muestras de N = 2 de una poblacion constituida por un
4.0 4 0.0952 millon de ntimeros, la probabilidad de obtener el mismo mimero dos veces es 0 en el
3.5 6 0.1429 muestreo sin reposicion y 0.0000000000001 en el muestreo con reposicion. De hecho,
3.0 6 0.1429 en las encuestas de opinion publica se emplea el muestreo sin reposicion, pues no
2.5 6 0.1429 tiene sentido entrevistar dos veces ala misma persona, salvo cuando se trata de un
2.0 4 0.0952
1.5 4
seguimiento. Sin embargo, puede emplearse con seguridad un modelo basado en el
0.0952
1.0 2 0.0476 muestreo con reposicion por el gran ntimero de personas que usualmente constitu
0.5 2 0.0416 yen la poblacion de interes,
0.0 0 0.0000
N x = 42 2::P{X} = 0.9999
Ejemplo 1. i,Cmil es la probabilidad de obtener sucesivamente los valores 0 y 2? Numero de resultados favorables al suceso A
p(A) = ,
Llarnemos suceso A a la obtencion de 0 y suceso B a la obtencion de 2. Numero total de resultados
p(A) = t, Sin embargo, esta definicion presenta una dificultad cuando se trata de variables
p(B) = p(BI A) =-!J, continuas. Como se indico en la seccion 3.7.1, es generalmente aconsejable represen
p(A y B) = (t)(-!J) = i2 = 0.0238. tar la frecuencia en funcion de areas situadas bajo una curva cuando se manejan
variables continuas. Asi, si esto ocurre, podemos expresar la probabilidad en la
Ejemplo 2. i,Cual es la probabilidad de obtener una media igual a 1.0? forma:
P~~~ responder a est a pregunta, combinamos las reglas de la multiplicacion y de Area bajo una parte de la curva
la a~lcl.on. Hay tres combinaciones posibles de numeros que pueden producir una p= (10.11)
media igual a 1.0, que son las que se indican a continuacion: Area total bajo la curva
Asi,
10.6 La probabilidad y el modelo de la curva normal
p(X) = p(O y 2) + p(2 y 0) + p(1 y 1)
En la seccion 7.3 establecimos que la distribucion normal estandar tiene f.l igual a 0, (J
= (Wi) + (t)(-!J) + @(O) igual a 1 y un area total igual a 1.00. Vimos que al transformar en valores z las
= 4~ + 4
12
+ 0 = l2 = 0.0476. calificaciones de una variable normalmente distribuida estamos, de hecho, expresan
PROBABILlDAD 189
188 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
do estas calificaciones en unidades de la curva normal estandar. Esto perrnite EI valor z correspondiente a X = 92 es
expresar la diferencia entre dos calificaciones cualesquiera como fracciones del area
__ 92 - 100 = -0.50.
total bajo la curva. Asi, cabe establecer valores probabilisticos en funcion de estas - - 16
razones, como en la formula (10.11).
Veamos varios ejemplos que ilustran la aplicacion de los conceptos de probabili . , de area a la izquierda de - = -0.50 es 0.3085. Por tanto. la
La fraccion -.. d I 92 es
dad al modelo de la curva normal. probabilidad de elegir al azar una persona con una calificacion e por 0 menos
I AREA A LA DERECHA DE
UNA CALIFICACION
DE 132
Fig.l0.2 Fraccion de area a la dere
Fig. 10.1 Fraccion de area ala dere P oblema 3. Veamos un ejemplo en el cual se aplica la ley de l~ .multiplicacion.
cha de una calificacion de 132 en una Dado que se emplea un muestreo con reposicion, i,cual es la probabilidad de escoger
distribucion normal con J1 = 100 Y . al azar tres personas con CI igual 0 superior a 124? Para este problema suponemos
derecha de una z de 2.00. Par tanto, la probabilidad de elegir al azar una persona con p(A, B, C) = (0.0668)3 = 0.0003.
u.n resultado .tan P?CO frecuentel», Esta claro que cuando la distribuci6n de frecuen
Ejemplo 1. "Cual es la probabilidad de obtener una media tan pequefia como 0.5
eras de las cal~ficacIOnes es simetrica, una calificaci6n de 68 0 menor esta tan desviada
(0 sea, una media igual a 0.5 0 menor)?
de. una. media d.e 100 como. 10 esta una calificacion de 132. Esto es, am bas
Hallamos la probabilidad de obtener una media de 0.5 y una media de 0.0 (que es
calificaciones estan ados unidades de desviaci6n estandar respecto a la di
C d I . me ra. la unica media inferior a 0.5), y sumamos estas probabilidades para obtener el valor p
.ua~ 0 ~~presamos e. valor de la probabilidad teniendo en cuenta las dos colas de la
distribucion, n~s refenmos al valor p como bilateral. En las distribuciones sirnetricas,
unilateral:
los. valores p .bllaterales se pueden obtener simplemente duplicando el valor del p(X :::; 0.5) = p(X = 0.5) + p(X = 0.0)
unilateral, A.SI, en.:1 problema anterior, la probabilidad de seleccionar a una person~ = 0.0408 + 0.0204 = 0.0612.
con una calificacion tan rara 0 poco usual Como 132 es 2 x 0.0228 = 0.0456.
A~lararemos la diferencia entre los valores p uni y bilaterales reliriendonos al Ejemplo 2. "Cual es la probabilidad de obtener una medi~ tan desviada (0 mas)
respecto a la media de la distribuci6n como 10 es una media muestral de 0.5?
expe~lmento muestral que hemos venido usando en el texto. La figura 10.3 representa
U? histograrna de probabili~ades basado en la tabla 10.1. Recordemos que esta
La respuesta a esta pregunta requiere eI usa de un valor p bilateral obtenido pOI'
dlstn~ucIOn se obtuvo seleCCIO?ando c?n reposici6n todas las muestras posibles de aplicaci6n de la regIa de la adici6n:
tamano N = 2 de una poblacion de siete nurneros.
p(X = 0.0) + p(X = 0.5) + p(X = 5.5) + p(X = 6.0).
0. 15 r-- - - - - - - - - - _ "ii""1'L;;q --,
Sin embargo, puesto que la distribuci6n es simetrica y las medias con valores de 5.5 y
6.0 estan igualmente desviadas que las medias con valores de 0.5 y 0.0, respectiva
mente, necesitamos solamente duplicar eI valor de p obtenido en el ejemplo 1:
. riedad se refiere ala selecci6n de los elementos de la muestra de modo que todos ellos
tengan la misma probabilidad de ser elegidos en una muestra de tamafio dado. El
Si. pr:guntamos,. «"cual es la probabilidad de obtener una media igual a cero?», muestreo independiente se refiere al hecho de que la selecci6n de un elemento no
necesltanamos refenrnos solamente a la cola izquierda del histograma de probabili afecta a Ia selecci6n de otro. Aunque no es posible predecir un suceso cuando se
dades para e?~ontrar que la respuesta es 0.0204. Sin embargo, si preguntamos, «"cual considera aisladamente, las colecciones de sucesos aleatorios adquieren caracteristi
~s la probabilidad de obtener un resultado tan desviado Como una media muestral cas y formas predecibles. Se mencionaron, al respecto, la distribuci6n binomial y la
igual a cero?», tendriamos qu~ observar ambas colas, la de la derecha y la de la curva normal.
IzqUIer~a. ~ue~t.o que una media de 6 esta igualmente desviada respecto a la media 2. Teoria de la probabilidad, que se relaciona con los resultados de los experimentos.
de la distribucion, usarnos la regIa de la adici6n para obtener el valor bilateral: Aprendimos a distinguir entre las probabilidades establecidas porIa admisi6n de
frecuencias relativas idealizadas, y aquellas otras establecidas empiricamente poria
pIX = 00 .Y = 6) = pIX = 0) + p(X = 6) determinaci6n de frecuencias relativas. La probabilidad se defini6 como
= 0.0204 + 0.0204 = 0.0408.
Numero de resultados favorables a un suceso
Veamos dos ejemplos mas.
p= Numero total de resultados
192 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
PROBABILIDAD 193
c) RegIa de la multiplicacion:
Cuando los sucesos son independientes. En el caso del muestreo con reposi *1/ Se tiene una poblacion formada por los mimeros 0, 3,.6 y 9. .
cion, la seleccion de un elemento es independiente de la seleccion de otro. 7 a) Construir una distribucion de probabilidades y un.~~togram~ para todas las medias
Dados dos sucesos A y B, la probabilidad de su realizacion simultanea 0 posibles, cuando se efectua un muestreo con repostcion, N = _. . . .
b) Construir un histograma de probabilidades para todas las medias posibles, cuando
sucesiva es igual al producto de la probabilidad de que ocurra uno de ellos
se efecttia un muestreo con reposicion, N = 3. [Sugerencia: La tabla para hallar las
por la probabilidad de que ocurra el otro, 0 sea, medias es la que aparece a continuacion, Los valores dentro de las celdas representan
las medias de las tres extracciones.]
peA y B) = p(A)p(B).
Cuando los sucesos no son independientes. En el caso del muestreo sin PRIMERA
0 3 6 9
reposicion, la seleccion de un elemento afecta a la probabilidad de la se EXTRACCION
leccion de los elementos sucesivos. Asi, dados dos sucesos (A y B), la SEGUNDA 0 3 6 9 0 3 6 9
0 3 6 9 3 6 9 0
EXTRACCION
probabilidad de que ocurran A y B conjunta 0 sucesivamente es igual z
al producto de la probabilidad de que ocurra cualquiera de estos sucesos par <Q 0 0 1 2 3 1 2 3 4 2 3 4 5 3 4 5 6
a:u 1 2 3 4 2" 3 4 5 3 4 5 6 4 5 6 7
la probabilidad condicional de que ocurra el otro, supuesto que ocurrio Wu 3
u<
a: a: 6 2 3 4 5 3 4 5 6 4 5 6 7 5 6 7 8
el primero. SimbOlicamente, w~
~x 9 3 4 5 6 4 5 6 7 5 6 7 8 6 7 8 9
W
peA y B) = p(A)p(B IA) = p(B)p(A IB).
4. Aplicacion de la teoria de la probabilidad a las variables continuas. La probabili t2. La poblacion original de los cuatro mimeros del ejercicio 1 fue rec~~ngular (todos tenian
dad se expresa en terminos de la fraccion de area situada bajo una curva. Asi, Una frecuencia asociada de 1). Comparar las distribuciones de .prob~~Ihdad enco~tra~~s en
l(a) y l(b), e intentar una generalizacion acerca de la forma y la dispersion de la distribucion de
Area bajo una parte de la curva as medias muestrales cuando aumentamos el tamafio de la muestra.
p=
Area total bajo la curva : Responder a las siguientes preguntas basadas en los histogramas de probabilidades
btenidos en el ejercicio 1.
194 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
PROBABILIDAD 195
a) Si se extrae una muestra de N = 2, locUli) es la probabilidad de obtener una media g) una diferencia entre medias tan rara 0 infrecuente c~mo - 3?
igual a cero? Comparar este resultado con la probabilidad de obtener aleatoriamente h) una diferencia entre medias igual 0 rnenor que 2, 0 igual 0 mayor que - 2?
una media igual a cero cuando N = 3.
b) Para cada una de las distribuciones, determinar la probabilidad de obtener una 8. Confeccionar una lista de todos los resultados posibles al lanzar una moneda tres veces.
muestra con una media tan rara 0 infrecuente como 9. Calcular la probabilidad de obtener
c) En cada uno de los histogramas de probabilidades, determinar la probabilidad de a) 3 caras b) 3 cruces
*4. Para la distribucion de probabilidades correspondiente a N = 2 [ejercicio l(a)], hallar c) un as 0 una figura d) una espada o una figura?
a) un 7?
*6. Imaginemos un tipo diferente de experimento muestral. Se han seleccionado todas las
b) dos mimeros iguales?
muestras posibles de N = 2 a partir de una poblacion de numeros encontrandose las si
c) dos numeros iguales 0 un 8?
guientes medias: 1, 2, 2, 3, 3, 3, 4, 4, 5. Se escribe ahora cada una de estas medias en una
d) un numero par?
pequefia tarjeta y se colocan las tarjetas en un sombrero. Se extrae una tarjeta, se anota el re
sultado y se vuelve a introducir en el sombrero. Se extrae una segunda tarjeta, se resta el 12. En una maquina tragaperras hay tres rued as en cad a una de las cuales estan dibujadas
mimero correspondiente del numero anterior y se repone la tarjeta. En la tabla que aparece a cinco frutas diferentes y una estrella. Despues de colocar una moneda y pulsar la palanca, las
continuacion se describen todas las posibles diferencias entre las medias, cuando N = 2. tres ruedas giran independientemente varias veces antes de detenerse. loCUlil es la probabilidad
. de que
a) aparezcan tres Iimones?
PRIMERA MEDIA OBTENIDA
b) aparezcan tres figuras iguales?
2 2 3 3 3 4 4 5 c) aparezcan dos Iimones y una estrella?
-c
a 1 a 1 1 2 d) aparezcan dos Iimones y cualquier otra fruta?
z 2 2 3 3 4
UJ
2 -1 a a 1 1 1
e) no aparezca ninguna estrella?
l-
ID
2 2 3
0 2 -1 a a 1 1 1 2 2 3 13. Se extraen al azar (sin reposicion) tres cartas de una baraja de 52 naipes. loCUlil es la
< 3 -2 -1 -1 a a a 1 1
is 2 probabilidad de que
UJ 3 -2 -1 -1 a a a 1 1
:;E 2 a) las tres sean corazones?
3 -2 -1 -1 a a a 1
< 1 2 b) ninguna de las tres cartas sea corazon?
a 4 -3 -2 -2 -1 -1 a
z -1 a 1 c) las tres sean figuras?
4 -3 -2 -2 -1 -1 a
:;)
(ll
-1 a 1
5 -4 -3 -3 -2 -2 -2 Calcular las probabilidades indicadas en el ejercicio 13 si las extracciones se hacen con
UJ
en -1 -1 a
reposici6n.
a) Construir una distribucion de frecuencias de las diferencias entre medias. 15. Las calificaciones obtenidas en una conocida prueba de inteligencia se distribuyen
b) Construir una distribucion de probabilidades de las diferencias entre medias. norrnalmente con una media de 100 y con una desviaci6n tipica de 16.
i) con cocientes de inteligencia de 122 0 mas? 23. Si se hacen extracciones con reposicion de la bolsa descrita en el ejercicio 21, l.cual es la
ii) con cocientes de inteligencia entre 90 y 11O? probabilidad de que:
iii) una con CI de 122 0 mas, y la otra con CI entre 90 y 1107 a) de tres bolas seleccionadas las tres sean azules?
f) l.Cual es la probabilidad de que, al salir de la clase, el primer estudiante que b) de dos bolas seleccionadas las dos sean verdes?
encuentre tenga un CI inferior a 120? l.Puede responder a esta pregunta basandose c) de cuatro bolas seleccionadas ninguna sea roja?
en la informacion proporcionada anteriormente? En caso negativo, l.por que no? 24. El 40 % de los estudiantes de cierta universidad cursan adrninistracion de emp:esas. EI
16. l.Cual de las siguientes tecnicas de seleccion dara lugar a muestras aleatorias? Explique 70 %de ellos son hombres y el 30 % mujeres. El 70 % de los estudiantes de la universidad son
las respuestas. varones. l.Cual es la probabilidad de que:
a) Poblacion: espectadores de un programa de television dado. Tecnica de muestreo: en a) un estudiante elegido al azar curse ad~inistracion de em~r~sas? ,
una noche determinada, entrevistar a una de cada cinco personas asistentes al b) una persona elegida al azar sea una mujer que curse administracion de empresas?
auditorio. c) dos estudiantes elegidos al azar cursen administracion de empresas?
b) Poblacion: un pastel hecho en casa. T'ecnica de muestreo: una porcion en forma de d) dos personas elegidas al azar sean estudiantes de administracion de empresas y sean
cufia cortada en cualquier parte del pastel. de distinto sexo?
c) Poblacion: todos los nifios de una escuela primaria. Tecnica de muestreo: cada uno de 25. 'Cu~il es la probabilidad de que una calificacion tomada al azar de una poblacion
los profesores a cargo de una seccion escoge un alumno para que integre la muestra.: norrnalmente distribuida con una media de 66 y una desviacion estandar de 8 sea:
17. En un estudio para determinar la agudeza visual, se presentan al sujeto cuatro matices de a) mayor que 707
un color que varian ligeramente en su brillo. l.Cual es la probabilidad de que la persona, por b) menor que 60?
simple azar, coloque los matices en orden de mayor a menor brillo? c) comprendida entre 60 y 70?
18. En cierta ciudad, la proporcion de personas con sangre de tipo A es de 0.20. l.Cual es d) alrededor de 70?
e) igual 0 menor que 54 0 igual 0 mayor que 72?
la probabilidad de que:
f) menor que 52 0 comprendido entre 78 y 84?
c) una persona dada no tenga sangre de tipo A? l.Que se entiende por muestreo aleatorio?
d) si se seleccionan dos personas, no tengan las dos sangre de tipo A?
19. En un proceso de fabricacion, la proporcion de articulos defectuosos es de 0.10. i,Cual es
la probabilidad de que:
a) en una muestra de cuatro articulos ninguno sea defectuoso?
b) en una muestra de cuatro articulos todos sean defectuosos?
c) uno 0 mas, pero no los cuatro, sean defectuosos?
20. En la Iabricacion de tornillos para la industria espacial, se producen diariamente miliones
de tornillos con una medida de 0.010 em. La desviacion estandar es de 0.001. Se considera que
un tornillo es defectuoso si su diferencia respecto a 0.010 es de 0.002 0 mas. Admitiendo
normalidad, i,cual es la probabilidad de que:
a) un tornillo seleccionado al azar sea defectuoso?
21. Una bolsa contiene 6 bolas azules, 4 bolas rojas y 2 bolas verdes, Si se extrae al azar una
bola de la bolsa, i,cual es la probabilidad de que sea:
a) roja? b) azul? c) verde? d) blanca?
22. Si se efectuan extracciones sin reposicion de la bolsa descrita en el ejercicio 21, i,cual es la
probabilidad de que:
a) de tres bolas seleccionadas las tres sean azules?
b) de dos bolas seleccionadas las dos sean verdes?
c) de cuatro bolas seleccionadas ninguna sea roja?
[198J
INTRODUCCION A LA INFERENCIA ESTADfSTICA 199
Introducci6n
11
a la inferencia estadistica *
existe. Intentamos hallar algo referente a las caracteristicas de esa poblaci6n como
si existiese. Por ejemplo, cuando administramos cierta medicina a un grupo de
sujetos (la muestra), deseamos generalizar nuestros resultados a todos los que po
tencialmente podrian recibir dicha medicina. Esta poblacion es, I!aturalmente, hipo
tetica,
Puesto que rara vez se puede estudiar exhautivamente a las poblaciones, depen
demos necesariamente de las muestras para llegar a una hip6tesis referente a di
versas caracteristicas 0 parametres de la poblaci6n. N6tese que nuestro in teres
no es el de describir los estadigrafos per se, sino el de hacer inferencias a partir
de los datos. Asi, si preguntamos a 100 personas c6mo piensan votar en la
pr6xima eleoeion, nuestro interes primario no es el de conocer la forma en que
votaran estas 100 personas, sino hacer una estimaci6n de la forma en que llenaran
11.1 zPor que se toman muestras? las papeletas de sufragio todos los integrantes de la poblaci6n de electores.
Casi toda investigaci6n conlleva la observaci6n y medida de un numero limitado
de individuos 0 de sucesos. Se supone que estas medidas nos diran algo acerca
Un lider de un qrupo reliqioso, con objeto de planificar la captaci6n de nuevos
de la poblaci6n. Para comprender la forma en que podemos hacer inferencias
miernbros.idesea conocer la proporci6n de adultos en su pais cuyo deseo de perte
ace rca de una poblaci6n a partir de una muestra, es necesario introducir el con
necer a una Iglesia es manifiesto. i,C6mo podria obtener esta informaci6n?
cepto de distribuci6n muestral.
A un psicoloqo que hace investigaciones con ratas, Ie in teresa saber la relaci6n que
existeentre la fuerza de la motivaci6n y el aprendizaje. Especificamente, i,cuales
son los efectos de la duraci6n del hambre sobre el nurnero de intentos requeridos
para que una rata aprenda a conocer un laberinto? Concepto de distribuciones muestrales
Se trata de un socioloqo que desea estudiar las diferencias entre la educaci6n dada
En la practica, las inferencias ace rca de los parametres de una poblaci6n se hacen
por los padres a los nifios delincuentes y a los que no 10 son.
basandose en estadigrafos que se calculan mediante una muestra de N observa
Un inoestiqador de mercados desea conocer la proporci6n de personas que pre ciones tomadas al azar en esta poblaci6n. Si continuaramos tomando muestras de
fieren ciertos colores de autom6viles y sus diversas combinaciones. tamafio N de esta poblaci6n, no deberia sorprendernos encontrar algunas diferen
cias entre los valores de los estadigrafos muestrales obtenidos. Seria extremada
El encarqado de una pistade patinaje, trata de determinar si la capa de hielo es mente raro que encontraramos siempre el mismo conjunto de observaciones. En
suficientemente gruesa para que la gente pueda patinar sin peligro. una ocasi6n podriamos obtener por azar un conjunto de observaciones en que la
Un juqador desea determinar si un juego de dados esta «manipulado», mayo ria de los datos fueran altos. En otra ocasi6n cabria obtener una mayoria
de datos bajos. Y todavia en una tercera ocasi6n podriamos obtener una buena
i,Que tienen todos estos problemas en cornun? Un encuestador esta haciendo mezcla de datos altos y bajos. Ciertamente, es este examen el que nos lleva al con
preguntas referentes al pararnetro de una poblaci6n, a la cual desea generalizar cepto de distribucion muestral.
sus respuestas, pero no tiene ninguna posibilidad de estudiar la totalidad de la
Una distribucion muestral es aquella distribucion teorica de probabilidades de los
poblaci6n. Anteriormente (seccion 1.2)* definimos una poblacion como un conjunto
valores posibles de alqun estadigrafo muestral que ocurriria si obtuoieramos todas
completo, real 0 te6rico, de individuos, objetos 0 medidas que tienen alguna carac
las muestras posibles, de un tamaiio fijo, de una poblacion dada.
teristica comun observable. Generalmente es imposible estudiar a todos los miern
bros de una poblaci6n dada porque la poblaci6n, tal como se la ha definido, tiene Hay una distribuci6n muestral para cada estadigrafo tal como la media, la
un numero infinito de elementos 0 es tan grande que imposibilita un estudio desviaci6n estandar, la varianza, la proporci6n, la mediana, etc. Se trata de uno
exhaustivo. Mas aun, cuando hablamos de «la poblacion», nos referimos a menudo a e los conceptos mas importantes de la estadistica inferencial EI lector esta ya
una entidad hipotetica, En el caso experimental tipico, la poblaci6n real no familiarizado con varias distribucionesmuestrales, aunque anteriormente no les
imos este nombre. Recordemos los diversos problemas muestrales que hemos pre
• Es conveniente estudiar de nuevo la seccion 1.2 a fin de revisar varias definiciones que apareceran en este ~entado en los anteriores capitulos. En uno de los ejemplos, partimos de una po
capitulo.
blaci6n de siete numeros y seleccionamos sin reposici6n muestras de N = 2. Ob
200 ESTADISTICA PARA LAS CIENCIAS SOCIALES INTRODUCCI6N A LA INFERENCIA ESTADISTICA 201
tuvimos todas las combinaciones posibles de estos numeros tomados dos a la vez,
Recuadro 11.1 y luego hallamos la media para cada una de estas muestras. En seguida cons
truirnos una distribucion de frecuencias y la distribucion de probabilidades de las
Se tiende a pensar que el muestreo es una actividad propia solamente de un pufiado
de profesionales: encuestadores, cientificos de laboratorio, demografos, por citar unos medias correspondientes a las muestras de tamaiio N = 2 provenientes de esa
cuantos. Tal como se demuestra en el siguiente fragmento de Winning with Statistics, poblacion.
el muestreo y la toma de decisiones se hallan entre las actividades mas generalizadas Recordemos tambien que en el ejercicio 1, al final del capitulo 10, construimos
de los organismos vivos. distribuciones muestrales basadas en la extraccion, con reposicion, de todas las
muestras posibles de N = 2 YN = 3 de una poblacion de cuatro mimeros (0, 3, 6, 9).
La tabla 11.1 muestra estas dos distribuciones muestrales y ademas la distribucion
muestral de la media cuando N = 4.
(p = 0.1211); y una media mayor 0 igual que 6.00 ocurrira casi el 26 % de las Volviendo al problema de la moneda, vemos c1aramente que para determinar
veces (p = 0.1211 + 0.0781 + 0.0391 + 0.0156 + 0.0039 = 0.2578). si la moneda es 0 no sesgada, tenemos que obtener una muestra del «cornpor
Siempre que estimemos un pararnetro poblacional mediante una muestra, ha tarniento» de esa moneda y lIegar a alguna generalizaci6n acerca de su posible
remos preguntas tales como: «~Que calidad tiene la estimaci6n obtenida? ~Cabe sesgo. Por ejemplo, si lanzamos la moneda 10 veces y obtenemos 5 caras y 5 cruces,
lIegarse a la conclusi6n de que el ,pan'tmetro poblacional es identico al estadigrafo ~comenzariamos a sospechar que nuestra moneda es sesgada? Por supuesto que
muestral, 0 es posible que exist a alguna discrepancia? Si es asi, ~cmil es la mag no, ya que este resultado es exactamente del 50 010 al 50 ~o, y concuerda con la
nitud de esta discrepancia 'l», Para responder a cada una de estas preguntas, hip6tesis de que la moneda no es sesgada. i..Y si obtenemos 6 caras y 4 cruces?
compararemos los resultados muestrales con los resultados «esperados», Los resul Nuevamente, este no es un resultado raro. De hecho, cabe responder a la pregunta
tados esperados estan dados, a la vez, por la distribuci6n muestral apropiada. de con que frecuencia, dada una moneda te6ricamente perfecta, puede esperarse un
Pero, ~c6mo es la distribuci6n de un estadigrafo particular? ~C6mo podemos cono resuItado que tenga una diferencia igual al menos a la obtenida respecto a una
cer la forma de la distribuci6n y cuales son, por tanto, los resultados esperados? repartici6n de 50 a 50. Refiriendonos a la fig. 11.1, donde se representa la dis
Puesto que las inferencias que vamos a hacer implican el conocimiento de la tribuci6n te6rica de probabilidades de los diversos nurneros de caras cuando
forma de la distribuci6n muestral, es necesario establecer ciertos modelos idealizados. N = 10, encontramos que los desvios respecto a una repartici6n de 50 a 50 son
La curva normal y la distribucion binomial son dos modelos cuyas propiedades bastante frecuentes. Ciertamente, cuando obtenemos 6 0 mas caras, 0 4 0 menos
matematicas se conocen. En consecuencia, estas dos distribuciones se emplean caras, nos estamos apartando de un resultado de 50 a 50. Tales desvios ocurriran
frecuentemente como modelos para describir determinadas distribuciones mues el 75.4 % de las veces cuando se lanza una moneda perfecta en una serie de
trales. Asi, por ejemplo, si sabemos que la distribuci6n muestral de determinado 10 lanzamientos.
estadigrafo toma la forma de una distribuci6n normal; podemos usar las propiedades
conocidas de esta distribuci6n para hacer inferencias y predicciones acerca del
estadigrafo.
0,24
0.20
nivel de significacion
P
0.12
Supongamos que el lector tiene una moneda favorita que utiliza constantemente 0,08
para decidir entre dos alternativas. Por ejemplo, se pregunta: «~Debo estudiar
esta noche para el examen de estadistica, 0 me voy al cine?». Si sale cara, 0,04
estudio; si sale cruz, no. Pasado un tiempo, el lector tiene la sensaci6n de que
la decision va mas a menudo «contra el» que «a su favon> (en otras palabras, 0.001 0.001
0.00
el estudio resulta mas frecuente que la diversi6n). Entonces comienza a dudar de 0 3 4 5 6 10
la exactitud y adecuaci6n de la moneda. ~Sale cara con mayor frecuencia que NUMERO DE CARAS
cruz? ~C6mo podriamos saberlo?
Fig. 11.1 Histograma de la distribucion binomial del nurnero de caras obtcnidas al lanzar
Una cosa esta clara. lamas se podra saber la verdadera proporci6n de caras diez veces una nioneda perfecta (N = 101.0 al lanzar diez rnonedas a la vez.
y cruces que caracteriza a esta moneda. Se podria cornenzar a lanzar la moneda
en este preciso instante y continuar lanzandola durante un mill6n de afios (supo l.Que ocurre si obtenemos 9 caras y 1 cruz? Evidentemente, comenzamos a
niendo una vida inmensamente larga y una moneda de duraci6n notable) y aun sospechar que la moneda no es perfecta. l.Por que? i..En que punto pasamos de
asi no se agotaria la poblaci6n de los resultados posibles. En este ejemplo, la aceptar a rechazar la honestidad de la moneda? Esta pregunta nos conduce a la
verdadera proporci6n de caras y cruces no puede conocerse porque el universo 0 parte crucial del problema de la inferencia estadistica. Se ha visto que cuanto mas
poblaci6n es ilimitado. raro 0 infrecuente sea el suceso, mayor sera nuestra tendencia a buscar una ex
EI hecho de que no pueda conocerse el uerdadero valor no nos impide tratar plicaci6n no aleatoria al mismo. Al obtener 6 caras en 10 lanzamientos de la
de hacer una estimaci6n. Ya se ha indicado anteriormente que dado que las po moneda, no sentimos la necesidad de hallar una explicaci6n a su desvio de un
blaciones s610 en raras ocasiones pueden ser estudiadas exhaustivamente, tenemos resultado de 5 caras y 5 cruces que no sea la de que este desvio ocurre con
que depender de las muestras para estimar los parametres. frecuencia «por azar». Sin embargo, cuando obtenemos 9 caras dudamos mucho
204 ESTADiSTICA PARA LAS CIENCIAS SOCIALES INTRODUCCION A LA INFERENCIA ESTADfSTICA 205
de la honestidad de la moneda. Nueve caras en 10 lanzamientos es un suceso Por tanto, la probabilidad bilateral de un suceso tan raro como 9 caras en 10 lan
tan raro que comenzamos a sospechar que la explicacion debe encontrarse mas zamientos es 2(0.010 + 0.001) = 0.022 0 2.2 %.
en las caracteristicas de la moneda que en las llamadas «leyes del azar». La pregunta Utilizando el nivel de significacion de 0.05 (C( = 0.05), deberiamos deducir que
crucial es i,donde trazamos la linea que determina la inferencia que hagamos la moneda es sesgada (0 sea que los resultados se deben a factores no aleatorios).
respecto a la moneda? Sin embargo, si usamos el nivel de significacion de 0.01 (C( = 0.01), no podriamos
La respuesta a esta pregunta revela la naturaleza basica de la ciencia: su orien afirmar que estos resultados se deben a facto res no aleatorios.
tacion mas bien probabilistica que absoluta. En las ciencias sociales, la mayoria Debe seiialarse e insistir en que no es admisible que el lector realice un es
de los investigadores han adoptado como base para inferir la intervene ion de fac tudio, analice los resultados, llegue a un valor de probabilidad y luego decida
tores no aleatorios, uno de los dos puntos de separacion siguientes: el nivel a. Este nivel debe especificarse previamente al estudio como una parte de la
1. Cuando el suceso, u otro que represente una mayor desviacion, ocurre por azar el estrategia general del diseiio del experimento.
5 % 0 menos de las veces, algunos investigadores estan dispuestos a afirmar que
los resultados se deben a factores ajenos al azar. A esto se le llama el nivel de
siqnificacion de 0.05, 0 el nivel de siqnificacion del 5 ~~.
2. Cuando el suceso, u otro que representa una mayor desviacion, ocurre por azar el
11.4 Examen estadistico de hipotesis:
1 % de las veces 0 menos, otros investigadores estan dipuestos a afirmar que los hipotesis nula e hipotesis alternativa
resultados se deben a facto res ajenos al azar. A esto se Ie llama el nioel de
siqnificacion de 0.01, 0 el nivel de siqnificacion del 1.00 %.
Al llegar a este punto, muchos estudiantes se sienten desilusionados por la na
El nivel de significacion adoptado por el investigador para inferir la intervencion turaleza arbitraria de la toma de decisiones en la ciencia. Examinemos un poco
"de facto res no aleatorios es conocido como nivel alfa (C(). Asi, cuando empleamos mas la logica de la inferencia estadistica y veamos si es po sible despejar algunas
el nivel de significacion de 0.05, C( = 0.05; Y si se emplea el nivel de significacion de las dudas. Antes de comenzar cualquier experimento, el investigador establece
de 0.01, C( = 0.01. dos hipotesis mutuamente excluyentes:
Para determinar en el experimento de la moneda si los resultados se deben
a facto res no aleatorios, necesitamos calcular la probabilidad de obtener un suceso La hipotesis nula (H 0), que especifica valores hipoteticos para uno 0 mas de los
tan raro como 9 caras en 10 lanzamientos. Para determinar la rareza de un suceso, parametres poblacionales.
hemos de considerar el hecho de que el suceso raro puede ocurrir en ambos La hipotesis alternatina (HI), donde se afirma que el parametro poblacional
sen tid os (por ejemplo 9 cruces y 1 cara) y que ello incluye sucesos mas extremos. tiene un valor distinto al hipotetico.
En otras palabras, la probabilidad de un suceso tan raro como 9 caras en 10 lan
zamientos es igual a En el presente experirnento de la moneda, estas dos hipotesis son:
Asi, Ocasionalmente, HIes direccional 0 unilateral. En este caso, ademas de indicar que
el para metro poblacional es diferente del hipotetico, sefiala la direccion de la dife
p(9 caras) + p(lO caras) + p(l cara) + p(O caras) rencia (por ejemplo, P > Q 0 P < Q).
= 2 [p(9 caras) + p(lO caras)].
1 evaluar el resultado de un experirnento, se deben emplear los valores unilate
ales de probabilidad cuando la hipotesis aIternativa sea direccional.
Estos valores de p pueden obtenerse de la fig. 11.1 como sigue:
Ademas, cuando la hipotesis aIternativa es direccional, tambien 10 es la hipo
sis nula. Por ejemplo, si la hipotesis alternativa es P > Q, la hipotesis nula sera
p(9 caras) = 0.010, y p(10 caras) = 0.001. ~ Q. Reciprocamente, si HIes P < Q, H 0 sera P ~ Q.
206 ESTAOfSTICA PARA LAS CIENCIAS SOCIALES INTROOUCCI6N A LA INFERENCIA ESTAOfSTICA 207
11.4.1 La nocion de prueba indirecta Por las razones mencionadas anteriormente, el eminente estadistico ingles R. A.
Fisher dijo: hi .
Un analisis cuidadoso de la 16gica de la inferencia estadistica revel a que la hipotesis En relaci6n a cualquier experimento, podemos hablar de esta ipotesis c~mo
nula no puede probarse nunca. Por ejemplo, si hubiesernos obtenido 5 caras en la «hipotesis nula», y debe notarse que la hip6tesis nula nunca. se prueba m se
10 lanzamientos de una moneda, wrobaria esto que la moneda no es sesgada? t blece pero es po sible rechazarla en el transcurso del expenmento. Se puede
La respuesta es un categ6rico «[no l». Un sesgo, si es que existe, puede tener una ~:c~r que'todo experimento existe solamente con el proposito de dar a los hechos una
magnitud tan pequeiia, que no podarnos detectarlo en 10 lanzamientos. Pero, oportunidad de rechazar la hipotesis nula",
~que pasa si lanzamos la moneda 100 veces y obtenemos 50 caras? ~Este resultado
no probaria ya algo? De nuevo, son valid as las mismas consideraciones. No im
porta cuantas veces lancemos la moneda, jarnas lograremos agotar la poblaci6n
de los resultados posibles. Podemos afirmar, sin embargo, que no existe funda 11.5 Examen estadfstico de hipotesis:
mento para rechazar la hip6tesis de que la moneda no es perfecta.
Entonces, ~c6mo podemos probar la hip6tesis alternativa de que la moneda
los dos tipos de error
es sesgada? Una vez mas, no podemos demostrar directamente la validez de la
hip6tesis alternativa. Pensemos por el momenta en la 16gica implicada en el si Podemos preguntarnos ahora, «~no corremos el riesgo de equivoc.arnos al rechazar
guiente problema. la hip6tesis nula? ~No es posible que de hecho hayamos obtemdo por azar una
Dibujense dos segmentos rectilineos y determinese si sus longitudes son diferentes. rara ocurrencia estadistica?»,
Al compararlas se dice: «Bien, en verdad no son iguales. Por tanto, deben tener La respuesta a esta pregunta debe ser un sencillo y mode~to .«Si». Esto ~s
longitudes diferentes», Al rechazar la igualdad (que en este caso es la hip6tesis precisamente 10 que queremos decir cuando afirrr~am?~ que la ciencia es probabi
nula) se afirma que existe una diferencia.. listica. Si existe algun enunciado absoluto que los cientificos tengan derecho a hacer,
La 16gica estadistica opera exactamente del mismo modo. No podemos pro bar es que no podemos asegurar jamas con una confia~za absoluta ~ue ?uestr?s .des
la hip6tesis nula, ni tarnpoco podemos pro bar directamente la hip6tesis alterna cubrimientos 0 proposiciones son verdaderas, Existen en I~s crencias . mu~tIples
tiva. Sin embargo, si podemos rechazar la hip6tesis nula, podemos afirmar la ejemplos en los que se ha tenido que ~odifica~ una. conclusion en apanencia fir
validez de su alternativa, 0 sea que el pararnetro poblacional tiene un valor dis memente establecida en vista de posteriores evidencias,
tinto al valor hipotetico, Aplicado al problema de la moneda, si podemos re En el experirnento de la moneda, aunque todos los lanzamientos hubiesen re
chazar la hip6tesis nul a de que P = Q = t, podremos asegurar la validez de la sultado caras es todavia posible que la moneda .no sea sesgada. Por azar, una
hip6tesis alternativa, 0 sea P i= Q i= t. N6tese que el apoyo a la hip6tesis alter vez de cada 1024 experimentos «en prornedio», se obtendran 1.0 caras en 10 la~
nativa es siempre indirecto. La hemos apoyado rechazando la hip6tesis nula. Por zamientos. Cuando usamos el nivel de confianza de 0.05, aproximadarnente el 5 %
el contrario, puesto que la hip6tesis alternativa no puede ser probada ni rechazada de las veces cometeremos un error al rechazar la hip6tesis nula y aceptar su al
directamente, no podremos probar mmca la hipotesis nula rechazando la hip6tesis al ternativa. .
ternativa. La afirmaci6n mas fuerte que podemos hacer a este respecto es que fra Estos son algunos de los hechos fundamentales en la realidad ~el r~zonamlento
casamos en rechazar la hipotesis nula. En la practica, muchos investigadores usan inductivo a los que el lector debe ajustarse. EI estudi~nte de cIe.ncI.as del com
indistintamente las expresiones «fracasar en rechazar la hipotesis nula» y «aceptar
portamiento que antes de emitir una opini6n sobre algun asunto mSIst~ en tener
la hip6tesis nula»,
una seguridad absoluta del mismo, es un estudiante que ha perman~cIdo mudo
durante muchos aiios y que seguira estandolo par el resto de su vida (proba
~Cuales son entonces las condiciones para rechazar la hip6tesis nula? Sim
plemente estas: utilizando el nivel de significaci6n de 0.05 se rechaza la hip6tesis blemente). , .
Las consideraciones anteriores han llevado a los estadisticos a formular dos
nula cuando un resultado ocurre por azar el 5 % de las veces 0 menos; y usando
tipos de errores que pueden presentarse en la inferencia estadistica.
el nivel de significaci6n de 0.01, se rechaza la hip6tesis nula cuando un resul
tado dado ocurre por azar el 1 % de las .veces 0 menos. En estas circunstancias
se acepta, por supuesto, la hip6tesis alternativa.
11.5.1 Error de tipo I (error de tipo a)
En otras palabras, se rechaza la hip6tesis nula cuando los resultados ocurren
par azar el 5 % de las veces 0 menos (0 el 1 % de las veces 0 menos), suponien En un error de tipo I, rechazamos la hip6tesis nula cuando e.n realidad e.s v~r~
do que la verdadera distribucion es la que corresponde a la hipotesis nula. Esto es, dadera. La probabilidad de cometer un error tipo I es a. Ante.no~~en~~ se indico
se supone que la hip6tesis nula es verdadera, se ca1cula la probabilidad en base ue si establecemos nuestro punta de rechazo en el nivel de significacion de 0.05,
a est a suposici6n y, si la probabilidad es pequeiia, se rechaza 10 supuesto.
-----. (EI subrayado es nuestro). Fisher, R. A., The Design of Experiments. Edinburgh: Oliver & Boyd, 1935, pogo 16.
208 ESTADISTICA PARA LAS CIENCIAS SOCIALES
INTRODUCCI6N A LA INFERENCIA ESTADfsTICA 209
rechazaremos err6neamente H 0 aproximadamente el 5 % de las veces. Pareceria Tabla 11.2 Tipo de error cometido, te
niendo en cuenta el estado real de H o y la ESTADO REAL DE Ho
entonces que para evitar este tipo de error deberiamos elegir el nivel de rechazo
10 mas bajo posible. Por ejemplo, si tomararnos ex = 0.001, el riesgo de cometer decision estadistica tomada. A modo de
[lustracicn, si Hoes verdadera (colum Ho Ho
un error de tipo I seria aproximadamente s6lo de un caso en cada mil. Debe na 1) y rechazamos H o (fila 2), cometemos
VERDADERA FALSA
advertirse que el nivelde 0.05 es de uso casi rutinario en las ciencias sociales un error de tipo I. Si Hoes falsa (columna 2)
Corrects Error tipo II
y del comportamiento, y puede utilizarse a menos que haya una raz6n particular y rechazamos H o' nuestra decision es co A Cept ar Ho
1 C( p
para. ser extrem~damente precavido ante el hecho de cometer error de tipo 1. rrecta.
Decision
Supongase, por ejernplo, que estamos comparando un metodo de enseiianza comple { Error tipo I Correcla
Rechazar H o
tamente nuevo con otro metodo clasico. Admitase tarnbien que la hipotesis nula sea C( 1-P
realmente verdadera, 0 sea, que no existe diferencia entre ambos metodos. Si se
cometiera un error de tipo I y la hipotesis nula fuera indebidamente rechazada cabe = 005 examen bilateral. Se obtuvo p = 0.03, valor bilateral.
H o.. /1 1 -- /1 2, N
CA. .,
imaginar que ello conducina a la sustitucion del rnetodn habitual de ensefianza, con Decision estadistica: Hoes falsa. Estado real de H 0: Verdadera.
mejor, En casos como este, pudiera ser que deseasernos fijar un nivel de confianza
mas conservador (por ejernplo, ex = 0.01). Para que ellector se familiarice con el uso = /12, ex = 0.05, examen bilateral. Se obtuvo p = 0.04, valor bilateral.
H o : /11
de ambos niveles ex, hemos usado arbitrariamente ex = 0.01 y ex = 0.05 en los Decisi6n estadistica: H o es falsa. Estado real de H o : Falsa.
ejemplos que se presentan en el texto. Sin embargo, hay que tener presente que Error: No se ha cometido ningun error. Se lIeg6 a una conclusi6n correcta
cuanto menor tomemos ex, mayor sera la probabilidad de co meter un error de tipo II. puesto que Hoes falsa y la decisi6n estadistica fue de que Hoes falsa.
H o : /11
11.5.2 Error de tipo II (error de tipo {3) Decisi6n estadistica: no se puede rechazar H o- Estado real de H 0: Falsa.
error es mas frecuente que el de tipo 1. Por ejernplo, si usamos el nivel de sig
nificaci6n de 0.01 como base para rechazar la hip6tesis nula, y luego realizamos Error: No se ha cometido ningun error ya que la decisi6n estadistica fue
un experimento en que el resultado obtenido podria haber ocurrido por azar la de rechazar H 0 siendo realmente falsa.
solamente en el 2 % de las veces, no podemos rechazar la hipotesis nula. En con Cabe ahora preguntarse: «l.Como podemos saber, en la practica, si se esta
secuencia, no podemos afirmar que existe un efecto experimental, aunque en rea cometiendo un error de tipo lode tipo II?» La respuesta es sencilla: [No po
lidad pudiera ser asi,
demos! Si se examina una vez mas la 16gica de la inferencia estadistica vere
Queda claro, entonces, que cuanto menor sea el nivel de rechazo, menor sera
mos por que. Ya se ha dicho que, salvo raras excepciones, ~o co?ocemos 0 n?
la probabilidad de cometer un error de tipo I, y mayor sera la probabilidad
podremos conocer los verdaderos parametres de una poblacion. Sin este c?nocl
de cometer un error de tipo II. A la inversa, cuanto mayor sea el nivel de rechazo,
mien to, l.c6mo es posible saber si los estadigrafos muestrales se han apro~lI~ad~
mayor sera la probabilidad de cometer un error de tipo I, y menor sera la
o no al valor real? l.C6mo se puede saber si hemos rechazado, 0 no; una hipotesis
probabilidad de cometer un error de tipo II.
ula equivocadamente? Si conocierarnos el valor. poblacional, podriam?s .saber si
El hecho de que el nivel de rechazo se tome tan bajo es una muestra del hemos cometido 0 no un error; pero, en tales circunstancias queda ehmmada la
espiritu precavido de los cientificos, quienes prefieren cometer un error al dejar
necesidad de emplear un estadigrafo muestral. Tomamos muestras y hacemos in
de proclamar un resultado, que cometerlo al recabar un resultado equivocado.
ferencias a partir de elIas solamente porque los valores poblacionales .nos son
La tabla 11.2 resume los tipos de error cometido, teniendo en cuenta el estado desconocidos por una u otra raz6n. Cuando dichos valores son conocidos, no
real de la hip6tesis nula y la decisi6n tomada. Debe notarse que los errores de
existe la necesidad de una inferencia estadistica.
tipo I y tipo II son errores muestrales y se refieren a muestras tomadas de pobla
ciones hipoteticas, l.No hay manera entonces de saber que experimentos proporci~n.an resu!tad~s
significativos y precisos y cuales no? La respuesta es un «Si» condicional, SI repi
Veamos algunos ejemplos en los que, con fines ilustrativos, damos la siguiente
tieramos el experimento y obtuvieramos resultados similares, tendriamos mayor
informacion relativa a la poblacion en estudio: H o, nivel ex, p obtenida, decision
confianza de no estar cometiendoun error de tipo 1. Por ejemplo, si hicierarnos
estadistica tomada y estado real de H o. Sefialernos el tipo de error cometido,
si ha habido alguno. una segunda serie de 10 lanzamientos de nuestra moneda y obtuvierarnos 9 car~s,
nos sentiriamos mas inclinados a creer que la moneda es sesgada. Entre paren
INTRODUCCION A LA INFERENCIA ESTADfsTICA 211
210 ESTADfsTICA PARA LAS CIENCIAS SOCIALES
tesis, la repeticion de los experimentos es una de las areas mas debiles de la Terminos para recordar
investigacion en las ciencias sociales. La actitud general es la de que un estudio
no es bueno a menos que sea «diferente» y constituya por tanto una nueva con I,ipotesis nula (Ho )
tribuci6n. Con frecuencia, la repetici6n de los experimentos, si es que se !leva a distribucion binomial
distribucion muestral muestra
cabo, no se publica. En consecuencia, podemos sentimos seguros de que en los
estudios donde se emplea un nivel de significacion de 0.05, aproxirnadamente error de tipo I( error de tipo rx) nivel alfa [a]
en uno de cada 20 se comete un error de tipo I al rechazar la hip6tesis nula*. error de tipo II (ermr de tipo P) nivel de significacion
hipotesis alternativa ( HI) poblacion
valor de probabilidad bilateral
hiplJtesis direccional
Resumen del capitulo hipotesis no direccional
valor de probabilidad unilateral
Tipo II: dejar de rechazar (<<aceptar») la hip6tesis nula siendo falsa. ldentifiquese HoY HI en los sigui~ntes ~asos:
a) La media poblacional en inteligencia es 100. ' . 0 50
El sentido precavido de los cientificos determina que hayan establecido un bajo b) La proporcion de dernocratas .en un condado no es igual a . .
nivelde significacion, 10 que les hace co meter con mayor frecuencia errores de e) La media poblacional en intehgencla no es igual a .100. 50
tipo II que de tipo I. d) La proporcion de dernocratas en un condado es igual a O. .
Sin repetir los experimentos carecemos de base para saber cuando se ha cornetido
7. Suponga el lector que es un jefe de persona~ a quie~ corresponde ~~:~:;;~~~ la pro
un error de tipo I, y aun con la repetici6n no podernos recabar el conocimiento de la rnocion de un empleado a un nivcl ejecutivo superior. i,Que !l~0 de error?
verdad absoluta. a) la hipotesis de que esta capacitado (H 0) se acepta .erroneame~te.
Por ultimo, y esto es quizas 10 mas importante, hemos visto que el cono b) la hipotesis de que esta capacitado se rechaza erroneamente.
cimiento cientifico es probabilistico y no absoluto. c) la hipotesis de que esta capacitado se acepta correctamente?
• La proporcion es probablemente mayor. porque nuestros rnetodos de aceptacion de los informes de investigaciones
d) la hipotesis de que esta capacitado se rechaza correctamente?
. d rente la compra 0 la venta de ac
8. Un analista del mercado de valores re~o:len a a s~e~ ~alor futuro de las mismas. i,Que
para su publicacion dependen mucho de la significacion estadistica de los resultados. Asi, si se lIevaran a cabo
independienternente cuatro estudios identic os y solamente en uno se obtuvieran resultados que perrnitieran rechazar la
nipotesis nula, seria este lrabajo el que tendria mayor posibiJidad de ser publicado. Virtualrnente no hay manera de que ciones segun las hipotesis que haya formu a 0 aeerca. . ., d ?
los cientificos conozcan en general los tres estudios en que no se pudo rechazar la hipotesis nula. tipo de error cornete si declara 10 que sigue en las condIciones indica as.
INTRODUCCION A LA INFERENCIA ESTADiSTlCA
213
212 ESTADISTICA PARA LAS CIENCIAS SOCIALES
tiene un valor p de 0.02 y deja de rechazar H o. Discutase: ~Es mas probable que este acep
Estado real de Il «: Verdadero. .
en uno bilateral?
14. Para rechazar la hipotesis nula en un examen estadistico unilateral, ~se tienen en cuenta
I)) 15. Supongase que se desea examinar estadisticamente la hipotesis de que no hay igual nu
mero de hombres y de mujeres en los cargos ejecutivos de una gran empresa. La hipotesis
nula apropiada seria:
a) Hay mas mujeres que hombres en los cargos ejecutivos.
16. Supongase que un experto en eliciencia encuentra una diferencia signilicativa entre el
tiempo que tardan las personas en leer un dial circular y el que tardan en leer uno rec
tangular. Aunque o: == 0.05 y rY. == 0.01 se consideran normalmente como niveles de significa
cion aceptables, esta eleccion es arbitraria. Para cada uno de los siguientes niveles de sig
nificacion, indiquese cuantas veces de cada 1000 se espera que esta diferencia ocurra por
azar.
17. Con referencia al ejercicio 16, indicar a que nivel de significacion sedan mas probables
los siguientes enunciados:
a) Existe una diferencia significativa entre los tiempos de lectura de ambos diales.
con mayor probabilidad a los siguientes errores. Identificar el tipo de cada error.
a) Hay una diferencia significativa entre los tiempos de lectura de ambos diales. Realidad :
No hay diferencia.
los tiempos de lectura de los dos diales. Realidad: Hay una diferencia.
p
0.10
0.05
0.00 '-----.........
o 2 3 456
0.15
.Que comparaci6n puede hacerse entre la media de cada distribuci6n muestral
p de medias y la media de la poblaci6n de la cual proceden las muestras?
~C6mo cambia la variabilidad 0 la dispersi6n de las medias muestra~es ~ua~~o
0.10 incrementarnos el tarnafio de las muestras en que se basa cada distribucion
muestral?
0.05 Compare ahora sus respuestas con las nuestras:
La media de la poblaci6n forrnada por cuatro numeros es, 4.5. La ~edia de
0.00 cada una de las distribuciones muestrales de las medias es 4.5. ASI, la media de una
0 1.5 3.0 4.5 6.0 7.5 9.0 distribuci6n muestral de medias es igual a la media de la poblaci6~ de donde
MEDIA MUESTRAL provienen las muestras. Esto es valido para todos los valores posibles de N.
(a) Figura 12.1
216 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
INFERENCIA ESTADfSTICA Y VARIABLES CONTINUAS 217
C3
(2.37)
extremos de la media muestral es menor a medida que N crece. Puesto que la
~(1.94)
z
desviaci6n estandar es una funci6n directa del numero de valores extremos (ver
~
en 2.00
w
tamano de la muestra.
3 54 0.054
4 242 0.242
5 400 0.400
6 242 0.242
12.2 Distribuci6n muestral de la media 7 54 0.054
B 4 0.004
Imaginemos que se esta llevando a cabo un experimento muestral en N = 1000 I)(X) = 1.000
extraemos al azar (con reposici6n)* una muestra de d o ' d el ~~e
en la ue - 500 s numeros e una poblacion
q Il - . Y (J = 0.99 (ver tabla 12.1). Por ejemplo, podriamos obtener los
• Esta notaci6n representa la desviaei6n estandar de una dislribuci6n muestral de medias. Se refiere a un
• Si la poblaci6n es inlinita 0 muy grande la djferenci I eoneepto puramente te6rieo, pues con un nurnero inlinito de medias muestrales no es po sible asignar un valor
• J erencia entre e muestreo, con 0 sin reposicion, es despreciable.
espeeltico al mimero de medias muestrales involueradas.
218 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
. INFERENCIA ESTADfsTICA Y VARIABLES CONTINUAS 219
claro que ~onforme aumente el tarnano de la muestra disrninuirn la variabilidad distribucion de las medias muestrales tiende a convertirse en una distribucion
de las medias muestrales.
normal con media u, oarianza (J2jN yierror estdndar (Jjp.
Si realmente s~ efectuasen estos experimentos muestrales, se obtendrian las
curvas de Irecuencias que se representan en la fig. 12.3. Simb6licamente,
(12.1)
N= 15
N= 5 y
N= 2 (J'
os = ;N' (12.2)
Recuadro 12.1
5' 152
Construyamos ahora una distribucion de freeuencias de estas varianzas y ealculemos
la varianza media.
4.50 2 9.00
2.00 4 8.00
0.50 6 3.00
52
152 0.00 4 0.00
muestral hipotetica de las medias muestrales esta asociada con cualquier media mues
no ses ado de la varianza (82 ) como el mejor estimador que tenem~s ~ara.}a
tral. Esta distribucion tiene una media us Y una desviacion estandar ax.
acionar,I ASI' , la formula para determinar la varianza de la distribucion
. g po blaci
vananza
Hasta ahora, para obtener los valores de /lx Y ax hemos tenido que conocer /l y a.
uestral de la media a partir de datos muestrales es
En el caso de no conocer los valores exactos de los parametres, nos vemos m -2
obligados a estimar los valores de /l y a mediante estadigrafos calculados a . 2 S
aJe estImada = Sx = N' (12.6)
partir de datos muestrales. Ya que en la practica rara vez tomamos mas de una
muestra, nuestras estimaciones se basan generalmente en los estadigrafos calculados Estimamos eI error estandar de la media extrayendo la raiz cuadrada de este valor:
mediante una sola muestra. Tales estimaciones en las que se usan los valores de una
sola muestra reciben el nombre de estimaciones puntuales.
. 8 fF
ax estimado = sx = '.) N = )N' (12.7)
ax estimado = ss = ~ =
s
'IN -1
~)X - X? _
N(N - 1) -
SC
N(N - 1)
. (12.8)* J
2 Dx-xy
s ==---- La formula (12.8) es la que se emplea mas frecuente~ente en las cienc~as del
N .comportamiento para estimar el error estandar de la media. Nosotros seguiremos
y se obtuvo la desviacion estan dar s hallando la raiz cuadrada de este valor. esta practica, d tili do
Estas definiciones son perfectamente apropiadas cuando se trata solamente de Antes de proseguir, revisemos los simbolos que. hemo~ esta 0 u I.Iz~n .
describir la variabilidad de una muestra. Sin embargo, cuando 10 que interesa es E I tabla 122 se presentan los simbolos para las medias, vananzas y.desvIaclOnes
estimar la varianza poblacional a partir de los valores muestrales encontramos es~a~dar, seg~n se trate de los parametres poblacionales, de los estimadores no
que la definicion anterior es inadecuada, ya que DX - X)2/N tiende en promedio a sesgados 0 de estadigrafos muestrales.
subestimar la varianza poblacional. En otras palabras, es un estimador sesgado
de la varianza poblacional, siendo necesario disponer de un estimador no sesgado.
Definiremos un estimador no sesgado como aquel que es igual, en promedio, ESTIMADORES
POBLACIONALES
al valor del pararnetro, Esto es, cuando afirmamos que un estadigrafo es un PARAMETROS NO SESGADOS
DE LA PARA LA
estimador no sesgado, estamos diciendo que la media de la distribucion de un mi DISTRIBUCION DISTRIBUCION
me TO muy grande de estadigrafos muestrales, calculados mediante muestras PARAMETROS MUESTRAL MUESTRAL ESTADIG RAFOS
POBLACIONALES DE LA MEDIA DE LA MEDIA MUESTRALES
provenientes de una poblacion dada, tiende a centrarse en el correspondiente
(TEOIilICOS) (TEORICOS) (EMPIRICOS) (EMPIRICOS)
valor del parametro, Se ha demostrado (recuadro 12.1) que es posible obtener un
Estimador no sesgado de a 2 = 82 =
l)X _X)2
N _ 1 . • La siguiente demostracion algebraica prueba como se llega a este estimador de a.. :
(12.4)
I(X -X)'
5C 52 = 1
Y 5= N
multiplicando ambos miembros de la ecuacion por N/IN - I) obtenemos
N NI(X - X)' _,
a estimada = 8 = p. (12.5)
- - 52
N -I
=
N(N-I)
=5 Ever formula (12.4)]
Asi, segun formula (12.7),
12.5 Examen estadistico de hipotesis con parametres se usa el estadigrafo z, la distribuci6n muestral apro'pia~a es la curv~ normal
desconocidos: la t de Student estandar. Para el estadigrafo t hay una familia de distribuciones que vanan como
una funci6n de los grados de libertad (gl). .
EI terrnino «grados de libertad» se refiere al nurnero de valores que son hbres
Anteriormente indicamos que cuando los parametres de una poblaci6n son cono
de variar una vez que se han impuesto ciertas restricciones a los datos. A modo ~e
cidos, es posible describir la forma de la distribuci6n de las medias muestrales.
ilustraci6n, consideremos los numeros 18, 23, Z7 y 32. Su suma es 1O? y la media
Sera una distribuci6n normal con ax igual a a/JN. Empleando la relaci6n entre
X = 100/4 = 25. Recordemos que si de cada nume~o restamos la ~edia tendremos
la escala z y la distribuci6n normal, podemos examinar estadisticamente hip6tesis
usando un conjunto de cuatro desviaciones cuya suma es igual a cero. ASI,
X - /10 Generalizando: Para cualquier muestra dada en la que hemos impuesto una sola
restricci6n, el numero de grados de libertad es N - 1. En el ejemplo anterior,
s/~ N = 4; por tanto los grados de libertad son 4 -.1 = 3.
tendera a dispersarse mas que la distribuci6n normal. N6tese que cuando se emplea s/~ [formula (12.8)J ~ara obtener sx, e~
La mayor contribuci6n de Gosset a la estadistica consisti6 en su descripci6n numero (N - 1) bajo el signo radical representa los grados de hbertad. ..
de una familia de distribuciones que permiten el examen de hip6tesis con muestras Anteriormente indicamos que el usa de la t de Student depende de adrnitir que.la
provenientes de poblaciones normalmente distribuidas, euando a es desconocida. poblaci6n basica tiene distribuci6n normal. Esta condici6n provie~e de una. propie
Estas distribuciones se conocen como distribuciones tot de Student. EI cociente dad unica de las distribuciones normales. Dado que las obseroaciones son indepen
empleado en el examen de hip6tesis es conocido como cociente t, y es dientes y aleatorias, las medias muestrales y las oarianzas muestrale.s s~lamente son
independientes cuando la poblacion tiene distribucion 11.0rmal., Como indicamos ante
x- /10 . riormente dos datos 0 estadigrafos son independientes solamente euando los
valores de uno no dependen de los valores del otro ~ viceversa. ~as pruebas
t= , (12.9)
Sg
de significaci6n de las medias requieren que las medias y las van~nzas. s~an
donde /10 es el valor de la media poblacional bajo H o..
independientes entre si, Ellas no pueden variar juntas de una forma. siste:nah~a;
EI estadigrafo t es similar en muchos aspectos a la z anteriormente estudiada. ello ocurriria, por ejemplo, si las varianzas crecieran al crecer las medias. SI vanan
Ambos estadigrafos estan expresados como la desviaci6n de la media muestral
en forma sistematica, la poblaci6n basica no puede ser normal, y las pruebas ~e
respecto a la media poblacional (conocida 0 admitida por hip6tesis) en funci6n significaci6n que se basan en la suposici6n de normalidad .p~eJen quedar sm
del error estandar de la media. Tomando como referencia la distribuci6n muestral validez. Por est a raz6n la suposici6n de normalidad es un requisito para el uso del
apropiada, podemos expresar esta desviaci6n en terrninos de probabiJidad. Cuando cociente t de Student.
228 ESTADisTICA PARA LAS CIENCIAS SOCIALES
INFERENCIA ESTADiSTlCA Y VARIABLES CONTlNUAS 229
. Not~ final: E,l c.ociente t de .Student es un examen fuerte, 10 que significa que las descrita por It I ?: 1.96 incluye aproximadamente ellS por ciento del area total.
l~ferencIas estadisticas son posiblernente validas aun cuando la distribuci6n pobla
En consecuencia, si emplearamos la curva normal para examinar estadisticamente
cional se aparte, m~cho de la .normalidad. Esta fortaleza es otra consecuencia
hip6tesis cuando N es pequefio (y por tanto gl es tambien pequefio) y (J es desconocida,
del teore~a del limite ~entral. SI tenemos serias dudas acerca de la normalidad de
correriamos el serio peligro de co meter un error del tipo I, 0 sea, de rechazar H 0
la poblacion, es aconsejable aumentar el tamafio N de fa muestra.
siendo verdadera. Obviamente, se requiere un valor mucho mayor de t para determi
nar los limites de la region critica 0 de rechazo. Ciertarnente, cuando gl = 3, el valor
absoluto de la t obtenida debe ser igual 0 mayor que 3.18 para rechazar H 0 al
12.5.1 Caracteristicas de las distribuciones t nivel de significacion 0.05 (examen bilateral). Sin embargo, cuando gl crece, las
Comparem~s las caracteristicas de las distribuciones t con las que tiene la curva diferencias en las proporciones de area bajo la curva normal y bajo la distribucion t
n.or~~J estandar que nos es ya familiar. Primero, ambas distribuciones son de Student se hacen insignificantes,
s~metncas respecto a una media de cero. Por tanto, la proporci6n de area A diferencia de nuestra utilizacion de la curva normal, los valores tabulados
sltu,ada a la ~ere~ha ?e un valor pos~tivo particular de t es iguaJ a la proporci6n para t (tabla C, apendice III) son valores criticos, es decir, SOil aquellos valores que
de area a la izquierda del correspondiente valor negativo de t. limitan las regiones de rechazo correspondientes a varios niveles de siqnificacion.
Segundovlas distribuciones t son mas dispersas que la curva normal. En Asi, al usar la tabla de las distribuciones t, localizamos en la columna de la
consecuencia, l~, proporcion d,e are~ mas alla de un valor especifico de t es mayor izquierda el numero adecuado de grados de libertad, y encontramos luego en la
que la proporcion de area mas aH~ del valor correspondiente de z. Sin embargo, columna correspondiente el rt. elegido. Los valores tabulados representan el valor
cua~to mayores sean los grados de libertad, mayor sera la semejanza entre las distri de t requerido para la significaci6n. Si el valor absoluto del cociente t obtenido es
buciones t ~ l~ cu~va normal estandar, Para que pueda apreciarse la diferencia igual 0 mayor que este valor, podemos rechazar H o
entre l~s dlstnbuclO?es. t ~ la curva normal, hemos representado tres curvas
en la fig, 12.5: las distribuciones muestraJes de t cuando gl = 3, Y gl = 10 la
curva normal. ' y 12.5.2 Problema ilustrativo: la t de Student
Un exa~en de la fig. 12.5 permite hacer varias observaciones interesantes. Exarninemos ahora un caso hipotetico referente a una muestra pequefia,
Ya hemos VI~tO que,~n .la cu.r,va normal estandar, Izi
?: 1.96 define la region de A un grupo de 17 estudiantes de cuarto afio de bachillerato, seleccionados
rechazo al myel de significacionOjjy, Sin embargo, cuando gl = 3, una regi6n
basandose en su expresado «interes» por la ciencia, se les aplic6 una prueba
para medir su conocimiento de los conceptos cientificos basicos. La prueba fue
gl = 3
ideada para obtener una distribucion normal con una media igual a 78 al ser
aplicada a alumnos de cuarto afio, Los resultados del estudio fueron
~Es razonable adrnitir que estos alumnos de cuarto afio son representativos
de una poblacion en la que 11 = 78?
Planteemos este problema en terrninos estadisticos mas formales.
1. Hipotesis nula (H o): La media de la poblaci6n de la cual proviene la muestra
es igual a 78 (11 = 110 = 78).
2. Hipotesis alternatiua (HI): La media de la poblaci6n de la cual proviene la
I
muestra no es igual a 78 (11 #- 110)' [Nota: Esta es una alternativa no direccional.J
3. Examen estadlstico: Se elige el cociente t de Student porque estamos tratando
con una variable normal mente distribuida en la que se desconoce (J.
4. N ivel de siqnificacion: rt. = 0.05.
z
5. Distribucion muestral: La distribucion muestral es la distribucion t de Student
con gl = 16. [Nota: gl = N - 1.J
Fig. 12.5 Distribuciones muestrales de t = (X - uo);'~7: cuando gl = 3 y gl = 10 .co d
con la curva normal estandar. ' mpara as 6. Region critica: Ito.051 ?: 2.12. Puesto que HI es no direccional, la region critica
consta de todos los valores de t tales que t ?: 2.12 Y t ,:::; -2.12.
230 ESTADisTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADisTICA Y VARIABLES CONTINUAS 231
En el presente ejemplo, el valor de t correspondiente a X = 84 es vacilar ligeramente, «Bien, quizas su peso se encuentre entre 85 y 115 kilos.
De cualquier modo, estoy completamente segura de que su verdadero peso esta
t =
x - flo = 84 - 78
= 1.50. entre 80 y 120 kilos». Notese que cuanto mayor sea el tamafio del intervalo,
Sx 16/JI6 mayor confianza tendremos de que el verdadero valor este comprendido entre estos
!imites. Notese tambien que al establecer estos !imites de confianza estamos
Decision Puesto que la t obtenida no cae en la region critica (esto es, 1.50 < to,os), haciendo dos cosas: (1) establecemos los !imites entre los cuales creemos que se
no podemos rechazar H o- En otras palabras, no tenemos justificacion estadistica encuentra el verdadero peso del individuo, y (2) rechazamos la posibilidad de que su
para creer que esta muestra proviene de una poblacion en la que la media tiene un verdadero peso este fuera de estos !imites. Asi, si alguien pregunta, «l.Se puede
valor diferente a 78. concebir que este hombre pese mas de 130 kilos 0 menos de 70 kilos 'l», nuestra
respuesta seria negativa.
Hem~s visto que la IJo1~dia de la.~istribuci6~ de las medias muestrales (fly) es igual Igualmente, para el limite inferior
a la media ~e la poblacion. T~mbl~n se ha VIStO que, puesto que para cualquier N
dado, es posible deterrninar cuan alejadas es probable que esten las medias muestrales limite inferior flo = X- to.0 5(Sy ). (12.11)
de cualquier valor dado 0 hipotetico de u, podemos determinar tarnbien la
probabilidad de que una X particular provenga de una' poblaci6n con media flo, Para obtener los Iimites del intervalo de confianza del 99 por ciento, sustituimos
donde flo representa el valor de la media poblacional bajo R o. Ahora bien, simplemente t o.O! en las formulas anteriores.
dado que no conocemos el valor de la media poblacional, quedamos Iibres para Notese que estas formulas se derivan algebraicamente de la formula (12.9):
formular cualquier valor que deseemos.
Debe quedar claro que podriamos considerar un numero ilimitado de hip6tesis . X- flo
referentes a la media poblacional y a continuacion rechazarlas, 0 dejar de rechazarlas t o.05 = SJ{ , por tanto flo = X- t o.05(sx).
basim?ose en la magnitud ~e los cocientes t. Por ejemplo, en el problema present~
seleccionarnos algunas medias poblacionales hipoteticas. Podemos usar el nivel de Empleando la formula (12.10), hallamos que en el problema anterior el limite
significaci6n de 0.05 (examen estadistico bilateral), y examinar la hip6tesis de que superior del intervalo de confianza del 95 p'or 100 es
flo = 98. EI valor de t correspondiente a X = 108 es
108 - 100 .
Habiendo encontrado que los Iimites inferior y superior son 101.82 y 114.18,
t = 3 = 2.667.
respectivamente, podemos lIegar a la siguiente conclusion: Basandose en la media
y en la desviacion estandar halladas, que fueron calculadas a partir de valores
Puesto que 2.667 > t o.05 (0 2.060), podemos rechazar la hip6tesis de que la obtenidos de una poblacion cuya media es desconocida, afirmamos que es pro
media poblacional es 100. bable que la media poblacional se halle dentro del intervalo que hemos esta
Si formulamos la hip6tesis de que flo = 102, la t resultante es 2.000, valor que es blecido.
menor que t o.05· En consecuencia, podemos considerar como admisible la hipotesis Haremos algunas advertencias en cuanto a la interpretacion del intervalo de
flo .~ ~02 ..Analogamente, cal~~lando los valores apropiados de t, hallariamos que confianza. AI establecer el intervalo dentro del cual creemos que se halla la media
la hipotesis flo = 114 es adrnisible, en tanto que para valores mayores que 114 las poblacional, no se ha establecido ninguna probabilidad de que la media obtenida
hipotesis no son admisibles. Asi, X = 108 proviene probablemente de una poblacion sea la correcta. En otras palabras, no podemos afirmar que las probabilidades
cuya ~edia se halla en el intervalo 102-114 (notese que estos Iimites, 102 y 114, son son de 95 en 100 de que la media poblacional sea igual a 108. Nuestras afirmaciones
aproximados pues ~e trata de los enteros mas cercanos). Se puede rechazar la son validas solamente respecto al intervalo y no respecto a cualquier valor
hipotesis de que X = 108 proviene de una poblacion con fl < 102 0 fl > 114, particular de la media muestral. Ademas, puesto que la media poblacional es un
a un nivel de significacion de 0.05. AI intervalo en el cual se halla probablemente valor fijo y no tiene una distribucion, nuestras afirmaciones de probabilidad
la media poblacional se Ie llama interoalo de confianza, y a los extremos de este nunca se refieren a fl.
intervalo, limites de corfianza. Puesto que hemos estado empleando rx = 0.05, La probabilidad de que hablamos se refiere al intervalo, 0 sea, a la probabilidad
lollamaremos interualo de confianza del 95 por ciento. Analogarnente, si emplearamos de que el intervalo contenga a fl.
rx = 0.01, podriamos obtener el interoalo de confianza del 99 por ciento. Finalmente, al establecer el intervalo de confianza de la media, no estamos
No es necesario efectuar todos los calculos anteriores para obtener los Iimites indicando que la probabilidad de que el intervalo particular que hemos hallado
de confianza. Podemos calcular directamente los Iimites exactos del intervalo de .contenga a la media poblacional es de 0.95. Debe quedar claro que si tornaramos
confianza del 95 por ciento. Estos Iimites son: varias muestras de una poblacion, la media muestral y la desviacion estandar
variarian de muestra a muestra. En consecuencia, los intervalos de confianza
limite superior flo = X + t o.05(Sy ). (12.10) tambien variarian de una a otra. AI establecer el intervalo de confianza del
INFERENCIA ESTADfSTICA Y VARIABLES CONTINUAS 235
234 ESTADfsTICA PARA LAS CIENCIAS SOCIALES
95 por ciento para fa media, 10 que estamos diciendo es que si de una poblaci6n
12.8.1 .Examen estadistico de H 0: p = 0
se tomaran repetidas muestras de un tamafio dado, el 95 por ciento de los intervalos Para examinar la hipotesis nula c!.tC que e1 coeficiente de corre1aci6n poblacional
calculados inc1uirian a la media poblacional. es igual acero, se puede usar la v~ariable
(12. J 2)
12.8 Ensayo de la significacion para
la r de Pearson: caso de una sola muestra EI numero de grados de libertad en este caso es igual a N - 2.
Veamos un ejemplo i1ustrativo: Un grupo de psicologos sociales desarroll6
En el capitulo 8 se estudi6 el calculo de dos estadigrafos (Ia I" de Pearson y una escala para medir el grado de acatamiento a la autoridad. Las calificaciones
la I"s de Spearman) comunrnente empleados para describir el grado de relaci6n obtenidas por 15 personas en esta escala fueron corre1acionadas con las calificaciones
entre dos variables. Se recordara que el coeficiente de correlaci6n varia entre que obtuvieron en una prueba que reveleba el grado de prejuicio hacia los grupos
± 1.00, indicando I" = 0.00 la ausencia de relaci6n. Es facil descuidar el hecho de que minoritarios. Se obtuvo una I" de Pearson igual a 0.60. ~Puede llegarse a la
los coeficientes de correlaci6n basados en datos muestrales son solamente estima conclusi6n de que no es probable que la correlaci6n obtenida provenga de una
dores del correspondiente pararnetro poblacional y, como tales, tend ran una distri poblaci6n donde e1 coeficiente de corre1aci6n es igual a cero?
buci6n alrededor de dicho para metro. Asi, es muy posible que una muestra Planteemos este problema en terrninos estadisticos formales.
obtenida de una poblaci6n en la que la correlaci6n es cero pueda dar lugar,
1. Hipotesis nula (H D): EI coeficiente de correlaci6n de la poblaci6n de la cual
pOI" azar, a una correlaci6n positiva 0 negativa alta. La hipotesis nula que se
proviene la muestra es igual a 0.00 (p = 0.00).
investiga con mayor frecuencia en el caso de una muestra unica es la de que et
coeficiente de correlacion poblacional (p) sea igual a cero. 2. Hipotesis alternatiua (H d: El coeficiente de correlaci6n de la poblaci6n de la
Esta claro que se necesita aplicar una prueba de significaci6n. Sin embargo, cual proviene la muestra no es igual a cero. (p #- 0.00).
el examen estadistico es complicado por el hecho de que la distribuci6n de p es Examen estadistico: La prueba t con N - 2 grados de libertad.
usualmente no normal, particularmente cuando p tiende a los valores Iimites
de ± 1.00. Consideremos el caso en que p es igual a + 0.80. Esta claro que los N ice! de siqnificacion : rJ. = 0.05, examen bilateral.
coeficientes de correlaci6n muestrales provenientes de esta poblaci6n se distribuiran Distribucion muestral: La distribuci6n t de Student con gl = 13.
alrededor de +0.80 y podran tomar cualquier valor entre -':"-1.00 y + 1.00. Sin It
Region critica: 0.051 ?: 2.160. Puesto que H 1 es no direccional, la regi6n
embargo, es igualmente evidente que existe una restricci6n definida en el rango critica consta de todos los valores de t ?: 2.160 y t :E;; - 2.160.
de valores que pueden tomar los estadigrafos muestrales mayores que +0.80,
mientras que no existe una restricci6n similar para los valores menores que En e1 presente ejemplo,
+0.80. EI resultado es una distribuci6n muestral negativamente sesgada. La desvia
ci6n respecto a la normalidad sera menor a medida que au mente e1 nurnero de t = 0.60 jl3 = 2.70.
parejas de valores en la muestra. Si el coeficiente de correlaci6n de la poblaci6n 0.80
de la cual proviene la muestra es igual acero, la distribuci6n muestral tiene
mayor probabilidad de ser normal. Estas relaciones se pueden apreciar en la fig. 12.6, Decision Puesto que t > to. os. esta en la regi6n critica y se debe rechazar H o
donde estan representadas las distribuciones muestrales del coeficiente de correlaci6n Asi, se puede lIegar a la conclusi6n de que la muestra proviene de una poblaci6n
cuando p = -0.80,0 Y +0.80. en la que p > 0.00. .
estadigrafo z., cuya distribuci6n es aproximadamente normal, aun para muestras Puesto que el r, obtenido de 0.64 es mayor que el valor critico al nivel
en que N es pequefio. de 0.05, podemos llegar a la conclusi6n de que el valor del coeficiente de correla
EI estadigrafo empleado para el examen es la desviaci6n normal Z, en la cual ci6n de Spearman en la poblacion de la cual proviene la muestra es mayor que 0.00.
::,. - Z,.
z- (12.13)
)l/(N- 3)'
donde Resumen del capitulo
z; = valor transformado de hi r muestral, y Hemos visto que si tomamos muestras de una poblaci6n dada, entonces:
Z, = valor transformado del coeficiente de correlacion poblacional especificado
bajo n.: 1. La distribucion de las medias muestrales tiende a ser normal.
2. La media de estas medias muestrales (j.J.x) es igual a la media de la po
Usando el mismo ejemplo anterior, examinaremos la hipotesis H 0 de que la p de la blaci6n (j.J.).
poblacion de la cual proviene la muestra es igual a 0.25. Recordemos que
3. EI error estandar de la media (ax) es igual a a/JN. Cuando N crece,
r = 0.60 y N = 15.
la variabilidad decrece.
La obtenci6n de z; se simpJifica grandemente utilizando la tabla F del apendice II,
ya que dicha tabla proporciona el valor de z; correspondiente a cada valor de r, Usamos estas relaciones en el examen estadistico de hip6tesis (por ejemplo,
de 0.01 en 0.01, desde 0.00 hasta 0.99. Asi, refiriendonos a la tabla F, vemos que a j.J. = j.J.o) cuando se conoce. la desviaci6n estandar de la poblaci6n, por medio
una r de 0.60 Ie corresponde una z; de 0.693. del estadigrafo Z y la curva normal estandar,
Analogarnente, a una p de 0.25 Ie corresponde una Z, de 0.256. Sustituyendo Para el caso en que a sea desconocida, presentamos el empleo de los estadigrafos
estos valores en la formula de Z, obtenemos muestrales para estimar estos parametres. Usamos estos valores estimados de los
parametres para examinar hipotesis, empleando el cociente t de Student y las
0.693 - 0.256 0.437 correspondientes distribuciones muestrales. Comparamos estas distribuciones t, que
JT/(15---=-3j = 0.289 = 1.51. varian en funci6n de los grados de libertad (gl), con la curva normal estandar,
! ! / '
Usamos el cociente t como base para obtener intervalos de confianza.
Decision Al nivel de 0.05, examen e~tadistico bilateral, se requiere que h.051 ;): 1.96 Finalmente, estudiamos el examen de la significacion para la r de Pearson y para
para que el resultado sea significativo. Puesto que Z = 1.51 es menor que los . la r, de Spearman en el caso de una muestra.
valores criticos, no podemos rechazar H o- Es posible entonces que la muestra
provenga de una poblaci6n en la que el coeficiente de correlaci6n es igual a 0.25.
0.544 + 0.506 1. Describir 10 que sucede con la distribucion de las medias muestrales cuando
238 ESTADfsTTCA PARA LAS CTENCTAS SOCTALES INFERENCIA ESTADfSTlCA Y VARIABLES CONTINUAS 239
2. Explicar por que raz6n la desviacion estandar de una muestra subestima generalmente 11. Es axiornatico que cuando se seleccionan al azar parejas de individuos y se correlacionan
la desviacion estandar de la poblacion, Dar un ejemplo. las calificaciones obtenidas en una prueba de inteligencia por los primeros miembros de las
3. Sabiendo que X = 24 y s = 4 para N = 15, utilizar la distribuci6n t para hallar parejas con las obtenidas por los segundos, se tiene p = 0.00.
a) los lirnites de confianza del 95 por ciento para /1,
a) Se seleccionan al azar 39 parejas de hermanos, y se encuentra para ellos, en
b) los Iimites de confianza del 99 por ciento para /1.
cuanto a inteligencia, que r = +0.27. i,Tienen los herrnanos mayor semejanza res
pecto a inteligencia que los individuos que no tienen ninguna relaci6n entre si?
4. Sabiendo que X = 24 y s = 4 para N = 121, usar la distribuci6n t para hallar
109
20. Con el fin de probar un aditivo para la gasolina, se estudi6 el rendimiento de 10 MEDIAS TOMADAS DE LA POBLACION 1
autom6viles bajo una supervisi6n rigurosa. Los rendimientos observados fueron de 15 12 13
16.' 17, 11, 14, 15, 13 Y 14 kil6metros por litro de gasolina. En miles de pruebas anterior;s c~n I~
3 5 5 6 6 6 B 9
~lIsma gasolina, pero sin el aditivo, se obtuvo un rendimiento medio de 12.63 kilornetros por 0 3 4 5 5 6 6 6 7 7 8 9
htro. Usando C( = 0.05, i,se puede liegar a la conclusion de que el aditivo mejora el numero de :5 1 2 3 4 4 5 5 5 6 6 7 8
kilo metros por Iitro? w 2 1 2 3 3 4 4 4 5 5 6 7
0
rn N 2 1 2 3 3 4 4 4 5 5 6 7
21. EI propietario de un restaurante c1asific6 a sus 17 camareros de acuerdo con su velocidad «2 4 4 5 6
00 3 0 1 2 2 3 3 3
y eficiencia en el trabajo. AI correlacionar estos rangos con el total de las propinas recibidas «
~u 3 0 1 2 2 3 3 3 4 4 5 6
por cada uno en una semana, encontr6 que r. = 0.438. i,Cual es la conclusi6n? 0:5 3 0 1 2 2 3 3 3 4 4 5 6
t-lD
22. El propietario de una cornpafiia de alquiler de autom6viles hizo la c1asificaci6n de rn 0 4 -1 0 1 1 2 2 2 3 3 4 5
«" 2 2 2 3 3 4 5
25 c1ientes con respecto a la pulcritud y cuidado general del coche alquilado durante un Ci 4 -1 0 1 1
w 1 1 1 2 2 3 4
periodo de tres meses. Correlaciono estos rangos con el mimero de kil6metros recorridos por ~
5 -2 -1 0 0
6 -3 -2 -1 -1 0 0 0 1 1 2 3
cada c1iente en el mismo periodo de tiempo, y obtuvo que r, = -0.397. Empleando C( = 0.05,
examen bilateral, i,cual es la conclusion?
23. Como requisito de ingreso en cierta universidad, un aspirante ha de someterse a un
examen estandarizado de selecci6n. La correlaci6n entre el rendimiento en este examen y las N6tese que la media de las medias de la poblaci6n 1 es igual a 6, y que esta media para la
a) EI presidente del tribunal de ingreso afirma que un procedimiento mejor de predecir a) Construyase una distribuci6n de frecuencias y de probabilidades de las diferencias
el exito en la universidad es el de usar las notas promedio obtenidas en el bachillerato, entre medias (X I - X 2)'
Para respaldar su afirrnacion, seleccion6 aleatariamente 52 estudiantes y correlacion6 b) Basandose en la intuici6n, estimese cual seria la media de estas diferencias. Calculese
sus notas en la universidad con sus notas en eI bachillerato, y obtuvo que r = 0.54. ahora la media de las diferencias. i,Fue muy precisa la estimaci6n? Formulese una
b) El ayudante del director prepara una prueba que considera es mejor para predecir entre medias.
y correlaciona sus calificaciones promedio con el rendimiento en dicha prueba, la primera bolsa contiene la poblaci6n de medias a la que hemos llamado poblaci6n 1.
y obtiene r = 0.61. i,Cual es la conclusi6n? Sin embargo, la poblacion de medias de la segunda bolsa nos es completamentedesconocida,
24. i,CU<lles son los estadigrafos usados para describir la distribuci6n de una muestra? Tomamos una muestra de cada una de las bolsas y calculamos las medias muestrales,
i,Cuales para un estadigrafo muestral? Restando la segunda media de la primera, obtenemos una diferencia entre medias muestrales.
25. i,Es 52 un estimador no sesgado de (J2? i,Por que? a) i,Cual es la hip6tesis estadistica mas adecuada que debemos examinar?
26. i,Es 52 un estimador no sesgado de (J2? i,Por que? c) Construir una distribuci6n de frecuencias y probabilidades de las diferencias entre
27. i,Que es un intervalo de confianza? medias bajo la hip6tesis H o :Ill = 1l2' [Sugerellcia: Sup6ngase que la poblaci6n 2 es
identica a la poblaci6n 1, y hallense todas las diferencias posibles entre las medias.]
28. Dar un ejemplo que muestre el efecto del nivel C( en la precisi6n de un intervalo de A esta distribuci6n de probabilidades se la conoce como distribuci6n muestral de las
confianza.
diferencias entre medias, donde la hip6tesis nula es que estamos tomando muestras de
29. i,En que se diferencian las distribuciones t de la distribucion normal? i,Son alguna vez poblaciones identicas.
iguales?
2. Usando la distribuci6n muestral bajo Ho:1l1 = 112 (del ejercicio 31 anterior), hallar la
e) XI - X 2 = -6
Se escriben estos numeros en tarjetas y se las coloca por separado en dos bolsas (una
para cada poblaci6n). Se elige una tarjeta de la poblaci6n 1, se anota la media correspon Imaginemos que la verdadera situaci6n es la distribuci6n muestral de las diferencias
diente, y se repone la tarjeta en la bolsa; luego se elije una tarjeta de la poblaci6n 2, se ntre medias que se encontr6 al resolver el ejercicio 30. Hallar la probabilidad de obtener
anota la media correspondiente, y se devuelve la tarjeta a la bolsa. Se resta la media a diferencia entre las medias muestrales tal que
proveniente de la poblaci6n 2 de la media proveniente de la poblacion 1 para obtener una a) 5::;;X I - X 2::;;-5 b) X I - X 22':6
diferencia entre medias. En la tabla siguiente se muestran todas las diferencias posibles entre c) X I - X 2 ::;; - 3 d) 6::;; XI - X 2 ::;; - 6
rr.edias, e) X I - X 2 = - 6
242 ESTADfsTICA PARA LAS CIENCIAS SOCIALES [243]
Inferencia estadistica
13
*34. <?omparar los valores de la probabilidad obtenidos como respuesta a los ejercicios 32 y 33.
Ver s~ pueden formularse observaciones mas generales acerca de las diferentes respuestas
obtenidas,
35. Supongase que las secretarias escriben como promedio 50 palabras por minuto. Un grupo con dos muestras
de secretanas que aprendi6 mecanografia en determinada escuela obtuvo las siguientes
velocidades (palabras por minuto): independientes
55 50 45 75 80 75 80 80
85 60 50 65 60 50 80 50
Calcular el valor de t. lSe puede lIegar a la conclusi6n de que las secretarias preparadas
por esa escuela son superiores en cuanto a su habilidad de escribir a maquina?
36. U~ aficionado a I.~s deportes encontr6 una r. de 0.15 entre los promedios de bateo
de 20 jugadores de beisbol y la cantidad de vitaminas que contienen los cereales que
consumen. lSe puede lIegar a la conclusi6n de que esta correlaci6n es significativa? Distribucion muestral de la diferencia
37. Una pers_~na afirma que ~u cu.r~o de preparaci6n para agentes de seguros de vida permite entre medias
a una cornpanra contratar mas pohzas que la compafiia «prornedio». EI promedio mensual
de co?tr~taci6n de todos los agentes de seguros es de $100000. Una muestra de 10 agentes
que siguieron el curso de preparaci6n dio los siguientes resultados (en miles de pesos): realizamos un experimento referente al aprendizaje del recorrido de un
'Jaberinto, lcmil es el efecto obtenido cuando se usa una droga, comparado con el que
$100 $120 $130 $120 $125 resulta sin dicha droga?
$ 90 $130 $135 $140 $110 lLa tasa de reincidencia de los delincuentesjuveniles con «problemas familiares» es
Si ellector fuera el supervisor de los agentes, ladoptaria el curso propuesto por esa persona? diferente a la de aquellos que no tienen esos problemas?
Calcular el valor de t. lEs distinto el rendimiento en examenes estandarizados de las c1ases donde
38. En .un e~tudio del exito y del fracaso matrimonial, Bentler y Newcomb (1978) dieron asisten alumnos de diferentes edades y de las c1ases donde los alumnos tienen edades
un cuesnonario para rellenar con datos personales a 162 parejas de recien casados. Cuatro analogas?
afios despues, se localiz6 a 77 de las parejas de la muestra original. De elias, 52 seguian Cada uno de los problemas anteriores requiere la comparaci6n de dos muestras
casadas y ?4 se habian se~~rado 0 divorciado. Entre el grupo de los que seguian casados Jmenos. Hasta aqui, con propositos heuristicos, hemos restringido nuestro examen
se encontro que la c?rrelaclOn entre las calificaciones obtenidas por los esposos y esposas en stadistico de hipotesis al caso de una muestra. Sin embargo, la mayor parte de las
una escala de atractivo personal era de 0.59, y la correlaci6n entre sus calificaciones en una investigaciones sobre el comportamiento requieren la comparacion de dos 0 mas
escala de generosidad era de 0.23. Entre el grupo de divorciados estas correlaciones fueron uestras para determinar si es razonable, 0 no, considerar que estas muestras
de 0.07 y 0.13, respectivamente.
provienen de la misma poblaci6n. Si las medias de las dos muestras difieren,
a) Usando Ct. = 0.05, formular y examinar la hipotesis nula de que la correlaci6n ldebemos conc1uir que estas muestras provienen de dos poblaciones distintas?
entre las calificacio.nes de las parejas casadas sobre atractivo personal es igual a cero.
Recordemos nuestra discusion previa acerca de la distribucion' de las medias
Fo~mul~r y exarmnar adernas la hipotesis nula de que la correlaci6n entre las
calificaciones de las parejas divorciadas sobre atractivo personal es igual a cero. muestrales (seccion 12.2). Vimos que debe esperarse alguna variabilidad en los
b) Usand.o Ct. ': 0.05, formular y examinar la hip6tesis nula de que la correlaci6n entre estadigrafos muestrales, aun cuando estas muestras se hayan extraido de la misma
las ca.hficaclOnes de las parejas casadas sobre generosidad es igual a cero. Formular y oblacion. Podemos describir esta variabilidad en funcion de la distribucion de las
exarrunar ademas la hip6tesis nula de que la correlaci6n entre las calificaciones de las edias muestrales. Para conceptuar esta distribucion, imaginamos entonces que se
parejas divorciadas sobre generosidad es igual a cero. xtraia de una poblaci6n un numero muy grande de muestras del mismo tamafio,
ara obtener la distribucion de las medias muestrales. En el caso de dos muestras,
deberemos imaginar que se extraen parejas de muestras, que se halla la diferencia
entre las medias de cada pareja y que se obtiene la distribucion de estas diferencias.
La distribucion resultante sera la distribucion muestral de la diferencia entre medias.
Para ilustrar 10 dicho, supongamos que de la poblacion descrita en la tabla 12.1,
la que J1 = 5.00 y (J = 0.99, extraemos al azar (con reposicion) dos muestras a la
z. Supongamos, adernas, que la primera muestra contiene dos elementos (N I = 2)
que la segunda muestra contiene tres elementos (N 2 = 3). Por ejemplo, la primera
INFERENCIA ESTAOISTICA CON DOS MUESTRAS INOEPENDIENTES 245
244 ESTAOISTICA PARA LAS CIENCIAS SOCIALES
muestra podria estar constituida por los numeros 5 y 6, y la segunda por los mimeros
Recuadro 13.1 4, 4 Y 7. Asi, X I = 5.5, X 2 = 5.0 Y X t - X 2 = 0.5. Supongamos finalmente que
continuamos extrayendo muestras de tamaiios N 1 = 2 y N 2 = 3 hasta obtener un
numero indefinidamente grande de parejas de muestras. Si calculamos las diferencias
+ 20
entre las parejas de medias muestrales y tratamos a cada una de estas diferencias
sfil (13.41
como un dato original, podemos construir una distribucion de frecuencias de estas
:2 diferencias. Juzgando intuitivarnente, ~que aspecto cabe esperar que tenga esta
:s
a:
+ lO distribuci6n? Puesto que tomamos al azar parejas de muestras de la misma
a: poblaci6n, deberiamos esperar una distribucion normal con media igual a cero.
::>
0 Dando un paso mas, podemos describir la distribucion de la diferencia entre
~ parejas de medias muestrales aun cuando las muestras no provengan de la misma
ffJ 0
poblacion. Esa distribucion sera normal con media (Mxl-x,) igual a MI - M2' Y con
::>
0
Ul desviacion estandar (ux -x, Hamada error estandar de fa diferencia entre medias)
UJ
a: . f""
igual a V Ux I + U>: z'
1_
FOTOGRAFIA FOTOGRAFIA
z = (X t - X 2) - (PI - ~12)
DE UN HOMBRE DE UNA MUJER
uK -s,
I
TIPO DE FOTOGRAFIA
SCI = I xi - (L: d
1
2
, y SC z = I x~ - (L: 2)
2
EXPERIMENTAL CONTROL
x, xr X 2 X~
13.3 Examen estadistico de hip6tesis: 12 144 21 441
10 100 14 196
8 64 20 400
3 9 8 64
t = , (13.3)
SXI-Xl 11 121 13 169
15 225
diferencia entre las medias poblacionales. Imaginemos, por ejemplo, que se conoce la )(2 = 15.100
diferencia entre las estaturas medias de los hombres y mujeres adultos (0 que te
nemos un estimador adecuado de dicha diferencia). Imaginemos tambien que Hipotesis nula (H o): No hay diferencia entre las medias poblacionales del grupo
tenemos razones para creer que en una localidad determinada esta diferencia puede que recibe la droga, y del grupo que no la recibe, en la prueba de coordinacion
quedar afectada por factores ambientales 0 por el tipo de alimentacion. En este caso, psicomotriz. Esto es, J1.1 = J1.2 0 J1.1 - J1.2 = O.
la hipotesis nula deberia especificar la diferencia conocida entre las estaturas. Asi, si
Hipotesis alternativa (HI): Existe una diferencia entre las medias poblacionales
se sabe que la estatura media de los hombres es 12 em mayor que la de las mujeres, la
hipotesis nula seria de los dos grupos en la prueba de coordinacion psicomotriz. Notese que la
hipotesis alternativa no es direccional. En consecuencia, se empleara un examen
H o : /1M - /1F = 12 ern. bilateral, esto es, J1.1 =1= J1.z·
Recuerdese que en la tabla C del apendice III se obtienen los valores criticos de t Prueba estadistica: Puesto que estamos comparando dos medias muestrales
correspondientes a varios niveles de IX. Puesto que los grados de libertad de las que, segun se presume, provienen de poblaciones normalmente distribuidas con
muestras son N 1 - 1 y N 2 - 1, en el caso de dos muestras el numero total de grados varianzas iguales, resulta adecuado el uso del cociente t de Student para el caso
de libert ad es N 1 + N 2 - 2. de dos muestras.
Nivel de siqnificacion: IX = 0.05.
• Se puede expresar esta formula en funcion de los valores originales. Ver paginas finales de este libra.
Distribucton muestral: La distribucion t de Student con gl = N 1 + Nz - 2,0 sea,
9 + 10 - 2 = 17.
248 ESTADisTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADiSTICA CON DOS MUESTRAS INDEPENDIENTES 249
6. Region critica: It 1 ~ 2.110. Puesto que HinD es direccional, la region critica Una forma de aclarar la «significancia» de una diferencia estadisticamente
consta de todos los valores de t tales que t ~ 2.110 y t s; -2.110. significativa, consiste en averiguar el grado en que las variaciones en la variable
Dado que N 1 "1= N 2 Y se admite que las vari~nzas poblacionales son iguales, experimental (el tratamiento administrado) explican las variaciones que se producen
emplearemos la formula (13.1) para estimar el error estandar de la diferencia entre las en la medida dependiente. En general, cuanto mayor sea el grado de relacion, mayor
medias. La suma de cuadrados para el grupo 1 es sera la importancia del hallazgo. Una medida de asociacion es OJ2 (omega al
cuadrado), cuyo valor estimado es
(88)2
SCI = 996 - -9- = 135.56. t2 - 1
OJ2 est* - ~------ (13.4)
Analogamente, la suma de cuadrados para el grupo 2 es
- t
2
+ NI + N2 - 1
Ejemplo. En elejemplo anterior encontramos que t = - 2.758 con N 1 = 9 y N 2 =
(151)2 = 10. Entonces.
SC 2 = 2445 - ----yo = 164.90.
2 7.61 - 1
OJ est = - - - - - -
El valor de t en este problema es 7.61 + 9 + 10 - 1
6.61
=-2 6 =0.26.
5. 1
Este resultado puede interpretarse casi de la misma forma que el coeficiente de
determinacion (r 2 ) que se estudio en el capitulo 9 (ver seccion 9.4). Recuerdese que un
(9.778 - 15.100) - 0 -5.322 coeficiente de determinacion de 0.26 significaria que, segun estimamos, el 26 % de la
1.93 = -2.758. varianza de Yha sido tenido en cuenta por las variaciones en X. Analogamente, OJ2 =
)(135.56 + 164.90) (~ ~) = 0.26 puede interpretarse en el sentido de que el 26 % de la varianza en la medida
17 9+10 dependiente ha sido tenida en cuenta en funcion de las variaciones en la variable del
tratamiento. Si consideramos la multitud de variables que tienen general mente
Decision. Puesto que la t obtenida cae en la region critica (esto es, 1- 2.7581 > influencia en las medidas dependientes, el hallazgo de una variable que tenga en
> 2.110, 0-2.758 < -2.110), rechazamos H o. El valor negativo de t indica cuenta el 26 % de la varianza nos indicara que describe un efecto real e importante.
simplemente que la media del grupo 2 es mayor que la media del grupo 1. Al N6tese que no podernos juzgar la magnitud de la asociaci6n por la simple
referirnos a la tabla C, prescindimos del signo del cociente t obtenido. observaci6n del valor de t. Por ejemplo, imaginemos que se ha encontrado el mismo
De acuerdo con los resultados obtenidos, llegariamos ala conclusi6n de que la valor de t de - 2.758 con N I = N 2 = 75. La diferencia es con toda claridad
droga afecta adversamente a la coordinaci6n psicomotriz, puesto que la calificaci6n estadisticamente significativa. Sin embargo, ~indica un mayor grado de asociaci6n
media en coordinaci6n psicomotriz del grupo que recibi6 la droga es significativa entre la variable experimental y la variable dependiente? Veamos.
mente menor que la del grupo placebo. Cuando t = -2.758 y N 1 = N 2 = 75,
2 7.61 - 1
OJ est = - - - - - -
7.61 + 75 + 75 - 1
13.4 Estimacion del grado de asociacion
entre la variable experimental =~~=0.04.
156.61
y la variable dependiente A pesar del alto valor de t, estimamos que la variable experimental solamente
tiene en cuenta alrededor del 4 % de la varianza en la variable dependiente. Estos
La obtenci6n de un valor de t estadisticamente significativo implica que existe algun ejemplos ilustran el hecho de que un valor significativo de t con N pequefia puede
grado de asociaci6n entre la variable experimental y la variable dependiente. Sin uy bien estar describiendo un efecto mas importante de la variable experimental
embargo, el hecho de que un resultado sea estadisticamente significativo no confiere ue un valor significativo de t con una N mayor.
automaticarnente «importancia» a 10 obtenido. Si N es suficientemente grande,
* Si ItI es menor que 1.00, w 2 sera negativa. Puesto que una w 2 carece de significado, hacemos arbitrariamente w 2 = 0
incluso una diferencia trivial puede resultar estadisticamente significativa. ando ItI :$ 1.00.
250 ESTADiSTICA PARA LAS CIENCIAS SOCIALES 251
INFERENCIA ESTADiSTICA CON DOS MUESTRAS INDEPENDIENTES
13.5 EI cociente t y la homogeneidad de la varianza anteriormente, el cociente t es un examen eficiente. Nuestras conclusiones podrian
sufrir alteracion solamente para desvios muy grandes respecto a las hipotesis
Las hipotesis fundamentales para el usa de las distribuciones t son las siguientes: adrnitidas de homogeneidad de las varianzas y de normalidad.
~Por que, entonces, nos interesa un analisis de las varianzas? Frecuentemente,
I.. La distribucion muestral de la diferencia entre medias es normal. una diferencia significativa en las varianzas (en particular cuando la varianza del
2. La ax,-x, estimada (0 sea, sx,-x,) se basa en la estimacion no sesgada de la grupo experimental es significativamente mayor que la del grupo de control) indica
varianza poblacional. un efecto dual de las condiciones experimentales. Una mayor varianza indica mas
3. Ambas muestras provienen de poblaciones cuyas varianzas son iguales. A esta valores extremos ell las dos colas de una distribucion. EI investigador atento toma
hipotesis se Ie da el nombre de homogeneidad de la varianza. ra estos hechos como base para explorar la posibilidad de que existan efectos
duales.
En ocasiones, y por razones que pueden no estar muy claras, las calificaciones de Por ejemplo, hace varios afios se estudio con detenimiento, y resultados bastante
uno de los grupos pueden estar distribuidas con mayor amplitud que las del otro ambiguos, la cuestion siguiente: «~Mejora 0 perjudica la ansiedad el rendimiento en
grupo. Esto nos puede llevar a la conclusion de que las muestras provienen de dos las tareas psicologicas complejas?», Recientemente se ha comprobado que los
distribuciones diferentes. Pero la pregunta crucial es: dos distribuciones diferentes estados inducidos de ansiedad tienen efectos duales que dependen de muchos
~en que, en las medias 0 en las varianzas? ' factores, por ejemplo las variables de personalidad. Un aumento en la ansiedad
Para determinar si dos varianzas difieren 0 no significativamente una de otra, determina que algunas personas se orientan mejor en la tarea que tienen entre
debemos hacer referencia a otra distribucion: la distribucion F. Quien primero manos, en tanto que otras «fracasan», por decirlo asi. Un estudio de las varianzas de
describio esta distribucion fue el estadistico R. A. Fisher. La distribucion F es diferente nuestros grupos experimentales puede facilitar la revelacion de efectos teoricamente
a las otras distribuciones que hasta hoy hemos visto, ya que es de naturaleza tan importantes e interesantes como los duales.
tridimensional. Para usar la tabla F (tabla 01' apendice III), debemos comenzar
buscando en la primera fila el mimero de grados de libertad del grupo con varianza
mayor, y mirar hacia abajo en esa columna hasta llegar a la fila correspondiente al
numero de grados de libertad del grupo con varianza menor. En la interseccion
hallaremos el valor critico de F requerido para rechazar la hipotesis nula de que no
Resumen del capitulo
hay diferencia en las varianzas. EI cociente F se define del modo siguiente:
Hemos visto que si se toman algunas parejas de muestras de la misma poblacion 0 de
§2 (varianza mayor) dos poblaciones diferentes, se tiene que:
F = --::----,-------:..
§2 (varianza menor) La distribucion de las diferencias entre parejas de medias muestrales tiende a ser
normal.
EI examen es bilateral, pues interesa determinar si las varianzas difieren significa
tivamente entre si. Seria unilateral solamente en el caso de que interesara determinar La media de estas diferencias entre medias (l1x, -x,) es igual ala diferencia entre
si una varianza especifica es significativamente mayor que la otra. Esta es una las medias poblacionales, 0 sea, 111 - 112'
comparacion diferente. Puesto que la tabla 01 se refiere a probabilidades unilatera EI error estandar de la diferencia entre medias (ax,-x,! es igual a J al + at.
les, el uso del valor critico al nivel 0.025 nos da el nivel de significacion bilateral de
0.05. En el problema muestral anterior, la varianza para el grupo 1 es igual a Presentamos formulas para estimar ax,-x, a partir de los datos muestrales.
135.56/8 = 16.94, Y para el grupo 2 es igual a 164.9/9 = 18.32. EI cociente F resul Us ando el valor estimado de ax-I -x- 2 (0 sea, sx I -x)2 mostramos el uso de la t de
ta ser Student para examinar hipotesis en el caso de dos muestras.
18.32 Presentamos tambien un metoda para estimar el grado de asociacion entre una
F =~-= 1.08 gl = 9/8.
16.94 ' variable experimental y la medida dependiente. Omega al cuadrado (ru2 ) proporciona
una estimacion de la varianza en la variable dependiente explicada por las variacio
En la tabla 01' para 9 y 8 gl, hallamos que una F ~ 4.36 es significativa al nivel nes de la variable experimental.
0.05. Podemos, por tanto, concluir que es razonable admitir que am bas mues Una hipotesis fundamental para el uso dela distribucion t es que ambas muestras
tras provienen de poblaciones con la misma varianza. rovienen de poblaciones con varianzas iguales. Aunque es probable que la falta de
~Que ocurre si encontramos una diferencia significativa en las varianzas? ~Se homogeneidad de las varianzas no afecte seriamente nuestras interpretaciones, el
incrementaria la posibilidad de rechazar la hipotesis nula de que no hay diferencia echo de la heterogeneidad de las varianzas puede tener importantes implicaciones
entre las medias? Con gran probabilidad, muy poco. Como hemos seiialado eoricas,
252 ESTADfsTICA PARA LAS CIENCIAS SOCIALES
INFERENCIA ESTAOfSTICA CON DOS MUESTRAS INOEPENDIENTES 253
Terminos para recordar a) Plantear este estudio en terrninos estadisticos formales y llegar a las conclusiones
apropiadas usando ex. = 0.01.
cociente F b) l,Hay evidencia de heterogeneidad de la varianza?
homogeneida.d de la varianza
5. Se dan dos poblaciones normales tales que
error estandar de la diferencia entre medias omega al cuadrado ((JJ2)
Jl2 = 77, (J2 = 6.
Si de la poblacion 1 se extrae una muestra de 36 elementos y de la poblacion 2 se extrae una
muestra de 36 elementos, l,cual es la probabilidad de que
a) XI-X2~5? b) XI-X2~0?
hipotesis de que las dos clases son igualmente aptas, usando ex. = 0.01. c) N I = N 2 = 16, d)
N 1 = N2=25.
2. ~n un experimento realizado para estudiar los efectos de cierta droga sobre los errores 7. Expresar graficarnente las probabilidades anteriores como una funcion de N. l,Podria
cornetidos por las ratas al desplazarse en un laberinto, se obtuvieron los siguientes resultados: formularse alguna generalizacion acerca de la probabilidad de encontrar una diferencia en la
direccion correcta entre las medias muestrales (esto es, X I - X2 ~ 0, cuando /11 > /12) como
una funcion de N?
GRUPO CON DROGA GRUPO PLACEBO
8. Un fabricante de gasolina realiza pruebas para determinar el rendimiento relativo de los
IXI = 324 IX2 = 256
.automoviles, empleando dos aditivos diferentes. Los resultados son los siguientes (en millas
IXi = 6516
IXi = 4352
por galen de gasolina):
N I = 18
N2 = 16
Aditivo 1: 12, 17, 15. 13, 11, 10. 14, 12
Aditivo 2: 16,14,18,19,17,13,11,18
Plantea! este experi.mento en terrninos estadisticos formales, usando ex. = 0.05, Yobtener las Plantear y examinar la hipotesis nul a apropiada.
conclusiones <l;propladas referentes al efecto de la droga en el numero de errores.
9. Dos analistas de mercado aseguran que su capacidad para predecir el alza <je las acciones
3. En una actividad psicomotriz en la que se tira ados blancos de diferente tamafio se bursatiles es mejor que la de su rival. En un periodo determinado de tiempo, cada uno
obtuvieron los siguientes resultados: ' selecciono diez acciones para las que predijo un aumento de valor. Cuando se conocieron
posteriormente los incrementos en los precios de las acciones, se llego a los resultados
GRUPO 1 GRUPO 2
siguientes :
Analista 1: $1.25, $2.50,$1.75, $2.25, $2.00, $1.75, $2.25, $1.00, $1.75, $2.00
9 6
Analista 2: $1.25, $0.75, $1.00, $1.50, $2.00, $1.75, $0.50, $1.50, $0.25, $1.25
6 7
8 7
Plantear y examinar la hipotesis nula apropiada.
8 9
9 8
10. El fabricante de cierto dentifrico afirma que los nmos que se limpian los dientes
diariamente con su producto (marca A) tienen menos caries que los nifios que utilizan el
entffrico de marca X. En un estudio cuidadosamente supervisado, se compare el mimero de
aries en un grupo de nifios que empleaban su dentifrico con el numero de caries en otro grupo
Plantear este experimento en terminos estadisticos formales, usando ex. = 0.05, Yobtener las e nifios que empleaban el dentifrico X. Los resultados fueron los siguientes:
conclusiones apropiadas.
. 4. Se. realize un estudio para determinar si la obtencion de una respuesta esta 0 no Marca A: 1,2,0,3,0,2,1,4,2,3,1,2,1,1
influenciada por los efectos de una droga. La. variable de criterio fue el numero de intentos Marca X: 3,1,2,4,1;5,2,0,5,6,3,2,4,3
requeridos para llegar a dominar la tarea (X I es el grupo experimental y X 2 es el grupo de aminar la afirrnacion del fabricante.
control). "
1. En un estudio longitudinal del desarrollo de los adolescentes, 582 jovencitos y 1052
qvencitas, que cursaban los primeros afios de bachillerato, rellenaron un cuestionario para
btener medidas de la personalidad y del uso de drogas (Wingard, Huba y Bentler, en prensa).
3
la escala de personalidad referente a «generosidad», se obtuvieron los siguientes datos:
254 ESTADfSTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADfSTICA CON DOS MUESTRAS INDEPENDIENTES 255
VARONES MUJERES
15. En un estudio acerca del desarrollo de la memoria, Wingard, Buchanan y Burnell (1978)
seleccionaron un conjunto de dibujos clasificables en cinco categorias semanticas (aliment os,
L:X, = 10371 IX2 = 20609
vestidos, juguetes, muebles, ani males). Se presentaron aleatoriamente los dibujos a 64 nii'ios de
IXi = 198503 IX~ = 427 764
cuatro afios y a 64 nifios de cinco afios, y se les pidio recordar tantos como les fuera posible.
N, = 582 N2 = 1052
Los autores midieron la tendencia de los nifios a agrupar los dibujos de la misma categoria
semantica para recordarlos. Para los nifios de cuatro afios se encontro X = 0.192y 8 = 0.302
a) Utilizando ex = 0.05, plantear y examinar la hipotesis nula de que los varones y las en agrupacion semantico, en tanto que para los de cinco afios se encontro X = 0.291 y
mujeres no difieren en la escala de generosidad. Hallar w 2 • 8 = 0.359. Plantear y examinar la hipotesis nula de que los nifios de cinco afios no hacen mas
Mediante una escala de cinco punto que va desde «nunca usa la droga» (1) hasta «usa la droga agrupacion semantica que los de cuatro afios. Puesto que la hipotesis alternativa es direccional
regularmente» (5), se obtuvieron los siguientes datos: (se espera que los niiios de cinco afios hagan mas agrupacion como consecuencia de su mayor
desarrollo cognoscitivo), utilicese cx = 0.05, examen unilateral. Calcular w 2 •
VARONES MUJERES 16. Si encontramos una diferencia significativa entre medias a nivel de significacion del 5 %,
de ello se seguiria que (verdadero 0 falso):
IX I = 1024 IX 2 = 1694
a) Esta diferencia es significativa a nivel de significacion del 1 %.
Pi = 2712 IX~ = 4318
b) Esta diferencia es significativa a nivel de significacion del 10 %.
N, = 582 N 2 = 1052
Poblacion 2: 1, 3, 5, 7
12. En un estudio acerca de las preferencias sobre television de los nifios en edad preescolar,
Friedrich y Stein (1973) pidieron a 52 nifios y a 45 nifias indicar sus programas favoritos. *17. De cada poblacion se toman aleatoriamente muestras de tamafio 2 (sin reposicion),
Luego los autores tuvieron en cuenta los programas considerados violentos y agresivos, y Construir un histograma que muestre la distribucion muestral de las diferencias entre las
obtuvieron los siguientes datos:
medias muestrales.
i,Cual es la probabilidad de que
NINOS NINAS a) XI-X2~0? b) XI-X2~1? c) Xl - X 2 ~ O?
Ix, = 71 IX 49
2 = g) Xl - X 2 ~ 2 0 Xl - X 2 ~ - 2?
Pi = 185 P~ = 147
N, = 52 N 2 = 45
Calcular la media y la desviacion estandar de cada poblacion,
'*20. Si de la poblacion 1 se extrae una muestra de 25 elementos y de la poblacion 2 se extrae
una muestra de 25 elementos, i,cual es la probabilidad de que
Plantear y examinar la hipotesis nula de que los nifios y las nifias no difieren en el mimero de
a) Xl-X2~0? b) X I-X 2 ~ I? c) ~1-~2~0? _ _
programas violentos que sefialaron como favoritos. Utilicese ex = 0.05.
d) XI-X2~-I? e) Xl-X2~4? f) Xl-X2~1 0 Xl-X2~-I?
13. Un director de adiestramiento de una gran ernpresa industrial afirma que los empleados g) x, -X2~2 0 X I-X 2 s -2?
que toman su curso de preparacion tienen mejor rendimiento en su trabajo comparados con
los que no 10 reciben. De 30 empleados recien contratados se seleccionaron 15 al azar para Calcular la probabilidad de que Xl - X2 ~ 0, cuando
a) N l = N 2=4, b) N l = N 2=9,
recibir adiestramiento. A los otros 15 se los torno como sujetos de control. Seis meses despues,
c) N l = N 2=16, d) N l = N 2=36.
en las pruebas de evaluacion del trabajo, se obtuvieron los siguientes estadigrafos para el
grupo adiestrado: Xl = 24.63, 8 1 = 3.53. Para el grupo de control se obtuvo X, = 21.45 Y 22. Un fabricante registro el numero de trajes producidos diariamente, durante un periodo
8 2 = 4.02. Plantear y examinar la apropiada hipotesis nula usando ex = 0.05. de 10 dias, por un grupo de 26 trabajadores (grupo A) que operaba con un sistema de salarios
14. Un editor afirma que los estudiantes que reciban instrucci6n en matematicas usando un fijos. Luego introdujo un plan de incentivos salariales para otros 26 trabajadores (grupo B) y
texto que acaba de publicar, obtendran una calificaci6n final cinco puntos mayor por 10 menos registr6 su produccion durante 10 dias. EI numero de vestidos producidos diariamente fue
que la de los estudiantes que emplearon eJ texto anterior. Se eligen al azar 36 estudiantes para COmo sigue:
asignarles ados clases: el grupo experimental, que emplea el J,luevo texto para su instruccion; y
Grupo A: 75 72 73 76 78 72 80 74 76 75
el grupo de control, que utiliza el texto anterior. En el examen final, para el grupo experimental
Grupo B: 80 83 84 78 79 81 84 85 78 86
y las 3:00, para tomar cafe. EI nurnero de errores cometidos entre las 3 :00 y las 5:00 fue como nar si puedeorech~arse H o al nivel I:i. = 0.05. [Sugerencia: ~a~a facili~ar.los calculos cuando
se indica a continuacion: hay numeros negativos, sumese 55 a cada dato, Este procedmll~nto elimina todos los valores
lor de t. N N
26. Determinar si las varianzas son homogeneas en el ejercicio anterior. Calcular el va Nota: Al sumar 55 a todos los datos no carnbiara la diferencia ent~e las medias ni el err?r
lor de F. estandar de la diferencia, ya que se mantienen las diferencias relativas entre los datos. Sin
embargo, la media de cada grupo tendra un incremento de 55.
27. Los bancos A y B utilizan dos formas diferentes de registrar los cheques girados. Dichos
bancos encontraron que durante los ultimos 10 aiios se devolvio e1 siguiente numero de 32. En la tabla siguiente se muestra el cambio en el tamano de.la pupila de c~nco varones
cheques a 15 clientes por carecer de fondos: heterosexuales Y de cinco varones homosexuales al ver fotograflas de una mUJer.
SUJETO HOMOSEXUALES
Banco A: 4 8 3 0 3 5 3 4 0 5 2 4 6 2 0
SUJETO HETEROSEXUALES
Banco B: 2 0 1 2 1 1 3 3 4 3 1 4 0 5 0
1 +05.9 6 +11.2
Determinar si hay una diierencia significativa entre el numero de cheques devueltos en cada 2 -22.4 7 -38.0
+19.2 8 + 18.1
banco. Usar a = 0.05. 3
4 +39.0 9 -05.6
'28. En el estado A se encuentra que el numero medio de cigarrillos consumidos semanalmen +23.1 10 +21.5
5
te por los fumadores es de 120, con a~, = 10. En el estado B, el impuesto a los cigarrillos es
$0.05 mayor por paquete; y el numero medio de cigarrillos consumidos semanalmente es de
at
110, con. = 9.lExiste una diferencia significativa entre el mimero de cigarrillos consumidos Formular u; YHI' examen bilateral. Usando la t de Student para.muestras i~depe~dientes,
en ambos estados? lCU<i! es el valor de z? determinar si puede recharzarse H 0 al nivel de ex = 0.05. [Sugerencla: Para evitar el inconve
mente de los numeros negatives, sumese 39 a cada dato.]
29. Los gerentes de dos tiendas de comestibles encuentran que tienen un exceso de latas de
33. En un estudio acerca de los efectos de los campos de concentracion en las.victimas de los
salsa para tallarines. Los precios y las cantidades vendidas en ambas tiendas son identicos, EI
nazis, Dor-Shav (1978)compare 43 supervivientes de dichos campos con 21 sujetos de co~t.r.ol
gerente A mantiene las latas en su lugar habitual, en tanto que el Bias coloca durante un mes
que tenian edad, antecedentes Y educaci6n analogos, pero que se escaparon. de la pnsion
cerca de los mostradores donde se comprueba el importe de la compra. Los gerentes
durante la Segunda Guerra Mundial. Se aplic6 a ambos grupos una sen~ de .pruebas
determinaron el mimero de latas vendidas durante 10 dias, con los siguientes resultados:
psicologicas, incluida la prueba de Rorschach de las manchas de ti~ta y el cue.stl~nano de lo~
A: 19 20 20 21 18 20 19 21 23 17 16 factores de la personalidad. En la prueba de Rorschach se obtuvleron los slgUientesdatos.
B: 26 24 25 23 25 24 22 26 27 25
SUPERVIVIENTES CONTROLES
lHay una diferencia significativa entre el numero de latas vendidas? lCual es el valor de t? IX
IX, = 17 2 = 39
30. Determinar si las varianzas son homogeneas en el ejercicio 29. Calcular F. LXi = 81 p~ = 357
Nt = 43 N 2 = 21
31. Al comienzo de este capitulo, presentamos una grafica correspondiente a una investiga
cion acerca de la reaccion de la pupila de los varones hetero y homosexuales al ver fotografia s
258 ESTADisTICA PARA LAS CIENCIAS SOCIALES
[259]
Recuadro 14.1
a
35 l- •
U
.f= l-
<{<{
I-
[52
1-0
I-
l-
•
UJI 30
I-
a:::>
a:<{
l
t3[l i •
zO -
i • •
UJ<{
z9
AU
25 -
Y --
,. •
--'0
<{--'
(,9UJ
a:UJ
~o
>
20
-
-
-<It
-
.. •
•• •
'"
",Q -- ••
::SCll -
--,2
-<{
2U
15 - I I I I I
--
15 20 25 X 30 35 40
En el capitulo 13 vimos que sX,-x, es una especie de hito respecto al cual calcularnos la TIPO DE CAMBIO DE VELOCIDAD
diferencia entre medias. Si este mimero es relativamente grande comparado con la
AUTOMATICO DIFERENCIA
diferencia media, nos vemos menos inclinados a rechazar H o que si dicho numero es
MODELO MANUAL
pequefio respecto a la misma diferencia entre medias.
7
Si existiera alguna forma legitima de reducir el tarnafio del terrnino de error (sx -x ), Gremlin 26 19
-4
nuestro hito seria mas sensible. Esto es precisamente 10 que se consigue con el adalisis Hornet 16 20
4
de la correlacion. Recordemos del capitulo 9 que cuanto mayor sea la correlaci6n entre Audi Fox 36 32
2
dos variables, mayor sera la oariacion explicada y menor la no explicada 0 variaci6n Skyhawk 26 24
3
Vega 30 27
aleatoria. Puesto que la variacion no explicada representa el error, el analisis de la 6
Datsun 210 41 35
correlaci6n proporciona una forma legitima de disminuir la variaci6n no explicada y, 3
Datsun 280 25 22
por tanto, de reducir tam bien el error. 5
Fiat 131 30 25
La tabla adjunta indica el rendimiento en carretera, medido en millas por gal6n, de Mustang II 24 20
4
veinte autom6viles con cambio de velocidades manual y de veinte coches con cambio -1
Granada 20 21
automatico. Cada pareja corresponde al mismo modelo de autom6vil. En otras 4
Capri II 27 23
palabras, los dos coches de cada pareja son identicos salvo el tipo de cambio de -1
Monarch 20 21
2
velocidad. Cuando se trata de muestras correlacionadas, se toma como base la ~~ffi ~ ~
3
diferencia entre las parejas de valores para calcular el terrnino de error. Si la correlaci6n Valiant/Duster 23 20
2
es baja, estas diferencias son grandes, y tambien 10 es el terrnino de error basado en Sunbird 26 24
3
dichas diferencias. Si r es alto, las diferencias son pequefias. Cuanto mayor sea la Lemans 21 18
9
correlaci6n, menores seran las diferencias entre las parejas de valores y el terrnino de Corolla 35 26
4
error se reduce analogamente, Corona MK. II 22 18
4
El diagrama de dispersi6n adjunto sugiere que la correlaci6n entre las parejas de Volvo 27 23
4
observaciones es muy alta. De hecho, se tiene que r = 0.89. EI terrnino de error LUV pickup 32 28
. t ejas de autom6viles. Cada
resultante, al que se denomina error estandar de la diferencia media (sJj), es mucho Cantidad de millasrecorridas en carretera par vel" e par. din
pareja consta de un cache con cambia manual y otro del rmsmo mo eo perc co
rnenor que el terrnino de error (sx -x) que es el que habriamos utilizado si las muestras
cambia autom6tico.
no estuvieran correlacionadas. ' 2
263
INFERENCIA ESTADfsTICA CON MUESTRAS CORRELACIONADAS
262 ESTADisTICA PARA LAS CIENCIAS SOCIALES
En nuestro estudio previo de la t de Student, mostramos la formula para la correspondle~tes ados grupos.deblsuJd 't~ io Los miembros de cada pareja fueron
estimacion no combinada del error estandar de la diferencia entre medias, que era asignados aleatoriamente a las condiciones expenmentales.
- - - r:Is~
S X,-X2--V"'X, + s£:<2--7/'S-X,X
s- 2' ":l/ s: (14.1)
PAREJAS
RELACIONADAS XI xi X, x~ X,X,
2 4 4 16 8
Suprimimos el ultimo terrnino siempre que los sujetos de la muestra se asignen a las A
9 9
B 3 9 3
condiciones experimentales al azar, por la sencilla razon de que cuando las califica 5 25 20
C 4 16
ciones son apareadas al azar, la correlacion entre las dos muestras debera tener un 5 25 6 36 30
0
promedio cero. Cualquier correlacion observada sera falsa, puesto que representani
una asociacion casual, En consecuencia, cuando se asignan al azar los sujetos a las 14 54 18 86 67
L
condiciones experimentales, el ultimo terrnino se reduce a cera (puesto que r = 0).
Sin embargo, hay muchas situaciones experimentales en las que no asignamos al
azar los sujetos a cada condicion experimental. La mayor parte de estas situaciones Para calcular el error estandar de la ~iferencia e~tre m~~i~s en el caso de grupos
pueden c1asificarse dentro de ana de las dos c1ases siguientes: no apareados, se siguen los pasos inclmdos a contllluaClOn.
1. Diseiio antes-despues, Se hace una lectura en los mismos sujetos antes y despues Paso 1. La suma de cuadrados para el grupo 1 es
de la introduccion de la variable experimental. Se supone que cada individuo
perrnanecera relativamente consecuente consigo mismo. Existira asi una correlacion SCI = 54 - (14)2/4 = 5.
entre la muestra antes y la muestra despues. Notese que cada sujeto puede haber side
La desviaci6n estandar para el grupo 1 es
seleccionado al azar de un grupo de personas; pero, puesto que el sujeto participa en
las dos condiciones, no podemos decir que los sujetos han sido asignados aleatoria
mente a las condiciones experimentales.
SI = J5!4 = 1.1180.
El error estandar de la media para el grupo 1 es
2. Diseiio de grupo apareado. Los sujetos disponibles para el estudio se clasifican
par parejas de acuerdo con alguna variable que sera correlacionada con la variable SI _ 1.1180 = 0.6455*.
dependiente 0 de criterio. El resultado es un conjunto de sujetos apareados en el que sx, = .jN 1 - 1- J3
los dos miembros de cad a pareja obtienen aproximadamente la misma calificacion en
cuanto a la variable que sirvio para formar las parejas. Uno de los miembros de la AnaIogamente, el error estandar de la media para el grupo 2 es
pareja es asignado aleatoriamente a la condicion experimental yel otro es asignado SX- = 0.6455.
2 •
al grupo de control, Asi, por ejemplo, si se tratase de determinar el efecto de cierta
El error estandar de la diferencia entre medias para grupos independieu
droga sobre la capacidad de resolver un problema matematico, podriamos formar
parejas de individuos basandose en los CI estimados, en la cantidad de preparaci6n
maternatica, en los conocimientos estadisticos 0 en el rendimiento alcanzado en la - -
S x,-x, = .jsx~ , + s1 2
= 0.91.
resolucion de otros problemas matematicos, Este disefio tiene dos ventajas:
a) Proporciona seguridad de que los grupos experimentales son «equivalentes» en , did' leando la formula (12.8), 0 sea,
• Se puede oblener direclamente el error estandar e a me ra emp
cuanto a la capacidad inicial.
b) Permite sacar provecho de la correlacion basada en la capacidad inicial con 10 sx,=
JJ sc
N,(N,-l)
(5 = 0.6455.
"j4(3j
que se consigue eliminar una fuente de error procedente de nuestras medidas.
265
INFERENCIA ESTADfSTICA CON MUESTRAS CORRELACIONADAS
264 ESTAOfSTICA PARA LAS CIENCIAS SOCIALES
apareados, se dan los siguientes pasos: diferencias entre las calificaciones de criter.io ob.tenidas p~ra lcad~~a:f~C~O ee~u:e~od~
t ra ar d d t s en un caso e una
Paso 1. Empleando la formula (8.2)*, hallamos que la correlacion entre los dos de la diferencia directa transforrna un caso e os n;ues rab d desvia
grupos es di uestral y un error estandar asa 0 en una
:~:s~:~i~~~~~:~~no~e~~ ~.~l: es queri
a
~~~::n~b~:n~~: ~~s~:i:~~~::u:~:=ll~:
~::~~~:~~~::e~~/ ~~ ~:~:~~~:~~:~; qJe~a diferencia media (JlD) tiene algun valor
Paso 2. El error estandar de la diferencia entre medias para grupos pareados es especifico. La t que se usa para decimar H 0: Jl[5 = 0 es
l5 - IIlJ jj (14.2)
t=---=-·
SlJ SlJ
= JOA167 + 0.4167 - 2(0.80)(0.6455)(0.6455) = 0.41.
. .. 1 lcular Ia suma de cuadrados de la
La formula de calificaclOnes ongina es para ca cu ar
entre medias. En otras palabras, proporciona una prueba mas sensible de esta
diferencia y nos da mayor probabilidad de rechazar la hipotesis nula cuando esta es
SCD = L D2 - (L~)2 , (143)
Problema muestral
14.3 Metodo de la diferencia directa: Los directores de una pequefia universidad privada se enc~entran con q~~ es
el cociente t de Student necesario aumentar el tamano de las aulas. Una pelicula especl~l, don~e se ttIhZ~~
las tecnicas mas avanzadas de propaganda, presenta las ventajas de as cases ,
- Se evalua la actitud de un grupo de diez estudiantes antes y despues
Por fortuna, no es realmente necesario determinar la correlacion entre las muestras mayor t amano. 1 t ., n de la pelicula
de la proyeccion de esta pelicula. Se preve q~e a. presen ~ClO
para hallar SX,-](,' Hay otro metodo que perrnite el calculo directo del error determinara actitudes mas favorables (0 sea, cah,fi~aclOnes mas ~ltas).
estandar de la diferencia. A este procedirniento 10 Ilamarernos metoda de fa diferencia Planteemos este problema en terminus estadlstlCoS formales.
• Notese que (X, - X,) reemplaza a (Y - V) en la formula (8.2). • Una formula allernaliva para obtener Sjj es Sjj ~ sn/~ , donde Sn ~ ..J SCn/N:
266 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
INFERENCIA ESTADfSTICA CON MUESTRAS CORRELACIONADAS 267
Hip6t~sis nula (H o): ~a diferencia entre las actitudes de los estudiantes antes Y
1.
Paso 4. El valor de t en el presente problema es
despues de ver la pelfcula es mayor 0 igual que cero, 0 sea, J1.D ~ O.
2. Hip6t~sis alternativa .(H 1 ) : La actitud de los estudiantes sera mas favorable 15 3.70
despues de ver la pelicula, 0 sea, J1.D < O. Notese que la hipotesis alternativa es t=-= - - = -1.81.
Sfj 2.04
direccional y, en consecuencia, se debera emplear un examen unilateral.
3. Prueba estadistica; Dado que estamos utilizando un disefio antes-de p . Decision. Puesto que la t obtenida no cae en la region critica (esto es, -1.81 >
. daa Ia
result a apropia art de S tudent para muestras correlacionadas. sues,
> t o.0 1) ' no podemos rechazar H o- No esta justificado llegar a.la ~oncl.usion de que la
4. Nivel de significaci6n: IX = 0.01. pelicula produce un cambio de actitudes estadisticamente significativo.
5. Distribucton muestral: La distribucion muestral es la t de Student Con gl =N
- 1, 0 sea, lO - 1 = 9.
6. Regi~~ ~ritica: t o;OI S;. - 2.821. Puesto que HI predice que las calificaciones en la
condicion despues seran mayores que las correspondientes a la condicion antes 14.4 EI estadigrafo A de Sandler
esp~~amo.s.que las diferencias entre las calificaciones sean negativas. Por tanto, la
region critica consta de todos los valores de t tales que t s; -2.821.
Hace algunos afios, un psicologo llamado Joseph Sandler ideo un procedimiento
. La ~abl~ 14.2 muestra los resultados de este experimento. En el metodo de la muy sencillo para obtener valores de la probabilidad x en todos los casos en que H 0:
diferencia directa se emplean los siguientes pasos: J1.1 - J1.2 = 0 y resulta apropiado el uso de la t de Student para muestras correlacio
nadas. Ciertamente, puesto que el estadigrafo A de Sandler se deriva rigurosamente
Paso 1: La suma de los cuadrados de la diferencia de las calificaciones es del cociente t de Student*; los valores de la probabilidad son identicos a los valores
p de Student.
(-37)2
SC D = 511 -1:0 = 374.10. El estadigrafo A se define del modo siguiente:
Paso 2. El error estandar de la diferencia media es Suma de los cuadrados de las diferencias LD 2
A= =--. (14.7)
Cuadrado de la sum a de las diferencias (LD)2
Sjj = J374.l0/lO(9) = 2.04. Haciendo referencia a la tabla de A (tabla E, apendice III) bajo (N - 1) grados de
libertad, puede determinarse si la A obtenida es igual 0 menor que los valores
~aso 3. El valor de jj es 15 = -37/lO = -3.70. (Para comprobar la exactitud de tabulados a diversos niveles de significacion.
D
L. , restamos LX 2 de LXI' 0 sea, LXI - LX 2 = LD, 171 - 208 = -37.) Ilustremos el calculo de A en el ejemplo anterior. Se recordaria que LD 2 = 511 Y
LD = - 37. El valor de A resulta ser
ANTES OESPUES
Tabla 14.2 Calificaciones de diez individuos en un
OlFERENCIA
experimento en que se emplea un diseiio antes- A = 511/(-37)2 = 0.373.
INOIVIOUO x, X, D D'
despues (datos hipoteticos).
Refiriendonos a la tabla E, bajo 9 grados de libertad, encontramos que se requiere
1 25 28 -3 9 una A igual 0 menor que 0.213 para que el resultado sea significativo al nivel de 0.01
2 23 19 4 16 (examen unilateral). Puesto que 0.373 es mayor que el valor tabulado, no podemos
3 30 34 -4 16
4 rechazar la hipotesis nula. Notese que nuestra conclusion es precisamente la misma a
7 10 -3 9
5 3 6 -3
la que se llego usando la t de Student. Esto ha de ser asi, naturalmente, ya que ambos
9
6 22 26 -4 16 procedimientos son matematicamente equivalentes. Dado que el calculo de A
7 12 13 -1 1
8 30 47 -17 289 * Formula para pasar de t a A:
9 5 16 -11
10 14 9
121 -I N
I
5 25 A=--+-
Nt? N
I 171 208 -37 511
1= JANN=-_\'
268 ESTADfsTICA PARA LAS CIENCIAS SOCIALES
INFERENCIA ESTADfSTI CA CON MUESTRAS CORRELACIONADAS 269
requiere mucho menos tiempo y trabajo que el empleado para calcular el valor de t,
XI = 14.2 X, = 12.9
Resumen del capitulo 51 = 2.0 5, = 1.5
NI = 17 N, = 17
Una formula general para calcular el error estandar de la diferencia es un disefio de grupos apareados (esto es, si r = 0.00), ~se
emPlle~?O
.,
2. Si lIegado
habria no hubieramos
a una cone usion diferente?
I' 2 .
Expliquese. [Sugerencia: Para caIcular sx,-x,'
S
X'-X
-
2 - ""x, + ·'.r,2 - -)/.",,
/,,2 0
"5.',"-"2' , "I
empleese la rormuia sx,_x,
= Vs~
X,
X,
+ s- .J
. A . dijo que la Liga
3. EI entrenador de un equipo e. a ~q .
. d I P uefia Liga en la Liga mencana
Es evidente que apareando las muestras respecto a una variable correlacionada con I D terminar la validez de esta afirrnacion en
la variable de criterio, es posible reducir la magnitud del error estandar de la Americana es mas poderosa que la L(~~) :c~onaa' co~tinuacion. Emplear la t de Student para
base a los numeros de «horneruns» a os
diferencia y proporcionar, por tanto, un examen mas sensible de la diferencia entre muestras correlacionadas y la A de Sandler, ex = 0.05.
medias. Por supuesto, cuanto mayor sea la correlacion, mayor sera la reduccion en el
error estandar de la diferencia.
POSICION FINAL EN L1GA NUMERO L1GA NUMERO
Vimos el uso del metodn de la diferencia directa para determinar la significacion LA L1GA RESPECTIVA AMERICANA DE HR NACIONAL DE HR
de la diferencia entre las medias de muestras correlacionadas.
1 Minnesota 16 Los Angeles 18
Finalmente, vimos el uso de un examen matematicamente equivalente, que es el 2 Chicago 17 San Francisco 11
de la A de Sandler. Debido a la sencillez de su calculo, la prueba de Sandler 3 Baltimore 15 Pittsburgh 14
reemplaza Con ventaja a la t de Student cuando se emplean muestras correlacio 4 Detroit 12 Cincinnati 10
nadas. 5 Cleveland 11 Milwaukee 12
6 New York 9 Philadelphia 13
7 California 13 SI. Louis 8
8 Washington 16 Chicago 10
Terminos para recordar 9
10
Boston
Kansas City
18
14
Houston
New York
9
15
Esperanza de vida en los Estados Unidos* diferencias y sumarlas [ED 2 ] , y sustituir finalmente estos valores en la formula del estadigrafo
A, que es A = ED 2j(ED)2. EI numero de grados de Iibertad es N - 1. Examinar la hipotesis
NO BLANCO
(PRINCIPALMENTE
NO BLANCO H 0: /10 = 100 millas para los tacometros de cada fabricante. Comparar los resultados de este
(PRINCIPALMENTE examen con los del examen anterior.
BLANCO NEGRO)
BLANCO NEGRO)
EDAD HOMBRE MUJER HOMBRE MUJER EDAD HOMBRE MUJER HOMBRE MUJER
u, En un estudio disefiado para determinar la eficacia de una nueva diet a, una compafiia de
seguros selecciono una muestra de 12 hombres con exceso de peso y edades comprendidas
0 67.5 74.4 60.9 66.5 11 58.6 65.2 53.5 58.7 entre 40 y 50 afios, Obtuvo sus pesos antes de iniciar la dieta y sesenta dias despues, Plantear y
1 68.2 74.8 62.9 68.0 12 57.6 64.2 52.6 57.7 examinar la hipotesis nula apropiada, usando C( = 0.05.
2 67.3 73.9 62.1 67.2 13 56.7 63.2 51.6 56.7
3 66.4 73.0 61.2 66.3 14 55.7 62.2 50.7 55.7
4 65.4 72.0 60.3 65.4 15 54.7 61.3 49.7 54.8 INDIVIDUO PESO INDIVIDUO PESO
5 64.4 71.0 59.3 64.5 16 53.8 60.3 48.8 53.8
6 63.5 70.1 58.4 63.5 17 52.8 ANTES DESPUES ANTES
59.3 47.8 52.8 DESPUES
7 62.5 69.1 57.4 62.5 18 51.9 58.3 46.9 51.9
8 61.6 68.1 56.5 61.6 19 91.6 81.6 94.8 92.9
51.0 57.4 46.0 50.9 1 7
9 60.6 67.1 55.5 60.6 20 50.1 2 107.5 100.2 8 86.6 82.9
56.4 45.1 50.0
10 59.6 66.2 54.5 59.6 78.4 79.3 9 90.7 83.9
3
4 73.0 71.6 10 85.7 84.8
5 83.9 81.6 11 80.2 78.0
8. Numerosa~ organizaciones de consumidores han criticado a la industria automovilistica 6 95.2 89.3 12 83.4 84.3
por emplear tacometros que muestran grandes variaciones de un instrumento a otro y de una
marca a ~tra. Para comprobar si se puede 0 no. considerar que los tacometros producidos por
dos ~abncantes. c~mpehdores pueden ser consideradns como provenientes de una poblacion 12. Una dificultad para interpretar los resultados del ejercicio 11 consiste en la falta de un
comun; ~e eq.mpo a once coches con dos taco metros, uno de cada fabricante. Todos los grupo de control. Es posible que un grupo seleccionado al azar de hombres con exceso de peso
a~tomoviles cI~cularon sobre una pista de 100 kilo metros y se fabularon las lecturas de los ta revele perdidas de peso en un periodo de dos meses. Un grupo de control, apareado en cuanto
cometros. Aphcar el examen adecuado para ver si es significativa la diferencia entre las al peso con los sujetos experimentales del ejercicio 11, mostro los siguientes cam bios antes
lecturas de los tacornetros de cada fabricante, usando C( = 0.01. despues. Plantear y exarninar la hipotesis nula apropiada para el grupo de control. Emplear
C( = 0.05.
FABRJCANTE FABRICANTE
INDIVIDUO PESO INDIVIDLJO PESO
AUTOMOVIL A B AUTOMOVIL A B
ANTES DESPUES ANTES DESPUES
1 104 102 7 97 99
2 112 106 8 107 102 1 92.0 93.8 7 94.8 97.5
3 103 107 9 100 98 8 87.0 97.5
2 106.5 104.7
4 115 110 10 104 101 9 91.1 83.4
3 79.3 78.0
5 99 93 11 108 102 10 84.8 88.9
4 72.1 74.3
6 104 101 11 80.7 83.4
5 83.0 84.8
6 95.2 92.5 12 83.9 78.4
AlMACEN
DE «REBAJAS» COMPETIDOR DIA ANTES DESPUES
A 25 30 F 5 5
16. Una empresa acaba de adoptar un regimen de trabajo de cuatro dias a la semana. Se B 15 17 G 0 1
conto.el numero de unidades producidas semanalmente por 10 ernpleados antes y despues del C 10 13 H 40 45
cambio. Usando la prueba A de Sandler, examinar la hipotesis nula a un nivel de significacion D 25 30 I 50 45
de IX = 0.05. E 30 25 J 35 40
i,Aumento la venta de los otros discos como consecuencia de la venta especial? i,Cual es el
N.D DE UNIDADES valor de A?
EMPlEADO ANTES DESPUES 20. Un comerciante registro el numero de paquetes de cigarrillos de cinco marcas vendidos
en tres ocasiones diferentes: un mes antes de que se estableciera un impuesto de $0.04 por
A 25 23 paquete, un dia despues de la subida y un mes despues del impuesto.
B 26 24
C 27 26
ANTES DEL IMPUESTO UN DIA DESPUES UN MES DESPUES
D 22 23
E 29 30 Marca A 50 45 49
F 25 24 Marca B 40 35 42
G 29 26 Marca C 60 57 59
H 30 32 Marca D 65 67 67
I 25 25 Marca E 50 40 47
J 28 29
fotografias de hombres y de mujeres. Los valores criticos dados en la cuarta y en la octava laboratorio se Ie inyecto una sustancia placebo y luego se la coloco en una caja junto a otra
columna. Una calificaci6n positiva significa mayor respuesta pupilar ante la fotografia de una rata. Se midio la cantidad de «agresion patologica» (ataques con las patas delanteras,
mujer; una calificaci6n negativa significa mayor respuesta pupilar ante la fotografia de un mordiscos y empujones) por parte de las ratas experimentales durante cierto periodo, Luego. se
hombre. inyect6 a las ratas experimentales una dosis ~e mescalina,. ~e las co~0~6 nuevame?te en cajas
con otras ratas y se midio nuevamente la cantidad de agresion patologica, En la pnmera etapa
se encontro que X = 1.31 y s = 0.92 agresiones patol6gicas, en tanto. que desp~e~ de
HETEROSEXUALES HOMOSEXUALES
haberseles inyectado mescalina se encontro que X = 2.13 y s = 1.78 agresiones patologicas.
RESPUESTA TOTAL RESPUESTA TOTAL La correlaci6n entre los resultados para ambos periodos fue de r = 0.56.
a) Usando CJ. = 0.05, plantear y examinar la hip6tesis nula de que la .correla.ci6n entre la
ANTE ANTE ANTE ANTE
agresion patologica antes y despues de la inyeccion de mescahna es. 19ua~ a cer?
FOTOGRA- FOTOGRA- RESPUESTA FOTOGRA- FOTOGRA- RESPUESTA
FIAS DE FIAS DE RELATIVA FIAS DE FIAS DE RELATIVA
b) Utilizando CJ. = 0.05, plantear y examinar la hipotesis nula de que no existe ~lferencIa
INDIVIDUO I HOMBRES MUJERES H vs. M INDIVIDUO HOMBRES MUJERES H vs. M entre la cantidad de agresi6n antes y despues de la inyeccion de mescahna.
c) Determinar los intervalos de confianza del 95 % para la agresi6n patologica media
1 - 0.4 + 5.9 + 6.3 6 + 18.8 + 11.2 - 7.6
antes y despues de la inyecci6n de mescalina.
2 -54.5 -22.4 +32.1 7 - 4.6 -38.0 -33.4
3 + 12.5 + 19.2 + 6.7 8 + 18.9 + 18.1 - 0.8
4 + 6.3 +39.0 +32.7 9 +18.2 - 5.6 -23.8
5 - 1.5 +23.1 +24.6 10 +15.8 +21.5 + 5.7
a) Efectuar una prueba con la A de Sandler entre las diferencias de las calificaciones
(ultima columna) de la muestra de heterosexuales. Usar CJ. = 0.05, examen bilateral.
i,Queda justificado el punto de vista de que los varones heterosexuales tienen
diferente respuesta pupilar ante las fotografias de mujeres y de hombres?
b) Efectuar una prueba con la A de Sandler sobre las diferencias de las calificaciones de
la muestra de homosexuales. Usar CJ. = 0.05, examen bilateral. i,Queda justificado el
punto de vista de que los varones homosexuales tienen diferente respuesta pupilar
ante las fotografias de hombres y de mujeres?
c) Efectuar una prueba t de muestras independientes, usando las diferencias de
calificaciones de los varones heterosexuales versus los varones homosexuales. Usar
CJ. = 0.05, examen bilateral. i,Existe base para afirmar que existe una respuesta diferente
de los heterosexuales y de los homosexuales ante las fotografias de hombres y de
mujeres, respectivamente? [Sugerencia: Para facilitar los calculos evitando numeros
negativos, sumar 34 a cada una de las calificaciones. Este procedimiento elimina
todos los mimeros negativos y hace uso de la generalizacion indicada en la secci6n
2.3.]
Para calcular la media de cada grupo utilicese la formula,
5 5
L Xi L Xi - 5(34)
;=1 i=J
--=-----.
N N
Nota: Al sumar 34 a todas las calificaciones no se altera la diferencia entre las medias ni el error
estandar de la diferencia, puesto que se conservan las diferencias relativas entre las calificacio
nes. Sin embargo, la media de cada grupo tendra un aumento de 34.
24. En el ejercicio anterior, se rechaza la hipotesis nula en dos de las tres comparaeiones.
Desde el punto de vista de la estadistica, i,estaria mas justificado rechazar H o si se hubieran
obtenido los mismos valores de A y t con una N mayor? (Hess, 1965).
25. Los efectos de la droga alucinogena llamada mescalina sobre el comportamiento agresivo
fueron investigados por Sbordone, Wingard, Elliot y Jervey (1978). A cada una de 45 ratas de
[276] INTRODUCCI6N AL ANALISIS DE LA VARIANZA 277
Introducci6n
ser significativas a un nivel de 0.05?; desde luego que no. Sin duda pensariamos que
15
al analisis de la varianza
«con 1000 comparaciones seria sorprendente que no obtuviesemos aproximadamen
te 50 comparaciones significativas por azar (0 sea, por errores predecibles de
muestreo)).
El analisis de la varianza es una tecnica de analisis estadistico que per mite superar
la ambigiiedad que se presenta al estimar diferencias significativas cuando se realiza
mas de una comparacion. Este analisis permite responder a la pregunta: i,Existe una
indicacion general de que los tratamientos experimentales han producido diferencias
entre las medias de los diversos grupos? Aunque el analisis de la varianza puede
utilizarse en el caso de dos muestras (don de proporciona los mismos valores de
probabilidad que la t de Student), su usa mas general se presenta cuando estan
involucrados tres 0 mas grupos. Sin duda, el metodo tiene su maxima utilidad en el
estudio de dos 0 mas variables independientes. Con el proposito de exponer las
15.1 Comparaciones de varios grupos caracteristicas fundamentales del analisis de la varianza, nuestro material ilustrativo
inicial correspondera al caso de dos muestras con grupos independientes. Los
Hemos revisado en este libro, y en varias ocasiones, el disefio clasico de los procedimientos que se indican a continuacion podran generalizarse a cualquier
experimentos. Este estudio clasico se realiza con dos grupos, uno experimental y mimero de grupos independientes.
otro de control. El proposito de la inferencia estadistica consiste en examinar
hipotesis especificas; por ejemplo, si es razonable considerar que los dos grupos
provienen de la misma poblacion [ver el capitulo 13).
Aunque este disefio clasico de investigacion se emplea aun en muchos estudios, 15.2 EI concepto de sumas de cuadrados
tiene evidentes limitaciones. Restringir siempre nuestras observaciones ados grupos,
es menospreciar la enorme complejidad de los fenomenos que estudia el cientifico. Es
Se recordara que anteriormente definimos el estimador 110 sesgado de la varianza
muy raro que los sucesos de la naturaleza se ordenen convenientemente en dos
grupos, uno experimental y otro de control. Las preguntas que con mayor frecuencia como
hacemos a la naturaleza son del tipo siguiente: i,Cual de los diversos esquemas -z I(X - xy SC
alternativos de reforzamiento conduce a una mayor resistencia contra la extincion s = N-l =N-(
experimental? i,Cual de los cinco metodos diferentes para ensefiar a operar con
Tambien se recordara que, cuando las desviaciones de las calificaciones respecto a la
fracciones en los grados primarios tiene mas exito? i,Que tipo de psicoterapia
media (X - X) son grandes, la varianza y, por tanto, la variabilidad de las
produce una mayor recuperacion del paciente?
calificaciones, es tambien grande. Cuando las desviaciones son pequefias, la varianza
Es evidente que el disefio de investigacion necesario para proporcionar respuestas
es correspondientemente pequefia.
a las preguntas anteriores, requerira necesariamente la comparacion de mas de dos
Ahora bien, si volvemos a pensar en la t de Student, notaremos que tanto el
grupos. Cabria pensar: i,Cual es la dificultad para hacer una comparacion entre
numerador como el denominador nos dan una estimacion de la variabilidad:
varios grupos? i,No podemos comparar simplemente la media de cada grupo con la
media de cada uno de los otros y obtener una t de Student para cada comparacion? Xl - x,
t = -----''------=
Por ejemplo, si tuvieramos cuatro grupos experimentales A, B, C y D, i,no podrfamos SX,-X,
calcular valores de la t de Student para comparar A con B, C y D; B con C y D; y C
con D? Se recordara que el denominador, al que llamamos error estandar de la diferencia
Si se piensa un momento en los errores de la inferencia, que ya hemos discutido entre medias, se basa en la estimacion combinada de la variabilidad dentro de cada
ampliamente, se recordara que nuestra mayor preocupacion fue la de evitar errores grupo experimental; 0 sea,
del tipo I. Cuando se establece la region de rechazo al nivel 0.05, estamos reconocien
do que aceptamos el riesgo de estar equivocados hasta en un 5 % de las veces al SC 1 + SC Z ( 1 1)
rechazar la hipotesis nula. Ahora bien, i,que ocurre cuando tenemos que hacer sx,-x,= N +N
l z-2 N I + N z .
numerosas comparaciones? Poniendo un ejemplo extrerno, supongase que estamos
realizando un estudio que requiere el calculo por separado de 1000 valores de la t de Sin embargo,el numerador es tambien una medida de la variabilidad, que en este
Student. i,Nos causaria una gran sorpresa que, por ejemplo, 50 de las t demostraran caso es la variabilidad entre las medias. Cuando la diferencia entre las medias es
278 ESTADisTICA PARA LAS CIENCIAS SOCIALES INTRODUCCI6N AL ANALISIS DE LA VARIANZA 279
Recuadro 15.1
AUTOESTIMACION
PROMEDIO
12
11
<{
f=
,
,
<{ lO
a.
::;E , MUCHA AUTOESTIMACION
u;
9
" ,,
,
8-
7
, POCA AUTOESTIMACION
sL---1---------------I-------------'
COM PETENTE COM PETENTE
NO COMETE TORPEZA COMETE TORPEZA
CARACTERISTICAS DE LA PERSONAS QUE
ACTUAN COMO ESTIMULO
Uno de los atractivos de la tecnica del analisis de la varianza es que libera al macron, Algunos sujetos de cada uno de estos grupos vieron corneter una torpeza
investigador de las Iimitaciones del tradicional disefio experimental de los dos grupos. (derramar una taza de cafe) a una persona competente. Ante los restantes sujetos, la
No solamente proporciona un metodo para analizar los efectos de un mimero ilimitado persona competente no cornetio ninguna torpeza. La medida dependiente Iue una
de niveles de tratamiento de una variable experimental, sino que tam bien constituye calificacion de «simpatia» hacia la persona que actua como estfmulo.
una base estadfstica para el analisis de algunos disefios muy complejos con dos 0 mas La figura muestra una clara interaccion, Para los sujetos de poca y mucha
variables independientes. EI interes del investigador en tales experimentos va a menudo autoestimacion, el hecho de ver a la persona-estimulo cometiendo una torpeza
mas alia de la pregunta «l,CuMes son los efectos de cada variable experimental?», La deterrnino que disminuyera su simpatfa 0 aprecio hacia dicha persona. En cambio, las
mayoria de las veces, al investigador Ie interesa saber si tiene lugar 0 no, una interaccion personas de autoestimacion promedio sintieron mayor simpatfa por la persona
entre dos 0 mas variables independientes. Se dice que dos variables interactuan si los estfmulo que cornetio Ia torpeza. Interacciones, como esta, afiaden un poco de picante a
efectos de una de elias dependen del nivel de la otra. Cuando se intenta forrnar unjuicio, la dieta insipida de muchos esfuerzos para hacer investigacion.
resulta de gran ayuda la representacion grafica de los resultados experimentales.
En la figura adjunta se resume un conjunto de resultados experimentales obtenidos Attraction toward the competent stimulus person, with higher scores indicating grater attraction.
(R. Helrnreich, E. Aronson y J. LeFan, «To err is human-sometimes: ElTects of self-esteem,
como parte de un estudio referente a los efectos que se producen al ver corneter una
competence, and a pratfall on interpersonal attraction», Journal oj Personality and Social
torpeza a una persona que aetna como estfmulo. Se dividio a los sujetos en tres grupos:
Psychology, 16 (1970): 262. Copyright 1970 by the American Psychological Association. Reprodu
los de poca autoestimacion, los de autoestimacion promedio y los de mucha autoesti cido con permiso.)
varianza y el error estandar de la diferencia entre medias. Se trata simplemente del La suma de cuadrados dentro de los grupos es simplemente la suma de la suma
numerador en la formula para la varianza, 0 sea, Sc. Como se recordara, la formula de cuadrados obtenida dentro de cada grupo, 0 sea,
para calcular la suma de cuadrados es
SC w = SCI + SC 2 (15.3)
La media para el grupo 1 es 4: y para el grupo 2 es 8. La media general, Xtat, es La formula para calcular la suma de cuadrados entre grupos con los datos
488 = 6. Si restaramos ahora la media general de cada calificacion y elevaramos originales es
al cuadrado, obtendriamos la suma total de cuadrados:
(15.5)
(15.1)
y en nuestro ejemplo,
(16)2 (32)2 (48)2
La formula alternativa, basada en los datos originales, es SCE = -4- + -4- - -8
= 64 + 256 - 288
SC = ~ X2 _ Q:XtoY
tot ~ tot N (15.2) = 320 -',288 = 32.
Notese que la suma total de cuadrados es igual a la suma de la suma de
Para los datos de la tabla 15.1, la suma total de cuadrados es
cuadrados entre grupos y la suma de cuadrados dentro de los grupos. En otras
palabras,
sc.; = 360 _ (4:V (15.6)
= 360 - 288 = 72. En el ejemplo anterior, SC ta t = 72, SCw = 40 Y SCE = 32. Asi, 72 = 40 + 32.
282 ESTADfsTICA PARA LAS CIENCIAS SOCIALES INTRODUCCION AL ANALISIS DE LA VARIANZA 283
15.3 Obtencion de estimaciones de la varianza resultado sea significativo al nivel 0.05. Entonces, en el presente problema no
podemos rechazar la hipotesis nula. Notese que la tabla D proporciona valores
bilaterales. El examen del analisis de la varianza para significacion es autornatica
Para lIegar ahora a las estimaciones de la varianza a partir de las sumas de
mente bilateral puesto que cualquier diferencia entre las medias muestrales aumen
cuadrados entre los grupos y dentro de los grupos, solo es necesario dividir cada una
tara la totalidad del valor de F y no solamente la diferenqia que interesa al inves
de elias por el numero de grados de libertad apropiado*. Los grados de libertad entre'
tigador.
grupos son, simplemente, el nurnero de grupos (k) menos 1.
glE = k - 1. (15.7)
15.5 Un ejemplo que involucra tres grupos Paso 3. La suma de cuadrados dentro de los grupos puede obtenerse aplicando la
formula (15.3) para tres grupos:
Supongase que acabamos de terrninar un estudio concerniente a la determinacion de
la influencia de varios niveles de motivacion en la adquisicion de conocimientos de SCw = (292 _ (4~)2) + (756 _ (7:)2) + (168 __(3:)2) = 176.45'.
aritmetica. Veintisiete nifios de primaria fueron asignados aleatoriamente a tres
grupos iguales, usando uno de los metodos descritos en la seccion 10.2. El grupo 1, SCw = SC lol - SCE = 291.41 - 114,96 = 176.45.
que sirvio de control, recibio una pequefia cantidad de motivacion en clase. Los
integrantes del grupo 2 recibieron un nivel de motivacion que fue calificado de
La estimacion de la varianza entre grupos es
intermedio por personas de criterio independiente. Finalmente, los alumnos del
grupo 3 recibieron un alto nivel de motivacion.
-2 . 114.96
Al terminar el periodo de instruccion, se hizo a todos los nifios un examen que gl E = k - 1 = 2,' sE = - - = 57.48.
tiene el nombre de «Inventario de Aritmetica Basica». En la tabla 15.2 se presentan 2
los resultados de este estudio hipotetico,
La estimacion de la varianza dentro de los grupos es
Total 291.41 26
N = 27.
Paso 2. Utilizando la formula (15.5) para tres grupos, la suma de cuadrados entre gllol= N -1. (15.12)
grupos es
En el presente ejemplo, el numero de grados de libertad para el total es
SC _ (46)2 (78)2 (34)2 (158)2_
E - -9- + -9- + -9- - ------r;- - 114.96. gllol = 27 - 1 = 26.
286 ESTADiSTICA PARA LAS ClENCIAS SOCIALES INTRODUCCION AL ANALISIS DE LA VARIANZA 287
15.6 Interpretacion de F Paso 1. Disponer un cuadro que muestre la media de cada estado y las diferencias
entre parejas de medias, tal como aparece en la tabla 15.4.
Cuando nos referimos ala F requerida para que hay a significacion con 2 y 24 grados Tabla 15.4 Diferencias entre medias.
de libertad, encontramos que una F mayor 0 igual a 3.40 es significativa al nivel 0.05. x,
Puesto que nuestra F de 7.86 excede a este valor, podemos concluir que no todas X, = 5.11
las medias de los tres grupos son estimaciones de una media poblacional com un,
Ahora bien, l.debemos detenernos aqui? l.No nos interesa en fin de cuentas averiguar x, = 5.11 3.56 1.33
si uno de los tres metodos para ensefiar aritmetica es superior a los otros dos? La X2 = 8.67 4.89
respuesta a la primera pregunta es negativa, y la respuesta a la segunda, afirmativa. X3 = 3.78
La verdad es que nuestro hallazgo de un cociente F significativo para el
experimento en su totalidad, permite la investigacion de hipotesis especificas. En
aso 2. En la tabla 0, para gl = 24, k = 3 Y IX = 0.05, encontramos qo.os = 3.53.
ausencia de una F significativa, cualquier diferencia significativa entre comparaciones
especificas debera considerarse como sospechosa por ser muy posible que represente aso 3. Para hallar DRS, se multiplica qo.os por Js~/N. El valor de stv se
una diferencia casual. ncuentra en la tabla 15.3 como estimacion de la varianza dentro de los grupos. En
En los ultimos alios los cientificos del comportamiento han desarrollado un gran ada estado el valor de N es 9. Asi,
numero de pruebas que permiten al investigador el estudio de hipotesis especificas
referentes a los parametres poblacionales. En lineas generales, estas pruebas son de
dos tipos: DRS = 3.53 ~ 9 fU5 = 3.53(0.90) = 3.18.
1. Comparaciones planeadas 0 a priori: Cuando se planean las comparaciones antes
de la investigacion, resulta apropiada una prueba a priori. En las pruebas a priori aso 4: Buscando en la tabla 15.4, encontramos que las diferencias entre Xl versus
no es necesario que la F general sea significativa. 2Y X 2 versus X 3 exceden a DRS = 3.18. Por tanto, podemos concluir que estas
2. Comparaciones a posteriori: Cuando las comparaciones no se planean de iferencias son estadisticamente significativas al nivel IX = 0.05. Puesto que la media
antemano, resulta apropiado el empleo de una prueba a posteriori. del grupo 2 es significativamente mayor que la media de los otros dosestados,
podemos llegar a la conclusion de que este estado produce un resultado significativa
En el ejemplo presente ilustraremos el uso de una prueba a posteriori para mente mayor en la medida dependiente (Inventario de Aritmetica Basica), Parece,
efectuar comparaciones entre medias tomadas por parejas. pues, que los niveles de emotividad medios producen los mejores resultados en este
Tukey (1953) desarrollo una prueba de este tipo, a la que llarno prueba de la experimento hipotetico,
diferencia honestamente significativa 0 DRS (honestly significant difference, RSD).
Para poder utilizar esta prueba, la F general debe ser significativa.
Una diferencia entre dos medias es significativa a un nivel IX si es igual 0 mayor
que DRS, cuyo valor es Estimacion del grado de asociacien
(15.13) entre la variable experimental
y la variable dependiente
donde s~ = varianza estimada dentro de los grupos,
N = numero de sujetos en cada estado, n la seccion 13.4 vimos el uso de omega al cuadrado (w 2 ) para estimar la proporcion
qrx = valor que se encuentra en la tabla -0, para un nivel IX y con glw y k varianza en la medida dependiente que se puede atribuir a variaciones en la
(numero de medias) dados. iable de tratamiento. Es posible efectuar una estimaci6n similar en el analisis de
arianza con clasificacion simple:
Sustituyendo estos valores en la formula (15.14), obtenemos: Asi cuando observamos un analisis de la varianza con «clasificacion simple»,
os 'que la variabilidad en la medida dependiente se debe a la variabilidad entre los
w2 est = _11_4_.9_6_-__
(2----:)(--::-70_35_) empos efectos de tratamiento) 0 ala variabilidad dentro de los grupos (dif nerencias 0
(
291.41 - 7.35 ebidas al «azar»), En el analisis de la varianza con «clasificacion doble», Ia vana bili
ru 0
1
EFECTOS CONJUNTOS
DE A y B
TOTAL
VARIABILIDAD
15.8 Amilisis de la varianza cuando hay DENTRO DE
LOS GRUPOS
clasiflcacion doble: el diseiio factorial
Acabamos de ver el aruilisis de la varianza con «clasificacion simple», cuyo nombre En un analisis de la varianza con clasificacion doble hay dos variables diferentes
proviene del hecho de que los diversos grupos de tratamiento representan diferentes experimentales 0 de tratamiento. Una de el~as, 0 ~as dos, puede ser ,cualitativa 0
niveles 0 diferentes categorias de una sola variable de tratamiento. Haciendo posible cuantitativa. Las variables cualitativas se diferencian en la clase mas que en el
la consideracion simultanea de varios niveles 0 categorias de una variable experimen «cuanto» como ocurre, por ejemplo, en los diferentes metodos de enseiianza 0 en los
tal, nos liberamos de las limitaciones del disefio tradicional de los dos grupos, el diferentes tipos de psicoterapia. Las variables cuantitatioas difieren en la cantidad,
experimental y el de control. como en la cantidad de droga 0 en la cantidad de refuerzo positivo suministrado a los
Las tecnicas avanzadas del analisis de la varianza ofrecen ventajas aun mas
sl.ljetos experimentales. . ,0 • •
profundas: (1) permiten la evaluacion de mas de una variable a la vez; (2) permiten la Si bien hay sola mente dos variables expenmentales en un analisis de la ~ananza
determinacion de posibles efectos de interaccion entre las variables; y (3) representan n clasificacion doble, puede haber cualquier numero de subclases 0 mveles de
un modo eficaz de aprovechar el tiempo y el esfuerzo empleados en la investigacion, atamiento de cada una de las variables. Un determinado estudio podria incluir dos
puesto que en muchos diseiios de analisis de la varianza cad a observacion proporcio iveles de una variable y cuatro niveles de una segunda variable, 0 tres niveles de
na informacion acerca de cada variable, de las interacciones entre variables y del da una de dos variables, etc. La forma tradicional de mencionar un analisis de la
error. rianza con clasificacion doble consiste en citar el numero de niveles (0 subclases) de
Detengamonos un momenta y examinemos el concepto de interaccion. Se dice a variable. A modo de ilustracion, un estudio con dos niveles de una variable y
que dos variables (0 facto res) interactuan cuando el efecto de una variable sobre
atro niveles de una segunda variable tiene un diseiio de 2 x 4. Un estudio con tres
alguna medida del comportamiento depende de la presencia 0 de la can tidad de una
eles de cada variable tiene un diseiio de 3 x 3. Un estudio con tres niveles de una
segunda variable. Supongamos, por ejemplo, que un particular metodo de enseiianza
riable y cuatro niveles de una segunda variable tiene un disefio de 3 x 4.
mejora las calificaciones obtenidas en una prueba por los sujetos de gran inteligencia,
pero no mejora las calificaciones obtenidas por los sujetos de poca inteligencia. Si los
efectos de los diferentes metodos de enseiianza fueran iguales para todos los niveles
de inteligencia, no habria interaccion. Veamos otro ejemplo. Volvamos a los datos
.8.1 El concepto de combinacion de tratamientos
presentados en el recuadro 13.1. Notese que la respuesta pupilar media (variable un diseiio factorial, a cada sujeto experimental se Ie administra algun nivel ?e c~~a
dependiente) ante las fotografias de hombres y de mujeres (variable independiente A) iable de tratamiento. Se llama combinacion de tratamientos a la combinacion
depende de la orientacion sexual (variable independiente B) de los sujetos experimen rticular de condiciones experimentales. Por ejemplo, en un diseiio factorial de
tales. Asi, la variabilidad en la variable dependiente (respuesta pupilar) puede 4, si a un sujeto dado se Ie administra el segundo nivel de la variabl~ A y el tercer
comprenderse mejor observando el efecto conjunto de las dos variables independien el de la variable B, la combinacion de tratamientos para dicho sujeto es A 2B 3 •
tes, 0 sea, la interaccion entre estos factores.
a) Combinaciones de tratamientos en un diseiio factoria de 2 x 2:
INTRODUCCI6N AL ANALISIS DE LA VARIANZA 291
290 ESTADfsTICA PARA LAS CIENCIAS SOCIALES
B, B2 B, B2
glB = B-1
Combinaci6n
de tratamientos
AIB I AIB 2 A,B I A2B,
onde B es el numero de niveles de B;
b) Combinaciones de tratamientos en un disefio factorial de 2 x 3.
A, A2
B, B2 B, B, B2 B3
dividir la suma de cuadrados dentro de los grupos por los grados de libertad
Combinaci6n
AIB 3
propiados se obtiene una estimacion independiente de la varianza poblacional:
A,B I AIB 2 A2B I A,B2 A2B 3
de tratamientos
SCw
§~ (error) = --, glw = N - k,
EI numero total de combinaciones de tratamientos en cualquier disefio factorial es glw
igual al producto ,de los niveles de tratamiento de todos los factores 0 variables.
Ejemplos. En un disefio factorial de 2 x 2, hay cuatro combinaciones de tratamien onde k es el mimero de combinaciones de tratamientos.
tos.
En un disefio factorial de 2 x 3, hay seis combinaciones de tratamientos.
En disefios factoriales mas complejos, se aplica el mismo principio, En un disefio Ejemplo desarrollado usando un diseiio
factorial de 2 x 3 x 4, hay 24 combinaciones de tratamientos. factorial de 3 x 3
A,
15.8.2 Descomposicion de la suma de cuadrados AI A,
B, B, B, 8, 8, 8, 82 B,
Veamos ahora el analisis de un disefio factorial de 3 x 3. Aunque se trate de un caso B,
particular, el analisis puede generalizarse facilmente a cualquier numero de niveles 0 1 2 5 4 5 6
2 3 6
subclases de cada una de las dos variables. 4 5 7 3 5 8 5 8 10
En un analisis de la varianza con clasificacion doble, la suma total de cuadrados 5 8 9 6 7 6 3 7 12
se divide en dos componentes: la sum a de cuadrados dentro de los grupos y la suma 7 11 12 7 9 11 7 9 11
de cuadrados entre grupos, 0 sea,
Combinaci6n
AlB, A,B 2 AIB 3 A2B , A2B 2 A2B 3 A3B , A3B 2 A3B 3
SC tot = SCw + SCE' de tratamientos
30 19 29 .39
18 27 34 17 23
I
Ala suma de cuadrados entre grupos se la divide ala vez en tres componentes: la
suma de cuadrados para la variable A (SC A), la suma de cuadrados para la variable B Ix = 236
(SC B) Y la suma de cuadrados para la interaccion de las variables A y B (SC A x B)' 0
sea,
eterminemos si existe un efecto significativo de la variable A, de la variable B 0 una
teraccion entre las dos variables. Usaremos (l = 0.01.
Al dividir por el apropiado mimero de grados de libertad, cada uno de los efectos aso 1. Hallar SC tot' Elevar al cuadrado cada una de las calificaciones, sumar todos
de tratamiento proporciona una estimacion independiente de las varianzas poblacio tos valores, y restarle al resultado CIX)2jN:
nales:
gl, = A - 1, SC
tot
="L. X2 _ (IX)2 .
N
INTRODUCCION AL ANALISIS DE LA VARIANZA 293
292 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
En el presente ejemplo, Hallar el numero de grados de Iibert ad para la suma de cuadrados entre
Paso 10. Hallar la suma de cuadrados de la variable B: Hallar los grados de libertad dentro de los grupos:
glw = N - k
= 36 - 9
= 27.
Paso 18. Situar la suma de cuadrados dentro de los grupos y los correspondientes
Puesto que N es igual para cada estado B, habra menor error de redondeo si se grados de libertad en la tabla 15.5.
suman los cuadrados de cada nivel de B y luego se divide por la N de cada estado: Paso 19. Comprobar que
(54)2 + (79)2 + (103)2
SC B = 12 - 1547.11
que
19,766
= -1-2- 1547.11
= 1647.17 - 1547.11 = 100.06. Paso 20. Hallar la estimaci6n de la varianza de la interaccion A x B, dividiendo la
suma de cuadrados de la interaccion por glA x B:
Paso 11. Hallar el numero de grados de libertad para el estado B:
SCA xB 3.27
glB = B-1, S~xB = - - = -- = 0.82.
gl, x B 4
donde B es el nurnero de niveles de B. En el presente ejemplo,
Situar este resultado en la tabla 15.5.
glB = 3 - 1 = 2. Paso 21. Hallar la estimaci6n de la varianza de la variable B, dividiendo la suma de
cuadrados de la variable B por glB:
Paso 12. Situar la suma de cuadrados para la variable B y los correspondientes
grados de libertad en la tabla 15.5.
-2 _ SC B _ 100.06 = 003
SB - - 5. .
Paso 13. Por sustraccion, hallar la suma de cuadrados de la interacci6n: glB 2
SC AxB = SCE - (SC A + SCB) Paso 22. Hallar la estimaci6n de la varianza de la variable A, dividiendo la suma de
= 115.39 - (12.06 + 100.06) uadrados de la variable A por glA:
= 3.27.
S~ = SCA = 12.06 = 6.03.
Paso 14. Hallar el numero de grados de libertad para la surna de cuadrados de la glA 2
interacci6n:
Paso 23. Hallar la estimacion de la varianza dentro de los grupos (error) dividiendo
glAxB = (A - I)(B - 1)
a suma de cuadrados dentro de los grupos por glw:
= (2)(2) = 4.
Paso 15. Situar la suma de cuadrados de la interacci6n y los correspondientes S~ = SCw = 179.50 = 6.65.
grados de libertad en la tabla 15.5. glw 27
Paso 16. Hallar la suma de cuadrados dentro de los grupos. Este valor puede aso 24. Hallar el cociente F para la interacci6n, dividiendo la varianza estimada
obtenerse por sustraccion: e la interacci6n por la varianza estimada dentro de los grupos:
SCw = SC tot SCE
F = s~ x B = 0.82 = 0 12
-
= 294.89 - 115.39 = 179.5. s; 6.65 .,
gl = 4/27.
INTRODUCCI6N AL ANALISIS DE LA VARIANZA 297
296 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
Paso 25. Consultar la tabla D bajo 4 y 27 gl para hallar el valor critico de F para ntre si, Una estimacion de la varianza entre grupos qu~ sea grande ~n relacion con la
rechazar H o al nivel a = 0.01. Puesto que el valor calculado F = 0.12 es menor que . nza dentro de los grupos sugiere que los tratamientos expenmentales son los
ana . ifi .,
el valor tabulado F o.ol = 4.11 requerido al nivel de significancia a = 0.01, no santes de las grandes diferencias entre las medias de los grupos. La signiticativi
podemos rechazar H o- ~:~ de la diferencia en las varianzas estimadas se obtiene utilizando la tabla para F
(tabla D, apendice III). ., .
Paso 26. Hallar el cociente F para la variable B, dividiendo la varianza estimada de Cuando se encuentra que la F general es estadisticamente significativa, qued~mos
B por la varianza estimada dentro de los grupos: 'bres para investigar las hip6tesis especificas usando una prueba de comparaclOnes
F _ s~_ 50.03 _ ultiples. .
Vim os, finalmente, que el analisis de la varianza puede aphcar~e al cas~ de
- s; - 6.65 - 7.52, gl = 2/27.
isefios mas complejos en los que se usa mas de una variable independiente. Se VlO el
Paso 27. Consultar la tabla D bajo 2 y 27 gl para hallar el valor crttico de F uso del analisis de la varianza con clasificacion doble para evaluar los efectos de dos
requerido para rechazar H o al nivel a = 0.01. PuestO' que F o.ol ~ 5.49, el valor variables independientes y la interaccion entre ellas.
obtenido de 7.52 esta en la region critica para rechazar H o- Existe un efecto
significativo de la variable B.
Paso 28. Hallar el cociente F para la variable A, dividiendo la varianza estimada de
Terminos para recordar
A por la varianza .estimada dentro de los grupos:
antilisis de la varianza homogeneidad de la varianza
F _ s1_ 6.03_ antilisis de la varianza con clasificacion doble interaccum
- s; - 6.65 - 0.91, gl = 2/27.
antilisis de la varianza con clasificacion simple suma de cuadrados
cociente F variables cualitativas
Paso 29. Consultar la tabla D bajo 2 y 27 gl para hallar el valor critico requerido variables cuantitativas
para rechazar H 0 al nivel a = 0.01. Puesto que F 0.01 ~ 5.49, la F obtenida de 0.91 no comparaciones a posteriori "
comparaciones planeadas 0 a pnort varianza dentro de los qrupos
esta dentro de la region critica, En consecuencia, no podemos rechazar H o- varianza entre grupos
diseiio factorial
Conclusion: De los tres efectos evaluados (la variable A, la variable B y la estimacion de la varianza
interaccion de A y B) solamente la variable B resulto estadisticamente significativa.
Resulta ahora adecuado utilizar una prueba de comparaciones multiples para
examinar las diferencias entre parejas de medias. Para efectuar estas comparaciones
puede usarse la prueba DHS de Tukey estudiada en la seccion 15.6.
Resumen del capitulo 1. Sirviendose de los siguientes datos, correspondientes al decenio 1955-1964, deter~inar si
hay una diferencia significativa, al nivel O.Ol,.en el indice de ~ortalidad duran!e las diferentes
estaciones. [Nota: Supongase que los indices de mortahdad para los anos dados son
Comenzamos este capitulo con la observacion de que los cientificos estan frecuente
independientes.]
mente interesados en la realizacion de estudios mas amplios que los correspondientes
al clasico disefio con dos grupos. Sin embargo, al incluir mas de dos grupos, INVIERNO PRIMAVERA VERANO OTONO
incrementamos el riesgo de cometer un error del tipo I si aceptamos como significati 9.8 9.0 8.8 9.4
va cualquier comparacion que caiga dentro de la region de rechazo. En los estudios 9.9 9.3 8.7 9.4
con varios grupos, es deseable saber si existe 0 no una indicacion de un efecto general 9.8 9.3 8.8 10.3
de los tratarnientos experimentales antes de investigar las hip6tesis especificas. La 10.6 9.2 8.6 9.8
9.9 9.4 8.7 S.4
tecnica del analisis de la varianza proporciona un examen de este tipo.
10.7 9.1 8.3 9.6
En este capitulo presentamos una sencilla introducci6n a las complejidades del 8.8 9.5
9.7 9.2
analisis de la varianza. Mostramos que la suma total de cuadrados se puede partir en 10.2 8.9 8.8 9.6
dos sumas de cuadrados componentes: la suma de cuadrados dentro de los grupos Y 10.9 9.3 8.7 9.5
la suma de cuadrados entre grupos. Con estas sumas de cuadrados componentes se 10.0 9.3 8.9 9.4
pueden obtener, a la vez, estimaciones de la varianza poblacional independientes
INTRODUCCION AL ANALISIS DE LA VARIANZA 299
298 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
2. Efectuar una prueba DHS para comparar el indice de mortalidad de cada estacion Con 8. Si el cociente F resulta menor que 1.00, loculil seria la conclusion?
cada una de las otras. En cad a cornparacion, utilizar el nivel 0.01, examen bilateral. 9. Determinar si existe una diferencia significativa en el impuesto estatal de la gasolina entre
3. Efeptuar un analisis de la varianza con los datos del ejercicio 3, capitulo 13. Comprobar tres regiones geograficas dadas.
que en e! caso de dos grupos F = t 2 .
4. Cierto fabricante contrata a 10 diferentes organizaciones de investigacion para que NUEVA INGLATERRA MEDIO ESTE LEJANO OESTE
comparen la eficacia de su producto con la del producto de su principal competidor. En uno
de los 10 estudios se encuentra una diferencia significativa (nive!0.05) a favor del producto del Maine 8 New York 7 Wash. 9
fabricante que encargo la investigacion, el cual an uncia enseguida que la investigacion N. H. 7 New Jersey 7 Oregon 7
independiente ha demostrado la superioridad de su producto sobre e! de su competidor Vermont 8 Penn. 8 Nevada 6
Mass. 6.5 Delaware 7 Calif. 7
~\ principal. Critiquese esta conclusion.
R.1. 8 Maryland 7 Alaska 8
"""""- 5. Varias empresas Iarmaceuticas afirman que fabrican un analgesico que libera su Conn. 8 D. C. 7 Hawaii 5
ingrediente activo con «mayor rapidez». Una seleccion al azar de los productos de cada
fabricante revelo los siguientes tiempos (en segundos) requeridos para liberar el 50 % del
agente analgesico, Examinar la hipotesis nula de que las muestras de los analgesicos provienen
de una poblacion comun. O. Efectuar un analisis de la varianza con los datos del ejercicio 27, capitulo 13.
11. Al comparar la velocidad de escritura a maquina (en palabras por minuto) de. los
MARGA A- MARGA B MARGA C MARGA D integrantes de una muestra de 24 personas que asistieron a cuatro escuelas de secretanado
diferentes, se obtuvieron los siguientes datos:
28 34 29 22
19 23 24 31
30 20 33 18
50 55 50 70
6. Una organizacion de consumidores selecciona al azar varias secadoras de ropa de tres 50 60 65 80
fabricantes importantes para efectuar un estudio. Se tabule el tiempo requerido por cada 55 65 75 65
maquina para secar un lote estandar de ropa. Plantear y examinar la hipotesis nula apropiada. 60 55 55 70
Usar la prueba DHS para comparar cada marca con cada una de las otras, tomando IX = 0.05. 45 70 60 75
55 65 65 60
MARGA A MARGA B MARGA C
42 52 38
'Existe una diferencia significativa entre las velocidades de escritura de los cuatro grupos?
36 48 44
47 43 33
2. Un experto en nutricion divide una muestra de ciclistas en tres grupos. Al grupo B se Ie
43 49 35
a un suplemento vitaminico, y al grupo C se Ie proporciona una dieta especial. A los del
38 51 32
rupo A se les indica que se alimenten en la forma acostumbrada. Algun tiempo despues, se
egistro el numero deminutos empleados por los ciclistas para recorrer seis kilometres. Ver ta
7. Se se!eccionan al azar llantas de seis marcas diferentes para comparar las distancias (en la adjunta.
pies)requeridas p~ra frenar cuando el automovil se mueve a 25 kilometres por hora*. Plantear y
examinar la hipotesis nula apropiada. Usar la prueba DHS para cornparar cada marca con A B c
cada una de las otras, tomando IX = 0.01.
15 14 13
MARGA A MARGA B MARGA C· MARGA D MARGA E MARCA F 16 13 12
14 15 11
22 25 17 21 27 20
17 16 14
20 23 19 24 29 14
15 14 11
24 26 15 25 24 17
18 22 18 23 25 15
14. En 1971, tres equipos de beisbolobtuvieron los siguientes mimeros de home runs hechos
por sus jugadores. REVISION DE LA TERCERA PARTE
Chicago Cubs: 2 16 28 2 21 2 2 19 0 4 8 6
Houston Astros: 9 2 1 10 13 1 12 0 1 2 7 7
Cincinnati Reds: 13 39 25 9 3 0 13 27 5 1 2 Estadistica inferencial
Examinar la hipotesis de que los tres equipos provienen de la misma poblacion en cuanto a la
obtencion de home runs. (Ver The 1972 World Almanac, pags, 910-911.)
15.. Supongase que hay solamente cuatro fabricantes de pintura para casas, y que el A. Pruebas parametricas de signiflcacion
fabricante A afirma que su pintura es superior a las otras. Para examinar esta afirmacion un
investigador deter~in6 en una muestra el numero de afiosque han de transcurrir para que una
casa necesite ser pintada de nuevo, con los resultados que se muestran en la tabla adjunta.
i.Apoyan los datos la afirmacion de A? Comparar los datos de A y de B.
'A 8 C D
n la tercera parte. A (capitulos 10-15) se estudiaron los elementos de la teoria de la
4.5 4.0 2.5 3.5 robabilidad y sus aplicaciones al problema de hacer inferencias a partir de muestras
5" 4.5 3.0 ;3.0 ue se suponen elegidas de poblaciones con distribucion normal. Los problemas que
5.0 4.0 3.0 4.0
5.5 3.5 3.5
se presentan a continuacion permitiran al lector completar el conocimiento del
3.0
6.0 3.0 4.0 4.5 material tratado en esta seccion.
5.0 4.5 2.5 3.0
Considerese la siguiente poblacion de datos: 2, 3, 3, 4, 4, 4, 5, 5, 6.
16. Los datos siguientes corresponden a las calificaciones obtenidas por un grupo de a) Determinar la media y la desviacion estandar de la poblacion.
personas en un experimentofactorial de 3 x 3. Efectuar el analisis de la varianza apropiado e b) Construir una distribucion de frecuencias de las medias para N = 2, usando
indicar las conclusiones a las que conduce dicho analisis, Usar IX = 0.05. muestreo con reposicion.
c) Construir una distribucion de probabilidades de las medias para N = 2.
A, A, A3 d) Determinar (Jx usando la siguiente formula:
B, B, B3 B, B, B3 B1 B, B3 (J
(Jx = --.
8
1
10
7
12
9
5
3
9
10
16
11
6
5
10 17 IN
7 9
7 9 11 8 10 12 4 11 12 e) Determinar (Jx por calculo directo a partir de la distribucion muestral de las
9 7 5 8 6 4 10 8 6 medias.
4 8 15 6 8 10 8 10 12
12 14 15 10
f') Determinar la probabilidad de se1eccionar aleatoriamente muestras (N = 2)
12 13 13 14 14
con:
i) una media muestral de 2.0,
17. Los siguientes datos corresponden a las calificaciones obtenidas por un grupo de ii) una media muestral de por 10 menos 5.0,
personas en un experimento factorial de 2 x 3. Efectuar el analisis de la varianza apropiado e
iii) una media muestral tan rara como 3.0.
indicar las conclusiones a las que conduce dicho analisis, Usar IX = 0.05.
A, A,
Considerese una segunda po blacion de datos: 4, 5, 5, 6, 6, 6, 7, 7, 8.
A 2 3 4 5 6
a)
B 4 5 6 6 8
A 2 3 3 4 4 4 4 4 4 6
b)
B 4 4 4 5 5 5 5 5 6 7
3. Usando los datos del ejercicio 2a) y b), tomar los datos por parejas yexaminar TERCERA PARTE
la significacion de las diferencias, utilizando IX = 0.05, prueba bilateral.
4. De tres universidades, cada una afirma que tiene los estudiantes mas brillantes.
Con objeto de demostrar su afirrnacion, cada una de ellas envia diez de sus mejores
Estadfstica inferencial
2 3
2 3
99 94 74 95 93 99
93 98 99 97 96 71
84 97 98 9. 96 70
89 92 99 88 91 79
72 92 97
89 90 83
Hasta ~qu~ hemos tratado de los diversos aspectos de la Curva normal en cuanto
sus aplicaciones a la estadistica descriptiva e inferencial. A los exarnenes estadistico~ Potencia y eficiencia
en que se hace uso del modelo probabilistico normal se los denomina prueb
parametricas de siqnificacion.
Hay .muchos conjuntos de datos para los cuales no es adecuado hacer un analisis
as
de una prueba estadistica
en ~er~nos de ~a curva normal, ? que no cumplen las hip6tesis basic as para su
aphcaclOn. Consideremos un estudio en el que los datos recopilados son rangos (p
ejemplo, un ordena~iento de estudiantes por rangos segun su disposicion a coop~~
r~r). Los valores ordinales resultantes no son cuantitativos y se distribuyen, necesa
namente: en una for~a r~cta~~ular. Resulta claro que en este caso no es posible usar
un estadigrafo con dlstnbucI~n probabilistica normal. En los ultimos afios se ha
desarrollado una notable vanedad de pruebas no parametricas aplicables a tales
datos.
Concepto de potencia
Se define u~a. pr~eba no parametrica de siqnificacion como un examen en el cual no
se hacen hlpotesl.s. acerca de la forma de la distribuci6n original 0 de la poblaci6n,
por 10 que tambien se le llama prueba de siqnificacion de distribucion libre. n las dos primeras partes de este libro solamente se hicieron breves referencias a la
otencia y a la eficiencia de una prueba estadistica (aunque no las identificamos
En esta parte final del texto describiremos varias de las pruebas estadisticas no omo tales). Antes de entrar en el estudio de las pruebas no pararnetricas de
parametricas mas importantes. ignificacion, es conveniente examinar est os conceptos con mas detalle.
En la seccion 11.5, al discutir los errores de tipo I y de tipo II, sefialamos que el
onservadorismo basico de los cientificos determina que fijen un nivel de rechazo
uficientemente bajo para conseguir que los errores de tipo I sean menos frecuentes
ue los de tipo II. En otras palabras, los cientificos prefieren cometer el error de
ceptar una hipotesis nul a falsa antes que cometer el error de rechazar una hipotesis
ula verdadera.
Sin embargo, ello no debe lIevarnos a la idea de que a los cientificos no
os inquieta la posibilidad de co meter errores del tipo II. Por el contrario, es muy
osible que muchos prometedores proyectos de investigacion hayan sido abandona
os a causa de que el investigador no pudo rechazar la hip6tesis nula cuando era
ealmente falsa.
Hasta aqui nuestra preocupacion ha sido la de establecer un nivel de significacion
ue reduzca la probabilidad de rechazar falsamente la hipotesis nula. En otras
alabras, se ha tratado de evitar mas el error del tipo I que el error del tipo II. Sin
bargo, debe reconocerse que la prueba estadistica ideal es aquella en la que se
nsigue cierto equilibrio entre ambos tipos de error. Lo ideal seria especificar antes
e nuestro estudio la probabilidad de co meter los dos tipos de error. En la practica,
ih embargo, los investigadores se contentan con establecer solamente el valor p que
saran para rechazar la hipotesis nula. Como hemos visto, este valor p representa la
robabilidad de un error del tipo I (0 sea, (X).
Cuando comenzamos a tratar de efectuar un equilibrio entre los errores de los
ipos I y II, nos encontramos con el concepto de potencia de un examen. Se define
'mplemente Ia potencia de un examen como la probabilidad de rechazar la hipo
sis nula cuando es en efecto falsa. Simbolicarnente, la potencia se define como
gue:
x, - x,
ado que la poblacion 2 es identica a la poblacion 1, 0
Potencia = 1- p. (16.1) ea, que J!l = J!2' Ysobre esta base hemos determinado 6 1
0.0083}
0.0248
las diferencias posibles entre medias.] 5 2 0.0165
Solamente podemos calcular la potencia de un examen cuando H o es falsa yestamos 4 5 0.0413
dando el verdadero valor de la media poblacional segun HI' 3 10 0.0826
2 14 0.1157
Antes de proseguir con un estudio formal de la potencia, revisemos una serie de 1 18 0.1488
problemas que figuran al final del capitulo 12 (ejercicios 30 a 33). Se recordara o 21 0.1736
s UPUSII~OS 1a extraccion
'. d e to d as las parejas
. de muestras posibles de dos poblaciones
que
-1 18 0.1488
de medias. -2 14 0.1157
-3 10 0.0826
-4 5 0.0413
Poblacion 1 de medias: 3 4 5 5 6 6 6 7 7 8 9' /11 = 6;
-5 2 0.0165}
Poblaci6n 2 de medias: 0'' l', 2', 2', 3', 3', 3', 4', 4', 5', 6:, 1/
r: 2
= 3. 0.0248
-6 1 0.0083
Se obtuvo la distribucion muestral de las diferencias entre medias que aparece en N.\', -'i', = 121 LP(X, - X2 ) = 1.0000
la tabla 16.1.
308 ESTADisTICA PARA LAS CIENCIAS SOCIALES POTENCIA Y EFICIENCIA DE UNA PRUEBA ESTADisTICA 309
•
0
c.. Sin embargo, de hecho fue utilizada la escala B. Asi, puesto que sabemos que H 0
en
UJ E s falsa y conocemos el verdadero valor de /l bajo HI (/l = /l I = 72), podemos
(lJ
-.J 'iij"
« alcular la potencia del examen (0 sea, la probabilidad de que sea rechazada la falsa
a: Qj
<D I-
M en hipotesis nula).
ro UJ
::J "....c.
en en a :2 " Describamos este problema en terminos estadisticos formales:
::5~ en I~I
UJo s0 I Hipotesis nula (H o): La media de la poblacion de la cual proviene la muestra es
ou UJ
«::J :2 I;>':: igual a 70, a sea, /l = /lo = 70.
e:~
::Je: en (lJ
Hipotesis altematioa (HI): La media de la poblacion de la cual proviene la
01 -0
«~
::5
UJ c'" muestra es igual a 72, 0 sea, /l = /l1 = 72.
(lJ
0-0
<D a:
0
::5 en M I-
'cr::l
00 ~ Z
UJ
Prueba estadistica: Puesto que se conoce a, la prueba estadistica apropiada
enD O· ..0
en
«
.§ corresponde a z = (X - /lo)/ax.
u -.; Nioel de siqnificacion: CJ. = 0.01 (examen unilateral).
Z
UJ
I
a: ..:s'"
UJ Distribucion muestral: Se sabe que la distribucion muestral de la media es normal.
U.
0
"
....
"c. Region critica: 20.01 2: + 2.33. Puesto que estamos usando un examen unilateral,
UJ '"
0
0
.g la region critica consta de todos los valores de z = (X - /lo)/ax 2: 2.33.
Z .~
-...,
00
}; Por tanto, el valor critico del estadigrafo muestral (valor minimo de X que
~ « N -.J
"
<Xl<Xl::l.
...,
0 «
a:
..0
0
onduce al rechazo de H 0) es
ii:1~~I~ UJ ....
l- I
« I
c.
::l. I <Xl
en .. «
"'"E
OI~:t:D
O} ~~g
'"
I
J:::JZ
UZ W
~en:2
"
....
OIl
0
'iii
X;", (2.33)ax + /lo.
a
. -«
UJenX :i3 Asi, la potencia es igual a la probabilidad de obtener este valor critico en la
ol.Uw
to
distribucion bajo HI' Se procede de acuerdo a los siguientes pasos,
lb '
ZfJ...:g
Q:i:c:i
8::5"
a: "
-
~
IOi>
~
Calcular el valor de a x:
(J 5
a-x -
- IN -- .fl6 -- 1.-75.
x= (2.33)(1.25) + 70 = 72.91.
310 ESTAOiSTlCA PARA LAS CIENCIAS SOCIALES POTENCIA Y EFICIENCIA DE UNA PRUEBA ESTADfsTICA 311
Paso 3. Determinar la probabilidad de obtener este valor critico en Ja verdadera paso 1. EI valor de (Jx es
distribucion muestral bajo HI' En la distribucion bajo HI' al valor critico de X Ie
corresponde un valor z de (J 5
(Ji = IN = .J25 = 1.00.
72.91 - /11 72.91 - 72.00
Z = (Jx = 1.25 = 0.73. EI valor critico de X es
Buscando en la columna (C), tabla A, apendice III, vemos que la probabilidad de x = (2.33)(1.00) + 70 = 72.33.
rechazar correctamente Hoes del 23.27 %. Esta probabilidad es 1 - /3, 0 sea, la
potencia. Incidentalrnente, la probabilidad de co meter un error del tipo II (/3) es del En la distribucion bajo HI' el valor critico de X tiene un valor z de
76.73 %.
La figura 16.2 clarifica estas relaciones indicando la region de rechazo para H 0 en
z = 72.33 - 72.00 = 0.33.
1.00
la verdadera distribucion bajo HI' I - /3, 0 sea, la potencia. EI area sombreada
indica /3, que es la probabiJidad de aceptar falsamente H o- En la columna (C), tabla A, vemos que la potencia del examen es del 37.07 %.
En eI problema ilustrativo encontramos que cuando N = 16 la p~tencia es ,del
AREA = (3 23.27 %. Al incrementar el tamafio de la rnuestra a N = 25, la potencia aumento al
REGION
DE RECHAZO
37.07 %. Si en el ejernplo anterior calcularamos la potencia ~ara N = 100, enco~tra
AREA = 1 - (3 rfamos un valor del 95.15 %. Asi, podemos lIegar a la conclusion de que la potencia es
funcion de N.
16.5 Efecto de la naturaleza de HI En esos casos nos vemosobligados a utilizar pruebas no parametricas que son
sobre la potencia menos potentes*.
l,Por que son menos potentes las pruebas no parametricas? Planteada en forma
escueta, la respuesta es que las pruebas estadisticas parametricas (contrariamente a 10
La potencia de un examen es tam bien funci6n de la naturaleza de la hip6tesis que ocurre con las pruebas no parametricas) utilizan al maximo toda la informaci6n
alternativa, En el cas a de que H o sea realmente falsa, la HI direccional
0 de una cola inherente a los datos cuando las poblaciones son normalmente distribuidas. Veamos
es mas potente que la prueba bilateral, mientras el parametro este en la direcci6n una ilustraci6n sencilla. Imaginemos que en el curso de un estudio se han obtenido
predicha.
los siguientes datos: 50, 34,21, 12, 10. Si convirtieramos ahora estos datos en rangos
El examen a simple vista de la tabla 16.3 revela que cuanto mayor sea el nivel ex (operaci6n que es basica en las pruebas no parametricas relativas a las escalas
men or .sen! el valor absoluto de z requerido para rechazar H o. Ya hemos visto que I~ ordinales), obtendriamos 1,2,3,4,5. N6tese que toda la informaci6n concerniente a
potencia crece cuando crece ex. Ello implica que la potencia aumenta cuando el valor las magnitudes de los datos se pierde al pasar a rangos. La diferencia entre 50 y 34
enrico de z decrece. La tabla 16.3 muestra que para cualquier nivel ex dado el va resulta «equivalente» a la diferencia entre 12 y 10 cuando se expresan los valores
lor critico de z es menor para un exam en unilateral que para uno bilateral. Po; tanto como rangos. Esta mayor sensibilidad de las pruebas parametricas a las magnitudes
un~ z obtenid~ que no es sign~ficativa para un examen bilateral puede serlo para un~ de los datos hace que constituyan una base mas segura para determinar los valores
umlateral. ASI, el examen umlateral es mas potente que su alternativo bilateral, a de probabilidad cuando se cumplen las hip6tesis fundamentales de la cardinalidad.
menos que ocurra que el parametro este en una direcci6n opuesta a la predicha. En
este caso, el exame~ unilateral sera menos potente.
NATURALEZA DE H,
Tabla 16.3 Valores criticos de z requeridos para
rechazar H 0' en varios niveles ex, como funcion de la
16.7 Calculo de la potencia: caso de dos muestras
naturaleza de H].
DIRECCIONAL NO DIRECCIONAL
(EXAMEN UNILATERAL) (EXAMEN BILATERAL) Hasta aqui hemos utilizado el caso de una muestra para examinar el efecto de
= 0.005 z = 2.58
diversos factores sobre la potencia. Todas las conclusiones que se han obtenido se
Cl z = ±2.81
Cl= 0.01 z = 2.33 z = ±2.58
aplican igualmente al caso de dos muestras.
Cl = 0.025 z = 1.96 z = ±2.24 LIegados a este punto sera util, a modo de ilustraci6n, desarrollar un problema
Cl = 0.05 z = 1.65 z = ±1.96 muestral en el que se calcula la potencia de un examen estadistico en e1 caso de dos
muestras.
Sup6ngase que se tienen dos poblaciones con los siguientes parametres:
fl.1 = 80, fl.z = 75,
16.6 Pruebas parametricas UI = 6, U z = 6.
Si de cada una de estas poblaciones tomamos una muestra de nueve elementos
versus pruebas no parametricas: potencia .(N I = 9, N z = 9), podemos efectuar un examen para ver si es significativa la dife
rencia entre las dos medias muestrales obtenidas. Planteemos primero este proble
Otro factor que determina la potencia de una prueba estadfstica es la naturaleza de ma en terrninos estadisticos formales.
dicha prueba. Cabe establecer como regIa general que para cualquier N dado, las
1. Hipotesis nula (H o): Las dos muestras provienen de poblaciones con medias
pr~e~as parametricas son mas potentes que sus equivalentes no parametricas. Es
iguales, est a es, fl.1 = fl.z.
principalmente por esta raz6n par 10 que hemos diferido el estudio de la potencia
es.tadistica ?as.ta es~~ secci6n del texto. Para cualquier N dado, las pruebas parame 2. Hipotesis alternatioa (HI): Las dos muestras provienen de poblaciones can
tncas .de significacion (en las que se supone que las poblaciones se distribuyen medias diferentes, esto es, fl.1 =f fl.z.
norrnalmente con la misma varianza) conllevan un riesgo menor de cometer error del 3. Prueba estadistica: Puesto que estamos comparando dos medias muestrales
tipo II, y dan mas seguridad de rechazar H o cuando es falsa. Asi, si hay que elegir provenientes de poblaciones normalmente distribuidas, can varianzas conocidas,
entre una prueba no parametrica y otra pararnetrica, se debe escoger la prueba resulta apropiado el uso de la variable z.
parametrica siempre que se cumplan las hip6tesis basicas. Sin embargo, como
verernos en los capftulos siguientes, hay numerosos casos en que la propia naturaleza * Debe insistirse en que las pruebas pararnetricas son mas potentes sola mente cuando son validas las hipotesis que
permiten su uso. Cuando estas hipotesis no se cumplen, un examen no pararnetrico puede ser tan potente como otro
de los datos excluye la posibilidad de usar una prueba parametrica de significaci6n. pararnetrico.
314 ESTADfSTICA PARA LAS CIENCIAS SOCIALES POTENCIA Y EFICIENCIA DE UNA PRUEBA ESTADfsTICA 315
<Tx- 1-"'2
,. /(J~.+d~---=2~·dx
= 'V.;\1 .1.}
u\=
-1'2
1.26.
(X I - X 2) = (± 2.58)(1.26) = ± 3.25.
Paso 2. Determinar los valores criticos de (X I - X 2)' ex = 0.01, examen bilateral.
EI valor criti~o inferior es (X I - X2) = (- 2.58)(2.828) = -7.296. El valor entice Paso 3. EI valor critico inferior de (XI - X2 ) tiene, en la distribucion segun HI' un
superior es (X I - X 2) = 7.296. valor z de
Paso 3. Determinar la probabilidad de obtener estos valores criticos en la verdade
ra distribucion muestral segun HI' EI valor critico superior de (X - X ) tiene un
z = (- 3.25 - 5.00) = _ 6.55.
valor z, en la distribucion segun HI' de I 2
1.26
16.9 Potencia, errores de los tipos I y II tengan que utilizar pruebas no parametricas, podemos hacer que cualquiera de elIas
sea tan potente como otra parametrica usando un tarnafio muestral mayor. Asi, la
DetengamO~OS un momento para enlazar algunas de nuestras observaciones acerca prueba A puede ser mas potente que la B cuando los tarnafios N son iguales; pero B
de la potencia y de los errores de los tipos I y II. Para cornenzar, debemos destacar el puede ser tan potente como A si es que tomamos, por ejernplo, una N de 40 para B y
hecho de que sola~ente hay dos posibilidades respecto a la hipotesis nula; es decir, 0 una N de 30 para A.
e~ ver?adera (por ejemplo, /11 = /12) 0 no 10 es (por ejernplo, /11 f /12)' Estas son dos El concepto de eficiencia se refiere al incremento necesario en el tarnafio de la
situaciones mutuamente excluyentes. Ahora bien, puesto que un error del tipo I s muestra para hacer que una prueba sea tan potente como otra con la cual se la
?efine .como la probabilidad de rechazar n; cuando es verdadera, dos puntos seria~ compara. Supongamos que la prueba A es la la mas potente para el tipo de datos que
mmedIatamente ObVlOS: estamos analizando. Admitamos que la prueba B tiene igual potencia que la A
cuando sus N respectivas son de 40 y 30. Representemospor N b el tamafio N
1. Si Hoes falsa, la probabilidad de un error del tipo I es cero.
necesario para hacerla tan potente como la prueba A cuando se usa N La eficiencia
Q'
2. Sola mente cuando rechazamos H 0 existe alguna posibilidad de cometer un de la prueba B queda expresada entonces como
error del tipo I. Este error se produce solamente cuando H es verdadera en
cuyo caso la probabilidad de un error del tipo I es !X.. 0 ,
N
Eficiencia de la prueba B = 100 (16.2)
!I
_Q.
Ademas, puesto que un error del ti~o se define como la probabilidad de aceptar Nb
H0 cuando es falsa, lIegamos a las siguientes conclusiones:
Asi, en el ejemplo anterior, la eficiencia de la prueba B respecto a la prueba A es
1. Si H o es uerdadera, la probabilidad de un error del tipo II es cero.
de 100a8), 0 sea, el 75 %. Par tanto, si se cumplen todas las hipotesis para el empleo
2. Solarnente cuando aceptamns H o existe alguna posibilidad de cometer un error de A, tendrernos que usar cuatro casos de la prueba B par cada tres de la prueba A
del tip~ !I. Este error se produce solamente cuando Hoes falsa, en cuyo caso la para conseguir una potencia igual. Por supuesto, si no se cumplen las condiciones
probabilidad de u~ error del tipo II es p. Debe quedar claro, entonces, que el para el empleo de la prueba A, el concepto de eficiencia carece de significado, puesto
co~cepto de potencia, que se define en terrninos de un error del tipo II (1 - P), se que no podra emplearse la prueba A.
aplica solamente cuando H 0 no es verdadera.
La tabla 16.4 resume las probabilidades asociadas con la aceptacion 0 el rechazo
de H o de acuerdo a como sea en realidad la situacion, (Recuerdesa que esta tabla fue
presentada en la seccion 11.5.2.)
Resumen del capitulo
ESTADQ REAL DE H
Tabla 16.4 Tipo de error cornetido, tenien
o do en cuenta el estado real de HoY la decision
r
En este capitulo se han estudiado dos conceptos importantes: el de la potencia y el de
estadistica tomada. A modo de ilustracion,
ACEPTAR H o RECHAZAR H si H o es verdadera (columna I) y rechazarnos la eficiencia. Se define la potencia como la probabilidad de rechazar H o cuando es
o
H 0 (fila 2), cometemos un error del tipo I. realmente falsa; 0 sea, potencia = 1 - p.
Correcta Error tipo II Si H o es falsa (columna 2) y rechazamos H o, Se indica la forma de calcular la potencia en los casos de una y de dos muestras,
Verdadara 1- IX
nuestra decision es correcta. cuando se sabe que Hoes falsa y se conoce el verdadero valor del pararnetro segun
{3
Decision
HI'
Error tipo I Correcta
H o Falsa Para calcular la potencia se necesita obtener:
IX 1-{3
el error estandar de la distribucion muestral tanto segun H 0 como segun HI'
el valor critico del estadigrafo muestral [X en el caso de una muestra; (X1 - X 2)
en el caso de dos muestrasJ,
16.10 Eficiencia de una prueba estadfstica la probabilidad de obtener este valor critico en la distribucion muestral segun
HI' Esta probabilidad es la potencia del examen estadistico,
E.n !a s~cci~~ 16.6 se indico que, cuando es razonable admitir que se cumplen las Se dernostro que la potencia varia como una funcion de:
hlpote~ls .baslcas, las pru:bas pararnetricas son mas potentes que las pruebas no el tarnafio de la muestra,
parametricas, para cualquier N dado. Sin embargo, tarnbien es cierto que cuando se
el nivel !X.,
318 ESTADfSTICA PARA LAS CIENCIAS SOCIALES POTENCIA Y EFICIENCIA DE UNA PRUEBA ESTADfSTICA 319
3. la naturaleza de HI' 5. Para el problema 6 del capitulo 13, ca1cular la potencia en cada uno de los cuatro
ejemplos, empleando a: = 0.01, examen unilateral. i,Que factores que influyen sobre la potencia
4. la naturaleza de la prueba estadistica,
son los que ilustran estos ejemplos?
5. el uso de medidas correlacionadas.
6. En el capitulo 14, problemas 3 a 5, vimos que el uso de muestras correlacionadas dio
La eficiencia se ~efiere al incremento en el tamaiio de la muestra para una prueba lugar a que se encuentre un valor de t mas alejado de la region de rechazo que el valor de t
basado en muestras independientes. Esto pareceria contradecir 10 dicho en la seccion 16.8.
dada que es nec~san? 'para hacerla tan potente como otra prueba en la que se emplea
Arrnonizar esta disparidad.
una N menor, Simbolicamente, la eficiencia de la prueba B respecto a la prueba A se
MUESTRAS
ESCALA
DE MEDIDA I CASO DE UNA MUESTRA
MUESTRAS
RELACIONADAS INDEPENDIENTES
• Nurnerosos investigadores han dernostrado la solidez de las pruebas t y F, 10 eual quiere decir que, incluso
desviaciones irnportantes respeeto de las hipotesis que faeultan el usa de las pruebas pararnetricas, no afectan seriamente
a la validez de las inferencias estadistieas. Para una mayor informacion sobre esta materia, vease Haber, Runyon y Badia, • Cuando se utilizan muestras grandes, las pruebas pararnetricas son easi siernpre apropiadas en ra: on del [eorema del
Readings in Statistics, Reading, Mass.: Addison Wesley Publishing Co., Inc., 1970. limite central (seccion 12.2.).
322 ESTADiSTICA PARA .LAS CIENCIAS SOCIALES INFERENCIA ESTADiSTICA CON VARIABLES CATEG6RICAS 323
Recuadro 17.1
100.-------------------------~
90
80
70
UJ
..., 60
~
UJ 50
U
a:
~ 40
30
20
10
o
SOBREVIVIERON NO SOBREvrVIERON NO
SOBREVIVIERON SOBR EVIVIERON
TUVIERON PERRO NO TUVIERON PERRO
La conocida frase «El perro es el mejor amigo del hombre» ha sido muchas veces tema significacion apropiada (prueba Xl) permite averiguar si el ser propietario de un perro y
de canciones y de leyendas. La evidencia reciente sugiere que la presencia de un perro la supervivencia son hechos relacionados.
puede tener tambien valor terapeutico (Friedman, 1979)*. Se estudio durante un afio a
un grupo de pacientes de enfermedades coronarias a su salida del hospital. Cincuenta y
tres de estos pacientes tenian un perro y 39 no 10 tenian. Un afio despues, 11 de los
pacientes que no tenian perro fallecieron, en tanto que solamente murieron tres de SITUACION RESPECTO A TENER PERRO
los propietarios de perro.
NO
En este estudio hay dos variables nominales: situacion respecto a la posesion de un PROPIETARIOS PROPIETARIOS
perro mascota y registro de supervivencia despues de sufrir una enfermedad coronaria. UJ~
ClU SOBREVIVIO 28 7~
Hay dos valores para cada una de estas variables: poseer versus no poseer perro, y 50
z~ UN ANO
sobrevivir versus no sobrevivir a una enfermedad cardiaca, A nivel descriptivo, 0>
podriamos determinar el porcentaje de propietarios de perro versus porcentaje de los
u>
<ta:
NO
SOBREVIVIO
3 11 14
::::J UJ
1-0
que no son propietarios de perro que sobrevivieron y que no sobrevivieron por 10 -::::J 53 39 92
(fJ(fJ
menos un afio despues de la hospitalizacion, Estos resultados aparecen en el diajrama
de barras adjunto.
A nivel inferencial, los datos pueden disponerse en forma de tabla de contingencia de
2 x 2. Leyendo hacia abajo, vernos que cincuenta de los cincuenta y tres propietarios de Tabla de contingencia de 2 x 2 que muestra el numero de propietarios de perro yel
perro sobrevivieron por 10 menos un afio, En cambio, solamente veintiocho de los numero de no propietarios de perro que sobrevivieron por 10 menos un afio despues de
treinta y nueve que no son propietarios de perro quedaban supervivientes. La prueba de aparecer una enferrnedad coronaria.
* Citado en un articulo del doctor Neil Solomon en Tile Los Anqeles Times, 25 enero 1979.
324 ESTADfsTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADfsTICA CON VARIABLES CATEGORICAS 325
Las probabilidades asociadas con resultados especificos pueden obtenerse usan Para deterrninar si la x obtenida cae dentro de la region cntica, debemos obtener
do la formula (17.1): la suma de las probabilidades correspondientes x = 9, x = 8, x = 7 y x = 6.
NI Como aclaracion hallamos, utilizando la formula (17.1), que la probabilidad de
pIx) = ... ~-.:._..~~ PXQN-x (17.1) x = 9, esto es, si P = 0.3 (segun H 0)' la probabilidad de que los 9 estudiantes fumen es
x!(N - x)! .'
donde 9'
p(9) = (' (0.3)9(0.7)9 - 9
9! 9 - 9)!
x =numero de objetos comprendidos en una categoria 0 nurnero de exitos,
N - x = numero de objetos en la otra categoria 0 numero de fracasos, = (0.3)9 = 0.000019683.
N = numero total de objetos 0 numero total de intentos, La probabilidad de x = 8 es
p(x) = probabilidad de que hay a x objetos en una categoria,
! el signo factorial indica que se ha de multiplicar el mimero indicado por p(8) = 9(0.W(0.7)1 = 0.000413343.
todos los enteros menores que el, pero mayo res que cero; asi, si N = 5, La probabilidad de x = 7 es
N!* = 5·4·3 ·2· 1 = 120.
p(7) = 36(0.]f(0.7)2 = 0.003857868.
Nos serviremos de un problema muestral para ilustrar el uso de la formula (17.1) en
Finalmente, la probabilidad de x = 6 es
el examen de hipotesis.
p(6) = 84(0.3)6(0.7)3 = 0.021003948.
17.2.1 Problema muestral Asi, la probabilidad de que al menos 6 de los 9 estudiantes fumen, cuando
P = 0.30, es igual a la suma de las anteriores probabilidades, 0 sea, p(x ~ 6) = 0.025.
El delegado de los estudiantes de una gran universidad manifiesta que desde que se
prohibio la venta de cigarrillos en el campus, la proporcion de estudiantes que fuman Decision: Puesto que la probabilidad obtenida es menor que 0.05, podemos
bajo a 0.30. Sin embargo, observaciones previas en otras instituciones donde tam bien rechazar H o- En otras palabras, la afirrnacion del delegado parece ser erronea,
se habia prohibido la venta de cigarrillos, indican un efecto muy pequefio sobre el
Presentamos el ejemplo anterior para ilustrar la aplicacion de la formula (17.1)
habito de fumar, 0 sea, que mucho mas del 0.30 de los estudiantes continuaron
fumando. cuando P =1= Q =1= t· Sin embargo, cuando N :s; 49 y P =1= Q =1= t, se puede emplear la
A nueve estudiantes, seleccionados al azar, se les pidio que declarasen si fumaban tabla N del apendice III para obtener directamente los valores criticos de x para
o no. Seis de ellos respondieron afirmativamente. valores seleccionados de P y Q. Refiriendonos a la tabla N, para N = 9 y P = 0.30,
Para examinar la validez de la manifestacion hecha por el delegado, represent are hallamos que x debe ser igual 0 mayor que 6 para que se rechace H o al nivel
mos por PIa proporcion de estudiantes que fuman y por Q la proporcion de los que no (J. = 0.05.
fuman. Digamos de paso que, cuando P = Q = t y N :s; 50, la tabla M proporciona los
valores criticos de x, tanto en el caso unilateral como en el bilateral, correspondientes
1. Hipotesis nula (H o): P s 0.30, Q ~ 0.70. a los niveles (J. = 0.01 y (J. = 0.05, donde x se define como la mayor de las frecuencias
2. Hipotesis alternativa (HI): P> 0.30, Q < 0.70. Notese que HI es direccional. observadas. Por ejernplo, si lanzamos una moneda diez veces (N = 10),hallamos que
se requiere un valor de x = 9 para rechazar H o (P = Q = t) con (J. = 0.05, examen
3. Prueba estadistica: Puesto que estamos tratando con una poblacion bicategorica,
la prueba binomial es apropiada. bilateral.
4. Nivel de siqnificacion: (J. = 0.05.
5. Distribucion muestral: La distribucion muestral esta dada por el desarrollo
binomial, formula (17.1).
6. Region critica: La region critica esta formada par todos los valores de x que son
17.3 Calculo aproximado de valores binomiales
suficiente~ente grandes para que la probabilidad de su realizacion segun H o sea mediante la curva normal
menor 0 igual que 0.05. Puesto que HIes direccional, la region critica es de una
cola. A medida que N aumenta, la distribucion binomial se acerca a la distribucion
• Al obtener las probabilidades binomiales, es importance recordar que O! = 1 Yque cualquier valor diferente de cero normal. La aproximacion es mas rapida cuando P y Q tienen valores proximos a t·
elevado a la potencia cero es igual a 1, 0 sea, XO = 1. Por otra parte, cuando P 0 Q tienen valores cercanos a 0, la aproximacion ala curva
326 ESTADfsTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADfsTICA CON VARIABLES CATEGORICAS 327
normal se hace mas deficiente para cualquier valor de N dado. Una buena regIa los tres jabones estan hechos con distintas formulas, y que las colores distintos de las
practica, cuando se considere la aproximacion normal a la binomial, es que el envolturas sirven solamente para ayudar a la identificacion de cada jabon. Un mes
producto NPQ debe ser igual por 10 menos a 9 cuando P tenga un valor proximo a 0 despues se informa a cada ama de casa que recibira gratuitamente una caja del jabon
01, y que N debe ser igual 0 mayor que 25 cuando P = Q = 1. Sin embargo, aun con que haya elegido. Los resultados se presentan a continuacion.
valores mas pequeiios de N la aproximacion es excelente. Aceptando estas restriccio
COLOR DE LA ENVOLTURA
nes, vemos que la distribucion muestral de x, definida como el numero de objetos
comprendidos en una categoria, es normal, con media igual a N P y desviacion BLANCO CASTANO TOTAL
estandar igual a J N PQ.
ROJO
Para examinar la hipotesis nula, llevamos x a la forma estandarizada: Preferencias de las amas de casa 200 300 100 600
x-NP
(17.2) Este es el tipo de problema para el que resulta idealla prueba X2 * en una variable. En
Z= JNPQ' las aplicaciones de una sola variable, la prueba X2 se describe como la tecnica de la
«bondad de ajuste», que permite determinar si existe, 0 no, una diferencia significati
La distribucion de z es aproximadamente normal con una media igual a cero y
va entre el numero observado de casos que cae en cada cat egoria y el mimero de
una desviacion estandar igual a uno. Asi, la probabilidad de cualquier x dada es igual
casos esperados, en base a la hipotesis nula. En otras palabras, permite responder a la
a la de su correspondiente valor z.
siguiente pregunta: «loSe ajusta bien la distribucion observada a la distribucion
Veamos un ejemplo en el que x = 5, N = 20, P = Q = 1 y IX = 0.05, examen
bilateral. Para obtener la probabilidad de que x :-s; 5, llevamos x a la forma teorica?»,
Lo que se requiere, entonces, es una hipotesis nula que permita especificar las
estandarizada y tenemos
frecuencias que han de esperarse en cada categoria y, posteriormente, un examen de
5 - 10 esta hipotesis nula. La hipotesis nula puede ser examinada mediante
Z = ~--;'(=20=)(=0.5=)(=0.=5) k
X2 = ~ (fa - fe)2
-5.00 -5.00 (17.3)
=--_=--=
.j5IJ0 2.24
-2.23. L
i= 1
fe
donde
~ecordemos que para que el resultado sea significativo se requiere que [z] ~ 1.96
fo = numero observado dentro de una categoria dada,
al mvel IX = 0.05, examen bilateral. Puesto que la z obtenida de - 2.23 excede al valor
critico, podemos rechazar H o- fe = numero esperado en esa categoria,
Notese que si buscamos el resultado en la tabla M, bajo N = 20 y IX = 0.05, k
Cuando estudiamos el cociente t de Student (seccion 12.5), vimos que las nominales en las que (2)los datos consisten en frecuencias que se tabulan y se colocan
distribuciones muestrales de t variaban en funcion de los grados de libertad. Lo en casillas apropiadas.
mismo ocurre para X2 . Sin embargo, la asignacion de grados de libertad para la t de Estos ejemplos tienen tambien una caracteristica adicional y mas importante: (3)
Student se bas a en N, en tanto que para X2 los grados de libertad estan en funcion del no hay un modo inmediato y evidente de asignar valores de frecuencias esperadas a
numero de categorias (k). En el caso de una variable, gl = k - 1*. En la tabla B cada categoria. Sin embargo, como se indicara en breve, 10 que debemos hacer es
del apendice III figuran los val ares criticos de X2 para diversos niveles (x. Si el basar nuestras frecuencias esperadas en las frecuencias obtenidas.
2
valor obtenido de X excede del valor critico a un nivel de probabilidad dado, se Veamos un ejemplo real. Las personas que llegan de visita a los paises subdesa
puede rechazar la hipotesis nula a ese nivel de significacion. rrollados sienten en muchos casos una afeccion intestinal conocida como «diarrea del
En el ejemplo anterior, k = 3. Por tanto, gl = 2. Usando (X = 0.01, encontramos viajero», De hecho, a menudo se posterga el viaje por el riesgo relativamente elevado
en la tabla B que se requiere para X2 un valor igual 0 mayor que 9.21 para que el de pasar una buena parte de las vacaciones en el cuarto de bafio, Un equipo de
resultado sea significativo. Puesto que el valor obtenido de 100.00 es mayor que 9.21, investigadores medicos hizo recientemente una evaluacion de la eficacia de una droga
podemos rechazar la hipotesis nula y afirmar, en cambio, que el color de la envoltura Hamada doxycylina para detener la incidencia de esta enfermedad. Participaron en e1
es un factor significativamente determinante en la seleccion preferencial del jabon por estudio 39 voluntarios del Cuerpo de Paz en Kenya. En un periodo de tres semanas,
parte de las amas de casa. 18 voluntarios recibieron la droga, en tanto que los 21 restantes recibieron un
placebo (sustancia inerte de aspecto parecido al de la droga). Los resultados de este
estudio se resumen en la tabla 17.1.
17.5 La prueba X2 de la independencia Tabla 17.1 Tabla de contingencia de 2 x 2 que muestra el mimero de
voluntarios del grupo que recibio la droga, y del grupo que recibio el
de variables categoricast placebo, que tuvieron desordenes intestinales en un periodo de tres
sernan as.
Hasta ahora nos hemos ocupado, en este capitulo, del caso de una variable. En la RESULTADO DEL ESTUDIO
j
Grupo del placebo 9 12 21
diferencia entre las opiniones de los hombres y de las mujeres respecto a determinado
asunto? (Dicho de otra forma, lla opinion acerca de determinado asunto depende en 10 29 39
alguna medida del sexo del entrevistado?)
Estos son solamente dos ejemplos de problemas en los que se aplica la tecnica X2 •
Podria, indudablemente, ampliarse esta lista para incluir multiples actividades, tales Debemos ahora aplicar un examen de significacion. En terrninos estadisticos
como la actitud de los miernbros de una asociacion estudiantil versus la actitud de los formales:
que no pertenecen a la misma, en relacion con algunos asuntos basicos (par ejemplo,
1. H ipotesis nula (H 0): No hay diferencia en la incidencia del desorden intestinal
copiar en los examenes), 0 las diferencias en los sistemas de calificacion entre
entre los que recibieron la droga y los que recibieron el placebo.
profesares de diversos departamentos de estudio. Todos los problemas anteriores
tienen algunas cosas en comun: (1) en ellos intervienen dos 0 mas categorias 2. Hipotesis alternativa (Hi): Hay una diferencia en la incidencia de la enfermedad
entre las personas que recibieron la droga y las que recibieron el placebo.
• Dado que el total marginal es fijo, solamente k - 1 categorias tienen Iibert ad para variar. Puesto que el total es de 3. Prueba estadistica: Puesto que ambos grupos (droga y placebo) son independien
600, en cuanto se conozcan los valores correspondientes a dos casillas a categorias, la tercera queda cornpletamente
determinada. Asi, hay solamente dos grados de libertad: sabiendo que al raja Ie corresponde 200 y al blanco 300, al
tes y los datos son frecuencias en categorias discretas, la prueba X2 de indepen
castano le debe corresponder 100. dencia es el examen estadistico apropiado.
t En la mayoria de los textos se recomienda utilizar la correccion de Yates par continuidad y tambien se indica que
las frecuencias esperadas deben ser iguales a mayores que 5 cuando gl = 1. Basandonos en una evidencia convincente 4. Nivel de siqnificacion: (X = 0.05.
(Dunlap, 1974; Camilli y Hopkins, 1978), hernos omitido dichas recomendaciones en esta edici6n.
5. Distribucion muestral: Es la distribucion X2 con gl = (r - l)(c - 1).
INFERENCIA ESTADfSTICA CON VARIABLES CATEOORICAS 331
330 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
CONDICION
CONTRAJO LA NO CONTRAJO
(l7.4) EXPERIMENTAL ENFERMEDAD LA ENFERMEDAD TOTALES
17 18
donde Grupo de la droga (4.62) (13.38)
r C
II
9 12 21
Grupe del placebo (5.38) (15.62)
r~ I c= I
10 29
indica que hemos de sumar este cociente a 10 largo de las filas y de las columnas.
EI ~roblema prineip~l consiste ahora en decidir acerca del procedimiento para
determinar las frecuencias esperadas correspondientes a cada casilla. Concentrerno Puede verse que enfermaron en total diez sujetos. De estos, solamente uno estuvo
nos por un momento en la casilla (a). Los dos totales marginales comunes a la casilla en el grupo que recibio la droga. Los nueve restantes se encontraron en el grupo
(a) .so~ los :orrespondientes a la fila y a la columna 1. Si la hipotesis nula es correcta y placebo 0 de control. l.Es suficientemente grande esta diferencia para que quede
la incidencia de la enfermedad es independiente de la condicion, deberiamos esperar justificada la conclusi6n de que la droga fue eficaz?
que hubiera I~ ~isma proporcion de sujetos que contrajeron la dolencia en el grupo
2 (1 - 4.62)2 (17 - 13.3W (9 - 5.38)2 (12 - 15.62)2
de los que recibieron la droga que en el grupo de los que recibieron el placebo. Puesto X = + + + ')
que del total de 39 sujetos experimentales 18 recibieron la droga, deberiamos esperar 4.62 13.38 5.38 15.6~
que en la casilla (a) hubiera (18/39) x 10, 0 sea, 4.62. Puesto que el valor 7.09 de X2 es mayor que el valor 3.84 requerido para que
Puesto que tenemos una situacion con un grado de libertad, las frecuencias exista significacion al nivel 0.05, cabe rechazar H o- En otras palabras, podemos llegar
esperadas en todas las demas casillas quedaran determinadas tan pronto como se a la conclusion de que la droga es eficaz para disminuir la incidencia de la «diarrea
hay a calculado la frecuencia esperada de una casilla. En consecuencia obtenemos del viajero».
to~as las dernas ~recuencias esperadas restando de los totales marginales'apropiados. Cuando se investiga, se encuentra a menudo que tenemos mas de dos subgrupos
ASI, para la casilla (b) tenemos 18 - 4.62 = 13.38, para la casilla (c) 10 - 4.62 = dentro de una clase nominal. Por ejemplo, podemos tener tres categorias en una
= 5.3~, y para la casilla (d) 29 - 13.38 = 15.62. Para estar seguros de no haber escala y cuatro en otra, resultando una tabla de contingencia de 3 x 4. El procedi
cometl~o un error al calcular la frecuencia esperada correspondiente a la casilla (a),es miento para obtener las frecuencias esperadas es igual al empleado en la tabla de
co~vemente calcul~r por separado la frecuencia esperada para eualquiera de las contingencia de 2 x 2. Por supuesto, los grados de libertad seran mas de 1 (por
casillas restantes. SI este numero coincide con el resultado obtenido por sustraccion, ejemplo, en las tablas de contingencia de 3x 4, gl = 6).
pode~os confiar en .no haber cometido ningun error. Asi, la frecuencia esperada para
la casilla (d), obtenida por calculo directo, es
21
39 x 29 = 15.62. Limitaciones en el uso de la X2
Una hipotesis fundamental para el empleo de la X2 es que cada observacion 0
Pues.to que este numero coincide con el resultado obtenido por sustraccion, debemo s
frecuencia es independiente de todas las otras observaciones. En consecuencia, no
contmuar con nuestro calculo del valor de X2 .
eben hacerse varias observaciones en el mismo individuo y tratar a cada una como
Seguramente el lector habra observado que hay una regia sencilla que puede
332 ESTADisTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADisTICA CON VARIABLES CATEG6RICAS 333
si fuera independiente de las demas, Tal error produce 10 que se llama una N injIada; Notese que para Xl se ha obtenido el valor 2.72 < 3.84, por 10 cual debe aceptarse
o sea, que, en cuanto a los datos, se cree tener mayor mimero de observaciones H o- EI hecho de no haber trabajado con respuestas independientes dio lugar a un
independientes de las que hay en realidad. Este error es extremadamente grave y grave error en la primera conclusion. Seguramente, el lector observara que el
puede conducirnos facilmente a rechazar la hipotesis nula cuando, de hecho, es requisito de independencia dentro de una casilla 0 condicion es fundamental para
verdadera. todas las pruebas estadisticas. Hemos mencionado este punta especificamente en
Considerese el siguiente ejemplo hipotetico. Supongamos que ellector estudia un relacion con la prueba Xl, porque tales anomalias pueden presentarse en forma tan
curso de sociologia y que, Como trabajo de final de curso, decide hacer una encuesta sutil que no sea posible reconocerlas facilmente.
entre .Ios estudiantes para determinar si las opiniones de los muchachos difieren de
las de las muchachas respecto a cierto tema de actualidad. A cada uno de los 15
miembros de la clase se le pide obtener respuestas de 10 entrevistados, 5 hombres Resumen del capitulo
y 5 mujeres. Los resultados aparecen en la tabla 17.3.
En este capitulo se estudiaron cuatro pruebas de significacion que se usan con
variables categoricas; a saber, la prueba binomial, la aproximacion normal a la
binomial, la prueba Xl de una variable y la prueba Xl de dos variables.
1. Vimos que la binomial puede emplearse para examinar la hip6tesis nula cuando
las frecuencias estan distribuidas entre dos categorias 0 casillas. Si P = Q = t y
N ::; 50, la tabla M proporciona los valores criticos uni y bilaterales para IX = 0.05 y
IX = 0.01. Cuando P =1= Q, pueden obtenerse las probabilidades utilizando la formula
(17.1) que se basa en el desarrollo binomial. Si N ::; 49, la tabla N proporciona los
valores criticos para valores seleccionados de P y de Q. Una regIa practica es que
N PQ debe ser igual 0 mayor que 9, cuando P se aproxima a 0 0 a 1, para permitir el
uso de la aproximacion normal a la binomial.
2. La prueba Xl de una variable fue descrita como una tecnica de «bondad de
Usando IX = 0.05, hallamos que la region critica esta constituida por todos los ajuste» que per mite determinar si existe, 0 no, diferencia signilicativa entre el numero
valores tales que Xl ;;:: 3.84. Puesto que para Xl se ha obtenido el valor 10.71 > 3.84, observado de casos en cada categoria y el numero esperado de casos especilicados
se rechaza la hipotesis nul a de que no hay diferencia de opiniones entre los alumnos y segun la hipotesis nula.
las alumnas respecto al tema en cuestion, Puede concluirse, en cambio, que la 3. EI caso Xl de dos variables puede emplearse para determinar si dos variables
aprobacion del asunto planteado depende del sexo del entrevistado. estan relacionadas 0 si son independientes. Si el valor de Xl es significativo, podemos
Despues de realizar el estudio, el lector descubre que algunos estudiantes fueron llegar a la conclusion de que las variables son dependientes 0 relacionadas. En este
inadvertidamente entrevistados dos 0 tres veces por diferentes miembros de la c1ase. capitulo, restringimos nuestro estudio a las tablas de contingencia de 2 x 2. Sin
En consecuencia, las frecuencias dentro de las casillas no son independientes, ya que embargo, pueden generalizarse facilmente los procedimientos para incluir mas de dos
algunos individuos contribuyeron con dos 0 tres respuestas. Rehaciendo el analisis categorias dentro de cada variable.
de los datos, de modo que solo se permita una respuesta por entrevistado, se 4. Finalmente, se estudio una limitacion importante en el uso de la prueba Xl: las
obtuvieron los resultados que aparecen en la tabla 17.4. frecuencias deben ser independientes entre si. El incumplimiento de esta condici6n da
lugar a un error conocido como de la N injIada y puede lIevar al rechazo de la
Tabla 17.4 hipotesis nula cuando es verdadera (error del tipo I).
RESPUESTA A LA PREGUNTA
28 37 65
Terminus para recordar
Hombre (32.5) (32.5)
32 23 55 N inflada
Mujer (27.5) (27.5)
poblacion bicateqorica [dicotomica]
60 60 120
prueba Xl de una variable (tecnica de la «bondad de ajuste»)
x2 = 2.72
334 ESTADfsTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADfsTICA CON VARIABLES CATEGORICAS 335
Numero de partidos ~ 6 ~
14. Supongase que se realizo un estudio para comparar los tipos de inversiones hechas por
I
Frecuencia de realizacion 1i-[i1l11T25
115 personas a las que se considera conservadoras y por 125 personas a quienes gusta correr
riesgos. i.Que conclusion puede deducirse de los siguientes resultados?
Para estos datos, examinar la hipotesis de que cada numero de partidos tiene igual probabili
dad de ocurrir.
TIPO DE PERSONA
6. En una gran universidad, un estudio de la cornposicion del consejo estudiantil revelo que
6 de sus ocho miembros eran estudiantes de ciencias politicas. De la totalidad de los 1200 TIPO DE INVERSION CONSERVADOR ARRIESGADO
estudiantes, 400 son alumnos de ciencias politicas. Plantear este estudio en terrninos estadisti
cos formales y extraer las conclusiones apropiadas. Bonos del gobierno 75 45
7. Se realize un estudio para determinar si existe una relacion entre la clase socioeconomica Acciones 40 80
18. En el ejercicio 17 supongase que ellector trata de cornparar el mimero de veces que salen
Inferencia estadistica con
nurneros impares y el de veces que salen numeros pares. Usando la variable Z, i,Puede lIegarse a
la conclusion de que el dado es correcto?
19. Utilicese la X2 para responder a las preguntas del ejercicio 18.
20. Supongase que una cornpafiia productora de discos esta interesada en determinar el tipo
de cubierta que debe poner a un album. Para ello envia el mismo disco con tres diferentes
18 variables de escala ordinal
cubiertas a una tienda. Transcurrido un mes, encuentra que las ventas fueron como se indica a
continuacion:
41 50 20
18.1 Introducci6n
i,Puede determinar la cornpafiia el tipo de cubierta que debe usar? Se dijo en el capitulo anterior que el investigador se enfrenta a menudo con el dilema
21. En el ejercicio 4 del capitulo 1, se presento un estudio efectuado por el profesor Yetman de saber cual es la prueba estadistica apropiada para sus datos. Recordara ellector
referente al nurnero de atletas blancos y de color que tuvieron una oportunidad de aparecer en que esto no constituye realmente un problema con respecto a las variables categori
anuncios cornerciales. En la siguiente tabla de 2 x. 2 se da un resumen de los resultados: cas, debido a que las pruebas no pararnetricas solamente son adecuadas para datos
de escalas nominales.
APARICION EN ANUNCIOS COMERCIALES En este capitulo estudiaremos varias tecnicas estadisticas que se emplean
frecuentemente como alternativas a las pruebas parametricas.
NO TUVIERON TUVIERON
OPORTUNIDAD OPORTUNIDAD
no es verdadera, podemos esperar un exceso de calificaciones E 0 de calificaciones C La tecnica de conteo para determinar V puede ser tediosa, particularmente
precediendo a un mimero opuesto. uando las N son grandes, y conduce frecuentemente a que se cometan errores. Un
Citemos un ejemplo. Supongase ellector que ha formulado la hipotesis de que el rocedimiento alternativo, que proporciona identicos resultados, consiste en asignar
liderazgo es una cualidad que puede adquirirse mediante un adiestramiento. Se rangos a los grupos combinados, como se hizo anteriormente, y emplear luego
forman dos grupos; un.o q~e recibe. ~n adiest~amiento especial para formar lideres (E) cualquiera de las siguientes formulas para obtener V y/o V'.
y el otro que no recibe mstruccion especial (C). Despues del entrenamiento, se
obtuvieron estimaciones independientes de las cualidades de lider de todos los (18.2)
sujetos. Los resultados fueron:
Calificaciones E 12 18 31 45 47
Calificaciones C 2 8 15 19 38
(18.3)
= 19. A est a suma mayor la llamaremos V'. Segun la hipotesis nula, U y V' deberian
TIEMPO EN TIEMPO EN
ser iguales. La cuestion es si la magnitud de la diferencia observada es suficiente para MILISEGUNDOS RANGO MILISEGUNDOS RANGO CALCULO .
garantizar el rechazo de la hipotesis nula.
La distribucion de V bajo la hipotesis nula es conocida. Las tablas II a 14 140 4 130 1 N (N + 1)
U = N 1 N2 + 1
2I - 81
muestran los valores de U y V' que son significativos a varios niveles ex. Para ser 147 6 135 2
153 8 138 3
significativa a un nivel ex dado, la U obtenida debe ser igual 0 men or que el valor
160 10 144 5 = 56 + 8(9) - 81
tabulado, 0 bien la U' obtenida debe ser igual 0 mayor que su correspondiente valor 165 11 148 7 2
critico. Usando ex = 0.05, examen bilateral, hallamos (tabla 13 ) que para N I = 5 Y 170 13 155 9
= 56 + 36 - 81
N 2 = 5 se requiere que V ::s; 2 0 que V' ;;::: 23 para rechazar H o- Puesto que el valor 171 14 168 12
obtenido para V es de 6 > 2, no podemos rechazar la hipotesis nula. 193 15 = 11.
Puede emplearse la formula (18.1) para comprobar los valores obtenidos de U
R I = 81 R 2 = 39
y V': N2 = 7
N1 =8
V = N IN 2 - U'. (18.1)
340 ESTADfSTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADfSTICA CON VARIABLES DE ESCALA ORDINAL 341
Para com pro bar los calculos anteriores debemos obtener primero el valor de V', no alcanza el nivel lX que hemos establecido para rechazar la hip6tesis nula, debe
empleando la f6rmula (18.3): consultarse la fuente bibliografica indicada a pie de pagina anterior, para recalcular
la V de Mann-Whitney con correcci6n por empates.
(N + 1)
V' = N N 1 2+ N 2; - 39 = 45.
La prueba U de Mann-Whitney
Un problema que presentan a menudo los datos es que varias calificaciones pueden ser Imaginemos que un investigador ha completado un estudio en el que N I = 22 y
exactamente iguales. Aunque la dimensi6n fundamental en la que se basan nuestras = 22. La suma de los rangos es 630. Al nivel « = 0.05, examinar la hip6tesis nula
medidas sea continua, son, en su mayor parte, bastante imperfectas. Por ello, aunque de que ambos grupos provienen de poblaciones con e1 mismo rango medio. Los
en teorfa no deberfa haber empates (si tuvierarnos instrumentos de medida suficiente valores criticos de z son ± 1.96.
mente sensibles), en la practica ocurren con bastante frecuencia. Si bien los empates El error estandar de los rangos es
dentro de un grupo no constituyen ningun problema (la V no queda afectada), se nos
presenta alguna dificultad cuando los empates ocurren entre dos 0 mas observacio (22)(22)(22 + 22 + 1)
nes de ambos grupos. Se dispone de una f6rmula para corregir el efecto de los Su = 12
em pates. Desafortunadamente, el empleo de esta f6rmula es un tanto complicado y
por ello esta fuera del alcance de este texto elemental*. En todo caso, al no efectuar la = )21780 = 42.60.
correcci6n de los empates, la prueba resulta mas «conservadora», 0 sea, disminuye 12
la probabilidad de un error del tipo I (rechazar la hip6tesis nula cuando no deberfa
El rango esperado segun Hoes
ser rechazada). Se recomienda efectuar la correcci6n por empates solamente cuando
su proporci6n es alta y cuando la V no corregida se aproxima al nivel de significa U = 22(22 + 22 + 1) = 990 = 495.
E
cion: previamente establecido. 2 2
En el caso de que se presenten varios empates, recomendamos calcular la V de valor de z resulta ser
Mann-Whitney sin la correcci6n por empates. Si la V no corregida se aproxima pero
7 = 630 - 495 = 3.17.
• Ver Siegel (1956), pags. 123-125, para las correcciones cuando se presenta un nurnero grande de empates. - 42.60
342 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
INFERENCIA ESTADfsTICA CON VARIABLES DE ESCALA ORDINAL 343
Puesto que el valor 3.17 de z excede al valor critico de 1.96, podemos rechazar la Las escalas de c1asificaci6n parecen ser extremadamente imperfectas y nos
hip6tesis nula y afirmar que el tratamiento experimental produjo una diferencia imposibilitan para afirmar que las calificaciones tienen propiedades cuantitativas
significativa entre las condiciones. precisas. La unica hip6tesis que podriamos hacer justificadamente es que cualquier
diferencia que exista entre dos calificaciones apareadas es un indicador valido de la
direccion y no de la magnitud de la diferencia,
18.3 Pruebas no parametricas En la tabla 18.3 hay 13 parejas de observaciones. Puesto que la pareja M esta
empatada y, por consiguiente, no hay indicacion de diferencia en un sentido 0 en
con muestras correlacionadas otro, omitimos estas observaciones apareadas. De las 12 parejas restantes deberia
mos esperar, basandonos en la hip6tesis nula, que la mitad de los cambios son en la
AI estudiar, en el capitulo 14, la t de Student para muestras correlacionadas y su direcci6n positiva y la otra mitad en la negativa. En otras palabras, segun H o' la
equivalente algebraico, el estadigrafo A de Sandler, hicimos notar las ventajas de probabilidad de que cualquier diferencia sea positiva es igual a la probabilidad de
emplear muestras correlacionadas siempre que fuera posible. Las mismas ventajas se que sea negativa. Puesto que tratamos con una poblaci6n bicateg6rica (diferencias
obtienen en las pruebas no parametricas con muestras apareadas 0 correlacionadas. positivas y diferencias negativas), puede expresarse H o precisamente en la misma
En las secciones siguientes se estudiaran dos de tales pruebas para variables de escala forma que en la prueba binomial cuando P = Q = 1- Esto es, en este problema, H o :
ordinal, que son la prueba del signo y la prueba del siqno-ranqo de Wilcoxon. P = Q = t. En verdad, la prueba del signa es solamente una variaci6n de la prueba
binomial presentada en la secci6n 17.2.
En el presente ejemplo, de las 12 comparaciones que muestran una diferencia
(N = 2), 9 son positivas y 3 son negativas. Puesto que P = Q = t, nos dirigimos a la
18.4 Prueba del signo tabla M, bajo x = 9, N = 12, y encontramos que el valor critico al nivel rx = 0.05,
xamen bilateral, es 10. Dado que x es menor que el valor critico, no podemos
Supongamos que se repite el experimento del liderazgo, con el cual iniciamos el echazar H o.
capitulo, empleando muestras mas grandes. Con la esperanza de que la inteligencia y Las hipotesis en que se basa la prueba del signo son que las parejas de medidas
la aptitud para ellideazgo sean variables correlacionadas, tomamos dos grupos, uno eben ser independientes entre si y que estas medidas deben corresponder, por 10
experimental y otro de control, que se aparean basandose en la inteligencia. Al . enos, a una escala ordinal.
completar el curso de entrenamiento para lideres, se pide a unos observadores Una de las desventajas de la prueba del signo es que elimina por completo
independientes que evahien las calidades de lider de cada uno de los sujetos segun alquier informaci6n cuantitativa que pueda ser inherente a los datos (por ejemplo,
una escala de 50 puntos. Los resultados se indican en la tabla 18.3. 8 = - 7 = - 6, etc.). La prueba del signo trata a todas las diferencias positivas
mo si fueran iguales y 10 mismo hace con todas las diferencias negativas.
Tabla 18.3 Clasificacion de dos grupos de sujetos apareados en cuanto a Si esta es la unica hip6tesis garantizada por la escala de medida empleada, no nos
las cualidades de lider (datos hipoteticos),
eda otro camino que utilizar la prueba del signo. Si, por el contrario, los datos
CALIFICACION DE L1DERAZGO rmiten hacer aseveraciones cuantitativas tales como «una diferencia de 8 es mayor
SIGNO
DE LA DIFERENCIA que una de 7, y una diferencia de 7 es mayor que una de 6, etc.», se pierde potencia al
PAREJA EXPERIMENTAL CONTROL (E - C) emplear la prueba del signo.
A 47 40 +
B 43 38 +
C 36 42
D 38 25 + Prueba del signo-rango de Wilcoxon
E 30 29 + para observaciones apareadas
F 22 26
G 25 16 +
H 21 18 + os visto que la prueba del signo utiliza simplemente la informacion concerniente
I 14 8 +
J 12 4 + direccion de las diferencias entre parejas. Si puede tenerse en cuenta tanto la
K 5 7 nitud como la direccion de estas diferencias, es factible emplear una prueba mas
L 9 3 + ente. La prueba del signo-rango de Wilcoxon para observaciones apareadas alcanza
M 5 5 (0) or potencia al utilizar la informaci6n cuantitativa inherente a la c1asificaci6n de
iferencias.
344 ESTADfSTICA PARA LAS CIENCIAS SOCIALES INFERENCIA ESTADISTICA CON VARIABLES DE ESCALAORDINAL 345
Con fines heuristicos, volvamos a los datos de la tabla 18.3 y hagamos una Se recordara que la prueba del signo aplicada a estos mismos datos no conduce al
hipotesis diferente acerca de la escala de medida empleada, Supongase que la escala rechazo de la hipotesis nula. La razon debe resultar obvia, ya que 00 podemos sacar
con que hicimos la evaluaci6n no es tan imperfecta como habiamos imaginado; esto ventaja de toda la informacion inherente a nuestros datos cuando empleamos la
es, no solamente proporciona medidas en la escala ordinal, sino tam bien diferencias prueba del signo,
entre estas medidas ordinales. La tabla 18.4 reproduce estos datos, con una columna
adicional que indica la magnitud de las diferencias.
18.5.1 Hipotesis fundamentales en la prueba
Tabla 18.4 Clasificaci6n de dos grupos de sujetos apareados en cuanto a las cualidades de lider (datos del signo-rango de Wilcoxon
hipoteticos).
para observaciones apareadas
CALIFICACION DE L1DERAZGO RANG OS
POSICION DE RANGO DE LA CON LAS SUMAS Una hipotesis involucrada en el uso de la prueba del signo-rango de Wilcoxon es que
LOS EQUIPOS EXPERIMENTAL CONTROL DIFERENCIA DIFERENCIA MAS PEQUENAS la escala de mediciones es por 10 menos de naturaleza ordinal. En otras palabras, la
hipotesis consiste en que las calificaciones permiten el ordenamiento de los datos
A 47 40 +7 9 segun las relaciones de mayor que y de menor que. Sin embargo, la prueba del signo
B 43 38 +5 5
36 42 -6
rango requiere una hipotesis adicional que la puede excluir de algunas de sus
C (-)7 -7
D 38 25 + 13 12 aplicaciones potenciales; esta hipotesis consiste en admitir que las diferencias entre
E • 30 29 +1 1 las calificaciones corresponden tarnbien a una escala ordinal. No siempre queda claro
F 22 26 -4 (-)4 -4 cuando es, 0 no, valida esta hipotesis para un conjunto dado de datos. Tomese, por
G 25 16 +9 11 ejemplo, una escala de personalidad hecha a proposito para medir la «ansiedad
H 21 18 +3 3 manifiesta» en un examen. l,Podemos asegurar de forma valida que una diferencia
I 14 8 +6 7
J 12 4 +8 10
entre observaciones apareadas de, por ejemplo, 5 puntos en una parte de la escala es
K 5 7 -2 (-)2 -2 mayor que una diferencia de 4 puntos en otra parte de la misma? Si no tenemos
L 9 3 +6 7 certeza del cumplimiento de esta hipotesis, debemos emplear otra forma de analisis
M 5 5 (0) estadistico, aun cuando ella signifique pasar a una prueba de significacion menos
sensible. Una vez mas, nuestro conservadorismo basico como cientificos nos hace
T= -13 preferir un error del tipo II a otros del tipo I.
teniendo en cuenta la correlacion entre sujetos respecto a una variable correlaciona 2. En un estudio para determinar el efecto de una droga sobre la agresividad, el grupo A
da con la medida de criterio. recibio la droga y el grupo B recibio un placebo. Inmediatamente despues de administrar la
La prueba del signo cumple con este objetivo empleando medidas antes-despues droga y el placebo, se realize una prueba para com pro bar la agresividad. Las calificaciones
en los mismos individuos. obtenidas fueron como sigue (a mayor calificacion, mayor agresividad]:
Vimos tarnbien que la prueba del signo, si bien obtiene ventaja de la direcci6n de Grupo A 6
~as diferencias implicadas en las medidas ordinales, falla al no hacer uso de la Grupo B
informacion referente a las magnitudes de las diferencias.
La prueba del signo-rango de Wilcoxon para observaciones apareadas tiene en Plantear este estudio en terrninos estadisticos formales y establecer una conclusion res paId ada
cuenta tanto la magnitud Como la direccion implfcitas en las mediciones ordinales con por la evidencia estadfstica.
~ue.stras cor~elacionadas. Cuando se cumplen las hipotesis basicas de la prueba, la 3. El jefe de personal de una gran cornpafiia de seguros dice que los agentes de seguros que
tecnica de WIlcoxon es una base extremadamente sensible para obtener valores de reciben un entrenamiento en relaciones publicas dan una impresion mas favorable entre los
probabilidad. posibles clientes. Para comprobar esta hipotesis se seleccionaron al azar 22 individuos entre
los contratados mas recientemente y se asigno la mitad de ellos al curso de relaciones publicas.
Los 11 individuos restantes fueron asignados al grupo de control. Despues del perfodo de
entrenamiento se observe a los 22 individuos en una entrevista simulada con un cliente, y se
Terminus para recordar los clasifico segun una escala de diez puntos (0-9) de acuerdo a su desenvoltura en el
establecimiento de relaciones. A mayor calificacion, mejor clasificacion. Plantear y examinar
H 0 usando la prueba estadistica apropiada. Utilicese (J. = 0.01.
prueba del signo
Grupo experimental: s 7 9 4 7 9 3 7 8 9 3
prueba del signo-rango de Wilcoxon para observaciones apareadas Grupo de control: 5 6 2 6 0 2 6 5 1 0 5
prueba U de Mann- Whitney 4. Supongase que los individuos del ejercicio 3 fueron apareados respecto a una variable de
la cual se sabe que esta correlacionada con la variable de criterio. Emplear la prueba
estadfstica apropiada para examinar H o- Utilicese (J. = 0.01.
5. A quince parejas de casados se les hizo una encuesta para estimar sus actitudes en
Ejercicios relacion con un asunto politico particular. Los resultados fueron los siguientes (a una mayor
calificacion corresponde una actitud mas favorable):
.1. . Par~ los datos presentados en la tabla adjunta, determinar si hay una diferencia
significativa en el numer? de «bases robadas» obtenidas por dos ligas, empleando ESPOSO ESPOSA ESPOSO ESPOSA
a) la prueba del signo,
37 33 32 46
b) la prueba de Wilcoxon para observaciones apareadas,
46 44 35 32
c) la prueba U de Mann-Whitney,
59 48 39 29
l,Cueil es la mejor prueba estadistica para estos datos? l,Por que?
17 30 37 45
41 56 36 29
36 30 45 48
NUMERO DE BASES ROBADAS
29 35 40 35
POSICION
DE LOS EQUIPOS L1GA 1
38 38
L1GA 2
1 91 81 l,Cual es la conclusion?
2 46 51
3 108 63 6. Supongase que en las ultirnas competiciones en pista no hubo diferencia entre la
4 99 51 velocidad media de los corredores de dos universidades. Supongase tam bien que en este afio
5 110 46 los equipos estan formados por las mismas personas que en ocasiones anteriores.
6 105 45 Para la cornpeticion de este afio, el equipoA entrena en la forma habitual. Sin embargo, el
7 191 66 encargado del equipo B introduce los recorridos en bicicleta como parte del entrenamiento.
8 57 64 Los corredores de las dos universidades obtuvieron los siguientes tiempos (en minutos):
9 34 90
10 81 28 A 10.2 11.1 10.5 10.0 9.7 12.0 10.7 10.9 II.5 lOA
B 9.9 10.3 11.0 10.1 9.8 9.5 .10.8 10.6 9.6 904
348 ESTAOfsTICA PARA LAS CIENCIAS SOCIALES [349]
Examinar la hip6tesis nula de que los recorridos en bicicleta no afectan a la velocidad del
corredor. REVISION DE LA TERCERA PARTE
7. Imaginese que en el ejercicio 6 los integrantes de cada equipo han sido previamente
apareados de acuerdocon la velocidad alcanzada en las prirneras 50 yardas. Las parejas est'
forma.das como se indica en .la lista anterior. Usando la prueba del signo y la del signo-ran;:
de Wilcoxon para observaciones apareadas, plantear y examinar la hipotesis nula.
Estadistica inferencial
8. U~ i~vestigador trata de medir la eficacia de un anuncio para prornocionar cierta marca
de dentJfn~o. Para este fin, c1asifica por parejas su muestra de consumidores (ninguno de los B. Pruebas no parametricas de significacion
cual~s .habla comprado antes dentifrico de esa marca) de acuerdo con eJ nurnero de tubos de
dentIrnc.o que sU~len comprar en seis meses. Teniendo la muestra dividida en dos grupos,
presento el anuncio a uno de ellos. Despues de seis meses, el investigador hall6 que el rnimero
d.e tubos de su ma:ca: cornprados per los integrantes de la muestra durante ese tiernpo, habia
sido tal como se indica a continuacion:
MANN, H. B., yD. R. WHITNEY (1947): «On a test of whether one of two random variables is
stochastically larger than the other», Ann. Math. Statist., 18, 52-54.
McNEMAR, Q. (1962): Psychological Statistics. Nueva York: John Wiley and Sons, Inc.
Referencias MERRINGTON, M., y C. M. THOMPSON: Tables of Percentage Points of the Inverted Beta
OLDS, E. G. (1949): «The 5 percent significance levels of sums of squares of rank differences
PEARSON, E. S., Y H. O. HARTLEY (1958): Biometrika Tables for Statisticians, vol. 1, 2." ed.,
RAND CORPORATION (1955): A Million Random Digits. Glencoe, Ill.: The Free Press of
Glencoe.
ROCKS, L., y R. P. RUNYON: The Energy Crisis. Nueva York: Crown Publishers, 1972.
RUNYON, R. P. (1968): «Note on use of the A-statistic as a substitute for t in the one-sample
AUBLE, D '.(1953): «Extended tables for the Mann-Whitney statistic», Bulletin of the Institute case», Psychological Reports, 22, 361-362.
BINGHAM, W. V. (193.1): Aptitudes and Aptitude Testing. Nueva York: Harper and Bros.
SALK, L.: «The role of the heartbeat in the relations between mother and infant», Scientific
DINGLE, 1. H.: «The Ills of man», Scientific American, 229 (3), septiembre 1973, 77-84.
American, 228 (5), mayo, 1973, 26-29.
NaZI victims: 25 years later», Journal of Consulting and Clinical Psychology, 46,
I-II. measures, based on a simplification of Student's t», Brit. J. Psychol.; 46, 225-226.
EDWARDS, A. L. (1969): Statistical Analysis, 3." ed., Nueva York: Holt, Rinehart and Winston, 389-399.
[353]
Apendices
I. Repaso de matematicas basicas
II. Glosario de simbolos
III. Tablas
IV. Tratamiento de las distribuciones no normales
V. Lista de formulas
VI. Glosario de terminos
[355]
Repaso
I de matematicas basicas
Operaciones aritmeticas
El lector ya conoce que la suma se indica por el signo « + », la resta por el signo «- »,
la multiplicacion por cualquiera de los modos siguientes, 2 x 4, 2(4) 0 2·4, y Ia
division por una diagonal «[», una barra «-» 0 el simbolo « -+ ». Sin embargo, no es
raro que se olviden las reglas referentes a la suma, resta, multiplicacion y division,
particularmente cuando estas operaciones aparecen en un solo problema.
Suma y resta
Al sumar mimeros, el orden de los sumandos no tiene ninguna influencia en el
resultado de la suma. Asi, podemos sumar 2 + 5 + 3 en cualquiera de las siguientes
formas:
2 + 5 + 3, 5 + 2 + 3, 2 + 3 + 5,
5 + 3 + 2, 3 + 2 + 5, 3 + 5 + 2.
Si se suma una serie de mimeros dotados de signos positivos 0 negativos, el orden
de los sumandos tampoco influye en la suma. Sin embargo, es conveniente a menudo
agrupar todos los numeros precedidos por signos positivos, agrupar los que esten
precedidos por signos negativos, sumar cada uno de los grupos por separado y restar
el ultimo del primero. Asi, ,
-2+3+5-4+2+1-8
numero menar del mayor y se da a la suma el signa del nurnero mas grande. ASi, del mismo signo, el resultado siempre es positivo; cuando los mimeros tienen sign as
-14+11=-3. diferentes, el cociente siempre es negativo.
EI orden en que los nurneros se multiplican no afecta al producto. En otras palabras, 15 + 15 + 15 + 15 + 15 = 5(15)
2x3x4=2x4x3=3x2x4
= 3 x 4 x 2 = 4 x 2 x 3 = 4 x 3 x 2 = 24. (15 + 15 + 15 + 15 + 15) + (16 + 16 + 16 + 16) = 5(15) + 4(16).
Cuando la suma, la resta y la multiplicaci6n se presentan en la misma expresi6n, Esta formulacion es iitil para cornprender las ventajas de «agrupar» dat.os en las
es preciso desarrollar ciertos procedimientos para indicar que operaciones han de llamadas distribuciones de frecuencias. Al obtener la suma de un conjunto de
realizarse primero.
calificaciones, algunas de las cua~es se repiten un c~erto mimero de veces, resulta
En la expresion
cornodo multiplicar cada calificacion por la frecuencia con que se presenta.y s.umar
2 x 4 + 7 x 3 - 5, despues los productos. Asi, si tuvierarnos que obtener la suma de las siguientes
calificaciones
se efecttia primero la rnultiplicacion. Asi, la expresion anterior es igual an
12, 13, 13, 13, 14, 14, 14, 14, 15, 15, 15, 15,
I) 2 x 4 = 8, 2) 8 + 21 - 5 = 24. . 15, 15, 15, 16, 16, 16, 17, 17, 17, 17, 18,
7 x 3 = 21,
seria ventajoso formar la correspondiente distribucion de frecuencias:
-5 = -5,
No se puede sumar prirnero y luego multiplicar, Asi, 2 x 4 + 7 no es igual a X IX
2(4 + 7), 0 sea, 22.
Si un problema implica hallar el producto de un mimero por una segunda 12 1 12
13 3 39
expresion que inc1uye dos 0 mas terrninos que a su vez, hay que sumar 0 restar,
14 4 56
podemos multiplicar prirnero y luego sumar, 0 bien sumar primero y luego multipli
15 7 105
car. Asi, la solucion al siguiente problema es
16 3 48
17 4 68
8(6 -> 4) = 8 x 6 - 8 x 4 18 1 18
= 48 - 32
= 16, N = 23 L/X = 346
o
8(6 - 4) = 8(2) .
= 16.
Operaciones algebraicas
Sin embargo, en la mayor parte de los casos es mas comedo reducir primero Transposicion
expresion dentro de parentesis, Asi, la segunda solucion que aparece arriba se
utilizara, mas frecuentemente, en general. Para transponer un terrnino de un lado de una ecuacion al otro, bast~ con cambiar
Por ultimo, si se multiplican numeros que tienen signos iguales, el product(j de signo el terrnino transpuesto.. Las siguientes expresiones son equivalentes:
siempre es positivo; por ejernplo, (+2) x (+4) = +8 Y (-2) x (-4) = +8. Si se
a + b = c,
multiplican dos rnimeros que tienen signos diferentes, el producto siemprc
negativo; por ejemplo, a = c - b,
b=c-a,
(+2)x(-4)=-8 y (-2) x (+4) = -8.
0= c - a - b,
La misma regia se aplica tam bien a la division: al obtener el cociente de dos nume~ 0= c - (a + b).
358 ESTAOisTICA PARA LAS CIENCIAS SOCIALES REPASO DE MATEMATICAS BASICAS 359
Resolucion de ecuaciones que contienen fracciones puede pasar al otro miembro de la misma dividiendo al numerador de ese otro
lado,
Muchas de las dificultades que se encuentran al resolver ecuaciones que contienen x x
fracciones pueden evitarse recordando un importante principio maternatico: ab = x puede convertirse en a=- 0 b =-.
b a
lquales multiplicados por iquales SOil iquales. Se ha visto as! que todas las expresiones siguientes se equivalen:
Veamos algunos problemas como ejemplo. a a
b=-, a= bx, x =-.
1. Resolver la siguiente ecuacion en x: x b
Analogamente,
a
b =-.
x LX
L!=N.
-=X
N ' X
AI tratar de obtener x, se desea expresar su valor en funcion de a y de b. En otras Division por una suma 0 una diferencia. Es cierto que
palabras, deseamos que la ecuacion final se lea x = .
Notese que podemos multiplicar ambos miembros de la ecuacion por xlb y x+y = ~ +~ y x- y = ~ _ ~.
obtener asi: z z z z z z
x a X Sin embargo, no es posible simplificar tan facilmente las expresiones siguientes:
h '-- = -.. '-.
h X b
x x
que se reduce a o
y+z y-z
a
x = b' Asf,
x x x
2. Resolver la ecuacion anterior para a. --#-+-,
y+z Y z
Analogamente, si deseamos resolver la ecuacion para obtener a, podriamos
multiplicar los dos miembros por x. Asi, donde =1= significa «diferente de».
a
b :x = .x
x
Simplificacion de fracciones
que se convierte en bx = a, 0 sea, a = bx.
En cada una de las soluciones anteriores se notara que el efecto final de la Un corolario de la regla que dice que iguales multiplicados por iguales son iguales es:
multiplicacion por una constante ha sido la reordenacion de terminos en el
numerador y en el denominador de las ecuaciones. De hecho, cabe establecer dos Desiguales multiplicados por iguales permanecen proporcionales.
reglas generales que perrnitiran resolver los problemas anteriores sin tener que
ernplear la multiplicacion por iguales (aunque la rnultiplicacion por iguales queda . ., 1.
implicita en las operaciones aritmeticas):
t
Asi, si multiplicaramos por t, el produc~o, 382' esta en la ml~ma proporcion que 4'
Este corolario es util al simplificar fracciones, Veamos un ejemplo.
a
a) Un mimero que est en el denominador de uno de los miembros de una ecuacion
Ejemplo. Simplificar
cld 0 b' d
se obtiene Si X = i, a = 2 Y b = 3,
(a/b) . (bd/l)
(e/d)· (bd/l)'
xa.Xb=xa+b=(_61)2+3 =(_61)5-_165 5 -
1
7776'
que se convierte en ad/be. Para dividir X elevada a la potencia a por X elevada a la potencia b, se resta
Sin embargo, obtendriamos el mismo resultado invirtiendo el divisor y multipl], simplemente el exponente del denominador del exponente del n~m~rado~ y se el.e,va
cando. Asi, X a la potencia (a - b)*. La razon de restar queda clara en la siguiente ilustracion,
alb a d ad XU X5 X· X . X . X . X _ 3 _ 3 _
-b
=-= -X -3 -27.
e/d b ' -c = be' X Xl X· X
Podemos enunciar ahora una regIa general para dividir una fraccion por otra
Si X = t, a = 4, b = 2, entonces
fraccion, Para dividir fracciones, .se invierte el divisor y se multiplica. Asi,
Xu = x-:» = X4-l = Xl.
x/y bx
xb
se convierte en que es igual a
al/b ~2y Sustituyendo t en vez de X, tenemos
3/4 3 2 2·3 6
52/2 -4' 52 = 4 X 52 = 100'
II
Simbolo Definicion Paqina
Media de la distribucion de las medias muestrales 218
/lx
Glosario de simbolos /lx, -x, Media de la distribucion de la diferencia entre parejas
de medias muestrales 245
15
2
Varianza poblacional 97
15
f5~ -
x - N Varianza de la distribucion muestral de la media 219
15
dias 245
A continuacion se dan las definieiones de los simbolos que aparecen en el texto, Omega al cuadrado; grado de asociacion entre la
seguidas por el numero de la pagina en que se haee referencia al simbolo por primera variable dependiente y la variable independiente 249
vez.
Las letras griegas y las italicas apareeen en listas separadas y en orden alfabetico Letras italicas
aproximado. Los operadores matematicos figuran en primer lugar. Estadigrafo empleado para la prueba de hipotesis con
muestras correlacionadas 267
Paqina
Pendiente de una recta que relaciona valores de Y con
Operadores matematicos valores de X
147
=1= Diferente de 24
24
17
(formula de rs) 133
X elevada a la potencia a D
N! Factorial: multiplicar N por todos los mimeros ente {
(2) Calificacion en la variable X - calificacion en la
variable Y, (X - Y) 265
Valor absoluto de X 96
siguen 17
ciones a los datos
F Cociente de dos varianzas 250
f Frecuencia
XI + X 2 + .... + X N 18
Ii Numero de casos dentro del intervalo que contiene
aX 67
Letras griegas
fe Numero esperado en una categoria dada 327
fo
lidad de rechazar H 0 cuando es verdadera 204
fX Calificacion multiplicada por su correspondiente fre
f3 . Probabilidad de cometer un error del tipo II, probabi cuencia 79
rechazada H 0
Valor de la media poblacional segun H o 220
Longitud del intervalo de clase 42
122
T
t
Suma de los rangos con el signo menos frecuente
Estadigrafo empleado para examinar hipotesis cuan
do (J es desconocida
344
226
(2) Numero de filas en una tabla de contingencia 330 U,U' Estadigrafo en la prueba de Mann-Whitney 338
r2 Coeficiente de determinacion 158 X, Y Variables; cantidades 0 calificaciones de variables 17
r, Coeficiente de correlacion por rangos de Spearman 122 X i, 1'; Cantidades especificas indicadas por el subindice i 18
R1 Suma de los rangos asignados al grupo cuyo tarnafio X,Y Medias aritrneticas 77
muestral es N 1 (formula U de Mann-Whitney) 339 Xi Media del i-esimo grupo 281
R2 Suma de los rangos asignados al grupo cuyo tamafio
muestral es N 2 (formula U de Mann-Whitney)
X _ IX to t Media general 280
339 101 N
SC
S2 =_ Varianza muestral 98 Desviaci6n de una calificacion respecto a la media 79
(X - X)
N
x Nurnero de objetos en una categoria 0 numero de
III Tablas
Agradecimientos
Tabla B R. A. Fisher, Statistical Methods for Research Workers (14." ed.). (Metodos
estadisticos para intiestiqadores.] Reproducida, con permiso, de Macmillan
Publishing Company, Inc. Copyright 1970, University of Adelaide.
Tabla C Tabla III de R. A. Fisher y F. Yates. Statistical Tablesfor Biological, Agricultural,
and Medical Research (Tablas estadisticas para la investigaci6n bioloqica, agricola y
A medica). Edimburgo: Oliver and Boyd, Ltd., 2." ed., 1974.
Proporciones de area bajo la curva normal 369 Tabla D G. W. Snedecor y William G. Cochran, Statistical Methods 6." ed., (Metodos
B Tabla de X2 estadisticos), Ames, Iowa: Iowa State University Press, 1967.
372
C Valores criticos de t Tabla E J. Sandler, «A test of the significance of the ditTerence between the means of
373 correlated measures, based on a simplification of Student's t» (Una prueba de
D Valores criticqs de F 374 significacion de la diferencia entre las medias de medidas correlacionadas, basada
D1 Valores criticos de F que corresponden al 2.5 % superior y al en una simplificacion de la t de Student), Brit. J. Psychol., 46, 225-226, 1955.
2.5 % inferior de las distribuciones F 378
Tabla F Q. McNemar, tabla B de Psychological Statistics (Estadistica aplicadaa la
psicoloqia). Nueva York: John Wiley and Sons, Inc., 1962.
E Valores criticos de A 380 Tabla G E. G. Olds, «The 5 percent significance levels of sums of squares of ditTerences and
F Transformacion de r a zr a correction» (Los niveles de significacion del 5 por ciento de las sumas de
381 cuadrados de las diferencias y una correccion), Ann. Math. Statist., 20, 117-118,
G Valores criticos de rs 382
1949. E. G. Olds, «Distributions of sums of squares of rank differences for small
H Funciones de r
383 numbers of individuals» (Distribuciones de las sumas de cuadrados de las
I Valores criticos de U y U' diferencias de rangos para numeros pequefios de individuos). Ann. Math. Statist., 9,
385 133-148, 1938.
J Valores criticos de T 389 Tabla H W. V. Bingham, tabla XVII de Aptitudes and Aptitude Testing ( Aptitudes y pruebas
K Factoriales de los numeros dell al 20 390 de aptitud). Nueva York: Harper and Bros., 1937.
L Coeficientes binomiales Tabla I H. B. Mann y D. R. Whitney, «On a test of whether one of two random variables is
390 stochastically 'larger than the other» (Acerca de una prueba para averiguar si una
M Valores criticos de x 0 de N - x (el que sea mayor) a los de dos variables aleatorias es estocasticamente mayor que la otra). Ann. Math.
niveles 0.05 y 0.01, cuando P = Q = ! 391 Statist., 18, 52-54, 1947.
N Valores criticos de x para varios valores de P y de Q cuando D. Auble, «Extended tables for the Mann-Whitney statistic» (Tablas ampliadas
para el estadigrafo de Mann-Whitney). Bulletin of the Institute of Educational
N ~49 392 Research at Indiana University, 1, mim, 2, 1953.
0 Puntos porcentuales del ran go studentizado 398 Tabla J F. Wilcoxon, S. Katti, y R. A. Wilcox, Critical Values and Probability Levelsfor the
P Wilcoxon Rank Sum Test and the Wilcoxon Signed Rank Test (Valores criticos y
Cuadrados, raices cuadradas y reciprocos de los mimeros dell
niveles de probabilidad para la prueba Wilcoxon de la suma de rangos y para la
al 1000 399 prueba Wilcoxon de los rangos con signo). Nueva York: American Cyanamid Co.,
Q Numeros aleatorios 405 1963.
F. Wilcoxon y R. A. Wilcox, Some Rapid Approximate Statistical Procedures
(Algunos procedimientos estadisticos de aproximacion rapid a). Nueva York:
Lederle Laboratories, 1964.
Tabla L S. Siegel, Nonparametric Statistics (Estadistica no parametrica). Nueva York:
McGraw-Hili, 1956.
Tabla M R. P. Runyon, tabla A de N onparametric Statistics (Estadistica nl) parametrica),
Reading, Mass.: Addison-Wesley Publishing Co., 1977.
368 ESTADfsTICA PARA LAS CIENCIAS SOCIALES TABLAS 369
Tabla 0
Reading, Mass.: Addison-Wesley Publishing Co., 1977.
E. S. Pearson y H. O. Hartley, Biometrika Tables for Statisticians vol. 1, 2.8 ed.
U SO de la tabla A
(Tablas de Biometrica para estadisticos). Nueva York: Cambridge, 1958.
Tabla P A. L. Edwards, Statistical Analysis 3." ed. ( Analisis estadistico). Nueva York: Holt
Rinehart and Winston, Inc., 1969. ' El uso de la tabla A requiere que la calificacion original sea transformada en un valor
J. W. Dunlap y A. K. Kurtz, Handbook oj Statistical Nomographs, Tables, and z, y que la variable tenga distribucion normal.
Formulas (Manual de nomogramas, tablas y formulas estadisticas). Nueva York: Los valores de la tabla A representan la proporcion de area bajo la curva normal
World Book Company, 1932. estandar, que tiene una media de 0, una desviacion estandar de I y un area total
Tabla Q RAND Corporation, A million Random Digits (Un mil/on de numeros aleatorios), tambien iguaJ a 1.
Glencoe, III.: Free Press of Glencoe, 1955. Puesto que la curva normal es simetrica, basta con indicar las areas correspon
dientes a valores positivos de z. A los valores negativos de z les corresponderan las
mismas proporciones de area que a sus equivalentes positivos.
La columna B representa la proporcion de area entre la media y una z dada.
0.5000 DEL
AREA TOTAL
MEDIA Z -Z MEDIA
!
La columna C representa la proporcion de area comprendida entre la media y una z
dada.
MEDIA Z -Z MEDIA
370 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
TABLAS 371
0.03 .0120 .4800 0.58 .2190 .2810 1.67 .4525 .0475 2.24 .4875 .0125 2.81 .4975 .0025
1. 13 .3708 .1292
.4535 .0465 2.25 .0122 2.82
0.04 .0160 .4840 0.59 .2224 .2776 1.14 1.68 .4878 .4976 .0024
.3729 .1271
1.69 .4545 .0455 2.26 .4881 .0119 2.83 .4977 .0023
0.05 .0199 .4BOI ,0.60 .2257 ,2743 1.15 .3749
0.06 .0239 .4761 .1251
1.70 .4554 .0446 2.27 .4884 .0116 2.84 .4977 .0023
0.61 .2291 " .2709 1.16 .3770 .1230
1. 71 .4564 .0436 2.28 .4887 .0113 2.85 .4978
0.07 .0279 A721 0.62' .0022
0.08 . 2374• .2676 1.17 .3790 .1210
1.72 .4573 .0427 2.29 .4890 .0110 2.86 .4979 .0021
.0319 .4681 0.63 .2357 .2643 1. 18 .3810 .1190
_1...73, __ .4§llg, 2.30 .4979
0.09 .0359 .4641 0.64 .Mill.('- _ .4893 .0107 2.87 .0021
.2389 .2611 1. 19 .3830 .1170
1:74 .4591 .0409 2.31 .4896 .0104 2.88 .49BO .0020
0.10 .0398 .4602
, . ,
0.65 .2422 .2578 1.20 .3849 .1151
1.75 .4599 .0401 2.32 .4898 .0102 2.89 .4981 .0019
0,11 ' .0438 .4562 0.66 .2454 .2546 1.21 1.76 .4608 .0392 2.33 .4901 .0099 2.90 .4981 .0019
.3869 .1131
0.12 .0478 .4522 0.67 .2486 .2514 1. 22 .3888 1.77 .4616 .0384 2.34 .4904 .0096 2.91 .49Q2 .0018
0.13 .0517 .1112
0.20 .0793 .4207 0.75 1.85 .4678 .0322 2.42 .4922 .0078 2.99 .4986 .0014
.2734 .2266 1.30 .4032
.0968
1.86 .4686 .0314 2.43 .4925 .0075 3.00 .4987 .0013
0.21 .0832 .4168 0.76 .2764 .2236 1.31 .4049
0.23 .0910 .4090 0.78 1.88 .4699 .0301 2.45 .4929 .0071 3.02 .4987 .0013
.2823 .2177 1.33 .4082
.0918
1.89 .4706 .0294 2.46 .4931 .0069 3.03 .4988 .0012
0.24 .0948 .4052 0.79 .2852 .2148 1.34 .4099
.0901
"
1.90 .4713 .0287 2.47 .4932 .0068 3.04 .4988 .0012
0.25 .0987 .4013 0.00 .2881 .2119 1.35 .4115 1.91 .0281 2.48 3.05 .4989 .0011
0.26 .0885
.4719 .4934 .0066
":: . 1026 .3974 0.81 .2910 .2090 1.36 .4131 .0869
1.92 .4726 .0274 2.49 .4936 .0064 3.06 .4989 .0011
0.27 .1064 .3936 0.82 .2939 .2061 1.37 .4147
'r
1.93 .0268 2.50 .4989 .0011
0.28 .0853
.4732 .4938 .0062 3.07
.1103 .3897 0.83 .2967 .2033 1.38 .4162 .0838
1.94 .4738 .0262 2.51 .4940 .0060 3.08 .4990 .0010
0.29 .1141 .3859 0.84 .2995 .2005 1.39 .4177 .0823
Tabla B
Tabla de X2 ,
Tabla C
Los valores tabulados corresponden a una prueba
Valores criticos de t.
bilateral.
Para cualquier nurnero dado de gl, la tabla presenta los valores de t correspondientes a varios niveles
Grados
de probabilidad. La t obtenida es significativa a un nivel dado si es igual 0 mayor que el valor indicado
de .10 .05
en esta tabla.
.02 .01
Iibertad
gl Nivel de significaci6n para una prueba unilateral
1 2.706 3.841 5.412 6.635 .10 .05 .025 .01 .005 .0005
2 4.605 5.991 7.824 9.210
3 6.251 7.815 9.837 11.341 Nivel de sig~ificaci6n para una prueba bilateral
4 7.779 9.488 11.668 13.277
5 9.236 11.070 13.388 15.086 gl .20 .10 .05 .02 .01 .001
6 10.645 12.592 15.033 16.812 I 3.078 6.314 12.706 31.821 63.657 636.619
7 12.017 14.067 16.622 18.475 2 1.886 2.920 . 4.303 6.965 9.925 31.598
8 13.362 15.507 18.168 20.090 3 1.638 2.353 3.182 4.541 5.841 12.941
9 14.684 16.919 19.679 21.666 4 1.533 2.132 2.776 3.747, 4.604 8.610
10 15.987 18.307 21.161 23.209 5 1.476 2.015 2.571 3.3~ 4.032 6.859
11 17.275 19.675 22.618 24.725 1.440 1.943 2.447 3.1~ 3.707 5.959
6
12 18.549 21.026 24.054 26.217 7 1.415 1.895 2.365 2.998 3.499 5.405
13 19.812 22.362 25.472 27.688 8 1.397 1.860 2.306 2.896 3:355 5.041
14 21.064 23.685 26.873 29.141 9 1.383 1.833 . 2.262 • 2.821 3.250 4.781
15 22.307 24.?96 28.259 30.578 10 1.372 1.812 2.228 2.764 3.169 4.587
16 23.542 26.296 29.633 32.000 11 1.363 1.796 2.201 2.718 3.106 4.437
17 24.769 27.587 30.995 33.409 2.179 2.681 3.055 4.318
18 12 1.356 1.782
25.989 28.869 32.346 34.805 13 1.350 2.160 2.650 3.012 4.221
19 '.771
27.204 30.144 33.687 36.191 14 . 1.345 1.761 2.145 '" 2.624 2.977 4.140
20 28.412 31.410 35.020 37.566 15 1.341 1. 753 2.131 2.602 2.947 4.073
21 29.615 32.671 36.343 38.932
22 30.813 33.924 16 1.337 1.746 2.120 2.583 2.921 4.015
37.659 40.289 , .740 2.110 2.567 2.898 3.965
23 32.007 35.172 38 •.968 17 1.333
41.638 18 1.330 1.734 2.101 2.552 2.878 3.922
24 33.196 36.415 40.270 42.980
25 19 1.328 1.729 2.093 2.539 2.861 3.883
34.382 37.652 41.566 44.314 2.086 2.528 2.845 3.850
20 1.325 1. 725
26 35.563 38.885 42.856 45.642
27 36.741 40.113 44.140 46.963 .21 1.323 I. 721 2.080 2.518 2.831 I,
3.819
28 37.916 41.337 45.419 48.278 22 1.321 1.717 2.074 2.508 2.819 3.792
29 39.087 42.557 46.693 23 1.319 1. 714 2.069 2.500 2.807 3.767
49.588 2.064 2.492 2.797 3.745
30 40.256 43.773 47.962 50.892 24 1.318 1.711
25 1.316 1.708 2.060 2.485 2.787 3.725
dZ;~~.
2.358 3.373
,'Y':p< <
»> :;?~'·P.
....•: 2.326 I> P·. ~;~~~ • .3;.291 j
La tabla C ha sido tomada de la tabla III (pag, 46) de las «Statistical Tables for Biological, Agricultural
and Medical Research», publicadas par Longman Group Ltd., Londres (publicadas anteriormente por
Oliver and Boyd, Edimburgo), con permiso de los auto res y de los editores.
Tabla D W
-..J
Valores criticos de F .j>.
La F obtenida es significativa a un nivel dado si es igual 0 mayor que el valor indicado en la tabla. Las filas superiores (nurneros c1aros) y las filas
inferiores (nurneros oscuros) corresponden a los niveles 0.05 y 0.01. respectivamente. tTl
Los valores indicados son para la cola derecha de la distribuci6n que se obtiene dividiendo el estimador de la varianza mayor por el estimador de la Vl
-l
varianza menor. Para hallar ellado izquierdo complementario. 0 sea. la cola inferior, dados los gl y el nivel x, inviertanse los grados de libertad y con >
ellos se encorurara en la tabla F el reciproco del valor buscado. Por ejernplo. el valor a cuya derecha esta el 5 ~·o del area, para 7 y 12 gl, es 2.85. Para C'
hallar el punto a cuya izquierda esta el 5 "~ del area, se busca en la tabla en J. = 0.05 con 12 y 7 gl y se obtiene 3.57. EI reciproco de este nurnero es 1/3.57 =
~'
= 0.28. Asi, el 5 nn del area esta a la izquierda de F = 0.28. n
>
Grados de liberrad en el numeradci "C
>
;:l:l
1 2 3 4 5 6 7 8 9 10 11 12 14 16 20 24 30 40 50 75 100 200 500 OC
>
1 161 200 216 225 230 234 237 239 241 242 243 244 245 246 248 249 250 251 252 253 253 254 254 254 r
4052 4999 5403 5625 5764 5859 5928 5981 6022 6056 6082 6106 6142 6169 6208 6234 6258 6286 6302 6323 6334 6352 6361 6366 >
Vl
2 18.51 19.00 19.16 19.25 19.30 19.33 19.36 19.37 19.38 19.39 19.40 19.41 19.42 19.43 19.44 19.45 19.46 19.47 19.47 19.48 19.49 19.49 19.50 19.50 Q
98.49 99.01 99.17 99.25 99.30 99.33 99.34 99.36 99.38 99.40 99.41 99.42 99.43 99.44 99.45 99.46 99.47 99.48 99.48 99.49 99.49 99.49 99.50 99.50 tTl
Z
3 10.13 9.55 9.28 9.12 9.01 8.94 8.88 8.84 8.81 8.78 8.76 8.74 8.71 8.69 8.66 8.64 8.62 8.60 8.58 8.57 8.56 8.54 8.54 8.53 n
34.12 30.81 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23 27.13 27.05 26.92 26.83 26.69 26.60 26.50 26.41 26.30 26.27 26.23 26.18 26.14 26.12 ;;
Vl
(; 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.93 5.91 5.87 5.84 5.80 5.77 5.74 5.71 5.70 5.68 5.66 5.65 5.64 5.63 Vl
-0
ro 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.54 14.45 14.37 14.24 14.15 14.02 13.93 13.83 13.74 13.69 13.61 13.57 13.52 13.48 13.46 o
E
c;
n
g 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.78 4.74 4.70 4.68 4.64 4.60 4.56 4.53 4.50 4.46 4.44 4.42 4.40 4.38 4.37 4.36 sr
"
-0 16.26 13.27 12.06 11.39 10.97 10.67 10.45 10.27 10.15 10.05 9.96 9.89 s.rr 9.68 9.55 9.47 9.38 9.29 9.24 9.17 9.13 9.07 9.04 9.02 tTl
0; Vl
c 6 5.99 5.14 4.76 4.~3 4.39 4.28 4.21 4.15 4.10 4.06 4.03 4.00 3.96 3.92 3.87 3.84 3.81 3.77 3.75 3.72 3.71 3.69 3.68 3.67
" 13.74 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.79 7.72 7.60 7.52 7.39 7.31 7.23 7.14 7.09 7.02 6.99 6.94 6.90 6.88
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.63 3.60 3.57 3.52 3.49 3.44 3.41 3.38 3.34 3.32 3.29 3.28 3.25 3.24 3.23
12.25 9.55 8.45 7.85 7.46 7.19 7.00 6.84 6.71 6.62 6.54 6.47 6.35 6.27 6.15 6.07 5.98 5.90 5.85 5.78 5.75 5.70 5.67 5.65
8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.34 3.31 3.28 3.23 3.20 3.15 3.12 3.08 3.05 3.03 3.00 2.98 2.96 2.94 2.93
11.26 8.65 7.59 7.01 6.63 6.37 6.19 6.03 5.91 5.82 5.74 5.67 5.56 5.48 5.36 5.28 5.20 5.11 5.06 5.00 4.96 4.91 4.88 4.86
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.13 3.10 13.07 3.02 2.98 2.93 2.90 2.86 2.82 2.80 2.77 2.76 2.73 2.72 2.71
10.56 8.02 6.99 6.42 6.06 5.80 5.62 5.47 5.35 5.26 5.18 5.11 5.00 4.92 4.80 4.73 4.64 4.56 4.51 4.45 4.41 4.36 4.33 4.31
10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.97 2.94 2.91 2.86 2.82 2.77 2.74 2.70 2.67 2.64 2.61 2.59 2.56 2.55 2.54
10.04 7.56 6.55 5.99 5.64 5.39 5.21 5.06 4.95 4.85 4.78 4.71 4.60 4.52 4.41 4.33 4.25 4.17 4.12 4.05 4.01 3.96 3.93 3.91
11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.86 2.82 2.79 2.74 2.70 2.65 2.61 2.57 2.53 2.50 2.47 2.45 2.42 2.41 2.40
9.65 7.20 6.22 5.67 5.32 5.07 4.88 4.74 4.63 4.54 4.46 4.40 4.29 4.21 4.10 4.02 3.94 3.86 3.80 3.74 3.70 3.66 3.62 3.60
12 4.75 3.88 3.49 3.26 3.11 3.00 2.92 2.85 2.80 2.76 2.72 2.69 2.64 2.60 2.54 2.50 2.46 2.42 2.40 2.36 2.35 2.32 2.31 2.30
9.33 6.93 5.95 5.41 5.06 4.82 4.65 4.50 4.39 4.30 4.22 4.16 4.05 3.98 3.86 3.78 3.70 3.61 3.56 3.49 3.46 3.41 3.38 3.36
13 4.67 3.80 3.41 3.18 3.02 2.92 2.84 2.77 2.72 2.67 2.63 2.60 2.55 2.51 2.46 2.42 2.38 2.34 2.32 2.28 2.26 2.24 2.22 2.21
9.07 6.70 5.74 5.20 4.86 4.62 4.44 4.30 4.19 4.10 4.02 3.96 3.85 3.78 3.67 3.59 3.51 3.42 3.37 3.30 3.27 3.21 3.18 3.16
14 4.60 3.74 3.34 3.11 2.96 2.85 2.77 2.70 2.65 2.60 2.56 2.53 2.48 2.44 2.39 2.35 2.31 2.27 2.24 2.21 2.19 2.16 2.14 2.13
8.86 6.51 5.56 5.03 4.69 4.46 4.28 4.14 4.03 3.94 3.86 3.~ 3.70 3.62 3.51 3.43 3.34 3.26 3.21 3.14 3.11 3.06 3.02 3.00
15 4.54 3.68 3.29 3.06 2.90 2.79 2.70 2.64 2.59 2.55 2.51 2.48 2.43 2.39 2.33 2.29 2.25 2.21 2.18 2.1'5 2.12 2.10 2.08 2.07
8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.~ 3.73 3.67 3.56 3.48 3.36 3.29 3.20 3.12 3.07 3.00 2.97 2.92 2.89 2.87
16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.45 2.42 2.37 2.33 2.28 2.24 2.20 2.16 2.13 2.09 2.07 2.04 2.02 2.01
8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.61 3.55 3.45 3.37 3.25 3.18 3.10 3.01 2.96 2.89 2.86 2.80 2.n 2.75
17 4.45 3.59 3.20 2.96 2.81 2.70 2.62 2.55 2.50 2.45 2.41 2.38 2.33 2.29 2.23 2.19 2.15 2.11 2.08 2.04 2.02 1.99 1.97 1.96
(; 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.52 3.45 3.35 3.27 3.16 3.08 3.00 2.92 2.86 2.79 2.76 2.70 2.67 2.65
-0
ro
e 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.37 2.34 2.29 2.25 2.19 2.15 2.11 2.07 2.04 2.00 1.98 1.95 1.93 1.92
'E 18 3.44 3.37 3.27 3.19 3.07 3.00 2.91 2.83 2.78 2.71 2.68 2.62 2.59 2.57
c
0 8.28 6.01 5.09 4.58 4.25 4.01 3.85 3.71 3.60 3.51
-0 " 19 4.38 3.52 3.13 2.90 2.74 2.63 2.55 2.48 2.43 2.38 2.34 2.31 2.26 2.21 2.15 2.11 2.07 2.02 2.00 1.96 1.94 1.91 1.90 1. 88
0;
e 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.36 3.30 3.19 3.12 3.00 2.92 2.84 2.76 2.70 2.63 2.60 2.54 2.51 2.49
-0 "ro 1.84
t:
20 4.35 3.49 3.10 2.87 2.71 2.60 2.52 2.45 2.40 2.35 2.31 2.28 2.23 2.18 2.12 2.08 2.04 1.99 1.96 1.92 1.90 1.87 1.85
8.10 5.85 4.94 4.43 4.10 3.87 3.71 3.56 3.45 3.37 3.30 3.23 3.13 3.05 2.94 2.86 2.n 2.tH 2.63 2.56 2.53 2.47 2.44 2.42
"
@
" -0 21 ~ '~.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.28 2.25 2.20 2.15 2.09 2.05 2.00 1.96 1.93 1.80 1.87 1.84
4.€ 5.78 .~.87 4.37 4.04 3.81 3.65 3.51 3.40 3.31 3.24 3.17 3.07 2.99 2.88 2.~ 2.72 2.63 2.58 2.51 2.47 2.42
8.02
1.82 1.81
2.38 2.36
'"
0
-0 .'
e 22 <l.05 2.82 2.66 2.55 2.47 2.40 2.35 2.30 2.26 2.23 2.18 2.13 2.07 2.03 1.98 1.93 1.91 1.87 1.84 1.81 1.~ 1. 78
~ 4.30' .3..M
7.94 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.18 3.12 3.02 2.94 2.83 2.75 2.67 2.58 2.53 2.46 2.42 2.37 2.33 2.31
23 4.28 3.42 3.03 2.80 2.64 2.53 2.45 2.38 2.32 2.28 2.24 2.20 2.14 2.10 2.04 2.00 1.96 1.91 1.88 1.84 1.82 1.79 I.n 1.76
7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 3.21 3.14 3.1;7 2.97 2.89 2.78 2. i'O 2.62 2.53 2.48 2.41 2.37 2.32 2.28 2.26
24 4.26 3.40 3.01 2.78 2.62 2.51 2.43 2.36 2.30 2.26 2.22 2.18 2.13 2.09 2.02 1.98 1.94 1.89 1.86 1.82 1.80 1.76 1. 74 1.73
7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.25 3.17 3.09 3.03 2.93 2.85 2.74 2.66 2.58 2.49 2.44 2.36 2.33 2.27 2.23 2.21
25 4.24 3.38 2.99 2.76 2.60 2.49 2.41 2.34 2.28 2.24 2.20 2.16 2.11 2.06 2.00 1.96 1.92 1.87 1.84 1.80 1.77 1.74
2.70 2.62 2.54 2.45 2.40 2.32 2.29 2.23
1.72 1. 71
2.19 2.17 ~
7.n 5.57 4.68 4.18 3.86 3.63 3.46 3.32 3.21 3.13 3.05 2.99 2.89 2.81 Cll
r
26 4.22 3.37 2.89 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.18 2.15 2.10 2.05 1.99 1.95 1.90 1.85 1.82 1.78 1. 76 1.72 1.70 1.69
2.15 2.13
~
7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.17 3.09 3.02 2.96 2.86 2.n 2.66 2.58 2.50 2.41 2.36 2.28 2.25 2.19
27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.30 2.25 2.20 2.16 2.13 2.08 2.03 1.97 1.93 1.88 1.84 1.80 1.76 1.74 1. 71 1.68 1.67
W
7.68 5.49 4.60 4.11 3.79 3.56 3.39 3.26 3.14 3.06 2.98 2.93 2.83 2.74 2.63 2.55 2.47 2.38 2.33 2.25 2.21 2.16 2.12 2.10 -..J
VI
Tabla D (contilJuaci6n) VJ
-..I
Puntas de la distribucion F correspondientes a los niveles 0.05 (nurneros claros) y 0.01 (numeros oscuros) 0\
"'"
40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.07 2.04 2.00 1. 95 1.90 1.84
7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.88 2.~ 2.73 2.66 2.56 2.49 2.37
1.79 1. 74 1.69
2.29 2.20 2.11
1. 66 1.61 1.59 1.55 1. 53 I. 51
2.05 1.97 1.94 1.88 1.84 1.81
s
~ ~
I:Il
'"
-0 42 4.07 3.22 2.83 2:59 2.44 2.32 2.24 2.17 2.11 2.06 2.02 1.90 1.94 I. 89 1.82 1. 78 1.73 1.68 1.64 1.60 1.57 1.54 1. 51 1.49
'"0 7.27 5.15 4.29 3.80 3.49 3.26 3.10 2.96 2.86 2.77 2.70 2.64 2.54 2.46 2.35 2.26 2.17 2.08 2.02 1.94 1.91 1.85 1.80 , .78
~
i5 44 4.06 3.21 2.82 2.58 2.43 2.3\ 2.23 2.16 2.10 2.05 2.01 1. 98 1.92 1. 88 1.81 I. 76 1.72 1.66 1.63 1.58 1.56 1.52 1.50 1.48
7.24 5.12 4.26 3.78 3.46 3.24 3.07 2.94 2.84 2.75 2.68 2.62 2.52 2.44 2.32 2.24 2.15 2.06 2.09 1.92 1.88 1. 82 1. 78 1.75
46 4.05 3.20 2.81 2.57 2.42 2.30 2.22 2.14 2.09 2.04 2.00 , .97 1. 91 1.87 1.80 1. 75 1.71 1.65 1.62 1.57 1.54 1.51 1.48 1.46
7.21 5.10 4.24 3.76 3.44 3.22 3.05 2.92 2.82 2.73 2.66 2.60 2.50 2.42 2.30 2.22 2.13 2.04 1.98 1.90 1.86 1.80 1. 76 1.72
48 4.04 3.19 2.80 2.56 2.41 2.30 2.21 2.14 2.08 2.03 1.99 1. 96 1.90 1. 86 1.79 1. 74 1. 70 1.64 1.61 1.56 1.53 1.50 1.47 1.45
7.19 5.08 4.22 3.74 3.42 3.20 3.04 2.90 2.~ 2.71 2.64 2.58 2.48 2.40 2.28 2.20 2.11 2.02 1.96 1.88 1.84 1.78 1.73 1.70
50 4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13 2.07 2.02 1.98 1. 95 1.90 1.85 1. 78 1. 74 1.69 , .63 1.60 1.55 1.52 1.48 1.46 1.44
7.17 5.06 4.20 3.72 3.41 3.18 3.02 2.88 2.78 2.70 2.62 2.56 2.46 2.39 2.26 2.18 2.10 2.00 1.94 1.86 1.82 1. 76 1. 71 1.68
55 4.02 3.17 2.78 2.54 2.38 2.27 2.18 2.11 2.05 2.00 1. 97 1.93 1. 88 1.83 1. 76 1.72 1.67 1.61 1.58 1.52 1.50 1.46 1.43 1.41
7.12 5.01 4.16 3.68 3.37 3.15 2.98 2.85 2.75 2.66 2.59 2.53 2.43 2.35 2.23 2.15 2.06 1.96 1.90 1.82 1. 78 1.71 1.66 1.64
60 4.00 3.15 2.76 2.52 2.37 2.25 2.17 2.10 2.04 1.99 1.95 1.92 1.86 1.81 1. 75 1.70 1.65 1.59 1.56 1.50 1.48 1.44 1.41 1.39
7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.56 2.50 2.40 2.32 2.20 2.12 2.03 1.93 1.87 1.79 1.74 1.68 1.63 1.60
65 3.99 3.14 2.75 2.51 2.36 2.24 2.15 2.08 2.02 1.98 1.94 1.90 1.85 1.80 1.73 1.68 1.63 1.57 1.54 1.49 1.46 1.42 1.39 1.37
7.04 4.95 4.10 3.62 3.31 3.09 2.93 2.79 2.70 2.61 2.54 2.47 2.37 2.30 2.18 2.09 2.00 1.90 1.84 1.76 1. 71 1.64 1.60 1.56
70 3.98 3.13 2.74 2.50 2.35 2.32 2.14 2.07 2.01 1. 97 1.93 1.89 1.84 1.79 1.72 1.67 1.62 1.56 1.53 1.47 1.45 1.40 1.37 1.35
7.01 4.92 4.08 3.60 3.29 3.07 2.91 2.77 2.67 2.59 2.51 2.45 2.35 2.28 2.15 2.07 1.98 1.88 1.82 1.74 1.69 1.62 1.56 1.53
<;
~ 80 3.96 3.11 2.72 2.48 2.33 2.21 2.12 2.05 1.99 1.95 1.91 1.88 1.82 1.77 1.70 1.65 1.60 1.54 1.51 1.45 1.42 1.38 1.35 1.32
c: 6.96 4.88 4.04 3.56 3.25 3.04 2.87 2.74 2.64 2.55 2.48 2.41 2.32 2.24 2.11 2.03 1.94 1.84 1. 78 1.70 1.65 1.57 1.52 1.49
'E
0
~ 100 3.94 3.09 2.70 2.46 2.30 2.19 2.10 2.03 1.97 1.92 1.88 1.85 1.79 1.75 1.68 1.63 1.57 1.51 1.48 1.42 1.39 1.34 1.30 1.28
a; 6.90 4.82 3.98 3.51 3.20 2.99 2.82 2.19 2.59 2.51 2.43 2.36 2.26 2.19 2.06 1.98 1.89 1.79 1.73 1.64 1.59 1.51 1.46 1.43
c:
~ 125 3.92 3.07 2.68 2.44 2.29 2.17 2.08 2.01 1.95 1.90 1.86 1.83 1.77 1.72 1.65 1.60 1.55 1.49 1.45 1.39 1.36 1.31 1.27 1.25
. 6.84 4.78 3.94 3.47 3.17 2.95 2.79 2.65 2.56 2.47 2.40 2.33 2.23 2.15 2.03 1.94 1.85 1.75 1.68 1.59 1.54 1.46 1.40 1.37
"'"
.c
'-= 150 3.91 3.06 2.67 2.43 2.27 2.16 2.07 2.00 1.94 1.89 1.85 1.82 1.76 1. 71 1.64 1.59 1.54 1.47 1.44 1.37 1.34 1.29 1.25 1.22
'"
-0 6.81 4.75 3.91 3.44 3.13 2.92 2.76 2.62 2.53 2.44 2.37 2.30 2.20 2.12 2.00 1.91 1.83 1.72 1.66 1.56 1.51 1.43 1.37 1.33
8
~200 3.89 3.04 2.65 2.41 2.26 2.14 2.05 1.98 1.92 1.87 1.83 1.~ 1.74 1.69 1.62 1.57 1.52 1.45 1.42 1.35 1.32 1.26 1.22 1.19
i5 6.76 4.71 3.38 3.41 3.11 2.90 2.73 2.60 2.50 2.41 2.34 2.28 1.17 2.09 1.97 1.88 1.79 1.19 1.62 1.53 1.48 1.39 1.33 1.28
-l
400 3.86 3.02 2.62 2.39 2.23 2.12 2.03 1.91, 1.90 1.85 1.81 1.78 1.72 1.67 1.60 1.54 1.49 1.42 1.38 1.32 1.28 1.22 1. 16 1.13 :>
6.70 4.66 3.83 3.36 3.06 2.85 2.19 2.55 2.46 2.37 2.29 2.23 2.12 2.04 1.92 1.84 1.74 1.64 1.57 1.47 1.42 1.32 1.24 1.19 I:li
e
:>
1000 3.85 3.00 2.61 2.38 2.22 2.10 2.02 1.95 1.89 1.84 1.~ 1.76 1.70 1.65 1.58 1.53 1.47 1.41 1.36 1.30 1.26 1. 19 1.13 1.08 I:Il
6.66 4.62 3.80 3.34 3.04 2.82 2.66 2.53 2.43 2.34 2.26 2.20 2.09 2.01 1.89 1.81 1. 71 1.61 1.54 1.44 1.38 1. 28 1.19 1.11
ex. 3.84 2.99 2.60 2.37 2.21 2.09 2.01 1.94 1.88 1.83 1.79 1.75 1.69 1.64 1.57 1.52 1.46 1.40 1.35 1.28 1.24 1. 17 1.11 1.00 VJ
6.64 4.60 3.78 3.32 3.02 2.~ 2.64 2.51 2.41 2.32 2.24 2.18 2.07 1.99 1.87 1.79 1.19 1.59 1.52 1.41 1.36 1.25 1.15 1.00 -..I
-..I
Tabla n, Yo)
-.l
Valores criticos de F que corresponden al 2.5 % superior y al 2.5 % inferior de las distribuciones F 00
Una diferencia en las varianzas es significativa al nivel n = 0.05, con gil y gIl' si es igual 0 mayor que el valor superior en cad a casilia 0 si es igual 0 menor
que el valor inferior en esa casilla. Por ejemplo, si §i = 8.69, gl = 12 y §~ = 2.63, gl = 9, F = 3.30. Los valores criticos para gIll y gig son 0.291 y 3.87. tTl
Puesto que la F obtenida esta comprendida entre estos valores, no podemos rechazar la hipotesis de la homogeneidad de las varianzas. Nota: Si hubierarnos ~
calculado F con §1 en el denominador, los valores criticos inferior y superior para 9 y 12 gl habrian sido 0.259 y 3.44. ;I>
eJ\ 0
"(j'j'
91 2 3 4 5 6 7 8 9 10 11 12 15 20 24 30 40 50 60 100 200 500
...,
n
;I>
r.c'\") .002 .026 .057 .082 .100 .113 .124 .132 .139 .144 .149 .153 .161 .1W .175 .180 .184 .187 .189 .193 .196 .198 -e
'Vi 1 648 800 864 900 922 937 948 957 963 969 973 977 985 993 997 1000 1010 1010 1010 1010 1020 1020 ;I>
:0=
;I>
.001 .026 .062 .094 .119 .138 .153 .165 .175 .183 .190 .196 .210 .224 .232 .239 .247 .251 .255 .261 :266 .269 r
;I>
2 38.5 39.0 39.2 39.2 39.3 39.3 39.4 39.4 39.4· 39.4 39.4 39.4 39.4 39.4 39.5 39.5 39.5 39.5 39.5' 39.5 39.5 39.5 tn
o
3
.001
17.4
.026
16.0
.065
15.4
.100
15.1
.129
14.9
.152
14.7
.170
14.6
.185
14.5
.197
14.5
.207
14.4
.216
14.4
.224
14.3
.241
14.3
.259
14.2
.269
14.1
.279
14.1
.289
14.0
.295
14.0
.299
14.0
.308
14.0
.314
13.9
.318
13.9 ~
;;
tn
.001 .026 .066 .104 .135 .161 .181 .198 .212 .224 .234 .243 .263 .284 .296 .308 .320 .327 .332 .342 .351 .356 tn
4 12.2 10.6 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84 8.79 8.75 8.66 8.56 8.51 8.46 8.41 8.38 8.36 8.32 8.29 8.27 o
o
.001 .025 .067 .107 .140 .167 .189 .208 .223 .236 .248 .257 .280 .304 .317 .330 .344 .353 .359 .370 .380 .386
sr
5 10.0 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62 6.57 6.52 6.43 6.33 6.28 6.23 6.18 6.14 6.12 6.08 6.05 6.03
gJ
.001 .025 .068 .109 .143 .172 .195 .215 .231 .246 .258 .268 .293 .320 .334 .349 .364 .375 .381 .394 .405 .415
6 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46 5.41 5.37 5.27 5.17 5.12 5.07 5.01 4.98 4.96 4.92 4.88 4.86
.001 .025 .068 .110 .146 .176 .200 .221 .238 .253 .266 .277 .304 .333 .348 .364 .381 .392 .399 .413 .426 .433
7 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76 4.71 4.67 4.57 4.47 4.42 4.36 4.31 4.28 4.25 4.21 4.18 4.16
.001 .025 .069 .111 .148 .179 .204 .226 .244 .259 .273 .285 .313 .343 .360 .377 .395 .407 .415 .431 .442 .450
8 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30 4.24 4.20 4.10 4.00 3.95 3.89 3.84 3.81 3.78 3.74 3.70 3.68
.001 .025 .069 .112 .150 .181 .207 .230 .248 .265 .279 .291 '.320 .352 .370 .388 .408 .420 .428 .446 .459 .467
9 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96 3.91 3.87 3.77 3.67 3.61 3.56 3.51 3.47 3.45 3.40 3.37 3.35
.001 .025 .069 .113 .151 .183 .210 .233 .252 .269 .283 .296 .327 .360 .379 .398 .419 .431 .441 .459 .474 .483
10 6.94 5.46 4.B3 4.47 4.24 4.07 3.95 3.B5 3.7B 3.72 3.66 3.62 3.52 3.42 3.37 3.31 3.26 3.22 3.20 3.15 3.12 3.09
.001 .025 .069 .114 .152 .185 .212 .236 .256 .273 .288 .301 .332 .368 .386
.407 .429 .442 .450 .472 .485 .495
.001 .025 .070 .114 .153 .186 .214 .238 .259 .276 .292 .305 .337 .374 .394
.416 .437 .450 .461 .481 .498 .508
.001 .025 .070 .116 .156 .190 .219 .244 .265 .284 .300 .315 .349 .389 .410
.001 ,025 .071 .117 .158 .193 .224 .250 .273 .292 .310 .325 .363 .406 .430
.001 .025 .071 .117 .159 .195 .227 .253 .277 .297 .315 .331 .370 .415 .441 .468
.001 .025 .071 .118 .161 .197 .229 .257 .281 .302 .321 .337 .378 .426 .453
.001 .025 .071 .119 .162 .199 .232 .260 .285 .307 .327 .344 .387 .437 .466
.001 .025 .072 .120 .165 .204 .238 .268 .295 .318 .340 .359 .406 .464 .498
Yo)
1.69 1.61 1.56 1.53 1.45 1.39 1.34 -.l
120 5.15 3.80 3.23 2.89 2.67 2.52 2.39 2.30 2.22 2.16 2.10 2.05 1.95 1.82 1.76 \0
380 ESTADfSTICA PARA LAS CfENCIAS SOCIALES TABLAS 381
Tabla E Tabla F
Para cualquier valor de N - I, la tabla indica los valores de A correspondientes a diferentes niveles de
probabilidad. A es significativa a un nivel dado si es igual 0 menor que el valor indicado en 1a tabla. r z r z r zr
r r
2
Ejemplo: si ID = 60, (ID)2 = 200, (1. = 0.05, prueba bilateral, y N - I = 28, A = 0.300. Puesto
que este valor no es igual 0 menor que 0.265, requerido para el rechazo de H 0' no pod emos rechazar la . .01 .010 .34 .354 .67 .811
hipotesis nula.
.02 .020 .35 .366 .68 .829
Nivel de significaci6n para una prueba unilateral
.03 .030 .36 .377 .69 .848
.05 .025 (
.01 .005 .0005 .04 .040 .37 .389 .70 .867
Nivel de significaci6n para una prueba bilateral
.05 .050 .38 ,400 .71 .887
N-I* .10 .05 .02 .01 .001 N-l* .06 .060 .39 .412 .72 .908
1 0,5125 0.5031 0.50049 0.50012 0.5000012 1
2 0.412 0.369 0.347 0.340 0.334 2
t .07 .070 .40 .424 .73 .929
3 0.385 0.324 0.286 0.272 0.254
4 0.376 0.304 0.257 0.238 0.211
3
4
.08 .080 .41 .436 .74 .950
5 0.372 0.293 0.240 0.218 0.184 _ 5 .09 .090 .42 .448 .75 .973
6 o.ao 0.286 0.230 0.205 0.167
7 0.369 0.281 0.222 0.196 0.155
6
7
.10 .100 .43 .460 .76 .996
8 0.368 \ 0.278 0.217 0.190 . 0.146 8 .11 .110 .44 .472 .77 1.020
9 0.368 0.276 0.213 0.185 0.139 9
10 0.368 0.274 0.210 0.181 0.134 10 .12 · 121 .45 .485 .78 1.045
11 0.368 0.273 0.207 0.178 0.130
12 0.368 0.271 0.205 0.176 0.126
11
12
.13 · 131 .46 .497 .79 1.071
13 0.368 0.270 0.204 0.174 0.124 13
14 0.368 0.270 0.202 0.172 0.121 14
.14 .141 .47 .510 .80 1.099
15 0.368 0.269 0.201 o.rn 0.119 15 .15 .48 .523 .81 1.127
· 151
16 0.368 0.268 0.200 0.169 0.117 16
17 0.368 0.268 0.199 0.168 0.116 17 .16 •161 .49 .536 .82 1.157
18 0.368 0.267 0.198 0.167 0.114 18
19 0.368 0.267 0.197 0.166 0.113 19 .17 .172 ;50 .549 .83 1. 188
20 0.368 0.266 0.197 0.165 0.112 20
.18 .181 .51 .563 .84 1.221
21 0.368 0.266 0.196 0.165 0.111 21
22 0.368 0.266 0.196 0.164 0.110 22 .19 .192 .52 .577 .85 1.256
23 0.368 0.266 0.195 0.163 0.109 23
24 0.368 0.265 0.195 0.163 0.108 24 .20 .203 .53 .590 .86 1.293
25 0.368 0.265 0.194 0.162 0.108 25
.21 .214 .54 .604 .87 1.333
26 0.368 0.265 0.194 0.162 0.107 26
27 0.368 0.265 0.193 0.161 0.107 27 .22 .224 .55 .618 .88 1.376
28 0.368 0.265 0.193 0.161 0.106 28
29 0.368 0.264 0.193 0.161 0.106 29 .23 .234 .56 .633 .89 1.422
30 0.368 0.264 0.193 0.18:> 0.105 30
.24 .245 .57 .648 .90 1.472
40 0.368 0.263 0.191 0.158 0.102 40
8:> 0.369 0.262 0.189 0.155 0.099 8:> .25 .256 .58 .663 .91 1.528
120 0.369 0.261 0.187 0.153 0.095 120
o: o.an 0.28:> 0.185 0:151 0.092 o: .26 .266 .59 .678 .92 1.589
..N = nurnero de parejas. .27 .277 .60 ..693 .93 1.658
.28 .288 .61 .709 .94 1.738
.29 .299 .62 .725 .95 1.832
.30 .309 .63 .741 .96 1.946
.31 .321 .64 .758 .97 2.092
.32 .332 .65 .775 .98 2.298
.33 .343 .66 .793 .99 2.647
382 ESTADiSTICA PARA LAS ClENCIAS SOCIALES TABLAS 383
TablaG
Tabla H
Valores criticos de rs
Funciones de r
Un valor dado der, esestadisticamente significativo si es igual 0 mayor que el
v~lor tabulado, de ac~e.rdo con el ?ivel ~ y a la N dada. Para interpolar, r .Jr ,2 ~ ~ 1 - ,2 ~ 100(1 -k) r
s~~ense los valor~s entices q~~ estan encima y debajo de la N de interes y k % Ef.
dividase por 2. As], el valor cnnco al nivel IX = 0.05, prueba bilateral, cuando
N = 21 es (0.450 + 0.428)/2 = 0.439. 1.00 1.0000 1.0000 O.COOO 0.0000 0.0000 0.0000 100.00 1.00
.99 .9950 .9801 .0995 .1000 .0199 .1411 85.89 .99
Nivel de significaci6n para una prueba unilateral .98 .9899 .9604 .1400 .1414 .0396 .1990 80.10 .98
.97 .9849 .9409 .1706 .1732 .0591 .2431 75.69 .97
.05 .025 .01 .005 .96 .9798 .9216 .1960 .2000 .0784 .2800 72.00 .96
Nivel de siqniflcacion para una prueba bilateral
.95 .9747 .9025 .2179 .2236 .0975 .3122 68.78 .95
N' .10 .05 .02 .01 .1164 .3412 65.88 .94
.94 .9695 .8836 .2375 .2449
.93 .9644 .8649 .2551 .2646 .1351 .3676 63.24 .93
5
6
.900
.829
1.000 1.000 - .92 .9592 .8464 .2713 .2828 .1536 .3919 60.81 .92
.886 .943 1.000 .91 .9539 .8281 .2862 .3000 .1719 .4146 58.54 .91
7 .714 .786 .893 .929
8 .643 .738 .833 .881 .4359 56.41 .90
.90 .9487 .8100 .3000 .3162 .1900
9 .600 .683 .783 .833 54.40 .89
.89 .9434 .7921 .3129 .3317 .2079 .4560
10 .564 .648 .746 .794 .4750 .88
.88 .9381 .7744 .3250 .3464 .2256 52.50
12 .506 .591 .712 .777 .87
.87 .9327 .7569 .3363 .3606 .2431 .4931 50.69
14 .456 .544 .645 .715 .86
.86 .9274 .7396 .3470 .3742 .2604 .5103 48.97
16 .425 .506 .601 .665
18 .399 .475 .564 .625 .2775 .5268 47.32 .85
20
22
.377 , .450 .534 .591
.85
.84
.9220
.9165
.7225
.7056
.3571
.3666
.3873
.4000 .2944 .5426 45.74 .84
.359 .428 .508 .562 .3111 .5578 44.22 .83
24 .83 .9110 .6889 .3756 .4123
.343 .409 .485 .537 .3276 .5724 42.76 .82
26 .82 .9055 .6724 .3842 .4243
.329 .392 .465 .515 .3923 .4359 .3439 .5864 41.36 .81
28 .81 .9000 .6561
.317 .377 .448 .496
30 .306 .364 .432 .478 .80 .8944 .6400 .4000 .4472 .3600 .6000 40.00 .80
.79 .8888 .6241 .4073 .4583 .3759 .6131 38.69 .79
• N = numero de parejas. .78 .8832 .6084 .4142 .4690 .3916 .6258 37.42 .78
.77 .8775 .5929 .4208 .4796 .4071 .6380 36.20 .77
.76 .8718 .5776 .4271 .4899 .4224 .6499 35.01 .76
Tabla II
Tabla H (colltinuacion) Valores criticos de U y de U' para una prueba unilateral al nivel ex = 0.005 0 para una prueba
cado en la tabla. La U' obtenida debe ser igual 0 mayor que el valor indicado en la tabla.
k % Ef. Ejemplo: Si cx = 0.01, prueba bilateral, N I = 13, N 2 = 15 Y se ha obtenido U = 150, no se
.50 .7071 .2500 .5000 .7071 .7500 .8660 13.40 .50 puede rechazar H o porque la U obtenida esta dentro de los valores criticos superior (153)
.49 .7000 .2401 .4999 .7141 .7599 .8717 12.83 .49 e inferior (42).
.48 .6928 . 2304 .4996 .7211 .7696 .8773 12.27 .48
.47
.46
.6856
.6782
.2209
.2116
.4991
.4984
.7280
.7348
.7791
.7884
.8827
.8879
11. 73
11.21
.47
.46 ~ I 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
.45 .6708 .2025 .4975 .7416 .7975 .8930 10.70 .45
.44 .6633 .1936 .4964 .7483 .8064 .8980 10.20 ,44
.43
.42
.6557
.6481
.1849
.1764
.4951
.4936
.7550
.7616
.8151
.8236
.9028
.9075
9.72
9.25
.43
.42
2 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 0 0
.41 .6403 .1681 .4918 .7681 .8319 .9121 8.79 .41 -38 -40
.40 .6325 .1600 .4899 .7746 .8400 .9165 8.35 .40 3 -- -- -- -- -- -- -- -- 0 0 0 1 1 1 2 2 2 2 3 3
.39 .6245 .1521 .4877 .7810 .8479 .9208 7.92 .39 27 ~ 33 35
-38 -41 -43 -46 -49 -52 54
- 57
.38 .6164 .1444 .4854 .7874 .8556 .9250 7.50 .38
.37 .6083 .1369 .4828 .7937 .8631 .9290 7.10 .37 4 -- -- -- -- -- 0 0 1 1 2 2 3 3 4 5 5 6 6 7 8
.36 .6000 .1296 .4800 .8000 .8704 .9330 6.70 .36 ~ 28 31 ~ -38 42
- -45 -49 52
-
55
-59 -62 -66 -69 72
.35 .5916 .1225 .4770 .8062
.8124
.8775 .9367
.9404
6.33 .35
.34
5 -- -- -- -- 0 1 I 2 3 4 5 6 7 7 8 9 10 11 12 13
.34
.33
.5831
.5745
.1156
.1089
.4737
.4702 .8185
.8844
.8911 .9440
5.96
5.60 .33 -25 -29 34
-
38
- -42 -46
50
- -54 -58 -63 -67 -71 75
- -79 -83 -87
.32 .5657 .1024 .4665 .8246 .8976 .9474 5.25 .32
.31 .5568 .0961 .4625 .8307 .9039 .9507 4.93 .31 6 -- -- -- 0 1 2 3 4 5 6 7 9 10 11 12 13 15 16 17 18
-24 -29 -34 -39 -44 -49 54
- -
59
-63 -68 -73 -78 -83 87
- -92 -97 -102
.30 .5477 .0900 .4583 .8367 .9100 .9539 4.61 .30
.29 .5385 .0841 .4538 .8426 .9159 .9570 4.30 .29 7 -- -- -- 0 1 3 4 6 7 9 10 12 13 15 16 18 19 21 22 24
.28 .5292 .0784 .4490 .8485 .9216 .9600 4.00 .28 -28 -34 -39 45
- -50 -56 -61 67
- -72 -78 -83 89
- -94 100 105 -111
- -116
.27 .5196 .0729 .4440 .8544 .9271 .9629 3.71 .27
.26 .5099 .0676 .4386 .8602 .9324 .9656 3.44 .26 8 -- -- -- I 2 4 6 7 9 II 13 15 17 18
94
20 22 24 26 28 30
106 112 118 -124 -130
.0625 .4330 .8660 .9375 .9682 3.18 .25 -31 -38 -44 -50 -57 -63 69
- -75
81
- -87 - -100 - -
.25 .5000
.24
.23
.4899
.4796
.0576
.0529
.4271
.4208
.8718
.8775
.9424
.9471
.9708
.9732
2.92
2.68
.24
.23
9 -- -- 0 1 3 5 7 9 11 13 16 18 20 22
97 104
24 27 29 31
111 117 124 131
33 36
138 144
.22 .4690 .0484. .4142 .8832 .9516 .9755 2.45 .22
27 35 42
- - - -49 -56 -63 -70' -77 -83 -90 - - - - - -
.21 .4583 .0441 .4073 .8888 .9559 .9777 2.23 .21
10 -- -- 0 2 4 6 9 11 13 16 18 21 24 26 29
151 158
31 34 37 39 42
.20 .4472 .0400 .4000 .8944 .9600 .9798 2.02 .20 -30 -38 -46 -54 -61 -69 -77 -84 -92 -99 -106 -114 -121 -129 -136 -143 - -
.19 .4359 .0361 .3923 .9000 .9639 .9818 1.82 .19
.18 .4243 .0324 .3842 .9055 .9676 .9837 1.63 .18 11 -- -- 0 2 5 7 10 13 16 18 21 24 27 30 33 36 39 42 45 48
132 140 148 156 -164 -172
.17 .4123 .0289 .3756 .9110 .9711 .9854 1.46 .17
.16
33 42 50
- - - 59
- 67
- 75
- -83 -92 -100 -108 -116 124
- - - - -
.16 .4000 .0256 .3666 .9165 .9744 .9871 1. 29
12 -- -- 3 6
I 9 12 15 18 21 24 27 31 34 37 41 44 47 51 54
169 -177 186
.15
.14
.3873
.3742
.0225
.0196
.3571
.3470
.9220
.9274
.9775
.9804
.9887
.9902
1. 13
.98
.15
.14
35 45 54
- - 63
- -72 -81 -90
143 151
-99 -108 -117 -125 -134 - - -160 - -
.0169 .3363 .9327 .9831 .9915 .85 .13
.13
.12
.3606
.3464 .0144 .3250 .9381 .9856 .9928 .72 .12 13 -- -- I 3 7 10 13 17 20 24 27 31 34 38
125 -125 144
42 45 49 53 56 60
153 163 172 -181 -191 -200
.11 .3317 .0121 .3129 .9434 .9879 .9939 .61 .11
38 49 58
- - - -68 -78 -87 -97 -106 -116 - - - -
.10 .3162 .0100 .3000 .9487 .9900 .9950 .50 .10 '14 -- -- I 4 7 11 15 18 22 26 30 34 38 42 46 50 54 58 63 67
.09 .3000 .0081 .2862 .9539 .9919 .9959 .41 .09 41 52 63 73 83 94 104 114 124
- -
134 144 -154
- - - 164 174
-- -184 -194 203
-
213
-
.08 .2828 .0064 .2713 .9592 .9936 .9968 .32 .08
.07 .2646 .0049 .2551 .9644 .9951. .9975 .25 .07 15 -- -- 2 5 8 12 16 20 24 29 33 37 42 46
153 164
51 55 60 64 69 73
174 185 -195 206 216 227
.06 .2449 .0036 .2375 .9695 .9964 .9982 .18 .06
-43 -55 -67 -78 -89 -100 111 121 132
- - -143 - - - -
.05 .2236 .0025 .2179 .9747 .9975 .9987 .13 .05 16 -- -- 2 5 9 13 18 22 27 31 36 41 45 50 55 60 65 70 74 79
.04 .2000 .0016
.0009
.1960 .9798
.9849
.9984
.9991
.9992
.9995
.08
.05
.04
.03 -46 -59 -71 -83 -94 -106 -117 -129 140
-
196 207 218
-151 -163 -174 -185 - - - 230
- -241
.03 .1732 .1706
.0004 .1400 .9899 .9996 .9998 .02 .02
.02 .1414
.0001 .0995 .9950 .9999 .9999 .01 .01 17 -- -- 2 6 10 15 19 24 29 34 39 44 49 54 60 65 70 75 81 86
.01 .1000
-49 -62 -75 -87
100 112 124 148 148
- - - - -160 -172 -184 -195 207
- -219 -231 -242 -254
.00 .0000 .0000 .0000 1.0000 1.0000 1.0000 .00 .00
18 -- -- 2 6 11 16 21 26 31 37 42 47 53
218
58 64 70 75 81 87 92
231 -243 255 268
-52 66 79
- - -92 105
-118 -131 -143 -156 -169 -181 -194 -206 - - -
19 -- 0 3 7 12 17 22 28 33 39 45 51
151 164 177
56 63
191 203
69 74 81 87 93 99
216 230 242 -255 268 281
38 54 69 83
- - - - 97
- -111 -124 -138 - - - - - - -
20 -- 0 3 8 13 18 24 30 36 42 48 54 60 67 73 79 86 99 105 92
116 130 144 158 172 186 200 ~ 227 241 -254 -268 281 -295
-40 57
-72 87 102
- - - - - - -
TAB LAS 387
386 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
Tabla 12
Tabla 13
Valores criticos de U y de U' para una prueba unilateral al nivel IX = 0.01 0 para una prueba Valores criticos de U y U' para una prueba unilateral al nivel IX = 0.025 0 para una prueba
bilateral al nivel x = 0.02. bilateral al nivel IX = 0.05.
Dados N 1 Y N 2, para que sea significativa: la U obtenida debe ser igual 0 menor que el valor Dados N, y N 2
, para que sea significativa: la U obtenida debe ser igual 0 menor que el valor
indicado en la tabla. La U' obtenida debe ser igual 0 mayor que eJ valor indicado en la tabla.
indicado en la tabla. La U' obtenida debe ser igual 0 mayor que el valor indicado en la tabla.
~
N, 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
~
N, 1 2 3
4 5 6 7 8 9 10 11 12 13 14 IS 16 17 18 19 20
-- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
I
-- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 1
2
-- -- -- -- -- -- -- -- .- -- -- -- 0 0 0 0 0 0 1
2
-- -- -- -- -- -- -- 0 0 0 0 1 1 I 1 1 2 2 2 2
26 28 30 32 34 36 37
I
39
16 lB
- -20 -22 23
- -25 -27 -29 31
-
32
-
34
- -36 -
38
- - - - - - -
7 7 8
3
-- -- -- -- -- -- 0 0 I 1 1 2 2 2 3 3 4 4 4 5
3
-- -- -- -- 0 I 1 2 2
3 3 4 4 5 5 6 6
52
21 24 26 29 32 34 37 40 42 45 47 50 52
55 .
15
-17 20
- 22
- 25
- -27 30
- -32 -35 37 -40 42
-
45
- -47 -50
- - - - - - - - - - - - - I
4
-- -- -- -.. 0 I 1 2 3 3 4 5 5 6 7 7 8 9 9
4
-- -- -- I 0 ! 1 2 3 4 4 5 6
7 8 9 10 11 11 12 13
63
\ 3
33 40
10
I\ - 16 ,'19
-
22
- 25
-
28
-32 35
- -38 -41 44
-
47
- -50 -53 57
-
60
- 67
20
-
23
-,
27
-
30
- --
37
- - 43
- 47
- 50
-
53
- 57
- ~ 63
-
67
- 70
-"
-,
13 14 15 17 18 \9 20
5
_. -- -- 0 I 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
5
-- -- 0 1 2 3 5 6 7 8
9 11 12
72 76 80
20 24 28 32 36 40 44 48 52 56 60 64 68 72 76 80 84
15
- 19
- -23 -27 -30 34
-
38
-
42
- -46 -49 53
-
57
- -61 65
- -68 -
- - - - - - - - - - - - - - - -
17 19 21 22 24 25 27
6
-- -- -- 1 2 3 4 6 7 8 9 . 11
12 13 15 \6 18 19 20 22
6
-- -- I 2 3 5 6 8 10 11 13 14 16
62 67 71 75 80 84 89 93
31 I~-~ 44 49 53 58
23 28 38 42 47 52 -17 22 -27 - - - - - - - - - - -
- - ;£ - - - - -57 --61 66 71
-
75
- 80
- 84
- 89
- 94
- - 93
7 -- -- 0 1 3 4 6 7 9 11 12 14 16 17 19 21 23 24 26 28
7
-- -- I 3 5 6
_41
B 10 12 14 16 18 20 22
76
24
81
26
-86
28
91
30
96
32
101
-106
34
2\ 27 32 38 43 49
- 54 59 65 70 75 81 86 91 96 102 107 112
-20 -25 -30 36 46 51
- -56 -61 -66 -71 - - - - -
- - - - - - - - - - - - - - - - t/7'>{-\ 19 22 24 26
29 3\ 34 36 3B 41
8
-- -- 0 2 4 6 7 9 11 13 15 17 20 22 24 26 28 30 32 34
8
-- 0 2 4 6 81i111O(P13
\~
15 17
91
-97 -102 -108 111 119
24 30 36
- 42 49 55 61 67 73 79 84 90 96 102 108 \ 14 120 126
.. 16 22
- 28 34
- 40 \' '46' 1{)51
\'\~;~~~t- -63 69
- -74 -80 -
86
-
- - - - - - - - - - - - - - - - - - -
20 23
26 28 31 34 37 39 42 45 48
9 -- -- I 3 5 7 9 II 14 16 18 21 23 26 28 31 33 36 38 40
9
-- 0 2 4 7 10 12" 15 17
126
26 33 40 47 54 61 67 74 81 87 94 100 107 113 \20 126 133 140
18
-25 51
-32 -38 -44 - -57 64
- -70 -76 -82 -89 -95 -
101 107
-
114
-
120
- -132
- - - - - - - - - - - - - - - - - - -
55
10 -- -- I 3 6 8 11 .13 16 19 22 24 ?7 30 33 36 38 41 47
44 10 -- 0 3 5 8 11 14 17 20 23 26 29
33 36 39 42
118
45
125
48
132
52
138 145
29
- 37
-
44
- 52
-
59
-
67
-- 74
- -- 81 88
-
96
- 103
-
110
- 117 124
-- -
132
-
139
- -146 -153
20
- -
27 35
- 42
- 49
-
56
- -63 70
- 77
- - 84 91
- -97 104
- -111 - -
- -
30 33
37 40 44 47 51 55 58 62
11 -- .- 1 4 7 9 12 15 18 i2 25 28 31 34 37 41 44 47 50 53
11 -- 0 3 6 9 13 16 19 23 26
121 136 143 151 158
40 81 22
- -30 38
- 46
- 53
- - 61
- 69 76
-
84 91
- -99 106
-
114
- - -129 - - -
32
- - -48 57
-
65
-
73
- _.
88
- 96
-
104
- 112
-- 120
- -
128 135
- -
143 151
- 159 167
-
37 41
45 49 53 57 61 65 69
12 -" -- 2 5 8 II 14 17 21 24 28 31 35 38 42 46 49 53 56 60
12 -- I 4 7 11 14 18 22 26 29 33
34 43 52 61 70 79 87 96 \04 113 121 130 138 146 155 163 180
23 32
-
41
- 49
- 58
- 66
-74 82
-91 -99
107
-
115 -123 131
-
139 147
- -155 -163 -171
- - - - - - - - - -- - - - - - -
172
- - 63 67 72 76
13 -- 0 2 5 9 12 16 20 23 27 31 35 39 43 47 51 55 59 63 67
13 -- I 4 8 12 16 20 24 28
89
33
97
37
41
106 \15
45
124
50
132
54
141
59
149 158 167 -175 184
26
-
37
-
47
-
56
-
66
- 75
- 84
-
94
-
103
-
112
-- 121
-
130
-
139
- 148 157
-
166
-
175
-
184 193
- -
25
- - 35
-44 -53 -62 71
- -80 - - - - - - - - - -
40
45 50 55 59 64 67 74 78 83
14 -- 0 2 6 10 13 17 22 26 30 34 38 43 47 51 56 60 65 69 73
14 -- I 5 9 13 17 22 26 31 36
151 -160 171 178 188 197
15 -- 0 3 7 11 15 19 24 28 33 37 42 47 51 56 61 66 70 75 80
15 - I 5 10 14 19 24 29 34 39
30 42 53 64 75 86 96 107 117 128 138 148 159 169 179 189 200 210 220
81
-29 -40 -50 -61 -71 -
121 131
-91 -101 -111 - - 141 151 161 170
- - - - -
180
-190 -200 -210
16 --
-
0
-
3 7
- -
12
-
16
-
21 26
- --
31
-
36
-
41 46 51
- -
56
. -
61
-
66 71
- -
76
-
B2 87
-
16 -- I 6 11 15 21 26 31
97
37
107
42 47
118 -129
53
139
59 64
70 75
149 -160 -\70 -181
81
.!2.!. -202
86 92
212
98
222
32
- -45 -57 68 80 91 102
-
113 124 135 ~ -157
-
168
-
179 190 -201
- uz 222 233
-31 -42 -53 ~ -75 -86 - -
45 51 57 63
67 75 81 87 93 99 105
17 -- 0 4 8 13 18 23 28 33 38 4449 55 60 66 71 77 82 88 93
17 -- 2 6 11 17 22 28 34 39
147 158 -17\ 180 191 202 213 224 235
18 -- 0 4 9 14 19 24 30 36 41 47 53 59 65 70 76 82 88 94 \00
18 -- 2 7 12 18
24 30 36 42 48 55 61 67 74 80 86
36 50 63 76 89 102 114 126 139 15\ 163 175 187 200 212 224 236 248 260
-
34
-47 60
-
72 84
- - 96
- 108
- -
120 132
- -
143
-
155 167
-
178 190 202 213
- - - -
225
-
236
- 248
- - - - - - - - - - - - - - - - - - -
106 113 119
19 -- I 4 9 15 20 26 32 38 44 50 56 63 69 75 82 88 94 101 107
19 -- 2 7 13 19 25 32
101
38
114
45
126
52
138
58
151
65
163
72
175
78
188
85
92
200 -212
99
224 236 248 261
37 53 67 80 94 107 120 133 146 159 172 184 197 210 272 235 248 260 273
36 50 63 76 89
- - - - -
- - - -
- - - - - - - - - - - - - - - - - - - - - - - - - -
119 127
39
- 55
- 70
- 84 98
- - 112
- 126
-
140
-
153 167
- --
180
-
193 207
-
220 233
- -
247
-
260
- -
273 286
38
-
52
- 67
- -80
-93 -106 -
119 \32
-
145
-
158
-
171
- -
184 197 -210
- -
222
-235 -248 -261
(Los gulones en el cuerpo de la tab\a indican la imposibilidad de tomar una decisi6n al nivel de significaci6n indlcado.]
(Los quionas en 81 cuerpo de la tabla indican la imposibilidad de tamar una decisi6n al nival de significaci6n indicado.)
TABLAS 389
388 ESTADfsTICA PARA LAS CIENCIAS SOCIALES
Tabla 14
Tabla J
Valores criticos de U y de U' para una prueba unilateral al nivel C( = 0.05 0 para una prueba Valores criticos de T
bilateral al nivel C( = 0.1O. El simbolo T representa la surna men or de rangos asociados con diferencias que tienen todas el mis~o
Dados N 1 Y N 2, para que sea significativa: la U obtenida debe ser igual 0 menor que el valor rango. Para cualquier N dado (mirnero de diferencias ordenadas de acuerdo a su rango), la T obtenida
indicado en la tabla. La U' obtenida debe ser igual 0 mayor que el valor indicado en la tabla.
es significativa a un nivel dado si es igual 0 rnenor que el valor indicado en la tabla. Todas las entradas
de la tabla se refieren al valor absoluto de T.
~1
N, I 2 3 4 5 6 7 8 9 10 II 12 13 14 15 16 17 18 19 20
2
-- -- -- -- a a a I 1 1 1 2 2 2 3 3 3 4 4 4
Nive\ de slqnificacion para una prueba bilateral
Nivel de siqnificaclon para una prueba bilateral
10
- -12 14
- -15 17
-19 -21 -22 -24 26
- -27 -29 31
-
32
- 34
- -
36
3
-- -- a a I 2 2 3 3 4 5 5. 6 7 7 8 9 9 10 II
~ -12 -14 16
-
19
-
21
-
24
-
26 28
-
31
-33 35
- 38
-
40
-
42
- 45
-
47
- 49
5
a -- -- -- 28
130
116
101
91
6
2
0
-- -- 29
140
126
110
100
4
-- -- a I 2 3 4 5 6 7 8 9 10 II 12 14 15 16 17 18
2
0
-- 30
151
137
120
109
21 42 7
3
-
3
1
a 31
163
147
130
118
8
5
140
128
5
-- a I 2 4 5 6 8 9 II 12 13 15 16 18 19 20 22 23 25
9
8
5
3
1
32
175
159
10 14 18 21 29 32 36 39 43 47 50 54 57 61 65 68 72 75
- - - - 25
- - - - - - - - - - - - - - 10
10
- 8 5
3
33
187
170
151
138
200
182
162
148
6
-- a 2 3 5 7 8 10 12 14 16 17 19 21 23 25 26 28 30 32
11
13
10
7
5
34
12 16 21 25 29 34 38 42 46 50 55 59 63 67 71 76 "80 84 88
213
195
173
159
- - - - \- - - - - - - - - - 12
17
13
9
7
35
227
208
185
171
36
7
-- a 2 4 6 8 11 13 15 17 19 21 24 26 28 30 33 35 37 39
13
21
17
12
9
-n
14 19 24 29 34 38 43 48 53 58 63 67 77 82 86 91 96 101
241
221
198
182
- - - - - - - - - - - - - - - - - - 14
25
21
15
12
37
235
211
194
19
15
38
256
8
-- I 3 5 8 10 13 15 18 20 23 26 28 31 33 36 39 41 44 47
15
30
25
249
224
207
-ss 39
271
-60
15 21 27 32 38 43 49 54 76 81 87 92 97 103 113
- - - - - - - 70
- - - - - 108
- - 16
35
29
23
19
40
286
264
238
220
17
41
34
27
23
9
-- I 3 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54
41
302
279
252
233
32
27
17
- 24
- 30
- 36 42
-
48
- 54
- -60 -66 72
- 78
- 84
- -90 96
- 102
-
108
- 114
-
120
-
126
- 18
47
40
42
319
294
266
247
19
53
46
37
32
10
-- I 4 7 II 14 17 20 24 27 31 34 37 41 44 48 51 55 58 62
52
43
37
43
336
310
281
261
20
60
19
-
26
-
33
-
39
-- - 46 53
- -60 -66 73
-
79
- 86
-
93
- 99
- 106
- 112
-
119
-
125
-
132
-
138
- 49
42
44
353
327
296
276
21
67
58
11
-- 5 8 12 16 19 23 27 31 34 38 42 46 50 54 57 61 65 69
371
343
312
291
I 65
55
48
45
22
75
21
- 28
- 36
-
43
- 50
- 58
- -es 72
- 79
- 87
- 94
-
101
-
108 115
-
122
-
130
-
137
-
144
-
151
- 23
83
73
62
54
46
389
361
328
307
407
378
345
322
12
-- 2 5 9 13 17 21 26 30 34 38 42 47 51 55 60 64 68 72 77
24
91
81
69
61
47
22
-
31
- - - - 63
- - - - - - - - - - - 25
100
89
76
68
48
426
396
362
355
49
446
415
379
13
-- 2 6 10 15 19 24 28 33 37 42 47 51 56 61 es 70 75 80 84
26
110
98
84
75
24 33 42 50 59 67 76 84 93 101 109 118 126 134 143 151 159 167 176
466
434
397
373
83
50
- - - - - - - - - - - - - - - 27
119
107
92
14
-- 2 7 II 16 21 26 31 36 41 46 51 56 61 66 71 77 82 87 92
[Podran encontrarse pequeiias discrepancias entre los valores criticos que aparecen en la tabla
-26 -35 -45 -54 -63 72
- -81 90
- -99 -108 -117 126
-
135
-
144
-
153
-
161
-
170
- -179 -188
anterior y los que figuran en la tabla 2 de la revision de 1964 del trabajo titulado Some Rapid
15
-- 3 7 12 18 23 28 33 39 44 50 55 61 66 72 77 83 88 94 100
Approximate Statistical Procedures, de F. Wilcoxon y N. A. Wilcox (Nueva.York: Lederle L,a.borat?
-27 38
- -48 57
- -67 -77 -87 -96 -106 -115 125
-
134
-
144
-
153 163
-
172
-
182
- -191 -200
ries). La discrepancia refleja la tendencia actual de estos aut ores de seleccionar el valor entice mas
cercano a un nivel de significacion dado, sobrepasando ocasionalmente ese nivel. Por ejemplo, para
16 -- 3 8 14 19 25 30 36 42 48 54 60 os '71 77 83 89 95 101 107
29 92 193 213
-
y
18
-- 4 9 16 22 28 35 41 48 55 61 68 75 82 88 95 102 109 116 123
- - - - - - - - - - - - - - - - -
Wilcoxon y Wilcox seleccionan una T de 4 como. valor critico al nivel de significacion de 0.05 (prueba
19
a 4 10 17 23 30 37 44 51 58 os n 80 87 94 101 109 116 123 130
19 34 47 59 72 84 96 108 120 132 144 156 167 179 191 203 214 226 238 250
bilateral), mientras que la tabla J refleja una actitud mas conservadora indicando una T de 3 como
- - - - - - - - - - - - - - - - - -
valor critico a este nivel.]
20
0 4 II 18 25 32 39 47 54 62 69 77 84 92 100 107 115 123 130 138
20 36 49 62 75 88 101 113 126 138 151 163 176 188 200 213 225 237 250 262
- - - - - - - - - - - - - - - - - - -
(Los guiones en el cuerpo de la tabla indican la imposibilidad de tamar una decision al nivel de siqnificacion indicado.)
390 ESTADISTICA PARA LAS CIENCIAS SOCIALES
TAB LAS 391
Tabla K
Tabla M
Factoriales de los numeros del I al 20
Valores criticos de x 0 de N - x (el que sea mayor) a los nive1es 0.05 y 0.01,
N Nl cuando P = Q = l
0 1
La x, 0 la N - x, obtenida debe ser iqual a mayor que el valor indicado para
1
1
que sea significative al nivel escogido. Los guiones indican que es imposible
2
2
3
6
tomar una decision para N al nivel rx dado.
4
24
7
5040
5 5
8
40320
9
6 6 6
362880
7 7 7 7
10
3628800
8 7 8 8
11
39916800
9 8 9
12
9 8
479001600
13
6227020800
10 9 10 9 10
14
87178291200
11 9 10 10 11
12 10 11 10 11
15
1307674368000
16
20922789888000
13 10 12 11 12
17
355687428096000
14 11 12 12 13
18
6402373705728000
15 12 13 12 13
19
121645100408832000
14 13 14
16 12
20
2432902008176640000
17 13 14 13 15
18 13 15 14 15
19 14 15 15 16
20 15 16 15 17
21 15 17 16 17
22 16 17 17 18
23 16 18 17 19
24 17 19 18 19
25 18 19 18 20
Tabla L 26 18 20 19 20
Coeficientes binomiales 27 19 20 20 21
28 19 21 20 22
N (~) (~) (~) (~) (~) (~) (~) (~) (~) (~) (~) 29 20 22 21 22
30 20 22 21 23
0 1
31 21 23 22 24
1
1 1
24 23 24
2
32 22
1 2 1
3
1 3 3 1
33 22 24 23 25
4
1 4 6 4 1
34 23 25 24 25
35 23 25 24 26
5
1 5 10 10 5 1
6
1 6 15 36 24 26 25 27
20 15 6 1
7
1 7 21 35 35 21 7 1
37 24 27 25 27
8
1 8 28 56 70 56 28 8 1
38 25 27 26 28
9
1 9 36 84 126 126 84 • 36 9 1
28 27 28
39 26
10
1 10 45 120 210 252 210 40 26 28 27 29
120 45 10
1
11
1 11 55 165 330 462 462 330 165 55 11
41 27 29 28 30
12
1 12 66 220 495 792 924 792 495 220 66
42 27 29 28 30
13
1 13 78 286 715 1287 1716 1716 1287 715 286
14
1 14 91 43 28 30 29 31
44 28 31 29 31
15
1 15 105 455 1365 3003 5005 6435 6435 5005 3003
45 29 31 30 32
16
1 16 120 560 1820 4368 B008 11440 12870 11440 8008
32 31 33
17
1 136 46 30
17 6BO 2380 6188 12376 19448 24310 24310 19448
18
1 18 153 816 3060 8568 18564 31824 43758 47 30 32 31 33
48620 43758
19
1 19 171 969 3876 11628 27132 50388 75582 92378 92378
48 31 33 32 34
49 31 34 32 35
20
1 20 190 1140 4845 15504 38760 77520 125970 167960 184756
50 32 34 33 35
Uso de la tabla N
Esta tabla fue preparada para facilitar la torna de decision cuando se manejan
poblaciones binomiales en las que P +- Q. Ejemplo: Un investigador efectuo doce
repeticiones independientes del mismo estudio, usando a = 0.01. Cuatro de estos
estudios resultaron estadisticamente significativos. ~Es este resultado (cuatro casos
significativos entre doce) estadisticarnente significativo en si mismo, 0 esta dentro de
10 que cabe esperar por accion del azar? En la columna encabezada por .01, y frente a
N = 12, hallamos que dos 0 mas diferencias significativas al nivel a = .01 es por si
mismo significativo al nivel a = .01. Asi, el investigador puede llegar a la conclusion
de que los resultados generales de su investigacion justifican el rechazo de H o-
Tabla N
Valores criticos de x al nivel a: = 0.05 (tipc claro) y a: = 0.01 (tipo oscuro) con diferentes valores de P y Q y
para N desde 2 hasta 49.
Un valor dado de x es significativo a un nivel a: dado si es igual 0 mayor que el valor critico indicado en la
tabla. Todos los valores presentados son unilaterales. Puesto que la binomial no es simetrica cuando
P f Q 0/= t, no hay una forma sencilla de obtener valores bilaterales.
N P
Q
.01
.99
.0'
.98
.03
.97
.04
.96
.05
.95
.06
.94
.07 .08
.93 .9'
.09
.9'
.10
.90
.11
.89
.,
.88
. .13 .'4
.87
.86
.'5
.85
.16
.84
.17 .'8
.83 .8'
.19
.8'
.z0
.80
.z,
.79
...
.78
.z3
.77
.'4
.76
.z5
.75
.z6 .z7
.74 .73
.'8
.7'
.'9 .30
.71 .70
.31
.69
.3'
.68
.33
.67
.34 .35
.66 .65
.36
.64
.37 .38 .39 .40
.63 .6' .6' .60
.4'
.59
.4' .43 .44
.58 .57 .56
.45
.55
.46
.54
.47 .48
.53 .5'
.49 .50
.51 .50
1 1 2 2 2 2 2 2 2
1 2 2 2 2 2 2 2 2
1 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3
3
2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
1 2 2 2 2 2 2 2 2 3 3 3 4 4 4 4 4 4
3 3 3 3 3 3 3 3 3 3 3 3 4
2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 4 4 4
3 3 4 4 4 4 4 4 4 4 4 4 4
1 2 2 2 2 2 2 3 3 4 4 4 4 4 4 4 4 4 5 5 5
3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4
2 2 2 3
3 3 3 3 3 3 4 4 5 5 5 5 5 5 5 5 5 5 5 5
4 4 4 4 4 4 4 4 4 4 5 5 5
2 2 2 2 2 2 3 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 6 6 6 6 6
3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 5 5
2 2 3 3 3 3 3 5 5 5 5 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6
3 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5
2 2 2 2 2 3 3 5 5 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6 6 6 6 6 6 7 7 7
3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 5 5
5
2 2 3 3 3 3 4
6 6 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7
3 4 4 4 4 4 4 5 5 5 5 5 5 6 6 6 6 6
2 2 5 5 5 6 6 6 6 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 7 7
2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 5 5 5 5 5 5
3 6 6 6 6 7 7 7 7 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8
2 3 3 3 3 4 4 4 4 4 4 5 5 5 5 5 5 5 6
6 6 6 6 6
2 2 6 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 7 7 8 8 8 8 8 8
2 2 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5
5
9
7 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 8 8 9 9 9 9 9
2 3 3 3 3 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6
2 2 2 3 3 6 6 6 6 6 7 7 7 7 7 7 7 7 7 8 8 8 8 8 B B B 8 B 9
3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6
10 7 7 7 7 8 8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 9 9 9 10
2 3 3 3 4 4 4 4 4 5 5 5 5 5 5 6 6 6 6 6 6 7 7 7 7
6 6 7 7 7 7 7 7 7 B 8 B B B B 8 B B 9 9 9 9 9 9 9
2 2 2 3 3 3 3 4 4 4 4 4 4 5 5 5 5 5 5 6 6 6 6 6 6
11
7 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 9 10 10 10 10 10 10 10 10
2 3 3 3 4 4 4 4 5 5 5 5 5 6 6 6 6
6 6 7 7 7 7 7 7
7 7 7 7 7 7 B B B B B B B B 9 9 9 9 9 9 9 9 10 10 10
2 2 2 3 3 3 3 4 4 4 4 5 5 5 5 5 5 6 6 6 6 6
6 7
12
8 8 8 8 8 9 9 9 9 9 9 9 10 10 10 10 10 10 10 10 10 11 11 11 11
2 3 3 4 4 4 4 5 5 5 5 6 6 6 • 6 6 7 7 7 7 7 7 8 8
7 7 7 B B B 8 B B B 9 9 9 9 9 9 9 10 10 10 10 10 10 10 10
2 2 3 3 3 3 4 4 4 4 4 5 5 5 5 6 6 6 6 6 6 7 7 7
13 8 8 9 9 9 9 9 9 10 10 10 10 10 10 10 10 11 11 11 11 11 11 11 11 12
2 3 3 4 4 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 8 8 8 8
7 B 8 B B 8 B 9 9 9 9 9 9 9 10 10 10 10 10 10 11 11 11 11 11
2 2 3 3 3 3 4 4 4
4 5 5 5 5 6 6 6 6 6 7 7 7 7 7
14 9 9 9 9 9 10 10 10 10 10 10 10 11 11 11 11 11 11 11 12 12 12 12 12 12
2 3 3 4 4 4 5 5 5 5 6 6 6 7 7 7 7 7 8 8 8 8 8 9
8 8 8 8 9 9 9 9 9 9 10 10 10 10 10 10 10 11 11 11 11 11 11 12 12
2 2 3 3 3 4 4 4 5 5 5 5 6 6 6 6 6 7
7 7 7 8
15 9 9 9 10 10 10 10 10 10 11 11 11 11 11 11 12 12 12 12 12 12 12 13 13 13
2 3 3 4 4 5 5 5 6 6 6 7 7 7 7 8 8 8 8
9 9 9
Tabla N (colltilluacioll)
.06 .07 .08 .09 .10 .11 ,12 .13 .14 .ts .16 .17 .18 .19 .20
.21 .22 .23 .24 .25
.26 .27 .28 .29 .30 .31 .32 .33 ,34 .35 .36 .37 .38 .39 .40 .41 .42 .43 .44 .45 .46 .47 .48 .49 .50
.94 .93 .92 .91 .90 .89 .88. .87 .86 .85
.84 .83 .82 .81 .80
.79 .78 .77 .76 .75
.14 .73 .72 .71 .70 .69 .68 .67 .66 .65 .64 .63 .62 .61 .60 .59 .58 .57 .56 .55 .54 .53 .52 .51 .50
2 2 3 3 3 4 4 4 5
55566
16 6 6 7 7 7
7 7 8 8 8
88999 9 9 9 10 10 10 10 10 10 " 11 11 11 1, 11 12 12 12 12 12
3 3 4 4 4 5
5 6 6 6 6 7 7 7
7 8 8 8 8
89999
9 10 10 10 10 10 11 11 11 11 11 11 12 12 12 12 12 12 13 13 13 14 14 14 14
2 2 3 3 4 4
4 4 5 5 5 5 666
17 6 7 7 7 7 7 8 888
8 9 999 9 10 10 10 10 10 11 11 11 11 11 12 12 12 12 12 12 13 13 13
3 3 4 4 4 5 5 5 6 6 6 7 777 88889
9 9 9 9 10
10 10 10 10 11 11 11 11 11 12 12 12 12 12 13 13 13 13 13 13 14 14 14 14 14
2 2 3 3 4 4 4 5 5 5 5 6 6 6 6
18 7 7 7 8
8 8 8 8 9
9 9 9 9 10 10 10 10 10 11 11 11 11 11 12 12 12 12 12 13 13 13 13 13 13
3 3 4 4 5 5 5
6 6 6 77778
8 8 8 9 9
9 9 10 10 10
10 10 11 11 11 11 12 12 12 12 12 13 13 13 13 13 13 14 14 14 14 14 14 15 15
2 3 3 3 4 4 4
5 5 5 6 6 6 6 7
19 7 7 7 8 8 8 8 9 9 9
9 9 10 10 10 10 10 11 11 11 11 12 12 12 12 12 13 13 13 13 13 13 14 14 14
3 3 4 4 5 5 5
6 6 6 7 7 788 88999
9 10 10 10 10
11 11 11 11 12 12 12 12 12 13 13 13 13 13 14 ·14 14 14 14 15 15 15 15 15 15
2 3 3 3 4 4 4 5 5 5 6 6 7 7
20 7 7 8 8 8 8 9 9 9 9
10 10 10 10 10 11 11 11 11 12 12 12 12 12 13 13 13 13 13 14 14 14 14 14 15
3 3 4 4 5 5 6 6 6 7 7 7 888 8 9 9 9 9
10 10 10 10 11
11 11 11 12 12 12 12 13 13 13 13 14 14 14 14 14 15 15 15 15 15 16 16 16 16
2 3 3 3
4 4 5 5 5 6 6 6 6 7 7
21 7 8 8 8 8
9 9 9 9 10
10 10 10 11 11 11 11 12 12 12 12 12 13 13 13 13 14 14 14 14 14 15 15 15 15
3 3
4 4 5 5 6 6 6 7 7 7 8 8 8 9 9 9 10 10
10 10 11 11 11
11 12 12 12 12 13 13 13 13 14 14 14 14 14 15 15 15 15 16 16 16 16 16 17 17
2 3 3 4 4 4 5 5 5 6
6 6 7 7 7
22 8 8 8 8 9 9 9 9 10 10
10 10 11 11 11 11 12 12 12 12 13 13 13 13 14 14 14 14 15 15 15 15 15 16 16
3 3 4 5 5 5 6 6 7 7 7 8 8 8
9 9 9 10 10 10 10 11 11 11 11
12 12 12 13 13 13 13 14 14 14 14 15 15 15 15 15 16 16 16 16 17 17 17 17 17
2 3 3 4 4 4
5 5 6 6 6 6 7 7 7
23 88899
9 9 10 10 10
11 11 11 11 12 12 12 12 13 13 13 13 14 14 14 14 15 15 15 15 16 16 16 16 .16
3
4 4 5 5 6 6 6 7 7 7 8 8 9 9
9 9 10 10 10 11 11 11 12 12
12 12 13 13 13 13 14 14 14 15 15 15 15 15 16 16 16 16 17 17 17 17 18 18 18
2
3 3 4 4 5 5 5 6 6 6 7 7 7 8
24 88999 9 10 10 10 11
11 11 11 12 12 12 13 13 13 13 14 14 14 14 15 15 15 15 16 16 16 16 17 17 17
3 4 4 5 5 6 6 7 7
7 8 8 8 9 9 9 10 10 10 11 11 11 12 12 12
13 13 13 13 14 14 14 14 15 15 15 15 16 16 16 16 17 17 17 17 18 18 18 18 19
25
2 3 3 4 4
5 5 5 6 6 6 7 7 8 8 8 8 9 9 9 10 10 10 11 11
11 12 12 12 12 13 13 13 13 14 14 14 15 15 15 15 16 16 16 16
3 17 17 17 17 18
4 4 5 5 6 6 7 7 7 8 8 9 9 9
10 10 10 11 11 11 12 12 12 13
13 13 13 14 14 14 15 15 15 15 16 16 16 17 17 17 17 18 18 18 18 19 19 19 19
2
3 3 4 4 5 5 6 6 6 7 7 7 8 8
26 8 9 9 9 10 10 10 11 11 11
12 12 12 12 13 13 13 14 14 14 14 15 15 15 16 16 16 16 17 17 17 17 18 18 18
3 4 4 5 5 6 6 7 7
8 8 8 9 9 10 10 10 11 11 11 12 12 12 13 13
13 14 14 14 14 15 15 15 16 16 16 16 17 17 17 18 18 18 18 19 19 19 19 20 20
2 3 3 4 4 5 5 6 6 6 7 7 8 8
8
27 9 9 9 10 10 10 11 11 11 12
12 12 12 13 13 13 14 14 14 15 15 15 15 16 16 16 17 17 17 17 18 18 18 18 19
3 4 4 5 6 6 6
7 7 8 8 9 9 9 10
10 11 11 11 12 12 12 13 13 13
14 14 14 15 15 15 15 16 16 16 17 17 17 18 18 18 18 19 19 19 19 20 20 20 20
2 3 4 4 4 5 5
6 6 7 7 7 8 8 8
28 9 9 10 10 10 11 11 11 12 12
12 13 13 13 13 14 14 14 15 15 15 16 16 16 16 17 17 17 18 18 18 18 19 19 19
3 4 4 5 6 6 7 7 8 8 8 9 9 10 10 10 11 11 12 12 12 13 13 13 14
14 14 15 15 15 16 16 16 17 17 17 17 18 18 18 19 19 19 19 20 20 20 21 21 21
2 3 4 4 5 5 5 6 6 7 7 8 8 8
9
29 9 9 10 10 10 11 11 12 12 12
13 13 13 14 14 14 14 15 15 15 16 16 16 17 17 17 18 18 18 18 19 19 19 20 20
3 4 5 5 6 6 7
7 8 8 9 9 9 10 10 11 11 11 12 12 13 13 13 14 14
14 15 15 15 16 16 16 17 17 17 18 18 18 19 19 19 19 20 20 20 21 21 21 21 22
2 3 4 4
5 5 6 6 6 7 7 8 8 8 9
30 9 10 10 10 11 11 11 12 12 13
13 13 14 14 14 15 15 15 16 16 16 17 17 17 17 18 18 18 19 19 19 20 20 20 20
3 4 5 5 6 6 7 7 8 8
9 9 10 10 10 11 11 12 12 12 13 13 14 14
14
15 15 15 16 16 16 17 17 17 18 18 18 19 19 19 20 20 20 21 21 21 21 22 22 22
2 3 4 4 5 5 6 6 7 7 7 8 8 9 9
31 9 10 10 11 11 11 12 12 12 13
13 14 14 14 15 15 15 16 16 16 17 17 17 18 18 18 19 19 19 20 20 20 20 21 21
3 4 5 5 6
6 7 7 8 8 9 9 10 10 11 11 12 12 12 13 13 14 14 14 15
15 15 16 16 16 17 17 17 18 18 19 19 19 19 20 20 20 21 21 21 22 22 22 23 23
2 3 4 4 5 5
6 6 7 7 8 8 899
32 10 10 10 11 11 12 12 12 13 13
14 14 14 15 15 15 16 16 16 17 17 17 18 18 18 19 19 19 20 20 20 21 21 21 22
3 4 5 5 6 7 7
8 8 9 9 10 10 10 11
11 12 12 13 13 13 14 14 15 15
15 16 16 16 17 17 18 18 18 19 19 19 20 20 20 21 21 21 22 22 22 22 23 23 24
2 3 4 4 5 5 6 6 7 7 8 8 9 9 9
10
33 10 11 11 12 12 12 13 13 13
14 14 15 15 15 16 16 16 17 17 17 18 18 19 19 19 20 20 20 21 21 21 22 22 22
3 4 5 5 6 7 7 8 8
9 9 10 10 11 11 12 12 12 13 13 14 14 15 15 15
16 16 16 17 17 18 18 18 19 19 19 20 20 20 21 21 21 22 22 22 23 23 23 24 24
2 3 4 4 5 6 6 7 7 7 8 8 9 9
10
34 10 11 11 11 12 12 13 13 13 14
14 15 15 15 16 16 16 17 17 18 18 18 19 19 19 20 20 20 21 21 21 22 22 22 23
3 4 5 6 6 7 7
8 8 9 9 10 10 11 11
12 12 13 13 14 14 14 15 15 16
16 16 17 17 17 18 18 19 19 20 20 20 21 21 21 22 22 22 23 23 23 24 24 24 25
2 3 4 5
6 6 6 7 7 8 8 9 9 9 10
35 10 11 11 12 12 12 13 13 14 14
14 15 15 16 16 16 17 17 18 18 18 19 19 19 20 20 21 21 21 22 22 22 23 23 23
3 4 5 6 6 7 7 8 9 9 10 10 11 11 12
12 13 13 13 14 14 15 15 16 16
16 17 17 18 18 18 19 19 20 20 20 21 21 21 22 22 23 23 23 24 24 24 25 25 25
3 3 4 5 5 6 6 7 7 8
8 9 9 10 10
36 11 11 11 12 12 13 13 14 14 14
15 15 16 16 16 17 17 18 18 18 19 19 20 20' 20 21 21 21 22 22 22 23 23 24 24
3 4 5 6 6 7 8 8 9 9 10 10 11 11 12 12 13 13 14 14
15 15 15 16 16
17 17 18 18 18 19 19 20 20 20 21 21 22 22 22 23 23 23 24 24 25 25 25 26 26
3 3 4 5 5
6 6 7 7 8 8 9 9 10 10
37 11 11 12 12 13 13 13 14 14 15
15 16 16 16 17 17 18 18 18 19 19 20 20 20 21 21 22 22 22 23 23 23 24 24 24
3 4 5 6 6 7 8 8 9 9 10 11 11 12 12 • 13 13 13 14 14 15 15 16 16 17
17 18 18 18 19 19 20 20 20 21 21 22 22 22 23 23 24 24 24 25 25 25 26 26 27
Tabla N (colltilluacioll)
p .01 .02 .03 .04 .05 .06 .07 .08 .09 .10 .11 .40 .41 .42 .43 .44 .45 .46 .47 .48 .49 .50
N Q .12 .13 .14 .15 .16 .17 .18 .19 .20 .21 .22 .23 .24 .25 .26 .27 .28 .29 .30 .31 .32 .33 .34 .35 .36 .37 .38 .39
.99 .98 .97 .96 .95 .94 .93 .92 .91 .90 .89 .88 .87 .86 .85 .84 .83 .82 .66 .65 .64 .63 .62 .61 .60 .59 .58 .57 .56 .55 .54 .53 .52 .51 .50
.81 .80 .79 .78 .77 .76 .75 .74 .73 .72 .71 .70 .69 .68 .67
3 5 5 6 6 7 B B 9 9 10 24 25
3B
3 6
10 10 11 11 12 12 13 13 14 14 15 15 15 16 16 17 17 1B ts 1B 19 19 20 20 20 21 21 22 22 22 23 23 24 24 25
7 7 8 8 9 10 10 11 11 12 12 13 13 14 14 15 21
22 22 23 23 23 24 24 24 25 25 26 26 26 27 27
15 16 16 17 17 17 18 18 19 19 20 20 20 21
3 3 4 5 5 6 6 7 B B 9
9 10 10 11 11 12 12 22 22 22 23 23 24 24 24 25 25 26
39 13 13 14 14 14 15 15 16 16 17 17 17 1B 1B 19 19 20 20 20 21 21
3 4 5 6 7 7 8 9 9 10 10 11 11 12 12 13 13 14 24 25 25 25 26 26 27 27 27 28
14 15 15 16 16 17 17 18 18 19 19 20
20 20 21 21 22 22 23 23 23 24
3 3 4 5 5 6 7 7 8 B
9 9 10 10 11 11 12 12 22 23 23 23 24 24 25 25 25 26 26
40 13 13 14 14 15 15 16 16 17 17 17 1B 1B 19 19 20 20 20 21 21 22
3 4 5 6 7 7 8 9 9 10 10 11 12 12 13 13 14 14 25 26 26 26 27 27 28 28 28
15 15 16 16 17 17 18 18 19 19 20 20 20 21 21 22 22 23 23 23 24 24 25
3 3 4 5 6 6 7 7 B B 9 10 10 11 11 12 12 13 23 23 24 24 25 25 26 26 26 27
41 13 14 14 15 15 15 16 16 17 17 1B 1B 19 19 20 20 20 21 21 22 22 23
3 4 5 6 7 8 8 9 9 10 11 11 12 12 13 13 14 14 15 16 24 24 25 25 26 26 26 27 27 28 28 28 29
16 17 17 18 18 18 19 19 20 20 21 21 22 22 23 23 23
3 4 4 5 6
6 7 7 B 9 9 10 10 I 11 11 12 24 24 25 25 26 26 26 27 27
42 12 13 13 14 14 15 15 16 16 17 17 lB 1B 19 19 19 20 20 21 21 22 22 23 23 23
3 4 5 6 7 8 B 9 10 10 11 11 12 12 13 14 14 25 26 26 27 27 27 28 28 29 29 29
15 15 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 23 24 24 25
3 4 4 5 6 6 7 B B 9 9 10 10 11 11 12 13 13 24 25 26 26 27 27 27 2B
43 14 14 15 15 16 16 17 17 1B 1B 1B 19 19 20 20 21 21 22 22 23 23 24 24 25
3 5 5 6 7 8 8 9 10 10 11 12 12 13 13 14 14 28 28 2B 29 29 30 30
15 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 23 24 24 25 25 26 26 27 27
3 4 4 5 6 6 7 B 8 9 9 10 11 11 12 12 27 27 2B 28 28
44 13 13 14 14 15 15 16 16 17 17 18 1B 19 19 20 20 21 21 22 22 23 23 24 24 24 25 25 26 26
3 5 5 6 7 8 9 9 10 11 11 12 12 13 14 14 15 28 29 29 30 30 31
15 16 16 17 17 18 18 19 19 20 21 21 21 22 22 23 23 24 24 25 25 26 26 27 27 28 28
3 4 4 5 6 7 7 B 8 9 10 10 11 11 12 12 13 13 25 26 27 27 28 28 29 29
45 14 15 15 16 16 17 17 lB 18 19 19 20 20 21 21 22 22 23 23 24 24 24 25 26
4 5 6 6 7 8 9 9 10 11 11 12 13 13 14 14 15 15 28 28 29 29 29 30 30 31 31
16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 24 24 25 25 26 26 27 27
3 4 4 5 6 7 B 9 9 10 10 11 11 12 13 13 14 26 26 27 27 2B 28 29 29 30
46 14 15 15 16 16 17 17 1B 18 19 20 20 21 21 22 22 22 23 23 24 24 25 25
4 5 6 6 7 9 9 10 11 11 12 13 13 14 15 15 16 27 28 28 29 29 30 30 30 31 31 32
16 17 17 18 19 19 20 20 21 21 22 22 23 23 24 24 25
25 26 26 27
3 4 5 5 6
'{ 7 8 9 9 10 10 11 12 12 13 13 14 15 24 24 25 25 26 26 27 27 28 28 29 29 30 30
47 15 16 16 17 17 1B 18 19 19 20 20 21 21 22 22 23 23
4 5 6 7 7 8 9 10 10 11 12 12 13 14 14 15 15 29 29 30 30 31 31 31 32 32
16 17 17 18 18 19 19 20 21 21 22 22 23 23 24 24 25 25 26 26 27 27 2B 28
3 4 5 5 6 7 7 B 9 9 10 11 11 12 12 13 14 14 15 26 26 27 27 28 28 29 29 30 30 31
4B 15 16 16 17 1B 1B 19 19 20 20 21 21 22 22 23 23 24 24 25 25
4 5 6 7 7 B 9 10 10 11 12 12 13 14 14 15 16 16 17 27 28 29 29 30 30 31 31 32 32 33 33
17 18 19 19 20 20 21 21 22 22 23 24 J4 25 25 26 26 27 28
3 4 5 5 6 7 8 8 9 10 10 11 11 12 13 13 14 14 27 28 28 29 29 30 30 31 31
49 15 16 16 17 17 18 18 19 19 20 21 21 22 22 23 23 24 24 25 25 26 26 27
4 5 6 7 B 8 9 10 11 11 12 13 13 14 15 15 16 16 30 30 31 31 32 32 33 33 34
17 18 18 19 19 20 21 21 22 22 23 23 24 24 25 26 26 27 27 28 28 29 29
398 ESTADfSTICA PARA LAS CIENCIAS SOCIALES TABLAS 399
Tabla 0
Tabla P
Puntos porcentuales del rango studentizado Cuadrados, rafces cuadradas y reciprocos de los numeros enteros comprendidos entre I y lOOO.
k - numero de medias a numero de pasos entre medias ordenadas N N2 .IN lIN N N2 IN lIN N N2 iN lIN
Error
gl a 2 3 4 5 6 1 1.0000 1.000000 61 3721 7.8102 .016393 121 14641 11.0000 .00826446
7 8 9 10 11 1
2 4 1.4142 .500000 62 3844 7.8740 .016129 122 14884 11.0454 .00819672
5 .05 3.64 4.60 5.22 5.67 6.03 6.33 6.58 3 9 1.7321 .333333 63 3969 7.9373 .015873 123 15129 11.0905 .00813008
6.80 6.99 7.17
.01 5.70 6.98 7.80 8.42 8.91 9.32 9.67 9.97 4 16 2.0000 .250000 64 4096 8.0000 .015625 124 15376 11.1355 .00800452
10.24 10.48
6 .05 3.46 4.34 5 25 2.2361 .200000 65 4225 8.0623 .015385 125 15625 11.1803 .00800000
4.90 5.30 5.63 5.90 6.12 6.32 6.49 6.65
.01 5.24 6.33 7.03 7.56 7.97 8.32 8.61 8.87 9.10 9.30 6 36 2.4495 .166667 66 4356 8.1240 .015152 126 15876 11.2250 .00793651
7 .05 3.34 4.16 4.68 5.06 5.36 5.61 5.82 7 49 2.6458 .142857 67 4489 8.1854 .014925 127 16129 11.2694 .00787402
.01 6.00 6.16 6.30
4.95 5.92 6.54 7.01 7.37 7.68 7.94 8.17 8 64 2.8284 .125000 68 4624 8.2462 .014706 128 16384 11.3137 .00781250
8.37 8.55
8 .05 3.26 4.04 9 81 3.0000 .111111 69 4761 8.3066 .014493 129 16641 11.3578 .00775194
4.53 4.89 5.17 5.40 5.60 5.77 5.92 6.05 10 100 3.1623 .100000 70 4900 8.3666 .014286 130 16900 11.4018 .00769231
.01 4.75 5.64 6.20 6.62 6.96 7.24 7.47 7.68 7.86 8.03
9 .05 3.20 3.95 4.41 4.76 5.02 5.24 5.43 5.59 11 121 3.3166 .090909 71 5041 8.4261 .014085 131 17161 11.4455 .00763359
.01 5.74 5.87 5184 8.4853 .013889 132 17424 11.4891 .00757576
4.60 5.43 5.96 6.35 6.66 6.91 7.13 7.33 7.49 12 144 3.4641 .083333 72
7.65 169 .076923 73 5329 8.5440 .013699 133 17689 11.5326 .00751880
10 .05 3.15 3.88 13 3.6056
4.33 4.65 4.91 5.12 5.30 5.46 5.60 5.72 14 196 3.7417 .071429 74 5476 8.6023 .013514 134 17956 11.5758 .00746269
.01 4.48 5.27 5.77 6.14 6.43 6.67 6.87 7.05 18225 11.6190 .00740741
7.21 7.36 15 225 3.8730 .066667 75 5625 8.6603 .013333 135
11 .05 3.11 3.82 4.26 4.57 4.82 5.03 5.20 5.35
.01 5.49 5.61 16 256 4.0000 .062500 76 5776 8.7178 .013158 136 18496 11.6619 .00735294
4.39 5.15 5.62 5.97 6.25 6.48 6.67 6.84 6.99 7.13 17 289 4.1231 .058824 77 5929 8.7750 .012987 137 18769 11.7047 .00729927
12 .05 3.08 3.77" 4.20 4.51 4.75 4.95 5.12 5.27 18 324 4.2426 .055556 78 6084 8.8318 :012821 138 19044 11.7473 .00724638
5.39 5.51
.01 4.32 5.05 . 5.50 5.84 6.10 6.32 6.51 6.67 6.81 19 361 4.3589 .052632 79 6241 8.8882 .012658 139 19321 11. 7898 .00719424
6.94
13 .05 3.06 3~73 4.15 4.45 4.69 20 400 4.4721 .05ODOO 80 6400 8.9443 .012500 140 19600 11.8322 .00714286
4.88 5.05 5. \9 5.32 5.43
.01 4.26 4.96 5.40 5.73 5.98 6.19 6.37 6.53 6.67 6.79 21 441 4.5826 .047619 81 6561 9.0000 .012346 141 19881 11.8743 .00709220
14 .05 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13 22 484 4.6904 .045455 82 6724 9.0554 .012195 142 20164 11.9164 .00704225
5.25 5.36
.01 4.21 4.89 5.32 5.63 5.88 6.08 6.26 6.41 6.54 23 529 4.7958 .043478 83 6889 9.1104 .012048 143 20449 11.9583 .00699301
6.66
15 .05 3.01 3.67 24 576 4.8990 .041667 84 7056 9.1652 .011905 144 20736 12.0000 .00694444
4.08 4.37 4.59 4.78 4.94 5.08 5.20 5.31 145 12.0416 .00689655
.01 4.17 4.84 25 625 5.0000 .040000 85 7225 9.2195 .011765 21025
5.25 5.56 5.80 5.99 6.16 6.31 6.44 6.55
16 .05 3.00 3.65 4.05 4.33 4.56 4.74 4.90 5.03 5.15 26 676 5.0990 .038462 86 7396 9.2736 .011628 146 21316 12.0830 .00684932
.01 5.26 .037037 .011494 147 21609 12.1244 .00680272
4.13 4.79 5.19 5.49 5.72 5.92 6.08 6.22 6.35 6.46 27 729 5.1962 87 7569 9.3274
17 .05 28 784 5.2915 .035714 88 7744 9.3808 .011364 148 21904 12.1655 .00675676
2.98 3.63 4.02 4.30 4.52 4.70 4.86 4.99 5.11 5.21 29 841 .034483 89 7921 9.4340 .011236 149 22201 12.2066 .00671141
.01 4.10 4.74 5.3852
5.14 5.43 5.66 5.85 6.01 6.15 6.27 6.38 30 900 5.4772 .033333 90 8100 9.4868 .011111 150 22500 12.2474 .00666667
18 .05 2.97 3.61 4.00 4.28 4.49 4.67 4.82 4.96 5.07 5.17 31 961 5.5678 .032258 91 8281 9.5394 .010989 151 22801 12.2882 .00662252
.01 4.07 4.70 5.09 5.38 5.60 5.79 5.94 6.08 6.20 6.31 32 1024 5.6569 .031250 92 8464 9.5917 .010870 152 23104 12.3288 .00657895
19 .05 2.96 3.59 3.98 4.25 4.47 4.65 4.79 4.92 5.04 5.14 1089 5.7446 .030303 93 8649 9.6437 .010753 153 23409 12.3693 .00653595
.01 33
4.05 4.67 5.05 5.33 5.55 5.73 5.89 6.02 6.14 6.25 34 1156 5.8310 .029412 94 8836 9.6954 .010638 154 23716 12.4097 .00649351
20 .05 2.95 3.58 3.96 4.23 4.45 4.62 4.77 35 1225 5.9161 .028571 95 9025 9.7468 .010526 155 24025 12.4499 .00645161
4.90 5.01 5.11
.01 4.02 . 4.64 5.02 5.29 5.51 5.69 5.84 5.97 6.09 6.19 36 1296 6.0000 .027778 96 9216 9.7980 .010417 156 24336 12.4900 .00641026
24 .05 2.92
U~
,3.90 4.17 4.37 4.54 4.68 4.81 4.92 5.01 37 1369 6.0828 .027027 97 9409 9.8489 .010309 157 24649 12.5300 .00636943
.01 3.96 4.91 5.17 5.37 5.54 5.69 5.81 5.92 6.02 38 1444 6.1644 .026316 98 9604 9.8995 .010204 158 24964 12.5698 .00632911
3D .05 2.89 3.49' 3.85 4.10 39 1521 6.2450 .025641 99 9801 9.9499 .010101 159 25281 12.6095 .00628931
4.30 4.46 4.60 4.72 4.82 4.92 .025000 25600 12.6491 .00625000
.01 3.89 4.45 , 4.80 5.05 5.24 5.40 40 1600 6.3246 100 10000 10.0000 .010000 160
5.54 5.65 5.76 5.85
40 .05 2.86 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.73 4.82 41 1681 6.4031 .024390 101 10201 10.0499 ,00990099 161 25921 12.6886 .00621118.
.01 3.82 4.37 4.70 4.93 5.11 5.26 5.39 5.50 5.60 5.69 42 1764 6.4807 .023810 102 10404 10.0995 .00980392 162 26244 12.7279 .00617284
60 .05 43 1849 6.5574 .023256 103 10609 10.1489 .00970874 163 26569 12.7671 .00613497
2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65 4.73 .022727 12.8062 .00609756
.01 3.76 4.28 44 1936 6.6332 104 10816 10.1980 .00961538 164 26896
4.59 4.82 4.99 5.13 5.25 5.36 5.45 5.53 2025 .022222 105 11025 10.2470 .00952381 165 27225 12.8452 .00606061
45 6.7082
120 .05 2.80 3.36 3.68 3.92 4.10 4.24 4.36 4.47 4.56 4.64
.01 3.70 4.20 4.50 4.71 4.87 5.01 5.12 5.21 46 2116 6.7823 .021739 106 11236 10.2956 .00943396 166 27556 12.8841 .00602410
5.30 5.37 .00934579 27889 12.9228 .00598802
47 2209 6.8557 .021277 107 11449 10.3441 167
.05 2.77 3.31 3.63 3.86 4.03 4.17 4.29 4.39 4.47 4.55 .020833 108 11664 10.3923 .00925926 168 28224 12.9615 .00595238
00
Tabla P (continuacion)
..
Ta bla P (con ti!/luaClon)
N N2 -..IN 1/N N N2 ,IN 1/N N N2 .IN 1/N N N 2 ,.IN 1/N N N2 .IN 1/N N N2 -iN 1/N
181 32761 13.4536 .00552486 241 58081 15.5242 .00414938 301 90601 17.3494
182 33124 13.4907 .00549451 242 58564 15.5563 .00332226 361 130321 19.0000 .00277008 421 177241 20.5183 .00237530 481 231361 21.9317 .00207900
183 33489 .00413223 302 91204 17.3781 .00331126
13.5277 .00546448 243 59049 15.5885 .00411523 362 131044 19.0263 .00276243 422 178084 20.5426 .00236967 482 232324 21. 9545 .00207469
184 33856 J3.5647 303 91809 17.4069 .00330033 233289 21.9773 .00207039
.00543478 244 59536 15.6205 .00409836 363 131769 19.0526 .00275482 423 178929 20.5670 .00236407 483
185 34225 13.6015 304 92416 17.4356 .00328047 20.5913 .00235849 484 234256 22.0000 .00206612
.00540541 245 60025 15.6525 .00408163 305 364 132496 19.0788 .00274725 424 179776
93025 17.4642 .00328947 19.1050 .00273973 425 180625 20.6155 .00235294 485 235225 22.0227 .00206186
365 133225
186 34596 13.6382 .00537634 246 60516 15.6844
187 .00406504 306 93636 17.4929 .00326797
34969 13.6748 .00534759 247 61009 15.7162 366 133956 19.1311 .00273224 426 181476 20.6398 .00234742 486 236196 22.0454 .00205761
188 .00404858 307 94249 17.5214 .00325733
35344 13.7113 .00531915 248 61504 15.7480 367 134689 19.1572 .00272480 427 182329 20.6640 .00234192 487 237169 22.0681 .00205339
189 .00403226 308 94864 17.5499 .00321675
35721 13.7477 .00529101 249 62001 15.7797 368 135424 19.1833 .00271739 428 183184 20.6882 .00233645 488 238144 22.0907 .00204918
190 .00401606 309 95481 17.5784 .00323625
36100 13.7840 .00526316 250 62500 15.8114 .00400000 369 136161 19.2094 .00271003 429 184041 20.7123 .00233100 489 239121 22.1133 .00204499
310 96100 17.6068 .0032258) 490 240100 22.1359
370 136900 19.2354 .00270270 430 184900 20.7364 .00232558 .00204082
191 36481 13.8203 .00523560 251 63001 15.8430
192 36864 .00398406 311 96721 17.6352 .00321543
13.8564 .00520833 252 63504 )5.8745 .00396825 371 137641 19.2614 .00269542 431 185761 20.7605 .00232019 491 241081 22.1585 .00203666
193 37249 13.8924 312 97344 17.6635 .00320513
.00518135 253 64009 15.9060 .00395257 313 372 138384 19.2873 .00268817 432 186624 20.7846 .00231481 492 242064 22.1811 .00203252
194 37636 13.9284 .00515464 97969 17.6918 .00319489
254 64516 15.9374 .00393701 314 373 139129 19.3132 .00260097 433 187489 20.8087 .00230947 493 243049 22.2036 .00202840
195 38025 13.9642 98596 17.7200 .00318471
.00512821 255 65025 15.9687 .00392157 315 99225 374 139876 19.3391 .00267380 434 188356 20.8327 .00230415 494 244036 22.2261 .00202429
17.7482 .00317460 495 245025 22.2486 .00202020
375 140625 19.3649 .00266667 435 189225 20.8567 .00229885
196 38416 14.0000 .00510204 256 65536 16.0000
197 38809 .00390625 316 99856 17.7764 .00316456
14.0357 .00507614 257 66049 16.0312 .00389105 376 141376 19.3907 .00265957 436 190096 20.8806 .00229358 496 246016 22.2711 .00201613
198 39204 14.0712 317 100489 17.8045 .00315457
.00505051 258 66564 J6.0624 .00387597 318 101124 17.8326 377 142129 19.4165 .00265252 437 190969 20.9045 .00228833 497 247009 22.2935 .00201207
199 39601 14.1067 .00502513 259 67081 16.0935 .00314465 378 142884 19.4422 .00264550 438 191844 20.9284 .00228311 498 248004 22.3159 .00200803
200 40000 .00386100 319 101761 17.8606 .00313480
14.1421 .00500000 260 67600 16.1245 .00384615 379 J43641 19.4679 .00263852 439 192721 20.9523 .00227790 499 249001 22.3383 .00200401
320 102400 17.8885 .00312500 300 144400 19.4936 .00263158 440 193600 20.9762 .00227273 500 250000 22 .3607 .00200000
201 40401 14.1774 .Q0497512 261 68121
202 16.1555 .00383142 321 103041 17.9165 .00311526
40804 14.2127 .00495050 262 68644 16.1864 441 194481 21.0000 .00226757 501 251001 22.3830 .00199601
203 .00381679 322 103684 17.9444 .00310559 381 145161 19.5192 .00262467
41209 14.2478 .00492611 263 69169 16.2173 382 145924 19.5448 .00261780 442 195364 2J .0238 .00226244 502 252004 22.4054 .00199203
204 41616 .00380228 323 104329 17.9722 .00309598
14.2829 .00490196 264 69696 16.2481 .00378788 383 146689 19.5704 .00261097 443 196249 21.0476 .00225734 503 253009 22.4277 .00198807
205 42025 14.3178 324 104976 18.0000 .00308642
.00487805 265 70225 16.2788 .00377358 325 105625 18.0278 384 147456 19.5959 .00260417 444 197136 21.0713 .00225225 504 254016 22.4499 .00198413
.00307692 198025 21.0950 .00224719 505 255025 22.4722 .00198020
206 42436 385 J48225 19.6214 .00259740 445
14.3527 .00485437 266 70756 16.3095 .00375940
207 42849 14.3875 326 106276 18.0555 .00306748
.00483092 267 71289 16.3401 .00374532 327 386 148996 19.6469 .00259067 446 198916 21.1187 .00224215 506 256036 22.4944 .00197628
208 43264 14.4222 106929 18.0831 .00305810
.00480769 268 71824 16.3707 .00373134 328 387 149769 19.6723 .00258398 447 199809 21.1424 .00223714 507 257049 22.5167 .00197239
209 43681 14.4568 107584 18.1108 .00304878
.00478469 269 72361 16.4012 .00371747 329 388 150544 19.6977 .00257732 448 200704 21. 1660 .00223214 508 258064 22.5389 .00196850
210 44100 14.4914 .00476190 108241 18.1384 .00303951
270 72900 16.4317 .00370370 330 108900 18.1659 389 151321 19.7231 .00257069 449 201601 21. 1896 .00222717 509 25908J 22.5610 .00196464
.00303030 510 260100 22.5832 .00196078
211 44521 390 152100 19.7484 .00256410 450 202500 21.2132 .00222222
14.5258 .00473934 271 73441 16.4621 .00369004
212 44944 14.5602 331 109561 18.1934 .00302115
.00471698 272 73984 16.4924 .00367647 332 110224 18.2209 391 152881 19.7737 .00255754 451 203401 21.2368 .00221729 511 261121 22.6053 .00195695
213 45369 14.5945 .00469484 273 .00301205
74529 16.5227 .00366300 333 110889 18.2483 392 153664 19.7990 .00255102 452 204304 21.2603 .00221239 512 262144 22.6274 .00195312
214 45796 14.6287 .00467290 274 .00300300
75076 16.5529 .00364964 334 111556 18.2757 393 154449 19.8242 .00254453 453 205209 21.2838 .00220751 513 263169 22.6495 .00194932
215 46225 14.6629 .00465116 275 75625 .00299401
16.5831 .00363636 335 112225 18.3030 .00298507 394 155236 19.8494 .00253007 454 206116 21.3073 .00220264 514 264196 22.6716 .00194553
216 395 156025 19.8746 .00253165 455 207025 21.3307 .00219870 515 265225 22.6936 .00194175
46656 14.6969 .00462963 276 76176 16.6132
217 47089 .00362319 336 112896 18.3303 .00297619
14.7309 .00460829 277 76729 16.6433 .00361011 396 156816 19.8997 .00252525 456 207936 21. 3542 .00219298 516 266256 22.7156 .00193798
218 47524 14.7648 337 113569 18.3576 .00296736
.00458716 278 77284 16.6733 .00359712 338 397 157609 19.9249 .00251889 457 208849 21.3776 .00218818 517 267289 22.7376 .00193424
219 47961 14.7986 .00456621 114244 J8.3848 .00295858
279 77841 16.7033 .00358423 339 114921 18.4120 398 158404 19.9499 .00251256 458 209764 21.4009 .00218341 518 268324 22 .7596 .00193050
220 48400 14.8324 .00454545 280 .00294985
78400 16.7332 .00357143 340 115600 18.4391 399 159201 19.9750 .00250627 459 210681 21.4243 .00217865 519 269361 22.7816 .00192678
.00294118
221 48841 400 160000 20.0000 .00250000 460 211600 21.4476 .00217391 520 270400 22.8035 .00192308
14.8661 .00452489 281 78961 16.7631 .00355872
222 49284 14.8997 341 116281 18.4662 .00293255
.00450450 282 79524 16.7929 .00354610 342 116964 401 160801 20.0250 .00249377 461 212521 21.4709 .00216920 521 271441 22.8254 .00191939
223 49729 14.9332 .00448430 18.4932 .00292398
283 80089 16.8226 .00353357 343 117649 402 161604 20.0499 .0024875 6 462 213444 21.4942 .00216450 522 272484 22.8473 .00191571
224 50176 14.9666 .00446429 18.5203 .0029J545
284 80656 16.8523 .00352113 344 118336 403 162409 20.0749 .0024813 9 463 214369 21.5174 .00215983 523 273529 22.8692 .00191205
225 50625 15.0000 .00444444 18.5412 .00290698
285 81225 16.8819 .00350877 345 119025 18.5742 404 163216 20.0998 .0024752 5 464 215296 21.5407 .0021551 7 524 274576 22.8910 .00190840
.00289855
226 51076 15.0333 405 164025 20. J246 .0024691 4 465 216225 21.5639 .00215054 525 275625 22.9129 .00190476
.00442478 286 81796 16.9115 .00349650 346 119716 18.6011
227 51529 15.0665 .00440529 287 .00289017
82369 16.9411 . 00348132 347 120409 18.6279 .00288184 406 164836 20.1494 .00246305 466 217156 21.5870 .00214592 526 276676 22.9347 .00190114
228 5J984 15.0997 .00438596 288 82944
229 52441 15.1327
16.9706 .00347222 348 121104 18.6548 .00287356 407 165649 20.1742 .0024570 o 467 218089 21.6102 .00214133 527 277729 22.9565 .00189753
.00436681 289 83521 17.0000 .00346021 349 121801 18.6815 219024 .0021367 5 528 278784 22.9783 .00189394
230 52900 15.1658 .00434783 .00286533 408 166464 20.1990 .0024509 8 468 21.6333
290 84100 17.0294 .00344828 350 122500 18.7083 409 167281 20.2237 .0024449 9 469 219961 21.6564 .00213220 529 279841 23.0000 .00189036
.00285714
231 53361 15.1987 .00432900 291 410 168100 20.2485 .0024390 2 470 220900 21.6795 .00212766 530 280900 23.0217 .00188679
84681 17.0587 .00343643 351 123201 18.7350 .00284900
232 53824 15.2315 .00431034 292 85264 17.0880 .00342466 352 123904 18.7617 .00284091 41 I 168~21 20.2731 .0024330 9 471 221841 21.7025 .0021231 4 531 281961 23.0434 .00188324
233 54289 15.2643 .00429185 293 85849 17.1172
234 54756 .00341297 353 124609 18.7883 .00283286 412 169744 20.2978 .0024271 8 472 222784 21.7256 .00211864 532 283024 23.0651 .00187970
15.2971 .00427350 294 86436 17.1464 .00340136
235 55225 15.3297 354 125316 18.8149 .00282486 413 170569 20.3224 .0024213 1 473 223729 21.7486 .0021141 6 533 284089 23.0868 .00187617
.00425532 295 87025 17.1756 .00338983 355 126025 18.8414 .00281690 414 171396 20.3470 .0024154 6 474 224676 21.7715 .00210970 534 285156 23.1084 .00187266
236 55696 15.3623 .00423729 296 87616 17.2047 415 172225 20.3715 .002409 64 475 225625 21.7945 .0021052 6 535 286225 23.1301 .00186916
237 56169 .00337838 356 126736 18.8680 .00280899
15.3948 .00421941 297 88209 17.2337 .00336700
238 56644 15.4272 357 127449 18.8944 .00280112 416 173056 20.3961 .0024038 5 476 226576 21.8174 .002JOO84 536 287296 23.1517 .00186567
.00420168 298 88804 17.2627 .00335570 358 128164 18.9209
239 57121 15.4596 .00418410 .00279330 417 173889 20.4206 .0023980 8 477 227529 21.8403 .00209644 537 288369 23.1733 .00186220
299 89401 17.2916 .00334448 359 128881 18.9473 .00278552
240 57600 15.4919 .00416667 418 174724 20.4450 .002392 34 478 228484 21.8632 .0020920 5 538 289444 23.1948 .00185874
300 90000 17.3205 .00333333 360 129600 18.9737 .00277778 419 175561 20.4695 .002386 63 479 229441 21.8861 .0020876 8 539 290521 23.2164 .00185529
420 176400 20.4939 .00230095 480 230400 21.9089 .0020833 3 540 291600 23.2379 .00185185
402 ESTAnfSTICA PARA LAS CIENCIAS SOCIALES
TABLAS 403
Tabla P (colltilluaciOIl)
Tabla P (contilluacioll)
N N2 .s: 1/N N N2 .IN 1/N N N2 .IN 1/N
N N2 ,.iN 1/N N N2 ,IN 1/N N N2 ,IN 1/N
541 292681 23.2594 .00184843 601 361201 24.5153 .00166389 661
542 436921 25.7099 .00151286
293764 23.2809 .00184502 602 302404 24.5357 .00166113 662 438244
543 25.7294 .00151057 721 519841 26.8514 .00138696 781 609961 27.9464 .00128041 841 707281 29.0000 .00ll8906
294849 23.3024 .00184162 603 363609 24.5561 .00165837 663 439569
544 25.7488 .00150830 722 521284 26.8701 .00138504 782 611524 27.9643 .00127877 842 708964 29.0172 .00118765
295936 23.3238 .00183824 604 364816 24.5764 .00165563 664 440896
545 25.7682 .00150602 723 522729 26.8887 .00138313 783 613089 27.9821 .00127714 843 710649 29.0345 .00118624
297025 23.3452 .00183486 605 366025 24.5967 .00165289 665 442225 784 614656
25.7876 .00150376 724 524176 26.9072 .00138122 28.0000 .00127551 844 712336 29.0517 .OOll8483
546 298116 23.3666 725 525625 26.9258 .00137931 785 616225 28.0179 .00127389 845 714025 29.0689 .00118343
.00183150 606 367236 24.6171 .00165017 666 443556 25.8070
547 299209 23.3880 .00182815 607 368449 .00150150
24.6374 .00164745 667 444889 25.8263 .00149925 726 527076 26.9444 .00137741 786 617796 28.0357 .00127226 846 715716 29.0861 .00118203
548 300304 23.4094 .00182482 608 369664 24.6577 .00164474 668
549 446224 25.8457 .00149701 727 528529 26.9629 .00137552 787 619369 28.0535 .00127065 847 717409 29.1033 .00118064
301401 23.4307 .00182149 609 370881 24.6779 .00164204 669
550 447561 25.8650 .00149477 728 529984 26.9815 .00137363 788 620944 28.0713 .00126904 848 719104 29.1204 .00117925
302500 23.4521 .00181818 610 372100 24.6982 .00163934 670 448900 25.8844 .00149254 729 531441 27.0000 .00137174 789 622521 28.0891 .00126743 849 720801 29.1376 .00117786
551 303601 23.4734 .00181488 611 373321 24.7184 .00163666
730 532900 27.0185 .00136986 790 624100 28.1069 .00126582 850 722500 29.1548 .oou 7647
671 450241 25.9037 .00149031
552 304704 23.4947 .00181159 612 374544 24.7386 .00163399 672 451584 25.9230 .00148810 731 534361 27.0370 .00136799 791 625681 28.1247 .00126422 851 724201 29.1719 .00117509
553 305809 23.5160 .00180832 613 375769 24.7588 .00163132 673
554 306916 452929 25.9422 .00148588 732 535824 27.0555 .00136612 792 627264 28.1425 .00126263 852 725904 29.1890 .00117371
23.5372 .00180505 614 376996 24.7790 .00162866 674 454276 25.96J5 733 537289 27.0740 .00136426 793 628849 28.1603 .00126103 853 727609 29.2062 .00117233
555 308025 23.5584 .00180180 615 .00148368
378225 24.7992 .00162602 675 455625 25.9808 .00148148 734 538756 27.0924 .00136240 794 630436 28.1780 .00125945 854 729316 29.2233 .oou 7096
556 309136 23.5797 735 540225 27.1109 .00136054 795 632025 28.1957 .00125786 855 731025 29.2404 .00116959
.00179856 616 379456 24.8193 .00162338 676 456976 26.0000 .00147929
557 310249 23.6008 .00179533 617 380689 24.8395 .00162075 677 458329 541696 27.1293 .00135870 796 633616 28.2135 .00125628 856 732736 29.2575 .00116822
26.0192 .00147710 736
558 311364 23.6220 .00179211 618 381924 24.8596 .00161812 678 459684 737 543169 27.1477 .00135685 797 635209 28.2312 .00125471 857 734449 29.2746 .00116686
559 312481 26.0384 .00147493
23.6432 .00178891 619 383161 24.8797 .00161551 679 461041 26.0576 738 544644 27.1662 .00135501 798 636804 28.2489 .00125313 858 736164 29.2916 .00116550
560 313600 23.6643 .00147275
.00178571 620 384400 24.8998 .00161290 680 462400 26.0768 739 546121 27.1846 .00135318 799 638401 28.2666 .00125156 859 737881 29.3087 .00116414
.00147059
561 314721 740 547600 27.2029 .00135135 800 640000 28.2843 .00125000 860 739600 29.3258 .00116279
23.6854 .G0178253 621 385641 24.9199 .00161031 681 463761 26.0960
562 315844 23.7065 .00146843
.00177936 622 386884 24.9399 .00160772 682 465124 26.1151 .00146628 741 549081 27.2213 .00134953 801 641601 28.3019 .00124844 861 741321 29.3428 .00116144
563 316969 23.7276 .00177620 623 388129 24.9600 .00160514 683 466489 26.1343 .00146413 742 550564 27.2397 .00134771 802 643204 28.3196 .00124688 862 743044 29.3598 .00116009
564 318096 23.7487 .00177305 624 389376 24.9800 .00160256 684 467856 26.1534 .00146199 743 552049 27.2580 .00134590 803 644809 28.3373 .00124533 863 744769 29.3769 .00115875
565 319225 23.7697 .00176991 625 390625 25.0000 .00160000 685 469225 26.1725 .00145985 744 553536 27.2764 .00134409 804 646416 28.3549 .00124378 864 746496 29.3939 .00115741
566 320356 23.7908 71,5 555025 27.2947 .00134228 805 648025 28.3725 .00124224 865 748225 29.4109 .00115607
.00176678 626 39J876 25.0200 .00159744 686 470596 26.1916 .00145773
567 321489 23.8118 .00J76367 627 393129 25.0400 .00159490 687 471969 26.2107 .00145560 746 556516 27.3130 .00134048 806 649636 28.3901 .00124069 866 749956 29.4279 .00115473
568 322624 23.8328 .00176056 628 394384 25 .0599 .00159236 688 473344
569 26.2298 .00145349 747 558009 27.3313 .00133869 807 651249 28.4077 .00123916 867 751689 29.4449 .00115340
323761 23.8537 .00175747 629 395641 25.0799 .00158983 689 474721 748 559504 27.3496 .00133690 625864 28.4253 .00123762 .00115207
570 26.2488 .00145138 808 868 753424 29.4618
324900 23.8747 .00175439 630 396900 25.0998 .00158730 690 476100 749 561001 27.3679 .00133511 809 654481 28.4429 869 755161 29.4788 .00115075
26.2679 .00144928 .00123609
571 326041 23.8956 750 562500 27.3861 .00133333 810 656100 28.4605 .00123457 870 756900 29.4958 .00114943
.00175131 631 398161 25.1197 .00158479 691 477481 26.2869
572 327184 23.9165 .00144718
.00164825 632 399424 25.1396 .00158228 692 478864 26.3059 751 564001 27.4044 .00133156 811 657721 28.4781 .00123305 871 758641 29.5127 .00114811
573 328329 23.9374 .00144509
.00174520 633 400689 25.1595 .00157978 693 480249 26.3249 752 565504 27.4226 .00132979 812 659344 28.4956 .00123153 872 760384 29.5296 .00114679
574 329476 23.9583 .00144300
.00174216 634 401956 25.1794 .00157729 694 481636 26.3439 .00144092 753 567009 27.4408 .00132802 813 660969 28.5132 .00123001 873 762129 29.5466 .00114548
575 330625 23.9792 .00173913 635 403225 25.1992 .00157480 695 874 763876 29.5635 .00114416
483025 26.3629 .00143885 754 568516 27.4591 .00132626 814 662596 28.5307 .00122850
576 331776 755 570025 27.4773 .00132450 815 664225 28.5482 .00122699 875 765625 29.5804 .00114286
24.0000 .00173611 636 404496 25.2190 .00157233 696 484416 26.3818
577 332929 24.0208 .00143678
.00173310 637 405769 25.2389 .00156986 697 485809 26.4008 .00143472 756 571536 27.4955 .00132275 816 665856 28.5657 .00122549 876 767376 29.5973 .00114155
578 334084 24.0416 .00173010 638 407044 25 .2587 .00156740 698 487204 26.4197 .00143266 757 573049 27.5136 .00132100 817 667489 28.5832 .00122399 877 769129 29.6142 .00114025
579 335241 24.0624 .00172712 639 408321 25.2784 .00156495 699 878 770884 29.6311 .00113895
580 488601 26.4386 .00143062 758 574564 27.5318 .00131926 818 669124 28.6007 .00122249
336400 24.0832 .00172414 640 409600 25.2982 .00156250 700 490000 759 576081 27.5500 .00131752 819 670761 28.6182 .00122100 879 772641 29.6479 .00113766
26.4575 .00142857
581 337561 760 577600 27.5681 .00131579 820 672400 28.6356 .00121951 880 774400 29.6848 .00113636
24.1039 .00172ll7 641 410881 25.3180 .00156006 701 491401
582 338724 24.1247 26.4764 .00142653
.00171821 642 412164 25.3377 .00155763 702 492804 26.4953 .00142450 761 579121 27.5862 .00131406 821 674041 28.6531 .00121803 881 776161 29.6816 .00113507
583 339889 24.1454 .00171527 643 413449 25.3574 .00155521 703 27.6043 .00131234 822 675684 28.6705 .00121655 882 777924 29.6985 .00113379
494209 26.5141 .00142248 762 580644
584 341056 24.1661 .00171233 644 414736 25.3772 .00155280 704 27.6225 .00131062 823 677329 28.6880 .00121507 883 779689 29.7153 .00113250
495616 26.5330 .00142045 763 582169
585 342225 24.1868 .00170940 645 416025 25.3969 .00155039 705 824 678976 28.7054 .00121359 884 781456 29.732J .00113122
497025 26.5518 .00141844 764 583696 27.6405 .00130890
586 343396 24.2074 765 585225 27.6586 .00130719 825 680625 28.7228 .00121212 885 783225 29.7489 .00112994
.00170648 646 417316 25.4165 .00154799 706 498436 26.5707 .00141643
587 344569 24.2281 .00170358 647 418609 25.4362 .00154.ll6O 707 499849 826 682276 28.7402 .00121065 784996 29.7658 .00112867
26.5895 .00141443 766 586756 27.6767 .00130548 886
588 345744 24.2487 .00170068 648 419904 25.4558 .00154321 708 .00120919 887 786769 29.7825 .00112740
501264 26.6083 .00141243 767 588289 27.6948 .00130378 827 683929 28.7576
589 346921 24.2693 .00169779 649 421201 25.4755 .00154083 709 502681 788544 29.7993 .00112613
26.6271 .00141044 768 589824 27.7128 .00130208 828 685584 28.7750 .00120773 888
590 348100 24.2899 .00169492 650 422500 25.4951 .00153846 710 504100 28.7924 .00120627 889 790321 29.8161 .00112486
26.6458 .00140845 769 591361 27.7308 .0013003 9 829 687241
591 349281 770 592900 27.7489 .00129870 830 688900 28.8097 .00120482 890 792100 29.8329 .00112360
24.3105 .00169205 651 423801 25.5147 .00153610 711 505521 26.6646
592 350464 .00140647
24.3311 .00168919 652 425104 25.5343 .00153374 712 506944 26.6833 .00140449 771 594441 27.7669 .0012970 2 831 690561 28.8271 .00120337 891 793881 29.8496 .001 I 2233
593 351649 24.3516 .00168634 653 426409 25.5539 .00153139 713 .00112108
508369 26.7021 .00140252 772 595984 27.7849 .0012953 4 832 692224 28.8444 .00120192 892 795664 29.8664
594 352836 24.3721 .00168350 654 427716 25.5734 .00152905 29.8831 .00111982
714 509796 26.7208 .00140056 773 597529 27.8029 .0012936 6 833 693889 28.8617 .00120048 893 797449
595 354025 24.3926 .00168067 655 429025 25.5930 .00152672 715 29.8998 .001) 1857
511225 26.7395 .00139860 774 599076 27.8209 .0012919 9 834 695556 28.8791 .00119904 894 799236
596 355216 24.413) 775 600625 27.8388 .0012903 2 835 697225 28.8964 .00119760 895 801025 29.9166 .00111732
.00167785 656 430336 25.6125 .00152439 716 512656 26.7582 .00139665
597 356409 24.4336 .00167504 657 431649 25.6320 .00152207 717 776 602176 27.8568 .0012886 6 836 698896 28.9137 .00119617 896 802816 29.9333 .00111607
598 514089 26.7769 .00139470
357604 24.4540 .00167224 658 432964 25.6515 .00151976 718 515524 777 603729 27.8747 .0012870 o 837 700569 28.9310 .00119474 897 804609 29.9500 .00111483
599 358801 24.4745 26.7955 .00139276
.00166945 659 434281 25.6710 .00151745 719 516961 26.8142 .00139082 778 605284 27.8927 .0012853 5 838 702244 28.9482 .0011933 2 898 806404 29.9666 .00111359
600 360000 24.4949 .00166667 660 435600 25.6905 .00151515 779 606841 27.9106 .0012837o 839 703921 28.9655 .00119190 899 808201 29.9833 .00111235
720 518400 26.8328 .00138889
780 608400 27.9285 .0012820 5 840 705600 28.9828 .0011904 8 900 810000 30.0000 .00111111
404 ESTADISTICA PARA LAS CIENCIAS SOCIALES TABLAS 405
Tabla P (cone/lIye)
Tabla Q
Numeros aleatorios
N N' -iN 1/N N N' .IN I/N N N' .IN lIN NL1mero
901 811801 30.0167 .00110988 936 876096 30.5941 de fila
.00106838 971 942841 31.1609 .00102987
902 813604 30.0333 .00110865 937 877969 30.6105 .00106724 972 944784 31.1769 .00102881 00000 10097 32533 76520 13586 34673 54876 80959 09117 39292 74945
903 815409 30.0500 .00110742 938 879844 30.6268 .00106610 973 946729 31.1929 .00102775 00001 37542 04805 64894 74296 24805 24037 20636 10402 00822 91665
904 817216 30.0666 .00110619 939 881721 30.6431 .00106496 974 948676 31. 2090 .00102669 00002 08422 68953 19645 09303 23209 02560 15953 34764 35080 33606
905 819025 30.0832 .00110497 940 883600 30.6594 .00106383 975 95062" 31. 2250 .00102564 00003 99019 02529 09376 70715 38311 31165 88676 74397 04436 27659
906 820836 30.0998 .00110375 00004 12807 99970 80157 36147 64032 36653 98951 16877 12171 76833
941 885481 30.6757 .00106270 976 952576 31. 2410
907 822649 30.1164 .00110254 .00102459
942 887364 30.6920 .00106157 977 954529 31. 2570 00005 66065 74717 34072 76850 36697 36170 65813 39885 11199 29170
908 824464 30.1330 .00110132 .00102354
943 889249 30.7083 .00106045 978 956484 31.2730 31060 10805 45571 82406 35303 42614 86799 07439 23403 09732
909 826281 30.1496 .00110011 .00102249 00006
944 891136 30.7246 .00105932 979 958441 31.2890 65692 68665 74818 73053 85247 18623 88579
910 828100 30.1662 .00102145 00007 85269 77602 02051
.00109890 945 893025 30.7409 .00105820 980 960400 31.3050 .00102041 00008 63573 32135 05325 47048 90553 57548 28468 28709 83491 25624
911 829921 30.1828 .00109769 946 894916 00009 73796 45753 03529 64778 35808 34282 60935 20344 35273 88435
30.7571 .00105708 981 962361 31. 3209 .00101937
912 831744 30.1993 .00109649 947 896809 30.7734 .00105597 982 964324 31. 3369 .00101833 00010 98520 17767 14905 68607 22109 40558 60970 93433 50500 73998
913 833569 30.2159 .00109529 948 898704 30.7896 .00105485 983 966289 31.3528 .00101729 00011 11805 05431 39808 27732 50725 68248 29405 24201 52775 67851
914 835396 30.2324 .00109409 949 900601 30.8058 .00105374 984 968256 31. 3688 .00101626 00012 83452 99634 06288 98033 13746 70078 18475 40610 68711 77817
915 837225 30.2490 .00109290 950 902500 30.8221 .00105263 985 970225 31.3847 .00101523 00013 88685 40200 86507 58401 36766 67951 90364 76493 29609 11062
916 839056 30.2655 .00109170 951 904401 30.8383 00014 99594 67348 87517 64969 91826 08928 93785 61368 23478 34113
.00105152 986 972196 31.4006 .00101420
917 840889 30.2820 .00109051 952 906304 30.8545 .00105042 987 974169 31.4166 .00101317 00015 65481 17674 17468 50950 58047 76974 73039 57186 40218 16544
918 842724 30.2985 .00108932 953 908209 30.8707 .00104932 988 976144 31. 4325 .00101215 00016 80124 35635 17727 08015 45318 22374 21115 78253 14385 53763
919 844561 30.3150 .00108814 954 910116 30.8869 .00104822 989 978121 31. 4484 .00101112 00017 74350 99817 77402 77214 43236 00210 45521 64237 96286 02655
920 846400 30.3315 .00108696 955 912025 30.9031 .00104712 990 980100 31.4643 .00101010 00018 69916 26803 66252 29148 36936 87203 76621 13990 94400 56418
921 848241 30.3480 .00108578 956 913936 30.9192 00019 09893 20505 14225 68514 46427 56788 96297 78822 54382 14598
.00104603 991 982081 31.4802 .00100908
922 850084 30.3645 .00108460 957 915849 30.9354 .00104493
923 992 984064 31.4960 .00100806 00020 91499 14523 68479 27686 46162 83554 94750 89923 37089 20048
851929 30.3809 .00108342 958 917764 30.9516 .00104384 993 986049 31.5119 .00100705 00021 80336 94598 26940 36858 70297 34135 53140 33340 42050 82341
924 853776 30.3974 .00108225 959 919681 30.9677 .00104275 994 988036 31. 5278 .00100604 00022 44104 81949 85157 47954 32979 26575 57600 40881 22222 06413
925 855625 30.4138 .00108108 960 921600 30.9839 .00104167 995 990025 31. 5436 .00100503 28707
00023 12550 73742 11100 02040 12860 74697 96644 89439 25815
926 857476 30.4302 .00107991 961 923521 31.0000 00024 63606 49329 16505 34484 40219 52563 43651 77082 07207 31790
.00104058 996 992016 31.5595 .00100402
927 859329 30.4467 .00107875 962 925444 31.0161 .00103950 997 994009 31.5753 .00103842 00025 90446 47774 51924 33729 65394 59593 42582 60527
928 861184 30.4631 .00107759 963 927369 31.0322 61196 26457
.00103842 998 996004 31.5911 .00100200 79953 59367 83848 82396 10118 33211 59466
929 863041 30.4795 .00107643 964 929296 31.0483 00026 15474 45266 95270
.00103734 999 998001 31.6070 .00100100 54387 54622 44431 91190 42592 92927 45973
930 864900 30.4959 .00107527 965 931225 00027 94557 28573 67897
31.0644 .00103627 1000 1000000 31. 6228 .00100000 25701 46670
00028 42481 16213 97344 08721 16868 48767 03071 12059
931 866761 30.5123 .00107411 966 933156 31.0805 00029 23523 78317 73208 89837 68935 91416 26252 29663 05522 82562
.00103520
932 868624 30.5287 .00107296 967 935089 31.0966 .00103413
933 870489 30.5450 .00107181 968 937024 31. 1127 00030 04493 52494 75246 33824 45862 51025 61962 79335 65337 12472
.00103306
934 872356 30.5614 .00107066 969 938961 31.1288 00031 00549 97654 64051 88159 96119 63896 54692 82391 23287 29529
.00103199
935 874225 30.5778 .00106952 970 940900 31.1448 00032 35963 15307 26898 09354 33351 35462 77974 50024 90103 39333
.00103093
00033 59808 08391 45427 26842 83609 49700 13021 24892 78565 20106
00034 46058 85236 01390 92286 77281 44077 93910 83647 70617 42941
00035 32179 00597 87379 25241 05567 07007 86743 17157 85394 11838
00036 69234 61406 20117 45204 15956 60000 18743 92423 97118 96338
00037 19565 41430 01758 75379 40419 21585 66674 36806 84962 85207
00038 45155 14938 19476 07246 43667 94543 59047 90033 20826 69541
00039 94864 31994 36168 10851 34888 81553 01540 35456 05014 51176
00040 98086 24826 45240 28404 44999 08896 39094 73407 35441 31880
00041 33185 16232 41941 50949 89435 48581 88695 41994 37548 73043
00042 80951 00406 96382 70774 20151 23387 25016 25298 94624 61171
00043 79752 49140 71961 28296 69861 02591 74852 20539 00387 59579
00044 18633 32537 98145 06571 31010 24674 05455 61427 77938 91936
00045 74029 43902 77557 32270 97790 17119 52527 58021 80814 51748
00046 54178 45611 80993 37143 05335 12969 56127 19255 36040 90324
00047 11664 49883 52079 84827 59381 71539 09973 33440 88461 23356
00048 48324 77928 31249 64710 02295 36870 32307 57546 15020 09994
00049 69074 94138 87637 91976 35584 04401 10518 21615 01848 76938
00050 09188 20097 32825 39527 04220 86304 83389 87374 64278 58044
00051 90045 85497 51981 50654 94938 81997 91870 76150 68476 64659
00052 73189 50207 47677 26269 62290 64464 27124 67011\. 41361 82760
00053 75768 76490 20971 87749 90429 12272 95375 05871 93823 43178
00054 54016 44056 66281 31003 00682 27398 20714 53295 07706 17813
00055 08358 69910 78542 42785 13661 58873 04618 97553 31223 08420
00056 28306 03264 81333 10591 40510 07893 32604 60475 94119 01840
00057 53840 86233 81594 13628 51215 90290 28466 68795 77762 20791
00058 91757 53741 61613 62669 50263 90212 55781 76514 83483 47055
00059 89415 92694 00397 58391 12607 17646 48949 72306 94541 37408
406
ESTADfsTICA PARA LAS CIENCIAS SOCIALES
TABLAS 407
Tabla Q (continuacionj
Numero
Tabla Q (continuacionj
de fila NLimero
de fila
00060 77513 03820 86864
29901 68414
00061 82774
5J908 13980
72893 55507
00120 41849 84547 46850 52326 34677 58300 74910 64345 19325 81549
94049 91345
42836 09191
00064 99559 68331
62535 24170 08007 45449
00123 52701 08337 56303 87315 16520 69676 11654 99893 02181 68161
69777 12830
74819 78142
43860 72834
00124 57275 36898 81304 48535 68652 27376 92852 55866 88448 03584
00070 38001
02176 81719 11711 71602 92937 74219 64049
65584 49698
64638
85902 49139 06441
03856 54552
85794 74296
08789 88156
64691 19202
00134 04515 25624 95096 67946 48460 85558 15191 18782 16930 33361
39820 98952
43622 63147
00138 72472 00008 80890 18002 94813 31900 54155 83436 35352 54131
64421 80814
43800 09351 31024 73167
00139 05466 55306 93128 18464 74457 90561 72848 11834 79982 68416
00081 38508 07341 23793 48763 00140 39528 72484 82474 25593 48545 35247 18619 13674 18611
90822 97022
17719 04207 95954
00082 30692 70668
94688 16127
49953
00141 81616 18711 53342 44276 75122 11724 74627 73707 58319 15997
07477 44606
17985 48911 97341
30358
00441 58997
62126 98408
12843 82590
09815 93146
35700 04754
83824 52692
54130 55160
00089 10455 16019 14210 33712 00148 79495 04146 52162 90286 54158 34243 46978 35482 59362 95938
00093 67245
52670 35583 16563
00152 62880 87873 95160 59221 22304 90314 72877 17334 39283 04149
00096 24637 38736 74384 89342 00155 66067 42792 95043 52680 46780 56487 09971 59481 37006 22186
52623 07992
12369 18601 03742 83873
00098 16444 24334 36151 99073 27493 00157 30945 57589 31732 57260 47670 07654 46376 25366 94746 49580
70939
85130 32552
54846 54759
00099 60790
18157 57178 65762
11161 00158 69170 37403 86995 90307 94304 71803 26825 05511 12459 91314
00911 98936
76355 93779
80863 00514
00104 69572 68777
39510 35905 00163 10875 62004 90391 61105 57411 06368 53856 30743 08670 84741
14060 40619
29549 69616
33564 60780
00164 54127 57326 26629 19087 24472 88779 30540 27886 61732 75454
41839 55382
17267 70943 78038 70267
39685 23309
10061 68829 55986 66485
74416 53166
35208 33374 87539 08823
53152 67433
35663 52972
16818 60311
00169 44071 28091 07362 97703 76447 42537 98524 97831 65704 09514
00117 30934
47744 07481 83828 00176 06170 97965 88302 98041 21443 41808 68984 83620
73788 06533 28597 20405 94205 20380
Tabla Q (concluye)
Tratamiento de las
Nurnero
de fila
00180
00181
00182
00183
00184
49386
06312
60942
92329
77936
54480
88940
00307
98932
63574
23604
15995
11897
78284
31384
23554
69321
92674
46347
51924
21785
47458
40405
71209
85561
41101
64809
68032
92061
29671
91178
98189
96717
39448
58137
10174
81851
54244
93136
17820
29420
29651
10701
25722
22751
90438
84215
41393
08564
36518
IV distribuciones no normales
00185 38101 77756 11657 13897 95889 57067 47648 13885 70669 93406
00186 39641 69457 91339 22502 92613 89719 11947 56203
00187 19324 20504
84054 40455 99396 63680 67667 60631 69181 96845
00188 38525 11600
47468 03577 57649 63266 24700 71594 14004 23153
00189 69249 05747
43321 31370 28977 23896 76479 68562 62342 07589 08899 05985
00190 64281 61826 18555 64937 13173 33365 78851 16499 87064 13075
00191 66847 70495 32350 02985 86716 38746 26313 77463 55387 72681
00192 72461 33230 21529 53424 92581 02262 78438 66276 18396 73538
00193 21032 91050 13058 16218 12470 56500 15292 76139 59526 52113
00194 95362 67011 06651 16136
00195 49712 97380 10404 55452
01016 00857 55018 56374 35824 71708
Transformaci6n de distribuciones de frecuencias
34030 60726 75211 10271 36633 68424
00196
00197
58275
89514
61764
11788
97586
68224
54716
23417
50259
73959
46345
76145
87195
30342
46092
40277
26787
11049
60939
72049
no normales en areas de la curva normal estandar
00198 15472 50669 48139 36732 46874 37088 63465 09819 58869 35220
00199 12120 86124 51247 44302 60883 52109 21437 36786 49226 77837
\ Existen varias tecnicas para normalizar una distribucion de frecuencias de calificacio
nes. Todas elias conducen mas 0 menos a los mismos resultados. El metodo expuesto
aqui es uno de los preferidos por los autores.
Para ilustrar el procedimiento de normalizacion de distribuciones de frecuencias,
emplearemos una distribucion de frecuencias agrupadas (i = 2) de rendimientos en
millas por galon de sesenta automoviles modelo 1976. Los datos son los que figuran
a continuacion, Notese el exagerado sesgo positivo,
L1MITES VERDADEROS f
DEL INTERVALO DE CLASE f ACUM
27.5-29.5 1 60
25.5-27.5 1 59
23.5-25.5 2 58
21.5-23.5 3 56
19.5-21.5 7 53
17.5-19.5 6 46
15.5-17.5 10 40
13.5-15.5 6 30
11.5-13.5 10 24
9.5-11.5 14 14
Paso Ct' ~allalr la calificacion a la que Ie corresponde el rango percentil de 50 En el EI rango percentil de 19 es
presen e eJemp 0: .
Obtener la transforrnacion necesaria para producir una media de 500 y una A continuacion se muestran las transforrnaciones a valores T de todos los valores
desviacion estandar de 100. normalizados de los datos correspondientes a las millas por galon.
T = a + bz
= 500 + 100z
VALOR
z CORRESPONDIENTE REDONDEADO
BAJO LA CURVA TRANSFORMACION T AL ENTERO
Transformemos ahora las millas por galen en valores T, de modo que obtengamos CALIFICACION NORMAL ESTANDAR (T = 50 + 10z) MAS CERCANO
una media igual a 50 y una desviacion estandar igual a 10.
29.4 3.14 81.4 81
(Nota: En muchas aplicaciones practicas de la transformacion T, se redondea el Cualquier valor transformado puede interpretarse facilmente convirtiendolo a
numero al entero mas cercano de modo que la Teste expresada como un mimero unidades de la curva normal estandar,
entero positivo.)
Ejemplos
Ejemplos. La T de la media se convierte en
1. Una calificacion de 81.9 da lugar a 10 siguiente:
T = a + bz 81.9 - 50 31.9
= 50+0 z = 10 = 10 = 3.19.
= 50.
En la tabla A se encuentra que el correspondiente rango percentil es 99.93.
La T de una calificacion de 11 se convierte en 2. Una calificacion de 37.8 conduce a 10 siguiente:
= 40.7.
En la tabla A se encuentra que el correspondiente rango percentil es 11.12.
414 ESTADfsTICA PARA LAS CIENCIAS SOCIALES TRATAMIENTO DE LAS DISTRIBUCIONES NO NORMALES 415
Trazado de la grafica de una distribucion Paso C. Trazar el eje vertical 0 eje Y de modo que puedan representarse numeros
desde 0.00 hasta 0040, con dos decirnales,
norrnalizada
Paso D. Situar cada valor z en el eje horizontal y desplazarse verticalme?te. hacia
arriba hasta hallar el valor correspondiente que representa la ordenada. Dibujar un
Para ilustrar el procedimiento de construccion de la grafica de una distribucion punto en este lugar,
norrnalizada de valores z, utilizarernos los datos de millas por galen que fueron
Paso E. Despues de haber efectuado 10 anterior c~n ~odo~. los valores y una vez
transformados previamente. Dichos datos son los que se reproducen a continuaci6n.
unidos los puntos obtenidos se tiene la grafica ~e la dlstnbucl.O? normal de los d~tos
transformados. Puede resultar adecuado afiadir los dato~ ongmales correspondien
(A) (B) (C) tes y sus valores transformados. (Ver la fig. IV.I, que sigue.)
z CORRESPONDIENTE
BAJO LA CURVA
ALTURA
24
1.57 «
a:
23 1.41 ::J
22 1.26 ~
«
21 1.05
20
0.83
19 0.65 -2.0 -1.0 0.0
18
0.50 z
17 0.32
16 0.10 Fig. IV.I Grafica que representa una distribucion no~~alizada de datos
15.5 0.00
en millas por galon correspondientes a sesenta automoviles modelo 1976.
15 -0.06
14 -0.19
13 -0.36
12 -0.60
1~ -0.93
10 -1.57
9.6 -2.27
Paso A. Buscar en la columna (D) de la tabla IV:!. En ella se puede ver la ordenada
correspondiente a cada valor z. Hallar la ordenada correspondiente a cada z en la
tabla anterior y colocar el resultado en la columna (C).
Ejemplos
1. La ordenada correspondiente a z = 3.14 es 0.0029.
2. La ordenada correspondiente a z = 0 es 0.3989.
3. La ordenada correspondiente a z = -1.57 es 0.1163.
Paso B. En una hoja de papel cuadriculado, trazar el eje horizontal 0 eje X de
modo que los valores comprendidos entre - 304 y 304 esten igualmente espaciados.
[416] LISTA DE FORMULAS 417
v Lista de formulas
Numero
(7.1)
Formula
z=-
s
X-x
110
r.(X - X)(Y - y)
Paqina
- - (r.X)(r. Y)
(8.3) r.(X - X)(Y - Y) = r.XY - N 129
r.XY _ (r.X)(r.Y)
Numero Formula Pagina N
J[
(8.4) r = --;::===========~ 130
(4.4)
. . .. .
Calificacion en un percentil dado = X n + i(f acum - in acum) 68
_ Sy
(9.5) Y' = Y + r - (X - X) 149
fi Sx
(5.1)
-
X:».
XI + X2 + ... + XN IX
=-, 77 , _ - mXY - (r.X)(r. Y) (X _ X)
(9.9) 150
N N Y - Y + mx2 - (r.X)2
(6.6) SC = r.x2 _ (r.X)2 (10.10) peA y B) = p(A)P(BIA) = p(B)p(AIB) cuando los sucesos no son
99
N independientes 185
418 ESTADisTICA PARA LAS CIENCIAS SOCIALES LISTA DE F6RMULAS 419
(12.8)
(Ix estimado
.
=Sx =~ =J~(X-Xf /SC
N(N _ 1) ='11 N0V=1)
S
225 (15.5) 281
(12.9)
X- Ilo (15.6) SC to t = SCw + SC a 281
t = 226
Sx
(15.7) glE =k- 1 282
(12.10) Limite superior Ilo = X + to.05(sx) 232
-z SCE
(12.11) Limite inferior Ilo =X- to.05 (sx ) 233 (15.8) SE= - 282
gh
(13.1)
Sx,-x, = J( SCI + SC z ) ( 1
N I+N
z-2
1)
r:r;+N;
(15.9) glw = N - k
z SCw
282
282
(15.10)
~Xy + I:xD - (NIXy + NZX~)(_I_ + _1_),
Sw=-
glw
N I+N z - 2 N1 «. -z
SE
NI # Nz 246 (15.11) F =-z
282
Sw
SCI + SC z (15.12) gltOI = N - 1 285
(13.2)
N(N - 1)
2
I:Xy + I:X~ -
N(N - 1)
N(Xi + X~)
246
(15.13) DHS = qa.
JfSw
N 286
SCE - (k - 1)s~
(Xl - Xz) - (Ill - Ilz)
(15.14) Z
est = 287
(13.3) t = -------.:~---.::....=:. 246
W
SC to t -
1
Sw
sx, - X,
Z t Z
- 1 (16.1) Potencia = 1 f3 306
(13.4) W est = z N N (para dos muestras independientesj 249
t+ 1+ z-1 Nu
(14.1) (16.2) Eficiencia de la prueba B = 100_ 317
262 Nb
f5 - Iljj f5 NI
(14.2) t=--= 265 (17.1) p(x) = I(N ~ ) I pXQN-x
Sjj Sjj x. x. 324
VI Glosario de terminos
Datos de frecuencias (datos de atributos, datos
categoricos, datos enumerativos). Tabulacio
nes del nurnero de presentaciones en cada
clase de una variable dada.
Desviaeion estandar, Medida de dispersion de
Abscisa (eje X). Eje horizontal de una grafica, distribucion que muestra el porcentaje acu
hipotesis nula (caso de una muestra). Su usa
Diagrama de barras, Una forma de grafica mulado debajo del limite superior verdadero
AI azar (0 aleatorio). Un metodo para selec esta indicado cuando se desconoce la desvia
donde se emplean barras para indicar la del correspondiente intervalo de clase.
cionar muestras de modo que cada muestra cion estandar poblacional (0 las desviaciones
frecuencia de las observaciones dentro de
de un tamafio dado tenga la misma oportuni estandar poblacionales). Distrlbncion de proporciones acumuladas.
cada categoria nominal u ordinal.
dad de ser elegida. Coeficiente de correlacien. Una medida que Una distribucion que muestra la proporcion
1
expresa el grado en que dos variables estan Diagrama de dispersion. Recurso grafico em acumulada debajo del limite superior ver
Amilisis de la varianza. Un metoda, descrito pleado para representar la variacion en dos dadero del correspondiente intervalo de
inicialmente por R. A. Fisher, para descom relacionadas.
variables. clase.
poner la suma de cuadrados de los datos Coeficiente de determinacion (r 2 ) . EI cociente
experimentales en cornponentes conocidas de de la variacion explicada entre la variacion Diseiio antes-despues, Un disefio de muestras Distnbucion leptoeurtica, Distribucion en for
variacion, total. correlacionadas en el que se mide a cada ma de campana, caracterizada por una con
individuo, en cuanto a la tarea de criterio, centracion de datos en su centro.
Amilisis de la varianza con clasificacion doble, Coeficiente de no determinacion. Proporcion antes y despues de la introduccion de las
Analisis estadistico de varias categorias 0 de la variacion no explicada en terminos de la condiciones experimentales. Dlstrlbueion mesocurtica. Distribucion en
niveles de dos variables de tratamiento. correlacion entre las dos variables. forma de campana; forma «ideal» de una
Diseiio de grupo pareado. Un disefio de mues curva normal.
Analisis de la varianza con claslflcacion sim Comparaciones a posteriori. Comparaciones
tras correlacionadas en el que los individuos
ple. Analisis estadistico de varias categorias 0 no planeadas de antemano para investigar Distribucion muestral. Distribucion teorica
se clasifican por parejas de acuerdo con una
niveles de una sola variable de tratamiento. hipotesis especificas referentes a los parame de probabilidades de un estadigrafo, que re
variable que sera correlacionada con la medi
tros poblacionales. sulta de obtener todas las muestras posibles,
da de criterio. A cada miembro de la pareja se
Comparaciones planeadas 0 a priori. Compa Ie asignan diferentes condiciones experimen de un tamafio dado, de alguna poblacion.
raciones planeadas previamente a la investi tales. Distribueion negativamente sesgada. Distribu
Calificacion estandar, Un valor que represen gacion de hipotesis especificas referentes a los
Diseiio factorial. Un disefio de investigacion cion que tiene relativamente pocas frecuen
ta la desviacion de una calificacion especifica parametres poblacionales.
en el que a cada sujeto se Ie administra algun cias en el extremo Izquierdo del eje hori
respecto a la media, expresada en unidades de Correlacion. Relacion entre dos variables.
desviacion estandar, nivel de cada variable de tratamiento. zontal.
Curva de frecuencia. Una forma de grafica Distrlbucion normal estandar. Distribucion
Cociente F. Un cociente entre varianzas Dispersion. EI esparcimiento 0 variabilidad
que representa una distribucion de frecuen normal con media 0, desviacion estandar 1, y
muestrales. de las calificaciones alrededor de la medida
cias, en la cual se usa una linea continua para area total igual a 1.00.
de tendencia central.
Cociente F. La estimacion de la varianza indicar la frecuencia de los correspondientes
entre grupos dividida por la estimacion de la datos. Djsposleien. Ordenamiento de datos de Distribucion platiciirtica. Distribucion de fre
varianza dentro de los grupos. acuerdo a su magnitud, desde el valor menor cuencias caracterizada por un achatamiento
Curva normal. Una curva de frecuencia con
Cociente t. Una prueba estadistica para de hasta el mayor. en la parte central.
una caracteristica forma de campana.
terminar la significacion de una diferencia Distrtbucioa binomial. Modelo con propieda Distribucion positivamente sesgada. Distri
entre las medias (caso de dos muestras) 0 des maternaticas conocidas que se usa para bucion que tiene relativamente pocas fre
para exarninar estadisticamente la hipotesis describir ciertas distribuciones muestrales. cuencias en el extremo derecho del eje hori
de que una media muestral dada se obtuvo de Datos. Numeros 0 mediciones obtenidas co zontal.
una poblacion con media especificada por la Dlstrjbueion de frecuencias. Cuando los valo
mo resultado de observaciones,
res de una variable se ordenan de acuerdo a Distrfbueion sesgada. Distribucion que se ini
422 ESTADisTICA PARA LAS CIENCIAS SOCIALES GLOSARIO DE TERMINOS 423
cia en forma simetrica y que se extiende hacia guardan una relacion entre sf, la cual se son exhaustivos, si ago tan todos los resulta la realizacion de un suceso dado no afecta a
uno de los extremos. expresa en terrninos del algebra de las desi dos posibles. Simbolicamente, p(A 0 B 0 ... ) = la probabilidad de la realizaci6n de otro
Distribuciones t. Distribuciones muestrales gualdades: a es menor que b, 0 a es mayor = 1.00. suceso.
teoricas de forma simetrica con media igual a que b (estas proposiciones se escriben en
Interaccion, Efecto conjunto de dos 0 mas
cero y desviacion estan dar que se hace mas notacion algebraica como a < b, 0 a > b).
factores en la variable dependiente, aparte de
pequefia conforrne aumentan los grados de Escalas continuas. Aquellas en que las varia Falacia «post hoc». Falsa inferencia causal los efectos separados de cualquier factor.
Iibertad (gl). Se las utiliza en relacion con el bles pueden tomar un mirnero ilimitado de proveniente de datos de correlacion,
cociente t de Student. Intervalo de confianza. Intervalo dentro del
valores intermedios. Frecuencia acumulada, EI numero de casos cual consideramos posible que se halle el
Escalas discontinuas (escalas discretas). Aque (frecuencias) en y debajo de un punto dado. parametro poblacional. Los intervalos de
lias en que las variables pueden tomar sola confianza mas frecuentes son los de 9S % y
mente un cierto numero finito de valares. 99%.
Error del tipo I (error de tipo IX). Consiste en
rechazar H 0 cuando real mente es verdadera, Estadigrafo. Numero resultante de la mani Grados de Iibertad (gl). El numero de valores
La probabilidad de cometer un error del tipo I pulacion de los datos muestrales de acuerdo que tienen libertad para variar despues que se
esta dada por el nivel IX. con ciertos procedimientos especificos. han impuesto ciertas restricciones a los datos.
Limites de confianza. Lirnites que definen el
Error del tipo II (error de tipo {3). Ocurre Estadigrafo A de Sandler. Un estadigrafo ri intervalo de confianza.
cuando se acepta H o siendo realmente falsa. gurosamente derivado del cociente t de Stu
La probabilidad de un error del tipo II esta dent para examinar diferencias significativas Limites verdaderos de un mimero, Los limites
Hipotesis alternativa (H 1)' Una proposicion
dada par {3. \ entre muestras correlacionadas. verdaderos de un valor de una variable conti
en la que se especifica que el parametro po
nua son iguales a ese numero mas 0 men os la
Error estandar de Ja diferencia entre medias. Estadistica. Colecci6n de hechos numericos blacional tiene algun valor diferente al especi
mitad de una unidad de medida.
Desviacion estandar de la distribucion mues expresados mediante proposiciones concisas; ficado en la hip6tesis nula,
tral de la diferencia entre medias. rnetodo para trabajar con los datos: una Hipotesis direccional. Una hipotesis alternati
herramienta para recopilar, organizar y ana va donde se indica la direccion en que el
Error estandar de la diferencia media. Error
lizar hechos numericos u observaciones. parametro poblacional difiere de 10 especifi Media. Suma de los datos 0 valores de una
estandar que se basa en un disefio de mues
Estadistica descriptiva. Procedimientos em cado en H o. variable dividida por su numero,
tras correJacionadas. Se utiliza en la t de
Student para muestras correlacionadas. plead os para organizar y presentar datos en Hipotesis no direccional, Una hipotesis alter
Media ponderada. Suma de los productos de
forma conveniente, utilizable y comunicable. nativa (H 1) donde se afirma solamente que el
Error estandar de la estimacion, Desviacion la media de cada grupo por su ponderacion
parametro poblacional tiene un valor diferen
estandar de los valores respecto a la recta de Estadistica inferencial 0 inductiva. Procedi respectiva (la N de cad a grupo), dividida por
te al especificado en H o-
regresion. mientos empleados para liegar a mayores la suma de las ponderaciones (N total).
Hipetesis nula (H o)' Una proposici6n que
generalizaciones 0 inferencias acerca de po Mediana. Dato 0 dato potencial de una dis
Error estandar de Ja media. Una desviacion especifica valores hipoteticos para uno 0 mas
blaciones, basandose en datos muestrales. tribucion, arriba y abajo del cual caen la
estandar teorica de las medias correspondien de los pararnetros poblacionales. Frecuente
tes a muestras de tamafio dado, provenientes Estimacion de la varianza. Suma de los cua mente, aunque no necesariamente, incluye la mit ad de los datos.
de alguna poblacion especificada. Cuando se drados de las desviaciones respecto a la me hipotesis de «no diferencia». Medicion. Asignacion de mimeros a objetos 0
basa en el valor conocido de la desviacion dia dividida por los grados de libertad.
Histograma. Una forma del diagrama de ba sucesos de acuerdo con conjuntos de reglas
estandar de la poblacion, ax = a/.JN; cuan Estimacion por intervalo. La determinacion rras que se usa para representar las distribu predeterminadas (0 arbitrarias).
do se estima su valor mediante una muestra, de un intervalo dentro del cual se presume ciones de frecuencias en escalas por intervalos
Sx = s/JFT=l. que este el parametro poblacional. (Compa Medida de tendencia central. Indice de locali
(0 de razones).
rar con la estimacion puntual.) zacion central ernpleado en la descripcion de
Escala de intervalos. Escala cuantitativa que Homogeneidad de las varianzas. Condicion las distribuciones de frecuencias.
permite el uso de operaciones aritmeticas. EI Estimacion puntual. Estimacion de un para que existe cuando dos 0 mas varianzas mues
punto cero en esta escala es arbitrario. metro poblacional constituido par un valor trales provienen de poblaciones con varian Metodo de los minimos cuadrados. Metodo de
aislado, obtenido mediante el criterio del zas iguales. localizaci6n de la media mediante la busque
Escala de razones. Igual que la escala de «mejor estimador», (Cornparar con la estima da del valor minimo de la suma de cuadra
intervalos, excepto que tiene un punto cero Homoscedasticidad. Propiedad que se refiere
cion par intervalo.) a que varias distribuciones tienen igual varia dos.
verdadero.
Estimador no sesgado de un parametro, Un bilidad (la misma varianza). Moda. Calificacion que se presenta con ma
Escala nominal. Observaciones de variables estimador que es igual, en promedio, al valor yor frecuencia.
no ordenad as. del parametro.
Muestra. Subconjunto de una poblacion 0
Escala ordinal. Escala en la que las c1ases Exhaustivos. Se dice que dos 0 mas sucesos Independencia. Condicion que existe cuando universo,
424 ESTADfSTICA PARA LAS CIENCIAS SOCIALES GLOSARIO DE TERMINOS 425
Muestra aleatoria, Subconjunto de la pobla Parametro. Cualquier caracteristica medibJe a la magnitud de las diferencias entre parejas los valores bajos de una variable estan aso
cion 0 universo seleccionado en forma tal que de una poblacion, de calificaciones. ciados con valores altos de la otra.
cada miembro de la poblacion tenga igual
Percentiles. Numeros que dividen una distri Prueba U de Mann-Whitney. Potente prueba Relacion positiva. Se dice que dos variables
oportunidad de ser elegido.
bucion en 100 partes iguales. estadistica no parametrica, comunmente em tienen una relacion positiva cuando los valo
Muestreo aleatorio. Eleccion de muestras en pleada como una alternativa para la t de res altos de una de elias estan acompafiados
tal forma que cada muestra de tamaiio dado Poblaeion 0 universe, Conjunto completo de de valores altos de la otra. Reciprocamente,
Student euando las mediciones no alcanzan
tiene precisamente la misma probabilidad de individuos, objetos 0 mediciones que tienen los valores bajos de una variable estan aso
la calidad de una escala por intervalos.
ser e1egida. alguna caracteristica cornun observable, 0
ciados con valores bajos de la otra.
un conjunto teorico de observaciones poten
Mutuamente excluyentes. Se dice que los su ciales.
cesos A y B son mutuamente excluyentes si
Poblackin bicategorica (dicotomica), La for Rango. Medida de dispersion definida como
no pueden ocurrir simultaneamente, Simboli
ma mas simple correspondiente a la escala la distancia en la escala entre las calificacio Sesgo. Se presenta en el muestreo cuando las
camente, para sucesos mutuamente excluyen
tes se tiene que p(A y B) = 0.00. nominal, pues contiene soJamente dos c1ases nes mayor y menor. selecciones favorecen a ciertos sucesos 0 a
o categorfas. Rango percentil. Numero que representa eI ciertas colecciones de sucesos.
Porcentaje acumulado. EI porcentaje de casos porcentaje de los casos en un grupo que Suma de cuadrados, Suma de los cuadrados
(frecuencias) en y por debajo de un punta alcanzo valores iguales 0 menores que el de las desviaciones respecto a la media. Se la
N inflada. Error que se produce al hacer dado. citado. representa por SC.
varias observaciones sobre el mismo indivi Potencia de una prueba. Probabilidad de re Rango semi-intercuartil. Medida de variabili Suma de cuadrados de las desviaciones. Des
duo y tratarlas COmo si fueran observaciones chazar la hipotesis nula cuando es falsa. dad que se obtiene restando la calificacion viaciones respecto a la media, e1evadas al
independien tes. correspondiente al percentil 25 de la califica
Probabilidad. Teoria referente a los resulta cuadrado y sumadas.
Nivel alfa (IX). Nivel de significacion estableci dos posibles de los experimentos. cion correspondiente al percentil 75 y divi
do por el investigador para inferir la interven diendo el resultado por 2.
cion de factores no aleatorios. Probabilidad condicional. La probabilidad de
un suceso, dado que ha ocurrido otro suceso. Rango truncado. Restriccion del rango de una
Nivel de significacion. Valor de probabilidad .0ambas variables, que resulta en una corre Teorema del limite central. Si de cualquier
Se la representa por p(A I B): la probabilidad
considerado tan raro en la distribucion mues lacion sumamente baja entre esas variables.
poblacion (independientemente de la distri
de A, dado que ha ocurrido B.
tral especificada bajo la hipotesis nula, que bucion que tenga) se extraen muestras aleato
Proporclon acumulada. La proporcion de ca Realizacion conjunta. Realizacion simultanea rias de tarnafio N fijo, a medida que N crece
nos inclina a aceptar la intervencion de facto de dos sucesos. Tales sucesos no pueden ser
res no aleatorios. Los niveles de significacion sos (frecuencias) en y por debajo de un punto la distribucion de las medias muestrales tiende
dado. mutuamente excluyentes. a la normalidad.
comunmente aceptados son 0.05 y 0.01.
Prueba X2 en una variable [tecnica de la «OOn Recta de regresion (recta de «mejor ajuste»).
Numeros cardinales. Niimeros usados para
dad de ajuste»). Prueba para determinar si Recta que hace minima la suma de los cua
representar cantidades.
existe, 0 no, una diferencia significativa entre· drados de las desviaciones respecto a ella.
Numeros nominales. Numeros usados para el numero observado de casos en cada cate r de Pearson (coeficiente de correlacion pro Valor absoluto de un mimero. EI valor de un
denorninar. goria y el nurnero esperado de casos, basan ducto-momento). Coeficiente de correlacion numero prescindiendo del signo.
Numeros ordinales. Numeros usados para dose en la hipotesis nula. empleado con variables correspondientes a Valor de la probabilidad bilateral. Valor de la
representar posicion u orden en una serie. Prueba del signo. Prueba estadistica no para escalas de intervalos 0 de razones. probabilidad que tienen en cuenta las dos
metrica para variables de escala ordinal, que r de Spearman (r s 0 coeficiente de correlacion colas de la distribucion,
se usa con muestras apareadas 0 correlacio por ranges), Coeficiente de correlacion que se Valor de la probabilidad unilateral. Valor de la
nadas. La prueba del signo utiliza simple usa con datos ordenados 0 jerarquizados por probabilidad obtenido considerando sola
Ojiva. Representacion grafica de una distri rangos.
mente la informacion referente a la direccion mente una cola de la distribucion.
bucion de frecuencias acumuladas de datos
de las diferencias entre parejas de califica Region cntica, Aquella porcion de area situa
normal mente distribuidos. Valores crfticos de i. Valores que limitan las
ciones. da bajo la curva que incluye los valores de un
2 regiones de rechazo correspondientes a va
Omega al cuadrado (w ) . Una estimacion de estadigrafo que nos lIevan al rechazo de la
Prueba del signo-rango de Wilcoxon para ob rios niveles de significacion,
Ja proporcion de Ja varianza en la variable hipotesis nula.
servaciones apareadas. Prueba estadistica no
dependiente que es tenida en cuenta por las Valores de p unilaterales. Valores de la proba
pararnetrica para variables de escala ordinal Relacion negativa. Se dice que dos variables
variaciones en la variable independiente 0 bilidad obtenidos examinando solamente
que se usa con muestras apareadas 0 correla tienen una relacion negativa cuando los valo
variable experimental. uno de los lados (cola) de la distribucion,
cionadas, Es mas potente que la prueba del res altos de una de elias estan acompafiados
Ordenada (eje Y). Eje vertical de una grafica. signo porque utiliza la informacion referente de valores bajos en la otra, Reciprocamente, Valores de p bilaterales. Valores de la proba
426 ESTADfSTICA PARA LAS CIENCIAS SOCIALES
[427]
Capitulo 1
1. a) estadigrafo b) inferencia estadistica c) dato
4. a) datos b) datos
5. No son estadigrafos, son datos. Los estadigrafos que pueden calcularse basandose en
estos datos incluyen la proporcion 0 porcentaje de tiros al arco convertidos en goles, etc. Para
una discusion de las proporciones y porcentajes, ver capitulo 2.)
6. (d) 7. (b) 8. (a) 9. (b) 10. (d) 11. (a)
Capitulo 2
1. a) PROPORCION PORCENTAJE b) PROPORCION" PORCENTAJE'
Resulta que la mayoria de los encuestados desean tener mas informacion acerca de los
seismos y como prepararse para afrontarlos. Asi, los resultados contradicen el punto de vista
de que los californianos prefieren no pensar en los seismos.
VICTIMAS DE HOMICIDIO
AGRESIVOS NO AGRESIVOS
1973 20.10 20.98
(PORCENTAJE) (PORCENTAJE)
* La pequefta disparidad resrecto a t 00.00 S8 debe a errores de redondeo.
c) nominal; discontinua
...,
UJ
«
I
17. a) 12.65 b) 4.00 c) 1.26 d) 0.40 e) 0.13 zUJ 30
o
r:r:
18. a) -0.5 a +0.5 b) 0.45 a 0.55 c) 0.95 a 1.05 0
n,
d) 0.485 a 0.495 e) -4.5 a - 5.5 f) - 4.45 a - 4.55 20
N
19. I Xl = 4 2 + 52 + 72 + 92 + 102 + 112 + 142 = 588
10
i=l
(t xf = (4 + 5 + 7 + 9 + 10 + 11 + 14)2
INTENTO FALSA AMOR AMENAZA
60 2 = 3600,
= DE EMBRIAGAR PROMESA FINGIDO DE TERMINAR
A LA CHICA DE LA RELACION
588 =I- 3600 MATRIMONIO
20. a) discreta b) discreta c) continua d) continua c) Los resultados no respaldan la hipotesis. De hecho estan en una direccion opuesta a
e) continua f) discreta la de la hipotesis,
430 ESTADisTICA PARA LAS CIENCIAS SOCIALES RESPUESTAS A EJERCICIOS SELECCIONADOS 431
25. 4. b) i = 3
BERKELEY YALE
INTERVALOS INTERVALOS
Armas de fuego 35 40 DE CLASE DE CLASE
Envenenamiento 26 12
Asfixia 17 20
97-99 1 67-69 2
Ahorcamiento 9 24 94-96 1 64-66 1
Saito desde lugares elevados 9 4 91-93 2 61-63 2
Instrumentos cortantes 4 o 88-90 1 58-60 1
85-87 3 55-57 0
82-84 4 52-54 1
79-81 6 49-51 0
76-78 8 46-48 1
Capitulo 3 73-75 2 43-45 0
70-72 3 40-42 1
1. L1MITES PUNTO
d) 4.5-14.5 9.5 10
90-99 4 80-99 16
e) (- 8.5)-( -1.5) -5 7 80-89 12 60-79 21
f) 2.45-3.55 3 1.1 70-79 15 40-59 3
g) 1.495-1.755 1.625 0.26 60-69 6
h) (-3.5)-(+3.5) 0 7
50-59 1
40-49 2
40-44 39.5-44.5
42 1 1 2.5 0.5-7.5 4
432 ESTAOfsTICA PARA LAS CIENCIAS SOCIALES RESPUESTAS A EJERCICIOS SELECCIONAOOS 433
65-69 1 30-34 6
60-64 2 25-29 5
16
55-59 3 20-24 4
50-54 4 15-19 3 f
12 -
45-49 5 10-14 2
40-44 6 5-9 1
35-39 8 8
9. INTERVALOS INTERVALOS
OL----""
OE CLASE DE CLASE f 112 117 122 127 132 137 142 147 152 157 162
63-67 3 28-32 o PESOS (EN LIBRAS)
58-62 o 23-27 9 14. a) histograma
53-57 7 18-22 o b) histograma 0 curva de frecuencias
48-52 o 13-17 5 c) diagrama de barras
43-47 11 8-12 o
38-42 o1 3-7 1 18.
33-37 14 GRUPO B
351
10. INTERVALOS
OE CLASE
INTERVALOS
DE CLASE f
::~ I\~\'OA
66-67 1 34-35 4
64-65
62-63
60-61
1
1
o
32-33
30-31
28-29
3
o
o
ll
58-59 o 26-27 4
12
11. INTERVALOS
10
DE CLASE
8
60-69 3
50-59 7 6
40-49 11 4
30-39 14
20-29 9
10-19 5 1 I I
67 77 87 97
0-9 1
CALIFICACION
434 ESTADfSTlCA PARA LAS CIENCIAS SOCIALES RESPUESTAS A EJERCICIOS SELECCIONADOS 435
59-61 4 8
56-58 4 4
22.
25.
8
oe{
wU 6
-,z
oe{w
1-0
z
wU
UZ 4
0::
ow
a.O
2
I I I I I
17 27 37 47 57 67
ANO
PUNTOS MEDIOS
0
m 26. 16...------------------,
23. w
a.
z - MAD RES DROGADICTAS
80
0
u ........ RESULTADO GENERAL 12
m 70
EN EL HOSPITAL
Om
1-0 60
oe{:;E
Zoe{ 8
50
80::
z(:J
40
wo
0° 4
LO 30
w N
-
;;foe{
1-0::
Zo
W -
20
10
..-.- ... Uli&ilii::fi ....ww ili£ o
uo::
o::w I
OLL 0
a.~ 1960
PUNTOS MEDIOS
436 ESTADfsTICA PARA LAS CIENCIAS SOCIALES RESPUESTAS A EJERCICIOS SELECCIONADOS 437
11 2
:2 30
10 3
::J
U 9 4
:: 20 8 5
7 6
10 6 7
5 6
I I I I I I I 4 5
0 1
N = 49
b) 8
6
f
4
2
0
8 9
Capitulo 4
29. a) rJl 35
:20:
c) 2.45% d) 0.18% e) 26.73% f) 3.73.%
::Jo
Zc.. 1940 1960 1980
8. b) 57, 76 c) Derecho, 60
ANO
21. y 22. 12. b) MEDIANAS d) Sacando de las medias: i) fa ii) 301 iii) lo
MEDIAS
A. 88.8 F. 42.0 K. 77.2 P. 42.0 U. 42.0 f f Sacando de las medianas: i) 3 4
ii) 30 iii) 7
30 30
3 7 6
*23. 2 4 3
f %
1 1 4
11 2 48 98
15. a) 71.9 b)
78
10 3 46 94
Ul
9 4 43 88
s
Cl 76
8 5 39 80
w
~
7 6 34 69
74
Ul
6 7 28 57
w
z
5 6 21 43
0 72
u
4 5 15 31
«
10 20
u
3 4 u,
2 3 6 12
::::;
«
u
1 2 3 6
0 1 1 2
I I I I I
'20 25 30 35 40 45 50
N = 49
*24. a) 98% b) 45% c) 12% d) 12% e) 24% 17. a) 0.89 b) -5.11 18. 0.25 19. X = 164.94 20. X = 148.44
Capitulo 5
22. incrernentar mediana: (c) 25. 1.83% 26. 2.08
incrementar media: (b)
1. a) X = 5.0 mediana = 5.5 mod a = 8 2. (c)
27. a) media = 30 mediana = 30 moda = 30
4 Todas las medidas de tendencia central estaran reducidas en 5 unidades. MEDIANA MODA MODA
28. a) x (X - X) b) x (X - 27.5) (X - 25) (X - 30)
5. Todas las medidas de tendencia central quedaran divididas por 16.
6. Capitulo 3, problema 13
10
-16 10 -17.5 -15 -20
Capitulo 3, problema 20
30 4 30 2.5 5 0
36 10 36 8.5 11 6
25
-1 25 -2.5 0 -5
d) X = 10.0 e) X = 2.5
32. $4.90
31. $0.49
11. grupo A: mediana; grupo B: media 33. fabricante A: media, mediana 0 moda; fabricante B: mod a
440 ESTADfSTlCA PARA LAS CIENCIAS SOCIALES RESPUESTAS A EJERCICIOS SELECCIONADOS 441
4 5 c) S = 7.89, S2 = 62.25
z
Q 0
0 0.5 1.0 1.5 2.0 2.5 3.0 12. La desviacion estandar esta expresada en las unidades de medida originales, en tanto que
o
~ 1
0.5 1.0 1.5 2.0 2.5 3.0 3.5 la varianza esta expresada en el cuadrado de estas unidades.
:: 2
1.0 1.5 2.0 2.5 3.0 3.5 4.0
~ 3
1.5 2.0 2.5 3.0 3.5 4.0 4.5
13. X = 68.25, S = 7.61
<{
a
z 5
:l
4
2.0
2.5
2.5
3.0
3.0
3.5
3.5
4.0
4.0
4.5
4.5
5.0
5.0
5.5
ENERO 1965 ENERO 1966 MAYO 1965 MAYO 1966 -----
l'l 6
3.0 3.5 4.0 4.5 5.0 5.5 6.0 76.90 70.42
6.0 1
S2 94.48 88.17 90.82 85.19
5.5 2
5.0 3
3.0
Burlington: S2 = 0.42; S = 0.65
7
2.5
Honolulu: S2 = 1.30; S = 1.14
6
2.0
Seattle-Tacoma: S2 = 3.31; S = 1.82
5
1.5 4
21. a) S2 = 471.04, S = 21.70
1.0 3
b) S2 = 287.37, S = 16.95
.5 2
c) S2 = 133.31, S = 11.55
o 1
N= 49
Capitulo 7
Capitulo 6
3. a) i) 0.3413; 341 ii) 0.4772; 477 iii) 0.1915; 192 iv) 0.4938; 494
1. S2 = 1.66, S = 1.29
b) i) 0.1587; 159 ii) 0.0228; 23 iii) 0.6915; 692 iv) 0.9938; 994 v) 0.5000; 500
3. S~lamente la des~iaci6n estandar satisface estas condiciones. Sin embargo, si las propie 4. a) aritrnetica: z = 1.21; cornprension verbal: z = 0.77; geografia: z = -0.29
dades mcluyen potencias de la constante, la varianza quedaria calificada como una medida de b) aritmetica; geografla
7. a) z = -0.67 b) z = 0.67
5. Todas las calificaciones tienen el mismo valor
X = 63.96 X = 80.04
6. a) 3.52 b) 2.31 c) 5.89 d) 0 c) z = 1.28 d) z = 0.67
X = 87.36 calificacion por encima de 25.14 %
7. La distribuci6n es extremadamente sesgada hacia la derecha. Las desviaciones extremas e) z = -0.5 f) z = - 0.67 Y z = 0.67
aumentan el valor de la desviacion estandar. calificacion por debajo de 30.85 % 63.96 - 80.04
8. a) 10 b) 8 c) 20 d) 0 g) z = ±1.64 h) z = ±2.58
8. fl = 72, (J = 8: 9. Las relaciones no lineales dan lugar a coeficientes de correlacion r de Pearson indebida
a) 66.64 b) 77.36 mente bajos.
c) 82.24 d) z = 1.00 10. Si el rango esta muy restringido (rango truncado), la r de Pearson sera indebidamente
e) z = -0.75 calificacion por encima de 15.87 %
baja.
calificacion por debajo de 22.66 % f) 66.64 - 77.36
g) debajo de 58.88
h) debajo de 51.36 n. r = -0.7728 12. r = 0.7614
encima de 85.12
encima de 92.64 13. a) r = -0.8924 b) r = -0.8720 c) r = 0.9729
8. fl = 72, (J = 4: 14. r =
0.85; rs = 0.81. Parece que existe una alta correlacion positiva entre las presiones
a) 69.32 b) 74.68 sanguineas de los sujetos durante las sesiones de control y de acondicionamiento.
c) 77.12 d) z = 2.00 15. rs = -0.21. Parece que existe una pequefia relacion negativa entre la cantidad de
e) z = -1.5 calificacion por encima de 2.28 % medicamento y el cambio en la presion sanguinea resultante de los procedimientos de aeon
calificacion por debajo de 6.68 % f) 69.32 - 74.68 dicionamiento.
g) debajo de 65.44 h) debajo de 61.68
16. a) r = 0.1412
encima de 78.56 encima de 82.32
b) PORCENTAJE DEL COSTO COSTO PORCENTAJE DEL COSTO COSTO
8. fl = 72, (J = 2: 9. prueba 2, prueba 1 POR ACCION POR ACCION POR ACCION POR ACCION
a) 70.66 b) 73.34
3.82 34 8.17 29
c) 74.56 d) z = 4.00
2.43 23 2.20 15
e) z = - 3.00 calificacion por encima de 0.003 %
1.14 7 2.57 14
calificacion por debajo de 0.13 % f) 70.66 - 73.34
1.50 6 3.92 40
g) debajo de 68.72 h) debajo de 66.84
4.17 48 10.12 30
encima de 75.28 encima de 77.16 14.38 8
8.86 22
10. No; los valores z rellejan simplemente la forma de la distribucion de la cual provienen. 6.32 28 1.55 44
Las variables que se distribuyen norrnalrnente daran lugar a valores z distribuidos normal 0.35 20 6.64 11
mente. 7.85 46 2.03 34
7.59 22 0.46 35
11. La distribucion normal incluye una familia de curvas en forma de campana, una de las
4.43 21 5.18 17
cuales es la distribucion normal estandar ().l = 0, (J = 1.0). 7.62 16
6.71 14
12. a) 26 b) 65 c) 45 d) 50 6.22 27 3.50 42
2.10 41 4.00 40
13. a) -2.7 b) 0.0 c) 2.8 d) 1.4 e) -0.4 7.34 50
3.68 19
14. Cuanto menor sea la desviacion estandar, menores seran las desviaciones de las 7.00 41 1.94 18
calificaciones respecto a la media. Cuando se usa la media para predecir una calificacion dada, 5.78 37 8.58 45
el error sera menor, en promedio, cuando la desviacion estandar sea pequefia. En el caso 3.00 28 4.68 34
limite, cuando s = 0.00, todas las calificaciones son identicas, No hay error en la prediccion. 8.75 12
17. El grado de relacion es el mismo en ambos casos. Sin embargo, la relacion es positivaen el
primero y negativa en el segundo.
Capitulo 8 b) rs = -0.9406 20. r = 0.330; rango
18. rs = - 0.9705 19. a) r = - 0.9536
1. r = 0.8466 2. r = 0.9107 3. r, = 0.906 truncado
I
5. a) relacion no lineal b) rango truncado c) rango truncado 21. ,. = - 0.598; rango truncado 23.
24. c) d)
5.0 5.0 I
Y
4.0 e • • • • •
4.0 "-- (multiPlicando IX 2 por ~)
•• • 3.0 "-- •
• ••
•• •••
3.0 -
Asi,
-• •
Y y
2.0 l
•• • • NIXY - (IX)(IY) NIX 2 - (IX)2
.
2.0 NIXY - (IX)(IY)
1.0 e- • • •• .... •• by = N -;- N = NIX 2 - (IX)2 .
\
I I T
1.0
• •
0.0 \
0.0 I I I I I 15. Puesto que Y = a + b}'x y a == Y- byX, tenemos que
1.0 2.0 3.0 4.0 5.0 1.0 2.0 3.0 4.0 5.0
X X Y' = Y - byX + b.X 0 Y' = Y + by(X - X).
Puesto que
25. a) (c) b) (a) c) (d) d) (b)
1. Y' = 3 - 0.9(X - 3)
16. a) r = 0.9584
2. a) 1.72 b) 118.48 c) SO'I y = 0.3928
b) Y' para 3 = 3.222 Y' para 4 = 4.139
3. a) 1.59 b) So"y = 0.47; SO'l'" = 11.20 c) 0.1296 Y' para 5 = 5.055 Y' para 6 = 5.972
4. Cuando r crece, el angulo formado por las rectas de regresi6n decrece, En los casos Iirnites Y' para 9 = 8.722 Y' para 10 = 9.639
(r= ± 1.00), las rectas de regresi6n coinciden. Cuando r = 0, las rectas de regresi6n forman un Y' para 11 = 10.556
angulo recto.
.c) 54.889 d) 4.473 e) 50.424 f) 0.919
5. 9.0; la desviaci6n estandar para un grupo con el mismo CI es el error estandar de la 17. a) 5.56 b) 4.16 c) 0.857
estimaci6n: Se't)' = SyJ1="? = 9. 18. a) 4.19, 0 moderadamente feliz.
b) 8.76, 0 perfectamente feliz, porque la calificacion predicha esta mas alia del limite
6. a) 0 b) 0.60 c) 1.20 d) 1.5 e) -0.75 f) -1.20 superior de la escala.
7. a) Y' = 89.17 c) 0.03, 0 menos que una vez en el periodo de estudio de 35 dias,
b) La proporcion (p) de area correspondiente a una calificacion de 110 0 mayor es de d) 1.18 cuando el predictor es la frecuencia de relaciones sexuales, y 1.12 cuando el
0.0031
8.a)r=0.9398
c) X = 31.54
g) 500,93,93, 907
d) p = 0.4129 e) p < 0.00003
b) 50,40,60,70
C
f) X = 68.64
.
1/. t
01 Vvu.Oy
C'0.Jl/,L LI Q(\ L:;>/C)
!...!)...rye v'
(':':e 1Y\\I.\'r\-'~Y'OI'\ Y'19) ~
~
I J ~ '::,
predictor es la frecuencia de las discusiones.
e) 49.7 % queda explicada por la frecuencia de relaciones sexuales, y 54.7 % queda
explicada por la frecuencia de las discusiones. .
f) 0.50 tomando como predictor la frecuencia de relaciones sexuales, y 0.45 tomando
10. a) 33.35 b) p = 0.1539 c) 46.82 e) 53.19 . como predictor la frecuencia de las discusiones.
f) si: p = 0.4840 g) Iii; p = 0.2912
11. a) r = -0.8450 b) 3.78 Revision de la segunda parte - Estadistica descriptiva
12. Las rectas de regresion seran identicas cuando r = ± 1.00 1. A. 200
50
Puesto que NIN = 1, podemos multiplicar IXY por NIN sin cambiar su valor. Asi,
I I I I
2 3 4 5 6 7 8 9 10
POSICION FINAL
446 ESTAOisTICA PARA LAS CIENCIAS SOCIALES RESPUESTAS A EJERCICIOS SELECCIONAOOS 447
1. B. (1) 11.70 (2) 142.5 (3) 3.74 C. (1) r s = 0.106 (2) r = -0.185 b)
0.20
2. A. 40,-----------------~
0.16
C
30 «
c
:::J 0.12
cc
«
cc
20 0
a: 0.08
e,
0.04
0.00 9
0 2 3 4 5 6 7 8
'54 '58 '60 '62
MEDIA MUESTRAL CUANDO N =3
ANO
2. Una desviacion extrema es mas rara conforme aumenta el tamafio de la muestra.
2. B.
3. a) 0.0625;0.0156 b) 0.1250;0.0312 c) 0.3750;0.3125 d) 0.7500;0.6250
5
f 3
6. (a) y (b) c) Media = 0.00;
2 x pIX)
4 1 0.0123
3 4 0.0494
O'--------L----'-----4--!!::=:=:!I'-----40-.....J:--¥------.J 2 10 0.1235
7.6 7.8 8.0 8.2 8.4 8.6 8.8 9.0 9.2 1 16 0.1975
-1 16 0.1975
-3 4 0.0494
Capitulo 10 -4 1 0.0123
I. a) Nx = 81 ij(Xj = 1.000
a ,
«
a 8. a) 0.1250 b) 0.1250 c) 0.3750 d) 0.5000
:::J
0.15
rn
d) 0.4231
« 9. a) 0.0192 b) 0.0769 c) 0.3077
co
0
0.10
a:
n, 10. Problema 1: a) 7 a 1 en contra, b) 7 a 1 en contra
Problema 2: a) 51 a 1 en contra, b) 12 a 1 en contra
0.05
II. a) 0.1667 b) 0.1667 c) 0.2778 d) 0.5000
14. a) 0.0156 b) 0.4219 c) 0.0123 13. Sf. HI bilateral: hay diferencia en la velocidad de acuerdo con los diferentes niveles de
15. a) 0.0838 b) 126.40 c) <68.64 y > 131.36 d) 0.4648
estimulo, HI unilateral: la velocidad es mayor cuando el estfmulo es mas fuerte.
e) i) 0.0070 ii) 0.2160 iii) 2(0.3895) = 0.0779
14. No. Las unicas desviaciones que se tiene en cuenta son las que estan en la direccion
16. (b) 17. p = l4 especificada por HI'
= 0.20 = 0.04 15. (b)
18. a) p b) p c) p = 0.80 d) p = 0.64
16. a) 1 b) 10 c) 5 d) 60 e) 50 f) 95 g) 4 h) 100
19. a) 0.6561 b) 0.0001 c) 0.3438
17. a) (h) b) (a) 18. a) (h), tipo I b) (a), tipo II
20. a) p = 0.0456 b) p = 0.0021 c) p = 0.9544
19. Basandonos en los datos, rechazariamos H o. Sin embargo, puesto que H o es verdadera,
d) p = 0.9109 e) p = 0.0228 f) p = 0.000520
23. a) t b) l6 c) ~~ 21. No podemos rechazar H o. Puesto que H o es falsa, no hemos podido rechazar una falsa
H o- Por tanto, hemos cometido un error del tipo II 0 tipo p.
24. a) 0.40 b) 0.12 c) 0.16 d) 2(0.0336) = 0.0672 22. Rechazamos H o. Puesto que H o es falsa, hemos tornado una decision correcta.
25. a) p = 0.3085 b) p = 0.2266 c) p = 0.4649
23. Rechazamos H o. Puesto que H o es falsa, hemos tornado una decision correcta.
f) p = 0.0947 g) p = 0.3296
24. La probabilidad de cometer un error del tipo I es igual a 0:. En el caso presente, 0: = 0.05.
Capitulo 11
Capitulo 12
2. a) En el caso de que este involucrado un aspecto teorico critico, el hecho de cometer un 1. a) Cuando se incrementa el tamaiio de la muestra, la dispersion de las medias muestrales
error del tipo I podria llevar a una conclusion falsa respecto a la validez de la teoria. decrece.
b) En muchos casos en los que se estudian los efectos toxicos de nuevas drogas, la b) Cuando se incrementa el mimero de muestras, es mayor la posibilidad de obtener
hipotesis nula consiste en que la droga no tiene efectos adversos. En el caso de un valores extremos de la media muestral. Por ejemplo, supongase que la probabilidad de
error del tipo II, podria ocurrir que una droga toxica quedase introducida en el obtener una media muestral de un valor dado es 0.01. Si el numero de muestras
mercado.
extraidas es 10, no se obtendra probablemente ninguna media muestral con ese valor.
3. No puede demostrarse la validez de la hipotesis nula. EI hecho de no poder rechazar la Sin embargo, si se extraen 1000 muestras, deberia esperarse obtener aproximadamen
hipotesis nula no constituye demostracion de que es correcta. te 10 medidas muestrales con valores tan extremos como el valor dado, de modo que
4. Todos los experimentos incluyen dos hipotesis estadisticas: la hipotesis nula y la hipotesis la probabilidad de su realizacion seria 0.01.
alternativa. Se proyecta el experimento de modo que el rechazo de la hipotesis nula lleve a la 2. Supongase que tenemos una poblacion en la que la media es igual a 100 y la desviacion
afirrnacion de la hipotesis alternativa. estandar es igual a 10. La probabilidad de obtener valores tan extremos como 80 0 menos, 0
5. H o : La velocidad es igual bajo los diferentes niveles de estimulo.
1200 mas (±2 desviaciones estandar) es 0.0456, menos del 5 %. La probabilidad de obtener
HI: Hay diferencia en la velocidad segun sean los niveles de estimulo.
valores aun mas extremos (por ejemplo, 50, 60, 70 0 130, 140, 150) es todavia menor. Asi,
deberiamos esperar que en una muestra dada se presentasen muy pocos (si es que hubiera
6. a) H o b) HIe) HId) H o alguno) de estos valores extremos. Puesto que el valor de la desviacion estandar es una funcion
7. a) tipo II b) tipo I c) no hay error d) no hay error directa del numero de valores extremos, la desviacion estandar de una muestra subestimara de
ordinario la desviacion estandar de la poblacion,
8. a) tipo II b) tipo II c) no hay error
3. a) 21.71-26.29 b) 20.82-27.18 4. a) 23.28-24.72 b) 23.05-24.95
9. Es mas probable que se este aceptando una falsa H o, puesto que es bastante pequeiia la
probabilidad de que el suceso observado ocurra por azar (p = 0.02). 5. Se rechaza H o : z = 2.68, donde ZO.OI = ±2.58
10. Simplemente por azar, cab ria esperar que cinco diferencias fueran estadisticamente 6. Se acepta H o ; t = 2.618, donde t o.OI = ±2.831, gl = 21
significativas al nivel 0.05. 7. En el problema 5 se conoce el valor de la desviacion estandar poblacional; podemos
11. Simplemente por azar, cabria esperar que cinco diferencias fueran estadisticamente emplear asi el estadigrafo Zy determinar los valores de la probabilidad en terminos de areas
significativas al nivel 0.01. bajo la curva normal. En el problema 6 se desconoce el valor de la desviaci6n estandar
12. Sf. poblacional, y debemos estimarlo mediante los datos muestrales. Asi, el estadigrafo empleado
es el cociente t.
450 ESTADfSTICA PARA LAS CIENCIAS SOCIALES 451
RESPUESTAS A EJERCICIOS SELECCIONADOS
Puesto que las distribuciones t son mas dispersas que la curva normal, la proporcion de area a
29. Las distribuciones t son mas dispersas que la curva normal. Asi, la proporcion de area a la
la derecha de un valor especifico de t es mayor que la proporcion de area a la derecha del
derecha de un valor especifico de t es mayor que la proporcion de area a la ~erecha del
correspondiente valor de z. Se requiere asi un mayor valor de t para marcar los hmites de la
correspondiente valor de z. Conforme aumenta el mimero de grados de libertad, las
region critica 0 de rechazo. En el problema 5, el valor absoluto de la z obtenida debe ser igual 0
distribuciones t se aproximan cada vez mas a la curva normal.
mayor que 2.58. En el problema 6, el valor absoluto de la t obtenida debe ser igual 0 mayor
que 2.83.
30. a) X, - x2 pIX, - J(2) cs!
Generalizando: la probabilidad de cometer un error del tipo II es menor cuando conocemos la
desviacion estandar poblacional. 9 1 0.0083
8 2 0.0165
8. Se rechaza H 0; t = 2.134, donde t o.0 5 = 1.833 (prueba unilateral), gl = 9
7 5 0.0413
9. a) z = 2.73, p = 0.9968 b) z = -0.91, p = 0.1814
6 10 0.0826
c) z = 1.82, p = 0.0344 d) p = 0.6372
5 14 0.1157
4 18 0.1488
10. a) 36.70-43.20 b) 35.79-44.21 I l. a) t = 1.706 b) t = 11.19
3 21 0.1736
12. t == 2.083, gl = 25 13. 27.14-32.08 14. t = 1,75, gl = 625 15. 263.34-273.66 2 18 0.1488
1 14 0.1157
16. a) Ji = 6.0, a = 3.42 17. a) p = /5 b) P = h c) p = 1
85
d) P =0
0 10 0.0826
18. a) p = /2 b) P = /2 c) P = ~ d) p = -if; -1 5 0.0413
-2 2 0.0165
19. X- Jio = 0.42, Sx = 0,2315, t = 1.814, gl = 7
-3 0.0083
1
20. X- Jio = 1.38, S.Y = 0.58, t = 2.379, gl = 9
Nil, -II, = 121 L.PIX1 - X2 ) = 1.0000
21. La conclusion depende de la naturaleza de la hipotesis alternativa. Si HIes direccional y
usamos o: = 0.05, rechazamos H 0 ya que el valor 0.438 obtenido para r s es mayor que el valor
requerido (interpolando para N = 17, el valor critico de r s para o: = 0.05, prueba unilateral, es b) La media de las diferencias es igual a 3. La media de la distribucion muestr~l de las
0.412). Sin embargo, si usamos una prueba bilateral, debernos aceptar H o diferencias entre medias es igual a la diferencia entre las medias de las poblaciones de
22. EI valor critico de rs para N = 25 (rx. = 0.05, prueba bilateral) puede obtenerse por las cuales provienen estas muestras.
interpolacion: 0.409 para N = 24, 0.392 para N = 26; asi, el valor critico para N = 25 es · -
31. a) H 0'Jil-Ji2'. 0 sea , son iguales las dos poblaciones de medias de las cuales se toman
00400. Puesto que el valor absoluto de la I"s obtenida es menor que el valor critico, aceptamos las muestras. . . ..'
u.. b) La distribucion muestral de las diferencias entre las medias bajo la hipotesis nula.
23. a) z = 1.01 b) z = 1.99
24. Los estadigrafos usados para describir la distribucion de una muestra son X (media) y S c) XI - X, p(XI - X,l
(desviacion estandar). El estadigrafo usado para describir la distribucion de un estadigrafo
6 1 0.0083
muestral son la media (Jix) y el error estandar de la media (ax).
5 2 0.0165
25. S2 no es un estimador no sesgado de a 2 . Cuando usamos N en el denominador de la 4 5 0.0413
formula de la varianza, subestimamos la varianza poblacional (S2 = SCIN). 3 10 0.0826
2 14 0.1157
26. 52 es un estimador no sesgado de a 2 puesto que se usa N - I en el denominador de la
1 18 0.1488
formula S2 = SCj(N - 1).
0 21 0.1736
27. Al intervalo dentro del cual es probable que este la media poblacional se Ie llama intervalo -1 18 0.1488
de confianza. -2 14 0.1157
-3 10 0.0826
28. Usando el ejernplo dado en la seccion 12.7 del texto, obtenemos el intervalo de confianza -4 5 0.0413
de 99 %: -5 2 0.0165
-6 1 0.0083
limite superior = 108 + (2.787)(3.0) = 116.36,
limite inferior = 108 - (2.787)(3.0) = 99.64.
32. a) 0.0496 b) 0.0083 c) 0.1487 d) 0.0166 e) 0.0083
Asf, los limites del intervalo de confianza de 991'~ son 99.64-116.36, en tanto que los limites del 33. a) 0.2644 b) 0.1487 c) 0.0083 d) 0.1487 e) 0.0000
intervalo de confianza de 95 % son 101.82-114.18.
35. t = 4.28 36. '1"(0.05) = 0.450 37. t=4
452 ESTAOfSTICA PARA LAS CIENCIAS SOCIALES RESPUESTAS A EJERCICIOS SELECCIONAOOS 453
38. a) Casados: t = 5.219, gl = 51, p < 0.05 18. a) p = 0.7778 b) p=0.6111 c) p = 0.3889 d) p = 0.2222
Divorciados: t = 0.329, gl = 22, no significativo e) p = 0.0833 f) p = 0 g) p = 0.4722
b) Casados: t = 1.688, gl = 51, no significativo
0.500
N crece.
Capitulo 14
l. t = 3.027, gl = 16; se rechaza H O'
16 25
N 2. t = 2.08. gl = 32; se acepta H o
8. t = 2.148, gl = 14 9. t = 2.913, gl = 18 10. t = 2.304, gl = 26 3. t = 1.571, A = 0.465, gl = 9; se acepta H o·
11. a) SCI =13696.06, SC z = 24027.66 b) SCI = 910.32, SC z = 1590.21 4. r s entre la posicion final y los home runs en la Liga Americana es 0.04; para la Liga
Xl = 17.82, K z = 19.59 K t = 1.75, X z = 1.61 Nacional es 0.36. Ambas correlaciones son demasiado bajas para que se justifique eI uso de
t = 7.080, gl = 1632 t = 2.333, gl = 1632 muestras correlacionadas.
(1Jz = 0.029 (jJz = 0.003
5. t = 1.590, gl = 18, se acepta H o- EI cociente t obtenido esta mas cercano a la region de
12. SCI = 88.06, SC z = 93.64 13. t = 2.224, gl = 28 14. t = 0.583, gl = 34
X I = 1:37, X z = 1.09
rechazo porque el nurnero de grados de Iibertad es mayor (18 frente a 9) cuando usamos
t = 0.994, gl = 95
muestras independientes.
15. t = 1.864, gl = 126, p < 0.05, prueba unilateral, (1Jz = 0.019 6. a) Mayor riesgo de un error del tipo II a causa de la perdida de grados de libertad.
16. a) falso b) verdadero c) falso b) Menor riesgo de un error del tipo II a causa de la mayor sensibilidad del error estandar
de la diferencia.
17. 9 X, - Xl
7. a) A = 0.048 b) A = 0.048 c) A = 0.778 8. A = 0.199
8
5 1
... 104.82 - 100
4 2 9. Fabricante A: t = - -1.63
- - - = 2.96' ~ul = 10'.
6 3 5
f 5 2 6 101.91 -100
1 8 Fabricante B: t = - -1.39
- - - = 1.37. ~ul = 10.
4
0 6
3 -1 5 Usando = 0.05 (prueba bilateral), aceptamos H o para By rechazamos H o para A.
IX
-2 2
2 10. Fabricante A: A = 0.195; fabricante B: A = 0.573 11. A = 0.216 12. A = 5.480
-3 1
13. A = 0.226 14. A = 0.230 15. A = 0.422 16. A = 1.625 17. t = 8.22
0
-3 -2 -1 0 1 2 3 4 5 18. A = 0.3056 19. A = 0.6406 20. A = 0.3696 21. A = 19
X'-X2 22. A = 0.295
454 ESTAOiSTICA PARA LAS CIENCIAS SOCIALES RESPUESTAS A EJERCICIOS SELECCIONAOOS 455
23. a) A = 0.266, gl = 4. Puesto que este valor es menor que el valor critico de 0.304, 10. FUENTE SUI\.A GRADOS ESTIMACION
rechazamos H o' Los varones heterosexuales muestran mayor respuesta pupilar ante DE VARIACION DE CUJ\DRADOS DE L1BERTAD DE LA VARIANZA
las fotograffas de mujeres que ante las fotografias de hombres.
b) A = 0.494, gl = 4. Puesto que este valor es mayor que el valor crftico de 0.304, no Entre grupos 12.067 1 12.067 3.102
podemos rechazar H o· No hay evidencia estadistica significativa de que los varones Dentro de grupos 108.934 28 3.8905
hornosexuales muestren mayor respuesta pupilar ante las fotograffas de hombres que
Total 121.0 29
ante las fotografias de mujeres.
c) t = 3.472, gl = 8. Puesto que este valor es mayor que el valor critico de 2.306,
rechazamos H o- Existe una respuesta diferente de los varones heterosexuales y de los
varones homosexuales ante las fotografias de hombres y de mujeres.
11. FUENTE SUMA GRADOS ESTIMACION
24. Como estadistico, el lector queda impresionado al rechazar H o con una N pequefia. La
DE VARIACION DE CUADRADOS DE L1BERTAD DE LA VARIANZA
razon es que el efecto del tratamiento ha de ser grande, en relacion con el error estandar de la
diferencia, para rechazar H 0 cuando N es pequefia. Dada una N bastante grande, serian Entre grupos 919.793 3 306.598 6.43
rechazadas virtualmente todas las hipotesis nulas. En muchos casos el efecto descrito seria Dentro de grupos 954.167 20 47.708
trivial.
Total 1873.96 23
25. a) t = 4.432, gl = 43, p < 0.05 b) t = 3.69, gl = 44, p < 0.05
c) Antes: limite inferior = 1.04; limite superior = 1.59. Despues: limite inferior = 1.60;
limite superior = 2>.67
2. Todas las comparaciones son significativas al nivel 0.01. Esta claro que el menor indice de Total 44.00 14
mortalidad corresponde al verano, y luego siguen, en orden creciente, la prirnavera, el otofio y
el invierno.
3. F = 0.643 13. La unica cornparacion significativa al nivel 0.01 es entre el grupo C y el grupo A.
4. Cuando usamos el nivel 0.05, una de cada veinte comparaciones sera significativa por
azar. Asi, una diferencia significativa, al nivel 0.05, en uno de cada diez estudios puede ser
14. FUENTE SUMA GRADOS ESTIMACION
atribuida al azar.
DE VARIACION DE CUADRADOS DE L1BERTAD DE LA VARIANZA
5. F = 0.30, gl = 3/12.
Entre grupos 285.431 2 142.716 1.606
6. F = 10.43, gl = 2/12, DHS = 7.16 Dentro de grupos 2843.312 32 88.854
8. Si el cociente F es menor que 1.00, concluimos que los gfupos provienen probablemente
de la misma poblacion,
ESTIMACION
DE VARIACION DE CUADRADOS DE L1BERTAD DE LA VARIANZA
Entre grupos 15.8645 3 5.288 15.57
Entre grupos 1.083 2 Dentro de grupos 6.7917 20 0.3396
0.5415 0.6228
Dentro de grupos 13.042 15 0.8695
Total 22.6562 23
Total 14.125 17
Comparaci6n de A y 8 DHS = 1.19 para a. = 0.01.
456 ESTAOfSTICA PARA LAS CIENCIAS SOCIALES
RESPUESTAS A EJERCICIOS SELECCIONAOOS 457
DE L1BERTAD DE LA VARIANZA Paso 3: el valor critico de X tiene un valor z en la distribucion bajo H 1 de -1.67.
7. X2 = 1.941, gl = 1
Iodice de materias
6 5 4
3 2 o
A de Sandler, 267
potencia, 309, 310
4095
15625 15625 15625 15625 tras correlacionadas, 267, 268
325
9. X2 = 2.185, gl = 1
Analisis de la varianza (vease tarnbien Co
Causalidad y correlacion, 159-161
10./0= 5 15
ciente F), 276-300
Cero, absoluto, 25
J. = 10 10
clasificacion:
arbitrario, en escalas de intervalos, 25, 26
Z - 10 + 10 = 5.00.
simple, 287, 288
I'ianza)
z
2
=
((5 - 10))2
,)5.00 = 5.00 = <. de tres grupos, 284, 285
13. x = 28, N = 46 (tabla M), valor entice = 31; no podemos rechazar H 0 descomposicion de la sum a de cuadrados,
Coeficiente (vease tam bien I' de Pearson: rs de
2 290-296
Spearman)
14. X = 20.452, gl = 1 15. Z2 = 12.5, gl = 2 16. 7. 2 = 3.5, gl = 2
Capitulo 18
pruebas de comparaciones multiples, 286
de determinacion, 158
probabilidad, 189-191
parametres:
Correlaci6n (veanse tambien r de Pearson,
conocidos, 219-221
reqresion y prediccioll, rs de Spearman),
simetrica, 53
definicion, 420
formulas, 98-101
Enfoque, de la probabilidad:
t, 226-229
y, 177, 202
negativa, 123
y distribuci6n normal estandar, 1'07-121
Error alfa (ex), 207, 208
definicion, 421
positiva, 123
Desviacion media, 97
aleatorio, 259
sigllo)
transforrnacion de I' a z, Tabla F, 381
como estimacion del error, 97
Distribucion de frecuencias (vease tam bien desviacion estandar como estimacion del,
y causalidad, 159-161
definicion, 421
Graficas, tipos de), 39, 41-43
117,118
Curva de frecuencias, definicion, 420
Diagrama:
tipo I (vease Error del tipo I)
acumuladas, 44, 45
acumuladas, 52
de barras, 46, 47-49
. tipo II (vease Error del tipo II)
agru padas, 42
Chi-cuadrado, 326-333
media, 243
estimacion, 245, 246
45
definicion, 421
ojiva, 54
definicion, 421
de la media, 216-219
111-1/3
bimodal,54
tabla de proporciones, Tabla A, 369
definicion, 422
binomial, 202
calificaciones estandarizadas, 107, 110,
muestras correlacionadas, 262, 263
111
agrupados, 39-43
acumuladas, 44
Error del tipo I:
ecuaci6n, 111
en intervalos de clase, 42
agrupadas, 42
probabilidad, 187-188
definici6n, 422
categoricos, 6, 24
no agrupadas, 77, 79
propiedades, 52, Ill, 112
prueba de hipotesis y, 208-210
de atributos, 24
del cociente F, 250
representaci6n grafica, 53
y comparaciones de varios grupos, 276,
de escala, 8
en forma de J, 54
277
de frecuencias, 6, 8, 24
en forma de U, 54
Y desviacion estandar, 107-119
y potencia, 305, 306, 311, 316
enumerativos, 6, 24
Ieptocurtica, 52
Distribucion normal estandar, area entre Error del tipo II:
Decision en una prueba de hipotesis, 202-205
rnesocurtica, 52
dos puntos, 112, 113
definicion, 422
cion estandars
ojiva, 54
Escala de razones, 25
calculo de la:
porcentaje acumulado, 45
definicion, 422
Eje:
99-101
proporcion acumulada, 44, 45
prueba de hipotesis, 337-348
errores, 102
rectangular, 53
I' de Spearman, 133-135
rangos y, 24
curva J, 54
Libertad, grados de (vease Grados de liber
del tipo I, 207, 208
tad) .
representacion grafica, 50
diagrama de dispersion, 124, 126, 132,
Escalas de medida:
152, 153
Lirnites, aparentes, 43
continuas, 26, 27
231
frecuencias acumuladas, 44, 45
discontinuas, 26, 27
grafica «[Gee Whiz!», 45
de numeros, 27, 28
discretas, 26
hipotesis:
grafica lineal, 54, 55
intervalo, 25
histograma, 49-51
verdaderos, 27, 28
alternativa, 205
nominal, 22-24
ojiva, 54
Limites verdaderos de numeros, 27, 28
nula, 205
Linealidad, hipotesis de, efecto sobre la co
ordinal, 24
porcentajes acumulados, 44
definicion, 422
ca, 342-345
descriptiva, 6, 8, 9
pararnetrica, 259, 262-267
Heterogeneidad de la varianza, 250
inferencial, 6, 10
nivel de significacion, 202-205
Media:
alternativa, 205
error estandar de la, 216-219, 221, 224,
definicion, 422
region critica, 220, 221
direccional, 205
Estadistica inductiva, 6, 10 \
poblacional, estimacion de la, 231-234
definicion, 422
rencia entre medias, 243, 245
Factoriales, 324
error del tipo I, 208, 316
varianza:
112
53
Hipotesis nula (H 0)' 205
Frecuencia, 29
Histograma, 49-51
acumulada, 44
Homogeneidad de la varianza, 250, 251
observada, 327
Estimadores:
distribucion de frecuencias no agrupa
relativa esperada, 178
unificados, 245
tico de hipotesis, Pruebas estadisticas)
definicion, 423
conocidos, 219-221
desiguales, 49-51
efecto de los valores extremos, 80
A de Sandler, }67
distribucion muestral, 216-219
limites de, 43 \
ponderada, 81, 82
procedimiento, 42
suma de los cuadrados de las desviaciones
proposito de los, 39
respecto a la, 80
no parametrica, 304
suposiciones concernientes a la distribu
Mediana, calculo a partir de una ordenacion
y rangospercentiles, 63
curva de frecuencias, 52
caracteristicas de la, 83
Nivel de significacion, 202-205
acumulados, 44, 45
comparaciones a priori 0 planeadas,
definicion, 423
en relacion al error del tipo I, 207, 208,
309, 310
Pruebas de significacion de distribucion li
relacion con los rangos percentiles en, 82
305
caso de dos muestras, 313, 314
bre (vease Pruebas no parametricas)
valores indeterminados, 84
nivel alfa (IX), 204
concepto de, 305-308
Pruebas estadisticas (vease tambien Examen
y sesgo, 84, 85
y potencia, 305, 306, 311, 316
definicion, 424
estadistico de hipotesis)
Medias, diferencia entre (vease Diferencia Normalidad, hipotesis de, 112, 113
efectos de, nivel alfa, 311
eficiencia, 316, 317
entre medias; tam bien Muestras co Notacion maternatica, 15, 17, 18
medidas correlacionadas, 315
prueba DHS, 286
errores de, 28
cardinales, 21
parametricas, 312, 313
345
83, 84
limites verdaderos, 27, 28
aleatoriedad, 175-177
binomial, 321, 324, 325
definicion, 423
tipos de, 20, 21
condicional, 185
cornparadas con las parametricas, 312,
'bucion normal) 1
sesgada, 176
xon, 343, 345
prueba del signo-rango de Wilcoxon, 343
Ojiva, 54
modelo binomial, 321, 324, 325
343-345
de fa) formulas, 338-340
Muestreo aleatorio
definicion, 424
Prueba del signo-rango de Wilcoxon, 343
calculo de la, metodo de la desviacion
definicion, 424
desviacion estandar, 97
345
media, 128, 129
parametro, 6
Pruebas de comparaciones multiples, com
definicion, 425
Y varianza, 98
reglas, 18-20
transformaciones a z, 236
construccion de la, 151, 152
dependiente, 54-56
y valores z, 126-128
t, distribucion, 2:'8
159
Chi-cuadradoi
cualitativas, 289
rs de Spearman, 122
negativa, 123
grados de libertad, 227
definicion, 426
calculo, 133
positi va, 123
grados de libertad, 264
relacion:
definicion, 425
homogeneidad de la varianza, 250, 251
Rango,93
62
prueba, muestras correlacionadas, 262
Variables:
definicion, 425
distribucion normal, 53
267
serni-intercuartil, 93-95
escalas:
tabla para la, Tabla C, 373
truncado, 132 1
de cocientes en, 50-52
val ores criticos, 229
cualitativas, 289
cuantitativas, 289
experimentales, 54-56
independientes, 54-56
Variacion:
calculo a partir de: una grafica de porcen
rectas de regresion, 151-153
l,por que describirla?, 76
explicada, 157-159
no explicada, 157-159
definicion, 425
Sesgo, 176
mediana, 83, 84
y r de Pearson
formula, 67
Sesgo, de una distribucion, 54
medida de, 76-91
explicada, 157-159
no explicada, 157-159
transforrnacion lineal, 67
positivo, 54
Teorerna del limite central, 218, 219
Varianza:
Razones, 29-31
Significaci on, nivel de, 204
Totales marginales, 328
Redondeo, 28, 29
independientes, 183, 184
Universo, definicion, 6
homogeneidad de la, y cociente t, 250, 251
Regresion:
relacionados 0 dependientes, 184, 185
hipotesis, 205
Varianza residual, 152-156
curvilinea, 130
Sucesos independientes, 183, 184
probabilidad, 189-191
definicion, 426
prediccion)
Suma de cuadrados, y recta de mejor ajuste,
y error estandar de la estirnacion, 154
muestral, 149
entre grupos, 277-281
calculo del estadigrafo T, 344