Documentos de Académico
Documentos de Profesional
Documentos de Cultura
v
Estadstica inferencial 1
3 Pruebas de hip
otesis 79
3.1 Conceptos de la prueba de hipotesis . . . . . . . . . . . . . . . . . . . . . . . 80
3.1.1 Comentarios acerca de los terminos aceptar y rechazar . . . . . . 86
3.2 Prueba para la media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
3.2.1 El caso de muestras grandes . . . . . . . . . . . . . . . . . . . . . . . 87
3.2.2 Caso de muestra peque
nas . . . . . . . . . . . . . . . . . . . . . . . . 89
3.3 Pruebas para la proporcion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
3.4 Prueba para la diferencia de dos proporciones . . . . . . . . . . . . . . . . . 92
3.5 Prueba para la diferencia de dos medias . . . . . . . . . . . . . . . . . . . . 95
3.5.1 Primer caso: varianzas poblacionales conocidas o desconocidas y
muestras grandes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
3.5.2 Segundo caso: varianzas poblacionales iguales, desconocidas y mues-
tras peque
nas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
3.5.3 Tercer caso: varianzas poblacionales diferentes, desconocidas y mues-
tras peque
nas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
3.6 Prueba para la varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
3.7 Prueba para la razon de dos varianzas . . . . . . . . . . . . . . . . . . . . . 105
Indice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
CONTENIDO
2
Dr. rer. nat. Humberto Llinas
CONTENIDO
CAPITULO 1
Distribuciones fundamentales de
muestreo
Contenido
1.1 Errores y t
ecnicas de muestreo . . . . . . . . . . . . . . . . . . . 4
1.1.1 Errores muestrales y no muestrales . . . . . . . . . . . . . . . . . 4
1.1.2 Tecnicas de muestreo aleatorio . . . . . . . . . . . . . . . . . . . 9
1.2 Estadsticos y distribuciones muestrales . . . . . . . . . . . . . . 18
1.3 Distribuci
on muestral de la media . . . . . . . . . . . . . . . . . 24
1.3.1 El caso para muestras grandes . . . . . . . . . . . . . . . . . . . 28
1.3.2 El caso para muestras peque
nas . . . . . . . . . . . . . . . . . . . 31
1.4 Distribuci
on muestral de una proporci
on muestral . . . . . . . 42
1.5 Distribucion muestral de diferencia de dos proporciones mues-
trales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
1.6 Distribuci
on muestral de diferencia de medias . . . . . . . . . . 52
1.6.1 Datos pareados (muestras dependientes) . . . . . . . . . . . . . . 53
1.6.2 Muestras independientes . . . . . . . . . . . . . . . . . . . . . . . 55
1.7 Distribuci
on muestral de la varianza y raz on de varianzas
muestrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
1.7.1 Distribuci
on muestral de la varianza muestral . . . . . . . . . . . 64
1.7.2 Distribuci
on muestral de la raz
on de dos varianzas . . . . . . . . 69
Ejercicios complementarios . . . . . . . . . . . . . . . . . . . . . . . 73
3
4
Dr. rer. nat. Humberto Llinas
3. Analizar la distribuci
on muestral de la media, proporcion, diferencia de dos medias, dife-
rencia de dos proporciones, varianza y raz
on de dos varianzas.
Empleo de la estadstica
Un fabricante de neumaticos ha desarrollado un nuevo producto que,
seg
un cree, tendr
a una mayor duraci
on en relacion con las millas recorri-
das comparado con la lnea actual de neumaticos. Para evaluar el nuevo
neumatico, los gerentes necesitan un estimado (o una estimacion) de la me-
dia de las millas que dura el nuevo producto. Selecciona una muestra de
120 neumaticos para probarlos. El resultado de la prueba es una media
de la muestra de 36.500 millas. En consecuencia, se obtuvo 36.500 como
estimado de la media para la poblacion de neumaticos nuevos.
Introducci
on
En este captulo, dedicaremos gran parte de nuestra atencion a analizar problemas que
tienen por objeto averiguar algo acerca de las propiedades de una poblacion a partir de
la informacion proporcionada por una muestra de dicha poblacion. Este es el objetivo
de la estadstica inferencial. La razon principal para observar una muestra en lugar de la
poblacion completa es el hecho de que la recogida de toda la informacion sera, en la mayora
de las ocasiones, exageradamente cara. Incluso en los casos en que se dispone de recursos
suficientes para analizar la poblacion completa, puede resultar preferible dedicar esos re-
cursos a un subconjunto peque no de la poblacion, con la esperanza que tal concentracion
de esfuerzos produzca medidas mas precisas.
1.1 Errores y t
ecnicas de muestreo
Cuando nos interesa estudiar las caractersticas de poblaciones grandes, utilizamos muestras
por muchas razones. Una enumeracion completa de poblacion, llamada censo, puede ser
economicamente imposible; o puede no haber tiempo suficiente para examinar a la poblacion
completa. En algunas situaciones, el censo puede ser imposible. Por ejemplo, un censo de
la poblacion marina que vive en el oceano Atlantico es imposible.
Poltica. Las muestras de las opiniones de los votantes se usan para que los candidatos
midan la opinion p
ublica y el apoyo en las elecciones.
Sociologa. El soci
ologo que desea conocer las actitudes de los adolescentes frente al aborto,
no emprende la tarea de entrevistar a todos los adolescentes que hay en el pas sino elige
una muestra de ellos y los entrevista.
Educaci
on. Las muestras de las calificaciones de los examenes de estudiantes se usan para
determinar la eficiencia de una tecnica o programa de ense
nanza.
Industria. Muestras de los productos de una lnea de ensamblaje sirve para el prop
osito de
controlar la calidad.
Medicina. Un fabricante de drogas que desea saber los resultados de algun medicamento
para bajar la tensi
on en la sangre y compararlo con una droga de la competencia, no lleva
a cabo un experimento con todos los pacientes conocidos que sufran de hipertensi
on.
Agricultura. Las muestras del maz cosechado en una parcela proyectan en la producci
on
los efectos de un fertilizante nuevo.
Gobierno. Una muestra de opiniones de los votantes se usara para determinar los criterios
del p
ublico sobre cuestiones relacionadas con el bienestar y la seguridad nacionales.
Errores muestrales
1.1. Errores y tecnicas de muestreo
6
Dr. rer. nat. Humberto Llinas
Ejemplo 1.1.3 Se toman muestras de tama no 2 de una poblaci on consistente en tres valores:
2, 4 y 6. Supongamos que el muestreo se hace con reemplazo (es decir, el n umero elegido se
reemplaza antes de escoger el siguiente) y que se seleccionan muestras ordenadas.1 Halle la media
poblacional, todas las muestras, la media de cada muestra y los errores muestrales.
SOLUCION:
La media poblacional es igual a = (2 + 4 + 6)/3 = 4. La tabla 1.1 contiene una lista de todas las
muestras ordenadas de tama no 2 que es posible escoger con reemplazo de la poblacion de valores
2, 4 y 6. Tambien contiene las medias muestrales y los correspondientes errores muestrales.
Aun si hemos tenido gran cuidado para asegurar que dos muestras del mismo tama no sean
representativas de una cierta poblacion, no esperaramos que las dos sean idenditcas en
todos sus detalles. El error es un concepto importante que nos ayudara a entender mejor
la naturaleza de la estadstica inferencial.
1
En una muestra ordenada, el orden en que se escogen las observaciones es importante. Por ejemplo, la
muestra ordenada (2,4) es distinta de la muestra ordenada (4,2). En la muestra (4,2), se escogio primero 4
y luego 2.
En los analisis practicos, existe la posibilidad de que aparezca un error que no este rela-
cionado con el procedimiento de muestreo usado. Estos errores apareceran tambien si se
tomara un censo de la poblacion completo. Se conocen como errores no muestrales
o sistema ticos. En un estudio particular, existen potenciales errores no muestrales por
varias causas, como se muestran los ejemplos 1.1.4, 1.1.5 y 1.1.7.
Ejemplo 1.1.5 (Los individuos bajo estudio dan respuestas inexactas o inciertas) Esto
podra pasar si las preguntas se redactasen de manera que fuesen difciles de entender o de forma
que parezca que una respuesta particular es m as aceptable o m as deseable. Adem as, muchas
preguntas que uno deseara formular pueden ser delicadas y sera temerario esperar respuestas
uniformemente sinceras. Supongamos, por ejemplo, que el director de una f abrica quiere valorar
las perdidas anuales de la compa na debidas a robos de los empleados. En principio, podra se-
leccionarse una muestra aleatoria de empleados y preguntarles: Que ha robado usted de esta
f
abrica en los ultimos doce meses? Claramente, esta no es la mejor forma de proceder para
obtener la informaci on deseada! De hecho, ya hemos hablado de una posibilidad para abordar
este problema. Para obtener una descripci on y una ilustraci
on de este procedimiento (llamado el
metodo de respuesta aleatorizada) se puede acudir a los ejemplos ?? y ??.
1.1. Errores y tecnicas de muestreo
8
Dr. rer. nat. Humberto Llinas
sitem aticos pueden presentarse si la poblaci on que ha sido muestreada no es la poblaci on de in-
teres. Los resultados obtenidos pueden considerarse como una muestra aleatoria de la poblaci on
de los individuos que responderan. Estas personas pueden ser distintas de la poblaci on general
en alg un sentido importante. Si esto es as, inducir
a un sesgo en las estimaciones resultantes.
Si se sospecha que el sesgo de la no respuesta presumiblemente ser a molesto, hay tres posibil-
idades abiertas. Primero, el investigador puede solicitar informacion mediante un mecanismo del
que se sepa que produce una proporci on de respuestas altas. Segundo, hasta donde sea posible,
deben compararse las caractersticas de los individuos que responden y de los que no, en aspec-
tos tales como sexo, edad y raza, para comprobar si hay diferencias obvias entre los dos grupos.
Finalmente, se debe intentar entrar en contacto con los individuos que no respondieron, algunos
de los cuales pueden estar bien dispuestos para contestar a unas pocas preguntas claves. Si sus
respuestas difieren significativamente de las de los individuos que respondieron al principio, debe
hacerse una correccion del sesgo de la no respuesta.
Es importante senalar que el sesgo muestral se refiere a una tendencia sistematica inheren-
te a un metodo de muestreo que da estimaciones de un parametro que son, en promedio,
menores (sesgo negativo), o mayores (sesgo positivo), que el parametro real. Los
ejemplos 1.1.4 y 1.1.8 ilustran situaciones para errores que resultan de colecciones de datos
que caen en esta categora.2
Ejemplo 1.1.9 Al recabar datos pueden generarse errores no muestrales cuando los instrumentos
usados para realizar las mediciones est
an fuera de ajuste o mal calibrados. Pueden ocurrir errores
de procesamiento si los datos est
an mal colocados, si se pierden al registrarlos o si las respuestas
proporcionadas por las personas durante el estudio no son verdaderas. Este u ltimo caso puede
darse con preguntas relativas a la edad, en las que mucha gente miente por vanidad.
2
En el ejemplo 1.1.4, la muestra estaba fuertemente sesgada a favor de Landon.
1.1.2 T
ecnicas de muestreo aleatorio
Como ya se ha dicho anteriormente, para evitar el sesgo muestral y lograr inferencias validas
acerca de la poblacion, es importante que el proceso de seleccion de la muestra este basado
en el principio de aleatorizacion. La forma mas sencilla para conseguir esto es dise nar un
mecanismo de seleccion en el cual todas las muestras de un tama no dado tengan la misma
probabilidad de ser elegidas. Esto conduce a la siguiente
Este metodo se usa con tanta frecuencia que, en muchos casos, el adjetivo simple se elimina de
ambos terminos definidos anteriormente.
Ejemplo 1.1.11 Se asume que una cadena nacional de comidas r apidas desea seleccionar aleato-
riamente 5 de los 10 estados de un pas para tomar muestras sobre el gusto de los consumidores.
a que las 10
Una muestra aleatoria simple garantizar 5 = 252 muestras de tama no 5 tengan la
misma probabilidad de ser utilizada en el estudio. En este caso, la probabilidad de escoger una
muestra aleatoria simple de tamano 5 sera
1 1
P (escoger una muestra de tama
no 5) = 10
= 0, 00397 0, 397%.
5
252
1.1. Errores y tecnicas de muestreo
10
Dr. rer. nat. Humberto Llinas
Las tablas estan construidas de forma que el proceso descrito en la definicion 1.1.12 tiene
las mismas propiedades que el muestreo aleatorio simple. Una de las posibles formas de
construir una tabla de numeros aleatorios consistira en meter en un caja 10 bolas numer-
adas de 0 a 9. Despues de haberlas mezclado bien, se extrae una de las bolas y se anota
su n
umero. A continuacion se devuelve esta bola a la caja y se repite el proceso. Puede
repetirse el procedimiento para obtener n umeros con tantas cifras como se precisen. Este
proceso tiene la propiedad de que cada uno de los posibles n umeros tiene la misma pro-
babilidad, y las elecciones sucesivas son independientes unas de otras. El problema es que
resulta extremadamente tedioso.
Ejemplo 1.1.13 Hay 180 estudiantes de primer a no en un colegio rural. Con el fin de obtener
informacion acerca de la costumbre que tienen los estudiantes de ver televisi on, un consejero de
orientaci
on desea seleccionar una muestra aleatoria simple de diez estudiantes para llenar un cues-
tionario. En la oficina del rector se encuentra una lista alfabetica de los estudiantes numerados
consecutivamente de 1 a 180. El consejero utiliza la tabla del apendice para determinar que estu-
diantes formaran la muestra.
Como el numero de estudiantes de la poblaci on es de 180 (un numero de tres dgitos) es con-
veniente pensar en los n
umeros de 1 a 180 como los n umeros 001, 002, 003, . . ., 180. Solamente
se aprovechar
an los n
umeros de tres dgitos que queden entre 001 y 180.
.. .. .. .. .. ..
. . . . . .
66790 72193 66790 72193 66790 72193
16427 71681 16427 71681 16427 71681
131, 063, 120, 065, 154, 117, 002, 166, 031, 101.
Por tanto, la muestra aleatoria simple consta de los 10 estudiantes identificados con estos n
umeros
en la lista.
El muestreo aleatorio simple se puede llevar a cabo de dos maneras: con reemplazo o sin
reemplazo. Cuando el muestreo es sin reemplazo, solamente se permite a una entidad
dada aparecer una vez en la muestra. Cuando se emplean los n umeros aleatorios para se-
leccionar la muestra, se descartan los n
umeros repetidos cuando salen. Cuando el muestreo
es con reemplazo, no hay ning un lmite para el n
umero de veces que una entidad pueda
aparecer en la muestra. En las aplicaciones practicas se usa el muestreo sin reemplazo.
Es imposible determinar por simple inspeccion si una muestra es aleatoria o no. Para
3
Nuevamente, la direccion es arbitraria. Por ejemplo, el consejero pudo haber corrido el lapiz hacia la
izquierda o empezar en la parte superior de la pagina.
1.1. Errores y tecnicas de muestreo
12
Dr. rer. nat. Humberto Llinas
.. .. .. .. .. ..
. . . . . .
63988 0 131 9 63988 01319 63988 01319
67468 22553 67468 22553 67468 22553
.. .. .. .. .. ..
. . . . . .
70321 26394 70321 26394 70321 26394
98710 5 063 9 98710 50639 98710 50639
.. .. .. .. .. ..
. . . . . .
57652 46065 57652 46065 57652 46 065
35933 3 120 3 35933 31203 35933 31203
.. .. .. .. .. ..
. . . . . .
69865 39302 69865 39 302 69865 39302
determinar si una muestra es aleatoria, debemos conocer el proceso de seleccion que se uso.
Ilustremos esto a traves del siguiente
Ejemplo 1.1.14 Suponga que queremos elegir tres meses al a no para estudiar cierto compor-
tamiento ambiental y que hemos escogido enero, julio, octubre y noviembre. Representan estos
cuatros meses una muestra aleatoria?
SOLUCION:
A partir de la informaci
on dada, es imposible decir si esta muestra es aleatoria. Estos meses
pueden haber sido escogidos porque est an distribuidos a lo largo del a
no y siendo as, la muestra
no es aleatoria. Si embargo, si se escogieron con la ayuda de una tabla de n umeros aleatorios o
de otros procedimientos aleatorios, entonces, s representan una muestra aleatoria.
Muestreo estratificado
cada ciudad.
Sin embargo, se not o que el numero de agricultores era muy diferente en cada estado. Si se
tomaba una muestra aleatoria simple de las cuatro ciudades como un todo, podra incluir pro-
porcionalmente pocos agricultores de algunas ciudades y demasiados de otras ciudades. Esto
resultara en una muestra no representativa, lo cual incrementara el error de muestreo.
El Ministerio decidi
o dividir a todos los agricultores en subgrupos o estratos y de cada sub-
grupo tomar muestras aleatorias. En este caso, los subgrupos logicos seran las cuatro ciudades
en menci
on.
El ejemplo anterior trata sobre una de las muchas situaciones en las cuales el muestreo
aleaorio simple es poco practico, imposible o no deseado. El procedimiento utilizado por el
Ministerio para la seleccion de una muestra se cononoce con el nombre de muestreo estrat-
ificado.
Ejemplo 1.1.17 Suponga que nos interesa obtener una muestra de las opiniones de los profesores
de una gran universidad sobre un grupo importante. Puede ser difcil obtener una muestra con
todos esos profesores, as que supongamos que elegimos una muestra aleatoria de cada colegio o
departamento academico. Los estratos vendran a ser esos colegios o departamentos academicos.
Otro hecho que es importante mencionar es lo siguiente: una vez que la poblacion se
divide en estratos, es posible seleccionar una muestra proporcional o no proporcional.
1.1. Errores y tecnicas de muestreo
14
Dr. rer. nat. Humberto Llinas
En algunos casos el muestreo estratificado tiene la ventaja de poder reflejar con mayor
precision las caractersticas de la poblacion que un muestreo aleatorio simple, como se
muestra en el siguiente
Ejemplo 1.1.20 Suponga que se quiere estudiar los gastos de publicidad de 352 empresas de un
pais y que el objetivo del estudio consiste en determinar si las empresas con altos rendimientos
sobre su inversion (una medicion de rentabilidad) ha gastado una mayor proporci on de su pre-
supuesto de ventas de publicidad que las empresas que tienen un menor rendimeinto o incluso un
deficit. Sup
ongase que las empresas se dividieron en cinco estratos y que en total se van a escoger
50 empresas (vease la tabla 1.4).
Observese que el 2 por ciento de las empresas tienen un rendimeinto sobre la inversi on de 30 por
ciento o mas (estrato 1) y el 1 por ciento tiene un deficit (estrato 5). Si se tomara una muetra
aleatoria simple de 50 empresas, quiz as por azar no se habra seleccionado ninguna empresa en
los estratos 1 o 5. Una muestra aleatoria estratificada asegurara que al menos una empresa del
estrato 1 y otra del estrato 5 est
an representadas en la muestra.
Supongamos que un investigador quiere estudiar una poblacion que se extiende sobre una
amplia area geografica, como una ciudad o una region. Si se usa un muestreo aleatorio
simple o un muestreo aleatorio estratificado, inmediatamente surgen dos problemas. En
primer lugar, para extraer la muestra, el investigador necesita una lista razonablemente
precisa de los elementos de la poblacion. Esta lista puede no estar disponible o puede ser
Tabla 1.4: N
umero seleccionado para una muestra aleatoria estratificada proporcional
Rentabilidad N
umero mues-
Estrato (Rendimiento Numero N
umero treado se en-
sobre la inversion) de firmas muestreado cuentra por
8
1 30 por ciento y mas 8 1 352
50
35
2 De 20 a 30 por ciento 35 5 352
50
189
3 De 10 a 20 por ciento 189 27 352
50
115
4 De 0 a 10 por ciento 115 16 352
50
5
5 Deficit 5 1 352
50
TOTAL 352 50
que obtenerla conlleve un elevado costo. En segundo lugar, incluso el investigador posee una
lista de la poblacion, los miembros de la muestra resultante, casi inevitablemente, estaran
dispersos por una extensa area. En ese caso, contactar con cada individuo de la muestra
puede ser muy costoso. Desde luego, si se enva un cuestionario por correo, este u ltimo
problema no aparece. Sin embargo, esta manera de obtener la informacion puede acarrear
una tasa de no respuesta inevitablemente alta, por lo que el investigador preferira utilizar
entrevistas personales.
Para afrontar cualquiera de los dos problemas expuestos en el parrafo anterior, el investi-
gador puede usar un procedimiento de muestreo alternativo conocido como muestreo por
conglomerados.
1.1. Errores y tecnicas de muestreo
16
Dr. rer. nat. Humberto Llinas
el porcentaje de familias que utilizaran sus servicios. Como no es practico preguntar en cada
casa, la empresa decide escoger una parte de la ciudad al azar para estudiar ah cada hogar. Esa
parte de la ciudad forma un conglomerado.
En el muestreo por conglomerados, estos se forman para representar, tan fielmente como
sea posible, a toda la poblacion. Entonces, se usa una muestra aleatoria simple de cada con-
glomerado para estudiarla. Los estudios de instituciones sociales como iglesias, hospitales,
escuelas y prisiones se realizan, generalmente, con base en el muestreo por conglomerados.
La poblacion completa puede estudiarse de manera efectivamente el analisis de sus copias en
miniatura o conglomerados. Si un conglomerado es muy grande para analizarse de manera
completa, pueden elegirse aleatoriamente algunos de sus elementos.
Muestreo sistem
atico
Definicion 1.1.24 El muestreo sistema tico es una tecnica de muestreo que requiere
de una seleccion aleatoria inicial de observaciones seguida de otra seleccion de observaciones
obtenida usando alg un sistema o regla.
Ejemplo 1.1.25 Para obtener una muestra de suscriptores telef onicos en una ciudad grande,
puede sacarse primero una muestra aleatoria de los n
umeros de las p
aginas del directorio telef
onico.
Al elegir el vigesimo nombre de cada p agina obtendramos un muestreo sistem atico. Tambien
podemos escoger un nombre de la primera p agina del directorio y despues escoger cada nombre
del lugar numero cien a partir del ya escogido. Por ejemplo, podramos seleccionar un n umero
al azar de entre los primeros 100. Supongamos que el elegido es el 40. Entonces, escogemos los
nombres del directorio que corresponden a los numeros 40, 140, 240, 340 y as sucesivamente.
Ejercicios de la secci
on 1.1
1. Use el primer dgito de la quinta fila de la tabla aleatoria del apendice como punto de partida
y, moviendose horizontalmente a la derecha, seleccione una muestra aleatoria de tama no 13
de la lista de los estudiantes de su curso de Estadstica.
2. Simule el lanzamiento de un moneda 12 veces usando la tabla aleatoria del apendice. Em-
piece con el tercer dgito de la sexta fila y muevase verticalmente hacia abajo.
3. Asignemos un n umero de dos dgitos de 00 a 84 a cada uno de los 85 clientes. Luego, desde
un punto aleatorio de partida en la tabla, nos movemos horizontalmente a la derecha hasta
escoger 20 clientes.
4. Consideren las primeras diez filas de la tabla aleatoria del apendice y anote la frecuencia
con la que figura cada dgito. Cu
antas veces esperara usted que aparezca cada numero?
5. Para el ejercicio 4, piensa usted que la variacion entre las frecuencias observadas y la
frecuencia de cada dgito indica una variaci
on debido al error muestral? Complete la tabla
adjunta y encuentre el promedio de los errores muestrales.
7. Dan lugar los siguientes procedimientos a muestras aleatorias? Explique por que s o por
que no.
(a) Para obtener una muestra aleatoria de profesores en un grupo, escoja a todos los que
tienen carro.
1.1. Errores y tecnicas de muestreo
18
Dr. rer. nat. Humberto Llinas
(b) Para lograr una muestra aleatoria de habitantes de cierta ciudad elija a cada cuarta
persona que entra por la puerta de una de las tiendas de la ciudad.
(c) Para conseguir una muestra aleatoria de los estudiantes matriculados en cierta universi-
dad, selecci
onelos usando una tabla de n u
meros aleatorios y los u
ltimos cuatro dgitos
de su carnet de estudiante.
7. (a) No (b) No (c) S
(a) Etiquete a los maestros de 001 a 200. Cu ales se escogeran para la capacitaci on si se
usa la tabla aleatoria del apendice y el punto de partida es el primer dgito de la cuarta
fila en la segunda columna y los dgitos se leen horizontalmente para la derecha?
(b) Un proceso m as eficiente de la selecci
on requiere clasificar a los administradores como en
la parte (a), y asignar los numeros 001, 201, 401, 601 y 801 al primer maestro, 002, 202,
402, 602 y 802 al segundo, 003, 203, 403, 603 y 803 al tercer maestro..., y 200, 400, 600,
800 y 000 al u ltimo maestro. Escoja una muestra aleatoria de cinco administradores
usando este esquema y empezando en el mismo punto.
9. No.
Sobre la base de la informacion muestral, nuestro objetivo sera hacer inferencias acerca
Ejemplo 1.2.1 Dada una muestra aleatoria de consumo de combustible de 20 autos de un deter-
minado modelo, se puede hacer inferencia sobre la media y la varianza del consumo de combustible
de todos los autos de ese modelo. Tal inferencia estara basada en la informaci
on muestral, y ser a
natural plantearnos cuestiones del tipo: Si el consumo de combustible de todos los autos de un
determinado modelo, medido en kil ometros por litro, tiene una media de 10 y una desviaci on
est
andar de 2, cu
al es la probabilidad de que, en una muestra aleatoria de 18 autos de ete tipo, el
consumo medio de combustible sea menor de 8 kil ometros por litro?. Al plantearnos la pregunta
de este modo, estamos asumiendo implcitamente que las inferencias sobre la media poblacional
estar
an basadas en la media muestral.
Definicion 1.2.2 Supongamos que se ha extrado una muestra aleatoria de una poblacion
y que se desea hacer inferencia sobre ciertas caractersticas de la distribucion de la
poblaci un estadstico muestral, es decir, en
on. Esta inferencia estara basada en alg
alguna funcion particular de la informaci
on muestral.
Debido a que un estadstico muestral tambien es una variable aleatoria (por ser funcion
de variales aleatorias), entonces, ese estadstico posee una distribucion. Esto conduce a la
siguiente
Ejemplo 1.2.4 Supongamos que un supervisor tiene a su cargo a seis empleados, cuyas experien-
cias (medidas en anos de trabajo) son 2, 4, 6, 6, 7 y 8. Se eligen al azar cuatro de estos empleados
y se les asigna una nueva tarea. F acilmente se puede determinar que el n umero medio de a nos
de experiencias para los seis empleados es 5,5. Estamos interesados en el n umero medio de a nos
de experiencia para los cuatros empleados concretos a los que se les ha asignado el cambio de
tarea. Podemos pensar en este ejemplo como en una muestra aleatoria simple de cuatro valores
extrados de una poblacion de seis. El n
umero de muestras diferentes que pueden ser seleccionadas
6
es 4 = 15. En la tabla 1.5 aparece cada una de las posibles muestras con su correspondiente
media muestral. Las muestras como (2, 4, 6, 7) aparecen dos veces porque hay dos empleados en
la poblacion con seis a
nos de experiencia de trabajo.
Tabla 1.5: Posibles muestras de cuatro observaciones con sus correspondientes medias mues-
trales para la poblacion 2, 4, 6, 6, 7 y 8.
Muestra Media muestral Muestra Media muestral
2,4,6,6 4,50 2,6,7,8 5,75
2,4,6,7 4,75 2,6,7,8 5,75
2,4,6,8 5,00 4,6,6,7 5,75
2,4,6,7 4,75 4,6,6,8 6,00
2,4,6,8 5,00 4,6,7,8 6,25
2,4,7,8 5,25 4,6,7,8 6,25
2,6,6,7 5,25 6,6,7,8 6,75
2,6,6,8 5,50
Puesto que todas las posibles muestras tienen la misma probabilidad de ser seleccionadas, la
probabilidad que tiene cada una de las muestras de ser elegidas es 1/15. Usando esta informaci
on,
podemos determinar la probabilidad de cada uno de los valores de la media muestral. Para ello,
podemos construir la distribuci
on de frecuencias de la media, como se muestra en la tabla 1.6.
Por ejemplo, en la tabla 1.5, vemos que tres de las posibles muestras tienen media 5, 75; dos de las
posibles muestras tienen media 5, 25, etc. Por tanto, la probabilidad de que los cuatros empleados
Tabla 1.6: Distribucion de frecuencias para las medias muestrales de la tabla 1.5
Media muestral 4,50 4,75 5,00 5,25 5,50 5,75 6,00 6,25 6,75
Frecuencia 1 2 2 2 1 3 1 2 2
seleccionados para la nueva tarea tangan una experiencia media de 5,75 a nos es de 3/15. De la
misma forma podemos encontrar la probabilidad de cada una de las posibles medias muestrales.
La colecci
on de todas estas probabilidades constituye la distribuci
on muestral de la media muestral.
El gr
afico de esta funci
on de probabilidad aparece en la figura 1.1.
N
otese que, mientras que el n umero de anos de trabajo de los seis trabajadores se mueve entre
dos y ocho, los valores posibles de la media muestral tienen un rango mucho m as restringido: de
Ejercicios de la secci
on 1.2
10. Suponga que de la poblaci
on de valores 2, 5 y 12 se toman nueve muestras de tama
no 2 con
reemplazo.
11. Cierto juguete se vende en tres tama nos: de 25, 40 y 65 centmetros. Veinte por ciento
de los compradores seleccionan el juguete de 25 centmetros, 50% el de 40 centmetros y
30% el de 65 centmetros. Sean X1 y X2 los tama nos de juguete seleccionados por dos
compradores independientes. Determine la distribucion muestral de la media muestral X,
calcule su media E(X) y comp arela con la media poblacional .
12. Hay dos retenes de control en mi viaje hacia otra otra ciudad. Suponga que X1 es el n
umero
de retenes en los que debo detenerme y que la distribuci on de X1 es:
x1 0 1 2
p(x1 ) 2 5 3
14. Se sabe que 80% de todos los estudiantes de cierta universidad son de estrato medio-bajo.
Suponga que n = 10 estudiantes se seleccionan al azar y sea X la variable aleatoria que
representa el n
umero de estudiantes del estrato medio-bajo en la muestra. El estadstico.
Obtenga la distribucion muestral del estadstico X/n, que es la proporci on muestral de
estudiantes del estrato medio-bajo en la muestra. [Sugerencia: un posible valor de X/n es
0,3 y corresponde a X = 3. Cu al es la probabilidad de este valor (queclase de variable
aleatoria es X)?]
x 1 2 3 4
f (x) 0,4 0,3 0,2 0,1
(a) Considere una muestra aleatoria de tama no n=2 clientes y sea X el n umero medio
on de probabilidad de X.
muestral de paquetes enviados. Obtenga la distribuci
(b) Considere el inciso (a) y calcule P (X 2, 5)
(c) En otra considere una muestra aleatoria de tama no n=2, pero ahora concentrese en el
estadstico R = rango muestral (diferencia entre los valores m aximo y mnimo de la
muestra). Obtenga la distribuci on de R. [Sugerencia: calcule el valor de R para cada
resultado y utilice las probabilidades del inciso (a).]
(d) Si se selecciona una muestra aleatorio de tama no n = 4, cu al es P (X 1, 5)? [Sug-
erencia: no deben tener una lista de todos los posibles resultados, sino s
olo para los que
x 1, 5.]
15. (b) 0,85
16. Una gaveta contiene diez cajas selladas y numeradas del 1 al 10. Las primeras cinco est an
vacas, las siguientes tres contienen 5 d
olares cada una, y hay un billete de 10 dolares en
cada una de las dos u ltimas. Se selecciona una muestra de tama no 3 con reemplazo (de
modo que tenemos una muestra aleatoria) y se obtiene la maxma cantidad en cualesquiera
de las cajas seleccionadas. Si X1 , X2 y X3 son variables aleatorias que representan las
cantidades de las cajas seleccionadas, el estadstico de interes es M = el maximo de X1 ,
X2 y X3 .
17. Una casa comercial se compone de tres sucursales, cada una manejada por dos trabajadores.
La informaci
on de salarios anuales (en miles de d
olares) es:
Sucursal 1 1 2 2 3 3
Trabajador 1 2 3 4 5 6
Salario 19,7 23,6 20,2 23,6 15,8 19,7
(a) Suponga que dos empleados se seleccionan al azar de entre los seis (sin reemplazo).
Determine la distribuci
on muestral del salario medio muestral X.
(b) Suponga que una de las tres sucursales se selecciona al azar y que X1 y X2 son variables
aleatorias que representan los salarios de los dos trabajadores. Determine la distribuci
on
muestral de X.
(c) C
omo se compara E(X) de los incisos (a) y (b)con el salario medio poblacional .
1.3 Distribuci
on muestral de la media
SOLUCION:
acilmente se puede encontrar que la media y varianza 2
En este caso, n = 2 y N = 3. F
poblacional est
an dadas por
0+2+4 (0 2)2 + (2 2)2 + (4 2)2 8
= = 2 y 2 = = ,
3 3 3
respectivamente. Ahora, distinguiremos los casos en que el muestreo se hace con o sin reemplaza-
miento.
(a) Si el muestreo se hace con reemplazo, entonces, las posibles muestras que se pueden escoger
son
(0, 0), (0, 2), (0, 4), (2, 0), (2, 2), (2, 4), (4, 0), (4, 2), (4, 4).
Muestras (0,0) (0,2) (0,4) (2,0) (2,2) (2,4) (4,0) (4,2) (4,4)
x 0 1 2 1 2 3 2 3 4
(b) Supongamos que el muestreo se hace sin reemplazamiento. Debemos considerar dos casos: el
muestreo es con orden o sin orden.4
(0, 2), (0, 4), (2, 0), (2, 4), (4, 0), (4, 2).
4
Cuando el muestreo es con reemplazamiento, necesariamente este muestreo es con orden. Por que?
muestral de la media
1.3. Distribucion
26
Dr. rer. nat. Humberto Llinas
El factor N n
N 1
se denomina factor de correccio n (de poblacio n finita). Podemos
pasarlo por alto si el tama
no n de la muestra es pequeno en relacion con el tama no N
2 2
N n
de la poblacion. Si N es mucha mas grande que n, la diferencia entre n y n N 1
se puede despreciar. Una regla de uso muy frecuente establece que el factor de correccion
de poblacion finita se puede pasar por alto cuando cuando Nn 0, 05, es decir, cuando la
muestra contiene menos del 5% de los elementos de la poblacion.
Como hasta ahora hemos concentrado nuestra atencion en el caso en que el muestreo se
hace en una poblacion finita, podramos preguntarnos que resultados se obtienen cuando
el muestreo se hace en una poblacion infinita. El muestreo con reemplazamiento en una
poblacion finita es equivalente al muestreo en una poblacion infinita. Por tanto, los resul-
tados analizados en el teorema 1.3.1a se pueden aplicar tambien al caso de un muestreo
hecho en una poblacion infinita. Es decir,
Teorema 1.3.3 Cuando el muestreo se hace en una poblaci on infinita, entonces, sin im-
portar si el muestreo es con o sin reemplazo, se tiene que
La media x de la distribuci
on muestral de x es igual a la media de la poblacion en
que se toma la muestra, es decir, x = .
La varianza x2 de la distribuci
on muestral es igual a la varianza de la poblacion
2
dividida por el tamano de la muestra, es decir, x2 = n (con la condicion de que la
poblacion en que se toma la muestra tenga una varianza conocida).
Para tener una vision global de los resultados presentados en los teoremas 1.3.1 y 1.3.3,
podemos reunir estos resultados en una tabla como la que se muestra en la tabla 1.8.
2
Tabla 1.8: X y X cuando la poblacion es normal con 2 conocida
X = Poblacion finita Poblacion infinita
2 2 2 2
Muestreo con reemplazo X = n
X = n
2 2 N n 2 2
Muestreo sin reemplazo X = n N 1
X = n
muestral de la media
1.3. Distribucion
28
Dr. rer. nat. Humberto Llinas
Teorema 1.3.4 Sea x la media de una muestra aleatoria de tamano n tomada de una
2
poblaci
on con media y varianza > 0. Supongamos que se cumple alguna de las sigu-
ientes condiciones:
XX
Como consecuencia de este teorema, se puede concluir que la variable aleatoria Z = X est
a
distribuida normalmente con media 0 y varianza 1. Adem
as, en los casos en que la varianza sea
desconocida y n 30, reemplazamos la desviaci on muestral s.
on poblacional por la desviaci
Ejemplo 1.3.5 Supongamos que el incremento porcentual de los salarios de los funcionarios de
todas las corporaciones medianas se distribuye siguiendo una normal con media 12, 2% y desviacion
tpica 3, 6%. Se toma una muestra aleatoria de nueve observaciones de esta poblaci
on de incremen-
tos porcentuales de salario. Cu
al es la probabilidad de que la media muestral sea mayor del 10%?
SOLUCION:
Tenemos que = 12, 2, = 3, 6 y n = 9. Nos piden calcular P (X > 10). Como no conocemos
el tama
no de la poblacion, supondremos que esta es infinita. Entonces, por el teorema 1.3.3, la
media y el error est
andar de la distribuci
on muestral de X son
3, 6
X = = 12, 2 y X = = = 1, 2.
n 9
X X 10 X 10 X
P (X > 10) = P > = P Z>
X X X
10 12, 2
= P Z> = P (Z > 1, 83) = 1 P (Z 1, 83).
1, 2
Ahora, como la poblaci on es normal y la varianza poblacional es conocida, entonces, por el teorema
1.3.4, la distribuci
on muestral de la media muestral es normal o, lo que es equivalente, la variable
Z tiene normal est andar (comparese con la definici
on ??). Por tanto, teniendo que es la funci
on
de distribucion normal estandar, entonces, de la tabla normal del apendice, tenemos que
Concluimos, entonces, que la probabilidad de que la media muestral sea mayor que un 10% es
aproximadamente del 97%.
Ejemplo 1.3.6 Un fabricante declara que la duraci on de las bujas que el fabrica sigue una
distribuci
on normal con una media de 36.000 kil ometros y una desviaci on est
andar de 4.000
kil
ometros. Para una muestra aleatoria de dieciseis bujas, se obtuvo una duraci on media de
34.500 kil
ometros. Si la afirmaci
on del fabricante es correcta, cu
al es la probabilidad de obtener
una media muestral tan peque na como esta o menor?
SOLUCION:
Tenemos que = 36.000, = 4.000 y n = 16. Nos piden calcular P (X < 34.500). Como no
conocemos el tama no de la poblaci
on, supondremos que esta es infinita. Entonces, por el teorema
1.3.3, la media y el error est
andar de la distribuci
on muestral de X son
4.000
X = = 36.000 y X = = = 1.000.
n 16
X X 34.500 X 34.500 X
P (X < 34.500) = P < = P Z<
X X X
34.500 36.000
= P Z< = P (Z < 1, 5).
1.000
Ahora, como la poblaci on es normal y la varianza poblacional es conocida, entonces, por el teorema
1.3.4, la distribuci
on muestral de la media muestral es normal o, lo que es equivalente, la variable
Z tiene normal est andar (comparese con la definici
on ??). Por tanto, teniendo que es la funci
on
de distribucion normal estandar, entonces, de la tabla normal del apendice, tenemos que
muestral de la media
1.3. Distribucion
30
Dr. rer. nat. Humberto Llinas
Ejemplo 1.3.7 Los tiempos requeridos para que unos trabajadores terminen cierta labor, se
distribuyen normalmente con media de 30 minutos y una desviaci on estandar de 9 minutos. Si
de la planta de trabajadores se toma una muestra aleatoria de 25, encuentre la probabilidad de
que la media del tiempo requerido para concluir la tarea en la muestra, este entre 28 y 33 minutos.
SOLUCION:
En este ejemplo, = 30, = 9 y n = 25. Nos piden calcular P (28 < X < 33). Como no
conocemos el tama no de la poblaci
on, supondremos que esta es infinita. Entonces, por el teorema
1.3.3, la media y el error est on muestral de X son
andar de la distribuci
9
X = = 30 y X = = = 1, 8.
n 25
Ahora, como la poblaci on es normal y la varianza poblacional es conocida, entonces, por el teorema
1.3.4, la variable Z tiene normal estandar. Por tanto, de la tabla normal del apendice, tenemos
que
P (28 < X < 33) = P (Z < 1, 67) P (Z < 1, 11) = (1, 67) (1, 11) = 0, 819 82%.
SOLUCION:
Nos piden calcular P (X > 2). Sabemos que = 1, 75, n = 50 y s = 0, 65. La media y error
est
andar de la distribuci
on muestral de la media es
X = = 1, 75 y X = s/ n = 0, 092.
Por consiguiente, por el teorema 1.3.4 y teniendo en cuenta la tabla normal del apendice, se tiene
que
2 1, 75
P (X 2) = P Z = P (Z 2, 72) = 0, 9967.
0, 092
P (X > 2) = 1 P (X 2) = 0, 0033.
Ejemplo 1.3.9 Una empresa emplea 1.500 personas. La cantidad promedio gastada, durante un
ano determinado, en servicios medicos personales por empleado fue de 2.575 d
olares y la desviaci
on
tpica de 525 d
olares. Cual es la probabilidad de que una muestra aleatoria de 100 empleados
(seleccionados sin reemplazo) arroje una media comprendida entre 2.500 y 2.700 d olares?
SOLUCION:
Tenemos que N = 1.500, = 2.575, = 525 y n = 100. Nos piden calcular P (2.500 X 2.700).
Teniendo en cuenta que la poblaci on dada es finita y que la varianza poblacional se conoce, en-
tonces, por la tabla de la figura 1.8, la media y el error est
andar de la distribuci
on muestral de X
son
r r
N n 575 1.400
X = = 2.575 y X = = 50, 74.
n N 1 100 1.499
P (2.500 < X < 2.700) = P (Z < 2, 46) P (Z < 1, 48) = (2, 46) (1, 48)
= 0, 9931 0, 0694 = 0, 9237.
esta distribuida normalmente y tiene una media igual a 0 y una varianza igual a 1. Ademas,
tambien afirma que, en los casos en que la varianza sea desconocida y n 30, utilizamos
la desviacion muestral s como una estimacion de . Con esto, los teoremas 1.3.1 y 1.3.3 o,
mejor dicho, la tabla 1.8, se pueden reformular como se muestra en la tabla 1.9.
Ahora, cuando la la poblacion es normal con varianza poblacional desconocida y las mues-
tras son peque nas (n < 30), entonces, la distribucion muestral de la media muestral no
es la normal. Este caso, juega un rol bien importante una distribucion continua llamada
distribucion t de Student.
muestral de la media
1.3. Distribucion
32
Dr. rer. nat. Humberto Llinas
2
Tabla 1.9: X y X cuando s se usa como estimacion de 2 desconocida
X = Poblacion finita Poblacion infinita
2 s2 2 s2
Muestreo con reemplazo X = n
X = n
2 s2 N n 2 s2
Muestreo sin reemplazo X = n N 1
X = n
La distribuci
on t de Student
cuando el muestreo se hace en una poblacion que esta distribuida normalmente. Esta dis-
n t de Student, nos permite hacer
tribucion, que se conoce con el nombre de distribucio
inferencias acerca de medias poblacionales cuando no se conoce la desviacion tpica de la
poblacion.
5
William Sealy Gosset se graduo en matematicas en Oxford y trabajo en la cervecera Guinnes
Brewerie en Dublin (Irlanda). Gosset escriba bajo el seudonimo de Student puesto que los empleados
de Guinnes no estaban autorizados para publicar trabajos de investigaci on con su nombre. En general,
el desarroll
o una nueva teora estadstica al trabajar con muestras peque
nas y en experimentos donde
intervenan temperaturas en esa cervecera.
Figura 1.3: Las curvas de la distribucion t para valores seleccionados de grados de libertad
n1
Por u
ltimo, es importante se
nalar que la distribucion t se aproxima a la distribucion normal
muestral de la media
1.3. Distribucion
34
Dr. rer. nat. Humberto Llinas
a medida que aumentan los grados de libertad. Para grados infinitos de libertad, las dos
distribuciones son identicas (por lo que la curva normal a veces recibe el nombre de curva t
con grados infinitos de libertad). Podemos verificar este hecho observando que los valores
de t en la u
ltima fila de la tabla del apendice son iguales a los valores de Z correspondientes
a valores de probabilidad determinados, tales como 0,10, 0,05, etc.
Distribuci
on muestral de la media muestral para muestras peque
nas
Teorema 1.3.11 Si el muestreo se hace en una poblacion normal con varianza desconocida
y si las muestras seleccionadas son de tama
no n < 30, entonces, la distribuci
on muestral
de la media muestral X es la t de Student con n 1 grados de libertad.
XX
Este teorema implica que la variable aleatoria t = X on t con n 1 grados de
tiene distribuci
libertad. Aqu, X y varianza 2
X se calculan de acuerdo a las situaciones presentadas en la tabla 1.9.
Ejemplo 1.3.12 Suponga que de una poblaci on normal con media 20 se toma una muestra de
tama
no 16. Si la desviacion est
andar muestral es 4, encuentre la probabilidad de que la media
muestral sea estrictamente mayor que 21,753.
SOLUCION:
Tenemos que = 20, s = 4 y n = 16. Debido a que la poblaci on es normal con varianza descono-
cida y a que n < 30, entonces, aplicaremos el teorema 1.3.11. Es decir, la distribuci
on muestral
de la media muestral es la t de Student con n 1 = 15 grados de libertad. Teniendo en cuenta la
tabla de la figura 1.9, encontramos que
s 4
X = = 20 y X = = = 1.
n 16
X X 21, 753 20
t15 = = = 1, 753
X 1
Ejemplo 1.3.13 Una muestra aleatoria de seis autos de un determinado modelo consumen las
siguientes cantidades en kil
ometros por litro:
Determine la probabilidad de que el consumo de gasolina medio muestral de los autom oviles de
este modelo sea menor que 17,6 kil
ometros por litro, suponiendo que la distribuci
on de la poblacion
es normal con media 17.
SOLUCION:
Tenemos que = 17 Py, en este caso, la muestra escogida es de tama no n = 6. La media de la
muestra dada es x = nxi = 116,9
6 = 19, 4833 y con esto la varianza de esta muestra es
muestral de la media
1.3. Distribucion
36
Dr. rer. nat. Humberto Llinas
Por consiguiente, la desviaci
on est
andar de esta muestra es s = 0, 96 = 0, 98. Debido a que la
poblacion es normal con varianza desconocida y a que n < 30, entonces, por el teorema 1.3.11, la
distribuci
on muestral de la media muestral es la t de Student con n 1 = 5 grados de libertad.
Teniendo en cuenta la tabla de la figura 1.9, encontramos que
s 0, 98
X = = 20, 1 y X = = 0, 4.
n 6
X X 17, 6 17
t5 = = = 1, 5
X 0, 4
y con ayuda de la tabla t de Student con 15 grados de libertad, entonces, la probabilidad pedida
ser
a
Ejercicios de la secci
on 1.3
18. Un determinado centro comercial ha encontrado que sus ingresos tienen un promedio de
12,4 millones de pesos por da con desviaci
on est
andar de 2,9. Para una muestra aleatoria
de 40 clientes, encuentre la probabilidad de que el ingreso promedio
19. Una m aquina autom atica llena bolsas de arroz con un promedio de 16 libras por bolsa y
desviaci
on est
andar de 0,5 libras. Cu
al es la probabilidad de que una muestra de 35 bolsas
de arroz tenga una media de llenado
20. Cinco mil personas se presentaron a un control de peso. El peso promedio fue 75 kilogramos
y la desviaci
on est
andar 10. Si de esta poblaci
on de pesos se toman 300 muestras aleatorias
de tamano 40, encuentre:
(a) x y x .
(b) el n
umero aproximado de medias muestrales que caen entre 73 y 77 kilogramos.
21. 0,3159
22. El n
umero de clientes que entran diariamente a un prestigioso centro comercial se distribuye
normalmente con una media de 220 y una desviaci on estandar de 50. Si se analiza una
muestra de 12 das para estimar el n
umero promedio de clientes que entran diariamente a
ese centro comercial, encuentre la probabilidad de que la muestra produzca un promedio
menor que 300 clientes.
23. Se empacan bolsas de cierto tipo de material con un peso medio de 78,3 kilogramos y una
desviaci
on est
andar de 5,6 kilogramos. C omo cambia la varianza de la media muestral
cuando el tama no de la muestra (a) aumenta de 64 a 196, (b) disminuye de 784 a 49?
24. Una m aquina empacadora de bolsas de sal se ajusta para que la cantidad de producto que
empaca promedie 240 gramos con una desviaci on est
andar de 15 gramos. La m aquina se
verifica peri
odicamente tomando una muestra de 40 bolsas de sal y se calcula el contenido
promedio. Si la media de las 40 bolsas de sal es un valor dentro del intervalo X 2X , se
piensa que la m aquina opera satisfactoriamente; de otra forma, se ajusta. Supongamos que
el funcionario de la compana encuentra que la media de 40 bolsas de sal es x = 236 mililitros
y concluye que la m aquina no necesita un ajuste. Fue esta una decisi on razonable?
24. S
25. La variable aleatoria X que representa el n umero de personas que trabajan en un banco,
tiene la siguiente funci
on de probabilidad f :
x 4 5 6 7
f (x) 0,2 0,4 0,3 0,1
muestral de la media
1.3. Distribucion
38
Dr. rer. nat. Humberto Llinas
(a) Si los tiempos para calificar son independientes y el profesor comienza a calificar a las
2:50 p.m. y lo hace en forma continua, cu al es la probabilidad (aproximada) de que
termine de calificar antes del inicio de las noticias de las 7:00 p.m. por TV?
(b) Si la secci
on deportiva empieza a las 7:10, cual es la probabilidad de que se pierda
parte de esa secci
on si espera hasta terminar antes de encender el televisor?
27. (a) 0,6026 (b) 0,2981
28. El gasto mensual en fotocopias por parte de un estudiante tiene un valor medio de 10.000
pesos y una desviaci
on est
andar de 500 pesos.
29. El tiempo utilizado por una persona seleccionada al azar para llenar un formulario tiene
una distribuci
on normal con una media de 10 minutos y desviaci on est
andar de 2 minutos.
Si cinco personas llenan un formulario en un da y seis en otro, cu
al es la probabilidad de
que la cantidad de tiempo promedio de la muestra diaria sea a lo sumo 11 minutos?
29. 0,7720
(a) Si la distribuci
on es normal, cu
al es la probabilidad de que el di
ametro muestral medio
para una muestra aleatoria de 9 ollas sea por lo menos de 51 cm?
(b) Cu
al es la probabilidad (aproximada) de que el di ametro muestral medio para una
muestra aleatoria de 40 ollas sea al menos de 51 cm?
31. (a) 0,0062 (b) 0
33. Si la experiencia indica que un 40% de todos los clientes que entran a un determinado local
son fumadoras, calcule la probabilidad (aproximada) de que en un grupo de 50 personas:
34. El n
umero de conductores que viajan entre cierto origen y destino, durante un determinado
periodo, tiene una distribuci
on de Poisson con par
ametro = 50. Cu al es la probabilidad
aproximada de que:
35. Suponga que el tiempo (en horas) empleado por el gerente de una empresa para elaborar un
presentar un determinado proyecto es una variable aleatoria X que tiene una distribuci
on
gamma con par ametro = 50 y = 2. Debido a que es grande, se puede demostrar
que Xtiene aproximadamente una distribuci on normal. Utilice este hecho para calcular
la probabilidad de que un gerente seleccionado al azar demore a lo sumo 125 horas en la
elaboraci
on del proyecto.
35. 0,9616
36. La duracion de ciertos componentes electricos producidos por una determinada empresa
tiene una media de 1.200 horas y una desviacion est
andar de 400 horas. La poblaci
on sigue
una distribuci
on normal. Suponga que usted ha comprado 9 bombillas, que pueden ser
consideradas como una muestra aleatoria de la producci on de la empresa.
(a) Cu
al es la media de la media muestral de la duraci
on de estos componentes electricos?
(b) Cu
al es la varianza de la media muestral?
(c) Cu
al es el error est
andar de la media muestral?
(d) Cu al es la probabilidad de que el tiempo medio de duraci
on de tres componentes
electricos sea de menos de 1.050 horas?
36. (a) 1.200 (b) 17.778 (c) 133,33 (d) 0,1303
37. El precio medio de venta de ciertos autos durante el u ltimo ano en cierta ciudad fue de
115.000 d
olares. La desviaci
on est
andar de la poblaci
on fue de 25.000 d
olares. Se toma una
muestra aleatoria de 100 autos nuevos de esta ciudad.
muestral de la media
1.3. Distribucion
40
Dr. rer. nat. Humberto Llinas
(a) Cual es la probabilidad de que la media muestral de los precios de venta se menor que
110.000 d olares?
(b) Cual es la probabilidad de que la media muestral de los precios de venta este entre
113.000 dolares y 117.000 d
olares?
(c) Cual es la probabilidad de que la media muestral de los precios de venta este entre
114.000 y 116.000 dolares?
(d) Sin hacer los c
alculos, razonar en cu
al de los siguientes rangos resulta m
as probable que
se encuentre la media muestral de los precios de venta:
113.000 d
olares - 115.000 d
olares
114.000 d
olares - 116.000 d
olares
115.000 d
olares - 117.000 d
olares
116.000 d
olares - 118.000 d
olares
37. (a) 0,9772 (b) 0,5762 (c) 0,3108 (d) 114.000 d
olares - 116.000 d
olares
38. Se ha tomado una muestra aleatoria de 16 profesores de cierta universidad, con el fin de
estimar el tiempo medio diario que emplean en desplazarse para ir hasta su trabajo. Supong-
amos que la distribuci
on de dichos tiempos en la poblaci
on sigue una normal con media de
87 minutos y desviaci
on est
andar de 22 minutos.
(a) Cu
al es el error est
andar de la media muestral de los tiempos de desplazamiento?
(b) Cu
al es la probabilidad de que la media muestral sea menor que 100 minutos?
(c) Cu
al es la probabilidad de que la media muestral sea mayor que 80 minutos?
(d) Cual es la probabilidad de que la media muestral tome una valor que este entre 85 y
95 minutos?
(e) Supongamos que se toma una segunda muestra de 15 profesores, independiente de la
anterior. Sin hacer los c
alculos, razonar si las probabilidades calculadas en los apartados
(b), (c) y (d) ser
an mayores, menores o iguales para esta segunda muestra?. Utilizar
gr
aficos para ilustrar las respuestas.
38. (a) 5,5 (b) 0,9909 (c) 0,8980 (d) 0,4329 (e) mayor, mayor, menor
(a) Cu
al es el error est
andar de la media muestral de la cuota mensual?
(b) Cu
al es la probabilidad de que la media muestral exceda a la media poblacional en
m
as de 5 dolares?
(c) Cual es la probabilidad de que la media muestral este m
as de 4 d
olares por debajo de
la media poblacional?
(d) Cu
al es la probabilidad de que la media muestral difiera de la media poblacional en
m
as de 3 dolares?
40. El tiempo que dedican a trabajar las personas de una empresa antes de un da festivo sigue
una distribucion normal con una desviaci on est andar de 8 horas. Se toma una muestra
aleatoria de 4 personas con el fin de estimar el tiempo medio de trabajo para esta poblaci
on
de personas.
41. Una industria produce bolsas de azucar cuyos pesos siguen una distribuci
on normal con una
desviaci
on est
andar de 1,6 gramos. Se selecciona un muestra de 100 lotes a fin de estimar
la media poblacional del peso de las bolsas de az
ucar.
(a) 0,05 es la probabilidad de que la media muestral del peso exceda a la media poblacional,
en que cantidad?
(b) 0,1 es la probabilidad de que la media muestral del peso este por debajo de la media
poblacional, en que cantidad?
(c) 0,15 es la probabilidad de que la media muestral del peso difiera de la media poblacional,
en que cantidad?
41. (a) 0,26 (b) 0,20 (c) 0,23
42. En una univesidad, 250 estudiantes se han matriculado para un curso de Estadstica Inferen-
cial. Cada uno de los integrantes de una muestra aleatoria de 50 estudiantes es interrogado
con el fin de estimar la cantidad de tiempo que gasta semanalmente en resolver los problemas
de estadstica. Supongamos que la desviaci on tpica de la poblaci
on es de 30 minutos.
muestral de la media
1.3. Distribucion
42
Dr. rer. nat. Humberto Llinas
1.4 Distribuci
on muestral de una proporci
on muestral
Proporciones muestrales
Como ya se dijo en la seccion ??, si se repite n veces un experimento que tiene probabilidad
de exito p, entonces, la variable aleatoria X, que representa al n umero total de exitos en
las n repeticiones, sigue una distribucion binomial. Un problema bastante com um consiste
en que el parametro p sea desconocido. Por ejemplo, podemos estar interesados en deter-
minar cual es la proporcion del electorado que tiene intencion de votar a un determinado
candidato, o la proporcion de lectores de revistas que podran estar en el mercado de un
producto especfico. En situaciones de este tipo, sera natural basar nuestra inferencia en la
proporcion de exitos en una muestra tomada de la poblacion que nos interese.
ametro p ser
En la mayora de las aplicaciones, el par a la proporci
on de individuos de una gran
on que posean la caracterstica de interes.
poblaci
De aqu y con ayuda de la parte (b) de los teoremas ?? y ??, obtenemos que
X 1
p = E(p) = E = E(X) = p,
n n
X 1 p(1 p)
p2 = V (p) = V = 2 V (X) = .
n n n
Si el n
umero N de individuos en la poblacion no es demasiado grande, comparado con
el n
umero de individuos de la muestra, en la expresion de la varianza de la proporcion
n por poblacio
muestral sera necesaria una correccio n finita. La varianza sera en-
tonces
2 N n p(1 p)
p = .
N 1 n
n 30 o
np 5 y n(1 p) 5,
pp
Este teorema implica que la variable aleatoria Z = p tiene distribuci
on normal. Aqu, p y
varianza p se calculan de acuerdo al teorema 1.4.2.
Notese que para p fijo, el error estandar de la proporcion muestral disminuye a medida que
crece el tama no muestral. Esto implica que, al aumentar el tama no muestral, la distribucion
de p se concentra mas alrededor de su media, como puede observarse en la figura 1.5. Esto
a su vez supone que, para cualquier proporcion poblacional particular, la probabilidad de
que la proporcion muestral y la poblacional difieran en mas de una cantidad fija disminuye
a medida que crece el tama no muestral. En otras palabras, si tomamos una muestra mayor
de la poblacion, nuestra inferencia acerca de la proporcion de individuos que poseen alguna
caracterstica particular se hara mas firme.
Ejemplo 1.4.4 Se toma una muestra de 250 casas de una poblaci on de edificios antiguos para es-
timar la proporcion de casas de este tipo cuya instalacion electrica resulta insegura. Supongamos
que, de hecho, el 30% de todos los edificios de esta poblaci on tienen una instalaci on insegura.
Hallar la probabilidad de que la proporcion de edificios de la muestra con instalaci on insegura este
entre 0,25 y 0,35.
SOLUCION:
Tenemos que p = 0, 30 y n = 250. Por consiguiente, teniendo en cuenta el teorema 1.4.2, tenemos
que
r r
p(1 p) (0, 30)(0, 70)
p = p = 0, 30 y p = = = 0, 029.
n 250
Ahora, como n 30, entonces, por el teorema de De Moivre-Laplace (teorema 1.4.3), la variable
Z tiene distribuci
on normal est
andar. Por tanto, de la tabla normal del apendice, tenemos que
P (0, 25 < p < 0, 35) = P (Z < 1, 72) P (Z < 1, 72) = (1, 72) (1, 72)
= 0, 9573 0, 0427 = 0, 9146.
Ejemplo 1.4.5 Se desea estudiar una muestra de 20 personas para saber la proporci on de ellas
que tienen mas de 40 a
nos. Sabiendo que la proporcion en la poblaci
on es del 40%, cu
al es la
probabilidad de que la proporci
on en la muestra sea menor del 50%?
SOLUCION:
Aqu, n = 20 y p = 0, 4. Por el teorema 1.4.2, tenemos que
r r
p(1 p) (0, 4)(0, 6)
p = p = 0, 4 y p = = 0, 1095.
n 20
np = 8 5,
n(1 p) = 12 5,
Ejemplo 1.4.6 Hallar la probabilidad de que en 200 lanzamientos de una moneda no falsa, el
n
umero de caras este comprendido en el 40% y el 60%.
SOLUCION:
En este caso, n = 200 y p = P (cara) = 0, 5. Ahora, por el teorema 1.4.2, tenemos que
r r
p(1 p) (0, 5)(0, 5)
p = p = 0, 5 y p = = 0, 035.
n 200
Ahora, como n 30, entonces, por el teorema de De Moivre-Laplace (teorema 1.4.3), la variable
Z tiene distribuci
on normal est
andar. Por tanto, de la tabla normal del apendice, tenemos que
P (0, 4 < p < 0, 6) = P (Z < 2, 83) P (Z < 2, 83) = (2, 83) (2, 83)
= 0, 9977 0, 0023 = 0, 9954.
Ejercicios de la secci
on 1.4
43. El 5% de todos los tornillos fabricados por cierta empresa estan defectuosos. Suponga que
de 1.500 tornillos recien fabricados se toma una muestra aleatoria de 50 y que p representa
el porcentaje de los defectuosos.
44. Cierta ciudad europea tiene un porcentaje de desempleo de 12%. Para un estudio de 500
personas, sea p el porcentaje de desempleados en esta muestra. Encuentre (a) P (p > 0, 11)
y (b) P (0, 11 < p < 0, 13).
45. Si un medicamento es efectivo en un 80% para tratar ciertas enfermedad, y una muestra
aleatoria de 500 pacientes recibe el medicamento, encuentre las probabilidades siguientes si
p representa el porcentaje de tratamientos en los que hay efectividad:
46. De acuerdo con un estudio reciente en cierto pas, de 500 personas el 75% est
a de acuerdo
con un referendo. Dando por v
alida la proporci andola por p, encuentre:
on citada y represent
47. En el ano 2005, los habitantes de cierto pas votaron en un referendum acerca de una nueva
ley. En cierto estado, el 42,4% de las personas que votaron lo hicieron en favor de la nueva
ley. Se tomo una muestra aleatoria de 100 votantes de dicho estado.
48. El propietario de cierto local comercial ha comprobado que el 20% de los clientes que entran
en su local realizan alguna compra. Cierta tarde, entraron en esta tienda 180 personas, que
pueden ser considerados como una muestra aleatoria de todos sus clientes.
49. Una empresa ha recibido 120 solicitudes de trabajo de estudiantes que acaban de terminar
su carrera de administraci
on de empresas. Suponiendo que estas solicitudes pueden ser
consideradas como una muestra aleatoria de todos los licenciados, cu
al es la probabilidad
de que entre un 35% y un 45% de las solicitudes correspondan a mujeres si se sabe que el
40% de los administradores de empresas que acaban de terminar su carrera son mujeres?
49. 0,7372
50. Una entidad bancaria est a considerando una nueva emisi on de bonos convertibles. Sus
directores piensan que la oferta resultar
a atractiva para el 20% de los accionistas actuales.
Supongamos que su creencia es acertada. Se toma una muestra aleatoria de 130 accionistas.
(c) Cu
al es la probabilidad de que esta proporci
on muestral este entre 0,18 y 0,22?
50. (a) 0,0351 (b) 0,9236 (c) 0,4314 (d) mayor, mayor
51. Se toma una muestra aleatoria de 100 personas de cierto estado con el fin de estimar la
proporcion de encuestados que est a a favor de un incremento en los impuestos sobre la
tarifa de los servicios p
ublicos para contar as con un ingreso adicional para las personas de
la tercera edad. Cu al es el mayor valor que puede tomar el error estandar de la proporcion
muestral de esta medida?
51. 0,05
52. Una empresa quiere estimar la proporci on de personas que son posibles compradores de
cierto servicio de telefona m
ovil y que ven las transmisiones de los partidos de f
utbol del
campeonato local. Se toma una muestra de 120 individuos que se identificaron como posibles
compradores del servicio de telefona m ovil . Supongamos que la proporci on de posibles
compradores del servicio de telefona m ovil en la poblaci
on que ven estas transmisiones es
0,25.
53. Suponga que el 50% de los colombianos adultos opinan que la tasa de desempleo al final del
presente a
no ser
a mucho mayor en comparacion de a
nos anteriores. Cu
al es la probabilidad
de que mas del 58% de las personas de una muestra aleatoria de 250 colombianos adultos
tenga esta opini
on?
53. 0,0057
54. Un colegio europeo cuenta con un total de 528 estudiantes. De ellos, 211 son extranjeros.
Se toma una muestra aleatoria de 120 de estos estudiantes.
(a) Cu
al es el error est
andar de la proporci
on muestral de alumnos que son extranjeros?
(b) Cu
al es la probabilidad de que esta proporci
on muestral sea menor que 0,33?
54. (a) 0,039 (b) 0,0384 (c) 0,4906
55. El incremento porcentual anual del salario mnimo de los trabajadores de cierta empresa
sigue una distribuci
on normal con media del 12,2% y una desviaci on est
andar del 3,6%.
Se toma una muestra aleatoria de 81 de los trabajadores de esta empresa. Cu al es la
probabilidad de que m as de la mitad de los individuos de la muestra tengan incrementos
salariales menores del 10%?
55. Pr
acticamente cero.
1.5 Distribuci
on muestral de diferencia de dos propor-
ciones muestrales
En muchas situaciones practicas el investigador necesita hacer inferencias sobre la diferencia
entre dos proporciones poblacionales. A continuacion se dan algunos ejemplos:
Medicina. Es mas alto el porcentaje de los casos de cancer pulmonar en una poblacion
que fuma que en otra compuesta por no fumadores?
Sociologa. Hay diferencia entre las proporciones de gente urbana y rural que esta a
favor de cierta ley?
Supongamos que una muestra de n1 observaciones de una poblacion con una proporcion p1
de exitos da lugar a una proporcion muestral p1 , y que se obtiene una proporcion mues-
tral p2 al examinar una muestra aleatoria independiente de n2 observaciones procedentes de
una poblacion con proporcion p2 de exitos. Dado que estamos interesados en la diferncia
poblacional p1 p2 , parece logico estudiar el comportamiento de la variable aleatoria p1 p2 .
Su media es
E(p1 p2 ) = E(p1 ) E(p2 ) = p1 p2
p1 (1 p1 ) p2 (1 p2 )
V (p1 p2 ) = V (p1 ) + E(p2 ) = + .
n1 n2
Ademas, si los tama nos muestrales son grandes, la distribucion de esta variable es aprox-
imadamente normal, por lo que si le restamos su media y la dividimos por la desviacion
tpica, el resultado es una variable normal estandar. As pues, la variable aleatoria
(p1 p2 ) (p1 p2 )
Z = q
p1 (1p1 )
n1
+ p2 (1p
n2
2)
sigue una distribucion normal estandar. Todos estos resultados expuestos hasta aqu se
resumen en el siguiente
Ejemplo 1.5.2 Los hombres y mujeres adultos radicados en una ciudad grande del norte de
cierto pais difieren en sus opiniones sobre la promulgacion de la pena de muerte para personas
culpables de asesinato. Se cree que el 12% de los hombres adultos est an a favor de la pena de
muerte, mientras que s olo el 10% de las mujeres adultas lo est
an. Si se pregunta a dos muestras
aleatorias, una de 150 hombres y otra de 100 mujeres, su opinion sobre la promulgacion de la pena
de muerte para personas culpables de asesinato, determine la probabilidad de que el porcentaje
de hombres a favor sea al menos 3% mayor que el de mujeres.
SOLUCION:
Representemos con p1 el porcentaje de hombres a favor de la pena de muerte y con p2 el de mu-
jeres. Como consecuencia del teorema 1.5.1, la media de la distribuci
on muestral de las diferencias
entre las proporciones muestrales es:
p1 p2 = p1 p2 = 0, 12 0, 10 = 0, 02
y el error est
andar de las diferencias entre las proporciones muestrales es
s r
p1 (1 p1 ) p2 (1 p2 ) (0, 12)(0, 88) (0, 10)(0, 90)
p1 p2 = + = + = 0, 04.
n1 n2 150 100
(p1 p2 ) p1 p2 0, 03 0, 02 0, 01
Z = = = = 0, 25.
p1 p2 0, 04 0, 04
Facilmente, podemos verificar que se cumplen las condiciones que se necesitan para poder utilizar
la aproximacion del teorema 1.5.1. Por tanto, por este teorema, la probabilidad pedida ser
a
Ejercicios de la secci
on 1.5
56. En una muestra aleatoria simple de 150 ingenieros que haban culminado su carrera en
universidades privadas, 45 gozan de una estabilidad econ
omica. En una muestra aleatoria
simple independiente de 200 ingenieros que haban culminado su carrera en universidades
publicas, 20 gozan de una estabilidad economica. Supongamos que la proporci on de los
ingeniron que gozan una estabilidad econ omica es de 0,15 en cada grupo. Cu al es la
probabilidad de que los resultados obtenidos con estas muestras lleguen a este extremo o a
mas?
57. Se cree que 0,16 de las industrias de un area metropolitana I son textiles. Se cree adem as
que en un area metropolitana II esta proporci
on es de 0,11. Si estas cifras son exactas, cu
al
es la probabilidad de que una muestra aleatoria simple de 200 industrias del area I y una
muestra aleatoria simple independiente de 225 industrias del area II arrojen una diferencia
entre las proporciones muestrales mayor o igual que 0,10?
57. 0,0475
58. Se cree que el 15% de los estudiantes de una universidad A fuman y que en una poblaci on
B solamente el 8% fuman. Si estas cifras son exactas, cu al es la probabilidad de que
una muestra aleatoria de 120 estudiantes de la universidad A y una muestra aleatoria
independiente de 130 de la universidad B arrojen un valor de pA p B igual o mayor que
0,16?
59. Se cree que dos tecnicas, A y B, son igualmente efectivas para reducir el nivel de ansiedad
de ciertas personas emocionalmente perturbadas. La proporci on de personas en las que la
droga resulta efectiva es 0,70. En una muestra aleatoria de 100 personas emocionalmente
trastornadas a quienes se les suministro la droga A, 75 experimentaron una reducci on del
nivel de ansiedad. La droga B result o efectiva en 105 personas de una muestra aleatoria
independiente de 150 personas. Si las dos drogas son igualmente efectivas como se cree,
cu
al es la probabilidad de observar un valor de pA p B tan gran de o m as grande de lo
que aqu se anota?
59. 0,2033
60. En una ciudad se cree que el 40% de los habitantes est an de acuerdo con un refendo. En
otra ciudad se cree que solo el 15% de los habitantes lo est
an. Siendo estas cifras correctas,
cu
al es la probabilidad de que muestras aleatorias simples de 100 habitantes de cada ciudad
arrojen una diferencia en la proporci
on de habitantes que est an de acurdo con el referendo
de 0,40 o de m as?
61. Un investigador opina que el 15% de los due nos de empresas de la ciudad A y el 10% de
los de la ciudad B son extranjeros. En una muestra aleatoria simple de 150 due nos de
empresas de la ciudad A el investigador encontr o que 30 eran extranjeros. Una muestra
aleatoria simple independiente de 100 due nos de empresas de la ciudad B revel o que 7 lo
eran. Supongamos que la opini on que tiene el investigador sobre la nacionalidad de los
duenos de empresas es correcta. Cu al es la probabilidad de observar una diferencia entre
las proporciones muestrales mayor o igual a la que realmente se observa? Puede ser que el
investigador decida revisar sus creencias sobre las dos poblaciones?
61. 0,0228; S
1.6 Distribuci
on muestral de diferencia de medias
En muchas situaciones practicas el investigador concentra su investigacion en dos pobla-
ciones. A menudo se desea sacar inferencias acerca de la diferencia entre dos medias pobla-
cionales. Un ejemplo podra ser el caso de un agricultor que esta considerando el uso de dos
fertilizantes alternativos y esta interesado en en la diferencia de las producciones medias
por hectareas resultantes. Para comparar las medias poblacionales, se extrae una muestra
aleatoria de las dos poblaciones y la inferencia acerca de la diferencia entre ambas medias se
basa en los resultados muestrales. El metodo apropiado para analizar esta informacion de-
pende del procedimiento empleado al seleccionar las muestras. Para ello se deben considerar
las dos posibilidades siguientes:
De manera general, supongamos que tomamos una muestra aleatoria de n pares de observa-
ciones que representamos por (x1 , y1 ), (x2 , y2 ), . . ., (xn , yn ), procedentes de dos poblaciones
con medias 1 y 2 . As, x1 , x2 , . . . , xn corresponden a las observaciones muestrales de una
poblacion con media 1 y y1 , y2 , . . . , yn corresponden a las observaciones muestrales de una
poblacion con media 2 .
2 s2d
D =X Y D = 1 2 D = n
Teorema 1.6.1 Supongamos que disponemos de una muestra aleatoria de datos pareados
procedentes de distribuciones con medias 1 y 2 . Sean d y sd la media y la desviaci on
est
andar muestral para las n < 30 diferencias di = xi yi . Si se asume que la distribucion
de las diferencias es normal, entonces, la distribuci
on muestral del D = X Y es la t de
Student con n 1 grados de libertad.
DD
Este teorema implica que la variable aleatoria t = D on t con n 1 grados de
tiene distribuci
2
libertad. Aqu, D y varianza D se calculan como se muestra en la tabla 1.10.
Ejemplo 1.6.2 La tabla de abajo recoge los datos de consumo de gasolina correspondiente a una
muestra aleatoria de 8 autom
oviles norteamericanos de dos modelos diferentes. Se formaron pares
con las dos muestras y cada elemento de un determinado par fue conducido por la misma ruta y
por el mismo piloto.
(b) Suponiendo que la distribucion de las diferencias poblacionales es normal con media -0,807,
encuentre la probabilidad de que el consumo promedio de gasolina del auto A sea mayor que
el del auto B.
SOLUCION:
(a) En la siguiente tabla se incluyen las diferencias di entre los datos de la tabla anterior. Estas
diferencias forman una muestra aleatoria procedente de una poblaci on cuya media es A B ,
la diferencia entre las medias poblacionales entre dos modelos de autos.
(b) Tenemos que A B = 0, 807. Sean X A y X B las variables que representan al consumo
promedio de gasolina de los autos A y B, respectivamente. Nos piden calcular P (X A > X B )
o, que es lo mismo, P (X A X B > 0). Hagamos D = X A X B . Por la tabla 1.10,
D = 0, 27 y D = sd / n = 0, 3413.
0 D
P (X A X B > 0) = P (D > 0) = P t >
D
0 (0, 807)
= P = P (t > 2, 3645) 0, 025.
0, 3413
Por consiguiente, la probabilidad de que el consumo promedio de gasolina del auto A sea
mayor que el del auto B es aproximadamente del 2,5%.
Las varianzas poblacionales son conocidas o desconocidas, pero las muestras son
grandes.
Las varianzas poblacionales son desconocidas, pero iguales, y las muestras son peque
nas.
Las varianzas poblacionales son desconocidas, pero diferentes, y las muestras son
peque
nas.
grandes.
Ademas, se puede probar que si las dos poblaciones son normales, entonces, X 1 X 2
tambien es normal. Por tanto, la variable aleatoria
(X 1 X 2 ) (1 2 )
Z= q 2
1 2
n1
+ n22
tiene una distribucion normal estandar. Todas estas caractersticas importantes de las dis-
tribucion muestral de la diferencia entre dos medias muestrales se encuentran resumidas en
el siguiente
Teorema 1.6.3 Sean x1 y x2 las medias de muestras aleatorias independientes de tama nos
2 2
n1 y n2 de poblaciones con medias 1 , 2 y varianzas 1 , 2 , respectivamente. Supongamos
que se cumple alguna de las siguientes condiciones:
(a) Ambas poblaciones son normales y ambas varianzas poblaciones 12 y 22 son conocidas;
on.
Treinta observaciones en cada muestra son, en general, suficientes para realizar esta aproximaci
Ejemplo 1.6.4 En un estudio para comparar los pesos promedios de ni nos y ni nas de sexto
grado en una escuela de instruccion media, se usara una muestra aleatoria de 20 ni nos y otra igual
de 25 ninas. Se sabe que, tanto para ni nos y ni
nas, los pesos siguen una distribuci on normal.
El promedio de los pesos de todos lo ni nos de sexto grado de esa escuela es de 100 libras y su
desviaci
on est
andar es de 14,142, mientras que el promedio de los pesos de todas las ni nas del sexto
grado es de 85 libras y su desviacion est
andar es de 12,247. Encuentre la probabilidad de que el
promedio de los pesos de los 20 ni
nos sea al menos 20 libras mas grande que el de los de las 25 ni
nas.
SOLUCION:
Supongamos que X 1 representa el promedio de los pesos de 20 ni nos y X 2 , el promedio de los
pesos de una muestra de 25 ni
nas. Nos piden calcular P (X 1 X 2 > 20). Como las dos poblaciones
en cuesti
on son normales y con varianzas conocidas, entonces, por el teorema 1.6.3, tenemos
La media de la distribuci
on muestral de X 1 X 2 es igual a 1 2 = 100 85 = 15.
on muestral de X 1 X 2 es
La varianza de la distribuci
Ejemplo 1.6.5 Se identificaron dos poblaciones de alumnos de u ltimo ano de un colegio. La vari-
able de interes en la investigaci
on consista en los puntajes obtenidos en una prueba de rendimiento
en estadstica que hicieron los estudiantes de las dos poblaciones. Los investigadores suponan que
los puntajes de las dos poblaciones estaban distribuidos normalmente con las siguientes medias y
varianzas: 1 = 50, 12 = 40, 2 = 40, 22 = 60. Una muestra aleatoria de tama no n1 = 10 se saca
de la poblaci on 1 y una de tama no n2 = 12 de poblaci on 2. Cu al es la probabilidad de que la
diferencia entre las medias muestrales este entre 5 y 15?
SOLUCION:
Observe que no se conoce la forma funcional de las poblaciones originales. Como las varianzas
poblacionales son conocidas y las poblaciones son normales, entonces, por el teorema 1.6.3(b),
on muestral de X 1 X 2 es aproximadamente normal y tiene una media igual a
la distribuci
2 2 40 60
1 2 = 50 40 = 10 y varianza n11 + n22 = 10 + 12 = 9. Para encontrar la probabilidad deseada,
transformamos los valores de X 1 X 2 en los valores de Z, como se muestra a continuaci on:
5 10 15 10
Z = = 1, 67, Z = = 1, 67.
9 9
De esta manera, la probabilidad de que la diferencia entre las medias muestrales este entre 5 y 15
es aproximadamente del 90,5%.
Ejemplo 1.6.6 Suponga que dos drogas A y B, de las que se dice que reducen el tiempo de
respuesta de las ratas a determinado estmulo, se est an comparando en un experimento de lab-
oratorio. El experimentador supone que las respectivas poblaciones de los tiempos de respuesta
al estmulo est
an distribuidos normalmente y tienen varianzas iguales. Se administra la droga A
a 12 ratas y la droga B a 13. Cuando se lleva a cabo el experimento, la reducci on promedio de
tiempo de respuesta al estmulo por parte de las ratas que est an recibiendo la droga A es 30,45
milisegundos con una desviaci on tpica de 5 milisegundos. Los datos correspondientes a la droga
B son 24,9 y 6 milisegundos. Cu al es la probabilidad de que la diferencia entre la reduccion
promedio de tiempo de respuesta al estmulo por parte de las ratas que est an recibiendo la droga
A y la reducci on promedio de tiempo de respuesta al estmulo por parte de las ratas que est an
recibiendo la droga B sea menor o igual a la que se observ o en el experimento? Suponga que no
hay diferencia alguna entre las dos drogas con respecto a la reducci on promedio en tiempos de
respuestas y que las drogas son igualmente efectivas.
SOLUCION:
Sean X A y X B la reducci on promedio de tiempo de respuesta al estmulo por parte de las ratas
que est
an recibiendo la droga A y la droga B, respectivamente. Nos piden calcular P (X A X B
30, 45 24, 9 = 5, 55). Como las dos poblaciones en cuesti
on son normales y los tama nos de las
muestras son grandes (observe que los tamanos de ambas muestras son mayores o iguales que 30),
debemos aplicar el teorema 1.6.3:
La varianza de la distribuci
on muestral de X A X B es
s2A s2 52 62
+ B = + = 1, 73.
nA nB 30 40
(xA xB ) (A B ) 5, 55 0
Z = q 2 = 1, 31.
sA 2
sB 2, 20
nA + nB
Por consiguiente,
P (X A X B 5, 55) = P (Z 1, 31) = 0, 9049.
2 2
V (X 1 X 2 ) = V (X 1 ) + V (X 2 ) = + .
n1 n2
Ademas, se puede probar que si las dos poblaciones son normales, entonces, X 1 X 2
tambien es normal. Por tanto, la variable aleatoria
(X 1 X 2 ) (1 2 )
Z= q (1.1)
2 2
n1
+ n2
tiene una distribucion normal estandar. Sin embargo, este ultimo resultado no puede ser
utilizado ya que la exprsion anterior dada para Z depende de la varianza poblacional de-
sconocida. Debido a que esta varianza es la misma para ambas poblaciones, pueden em-
plearse los dos conjuntos de informacion muestral para estimarla. El estimador es
donde s21 y s22 son las dos varianzas muestrales. Observese que la cantidad s2 , que se de-
nomina varianza muestral combinada, es el promedio ponderado de las dos varianzas
muestrales que se han obtenido ponderando cada una por los respectivos tama nos mues-
trales menos 1.
(x1 x2 ) (1 2 )
t= q 2 .
s1 s22
n1
+ n2
Puede demostrarse que esta variable aleatoria sigue una distribucion t de Student con
n1 + n2 2 grados de libertad. En el siguiente teorema resumimos los resultados hasta aqu
expuesto y que se refieren al segundo caso.
(x1 x2 ) (1 2 )
t= q
s2 2
n1
+ ns 2
est
a distribuida seg
un la distribucion t de Student con n1 + n2 2 grados de libertad.
Ejemplo 1.6.8 Repita el ejemplo 1.6.6, pero ahora suponiendo que las poblaciones no tienen dis-
tribuci
on normal y que los tama
nos muestrales son menores que 30, digamos nA = 12 y nB = 13.
SOLUCION:
Como las dos poblaciones en cuesti on son normales y los tama
nos de las muestras son peque
nas
(observese que los tama nos muestrales son estrictamente menores que 30), entonces, debemos
aplicar el teorema 1.6.7:
La distribuci
on muestral de X A X B es aproximadamente la t de Student con nA +nB 2 =
12 + 13 2 = 23 grados de libertad.
Debido a que no hay diferencia alguna entre las dos drogas con respecto a la reduccion
promedio en tiempos de respuestas y que las drogas son igualmente efectivas, entonces,
on muestral de X A X B es igual a
A = B . Por consiguiente, la media de la distribuci
A B = 0.
s2 s2 30, 74 30, 74
+ = + = 4, 92.
nA nB 12 13
(x1 x2 ) (1 2 ) 5, 55 0
t = q = = 2, 5.
s2
+ s2 2, 22
n1 n2
Por consiguiente,
P (X A X B 5, 55) = P (t 2, 5) = 0, 01.
En este situacion supondremos que las poblaciones originales estan distribuidas normal-
mente, que las varianzas poblacionales son desconocidas y diferentes y que las muestras son
pequenas. En este caso, se utilizaran las varianzas muestrales s21 y s22 en vez de las varian-
zas poblacionales desconocidas 12 y 22 , respectivamente. Haciendo un analisis similar a las
situaciones anteriores encontramos los siguientes resultados que se presentan a continuacion.
(x1 x2 ) (1 2 )
t= q 2
s1 s2
n1
+ n22
est
a distribuida seg
un la distribuci
on t de Student con
2 2
s1 s22
n1
+ n2
= (s2 /n )2 (s2 /n )2
1
1
n1 1
+ n2 2 12
grados de libertad. Dado que rara vez es un entero, se redondea al entero mas cercano.
Ejemplo 1.6.10 Repita el ejemplo 1.6.6, pero ahora suponiendo que las poblaciones no tienen
distribuci
on normal, que los tama
nos muestrales son menores que 30 (digamos nA = 12 y nB = 13)
y que las varianzas poblacionales son diferentes.
SOLUCION:
En este caso, debemos aplicar el teorema 1.6.9:
grados de libertad.
on muestral de X A X B es
La varianza de la distribuci
s2A s2 52 62
+ B = + = 4, 85.
nA nB 12 13
Por consiguiente,
P (X A X B 5, 55) = P (t 2, 52) 0, 01.
Ejercicios de la secci
on 1.6
62. La distribucion de pesos de los animales de cierto pueblo asiatico tiene un peso medio de
72 kilogramos y una desviaci on est
andar de 10 kilogramos, mientras que la distribucion de
pesos de los animales de cierto pueblo africano tiene un peso medio de 28 kilogramos con una
desviaci
on estandar de 5 kilogramos. Suponga que las medias muestrales se pueden medir
con cualquier grado de precision. Encuentre la probabilidad de que la media muestral para
una muestra aleatoria de pesos de 64 animales del pueblo asi atico exceda la media muestral
para una muestra aleatoria de alturas de 100 animales del pueblo africano por cuando mucho
44,2 kilogramos.
63. Se llevan a cabo dos experimentos independientes en los que se comparan dos tipos diferentes
de impresoras. Se imprimen 18 hojas con el tipo A y en cada uno se registra el tiempo de
secado en minutos. Lo mismo se hace con el tipo B. Se sabe que las desviaciones est andar
de la poblacion son ambas 1. Suponga que el tiempo medio de secado es igual para los
dos tipos de impresoras, encuentre P (X A X B > 1), donde X A y X B son los tiempos
promedios de secado para muestras de tama no nA = nB = 18.
63. 0,0013
64. Las bateras del fabricante A tienen una duraci on media de 6,5 a nos y una desviaci
on
est
andar de 0,9 anos, mientras que las del fabricante B tienen una duraci on media de 6,0
a
nos y una desviacion estandar de 0,8 anos. Cu
al es la probabilidad de que una muestra
aleatoria de 36 bateras del fabricante A tengan una duraci on media que sea al menos de
un ano mas que la duracion media de una muestra de 49 bateras del fabricante B?
64. 0,0040
(a) Cu
al es la probabilidad de que despues de 2 horas de recorrido el segundo tren no
haya alcanzado al primero?
(b) Determine la probabilidad de que los trenes esten separados a lo sumo 10 km despues
de 2 horas.
67. Suponga que tiempo de vida esperado de la batera del tipo A es 105 horas y la desviaci
on
est
andar es 8 horas. Para la batera del tipo B, suponga que el tiempo de vida esperado y
desviaci
on est
andar son 100 6 horas, respectivamente. Sea X = tiempo de vida promedio
de una muestra aleatoria de 40 bateras de tipo A y sea Y = tiempo de vida promedio de
una muestra aleatoria de 35 bateras de tipo B.
(a) Cu
al es la distribuci
on aproximada de X y deY ?
(b) Cu
al es la distribuci
on aproximada de X Y ? Justifique su respuesta.
(c) Calcule (aproximadamente)P (1 X) Y 1.
(d) Calcule P (X Y 10). Si en realidad se observ
o X Y 10, durara de que
1 2 = 5?
67. (a) Aproximadamente normal con media 105, desviaci on 1,2649; Aproximadamente
normal con media 100, desviacion 1,0142 (b) Aproximadamente normal con media 5 y
desviaci
on 1,6213 (c) 0,0068 (d) 0,0010; s
representa el n
umero de celulas guardados en el refrigerador B que sobreviven 1 a no. Si la
probabilidad de que una celula guardada en el refrigerador A sobreviva 1 a no es 0,7 y la
probabilidad de que sobreviva 1 ano en el refrigerador B es 0.6, calcule una aproximacion a
P (5 6 X Y 6 5).
1.7 Distribuci
on muestral de la varianza y raz
on de
varianzas muestrales
1.7.1 Distribuci
on muestral de la varianza muestral
Supongamos que se extrae una muestra de n observaciones de una poblacion con media
desconocida y varianza desconocida 2 . Representaremos las observaciones muestrales
por X1 , X2 , . . . , Xn . La varianza poblacional es la esperanza
2 = E[(X )2 ]
y, por tanto, una cantidad en la que evidentemente deberamos fijarnos sera en la media
de los (Xi )2 para los n individuos de la muestra. Sin embargo, la media poblacional
es desconocida, por lo que en la practica esta cantidad no podra ser calculada. Es natural,
entonces, sustituir la desconocida por la media muestral X, y considerar la media de los
(Xi X)2 . De hecho, como ya se dijo en el captulo ??, la varianza muestral se define como
se muestra a continuacion:
Definici
on 1.7.1 Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblaci
on. La cantidad
n
1 X
s2 = (Xi X)2
n 1 i=1
n
recibe el nombre de varianza muestral. Su raz cuadrada, s, se denomina desviacio
tpica muestral.
Observese que, en nuestra definicion de varianza muestral, hemos usado como divisor (n1)
en lugar de n, lo cual puede resultar sorprendente. La razon para esta formulacion es que
puede probarse que, si se define la varianza muestral de este modo, entonces, la media de
su distribucion muestral es la verdadera varianza poblacional, es decir,
E(s2 ) = 2 .
sigue una distribucion conocida con el nombre de distribuci on 2 con n 1 grados de lib-
ertad 6 . El smbolo 2 se lee ji-cuadrada o chi-cuadrada.
on 2 y sus propiedades
La distribuci
1. Esta distribucion solo esta definida para valores no negativos de la variable aleatoria,
lo cual resulta adecuado en este contexto, ya que la varianza muestral no puede ser
negativa.
4. El area total limitada por la curva de una distribucion 2 y los ejes es igual a 1.
6
La distribucion 2 con n 1 grados de libertad es la distribucion de la suma de los cuadrados de n
variables aleatorias normales estandar independientes.
E 2 () = , V 2 () = 2.
Figura 1.6: Distribucion 2 en la que se muestra el area que queda a la derecha del valor
2
La tabla del apendice da los valores de 2 para varios valores de y . Las areas, , son
los encabezados de las columnas; los grados de libertad, , se dan en la columna izquierda;
y el cuerpo de la tabla son los valores de 2 . De aqu que el valor de 2 con 7 grados de
libertad, teniendo un area de 0,05 a la derecha, sea 20,05 (7) = 14, 067. Debido a la falta de
simetra, deben utilizarse las tablas para encontrar 20,95 (7).
(n 1)s2
(n 1)
n1 = E 2
= E(s2 ),
2
y, en consecuencia,
2 4
V (s2 ) = .
n1
Estos resultados se presentan resumidos en el siguiente
Aplicaciones pr
acticas
Supongamos que hemos tomado una muestra aleatoria de una poblacion y queremos hacer
alguna inferencia sobre la varianza poblacional. Si se asume la normalidad de la poblacion,
se podra usar la distribucion chi-cuadrado, como haremos en los ejemplos que aparecen a
continuacion.
SOLUCION:
Tenemos que n = 4 y = 3, 6 y como la poblaci on en cuesti
on es normal, entonces, podemos
aplicar el teorema 1.7.2. Por tanto, teniendo en cuenta la tabla del apendice, la probabilidad que
se nos pide es
(n 1)s2
2 27(n 1)
P (s > 27) = P >
2 2
(27)(3)
= P 2 (3) > = P 2 (3) > 6, 25 0, 10.
12, 96
Ejemplo 1.7.5 Un fabricante de latas de guisantes est a interesado en que el peso medio de su
producto este proximo al peso anunciado. Adem as, desea que no haya mucha variabilidad en
los pesos de las latas de guisantes, ya que de lo contrario, una gran proporcion de latas diferira
sensiblemente del peso anunciado. Asumamos que la distribuci on poblacional de los pesos es nor-
mal. Se toma una muestra aleatoria de veinte latas. Hallar el valor de k que verifica la relaci on
s2
P 2 < k = 0, 05.
SOLUCION:
Tenemos que n = 20. Para hallar el valor de k, tendremos en cuenta el teorema 1.7.2. Ahora,
s2 (n 1)s2
0, 05 = P <k
= P < (n 1)k
2 2
= P 2 (n 1) < (n 1)k = P 2 (19) < 19k .
Entonces, P 2 (19) > 19k = 0, 95. Por tanto, de la tabla del apendice, encontramos que 19k =
Hay que hacer hincapie en el hecho de que la tecnica empleada en estos ejemplos no es tan
universalmente aplicable en la practica como la que usabamos en las primeras secciones de
este captulo. En este contexto, el supuesto de que la distribucion de la poblacion de la que
se ha extrado la muestra es normal, es fundamental. Hemos visto como pueden encontrarse
probabilidades relativas tanto a la media muestral como a la varianza muestral cuando se
muestrea de una poblacion normal. Sin embargo, esta u ltima se vera mas afectada por
desviaciones del supuesto de normalidad de la distribucion poblacional. Cuando se quieren
calcular probabilidades relativas a la media muestral, el teorema ?? asegura que, para
muestras moderadamente grandes, desviaciones peque nas de la hipotesis de normalidad de
la poblacion de la que se extrae la muestra tienen un efecto peque no en la validez de las
probabilidades calculadas. Por esta razon, se dice que las inferencias basadas en la media
muestral son robustas frente a desviaciones del supuesto de normalidad de la poblacion,
mientras que las inferencias basadas en la varianza poblacional no lo son.
Sin embargo, es frecuente en la practica que la varianza poblacional tenga un interes di-
recto para el investigador. Debe recordarse que, si solo se dispone de una cantidad peque na
de observaciones muestrales, desviaciones importantes del supuesto de normalidad de la
poblacion pueden invalidar las conclusiones del analisis realizado seg
un la tecnica que hemos
descrito en esta seccion. Por tanto, un analista precavido debera ser cuidadoso a la hora
de hacer inferencias en tales circunstancias.
1.7.2 Distribuci
on muestral de la raz
on de dos varianzas
Otro metodo para comparar dos poblaciones es comparar sus varianzas. Surgen muchas
aplicacione estadsticas en las que deben compararse las varianzas poblacionales. En aplica-
ciones industriales referentes a dos metodos o maquinas para producir el mismo producto,
se utilizan con frecuencia las varianzas y se las compara con propositos de control de calidad.
Teorema 1.7.6 Si s21 y s22 son las varianzas de muestras aleatorias independientes de
tamano n1 y n2 tomadas de poblaciones normales con varianzas 12 y 22 , respectivamente,
entonces, la variable aleatoria
s2 / 2
F = 21 12
s2 /2
tiene una distribucion F con 1 = n1 1 y 2 = n2 1 grados de libertad.
En la tabla del apendice se proporcionan los puntos de corte F (1 , 2 ) para igual a 0,05
y 0,01. Por ejemplo, para 10 grados de libertad en el numerador y 20 en el denominador,
hallamos en la tabla que
F0,05 (10, 20) = 2, 35 y F0,01 (10, 20) = 3, 37.
7
Formalmente, la distribucion F se define como la distribucion que sigue el cociente de dos variables
aleatorias independientes con distribucion chi-cuadrado, cada una dividida por sus grados de libertad.
Ejemplo 1.7.7 En una prueba sobre la efectividad de dos tipos de pldoras para dormir, A y B,
se utilizar
an dos grupos independientes de personas con insomnio. A un grupo de tama no 61 se
le administrara la pldora A y al otro grupo, de tamano 41, se le administrara la B, registr
andose
el n
umero de horas de sue no de cada individuo participante en el estudio. Suponiendo que el
numero de hora de sue no de quienes usan cada tipo de pldora se distribuye normalemente y que
2 2
A = B , calcule la probabilidad de que la raz on de las varianzas muestrales de A y B sea mayor
que 1,64.
SOLUCION:
La probabilidad pedida est
a dada por
P (s2A /s2B > 1, 64) = P F (60, 40) > 1, 64
= 0, 05.
Ejercicios de la secci
on 1.7
69. Las rentabilidades mensuales de cierto tipo de acciones son independientes unas de otras y
siguen una distribuci
on normal con desviaci on tpica de 1,7. Se toma una muestra de 12
meses. Hallar la probabilidad de que la desviaci
on estandar muestral sea (a) menor que 2,5,
(b) mayor que 1.
70. Se quiere someter a todos los docentes de matem aticas de cierta ciudad a un examen de
100 preguntas. Inicialmente, en un estudio piloto, se somete a este examen a una muestra
aleatoria de 20 docentes. Supongamos que, para la poblaci on completa de todos los docentes
de la ciudad, la distribuci on del numero de respuestas correctas sigue una normal con
varianza 250. Cu al es la probabilidad de que la varianza muestral sea (a) menor que 100,
(b) mayor que 500?
71. El numero de horas que duermen los futbolistas en la semana anterior a un partido que
define el campeonato mundial de clubes sigue una distribuci on normal con una desviaci on
est
andar de 4,5 horas. Se toma una muestra aleatoria de 30 futbolistas. Es mayor que
0,95 la probabilidad de que la desviaci
on est
andar muestral se (a) mayor que 3,5 horas, (b)
menor que 6 horas?
72. Una cierta empresa fabrican bombillas cuya tiempo de vida sigue una distribuci
on normal.
Se extrae una muestra aleatoria de 6 bombillas y se mide sus tiempos de vida.
(a) 0,05 es la probabilidad de que la varianza muestral sea mayor que que porcentaje de
la varianza poblacional?
(b) 0,10 es la probabilidad de que la varianza muestral sea mayor que que porcentaje de
la varianza poblacional?
72. (a) 221,4 (b) 32,2
73. Se extrae una muestra aleatoria de 15 empresarios y se les pregunta sobre su predicci
on
acerca de la tasa de desempleo para el p
oximo a
no. Supongamos que las predicciones para
la poblaci
on completa de empresarios sigue una distribuci
on normal con una desviaci on
est
andar de 1,8%.
74. Para precisar el tiempo mnimo en que dura un atleta en recorrer la misma distancia bajo las
mismas condiciones, se toma una muestra de 12 tiempos del mismo atleta. La distribuci on
poblacional de los tiempos es normal.
75. M
as de 0,10
76. Los gerentes de una industria que fabrica bolsas desean saber si pueden comparar dos pro-
cesos de manufactura en relaci on con la variabilidad de la resistencia que tiene el producto
respecto de la traccion. Manifiestan ellos que, en su concepto, los dos procesos producir an
bolsas con igual resistencia a la tracci on si la raz
on entre las varianzas muestrales de pro-
ductos de los dos procesos no es demasiado grande. Consideran que la raz on es demasiado
grande si la probabilidad de obtener un valor mayor o igual a un valor determinado es
menor que 0,05. Las muestras aleatorias (independientes) de 25 productos de cada uno
de los procesos, dan varianzas de 540 y 256. Creer an los directores que ambos procesos
producen bolsas con la misma variabilidad de resistencia a la tracci on? Supongamos que las
resistencias a la tracci
on de los productos fabricados con los dos procesos estan normalmente
distribuidas.
77. Se supone que la varianza de las calificaciones de las pruebas de estado en cierto pas es
la misma para hombres y mujeres. Una muestra aleatoria de 21 hombres y una muestra
aleatoria independiente de 19 mujeres dan varianzas de 876 y 400 respectivamente. Si las
calificaciones para hombres y mujeres est an normalmente distribuidos y tienen varianzas
iguales, cual es la probabilidad de obtener de esas muestras resultados tan extremos o m
as
extremos que estos?
77. 0,05
Ejercicios complementarios
78. Diga si la afirmacion dada es verdadera o falsa. Justifique siempre su respuesta. En caso
que sea falsa, de un contraejemplo.
(a) Suponga que se utiliza el muestreo aleatorio simple para escoger muestras aleatorias
(simples) de una poblacion que tiene por elementos a las letras a, b, c y d. Si el
muestreo se hace con reemplazo y con orden, entonces, la probabilidad de seleccionar
no 2 es igual a 24 = 21 .
dos muestras cualesquiera de tama
(b) La diferencia de dos medias poblacionales es un ejemplo de un par
ametro.
(c) La varianza muestral es una probabilidad.
(d) La distribuci
on muestral de un estadstico es una variable aleatoria.
(e) La distribuci
on muestral de un estadstico es un n
umero.
(f) Un estadstico es un n
umero.
(g) Si una poblaci
on es normal, entonces, la distribuci
on muestral de la media muestral es
la t de Student.
(h) Cuando el muestreo se hace sin reemplazo en una poblaci on finita, la media de la
distribuci
on de la media muestral es igual a la media de la poblaci
on original dividida
por el tamano de la poblaci
on.
(a) Que quiere decir que la media muestral tiene una distribuci
on en el muestreo?
(b) Una poblacion tiene una desviaci
on est
andar de 15. Se toman muestras aleatorias de
tamano n sin reemplazo y se calculan sus medias. Que le sucede al error est
andar de
la media cuando n crece de 400 a 900? Y a x cuando n crece?
(c) Bajo que condiciones existir
ala distribuci
on muestral de la moda?
(d) Si la distribuci
on muestral de la media es normal para todos los tama
nos n de muestras,
que sabe usted de la poblacion de la cual proceden las muestras?
(e) Es una muestra aleatoria simple la muestra 1,2 de la poblaci
on de valores 1, 2, 3, 4, 5,
6, 7, 8, 9, 10?
(f) Que importancia tiene el teorema central del lmite en la distrbuci
on muestral de la
media muestral?
79. (b) Decrece (c) La distribuci on muestral de la moda s olo tiene sentido cuando para
cada muestra extrada de la poblacion existe una u
nica moda. En la pr actica esto nunca
ocurre (d) La poblaci on es normal. Para muestras de tama no uno, la distribucion
muestral de la media es identica a la poblacion de la que proceden las muestras (e) No
podemos decir. Debemos conocer el procedimiento utilizado.
(a) Cu
al es el n
umero de posibles muestras de dos fondos?
(b) Hacer una lista de todas las posibles muestras.
(c) Hallar la funci
on de probabilidad de la distribuci
on en el muestreo de la media muestral.
(d) Comprobar directamente que la media de la distribuci
on muestral es igual a la media
poblacional.
81. Las calificaciones obtenidas por todos los estudiantes en las pruebas del ICFES sigue una
distribuci
on normal con una media de 420 y una desviaci on est
andar de 100. Se extrae una
muestra aleatoria de 25 puntuaciones.
(a) Hallar la probabilidad de que la media muestral de las puntuaciones sea mayor que 450.
(b) Hallar la probabilidad de que la media muestral de las puntuaciones tome un valor que
este entre 400 y 450.
(c) 0,10 es la probabilidad de que la media muestral de las puntuaciones sea mayor que
que n
umero?
(d) 0,10 es la probabilidad de que la media muestral de las puntuaciones sea menor que
que n
umero?
(e) 0,05 es la probabilidad de que la desviaci
on est
andar muestral de las puntuaciones sea
mayor que que numero?
(f) 0,05 es la probabilidad de que la desviaci
on est
andar muestral de las puntuaciones sea
menor que que numero?
(g) Si se toma una muestra de 50 calificaciones, la probabilidad de que la media muestral
de las puntuaciones sea mayor que 450, ser a mayor, menor o la misma que la obtenida
en el inciso (a)? No es necesario detallar los c
alculos. Realizar un gr
afico para ilustrar
el razonamiento.
81. (a) 0,0668 (b) 0,7745 (c) 445,6 (d) 394,4 (e) 123 (f ) 76 (g) Menor
82. En un determinado a no, las tasas de rentabilidad de las acciones de las companas electricas
siguieron una distribuci
on normal con media 14,8 y desviaci on est
andar 6,3. Se extrae una
muestra aleatoria de 9 de estas acciones.
(a) Cual es la probabilidad de que la media muestral de la tasa de rentabilidad sea mayor
que 19?
(b) Cual es la probabilidad de que la media muestral de la tasa de rentabilidad este entre
10,6 y 19?
(c) 0,25 es la probabilidad de que la media muestral de la tasa de rentabilidad sea menor
que que n
umero?
84. 0,005
85. Las calificaciones de cierto examen realizado por un grupo grande de estudiantes sigue
una distribucion normal con una desviaci on est
andar de 40 puntos. Se toma una muestra
aleatoria de 16 calificaciones para estimar la puntuaci on media en la poblaci
on. Sea X la
media muestral. Cu al es la probabilidad de que el intervalo que va de X 10 a X + 10
contenga la verdadera media poblacional?
85. 0,6826
86. En determinado a no, el 40% de las prestamos realizados en una entidad bancaria fueron can-
celados durante los 15 anos siguientes. Se examina una muestra aleatoria de 250 prestamos.
87. Se sabe que el salario devengado por las personas afiliadas a cierta entidad de salud sigue
una distribuci
on normal con una desviaci on est
andar de 6.600 d
olares. Se toma una muestra
aleatoria de 25 personas afiliadas a dicha entidad de salud.
(a) La probabilidad de que la vida media de una muestra aleatoria de nueve animales de
esta especie caiga entre 6,4 y 7,2 a
nos.
(b) El valor de X a la derecha del cual caera el 15% de las medias calculadas de muestras
aleatorias de tama
no 9.
89. Sean X1 , X2 , . . ., X100 variables aleatorias que representan los pesos netos reales de 100
bolsas de 50 libras de cemento, seleccionadas al azar.
(a) Si el peso especificado de cada bolsa es 50 y la varianza 1, calcule P (49, 75 X 50, 25)
(aproximadamente) empleando el teorema central del lmite.
(b) Si el peso esperado es 49, 8 libras, en lugar de 50 libras, de modo que en promedio las
bolsas tienen menos pesos, calcule P (49, 75 X 50, 25).
90. La longitud de cierta cuchara para postres seleccionada al azar es una variable aleatoria con
valor medio de 12 cm y desviacion est
andar de 0, 4 cm.
91. El tiempo que dedican a entrenar los futbolistas de de cierto pas en la semana anterior a la
final de los campeonatos sigue una distribucon normal con una desviaci on est
andar de 8,4
horas. Se toma una muestra aleatoria de estos futbolistas con el fin de estimar el tiempo
medio de entrenamiento para esta pobalci on de futbolistas.
92. Una pieza de tubo de PVC debe insertarse dentro de otra pieza. La longitud de la primera
est
a normalmente distribuida con valor medio de 20 pulgadas y desviaci on estandar de
0,5 pulgadas. La longitud de la segunda es una variable aleatoria normal con media y
desviaci
on est
andar de 15 pulgadas y 4 pulgadas, respectivamente. La cantidad de traslape
est
a normalmente distribuida con valor medio de 1 pulgada y desviaci on estandar de 0.1
pulgada. Si se supone que las longitudes y cantidades de traslape son independientes una
de otra, Cual es la probabilidad de que la longitud total, despues de la inserci
on, sean
entre 3,45 y 35 pulgadas?
92. 0,1588
Pruebas de hip
otesis
Contenido
79
80
Dr. rer. nat. Humberto Llinas
3. Aprender cu
ando usar pruebas de una cola y c
uando pruebas de dos colas.
Empleo de la estadstica
Una encuesta realizada en cierto a no revelo que el 78% de quienes re-
spondieron consideraron que estaban mejor financieramente que sus padres.
Una encuesta m as reciente encontro que 370 de las 500 personas quienes
respondieron pensaron que sus fortunas financieras eran mejores que las de
sus padres. Sugiere esto un descenso en la proporci on de personas que
consideran que estan financieramente m as estables de lo que estaban sus
padres?
(a) Un empresario afirma que, en promedio, las utilidades mensuales son por lo menos de $
5.000.000. Para vefificar esta afirmacion se promedian las utilidades de una muestra aleatoria
y se infiere el resultado a partir de la informaci
on muestral.
(b) Una papelera recibe un gran cargamento de lapiceros. Solo puede aceptar el envo si no hay
mas de un 3% de lapiceros defecutosos. La decisi
on de si aceptar la remesa puede basarse en
el examen de una muestra aleatoria de lapiceros.
Captulo 3. Pruebas de hipotesis
Estadstica inferencial 81
Las situaciones propuestas tienen algo en com un. La hip otesis se formula sobre la poblaci
on y las conclusiones sobre la validez de esta hip otesis se basan en la informacion muestral. En
eta secci
on, se introducir
a una herramienta general para abordar estos y otros problemas. Los
procedimientos especficos se desarrollar
an en las siguientes secciones.
Hip
otesis estadsticas
En general, una hipotesis es una explicaci on propuesta que puede, o no, ser cierta. Nuestra dis-
cusi
on se limitar
a a las hip
otesis estadsticas.
Definici
on 3.1.2 Una hipo tesis estadstica es una afirmacion cuantitativa acerca de una o
m
as poblaciones, o mejor, como es m as frecuente, afirmaciones sobre uno o m as par
ametros de
una o m
as poblaciones.
Las hip
otesis nula y alternativa
Las hip
otesis estadsticas son de dos tipos: las hip
otesis nula y alternativa.
Definicion 3.1.3 La la hipo tesis nula, que se simboliza por H0 y que es la hip otesis que se
debe comprobar. Es una afirmaci on en la que se dice que no hay diferencia alguna entre dos
poblaciones, entre dos par
ametros poblacionales o entre el valor verdadero de alg
un par
ametro y
su valor hipotetico.
Siempre que vayamos a escribir una hip otesis estadstica en terminos de la H0 o H1 , debemos
tener en cuenta los siguientes comentarios:
1. La hip
otesis nula H0 siempre se refiere a un valor especfico del par
ametro de poblaci
on
(como, por ejemplo, ), no al estadstico muestral (como X).
2. La expresi
on de la hip
otesis nula siempre contiene un signo igual respecto al valor especifi-
ametro poblacional (por ejemplo,1 H0 : = 36, H0 : 36 o H0 : 36).
cado del par
3. La expresion de la hip
otesis alternativa nunca contiene un signo igual respecto al valor
especificado de par
ametro de poblacion (por ejemplo, H0 : =
6 36, H0 : < 36 o H0 : >
36).
1
En general, si es un par
ametro poblacional y si k es cualquier n
umero real, entonces, la hipotesis
alternativa H1 : 6= k se llama alternativa bilateral y las hipotesis alternativas H1 : < k y
H1 : > k, alternativas unilaterales.
3.1. Conceptos de la prueba de hipotesis
82
Dr. rer. nat. Humberto Llinas
La especificaci
on de unas hipoteis nula y alternativa depende del problema. Para ilustrar estos
conceptos, consideremos las situaciones que se presentan en el siguiente ejemplo.
(a) Un empresario afirma que el peso medio poblacional (en gramos) de lapiceros por caja es de
por lo menos 300 gramos.
(b) Una empresa decide aceptar envos de piezas siempre y cuando no tenga evidencia para
sospechar que m
as del 4% son defectuosas.
(c) Supongamos que la conjetura de una profesor es que la utilizacion de la tecnologa no produce
diferencias en el promedio de las calificaciones del examen final.
(d) Como hip otesis de un trabajo, un investigador puede considerar que la propuesta de una nueva
ley es acogida de igual forma por hombres y mujeres.
SOLUCION:
(a) Sea el peso medio poblacional (en gramos) de lapiceros por caja. Si la hip
otesis es que esta
media es por lo menos 300 gramos, entonces, la hip
otesis nula es
H0 : 300.
La alternativa obvia es que el verdadero peso medio es inferior a 300 gramos, es decir,
H1 : < 300.
H0 : 0, 05.
Basandose en la informaci
on muestral, se contrasta esta hip
otesis frente a la alternativa uni-
lateral
H1 : > 0, 05.
(c) Sea la diferencia entre las calificaciones medias poblacionales para las dos partes del curso,
con y sin uso de la tecnologa. Entonces, la hip
otesis nula es
H0 : = 0.
Sin embargo, el profesor puede sospechar que posiblemente el uso de la tecnologa produzca
un incremento en el promedio y, en consecuencia, querr
a cotrastar la hip
otesis nula frente a
la alternativa unilateral
H1 : > 0.
Captulo 3. Pruebas de hipotesis
Estadstica inferencial 83
(d) Sea la diferencia entre las proporciones poblacionales a favor de la nueva ley. Entonces, la
hip
otesis nula es
H0 : = 0.
Si el investigador no tiene una buena raz on para sospechar que la mayor parte del apoyo
venga de una poblaci on en lugar de la otra, esta hip
otesis nula puede contrastarse frente a la
hipotesis alternativa bilateral
H1 : 6= 0.
1. Aceptar la hip
otesis nula (o rechazar la alternativa).
2. Rechazar la hip
otesis nula (o aceptar la alternativa).
Con el fin de llegar a una de estas conclusiones, se adopta una regla de decisio n basada en la
informacion muestral. En las secciones siguientes, estudiaremos reglas de decisi
on concretas.
Decisi
on sobre H0 H0 es verdadera H0 es falsa
Aceptar H0 Decision correcta Decision incorrecta
Rechazar H0 Decision correcta Decision correcta
Si aceptamos la hip otesis nula cuando es verdadera o se rechaza cuando es falsa, entonces, hemos
tomado una decisi on correcta. Pero si rechazamos la hip otesis nula cuando en realidad es ver-
dadera, hemos cometido un error; este evento lo llamamos un error de tipo I. Adem as, si aceptamos
la hip
otesis nula cuando es falsa, hemos cometido otro tipo de error; lo llamamos un error de tipo
II. Estos errores son eventos y, por lo tanto, ocurren con cierta probabilidad.
3.1. Conceptos de la prueba de hipotesis
84
Dr. rer. nat. Humberto Llinas
Definici
on 3.1.5 Se dice que cometemos un error de tipo I si rechazamos la hip otesis nula
cuando en realidad es verdadera y que cometemos un error de tipo II si aceptamos la hipotesis
nula cuando es falsa. La probabilidad de cometer estos errores est
a dada por
Los conceptos se
nalados en la definici
on 3.1.5 se pueden visualizar m
as claramente en la tabla 3.2.
Decisi
on sobre H0 H0 es verdadera H0 es falsa
Aceptar H0 Decision correcta Error de tipo II
Probabilidad = 1 Probabilidad =
1 se llama grado de confianza
Rechazar H0 Error de tipo I Decision correcta
Probabilidad = Probabilidad = 1
se llama nivel de significancia 1 se llama potencia
Ejemplo 3.1.6 Suponga que un nuevo procedimiento y m as caro para detectar el cancer de
mama en las mujeres se est a probando para ver si es superior al metodo usado generalmente. Las
hip
otesis estadsticas son:
Observese que las consecuencias de cometer un error de tipo I incrementaran los costos medicos.
En cambio, las de cometer un error de tipo II seran una menor eficacia de la prueba y, posible-
mente, una mayor proporci on de muestres por c
ancer.
Ejemplo 3.1.7 Supongamos que un individuo es juzgado por cierto delito que supuestamente ha
cometido. En este caso, las hip
otesis a tener en cuenta son:
H0 : El individuo es inocente.
H1 : El individuo es culpable.
Los abogados de la fiscala tratan de probar que el individuo es culpable, es decir, que H1 es
verdadera (o que H0 es falsa). Al llegar a su veredicto final, el jurado debe emitir una decis
on
Captulo 3. Pruebas de hipotesis
Estadstica inferencial 85
correcta o incorrecta. Las decisiones correctas son que el jurado vote inocente cuando el individuo
es inocente o que vote culpable cuando el individuo es culpable. Las decisiones incorrectas son
que el jurado vote por castigar al acusado cuando este es inocente (error de tipo I) o vote por
perdonarlo cuando sea culpable (error de tipo II).
Por supuesto, lo ideal sera que las probabilidades de los dos tipos de error fuesen lo mas pequenas
posible. Sin embargo, hay una clara compensaci on entre los dos. Cuando se ha tomado una
muestra, cualquier regla de decisi on que haga menos verosmil rechazar una hip otesis nula cierta,
inevitablemente, se traducir a en mayor verosimilitud de aceptar esta hip otesis cuando es falsa.
Ejemplo 3.1.8 Supongamos que, bas andonos en una muestra aleatoria, queremos probar la
hip
otesis nula de que el verdadero peso medio del contenido de caja de lapiceros es al menos
de 300 gramos. Dado un tama no muestral especfico (digamos, 40 observaciones), podemos adop-
tar la regla de decisi
on de rechazar la hip
otesis nula si el peso medio en la muestra es inferior a 295
gramos. Ahora, es f acil encontrar una regla de decisi on para la cual la probabilidad de cometer
un error de tipo I es menor.
Si modificamos nuestra regla de decisi on rechazar la hip otesis nula si el peso medio es infe-
rior a 295 gramos, se conseguir
a este objetivo. Sin embargo, hay que pagar un precio. Si usamos
la regla de decisi
on modificada, sera mas verosmil aceptar la hip
otesis nula, tanto si es cierta
como si es falsa. Por tanto, al disminuir la probabilidad de cometer un error de tipo I, hemos
aumentado la probabilidad de cometer un error de tipo II.
En el ejemplo 3.1.8, la u
nica manera de disminuir simult aneamente las dos probabilidades de error
ser
a obtener m as informacion sobre la verdadera media de la poblaci on, tomando una muestra
mayor. Habitualmente, lo que se hace en la pr actica es fijar la probabilidad de cometer un error
de tipo I a un nivel deseado, es decir, se fija el nivel de significancia. Entonces, esto determina la
regla de decisi
on adecuada, que a su vez determina la probabilidad de un error de tipo II. Este
procedimiento se ilustra en el esquema siguiente:
Ejemplo 3.1.9 Consideremos nuevamente la situaci on del ejemplo 3.1.8 en donde, a partir de
una muestra de 40 observaciones, se quiere probar si el verdadero peso medio del contenido de
caja de lapiceros es al menos de 300 gramos. Dada una regla de decisi on, podemos determinar
las probabilidades de los errores de tipo I y de tipo II asociadas al contraste. Sin embargo,
en realidad, procedemos fijando primero la probabilidad de rechazar la hip otesis nula cuando es
cierta sea como mucho 0,05. Podemos conseguirlo eliminando un n umero c apropiado a la regla
de decisi
on rechazar la hip
otesis nula si la media muestral es inferior a c gramos (en la secci
on
3.2 explicaremos como se puede hacer esto). Una vez elegido el n umero c, pueden calcularse las
probabilidades del error de tipo II usando las procedimientos que expondremos en la secci on ??.
3.1. Conceptos de la prueba de hipotesis
86
Dr. rer. nat. Humberto Llinas
Definicion 3.1.10 Un estadstico de prueba es un estadstico (es decir, una funci on que
s
olo depende de la informaci
on muestral) que se utiliza para determinar si se rechaza, o no, la
hip
otesis nula.
La regio n crtica es el conjunto de todos los valores del estadstico de prueba para los
cuales la hip
otesis nula ser
a rechazada.
El estadstico de prueba se determina teniendo en cuenta el par ametro sobre el cual se hace la
hipotesis y la naturaleza de la distribuci
on muestral del estadstico pertinente, como se ilustra en
el siguiente
Ejemplo 3.1.11 Supongamos que, de una poblaci on distribuida normalmente con varianza 2 ,
se selecciona una muestra aleatoria simple de tama no n, con media x y varianza s. Adem as,
supongamos que se quiere probar la hipotesis nula H0 : = 0 , siendo 0 un n
umero real dado.
(a) Si es conocida, el estadstico de prueba que se usa para verificar una hip
otesis sobre la media
poblacional es
x 0
Z = ,
/ n
el cual se distribuye como la distribuci
on normal est
andar.
(b) Si es desconocida, entonces, bajo ciertas condicones, el estadstico de prueba que se usa
para verificar una hip
otesis sobre la media poblacional es
x 0
t = ,
s/ n
Captulo 3. Pruebas de hipotesis
Estadstica inferencial 87
bargo, estos terminos no reflejan adecuadamente la asimetra de los estatus de las hipotesis nula
y alternativa, o las consecuencias de un procedimiento en el que se fija el nivel de significancia y
no se controla la probabilidad de un error de tipo II.
Como hemos visto, cuando aumenta el n umero de observaciones de la muestra, tambien lo hace
nuestra capacidad para detectar una hip otesis nula falsa. Por tanto, al aceptar una hip otesis
nula, no estamos asegurando necesariamente que haya mucho en su favor. Una afirmaci on mas
precisa, aunque m as pedante, sobre la situaci on puede ser los datos disponibles no proporcionan
suficiente evidencia para rechazar la hip otesis nula, dado que queremos fijar en la probabilidad
de rechazar una hip otesis nula que es cierta. Por esta raz on, algunos autores prefieren la frase
no se rechaza la hipotesis nula en lugar de se acepta la hip otesis nula. Nosotros seguiremos
usando aceptar como una manera eficiente de expresar esta idea, pero es importante tener en
cuenta la interpretacion de la frase. La situaci on es muy similar a la de un tribunal de justicia,
donde el acusado, al prinicipio, goza de la presunci on de inocencia, y la acusacion debe presentar
evidencia contraria lo suficientemente clara como para conseguir un veredicto de culpabilidad. En
el contexto de la prueba de hip otesis cl
asica, la hip
otesis nula se considera cierta inicialmente. La
tarea de persuadirnos de lo contrario corresponde a los datos de la muestra.
2 tesis mantenida es aquella de que se considera cierta salvo que los datos contengan suficiente
Una hipo
evidencia en contra
x 0 y la regi
el estadstico de prueba tiene la forma Z = / n
on crtica depender
a de cada uno de
estos tres casos, como se ilustra en la tabla 3.3.
Entonces, una prueba de hip otesis con nivel de significancia para la media es como se
x
0 el estad
presenta en la tabla 3.3, siendo Z = / n
stico de prueba correspondiente y Z/2 el valor
de una variable aleatoria a la derecha del cual se tiene un area de /2 en la distribuci
on normal.
Ejemplo 3.2.2 Como parte de un proceso de ensamblaje, se usa un taladro para hacer agujeros
en una lamina de metal. Cuando el taladro funciona adecuadamente, los di ametros de estos
agujeros tienen una distribuci
on normal con media de 2 centmetros y desviaci on tpica de 0,06
centmetros. Peri
odicamente, se miden los diametros de una muestra aleatoria de agujeros para
controlar que el taladro funciona adecuadamente. Asumamos que la desviaci on tpica no vara.
Una muestra aleatoria de nueve medidas da un di ametro medio de 1,95 centmetros. Probar la
hip
otesis de que la media poblacional es 2 centmetros frente a la alternativa de que no es as. Use
Captulo 3. Pruebas de hipotesis
Estadstica inferencial 89
H0 : = 2 versus H1 : 6= 2.
y para una prueba al nivel del 5%, tenemos que = 0, 05 y Z/2 = Z0,025 = 1, 96. Entonces,
como Z = 2, 50 es menor que Z/2 = 1, 96, se rechaza la hip
otesis nula al nivel de significancia
del 5%.
Ejemplo 3.2.3 Una muestra aleatoria de 100 muertes registradas en cierto pas durante el a no
pasado mostr o una vida promedio de 71,8 a nos. Suponiendo una desviacion est
andar poblacional
de 8,9 a
nos, parecera esto indicar que la vida promedio hoy en da es mayor que 70 a
nos? Utilice
un nivel de significancia del 5%.
SOLUCION:
Sea la vida promedio poblacional (en a nos). En este ejemplo, se quiere probar la hip
otesis
H0 : 70 a
nos versus H1 : > 70 a
nos.
Para una prueba al nivel del 5%, tenemos que = 0, 05 y Z = Z0,05 = 1, 64. Entonces, como
Z = 2, 02 es mayor que Z = 1, 64, se rechaza la hip otesis nula al nivel de significancia del 5%.
Es decir, se concluye que la vida promedio hoy en da es mayor que 70 a nos.
Nuevamente, para cualquiera de los tres casos siguientes que podemos considerar para la hip
otesis
nula
H0 : = 0 , H0 : 0 , H0 : 0 ,
Teorema 3.2.4 Sean x y s2 la media y varianza de una muestra aleatoria de tama no n < 30
tomada de una poblaci on normal con media y varianza 2 desconocida. Entonces, una prueba de
hip
otesis con nivel de significancia para la media es como se presenta en la tabla 3.4, siendo
t = x 0 el estad
s/ n
stico de prueba correspondiente y t/2 el valor de una variable aleatoria a la
derecha del cual se tiene un a
rea de /2 en la distribuci
on t de Student con n1 grados de libertad.
q
Si la poblaci
on es finita de tama no N , se reemplaza sn por sn N N 1 . Es importar enfatizar que
n
Captulo 3. Pruebas de hipotesis
Estadstica inferencial 91
xp0 y la regi
El estadstico de prueba tiene la forma Z = / n
on crtica depender
a de cada uno de
estos tres casos, como se ilustra en la tabla 3.5.
(a) n 30;
(b) np 5 y n(1 p) 5.
Entonces, una prueba de hip otesis con nivel de significancia para la proporci
on p es como se
pp 0
presenta en la tabla 3.5, siendo Z = q p (1p ) el estadstico de prueba correspondiente y Z/2 el
0 0
n
valor de una variable aleatoria a la derecha del cual se tiene un a
rea de /2 en la distribuci
on
normal.
q
p0 (1p0 )
Para el caso de una poblaci no N , debemos reemplazar
on finita de tama n por la cantidad
q q
p0 (1p0 ) N n
n N 1 .
Ejemplo 3.3.2 De una muestra aleatoria de 802 clientes de supermercados, suponga que 378
pagaron sus artculos con tarjetas de credito. Contrastar el nivel del 10%, la hip otesis nula de
que al menos la mitad de los compradores pagan sus artculos con t arjetas de credito frente a la
3.3. Pruebas para la proporcion
92
Dr. rer. nat. Humberto Llinas
En este ejemplo, p0 = 0, 50, n = 802 ( 30), p = 378/802 = 0, 471. Observese que puede aplicar el
teorema 3.2.1 porque el supuesto (a) del teorema se cumple. En este caso, el valor del estadstico
de prueba est
a dado por
p p0 0, 471 0, 50
Z=q =p = 1, 64.
p0 (1p0 ) (0, 50)(0, 50)/802
n
Para una prueba al nivel del 10%, tenemos que = 0, 10 y Z = Z0,10 = 1, 28. Entonces, como
Z = 1, 64 es menor que Z = 1, 28, se rechaza la hipotesis nula al nivel de significancia del
10%.
Ejemplo 3.3.3 Un doctor afirma que el 12% de todas las citas son canceladas, durante un periodo
de seis semanas, fueron canceladas 21 de las 200 citas del doctor. Haga una prueba con un nivel
de significancia del 5% para determinar si la verdadera proporci on de todas las citas que son
canceladas es diferente del 12%.
SOLUCION:
Sea p la proporci
on poblacional de citas canceladas. En este ejemplo queremos probar la hip
otesis
H0 : p = 0, 12 versus H1 : p 6= 0, 12.
Tenemos que p0 = 0, 12, n = 200 ( 30), p = 21/200 = 0, 105. Nuevamente podemos aplicar el
teorema 3.2.1. En este caso, el valor del estadstico de prueba est
a dado por
p p0 0, 105 0, 12
Z=q =p = 0, 65.
p0 (1p0 ) (0, 12)(0, 88)/200
n
Para una prueba al nivel del 5%, tenemos que = 0, 05 y Z/2 = Z0,025 = 1, 96. Entonces, como
Z = 0, 65 est a entre Z/2 = 1, 96 y Z/2 = 1, 96, se acepta la hip otesis nula al nivel de
significancia del 5%. Es decir, no tenemos evidencia estadstica para rechazar la afirmacion del
doctor.
Captulo 3. Pruebas de hipotesis
Estadstica inferencial 93
exitos es p2 y la proporci
on muestral resultante es p2 .
(p p2 ) (p1 p2 )
Z = q1
p1 (1p1 )
n1 + p2 (1p
n2
2)
tiene aproximadamente una distribuci on normal estandar. Supongamos que que queremos con-
trastar la hipotesis de que las proporciones poblacionales son iguales. Si denotamos por p0 su
valor comun, entonces, bajo esta hip
otesis, tenemos que
p1 p2
Z=q
p0 (1p0 ) p0 (1p0 )
n1 + n2
Reemplazando el valor desconocido p0 por p0 se obtiene una variable aleatoria cuya distribuci
on
est
a pr
oxima a la normal. Este resultado es la base para probar las hip
otesis
H0 : p1 p2 = 0, H0 : p1 p2 0, H 0 : p1 p 2 0
y la regi
on crtica depender
a de cada uno de estos tres casos, como se ilustra en la tabla 3.6.
Teorema 3.4.1 Sea p1 la proporci on de exitos observada en una muestra aleatoria de tama no n1 ,
procedente de una poblaci on p1 de exitos, y sea p2 la proporci
on con proporci on de exitos observada
en una muestra aleatoria independiente de tama no n2 , procedente de una poblaci
on con proporci on
de exitos p1 . Supongamos que se cumple alguna de las siguientes dos condiciones:
(a) n1 30 y n2 30;
(b) n1 p1 5, n1 (1 p1 ) 5, n2 p2 5 y n2 (1 p2 ) 5.
Entonces, una prueba de hipotesis con nivel de significancia para la diferencia de proporciones
p1 p2 es como se presenta en la tabla 3.6, siendo
p1 p 2
Z=q
p0 (1p0 ) p0 (1p0 )
n1 + n2
Ejemplo 3.4.2 Un rector de cierta universidad afirma que la proporci on de hombres que tienen
auto en el campus es mayor a la proporci on de mujeres que tienen auto en el campus. Un profesor
de estadstica se interesa en la afirmaci
on y entrevista aleatoriamente a 100 hombres y a 100
mujeres. Encuentra que 34 hombres y 27 mujeres tienen autos en el campus. Puede concluirse
con un nivel del 5% que la afirmaci on del rector es falsa?
SOLUCION:
Sean p1 y p2 las proporciones poblacionales de hombres y mujeres, respectivamente, que tienen
auto en el campus. Entonces, queremos contrastar la hip otesis nula
H 0 : p1 p2 0 versus H1 : p1 p2 > 0.
Captulo 3. Pruebas de hipotesis
Estadstica inferencial 95
Para una prueba al nivel del 5%, tenemos que = 0, 05 y Z = Z0,05 = 1, 64. Entonces, como
Z = 1, 075 es menor que Z = 1, 64, al nivel de significancia del 5%, no se rechaza la hip
otesis nula
de que la proporci
on de hombres que tienen auto en el campus es menor o igual a la proporci on de
mujeres que tienen auto en el campus. Es decir, los datos muestran que la afirmaci on del rector
es falsa.
Ejemplo 3.4.3 De una muestra aleatoria de 203 anuncios publicados en revistas colombianas, 52
eran de deportes. De una muestra aleatoria independiente de 270 anuncios publicados en revistas
brasileras, 56 eran de deportes. Usando un nivel del 5%, constrastar frente a una alternativa bi-
lateral, la hip
otesis nula de que las proporciones de anuncios c
omicos de las revistas colombianas
y americanas son iguales.
SOLUCION:
Denotemos por p1 y p2 las proporciones poblacionales de anuncios deportivos en revistas colom-
bianas y brasileras, respectivamente. Entonces, queremos contrastar la hip otesis nula
H 0 : p1 p2 = 0 versus H1 : p1 p2 6= 0.
En este ejemplo,
52 56
n1 = 203, p1 = = 0, 256, n2 = 270, p2 = = 0, 207.
203 270
Para una prueba al nivel del 5%, tenemos que = 0, 05 y Z/2 = Z0,025 = 1, 96. Entonces, como
Z = 1, 26 es menor que Z/2 = 1, 96, al nivel de significancia del 5%, no se rechaza la hip
otesis
nula de que las proporciones poblacionales de anuncios deportivos en las revistas colombianas y
brasileras son las mismas.
1. Las varianzas poblacionales son conocidas o desconocidas y las muestras son grandes.
2. Las varianzas poblacionales son iguales, desconocidas y las muestras son peque
nas.
3. Las varianzas poblacionales son diferentes, desconocidas y las muestras son peque
nas.
Para estos tres casos supondremos que disponemos de una muestra aleatoria (de tama no n1 , con
2
media x1 y varianza s1 ) que es tomada de una poblaci on con media 1 y varianza 1 , y de una
muestra aleatoria (independiente de la anterior, de tama no n2 , con media x2 y varianza s22 ) que
es tomada de una poblaci on con media 2 y varianza 2 .
H0 : 1 2 = d0 , H0 : 1 2 d0 , H0 : 1 2 d0 .
(x1 x2 ) d0
Z= q 2
1 22
n1 + n2
y la regi
on crtica depender
a de cada uno de estos tres casos, como se ilustra en la tabla 3.7.
Captulo 3. Pruebas de hipotesis
Estadstica inferencial 97
Teorema 3.5.1 Sean x1 y x2 las medias de muestras aleatorias independientes de tama nos n1
2 2
y n2 de poblaciones con medias 1 , 2 y varianzas 1 , 2 , respectivamente. Supongamos que se
cumple alguna de las siguientes condiciones:
(a) Ambas poblaciones son normales y ambas varianzas poblaciones 12 y 22 son conocidas;
Entonces, una prueba de hip otesis con nivel de significancia para la diferencia 1 2 es como
se presenta en la tabla 3.7, siendo
(x1 x) d0
Z= q 2
1 22
n1 + n2
el estadstico de prueba correspondiente y Z/2 el valor de una variable aleatoria a la derecha del
cual se tiene un a rea de /2 en la distribuci
on normal.
En el caso en que las varianzas poblacionales son desconocidas, utilizamos las desviaciones mues-
on de las correspondientes desviaciones poblacionales.
trales repectivas como estimaci
Ejemplo 3.5.2 Se llev o a cabo un estudio entre expertos matem aticos para conocer su opini on
sobre las mujeres matem aticas. Se les pidi o que evaluaran en una escala de 1 (totalmente en
desacuerdo) a 5 (totalmente de acuerdo) la afirmaci on: Las mujeres matem aticas tienen la misma
oferta de trabajo que los hombres. Para una muestra aleatoria de 186 hombres de esta profesi on,
la respuesta media fue de 4.059 con una desviaci on tpica de 0,839. Para una muestra aleatoria
independiente de 172 mujeres matem aticas, la respuesta media fue 3.680 con una desviaci on tpica
de 0,966. Utilize un nivel de significancia del 5% para contrastar la hip otesis nula de que las dos
medias poblacionales son iguales frente a la alternativa de que ambas sean diferentes.
SOLUCION:
Sean 1 y 2 las respectivas medias poblacionales de hombres y mujeres matem aticas. Queremos
contrastar la hip
otesis
H0 : 1 2 = 0 versus H1 : 1 2 6= 0.
Tenemos que
Observemos que podemos aplicar el teorema 3.2.1. En este caso, d0 = 0 y el valor del estadstico
de prueba est
a dado por
Para una prueba al nivel del 5%, tenemos que = 0, 05 y Z/2 = Z0,025 = 1, 96. Entonces, como
Z = 3, 95 es mayor que Z = 1, 96, se rechaza la hip
otesis nula al nivel de significancia del 5%. Por
lo tanto, estos datos sugieren que la respuesta media en la poblaci on es mayor para los hombres
que para las mujeres. Es decir, en promedio, los hombres tienen m as confianza que las mujeres en
que a las mujeres se les ofrecen las mismas ofertas de trabajo que a los hombres.
Ejemplo 3.5.3 En un establecimiento escolar suburbano, se seleccion o al azr una muestra aleato-
ria de 25 alumnos de quinto grado (grupo 1) de una poblacion de estudiantes perteneciente a
familias en que ambos padres trabajan. Se seleccion o tambien una muestra aleatoria al azar de
15 estudiantes (grupo 2) del mismo grado y establecimiento escolar entre aquellos estudiantes que
pertenecen a familias en que solamente el padre trabaja. El an alisis de los puntajes de rendimiento
escolar (en escala de 1 a 100) de los dos grupos dio los siguientes resultados: un puntaje promedio
de 78 para el grupo 1 y de 85 para el grupo 2. La experiencia muestra que las poblaciones de
puntajes para ambos grupos est an distribuidas en forma aproximadamente normal, con varianzas
2 2
de 1 = 81 y 2 = 25. Utilizando un nivel de significancia del 5% y con base en estos datos,
determinar si se puede concluir que la media de la poblaci on de la que se seleccion o el grupo 1 es
inferior a la media de la poblaci
on de la que se seleccion o el grupo 2.
SOLUCION:
Sean 1 y 2 las respectivas medias poblacionales de puntajes promedios. Al plantear las hip otesis
del problema, obtenemos
H0 : 1 2 o su equivalente H0 : 1 2 0;
H1 : 1 < 2 o su equivalente H1 : 1 2 < 0.
Observemos que nuevamente podemos aplicar el teorema 3.2.1. En este caso, d0 = 0 y el valor del
estadstico de prueba est
a dado por
Para una prueba al nivel del 5%, tenemos que = 0, 05 y Z = Z0,05 = 1, 64. Entonces, como
Z = 3, 16 es menor que Z = 1, 64, se rechaza la hip otesis nula al nivel de significancia del
5%. Por lo tanto, se concluye que en ese establecimiento escolar, los puntajes promedios generales
de rendimiento de los estudiantes de quinto grado que pertenecen a familias en que ambos padres
trabajan son inferiores a los de los estudiantes que pertenecen a familias en que solamente el padre
trabaja.
Captulo 3. Pruebas de hipotesis
Estadstica inferencial 99
H0 : 1 2 = d0 , H0 : 1 2 d0 , H0 : 1 2 d0 ,
(x1 x2 ) d0
t= q
s2 s2
n1 + n2
Teorema 3.5.4 Sean x1 y x2 las medias de muestras aleatorias independientes de tama nos n1 <
2 2
30 y n2 < 30 de poblaciones normales con medias 1 , 2 y varianzas 1 , 2 iguales y desconocidas.
Entonces, una prueba de hipotesis con nivel de significancia para la diferencia de medias 1 2
es como se presenta en la tabla 3.8, siendo
(x1 x2 ) d0
t= q
s2 s2
n1 + n2
Ejemplo 3.5.5 Se llev o a cabo un estudio que pretenda valorar el efecto de la presencia de un
moderador sobre el numero de ideas generadas por un grupo. Se observaron cuatro miembros, con
y sin moderadores. Para una muestra aleatoria de cuatro grupos con moderador, el n umero medio
de ideas generadas por grupo fue de 78, con una desviaci on tpica de 24,4. Para una muestra
aleatoria independiente de cuatro grupos sin moderardor, el n umero medio de ideas generadas
por grupo fue de 63,5, con una desviaci on tpica de 20,2. Asumiendo que las distribuciones
poblacionales son normales con igual varianza, contrastar la hip otesis nula de que las medias
poblacionales son iguales frente a la alternativa de que la verdadera media es mayor para los
grupos con moderador. Use un nivel de significancia del 10%.
SOLUCION:
Sean 1 y 2 las respectivas medias poblacionales para los grupos con y sin moderador. Queremos
contrastar la hip
otesis
H0 : 1 2 = 2 versus H1 : 1 2 > 2.
Tenemos que
n1 = 4, x1 = 78, 0, s1 = 24, 4;
n2 = 4, x2 = 63, 5, s2 = 20, 2.
Observemos que podemos aplicar el teorema 3.5.4. En este caso, d0 = 0. La varianza poblacional
com
un se estima como
(n1 1)s21 + (n2 1)s22 (3)(24, 4)2 + (3)(20, 2)2
s2 = = = 501, 7.
n1 + n2 2 4+42
Adem
as, el valor del estadstico de prueba est
a dado por
(x1 x2 ) d0 (78, 0 63, 5) 0
t = q = q = 0, 915
s 2 s 2 501,7 501,7
n1 + n2 4 4
Captulo 3. Pruebas de hipotesis
Estadstica inferencial 101
Para una prueba al nivel del 10%, tenemos que = 0, 10 y t = t0,10 = 1, 44 con = n1 +n2 2 = 6
grados de libertad. Entonces, como t = 0, 915 es menor que t = 1, 44, no puede rechazarse la
hip
otesis nula de igualdad de medias frente a la alternativa unilateral al nivel de significancia del
10%. Por lo tanto, los datos de la muestra no contienen suficiente evidencia que sugiera que, en
promedio, se generan m as ideas en los grupos con moderador.
Ejemplo 3.5.6 Se llev o a cabo un experimento para comparar el deterioro abrasivo de dos ma-
teriales laminados diferentes. Se probaron doce piezas del material 1, exponiendo cada una a una
maquina para medir el deterioro. De la misma manera, se probaron diez piezas del material 2.
En cada caso, se observ o la profundidad del deterioro. Las muestras del material 1 dieron un de-
terioro promedio (registrado) de 85 unidades con una desviaci on estandar muestral de 4, mientras
que las muestras del material 2 dieron un promedio de 81 y una desviaci on estandar muestral de
5. Puede concluirse en el nivel de significancia del 5% que el deterioro abrasivo del material 1
excede al del material 2 por m as de 2 unidades? Asuma que las poblaciones son aproximadamente
normales con varianzas iguales.
SOLUCION:
Sean 1 y 2 las respectivas medias poblacionales para las piezas de los materiales 1 y 2. Queremos
contrastar la hip
otesis
H0 : 1 2 = 0 versus H1 : 1 2 > 0.
Tenemos que
n1 = 12, x1 = 85, s1 = 4;
n2 = 10, x2 = 81, s2 = 5.
Observemos que nuevamente podemos aplicar el teorema 3.5.4. En este caso, d0 = 2. La varianza
poblacional com
un se estima como
Adem
as, el valor del estadstico de prueba est
a dado por
Para una prueba al nivel del 5%, tenemos que = 0, 05 y t = t0,05 = 1, 725 con = n1 + n2 2 =
20 grados de libertad. Entonces, como t = 1, 04 es menor que t = 1, 725, no puede rechazarse
la hip
otesis nula de igualdad de medias frente a la alternativa unilateral al nivel del 5%. Por lo
tanto, no se est
a en condiciones de concluir que el deterioro abrasivo del material 1 excede al del
material 2 por m as de dos unidades.
H0 : 1 2 = d0 , H0 : 1 2 d0 , H0 : 1 2 d0 ,
Teorema 3.5.7 Sean x1 y x2 las medias de muestras aleatorias independientes de tama nos
2 2
n1 < 30 y n2 < 30 de poblaciones normales con medias 1 , 2 y varianzas 1 , 2 diferentes
y desconocidas. Entonces, una prueba de hip
otesis con nivel de significancia para la diferencia
de medias 1 2 es como se presenta en la tabla 3.8, siendo
(x1 x2 ) d0
t= q
s2 s2
n1 + n2
es el estadstico de prueba correspondiente. Ademas, t/2 el valor de una variable aleatoria de una
variable aleatoria que tiene distribuci
on t de Student con
2
s21 s22
n1 + n2
= (s21 /n1 )2 (s22 /n2 )2
n1 1 + n2 1
Ejemplo 3.5.8 El departamento de zoologa de cierto instituto llev o a cabo un estudio para
estimar la diferencia en la cantidad de cierta sustancia qumica medida en dos estaciones diferentes
de un ro. La sustancia se mide en miligramos por litro. Se reunieron 15 muestras de la estaci on 1
y 12 muestras de la estaci on 2. Las 15 muestras de la estacion 1 tuvieron un contenido promedio
de sustancia qumica de 3,84 miligramos por litro y una desviaci on estandar de 3,07 miligramos
Captulo 3. Pruebas de hipotesis
Estadstica inferencial 103
H0 : 1 2 = 0 versus H1 : 1 2 6= 0.
Observemos que podemos aplicar el teorema 3.5.7. En este caso, d0 = 0 El valor del estadstico
de prueba est
a dado por
Para una prueba al nivel del 5%, tenemos que = 0, 05 y t/2 = t0,025 = 2, 120 con
i2
(3,07)2 (0,80)2
h
15 + 12
= ((3,07)2 /15)2 ((0,80)2 /12)2
= 16, 3 16
151 + 121
grados de libertad. Entonces, como t = 2, 846 es mayor que t/2 = 1, 725, puede rechazarse
la hip
otesis nula de igualdad de medias frente a la alternativa bilateral al nivel del 5%. Por lo
tanto, podemos concluir que los contenidos promedio reales de sustancia para estos dos lugares
son diferentes (comparese este resultado con el obtenido en el ejemplo ??).
(n 1)s2
2 =
02
(n 1)s2
2 =
02
el estadstico de prueba correspondiente. Adem as, 2 y 21 son los valores de una variable
2 2
aleatoria que deja un a rea de 2 y 1 2 , respectivamente, a la derecha de la distribuci
on chi-
cuadrada con n 1 grados de libertad.
Ejemplo 3.6.2 Con el fin de cumplir las normas establecidas, es importante que la varianza en
el porcentaje de impurezas de unas remesas de productos qumicos no supere el 4%. Una muestra
aleatoria de 20 envos dio una varianza muestral de 5,62 en el porcentaje de impureza. Al nivel del
10%, contrastar la hip otesis nula de que la varianza de la poblaci
on no es mayor que 4. Sup
ongase
que la distribuci
on de la poblaci on es normal.
SOLUCION:
Sea 2 la varianza poblacional de la concentraci on de impureza. Queremos contrastar la hipotesis
H0 : 4 versus H1 : > 4.
Captulo 3. Pruebas de hipotesis
Estadstica inferencial 105
Para una prueba al nivel del 10%, tenemos que = 0, 10 y 2 (19) = 20,10 (19) = 27, 20 con
= n 1 = 19 grados de libertad. Entonces, como 2 = 26, 695 es menor que 20,10 (19) = 27, 20,
no puede rechazarse la hipotesis nula al nivel del 10%. Por lo tanto, los datos no contienen
una evidencia particularmente importante contra la hipotesis de que la varianza poblacional del
porcentaje de impureza no es mayor que 4.
Ejemplo 3.6.3 La varianza calculada de los puntajes en lectura de los estudiantes de tercer grado
del sistema escolar A, obtenidos durante 10 a nos, es 1,44. Una muestra aleatoria de 21 estudiantes
de tercer grado de otro sistema escolar (B) con quienes se practic o la misma prueba de lectura,
arroj 2
o una varianza de s = 1, 05. Proporcionan estos datos evidencia suficiente como para
concluir, al nivel de significancia 0,05, que los puntajes de los alumnos de tercer grado del sistema
B son menos variables de que los de los estudiantes del sistema A? Sup onga que los puntajes de
los estudiantes de tercer del sistema B est an normalmente distribuidos.
SOLUCION:
Sea 2 la varianza poblacional de los puntajes de los estudiantes de tercer del sistema B. Queremos
contrastar la hipotesis
H0 : 1, 44 versus H1 : < 1, 44.
Para este ejemplo, s2 = 1, 05, n = 21 y 02 = 1, 44. Observemos que nuevamente podemos aplicar
el teorema 3.6.1. En este caso, el valor del estadstico de prueba est
a dado por
Para una prueba al nivel del 5%, tenemos que = 0, 05 y 21 (20) = 20,90 (20) = 10, 851 con
= n 1 = 20 grados de libertad. Entonces, como 2 = 14, 48 es mayor que 20,05 (20) = 10, 851,
podemos rechazar la hip otesis nula al nivel del 5%. Por lo tanto, concluimos que los puntajes en
la prueba de lectura de los estudiantes de tercer grado del sistema B son menos variable sque los
de tercer grado del sistema escoalr A.
H0 : 1 = 2 , H0 : 1 2 , H0 : 1 2 ,
de dos varianzas
3.7. Prueba para la razon
106
Dr. rer. nat. Humberto Llinas
Teorema 3.7.1 Si s21 y s22 son las varianzas de muestras aleatorias independientes de tama
no
n1 y n2 tomadas de 2 2
poblaciones normales con varianzas 1 y 2 , respectivamente, entonces, una
prueba de hipotesis con nivel de significancia para la razon de varianzas 12 /2 es como se
presenta en la tabla 3.10, siendo
s2
F = 21
s2
el estadstico de prueba correspondiente. Adem as, F 2 (1 , 2 ) es el valor de una variable aleatoria
que deja un a rea de 2 a la derecha de la distribuci
on F con 1 = n1 1 y 2 = n2 1 grados de
libertad.
Ejemplo 3.7.2 Se compararon las varianzas de los vencimientos de dos tipos de bonos. Para
una muestra aleatoria de 17 bonos del primer tipo, la varianza de los vencimientos (en a nos al
cuadrado) fue de 123,35. Para una muestra aleatoria independiente de 11 bonos del segundo
tipo, la varianza de los vencimientos fue de 8,02. Al nivel del 2%, determinar si las dos varianzas
poblacionales son diferentes. Asuma que las dos poblaciones tienen distribucion normal.
SOLUCION:
Sean 12 y 22 las respectivas varianzas poblacionales. Queremos contrastar la hipotesis
H0 : 12 = 22 versus H1 : 12 6= 22 .
Captulo 3. Pruebas de hipotesis
Estadstica inferencial 107
Observemos que podemos aplicar el teorema 3.7.1. En este caso, el valor del estadstico de prueba
est
a dado por
s2 123, 35
F = 12 = = 15, 38.
s2 8, 02
Para una prueba al nivel del 2%, tenemos que = 0, 02 e, interpolando, F/2 (16, 10) = F0,01 (16, 10) =
4, 53 con 1 = n1 1 = 16 y 2 = n2 1 = 10 grados de libertad. Claramente, F = 15, 38 es
mucho mayor que F0,01 (16, 10) = 4, 53, es decir, podemos rechazar la hip otesis nula al nivel del
5%. Por consiguiente, hay abrumadora evidencia de que las varianzas en los vencimientos son
diferentes para estos dos tipos de bonos.
Ejemplo 3.7.3 Al probar la diferencia en el desgaste abrasivo de los dos materiales en el ejemplo
3.5.6, se asumio que las varianzas poblacionales desconocidas eran iguales. Es esta justificaci
on
correcta? Utilice un nivel de significancia del 10%.
SOLUCION:
Sean 12 y 22 las respectivas varianzas poblacionales para el desgaste abrasivo de los materiales 1
y 2, respectivamente. En este caso, queremos contrastar la hip otesis
H0 : 12 = 22 versus H1 : 12 6= 22 .
n1 = 12, s1 = 4, n2 = 10, s2 = 5.
Observemos que podemos aplicar el teorema 3.7.1. En este caso, el valor del estadstico de prueba
est
a dado por
s2 16
F = 12 = = 0, 64.
s2 25
Para una prueba al nivel del 10%, tenemos que = 0, 10, de donde /2 = 0, 05. Ahora,
F0,05 (11, 9) = 3, 11 y, teniendo en cuenta el teorema 1.7.8,
1
F0,95 (9, 11) = = 0, 34.
F0,05 (11, 9)
Debido a que F = 0, 64 es mayor que F0,95 (9, 11) = 0, 34, no podemos rechazar la hipotesis nula
al nivel del 10%. Por consiguiente, se concluye que no hay evidencia suficiente para afirmar que
las varianzas son diferentes. Es decir, la suposici
on es correcta.
de dos varianzas
3.7. Prueba para la razon
. 108 .
Dr. rer. nat. Humberto Llinas
Indice
Regi
on crtica y de aceptaci
on, 86
Regla de decision, 83
Sesgo
muestral, 7
negativo, 8
positivo, 8
Tabla
de n
umeros aleatorios, 10
Teorema
de De Moivre-Laplace, 43
Varianza muestral, 64
INDICE