Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTAASVTCA
illtodos y Z\pficaciones
Iidtin Galinclo
En cualquier actividad de Ia ciencia, la tcnica, Ios negocios o de la vida cotidiana, que d como
resultado una serie de mediciones, se obtiene ms informacin que las simples cifras recolectadas. El
cmo conseguir la informacin, su anlisis e interpretacin se puede realizar de muchas maneras, pero
primero se debe tener una idea clara de las caractersticas ms importantes de los datos obtenidos.
Los datos pueden ordenarse en tablas; sin embargo, stas no muestran su comportamiento global.
Su representacin grfica ayuda a captar fcilmente tendencias y establecer modelos probabilsticos.
Conjuntamente con el empleo de mtodos numr'icos sencillos, se puede presentar datos, resumir in-
formacin y dar una respuesta rpida del comportamiento global de Ias unidades de donde provienen
dichos datos.
En este captulo examinaremos varios de estos mtodos, que son aquellos que frecuentemente aparecen
en los paquetes computacionales de estadstica.
1.1. Introduccin
En primer lugar, demos una definicin de la ciencia Estadstica que recoge mucho de lo que ella realiza.
Para su mejor estudio, a Ia Estadstica se Ia divide en dos grandes ramas: la Descriptiva y la Inferencial.
La Estadst'ica Descriptiua -tambin conocida como An.lisis Erploratori,o de Datos- consiste, sobre
:odo, en la presentacin de datos en forma de tablas y grficos. Est diseada para resumir o describir
los datos sin factores adicionales; esto es, sin intentar inferir nada que vaya ms all de los datos, como
:ales.
Capitulo 7. AnIsis Exploratorio de Datos
Para aplicar los mtodos estadsticos a la informacin disponible, es necesario tener presente los tipos
de problemas que esta ciencia resuelve.
Anlisis de muestras. Es frecuente que, por razones tcnicas o econmicas? no sea posible estudiar
los elementos de una poblacin. Por ejemplo, para determinar Ia opinin de la poblacin ante las
elecciones solo se investiga a un grupo pequeo, ya que es imposible consultar a todas las personas
en capacidad de votar. Anlogamente, se acude a una muestra para estudiar la rentabilidad de un
proceso de fabricacin o para de terminar el nivel de ocupacin de la poblacin.
La Estadstica se utiliza para elegir una muestra representativa y para hacer inferencias respecto a la
poblacin a partir de lo observado en la muestra. Este es el procedimiento aplicado para, por ejemplo:
Medicin de relaciones. Los gastos en alimentacin de una familia dependen de sus ingresos, pero,
es imposible determinar con exactitud cul ser el ga.sto de una familia de ingresos dados. Entonces,
no existe una relacin exacta, sino estadstica. Determinar y medir estas relaciones es importante
porque, debido a los errores de medicin, las relaciones que observamos entre variables fsicas, sociales
o tcnicas son, casi siempre, estadsticas.
Prediccin. Muchas variables econmicas y fsicas tienen cierta inercia en su evolucin y aunque
sus valores futuros son desconocidos, el estudio de su historia es informativo prra prever su compor-
tamiento futuro. Este es el mecanismo que se emplea para prever la demanda de un producto, la
temperatura en un horno industrial o las magnitudes macroeconmicas.
7.2. Definiciones bsicas
Para la obtencin de informacin estadstica se emplean dos formas bien diferenciadas: los mtodos
de muestreo y los experimentos diseados.
Una investigacin por muestreo es un estudio cuya finalidad es la recoleccin de datos y en el que
el investigador no tiene control sobre las condiciones o los individuos participantes. Ejemplos de
muestreos son los censos, las encuestas electorales o de consumo de un producto.
Un experimento es cualquier proceso o estudio en el que se realiza una recoleccin de datos donde el
investigador, usualmente, tiene control sobre algunas de las condiciones bajo las cuales el experimento
tiene lugar. Por ejemplo, en el desarrollo de un nuevo medicamento, en la preparacin de una nueva
aleacin de acero para usar en los automviles, es necesario realizar experimentos para comparar su
efectividad con otros previamente existentes.
Las que antes indicamos son las principales aplicaciones de la Estadstica, cuando esta ciencia se
utiliza para analizar procesos o fenmenos naturales a profundidad. Pero este no es nuestro caso, por
el momento, nosotros podemos pensar que la Estadstica es la ciencia de <<deducir hechos a partir de
datos y de figuras>>.
Aqu surgen varias ideas importantes en todo anlisis estadstico: la unidad muestral,la poblacin (o
uniaerso) y la muestra.
Definicin (de unidad muestral o experimental) Una unidad es una persona, animal, planta o
cosa que es examinada por un investigador; es el objeto bsico sobre el cual el estudio o experimento
se lleva a cabo.
Definicin (de poblacin o universo) Una poblacin es una coleccin completa de personas,
animales, plantas o cosas de las cuales se desea recolectar datos. Es el grupo entero al que queremos
describir o del que deseamos sacar conclusiones.
Generalmente, se selecciona una muestra porque la poblacin es demasiado grande para estudiarla
enteramente. La muestra debe ser representativa de la poblacin general, lo que se logra mediante
una seleccin al azar de las unidades. Tambin, es importante que el investigador defina, completa
y cuidadosamente, la poblacin antes de recolectar una muestra, incluyendo una descripcin de los
miembros a ser seleccionados.
3. Una duea de almacn desea estimar el gasto medio de compra de sus clientes en su almacn
en el ltimo ao. La poblacin es todas las facturas de compra en el indicado periodo. Una
muestra de ciento veinte facturas seleccionadas aleatoriamente, servira para tener una idea del
gasto medio de los clientes.
En los ejemplos anteriores solo se enunciaron posibles muestras para las distintas poblaciones, sin
importar que tan buena pudiera ser sta.1
2. Cuantitativos (Numricos): Cuando ellos describen caractersticas que son medibles; por ejem-
plo, la temperatura del ambiente, el nmero de hijos de un matrimonio, el salario de una persona.
A su vez, las variables cuantitativas se clasifican en discretas y en continuas.
Datos discretos. Un conjunto de datos se denomina discreto si los valores u observaciones
que pertenecen a l son distintas y separadas; es decir, ellas pueden ser contadas (1, 2,3, ...).
Ejemplos de datos discretos son: el nmero de clientes que ingresa a un almacn en un da, el
nmero de aos que vive una persona.
Datos continuos. Un conjunto de datos se denomina continuo si Ios valores u observaciones que
pertenecen a l pueden tomar cualquier valor en un intervalo considerado. Ejemplos de datos
continuos son: el tiempo que se demora en ejecutarse un programa en la computadora, el peso
de una persona.
Definicin (de escala de medicin) Una escala de medicin es un instrumento de medida con
el que se asignan valores a las unidades estadsticas.
I
La eleccin apropiada de las muestras se explicar en profundidad en el Captulo 13
7.4. Caracterst,icas de los datos
Escala nominal' Un conjrrnto de clatos cst mecliclo en esca,l,a nomin,al si a los vaiorcs que pertcnccen
a 1 se lcs puedc asignar un cdigo, en la forma cle nn nrimero, clonde los nrmeros
sor simplemete ula
cticlueta' Los datos en escala nominal ptteclen ser contados, pcro no pueden ser orclenclos o medios.
Por ejemplo) elr Lln registro de pclsonas, los hornbres pueden ser codificados como 0 y las mujeres
como 1; el estado civil de un indirriduo puede codifi.carsc como "1" si es casado y como ,,2,'
si no lo es.
Escala ordinal. IJn conjunto de clatos cst medido <:n esca,la ord.inal si a los valores qne per.tenecen a
l se les puede asignar un orden o asociar una escala. Los datos en escala ordinal pueden
ser contados
y ordenados, pero no pueden ser medidos.
Las categoras, para un conjunto ordinal, deben tener un orden natural; por ejemplo, suponga que
a
ur grupo de personas se les pide que clasifiquen la calidad de la seal de las emisiones de radio, en
una escala de 5 a 1, que representan excelente, buena, regular, mala y psima. Un puntaje de
b indica
mejor seal que un puntaje de 4. As, los datos resultantes son ordinales.
Escala de intervalo. Un conjunto de datos est medid o en escala d,e interualo si los valores que
pertenecen a l pueden tomar cualquier valor dentro de un intervalo finito o infinito, con
la particula-
ridad de que existe un <<cero relativo>>. Los datos en escala de intervalo pueden ser contados, ordenados
y son vlidas las operaciones de adicin y sustraccin) pero no las de multiplicacin y divisin.
Ejemplos de datos en escala de intervalo son: la temperatura medida en grados centgrados (donde
hay un cero elegido arbitrariamente), los puntajes obtenidos en una pruebalaonae un puntaje
de cero
no significa que quien lo obtuvo no sabe nada).
Escala de razn. Un conjunto de datos est medido en escala d,e razn si los valores que pertenecen
a l pueden tomar cualqnier valol dentro dc un intcrvalo finito o infi.nito, con Ia particula'idad
de que
existe un <<cero absoluto>>. Los datos en escala de intervalo pueden ser coritados, ordenados y
son
vlidas las operaciones de adicin, sustraccin, multiplicacin y divisin.
Ejemplos de datos en escala de lazn son: la temperatura medida en grados Kelvin (doncle
hay un
cero absoluto), la estatura de una persona, cl tiempo de vida rtil de una mqnina.
1.3.3. Valoresatpicos
Un valor atpico -tambin denominado valor inusual o valor extremo- en un conjunto de datos,
es
t una observacin que es lejana, en valor, del resto de datos; es clecir, es un d.ato inusualmente
grande
o innsnalmente pequeo, cotriparado con Ios dernis.
Un valor atpico >uede ser el rcsultado de un error en una medicin, en cuyo caso distorsiona Ia
interpretacin de los datos al tetrer una influencia excesiva sobre los clculos a partir
de la muestra.
Si el valor atpico cs un lesultado genuino es importante, porque podra indicar nn
compoltamicnto
S extremo del proceso en estudio. Por esta razn, toclos los valores atpicos deben
ser exarniados
) cuidadosamente antes de rcalizar un anlisis formal y no se los debera eliminar
sin una.justificacin
pre\1a.
Todo conjunto de datos presenta ciertas caractersticas que perrniten, en rlna pr.imera
aproximacin,
deducir el comportirmiento dcl proceso del cr-ral fueron obteniclos. Las tres principales
caractersticas
son: la localizacin, la dispersin y la simetra.
Captulo 7. AnIisis Exploratorio de Datos
o tr ocalizacin. La krcaliztcin <le nn conjrrnto clc clatos cs la Posicin lelatir'r cltic cllos lllesentan.
En gc'rrcr:rl, se rrricle L la localizrcin lror cl valcil que tiene el pLrnto mr:clio clel corrjurrto c.1e clatos.
Por cljernplo, r,:rr la rnedici<in cl<r la rstrttu'r rl<,r lrrr grlipo de personirFj) l)s medicioncs estrr'n
entre los trcirrta centrnetlos (clc los rccirr naciclos) y los cLos mctlos veinl,e centne-
localiza,cl.s
tros (clc los adultos muy altos), si se srrl>one qucl esta,turas rxayorcs no se prcsentar, y se pirede
caracterizal a todos ellos con una estatura prornedio de 1.70 mctros.
La iclea de localizacin fr-ic introcluci<la por R. A. Fisher er 7922.
Dispersin. Los valores obtenidos en url mnestra no son todos iguales. La valiacin cntre
estos valoles sc denomnzt dispe'rsin. Curndo sc mide la dispersin sc desea dctectar el grado
de disemirracin de los valores individuales alrededor del centro de ias observaciones.
En los procesos de manufactura o de medicin) una alta precisin est asociada con una baja
dispersin.
El concepto de dispersin fue introdr.rcido por F. Galton (en 1886) y por W. Lexis (en 1887) e
identificado como aqrrel en el que se reflejan las cliferencias entre las mediciones) provenientes de
una misma fuente o tomadas en condiciones semejantes.
Simetra y asimetra. Un conjunto de datos es sirntrico cuando los valores de los datos estn
distribuidos en la misma forma por encima y por debajo de su punto medio.
Los datos simtricos:
1. Son fciles de interpretar, pLles los dal;os cre estn por encima y por debajo del pr.rnto medio
pueden sel considelaclos con un misrrio critcrio;
2. Pelmitcn la fcii deteccin de valores atpicos;
d. Adrniten la comparacin con conjurrtos de datos similales, en tr'minos de la dispersin.
La asimctra cn un conjrtnto cie datos es el lgrtrpaniiento que ellos Jrresentan a un lado de su centro
Los valores situados a un lado de la rnitacl clc los datos ticnclen a estar rns alejados qrre 1os \rlores
clue se enclrerrtran cn ei otro lrdo.
La distribuci,nde ,f'rec'u,en"cias cs Lrrre herrarnicnta que se emplea para resurnir', mediantc una tabla,
nurnerosos dtos dc rnancra qlle sc ponga de maniliesto l locrlizacin y Ia clispersin de lrs olserva-
cloLcs.
7.5. Distrbucin de frecuencias
Con ltna tabla de frccuencia,s se puedcn resurnir- da,tos ctrtegr'icos, nominales u ordiuales. Si los clatos
son continrros se pr-rede lesumillos l.lnr \rez qlle se los ha dividido cn grupos serrsiltlcs.
Si se dispone (le un nrrnelo alto dc obsclvacioues) r, se procede r cstablccel cr,rntas vcccs se rcpite
cada nrta de ellas, pala cletelrninar sn frecu,en,ci,u o,bsolutct, n". A par:til dc esta informacin b,sicr se
puede obtencl o1,la, que es converriente poncrla etl nna tabla.
Par'r la confeccin de ltna tabla, de distribucin dc frecuencias es lecomcrrdablc segu.ir los sigrrientes
Pasos:
Procedirniento.
1. Se ordenan los datos tr7) :[2) . . ., rk en ur]a columna, de forma ascendentc, poniendo a continuacin
k
sus frecuencias absolutas n1, TL2 ... n. Ntese que D rLi: n.
i:r
2. Luego se forma una tercera columna en la que se pone Ia frecuenc'ia relat'iua; que resulta de
dividir la frecuencia absoluta n para el nrmero total de observaciones: / - 3. Xo es ms que
TL
la proporcin de aparecimiento de cada observacin.
3. Pueden, tambin, calculalse dos columrlas correspondientes a las fi'ecuencias acumuladas, tanto
absoluta como relativa, que resultan de sumar las frecuencias de todas las observaciones ante-
riores hasta la considerada inclusive. Muchas veces, a las frecuencias relativas se las pone como
porcentajes, en lugar de nmeros flaccionarios.
Ejemplo. En nna fbrica de muebles de rnaclera, se contlole1 tiempo (en minutos) neccsario para
completar un trabajo cle armado de ciertos anaqueles. Se obturrieron las siguientes mediciones del
tiempo empleado por los obreros:
32.9 JJ.4 33.9 tao JJ.J 32.8 J.).1 .1.). i ) J,]..) 33.5
Dt <
.)r).J 33.6 1') n .),). I 33.6 .4 33.6 33.8 33.9 t')
.)J. J
o
34.0 il :'t3.0 tD OD D
. DD
rlJ.+ r',
,1,1. ,),).4^ JJ.J J.+ 33.6 33.6 /
.)t r '12 r) ,j.l 1
r)r).J 33.6 33.0 JJ.1 33.6 JJ.U 33.6 33.1 33.8
,),
J.J. / ,-),1., ) 33.8 JJ.
1
1 .),)..) 33.0 .).) ,.) 33.4 J. iJ 33.0
Capitulo 7. Anlisis Exploratorio de Datos
La sigr-riente taJrla rrnrestra li clistrilrrcin cle flecrrerrcits dc clatos illrliviclrtrlns (crr 17 r':rl,rres).
Sc ha presentado una distribucin de frccuencias para 100 datos individuales, pero la tabla pr-rede
Ilegar a scr exterlsa; y si bicn prescnta la, informacin resunicla, puede ser conveniente resumirla arr.
rrrtis, c;r'eando clrses. La agrr-rpac:in cle clatos cn clrscs sirnplificir Ia presentacin y el estuclio cle la
distribucin) allnqlle se pierden algunos rleta,lles.
A continuacirr sc enLlnleran los ptrsos a scguir para constrllir una clistribr-rcin de fiecnencirs cle dat,os
agmpatlos en clrses:
Decida el nmero de clases (ft). La siguienl,e talrlr puccle clar rura olientacin adccuada cn
Ia rnayor'tr de los casos.
201 - 500 o
501 - 1000 10
rns clc 1000 t|-20
Calcule la iongitud de ia clase. La longitrrcl clc la cllsc cs igual a Ia obsclrracin rnayol menoil
dividido por cl nLilrrero de clases. Rcdonclcc este rcsulLado pala obtenel rrn rrrnrero
li1 ttrcnor,
cor)venicnte) que tenga el mismo nurelo de decimales qlre los drtos.
/nrx - frnn
.4
k
,) Construya las clases indicando los cxtremos de Ias misrnas. Corro ayllda parzr clculos
J)ostcIioICS:
a) El extremo inferior' (16) plimera clase ser cl lrrrrero ilrnediatarnentc rnerror- a1 r'alor'
de 1a
mnimo, quc tierle rrn clecirnrl rns y qlle terlnrna cn cnco-
7.5. Distribucin de frecuencias
5. Calcule las columnas restantes. IJna vez que tiene la frecuencia absoluta, proceda a calcular
las frecuencias lelativa y acumuladas) como se explic anteriorrnente.
Observacin. El nmero de intervalos puede variar del inicialmente estimado al redondear el valor
de la longitud del intervalo y que se cumpla el paso 3 a).
Ejemplo. (Continuacin.) Construir una distribucin de frecuencias por clases de los datos de las
mediciones del tiempo necesario para armar anaqueles.
Solucin: De acuerdo a la tabla los datos se distribuirn en k:7 clases. Los mximos y los mnimos
son:
r^5* -- 34.4, rm. : 32.7, rmx - trni. : L.7,
1n
longitud de la clase : ::: :0.24,
7
Ls : Le -l A:34.25 *0.2:34.45
Ntese que por efecto del redondeo en Ia longitud del intervalo ha dado un total de 9 clases. Queda
para el Iector realizar el mismo ejercicio redondeando la longitud de Ia clase a 0.3.
10
Captulo 7. Anlisis Exploratorio de Datos
1.6. Representaciones grficas
de los datos
una rnanera rntly eficiente cle co'oce.
grficamente' ya que permite
el cornlo.ta'riento de un conjunto
dar rtna descripciin a. cre datos es rerrese'tar.lo
-"r,lr" rpida y rit de entender. La importancia
i: ::rff ;Tfi:,::l il:T:T.5 f*13,T# l.:, :ll" : ".o an ,isis ". t J.t i"o de b e ir acomp aado
i'if?sii u.,n*
Figura 1.2: Diagrama de puntos.
1. Los datcs estn agnrpados ccrca del valor 3, antes que, digamos B o 10.
2. Las observaciones sc cxtiencleu en ah'ecledor clc 17 uriidacles) con Llua concentracin entre 0 y 8.
o
a 3. EI valor 16.4 puede ser calificado de atpico, porque se clcuentra alejado del grupo principal de
o datos.
El diagrama de tallo g hojas, que es una tcnica semigrfica que se emplea para ilustrar las principales
caractersticas de los datos (localizacin, dispersin y simetra). Adems, tiene la ventaja de presentar
Ios valores de los datos. Por la forma en que se construye, se debe emplear para un conjunto de hasta
100 datos.
08 19 77 01 07 09 05 16
13 04 15 02 00 o4 01 12
es)
tar A los datos los clasificaremos considerando las decenas; as tendremos dos grupos, uno que empieza
tr con 0 y otro que empieza con 1. Ellos forman el tallo, al colocarlos de manera vertical:
)o
0
rar 1
lue
A continuacin, para cada observacin anotamos el segundo dgito (de las unidades) a la derecha de
la barra vertical, que vienen a constituir las hojas. La primera observacin 08 da
las
ar
0
1
006
Al agregar la segunda observacin 19, da
0 8
1 9
0 8L79542041
1 976352
Los valores que forman las hojas pueden reordenarse de menor a mayor, as:
0 0LI2445789
1 235679
12 Captulo 7. Anlisis Exploratorio de Datos
Podemos crear dos categoras en cada una de las decenas, en las cuales los dgitos de las unidades del
0 al 4 formen un F,rupo y los dgitos del 5 a 9 foimen otro; de esta manera se tiene:
t) r42047
0 8795
1
to
1 9765
Cuando los datos constan de ms de dos cifras, se deben escoger los rangos para las agrupaciones
que se realizarn;luego aI llcnar las hojas se separan mediante una coma para evitar confusiones. Si
disponemos de los siguientes datos:
qD
DJ 55 79 106 188 47 118 248
47 58 82 113 208 60 88
que est agrupado por centenas. El siguiente diagrama est agrupado en intervalos de 50:
0 33,47,47
0 55,58,60, 79, 82,88
1 06, 13, 18
1 88
2 08, 48
2
Asimismo, se pueden usar diagramas mltiples para comparar dos conjuntos de datos, para ello se
coloca un tallo comn y las hojas de un conjunto se ponen a la izquierda del tallo y las hojas del
segundo conjunto a la derecha del tallo, de la siguiente manera:
4371 1 44
ft 9888655 1 5779
310 2 0L23344
99875 2 678
311 3 03
.) 5
4
Se observa que los datos de la izquierda estn ms agrupados en los valores bajos, con un rango mayor
y fuerte asimetra; mientras que el conjunto de la derecha es muy simtrico y con menor dispersin.
Tambin, se emplean estos diagramas para representar datos con decimales; por ejemplo, si tenemos
los datos:
1.3 0.8 1.6 2.0 r.7 7.2 0.5 1.9 0.6 2.2 0.5 1.6.
7.6. Representaciones grficas de los datos 13
0. 5568
1. 236679
2. 02
FYecuencias Fbecuencias
Categoras
absolutas (n) relativas (/)
Ct u f,
Cz n2 fz
Cn ;, ir
Total n, 1
Un grfico de sectores es un crculo dividido en segmentos, donde el rea de cada uno de los sectores
es proporcional a la frecuencia relativa de esa categora. El ngulo central de la categora es igual a
fi x 360".
Junto a cada uno de los sectores que constituyen el grfico, se suele indicar el nombre, el nmero de
elementos y el porcentaje de cada categora.
Tambin, se puede resumir datos cualitativos mediante rn gr.fi,co de baryas. En stos, los datos
se exhiben mediante rectngulos, del mismo ancho, cada uno de los cuales representa una categora
particular. La longitud (y por lo tanto el rea) de cada rectngulo es proporcional al nmero de casos
en la categora que representa.
Si los datos son nominales, las categoras se pueden colocar en cualquier orden; pero si los datos son
ordinales, las categoras deben estar ordenadas.
Los grficos de barras se pueden presentar de manera horizontal o vertical y usualmente hay un espacio
entre los rectngulos. Junto a cada uno de los segmentos que componen el grfico se coloca el nombre
el nmero de elementos y el porcentaje de cada grupo.
Con el grfico de barras se distinguen las principales caractersticas de los datos, como aquellas causas
que son ms importantes o que ms frecuentemente se presentan en un proceso. Tambin, tiene la
ventaja de que se pueden realizar gr,,ficos de barras agntpadas, que consiste en representar sobre el
mismo grfico ms de dos variables -siempre que estn medidas en las mismas unidades-, permitiendo
realizar comparaciones,
Ejemplo. En una empresa financiera, los empleados disponen de computadortrs porttiles de distintas
marcas. Un resumen del nmero de mquinas, de acuerdo a su respectiva marca, se presenta en el
siguiente cuadro.
Toshiba
L.6.4, Histograma
El histograma es apropiado para datos continuos, medidos con una misma escala y se lo emplea
cuando un diagrama de tallo y hojas es tedioso de construir. Igualmente, puede ayudar a detectar
observaciones atpicas y cualquier brecha entre los datos.
Ejemplo. (Continuacin.) El histograma correspondiente a la tabla de distribucin de frecuencias
de los tiempos de ensamblaje de anaqueles se presenta a continuacin.
Figura 1.4:
Un polgono de frecuencis es un grfico que se obtiene uniendo con segmentos de recta los puntos que
tienen proporcionalmente como abscisa a la marca de clase y como ordenada la frecuencia respectiva.
Se cierra en ambos extremos en las marcas adyacentes con frecuencia cero.
7.7. Ejercicios 15
La ojiua es un polgono de frecuencias acumuladas; es decir, en las abscisas se colocan los lmites
superiores de cada intervalo de clase y en Ias ordenadas se coloca la frecuencia acumulada (absoluta o
relativa) de la clase. La ojiva es til para:
Una vez que se ha confeccionado una tabla de frecuencias y se ha realizado Ia representacin grfica
correspondiente, es necesario disponer de valores que permitan describir y compara los conjuntos de
datos, mediante nmeros que indiquen su posicin, su variabilidad y su forma. sto se realiza con las
llamadas medidas estadsticas o simplemente estadsticos.
L.7. Ejercicios
1. D ejemplos (preferentemente de su propio campo) de poblaciones y muestras.
2. Para cada uno de los distintos tipos de datos: discretos (categricos, ordinales y nominales) y
continuos, enuncie al menos dos ejemplos. Justifique sus respuestas.
3. En una encuesta de opinin acerca de las preferencias de bebidas gaseosas, por sus colores: negro
l
(N), blanco (B) V R (rojo), 20 consumidores dieron las siguientes respuestas:
i
N, B, B, N, R, B, B, N, N, B, N, B, B, R, N, B, N, R, N, B.
I
Construya el grfico de sectores circulares.
4. Los siguientes datos corresponden al porcentaje de alumnos de cuarto grado de escuela, clasifi-
cados segn su rendimiento acadmico en la materia lenguaje.
Calificacin %
Insuficiente 53
Regular 26
tre
Bueno 15
c) .Qu porcenta.jc de los alurnrros cle cuarto graclo tien<:u urr renclirnierrto <<bucno>> o mejor
que bueno?
E
i). En Ia siguiente tabla se describe diferentes razas d<r perros, segn varias caractersticas obser-
vadas.
R,aza Tamao Peso Velocidad Agresividad Funcin
basset 11 I 2 2
boxer' 22 2 2 I
bauceron 32 2 2 r)
bulldog 11 I 1 1
caniche 11 2 1 1
chiguagua 11 1 1 1
cocker 2I 2 2 1
colley 32 3 1 1
doberman 32 3 2 3
dogo 33 3 2 ,
r)
fox hound 32 3 2 2
galgo 32 3 1 2
labrador 22 2 1 2
mastin 32 3 2 3
pekins 11 1 1 I
podenco 22 2 1 2
pointer 32 3 1 2
san bernardo 33 1 2 3
teckel 11 1 1 1
teI'ranora 22 1 1 3
,Qu porcentaie del peso total del cuerpo humano corresponde al peso total de la piel?
7. Se registr Ia distancia diaria (en km) que el representante comercial de una empresa recorre
para visitar a sus clientes:
36 19 29 37 33 22 29 31 2L 35
2042534 24 27 27 24 26 31
27 77 31 10 28 15 41. 30 18 39
46 26 12 23 18 33 25 28 23 28
a) Elabore una distribucin de frecuencias con 7 intervalos de clase;
b) Realice el diagrama de tallo y hojas;
c) Determine el porcentaje de empresas con una inversin entre 14 mil y 20 mil dlares.
9. Los ingresos mensuales de una muestra de pequeos comerciantes se tabularon en una distribu-
cin de frecuencias simtrica de 5 intervalos de clase de igual amplitud, resultando como ingreso
mnimo 125 dlares, marca de clase del cuarto intervalo: 300. Si el 8 % de los ingresos son
menores que 165 dlares y el 70 % de los ingresos son menores que 275 dlares. Cul es el
porcentaje de los ingresos que son superiores a 285 dlares?
10. Se tiene la siguiente tabla acerca de las edades de los obreros de cierta empresa:
No. de
Edades
obreros
22-27 L4
27 -32 17
32-37 25
37-42 10
42-47 I4
12 Al clasifical las no+"as cle 0 a 100 cn un exarnen,se obtuvo una distribucin simt,rica, con 5
intervalos de clase de iglral ancho. Si el 10% desaprotr con rnenos de20, rnientra-s qurcel 40o/o
obtlrvo notas comprendidas entre 40 y 60, ,qrr porcentaje de alurrinos obtuvo una nota rnenor
de 60?
14. Los pesos de n artculos se ordenaron en una tabla de distribucin de frecuencias de 7 intervalos
de igual ancho de clase, donde: mn : 50 g, mx : 120 g.
a) Determine el valor de n;
Frec. absoluta
Intervalo Frec. absoluta Frec. relativa
acurnulada
640 - 680
680 - 720 48 60
720 - 760 0.r25
760 - 800 0.075
800 - 840
Determine el nmero de familias que tienen un ingreso menor a 800 dlares mensuales.
17. Dado el siguiente histograma de frecuencias relativas. Cuntas observaciones hay en el rango
[c, /], si el total de la rnuestra es de 400? 2(
7.7. Ejercicios 1_9
Figura 1.7:
Qu porcentaje del consumo diario se utiliza desde las 19h hasta las 24h?
100
55
45
25
10
12 17
Figura 1.9:
go
20. Dada la ojiva correspondiente a los gastos en servicios de los hogares de una ciudad.
20 Captulo 7. Anlisis Exploratorio de Datos
/D
Figura 1.10:
Existe una amplia variedad de medidas de localizacin; nos concentraremos en las ms empleadas: el
promedio, la mediana, la moda, la media geomtrica y la media armnica.
rt*rz*.'.*rn Drn
i=l
&-
n
. Si las observaciones estn agrupadas en una tabla de frecuencias de datos individuales como la
siguiente:
Observacin Flec. absoluta
rI fLy
I2 n2
rk nk
k
Dnn'n
:t
&
sa
I: ---=-,
n
COn n: z_rn.
d:l
7,8. Medidas de localizacin 2L
2 I2 S2 r2 TL2
k t" 9p ;r rLk
se calcula el punto medio cle cacla clase rromo iri :; l I s' ' '
Q,:1,2,, .. , k) y el promedio es
k
I
i1
rr, r k
t con 7:l n.
n
i:7
4. Es nico.
;EI 5. Su principal inconveniente es que se ve afectado por la presencia de valores atpicos.
Ejemplos
Solucin: Como las mediciones estn agrupados en una tabla de datos individuales, aplicamos
Ia frmula que considera la frecuencia de cada una de ellas.
Tngase presente que el nmero de clases s k : 9 y el tamao de la muestra es n: 46.
I
I n'r
r:i:l
n,
2x I.45*4 x 1.48+... +3 x 1.63 * 1 x 1.65
46
r.545.
3. En una cooperativa de ahorro y crdito se realiz Ia tabla de frecuencias de Ios montos de los
ahorros de sus socios (en dIares), segn se presenta en la tabla,
D'*n
t--l
TL
1.8.2. La mediana
La mediana fue por primera vez utilizada, como una medida de localizacin, por A. A. Cournot en
1843 y redescubierta por F. Galton en L882, ao desde el cual su empleo se ha generalizado.
Definicin (de mediana) La mediana de un conjunto de datos xr, z2: .. ., rn es el valor que se
encuentra en el punto medio, cuando se ordenan los valores de menor a mayor.
1.8. Medidas de localizacin 23
Se la nota como Q2 o Med y tiene la propiedad de que a cada lado del valor se encuentra el 50 % de
las observaciones.
Si los datos estn resumidos en una tabla de distribucin de frecuencias de datos individuales.
1. Ordene las observaciones de manera creciente, con sus respectivas frecuencias acumuladas.
2. Calcule I2"v red.ondee al entero ms cercano. Determine en Ia columna de Ia frecuencia
acumulada a qu dato pertenece, comparando el valor obtenido con el valor de la frecuencia
acumulada que es igual o inmediatamente superior; ste valor es la mediana.
Si los datos estn resumidos en una tabla de distribucin de frecuencias por clases, la mediana
se determina por interpolacin, as:
1. Es la medida mis representativa en el caso de variables que solo admitan la escala ordinal.
2. Es fcil de calcular.
.). En Ia mediana solo influyen los valores centrales y es insensible a la presencia de valores atpicos.
L MC L
lal
Figura 1.11: Interpretacin geomtrica del clculo de la mediana.
Ejemplos
5.5 6.9 7.0 3.0 4.8 4.t 3.2 4.3 5 5 6.5 4.3.
3.0 3.2 4.7 4.3 4.3 4.8 5.5 5.5 6.5 6.9 7.0.
t70 r72 168 165 L73 178 180 165 167 L72.
la
3. (Continuacin.) Calcular la mediana de la estatura de 46 seoras, cuyas medidas son:
Soluci,n: Las mediciones estn agrupados en una tabla de datos individuales y el tama0,d,9,1,1i
muestra es n: 46. , . .iJ,riri,!
Calculamos 2 : ZZ y vemos en Ia columna de Ia frecuencia acumulada que hay los valoles 19 y
2
31, que cumplen que 19 < 23 < 31.
i"r;i'r;'irt:;'/
As, Ia mediana es el valor cuya frecuencia acumulada es 31; es d,ecir, Q2: 1.55-.i "
4. Para la liquidacin del impuesto a Ia renta, en una pequea empresa, se calcularon lcs'ingbesoS
anuales (en dlares) de todos los empleados. La tabla de distribucin de frecuencias es la
siguiente: ,i'_l-
Nmero de Fbecuencia
Ingreso anual
personas (n) acumulada (Nr)
,,,r.1 t,
2400 - 3000 3 3
3000 - 4200 20 23
,,r,; r ix llri.il
4200 - 5400 35 58
5400 - 7250 25 83
7250 - 9000 15 98
9000 - 12000 2 100
Solucin: Los datos estn dados en una tabla de frecuencias por clases con r: 100.
* - *n-,
Med: L;I*TO
!{-es): : 4200 + tO:"rrg :5L25.7. 'i rr,','i;tr :'.i r1i','1,\q;?.
35
t;i ir1;({ l:
La mediana del ingreso anual de los empleados de la empresa oist25'.1lil*J]
'" -- 1--.\' lrii:Lli-'rr "i'j ..'ilrrrrrri
r
'rli;rl.lirll;l
Definicin (de moda) L" moda de un conjunto de ddob'es aquel valor que tiene la mayor
frecuencia absoluta.
Se la nota como Mo. Hay ocasiones en las cuales los datos pueden tener dos o ms modas, o no puede
existir, cuando todos los datos tienen igual frecuencia. Para su determinacin es til construir una
tabla de frecuencias de los datos.
. Si los datos estn resumidos en una tabla de distribucin de frecuencias por clases, la m'6dr
"e
determina mediante la frmula: ii ,,'t:) i, ri ) lfl;'{
I = :,(' i, ;i,
Mo:L* dt,O' trz, O
t li) il);jii-),1fli ii lfrli/.
donde:
tr-1 es el lmite inferior de la clase modal.
d1 es la diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior.
d,2 es la diferencia entre la frecuencia de la clase modal y la frecuencia de Ia clase siguiente.
Aunque la icler de <<valol rn1s fiecuente>> es mny trrrtigurr, no fue ernpleacla en estacistica, dc rnlnela
forrnal, hasta cre Ia polrlirliz K. Peu'son en 1894.
2. Es la nica medida de Iocalizacin que ptiede obtenerse en Ias variables de tipo cualitativo.
Ejemplos
9.4 8.1 9.0 5.6 7.0 9.0 6.5 9.0 3.8 7.0.
Soluc'in: La moda de este conjunto es Mo:9.0, que es el valor que ms veces se repite.
3. Para la liquidacin del impuesto a la renta, en una pequea empresa, se calcularon los ingresos
anuales (en dlares) de todos los empleados. La tabla de distribucin de frecuencias es la
siguiente:
Nmero de
Ingreso anual
personas (n)
2400 - 3000 3
3000 - 4200 20
4200 - 5400 35
5400 7250 25
7250 - 9000 15
9000 - 12 000 2
Solucin: La clase modal es el tercer intervalo, ya que tiene la mayor frecuencia (hs : 35).
I
: 50; por tanto, la mediana estar el el intervalo
Entonces,,2I (4200; 5400), de manera que
dr :35 -20:15, d:35 - 25:10 y A:5400 - 4200:7200. l
:
Ahora, tenemos que
Definicin (de media geomtrica) La media geornt,rica, notaclzr corno .{lG, clc urr conjunto dc
n, meclicions r1, 12:.. ., nr es igrral a Ia taz r-sirna de su ltroclucto; es decir,
AIG: Vqxrrx-xrk.
3. Es rnica.
MG : (rx12x-xrn
: otT
11.70 x I.72 x 1.68 x 1.65 x I.73: 1.696.
Su empleo no es aconsejable en distribuciones de variables con valores pequeos. Se suele utilizar para
promediar variables tales como productividades, velocidades, tiempos, rendimientos, cambios, etc.
28 Captulo 7. AnIisis Exploratorio de Datos
3. Es nica.
Ejemplo. Calcular la media armnica de la estatura de cinco personas que miden (en metros):
11111 : 1.696.
A un conjunto de datos ordenado se lo puede dividir en un nmero fijo de partes iguales; cuando se lo
divide en cien partes se tienen los percentiles.
Definicin (de percentiles) Los percentiles son cada uno de los 99 valores que dividen a la
distribucin de los datos en 100 partes iguales.
A los percentiles se les nota como P. Con ellos se puede encontrar regiones donde se acumulan los
datos; as, el 30 % de los datos estn por debajo del trigsimo percentil.
. Si los datos no estrn agrupados o estn en una tabla de datos individuales, se efecta la siguiente
descomposicin:
nk
: j *r,
100
donde:
j es la parte enter u a" !.
100
r es la parte fraccionaria a. *.
100
Entonces, se tiene que
si r:
"+-,
rj+L, sir>0.
o;
7.8. Meddas de localizacin 29
,tk, _
l{r.
"
I'A,:LA-ta 1oo ',1,
,
7Lk'
rlor rcler:
,L 1 es cl lrrrite inferior del intervalo (cuva fi'ecucrrcia rcurnulada es la primera mayor o igr.ral
tt,A:
a _).
100'
l-l cs la fi'ecuencia acumulada hasta .L-1.
n es la frecuencia absohrta del intervalo h.
A es la longitud del intervalo h.
Ejemplos
1. Calcular los percentiles de orden 20 y 33 de la estatura de diez personas que miden (en cm):
165 165 167 168 170 L72 r72 r73 178 180.
Pzo
Nmero de FYecuencia
Ingreso anual
personas (n) acumulada (/r)
2400 3000 3 ,)
3000 - 4200 20 23
4200 - 5400 35 58
5400 - 7250 25 83
7250 9000 15 9B
9000 - 12000 2 100
'k n,.
,I)A, . - 100 -
L-I
nk
D-
rSri 72to +
tLUv |
uu - 83 trrn
15
: 7600.
--'l
Dos casos particulares, y muy utilizados, resultan cuando al conjunto de datos se Io clivide en cuatlo
o cinco partes iguales, que corresponden a los cuartiles y a los quintiles, respectivamente.
Definicin (de cuartiles) Son valores que dividen a la distribucin de los datos en 4 partes, cada
una de las cuales engloba eI25% de los mismos.
. El cuartil inferior (Qr), qre deja a su izquierda el 25% de los ctatos v se curnple eue Qr : P2.
. El cuartil medio (Qz), qre deja a sr.r izquierda el 50 % de Ios datos, coincide con la mediana y se
cttmple que Q2 : Pso.
. El cuartil superior (Q3), que deja a su izquierda el 75 % de los datos y se cumple eue Qe - Pz.
As, para el clculo de los cuartiles solo se deber tener en cuenta que ellos son los percentiles de orden
25, 50 y 75, respectivamente (Figura 1.12).
500 500
mln Qt Qt Q max
Definicin (de quintiles) Los quintiles son valores que dividen a la distribucin de Ios datos en
cinco grupos, cada uno de los cuales contiene el 20% de las observaciones.
. El primer quintil (qr), q.t" deja a su izquierda el 20% de los datos y se cumple que qr - P2o.
El segundo quintil (qz), qrr" deja a su izquierda el 40% de los datos y se cumple eue 9z - P4o.
. El tercer quintil (qs), qn" deja a su izquierda el 60% de los datos y se cumple que qB - Poo.
r El cuarto quintil (g), qr" deja a su izquierda el 80% de los datos y se cumple que q4 - P80.
7.8. Medidas de localizacin 31
Ejernplos
1. (Continuacin.) Dctcrrniuar los cuartilcs infcliol y surcliol cle las estaturas de 46 seoras,
cuyas ntedidrs son:
1.65 1 46
Es decir, r: 0.5 y
P, * l-rt
Pzs : rsa : 1.57.
2 (Continuacin.) Determinar Ios cuartiles inferior y superior de los ingresos anuales de los
empleados de una empresa.
Nmero de FYecuencia
Ingreso anual
personas (r) acumulada (Nr)
2400 - 3000 t) J
3000 4200 20 23
D'lu.
4200 - 5400 Jd
DT
58
P+0.
5400 - 7250 25 83
7250 - 9000 15 9B
'60. -
9000 12000 2 100
D-^
EU' Solu,cin: Tenemos que n : 100.
32 Captulo 7. AnIisis Exploratorio de Datos
109ri.25
. Cuartil inferior: Qt : Pz;, k::25 J, Y: : Z.
100 100
El irrtelr'rlo l doncle se enc:uentra Q1 es @200;5a00) y Lt-t:4200.
Tambirr, se tiene que N- t : 23,nt :
35 y A :54U0 - 4200 : 1200.
Entonces, lesrrlta que:
t'/t
- Ar,.-,
P, : Lt-tI loonk "'
t<_t?
Pzs : 4200 +'",;;'" 1200
Ji)
: 4268.6.
Estas medidas deben tener la propiedad de que si los datos estn ampliamente extendidos, la medida
ser alta; y cuando los datos se encuentren muy agrupados, ser baja.
Existen varias medidas de dispersin, nosotros vamos a analizar la desviacin estndar, el rango y el
rango intercuartil.
Definicin (de desviacin estndar o desviacin tpica) La desviacin estndar, notada como
s, de nn corljunto de n mediciones 11, 12, ... 2,, es la raz cuadrada de la suma de los cuadrados
de Ias desviaciones de las mediciones, respecto al promedio z, di'l'idida entre n - 1; es clecir,
n-I D,@,
i:l
7.9. Medidas de dispersin 33
\tese que la desviacin estndal es siempre positiva y sus nnicladcs de medicla son las rnisnrrrs clrLt:
aquellas que corresponden a los datos originales.
- n \r)'
n-I
De la misma manera que para Ia media aritmtica se consideran los siguientes casos:
' Si las observaciones estn agrupadas en una tabla de frecuencias de datos individuales:
r2 n2
x) te ;o
la desviacin estndar se calcula por
k
DnnrT
i:I
- n(T)2 k
o s: con n:, ni.
n-7 i:r
in ' Si los datos se presentan en una tabla de frecuencias, agrupados por clases:
as
Clase LIC LSC Punto medio Flec. absoluta
1 ly Sl I1 TL1
ida 2 l2 S2 I2 n2
: : : :
rel k l" Sk rk nk
s se calcula por
k
Lnr - nlI)'
O /-\
k
la o 8: i:l
con n: \-nr.
in -itn(r-r)2
i:7 n-I /-;-l
ilar,
2. En su clculo intervienen todos los valores de la distribucin y por ello puede ser complicado.
3. Es nica.
Ejemplos
1. (Continuacin.) Calcular la clesviacin estrrdar cle los srreldos cle diez l)crsonrrs que ganan
(en dlares):
r70 t72 168 165 173 178 180 165 167 t72.
Solu,cin: Previamente se haba calculado el promedio 7: L7I. Con sto, resulta que:
*i@n-,'
(170 - t7L)2 + (I72 - I7r)2 +...+ (167 - tTL)2 + O72 - LTr)2
10-1
1.
Dn *?-n@)2 ffi
o:, , :.@:0.04627.
n-r
D-
n-l V o-t
La estatura de las seoras analizadas tiene una desviacin estndar de 4.6 cm.
3. (Continuacin.) Calcular la desviacin tpica de los montos de ahorros de los socios de una
cooperativa de ahorro y crdito:
k
D ro"? - "(")2
,i.:1
n-7
:V/33002ffiro-i :riY'
Definicin (de rango o recorrido) El rango de n mediciones es igual a la diferencia entre los
'.'alores mayor y menor de las mismas:
Rango : T..'x
Ei rango se puede utilizar para hallar una aproximacin de la desviacin estndar mediante las si-
--rrientes relaciones :
R.anso
s = ---) para n 176, para 16 q 7 ( 100,
1/n
R,anso
para100<n(400, para n > 400.
"=--,
1. En su clculo solo intervienen los dos valores extremos de Ia distribucin y por ello se ve muy
afectado por Ia presencia de valores atpicos.
Definicin (de rango intercuartil) EI rango intercuartil, notado por RIQ, de un conjunto de
latos es igual a Ia diferencia entre ios cuartiles superior e inferior; es decir,
RIQ: Qs - Qt.
Las definiciones de los cuartiles superior e inferior y del rango intercuartil fueron dadas por F. Galton
en 1882.
36 Captulo 7. AnIisis Exploratorio de Datos
Estatura r.45 r.48 r.50 1.53 1.55 1.57 1.60 r.o.) 1.65
Fbecuencia 2 4 Ir 8 12 7 4 3 1
Rango 0.20
sFr : 0.05.
4 4
Como se ver el valor aploximado cs bastante cercano al exacto, calcuiado con la frmula respectiva.
Esta rnediclr se utilizr l)lra conlpr'rr las rnccliciones de tunr misrna magnitrici rclizrrir cn distintas
unidades o por distintos individuos.
Si u.rr conjurrto de clrtos es honrog(rneo, CV < 1; si Cf/ > 1.5. los dzrtos poclran ser hctclogncos.
2. En sn clculo interviencn toclas las obscrvaciones. pr-rclicnclo ser nluv iufluido pol valoles atpicos.
Ejernplo. (Continuacirr.) Crlcrrlrr r:l c:oerficrierrtc clc r'rriacirr clcrl srrclclo clc cliez pcrsorrrs clllc
-irr1rr (crL ckilzrrcs) :
170 rT2 168 165 r73 r78 180 165 167 r72.
: :,1 uc,iir: Pleviarrx:rrtc s<t Itrba cirlculaclo clur: r: 177 1' ,s - 5.1. Con sto, r'esulta que:
5'1 :0.02982.
CV:! T - 777
--omo
el valor de coeficiente es muy ba.jo, los datos son homogneos.
-{asta ahora, heruos arralizado la localizacin y la dispersin cle una distribucin, pero necesitamos
. r'locer ms sobre el comportamiento de los datos. En esta seccin, analizaremos las medidas de
-,)
- )inla'.
- as medidas de forma de ttna distlibucin se clasifican en dos grllpos: medidas dc asinietr'a y medidas
-- cttrtosis.
1.10.1. Asirnetrra
coet'czente d,e a,s'intetra, dc nrra variable midc cl grado de asimetr'a de la distribucirr r,le sus datos
tolno r sti meclia. Es aclirncnsional v se definc corno srg=Lre:
,s3
--,--.
crtl,o,s cle nnL variable cstrr coltstituidas por los r.alores alejaclos de la meda (r,a.1oles cxtrcmos).
--:,a l'rriable es l,sini:tricr si srr
col ;r nn 1rclo cs rns larga que sr1 colr al otro y sinrtricr si ambrs
-es solr igual cle largas.
. si As < 0 la clistribrrcirt seri rsirntlica a ltr izcluicrcla. La cola a lur izqnierdl es ms lrrrgir que
la cola a Ir clelechr.
rEn la definicin cle las trrecliclrs rte tirma no hal,'unidac.l cle criterios cntre los especi:rlista,s, por lo clrLc hay una amlrlia
r i cclacl
38 Captulo 1. AnIisis Exploratorio de Datos
ir", - *)n l,
i:t ,
Ap: e4 -J.
Platicrtica, si Ap ( 0; es decir, es menos apuntada que la normal. Hay muchos valores extremos,
Ias colas de la variable son muy pesadas.
t70 172 168 165 r73 178 180 165 t67 172.
i@n-e)'
i:7 (170 - 171)3 + 072 -171)3 + .
+ (167 - i71)3 + O72 - t7D3
10
55.8.
i{,n-n)n
i:l - LTDA + $72 - I7I)4 +. . . + (167 - LTD4 + G72 -
(170 I7D4
n 10
1191.
7.77. Otras representaciones grfrcas 39
- ntOnCeS,
In
\-.
T).
\ r; - ( T\'' lr,
1J"
'i-I 55.8
)11
As: t
so (5.1)3
0.42r.
ir", - ,)n l,
i:t 1191
Ap: s4
-J-
t
(5.1)n -.)
-t.239.
Ia
-,cs datos son levemente asimtricos, con asimetra hacia la derecha; tambin, son platicrticos,
;,,rsible presencia de valores atpicos.
) Sobre una recta se ubican los valores del promedio, el mnimo y el mximo. Los segmentos que
unen el promedio con el mnimo y con el mximo se denominan brazos de Ia balanza.
3 Sobre la misma recta se ubican dos puntos -uno a la izquierda y otro a Ia derecha de la media-,
a una distancia igual a la desviacin estndar.
x .x+.s
Figura 1.14:
40 Captulo 7. AnIisis Exploratorio de Datos
1 Si los cltos solL sinrrtlic:os, r:l valor del plonreclio se sitr rrr r:l <:c:rrtLo rlci grlico.
2 Si los drtcs estilr agrrrptrdos en torno ri ccntlcl. los lr-Lzos rlr: l,r balrnz ser'ilr cortos; pr"u cl
contrzlricl, si ir"rs tlat,os estiirr dispclsos eu tor-rr<l r.l coutlor lt-,s lrr'rzos clc lr balrnza s<)r''rir liilgos.
,) Si nno dc los rlos blrzos clc 1r brlarrz es muchr rlrs largo crc r:l otlo, nos inclica (llre los (l1tos
sorl asirr)tricos y clue hay posible prcsencia cle r'rloles atpicos en ls obselvciones.
Puede ser irtil combinrr' (solrre el mismo gr'fico) con un cliagrzrma clc prrni;os pzrra visualizrl Ia, Irillr(:lr'&
en que se distlibuycn ias observaciones.
5 5 5 5 1010202027 35
39 55 55 60 60 60 68 75 90 90
Entonces,
:L
-S 39.729.3:10.4.
-
T *s 39.7+29,3:69.0.
Figura 1 .15;
Scgirrt sc obscrvit crr i'i gilico, el prornedio no se encuentra crr cl centro del ralgo. entonces sc dr:drrc<:
quc los cltrtcs sotr asirtrtricros. Arlcrris, lcs br'rzrs cie ir blrnza rro ticrierr ig'ral longitnri, lo <1rri.r ri<rrtotr
la posrble plcserrcia cle vakrrcs atpicos elr cl ex1 r'errro clcrecho.
El rli,o,qt'ant,a" de c:o,.jo, fr-re irrtroduciclo r:n 1977, pol JoLrn \\I. Tuliey conLo lurl herranrierrtzr quc rrurcslr'tr,
er Lrn misuro gr:ific:o, lr foltna de los clatos, sn r'r,lol ccntlal y srr rrariabiliclrcI irl rcprr:sentar ir rne<lirrra.
los crrrtilcs) el r'1rlgo intercualtil y el rango c1e las observacicxrcs.
l. Soble lrn lnel holizontal se locrlizrn l mcdiana. Ios cuartiles inferior y supr:rior 'los clatos
nrnilro I'mixirno.
7.77. Otras representaciones grfrcas 4L
,l
Se constrrtye rtna ca..ja angosta qlre une a Qt y Qz; a continurcin, se clivicle estar caja cn clos
mecliatrte una lnea qne pase por Qz.
t
.J. Finalrnente, se ttazan las uallas, que son dos rectas, una desde cada extremo de la ca.ja, hacia el
valor rnnimo y hacia el valor mximo de los datos.
I trt I
min Qt Qz Qr max
;--n diagrama de caja es especialmente til para examinar la simetra de los datos, la presencia de
-"-:lores atpicos y para comparar dos conjuntos de muchos datos.
Ejemplos
Estatura r.45 1.48 1.50 1.53 1.55 L.57 1.60 1.63 1.65
Flecuencia 2 4 5 8 12 7 4 3 1
Solucin: Antes se determin que Qr : 1.53, Qz : L.55, Qs : t.57, rrnn: I.45 y z16* : 1.65.
. -lttc:cr
, lr rti
I I
Como se observa, los datos son bastante simtricos, con una fuerte concentracin en torno al
centro y -puesto que las vallas son largas- con la posible presencia de valores atpicos (el mnimo
y el mximo).
clirlos
Se recogieron los datos de los ingresos mensuales de 200 hombres y 250 mujeres, que realizan
42 Captulo 7. Anlisis Exploratorio de Datos
Comparar los ingresos de los dos grupos mediante sus diagramas de caja.
Solucin: Se tiene la siguiente tabla que resume las medidas descriptivas reqtteridas:
mIn Qt Qz Qs max
Flombres i90 270 220 230 240
Mujeres 180 190 200 220 230
240
230
22O
o
ut
fl
s zro
tr
200
190
'180
Sexo
Figura 1.18:
L.1-2. Ejercicios
i. Una persona est rnanejando un carro en una autopista a 70 km/h y nota que el nmero de autos
a los que pasa es igual al nmero de autos que a ella le pasan. Los 70 km/h son el promedio, la
mediana o la moda de las velocidades de los autos en la carretera. Por qu?
7.72. Ejerccios 43
2. Dadas r : 8 nrccliciones: 4, 2, 6. 5, 7, 5, 4, 6.
1. En 1904, Cushny y Peebles publicaron en el artculo <The action of optimal isomers>> (Journal
of Physiologg), un estudio sobre el efecto de dos ismeros de Ia molcula hidrocinamida hidro
bromida en prodrtcir sueo. Se present la variacin en el nrmero de horas de sueo por noche
al usar las dos versiones de Ia droga:
a) Realice un diagrama de puntos para cada uno de los dos tipos de drogas y comparrelos.
Cul de los dos ismeros es ms efectivo en producir aumento en las horas de sueo?
b) Realice un diagrama de tallo y hojas con los datos.
c) Calcule el promedio, la mediana y la desviacin estndar de los datos de las dos drogas.
Cul es ms efectiva? Explique.
. Un inversor tiene ahorros repartidos en 3 depsitos con 2000, 5000 y 10000 dlares, respectiva-
mente. Si el primero le rinde un 5To anual, el segundo un 4To anual y el tercero un 2To anual.
Cul es el tipo de inters que recibe?
tenla
En una empresa se registr la edad (en aos completos) de sus empleados, resultando la siguiente
Como
tabla:
31 49 36 39 56 29 57 4t 40 51
Idela 45 61 40 39 47 27 36 37 16 37
)ertor, 51 18 29 42 38 62
34 31 28 25
36 40 46 37 49 25 2r 39 35 37
trenen 56 35 48 44 42 43 49 22 25 28
trados
teos.
a) Determine el nmero de clases que se debe utilizar en la distribucin de frecuencias;
b) Construya la tabla de frecuencias y el histograma;
c) Qu porcentaje de los empleados es menor que 50?;
: autos
d) Qu porcentaje de los empleados es mayor que 35.5?
dio, la
7. En una bodega de venta de licores se registr las principales. caractersticas de 25 marcas de
44 Captulo 7. AnIisis Exploratorio de Datos
rn'hiskys:
No. de Precio Proporcin Tiempo de Nota de
Categora
whisky de venta de malta aejarniento calidad
.,
I 70 20 1 5 J
2 60 20 1 5 2
, 65 20 1 7.5 2
4 74 25 I I2 2
5 70 25 I t2 3
6 ,J 30 1 5 0
7 70 30 1 8 0
8 55 30 I 5 2
9 93 J,l 2 6.5 I
tt
Jd 2 8 3
10 62
tt
JJ 2 8.5 3
11 87
T2 78 35 2 8.5 2
13 83 40 2 8 4
t4 90 40 2 5.5 2
15 110 40 2 T2 1
16 113 40 2 8.5 1
t7 96 40 , T2 dt
18 82 45 2 12
,
d
19 r27 45 2 8.5 4
20 160 100 3 L2 3
2I 90 100 3 12 4
22 86 100 3 12 2
23 100 100 3 10 3
q
24 100 i00 3 11 d
25 95 100 3 T2 0
il. Sc rcirlizti rttta irrr'<rstigacirn sobtc cl prccic'r rlc zapzrlos <lcportivos. clcr sirnilarets <:rrrctetrsticrs
crr rlivrtlsos tllutr:ctttts clc lr trirrrlrcl, ob1<:ni:rrr[os<t los sigrricnt<:s cLttos (cl<ilarcs):
50 4:l 39 43 40 38
,)-
r),J oi
,l
.)-
r) I
.)o
r)i
49 43 39 44 40 38 33 26 36 30
49 43 39 44 4U 38 33 27 36 30
+t 41 39 45 40 37
.).)
,),)
,)a
,l ') E
,)r)
J)^
.)t,
46 47 38 46 40 37 32 28 35 28
Esratura (en cm) | 155 160 165 170 \75 180 185
No. de eslrrdiantes I 10 14 26 28128
Halle:
o;
lpo
ror- Encuentre:
-=. La siguiente tabla muestra la temperatura nocturna (en "C) clr.rrantc 200 das:
Los siguientes datos se obtuvieron de una encuesta sobre las condiciones de vida, en el rea nrral
dc los cantones dc Zapotillo y N{zrcar y corresponden al nrrnero de hornbres y de rnujeres que
Captulo 7. AnIisis Exploratorio de Datos
b) Realice la tabla de frecuencias y el histograma de los datos, segn el sexo de los encuestados;
e) Determine el nmero total de miembros en cada familia. Con estos nuevos datos trace eI
diagrama de puntos, el diagrama de tallo y hojas, la tabla de frecuencias, el histograma y
el diagrama de caja. Interprete lo obtenido.
16. Las siguientes temperaturas fueron tomadas al medio da en Quito (en 'C) durante una semana:
17. En una investigacin sobre la razn por Ia que frecuentemente haban colas muy largas en las
cajas de un banco, se obtuvo informacin del tiempo (en minutos) requerido para atender a los
clientes. Se tomaron 50 mediciones en una caja, las cuales se dan a continuacin:
6.0 5.9 4.0 3.1 1.9 5.3 2.7 5.2 2.9 5.2
4.8 4.8 5.1 6.0 4.2 4.4 5.3 7.4 4.4 4.1
5.2 2.8 4.7 1.8 5.1 5.8 2.9 5.7 3.8 5.8
3.6 4.4 2.0 2.8 4.8 3.1 1.5 5.9 3.6 4.6
3.7 4.5 3.9 2.3 5.5 5.3 5.8 2.4 5.5 3.7
18. La siguientc tabla muestra los tiempos de duracin (en minutos) de las versiones en DVD de 22
pelculas dirigidas por Alfred Hitchcock:
ios;
a) Construya un diagrama de tallo y hojas de los datos;
b) Calcule la mediana de los tiempos;
c) Calcule los cuartiles inferior y superior. Use esta informacin para detectar algn valor
:e el y
atpico para trazar el diagrama de caja;
ray
d) Determine el promedio y la desviacin estndar;
e) Represente los datos mediante un diagrama de balanza. Cules datos influyen ms en los
valores calculados?
f) Calcule los coeficientes de asimetra y de apuntamiento.
19. Las notas de un examen de 6 alumnos son: 6, 5, 9, 19, 3 y 18. Un alumno aprueba si su nota es
mayor o igual que el promedio y que Ia mediana de las notas. Qu porcentaje de los alumnos
aprobaron el examen?
+-
J-
ados 10. Un automvil ha recorrido los 832 km que separan Loja de Esmeraldas, permutando regularmente
las 5 llantas (incluida la de emergencia) para que todas tengan igual desgaste. Cul es el
recorrido promedio de cada llanta?
11. El kilometraje que marca un auto, luego de 4 aos de uso, es 100 mil kilmetros. Si el dueo
r las lo compr nuevo y lo hace descansar 1 da, luego de usarlo 4 das seguidos, cul es el recorrido
a los promedio diario de los das manejados, considerando aos de 365 das?
')2. De 400 alumnos de un colegio, cuya estatura promedio es 165 cm, 150 son mujeres y su estatura
promedio es 160 cm. Cul es la estatura promedio de los varones?
13 Se tiene cuatro nmeros. AI aadir el promedio de tres de ellos al nmero restante, se obtienen
los nmeros 17, 2I, 23 y 29. Si se excluye al mayor de estos nmeros) cul es el promedio de
los tres restantes?
e b). Temp. ("C) 20.5 20.0 19.5 19.0 18.5 18.0 t7.5
No. das 2 4 3 13 3 4 2
48 Captulo 7. Arlisis Exploratorio de Datos
Iutclrrlo I'r'ccucucia
10 - 2i) 3
.)
20 -30 'J
30 - 4i) 12
40 50 B
50 60 5
1 gelente: 10 000
1 secretaria: 650
3 empleados: 500 (cada uno)
2 ayudantes: 400 (cada uno)
1 conserjc: 300
28 En una reunin hay 50 varones con una edad media de 20.5 aos y 25 mu.jeres, las que en
promedio ,or, ] mis jvenes qne los \arones. Halle el nrmero entero ms prximo a la edacl
'10
media de las personas de dicha leunin.
29. Un ftrmador dice que su vicio empez con un cigarrillo en la primera sernana, 2 en la segunda,
4 en la tercera, 8 en la cuarta, y as sucesivamente; hasta fumar casi 2 ca.jetillas diarias de 20
cigarrillos cada una, en promedio.
30. Si cada uno de los 28 millones de habitantes de cierto pas come) el promedio, 12 kg de pescadcr
al ao, entre conservas enlatadas y pescado fresco, siendo este rubro 4 veces el de conserva.
Cuntas toneladas de pescado fresco se consumen? en promedio, por ao?
31. En una muestra de 20 empresas florcolas se obtuvieron los siguientes datos sobre el nrnero de
empleados y sus ingresos anuales, en miles de dlares:
Calcule:
32. De los datos de rrna tabla de distribucin de frecuencias, con 5 intervalos de clase ;r ancho de
clase corntn, se observ que: Qz:24, x: : l$, 13 :24, nB : 2'n,r, n5 : )71r. .Qu porcerrtaje
del total sor nrenores de 30?
7.72. Ejercicios 49
34. La siguiente tabla muestra la distribucin de sueldos de 210 trabajadores de una empresa.
Sueldo Trabajadores
600 700 100
700 800 20
800 - 900 60
900 1000 20
1000 1100 10
35. En una muestra de 1000 trabaiadores, se registr sus sueldos en una tabla de frecuencias:
Sueldo Trabajadores
ue en 0 400 150
, edad
400 - 800 300
800 - 1200 200
1200 - 1600 250
rnda,
1600 2000 100
de 20
a) Calcule la moda de los datos;
b) Qu porcentaje de los trabajadores tiene sueldos comprendidos entre el promedio y la
mediana?
irimo 36 En la siguiente ojiva se muestran los sueldos de Ios traba.jadores de un organismo estatal.
scado
lser\4.
rero de
Figura 1.19:
Calcrrle el pronrr:clio, la rnecliarrr v la clesvircil estnclar cle la cclacl de los niuos rtcndirlos.
38 Err la sigr.rierite tabla se rnuestr'r ir clistlilnciu ck: frecnencias clc lrs vcntas rcrlizadls pol' lcs
Si Ios intervalos tienen igual longitud, halle el promedio, la mediana y la desviacin estndar de
Ias ventas.
7
0.06
El Concepto de Probabldad
-enrbin existen fenmenos cuyo resultado no puede ser anticipado con cetteza, sino que existe una
:tbabi,Iidad de que un cierto resultado se d; por ejemplo, la ganancia que obtendr un inversionista
-=-pus de dos aos, el tiempo que sobrevivir un cnyuge a la muerte de su pareja o el nmero de
;-ros eu pasan por una esquina durante una hora determinada. Es evidente que nadie puede dar
-, resultado certero con anticipacin a los tres euentos considerados, entonces si se da una respuesta,
-:'iste una incertidumbre en el resultado.
?ara dar una explicacin matemtica a aquellos resultados que aparecen en experiencias en que est
-r'olucrado el azar, se desarroll la teora de probabilidades.
51
52 Captulo 2. El Concepto de Probabilidad
El desarrolio clel anilisis rnatenrtico los juegos dc azal se produjo durrnte los siglos XVI y XVII.
c,le
Algunos autores consideran como origen del clculo de probabilidades la lesolucin del prolrlema de los
puntos en la correspondencia entre Pascal y Fermat en 1654. El problema planteado a estos autores
por Chevalier de Mer, fue cnro debera repartirse el dinero cle las apuestas, depositado en la mesa,
si los jugadores se ven obligados a finalizar la partida sin que existiera un ganador. Aunque ningur<-r
de estos dos matemticos public al respecto, s lo hizo Huygens en su tratado Ratioci,n'iis 'in In,do alae
(Razonamientos relativos al juego de dados). Su escrito tiene Ia trascendencia de ser el primer liblo
de probabilidades de la historia.
Pierre Simn Laplace (I749 - 7827), introdujo la primera definicin explcita de probabilidad y desar-
roll la ley normal como modelo para describir la variabilidad de los errores de medida. En esta poca
tambin hubo importantes contribucfones de matemticos como Legendre (1752 - 1833) y Gauss (1777
- 1855) para tratar de realizar predicciones del comportamiento de ciertos fenmenos.
Durante el siglo XIX, los matemticos y astrnomos continuaron ampliando la teora, de manera que
a mediados de este siglo ya existan Ias herramientas que permitieron su consolidacin como una rama,
cientfica. A pesar de ello, la aplicacin de estos principios se restringa a Ia Fsica y la Astronoma.
Una descripcin axiomtica de la idea de probabilidad fue dada en 1933, por A. N. Kolmogorov. Ello
constituy la base de la moderna teora, tal como hoy la conocemos. Con sto, se consigui elaborar
modelos complejos y aplicar las probabilidades a muchas ciencias y campos de Ia vida.
En las ltimas dcadas, el empleo de la teora de probabilidades en las modernas ciencias naturales,
en las ciencias sociales y en ramas de aplicacin, como la ingeniera, el clculo actuarial o la economa
ha crecido enormemente y su conocimiento es una necesidad imprescindible.
Antes de iniciar el estudio de la probabilidad, revisemos los principales conceptos del anlisis combi- E
natorio.
_I--
: .
Definicin (de variacin) Se clenorninr variaci(rrr a cr.cla nrro cle los irrrcgJ,os orclcrrrrlos clc /'
lenreutos, tornaclos cle otlo cle n r:lernentos (k ( n). cle rnanel'l cluc estos arrcrglos rlificrcrL cn algur
.-enientr.i o en el orden de colocacin.
r- rrrrnero cle r'rrirciones de A; elementos qne pueden obtenelsc a partir: de rin coujlurto rl<r it, clcrrtcutos,
--.lotado por Vf,, es igual a
Wn:-
,nl
'n (n-A:)!
nl.
kt(n - k)t'
-:'lucin: Se tiene n : 3 y lr : 2.
V! : .--
3! : 6 :
a) Se pueden formar
(3-2)! ;1 6 variaciones, qlle soII:
Definicin (de permutacin) Una permutacin de n elementos es cada una de las variaciones
r: los n elementos distintos.
Pn: n!'
Ejemplo. Encontrar Ias permutaciones que se pueden forurar a paltir del conjunto {a,b,c}.
I 'iuc'in: Son P3 : 3! : 6 permutaciones; stas son:
A: {at,a2,.".,a,r} y B : {h,bz,...,brr}.
54 Captulo 2. El Concepto de Probabilidad
Parejas. Con los n elementos <.lc A y los tr elerucntos cle B cs posible forrnrl nt,xTt ptrlejirs (rt,,lt,)
<rr: contcngan lln cleniento rle c:rdr con.jrrnto.
Ejemplo. En uur fibrica cle calzrc,lo se confcccirnrn 4 Lnodcl<s de zapatos lttlla. clirmas, en 6 tztrrrarius
cliferentes. Por lo tanto, se pr-reden fabricar 4 x 6 : 24 distintos tipos de zapatos.
Otra forma de ver este concepto es considerar un procedimiento A que se puede realizar de m maneras;
un procedimiento B de n maneras; y as sucesivamente, hasta un procedimiento G de s rnaneras.
La accin consistente en realizar el procedimicnto A, seguido del procedimiento B, hasta llegar al
procedimiento G; se puede efectuar de m x n x - -' x s maneras diferentes.
Ejemplo. Suponga que se clasifica a un grupo de estudiantes universitarios segn su sexo, estado
civil y la carrera que estudian. El sexo puede ser masculino o femenino; el estado civil puede ser
soltero, casado o divorciado; y, digamos que hay 7 carreras. Entonces, hay un total de 2 x3 x7 : 42
clasifi.caciones diferentes.
Anteriormente, se examin las permutaciones de elementos de un conjunto, pero sin repeticin; si ahora
queremos determinar las permutaciones con repeticin, bastar considerar en los arreglos mltiples el
mismo conjunto.
Definicin (de perrnutacin con repeticin) llna permutacin con repeticin, de k elementos
obtenidos a paltir de un conjunto de n elementos, es un arreglo de k elementos ordenados en el que
los elementos pueden repetirse arbitrariamente.
P,\, : nk
Ejemplo. Con los elementos del conjunto A: {a,b,c}, cuntas permutaciones con repeticin, de
dos elementos, se pueden formar?
Soluc'in: Se van a formar parejas considerando dos veces el conjunto A, por Io tanto se tiene n:
y k :2; entonces, hay un total de 32 : 9 permutaciones con repeticin; ellas son:
(a, a), (a,b), (a,c), (b,o), (b,b), (b, c), (c,a), (c,b), (c,c).
Examinemos un ejemplo: el lanzamiento de un dado una sola vez. Como resultado de la prueba se
pueden producir diferentes resultados: <<sale dos>>, <<sale cinco)>, <<l nmero que aparece es par>>, etc.
Esto nos conduce a definir \os euentos.
Definicin (de evento) Se llama evento, notado como (r, a cualquiera de los resultados posibles
de un experimento u otra situacin que involucre incertidumbre.
Los eventos se clasifican en: elementales, aquellos que constan de un solo resultado: r compuestos,
que consisten de ms de un resultado. Por ejemplo, <<sale dos>> es un evento elemental: mientras
2.4. Defrnicin axiotntica de la probabilidad bl)
llre <<cl nrimcro qrre aparece es pal>> es un evento conpuesto, l)orque cst conformado de Los cventos
-lementales <(sale dos>>, <srle c;uatro>> y <<sale seis>.
,Jbselvernos que todo cvento relacionado con una pn,reba se pr"rede desclibir en trminos de evertos
.lenrenta,les.
Definicin (de espacio muestral) La coleccin de todos los eventos elementales, notirdo por Q,
-e denomina espacio muestral:
Sealemos que el concepto de espacio muestral fue introducido por Gaiileo para resolver el problema
-e por qu en el lanzamiento de tres dados "10" y "11" aparecen ms frecuentemente qr-re "9" y "72" .
?ara resolverlo list todos los casos posibles.
-,
olviendo al ejemplo, si consideramos el nmero de puntos que aparecen al arrojar un dado, tenemos:
::an A y B dos eventos de O, en el siguiente cuadro se presentan 1as equivalencias entre las proposi-
--rnes de las teoras de probabilidades y de conjuntos y en la Figura 2.1 se encuentran los diagramas
-r Venn correspondientes.
:
2.4. Definicin axiomtica de la probabilidad
Lna probabilidad provee una descripcin cuantitativa de la posibilidad de ocurrencia de un evento
;,articular y se puede pensar que es su frecuencia relativa, en una serie larga de repeticiones de una
-rrueba, en la que uno de los resultados es el evento de inters.
s
ii
Figura 2.1: Interpretacin de los conjuntos como eventos: a) Ocurre eI evento A. b) Ocurre A u ocurre
B (A U B). c) Ocurre A y ocurre B (An B). d) Si A ocurre, tambin B (A e B). e) Eventos
incompatibles (A ) B :0). f) No ocurre A (ocurre A").
. A2. Pr(Q) : r.
. A3. Si A y B son incompatibles: Pr(A U B) : Pr(,a) + Pr(B).
Ejemplos
1. Dados los eventos A, B y C del espacio muestral f). Expresar mediante las operaciones entre
conjuntos los eventos:
Solucin:
2. Demostrar que:
a) Pr(") - 1- Pr(A).
2.5. Clculo de probabilidades :)t
Soht,cin,:
k
Pr(A) : DPr({a.'}). (2.2)
i:t
Un caso particularmente importante se presenta cuando todas las probabilidades Pr(c.r) son iguales.
Casos favorables de A
Pr(A) :
Casos posibles
Card(A) k
Carcl(A) /
En el ejemplo clel lanzamicrtto cle rrn dado cortsicleremos el evcnto A <<salc rtn nrimero rar>>:
Pr(A) :ffi
Card(A)
:-:-31
62
En los siguientes ejemplos, consideraremos espacios mnestrales finitos y aplicaremos los conceptos de
anlisis combinatorio al clculo de probabilidades.
Ejemplos
1. En un estante hay 2 libros de historia y 3 de biologa. ,Ll azar, se toma un libro y luego se toma
un segundo libro. Encontrar la probabilidad de que un libro de biologa sea seleccionado: a) la
primera vez; b) ambas veces.
Soluci,n:
Pr(A)
'-' :9'1!9 :I
Card(f^)) 5'
b) Que ambas veces se seleccione un libro de biologa significa:
. que la primera eleccin es un libro de biologa, entonces se tiene 3 casos favorables; y
. que la segunda eleccin tambin sea un libro de biologa, entonces hay 2 casos favorables.
As, el nmero de casos favorables es igual a 3 x 2 : 6.
El nmero de casos posibles, de todas las parejas sin repeticin, es 5 x 4 :20.
Entonces, la probabilidad buscada es
63
u- 20 10'
El nmero de casos favorables en el cual 2 de los 3 alumnos del colegio A ganan los premios es:
V3 : o. Luego,
Pr(B) :*:0.,
3. Entre 100 fotografas de un sobre se encuentra la foto buscada. Del sobre se extraen aI azar 70
fotos. Hallar la probabilidad de que entre ellas resulte la foto necesaria.
Solucin: Ei espacio muestral Q est formado por los conjuntos de 10 elementos que pueden
formarse a partir de 100: Card(A) : Cl8o.
2.5. CIculo de probabilidades 59
El nrmero de resultados favorables que nos interesa es igual al total de formas como pueden
escogerse 9 fotos de las 99 restantes; es d'ecir, Card(A) : CBg'
La probabilidad buscada es
CP^
:e';:10. 1
Pr(A)
4, En el Consejo Universitario cada una de las 10 facultades est representada por el decano y
el subdecano. Se nombra una comisin de 10 miembros elegidos aI azar. Determinar Ia pro-
babilidad de que:
de
a) una determinada facultad est representada;
b) todas Ias facultades estn representadas.
Solucin:
)ma
a) Considerando el evento complementario A': facultad dada no est representada>>, y
<<una
i) la
calculemos su probabilidad. Hay 20 representantes, 18 de ellos no son de la facultad
en
Pr(B) : 0.00554.
#ry
Se arrojan dos dados. Hallar la probabilidad del evento : {al menos en uno de los dos dados
salen ms de dos puntos).
Solucin: EI espacio muestral puede describirse como
reCen
rd de
cl: {(i, j)li, j: L,2,...,6},
j
donde el evento elemental (i,j) corresponde a los puntos aparecidos en un dado y los puntos
rarti-
aparecidos en el otro. Consecuentemente, Card(Q) : 36.
Designemos como 81 el evento consistente en que en el primer dado salen ms de dos puntos y
con B2 el evento anlogo para el segundo dado:
u10 por lo tanto, card(B1) : card(Bz) :21. Puesto qrue B1l\82: {(i, i)l i,i :3,4,5,6}, entonces
Card(B1 B) :42 :16. Ahora bien,
: :'! : ?, y Bz):#:
Leden
Pr(81) Pr(Bz) Pr(81
36
60 Captulo 2. El Concepto de Probabilidad
ie,1i,,,)) :1,
i:l
Pr(A) : t Pr({a.'}).
u,A
Ejemplo. Juan y Andrs juegan tenis con la misma habilidad. Deciden jugar una secuencia de sets
hasta que uno de ellos gane 2 sets seguidos. Halle la probabilidad de que se necesite jugar nmero
par de sets para terminar el juego.
Solucin: Sean los eventos: J: <<gana el set Juan>> y A: <<gana el set Andrs>>.
Segrn el enunciado, el espacio muestral est conformado por los siguientes eventos elementales:
El evento B: jugar hasta que uno de ellos gane 2 sets consecutivos>> es la unin de los eventos
<<se
que estn sealados con una estrella (*) en el espacio muestral.
Se tiene que
Pr(AA) :
1
Pr(JJ) +
i'
Pr(JAJJ)+ Pr(AJAA) : 1
=.
8
-
2.5. Clculo de probabilidades 61
O -.
En general, si A es un evento cle un espacio mnestral continuo O, tal que su rnedicla (longitud, ',rotrr*"r.,
,iempo, etc.) existe; entonccs, su probabilidad cs
\{edida cle ,4
Pr(A):
\tledida de O'
Ejemplos
Figura 2.3:
T
:s:loo;"-t:o'75'
75r cttt2
Pr(A)
62 Captulo 2. El Concepto de Proba'bilidad
2. Sr:L l) :
{(:r;. !l) I () <:t; I 1; il :l I ii (i,';grui.2"4) ci i:sirir.<:io irirrstliil ,i,:r rrrr fcririrrrcro akrirtolir
v sitP<ttticrttlo c.irrr: io<lrl prulto <l<r (l'itrrr,'l;r risrirr rlolrrrlrilirltlrl ilc sLl 1r".rLtLo clL r;rrerL1a.
Jr
il 4 x
,,4n8 E
117
Figura 2.4:
a) rca O: 1 x 1 : 1.
cle
2.8" ;i!e::cir:ios
Anlisis cornbinatorio
l" Culcuie lcis siguierri,cs (ioccitintcs bilorrrilcs Cf,: n) Ci; b) C1]; r) Ci:
2. C.lc.le Vf eri l<,rs sigrricrrtcs cr:jos: ,r) Vl; lr) V!; ,r) V3; cl) \.].
6. Cnntas palejas con rclposicrn pueden formar-se con conjuntos crtya crlclina.lidad es:
l. Ftxure todas las combinaciones y valiacioncs qlre se pnerlen obtener a parl,ir de los cortjuntos:
8. Para los conjuntos indicaclos forme todas las pa,r'ejas sin reposicin y parejas con reposicin:
A: {a,e,i,o,u}; b) B: {I,2,3,4,5,6).
^)
r;r cortrruc uv.r-iu!ar--- -, .--:. eiirr-'131. ql.- -.-:iir::-,i', , $:rL)iici y [1 silllg:r'ente; debe elegi' un
presidente y r-rn vicepresiderr c. De cuntas maneras se pueclerr elcgrr esr,e par dc fiutcrorrilios
si el presidente debe ser nn ;:iente?
Ul hospital cuenta con 21 ci r.ijanos (ion ri)s, ,,'-.ies hay que folrnar ter-uas para relizar guardias.
.Cunttrs ternas sc pueclen f:rrnar?
Un amigo le quiere regalar a tro 3 cliscos y los quiele clegir cntre los 10 que ms Ie gustan. .Dc
cuntas marreras pucde hace'lo?
Eu cl ejcrcrcio rntelior considresc qrre los 3 enrpleirclos \an a ir l l misrna planta. .D<: curintas
rnaneras se puede hacer la seleccicin?
_)
.Currtos nrirneros de 6 cifras pucderr haccrse con los dgitos {I,2,3.4, 5, 6}:
rr) sin rcstliccin algrrua'/; b) sin rcpctil ling;'.url cifra?; c) maStolcs crc 500000?
Sicte pcrsonrs h1n soiicitado empleo para lleuar dos r.acantcs. De currtos modos se puerclen
llcrrar lts vat:rrrtcs si:
18. i',Cttrrtos partidos sc .jucgatt cII ull cirruptxrrrato. crrr cl qrre prrlticipan 20 cqrripos y en el quc
.iuegan toclos contla to<[os. rul{) crr crsa V otlo <lc visil rlrte?
19. Etr tttr lestattrarttr: cie cotnicla rtipicla se inclir:a al clicrrtc (lrrc sri harnbrrlgr-resa. a rns del pan 1,
la catne, puede ir cou todo lo siguiente r sin ello: salsr clc tornatc, nrostaza, rnayollesa) lechuga,
cebolla, tomate o queso. .Crt:intos tipos difercnt<,rs <1r: hirrnburguesas son posibles?
20. La produccin de una rnqnina cronsta de 4 frses. Ilirl' 6 lneas cle montajc pala la primera fase,
3 para la segunda, 5 para l:t telcrerir, y 5 para la irltirrrr. Detelmine de cnntas forrnas distintas
se puede montar Ia mquina en este proceso de produccirr.
21. Eu un plano hay 15 puntos de los cuales rro hay tles que sean colineales. Cr-riintas rectas
determinan?
26. En cualquier set de un partido de tenis, el oponente X puede vencer al oponente Y de siete
maneras. (Con el marcador 6 - 6, se juega uu desernpate: tie breaker) El primer tenista que
gane tres sets obtiene la victoria. De cuntas maneras se pueden registrar los resultados si:
27. De cuntos modos se pucden poner 5 anillos diferentes en los dedos de una narlo. omitiendo el
pulgar?
Definicin de probabilidad
28 Sean Q un espacio muestral y A, B y C eventos cualesquiela) exprese las siguientes afirmaciones
conro uniones e intersecciones de A, B y C y de sus conrplementos.
aj 30. Se arrojan dos dados, sean A el evento <<la suma de las caras es impar>>, y B el evento <<sale por
Io menos un tres>>. Describa los eventos A a B, Atl B, A l\ 8". Encuentre sus probabilidades
si se supone que los 36 eventos elementales tienel igual probabilidad.
i,
AS 31. Se consideran dos eventos A y B, tales que Pr(A) : 1 r PrlB) : 1. Determine el valor de
3" 2
Pr(A'O B) en los siguientes casos:
:32. Se consideran dos eventos Ay B, con Pr(A) : 0.375, Pr(B) : 0.5 y er(AnB) :0.125. Calcule:
'),). Sean A y B dos eventos tales que Pr(A) :0.9 y Pr(B) :0.8. Demuestre quePr(AnB) > 0.7.
34. Un experimento aleatorio consiste en arrojar una moneda y un dado a la vez y observar el
resultado. Escriba el espacio muestral del experimento.
rdo
tos ,JD Una empresa tiene dos tiendas distribuidoras, una en el norte y otra en el sur de la ciudad. De
utl Ios potenciales clientes, se sabe que el 30% solo compra en la tienda norte, el 50% solo compra
en la tienda sur, el 10 % compra indistintamente en las dos tiendas y el 10 % de los consumidores
no compra en ninguna de las dos. Sean los eventos A: <<el cliente compra en la tienda norte>> y
de B: <<el cliente compra en la tienda sur>>. Calcule las probabilidades (e interprtelas):
las
tes a) Pr(A); d) Pr(A n B); g) Pr[(A n B)"];
b) Pr(,A u B); e) Pr(A \ B);
ete c) Pr(B"); f) Pr(" B"); h) Pr(A u B').
lue
: 36. En la interseccin de una autopista, los automviles pueden girar a Ia derecha (D) o a la izquierda
(1) Desde un puesto de observacin se registra el sentido de la maniobra de los tres primeros
vehculos.
Clculo de probabilidades
.)/. Un gerente de compras desea hacer pedidos a proveedores diferentes, a los que nombra corno A,
B y C. Todos los proveedores son iguales en lo que respecta a la calidad por lo que escribe cada
letra en un papel, rnezcla los papeles y selecciona a ciegas a uno de ellos. Se har el pedido al
vendedor que salga seleccionado. Calcule las probabilidades de los eventos:
66 Captulo 2. El Concepto de Probabilidad
Sttpong:t quo cll ttn soLt(:o itr lrrolrirlrilicltcl rlc galiar prirner prcrrric-r.,,
f v
38 c1 1a,1" girnzrr cl
3^Si 1a
:. 3
r.cgLttLc[,r rt.'tnio,'s
i irrolrabilirlrr1 r[c Bur:r1 rl nretrros rrrro clc los rlrs ltlcrnios es ;-l . ;.r:irlcrrlc
la probabiliclrcl clc garrrl solo rrrro dc los rlos plenrios'/
39 Sc enr'rtt 3 oficios a 3 personas diferrentcs. Sin ernbrr'lo, una secretria distr'rcla levrir:lvc los
oficins v sc pttccle consitlelal clttc los lnalr(l rl z1r. Si turr coirrcidencria <rs el hcchri rle rlrrc rrna
persona recil-,a el oficio correcto. cak:ule la probabilidad de que haya:
a) ninguna coincidcricia;
b) exactarrrente rrna coincidencia.
40 La fbrica errsarnbladora ha dcterminado que Ia demanda clel arrto Honda Civic es igual para
cada uno de los colores azul, blanco, verde y rojo. Se haceu tres pedidos sucesivos de autos de
ese rnodelo. Deterrnine la probrrbilidad rle que:
4I Lr-icgo dc las 1>ntel)ls tr)I a ocupar un puesto a los 6 aspir;r.rrtes se lcs clasifica de a<rrrerclo al 1>untaje
obtenido. Los rcsrtltr<los uo le llegtrn al empleador pol lo quc l contlatr a clos aspirantes al
azar'. ,Cul cs ia ltrobabili<lad tle quc haya contratado a los dos aspirantes me,jor crlificados?
r)
,1
Un pacltrete cle 6 focos tienc 2 rrnidacles clefectuosas. Si se cscogen 3 focos para su uso, calcrrle
la probabilidad cle qr-re ninguno tenga clef'cctos.
43 En ttna caja hay 20 fotografas en la cual htry 6 mal tomadas. ,Cul es la probabilidrd de
selecciorrar 2 fotografas clefectuosas'/
44. Entre 100 artculos de ttn lote hay 5 <iefectuosos. Halle Ia probabilidad de que entre 10 altculos
escogidos aI azar, no sc tenga ms cle un artculo defectnoso.
45 Un distribuiclor de electrodomsticos recibe un euvo de 20 pianchas, cie las curles hay 3 defcc-
tuosas. Para conocer si el lote est buerro pmeba 6 aparatos. trl distribuidor aceptari el lote
si cltcttetitra a lo rns ltn aparato dcfec:tnoso cntrc los prolrados. Cul cs lt pl'ollabili<lad cle
rechazar el envo'/
46. De un ttft-rrir, quc contietre 100 boletos. se extrerr tres bolctos ganadores. ;.Crr1 cs la lrrob:r-
biliclad de que gane una persona que conrlrr:
47. Entt'e 1as 80 t:stacioncs de sen,ir:io qrrc hay ell nnA cindarl, 10 errtrcgan unr ca:i-i'la,l merrol clue
la que el cliente comprr. tlu inspect,or clc la Dircccin de Hiclrocarbrrros r-i..it:r aiertorirmente
cinco de ellas para velificar si la cantidad'n'enrlidr cs correctt. ,CLrl es la p:'',rt,airrliclad rle que
descubra al nenos una fiaudulenta?
48. En el juego del <<cuarenta>> se reparten 5 cartas, al azar, a cada jugador. a palil' ,Le rrn mazo de
40 cartas. ,Cul es la probabilidad de que un jugador tenga:
2.7. Independencia y condicionalidad 67
r) urr as) rur dos, un trr:s, un cuatLo y un c:irrro, clel rnisnio pnlo'/;
l,) 4 cu'tas <lel rnismo pirlo'/;
t:) rrua <<rorrcla>>; cs rlecir', 3 calt.rs rle ia rnisrna clelornillci<in (as, clos, etc.)?
i9 En nrr closet hay 6 pales cle zrpatos. Se escogcn 4 zapatos al azar. Encuentre la probabilidad
rle de qnc haya pol io rnenos lrn par de zapatos errtre los 4 zapatos escogidos.
50 Err los pases europeos existe una forma muy popular de lotera, llamada Lotto, que consiste en
OS seleccionar'6 nmeros de una cartilla que contiene 44 nrmeros (del I aI 44). El da del sorteo
na se seleccionan 6 bolas al azar y sin reposicin. Una persona gana el premio principal si los
6 nmeros sorteados coinciden con los seleccionados; tambin se puede ganar prernios si 4 o 5
nrmeros sorteados coinciden. Determine la probabilidad de:
rra 51. Una persona presiona, aI azar, 8 cifras en una calculadora. Cul es la probabilidad de los
de eventos siguientes:
Dentro del rectngulo limitado por las rectas , : -L,, :;, A : -7, A : l, se tiene el
bc- grfico de la funcin trigonomtrica seno. Sobre el rectngulo cae una gota de tinta. Cul es
ote la probabilidad de que Ia gota de tinta haya cado dentro del rea comprendida entre el eje r y
de la curva A: sel:x? (Observacin: Suponga que el rea, de Ia mancha de tinta es despreciable.)
Fn la teora de probabilidad un concepto muy til es el de independencia de eventos, que significa que
-a ocurrencia de uno de los eventos no da informacin sobre si otro evento ocurrir o no; es decir, Ios
lue -r-entos no influyen uno sobre otro.
nte
lue
Definicin (de independencia) Dos eventos A y B se llaman independientes si la probabilidad
de que ambos ocurran es igual al producto de las probabilidades de los dos eventos individuales.
Es decir,
,de Pr(A n B) :Pr(A) x Pr(B).
Captulo 2. El Concepto de Prcbabilidad
Ejemplos
1. Sea Q: [0,1]x [0,1] y dados los eventos: A: {(r,a)10 S r 5ll2; 0 < y < I}, B : {(",A)10 <
r 1I;0 <y <Il ). Probar si A y B son independientes.
Figura 2.5:
Pcu lo trutto.
Pr(C) : Pr'(,4 a 13") * Pr(4" . 13) :0.095 + 0.045 : 0.14.
Tles bicllogos, irr<lepcnclierrtcrncutc uno clel otlo, nriclielon el c:<rrtcniclo <,1<'l suero c1t tllll tttttestra.
La proba.bilidacl cle <-re cada uno cometr Lln el'ror eu Ir lcctur:r dol apzrlato cs igutrl a 0.1, 0.15 y
0.2, r'r:srectivarrrente. Hallal la probabilidad de que cll ttna s<,rla rneclicitt pol lo meros ttno de:
Ios investigrclores coureta Lrrl erlor.
Soluc,i,n,: Ser el evento : {por lo menos uno de los investigaclolcs coniete urr crror}, el
complerrento es A" : {ninguno de los investigadores comete un error}.
CaiculrrernosPr(4"), considerando que las medicioltcs son evctttos inclcpendientcs.
(dis- Sean p la probabilidad de que el i-simo investigador cometa un error (i: I,2,3), entonces
Pr(A') : (1 -pr)(t-pz)(I-pz)
: (1 - 0.1)(1 - 0.15)(1 - 0.2) :0.612.
/0< Resulta que Pr(A) - 1- 0.612 : 0.388.
Pr(AlB):HF
Ejemplos
r). a) .Cul es Ia probabilidad condicional de qtte ttrr esposo seir fiel, clirclo qr-re sll esposa es fiel?
b) '.Cul es Ia probabilidad de ctrr-te ttl)a esposa sea fiel, claclo
(luc srr csposo es infiel'/
n B).
Sol'u,cin; Corrvengarnos en la siguiente notcirr de los ercrrtos:
.f1F: Hornbre fi.el, 111: Hombre iuficl,
,41F: N{u.ler fiel, 11,/1: \4Lr.jer infiel.
70 Captulo 2. El Concepto de Probabilidad
a) Dcseamos calcular
PI(II I-IAI F) : f'r(II F. n{F)
Pr(r1F)
De 1a tabla se obi:ierrcr cllle
trL(i1F . AI F) ),
Pr(n1F) 0.22 + 0.31 :0.53.
Con sto,
0.22
Pr(111lrt{F) : : 0.415.
0.53
b) Calculcmos
n HI)
Pr(A,I FIH i) : Pr(MF
Pr(H/) )
con
Pr(MFnf{f) :0.31 y PI(III): 0.31 + 0.23 : 0"54.
Entonces,
g'31
pr.(,41 FIHI\:
' 0.54
:0.bT4.
Pr(BlA\:9:?
__\_r--l
9 3
u La pI'rbabilidad de que el tercero sea hombre sabir:rrdo que los dos primeros trnrbin lo son,
es la probabiiidacl dc C dado A y B:
:'r(C An : !.
ll),E
tr-ir pr"obabiiidrci buscacla tlc clrrc las i,lcs i)crsonrs escc.rgiclirs sean holrlrres es
La probabilidrd clc: A, que puccic ocrrriir sclo rl lllrlecel uno rl,:.'. . .1 ,,< r-trLrtuarnerLtr:
Lttt cvonto
f:xclltt'giss B t, 82, .. , 8,, (Figura 2.6), talcs (llre sli unirr es el espacio rri,r.:j r.- j ,'1 (lada por
Supongamos que el evento A puede ocurrir a condicin de que aparezca uno de los eventos Bt, Bz,
..., Bn. Si A ya ocurri, la probabiiidad (condicional) del evento B es igual a
Pr(B6lA) :ffi:g;ffi
Pr(AnB) Pr(B)Pr(AlB)
i:I
?ara e1clculo mediante la frmula de Bayes puede resultar conveniente disponer las probabilidades
:t rn diaqrama de "'rbol como el siguiente'.
A
Pr(81)Pr(Al81)
A'
Pr(81)Pr(A'lB1)
A
Pr(82)Pr(AlB2)
Ac
Pr(82)Pr(A'lB2)
A
Pr(8,)Pr(AlB")
Pr(8")Pr(A'lB")
rsta dispctsicirr de los datos facilita la rcaiizacin de los clculos ya que
nicamente se debe realizar
-na slrma de los resultados en las ramas de inters
Ejer.:rIos
l. En una oficina hay 6 computadorrs de marca y 4 ciones. La probabiliclad de que al utilizar una
mc1lrina, sta encienda correctameirte es 0.95 para las de marca y 0"8 para las clones. Un em-
pleado utiliza aI azar una computadora, hallar la probabilidad dc que se encienda correctamente.
.4oluci,n: Definamos los eventos:
.3)
A: el empleado ul,iliza una mquina de marca,
B: el crnpleado utiliza una mquina cin,
C: la mquina enciende correctarnente.
72 Captulo 2. EI Concepto de Probabilidad
Sc ticrrc,
4
PL(A) :*:,,0, Pr(ll) :r0:,,.n.
Pr(ClA): 0.95, Pr(ClB): 0 8.
a) Se tiene
Pr(81) : j,2I Pr(82) : :.
La probabilidad condicional de que la botella contenga la cantidad exacta, si ha sido en-
vasada por Ia primera mquina es
Pr(AlB1) :0.6.
Por tanto, la probabilidad de que la botellr tomada aI azar contenga la cantidd exacta es
1-,) Ltr prcibttbilidtrd del crcnto <se escogi unr botcllr r:on la cantidad exacta llcuada poi' Iir
segurrcla m<rirrir>> es
17.
Este resultado tarnbin se puede calcular eurpleando cl concepto dc evento cornl lerlentario.
Err trna ciudad, el 25% de los habitantes son ancianos, el 35 % adultos y ei 40 % sorr lios. Se
sabe que la glipe afecta al5% cle Ios ancianos, al4To de los adultos y al2% de los rrios.
Ahora, basta sumar los resultados parciales en las ramas para obtener el resultado deseado:
or lr
Pr(,4u/lG) : Pr(AlG) +Pr(.n/lc)
r25 80
345+3*:0'594'
La lrlobabilidad de que si urt habitante tiene gripe, ste sea anciano o rriiro, es clel 59.4%.
74 Captulo 2. EI Concepto de Probabilidad
4 EI 35'/r, clc los ct'clitos clttrt rtt<-ltger rtrr banc<l es parr vivicncla, eI 50%, ltara pr.ochrc:ciu y el r'esto
(r()llsittlllo. R,cstrltrrr lltot()sos r:l 20(X, tk: krs cl'rtlit,cts
l)r1 i ltrua vivicr,la, el l5%, rlc los clrlitgs
lrillrr >r'orlrrcrcin y t>l 70c,4, r[c Ios cr'ditos I)i,t'a c:orrsurr]o.
a) Tengamos presente que el evento <<el crdito se paga a tiempo> es el complemento del
evento <el crdito est en mora>; entonces, buscamos Pr(M.).
Por la frmula de la probabilidad total,
2.9. Ejercicios
1. Sean A y B dos eventos con Pr(A) # 0 V Pr(B) 10. Demuestre que
En una biblioteca hay B libros de literatura de ciencia fi.ccin, 3 de los cuales son de Isaac Asimov.
La bibliotecaria toma al azar 2 libros. Determine la probabilidad de que ambos libros resulten
ser de Isaac Asimov.
10 La Empresa de Correos ha determinado que el 70% de los paquetes enviados al exterior no llegan
a su destino. Dos libros se pueden enviar separadamente o en un solo paquete. Para cada una
de las dos formas de envo postal, encuentre:
t2. El 35% de los crditos de un banco es para vivienda, el 50%o para industrias y el 15 % para
consumo. Resultan morosos eI 20To de los crditos para vivienda, el 15% de los crditos para
industrias y el 70 % de los crditos para consumo. Calcule Ia probabilidad de que se pague un
crdito elegido al azar.
1t
1J En una exhibicin de arte hay 12 pinturas de las cuales 10 son originales. Un visitante selecciona
una pintura al azar y decide comprarla despus de escuchar la opinin de un experto sobre la
autenticidad de la pintura. El experto est en lo correcto en 9 de cada 10 casos, en promedio.
a) Dado que el experto decide que la pintura es autntica, icul es la probabilidad de que l
no se equivoque?;
b) Si el experto decide que Ia pintura es una copia, entonces el visitante la devuelve y escoge
Le el
otra, cul es Ia probabilidad de que Ia segunda pintura escogida sea original?
dad
14. Hay una epidernia de clera (C). Consideramos como uno de los sntomas la diarrea (D), pero
este sntoma se presenta tambin en personas con intoxicacin (1) , e incluso en algunas que no
tengan nada serio (N). Las probabilidades son:
cule
Pr(DlC): 0.99; Pr(Dl1) : 0.5; Pr(Dl,n/) : 0.004
Se dan los siguientes porcentajes: el 27odela poblacin tiene clera y el 0.5% intoxicacin. Si
una persona tiene diarrea calcule la probabilidad de que tenga clera.
76 Captulo 2. EI Concepto de Probabilidad
15. Urta pru<tlril cl vitrts del SIDA eu la sangle cl el cliagnstico correcto coll urra pro-
l)tlr rlctct:trt
babiliclrcl rlcl 9ll %. Sogrin clatos mdicos) lrrio clc carla 2 000 habitantes cl<ll pas. en prornr:clio, es
poltaclol rlrtl virtts. Da<lo qrte la pnrebzr fire positivtr I)arr una persorl1) 1',clril es la proira.lriliclacl
cle que cllr, r'elnrcrrte tcnga Ia enfermedrd?
16. Utra emplesa financiera opera en las tles regiones del pas: Costa, Sierra y Arnazona. El 50 %
de las opeLaciones se realizan en la Costa, el 40 To er Ia Sierra y el resto en la Amazona. Se
ha estimaclo, derlrido a la larga experiencia, el porcentaje de clientes qne no pagan sus deudas en
cada una cle las regioues. Para Ia Costa es del I%o, para la Sierra deI 2To y para la Amazona
del 8 %. Si la empresa tiene 1000 clientes, determine cuntos pagan sus deudas puntualmente.
17. Una encuesta revela que el 70% de la poblacin tiene estudios secundarios, de los cuales eI 72%c
no tiene trabajo. Del 30 '70 q:ue no tiene estudios secundarios , eI 25 % no tiene traba.jo. Calcule:
18. De 200 aspirantes a un cargo se conoce Ia siguiente tabla respecto a experiencia en funciones
similares y la formacin acadmica necesaria
a) con experiencia y con folmacin; d) sin formacin dado que no tiene experien-
b) con experrencra; cia.
c) con experiencia dado que tiene formacin;
19. En una investigacin sobre el crdito bancario a trabajadores agrcolas se obtu\o el siguiente
modelo, en el que se califica al campesitto como propietario o no propietario del terreno que
cultiva y si mantiene o no mantiene deudas con los bancos.
Propietario
Deudor SI NO
SI 12 28
NO 20 64
20 A 100 empleados se les hizo un examen para determinar su destreza mar,'.,:-- C''ralenta clc los
ernpleados ern hombles. Scsenta de los empleados pasaron el exameli 1., _: .. .lcanzaron rurl
2.9. Ejercicios 77
ro- calificrciu rriayot que cicrto rrivcL Pledetr:r'ruilrdo cle arr'<x,'eclrarnictrtci. Lr clrsific-Lcin entre
CS
hornll'ers y rnujer-cs fue Ia sigrrielrte:
[cl
Honrlrr.cs (11) N{u,lcres (,4'1)
Pasaron (P) '24 36
)% No pasarou (.Ay') r6 24
Se
ien Sr-rponga que se selecciona al azar un eurpleado dc los 100 que hicielon el examen.
lna
Lte. a) Calcule la probabilidad de que el empleado Laya ptrsado y sea hornbre;
2%
b) Calcule la probabilidad de que el emplead., sea hombre dado ctrtrc pas el examen;
q.ue
2I. Los empleados de la compaa Crrz del Sur se encuentran distribuidos en 3 divisiones: Admi-
nistracin, Operacin de Planta y Ventas. La siguiente tabla indica el nrmero de empleados en
cada divisin, clasificados por sexo.
ente 22. Dada la siguiente tabla que indica el comportamiento respecto del hbito de fumar en un grupo
) que de 100 estudiantes que fueron averiguados.
Hbito
Sexo No fuma Fuma Ex-fumador TOTA
Hombre 16 10 24 50
Mujer 30 16 4 50
TOTAL 46 26 28 100
25. En un pas hay 4 partidos polticos que se dividen la opinin pblica. Se sabe que:
Entre los adherentes al partido I, un 36 % corresponde a personas con ingresos inferiores a dos
salarios mnimos. Entre los adherentes al partido II, esa proporcin es del 52'/o. Para el partido
III es un 42V0, y para el partido IV es 11%. Si se elige una persona al azar y resulta tener un
ingreso mayor a dos salarios mnimos, calcule la probabilidad que sea adherente al partido I.
26. La seora Sonia se fue de viaje y encarg a su hijo, Pablo, que riegue el rosal. La probabilidad
El rosal est en un estado inseguro:
", ].
de que Pablo olvide regar el rosal durante su ausen"iu
3
si se riega tiene igual probabilidad de secarse que de no secarse) pero solamente tiene un 0.25 de
probabilidad de no secarse si no se riega. Despus del viaje Sonia encuentra el rosal seco, cul
es Ia probabilidad de que Pablo no lo haya regado?
27. Se estima que slo un20To de los que compran acciones en Bolsa tienen conocimientos burstiles.
De ellos el 80 % obtienen beneficios. De los que compran acciones sin conocimientos burstiles.
slo un 10% obtienen beneficios. Se desea saber:
a) El tanto por ciento de los que compran acciones en Bolsa que obtienen beneficios;
b) Si se elige al azar una persona que ha comprado acciones en Bolsa y resulta que ha obtenido
beneficios, cul es la probabilidad de que tenga conocimientos burstiles?
28. En un supermercado el 70 % de las compras las realizan las mujeres; de las compras realizadas
por estas, el 80 % supera los 20 dlares, mientras que de las compras realizadas por hombres slo
el 30% supera esa cantidad.
29. En una universidad existen tres facultades: A, B y C. En A hay matriculadas 150 chicas y 5[
chicos; en B, 300 chicas y 200 chicos; y en C, 150 chicas y 150 chicos.
-i-
2.9. Ejercicos
30. Etr.e los cinco rrstirantes a un calgo cle geleute, a <los se ios considera excelentes y a los rierns
se les consicler'r bucnos. Para una entrevista se escoge al azal a dos de los cinco. Calcule lr,
probabiiidacl de que se esco.ia:
31 Se dispone de dos mtodos A y B para ensear una destreza manual. El ndice de reprobados es
del 20 To para el mtodo A y 10 To para el mtodo B. Sin embargo, el mtodo B es ms caro por
Io que solo se le usa el 30 % del tiempo y el A el otro 70 %. A un trabajador se le adiestra con
uno de los d.os mtodos, pero no puede aprender en forma correcta. Cul es Ia probabilidad de
que se le haya adiestrado con el mtodo A?
32 En los exmenes de ingreso a una universidad cada candidato es admitido o rechazado de acuerdo
a si l ha aprobado o reprobado la prueba. De los candidatos que realmente son capaces' el 80 %
pasa la prueba; y de Ios que no son capaces, el 25To pasan Ia prueba. Dado que el40% de los
dos candidatos son realmente capaces, encuentre Ia proporcin de estudiantes capaces que ingresan
ido a la universidad.
un
JJ Segn datos de investigaciones genticas se ha establecido que: los padres de ojos claros y los
hijos de ojos claros constituyen el 5To de las personas estudiadas; los padres de ojos claros y loB
dad hijos de ojos oscuros el 7.9 %o; los padres de ojos oscuros y los hijos de ojos claros el 8.9 %; los
padres de ojos oscuros y los hijos de ojos oscuros eI78.2Vo. Halle la probabilidad de que:
uro:
5de a) el hijo sea de ojos oscuros, si el padre es de ojos oscuros;
cul
b) el hijo sea de ojos claros, dado que el padre es de ojos claros.
,iles. :l-1 Como un acto de buena vecindad Dios y Satans acordaron un intercambio cultural entre el
:iles, Cielo y el Infierno. Demonios del Infierno van a vivir en el Cielo, mientras que ngeles del Cielo
van a vivir en el Infierno. Los demonios tienden a no decir la verdad ms frecuentemente que los
ngeles. Los demonios mienten el 80 % de las veces y los ngeles mienten el20% de las veces (en
estos das es difcil encontrar ngeles buenos!). Despus del intercambio, la proporcin entre los
demonios y ngeles en el Cielo es 2:3. Mi amigo Jos muri y fue al Cielo. l encuentra a una
rnido
persona en la calle y Ie pregunta donde encontrar un bao para hombres. Desafortunadamente,
Ios demonios y los ngeles no se pueden distinguir por su aspecto fsico. Deseamos determinar:
:adas
; slo
a) Cul es la probabilidad de que Ia respuesta haya sido una verdad a la pregunta de Jos?
b) Dado que la respuesta fue una mentira, cul es la probabilidad de que haya sido dada por
un demonio?
os 20
.)=
)'J Una compaa de tarjetas de crdito encuentra que cada mes el 50% de quienes poseen la tarjeta
ilidad cubren totalmente sus deudas.
a) Si se seleccionan dos usuarios al azar, cul es la probabilidad de que ambos paguen total-
;y50 mente su deuda ese mes?;
b) Si se selecciona un cliente al azar, cul es la probabilidad de que dicha persona pague
totalmente sus deudas en dos meses consecutivos?
c) En qu hiptesis se apoy para responder a los dos apartados anteriores? Le parece que
ef alguna de ellas no es razonable?;
80 Captulo 2. El Concepto de ProbabIidad
<1) Urr cxarrrerr rnis <1etrllaclo der los rcgistlos cle la conipaa rnuestr'r quc el 90 % cle los clicutcs
que l)agau t<it.rllneut,e unr cLr<lrrtl nrensual tarnbin lo hacen al mes siguiente v <1uc slcr
eI 70%, clc los cluc l)o l)ag]lr totr.lrnente en llrl rnes cttl-ren totalmente srr dcrrcl al mes
siguierrte. Calculc, cn este cso. la probabilidad pedida en b).
e) Con las hiptesis de d), calcule la probabilidad de que un cliente seleccionado al azar no
pague totalmente ningr-rna cle las dos cuentas rnensuales consecutivas;
f) Calcule Ia probabilidad de que slo pague una de las dos cuentas.
37. El cardinal de un espacio muestral finito es rn. Los eventos A y B son independientes y cumplen
que:
38. Demuestre que si se tienen Bt, Bzr..., B, eventos mutuamente excluyentes, tales que su unin
es el espacio muestral, ertonces se tiene que
fi,:r e'1ana) : t.
Captulo 3
Definicin (de variable aleatoria) Se llama variable aleatoria a cualquier funcin definida en
':: espacio muestral f) con recorrido en un subconiunto finito o infinito de R.
- decir, Ia funcin
X:Q --) R
u F-f X(r)
81
82 Captulo 3. Variables Aleatorias, Esperanza y Varianza
Figrira 3.1:
Ya hemos estado trabajando con variables aleatolias sin leferirnos cxplcitarncnte a ellas; por ejernplo,
al arrojar un dado son posibles seis casos. Designando por o ei evento elementl consistente en saiir
puntos, tenemos:
CI : {cuf ,u)2,u)Srw4rrr'5rw6}.
Lavariable aleatoria X(rn): i identifica al nrmero z de puntos obtenidos al lanzar cl dado, se define
as:
Al arro,jar una rnoneda tenerlos dos eventos: C: <<sale cara>> o -E: <<sale escudo>>; definimos la variable
aleatoria X, que cuenta el nmero de caras aparecidas en una serie de lanzamientos, de la siguiente
manera:
Las variables aleatorias se clasificanten d'isc'retas y co'nti,rtuas, de acuerclo a los vlores qne ellas tomen.
\rkrtniis, ti p,, : Pr'(X : x:). cs lir ytt'tillzrlrilirlrrl <lc tlrtc X tonrc <rl vtlol ru, sc ctuttplc <ue
rn ottas palablas, X os disc:r'cta si rrna unirlarl rkr urlsr clc plobabiliclrd csti <listribrricla sobre el e.ie
-=al, cc'rrLcerrtrnclose rrril rnrsr I)ositi\'1 err cacla prrut,o <le c:ielto c:on.jrrnto finito o infinito nrrrnerable y
.:- los restaltes purrtos uo l)ry lnasr.
-,-r'iables
aleatorias discretas sorr usualmente (pelo no rrecesariamente) conteos de ciertos elementos'
- -,r ejemplo, el nirmero de hi.jos de una familia, el rniulcro de ventas realizadas por Lrn almacn, etc.
- la vez qlre se ha determinado las probabilidades isociadas a cada uno de los rralores de nna variable
-:atoria discreta, es ritil ponerlas en forma dc una distribu.ci,n de probabilidad, que es una tabla con
:,,ios sus posibles valores y sus correspondientes probabilidades, como la siguiente:
f 1 2 n
Pr(X : r) Pt PZ P,,
Ejemplos
Po : :0) : PL({CCC}): 1
Pr(X
8'
t
J
Pt : Pr(X: 1) : PL({CCE}): g'
3
Pz : Pr(X : 2) : Pr({C EE}) :
8'
Ps : Pr(X : 3) : Pr(iE EEI) : 1
-:.
8
T 0 1 2 3
Pr(X : r) 1/8 318 318 r18
y se cumple que
1331
Po*h-lPz+Pt : B + d + S + g : 1
Consideremos la sigrriettte plueba: se dispara corr nna pistola a un blanco situado a cierta dis-
tancia. Nos interesa analizal los eventos uJ: <<rlmero de balas empleadas por un tirador hasta
(lne se da en el lrlarrco por prirnelavez>,.
Definimos la variable aleatoria X: <<nrnero de balas gastadas>>:
EI corrj nnto de posibles valores que puede tcmar Ia variable aleatoria es { 1, 2,3, . . .} .
Este es un conjunto infinito numerable, pues no se conoce un mximo para el nmero de balas
empleadas que pudiera ser extremadamente grande para una persona con muy mala puntera-;
es decir, X es una variable aleatoria discreta definida sobre un conjunto infinito numerable.
Definicin (de funcin de distribucin) Sea X una variable aleatoria discreta, la funcin leal
-F tal que
V e R, F(t): Pr(X < )
Propiedades
Observacin. La probabilidad Pr(X: a) se calcula mediante Pr(X: a): F(a) - F(o_), donde
F("-) es el lmite, por la izquierda, de la funcin de distribucin en el punto a. Este concepto tiene
importancia para el clculo de las probabilidades en los puntos donde ,F tiene saltos.
Ejemplos
0, si <0;
Il8, si 0(<1;
F(t) : Il2, si L<t<2;
718, si 2(<3;
1, si 23.
Los grficos de las funciones de probabilidad y de distribucin se dan en la Figura 3.2:
F(t)
0.4 I F
H
0.3 0.75
0.2 0. H
0.1
o
Figura 3.2:
3.1. Valial-ies aleatorias 8r
Elr rrrLr lltrr<:l-,ir rkt c:tli<lr<l rk. ttrr ltLorltt, l,r sl tillrr'(lllr'{'n tLrt [o1<: tlt l') Piczas lrn'!i ].,1[tttttt.
t .1 rlcf<r<:tlrosrs. L)rr cl rkrP;uliunollt() rlc <:rrrtlol tlt' r:irlir[rrI st: lrrrrt turt nrttcsl tl tlc ]] lriczits
Clorrstlrril lr lct'rkr lr r'rriirlrlc alcrtoLir <<Lrirrrr:Lo rl<r lrir:z;ts lrlrcLr,lsr,.
Sol,tLr:irin,: La r'ilialrlr: a,lcrtolia crL crLcstirilr prr<rrlc torrrar'krs r'rlolr.s 0. 1.2 \,J: rIctr:nnirolnos
srrs prol)rl )ilir [<ics.
El llrill<:r'<.1 r[c srrbc:onjrrrrtos cl<l 3 c]crnerrtos rilrtcrrilrlcs rlc rrrr c;ou,jrtrtto <[c 12 clrlurcrrtos cs C:fr.
que es Card(O).
r Si X:0, cutolrccs toclrs las Piczas sou dcfcctuosas, lriv C[ lorrnirs clc <:scogctlirs.
. Si ,Y : 1, crrtorrc:es 1 es lrucrrr y 2 sorr clefcctrrosrs. c\istcu Cl f.rlrn,rs cle csc:ogt:t l:rs Piclzirs
buenls v Cl de cscoger las clefectnosas) crrton(ies lrv CC; forurts clc: cornlrilrrr lrs lrttettrs
y las defectuosas.
. Si X : 2,ltay C! conjuntos de las piezas buenrs y C] dc dcfcctuosas) prr'-r, rrn total cle
Cl|6C| formas cle combinarlas.
. Si X: 3, hay C! cornbinaciones de piezas bueuas.
Entclnces,
Para clefinir urrr variablc alertoriir no cs nccesario cxhil.il urr fcrtcirrrcrto rleat<lrio pat'ticttltrr',
es suficiente clar ulla funcin cle probabilictad o cle clistlibucicln rre cr-rrnpla las plopic<lrclcs
enunciadrs.
si l,<-3;
si -3<<0;
si 0(t<2;
si >2,
Coustruil Ia tal-la de clistribucin de probabilidacl clc )'.
Sol'ucit: De acuerdo a la definicin de la ftrnciu cle clistribucirr roclenlos \'ol cluc lr r-rrirblc
aleatoria tornr los valoles -3,0 y 2.
r l-rlo l2
Pr()':trlIl2 lll4lIl4
86 Captulo 3. Variables Aleatorias, Esperanza y Varianza
4. Unr variable rleatoria X est dcfinida medirnte lir siguierrte lcy de plobabilidacl
Jr l rlzl | qI s
a) Determinar F(r).
b) Graficar f(r)y F(r).
c) Hallar: Pr(X:1), Pr(X < 1), Pr(X < 1), Pr(1 < X < 2), Pr(1 < X < 2), Pr(1 < X <2).
Soluci,n:
Pr
F
0.
0. H
H
0.1 H
0.1 H
Figura 3.3:
c) Se tiene:
Definicin (de variable aleatoria continua) La variable aleatoria ouyo recorrido es un intervalo
inito o infinito de R se llama variable aleatoria corrtinua.
Tambin, se dice que Lrna variable aleatoria X es continua si para todo valor real r se tiene que
Pr(X: z) :0.
- sualmente, lasvariables continuas representan mediciones; por ejemplo, la estatura de una persona,
-l tiempo que se demora un programa en buscar un registro en una base de datos, la cantidad de
:ngre que tiene un animal.
Definicin (de funcin de distribucin) Sea X una variable aleatoria continua, Ia funcin real
F tal que
V R, F(t): Pr(X < )
=e denomina funcin de distribucin de la variable aleatoria X.
Fropiedades
l. Pr(a< X <b):Pr(<X <b) :Pr( < X < b) :Pt(a <X < b) :f'(b) - F(").
Definicin (de funcin de densidad) La funcin de densidad de una variable aleatoria continua
-'t es una funcin real / que cumple:
)
") f (r) 0 Para cualquier valor z.
b) /A f@)dr:r.
c) Para cualquier intervalo A: lo,b], se tiene que
-,
-amos cmo estrr relacionadas las funciones de distribucin y de densidad. (Ver Figura 3.4)
F(r):
l"*r@ot y f (*): F'(r).
88 Capt,tttra 3. VaranJes Aleadorias, Espet'anza I \-ariattza
f {t}
Figura 3.4: Relicin cntr-c las firncion<:s clc clclsidaci y c1e clistrilruc:irr.
b
Pr(a<X<q: I I(r)dr:F(b) -F(").
En las valiables aleatorias continuas es suficiente indicar la funcin de densidad o Ia funcin de dis-
tribucin para que la variable aleatoria qr-rede completamente definida.
Ejemplos
"'(0.".1)
2 Lr fiurcin de densidacl de una valirble aleatoria est clada por /(z) : (\.e-s:L cn el intern,alc
(0,-) v f @): 0 fitera cle cste itttetvalo. Hallar' el vrlor de la constante cv para que /(z) as-
clefilriclr scl unA funcin <le densidld.
. En (0, oo) se debe tener f (") >- 0, es decir (\e-3* ) 0. Pero Vr (0, rc), e t" > 0; entouces,
se dobe tener que a ) 0.
Consecuentemente, : tt entonces a : 3.
Dada la funcin de densidad de la variable aleatoria continua X:
( o, sic(o;
f(*): { cosr, si0(r<rf2;
r dis-
I o, sir>rf2.
a) Hallar la funcin de distribucin F'(r).
b) Determinar: pr (t = *. ;), e, (x ,;),"'(; <x <
#)
Solucin:
( o, sir(o;
F(r):l ';" ', si o < '<X,
I r, six>[.
b) Para calcular las probabilidades emplearemos Ia funcin de distribucin.
r Pr(a < X <b) :F(b) - F("). Si : I y U:[,
erval< 6" 3
(r) as
: -"()
"'(=".) "()
: *" () : rfr1
2 -5
'"" () -
: 0.36603.
90 Captulo 3. Variables Aleatorias, Esperanza y Varianza
"("'i) : '-'(;)
1-sen/1):
\ 4/
r-Jt2
_ 0.29289.
r 17tr
e Pr(a < X < b) : F'(b) - F(o), con : vb-_.
3" t2
4. La funcin de densidad de una variable aleatoria ? est dada por f (t) : t-f, y /() : O
"n(1,2)
fuera de este intervalo. Hallar las probabilidades:
a) Pr(0<?<1.8):
,t) Pr(r.4<7<3):
r.1 r
_ t)',n+o
[,'^('-;)"* 1,'o
1.. ..
ilt'-2)-({r+)2- 72.
5. Hallar la funcin de densidad /(r) de una variable aleatoria cuya funcin de distribucin es
'17
4'
( !"-,,r, si > o;
f (t): \ 0, '2
|. en Io dems;
donde es el tiempo (en horas). Calcular la probabilidad de que un elemento dure ms de tres
horas, dado que ya ha estado en uso mis de dos horas.
Solucin: Nos interesa Pr(? > 3lf > 2), que segn Ia frmula de la probabilidad condicional se
tiene:
Pr(?>3lT>rl :#fi;
porque Ia interseccin de los eventos (7 > 3) y (T > 2) es el evento (" > 3). Entonces,
l'* | -rtz
Pr(? > s) _ ./r rt :- "-t1," _ e-rlz:
Pr(I > 2) -
0.606.
[* !"-* r'
.lz 2
Sea g una funcin real cuyo dominio contiene el recorrido de la variable aleatoria X, podemos definir
-l-na nueva variable aleatoria Y mediante
y: g(X),
92 Captulo 3. Variables Aleatorias, Esperanza y Varianza
y9por
gtB ------+ R conAe B
r r---' g(r)
Y : Q ------+ R
ul-----' Y(u): s6@)).
donde A: g(r).
Si X es una variable aleatoria continua. Supongamos que g es una funcin continua y estricta-
mente creciente en todo el eje real; entonces, existe la funcin inversa de g que la llamaremos l.
sta tambin es continua y estrictamente creciente, por lo que
Aplicando la funcin inversa a los dos miembros de la desigualdad del argumento de la ltima
expresin se obtiene
Pr(e(X) () :Pr(X<h()) : Fx(h(t)).
Luego, se tiene la siguiente equivalencia entre las funciones de distribucin de X y de Y:
Fv(t): k(h()).
Si las funciones F y h son derivables, se pueden derivar ambos miembros de la igualdad anterior,
empleando la regla de Ia cadena:
Ejernrlos
1. Da<[a ll [rrrrc:it <lc <listlilrrr<:in F clc lr varitll]cr rlcrtolit -\. hallrl l.rs ftttt<:i<.trcs rl<r rlisl tilrrrt iritr
<lc rkrusiclir<l d<l \" : u,X * b,
r' pala: a) rr, ) 0; lr) tr, < 0.
Soht.r:i.titt:
La funcin de densidad es
: -r/t).
Si F.v es coutiuua SC
<0;
>0.
Si lr.v <s rl<lrivable er rlcusiclad:
<0;
>0.
94 Captulo 3. Variables Aleatorias, Esperanza y Varianza
x I -s I -21 o | 2
Sol'ucin: Como Ia variable aleatoria es discreta, basta aplicar la relacin Pr(Y : A) : Pr(X :
ri), a cada uno de Ios valores que toma Y : X2. Entonces, tenemos que
v2 l(-)rl(-z)rlo, lz,
Es decir,
Y lglq lol+
Como el valor Y : 4 se repite 2 veces, unificamos sus probabilidades y la tabla queda as:
( 0, si <-1;
k():{ +,sisi>1.
-1<<1;
( t,
Solucin: Se tienen las siguientes igualdades:
0, si -lnt<-I;
F(- ln) :{ -ln*1 si - 1< -ln <
2' 1;
1, si -lnt>L.
:t 0,
-ln*1
1,
2'
si>e;
si e-l 1t 1 e:
si < e-1.
Por tanto,
1, si>e:
+ ln
- 1- Fx? ln) :
1
Fv(t)
2
sie-'1t1e:
0, si<e-1.
3.3. Ejercicios 95
3.3. Ejercicios
1. Irrclique si las siguierrtes variables aleatolias son discretas o corrtiuuas y su rarrgo cle <lefinicin:
,l Se arroja un dado y se designan por : {el nmero de los puntos aparecidos es par} y por
6 : {el nmero de los puntos aparecidos se divide por 3}. Para los dos eventos, halle Ia Iey de
distribucin y grafquelas.
4. Determine Ia funcin de distribucin de la variable aleatoria X que est definida por la ley que
se presenta en la tabla.
-2 rt
rl4 213 rlL2
. Un escritor ha lanzado al mercado una nueva novela. La probabilidad de que Ia novela sea muy
exitosa es 0.6, de que sea medianamente exitosa es 0.3 y de que sea un fracaso es 0.1. Los bene-
ficios esperados son: si la novela es muy exitosa, 100 mil dlares; si la novela es moderadamente
existosa, 50 mil dlares; y, si es un fracaso, 10 mil dlares. Forme la ley de distribucin de los
beneficios esperados por el escritor.
6 Una agencia automotriz recibe un embarque de 20 automviles nuevos; entre stos, 2 tienen defec-
tos. La agencia debe seleccionar, aleatoriamente, 3 automviles de entre los 20 para venderlos.
Forme la ley de distribucin de la variable aleatoria <<nmero de carros defectuosos entre los
escogidos>>.
7 IJn apuesto prncipe visita a un rey que tiene cuatro hijas casaderas, con la intencin de integrarse
en la familia. Las probabilidades que tiene el prncipe de ser aceptado por cada una de las
princesas son 0.6, 0.8, 0.2 y 0.4. El prncipe pide la mano de cada una de ellas de forma
consecutiva y se casa con la primera que acepte. Sea X la variable aleatoria definida como
X:i si se casa con Ia i-sima hija (i - 1,.. .,4) y X:0 si todas le rechazan. Calcule la ley
de probabilidad de X y su funcin de distribucin.
8 Una chapa para puertas consta de tres piezas mecnicas. Suponga que las probabilidades de que
Ia primera, la segunda y la tercera piezas cumplan con las especificaciones son 0.95, 0.98 y 0.99,
respectivamente. Determine la distribucin de probabilidad del nmero de piezas que cumplen
las especificaciones en una chapa.
9. Sea X una variable aleatoria discreta cuya funcin de probabilidad es p(r) : :1,2,3,4,5.
#,r
a) Encuentre el valor de & para que la funcin p(r) sea la funcin de probabilidad de X;
b) CalculePr(l < X34).
C)a>tulo 3. Varitltl:s Aleatorias, Esperattza y Varianza
l(. l,r lr:.'i,irr ,lr'rrol,irlrilirl:r<1 ./'cl<: rulr r'uiirllc rl<rtlotir -f <:s rrttlt srh'o cn lr.rs lrtttrtos /.:0. f .i'
'1. lirr cl[r, l()nrr lr)s vitl()los:
il. t':r,r r''u'ialllc r,leatoli:r -Y se dicc <ur: sigrr<: lrr lcy cle B<rnfot'cl si se cttrnple qtte
,:) /(t ) =
{iZ;:, :i ;: l]
15. Dncla la fttttciu de distlillrrt:ititr rk: r: r'tt'ia,lrlc alertori .{:
0. si z(0;
L 14. si 0lr(1;
F(.r:) =
t l:J. si | 3r <2;
:r fr.t. si 2(1t14;
(t: -').)/3. si 4l:r. ( 5;
l. si ;u)5.
C)al<:r tlc lits rt'o! r;.l,rriidul<ts:
3.3. Ejercicios 97
0, si r<-J2;
Il8, si -J2<r10;
215, si 0(r1I;
Il2, si t <, < J2;
314, si t/2<r<512;
1, si r>512.
Determine la funcin de probabilidad asociada y grafquela.
10, sir<-2;
F(r):l ar+b, si -2Sr<2;
I t, sir>2.
a) Determine los valores de a y b; c) Halle: Pr(X
b) Encuentre la densidad /; Pr(lxl > 1.2).
El tiempo en minutos que una persona espera un autobs es una variable aleatoria cuya funcin
de densidad viene dada por las frmulas: /() : j ouru 0 < < t, f(t) : o.ru I < t < 4,,
(t):0 I
para los dems valores de . Calcule Ia probabilidad de que el tiempo de espera sea:
f
98 Captulo 3. Variables Aleatorias, Esperanza y Varianza
22 Los registros de ventas diarias de una empresa que comercializa computadoras muestran que
vendern 0, 1 o 2 computadoras de acuerdo a Ia siguiente tabla:
No. de ventas 0t1t2
Probabilidad
24. Una empresa alquila el tiempo de cmputo de un tipo especial de computadora a una universidad.
La empresa debe planear su presupuesto, por lo que ha estudiado el tiempo de empleo de Ia
computadora. El tiempo semanal de alquiler (en horas) sigue la funcin de densidad dada por:
si o( t<4;
*U'n-U'
f(t):{ 0,
[ caso contrario.
25. La cantidad de pan (en cientos de kilogramos) que vende una panadera en un da es una variable
aleatoria con funcin de densidad
c, si 0Sr13;'
c(6-r), si 3l r16;
0, caso contrario.
a) Encuentre el valor de c;
b) Cul es la probabilidad que el nmero de kilos de pan que se vende en un da sea: (i) ms
de 300 kg?, (ii) entre 150 y 450 kg?;
c) Denote por A y B los eventos definidos en (i) e (ii), respectivamente. Son independientes
Av B?
26. La cantidad (en gramos) de fertilizante qumico que una planta puede recibir es una variable
aleatoria cuya funcin de densidad es
f srla z;
(r): { ff, - si r [o' 8];
f
0,[ caso contrario.
Ejercicios 99
l;. Se extrae una bolita al azar de un bolillero que contiene 3 bolitas numeradas de 1 a 3. Llarnamos
X al nmero de la bolita extrada. Una vez conocido el valor de X, extraemos una nueva bolita
alazardeotrobolilleroquecontiene4-XbolitasnumeradasdeXa3(porejernplo: siX:2,
la segunda bolita se extrae de un bolillero que contiene dos bolitas con los nmeros 2 y 3).
Llamamos Y al nmero de la bolita extrada en el segundo bolillero.
f(n\:Ir'siz[o'1];
\"/-lo, sizl[0,t].
a) Si Y - X2, halle la funcin de distribucin de Y;
[ si z [-1,1].
Halle Ia ley de la variable T : -52.
i.'. IJna variable aleatoria X tiene funcin de densidad
rf") : (! sirl-z,Z);
I o1 si n ( l-2,21.
Halle la probabilidad Pr(X2 < 1).
5,
sigl-t,Z];
0, caso contrario.
Una variable aleatoria X tiene funcin de distribucin Fy(r) - 1 - e-o', si r ) 0. Halle las
funciones de densidad de:
100 Captulo 3. Variables Aleatorias, Esperanza y Varianza
{Y:f7; b) Z :1tnt.
En las secciones precedentes vimos que una variable aleatoria queda definida por su funcin de dis-
tribucin, pero muchas veces solo se desea tener una idea del comportamiento general de las variables
aleatorias, sin dar detalles de su distribucin de probabilidad; para tal propsito, examinaremos dos
caractersticas tericas de las variabtes aleatorias: la esperanza y la varianza, que son dos parmetros
que miden la Iocalizacin y la dispersin de Ios valores que toma la variable.
1. Si X toma un nmero finito de valores rr 12, ..., rn con probabilidades h:Pr(X : rt),
pz : Pr(X : r2), . . ., pn: Pr(X - ,n)t
E(x) : f,o*rr.
l^-1
2. SiX toma un nmero infinito de valores rr, 12, .. . con probabilidades p : Pr(X : rk),
k:I,2,-..; oo
E(X) : ln*"r.
/c: f
E@:
l: rf (r) dr.
Observacin. Si /(r) toma valores distintos de cero en un intervalo [a., b], Ia esperanza se calcula
como
Fj(x): rf (r)d,r.
L
La esperanza posee varias propiedades, independientes del tipo de la variable aleatoria. A continuacin
vamos a enunciarlas y demostrar algunas de ellas, en el caso de una variable aleatoria continua, los
otros dos casos quedan como ejercicio para el lector.
Propiedades
D enostt'o,cir:
dis-
2. Aditividad. La esperanza de la suma de dos variables aleatorias es igual a la suma de la^s
bles
esperarrzas de los dos surnandos:
dos
tIoS E(x+Y) :E(X) +E(Y).
3. Un factor constante c se puede sacar del smbolo de la esperanza matemtica:
E(cX) : cE(X).
Demostracin:
l'c. f@
E(cX) : (r) O, : (r) dx : cE(X).
.l_*crf " .l_*rf
4. Sea g una funcin real, la esperanza de la variable aleatoria Y : S(X) est definida por
E (x,) : l:,2q,d,.
5. Si X y Y son dos variables aleatorias independientes
E(xv) : E(x)E(r).
Observaciones:
E(Y):aE(x) +b.
1 2. Si la funcin de densidad es simtrica respecto a Ia recta
3.5)
r: rr, entonces E(X) : rn. (Figura
rria y
cula
aclon
a, los
Dos variables aleatorias con la misma esperanza pueden tener distribuciones diferentes. Para diferen-
-iarlas es lecesario introducir otra caracterstica terica que informe sobre la dispersin de su posibles
r-alores.
LO2 Captulo 3. Variables Aleatorias, Esperanza y Varianza
3.5. La varianza
Lr iclea de <lspelanza no ittclica ctuo csti clistlibuicl Ia mtsr en torrro su <l<ntro; sto sc explrcs)
rrreclirnte la Ia valiable alertoria X, que se nota Var(X) o o2.
uari,an,zo, de
Definicin (de varianza) La varianzt de nnt variable aleatoria X es rrn nrmero no negrrtivo que
se calcula por:
Var(X) : E(X -E(X))',
o, equivalentemente, por
Var(x) :E(x2) - (E(x))''
1. Para una variable aleatoria discreta que toma un nmero finito de valores rtt r2t .) trn con
probabilidades p1 : Pr(X : rt), pz:Pr(X : rz), ..., pn: Pr(X : r,-)i
2. Para una variable aleatoria discreta que toma un nmero infinito de valores rr, 12, .. . con
probabilidades p : Pr(X : rk), k : L,2,. ..:
La varianza da la idea de cun ampliamente dispersos se encuentran, en torno de la media, los valores
que toma Ia variable aleatoria:
1. Una mayor varianza indica que Ios valores tienden a estar ms alejados de la media.
2. Una menor varianza indica que los valores tienden a estar ms concentrados alrededor de la
media.
o:\@.
3.5. La varianza 103
Propiedades
Var(c) : g, c constante.
Denostracin:
Var(oX + b) : a2 Yar(X).
Fj,emplos
de la
-. La variable aleatoria discreta X est definida segn Ia ley
x I -41 6 10
p10.2 10.3 0.5
3
a) E(X) : D : -4 x0.2 +6 x 0,3 * 10 x 0.5 : 6.
A:1 "xp*,
Calculemos E(X2):
Entonces,
Var(X) : P(X2) - (E(x))2 :64 - (6)2 :2a.
b) Vamos a aplicar las propiedades de la esperanza y la varianza para calcularlas:
xl 1oo I so I ro I o
p | 1/Boo | 1/3oo I sTaoo I zoaTaoo
As,
293
E(X) rooxfr*5ox #.rox.*I+ox 300
0.67.
Como la persona paga 1 dlar por el boleto, Ia ganancia (total) esperada es E(G) : 0.67 - 1-
-0.33 dlares; es decir, una prdida.
3. Una persona quiere abrir una puerta y tiene 5 llaves, de las cuales solo una corresponde a la
cerradura. La persona va eligiendo al azar y probando abrir Ia puerta. Calcular la esperanza y
la varianza del nmero de intentos si separa las llaves que prob anteriormente.
Solu,cin: Como cadavez separa las llaves utilizadas, cada llave tiene la misma probabilidad de
abrir la cerradura; por lo que la variable aleatoriaX: <<nmero de llaves utilizadas>), sigue la
siguiente ley:
xl1 I 213 I 4l b
Entonces,
515
E(x): D*ou:;I/c:3,
l--1 t- r
515
E(x') : Dk'rr:;tk2:rr,
l': I [:1
Var(X) : lI - 32 :2.
3.5. La varianza 105
4. Una variable aleatorir X toma solarnente dos valores rt- y r2t tales que 12 > r1. La probabilidad
de que X tome el valor zl es 0.6. Hallar la ley cre sigr.re X, si la esperanza rnatemtica y la
varianza son conocidas: E(X) :1.4 y Var(X) :0.24.
Sol'uci,n: Esclibamos Ia ley de X:
La ley de X2 es
Entonces,
E(X') :0.6r? + g.arl
v
Var(X) : n(X2) - [E(X)]2 : 0.6r? + g.arl - r.42 : 0.24
I o.aq t olq:1.4
\ o.o"l -t o.4r| :2.2
.6 t.4
(,1. z
si t<, -1;
F(r) : si -1l<r 3;
si r,) ' .).
(r): si -1(r(3;
f
caso contrario.
De manera que
E(x) : (,)l_,
rf
1)
o":
e (x') :
[_,
r2r@ (i) r"
106 Captttlo 3. Variables Aleatorias, Esperanza y Varianza
Pot lo turto,
v.u(-K) : p (x') - (E(x))2 :: - r' :: .)
J
b) Tenerrros la varirblc lertor-ir Y :5X *2, cuyzr. funcin de densiclad no la corrocerno$. pero
podenos enrplezrr' las propiedacLes cle Ia esperanza y de Ia varianza:
E(Y) : :5E(X)+E(2) :5 x It2:7,
E(5X +2)
Var(Y) : Var(5X + 2) :25 Var(X) :25 x * : +
.) .)
b. Una valiable aleatoria X est definicla por slr densidad J'@):r+l2 el intervalo (0, 1), fuela
"n
de este intervalo f (r):0. Hllar la esperanza matemtica de la variable aleatolia Y : X3.
Soluctn:
E(v) : rs f @) o, : ,t (, **) o,
.lo'
,)ar:1" *1 4l '
)"- ls 2 a)o
u--.40I3
7. Determinar la esperanza y lti ', ' a valiable aleatoria 7 cr.rya fnncin de distlibrrcin
csF() -1-e2t,t>0.
Soluczn: La funcin de deusidad es:,/(/) : F'(t):2"-2t, > 0; y 0, caso contrrrio.
Calculemos Ia esperarrzn:
fx
tr(x) : /.oo
2re-2''d,r.
.l_,"r.tb)nt: .lo
Irrtcgrando por partes, ponicriclo rL: :1. rl,u : e-2'cl,r; pol lo tanto: ilu,: dn, Lu : _
'r"-r',
: -rc2 l-*1 l'n
2'
l'*
.lo r".,,rh
ln'2.1u "-r."rl,
,"-" l* 1 __r,.1-
z io-4c l.
;'^'^
Entonces,
E(X): , lo*
,"-'2'rL*:r(i) - I
Necesitamos el clculo cle E(X2):
var(X) : E (X,)
1 tt/1\2 1
- (tr(.Y))2
o \ol
\o /
"
S.S. La varianza
Etr ttlt slll)crlriercacro se ro,,.1,. ,,-.-
ro7
-.
crescrir,e ; ;;;;'.,". .:ff:fii:::;1ij,."":J1,*,:,i:"..T;"^,jj,f,:i,,ililTjc arcaroria quc
.f(r):[;*'sjo<'<5o;
I o, caso contrario.
a) ;.Crrl es Ia cnt jdact
de calnc quc se esr)
l)el'a vender diariamente
llin, halle ia desviaci" en el supermercaclo?
Tam_
"r*0""..oq
b) Si la ganancia en el producto
se expresa
-r"4vvu por
ganancia esperada. vvL la ecuacin
r'L ccuacln C:
).
a) Calcularemos l
de la variable aleatoria
efectra ,ro"r.lr,lifjlllza como er indicador
de las ventas que
",
E(x): ['o
to " Gil o*: # fo,o
,, o,
,hl#]; :3333
As' el supernrercatro
espe.ara
-- vender
Calcrrlernos E (X2): 'v'uL 33.33 kg diarios cre car'e.
La r.ar.iarrza es
-\v'/ :
E(c) n(2.-, \
"rl*o" *'o):
.r
P,_1
Propiedad 1. Va (0,1), , It,
41,-
l.;:0 | - (L
I (1 -P)A
po,:-7, h:I,'2,..,;
L- 1.' P (0,1).
: io-,k:i(-#) (r -P)k
E(x)
A=1 A:1 '
: l-r) i,'- :- (*)
\ I'p)3' ir, -or*
\nP/7_o
p)k
: L-p
Dttono
: ct + q2 + q3 +... - Dnr
k:1 k:r
: /. r,\\
'P)
3.6. Funcin generadora de rnornentos 109
Los momentos de una variable aleatoria son nmelos que representan algunas calactersticas de la
jistribucin de probabilidad asociada. Bajo ciertas condiciones el conjunto de momentos determinan
ie manera nica a la ley de probabilidad.
Definicin (Mornentos) Sea X una variable aleatoria y sea r un nmero natural. Cuando existe,
el ntrnero pr:E (Xk) es el k-simo momento de X.
f ntonces, tenemos que Ia media p es el primer momento de la variable aleatoria; es decir, F: lJt.
-isociada a cada variable aleatoria podemos encontrar una funcin que permite calcular sus rnomentos.
fsta funcin tiene Ia propiedad de que, al igual que la funcin de distribucin, caracteriza de manera
:rica a la ley de probabilidad de la que proviene
M(t):E("t"),
iefinida para valores reales de tales que la esperanza existe.
- . funcin generadora de momentos se utiliza tanto para variables aleatorias discretas como continuas.
alrt o
Ejemplos
x I -4 I 6 I 10
p 102 | 0.3 | 0.5
Solucin: Resulta que
I[(t) : E("t"):|pr"tr
k
: 0.2 e-at * 0,3 e6 f 0.5 e1o
Hallar la funcin generadora de momentos de una variable aleatoria cuya funcin de densidad es
rI si
r, ' I
f\L;): \ -.
4 -1<r(3;
[ 0. caso cont rario.
,et' 4
r- siguiente resu.ltado nos indica crno se pueden obtener los momentos de cualquier orden con el
:-:rpleo de la f.g.m.
110 Captulo 3. Variables Aleatorias, Esperanza y Varianza
Teorema. Sea X con furrcin generaclora de rnomentos,4f (rl), con derivadas continuas dc cualquier
orden; entonces,
.,_
I-Ik-L qlxu):
j-nt,,,l
tr,,,=o
\-'/- dj",
Es decir, el k-simo momento de una variable aleatoria se calcula como la derivacla de orden k de la
f.g.-., evaluada en cero.
Observacin. Se tiene que E(X) : Ft y Var(X) : Fz - F?.
Ejemplos
x I -4 I 6 I r0
p10.2 10.3 10.5
Soluc'in: Antes calculamos que il{() : 0.2 e-4t * 0.3 e6 * 0.5 e10; por tanto,
.1
: _0.8e-at * 1.8e6 * belo
aual
t,)
o.-
AI ft) : 3.2e-at * 10.8e6 f 50e10.
dt2
Entonces,
ltt :
ftnup: -0.8e-a(o) + 1.8"u(o) - 5"10(0) : 6,
(l
I@):l q,'si -1<r(3;
[ 0,
conrrario. caso
Por tanto,
!u,rt (3t-1)e3*(1-t)e-r
dt t2
+t,
(st' - 6t + 2) e3t - - l:
.-)
',:r
#,u,
3,7. Ejercicios 111
2
Puesto que 1,1() no est definida para l, : 0. para hallar M (0) aplicaremos la
*r*r|, ,ljz
regla de L'Hospital; entonces,
Por lo tanto,
Var(X) : pz- Lr?: 56.4
243
3.7. Ejercicios
l. Halle la esperanza y la varianza de las variables aleatorias discretas definidas por
xl-0.7t10.24 10.61 Yt 2 t 4 t 5 I 6
pl 0.2 10.5 10.3 p 10.3 10.1 10.2 10.4
Se escoge aleatoriamente un nmero de conjunto $ : {-1;0; 1}. Sea X el nmero escogido.
Encuentre su valor esperado, La varianza y la desviacin estndar de X.
Existe una variable aleatoria X que cumple qLre E(X - 2) :8 y que E ((X + 1)2) : 120?
a) Jx\r): r;
I b) fy(r):lrl. c)fx@):t-lzl. d) f x@) :t '.
Encuentre la esperanza y desviacin estndal de las variables aleatorias definidas mediante las
leyes:
f 0. si r ( l;
.) r(,) :{ +, si 1(.c14;
t,I sir>4.
t12 Captulo 3, Variables Aleatoras, Esperattza y Varianza
(o sir!1;
l:lr): {L2-r'
,
t2 - si11.r.<2;
b)
I t. sir)2.
c) r,-..:l I Zr. si z e (0. l):
/(rt o. sir((0, 1).
d) ' ))' * Br - l2). si r (-5. -3):
..\ < - *frt
f,(t:):
--
I O, caso contrario.
(t. si re [1,2]:
e) f(r):1 '
I o, si zl11.2l.
(Determine primero el valor de c.)
8 Una variable aleatoria X toma los valores 4, 6 y o con probabilidades Pr(X - 4) : 0.5, Pr(X :
6) : 0.3 y Pr(X : a) : p. Si se sabe que 1a esperanza de X es igual a 6, halle los valores de p
ya.
q Halle la varianza de una variable aleatoria Z q:ue solo puede tomar dos valores, el uno el doble
del otro, con la misma probabilidad, si se sabe que E(Z) :0.9.
10 I-a variable aleatoria discreta X tiene solamente dos posibles valores: rr y fr2, adems 11 1 12.
La probabilidad de que X tome el valor 11 es igual a 0.2. Halle Ia ley de distribucin de X.
conociendo la esperanza E(X) :2.6 y la desviacin estndar o : 0.8.
11. Una variable aleatoria X puede tomar tres valorest r,1 : -I, 12:0 y 13:1. Si se conocen las
esperanzas matemticas E(X) :0.1y E(X') :0.8, enci-r.entre las probabilidades Pt,Pz yp, de
los I'alores rt, 12 y 13) respectivamente.
12. La variable aleatolia X tiene tnicamente tres posibles'u.alores rr:1,:x2 y x3 (rt < rz <'J4).
Las probabilidades de que X torne los valores rr y 12 son respectivamente iguales a 0.3 ,'
A.2. Determine la ley de distribucin de X, conociendo Ia esperanza E(X) :2.2 y la varianza
Var(X) :0.76.
i3. La variable aleatoria X tiene funcin d e distribucin
0, parar12l
F(r) : arlb, para21r14;
1, parar>4.
a) I{alle e1 valor de las constantes cr y b;
74. Suponga que se escoge un nrmero real X en el intervato [2; 10] con urra funcin de densidad de
Ia forma f (r) : Cz, donde C es una constante.
a) Halle el valor de C;
b) Calcule Pr(D), donde 1 : 13;71;
c) Encuentre Pr(X > 5), Pr(X < 7) y Pr(X2 - 72X * 35 > 0):
d) Encuentre la espera\za y la varianza de X.
3.7. 4jercicios 113
15. Uu cstudiante rinde ttnil plr-reba consisterrte en 2 probleuras de eleccin mrltiple. La primcra ticrrc
3 posiblcs resprtest:rs y la scgurrda 5. El estrrcliante cscoge las 2 r'espuestas al rzrr. Encuentl-e:
6 tlna organizac:n benfica realiza una rifa para conseguir fondos. cn la que sc vendieron 10000
boletos, a 4 dlales cada uno. E1 prerrio es un antomvil de 12 000 dlares. Si un ciudadarro
compra 2 boletos, cul es la ganancia esperada del comprador de los boletos?
IJna persona participa en un concurso de la televisin. Le hacen una pregunta con 5 respuestas
(solo una es verdadera) si acierta, gana 10 000. Si falla le vuelven hacer otra pregunta con tres
posibles respuestas de las cuales solo una es verdadera. Si acierta, gana 1000 y si falla se le
vuelve hacer otra pregunta con solo dos respuestas si acierta, entonces no gana nada y si falla
pierde 500. El juego termina cuando la persona acierta c despus de fallar la tercera pregunta.
Se asegura un vehculo de 50 000 dlares por su valor total, pagando una plima de C. Si la
probabilidad de robo en un ao es de 0.02, cul es el valor de la prima que debe cobrar la
compaa de seguros, si espera ganar 200 dlares?
9 Si Roberto termina sus estudios en Junio, podr disfrutar de una beca para poder realizar un
curso de especializacin con todos los gastos pagados. Si aprueba en Septiembre, la beca slo le
cubrir el 40% de los gastos. Si no consigue aprobar, tambin realizar el curso pero abonando
50000 dlares, que es 1o que cuesta. Roberto sabe que la probabilidad de aprobar en Junio es
slo de un 10%, mientras que la de aprobar en Septiembre es de:un 4ATa.
:0, Una agencia que renta autos tiene disponibles 4 carros todo terreno, para alquilarlos. El precio
de alquiler de cada carro es 60 dlares diarios. En un estudio de mercado el propietario ha
determinado el siguiente modelo probabilstico sobre la demanda de estos autos:
Demanda Probabilidad
0 0.05
1 0.10
2 0.20
c
r) 0.25
4 0.20
5 0.15
() 0.05
Adems, en el mismo estudio ha encontrado que sus gastos diarios son: 20 dlares por alquiler
del local y 15 por pago a ul empleado.
lL4 Captulo 3. Variables Alcatarias, Esperanza y Vatiai;za
a) Crlcttltt r:l tLtrrtelo csp<:r'aclo dc carlc-'s tocl,r tellerro <re la agencia alqr-',il.rrri urr rla (;Lralquiera;
l,) CalcrLl<-r ltr girrrnirciir clirli csperad a:
,') Caicule Ia <l:sviacin cstinclal cle lii gzrrranr;iir
'21 Urr poltafolio r-lc invcrsi<irr sig-ue r:l .,iguicltc: (iselrr1ir lrlolrabilstic:o:
22.Uncrculoderaclio1eszonificaclcen10"rculoscorclrtricosd.eradios "' 10
10' 10"
lanza un dardo sobre el crculo, si stc cac en la zona ccmprerdida ertre los cr'culos de radios
i^"lJellar:zad.organa10-idlalcs, i:0,l,...,g.SeaXlacantidaddedineroganaclo,
i0 10
a) Halle Ia ley de la variable aleatolia X;
b) Calcule su esperanza y su varianza.
23. EI espesor del recubrimiento de unos cables tiene funcirr de densidud ry, corr 100 l1rn <:r <
'r'
2ao tm.
a) Determirre la media y la varianza del espesor del recublimiento;
b) Si el costo del recubrimiento es de 0.5 dlares por micrmetro de espesor, ,cul es el costo
medio por recubrir los cables?
24. Un supermercado tiene una dcmanda dialia variable X de la cantrdad de caile que vende, de
tal manera que X (medida en cientos de krlogramos) tiene una funcrn cie densidad
(
f@):1oq1r'. sio( r<4'
|. 0, caso contrario.
26. El tiempo de uso diario de la red Internet en Lrna oficina tiene p,-r1 :r,;r-cin cie densidad (medida
en horas) a
( gr2(g - ,\
f("):{'-r-' sio((s:
0, [ carco conira:- .
3.7. Ejercicios r-15
a) Calcrrle cl vrlot eslrclaclo y la virriarrza rlcl tieurpo <.lialio clc rlso de lr lecl Intelnel,.
lt) El tictlitct cle ttso ilc Irrtcrrrcl' crlcsta 2 cllares pol hora. CLlcule el vr,lor esperiiclo v lzl
clesviat:iu estrrdat ck:l costr scur-nri (cn 5 clas laLorablcs) por el citilrio rrso.
La lcy cle 1tloltabiliclacl rlue rlesclibc la clistarrr'lia (cn inctros) a Ia. <-re un atletr lanza la,jabirlina
CS
a) Halle la probairiliclrd de qLre rula jal;alir'a lanzidr llcgue a nna distrncia mayor quc 60 m;
b) Determinc el valor esperado dc Ia distancia a la que llr:ga la jabalina;
c) Halle Ia varianza y la desviacin estndar de la distancia cubielta por la jabalina.
:3 Dcmuestre quc la ebperanza y la valianza de Ia variable aleatoria discreta definida por
Calcule:
Halle la esperanza matemtica y la varianzadela variable aleatoria Sn: Xrt Xz*... * Xr.
116 Captulo 3. Variables Aleatorias, Esperanza y Varianza
33. Las variablcs aleatolias X1 , X2, . .. , Xrr,Y,Yz,. . . ,Y,, son independicntes. Pongamos
E(X,) : a, Var(X) : s2
35. Sean XyYdos variables aleatorias independientes e idnticamente distribuidas con f.g.-. M(t)
Demuestre qtte Myy(t): Mx(t)llv(t) y qlue My-Y(t): Mx(t)M\'(-t)-
36. sea X con f.g.m. Mx(t), y sean a y b dos constantes. Demuestre que Moy6(t):"'btwx(ot).
Captulo 4
:r este captulo se presentan, en detalle, algunos tipos de leyes que siguen las variables aleatorias, que
:f,arecen frecuentemente en problemas prcticos y cuyas propiedades deben ser conocidas.
-{ una variable aleatoria X que sigue una ley L de parmetros (pr,pz) Ia notaremos como X - L(pt,pz).
E(X) : n*7
: :U Vaflanza
^2 -'t
VarlX)
t2
-
' equiprobabilidad es la forma ms obvia de asignar probabilidades dentro de un fenmeno aleato-
:-,- cuyo comportarniento es desconocido. Esta ley aparece en los jr.regos de azar en los que todos
r,s jugadores tienen iguales posibilidades; adems, esta ley es la bsica en la simulacin de eventos
u,=atorios mediante comput adora.
Eemplos
717
118 Captulo 4. Principales D istr ibttciones de P rob abilidad
Sol,tt,c'i,n: Sc tir:rre que ? - B )' sr: asigrtzr lir probabilitirl Pt (X : i),8: 1; ,,trt,rt,""r,
(l
r-F1 8+1
E(,Y)
2
,2
,
Var(X) :
n,2 -I 64-r 27
12 1')
2. Una mquina registra, en rninutos conipletos, la di.felencia de tiernpo en e1 paso cic crrrriones
por cierto lugar de la carretera. Se sabe clue ia diferencia mxima puede ser 9 rninutos. Si se
asrlme qne los arril-ros son aleatolios, calculal cl tiempo qlle se es1;erara exista errtlc dos rniJos
consecutivos, su varianza y desviacin estndar.
Soluci,n: La variable aleatoria puede tomar los valores 7,2, ..., 9, que suponemos tiene dis-
tribucin uniforme, por Io tanto,
E(x) : '+]:nrt:5min,
22
Var(X) : +: \/:6.62min2,
o : J6.6? : 2.58 min.
3. Un reloj est descompuesto y suena) aleatoriamente, a la hora en punto; es decir, puede sonar
a Ia una, a las dos, . .., a las doce; dando ese mismo nmero de campanadas. Determinar la
esperanza y varianza de la varirble aleatoria que describe el nrmero de campanadas que se habr
de esperar que d el relo.j.
Solttcin: Encontremos la esperanza y la varianza, considerando n: 12:
n2 -r L44-I
Var(X) : 11.92 h2
72 72
Nos planteamos el siguiente problema: en una urna se tienen ly' bolas, n de las cuales son rojas y las
N -n restantes negras, de las cuales se extraen al azar r bolas; investigaremos la probabilidad de qne
el grupo eiegido contenga exactamente k bolas rojas. Aqu, k puecle ser cualquier entero entrc cclo l
TL A T.
l,a probabilidad es
Pr'(X : : Cf,C'f!,,
/,')
ci
Si consideramos l proporcin de irolas rojas en la composicin incial de bolas contenidas en la urna
n,
p : I y q : I- p, la frmula de Ia probabilidad puede expresalse colno
' N"
Ck,,,Ch-"*
Pr(X: tt): ff, A:0. 1,...,mn{Np,r},
por Io que la probabilidad p de obtener una bola roja se puede introducir como un parrnetro que
define la ley.
4.2. Distribucin hipergeorntrica 119
-\ ttrta variable rlctotir X c-rer sigue una ley hipelgeorntlica cle lral,rnetlos (Iy',n,r) se la uota
.rrcr li;rItl c tl(A'. r.r').
Lir csp<rlauza cs
'.' la rrarianza
vartx\:rL(l_
,u\-, i,
/A/-r\ : rr(,
" ' (,^,, /l/-r\
/ \' 1,,) _ r) -ttt (v _ r/
(,n-n)!(N-r)!
Po: /!(/ -n-r)l
n'll-k r-17-k
Pk : Pn-r f _n_r+k, k : I,2,.. .,T.
Ejemplos
-. En ttn grupo de 12 estudiantes 8 son sobresalientes. Por Iista se escogieron 9 al azar. a) Cul es
la probabilidad de que entre los estudiantes seleccionados hayan 5 sobresalientes?; b) Cuntos
estudiantes sobresalientes se espera encontrar entre los seleccionados?
SoIucin:
8! 4l
Pr(Z :5) :
elqi : 5!3t4CI 14
c?, 12t - 55
9!3!
b) Calctrlemos la esperanza de Z:
E(Z): rn 9x8
' 12
Se esperara encontrar 6 sobresalientes.
Drane, J. W., Cao, S., lVang, L. y Postelnicu, T. (1993), "Limiting Forms of Probability \,Iass Functions via Recur-
-:- re Formulas," T he American Statist'icia'n, 47, 269-27 4.
L20 Captulo 4. Pncipales Distribuciones de Probabildad
En trn contlol de calidacl inch.rstlirl se tonr un lote dc 10 lriezas l)lra nna irrsirelcin. ELr el lotc
Luy 8 piczas correctrs. Sr: tottiart al azat2 piezas. Formrr lil lcy clc clistlil.,rrcirin clel nrrnero clc
picz:rs corlcctas cntrc 1rs escogi<lir"s .y calcrrltrl su esl)eranz1.
Scht,c'i'r: La variable l'(nirmcro
aleatorir. c-le piezas correctas entre las escogiclas) tiene los
siguientes r,lores: zt : 0, L2:7, :t:3 : ).
Ernplearerrios la ley hipergeomtlica con A:10 (rrrmero total cle piezas), : B (nrrncro total
de piezas correcta^s) y r :2 (tarnairo de Ia muestra); es decir, Y - ft(10,8,2), obteniendo:
C3C3
Pr'()/ : 0) : 1
- 10x9 -
1
c?n 4,)
7x2
Pr(Y: 1) : cc 8x2 16
c?o 45 45
Bx7
Pr()':2):W Ix2 28
45 45
w Yl o | 1 | 2
La esperanza es
E(Y) :6 116 28
+'2x-:1.6.
45
-+1x- 45 45
Generalmente, se define la variable aleatoria que sigue una ley de Bernoulli as:
La ley de probabilidad es
La ley de Belnoulli desempea un papel fundamental en el anlisis de fenmenos en los cuales solo se
tienen dos resultados mutuamente excluyentes, como es el caso de muchas preguntas en todo tipo de
encuestas o Ia cleterminacin del sexo de los recin nacidos.
4.3. Distribuciones de Bernoulli y binomial L2L
Ejernplos
: -pongamos que se reah.za una sucesin de n pruebas de Bernoulli e interesa conocer el nmero de
-ritos>> obtenidos, al margen del orden en que ellos se presenten. EI nirmero de xitos puede ser 0,
'- 2'
"', n'
:- ilama binomial a la ley de distribucin de una variable aleatoria discreta X
que describe el nmero
' ie xitos en una sucesin de n pruebas de Bernoulli independientes, en cada una de las cuales la
-:.,babilidad de xito es igual a p.
-'t-';ley de distribucin binomial fue descubierta por James Bernoulli, quien Ia dej escrita en su obra
Conjectandi,, ptblicada en 1713, despus de su muerte ocurrida en 1705.
,iistribucin
--'-:ra binomial tiene amplia aplicacin en Ia teora de mr.restreo cuando se puede contestar
r pregunta rnicamente con dos opciones (por ejemplo SI-NO).
; -lculo de ias probabilidades puede ser un proceso difcil porque los factoriales en los coeficientes
--- -,rriales crecen muy rpido, mientras que las potencias de p y q decrecen rpidamente. Por estas
:-r-)nes se utiliza la siguiente frmula recursiva para su clculo2:
Po : (l-p)"
pk :
n-._l-l;
pk,I--------;-
p
ff : I. Z)... jll.
K l--,
I-P
-)rane, J. U/. y otros (1994), op. cit
122 Captulo 4. Principales Distribuciones de Probabilidad
Ejemplos
1. Su>ongamos que en r,rna poblacin existen igual nirmero cle holnbres y de rnqjeres y consideremos
aquellas familias que tienen 4 hi.jos.
a) Formar Ia ley de Ia variable aleatoria que describe el nrmero de hijos varones en dichas
familias.
b) Calcular la probabilidad de que en una de estas familias haya mis de un hijo varn.
c) Cuntos hijos varones se espera que haya en una familia que tiene 4 hijos?
1
Soluci,n: )emos que p :
Sat y el nmero total de hijos es n : 4. Entonces, Ia variable
t
aleatoria X: <<Nmero de hijos varones>>, sigue una ley binomial de parmetros (4,|f 2); o sea,
X - Bin(4,t12).
Pr(x: o) : c3 (;)'(;)'-': *
o Si hay un varn, k: I:
Pr(x:1) : cl (;)'(;)^-': i
o Si hay dos varones, k:2:
n-'
Pr(X :2) : (;) :z
"1(;)'
o Si hay tres varones, /c : 3:
Pr(X:3) : cl (;)'(;)'-': i
o Si hay cuatro varones) le:4:
Un dispositivo esti cornpuesto 1>or tres elementos que traba.jan independientemente. La pro-
labiliclad cle frlla de crda elemento en Lrrr da es igual a 0.1. Formar la ley de distribucin del
rrmero de elementos qr-re fallan en r-ru da.
Solucirt: La variable aieatoria X (<nirmero de elernentos que fallan>>) puede tomar los siguientes
valoles:
z1 : 0 (ningn elemento fall), 12: I (fall un solo elemento), 13 : 2 (fallaron dos elementos),
fr4:3 (fallaron tres elementos).
Las probabilidades de fallo de cada uno de los elementos son iguales entre si, entonces es aplicable
la ley binomial; por lo tanto, X - Bin(3,0.1):
pt : Pr(X : 0) : c3(o.t)o(0.9)' : 1. (0.1)0. (0.9)' :0.729,
pz : Pr(x : 1) : cl(o.t)t(0.9)' : 3.0.1. (0.9)2 :0.243,
ps : Pr(x : 2) : c3(o.t)'(0.9)t : 3. (0.1)2 .0.9 : 0.027,
p+ : Pr(X : 3) : c3(0.l)t(0.9)o : 1. (0.1)3. (0.9)0 :0.001.
Bn resumen,
3. Un examen consta de ocho preguntas de eleccin mltiple, cada una de ellas ofrece cinco al-
ternativas, de las cuales solo una es correcta. Para aprobar ei examen es necesario contestar
correctamente al menos tres preguntas. Si un estudiante se propone responder a las preguntas
al azar.
Lo que nos indica que es muy difcil que adivine todas las respuestas.
b) Para aprobar se debe contestar correctamente al menos tres preguntas, por lo tanto Z > 3-
Pr(Z>3): I-P(Z<3)
: r - lPr(Z : 0) * Pr(Z : I) +Pr(Z :2))
: 1 - c3(0.2)o(o.e)t - cA(0.2)1(0.8)' - c!10.2210.s6
: 0.20308.
Una agencia de turismo ofrece viajes a la amazona. La utilidad mnima que le reporta uno
de estos viajes es 6 dlares por cliente. Ademiis, ofrece dos planes especiales, A y B. Por un
plan de tipo A, obtiene una ganancia adicional de B dlares y por un plan de tipo B, 13 dlares.
Adems, se sabe que el 60% de los clientes que contratan planes especiales prefieren uno de
tipo A. Si una semana, la agencia vendi 25 viajes a la amazona, 20 de los cuales no fueron
especiales, cul es la ganancia esperada?
Solucin: La agencia vendi 25 planes: 20 normales y 5 especiales.
f24 Captulo 4. Principales Distribuciones de Probabilidad
Consideremos una secuencia de pruebas de Bernoulli, con probabilidad de xito p, pero en lugar de
contar el nmero de xitos, nos interesa conocer el nmero de intentos hasta obtener el primer xito.
Una sucesin de pruebas de este tipo se dice que forman un erperimento geomtrico.
Una variable aleatoria discreta X que puede tomar un nmero infinito de valores I,2, . .., se dice que
sigue una ley de distribucin geomtrica de parmetro p (0 < p < 1), si la probabilidad de que X
tome el valor k es
Pr(X : k) : p(I - dk-t, k: I,2,. . .
A esta variable aleatoria se la nota como X- A(p). Su esperanza y su varanza son iguales a
E(X) : p
1
Var(X) :
L-p
p2
Ejernplos
1. Si la probabilidad de que un estudiante pase una prueba de ingreso a una universidad es 0.25.
cul es la probabilidad de que el estudiante pase la prueba en el cuarto intento?
Soluc'in: En nuestro caso p : 0.25 y el nmero de intentos es k : 4, por lo que
Pr(X:4) : p(L-p)a-1
: 0.25(1 - 0.25)3 : 0.105.
2. En una promocin una marca de papas fritas incluye, en cada una de las fr"rndas, una de las
figuras de los tres chiflados. Si un comprador cree que hay igual nmero de figuras cle cada uno
de los personajes en Ia promocin, cuntas fundas ha de esperar comprar para obtener las tres
figuras?
Solu"ci;n: En Ia primera compra) siempre obtiene una figura que no se tena, por Io tanto
E(X1) :1.
Para la segunda compra se tiene una probabiiidad de p2: I O" .orrr"*uir rrna figura nueva; as.
I
Un) r'cz (luo sc ticrrcrr rlos figruirs, la Prolrabilirlad <lc crLr:(rrtr'll la figrrtzr clrc fallrr es p.l : -\cl
,)
r)
As,seeSI)erarea]izar.altncrios6cotriprasc1elproc1ttcto])araobte1leI'lacoIeccirrcclrtlpleta.<
-\hora, gclrcr'rlicernos la iclea de lr lev geomtrica )/ nos intcresa cl nrrnero de pnrebtrs cle Bemoulli
:recesarils hast obtencl exactanlente r' xitos.
-ua variable aleatoria cliscreta X que puede tomar nn nrmero infinito de valores r, r]_7,r'12,...,
=: dice que sigue una ley de distribucin binomial ncgativa de parmetros (r, p) (r > 1,0<p<1),si
-r probabilidad de que X tome el valor k es
Pr(X : x) : C'r--tpr'(t - rn-t, k : r','t" + l)r *2,...
:l parmetro r es el nirmero de xitos que se desea obtener y r es la probabilidad de obtener un xito.
-\ esta variable aleatoria se la nota como X - BN(r,p). Su esperanza y su varianza son iguales a
E(X) : L
p
l-n
Var(X) : ,;
\ la ley cle distlibucin l;inornial negativtr tamJrin se le llama distr"ibttczn d,e Pa,sco,l y tierre las nrisrnas
.:licaciones que la ley georntlica.
Ejemplo. Una mquina. que est claacla) ellvasa latrs cle collserva de una en una y de rnauela
--,lependiente. Se considera que el 5% de lo envasado resulta defectuoso. Si Ia mquina se detiene
::lenas produce el tercer defectuoso:
: 'l.uci'n: Definimos la variable aleatoria X: <<nmero <le latas producidas hasta que hayan 3 clefec-
--rsas>>; X BN(3,0.05).
-
a) Calculemos la esperrnza de X:
E(X) :l:,1
p 0.05 --Or-t.
c) Quc ningunl lata ploducidr fuc bLrcna, significa qr.re las 3 plirueras lLts fueron defectuosas; es
decir, A; : 3.
Pr(X : 3) : C3_1(0.05)3(1 - 0.OS;:-;t : 0.000125.
t26 Captulo 4. Principales Distribuciones de P robabilidad
Uria r'rriable lertoria <liscret X quc puedc tonrrr rin nrrneLo infinito de valor.<ts 0, 1, 2, .,., sc dice
quc sigue una ley cle Poisson de pirrmetro ) () > 0), si la probabilidd cle qrre X tome el r,lor k es
)' sl':
Pr(X: :
k) "-
k! , k:0,r,2,...
A esta variable aleatoria se Ia nota como X - P(^).
Su esperanza y su varianza son, respectivamente, iguales a
E(x)
Var(X) ^,
^.
La distribucin de Poisson se aplica a sucesos que se presentan en el tiempo o en el espacio, tales como
nmero de accidentes de trfico, nmero de llamadas telefnicas a una central, nmero de goles que
marca un equipo en un partido, nmero de bacterias en una placa, entre otros.
Para la ley de distribucin de Poisson tambin existe una frmula de recurrencia para el clculo de
las probabilidades3, dada por
PO
:e -,\
Pt : P*-t x ^ k: L,2,. . .
k'
Ejemplos
e-3:12
Pr(X:2):;:0.224.
3Drane,
J. W. y otros (1994), op. cit
D istribucin de Poisson t27
: e-330 e-331
0! 1!
:i t-(
'rii,i I--;;; f :li; "J'";f_:^'].: "''"
1r 2! * o " i:o'352'
"
El promedio de llamadas que pasan por una central telefnica en un minuto es igual a dos.
Hallar la probabilidad de que en tres minutos se hagan: a) 4 llamadas; b) menos de 4 llamadas;
c) al menos 4llamadas.
Solucin: En este caso es necesario utilizar la segunda forma de la ley de Poisson con )- 2y
+
L
D.
.
--
Pr(X: a) ^ll"-
a) La probabilidad de que en 3 minutos se hagan 4 llamadas es
3)n _ .-66a
Pr(X:4) : "-z's(2.
41 24
:0.1339.
Lr=
: 0.1512.
c) Los eventos <<se hicieron menos de 4 llamadas> y <<se hicieron al menos 4 llamadas>> son
complementarios; por eso, su probabilidad es:
Un libro se edita con un tiraje de 1000 ejemplares. La probabilidad de que un libro est en-
cuadernado incorrectamente es igual a 0.01. Hallar la probabilidad de que el tiraje contenga
exactamente cinco libros defectuosos.
Solu,cin: Segn los datos del probleman:1000, p:0.01 y k:5. El nrmero z es grande yp
pequeo, por lo que utilizaremos la distribucin de Poisson. Estimamos ),: np: 1000 x 0.01 :
10.
La probabilidad buscada es
0.000045 . 105
Pr(X:5) : "-10195
< : : 0.0375.
El gerente de una fbrica planea comprar una mquina r.ueva de entre dos tipos A y B. Por
cada da de funcionarniento, el nrmero de reparaciones X que necesita Ia mquina A es una
variable aleatoria de Poisson cuya media es 0.1, siendo el tiempo de funcionamiento diario
(en horas). El nmero de reparaciones diarias Y de la mquina B es una variable aleatoria de
Poisson con media 0.12t. El costo diario de operacin de A es C(t): 10 +30X2 y para B
128 Capitttlo 4. Principales Distribtrciones de Probabilidad
as Cp() : + 301'2. 'Cul cle las rni'rcluirra,s clr cl rnerror (:osto esPclackr, si iur clr clr: tralrtr.icr
S
corrsisl c crL: a) 10 lror'is'/ 1r) 20 Lolas'l
Sol,u,t:irit,: El costo cspr:raclo pzrlrL;t os
Igualrnente,
4.6. Ejercicios
Ley uniforme discreta
I IJn leloj automtico registra la hora a la cual llegan los empleados de una oficinzr, err troras 1'
minutos completos. Una persona puede atrasarse irasta 59 minutos luego de la hora prefijada
para entrar, caso contrario se le corrsidera corno falta. Por cada minuto de rtlaso se le colra
trua multa de 50 centavos. Si los tiernpos de atraso se consideran aleatorios:
2. Pala el sen'icio de transporte entre dos ciudades hay 10 buses, cle los cuales 5 son de tiPo normai
(costo clel ptrsa.le 2 dlares) y 5 sou clc tipo r:spocial (costo clel pasa.je 3 dlales). Una pclsorra
tietre que rir.iar etrtre las dos ciudades (ida y vuelta) durante los 5 das la.borables clc Ir senranr.
y prr'r tLrutsroltalse tonta el primcr lms c-re apalece en esr mtl) sin difelencir' el tilto; .cntinto
(:)Spelzlli gastar esta lrelsona en la semrua?
li.
'
Eu ttna escuela prirnaria se registr el nrimero de palabras por minuto que lcan los estucliantes,
cricontr'irrclose qtle lean r-rrr rnnirno de B0 palablasi y Lrrr mximo dc 139. Ba.jo la suposicin cle <rc
la variable aleatoria clrte clcsclibe el nrrnero rlc palabrtrs lec,lls esti uuiformcmente clistribuicla.
a) Halle la probabilidad de qlle un estudiante, seleccionado al azar', 1ea l menos 100 paltrbras;
b) Determine el nrinero de palabras qlre se esperar'a lea nn estudiante selcccionaclo al azlr..
Sea X una varia,trle aleatoria que sigue una ley uniforne sobre {-1,0,1}. Calcule: a) E (Xa)
para k : I,2,... ; b) Var (X*)
Ley hipergeomtrica
Una variable aleatoria X tiene distribucin hipergeomtrcaH(7,4,5). Calcule:
a) Pr(X:3);
b) la esperanzartllzando la definicin y verifquela empleando la frmula de E(X);
c) la varianza de X.
En una lnea de control de calidad se revisan 10 artculos, determinndose que hay 3 que no
cumplen con las especificaciones. Si se escogen al azar dos artculos, identifique los parmetros
de la ley y halle la esperanza de la variable aleatoria X, que describe el nmero de piezas correctas
entre las dos escogidas.
Una empresa renta autos, a los que no les da el mantenimiento clebido, por lo que algunos
funcionan mal. IJn da tiene disponibles B autos para ser rentados, de los cuales 3 funcionan
mal. Ese da se rentaron 4 autos. Calcule la probabilidad de que:
a) ningn cliente haya recibido un auto que funcione mal;
b) por lo menos un cliente reciba un auto que funcione mal;
c) tres clientes reciban autos que funcionen mal.
Leyes de Bernoulli y binomial
Una variable aleatoria X tiene distribucin binomial Bin(4,0.2). Calcule:
130 Captulo 4. Principales Distribuciones de Probabilidad
t2 Urra rnquinr llena las ca.jas cle palillos de fsforo. En una Jrroporcin del 10 % la rnquina no
llena las cajas por completo. Se toman al azar 25 ca.jas de fsforos, calcule Ia probabilidad de
que no haya ms de dos cajas incompletas.
13 IJna encuesta revela que el 20%o de la poblacin es favorable a un poltico y el lesto es desfavo-
rable. Si se eligenseis personas al azar, se desea saber:
a) Cul es la probabilidad de que sean exactamente 4 radares Ios que descubren al avin?;
b) Cul es la probabilidad de que por lo menos uno lo descubra?;
c) De cuntos radares ha de constar la instalacin para asegurarse en detectar aviones al
menos en un 98 % de las veces?
a) no se observen fallas?;
b) no se observe ms de una falla?
c) Si un avin puede seguir volando si al menos 2 motores continran funcionando, cul es la
probabilidad de que el avin se accidente?
18 Supngase que ia tasa de infeccin de una enfermedad contagiosa es del 25 %. En una oficina
hay 10 personas que se vacunaron contra la enfermedad y ninguna se contagi.
Una compaa petrolera va a perforar 29 pozos, cada uno de ellos tiene una probabilidad de 0.1
de producir petrleo de manera rentable. A la compaa Ie cuesta 100 mil dlares perforar cada
pozo. Un pozo comercial extrae petrleo por un valor de 5 millones de dlares. Calcule:
Una lnea area, habiendo observado que el 5% de las personas que hacen reservacin no se
presentan para el vuelo, vende 100 boletos para un avin que tiene 95 asientos. Cul es Ia
probabilidad de que, el momento del vuelo, haya un asiento disponible para cada pasajero?
tl En un examen se plantean 10 preguntas a las que debe responderse verdadero o falso. Un alumno
-)
aprobar el examen si aI menos 7 respuestas son acertadas. Qu probabilidad de aprobar tiene
un estudiante que responde todo al azar? Y uno que sabe el 30 % de la asignatura?
Leyes georntrica y binornial negativa
Cuando se graba un comercial de televisin, la probabilidad de que un actor recite correctamente
0.3. Cul es la probabilidad que el actor recite correctamente su dilogo
el dilogo de su toma es
en la sexta vez?
-'a. La probabilidad de que un tirador haga blanco en un solo disparo es igual a 0.2. Al tirador se
le entregan cartuchos hasta tanto no yerre el tiro.
En un examen, en el que se realizan preguntas sucesivas, para aprobar hay que contestar correc-
tamente a 10 preguntas. Suponiendo que el alumno sepa el 80 % de las respuestas, cul es la
probabilidad de que apruebe en las 12 primeras preguntas?
t32 Captulo 4- Principales Distribuciones de Probabilidad
29 {Jna marca de refrescos tiene impresas, en cada una de las tapas, una de las fi.guras de los 4
jinetes del apocalipsis, y quien retina la coleccin completa ganar' un premio. Si nn comprador'
cree qlre hay igual ntnero de figulas de cada uno de los pelsona,jes en la promocin, cuntos
refrescos ha de esperal comprar para ganar el premio?
30. Un pjaro de cierta especie come gusanos de una poblacin muy grande. Estos glrsanos pueden
comer) a su vez) de una planta venenosa) de manera que si el pjaro come un gusano envenenado,
deja de comer gusanos ese da. Suponiendo que el 33% de la poblacin de gusanos come de ia
planta venenosa) hallar el nmero medio de gusanos comidos por un pjaro en un da.
31. Un lepidopterista solo est interesado en los ejemplares de una clase de mariposas, que consti-
tuyen el75To de todas las mariposas de la zona. Hallelaprobabilidad de que estapersonatenga
que cazar 8 mariposas de las que no le interesan antes de encontrar:
32. En una fbrica, el departamento de contlol de calidad, revisa los lotes de piezas que entran, de
acuerdo con el siguiente criterio: se van extrayendo piezas sucesivamente y el lote es rechazado
si se encuentra Ia primer pieza defectuosa antes de la vigsima extraccin. Si conocemos que el
2% de piezas son defectuosas, cul es la probabilidad de que un lote sea rechazado?
t.f En una fbrica, se examinan las piezas que salen de una determinada mquina. Supongamos que
si en una hora salen mas de 5 piezas defectuosas, la mquina debe ser recalibrada. Si suponemos
qrre la probabilidad de que una pieza sea defectuosa es 0.2, y es la misma para todas las piezas
fabricadas ; encontrar:
a) Cul es ia probabilidad de que el terccr usuario sea el primero que cierra adecuadamente
el Windows?;
b) Cul es el nmero medio de personas que usan Ia computadora desde el momento en qlle
se enciende hasta que alguien no cierra el programa adecuadamente?
Ley de Poisson
35. Sea Y una variable aleatoria que sigue una distribucin de Poisson de meda ),:2. Calcule:
4.6. Ejercicios 133
16. El prornedio cle llrnaclas clue recibe urra ccntlal telcfrrica cn Lur rninuto es cle 1.5. Halle la
plolrabilidad de que en cuatro rninntos se rec:il;rn:
19. Una fbrica de gaseosas recibi 100 botellas vacas. La probabilidad de que al transportarlas
resulte una botella rota es 0.03. Halle la probabilidad de que Ia fbrica reciba rotas:
Se supone que el nrmero de bacterias por mm3 de agua en un estanque es una variable aleatoria
X con distribucin de Poisson de parmetro ) : 0.5.
a) Cul es la probabilidad de que en 1mm3 de agua del estanque no haya ninguna bacteria?;
b) En 40 tubos de ensayo se toman muestras de agua del estanque (1mm3 de agua en cada
tubo) . ,Qu distribticin sigue la variable Y: <<nmero de tubos de ensayo, entre los 40,
qlre no contienen bacterias>>? Calcule Pr(I' > 20);
c) Si sabemos qlre en un tubo hay bacterias, cul es la probabilidad de que haya menos de
tles?
Urra planta ernbotelladora de refrescos tiene una mquina vieja para llenar botellas. La mquina
produce una ganancia de 100 diares por da de traba.jo; sin embargo, se descompone en promedio
2 r'eces cacla 10 das. Si )' replesentr el nrrnero de descompostur-as clurante el funcionamiento
de la rnquina y es el nrmero de das que traba.j lzr mquina, la ganancia generada por Ia
mqr.rina se expresa por G : 100 -50Y2. Dctermine Ia ganancia esperada en 10 das de trabajo.
<:) , CLtiirr grarrrlc <leltt scl lttrl lrrtt<lstlr alertolia (c:orr lecrrrl,lrrzo) lr,rrir (iri,, i,r lrlrrlr;rlrili,l'1, I ,lr,
rlttc al ltren()s turI l)oISorrr tcrrgl <lll rtrrisrrro sor llrirl()r o igrral t ().1.1i'
44 ]llt tttt lrosrltte rlc c;eclt'o t:l rrru<:ro rk: ir'l>olcs <;orr plirgrr pol lrcclr'cr )' tj(,rlr, rrrr;r <[istr ilrrr i,,rr
c-lr:Poissorr 2(10). Los itlolcs c:ort 1.,lir1r'r. se trrtrn con insccticiclt r urL co:jt() (lo 3 rlcilrr(.: l)()r
t'lol; rrlcrns. clr: urt costcl fijo. por rlso del r:quipo y tr'lir,jl)otte. igual r 50 clrilrr<ts. I{rllr,,'l
vaiol cspcrrclo y la dcsi'itciu estrLclrr'<.lel cost,o total C de firrnigai'5 hectilcirs rlc lrosrlrrr'.
45 Para cl control cle calidacl de discos para corrrplrtadora se errrl)le un dispositivo clcctr'rrico <rrc
cltentr cl nirmelo de bytes defectuosos. Una marca de discos de computadora tierie rrrL plouLcr lio
<1e 0.1 bytes defectlLosos pol disco. Calculc el porcenta.je clc <liscos que:
46 EI nrmero de automviles que llegan a un estacionamiento, que tiene una capacidad de 12 rLrtos.
es una variable aleatoria que sigue r-rna Iey de Poisson, con Lln promedio de 4 pol hora. Si al
inicio del da el estacionamiento est r'aco,
47. Si hay en promedio, un 1 por ciento de zurdos, cul es la probabilidad de tener porlo menos 4
zrirclos entre 200 personas?
48. En una investigacin de mercado se detelmin que el 2 por ciento de Ia pobiacin torna regultrr-
rnente Llna marca de yogurt. Se escogi una muestra de 300 personas, determine Ia prolrabiii<ltrti
de que:
50 En estudios demogrficos sobre matrimonios que tienen algrn tipo de planificacirr farniliar. c,i
nmero X de hijos por matrimonio es igual a 2, salvo ciertas clesviaciones debidas al azar. St'
ha comprobado que, o bien
X:2-(Y+1),
donde Y es nna variable de Bernoulli de parm etro p - 0.3, y sto ocurre con probalriiiclact 'p ::
(pues se cr.rmple en el 50% cie ios matlimonios), o bien es
X:2* Z,
dorrde Z sig:ue una distribucirt de Poisson de parmetro ,\; v esto seguudo ocul'r'e <:ou tarnbi(ll-
con probabilidact p::. Halle:
2
rl,
I b-" si z e 1".]
f(r): 4 =-1.
I o, sirf [o.]
E(x) a* b
2'
Var(X)
(b - ")'
t2
Esta ley es ei anlogo continuo de la distribucin uniforme discreta, que asigna igual probabilidad a
-da resultado de un experimento. Tiene amplia aplicacin en problemas de simulacin estadstica
-,-en fenmenos que presentan regularidad en su aparecimiento, pero qne no es posible usar variabies
-iscretas, como cuando dependen dei tiempo. Tambin, el error originado por el redondeo de un
---imero se describe satisfactoriamente mediante una ley unifbrme en el interv.t" [-:,:l
L 2 2l
Ejemplos
I
,f (r) : I t.sir-2,31;
I 0, sir(l-2,3).
r pr(X - r) : f ,rrd.r:0. porque X es una variable aleatoria continua.
.[,'
o Pr(x < 1.g) : l'" f (r)d.r: dr :0.66.
-m .t L,'!,
o Pr(lxl < 1.5) : Pr(-1.5 < X < 1.5) : ['
rtr[(r)dt
: l'
r'rtr^,
:l : 0.6.
b) Calculemos Pr(X > ):
/'oo ' ,'3 /m
Pr(X >L)
' I
.lt tf"ld.*:l)ar+l
,lt s .ls
o*
lrl3
t-l
3 -t
Lblr.
bntonces.
3- :",corr 1
lo crr l r:
4
b 3.
2. Dos amigos, Roberto v Fernando, deben encontrarse en una parada de bus entre las 9:00 r
10:00 h. Cada uno esperar r-rn mximo de 10 minutos. Cul es la probabilidad cie que rro se
encuentren, si Fernando llegar a las 9:30 en punto?
Soluci.n: La variable aleatoria X que describe el tiempo de llegada de Roberto puede tomar
cualqniervalorentrelas9:00y 10:00hoentre0y60minutos. DemaneraqueX -Ula,b] ysu
f'ncin de densidad es
( :, si o ( < 6o;
/(f) :{ t'0
( 0. caso contrario.
Puesto que Fernando llegar a las 9:30 o a los 30 minutos despus de las 9 y esperar a lo ms
10 minutos, Roberto no se encontrar con Fernando si llega de g:00 a rnenos de 9:20 o si llega
despus de las 9:40.
Entonces, la probabilidad de qne no se encrrentren es
C :200 + l2T2
4.8. Distribucin exponencial r37
a) Ctrlculirr la probabilidrcl de qrre el tiempo de espela sea cle: clos <las o rrts.
b) Calcrrlar el costc esperirclo cle r-rna falla.
Soht,ci,<i'n:
a) trl tiempo de entrega est uniforme distribnido cle trno a ciuco clas, de rnodo que
o":lyb:5:
si1(<5;
f(t):
caso contrario.
As,
Pr(r > ,):
l, f (L)dt: .[r'Lor:1,r - 2):X
b) Por las propiedades de la esperanza, E(C) : 200* I2F,(f\. Calculemos E("2) : Var(?)*
(E("))2:
E(r'): ry.(+)'
(5-1)2-/r+s\':I
: r2-r\, :T
)
As,
E(c) : 2oo + t, (+) : 2oo + t24: r24.
EI costo esperado de una falla es de 324 dlares.
F(r): sir(0
{ ?'- -\r, si r ) 0
"
E(x) : +,
Var(x) : I.\l'
Esta ley sLlrge en problemas de gentica, duracin de aparatos electrnicos o desintegracin lacliactiva
Tambin, es Ia principal en la teora de los procesos ie Markov.
Sea X la variable que cuenta el nmero de eventos que ocurren en el tiempo [0,] , con media ):
entonces,
Sea ? eI tiempo que transcurre hasta que sucede el primer evento de Poisson. El rango de 7 es el
intervalo [0, -[ y su funcin de distribucin es
donde el evento Q > t) indica que el primer evento de Poisson ocurre despus de , o lo que es io
mismo, que no ocurre ningn evento en el intervalo [0,];es decir, (T > t): (X:0).
1. Una variable aleatoria continua Y est distribuida segn una Iey exponencial t(3).
.55
b) Se tiene que
E(v)
11
) 3'
"(Y)
: \;(n:
D ist r ibucin exp onenc ial 139
El tiernpo dut'ante el cual las bateras para telfono cehrlar trabajan en folma efectir,a hasta que
frllan se distribuye sr:gur un modelo expouencial, cr)n Lrn tiempo promcdio de falla cle 500 holas.
a) Calcular la probabilidad de que una bater'a funcione por rns de 600 horas;
b) Si una batera ha trabajado 350 horas, cul es la probabilidad de que trabaje ms de 300
horas adicionaies?
Solucin: Consideremos la variable aleatoria X: <<tiempo que dura Ia batera hasta que falla>>.
E(X) :500: ): X
# r -E(#). Sufuncindedistribucines:
Como
], ".'to'ces
( o, sir<o;
F(r): siu )0,
{,_ "_rlsoo,
a) Calculemos Pr(X > 600):
.fr(t):4"-nt, >0.
a) La probabilidad de que eI primer cliente llegue en los primeros 30 segundos es
,.0.5
Pr(?<0.5)' : | +"-n':0.86b.
.lo
La ley de probabilidad de una variable aleatoria continua X se llama nortnal si s:.:t funcin de densiclad
donde es un valor real cualquiera yd es positivo. A tal variable aleatoria se notar como X
.M(p,o').
La funcin de distribucin correspondiente es la integral
F(r): t.
t/2"" "-(t-2lzo2
Por esto, se dice que es una ley normal de media t y varianza o2. Obviamente o es la desviacil
estndar de X.
Observemos que la funcin de densidad de una variable aleatoria X - Jt(p,o2) es simtrica respect,
a Ia recta r: IL.
Esta ley tiene amplia aplicacin en fsica, economa, ingeniera y biologa, pues como una primer,
aproximacin- se asume que los fenmenos siguen una ley normal. Tambin, juega un papel mr-l-.'
importante en toda Ia teora estadstica ya que, bajo amplias suposiciones, el comportamiento de l-
sumas de magnitudes aleatorias es aproximadamente normal, lo que constituye el Teorema del Lmir-
Central.
El nombre de normal fue aplicado a esta ley de distribucin por F. Galton en 1889, no sin reparos p-l
otros cientficos, porque este nombre puede hacer pensar a las personas que las otras distribuciont:
son) en uno Ll otro sentido, anormales. En el plano anecdtico, remitmonos a lo que se dice en =-
libro de Mosteiler, Rourke y Thornas (1970, p. 226) respecto al nombre de esta ley: <Algunas vecr:
la distribucin normal es llamada gaussiana, especialmente en la ingeniera y la fsica. En Francia =-.
llamada laplaciana. Estos nombres son usados, probablemente, porque la distlibucin fue inventac"
por de Moivre.>>
Un caso importante de esta ley de probabilidad se tiene cuando F:0 y o2 :1, que se denomi-:
4.9. Distribucin norrnal t4t
,tttnol. cstti,tdot'(^/(0. 1)), sus funcicues cle clcusidrci y distlibucicilr sorr
L
7\:'/
^t-.\
,ryi.
n-"'2. ., (-co. rc)
.1. <
o(,) : t'/2
cu,
h [__"
:espcctir,aruente. Obsrvese qlre) en este caso particular, la funcin de densidad se nota mediante cp y
-a ftrncin clc clistribucin por .
Si se ticnc urra variable aleatoria X - N(p,,o2), pr-redeu calcularse los valores de su funcin de dis-
:rilucin lncdiante el empleo de la ley normal estndar aplicando la trausfolmacin
F(r\ :o l" - P\ .
\o /
distribucin de la ley normal estndar no se puede dar como una funcin explcita, sino
li-a funcin de
=tlamente en forma de una integral, por lo que se emplean tablas, como la que se encuentra en la
Tabla 1 del Apndice, para calcular los valores de O(z).
Si X - Jt[(p,o'), se puede dar la siguiente regla emprica que da el rea bajo Ia curva limitada por
-na, dos y tres veces la desviacin estndar (ver Figura 4.4).
Ejemplos
l. La esperanza cle una variable aleatoria X normal es igual a 6 y su varianza es 16. Escribir la
ley cle la variable aleatoria y calcular:
a) Pr(X < 3); b) Pr(X > a); c) Pr(4.5 . * .r)t
d) Encontrar el valor de de manera que se cumpla que Pr(X { ) : 0.9264.
SoLu,c'in: La espelanza es E(X) - lL:6 y la valianza .s 02 :16, por lo que o:4; etttottccs,
r@) :
#r""p ( g#) : #".' (-q#)
L42 Capitulo 4. Principales Distribuciones de Probabilidad
Por otro lado, en la tabla de Ia ley normal, se encuentra que (D(1.45) :0.926q; es decir, se
cumple que
t : t'nu'
Entonces, t: 1.45 x 4 * 6: 11.8. ^u
2. El permetro craneal de los hombres, en una ciudad, es una variable aleatoria de media 60 cm '
desviacin estndar 2 cm.
Por otro lado, eu la tabla de la ley norm,rl estinclar se observa que Q(0.97) : 0.834.
Entonces,
r-60 : 0.97.
De donde, z:61.94cm.
c) Ahora, hallemos z tal que Pr(X < z) :0.352.
z-60 :
-0.38.
En una fbrica de autos un ingeniero est diseando autobuses pequeos. Sabe que la esta[ura
de la poblacin est normalmente distribuida con media 1.70 m y varianza 02, con o :5cm.
Qu altura mnima debern tener los autobuses para que no ms del l% de las personas golpee
su cabeza con la parte superior del autobs?
Solucin: Sea X la variable aleatoria <<estatura de las personas>, X - N(t.70, (0.05)2). De-
nominemos h ala altura mnima para que la probabilidad de que una persona golpee su cabeza
con el techo del autobs sea del LTo; es decir,
Pr(X>h) : 0.01
1-oln;=t:to)
0.05
: o.or.
\ /
oft-1'70\
-\ o.o5
: v'v! :o.ee.
r1-0.01
)
En una ciudad habitan 150 mil familias, cuyo ingreso anual sigue distribucin normal con media
de 8000 dlares y desviacin estndar de 1200 dlares.
EI 12.1% clc las faltrilirs tictrc ingresos anuales menores a 6600 cllares. Eso quir,.r'c clccir
que sorr 0.121 x 150 000 : 18150 farnilias.
b) Si buscarnos el riltino quintil de ingreso, qniere decir aquellas farrrilias r,re tienen el 207,
dc los inglesos nrs altos; o sea) tenem s que encontral rrn valor :: de nlancla que Pr(I >
r) :0'2'
>r) : 1-Pr(/ 1r):0.2,
Pr(I
I r) : F(r) : 1- 0.2 : 0.8,
Pr(/
o l" -,99!o) : 0.8.
\ 1200 )
En la tabla de la ley normal, \emos que se velifica que iD(0.84) : 0.8. Por tanto,
z - 8000
: 0'84'
1200
Al resolver esta ecr.tacin, nos da r : 9008. Consecuentemente, el 20 % de las familias tiene
un ingreso superior a 9008 dlares anuales
Se tomaron <Ios exmencs sobre 100 puntos, crr el .rrimero se obtur,'o r1 :80, ot:4 y en e-
segundo p2 : 65, 02 : 5. Un cstrrdiante sac 84 en el primer exalnen y 75 en el segrrnclo
Cornparativamcnte, en cul de los exrncnes obtu.r'o rnejor resultado?
Sol'u,cirt: Deterrnincrllos, ptl'a cada examen, el porcentaje cle cornrarleros (lue src]r'on rnclroi
nota que 1, sabiendo qr.re
Una empresa ernbotella t'efrescos rnediante una mquina que envasa el lquiclo, con un nredia r -.
desviacin estndar de 10crn3. Calcular el valor de Ia media prra que solo se lebase la cantida-
de 310cm3 en elSTo cle Ias lrotellas, si se supone que la canliclad de lquido ernl-otellaclo tierr.
distribucirr nonn1.
Sol'ucin: Sea X: <<la cntidad de lquido embotellado>>, corr X - N(F,(10)2). Se brrsca el,r,rlc,:
de r tal que
Pr(X > 310) :9.65.
Ahola bien,
clorrde Z - N(O,I). Por la tabla de la ley normal, Pr'(Z > 1.645) : 0.05, debindose cumplir
que
310-p:1.645.
10
As,
: 310 - 10(1.645) : 293.55.
ElmarcadorqueindicaIacantidadmediadelquidodebeestarposicionadoen293.5cm3.<
En el Cuadro 4.7 se encuentra un resumen de las leyes de probabilidad analizadas en este captulo.
Uniforme discreta, r
'lt(N,n,r) -r
Hipergeomtrica
# #(t-#) N-1
Bernoulli Ber(p)
Binomial Bin(n,p) np
Geomtrica
r-p
9(p)
p2
l/(a,b) (b - o)'
Uniforme continua
+ L2
I I
Exponencial r(r) ;
^2
Normal N(t",o")
Normal estndar
^/(0,1)
Cuadro 4.1: Principales leyes de distribucin de probabilidad
4.10. Ejercicios
Ley uniforme
4. Los utobrrses de cierta lner salcrr c:on holario estricto cada cinco minutos. I{alle la plolrabilicliLrl
ckr cluc 1ul l)asa.jero c1r-rc llcga n lzr pzrraclzr tenga que esperar el rutobris nlclros cle tlcs rrtintrtos.
r
L,. Al cstrrcliu' las ofertas de contlatos cle ern'o, un fablicante de coml>utdoras ve que los cxlrtr'rtr.,-
clc los intelesados tienen ofertas que se distribuyen ltniformemente entre 20 nril y 25 nlil dlarcs
Calcule lil plobabiliclad de que el siguiente contrato sea:
6. Sqrngase que Ia velocidad de los autos en un sector de una carretera sigue urta ley uniforntt
entre 60 y 120 kmlh. Cul es la probabilidad de que un auto:
12. Se prueban dos elementos que trabajan independienternente. El tiempo de trabajo del primer
elemento tiene distribucin (0.02) y el segundo elemento t(0.05). Halle la probabilidad de que
en el tiempo de duracin t :6 horas:
13. La duracin (en minutos) de las llamadas telefnicas de larga distancia desde Quito es una
variable aleatoria con densidad
14. La duracin (en aos) de la vida de los individuos de una poblacin humana se puede modelar
mediante una'r,ariable aleatoria con funcin de densidad
si > o;
f (t) :{ {oe-.t/ao,
0, si10.
a) Determine la vida media de la poblacin;
b) Cul es la probabilidad de que un individuo no llegue alos 42 aos?;
c) Cul es la probabilidad de que una persona que tiene ms de 50 aos, supere los 65?
-o Suponga que la duracin, en minutos, de una conversacin telefnica sigue una ley exponencial
eOlS). Encuentre la probabilidad de que Ia duracin de una conversacin telefnica:
6 Se prueban tres elementos que trabajan independientemente entre s. La duracin del tiempo
de trabajo sin fallo est distribuida segn una ley exponencial: para el primer elemento h(t) :
0.1e-0'1, para el segundo elemento fz(t) :9.2"-o'2t, para el tercer elemento /s() : g.3"-0'3t.
Halle la probabilidad de que en el intervalo de tiempo (0,10) horas, fallen:
La escala Richter para medir la magnitud de los terremotos sigue una ley exponencial de media
2.4. Calcule la probabilidad de que un sismo sea:
-5. El tiempo de duracin, en meses. de un tipo de resistencia elctrica se expresa mediante una
variable aleatoria X que sigue una ley exponencial (0.5).
cl) Si el costo de produccin cle una resistencia es C : 2 + (30 - X)' , cul es el costo espelaclo
de una resistencia?
19 El tiernpo 7 que se demora para completar una reparacin elctrica es una variable aleatoria
distribuida exponencialmente, con media 10 horas. El costo C de llevar a cabo este trabajo se
relaciona con el tiempo empleado mediante la frmula
20. La duracin de los neumticos de una marca determinada siguen una ley exponencial cuyo
promedio es 30 (en miles de kilmetros). Calcule la probabilidad de que un neumtico dure:
a) ms de 30 mil km;
b) ms de 30 mil km, dado que ha durado 15 mil km.
Ley normal
21. Se tiene una variable aleatoria Y con media 5 y varianza 16.
23. cigarrillos es, para los fumadores, de 5 dlares diarios por trmino medio.
Se sabe que el gasto en
y que la desviacin estndar es de 0.8 dlares. Suponiendo que el gasto sigue una distribucin
normal, qu proporcin de los fumadores gastan entre 4 y 6.2 dlares diarios?
24. Se experimenta con un medicamento que produce variacin en el peso de las personas que lo
toman. Pruebas de laboratorio han demostrado que al cabo de un mes la rrariacin del peso
sigue una distribucin gaussiana de media 2 kg y desviacin estndar 1.25 kg. Determine la
probabilidad de que una persona:
25. La compaa area Helios sabe que el tiempo de retraso de sus vuelos sigue una ley normal, con
un retraso medio de 10 minutos y desviacin estndar 5 minutos. Calcule la probabilidad de
que:
26 La Cruz Roja ha determinado que tiempo necesario para que una de sus ambulancias llegue al
sitio donde hay una emergencia se distribuye segn una variable normal de media 17 minutos y
desviacin estndar 3 minutos.
4.70. Ejercicios t49
Los r:r'r'olcs rlc clc pcso cle Ltna balanzl obeclccelr a una ley normal con desviacirt
lr nrcclir:i<irr
y
cst inclrr' 20 nrg csl)cr irrza 0 rng. Hzrlle Ia probabiiidad cle clue cle tres niediciones iridcpendientcs,
el clrol tlc por lo rncnos una cle ellas no sea mayor) en valor absoluto, que 4 mg.
Se aplic rrrrzr plueba clc fluiclez ver-bal a 500 alumnos de Educacin Bsica. Se supone que las
rtrrrtnaciones obtcnidas se clistlibr.ryen segrn Lrna rrornlal de media 80 y desviacin estndar 12.
l9 El per'metro craneal de los hombres, en medido en cm, es una variable aleatoria normal /(60, 4) .
a) Qu permetro craneal debe tener un hombre para que el 16.6% de sus paisanos <<tengan
ms cabeza que l>>?
rl. Se llama cociente intelectual(C.I.) al cociente entre la edad mental y la edad real. Se sabe que
Ia ley de distribucin del C.I. es normal con media 0.95 y desviacin estndar 0.22. En nna
poblacin con 2600 personas se desea saber:
a) .Cuntas tendrn un C.I. superior a 1.3'/; c) Cultas tendrn un C.I. entre 0.8 y 1.15?
b) .Crrntas tendrn un C.L inferior a0.77?;
l1
JI Se va construir nn n)arco para montar una puerta. Qu altura mnima ha de tener el rrrarco
para que el 7%o de Ia poblacin tenga riesgo de chocar su cabeza al atravezarla, si la estatura de
la lroblacin estadistribuiclanormalmente, con media F:1.72m y varianzao2, con o:12cm?
i2 La cstattrra de la poblacin masculina est normalmente distribuida con F : L67 cm yo : 3 cm.
(i) mayor que 167 cm?; (ii) mayor que 170 cm?; (iii) entre 161 y 173 cm?
El peso de las fundas de papas fritas producidas por una fbrica sigue una distribucin rrolmal
con media 12.8 onzas y desviacin estndar 0.6 onzas.
34. La <:strtr-rr't ct: lzr pobla,cin rnascrrlina y femcnina siguen leyes de distlibucin nclrrnal. La
rtascrtliut tirtnc t,1 - I.67 trl y 01 : 12crn v ]a fcnlr:nina" p2:1.55 In y 612 :10c1r. Se tice
urra 1rarcjir ert lt c:ual cl varlr rnicle 1.70tn y Ia rtru.ler 1.60rn. Cornparil,tir/amente) .cul cle los
dos es rns rlto Li:spccto a los miembros cle su sexo?
OE
Ji, Los conductoles quc se fabricrn para utilizar en las computadoras deben tenel resistencias clue
varan entre 0.12 y 0.74 ohm. Las medidas de las resistcncias que produce Lrna compaa siguen
una ley de distribucin normal de media 0.13 ohm y desviacin estndar 0.005 ohm.
36. Los tiempos de Ia primera avera de una mquina de cierta marca tienen distribucin gaussiana
con un promedio de 1500 horas de uso y desviacin estndar de 200 horas.
37. El promedio de las calificaciones de los estudiantes universitarios se distribuye normalmente co-
media 5.4 y desviacin estndar igual a 0.5 puntos.
38. En el grupo tnico A, la estatura de las personas (en cm) sigue una distribucin,Af(t6S;25): .,-
el grupo tnico B sigue una,A/(170;25) y en el grupo C una N(175;25). Los tres grupos tnio-
son muy numerosos.
a) Si elegimos una persona del grupo A, cul es la probabilidad de que mida ms de 160 cn
b) Si elegimos 10 personas al azar del grupo tnico A, independientemente unas de otras, ct-
es la probabilidad de que 5 de ellas midan ms de 160 cm?;
c) En una ciudad, el 50 To de Ia poblacin pertenece a la etnia A, el 20 % pertenece a la E '
el30% r'estante a la C. Si elegimos una persona al azar en esta ciudad y mide ms de ---
cm, cul es la probabilidad de que pertenezca al grupo tnico C?;
d) Si elegimos 10 pelsonas al azar del grupo B, independientemente unas de otras, icul a -"
probabilidad de que al menos 5 midan ms de 172 cm?
39. Una mquina para llenar cajas de cereal tiene una desviacin estndar de 25 gramos sobrt *r
peso de llenado de lascajas. Qu medida debe indicar el marcador de llenado de las cajas p--.
que permita que ha5,a cajas de 450 gramos o ms durante elI% del tiempo? Se supone qu iiu
cantidad de cereal por caja sigue una ley normal.
40. La anclrura, en mm, de una poblacin de colepteros sigue una distribrcin N(p,;o2). Se esti
que el 77% de la poblacin mide menos de 12 mm y que el 84% mide ms de 7 mm. Halle
parmetros de Ia ley.
4.77. EI teoretna del Lmite Central 151
Teorema (del Lmite Central) Sean Xt, X2, .. ., X,,, n r'rriables aleatorias independientes,
,listribuidas con media t y varianzd 02, y que signen una ley de probabilidad cualquiera -no nece-
sariamente la misma-. Se forma Ia variable suma
Y:Xt]-Xz-+..-tX,,,
que tiene esperauza E(Y) varianza Var(Y) : no2. Entonces, la distribucin de la variable
aleatoria
Y -E(Y) Y -np
Jv*@ o{n
riende hacia una ley de distribucin normal estndar, cuando n tiende al infinito.
ii teorema implica que si n es grande, se puede aproximar las probabilidades de Y utilizando que
pr(y r) : pr (t * (T#)
=';#) = ,
-
= formulacin de este teorema es, en su forma ms elemental, debida a P. S. Laplace y fue demostrado
:--a-rlrosamente, en primer lugar, por Liapunov en 1901.
Ejemplos
-. Sean X1, Xz, ..., X1o, cincuenta variables aleatorias independientes que siguen la ley
r 0 1 2
Pr(X : r) rl8 3i8 t/2
E(X):
+, Var(X,) : #
Entonces, si Y : Xt * Xz*.'. *X0,
E(v) : 50x+:T,
Var(Y) :
31 775
bux6a:E'
I irl l'tittt it:ri,'.s fij.,l tilttt it;cs rlc l't,!.ltilitl;t'l
I'ri) i{) i
l-,1'
l-l t'osto rlitti,r rlc orcliu llll iullrltis lir,tl,) rurt'rrsto li.irr r[t: ]J0,l,rlalcs v rrn \alol \'uirl]le rlcl 30:.-
rlr: los ittgl'r's<ls. EI itrglt'so lier<'r ttrr,lisl Iilrrrr i,ilr unilr,r nrc t'r1r'r:5r0 l'250 dlales. a) Cirlt:rr1;r:
la rr,rltr,lrili,la,l rle (luc ('l ('()sto ([r: <lret.;rL rur :rrt()l)ris. rlruarrtr,S[ <lias. sllpele los 2500 cllares
lr) ;.C'rrrrtos rls rle ort'ta<:irirr s<:r'tr no('('s;uios r;tt;r (,lll(\ (()lr llrrir l)tol)l)ilidad cle 0.95. cl c()st,-
,li,,rlrct';u:ir'll sea .lo it,l Irrclr()s 2.li() d<'larcs.'
-\ : ltr;rt'so rli;rtir r rol r )l)('t;r( irlrr .lt:l rutol)rij: .\' - /i;(). 2;01 .
('' f'..1,r !i;rl i,,,lt',,)t 't ;t,'iritr,lr,l ;rrl,rlris: C..' : .i0 : 0.:1.\.
Sr: t it'trt' rttc
l-tti,,!tt,'..
ii
;t) Slrr l' : I l',. r'l r'rtsl,r r[t,olrt'l:tci,ilr trr,.tisrrrl ilcl ittol)tis. l:,rttctrrccs,
r=l
z:ry_^/(o,t).
t/300{u,
.5r: rL,l,r'rlllr,r rrirrr,r'eI r,;rlot rlc lr. tal (llrc [)l(.i > 2350) :0.95:
|,t({'>.]:l..-l(l)=i,,(z'ffi):'_*(,loo#'',):o.n'.
I'l'I;tttlrl.
3i(l - i l
yf.rt)tttT = -1'645'
i, 'r. rlsrrltil rlil(, ,r : .f:l ;:j. Ls rktcir'. sr: lrcfirsiti\Il 34 clrs.
4.77. El teoretna del Lrnite Central 153
a) Se necesitan ms de 36 componentes durante 210 das, si la vida til es menor a 5040 horas
(210 das por 24 horas). De manera que
too) :
Pr(Y36 < bo4o) = r Itot,==tuj
\ 100y'36
a Q'4)
: 0.9918.
Luego,
4600 - 100n
: -2.33
Lasolucindelaecuacirresn:64.5;esdecir,65componerrtes.<
,:j*, i=l
a.e una distribucin Bin(n,p), con media np y varianza npq) corr Q : I - p. Por el Teorema del
- -:cite
Central, la variable
Z_ Y-np
J"w
ii:re apl'oximadamente una ley normal estndar, cuando n es suficientemente grande; es decir,
En la siguiente tabla se presenta una relacin entre los parmetros n y p para que la aproximacin
normal a la ley binomial sea vlidaa.
p n requerido p n requerido
0+ 22t 0.25 74
0.01 214 0.30 51
0.05 188 0.35 32
0.10 757 0.40 16
0.15 728 0.45 13
0.20 100 0.50 13
pq
Otro criterio para escoger n es que el intervalo (o ,Pl2 T)
\ -
Z se encuentre completament
n
dentro del intervalo (0, 1).
Ejemplo. La Superitendencia de Bancos cree que el 32% de los crditos al sector agrcola estn e-
mora. En un estudio se tomo una muestrade2T0 crditos a la agricultura. a) Hallar la probabilida-
de que ms de 80 de ellos estn en mora; b) Cul es la probabilidad de que exactamente 95 cliente.
estn en mora?
270
pr(X > 80) : pr(x > 81) :
I
/r:81
clro(0.32k10.68270-k,
cuyo clculo puede ser muy complicado. Aplicando la aproximacin de la ley normal a la l.n
binomial, se tiene
Luego,
1.L2. Ejercicios
1. En una caja se empacan 100 latas de conservas. Segn los datos de la fbrica, cada lata tiene
un peso promedio de 1 oz con desviacin estndar de 0.1 oz. Cul es la probabilidad de que
una caja pese ms de I02 oz?
Un borracho camina de forma aleatoria de la siguiente forma: cada minuto da un paso hacia
adelante o hacia atrs con igual probabilidad y con independencia de los pasos anteriores. Cada
paso es de 50 cm. Calcule la probabilidad de que en una hora avance ms de 5 metros.
.). Los clientes de cierto banco efectan depsitos con media 157.92 dlares y desviacin estndar
30.20 dlares. Aparte de sto no se sabe nada ms acerca de Ia distribucin de estos depsitos.
Como parte de un estudio, se eligieron aI azar e independientemente 75 depsitos. Cul es la
probabilidad de que la suma de estos 75 depsitos sea 12 750 dlares o mayor?
Los vehculos que cruzan un puente tienen pesos cuya media es de 4675 kg y cuya desviacin
estndar es de 345 kg. Si hay 40 vehculos sobre el puente en un instante dado, halla.r el nmero
o tal que la probabilidad (aproximada) de que su peso total no supere a o sea del 99 %.
La empresa Rapid Express enva paquetes de distintos pesos, con una media de 1.5 kg y una
desviacin estndar de 1.0 kg. Teniendo en cuenta que los paquetes provienen de una gran
cantidad de clientes diferentes, es razonable modelizar sus pesos como variables aleatorias inde-
pendientes. Calcule la probabilidad de que el peso total de 100 paquetes exceda de 170 kg.
6. El propietario de una copiadora ha determinado que el nmero diario de copias que se realizan
en su local tiene una media de 1250 con una desviacin estndar de 350. Halle Ia probabilidad
de que en un mes de trabajo (25 dfas) el total de copias:
b) Cultos hilos se rrecesital pala qr-re el cable sosterrga 300 kg corr urr gg% cle seguriclrci/
9. Utr jugador de baloncesto encesta urr lanzrrniento de 3 puntos con plobal,'ilidacl 0.3.
10 En promedio, de las personas que ingresan a una librera solo el 25o/o realiza una compla. Si
en un da entraron 80 clientes, calcule Ia probabilidad aproximada de que se hagan al menos 28
cornpras.
11. Se ha encontrado que el 70% de las personas que entran en un centro comercial lealizan cuando
menos una compra. Para una muestra de 50 personas,
13. Se conoce, por estudios previos, que Ia proporcin de vacas que enfer-marn despus de su-
ministrarles la vacuna contra la fiebre aftosa es del 2To. Una granja tiene 600 vacas qtre sor
vacunadas. Determine:
Distribuciones Multidimensionales de
Probabldad
;-, muchos casos) un fenmeno aleatorio no depende de una sola variable, sino de dos o mi; por
- =:rplo, algo tan simple como el tiempo que empleamos en trasladarnos desde la casa a la universidad
l':!e61s, entre otras cosas, de Ia velocidad media del carro y del nmero de veces que nos detengamos
: -: los semforos en luz roja. Es decir, el resultado en la prueba descrita depende de, al menos, dos
--=:l ables aleatorias.
;- .o que sigue, trataremos con conjuntos de varias variables aleatorias que se manifiestan simultnea-
- --te en un fenmeno y determinaremos si ellas estn o no relacionadas. Para simplificar la exposicin,
-jzaremos eI caso bivariante ya que Ia generalizacin a ms variables es inmediata.
fefinicin (de variable aleatoria bidimensional) Sean X y Y dos variables aleatorias unidi-
-=:rsionales deflnidas sobre un mismo espacio muestral f,); entonces, la funcin
RxR
r_F
-+
LD r------ (X (r) ,y (r)),
-'--,de w es un evento elemental, es una variable aleatoria bidimensional.
Sea? : {(r, eFr2l @,y) > 0}; es decir, el conjunto de puntos con probabilictad positiva, es finito
o infinito numerable y se cumple que
I
(x,v)eT
f (r,a) : L.
Supongamos quezl, 12...y At,Uzr... son los valores posibles deX y Y, respectivamente, ysea
La probabilidad del evento (X,Y) .E es igual a la suma de todos los p para los cuales (r,y) E:
Observacin. Si los espacios muestrales son finitos, las series deben reemplazar,je por sumas finita-s
5.7. Variables aleatorias bidimensionales 159
,l'on rq,1161 cle r'rriallcs ak:torias bicliurcnsiouales se ruecle clal uut defrrricin cle iuclependerrcitr e<1tti-
"rlerrtc r lr autetiot'trlclttc clrclir:
Ejemplos
Para que / sea una funcin de probabilidad, la suma de todos los trminos que acabamos de
calcular deben dar 1; es decir,
X
Y I 2 3
1 r/36 2136 3136
2 2136 4136 6136
3 3136 6136 e136
s
T -1 0 1
Entonces,
F(0.b,0.3) : I tPr(^9:i,T:
j<0,3
<0.5
: Pr(S : -l,T - -1) + Pr(S :0,7 - -1)
: 115
8-12:i4'
b) Por la frmula de la funcin de probabilidad marginal tenemos: f s(i) : ! Pr(S : 'i.,7 : j):
J
por lo que
B' 24 3'
/s(o) : Pr(,s: 0,7 :-1)+Pr(S:0,?: 1)
111 I
12' 6 4'
/s(t) : Pr(S : l,T :-1) +Pr(,$: I,T :I)
7r5
: %- E: 12'
De manera anloga, se obtiene la ley de ?:
8-12-24-t
fr!) : Pr(.9 : -1,7 :1) + Pr(S :0,7: 1) f Pr(^9 : 7,7 :1)
: 24-
5 *1*1:1
6- 8- t'
Entonces, las variables aleatorias S y T siguen las leyes:
-1 01 T l-r 1
A la variable aleatoria (X,Y) est asociada una funcin no negativa /, denominada fu,ncin, de densida,:
conjunta, que cumple con Ias siguierrtes propiedades:
tI4
.l \&r Y
,
'tl J --
o2 F(r,y)
- or oa
db
Pr(a<X<b,c<Y< o): @,y)d,rdy: J ,o,fid,rd,y
Il"f I
Definicin (de funcin de densidad marginal) Las funciones de densidad marginal de las
-.-ariables aleatorias X y Y estn dadas, respectivamente, por las relaciones
/'oo f
fx@):l .l
l@,a)da v fv(a):l,l f@,a)tu.
-a -*
toooo
Fx(t):
I f@,y)dyd.r y Fy(t):
I If@,s)d,rd,y
"[
lon este tipo de variables aleatorias tambin se puede reformular la definicin de independencia.
Ejemplos
1. Un crculo de radio o est inscrito dentro de un cuadrado cuyo lado tiene una longitud de 2a
(vase Ia Figura 5.1). Se supone que Ia probabilidad de que un daldo arrojado hacia el cuadrado
es idntica para cualquier punto. a) Calcular la probabilidad de que el dardo impacte dentro
del crculo; b) Encontrar las leyes marginales de X y de Y.
L62 Captulo 5. Distribuciones Multidirnensionales
Solucin:
Determinar: a) las funciones de densidad marginal de cada una de las variables; b) la funcin de
distribucin asociada.
Solucin:
: (#) (")
Consecuentemente, la funcin de distribucin queda como
f (t-Xt-v).
Fxv(x,y)={ ra ' sir)1, y2L;
I O, caso contrario.
5.2. Dstribucin condicionada 163
: : at : u)
Pr(X rlY
' ,, -P'(I:^!'Y
Pr(Y:Y
.
. Para variables aleatorias continuas, la funcin de densidad condicionada de r, para un valor fijo
de la variable g, se calcula por
f @la) : f
,@)',) .
TY\A )
Como fv(a) :
l*_rr",a)
d,r : l_ f (al")f x@) dr; entonces,
I
f (alr)f x(")
f(,(rga) f@1
J
I f (al")f x@) dr
-'x
que puede interpretarse como el teorema de Bayes para funciones de densidad.
Ejemplos
Pr(Y: 2) 1 2'
5
164 Captulo 5. Distbuciones Multidimensionales
, f 2, si0(r1).,0<y<r,rly<r;
r'\r \ /: I .0,
"fxr'(r,ll) L casoconl,r'ario.
dr :2(I _ y).
La distribucin condi
f@lao) , Para0(rlr-ao;
caso contrario.
Al igual que en el caso de las variables aleatorias unidimensionales, en las bidimensionales es posible
calcular la esperanza y la varianza, previa la realizacin de una transformacin de variables.
Definicin (de esperanza) Sean (X, Y) un vector aleatorio bidimensional y g(r,y) una funcin
real
g iPt2 --J R
@,a) g(r,a).
'-
1. Si (X,Y) es un vector aleatorio discreto, cuya funcin de probabilidad es /(z,g), entonces
2. Si (X,Y) es un vector aleatorio continuo, cuya funcin de densidad conjunta es /(r, A), en-
tonces
E(g(x,Y)) : r@,a)d,vd,r
l:l:s@,a)
Observemos que si XyY son independientes, se deduce que
als@)n( )l : E[g(x)]Eth(Y)1.
Para las variables aleatorias bidimensionales se tiene una medida estadstica nueva, ia covarianza) que
permite evaluar la relacin entre Ias variables aleatorias X y Y.
Definicin (de covarianza) Sean X y Y dos variables aleatorias, Ia covarianza entre XyY se
calcula por
Cov(x, Y) : E[(x - E(x))(Y - E(Y))].
-\ contirmacin, se deduce una expresin para la varianza de la suma de dos variables aleatorias
'.ralesquiera.
p(x,v : Cov(X, Y)
-r. Si )' st: cxprcsa lincrlnrenbe err funcin de X, pol Y : a,X f , donde cr, y b son dos constantes,
crltorICCS lf(X )-)l : f .
166 Captulo 5. Distribuciones Multidirnensionales
Observacin. Se debc tener en cucnta cre si clos rraliables aleatolias sorr independientes, cntoncc.
son no correlacrionadas; pero la afirmacin rccrroca no es correcta; es decir', si dos variables aletoriar.
no estn <rorrelacionadas, uo son obligatoriamente inclependientes.
Ejemplos
s l-r 0 1
-1 1
En consecuencia,
:
157t1
8 24 24'8 --I
4'
5.3. Esperanza y covarianza 1.67
Por Io tiurt,o,
Cov(.S,7)
p(s,ll) :
-+:
-?
-0.29.
(i#) .'
t/toz
I
/ Y), : 12, si0(r.-I,0<y<!,r*a<L;
txv\r,
t o, caso contrario.
Hallar la correlacin entre X y Y.
Soluci,n: Anteriormente determinamos que
lo' .[ot-'
Entonces,
: 111
Cov(X, Y) E(XY) - E(X)E (n : + - 3"3- 36
De manera que
Cov(^9, T)
P(S,T) : 1
2'
IJrr:irtrrrLo :-. ll Lt
: t' r/,r' - ,/ t - ll.2dz. crtcotttrarLtrs:
,/ t tt: -
I .'tt..2t:., / - .: /, , 7 ,,.,.tz.
l-./,,\-
) tt t I Ct/-,la:-, t :t -)O<r< \.
't ' - )tT' .l -^ rf-'l-
Y) : E(Xi') - :
Cor'(X. E(X)E(Y)
l:l:rurxv (r,y) rlr d'y - 0
=
h'[- o"-o'''(l: J';I _H 1
- r- Ry)2 I Q(1-R2)) ar\ y.
/
La integral interior es igual a Ry; por lo tanto,
Los corrceptos descritos, r'liclos prrra variables aleatorirs biclirnensionales, se pneden generalizar r.
vcctorcs aleatorios de cnalcriel dimcnsirl; por lo tanto, solo vamos a exponer las definicioles d.
mrnerl r-esumida.
Si Xl , Xz, ..., X, son variables rleatorias discretas, el vector aleatorio Z es discreto y su funcin ci
r'obabilidad es
.fz(r, "',r,'.) : Pr(Xt : t7.'.,X,, : r,,).
Si Xl. ... ,X, son r'rriablcs rlcrlolias continttas, el vector aleatorio Z es cotttittuo y la probabilida.-
dcl cvento u(Xr, ...,X,,) e E C R">> se calcula por
-, eqtrivzrlentcntertte,
J'z@,,.. . ):t:t) : .frr(tr) . .' [x,,(L:,,.).
Sea g urra fitncin clefinicla de R" err R, la espcrtrnza nrrtemticr cle tL(Xt,...,X,,), segrin l:r lc' [s
Z. sc calcrrla por
:uando Z es continua.
Cot,(X,,., X,,r)
P(X,,X,n):
Var(X,.) Var(X,")
:.-
:-
*=
la
de eda como
Ejemplo. En una empresa operadora de tarjetas de crdito se registr las causas para la renovacirr
de las tarjetas. Se estableci que 60 % es por prdida, el25'/o por vencimiento y el 15 To por deterioro
Un da se recibieron 28 solicitudes de renovacin de tarjetas. Evaluar la probabilidad de que 15 sean
por prdida, 7 por vencimiento y 6 por deterioro.
Solucin: Sean:
5.6. Ejercicios
1. Si la funcin conjunta de probabilidad de X y Y est dada por
r*u
J lr,a) : -30=, para : 0, I,2,3; A :0,I,2.
Construya una tabla que muestre los valores de la funcin conjunta de probabilidad de las dos
variables aleatorias.
2. Las variables aleatorias ,9 y 7 tienen Ia funcin de probabilidad conjunta que se resume en la
siguiente tabla:
s
T 0 1 2
0 rlr2 Llg rl24
1 114 rl4 tl40
2 rl8 rl2o
3 r/20
Encuentre:
t72 Captulo 5. Distribttciones Multidimensionales
X1
Xz 012
0 p p12 pl4
1 2p p pl2
2 4p 2pp
a) Halle el valor de p;
b) Halle las leyes marginales de X1 y de X2. Son independientes?;
c) Sean Y : Xt x X2, calcule la esperanza de Y.
5. Las variables aleatorias X y Y son independientes ente s y sns funciones de probabilidad son
z 0 1 2 .l 4 J
_V 0 t/z
Pr(X : Z) 03 0.2 0.1 0.15 0.25 Pr(Y :.i 0.25 0.67 0.08
x
Y -3 4 10
2 0.15 0.13 0.27
4 0.10 0.30 0.05
a) Halle las leyes de distribucin de X y de Y;
b) Calcule el coeficiente de correlacin cntrc X r,' }, .
7. Dada la distlibucin cle 1>robabilidacl clc uur variable aleatoria bidimcnsional cliscreta
X
Y l0 20 30 40
0 0.05 0.1.2 0.08 0.04
1 0.09 0.30 0. r1 0.21
3. Sc r:ousicl<trzr 1a sigtLictrtc f\urciri de plolrabili<1acl corrjrLrrta. rlc la,s r'rlirbles rlcrtotiLs XyY
1. , ,
./.\)'('lt: I ', Qr -,1. .i .r' {0 I 1.3}. // c {1.?.3}:
\ tt. (.;rO r.(rull.al.iu.
nt , f senrser\y1 si 0( r'1
rw'lJ):l rf2, 0<y<rf2;
o, si r(0, y<0.
a) Halle la probabilidad de que el punto aleatorio (X,Y) caiga en el rectngulo limitado pol
las rectas r -- 0,, :;, y : :
[,, tt
b) Deterrnine las fr-rncioues de densidad marginal de cada una de las variables aleatorias.
v
-,\
.l
Y L ) ,) 4 5
0 2150 r ls0
1 3/5n 7150 12150
') 5150 e l50 41 50 :t 150
3 3ltt) \ 150
c) Olrtcrrgir l distribrrr:i<irL plol-ralrilstica cle 1>r'och-rctos. \::l (ln(' rlr ticrur prstirrrr<ls.
T4 Uu soc:icikrgo irrvr:stigrr cl c:<lrrrrortirnrietrto <lcliuttrcrr<:irl <[c los irrtcr rros <lc trrr pr.rral. Lr r'rrial
X relltcscutr c-.1 ruirrrcro rle voccs rlue ha cstulo clctcrri<lo v lr r'rriabkr )'- cl uliurclro rlc rlcll-
c[istitrtcls llor los (rc] ha siclcl s<lrrtcucir.clr. Srrs r1rtos sc reslrrl)clr crr Ia sigrriorrte talrla:
.Y
.)
Y i 2 .) 4 5
1 15/100 e/100 41r00 1/100 1/i00
2 5/100 1 1/ 100 51700 21r00 1/100
3 21r00 41t00 7 1100 3/100 1/100
4 rlrc} 3/100 5/100 21r00
I
tJ 21r00 41r00 211.00
6 21r00 3/100 1/100
7 21r00 21t00
15. Sea X
una variable aleatoria que sigue una ley ul)ifolure sobre {1,2,...,n}. Sea Y la variab-.
aleatoria definida ror Y : (X + l)2. Calcule la cor'rianza entre X y Y .
16 Sea X
una lariable aleatoria qne sigue una ley unifornre sobre {-1,0, 1}. Calcule el coeficiel,:.
de colrelacin cntre Xtn y X'tL.
17, En nna urriversidad se toma, a los aspirantes, pmebas de ingleso en ciencias y en humanidades. S
X y Y sou, rcspectivamente, Ias ploporciones de rcspuestas correctas que un estudiante alcaui..
en las pruebas r su funcin de densidad conjurta viee dada por'
r 4r -l6u
,,^ ^.t
IV,A):- \ J
5
[ 0. caso corrtrario.
b) rrrs del 80% de respuestas correctas en ciencias r,. rnenos de 50% en hurnanidades?
18. La c'arrtidad en rniligramos de dos componentes con[enidos er] un producto es nrra valial.'--
aleat<ria hrir,ariantc. cuya fttncin de densidad viene dada pol Ia expresin
o<v < r;
r@,:
{ ;:r, ::j:":;:,;''
a) Errcucrrtre el valol cie la constante c;
lr) I{rlle Ia ley condicional /(zlys):
C:) Ctlt:ule la rrobabilidad de <ue la cntidacl clcl primer componente sea menor que 0.3:
rrritigramos cuando la del segundo cs 0.8 nriligramos;
d) ;.S,ru irr,lrendientes los dos <.:omponentes'?
5.6. Ejercicios L75
19. Si X cs l;r pr'oilorc:i<itt rlc pcrsonas que I'csl)ontlcrr r ulra cnclrostr lerlizacla por correo y )'' t:s
la rtopor< iritr <lcl l)0lsorras cllre resl)onclen a otla errr:rrestr rr:aliz<lll)ol correo, y la ftLrrciirn r1<''
rlcnsirlrrl <:orr.jrurtit <lc X y )/ esti dada por
r| -*'-!,
2ri8t
.lb,v): I 5
para 0(r(1; 0<yl1;
[ 0, caso colrl r'trio.
Eucueutle:
20. La vida de uso (en horas) de cierta clase de circuitos integrados es una variable aleatoria con
funcin de densidad
I 20000
st z ) u;
l@): { G+ looF'
I O, caso contrario.
a) la densidad conjunta de X1, Xz y Xs, que representan la duracin de cada uno de los
circuitos;
b) la probabilidad Pr(X1 < 100,X2 < 100,X3 > 200).
2r Sean .9 y T dos variables aleatorias cuya funcin de densidad conjunta est dada por
a) Encuentre el valor de k;
b) Obtenga las densidades marginales de ^9 y de ?;
c) Determine la funcin de distribucin F(s, ).
22. Una funcin de densidad conjunta est dada por
' t/
f(r,a,-,, I l6ryzt' si 0( r1I; 0<y<1; 0<z1I; 0l11;
- I 0, caso contrario.
- r - u)' <a< 4;
l.;}]
r(*,v):
{ i:t :'-: ;ffi?,I'
a) Halle el valor de k;
b) Obtenga ls densidades marginales de X y deY;
176 Captulo 5. Distribuciones Multidimensionales
a) Halle el valol de c;
f
. ( !6rr+yr)y,
(r,a):1 5
sio( r1r; o1y< l;
|. 0. caso contrario.
26. Sea (X, Y) distribuido uniformemente sobre el sernicrculo del diagrama. Entonces, f (r,y):
si (r,y) est en cl semicrctilo.
a) c) .Son independientes X v Y?
b) al de X;
28. Pala :
si z 0, y>0; conn),2,
+ YY
caso contlario.
5.6. Ejercicios L77
,)
h
a) l?,a) :3 a"",
at:-
0 ( r 1y 1 l?; b) "f(r,A): (r+r ta)4
r) 0; rr>0?
s I 1;
r@,a):
{3:r' :ff"h;,s
a) Encuentre el valor de k;
b) Calcule ias funciones de densidad marginal deXydeY;
c) Calcule las esperanzas de X y de Y;
d) Calcule Pr(X < 0.51Y : 0.6);
e) ,Son XyY independientes?
')t
'),) Sca (X, Y) una variablc aleatoria liidirnensional con funcin dc densidad conjunta
0<g<r<1.
Calcule:
a) el valor de la constante k;
b) Ias ftrnciones de densidad rnalgiual cle X y Y. Son independientes?;
c) la corrarianza entre X y Y;
cl) la funcin clc clensicla<l <tc )''lX : 1;
2'
e) la csperanza de YIX ::.
'2
ji. Si (X, Y) est uniforrnemente distribuido en cl tringulo limitado por las rectas t :0, A :0 y
r + lJ :2, encuentre:
a) iafuncin cie densida"d de (X,Y); c) lacovarianzaentre X yY.
b) las funciones de densiclrd clc X y de Y;
l;. La distribrrcin coljnnta cle las r.ariables alertolirs X :,Y es uniformc en el cnadrado con vrtices
en (1, 0), (-1, 0), (0, 1) v (0, -1).
178 captulo E. r)istribuciones Multidimensionales
tr) Escrilra
l,1 frrrrcirr clc clensicltcl conjrrnta cle X y y;
'Cul es Ia probabilidad de que e rtre 9 plantas as obtenidas, 4 sea cle semillr amarill lisa. _
sean de semilla amarilla rugosa, 3 de semilla vercle lisa y ninguna
cle semilla vercle rugosa?
40' Las variallles aleatorias Xt, Xz y X3 siguen las siguientes leyes de probabilidad: X1 I
Xz - N(20, 1) y X -.A/(30,4). le definen -
^f(10.
Zt: XtlX2- X3, Zz: XtlXzlXz, Zs: Xt_Xz- X.
Si X1 , Xz, Xs son independietrtes calcule la nlatriz cle covarianzas cle (21,22,2;).
4r' Las variabies aleatorias xt, X2, . ., Xr, yt, y2, - . ., y, son inclepenclientes. porrgamos
*
Captulo 6
Distribuciones de Muestreo
L,c chinos, tambin efectuaron censos hace ms de cuarenta siglos. Los griegos realizaron censos
;eridicamente con fines tributarios, sociales y militares. La investigacin histrica revela que se
:o-alizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia
SUerrera.
Fero fueron los romanos quienes mejor supieron emplear los recursos de la estadlstica. Cada cinco
m realizaban un censo de la poblacin y sus funcionarios pblicos tenan la obligacin de anota
179
1ECI Cayttulo 6. Distribucior:es de M-esreo
defnnciolres 1- rna.1 r'iurorrios) sin olviclar los iecurr:ntos peticlictos clcl g;lnarlo
nr<:itnicni<-s, I' de lirs
licluezils contcnic,lrs crr lrs tict rrs colctisladas. li
lp
Durante los rnil aos sigrrientcs a. la cada del impclio Rornaro sc rcilizrron rruy po.irs irn'estigaciones
I
estrdsticas. E1 primel intento de aplicar un razonamicrrtu propiirmentc cstadstico, en el seul,ido actua. tt
del tr'mino, a datos clernoglzificos es clebido r John Granrrt, err 1662, quien sc plarrte el problem:r de
l',
I
estirnar Ja pol-rlacirr inglcsir de la poca.
Durante el siglo XVIII y 1a mayor parte del siglo XIX, Ia Estadstica evolucion como ciencia separada
del Clculo de Probabilidades. Una contribucin importante al desarrollo de la Estadstica es debid
a A. Quetelet (1846), quien sostuvo la importancia del clculo de probabilidades para el estudio de
datos humanos. Quetelet demostr que la estatura de los reclutas de un regimiento segua una le'
probabilstica, e introdujo el concepto de <<hombre medio>>.
A finales del siglo XIX, Sir Francis Galton ide el mtoclo conocido por correlacin, que tena por
objeto medir ia influencia relativa de los factores. Sus irrvestigaciones se dirigieron a aplicar mtodos
cuantitativos en el estudio de la herencia humana. La importancia de Galton radic no solamente en
el nuevo enfoquc que introdujo en los problemas de estadstica, sino tambin en su influencia direct-
sobre W. Weldon, K. Pearson y Edgcworth, entre otros. Adems, fund el primer departamento de
Estadstica. E
'de
Pero, talvez qu.ien rns ha influido en ei desarrollo de la Estadstica moderna es R. A. Fisher (1890 - po
-En
1962). Fisher se interes plimero por la eugenesia, Io que le condujo, siguiendo ios pasos de Galton, :.
la investigacin estadstica. Sus trabajos culminaron con la publicacin del libro,9listi,cal Method:
Por
t'or Research Workers. En esta obra aparece el cuerpo mctodolgico bsico de la Estadstica actual. Iup
A partir de 1950 se puede considclar que comienza ia poca moderna de la Estadstica. tln aspect,-
Ger
clifercncial respecto a ios periodos rnterioles es La aparicin cle las computadolas) que revolucionalor,
par
1a metodologa estadstica y abren enormes posibilidades para 1a construccin de modelos complejos
En la actualidad, ia trstadstica es una discipiina que actira como pncnte entre los modelos matemtico- Den
y los fenmenos reales. IJn modelo es una abstraccin sirrrpliflcada de una realidad ms compleja - ns
siempre existir discrepancia entre lo observado y 1o previsto por el modelo. La Estadstica proporcioni- por
una metodologa para evrluar y jr.rzgar estas discrepancias entre la realidad y la teora.
Los
Defi.nicin (de poblacin) Una poblacin (o universo) es una coleccin completa de pelsonas.
anirnalcs, plantas o cosas de las crrales se desea recolectar datos. Es el glr-rpo cutero al que querernos
dr:scribir o del que deseanros sacar conciusiones.
La poblacin debe tener caractersticas medibles o cntables, cle rraturaleza cuarrtitativa o cualitatir'
A la r:aracterstica nredible sc denomina uar-iabl,e estadstica t a los r-rloles ciue tomr se los llal
ol s cr-ur,ciorcs.
6.2. Definiciones bsicas 181
. La media, /_;
r El total, r;
. La varianza, o21
. La desviacin estndar, o;
. La proporcin, 7T o p.
Definicin (de estadstico) Un estadstico es una cantidad que se calcula a partir de una muestra
dedatos. Se los emplea para dar informacin sobre los valores desconocidos correspondientes a la
poblacin.
Por ejemplo, el promedio de Ios datos de una muestra, se usa para dar informacin sobre Ia media de
-a poblacin, de la cual se extrajo Ia muestra.
leneralmente, a los estadsticos se les asigna letras latinas (por ejemplo, m y s); en cambio, a ios
:armetros poblacionales se les asigna letras griegas (por ejemplo, ,t,y o).
Jentro de una poblacin, un parmetro es un valor fijo que no vara; mientras que es posible extraer
-'s de una muestra de la misma poblacin y eI valor de un estadstico variar de muestra a muestra.
lr ello, un estadstico es una variable aleatoria que sigue una ley de probabilidad.
-..rs
estadsticos ms importantes y sus valores, calculados a partir de una muestra de tamao ?) son:
i"n
. La media muestal o promedio , T : L;
m
'ln
La r.arianza mucstral, s'2 - ---:- T.@, - )2;
'rL
1
. La desviacin estndar muestral. s : D@, - r)";
n-I i-I
. La proporcin rnuestral, f : Lt
, donde y es el nmero de xitos entre n intentos.
n,
182 Capitulo 6. Distribuciones de Muestreo
Si decirnos que un estadstico es Lrna vrlialrlc aleatoria, entonces tendr' una Icv de lrrobabilidad
asociada.
1. E(x) : l-L;
o2
2. Var(X) -
-1TL
X-u,
3. '+
ol\/n
sigue aproximadamente urla ley normal estnclar (por el Teorema clel Lrnite Central).
Es decir,
\"11")'
donde Z es tna variable aleatoria normal estndar.
Tngase en cuenta qlre) para la mayora de aplicaciones, ya se obtiene una buena aproximacin cor-
un tamao de muestra de n:25.
Ejemplos
Solucin: La distribucin de la media muestral X sigue una ley normal con media p: 7:
. o2: (0.9)2es declr' 0 0.9
:
varlanza u'rc'
; 36 ; ,fr: ,,/g6
6.3. Distribuciones de ntuestreo 183
a) As,
Pr(6.8 '^\(8:J
<X <z.zs : e, o.lb <\z\z <7'2e-7)
o,lb )
- o(-1 33) :0 e732 - 0 0e18
: i:iffl
El nmero de clientes que ocupan un cajero automtico) en un lapso de 5 minutos, es una variable
aleatoria distribuida segn la siguiente ley de probabilidad:
k 0 1 2 3 4 5
PI, r/tz 2/72 3l12 3lt2 2lt2 r/72
: aQ.45) - o(-1.47)
: 0.922L.
184 Captulo 6. Distribuciones de Muestreo
3. En una plania pasteurizadora se ha observado que la mquina que llena las fundas de leche.
envasa el lquido con una media p y una desviacin estndar de o:20cnr3. Si un da se llevarL
a cabo 25 mediciones de la cantidad de leche en cada funda. a) Caicular Ia probabilidad de que
el promedio medido difiera a lo mucho en 8 cm3 de la media terica que debe tener el volumen
de leche envasado; b) cuntas mediciones deben realizarse para que 7 difiera dc r, en menos de
Bcm3, con una probabilidad de 0.99?
Solucn: Como n : 25, se puede asumir que la distribucin de X es aprc:,i-:ladamente normal.
a) Entonces,
Pr(lX-/rl <B) : Pr(-8<X-p<8)
: /88\
"'|.-rE<zsn/6)
: Pr(-2.2.2),
donde Z : X -# sigue una distribucin normal estndar. La probabilidad buscada es
olt/n
Pr(-2 < Z <2) : o(2) - o(-2)
0.9772 - 0.0228 : 0.9544.
b) Se tiene que
Pr(lX - pl l8) : P'(-s <X -p S 8) : 0.99.
Como o:20,
\ -Y Y)
,, (
20 ,X ,-1,_
-olr/n-
:pr(-0.4J
--\ --v < z < 0.4Jn): o.ee.
= 20)
Mediante la tabla de la ley normal se encuentra que
Pr(-2.57 < Z < 2.57) : 9.99,
por lo que se deduce qne 0.4Jn:2.57, o sea
":(#):40e6'
Se necesitan al menos 41 mediciones para que el promedio de la nuestra est a 8 cm3 de ,
n:irn
i-r
donde X:7 con probabilid^'r p y X:0 con probabilidad Q: I - p, i : I, 2, ..., n. Entonce.
cuenta el nmero de xitos en . intentos. La proporcin de <<xitos>> en la muestra es
f:Y: li",
TL 7I4;- 1
La variable aleatoria Y tiene distribucin binomial de parmetros (n,p). Por lo eu, py:
o2" : npe, y se cumple que:
6.3. Distribuciones de muestreo 185
r E(i) : 1
: p;
n-E(Y)
l. 1
Var(f) = I Var()')
rL'
:?3:
n
l. + sigrre aproximadarnente Lrna ley normal cstnclar' (por el Teorema del Lrnite Central)
\/ pq ln
Es decir.
./ \ / \
P,(Fsl) =Pr(z1l!) :of '-1 )
\ - t/pql" ) \r/pql" )
dorrde Z es tna variable aleatoria normal estndar.
Ejemplos
o(!zg::2.\-rlors-oz\
\v/0.16/loo/ \v/0.16/1oo/
aQ.25) - O(-1.25) : 0.9878 - 0.1057
0. BB2 1.
Eu lrna investigacin por muestreo interesaba saber el nivel de sintona, en los hogares, de un
partido de frtbol. Se realiz nna encllcsta en Qr-rito a 213 hogares y se encontr' qr-re el 53% de
los hogares haban visto el nencionaclo partido. Srrpongamos clue la proporcin 7r de hogares
en los que se vio cl partido fue realmente igual a 0.5. ,Cul es la probabilidad de observar una
proporcin muestral f igual o mayor qr.re la observada 0.53?
Por 1o que,
Hzq qrre totnar Lrr.i nltcstla. alcrt,or'a para estimar Ia proporcirr de artculos defcctnosos p de lur
ploceso de prochrccin. a) Establecer el tanrao mnirnc de ia rnr-restla de modo que la proporcin
observrda difiera de la propolcin velda,clcrr' on irrerios cle 0.1, oon riua 1>robabi iclad c,le al rnenos
eI 957o; b) Realizar el inciso antelior si se conoce qr.re la ploporci<in dc artculos defectuosos es
mcnor clue c1 12 %.
Soht"ci,rin,;
186 Captulo 6. Distribuciones de Muestreo
zr) Deseanros cletermirtar el ta,rnao nruirno cle 1a mrrestrr clc tal moclo quc Pr(lp tl < 0.1)
0.95:
0.I{"
,/w
n
La ley de distritucin y2
Sean X1 , X2, .. ., Xrr., fr variables aleatorias,independientes que siguen una distribucin normal e. . .,.
dar, la variable aleatoria definida por T : D X? tiene una distribucin X2 (jl-cuadrado) con n gr1-ul
,i-I
de libertad (g.1.), denotada y2(n).
Su funcin de densidad es
,(n-2) lz lz
"-r , siz)Q;
f(r):
i; 2"trt (;)
sir(0.
2.
z@)
:sta distribucin est definida para valores mayores que cero y viene tabulada. La Tabla 3 del Apndice
--,ntiene los valores X?qrre cortan un rea a en el extremo derecho de la distribucin (Figura 6.1).
- a lectura de la tabla se realiza de la siguiente manera:
Ejemplo. Se desea conocer el valor de la ley X2 a 4 g.l. para el cual el rea en el extremo superior es
-.ral a 0.025.
-' .lucin: Se busca Xl.ozs(a) : ll.l4. Esto quiere decir que el rea a la derecha del valor t : II.I4
-= Ia ley y2 cor. 4 g.l. es igual a 0.025: Yr (X2 > 11.14) :0.025.
:;pongamos que se obtiene una muestra Xy, X2, ..., Xn de una poblacin que sigue una ley normal
-'i ri,.t,o2). A partir de la muestra calculamos la varianza muestral, s2 : ' n-rl-t
-i (X, -X)2; entonces,
- cumple que:
-. E(s2):oz'
)n4
l. '*'\"Ls2),,
Var
n_1,
(n
J # - 1\.s2
sigue una ley 2(n - t;.
=jemplo. Un jugador profesional de dardos decide tratar de mejorar su tcnica de lanzamiento y va
. -stndial la varianza de Ias distarrcias al centro del blanco a las que cae el dardo. Para una cierta
-rrnica de lauzamiento se sabe que esas distancias tienen una distribucin normal cuya desviacin
+ ndar es 4 cm. Realiza 30 lanzamientos y calcula la varianza de Ias distancias entre el sitio de
--pacto del dardo y el centro del blanco. a) Calcular Ia probabilidad de que Ia desviacin estndar
-. los lanzamientos sea myor a 3 cm.; b) Hallar Pr(10 < s2 < 27), aploximadamente; c) Calcular Ia
:--dia y la varianza de s2.
pr(10 < ,2 < 2T : v, (!rc <n _ut ,' t}rr\: pr(18.13 < u< 48.s4)
\16 o -16 /
: Pr(U < 48.94) - Pr(U < 18.13)
: [1 - Pr(U > 48.e4)] - [1 - Pr(U > 18.13)]
: Pr(U > 18.13) -Pr(U > 48.94).
En csta seccin presentaremos distirrtas distribuciones cle muestrcoT qlre se presentan cuando tratantc,.
con transformaciones adecttadas cle los estadsticos. Estas transformaciones son rlecesarias para oJtene:
leyes clc probabilidad que permitan traba,jar adecuadamente.
trn 1908, \ /. S. Gosset, esclibieldo c:on cl nornbre de Studcnt, public en la rcvista Biont,ett"i,ka s'
dccluccin cle la distribucin e inclrry tlrblas cle probtrbiliclrd acurnr-rlacla de la ley.
trl grfico de la funcin de densidad de la Ie5, / 1i"t n rrna forrna parecida al de la ley rrormal, simtric
rcspecto a 0 y se extiende a Io largo clel eje leal.
Los valores de probabiliclad clue tona vienen tabulclos. La Tabla 2 del Apnclice contienc los vrlole:
dc o qrte coltlrr nn rea igrral a o err cl extlemo clelecho clc la distribucin (FigLrrrr 6.2).
6.4. Otras distribucones de ntuestreo 189
Los valores tabulados dependen de los grados de libertad, porque la ley de probabilidad cambia si n
;ara. Cuando n aumenta, la distribucin se aproxima a la normal estndar.
La lectura de la tabla se realiza de la siguiente manera:
Ejemplo. Encontrar el valor de Ia ley a 6 g.l. para el cual el rea en el extremo superior es igual a
_.t125.
jolucin: Se busca fo.ozs(6) :2.447.Esto quiere decir que el rea a la derecha del valor t:2.447 de
--,Iey t es igual a 0.025: Pr (? > 2.447) : 0.025.
La ley de distribucin de X
Srpongamos que se obtiene una muestra X1, X2, . . ., Xn de una poblacin que sigue una ley normal
-l'(p,,o2), donde o2 es desconocida. Entonces, se cumple que la variable aleatoria 7: j
s/\/n "igu"
.ra ley de Student con (n - 1) grados de libertad. Es decir,
/ t- \
Pr(X < ):
' Pr (r.- Z- 41
sl'/n)
\
Ejemplo. IJn fabricante de cigarrillos asegura que el contenido medio de nicotina, en una de sus
-arcas) es de 0.6 mg por cigarrillo. Una organizacin independiente mide el contenido de nicotina
-e 16 cigarrillos de esta marca y enclrentra que el promedio y la desviacin estndar son de 0-744 y
-.i75 mg de nicotina, respectivamente. Si se supone que la cantidad de nicotina de estos cigarrillos
= una variable aleatoria normal, qu tan probable es el resultado obtenido por la organizacin
- Cependiente?
i'.,iucin: Se tiene que p:0.6, s:0.175, n: L6. Encontremos la probabilidad de hallar un valor
::omedio igual o superior a 0.744.
) Ia lectura de la tabla de la ley con 15 g.1., resulta que Pr (" > 3.29) : 0.0025. De manera que el
-'Lto proporcionado es muy poco probable.
190 Captulo 6. Distribuciones de Muestreo
SLrl>orrgtrrnos qLlc se clispone de dos pol-rlaciones que tienen rriedias Ft y lrz y varianza, ol v o)r.
respcctivarnente. Sean X1 y X2 ias lreclia muestrales de dos muestras leatorias indepenclientes de
tarrrros TLr y rL2l seleccionadas lesrcctivarnelte de las poblaciones 1 y 2. trntonces, X1 - X2 cunlple
qr.le:
2. o7r-r: Var(Xr
o?-l- oZ
-2): TL1
-
I
-ln2
7-
(Ft -x2) - (pr- t'z)
<z< 2-(40-40
r:d------'=t
t5'
tl-L-
Vro go
o(1.55) - o(-1.55) : 0.9394 - 0.0606
0.8788.
Supongamos que se dispone de dos poblaciones que siguen una ley normal: la poblacin 1 sigue una le-
.M (lrr, ol) y la poblacin 2 sigue una ley ,A/( 12, 03) . Sean X 1 y X2 las media muestrales de dos rnuestras
aleatorias independientes de tamaos Uy n2, seleccionadas respectivamente de las poblaciones 1y 2.
6.4. Otras disribuciones de ntuestreo 191
Lr r'r'irbkr alcat<llia
(*.*)'
9-
1ntlft2
Ft:Lfx,
fl,'t a
y Fz:!fy,.
nt- u
- i:l i:t
, 1r ,^ ^\ pt(J-pt).pz1-pz)
2 -Pt-P2
va - '*-\rr
vaLtul
- r''/
tt)t T )
- - TL1 n2
3 Para n1 y n2 suficientemente grandes, la variable aleatoria
- -
.
t-.-
-rr
\- -.
L92 Captulo 6. Distbuciones de Muestreo
sigue aproximadamente una Iey normal estndar (por el del Lmite Central). Es decir,
t-(pt-pz) t-(pt-pz)
Pr(Fr - lt) =rr( , t
Fz
\
ffi
U"r-rr" Un2
Ejemplo. Una-6rma especializada en sondeos polticos afirma que el 30 % de las mujeres y el20%
de los hombres estn a favor de la reeleccin del actual alcalde. Si se hace un sondeo aleatorio a 150
personas de cada sexo, con qu probabilidad la diferencia entre las proporciones muestrales de las
mujeres y de los hombres es, en valor absoluto, menor a 0.19?
n1o
-pt-rn
0.3(1 - 0.3) , 0.2(1 - 0.2):0'00247' A
150 '* ff
Buscamos la probabilidad Pr (lfn - f^l < 0.19):
pt(10
-0^l < 0.19) : Pr(-0.19 <Fn-A' < 0.19)
La ley de distribucin F
Sean X1 y X2 dos variables aleatorias independientes que tienen distribucin y2 con nL y n2 grados
de Iibertad, respectivamente; entonces la variable aleatoria
,, xrlnt
' - Vrln,
sigue una distribucin F (de Snedecor) con (n 1, n2) grados de libertad, que se Ia notar como F(n1,n2)
(Vase la Figura 6.3)
Su funcin de densid
-??2\ n,/2
I (-)n'i"'n,
-/rt n2f2
: 2n|(n1+ n2 - 2)
E(Y) "^,sin2>2
TL2-
y Ya{V1: nt(nz-2)z(n2-4)' sn2>.4.
Ntese que esta ley depende de dos parmetros (nt,nz) que corresponden a sus grados de libertad del
numerador y del denominador, respectivamente.
Los valores de las probabilidades vienen tabulados. En la tabla 4 del Apndice se presenta el valor r
para el cual la variable aleatoria V - F(n1,n2) es igual a una probabilidad a: Pr(V ) r) : q.
Para la lectura de los valores porcentuales del extremo inferior de la tabla de la ley -F se emplea la
siguiente relacin:
F1r-,"(u,nil p,()r,nr)
Ejemplos
2. Hallar el valor de r tal que Pr(V { r):0.05, donde V - F(6,9). Aqu, n1 :6, TL2:9 y si
Pr(V < z) : 0.05, entonces Pr(V > r) : 0.95. Por la relacin anterior,
Fo.gs(6,9) : 1L :
,. ou.g,
^:0.244.
^2
La ley de distribucin d" 1
si
S rpongamos que se dispone de dos poblaciones que siguen una ley normal: la poblacin 1 sigue una
ol) y Ia poblacin 2 sigue una ley J!'(pr,"}). Sean sl y s2rlas varianzas de dos muestras
-.r-,A/(21,
ieatorias independientes de tamaos n).y n2t seleccionadas respectivamente de las poblaciones 1y 2.
trntonces, Ia variable aleatoria
'n- '?1"?
'31"3
:-3-ue una distribucin -F' con (rt - I,n2 - 7) g.I.
t
fengamos presente que si o?: o3: 02, entonces f' : 3 - F(n, - !,n2 - I).
D2
Ejemplo. Una marca de automviles tiene dos plantas que ensamblan el mismo modelo de autos.
=l rendimiento de estos automviles debe tener la misma media y desviacin estndar. La empresa
--ene Ia poltica de regularmente comparar los rendimientos de los carros ensamblados, escogiendo
t94 Captulo 6. Distrbuciones de Muestreo
rnrr<lstlas aiertorirs en las clos plarrta.s. Se tonluorr serx.ls mrrestr'lrs cLc tarriro 30 y se controlrj lr
clcsvircicin estirrclar clc:l corrsumo clc c:acla urrr. Hallar' 1zr probabilicLrd clc quc lr clesvircicin cstrrc1-rr
cle una rnucstr] ser al rnenos 1.5 r't:<;es nravor qrtc lir clt: l:r seguncla.
- :.,( p,.r^)
", (; ")
Como F : t: - F(29,29); entonces.
/.?
001<r.( > 2.25) < o.o2b,
6.5. Ejercicios
Distribucin de la media
1. Para una prueba de aritmtica se sabe, con base en Ia experiencia, que la puntuacin media es 7[t
puntos con una desviacin estndar de 12.5. Si se aplica la prueba a 90 personas seleccionadas
al azar, aproxime las siguientes probabilidades:
2. En una ciudad, el peso de los recin nacidos se distribuye segrn una ley de media : 3100 g :
desviacin estndar o : 150 g, Halle los parmetros de la distribucin que siguen las medias de
las muestras de tamao 100.
o
!). Un actuario estableci el siguiente modelo probabilstico sobre los sueldos que reciben los traba-
jadores en el sector de la agroindustria:
4. Las normas internacionales de calidad indican que los neumticos deben durar al menos 33 m:l
km. Un fabricante de neumticos seala qlre su producto tiene una dulacin promedio de 34 nr-
km y desviacin estndar de 4 mil km. En un iaboratorio que controla la calidad de fabricacin s=
probaron 36 llantas de esta marca. .Cul es la probabilidad de que, en promedio, los neumticc'.
probados no cumplan con las normas internacionales?
IEste valor se obtuvo mediante el empleo de r.rn proglama conputacional.
Nosotros) por la lirnitacir-r cle las tabla-.
solo podemos acotar el valor de la probabilidad.
6.5. Ejercicios 195
5. El tierripo qne los usurios dc nna emplcsl intcrlplovirrcial de transpolte esperan l)ar'r cpre stl
brrs salga clel telrninr1 es rrn r'ariabk: alcatolia con mcclia. rle 8.2 rnin y clesr.'iacin estnclrr cle
5.5 rnin. Sr-rporrga qnc err uri lus se ernl;arc:trorr 49 p:rstr.jeros. Halle lr probabiliclacl cle clue el
tienipo plorneclio quc ellos turrielori cllre esl)elal sel:
[1. La gente que freclrenta cierto bar tiene una probabilidad de 0.001 de salir y cantar con el grupo
que est actuando. En una noche de fin de semana hay 150 personas en el bar. Cr-rl es la
probarbilidad de que al rnenos una pelsol1a salga y cante con el grr-rpo? (Suponga que cadr
persona en el bar toma la decisin independienternente del resto. Halle el verdadero valor y erl
aproximado)
8. La estatura de los varones de 18 aos de Quito sigue una distribucin normal de media 162 cm
y desviacin estndar 13 cm. Se toma una muestraalazar de 85 de estos chicos encuestados y
se calcula el promedio. Cul es Ia probabilidad de que este promedio se encuentre entre 159 y
164 cm?
9. EI centro de cmputo de su universidad dispone de un servidor para gestionar las pginas web
personales de profesores y alumnos. Supongamos que la cantidad de memoria ocupada por una
de estas pginas puede considerarse como una variable aleatoria con una media de 1.3 Mb y
una desviacin estndar de 0.3. Si el servidor va a gestionar un total de 500 pginas, calcnle,
aproximadamente, la probabilidad de que la cantidad promedio de memoria necesaria supere los
1.32 Mb.
10 Se efectu un anlisis sobre Ia duracin de las mquinas impresoras, de una cierta marca) que
tienen las empresas prblicas. Se eligi una rnuestra de 179 mquinas utilizadas en una empresa
elegida al azar. La vida media de las impresoras result ser de 3.33 airos y una desviacin
estndar de 2.05 aos. Con una probabilidad del 99.7%o, en qu intervalo de tiempo puede
considerarse que se encnentra la vida media de las impresoras de tal marca?
Con una muestra de 160 entrevistas realizadas a mujeres que trabajan, result que el gasto
promedio mensual en arreglo del cabello fue de 39 dlares y desviacin estndar de 5.2 dlares.
Con una probabilidad del 99.7To, entre qu lmites variar el gasto medio en arreglo del cabello
para las mujeres que trabajan?
Un proceso automtico llena fundas de chifles cuyo peso medio es de 450 g y una desviacin
estndar de 3 g. Pala controlar el proceso, cacla hora se pesan 36 fundas escogidas al azar'; si
el peso neto est entre 449 g y 451 g se continlra con el proceso, en caso contrario se detiene el
proceso para recalibra,r la mquina.
a) Cul es la probabiliclad de detener el proceso cuando el peso neto medio realmente es 450
b')
b) Cul es la probabilidad de aceptar que el peso neto promedio es 450 g, cuando realmerite
es de 448 g?
_.f
-'f . La vida til de cierta rarca de llantas sigr-re unt-r distribucin normal X con media 38 mil km y
desviacin estndar 3 mil km.
196 Captulo 6. Disribuciones de Muestreo
a) Si Ia utilidad Y (en dlares) que produce cada llanta est dada por Ia relacin Y :0.2X -f
100, cul es la probabilidad de que la utilidad sea mayor que 8900 dlares?;
b) Determine el nmero de tales llantas que debe adquirir una empresa de transporte para
conseguir una utilidad media de al menos 7547 dlares, con una probabilidad de 0.996.
14. En Manab, el peso de los esDosos y de las esposas se distribuye segn las leyes
y N(64,69), respectivamente, y son independientes. Si se eligen 25 matrimonios, ^/(80,100)
al azar, de
Manab, calcule la probabilidad de que el promedio de los pesos sea a lo ms 137 kg.
Distribucin de la proporcin
1
15. Se extrae una muestra aleatoria de 150 elementos de una poblacin binomial corr pt :
4' cul
es la probabilidad de que Ia proporcin muestral satisfaga
*=U= *t
16. El suceso A tiene una probabilidad de 0.4. Esto significa que esperamos que la frecuencia relativa
de A est cercana a 0.4 en una larga serie de repeticiones del experimento que se est modelando.
Cul es la probabilidad de que en 1000 experimentos, la frecuencia relativa est entre 0.38 y
0.42 (inclusive)?
17. La FIFA est interesada en conocer si las selecciones nacionales ganan ms de la mitad de
los partidos que juegan en casa. Suponga que se escogen aleatoriamente los resultados de 80
partidos, efectuados en las ms recientes eliminatorias para el Mundial de Ftbol, y se encuentra
que 65% de ellos fueron ganados por el equipo local.
18. Supongamos que el 80 % de todos los residentes en Guayaquil celebran la fiesta de Navidad (el 25
de diciembre.) Se planea seleccionar una muestra aleatoria de 300 guayaquileos y determinar
la proporcin de ellos que celebran la Navidad.
19. En un canal de transmisin de datos Ia probabilidad de que un bits se reciba con un error es
1 x 10-5. Si en una transmisin se envan 16 millones de bits, cul es la probabilidad de que
no ocurran ms de 150 errores?
20. Segn las estadsticas de trnsito, se ha establecido que en una noche de viernes, en promedio.
1 de cada 10 conductores est ebrio. Si un fin de semana la polica realiza 400 pruebas de
alcolemia, cul es la probabilidad de que el nmero de conductores ebrios detectados:
6.5. Ejercicios L97
21. Supongamos que el 40% de los votantes est a favor de Ia reeleccin del actual alcalde.
24. En la segunda vuelta electoral los resultados clan que el candidato ganador obtuvo el 55 % de
los votos. Cul es la probabilidad de que en una encuesta realizada a 169 personas el resultado
no muestre una mayora a favor dei candidato?
o
En una encuesta realizada con una muestra de 3000 personas adultas escogidas al azar, ha
resultado que el 35 % toma caf al menos una vez al da. Con una probabilidad del 95.5 %,
entre qu lmites variar esta proporcin para Ia poblacin completa?
26 El tiempo que esperan los peatones para crllzar una va muy transitada se distribuye en forma
exponencial con media de 1 minuto. Si en una hora llegan 95 peatones, calcule la probabilidad
<i de que por lo menos la tercera parte de ellos tenga que esperar ms de un minuto.
-.-
Lr--
Distribucin de la varianza
28 Con el empleo de Ia tabla de la ley X2 Iocalice Ios siguientes valores y represntelos, aproximacla-
mente:
rr 29 Si X1 , X2,...,X9 son nueve variables aleatorias independientes y distribuidas segn una ley
l.- !-
It[(t2,32), calcule la probabilidad de que la varianza muestral sea menor o igual que 56.28.
30 Calcule Ia probabilidad de que una muestra de tamao 13 seleccionada de una poblacin normal
con varianza 4 tenga una varianza muestral:
31. Encuentre la probabilidad de que una muestra aleatoria de 20 observaciones, de una poblacin
normal con varianza o2 :5, tenga nna varianza nuestral s2: a) rrayor a 8.1; b) entre 2.66 y
9.52.
ta
L, En los ltimos 5 aos, las califlcaciones del exarrren de aptitud para el ingreso a la universidad,
siguen urra distribucin nolmal con variarrza o2 :8. Considerara usted o2 :8 como un valor
vlido de la varianza de las notas de los exmenes que se rindieron este ao, si una muestra
aleatoria de 20 calificaciones arroj un valor de s2 : 16?
J.t. En una oficina de seieccin de aspiral.tes para optar por una beca se estudia Ia varianza de las
calificaciones para identificar fcilmente a los mejores aspirantes. Para una prueba de matemti
cas se supone que las calificaciones se distril)uyen normalmente con desviacin estndar de 10.
Hay 15 aspirantes a optar por una beca. Calcule Ia probabilidad de que la desviacin estndar
de las calificaciones de clichos aspirantes sea mayor clue 7.
q/
t)1. En una granja pisccola se mide la varialrilidad en el peso de los peces capturados. Las normas
internacionales indican que el peso est distrilruiclo segn la ley normal con varianza o2 : 225 82 .
.)/ Si X1, Xz, ..., X9 son nueve variables aleatorias independientes y distribuidas segn una Iey
/(8, 4), calcule la probabilidad Pr (f ST < 9; 1.09 < t2 < 10.045) . (X v s2 son independientes)
38 En la ciudad capital. el precio rredio de venta de las casas nlrevas es 115mil dlares. Se toma
una rnuestra aleatoria de 10 casas nuevasr resultando una desviacin estndar de 25 rril dlares.
Cul es la probabilidad de que la media muestral de los precios de venta sea:
39 Se tom una muestra de 16 directores de oficinas de una ciudad con el fin de estimar el tiempo
medio diario que emplean en desplazarse hasta su trabajo. Si Ia media cle los tiempos es de 87
minutos y Ia desviacin estndar de 20 minutos, calcule la probabilidad de clue la media muestral
sea menor de 100 minutos.
40 Con el empleo de la tabla de la ley F localice los siguientes valores y represntelos, aproximada-
mente:
72 Dos nruestras alertotias irrclependicntcs cie tanraos 7 y 13, r'cspcc:tivarnente, se totu] dt: ula
rnisrna poblacin rronrrlrnente clistribrriclr. .Cul cs lir probabiliclid cle que la variarrz cle lr
llirnela rnrestla scl rr)r-\/or igrral zrl tliplc clc lr r'rlianza cle lrr strgrrndr mucstra?
Una muestra aleatolia de tarnao 16 sc seleccion a partir de una poblacin normal de media 75
y desviacin estndar B. Una segunda muestra alcatoria de tamao 9 se tom a partir de una
pobiacin normal de media 70 y desviacin estndar 12. Sean X1 y X2 dos medias mrrestrales.
Halle:
6 Una firma comercializaclora afi.rma que el peso medio (en gramos) tq y pz de dos marcas de
atrr enlatado, A1 y Az, es el mismo. Para verificar la afirmrcin se escogen dos muestras
independientes de tarnaos 36 de cada marca. Si la rnedia mlrestlal de A1 es mayor que la
media muestral de y'.2, sc rechaza gue Fr : 11,2, e\ caso contrario, se accpta gue Fr : 1tr. Cl'l
es la probabilidad de aceptar eue lr : lt2, cuando realmeute p : ll2 l2? Suponga que las
poblacionales son o?:9 y o2n : 4.
Para comparar la duracin media (en rneses) Ltt y ltz de dos marcas de bateras , A y B, se
tomaron dos muestlas aleatorias independicrrtes de tamarlos 32 y 36, respectivamcnte. Si Ia
duracin promedio (mrrestral) de ,4 es mayor que la de B en ms de dos rneses, se acepta que
ltt ) l-tz; caso contrario, se acepta qlre /t : 1t,r. Calcule la probabilidad de aceptar q:ue 17 ) r"2,
cuando realmente Ft: ltz. Suponga que las varianzas de las duraciones son o2: 16 y o2B: g.
,i
EI administrador dc r-tn edificio quiere decidir la compra de lmparas fluorescentes de mrca 7
o [/. Pala ayudarle a lealizar su decisin) se escogen dos muestras de tamaos 10 y 9 lmparas,
respectivamente, rcsultando las desviaciones estndar de s1 : 200 y sz : 150. Si la diferencia
entre los promedios es rllayor que 173 horas, se acepta eue pt I pz; de 1o contrario se acepta que
l-Lt: llt. Cul es la ltrobabilidad cle aceptar cre /t f -t"2, ctando realmente pr: p2? (Asuma
que Ia vida irtil dc ambas narcas tiene distribucin normal con valianzas iguales.)
Para cornparar los salarios que pagan a sr.rs empleados dos fblicas cle cobijas, San Lucas y
Cebra, se escogen dos muestras aleatorias cle tamaos 16 y 13, respectivamente, de las dos
fblicas. Result que la^s desviaciones estindar filerori sr: I20 dlales y sc : 55 dlares. Si
la difer-encia entre las rnedias rnnestrales no es tr]yor a 65 dlares, sc acepta que ,r,1 - /-2; caso
contrario, se accpta eue /r,1 I Itz. Cul es la probabilidad de aceptar que /1 I p,z, cuando
lealrtretrte Ft : I,tz7 Suporrga que los salarios, cn ambas empresas, siguerr una distlibucin
nornral con valianzas difeleutes.
;c Dos plogramas de televisin tienen como latings 40% y 20Vo, t'espectivamente. Se tom una
muestra de 300 hogales qne poseen televisor, durante Ia transmisin del programa A y otra
muestra de 100 hogar"es durante Ia transmisin de B. Cul es la probabilidad de que los
resultados muestren qr:e el programa A tiene un rating mayor al de B, en un 70%?
Captulo 6. Distribuciones de Muestreo
52. Se escoge una mnestra de 600 electores crrc acaban de votar, entre la,s 9:00 h y las 15:00 h, pare,
estimar la propolcin cle votantes a favor de los canclidatos H y M. En una encuesta rerlizada l.
vspera, se estim en 30% y 35% los polccntajes cle apoyo de los dos candidrtos, respectivanielte.
.Cr"rl es la probabilidad cle clue la proporcirr rnuestral de B excecla a la proporcin rnuestral de
A en al menos I0%?
53. La msica romntica es preferida por el 30% de mujeres y eL25 % de hombres. En una encuesta
realizada a 300 personas de cada-sexo, cul es la probabilidad de qne la proporcin muestral de
mujeres que prefieren la msica romntica, sea mayor a la de los hombres?
Crptulo 7
Estlmacin de Parnnetros
:n el Captuio 1 se expusieron varios mtodos qr-re permiten descrilrir un conjurrto de datos de rna-
,-era r'pida, generai y efi.caz; estos mtodos son grtficos y su intelpretacin es fcil, pero tienerr el
:-cortverrieute cte la dcscripci<in cle los datos no es rnica y no sc plcstan para realizar Jrreclicciorres.
:l rtso clc la ittforrnacin que se obtiene a partir dc unr muestra pa.la sacar corrcinsiones soblc lr
;.1. Estirnacin
-. teora de 1r estirnacin de parmetros fue clesarrollacla en las primeras dcadas clel siglo XX,
Ilo rurt parte de otra teora (las pruebas de hiptcsis) y sistematizaclir por J. Neyrnarr cu 1934.
-- tualmente, esta teora es la basc de cr-ralquier estudio estadstico.
-"tartclo sr toma ttna nutestra de una poblacirr, e1 olljetivo es tenel un indicio cle los valoles cle los
.-rrnetros descorrocidos de sta. Tal proceso se dc:nomirta est'imarcin y a los valoles crlculrclos
'. inladores.
Definicin (de estimador) IJu cstimador es rlua nieclida estrdsticr qrre permite conocer o
-:,a idea del valol de ttn paliimetro dcsconocido, basndose en la informacin de la mr-rcstra.
- :' ejcrnplo, si disponerrtos cle una poblacirr cr-rya rneclia .r, es desconocida, es natulal cscogcl el
:. rrnedio r conro estirnador clr-. r,.
,:,,selvemos que un estirnar,lol es nna variable aleatolia; rnientras que Llua estirnacirr es nn nrrnct'o.
:--lr.ttrs veces)
los estirnadorcs dc los parzmetros poblacionales se distingr"ren clel verdadero r'rlol
:'--diante el empleo del smbolol Por ejenplo,
20r
202 Captulo 7. Estimacin de Parrutetros
Las siguientcs secciones lrs declicalenros r cono(icll las plopiecl:rclcs cle los cstinrrdores clc los pnr'metr,,-
poblacionales, a evaluar su r.aliclez \' r cxporlcr s'.is aplicaciones.
Cuando sc obticrre una rnuestra de nua poblacin, el objetivo es tomar una decisiti cu brse de I
estadsticos calculaclos a partir de los datos rnuestlales; luego ellos se resumen en frascs como I..
siguientes:
1. trn 2930 de los 10 000 hogares de Ia ciudad se sintonizaba cierto prograrna de televrsrn.
Los estimadores anteriores dan una idea concisa de los resultados de la muestra, pero no inform.:
de su precisin. As, pudiera haber gran diferencia entre tales estimaciones, calculadas a partir C=
una muestra, y Io que uno podra obtener si dispusiera de una cantidad ilimitada de datos. Pr::
ejemplo, 74Vo sera una estimacin razonable (o prediccin) de la desocupacin el prxirno mes; per'(,,
',cun <<buen>> estimador es? Teniendo en cuenta Ia variacin en el mercado laboral, sabemos que e:
improbable que el prximo mes haya un nivel de desocupacin de eractamente el 74%. Sin embargc
podemos esperar que su valor sea <<cercano>> alI4To, y qu tan cercano? Podemos esperar que se:-
dentro del 10.1% el estimador?, o dentro del tl Vo?, o dentro del +I0%?
A partir de la discusin anterior podemos deducir que existen dos tipos de estimadores: uno que ci:-
un valor numrico qlre resume lo observado en la muestra; y otro que, adems, expresa la incertidunr-
bre debida a Ia variabilidad en los (generalmente limitados) datos. A continuacin definimos m-.
formalmcnte estos tipos.
Definicin (de estirnador puntual) Sea X1, Xz, ..., X,"Ltrra muestra aleatoria seleccionada de
poblacin con distribucin de parmetro 9. Se denomina estimador puntual del parmefto 0 a
r.rna
cualquier estadstico que proporciona una estimacirr del verdadero valor de 0.
Por ejemplo, si la media poblacional es p : 6, obtenemos ttna muestra 5r determinamos Lrn promedi,-
z : 5.85. sta es una estimacin puntual de 1.
Tambin, mencionamos que la estimcin puede realizarse mediante Lrn r-ango de valolcs entre lo.
cuales se encontrar cl verdadero','alor con alta pr-obabilidad.
Definicin (de estimador por intervalo) Un estimador por intervalo de un parmetro descono-
cido est dado por clos puntos, qne pretenden abarcar el valor leal del parmetro.
E(6):e
De otra manera ? se llama sesgado.
D--
L -_
:-'
i::
\otemos que la rlistribucin muestral para el estimador sesgado est desplazada hacia la derecha de
4. Este estimador sesgado, probablemente, sobrestima 0.
sesgo(?) :E(A) - a
Ejemplos
l
1. La media muestral X es r,rn estimador insesgado de ;, ya que E (X) : p
,n
>a x?
,i-t
\/ -X2 :
'
El estaclsti c< no es un estimador insesgado de r, ya quc E (t/F) + u
17
.'l- disponemos de dos estimadores insesgados de , interesa tener nn criterio para elegir uno de ellos
E(0:) = 0
l-igrrla 7.2: Estirnrcloles insesga<,los corr clistirrti valiarrza: Var(d2) < Val(91)
lDados dos estimaclores iusesgados de un misnro par'rnetro, es irrcferibl escoger_'el nrs eflciente. I
A vcces se prcsenfa el problema de elcgir entre dos est.irnaclorcs corr propiedades contrapr-restas: Llno
de cllrs es iusesgado y el otro es sesgado, per-o con nrcnor valianza. En estos ca,sos cs necesario dcfinir
una mcdida qrle Dos pcrmita lcaiizar tal conrl>aracin.
Definicin (de error cuadrtico medio) El error curdrtico medio debido a la estimacin de
d nrediante D cs ECM(D) - P lf e -hV].
L' l
v
u]
-
14 1, ir: ,r(Xr +,Y.r + xr;,
^t
0t: )(xr
'2- * 2_Y), 0q:-Y:
I
F-Y2-r- Xtr-Xq-X).
r("t
a) Segrn el criterio de la eficiencia, cul es el rnejor?; b) Cornparar los estimaclores0zy ?3 rnecliantc
el ECM.
Sol,ttc'in,: Calcnlemos lzrs esperanzas y las variarrzas de <:aclr r.uro de los esl.imadores:
I )
tar'(0) ;(Var (X) + 4 Var'(Xs)) : a,
DO-
44
,2
Var(?a) VallX,) : --.
r-
7.3, Estitnacitt tuttLual
205
r) Elcstinta'<[,r03css.sgirclo,rttictrtt1s.1,,,r?,.i.t:,/,usr.rrrirscsgrtles;
estinlldor
aclenrs,04:Xcsel rrc.loI
<[e 1, lol'rrte ticnr ll nrcrror r'rr'irrLzt (r,s cl rrriis <rfir:i.rrtc).
l,) Crlctrlcrtr<-s los scsg<_ls clc los dos cstiru;r, lorcs
l') :
ECM(as) : Var(?3) +(."rgu1D3)2 :-Tii:o' /7 \2
. La esperanza de X es
E(X) : --E
I
_1 ttt'' : !@r')
lt ?t
f
De manera que T es un estimaclor insesgtrcl r.t <I<: t.
La varianza de X es
o-,
77
5"*l --,,,
206 Captulo 7. Estinacin de Parntetros
os rlll cstirlrrclor'lrrrrrlrral ci<r o2. rerro lirtuc cl irLc:orrvclricrrl.c clc s<:r scsgado. pol Jo (rc sc rkrfinc
. Lt esJrer'lnza de .92 es
D(xu -x)'
,i.:t
rt-7
', f "
E(s2) : fr' + o") -, ,lI (r'- #)l
" - L=l ' )
I.).)r.)1,)
: -i-(npt
11
+ no2 - ,, r2 - o2) : n-l (n - l)o:
-t
: o2.
2oo
L r'arianza de ,S2 es Vzrr'(52) : (este resultaclo no se clernostr-ar' ya qLle su complejida,J
TL- a
|
sale del alcarrce dc esta obrz-r) .
Para detelrniual la cstimacin cle rLn pirrmetro poblacional existen varios nitodos, los dos ms im-
roltantcs son el de los rnomentos y el de mxinra verosimilitud.
EI rntoclo de estiniacin de los tnornentos fire dcsarrollado pol K. Pealson en 1880. Es r.rn mtodo
gcller'rl t1c estiulrcirr de uuo o ms pirlzinreltos y se brsa cn lr idea de tornrr conro estimadol cle la
media a la rneclir rnuestlal. colrro estirntclol de It rtaliarrza r Ir valianza rnnestlal, y as succsivmente.
Err genelirl, si derrotrrnos fr,: E(X'), denominrdo el A-simo nn'ntento teri,co clr larrariable X. EI
/i;-siro nt,cnett,to nnt,e,stra,L es 1r valirble
rrl
i^ : L, rL
A, : 1.2.3.. . .
El itcorrvcuicnte cl<,r cste rrrtoclo es (lrre los estirrrr,:loles olrtclri<[os, rnnc:hzrs \eces sou sesgt(los.
Ejerrrplo. Disp<trrcrrros <le rrtrt lnllestr'r Xt, X2,.. ., I,,. ixovtrtriculr: clc ttttt irrtblaciu t:orr rlistlilrrr<:itr
Ul-9,l , rlorr<lc d > 0 cs clcsc:ouociclo. Hlirr'li cstirnrcirr clc .
Sea X1, Xz, ..., X,, una mnestLa proveniente de una distribr-rcin con par'rnetro 0 y ley ,f (r;0). El
procedimiento a seguir es el sigttiente:
3. Hallal el valor cle d que maximiza Ia log-r'erosiniilitud. En este casoT es el valor'?, q.," cs solucin
de Ia ecuacirr
dt
-:n
d0
Ejemplo. X2, ..., Xr, Llna muestla provenierite de tirra poblacin con distribucirt
Sea X1 , N(p,o2).
Hallar los estimadoles de p. y de o2.
(X=
SoLuctn: La funcin cle densidad de la ley es /(X; p,o2) : +"*O-'v (- f)'\
2o2 )
/2tro \
208 Captulo 7. Estimacin de Parutetros
1'r
t(p,o'): Iog(.1(r, o2)): -|bgQno2) - *f(xo-,)'
O' i_1
-
p):0,
#:-o* # lrx,-
de doncle p : - x.
Por ctlo laclo.
nI 1
-t7 +;VDtx' - p)2 :o
0t, 'L
o(ot) i:l
IL
Drxn-X)'
cuya solucin es o2 : l-1
: S*2.
l.D. Ejercicios
1. <El pr-incipio subyacente etr todas las tcuicas de inferencia estadstica es que nllo Llsa estads-
ticos rnuestrales para aprendel algo (es decir, para inferil algo) acerca de los partirnetros pobla-
cionales>>. Si usted entendi Io qr.re quiere decir esta afir'macin, escriba uu 1>iillafo en el que
describa una situacin en la que se pueda emplear un estadstico muestlal para irrfelir algo sobre
uu palrimetro poblacional. En su ejemplo, identifique claramente Ia rnuestrtr, Ia poblacin, el
estadstico y el patrnetro. Sea trn especfico como sea posible y no use cjelnplos clad<ls en el
Iibro.
2. Se tomr Lrrta muestla cle tamairo 4 de una lroblacin de rnedia t" y varianza o2. Sc lrroptnre los
siguientes estimadores de I media:
Xt -l Xz + 3X4 -f
0,: , 02: Xr Xz + 2XJ
4'
03: Xt'l Xz * Xs * Xq Xt*Xz*X+X+-J
, 6n:
lndique su orden de prefelettc;ia (clel me.jor al peor) 1, explic$re los motivos dc su <rlrsificrli,irr.
7.5. Ejercicios
3. Dos muestras alcatorias independientes se extraen de una poblacin con media p, y varanza o2.
Los tamaos nruestraleS Sor ??,1 y rL2 : ? v tu. meclias muestrales son X1 y X2, respectivamente.
2'
Para estimar a lL se proponen tres estimadores,
4. Si se dispone de una muestra Xt , Xz, X3 de observaciones que siguen una ley exponencial e Q' 1 0) .
0,
*t .
: .yr, 0., : ', :2"2 a, : IJ:3!2, :x an .
5. Si se dispone de una muestra Xt , Xz, X3, Xs, Xs de observaciones que siguen una ley de Poisson
P(^). Considere los siguientes estimadores:
Xt -f2Xz * X: * 2Xq -f Xs
a,
0n :xl+xl.
a) Cules estimadores son insesgados para )?;
b) trscoja el mejor estimador insesgado de ).
A partil de una poblacin que tiene media p, y varianza o2 se tomalon tles muestras de tamao
rtr : 7, n2 : 74 y nz : 9. Sean sl, tS V t:3 las varianzas muestrales calculadas a partir de las
muestras. Compruebe que
t tsl+usi?r+osl
30
El nmero de clientes que ingresan a una librera en una hora es una variable aleatoria X que
sigue una distribucin de Poisson con media ). Se dispone de una muestra aleatoria Xt, . .., Xn
del nmero de clientes por hora.
SiXl y X2 son dos variables aleatorias independientes tales que E(Xr) : E(Xz) : p y
Var(X1) : Var(Xz) : 02 j determine si el estimador.
10 Suponga qr-re X1 y X2 son dos medias muestrales caLculadas a ptrrtir de dos nurestras dc tarnao
n,r y n2, respectivamente, obtenidas dc una poblacin normal de media r, y varianza o2.
11. Considere una sucesin de variables aleatorias Xr, Xz, ..., X", independientes e idnticamente
distribuidas que siguen Lrna ley uniforme en el intervalo l0 -7;0 +tl, donde I es un parmetro
desconocido. Denotamos por X," el promedio de estas variables.
12. Sea X1, .. ., X,, una muestra aleatoria de una poblacin con la siguiente distribucin discreta
_1. ) Sca X1, .. ., X2s una mnestra aleatoria de tamao 25 una poblacin binomial de
r e (0, 1).
Pr(X: r): Cp'"(1 - r2-z
Determine estimador de mxinia el valor 0 ocurre 5 veces, el valor 1 ocurre
11 veces y valor2ocnrre9veces.
15. EI tiempo, eu ltoras, que dura un elemento electlcinjco es Llna vtrriable aleatoria ? que tienc.
distribucin exponencial de 1:irrmetro ). Pala estimrr ) se pruebzrn 30 elemerrtos y sc enclrentLa
que 18 fallan antes de Ias 600 horas de uso.
7.6. Estintacit) pof intervtlo 217
rL) \lr'<li;tLrl,: r'l Lrri'rtr.rr-[<l <l.c rulxiLrlt vctosiurililrr<1. <rstirnar I;r lrLo1>or'{:irjn <l<r t<t<los ]os clcrrrclrtos
rrtt' Irll;ur ;r]l1r' <lc l;ts 0()() lrrlr'rs
lr) tltilir r: r'I tt'ru]ttrlo rlt ii) I)u r ol rltrrrt'l lul osl irrrr,-lor rlr: ).
10. A lr.' l;trgo rlc rttL tio, lr ltcnrl rrr rlc tigrillo prrctlc tcrrcr rurr o rLos r:r'its. o lr() t<:rrct rrttrgrtrr;r.
I)
Scg-rirr tllr ('sl ttrIio ttrt]iztclr-' pot lllr grrrl)o tl<r zorilogos. lir plopolr:iirr rle lrcnrllrls slll (:llts os -..)
.)
t) IJrillc <,'l urirnr:Lo mc<iio csl)cllirclo clr: cr'as pol lrcrnlrrir r lo lalgo clc un rrio:
lr) AI lcllizar un cstrldio de 200 henrlrr's chrlantc nu o, cl ccripo cle cientfir:os nlcliciorri(lo
cncontr' 55 hembras quc rlo hur tenido crt.rs, 106 quc h.u) telido urra cra y 39 clue han
tcnido <1os. Eshirrrc el par'rnctro p l)or el rntodo cle lrs lnomentos.
L7. EI control tle r.rna paltidzr de loclillos se rcalizr clasificardo las piezas en leqneas, rrormales y
glatrdes. Ltrs propolciones tet'icrs sc stlporel) pr : 0.05; pz : 0.90; ps : 0.05. Pero sc sospeclta
clLte h'r. aumentado la dispersin y, por tanto, las piczas siguen las ploporciones: pr : 0.05 f ;
pz : 0.90 - 3n; ps : 0.05 + 2r. Se anrlizal 5000 riezas obteninclose n1 : 7278; n2 : 2928;
?B : 794 cle cacla clase. Obtenga una estimaciu cle ntxirna verosimilitud cle .
-is. por ejcrnplo, con base eu ula rl)uestr'r cle hogirres crr los quo se est r'icndo televisin, podemos
Itrstruir urt inten alo qlre coltenga, corl un glado cspecfico de coufirbilidad, la rnedia o la desviaciu
,-.tnclal clel tierrrpo clue ia roirlacir'r consrrltacla vc tclcvisilr .
-rtltes cle aulliz1r los r-lifclctrtes crsos) cxnrincrnos zrlgrrntrs icletrs irrclirninrlos.
Dcfinicin (de intervalo de coufiatrza) Uu interr'rlo cle r;onfianzl cs nn rango cle valores,
llcttlrclo zr par [it de ios clatos rnuestrarles, el clral 1-rrobablcrnento incluye cl verdadero vrlor cle nn
-,
r irrret,r'o r lescorrocido.
.-, cadr intcrr,'alo cle confiattzr se Ie rsocit rrna 1l'obtrbiliclacl (l - o) clc clue corrtenga el veldrrlero \/alor
-'llratiirnctlo . A tal ptolrabilidarl se lt: clclirnitn t,tc,l d,e cort,fia,ttzn, y a los cxtrernos cltl irLtelvalcr
tie i.n,.feri,tt v Litn'ittt srtltel"ior'<l<t c:<trrfiurza: (LIC:.LSC). Esto s<: r'esLunc cll
r\(LIC<0<LSC',):l ri.
-',- irrtt:tr'rkr <1ur: c:rttnllle cstrs c:ottdicioues se <ierLorlinit'i,tttet'uo,l,o d,e co'n,tiarr cle rrivcl (1-or) xI00(/r.
- :t t<:ucr tr,'sultitclos firlrl<s. ci rrivc] clc r;orrlirnzr <lcbr: ser'rlto, lo rnis cercir.lro a ruro: gc:trt-.rtrlnrerrtc
., f ornr 0.9. 0.95 o 0.99.
:- rtrcho de tLl iltten'alo clc crttfirrtzr nos da lr icier clc curnta inc;cltidumble existe, alredcdor del
,:iurctlo rlesc:onociclo. Uu inbelvalo muy rncho prrede inclicrr qtre deber'arnos recolectar ms datos
-"-tes clc dt:cil algo tlefinitivo solre el partinretro.
212 Captulo 7. Estitnacin de Parntetros
Ulr intervaio cle conlianza para lir mcclia poblacional vcl clel 100(1 a) %, cst cla,:,lo por
o
(t- ttt/,2 r1r
.; L (7 1)
vn
Dondc:
a n es el tamaio de la rnuestla"
zo2 eI valor z que colresponde al .",- I en el extlerno superior de tra distribucirt norrnai
2
estrrdar; es decir, 7 - (z*2)
\ttl.,/2,
: : (Figura 7.3).
Acln se aplicir el Teorerra del Lmite Central y es aconsejable tencr un tamro rnucstlal n) 25.
Iln Xrr siguiente tabla se preserrta ios intervalos de confirnza ms corrLrrrtnente usaclos:
Nivel de
cor:fiarlza
0.90 0.10 1.6.15 I.6a5 oI /n ;) 1.645 o l1/n,
0.95 0"05 1.96 T. 1.96 o I yE 4), t.s6 oI l
0.99 0.01 2.58 '-u 2.58 o I y, ;I 2.58 o I y.
Observaciones
2. Prresto (llre Para urr valol de znr2:3 sc tierie un rtir.cl cle r:ou{ianza clcl 99.7%- crr las zrPlicacionc..
prcticas sc supone que nrl intelvalo <le conlianz al 99.7% conticne el r'rlol cle lir rnediir, co
I rttltt ttO'"'''O o O '
Estirnacin de la rnedia cuando Ia varianza es conocida 2L3
Ejernplos
Deterrninar un intervakt cle confianza cle nivel 95 % pala Ir rneclir poblacional p" s n: 36,r : 15
y o2 :3.24.
Sol'uci,n: Sabemos cuie :3.24, o sea o:
o2 1.8,
/ o=) : /
(r- - .. o .o,' 'atz
'o/2
^ o\ ''rw
I.B
ltt-1.96{;1b+t ''' go 1.8\
| ''"" ^=-=
)
\- lE1" n) \'" 76t J36)
(L4.4t2;15.588).
/- o o\ : ( qA 3.6+ / 3.64\
In- z,2J-;T
*," + z*2:71 - - 2$:=;46+
- "- 2.33"'";
""
\ r/r,, ",. t/n ) \ ,/ JrT )
I
@6-1.2;46+t.2)
(aa.8; a7.2).
Ello significa que, con una probabilidad del gB %, la media del nmero de horas trabajadas
aquella semana se encuentra entre 44.8 y 47.2.
Segn los consumidores, las empresas pasteurizadoras de leche no entregan la cantidad exacta
de producto. Para verificar esta denuncia, se tom una muestra de 45 fundas, cuyo contenido
terico era de 1 litro de leche. Se encontr un promedio de g72cm3 y una desviacin estndar
de 51cm3. Sobre la base de un intervalo de confianza al 99.7 Vo, se puede clecir que Ia denuncia
de los consumidores tiene fundamento?
Como el nivel de confiabilidad es del 99.7%, podemos decir qlre con toda seguridad,),a denuncia
de los consumidores es verdadera.
2t4 Captulo 7. Estimacin de Parutetros
errrtlc str r,rlor vttrclaclclc> v 1.r cstiuracitirr: 17 t-Ll. Sus vrlorr:s rrrr'arr en1 rc 0 y zr, 12!-.
Pc-,clerrnos planl<:iunos erl ploblcnra r1e enc:outlal erl trrnro cLe 1r rtLr<rstla rle rrrur()I r clrLe el error rlr-
r:stirrrr:i<in DO sc1 rnayor' <re E.
El irrterr,rlo de confianzl para ia rneclia pol)lacionrl tierre Ii forrnr @ - n;r + E), cloncle p: lt - L
<rs el cu or err li estimcirr dc 1r rneclia pala el uivci cle confirbilirlad dado. Si el irrtcn'alo tierrr: 1r
- / o o\ o
Irrnrfa {:r'- 3. /.) -;Ll zo2 f , elt1.e1p5 f'::,r.2--7.
\ Vn -
\/n / \/?l
Si de esta igualdad despejamos n, obteucmos
za/2o\2
n,: |/ ------
\E/ |
que es el tamairo de Lr muestra, necesario para tener un error de estimacin -E a nn nivel de confianza
7-c..
Ejernplo. Se desea conocer la distancia media que cor-ren scmanalmente un grlipo de atletas de fonclo.
Por estrrclios anterioles se conoce qr.re la desviacin estndal de esas distancias es cle 3 knr. ;A cunto
atletas habr quc muestrear si la estimacin debe quedar a rnenos de 0.5 km de la media verdadela.
con rur rrivel cle confi.anza deI g5a/a?
Sohtczn: El irrtervalo de confianza es cle Ia forrna (Z - 0.S;r + 0.5), entonces E : 0.5 y za/2: 1.96
Se sr-rgiele que el Iectol a,juste los parrnetlos, para tenel nna rnnestra aproxirnada cle 50 rtletas, y lo.
llrteIi)rete.
7.8. Ejercicios
1. Deternine los intervalos de corrfinza al 95 To para t:I media pciblacional desconocid
l
si
n:45, r:5,
tt) o : 6.8; c) l : 13(). 7 - 1d.5. o2 : 4.2:
b) n, : 100, r:37, .,2
D
-
-L<)
q<.
d) n : 169, 7: -22, o2 : 14.
Dctcrminc rtri intervtlo en el que se pueda dccir que se encuentla el valor de la rncdia con casi
toda seguridad si
6. En cierto barrio se seleccion, al azar, una muestra de 100 personas cuyo promedio de ingresos
mensuales es z:460 dlares y una desviacin estndar de o : 200 dlares.
a) Si se toma un nivel de conflanza del 97To, Lcul es el intervalo de confianza para la media
de los ingresos rnensuales de toda la poblacin?;
b) Si se toma un nivel de confianza del g9 %o, el tamao muestral necesario para
cuI es
estimar la media de ingresos mensuales con un error menor a 30 dlares?
7 Se tom tlna muestra aleatoria de BB individuos a Ios que se midi el nivel de glucosa en la
sangre, obteniendo una media rnuestral de 110mg/cm3. Se sabe que Ia desviacin estndar de
la poblacin es 20 mg/ cm3.
8 La media de edad de los alumnos qne se presentan a las pruebas de acceso a la universidad es
de 18.1 aos y la desviacin estndar 0.6 aos. De los alumnos se elige, aI azar, una muestra de
720"
a) Cul es lir probabilidad de que la media de edad de la muestra est comprendida entre
17.95 y 18.25 airos?;
b) Qu tamao debe tener rrna muestra de dicha poblacin para que su media est compren-
dida entre 77.9 y 18.3 ahos, con uua conflanza del99.5%'l
9. Una fbrica produce varillas de hierro con Lra desriacin estndar de 25 cm. La empresa recibe
tin pedido de rrarillas que inclica que la longitud promcdio debe tener Lrna des\/iacin mxima de
10 cm de la longitud requerida. Cuntas varillas se tendrn que prodncir para cumplir con la,
especificacin, con crsi toda seguridad?
10 Se realizaron 169 mcdiciorres del voltaje de ia recl de alurnbrado prblico y se registr un promedio
de 108 voltios y desviacin estnclar de 5 voitios.
a) Cules son los lrnites de confianza, a un nivei del 987o, para el voltaje medio de red dc
alumbrado pblico?;
b) A qu nivel de confianza puede decirse que la estimacin de la media incluye el valor 109
voltios?
2L6 Captulo 7. Estimacin de Parntetros
11. En una regin geogrfica, la estatura de los individuos varores (en cm) sigue r-rna N (U;7.52).
a) Halle el intervalo de confianza al nivel 92To para estimar .r,, a partir de una mnestra aleatoria
de tamao 36, cuya estatura promedio es 167.2 crn;
b) Para la rnisma poblacin, determire el tamao mnimo de la muestra para estimar LL con
un error inferior a !2 cm con un nivel de confianza de| g4%.
a) La estimacin puntual que daramos para el gasto mensual por familia en electricidad en
esa ciudad;
b) Qu nmero de familias tendramos que seleccionar aI azar como mnimo para garanti-
zaros) con una confianza del 96 To, wa estimacin de dicho gasto medio con un error
mximo no superior a 3 dlares?
13. La vida activa (en das) de cierto frmaco sigue una distribucin A/ (tZOO;402). Se desea enviar
un lote de medicamentos de modo que Ia vida media del lote no sea inferior a 1190 das, con
probabilidad 0.95. Halle el tamao mnimo del lote.
l4 Se desea conocer el nivel de consumo medio con una determinada tarjeta de crdito con un error
mximo de 15 dlares y un nivel de confranza de 0.97. Cul debe ser el tamao mnimo de la
muestra que se debe tomar, si se ha estimado una desviacin estndar de 45 dlares?
15 Se sabe que el contenido de fructosa de una variedad de manzana sigue una distribucin normal
cuya varianza es conocida teniendo un valor de 0.25. Se desea estimar el valor de la media
poblacional mediante el valor de la media de una muestra, admitiendo un error mximo de 0.18.
con Llna confianza del 95.5 %. Cul es el tamao de la muestra?
16 Suponga que se midi la longitud del pie dereciro a 41 estudiantes de su universidad. EI promedio
de todas las mediciones fue de28.4 cm y la desviacin estndar fue 5.1 cm.
a) Encuentre un intervalo de confianza al96% para la longitud media del pie derecho de todos
los estudiantes de su universidad;
b) Esperara usted que alrededor del 96% de todos los estudiantes tengan longitudes de pies
en este intervalo? Explique;
c) Si usted hubiera encontrado un intervalo de confranza al 907o, cmo habra diferido del
intervalo antes obtenido?;
d) Si Ia muestra hubiera constado de 141 estudiantes (los restantes datos se mantienen iguales),
cmo habra variado el intervalo de confianza?;
e) Si Ia desviacin estndar hubiera sido de 3.7 cm (sin variar los dems datos), cmo se
hubiera visto afectado el intervaio de confi.anza?;
f) Si la media mLrestral hubiera resultado ser de 25.4 cm (sin variar los dems datos), qu
habra sucedido con el intervalo de confianza?
Srrpngase qLrc se desea estimar la media p para r.rna poblacin cuya varianza o2 es desconocida y que
se dispone de una muestra de n mediciones que siguen una ley normal: rt t2 ..., rr..
7.9. Estirnacin de Ia tnedia cuando Ia varianza es desconocida 217
Un irrtetvalo cle confianza para la media poblacional r, a un nivel del 100(1 - a)Ta, est. daclo por
Ejemplos
1. La cotizacin diaria de una moneda frente al dlar sigue una distribucin normal de media y
varianza desconocidas. Se eligieron 9 das aI azar, Ia cotizacin fue:
a) Determine tln intervalo de confianza, al g9 7o, para la cotizacin media de la citada moneda'
b) Con qu confiabilidad se estima la media en un intervalo cuya longitud es 1.116?
a) trl intelvalo es
1.116
b) Si la longitud del intervalo es 1.116, entonces el en.or.mximo es -E : : 0.558 y como
E : t,"2(n - f)*; entonces, sustituyend.o valores:
\/n
0.558 : t,n6)9.
\/9
Si examinamos en la tabla de la ley a 8 g.1., verros clue /sos(8) :1.36. De maner.a qnc
a
; : (-).05; por lo tanto, ci:0.1 y I - d:0.9. El nivel de confianza es del 90%.
El tiempo qlle un aparato de televisin perrnanece encendido sigue una ley nolmal. Por meclio
de rtn audmetro se registr este dato en 10 hogares dulante Llna senrana y se calcul el promedio
dialio (en rninutos). Los resultados son los siguientes:
248 r77 110 200 135 i85 224 155 180 166.
a) Deterrnilrar un intet'valo de confialza para el tiempo promedio diario que los hogares rlilarr
. televisin, a un nivel del g5 %;
218 Captulo 7. Estitnacin de Parnreros
,9ol,ttt:irit:
b) Aqu no se puede aplicar dircctrmente la fr'mr-rla del clculo del tamao muestral, ya clu
Ios vrlores de la lev / raran scgrin el nirmcrr cle grados cl< libertad) pcro el plincipio cs e-
nusnlo.
Se -B : tot(n - l+ y como ste debe sel nrcrtol que 20, se tiene to/z(n - yJ < ztt
\/lt Vn
Entonces.
t'o2@ - 1)
to2(n - I)
Folmemos una tal:>lr en la que se tenga los dos miernblos de la desigualdad. El tamr
mriirno cle la rnuestra es el corlespondiente al nenol valor cle ? para el cr.ral se cunple I
desigrraldrrd.
n 0.51n 1,,12(n - L)
10 1.581 2.262
16 2.000 2.\37
17 2.061 2.r20
18 2.r2L 2.1 10
7.LO. Ejercicios
I. Encuentle ul intervrlcr ctc confianza cle nivel (1 - cr) pala la rncclia si
Se d<,.scr estucliar cl girsto scrnanrl rlc fotocopiirs, crr cllarcs, clc L.ls eslucli:urtcs ulrivelsitli
Se eligiti una rnnestr'i <lc 9 cstur,litlrrtcs, elegidos l rzrr'. r'csrLlt,r.rrclo los gastos:
Se srrpouc que la r,tliable rrleatolir oll.jeto clc cstuclio siguc rurir clistlibrrcir). rrorlral <tc nrc.,.
dcsc;onocicLr,. Detolrnine el interr'k clc confi.urza clcl 95 % par',r lr rneclia clel grusto semauirl
fotocopiirs pol estuclizrnte.
7.70. Ejercicios 2l-9
Err los crrllcrrtrrriorLtos rlc lrn rrar[Lclor sc rrrirk: cl tierLrlr<t <re crrrplr:a elr |ecoller los 10() lrrctr os
lilrl<ts tIirr'rrrtc sttis <lLs r:onst)<]1rfl\.()s. S<r ltarr olrtcrriclo los siglrirtrrt,'s ticrrrl>os pr orrcclio rlc caclr
Luro clc los clrs rlt: lt sclr;ilrr c)lr (fllo rrrrll<)rrri:
) Si scr <:rtnsi<icLir clrrt' los 1;icrrrpos sr: clistrilrrLyclr liol'rn1lrnrlrrte. etr<rncntre rur interlvalo cle
corrfi)nzI. <lc ttivcl 91.-) %,. 1>irlrr el ti<:nrpo pt'onrr:clio irlvcltickr:
l,) ,Puccle csl)cr'r'sc cre cl la<lrclol leba.jc srr ticrnpo dc 50 s<-.gunclos? ,Por qrr?
4 Lrs tensiotrr:s dc totur'r (cu Iip) clc 5 cables cle acelo fuctolt
Suponicndo normalidad para las tcnsioncs, estinre la tcnsin mcdia de lotura rnediante lrn in-
telvaio c1e confianza al nivel 99 %.
5. Se desea estimar ei tiernpo medio de e.jccr-rcin de un programa. Para ello sc ejecut dicho
programa B veces utilizando conjuntos clc datos elegidos aleatoriamentc, obtenindose que Ia
media mlrcstral y la desviacin estndar- rnriestr-al son, r'espectivamente, 230 ms y 14 ms. Obtcnga
un intervalo de confianza aI90% para la rncdia. (Suponga normalidad.)
6 En una entidad de crdito para la rnicroempresa se desea conocer la dcuda media de los clientes
que tienen prstarnos. Los siguientes datos corresponden a la dcuda, en dlares, de 16 clientes
que se seleccionaron de manera aleatoria.
I Al fumigal los rrodr-rctos agr'colas existe cl riesgo de qr-re se coloque demasiada canticlrcl dc
irgroqunricosi cou cl consignieute riesgo pala el consurniclor. De nl lote se extra.jo una muestra
de 10 tomates y se midi la concentracin (cn g/ kg de producto) cle fosfatos qr-re ellos contenan,
resultanclo:
24.9 23.5 26.7 28.2 26.4 23.8 25.r 25.3 27.7 26.6.
a) Determine Lrn intelvalo de confiarrzr del 95 To pata la concentlacin;
b) Si la concentlacin mxiurr permiticla es cle 24 LLgl kg, puede esperarse que el lote sea
aceptaclo pirla cl corlslrmo hr,rrrrano'/
8. Elr una filrrica cle corrselras se micie ias irrrPulczas cn rrn lotc ck:stinado a la exPortaci<in. En
ur1l nlnestrr do 12 frscos de mernielaclr sc obtr-rvo los siguientes polcelta.jes de inrpr-uezrrs:
2.:3 1.9 2.7 2.8 2.3 3.6 1.4 1.8 2.\ 3.2 2.0 1 L
a) Asurnier.rclo c1r.Le las medicioncs estn normalrneDte clistliluidas. ertcuerrtle el interr,rlo de
confjurzr tI 95%,:
b) Si cl polceuttr.je rrrixinro c1e inrpulczirs peruriticlo pzt,r'zi la r:xpor-tacirr es c.le 1.5%, .sc,rccp-
tari cl lote par a scl (lxpoltrclo/
9. El r,ic'rnpo cLe virlr cn c;rrtivelio de B cspecmenc.s cle urr tipo clc insec;to fue cle 228 hot'zrs, con
uu des\il(:in estir.cll cle 7 holas.
220 Captulo 7. Estimacin de Parntetros
10 IJrra mqr-rirra ploduce artr:ulos cuya dirnensin se corrtrclla rnediante Ia torna de unrr rruestr.1
aieatorir. Un cla se obtuvieron las sigrrientcs rnediciou<:s:
:3.7 3.4 3.5 3.5 3.4 3.7 3.9 3.7 3.5 3.7 3.8.
11 Los siguientes son los tiempos, rnedidos en das laborables, que demoraron 16 trmites de jubi-
lacin en cl IESS, elegidos al azar:
Das
159 280 362 222 264 224 101 2t2
t70 485 250 379 779 168 260 149
a) Bajo Ia suposicin de que los tiempos se distribuyen nolmalmente, detelmine urr intervalo
de confianza ai 9970 para el tiempo medio de nn trmite de jubilacin;
b) El director del Instituto ha indicado que ios trmites no se demoran ms de 180 das. Es
razonable suponer que e1 tiempo meclio verdadero es mayol que lo indicado por cl director'/
12 La siguiente lista contiene la longitud (rrrmero de letras en las pala)rras) para rrna muestra clc
26 palabras del libro Rayuela cle Julio Cortzr
102 3 7 2E 4821752
54 '12294252347
a) Calcule el promedio y la clesviacin cstndar cle lr longitud de las palabras;
b) Constmya un interr'lo cle confianza al 99 % para Ia longitud rnedia de las palabras el
Rayueltr;
c) Si el tamairo muestral fuera mayor' (v el prorneclio y Ia desviacin estndar fueran los
mismos), ,cmo cambir,rr el intervrlo cle confianza?;
d) Si el prornedio fuera mayor (rnantenindose el tamro muestral y la desviacin estndar).
cmo cambiar'a el intervalo de confianza?;
e) Un intcrvrlo de confianz al g5 % cs (3.655; 6.037). Qu proporcin de las 26 palabras de la
muestra estn dentro clcl intelvalo? ,Su lesPuesta scr siempre ccrclnl aI 95%il Explique.
Un intctvalo de confianz par:r ir valianza polrlirciorrirl 02, ,r ,1lr rrivcl del 100(1 - cl) %, cstri dado
por
( (rr - I ).'2 (rr - 1)s2 \
\,(,,-Df"d-D)
7.77. Estimacin de Ia varianza (distribucin norrnal) 22t
T s2 es la varianza muestlal.
\?
\j,o/z^,"(n - 1) es el valor, de la clistribucin X2 a (, - 1) grados cle libertacl) para el cual el rea
en el cxrlemo inlerior os igual a
].
X,-o,,
z,_o,, Latz
Ejemplos
1. Hallar un intervalo de confianza para la varianza poblacional, al 90 Yo, para una muestra de
tamao n : 10, si s2 : 196.
si 1-cv:0.9, a:0.1,
]:o.osy 1- |-o.os. Los valoles d" x8o y
Sol,ucin: entonces
Xfr n, correspondientes a n - 1.: 9 g.1. son
El intervalo de confianza es
( (n_ t)s2 (n_ r)s2 \ /9x196 9x196\
:
\q," - tl';-ql" 1) ) \ reoro' n% )
: Q0a.26; b30.b3).
2. IJn hombre de negocios est interesado en invertir en un instrumento que piensa le puede dar
altos rendimientos. lrlo obstante, sabe que, en general, a mayor rendimiento se tiene mayor riesgo.
Al considerar instrumentos sirnilares se observaron los siguientes rendimientos porcentuales, que
suponemos siguen una ley normal:
7.t2. Ejercicicrs
1. Halle un intervalo cle confi.anza al 90 To si s'2 :225 para los siguientes tamaos de muestra:
116 105 t2r 119 110 105 108 t02 107 t02 104 116.
Detclminc los intcrvalos clc confi.abilidad dcl 90 "/c y cleI95%: para o2.
3. En los rnrrrualcs de fbricr cle un lpar'rto pala cleterrninar- el rrivel de alcohol cn la strugle.
sc irrdica que las niediciones tienen una clcsviacirr estndal de 5 ulidacles. Pala p-t-obar estL
afilruacin, cn la oficina de normas se reaiizarol mediciones clcl contenido de alcoiroi en Ia szrnrc I
LL
83 75 92 79 60 85 92 77 76. i
Basndosc crt LlD ilrtervalo cle confirrrza dc 95 %, cleterminc si Ia afirrnacin <lel fabricarrte
cs cortecta.
4. Sc rnliz Llr)t nlalca c1e rnirrgarinr rlietticr pzrlir dcterminar el nivei cle acic,los gl'l,sos ltolisatr-r-
raclos (en lrorcenta.jc). Un,r ntuestr't de scis paquel;cs ltrovcy ltr siguientc informa<rirln.
a) el intcrr'rlo clc confianza para cl contenido medio de glasa. con rln nirrcl del g9 %;
b) r:l irrtelr'rlo clc <;onfianzr par'r Ir vaLirrrza del conteniclo dc g1 lsa, corr Lrn nivr:l del 95%.
5. En nrra mncstra alcrtoria cle 15 cuentas bancarias que realizaron depsitos la rltirna serrralta sc
encontr que la desviacin estndar era de 73.6 dlares. Se supone que los depsitos siguen una
ley normal. Estime Ia varianza y la desviacin estndar de los depsitos mediante un intervalo
de confianza al g5To.
7.72. Ejercicios 223
Ir Urr httrribre clc nr:gor:ios est, intercsrdo crr ilrutil err bcnos cle un pirs lrrtinorrrnclicauo, qrrc
lticttszr lc rueclcu <lu altos t'euclinientos. No obstiurte, s1be ouo. en gcuerzrl, a nryor rcnclirnicnto
se tietrcr IIl1yot lictsgo. AI cotrsiclctal ptrpcles similarr:s sc obsel'r'alorr los sigrricrit,cs lcndirnicntos
( ')/,t):
9.7 21,5 17.0 16.9 13.4 20.7 24.6 15.8.
7. El conteniclo cn nicotini de los cigarlillos de unl nralc) dcterrnirrada sigue uua distriliucirr
N (U;"2). Sc torn urta mucstr:a cle 5 cigarrillos, obtenindose en cstr muestra un ccntenir-lo
medio de 27.2 rng y varianza rmestral 4.2025. Obtenga:
8. Se desea ptobar ttn nnevo mtodo de embalaje de rnercaderas, para Io cual se registra el tiempo
(en segtindos) quc un misrno tlaba.jador emplea err realizar la tarea:
Procedimiento Procedimiento
tradicional alternativo
31 36
36 32
34 30
27 26
40 O
4,f 4I
AA
28
30 33
,t
Jt)
Si el tiempo empleado es similal en los dos casos, entonces se decidir emplear aquel mtodo
qtre presente la menol r'rliacin. Mediante un intervalo de confianza a). 9570, ,cu.l de los dos
mtoclos escogcra, el traclicional o el alternativo?
93 90 97 90 93 91 96 94 91 88
93 95 91 89 92 87 88 90 86 91
Strponiendo que la dnlacin sigue una distribucin noLmal, hallar los intervalos de confianza aI
90 % para la rneciir y Ia r.arianza.
Etr el enibrlajc dc fi'rtta pala ltr cxporttrcin es importante conocer Ia variabilidaci del caliJre
cle la fruta (que es el clirnetro mxirno de Ia fmta). Una fruta con Lrn calibre bajo se cotiza
a l:a.jo prercio y una con calible alto da ploblemas en el embalaje. Las siguientes mediciones
corlesponderr rl calibr-c plorncclio (en cm) de los rnclones contenidos en 113 ca,jas:
a) Determine los intervalos de confianza, al g0To, para la media y la varianza del calibre;
224 Captulo 7. Estirnacin de Parrnetros
b) Si el calibre promedio es nlenor que 20 crn o mayor que 21.5 cm, o si Iavatianza es mayor o
igual a 3, se recomienda el cambio de Ia variedad de meln. Cree tisted que ser necesario
hacer tal cambio? Por qu'/
l1 Una ernpresa de venta de cosmticos est interesada en introducir una nueva lnea de artculos.
para ello se examina Ia ganancia (en dlares) que le dejaran cada uno de los productos:
23 38 15 7 t2 10 10 11 18 13 9 10
Strponga que se dispone de una muestra rt 12, ..., rrr., de n observaciones que siguen una ley de
Bernoulli, cuyo parmetro p (la proporcirr poblacional) deseamos estimar.
Un intervalo de confianza aproximado para la proporcin7t, a un nivel de 100(1 - a)% viene dado
por
Donde:
,n
. p:- 9 , siendo y : D r el nrmero de xitos en las n pruebas.
TL i.:1
' za/2 el valor z que corresponde a,l rea 9 en el extremo superior de la distribucin normal
2
estndar.
EI tamao de la muestra necesaria para tener Lrn error -8, a un nivel de confianza (1 - a) es
n: Qo/)'0Q - A)
E2
Observacin. Si no se conoce de antemano una estirnacin de p como sucede cuando se realiza una
investigacin por primeravez , se toma fr:0.5, porque este valol permite obtener el tamao mximo
de rnuestra.
7.73. Estimacin de Ia proporcin (distribucin binomial) 225
Ejemplos
1. Cott cl ob.jcto rle estirrra,t'la Jrroporcin clc televiderrtes qr-re han visto el anuncio de un proclucto,
se enl,rcvist 400 tek:spectacloles y result,ri que 344 de ellos lo habarr visto.
a) Ertcuentrc un intcrvalo de c:onfianza clc g7'% para la proporcin de todos los espectadores
que harr visto la ltublicidacl r.[el producto;
b) Obtenga el tanrao cle rrnrestra indispensable para que cl intervalo del inciso a) terr.ga una
Iongitud mxima cle 67a corr la misrna confianza.
a) El intervalo de confi.anza es
/
- z"rz
\n
(0.86)(0.14)
(o ;0.86 * : (0.8306; 0.8894).
400
'u
b) Si la longitr rd del intervalo es 6 %, quiere esdecir,E:0.03.
El ta mari.o le la rrmestra
< es
'F2
("n/.)'2 fr(t - i) (r.695)2(0.86)(0.r4) .){, ?(
_ roa'rJU'
- (obz- -
Habr' qr-rer consuJ.tr a 385 tcle','id<tutes.
2. En unr encuesta piloto, plevitr 1>ara la lcalizrcin cle la encnesta clcfinitiva) se encontr que el
630, de lir poblacin (ircle que el plirrcipal problerna clel pas cs la colrupcin. La ficha tcnica
de la cncuesta definitiva indica cre ci sonclco tendr un 97 % de confirlrilidad y el error estimado
clel 4(%. A cuntos cirrcladanos se debel cousultar si:
r: @#f:@*ffi@
(2.i7)2(0 63) (0.37)
: 686.
0.0016
La eucnesta deber ser realizda a Lrrr mnirno de 686 personas.
b) Como no se tiene iriforrnaci<irt previa soble p, se toma 0: 0.5 y el clculo del tarnao queda:
r: @#r:e%l&i#e
: 7:35.77 .
Sin urr conocirnieuto previo de Ia proporcin, se deber muestrear al menos a 736 pelsonas.
::i el Curdto 7.7 se encnentra un resLrilren de los intervalos de confianza de una muestra analizados
-- este captulo.
226 Captulo 7. Estimacin de Parntetros
Distribucin
proporcron p f! rulz F0-)
binomiai
7 "L4" Ejencicios
1. Determine Ios intervalos de confianza para la proporcin, de una muestra de tamao 200 en la
cual se han obtenido 150 xitos, segn los siguientes niveles:
2. En esta pregunta no realice clculos, responda mediante una frase que explique su razonamiento
J. llna muestra realizada a los clientes de un supermercado dio que 120 de 300 clientes usan
regularmente tarjeta de crdito o cheques para sus compras. Encuentre un intervalo de confi.anza
aI 98% para el porcentaje de personas qlre usan efectivo en sus cornpras.
4 Un partido poltico que concurre a las elecciones mr-rnicipales en la ciudad quiere encargar una
encuesta para estimar su porcentaje de votacin mediante un intervalo de la forma P +1.5%.
cuyo nivel de confianza sea 95 %. Qu tamao muestral debe utilizarse en la encuesta para
alcanzar aproximadamente este objetivo, sabiendo que en una muestra piloto el porcentaje de
votacin estimado fue del 75%?
7.74. Ejercicios 227
5. La efectividad cle tut trtcclictnrcrrto oorrlla cl dolor dc cabez se examirra deterrninando si ste
elirnin o tro r:l sntonra. St: arlrrriuistr'<i <r1 mcclicrurerito a 225 pacientes voluntarios, de los ctLaies
en 170 crns el efr:cto rlr-'scrclo. El rrrcclicLrento se trr:epta l)ara, su u,<jo general si ticnc uur
efectividad en al menos cl 80 % clc los crsori.
a) Basndose en Ltn intervalo de confianza c-lel 98 %, .puede recomendarse el uso dei meclica-
mento'/;
b) Sin variar la propolcin estimacla, .qr-r tan grande deber ser Llna muestra si se clesea tener
una confianza del 96(% de que el error mximo de estimacin es 0.05?
6. Segrrrrtn estudio sobre los nios que padecen clolor de pecho, realizado por Selbst, Ruddy y
Clark (Cli,nical Ped'iatrics,1990), se encontl que de 137 nios que tenan dolor de pecho, 100
daban radiografas de trax normales.
a) Obtenga un intervalo de confianza del 957a pata la proporcin p de nios con dolor de
pecho que dieron radiografas normales;
b) Halle el mnimo tamao muestral para que el error cometido en la estimacin de p sea
inferior a 0.07, al nivel de g5%.
7. En una poblacin, nadie es indiferente respecto a la iniciativa propuesta por el alcalde de construir
un nuevo parque en el norte de la ciudad. Cada habitante adulto o bien est a favor, o bien en
contra de la iniciativa. Se desea conocer el porcentaj" (P) de las personas que estn en contra.
Entre 250 habitantes adultos elegidos al azar,75 afi.rmaron que estaban en contra (v los 175
restantes a favor).
S. En una lnea de control de calidad en un da se examinan 250 piezas de un lote, de las cuales 25
tienen algn tipo de defecto.
9. Para la introduccin al mercado de una nue\a variedad de semilla de naz la empresa productora
estima que deben germinar al menos eI 73u/o de1 total de semillas sembradas. En una prueba de
laboratorio se sembraron 745 semillas, de 1as cuales germinaron 518. Con base en un intervalo
de confianza de nivel igual a1 97T0, [,poclr la empresa introducir al melcado la nueva variedad?
-0. Err un sondeo sobre la preferencia deportiva de la poblacin masculina ecuatoriana, realizada a
1000 personas, se determin que eI 72% de 1os encuestados gustaba ver regularmente partidos
de ftbol por televisin. Con una seguridad del g5 a/o, se puede decir que los resultados son
iguales, con Lrn margen de ms o menos 3 puntos porcentuales, a los que se habran obtenido si
se hubiera consultado la opinin de la poblacin masculina completa?
:1. Una noticia de prensa dice que, de 1200 persorras encnestadas sobre la conveniencia de hacer
reformas a la ley de trnsito, 756 se muestru a favor y 444en contra, y concluye afirmando que
eI 63% de la poblacin se mltestra a favor, con un rnargen de error de t3 %. Cul es el nivel
de confianza de esta afirrnacin?
228 Captulo 7. Estirnacin de Parmetros
72. En ttna errtlevista realizrc.la a 130 rnujercs casadas, 113 de ellas indicaron qlle haban sido r.ctirnas
clc zrlgrin tilto de agresi<in ltor parte de su cnyuge.
a) Asumieudo qtle estas nnrjeles form:ur una nnrestra aleatoria, calcule r,rn intelvalo r-le con-
fi.anza de nivel 95% para la proporcin de las mujeres casadas que han sicio agrediclas;
r) Si se hubiera consultado a 520 mujercs, .cree usted qrre el intervalo hubiera sido rnis ancho,
ms estrecho o de igual ancho? Explique y no realice clculos;
c) El intervalo hubiera sido ms ancho) ms estrecho o de igual ancho si 73 de las 130 mujeres
hubieran respondido afir'mativamente? Explique;
d) Realice una interprctacin del intervaio.
13. Se desea estimar la proporcin de estudiantes universitarios a favor de sustituir el actual himno
nacional por otra cancin.
a) Para estimar esta proporcin con una precisin de 0.10 a un nivel de confianza del 92Vo,
a cuntos estudiantes se necesitar preguntar? (Para determinar el tamao de mnestra
necesario, fije su propia proporcirr rnuestral, identificndola claramente.)
Para responder las siguientes preguntas, usted no necesita realizar clculos. Explique sus
respuestas.
b) Si se deseara estimar la proporcin con nna precisin del 0.05, a un nivel del 92 To, es
necesario muestrear a ms o menos estudiantes que en a)?;
c) Si se cleseala estirnar Ia proporcin con una precisin del 0.02, a un nivel del 95 To, ,es
necesalio muestrcar r mis o trtenos cstudiantes que en a)?
Un intervalo de conhan za par a la diferencia de medias poblacionales r, - F2, d un nivel del 100(1-
a)To, est dado por
I
| (zr - rz) - t../z(nt -t nz - 2) @t - rz) + /z(nt t nz - r
lE=-;
t
\
*
rE=-)
^r_(ra-t)"?+(n2-r)sl
U+n2-2
Donde g : + slln2)2
('?1",
("?1",)' , G3/"r)'
u-L - nr-r
Ejemplos
1. Se pretende comparar la duracin de dos marcas de pilas alcalinas. Para ello se escogieron dos
muestras de cinco piias cada una. Los datos se presentan a continuacin.
Marca A 100 96 92 96 92
Marca B 76 80 75 84 82
Si suponemos que las varianzas poblacionales son o2A: II y q2B :15, determine, basndose en
un intervalo de confianza de nivel g5 %, si las dos marcas de pilas tienen igual duracin.
Soluctn: Se tiene que
nl :5, r1 :95.2; o?: l!,
TL2: 5, rZ :79.4; 03: 15.
Entonces,
(,r,-,
- - zat2U
la* o" \r,'- - rz) - ,"/r\,1@:
\,,,
"'2) ; , ;' _ ):
: (11.33; 20.27).
Si las dos medias fueran estadsticamente iguales, su diferencia sera igual a cero. Como cero no
se encuentra en el intervalo de confianza, podemos afirmal que las dos marcas no tienen igual
durabilidad.
230 Captulo 7. Estimacin de Parntetros
2. Lhr irgr:nir:r'o desea cletelrninrl si los automrj.lles a,nrcricrrros ), los japorreses tienen igual consrrmcr
rl<corirrstible. Par'relloescogoliirtrnrrest,rrcle10cr.r'rosarnclicarros), 12,jaPcrresesrlesinrilrlr.:s
crr',rctersticas y rnidi cl ccrisurrro por 100 hrn cle recolrickr, con los siguicirtcs r-csultrclos:
Estinrar, mediante un intelvalo de confianza a,l 95'%,).a cliferencia eirtle las clos rnedias de con-
sllrllo. ,Se puede decir el conslrilro de cornbustible no depende del oligen clel ruto?
SoLuciu. Supondremos que las poblaciores son norrnales con varianzas desconocidas, supuestas
iguales. Adems, se tienen los siguientes resultados:
El estimador de la vananza es
2
5:
(n1 -1)sl +(n2-I)s2; (10 - r)2.216 + (t2 - 1)0.87e : 1.481.
n1 +n2-2 10+12-2
Entonces, el intervalo es
rz) tn/z(nt + nz -
(,', - - 2)
1.4811.481
(,t.uu - 6.04) - ts s25(20) *
,o i, (7.86 - 6.04) + o.ozs(20)
Suponga que disponemos de dos muestras independientes de tamaos TLt y n2. seleccionadas de dos
poblaciones que siguen leyes normales con varianzas o? y o3, respectivarnente. Deseamos construir
un intervalo de confia\zapata la razn de las dos varianzas.
o?
Un intervalo de confianza para la razn de las varianzas poblacionales i,oi aun nivel del 100(1-c)%,
est dado por
4,,, 4-otz
Figura 7.5:Localizacin de los valores de la ley F en el intervalo de confianza para larazn entre dos
rrarianzas.
Ejemplo. LIn inversionista quiere comparar, en trminos de las varianzas, los rendimientos de las
acciones de dos compaas del sector servicios. Calcul los rendimientos mensuales del ltimo semestre
de las dos compaas, como se muestra a continuacin.
Con el empleo de un intervalo de confi.anza de nivel 95To para las varianzas, determine si los rendimien-
tos tienen igual variabilidad.
EI intervalo queda:
/^2 \
(?rFr-*p(n "?
- r,nz - r); 3F-tr@, - t,n2- 1) ) :
\si si /
(3#"-' ozs(5, 5);
.iz8q!ryFo
oru(5, 5)) : (0'433; 22'082)'
Si las varianzas son iguales, su cociente es igual a uno. En este caso, el valor 1 se encuentra dentro
iel intervalo; por tanto, las varianzas de los rendimientos de las dos compaas son iguales.
Sean f1 y f2 Ias proporciones de xitos de dos muestras aleatorias independientes, de tamaos rLr y n2,
:rovenientes de dos poblaciones de Bernoulli, Ber(p1) y Ber(p2), respectivamente. Ahora, deseamos
-timar, mediante un intervalo, la diferencia de esas proporciones poblacionales.
:--n intervalo de confi,anza aproximadc-r para la diferencia de proporciones pr a \rr
l-r:
- p21
-00(1 - a)To viene dado por
l,,rnde 0r : 1 - y lz : I _ fz.
Ejemplo. Un fabricante cree que su marca de yogurt es ms preferida en la Sierra que en la Costa.
?ara probar su sospecha escogo dos muestras aleatorias de 500 consumidores en la Costa y 300 en
232 Captulo 7. Estirnacin de Parrnetros
la Sierra. Las muestras revelaron que 210 consurnidores en la Sierra y 320 en la Costa consumen su
producto. De acuerdo a un intervalo de confianza al 98T0, se puede inferir que el fabricante tiene
razn?
ComoceroestdentrodeIintervalo'noSepuedeafirmarquelasospechadelfabricanteseacierta.<
En el Cuadrc 7.2 se encuentra un resumen de los intervalos de confianza de dos muestras analizados
en este captulo.
Parmetro Intervalo
Distribucin oi o3
general
o7 y o2 conocidas (rt - rz) t 2,,
/2 r\ n2
Distribucin or y o2 desconocidas sZ
normal supuestas iguales
(t t - iz) tt o/2,(ntrn2-2)l * 'lL2
I'O
Distribucin ot y 02 desconocidas (t-r)It,,/2,nrl! .9
normal distintas Ft- Pz '" nt r2
V t2
A lo largo de este captulo la idea de que los intervalos estaclsticos reflejan la in-
se ha enfatizado
cer-tidumbre debida a la variabilidad de los datos, pero en la mayora de casos prcticos, a ms de
que las hiptesis bsicas sobre la muestra (como aleatoriedad, independcncia y normalidad) son vio-
1adas, influyen otros factoles cuya magrritud es incuantifi.cable, por ejemplo, el comportamiento de las
personas y los equipos, el medio ambiente, etc.
Entonces, en la correcta interpretacin de los intervalos estadsticos habr qlle tomar en cuenta que
ellos no leflejan la incertidumbre total presente en las rnediciones y solo proveer wa cota'inferior de
la verdadera incertidumbre; por lo tanto, son una cruda aproximacin a Ia realidad.
t
7.76. Ejercicios 233
7.16. Ejercicios
1. El gercrrte de una empresa quc tiene dos locales de ferretera cree cre las venlas en el local del
norte son mayores que en el Iocal del sur. Para verificarlo, tom una muestra de 200 facturrs
en el local del sur v 250 facturas del local del norte, resultando un promedio de 13 y 15 cilares
y desviaciones estndar de 3 y 4 dlares, r'espectivamente. Mediante un intervalo de confianza
de rrivel 95To, ,se puede concluir que e1 gerente tiene razn?
2 Una organizacin de defensa de los derechos civiles afirma que en la industria de Ia construccin
el salario r4edio semanal de los hombres supera en 13 dlares al de las mu.jeres. Una muestra
aleatoria de 20 hombres y otra de 25 mujeres revel promedios de 110 y 100 dlares, respecti-
vamente. Si Ias dos poblaciones de salarios son normales con varianzas de 100 y 64, mediante
un intervalo de confiarrza para la diferencia de medias, de nivel 98 %, se puede decir que la
afi.rmacin es cierta?
Se cree que el precio de arriendo de las casas es mayor en Cuenca que en Ambato. Estudios
anteriores revelan que las dos poblaciones de arriendos tienen distribucin normal con varianza
homognea. Dos muestras aleatorias de tamao 16 revelaron lo siguiente: z1 : 138, sr : 6 y
Tz:135, s2:4. Con el empleo de un intervalo de confianza al 957o, se puede concluir que Ia
suposicin es correcta?
4 Un inversionista hizo un estudio para determinar en qu ciudad, Manta o Loja, podra abrir un
supermercado. En una muestr a de 2I hogares de la ciudad de Manta hall un ingreso promedio
de 500 dlares y una desviaciri estndar de 120 dlares. En otra muestra de 16 hogares de Ia
ciudad de Loja hall un ingreso promedio de 480 dlares y desviacin estndar de 60 dlares.
Suponiendo poblaciones normales con varianzas diferentes y con el empleo de un intervalo clc
nivel 957o, en cul de Ias ciudades le conviene abrir el supermercado?
El dueo de dos restaurantes que verrde pollo a la brasa quiere dcterminar si sus dos locales
venden Ia misma cantidad de pollos diarios. Dos muestras de las ventas de 12 das dieron los
siguientes nmeros de pollos vendidos:
Local A 12 17 I4 1B I 10 20 l5 72 1ti B 74
Local B 72 L4 13 11 12 15 21 l4 13 14 22 15
Adems, Ias muestras revelaron que las dos poblaciones de muestras son normales con valianzas
diferentes.Se puede inferir que en los dos locales las ventas diarias de pollos son Ias misrnas?
Una manera de comparar el riesgo de dos inversiones es a travs de sus varianzas. Para una
itrversin en Ia industria electrnica se tom una muestra de 10 datos y result una desvicin
estndar de 52. Para una inversin en la industria siderrgica se tom una muestra de 15 datos
y result ttna desviacin estndar de 31. Si se asume que cada una de las invcrsiones sigucn
leyes normales, cul es su conclusin si utiliza un intervalo de confianza al 90% para la razn
de varianzas?
IJn investigador sospecha que los hombres y las mujeres difieren significativamente en ticmpcr
diario de utilizacin del telfono. Entrevista a 25 sujetos de cada sexo obteniendo ios siguientes
resrrlt ados:
Mujeres: :38; or:6,
Ffornbres: : 31; 02:5.
Utilice un nivel de confianza del g5 7o para:
a) construir un intervalo para larazn entre las varianzas. Se puede decir que son
234 Captulo 7. Dstimacin de Parmtetros
El ctrtrclaclol clc rtu cqrLipo cle fiitbol quietc (jor]'lprar li r:fcctir,'iclrri cle srrs.jrrgaciolcs al c<tlrlar'
trn tiro pena1. En los cntrenarnicntos, Ios jr-rgaclores n:rcrionalcs, clc 120 tilos intcnta<ftrs, accrta,r'on
91, tnientras que krs extlaqjelos rle 90 tiros lea,lizados, accltaiolt 78. N,Icdiant.: rrn iutelvakr de
corrfiauza de nivel 90 %, se puede infcrir que rro hay diferencia cntle los jrrga<lores ritrciorrirlcs 1'
extran jeros a,l colrar un tiro penal'?
I En lur estudio epidemiolgico, se tonr una rnuestra alcatoria de 300 hombres y 27 de ellos
padecicron o padecen Llna determinada variedrd de gripe. Tambin, se torn una rnlrestr:a de
400 rnujeres y a 32 les oculra lo misrno. A la vista dc cstos datos, se pucde consideral que estc
tipo de gripe afecta a hornbres y mujeles por igual? (Usc 1 - cl : 0.96)
10. Se quiere comprobal la efectividad de una vacuna contra una enfermedad y para ello, tras
contagiar a 200 animales, se Ia suministra a 100 y se compara con otros 100, a los cuales no se les
suministr. De entre los vacunados, mueren 8 a causa de la enfermedad y de los no vacurrados
20. A un nivel de confiabilidad del 93%o, podemos decir que la vacuna es eficaz pala reducir la
tasa de mortalidad?
I
4
a
C*pstulo I
Pruebas de Hiptesis
En el captulo anterior se vio que se puede realizar inferencias acerca de un parmetro poblacional
estimando su valor, ya sea de manera puntual o como un intervalo de confianza. Pero en muchas
ocasiones no interesa conocer o tener una idea dcl valor del parmetro, sino comprobar (o rechazar)
una afirrnacin sobre el valor que tiene el parmetro, sin mportar la longitud o la localizacin del
intervalo.
Suporrgamos que un investigador desea probar que actualmente, el ingreso mensual de los ecuatorianos
es mayor que el ingreso que tenan 5 aos atrs. Par-a verificarlo, recolecta los datos mediante una
muestra tomada al azar. El investigador podra desear cornprobar la hiptesis de que el aumento del
ingreso es rnayor que un cierto valor prefijado. Un intervalo de confianza de la variacin media del
ingreso proporcionar menor informacin que una prueba de hiptesis sobre la variacin del ingreso.
Las hiptesis son, en general, afirmaciones sobre los parmetros poblacionales, como 1a media y la
tarianza; as, se pudiera desear probar que el ingreso medio actual no es diferente de aquel que los
ecuatorianos tenan hace 5 aos. Una hiptesis tambin puede ser una afirmacin sobre la distribucin
de una caracterstica de inters; por ejemplo, que el ingreso mensual sigue una distribucin normal.
La teora de las pruebas de hiptesis sobre parmetros poblaciont.:.les fue desarrollada en los primeros
aos del siglo XX y sistematizada por R. A. Fisher, E. S. Pearson y J. Ncyman. stos ltimos la
formalizaron e introdujeron el vocabulario actua,lmentc en uso) en una publicacin realizada en 1933.
-\qu se expondrn los casos de mayor uso e importancia.
Para probar una hiptesis estadstica es necesario tcner en cuenta cicrtos elementos que conducirn
a aceptar o rechazar la hiptesis planteada, de manera correcta. Ello 1o ilustraremos con el e.jemplo
anterior.
El investigador cree qLle) en condiciones normales, el aumento dcl ingreso medio d debe ser menor que
un nivel prefijado do :60 dlares. y decide probar esta afirmacin; pero en el curso de Ja investigacin
235
236 Captulo 8. Pruebas de Hiptesis
se podraconclllir que Ia variacin del ingreso es mayor que 60 dlares. Para tornal cnalquier drcisin
es necesario que el investigador compare cori Lrn valor que le informe de la validez o irn'alidez de su
liiptesis.
En la terminologa de las pruebas de hiptesis, aquelLa que especifica un valor particuJ.ar del par'metlo
que se estudia se llama hzpteszs nula, que se representa por 11g. trsta hiptesis, usualmente, corres-
ponde al procedimiento de operacin normal de un sistema de especificaciones corrocidas. En el
ejemplo, d < 60 es la hiptesis nula, pues representa Io que debera suceder cuando ha habido un
incremento del ingreso, en condiciones normales; o sea) Hg: 0 < 60.
La hiptesis que especifica aquellos valores de1 parmetro que representan un cambio importante del
procedimiento normal o de las especificaciones conocidas, se llama hiptesis alternatiua y se repre-
senta por 111 . En el ejemplo los valores mayores que 60 indicaran un comportamiento anmalo o
extraordinario; as, la hiptesis aiternativa es -111: e > 60.
La cantidad, calculada a partir de la muestra, que permite decidir si la hiptesis nula ser o no
ser rechazada se denomina estadst'ico de p'rueba. La distribucin de probabilidad del mencionado
estadstico debe ser conocida para poder realizar Ia prueba.
EI conjunto de valores del estadstico de prueba que conduce al rechazo de la hiptesis nula, en favor de
la hiptesis alternativa, se llama regi,n de reclazo o regin crtica de la prueba. La dec,istn consiste
en rechazar la hiptesis nula en favor de la alternativa si el valor del estadstico de prueba cae en la
regin de rechazo; caso contrario no se descarta fIs.
Estadstico de prueba.
4 Regin de rechazo.
5. Decisin.
Al tomar una decisin sc puede cometel dos tipos de errores: rechazar Ia hiptesis nula cuanclo es
verdadela, lo que se llama error de tipo I; o bien, no rechazar la hiptesis nula cuando en realidad es
falsa, lo que se denomina error de tipo II. Ello se resllme en el siguiente cuadro:
Hiptesis Nula
Decisin Verdadera Falsa
Rechazar 1 I
Error tipo Decisiu col-recta
No rechazar 116 Decisin correcta Error tipo II
2. El niuel de signifi.ca,ci,n obseruado o p-valor', es el mnimo valor del nivel cle significacin para
el cual los datos observados irrdican que Ia hiptesis nula debe ser rechazada.
Este valor se utiliza cuando se trabaja con paquctes computacionales para detelrninar si se
rechaza Hs. La regla es la siguiente:
Si el valor de p ( a, entonces se rechaza 116. Caso contrario, no se rechaza (se acepta).
Para un tamao de muestra frjo, al aumentar la regin de rechazo (y por lo tanto a), B disminuye.
s de pruebas de hiptesis
Definicin (de prueba estadstica unilateral) Una prueba estadstica urrilateral es aquella en
Ia que la regin de rechazo se localiza solamerrte en un extrerno cle la distribucin de probabilidad
del estadstico de prueba.
Para detectar si 0 I 0o la regin de rechazo se sitra err el extrerno superior de la distribucin del
estimador d (Figura 8_.2). Para detectar si d ) d6 la regin de rechazo se sita en el extremo inferior
de la distribucin de d.
eo 0o+C
Acentar Hn I Rechazar Hn
Definicin (de prueba estadstica bilateral) Una prueba estadstica bilateral es aquella que
sita la regin de rechazo en ambos extremos de la distribucin de probabilidad del estadstico de
prueba.
Las pruebas bilaterales se utilizan para detectar 0 < d6 o bien 0 > 0ol es decir, 0l0o (Figura 8.3).
Uno de los casos ms comunes en la realizacin de pruebas de hiptesis es hacerla sobre el valor de
la media poblacional, cuando se dispone de una muestra de dicha poblacin. El parmetro 0 que se
desea probar es LL y el estimador d es la media muestral 7.
A continuacin se exponen -de manera sucinta-, las pruebas estadsticas, bilateral y unilaterales,
cuando deseamos probar que el valor de la media poblacional l es igual a un valor prefijado -r,s.
Ejemplo. IJna empresa farrnacutic ha estatlecido qlre un compriniido dcbc tcncr Ltn peso
nredio igual a lo:0.5g y una desviacin estndar de o:0.11g. Se tom una muestradeT44
comprimidos de un lote de frmacos, cuyo peso promedio fue de Z:0.53g.
a) Para un nivel de significacin de 0.01, ,el peso de los comprimidos en e1 lote se diferencia
del admisible por Ia empresa'/;
b) Determinar el p-valor de la prueba.
Solucdn:
4.
"l\,' zo6"
Regi,n de Rechazo. Zobs > zo (obien { -zat cuando HI F < ttd.
Ejemplo. Si en el ejemplo anterior, el peso mximo admisible para que el medicamento no sea
txico es igual'd LLo:0.52g.
a) Se desea saber si los comprimidos del lote son aptos para el consumo humano, a un nivel
de significacin del 5 %;
b) Determinar el nivel de significacin de la prueba.
Solucin:
a) Los datos son los mismos que antes se usaron, solo debindose cambiar las hiptesis.
24O Captulo 8. Pruebas de Hiptesis
Errtonces, por el Teorema del Lmite Central, la variable 7 : !-4 sigue una Iey normal estndar.
ol\/n
Ejemplo. En el ejemplo anterior, calcular Ia potencia de Ia prueba si el verdadero valor de la media
es 0.54 mg.
Solucin: Veamos qu signiflca <<aceptar -16>> en trminos de los valores que puede tomar el promedio,
r.
Aceptamos Hs si+ < 1.6b; es decir, ,01.?,, < 1.65, o seaz < 0.53b13.
o I \/n - 0.rll\/144
=u-- -
Por tanto, la probabilidad B la podemos poner de la siguiente manera:
Cuando la varianza es desconocida, no es posible aplicar el Teorema del Lmite Central; en este caso,
para que sea posible aplicar esta prueba es necesario que la muestra provenga de una poblacin que
sigue una ley normal, de manera que el estadstico de prr"reba sigue una ley de distribucin . Entonces
la prueba estadstica es la siguiente:
8.3. Pruebas de hiptesis sobre la rnedia, cuando Ia varianza es desconocida 24L
4. 'l'F,
{ -to/z(n -
Regi,n de Rechazo. tob" 1) o tob" ) t^2(n - I).
Ejemplo. Segn un estudio del Ministerio de Educacin, el costo medio de la lista de tiles
de los escolares de educacin bsica es 87 dlares. Para verifi.carlo, un investigador tom una
muestra con los siguientes resultados:
Para un nivel de significacin de 0.05, verificar la hiptesis de que la mquina cumple con la
especificacin.
Solucin: Previamente hallamos eL promedio y la desviacin estndar: :97.7 y s : 18.728
(los clculos se dejan como ejercicio para el lector).
Con sto planteamos el contraste:
5. Dectsin. Como el valor o6" s encuentra en Ia regin crtica, ya que 2.555 > 2.093, se
rechaza la hiptesis nula; es decir, el precio medio de las listas de tiles es distinto al que
afirma el Ministerio.
Ejernplo. Segn las previsiones del gobierno, la inflacin para este ao ser de 3.g %. Un
economista, desconfiado de Ia cifra, realiz una investigacin por su cuenta y registr la variacin
de los precios en los 22 artculos que a su juicio tienen la mayor incidencia en Ia economa popular.
Obtu'r'o una variacin de 4.5 7o y una desviacin estndar de 1.3 %. Pruebe si la cifra de inflacirr
del investigadol ser mayor que la del gobierno.
Solucin: Se tienen los siguientes datos del problemai rL:22, r:4.5 y s: 1.3. La prueba es:
2.518; pcto si sc tonta r-v:0.1-J5 y ls5(21) - I"721,1:r reg,in ur'tir-' es ..,,, > 1.72]1.
Dec:i,si,n, Prla cr - 0.01 no se rechaza H; cs dccir, no existe evidencia quc indiqu,,rl{'ia
ciflr clacla, pol cl gobierno est subestirrrada. Srn embargo, si sc torna r-v - 0.05, resulta que
Lob., ) ... se rechaza Ho; es decir, 1a infla',n cs inayor que la estimada por el gobici"no.
Para realizar una prueba de hiptesis sobre la varianza, supondremos que las observaciones provienen
de una distribucin normal) para que el estadsti * @# siga una distribucin y2 con (n - t)
grados de libertad. Bajo este supuesto, las pruebas de hiptesis son las siguientes.
Ejemplo. Un fabricante de cables de cobre afirm que su producto tena una resistencia a la ruptura
relativamente estable y que se ubicara en un rango de 40 kilogramos-fuerza (kgf) . IJna muestra de
16 mediciones arroj una varianza igual a s2 : 195.
4. R.egir'r de Reclazct. Prra nn rrivel cle significacin o:0.05 y 15 g.1., fSoo(15) :25.00. La
regin crtica es Xlo" > 25.
5. Decisin. Como 29.25 > 25, se conch.r.yc qrre la hiptesis es falsa y qtle la variacin de la,s
mediciones excede ias especificacioues del fablicante.
:jemplo. Una empresa realiz una investigacin de mercado para determinar el nivel de consumo de
- refi'esco, para lo que consult a200 consumidores, de los cuales 28 expresaron sll preferencia por
.-:roducto. El fabricante, de acuerdo a sus ventas, cree que tiene el 10% del mercado de refrescos.
244 Captulo 8. Pruebas de Hiptesis
a) Son los resultados de Ia investigacin consistentes con los datos del fabricante?;
28
Soluczn: Se tiene Po : 0.1 Y el estimador de Ia proporclon es p - :0.14.
200
b) Como zobs :1.886, el valor de probabilidad correspondiente es A(1.886) : 0.9706. Por ser una
prueba bilateral, se cumple que 0.9706 +;:1; por lo tanto, a:0.0588.
3,i,"Ti3:.fi;TH' i
grarrcle) =
i;i r,lli , t!
-ro/\/n
,
t4,"'),,,'
(rrruestra Lt,2 tt,o lt { I,t,o z4 -zo
Distribucin riorrnal : l1,o F I H, ,'- i - l"o lt > t^/,
va'iarrza lt1. po Fllro slJn- tltu
clescolocida y,) l.ro lt 1 fto (n - 1) g.l. t { -to
8.6. Ejercicios
Se sospecha que los varones de las nuevas generaciones tienen, en promedio) mayor estatura que
las antiguas. En un estudio realizado hace clos dcadas se determin que la poblacin adulta
masculina tcna una cstatura media de 167 cm, con desviacin estndar de 10 cm.
Un fabricarrte de fertilizantes afirma que el uso de su producto dar por resultado una cosecha
de por lo rnenos 3.5 toneladas de trigo por hectrea, como media, con una desviacin estndar
de 0.5 toneladas. La aplicacin del fertilizante a un lea de 37 hectreas dio una cosecha de
3.35 toneladas por hectrea.
Una emplesa qlle elabora plarrchas plsl,icas puso en prctica un nlrevo rntodo de fabricacin
tal que el costo medio por rnetro cuadrado sc distribuye rrormalmente con va,rianza poblaciorral
4. Se obtuvo una muestra aleatoria simple de tamao 100, resultando un costo promedio de 2.4
dlares. Verifique la hiptesis de que el costo medio es dc 3 dlares, con rrn nivel de significacin
del4.5%.
246 Captulo 8. Prttebas de Hiptests
5. Pol cstudios rrrt<:Liorcs, scr srrbc crer lir" rrcrlir dr: I eclrd rle los tlclirrcrrcrrt<:s crr cl pzrs cs rlc 23
aos: sirr cnrl.,argo. crr un estrrclio rer:icnt<r (ioll Llnt unrcstLr rlc: 80 clr:tcrriclos. sc obtrrvo r-rrr 1>rorrrc<1io
clc 21.5 arlos y urrt <lesviar:irirr estirlrlrr' <lc i-J. Crl rrn nivcl rle sigrriic:ir<:irirr cl<:1 '2 %, r:r.,ur1.,nLelrc
ia, hipritcsis clc quo lr rneclir cie ecla,cl cle los clelirrcrrcntes sc hr lc<hrciclo sigrrific:rtivirrle:lr(,c.
(i LLr lrbor'rtorio frlrrrrcuti<:o asegura qllc rrn nrcdicrriertto crc fal rricr ti<rrre nrr <rolrtenirlo rrreclio
dc 10 000 unidadcs cln ca(la dosis. Para corrl"rol.rrr si c1 lrl-ior'itolio cs de fial se torn<i uua
mur:stla cle 40 dosis, obterricnclo una rucclia <le 9940 uuirirrles ) ulla desvircin ostinclar clc 120
unida<les.
a) .Poclcrnos aceptal la iuclicacin clel Irboratori<.r cou ulr rrivcl cle significacitit r.IeI I%il:
b) Calculc ei nivel de significacin de la prueba.
7 En un restaurante se haia tenido una media de 160 consumiclores diarios y nlla dcsviacirt
estrrclar clc 17.5. Se aumerrrt los precios cle la cornida y el propietalio not que 1os 30 riltimos
das haba un prornedio de 151 clientes diarios. trI propietario pnede pensar que efectivament<:
ha descendido el nmero de clientes o que la variacin es debida aI azatrl
B IJna emprcsa exportadora de camarn el ao pasado embarc una media de 10500 c:rjas por'
sernana) corr una desviacin estndar de 1500. Eu los primeros seis rneses (26 sernanas) dc estc
ao export un plornedio cle 11200 cajas cada semana.
10 Una sociloga afirma que cl tiempo que los nios cle tres r cinco riros dedican a ver la televisirr
cada semana se distribuye normalmente con media 22 horas y desviacin estndar 6 horas. Frentc
a este estr-rclio, una ernpresa de investigacin de mercados cree que la media es mayor y pala
probar su hiptesis tom una mucstra de 64 observaciones procedentes de la misrna poblacirr.
obtcniendo como resultaclo una meclia dc 25. Si se utiliza un nivel de significacirr del 5 %:
11. Urr rnicroernpresario est considerando la posibilidad de administrar cl bar clc uu colcgio. trl
adrrrinistradol actual del brr afilma quc r:l inglescr diario sigue una distrilrucin nolrnal rle rnedia
87.5 dlares y una desviacirr estndrr di: 7.5 dlares. Para comprobar si decr la verclld) torn(i
Lurr rnlrestra de treinta das y :sta revel<i r-ru ingreso dialio promedio dt: 82.5 dlrres. Utilizarrck
o: 0.1,
a) ,hay evidencir de quc cl iirgreso diario promcdio sel nenor clcl que rfir'ma el clueo actrral'/;
b) Calcule la potcncia clcl contraste si lr verdaclera rncdia fucra pr,:85.
Se dcsca saber si la cdad promedio a la cual sc clesposan las rlujeres en la ciudacl cle Cuenca es
diferente cle los 26 aos de edad. Sc torn rrna muestraclc24 registros dc rnrtrimoriio, resultandcr
las sigr-ricntcs edades de las novias:
18 28 46 21 29 23 47 43 23 32 20 56
26 40 19 35 20 18 16 65 22 19 24 32
14. Una compaa de televisin por cable anuncia que el periodo medio de espera desde la solicitud
hasta la conexin a la red de sus nuevos clientes es de ocho das. Una asociacin de consumidores
desea verificar dicha hiptesis, para lo cual tom urra rnuestra del periodo de espera (en das) de
15 clientes con los siguientes resultados:
\5. La resistencia, en kgf crn2, de Ia fibra de carbono se distribuye normalmente. Se tom una
mnestra de 10 elementos fabricados con este material, obteniendo:
203 229 275 220 223 233 233 208 228 209
Contraste la hiptesis de que la muestra proviene de una poblacin de media 275 kgf cm2.
6 Segrn los datos de una universidad, sus estudiantes obtienan en el examen de evaluacin clel
ingls como segunda lengua una media de 50 puntos. Un profesor de ingls quiso comprobirr
si sus alumnos tenan un promeclio rns alto, para ello seleccion una muestra aleatoria de 20
alumnos y les envi a examinarse. Los resultados dieron una nota promedio de 54 y desviacin
estndar dc 7 puntos. A qu conclusin llegar el profesor, con un nivel de significacin del
f,(Yn
/a:
En una ciudad se quiele hacer un cstr-rdio rpido para'r,'alorar el consunlo de agua en los domicilios
palticulares dulantc los meses de mayor seqntr. Para ello sc seleccionalon, al azar, 15 domicilios y
se midieron slrs consumos (r) en metros crbicos durante el mes de agosto. Los resultados fueron
Dr :280.5, Dr? :5308.35. En vista cle estos clatos, hay suficiente evidencia estadstica, al
nivel 0.05, r favor cle la hiptesis de que el conslrmo medio de los particulares durante el mes de
agosto es llayor clue 18m3 (q,-,e es el consnmc considerado como <sostenible>>)?
El consumo de gasolina (en litros por 100 km) de los automviles de 3 puertas sigue una distribu-
cin normal con rnedia 8. Se introdujo una modificacin en el motor con objeto de disminuir el
248 Captulo B. Pruebas de Hiptesis
corrslrnlo y se probaron 10 rutos corr el motclr modificaclo, obtcrrirrclose los siguierrtes esta,rlsticos
por' 100 krrr:
10 10
f
,.-r ",:77'5, T,r;i -
i.- I
(i01.33
a) Hay suficiente evidencia estadstica, al nivel 0.05, a favor de ia hiptesis de que el rruevo
modelo disminuye el tiempo dc acceso'/;
b) Calcule el p-valor.
c) Indique un par de valores de 7 y de s que hubiesen llevado a un p-valor de 0.005. Qu
decisin se dcbera tomar eri este caso respecto al nucvo rnoclelo?
20 Una muestra de 25 traba.jadores informales, que sc dedican a vender golosinas en los buses.
ganan un promedio de 17.5 dlarcs diarios con una desviar:in estndar de 2.5 dlares.
a) Estime la ganancia pr:ornedio diaria r-le es1,c tipo cle trabtrj:rdores informales, usa,ndo nn
intervalo de confianza aI g57a;
b) trs Ia ganarrcia promedio de 17.5 cl<ilares significativmente inferior a los 18.5 dlares qrrc
ganan los vencledores qne tienen un prresto fijo en los cines? (Utilice nn nivel del 5%.)
Verilique si la nrqrrinir gartrrrtiza lir prer:isin neer:salia p;rlzr el uivel cle significirr:irin ck: (-).05.
24. estndar-de un proceso ir.ciustLirl (irrc plo(hlce valillas, <:l concliciones nolrnirles,
Lr c{esvia,cicin
es clc 3 crn. Se dispone de una nnestra ck: tarnairo 15, con los sigr-rientes valores:
25. Una mquina de crnpaquetado automtico deposita en cada paquete una ciclta cantidad de papas
fritas. Se scleccionan 20 paquetes, se pesa su contcnido y se obtienen los sigr.rientes resultados:
49 50 49 t10 50 50 49 50 50 50
49 50 50 51 52 48 50 51 51 51
a) Verifique si la media de esa variable es 51, con un nivel de significacin del 1%;
b) Verifique si la varianza es la unidad, con un nivel de significacin clel 5 %.
27. Una marca de aceite comestible cubre actualmente el 20 % de los rotencialcs clientes. Para
incrementar las ventas se estructura una campaa pubiicitaria intensiva. AI final de la misma se
realizar una investigacin a 400 consumidores potenciales para determinar si tra tenido xito.
r8 En una encuesta a 300 taxistas, 132 contestaron que utilizan el cinturn de segulidad. {Jtilizanclo
un nivel de significacin del 5 %, podemos concluir que la mitacl de los conductores utilizan el
cinturn?
')9 De acuerdo con sns registros, una clnica ha establecido que la probabilidad de curacin completa
de un enfermo que ha tomado el medicamento A es 0.8. La clnica experiment con un nuevo
medicamento B en 700 pacientes, de los cuales 575 se cllraroll totalmente. Se puede considelar
que el nuevo medicanrento es ms eficaz que el tradicional, al nivel dc significacin de 5To?
Una agencia dedicada a1 cobro de cheques encontr <re el 5 % de toclos los cheques remitidos
a la agencia eran cle cuentas sin fondos. Despus de implantar nn sistema de verificacin, pa,r'a
disminuir sr"rs prdidas, se hallalon solarnente 50 cheques sin fonclos erl Lrna mncstra aleatoria cle
1124 cheques. Existe suficientc evidencir, estadstica para concluil quc el sistema de verificacin
ha reducido la proporcin de cheques sin fondos?
Un proveedor ascgura que los artculos que 1 snnrinistra sorr defectu.osos en un 1% cle los casos.
Se realiz r-rna pmeba r 200 de sus artcnlos y resr-rltaron 3 r-lefectllosos.
a) A un nivel cle significacin del 1 '%, ;t:s falsa o cierta la afir'macin del ploveedor?;
b) Halle el nivel de significacin observado de la plueba.
En una encuesta en Quito se entrevist a 850 adlrltos. A la pregunta de que si ellos estaban a
favor del endurecimiento de las penas por ciertos delitos, eI 52% respondi afi.rmativamente.
250 Captulo 8. Pruebas de Hiptesis
r) .Sc Pucclc ccttr:lttil ctct lir rtit\rorr clet los rdultos estn r favol del enchrrc<tirrLierrto rle lrs
l) ollrs ?i
33. Utt ecortornista clcl Battco Cerrtral est intcreslclo err conrl)ar'rr cl uilice cle arrsentisrno labolal
crr (.)rrito con el dcl rcsto del pas, doncle se sitria <n eI 77(%. Corr estc plopsito se:ieccionci, al
azar') urra rnuestra cle 200 tlaba.jaclores de dicha, ciuclad, la cual proporcion rur porcenta.je de
ausentisnro del \6(Vo.
a) Se pr-rede sacar la conclusi,n de que el arrsentisrno es rnayor en Qr-rito qlle cn el lesto de1
pas, al nivel de significacin a : 0.025?;
34. Una agencia de publicidad trat de convencel a un industrial para que hiciera propaganda
televisada de uno de sus productos, asegurndole que el programa en el que se incluira su
aruncio era visto por el 2A% de las familias. trl industrial quiso hacer un experimento por su
cuenta. Llam por telfono, durante Ia hora del programa, a 220 familias y hall que en 33 de
ellas se vea el programa.
35. En un programa periodstico de opinin se pidi que los televidentes Ilamaran al canal y respon-
dan a la pregunta << ,cree usted que es necesario que se hagan reformas en el sistema educativo
del pas?>> De 812 llamadas recibidas, 790 se expresaron afi.rmativamente.
a) Use esta informacin para realizar Lura prueba de que ms del 95% de los ecnatorianos
adultos cree que se deben hacer reformas en el sistema educativo;
b) trs el resultado de la prueba estadsticamente significativa al nivel 0.01?;
c) Liste las hiptesis requeridas para que Ios resultados de Ia prueba sean vlidos en esta
situacin. En este caso, ,se satisfacen tales hiptesis?
Al igual que en el caso de observaciones realizadas sc\bre una misma poblacin, cuanclo se dispone
de varias muestras provenientes de poblaciones distintas, se podra desear conocer si ellas compalten
irlgurra caracterstica o si son totalmente diferentes. En Io que siguc nos ocuparemos de las pmebas
de hiptesis que involucran dos mllestras.
Igual a lo que se hizo en la seccin cledicada a las pruebas de hiptesis sobre la rnediir, se deben
considerar los casos en qne es posible aplicar el Teorema del Lmite Central y aquellos erl que no es
posible. Adicionalmente, se deber terrer en cuenta un tercer caso, cuando las muestr-irs provienen de
una misma unidad muestral, mediante mediciones repetidas.
8.7. Pruebas para Ia diferencia entre dos rnedias 25t
Sr-rporrgarnos !1[te sc) clispone r[c clos poblaciorres, rlrri: liLs rrr)rnl-,r'rlcn]os conlo I -y 2, y se clescr 1rrt.r]rzrl si
la difcreucia entre lrs clos rnccUas polrl:rcionales es igual l nrra crnticlad 1); cs clecir, H1: 1 - lLt - Do,
o se clesei lrlobal el caso lrirlticular cLe ltr igualclic.l dc talcs rnedirs, o scA) H'. t1 - ,t,.r.
De la pobltrcin 1 se extrae irnt rnrtestta de tarnao rL y de la pobl:rcit 2 sc extrrc unl mlrestlr (le
tarlao n2. Si lrs colrcsporrdientes r,'arianzas poblaciontrles son corrociclas. las 1>nrebas de hiptcsis
son las signientes:
Y n'' n2
4. Regin de Rechazo. zobs 1 -zryl2 o zobs > za/2.
2 F"r-,r"!in ,lo
3. Estadstico p,"",.t,^ z.ts: (rt -z) - Do
de P'rueba. - l,
loi o;"
U^--q
4. Regin de Rechazo. zobs> zo (oltierr zo," -zat cuarrdo H (t1 - pz) < Do).
Ejernplo. Una inversionista tiene dos hoteles en la ciudad, uno en el norte y otro en el sur. El
sospecha que el conslrmo medio en el restaurante del norte es menor que en el del sur. Del primer'
-ocal se obtuvo una muestra de 30 facturas, r'esultando un consumo medio de 59 dlares. Del segunclo
-ocal se tom una muestra de 50 facturas, con Lln consunlo medio de 63 dlares. Las varianzas de los
: onsumos en los clos locales son conocidas e iguales a 60 y 80, respectivamente.
a) Para un nivel de signiflcacin de 0.05, r'erifque si es cierta la sospech.a del duer-ro cle los hoteles;
4. Ile.qi,n de Rechq,zo. Para el nivel clc significacirt o : 0.05, 1a regirlrr cle rechazo es z,'," {
-7.645.
cl loca1 del nortc
Dccisi,,n. Corno zobsl (:aceu la rcgin cle rechazo; se concluye qlle cn
e1
5.
conslrmo es menor.
b) Puesto qtLe zobs: -2.17, entonces o(-2.11) :0.0174; es decir', el p-valor <:s 7'74o/c''
8.7.2.Caso2:Varianzasd'esconocidas'Supuestasiguales
- 7t 'i-,"1'-2'
, (nr- r)r? - - ls|: it'
s-:-
qn2
"
ntln'-2
n,.-2
4. Regi,n d.e Rechazo. tob, ) t,,(rr1 + n'2 - 2) (o bicn tot," { -to(U I nz - 2), cuando
Hr (h - P) < Do)'
8.7. Pruebas para Ia diferencia entre dos medias 253
Observacin. EI supuesto que realizamos de igualdad entre las varianzas poblaciones--, debe ser
comprobado meclirnte la prueba cle hiptesis cor'r'espondiente, qr.re Ia explica cn la Seccin 8.8.
Ejemplo. Un irrversionista no sabe si invertir en bonos ernitidos por un pas A o por un pas B.
Para realizar Lrna decisin, seleccion dos muestras correspondientes a los rendimientos de los bonos
emitidos por los dos pases, obteniendo los siguientes resultados:
Pas A
Rendimiento (%) 12.3 t2.5 r2.B 13.0 13.5
Frecuencia
Pas B
Rendimiento (7o) U 12.2 72.3 13.0
Flecuencia rn;
A un nivel de significacin del 0.01, verificar si el rendimiento de los bonos de los dos pases es el
mismo. (Asumir que los rendimientos siguen una distribucin normal y tienen igual varianza.)
Solucin: Se tiene que
.1, 12.80, s7:0.71, n" : 70,
a-
-
12.35, s? : 0.07, nv : 16.
4. Regin de Rechazo. Como to oos(24) : 2.797 , la regin crtica es o" > 2.797 o to6" 1 -2.797 .
5. Decis'in. Como to6" ce en la regin de rechazo) se puede asegurar que los bonos de los dos
pases tienen rendimientos diferentes.
Queda como ejercicio para el lector determinar en cules bonos se recomienda invertir.
Sr-rpongamos que se dispone de dos poblaciones y se desea probar si la diferencia entre sus correspon-
lientcs medias pobltr,cionales es igr,ral a r0; es decir, 11: h - lrz - Ds. Para ello. admitiremos que
.as poblaciones sorl normales, cuyas varianzas poblacionales sorr desconocidas y distintas.
2. H ip te si s A It ernat'iu a.
3. Estadstico de Prueba.
4. Regin de RecLo,zo. tob, 1-trtzG) oto,, ) t.lz(g), donde cl nirmero de grados de libcrtad
, ,) ,2
/","i\
'
\tt n.r)
se calcula pot g -
l'? , s]
Ejemplo. Se desea conocer el efecto delfro extremo sobre la realizacin de operacioncs manuales.
Fara ello se eligieron al azar 20 voluntarios, clivididos en dos grupos de 10. Al primer grupo se le
expuso a una temperatura de 4oC, rnientras que al otro se le mantuvo a temperatura ambiente. Se
contabiliz el nmero de veces que los voluntarios podan abrir y cerrar Ia mano en un lapso de 15
segundos, con los siguientes resultados:
No expuestos al fro 54 tr1
, a 40 45 48 46 45
(o 49 50
Expuestos al f,ro 32 29 3B 33 34 tt
r)rJ 36 o 29 o.)
Lt)
Probar Ia hiptesis que el estar expuesto al fro reduce la capacidad de abrir y cerrar la mano en ms
de 12 veces.
/ L6.Bg 19.16 \ 2
9:
(ro**) : 17,9 v 18.
8.7. Pruebas para Ia diferencia entre dos rnedias 255
1. Hipteszs - t z) : Do.
Nula. Ho: (h
2. H'iptesis Alternat'iua. Hr (fq - LL) I Do.
(lt - - no
3. Estad,sti,co d,e Prueba. tob, :
l"? , sl
U^--
4. Regin de Rechazo. tob" 1-t^tzj) oto6") t,/z(g), donde el nmero de grados de libertad
nz-l
Cuando g no es un nmero natural, se redondea al entero ms cercano.
Las pruebas para las diferericias de las medias, realizadas anteriormente, se aplican cuando las dos
muestras son independientes, pero existen casos en los que Ia informacin recogida no es independiente
(como cuando se Ia toma de un mismo individuo de manera repetida) .
Sea (r1,y1), (rz,Az),..., (rn,an) una muestra aleatoria de pares de observaciones; donde (r,y)
representa dos mediciones tomadas de la misma unidad muestral, antes y despus de un tratamiento
o fenmeno que Ia afect. Se desea conocer si Ia poblacin cambi de manera apreciable despus
del fenmeno indicado; para ello se emplea la prueba de diferencias por parejas de la manera que a
continuacin se describe.
256 Captulo 8. Pruebas de Hiptesis
Se construye una muestra aleatoria de las diferencias dt, d2, .. ., dn, donde d: r-Ai (i :1,2,. .. ,n),
que las supondremos siguen una ley normal de media p,,1 y varianza o2(1. Para estos parmetros
poblacionales se calculan sus estimadores:
lft1lL
,I: ! r, y s7.: -- . r(n - )r.
i.:1 i.:1
Observacin. Tambin, se pueden realizar los contrastes unilaterales considerando las hiptesis alter-
nativas F 1 Do o F ) Dg; para cada caso se escoger, de Ia manera antes indicada, la correspondiente
regin de rechazo. Se recomienda que el lector formule tales pruebas.
Para un nivel de significacin de 0.05, establecer si el acondicionamiento fsico vari de manera signi-
ficativa la frecuencia cardiaca, suponiendo una distribucin normal de las diferencias.
A:2: :3.22,
r_l
sa,:8.2r.
5. Deci,sin. Como to6" r1o est en la regin crtica, no se rechaza Hg; es decir, no hay por qu
considerar que hubo una variacin apreciable en la frecuencia cardiaca.
8.8. Pruebas de hiptesis para la razn entre dos varianzas 257
Supongamos cllre se desea probar la igualclad de las varianzas dc dos poblaciones normalmente dis-
tlibuidas, de las que se han extrado dos muestras independientes; es decir, se desea probar Hg: ol : 6/.
Las pruebas de hiptesis son las siguientes:
5. Deciszn. Prtesto que 1.571 < 3.12, no se debe rcchazar la hiptesis de la igualdad cle las
variarrzas. Entonces, fite correcto rsumir que las varianzas elan igrrales, cuando realizamos la
prueba sobre la igualdad de las me<lias.
:--ipongamos qnc se han scleccionado dos muestras, de rnanera aleatolia e irrdependiente, de dos pobla-
.-rnes binorniales, cr.tyos tantarios, llr y'r2 sorr sufi.cierrtemente altos palir que las distribuciones rnucs-
-:ales de Ft y fz sealt aproxirnadanrente norrnales. Se desea probal si Ir difclencia de las proporciones
:'nestrales es igual a un valor D6. Se deben tomar en cuenta dos casos: cr-rndo Do : 0 (igualdad de
-is proporciones) y cuando Do 10.
258 Captulo 8. Pruebas de lliptesis
io(!
\nr
.;)
4. Reqin de Rechazo. Zobs { -zo/z o 2o6" } zo2.
Pt:go :
5
0.0625, Fz:
6
: 0.0882,
6B
5+6
0: 80+68 :0.0743.
Observacin. Tambin, se pueden realizar las pruebas unilaterales para probar que I11 : (pt-pz) > Do
f11 : (pt - pz) < Do, cambiando las regiones de rechazo segn cada caso particular.
o qtre
Ejemplo. En el deporte del balonmano) en un partido est permitido sustituir al portero solo
para que detenega los tiros penalties. El entrenador de un equipo, al definir su estrategia para un
partido, examina las estadsticas individuales de los porteros titular y suplente. En una muestra de
los registros cle los entrenamientos del ltimo mes, el titular ha detenido 128 de 510 penalties y el
suplente ha detenido 183 cle 480 tiros. El cntrenador decidir sustituir al portero titular, el momento
de parar un penalti, si el suplente ha detenido al menos un 10 Va :ms de tiros que el titular. A un
nivel de significacin del 5 7o, qr decisin tomar el entrenador?
128 183
'Pl : =-:=:0.21, T)t:- :0.381.
510 480
1. Regi,n de Recha,zo. AI nivel de significacin 0 05, la regin de rechazo es zobs > 1.645.
5. Decisir. Conio zobs:1.023, no cae en 1a legin de lechazo, no hay razn para pensa. que la
diferencia es mayor qr-re 0.1; entonces, e1 cntrcnador no debela decidirse a sustituir al portero
titular.
in el Cuadro 8.2 se presenta Lrn resumen de las pruebas de hiptesis con dos muestras.
260 Captttlo 8. Pruebas de Hiptesis
(t:r -rz) - Do
Normal lrt : Do
[L' r'r- Prf Do Itl > t.i't
anzas desconocidas
vrri trtt -ttIDo t, - t,2 ) D t) t.,,
\it-rz)-Do
Norrnal Ft Fz: Do ut-t-LtlDo Itl > t,,z
varianzas desconocidas 11't-Fz{Do t1,,,-Fz)Do tlto
supuestas clistintas LIt - Fz) Do r.r-t"{D6
Normal Fn: F,o,, H o I trtn,, D-u^ Itl > t.t"
observaciones llo I Ho,, l-Lo) 11n,, sdlJn t>t-
empareiadas ILn ) Fo,, lto { 11o,, n-1g1, t<-t^
o I :o 2 olo
2, F:5st F ) F,/z
Noma1 o 21 1o 2
2 01)02 2
F>T-.
o 1 )o 2
2 < ur:nr-I,u2-n2-I F I Ft-o
"? "',
8.10. Ejercicios
Pruebas sobre la diferencia de dos medias (varianzas conocidas)
1. Dos mquinas envasan cereal en ca.ias. De la prirnera rnquina se obtu\o una muestra dc 30
cajas) resrlltando un peso promedio de 130 g y de la segunda mquina se tom Lrna muestla
de 50 cajas) con un peso promedio cle 125 g. Las varianzrs de los pcsos envasados por las dos
rlqlrinas son conoci(las e igr-raIes a 60 y 80, respectivamentc. Para un nivel clc significacirr rle
0.C5, velifiqlle si laij clos mquinas er]\asan iguales canticlirlcs de ccreal.
2 En del Minist,erio de SrhLcl se rnicli el conterriclo clc nicotirra c-le clcs rnarcrs
unr iuv<:s1,igacirr
de cigallillo. Err un experinlentocorr 50 cigarrilkrs de la priruer' nralcr se elrr:ontrci que tielre
un corrtenido promeclio de 2.47 nlg corr clesviacin estrrclar de 0.12 rng; mierf,ras quc p1ra 40
cigarrillos de lzr segurrda mrrca el crorrterriclo 1)rorncdio fuc <le 2.39 mg colr clesvii.rcin estinclar rle
0.14 mg. Prr.rcbe la hiptesis rlula //,1 - I,L2 - 0.12 contr1 la tltettatiya /r - l, 10.12, tisarlo
cv : 0.05.
En unt ciuclarl operan 2 elrpresas dc telerfonr cclular: Flirius y Qualli. Por los registros ltrs
c[]plesrs sal)cn que cl gasto inenslr11 de slrs borrrdos ticrren clcsrriaciorrcs cstilrclar'<lc 6.5 y 5
cllares, iespectivamerlte. Parrr conrpalal ol gasto nreclio dc los c:lientes cle las <los enrplesas, se
tom una rnuestra) aI azar, de 34 clierrtes dc Sirius y otra ullrestrr de 41 clientes de Quark. Los
corresl)ondientes conslrmos mensuales fueron 35 v 38.5 dlares.
8.70. Ejercicios 26r
a) Proporcionan estos datos evidencia estadstica, al nivel 0.04, a favor de la hiptesis de que
el gasto de los clientes de Sirir-rs es menor que es gasto dc los clicntes de Quark?;
b) Halle el p-valor de la prueba.
4 Los ingresos del primer ernpleo de los ingenieros informticos, egresados de cualquier universidad,
siguen una distribucil normal con desviacin estndar de 3800 dlares. Se tom una muestra
aleatoria de 15 ingenieros procedentes de la Universidad Nacional, resu.ltando que en su plimer
empleo los ingresos medios anuales fueron de 12000 dlares. Otra muestra independiente de
12 ingenieros de Ia Universidad Tcnica dio como resultado unos ingresos medios en el primcr
empleo de 13 200 dlares. Se pide, con un nivel de significacin dei 2'/o, probar Ia hiptesis dc
que las medias son iguales frente a la alternativa de que la media de la Universidad Nacional es
menor que Ia de la Universidad Tcnica.
5. Una cooperativa agrcola produce cierto atroz con fertilizante natural y con abono qumico. En
las parcelas donde se emplea fertilizante natural se obtienen plantas cuya altura tiene varianza
de 47 cm2. En los terrenos donde se usa abono qumico la altura de las plantas tiene un varianza
igual a 39cm2. Para comprobar las medias se toma aleatoriamente una muestra de 65 plantas,
31 correspondientes al primer tipo de tierras y 34 al segundo; obtenindose en las muestras 92
cm y 86 cm de alturas medias, respectivamente. Para un nivel de significacin del 6 %, contraste
Ia hiptesis de que los fertilizantes son igualmente eficaces, frente a Ia hiptesis alternativa de
que es ms eficaz el natural.
En un proceso qumico para producir oxgeno (O2) se emplea un catalizador. Durante treinta
das se midi Ia cantidad promedio de oxgeno producido luego de haber colocado el catalizador
y cuatro horas despus, resultando que, en el primer caso se producan 1000 litros de 02 en una
hora, con una desviacin estndar de 90 litros y en el segundo caso se producan 880 litros de Oz
con una desviacin estndar de 140 litros. Existe evidencia que indique que el catalizador se
degrada, produciendo una merma de al menos 100 litros de 02, cuando han transcurrido cuatro
horas?
Se efectu un anlisis sobre la duracin de las mquinas computadoras que se utilizan en las
empresas prblicas. Se eligieron dos muestras de computadoras, de marca y de clones, cada una
constituida por 80 mquinas. Para las de marca, result una vida promedio de 4.8 aos y una
desviacin estndar de 1.7 aos. Para las clones, dio una vida promedio de 3.3 aos y desviacin
estndar de 1.2 airos. Puede considerarse que la vida media de las computadoras de marca es
superior en al menos un ao a las que son clones?
La FIFA realiz un cambio en la forma de puntuacin en los partidos de ftbol ganados: se otorg
tres puntos al equipo ganador, en lugar de los dos puntos usuales. Para examinar la efectividad
de la nueva norma) se examin los resultados de los partidos jugados en 1995 y 1996 (ao en
el que entr en vigencia la nueva norma) . En 45 partidos examinados, jugados el ao 1995, se
encontr un promedio de 2.87 goles por partido y una desviacin estndar de 0.21; en los 38
partidos examinados de 1996, se hall que se haban ploducido un promedio de 3.05 goles con
Captula E. .Fruebas de {iptesis
dcsviacirjn estridal cle 0.18. Fuede decirse c-re irr rrlreva rrolrrra pelrniti<i unlr:n1,ar t:l prornoclic-r
cl: goles por partido'/
10 Una persona desea comprar un automr'il nr-revo y toma conro factor de decisin el consumo meclio
de cornbustible que tienen dos nlodelos de calactersticas similarcs, uno fabricraclo en Europa v
otro en Corea. Consulta una rerrista especiahzada y encuentra qr.rc e1 auto eulopeo tiene nn
recorrido prornedio de 28.3 krn por gain de cornbustible. con nna desriacin estndar de 6.2
km; para el auto coreano encucntra qr-re el rccorrido es dc 26.7 krn por ga1ll una desviacicirr
"v
estndar de 5.1 km; adems, la revista indica que los datos estadsticos fuerorr tomados a partir
de las mediciones realizadas en 50 autos de cada oligen. Cutr de los dos aritos cieber'i cornl-iral?
o deber tornar en consideracin otras calactersticas, distintas clel renclirniento del combustible.
para tomar su decisin'/
Fruebas sobre la diferencia de dos rnedias (varianzas desconocidas)
11. Se realizaron pruebas para conocer la cantidad de plomo en la sangre de personas expucstas a
la contaminacin en ia ciudad. Se tomaron muestras aleatorias de 24 nios y 18 adultos que
dieron los siguientes resultados (en ppm):
Adultos Nios
rt : 0.043, rz:0.028,
sr : 0.018, sz : 0.007.
Asumiendo que las varianzas poblacionales son iguales, pruebe la hiptesis de que no hay dife-
rencia entre el contenido medio de plomo en la sangre de los nios y de Ios adultos, contra ia
hiptesis de que los adultos tienen mayor cantidad que los nios.
12. En un estudio sobre un nuevo programa piloto para el aprendizaje a distancia mediante com-
putadora, se eligieron al azar,21 estudiantes de una clase para seguir el nuevo prograna (grupo
piloto) mientras que los 23 restantes seguan el mtodo tradicional (grupo control). Finalizado
el curso, se realiz un examen obtenindose los siguientes resultados:
Grupo piloto Grupo control
Nota promedio 51.48 47.52
Desv. estndar 11.01 14.15
Suponiendo igualdad de varianzas, contraste si hay evidencia (a nivel del 5 %) de que el nuevo
mtodo piloto da mejores resultados que el mtodo tradicional.
Pruebe la hiptesis de que no existe diferencia entre el total de surcos) contra una triptesis
adecuada a los datos, asumiendo igualdad en las varianzas.
tr) Pruebe Ia hiptesis de que los dos medicarnentos tienen igual efecto, contla la hiptesis de
que el mec.licamento B es rns efectivo. Qu conclusin saca?;
b) Encuentre el nivel de significacin arroximado de la prueba.
15 Dos empresas competidoras (S y T) que venden implementos deportivos han puesto en marcha)
casi simultrreamente, pginas de internet para la venta electrnica. Se eligieron, al azar) ocho
clientes que visitaron la pgina S y, de manera independiente, otros ocho que visitaron la T y sc
midi el tiempo (en minutos) de la duracin de ia visita de cada cliente. Los resnitados fueron
los siguientes:
Pg naS oa c).tr tJ 42 3.2 44 21 16 d"t) .)
Pe naT 1t
IJ z-,1 44 2B ri.5 3.6 /t
Proporcionan estos datos suficiente evidencia (al nivel 0.05) para afirmar que los tiempos medios
de duracin de las visitas en ambas pginas son diferentes?
16. Para los tres primeros meses del ao, 15 vendedores de la Costa tuvieron ventas semanales
promedio de 300 dlares con una desviacin estndar de 50 dlares; en tanto, 10 vendedores de
ia Sierra tuvieron ventas semanales promedio de 260 dlares, con una desviacin estndar de 16
dlares. Si consideramos que las desviaciones estndar de las ventas son diferentes, determine
si los vendedores de la Costa tienen mayores ventas semanales.
t7. Se compararon los tiempos (en segundos) que realizan atletas escolares, masculinos y femeninos,
al recorrer una distancia de 500 metros. Para el efecto, se registraron las marcas de 9 nios y 7
nias, obteniendo lo siguiente:
Nios 187 223 235 r92 259 775 206 t94 247
Nias 248 366 223 326 274 369 301
Determine si la diferencia en el tiempo medio entre hombres y mujeres es mayor que un minuto.
Use rr : I0'7a.
18. Se sospecha que Ia concentracin media de dixido de carbono es mayor en la capa de aire ms
prxima a la superficie. Para contrastar esta hiptesis se analiz el aire en 20 puntos elegidos
aleatoriamente a un metro de altura del suelo, resultando una media muestral de 580 p.p.m.v.
(partes por milln en volumen) y una desviacin estndar de 60. Tambin, se realizaron 16
mediciones de la concentracin, a una altura de 18 metros, resultando una concentracin de 365
p.p.m.v. y una desviacin estndar de 110. Suponiendo norrnalidad para las mediciones y que
Ias varianzas son diferentes, proporcionan estos datos sufi,ciente evidencia, al nivel 0.01, a favor
de la hiptesis de que la concentracin es mayor cerca del suelo?
Pruebas sobre Ia diferencia por parejas
19 Se hizo un estudio para comparar los tiempos de acceso, en diferentes momentos del da, a
internet desde computadoras domsticas con mdem. Para ello, se cargaron 8 pginas web por
la tarde en el periodo de 14 a 15 h. y, con Ia misma mquina, Ias mismas 8 pginas por Ia noche
en el periodo de 22 a 23 h. Los respectivos tiempos de acceso en minutos fueron:
Antes 19 T4 23 25 18 24 17 19 20 11
Despus 20 15 26 24 t7 26 18 22 26 11
264 Captulo 8. Pruebas de Hiptesis
A un nivel clc significacin dei 5'%, ,se prrecle decir <re el nrtevo mtodo es efcctivo'?
2L Urr glnpo dc invcstigaclores afirma haber dcscrrbiclto un ti1.ro clc alirncnt,acin pzua las gallinas,
ba.jo la cual stas prodricen hnervos que rlo aumcnl,rrr cl c;olcsterol en Li,s personas que los q)n-
slrrten. Parzr cornprobal dicha teora, sc seleccionaron al azar 36 personas a las <,rte se les rnicli
su nivel de colesterol habitual (z ) . Desprrs sometcr' r estas rnismas pcrsolas a ulla dieta r base
de los huevos en estudio, se micli cn ellas cle nu.cvo dicho nivcl (y). Los resultaclos fiterort:
l Ji -., :
I =2a3. s -200, ;t1\ 4) . (d,-d)- ls6
r.- 1
22. Se quiere comparar dos mtodos rpidos para estimar la carga elctrica en Ltn circuito. En
un laboratorio se midieron B circuitos, mediante los dos mtodos, obteniendo los siguientes
resr-rltados:
Circuito 1 2 3 4 r
d 6 7 B
- a) Ha, suficiente evic,lcncia l)r.ra pertri)r q,re al. : o?.?, -r q nirrcl cle significacirr cle 0 05;
lr) Encucntre el rtivcl dc siguificacin dc la plr,rebtr, c inter'lrrete el lcsultaclo.
25. Unr fbrica cle refrcsctos tiene clos mquirrirs enrbotcllrclorrs qrre eDvasan el lqr-rid<; err las botcllas.
Los expencledores hrtt irrfor-nirdo rl fabticrrrte quc lrr.s botellrs ltrcsentirl clemasirclr yali-Lltiliclad
eu la cantidacl de lquido que cortlienert. llala exanrinar la que.ja se nidiri la var.irza clel vrlmeir
clc 1quido crnbotellado ltol cacla ttna de las maic.rirras, resrrltanclo qrre con rrnr rqcstra c1e 18
botellas cle la mquirta 1, se obtrtvo una varianza clc 700 y ciou una mucstla de 15 botellas clc lr
rrtquirra 2, se obtuvo ttna valinza de 210. L1 vuial)ilidad err los volirmenes crrvasaclos
ser atribuida a una o a las dos r,rquinas? Utilice a : 0.05. 'r-rcclc
8.70. Ejercicios 265
26. Dos estaciones rneteorolgicas predicen Ia temperatura a medio da en la ciudad con seis horas de
anticipacin. Se tornaron dos muestras independientes de los datos de cacla estacin, resultando:
a) Verifique si las varianzas de las temperaturas pronosticadas son distintas. (Tome c:0.1);
b) Empleando el resultado anterior, pruebe si las dos estaciones pronostican iguales tempera-
turas, a un nivel de significacin de 0.1.
27. Se van a probar dos medicamentos A y B contra una enfermedad. Para sto se trataron 21
ratones enfermos con A y otros 21 con B. EI nmero medio de horas que sobreviven con A es
1200 y el nmero medio con B es L225. Suponiendo normalidad en ambos casos:
a) Se puede aceptar igualdad de varianzas si se sabe que D@o - ,)" :9800 y D(An - y)' :
3500? (Tomeo:0.05);
b) Es ms efectivo el medicamento B? Plantee el contraste adecuado para estudiar esto con
un nivel de significacin del 5 %.
18. Una compaa petrolera est considerando Ia posibilidad de introducir un aditivo en su gasolina,
esperando incrementar el kilometraje medio por litro. Los ingenieros del gupo de investigacin
probaron 10 autos con la gasolina habitual y otros 10 autos con la gasolina con el aditivo. trl
resumen de los resultados es:
ll. IJn economista del Instituto Nacional de Censos desea conocer si las tasas de desocupacin
urbanas son iguales en las dos principales ciudades del pas. Con base en sendas muestras de
500 personas en cada ttna de las ciudades, el economista encontr 46 personas desocupadas en
una ciudad y 35 en la otra. A un nivel de significacin del 3 %, puede snponerse que las tasas
de desempleo en las dos ciudades son diferentes?
,1. De una muestra de 300 televidentes escogidos al azar, que tenan sus televisores encendidos en la
hora del noticiero, 50 indicaron que tenan sintonizado el canal 4y 70 que sintonizatotr el canal
8.
a) Puede afirmarse que los dos canales tienen igual nivel de sintona a Ia hora del noticiero?
(Utilice un a:2To);
266 Captulo 8. Pruebas de Hiptesis
.Jo
L Dos ernpresas encrrestadoras realizan investigaciones para determinar el porcenta.je dc pcrsonas
que votarn a favor de una pregunta en Lrn plebiscito. La primera cnrplesa etrtrevist a 1000
pelsonas de las cuales 367 contestaron afirrnativamente. La segunda empresa entrevist a 300
personas y obtuvo 121 r'espuestas afirmativas.
a) Puede considerarse que las dos empresas entregan resultados similares respecto del nrmero
de electores que votarn SI a la pregunta. Utilice a : 0.05;
b) Encuentre el nivel de significacin de Ia prueba.
.).) Se seleccion,al azar,500 usuarios de correo electrnico que trabajan en empresas pblicas -
result que 32 de ellos haban recibido virus informticos a travs del correo en eI ltimo ao.
Se realizotro muestreo independiente eligiendo, al azar, 300 usuarios que trabajan en empresas
privadas, resultando que 9 de ellos haban tenido este mismo problema.
a) Proporcionan estos datos sufi.ciente evidencia estadstica, al nivel 0.04, a favor de la hipte-
sis de que la incidencia de los virus es mayor en las empresas pblicas?;
b) El p-valor del contraste, es mayor o menor que 0.01?
34. Un estudio indicaba que las hijas de madres fumadoras durante el embarazo tienen mayor proba-
bilidad de ser ellas mismas fumadoras. El estudio se Ilev a cabo con nias, preguntndo si ellas
haban fumado el ltimo ao y a la vez se consult a las madres si ellas haba fumado cuando
estaban embarazadas. Solo el 4% de las hijas, de 200 madres que no fumaron cuando estaban
embarazadas, haban fumado el ltimo ao, comparado con el26% de las hijas, de 500 madres
que haban fumado, tambin lo haban hecho. En la investigacin se propone que el hecho que
una madre haya fumado en estado de embarazo, aumenta Ia proporcin de hijas fumadoras en
w 20To.
35. Se desea comparar Ia proporcin de viviendas con servicio de alcantarillado en las reas urbana
y rural de Pastaza. Se hizo un muestreo en las dos reas con los siguientes resultados:
Hay suficiente evidencia para concluir, con un nivel de significacin del 3 %, que en Pastaza,
la proporcin de viviendas con alcantarillado en la zona urbana excede en ms del 15 %o a la
proporcin de viviendas con alcantarillado en la zona rural?
36. Para estudiar el efecto de una nueva terapia sobre el cncer de seno se tomaron dos muestras,
una de 300 pacientes que no recibieron Ia terapia y otra de 200 que si lo hicieron. De Ias que
no recibieron, L7L pacientes murieron y de las que si recibieron, 66 murieron. Un tratamiento
se considera efectivo si rebaja en ms del 18 % el porcentaje de los pacientes fallecidos. A un
nivel de significacin de 0.05, es efectivo el nuevo tratamiento?
Captulo I
Pruebas de Hiptesis No Paramtricas
En las pruebas de hiptesis que utilizan Ias distribuciones normal, t o F, se supone que la ley de
probabilidad de la poblacin de la cual se extrae la muestra tiene determinada forma y que sus
parmetros verifican ciertas condiciones de manera que el estadstico muestral correspondiente tiene
una distribucin de probabilidad conocida, por lo que se llaman pruebas paramtricas. Por ejemplo,
para la aplicacin de Ia prueba , se debe suponer que Ia poblacin es normal. Adems, para la
aplicacin de las pruebas paramtricas se requiere que el nivel de las mediciones sea al menos de escala
de intervalos.
Sin embargo, existen muchas aplicaciones en las ciencias y Ia ingeniera donde no es posible conocer las
distribuciones de las poblaciones de las que se extraen las muestras o los datos se reportan como valores
en escala ordinal. En estos casos, se utilizan mtodos alternativos equivalentes a los paramtricos,
denominados mtodos no paramtricos o de distribucin li,bre.
Con frecuencia se utilizan las pruebas no paramtricas cuando se tratan de inferencias con muestras
pequeas y distribucin desconocida de la poblacin, ya que en estos casos no se puede utilizar el
Teorema del Lmite Central. La aplicacin de los mtodos no paramtricos no requiere conocimientos
matemticos avanzados, debido a que la tarea matemtica consiste en ordenar por rangos Ios datos
observados.
Si se verifican Ias condiciones exigidas para el uso de una prueba par-amtrica, entonces, es siempre
preferible utilizar sta y no su equivalente no paramtrico. EIlo se debe a que si se utiliza el misrno
nivel de significacin en ambas pruebas, Ia potencia de una prr.reba no paramtrica es siempre menor
a la de su equivalente pararntrico. Por otro lado, con los mtodos no paramtricos se pierde gran
7)
cantidad de informacin al no operar explcitamente con los valores sino con sus rangos.
Las pruebas no palamtricas tienen varias ventajas sobre las pruebas paramtricas:
267
268 Captulo 9. Pruebas de Hiptesis lVo Paramtricas
3. Llevan a una mayor probabilidad de no rechazal una hiptesis nula falsa (error de tipo II).
Las pruebas no paramtricas se dividen en dos grupos: sobre una sola muestra y sobre varias muestras.
Tambin, hay un grupo de pruebas que se basarr en la ley de distribucin ji cuadrado.
En este captulo examinaremos un conjunto bsico de pruebas no paramtricas, que permiten con-
trastar hiptesis sobre la independencia de variables, el ajuste a una ley de distribucin dada, la
aleatoriedad de las observaciones, entre otras. En la prirnera parte examinaremos aquellas pruebas
que emplean la ley ji-cuadrado, mientras que la segunda parte dedicaremos a otro tipo de pruebas.
Itrteresa. conocer si el nmero cle cbservaciones clue se ubican en cada categor'a se ajusta a un esqlle-
rna cle probabilidnd <lado; es clccir', si las probabilidadcs dc rertenencia a cada gr,r-rpo tiencn valores
especficos: pr : pro p2: p20, . . ., pk : pk. Entonces la pruebzr queda as:
9.7. Pruebas X'2 de bondad de ajuste a una ley 269
2. Htpteszs Alte'r'no,t'rua,. I11 : Al rnenos uncl cle los r, es <listirrto c.Ic., p,g,'i - I,2,...,k.
, (rr-ttp)2
3. Estad'st'ico de Prtt,ebo^ '\r/r'\ -
7-t nPo
4. Regi,rr de Reclazo. Se rechaza 11 cuando X?"1,, > XZ@ - l).
Se supone que los datos esLn distribuidos segn una ley trinomial de parmetros (100;p1,Pz,Ps)
: P2: I
4Y Pt: I2
Pt Probar Ia hiptesis a un nivel de significacin del 5 %.
4. Regin de Rechazo. Tenemos que XSos(2) :5.99 y la regin crtica es XZt" > 5.99.
5. Deciszn. Como 13.18 > 5.99, se rechaza 116, o sea, los nacimientos de los gemelos no siguen Ia
Ley indicada.
Se recomierrda que el lector cambie las probabilidades de pertenencia a cada grupo) de manera que se
acepte la hiptesis nula.
Disponemos de un conjunto de n observaciones, que se supone siguen una ley de probabilidad dada y
que estn agrupadas en k clases o categoras.
Por otro lado, sea X una variable aleatora que sigue Ia indicada ley probabilidad, que toma valores
.r:r) tr2). . .; entonces. Pr(Y : r.) : p.
270 Captulo 9. Pruebas de Hiptesis lVo Paramtricas
Pr(X:r):P ="-tr)'"
,l
donde el par'metro ) puede estar previamente especificado o debe ser estimado.
A partir de las probabilidades tericas se calculan las frecuencias esperadas de cada clase como ei : np,i.
Cuando alguna clase tiene una frecuencia observada menor que 5 se Ia puede unir con alguna clase
adyacente y sumar las probabilidades correspondientes. Luego de agrupar las observaciones que lo
ameriten, se dispondr de una tabla de frecuencias con k clases, como Ia siguiente:
k ;r ;* ek: nplr
Total n
El estadstico de prueba, para comprobar si los datos siguen una ley especfica, es
k .o
,"0
xZu":
I
L=I "n",,"
,
que sigue aproximadamente una distribucin y2 con [(k - I)-(nmero de parmetros esti,mados)]
grados de libertad. As, si se supone una ley de Poisson, de parmetro ,\ conocido, entonces Xlr" sigue
unaley X2(k-1);perosiseestimaelparmetro),elestadsticoXl6"sigueunadistribuciOny2(k-2).
La prueba de hiptesis queda como sigue:
1. Hi,ptesi,s NuIa. fls: Los datos siguen una \ey L(p) dada.
2. Hiptesi,s Alternatiua. I11: Los datos no siguen la ley 4(p) dada.
(' -
.). Estad,stico d,e Prueba. XZn. : ! ")2 ,
i:t ei
donde &: es el nmero de clases que se forman luego de agrupar los datos.
4. Regi,n de Rechazo, Se rechaza Hs si XZt" > X?"@ - 1- l), donde I : nmero de parmetros
estimados a partir de la muestra.
Ejemplos
1. En una agencia bancaria hay cinco cajas para atender a los clientes. Un da, el encargado de la
agencia contabiliz el nmero de clientes que escoga cada una de las cajas, obteniendo:
o
Caja 1 2 4 5 Total
FYecuencia 34 54 39 48 45 220
De acuerdo a estos resultados, se puede concluir que ha'preferencia por alguna de las cajas?
9.7. Pruebas X2 de bondad de ajuste a una ley 27L
Sohtc'in,: La hiptesis nnla es sriponel que no hay l'eferrencia por una caja palticular o, lo que
es 1o rnismo, que los datos siglren Lrna ley uniforrne con
xza" : f@t-"t)2
ei
i.:r
: (34-4q2 _64-4q2 _Q9-44)2 _gB-4q2
44=44.44=44-44 -(+S-+q2
4. Regi,n rl,e Rechazo. Como X3.os(5 - 1) : 9.49,\aregin es XZt"> 9.49.
5. Deci.szn Aqu, XZa"no est en la regin de rechazo; de manera que se puede decir que no
hay preferencia por ninguna caja.
2 En una ensambladora de carros se registr el nmero de defectos por unidad en una muestra de
100 unidades que se inspeccionaron durante una semana dada, dando la siguiente distribucin
de frecuencias:
Nmero de defectos 0 1 2 .) 4
Nmero de carros 63 20 8 5 4
_0.67(0.67)o
Po : Pr(X:Q) : : 0.512,
0!
-0.67(0.67)1
Pt, : Pr(X: 1) : : 0.343,
1!
67
e_o (0.6n2
Pz : Pr(X :2) :
2t'
:0.115,
6T
e-o (0.67)3
P3 : Pr(X:3) : ol
JI
:0.026,
e-0.67 (0.6n4
P+ - Pr'(X:4) : : 0.004.
4
eo : 100 x 0.512
-- 51.2, et: 100 x 0.343 :34.3,
ez:100x0.115-11.5, e3: 100x0.026-2.6,
et : 100 x 0.004 :0.4.
272 Captulo 9. Pruebas de Hiptesis lVo Paratntricas
1. Hiptesis NuIa. 11: Los datos siguen una ley de Poisson P(0.67).
2. Hi,ptesis Alternatzua. 11r: Los datos no siguen una ley de Poisson P(0.67).
3. Estadsti,co de Prueba. X?ot":4I.72.
4. Regi,n de Rechazo. Como x3.os(5 - 1- 1) :7.81 y la regin es XZu" > 7.81.
5. Deci,si,n Se cumple que 4I.72 > 7.81; entonces, se rechaza Ia hiptesis nula. El nmero
de defectos no siguen la ley de Poisson P(0.67).
Para el nivel cle sigrrificacin 0.01, 'i'erificar la hiptesis de que el tiempo rnedio de trabajo de Ios
elementos est distlibuido segn una Iey exponencial.
Solu,czn: El parmetro .\, que sigue la ley exponencial, se estima po, 1 : ! : O.r.
T
Calculemos las probabilidades de que la variable aleatoria tome valores en cada inten'alo:
Anlogamente, se obtienen
Como las tres rltimas frecuencias son pequeiras, se las puede agrlrpar en una sola clase, obtenin-
dose k : 4 clases. De esta manera, se dispone de Ia siguiente tabla que muestra el grupo, la
frecuencia observada y la frecuencia terica.
1 133 t26.42
2 45 46.52
D 15 17.10
4 7 9.48
Total 200
1 fI'iptcs'is Nrtla. 11: Las obserr,ciorres sigucrr rrrrrr lcy <rxporrcuciul t(0.2).
2 Htptes'is Altr:tra,ti,tstt,. H1: Los clrtos u<l sigucrr rrrrir Icy r:xponencial ,(0.2).
3 Estct,dst'i,co de Prtebu.
f
,
rlr., : rl
)
(rt,
.-:
- c,)'2 (133 - 126.4D2 (45 - 46.5\2
+
(15 - 17.10)2
e i 126.42 46.s2 17.70
-,:,
: 1.299.
150 - 155 61
155 160 22
160 165
-\ cotrtintiacitt se rresenta ttn resurnen de los estirnrdoles cle los prrr'rnetros de las Ieyes ms comLlrl-
rlentc enipleaclas.
274 Captulo 9. Pruebas de Hiptesis -lVo Paratntricas
Ley Estimador
Binomial Bin(n,p) p- -u
TL
Cuando tenemos la informacin de 2 variables de tipo cualitativo, se la resume en Lrna tabla de cont'in-
gencia, que es una tabla de frecuencias de doble entrada, donde en las filas se ponen las modalidades
de una variable, y en las columnas las modalidades de la otra; en las celdas resultantes del cruce de
las filas y las columnas se coloca el nmero de elementos que presentan ambas modalidades.
Si se tiene informacin de.l elementos acerca de las variables Ay B, de tal forma que prescntarl r y
c modalidades respectivamente, Ia tabla de contingencia r x c (r filas y c columnas) es de la forrna:
Variable B
Variable -4 B1 B, B. lbtal
At ??"TI nli n C nL
Total n.7 n1 nc
donde,
ni.
f: N' 7r. . . ,T,
f : n.i J
y'' r
;-
lr''' ,c'
Bajo la hiptesis de independencia entre filas y columnas, se tiene que la frecuencia esperada en la
celda ubicada en la i-sima fila y j-sima columna es
ej: NF.0t:U#
xZa":iiry,
i:l j:L "Ll
que sigue aproximadamente una distribtcin y2 con [(r - 1)(" - 1)] grados de libertad.
2. Hiptesi.s Alternatiua. Ht: pt * p.p., para al menos una celda de la tabla (la variatlles A y B
no son independientes).
@ e')2
3 Estad,sti,co d,e Prueba. XZu,: i - .
Ejernplo. En una investigacin se desea revelar si existe relacin entre el consumo de combustible y
el origen de los carros que circulan por la ciudad.
Origen
Consumo EE.UU. Europa Japn Total
Bajo 76 56 70 202
Alto 160 t4 9 183
Total 236 70 79 385
en
nt.n.r 202 x 236 : !23.82,
nL.n.2 202 x 70
:36.72,
N 385 / 385
etg :
nt.n.s 202 x 79
:4I.45, e2l:
n2.n.l
-----;=-
183 x 236
: 112.18,
N 385 /v 385
n2.n.2 183 x 70
:33.27, (,.r.!
n2.n.3 183 x 79
: 37.55.
385 - A,/ 385
-
276 Captulo 9. Pruebas de Hiptesis lVo Pararntricas
Origen
Constlmo EE.UU. Europa Japn
Bajo 723.82 36.72 4\.45
Alto 112.18 33.27 37.55
1. H,i;ptesis N,ula. /16: El origen del crlro y el consurno de combustible sou iudependientcs.
2. Hi,ptesis Alternat'iua. .F1r: EI origen del carro y el consumo de combustible estn relacionados.
3. Estadstico de Prueba.
(76 - t23.s\2
xZt
" r23.82
(160 - 112.18)2
112.18
: 101.51.
5. Deci,si,rin. Como 101.51 > 5.99, se rechazr ltr hiptesis nula. Coucluinros qtte ltal'relaciIt entre
el consurno de combttstible y eI origen de los carros.
Tablas de contingencia de 2 x 2
Variable ll
Variable A 81 132 Total
A1 ab a*b
A2 cd ctd
Total aic b+d n,
t{ad - bc)2
xZt* = (a b)(c d)(a c)(b d)'
+ + + +
Sexo
R.crccin HorrrlrLr-'s \Irrjcles Tolal
Dcsfavorable 1t) ,] 15
Favolablc 3 7 10
Total 13 72 o-
:
1 Iiptesis AluLa. fI6: La lcrcciri rntc el corr,:rrtrirl crs inclcpcrrclicntc clel sero.
') Hi,ptcs'is tlltent,otiuo. 111 : l,a rccr:icirr rltr cl c:orrrcr'<:irl y cl ,5cxo cstitr rclacionacios.
Rngzn de Reclo.zo. Si escogcrrlos rr:0.05, \'crrros,1,,e lo,(l) :3.34. La legin cle lecliazo cs
\;i,, > 3.84.
5. Decis'itl Como 3.23 < 3.81, no sc lechrza la hiptcsis lula. Se concluye clue hay inclepenclencia
entre el sexo del espectacLol y la accptacirr clel comcrcirl.
Sc srLgiele cre cl leciot rerlicc cl c.jeLcicio niecliante el r:ilc:rLlo cle las ficcLrcricias cspeladas
i. Hi,ptesi,s Nrtla. Is: Lts tltLLcstlzts ptttvir-'rrcrL rlc rrrra rLrisrr:r toltlurcirr (lers llLlest,tirs sttrr lro-
nrognears).
') Alternatiua.
H t'ptes i,s 11 : Las nttlcstras no ptovicncrr clcl rurr nrisrua ltoblarcin (lars rnucstlz-rs
son hetelogneas),
(tt'j
Estn,dst'ico dc PrtteLto, \I\, r/,.r -.-
- r-1- 1-
r- ' ',t)
itt ('j
4 R, qin ,le Rcc'l,azo. l.t hipcitesis cie inclepcrrrlcnc:i,r sc lcc:hrrzr .i 13,,., > X3l(?'- t)(c- i)].
trjemplo. En uua Facultacl sc clasific i las rrolas obfr:niclis L)or sus alumnos, luego cle lenclil cl
luisllo exalren Fsica. conro )ra.jas. rlcclirs v allrs. 'fanbin. sc rcgislr' cl plofcsol clue clictirba la
cle
rlater-ia. obtenienclo:
Cililicrcic'rrr
Plofcsoi lia.a i\lc<liir,,\ll lLbral
tl 1,2 23 l .12
1) 2 r7 r! .16
,)
lirl rl ,l 0 ll ,!8
278 Captulo 9. Pruebas de Hiptesis No Paranttricas
Calificacin
Profesor Baja \'Iedia AIta
A .7 19.1
t7 5.3
t)
l) 19.3 20.9 5.8
1. Hiptests Nula. 11: Las difer-elcias eu las notrs no son debidas rrl plofesor de la materia.
2. II'iptesis Alternatiuu,. ,F11 : Lrs cliferencias crr las notas se debelr al profesor.
9.3. Ejercicios
1. En un cluce de carretelas los aulos pueden gir-al a 1a izquierclrr, l Ia derecha o seguir de frentc.
Se supone que la rnitad de los autos scgr-rir'irr de fi-ente, la nna cutrta parte ir a Ia izquielda 1-
Ia cuarta parte restante a la clclecha. Sc rerliz urr colteo cle los autos segn la direccin quc
ellos siguen:
De fi'ente A la izqr-rierda A la derecha
Frecuencia 29 149
Pruebe Ia hiptesis indicada a un nir.cl clc significircirr de 0.1.
Cuando el naturalista francs del siglo XVIII Georgcs Louis llrLflbn realiz 4040 lanzamientos
cle una rnoneda observ 2048 calas. Cclncuerrlarrr estos datos coL la hiptesis de que la rlonedr
cs simtrica?
Una zona de \4indo es cl hbitat natur'rl <le tles cspccics dc colibres. Se cree (hiptesis nula)
qlle ulla quinta parte de los colibr'es pcltcrrecc tr la prirrrera cspccie, dos quintas partes a l;r
segunda especie y otlas dos quintas part<rs r la tercera. En una nnestr"a aleatolia de 34 colibr'cs
de la zona, se observalol 12 cle Ia priirrcr-er especle. 15 clc la scgrLnda" y 7 de la telcera. IIav
suficiente evidencia estadstica (al nrvcl 0.05) pala acepterr Ia hiptesis propuesta?
4 Segirn los datos de un estudio c-rhaustivo rle rrrercado qlle se lc;iliz en la ciudad, las ventas clc
irnpresoras para comptltadoras lrersonalcs der uso clomstico sc ciividen entre cuatro marcas (4,
B, C y D) cuyos porcenta,jes dcl total de las vcntas son 18 c/o,22Vu.35% y 25To, respectivamentc.
Un ario despus, se quiere analizal de urrcro lr situacin pcro sc cree qrle no se debe repetir ur
estudio de mercado a gran escalr. Se clccicte obserr.ar Ia narcr adquil-ida por 200 compradores
cle inrpresoras elegidos al azar. obtcnienclo cpre c1e cllos 28 habalr clegido la marca 4,48 LaR,77
Itr C y 47 LaD. Hay suficientc cvidencir. ..1 rrivcl 0.05, para tl[iL'r,-rzrr clue el reparto del mercacio
yr no es el mismo quc el arlo rnl-eriol'/
9.3. Ejercicios 279
a) Compare los resultados de la eleccin con cada Llna de las investigaciones de las empresas;
b) Se puede determinar cul de las ernpresas dio el resultado ms certero? Explique.
6. Cuando Gregor N4endel realiz sus experinrcrrtos clc cnlzarniento de guisantes, obserr, las fre-
cuencias de varias semillas producidas por hbriclos dc guisantes amarillos Lisos y guisantes verdes
mgosos. Estos datos y sr-rs respectivas probabilida,cles, segirn las predicciones de la teora de la
herencia de Nlendel, se dan en la siguientc tab1a.
Para un nivel de significacin del 1%, erarline si las frecuencias rle los datos son consistentes
con las probabilidades tericas.
7. En el desarrollo decimal de z- entle los 10 03E primeros dgitos aparecen 968 ceros, 1062 unos,
1021 dos, 974 tres, 1014 cuatros, 1046 cincos. 1021 seis, 970 sietes. 948 ochos y 1014 nueves.
8. Entre 2000 familias que tienen 2 hijos. 522 frnulias lienen dos r.alones, 471 dos mujeres y 1007
de los dos sexos. A un nivel de significacirr de 0.05. ,se puecle consiclerar que el nrmero de hijos
\rarones en las familias es rlna variable alcatoria binomial?
9. En nn estudio a 107 familias qr-re tienen 5 hi.jos. sc coutaliliz el nrmcro de hijas que tienen tales
fanilias, con el siguiente resultado:
Nmero de )
t) I .) 4 5
hijas
Frecuencia 5 17 28 to
L 19 6
Puede afi.rmarse que) para las fanilias estucliaclas. el rrrrler-o cle hijas sigue una ley binonial?
(Use a : 0.05.)
280 Captu.Io 9. Pluebrs de Hiptesis No Pararntricas
10. Para estudiar la delilcueucir ol] Llrr1 r:irrrlacl se rrrotr'on lr-s clcuulcias lol lobo rle automr.iles
recibidas en los riltinros 575 r1as. obttnirrrrlose krs siguicritcs losrrltaclos:
No. denuncias 0 L 2 3 4 5
Frecuencia 23t) 210 90 JiJ 8 2
Contraste la liii.rtcsis clc crc los cltos plocorlcrr cic rrna <listribuciu rle Poisson con ) : 1.
(a : 0.05)
i1 Se registr la cantiriacl cle goles colsegrrirli.rs uu 1,19 p;rr'1 iclos <lisprrbados por r-rn ecluip o profesiottzrl
de fiitbol
No. cler golc.s
en Lur priti(lo
01234
Frectterttc,it 50 64 23 84
Verifique la hiptesis dc que ol uiruero rlcr golcs Pt.,r llarticlcl csti distribuido segrr una ley dc
Poisson. para el nivcl clc sig-nificircin 0.l)5.
12 En el transcurso de dos holits, cl nrirlcto dc llaulrrlas pol rrrinuto, solicitadas r una cetittal
telefnica ftre:
No. llarnadas/min 0 i ') J tl 5 t)
Frecuencia 6 18
.)
,)-)
,)
JJ
- I7 10 2
,Se puede aceptar que e1 nrnrelo clc llrrrrrrlrs pol rrrirnrto signc una distlibucin clc Poisson'J
13. En cierta regin sc registr la temperirtur'r ck:l rilc chrrantc 300 clas. Lrs medicioncs se rcsruneu
cn Ia siguiente tabla (en la plinrcla cohurLnr se inrlic:l el intclvalo de tr,.nperatnrr en grados 1'
en la segunda el nrmero de clis cuvr fclrrL)clratLrLa rrrecli,r collcsponclc l cse intervalo). Ver-ifi<.re
clue la tenperatura rrreclir esti clistribuiclr rLrrifolnonrcnte r un livel cle significzrcin dc 0.05.
14. Un estudio realizado iuclica cre el ticnrpo clc cspera cri lr crola rlc la, ca,ja de un banco se pucclc
rnodelizar con Ltlla distribucin cxporrcrrcirl clc rreclia 3 rninr,rtos. Para cornprobar si este noclclo
sigue siendo r'liclo, sc tom la sigrricrrtcr ntrrcstLa:
3 2 6 ,,t 1 3 2 1 1. 4.
\erifiquc si los drtos Jloccclcn clcl rrroclckr ospecrifir::rrlo cn cl cstrrclio (cr:0.05).
15. Se probaron 450 focos, t-egistlrindose e1 ticrtrpo crc <lulitlon enccncliclos hasta que ftrilaron:
Nrirnclo Niunelo
Tiernpo Ticrnpo
clc firr:os clc focos
0a40u 131 L6(X) a 20t10 i)
400 a 800 95 2000 a 24U0 3ij
800 a 1200 76 2'100 a 2E00 )1
1200 a 160i) 5(i
Pala un nivel de significacin de 0.01. r-clifc1ue la hiptesis clc clue el ticrlpo de dulacin clc los
focos est distlibuicla segrn rrrrrr ic). exlrrIttcucirl.
9.3" Ejercicios 287
16. En la Facultad de Ciencias se quiere averiguar los conociurientos sobre Fsica que tienen los
alurnnos matriculados por primera \ez en dicha Facultad, para lo cual se realiz el primer da
de clase una prueba genera,l. Los resultados correspondientes a rlna nnestra de 211 alumnos se
recogerl en la siguiente tabla:
Puntuaciones Frecuencia
50.5 55.5 4
55.5 60.5 77
b(J.b bli.l) 45
65.5 70.5 67
70.5 75.5 It
dL)
75.5 - 80.5 15
80.5 85.5 10
17. En una investigacin sobre el hbito de fumar por lur grupo de estudiantes universitarios se
obtuvo Ia siguiente tabla, en la cuaL se relaciona el sexo del entrevistado y si l o elia es un
funador.
Fuma?
Sexo SI NO
Masculino 26 10
Femenino 11 15
18. En un estudio mdico a 300 pacicntes que fueron opcradas por cncer de ovario, se clasificaron
en quienes han sobrevivido 10 aos despus tl.: la operacin y quienes no lo hicir:i.rn, y el estado
del tumor al momento de la operacin.
l9 A firr de probar el supuesto de que una persona desernpleada rcpresenta un alto riesgo crediticio,
en nn banco se realiz un estudio de 100 c:nentas escogidas aleatoriamente con los siguientes
resultados:
Situacin laboral
Situacin actual del cliente
del prstamo Ernpleado Desempleado
En mora 16 10
No en mora 55 19
20. Se realiz un anlisis de sangre de un grupo de 1000 habitantes (elegidos al azar) cie una ciudad
con la siguiente distribucin, segn el grupo sanguneo y el factor Rh:
C A B AB
t7-
Rh+ 3r7 81 39
Rh 96 82 29 10
Segn estos datos. puede aceptarse la liiptesis de inclependencia, del factor Rh de1 grupo san-
guneo? (Use cr : 0.05)
2I Se ejecut un estudio sobre la utilizaciu de ciertas fuentes de financiamiento externas para 1as
pequeas y medianas empresas (PYN'ItrS), Fara e1lo, se seleccion aleatoriamente 500 PYMES a
nivel nacional. Las empresas se clasifi.caron segr1n su tarlao en tres categoras (micros, pequeas
y medianas) I' segn hayan utilizado o rLo a).gr.rna fi.relte de financiacin. Los datos obtenidos
fueron:
Con financiamiento Sin financiamiento
Nlicros 115 o
Pequeas 20 20
Medianas 15 5
22 Se realiz un sondeo en ia ciudad paradetenlinal 1as posibles relaciones entre el nivel educativo
(superior, medio o primario) de las persolras y el consumo (bajo, medio o alto) de productos
electrnicos. Los resultados, para 400 personas seleccionadas al azar, ftteron:
Nivel Consurno
Educativo Bajo \'Iedio Alto
t)1 4.4
Superior .)-L 47 ++
\4edio 2B 79 125
Primario 16 17 19
23. En una investigacin sociolgica a un grupo de pcrsonas casadas, se desea saber si el nivel so-
cioeconmico de los encuestados incide sobre el xito o fracaso de su matrimonio. Los resultados
se dan en la siguiente tabla:
NSE
FYacas? I II III IV V
Si 28 62 79 181 724
No t27 230 443 850 582
,Se puede concluir que la diferencia en el ndice de fracaso se debe al nivel socioeconmico de
los matrinonios?'
24. trl Consejo Directivo cle una universidad cluer'a determinar la opinin de cl.iversos grupos en
relacin con el calendario docente propuesto. LIna muestra aleatoria selecciolada entre 100
estudiantes, 50 empleados y 50 profesores dio 1os siguientcs resultados:
Estudiantes Ernpleados Profesores
Favorakle 63 27 30
Desfavorable JI z,\ tn
9.4. Pruebas sobre rna soJa ntuestra 283
Si se desea saber si hay prucbas dc una difcrr:ucia, rrrr la rctitucl hacia el calendario entre los
diversos grrpos:
a) Indique cul es Ia prueba adecuada para la realizacin de este contraste, y especifique las
hiptesis a contrastar
b) Realice el contraste corrcspondiente, con un livcl de significacin del 1 %.
25. Un estudio sobre tabaquismo cn tres ciuciadcs, rnediante tres muestras aleatorias de tamao 100,
proporcion los siguientes resultados:
Se pueden considerar homogneas las tres poblaciones respecto a sus hbitos fumadores, al nivel
0.05?
Esta parte del captulo la dedicaremos al anlisis de la,s prucbas no paramtricas que involucran una o
dos muestras y cuyo objetivo es probar si los parmetros de los que provienen las muestras adquieren
ciertos valores particulares. EI lector notar la sinilitud con las pruebas desarrolladas en el captulo
anterior.
En las pruebas no paramtricas sobre Lrna nuestLa se distinguel dos clases: aquellas que contrastan
el valor de una rnedida estadstica (de localizacin, de clisper-sin, etc.) y las que contrastan una
caracterstica general de los datos (ajuste a una lcy, aleatoriedacl, etc.).
Existe una amplia variedad de estas prnebas, nosotlos solo exarninarenos los contrastes ms comlrn-
mente utilizados y que generalmente se presentan en los plograrlas estadsticos.
Podemos establecer hiptesis acerca de la mediana: sabemos cluc la mediana deja por encima de s el
nrisrno nrmero de valores que por derbajo. Considcrando c.re r- A'Ied > 0, darn signos positivos
(+) y - Med { 0 signos negativos (-), en la poblacirr original tendremos tantos (+) como (-). S"
tratar"ode ver hasta que punto el nrrlero de sigrios (+) esta dentro de Io que cabe esperar que ocurra
por azar si el valor propuesto cono mediana es verdaclerol .
Teniendo en cuenta que se trabaja con dos clases de valores, Ios que estn por encima y los que estn
por debajo de la mediana, los estadsticos de contraste sigucn ura distribucin binomial Bin(n,0.5),
si se supone independencia y constancia c.e la plobabilidad el el lnuestreo, ya que la probabilidad de
qne Lur valor se encuentre por encirna (o por deba.jo) rle la urediarra es p : 0.5.
ILo misr-no se puede decil lespecto a los cualtiles, qrrintrles o clecilcs
284 Captulo 9. Pruebas cle Hiptesis lVo Pararntricas
Si X es la variable aleatoria que cuenta el nrmelo de ocur-rencias del signo menos frecuente; entonces.
su probabilidad se calcula por
Como nos interesa la ocurrencia de valores tan extrernos o ms extremos que el observado, la proba-
bilidad deseada es Pr(X < k).
Observaciones
1. Si al determinar los signos de las diferencias, obtenemos un valor cero, a ste no se lo considerar
el momento de contabilizar el nmero de signos.
2. Si n < 30, se utiliza la ley binomial; en carnbio, si n ) 30, se utiliza la aproximacin mediante
x-n
la ley norm al Z : --J - ,A/(0, 1).
\/n
2
r:0 ,'
4. Cri,teri,o d,e Rechazo. 2po6, 1 a.
6.6 6.8 4,4 7.3 8.5 4.5 6.7 6.0 3.4 9.1 5.3 4.8.
1.6 1.8 - 0.6 2.3 3.5 - 0.5 r.7 1.0 - 1.6 4.7 0.3 _ 0.2.
Lasecuenciadesignos queseobtiene es + + - + +- + + -+ + -. Elsignomenos frecuente
es ( ), que aparece 4 veces; de manera que la prueba es
248912147721222426.
AI nivel de significacin del 10 %, probar que Ia mediana de los puntos acumulados por los
equipos en el campeonato es menor a 22.
Soluczn: Tenemos eue o : 22; entonces hay B signos negativos, 2 positivos y un cero. Por
tanto, n: l0 y k :2; de manera que la prueba queda as:
5. Deci,sin. Como 0,0547 < 0.1, se rechaza -FIs. La mediana es menor a 22.
Esta prueba, tambin conocida como contraste T de Wi,lcoron, se utiliza para comprobar que la
mediana es igual a un valor dado y para su aplicacin es necesario que los datos vengan dados en
escala ordinal o de intervalo. EI procedimielto es el siguiente:
Se determinan las diferencias entre cada uno de los valores observados y el valor hipottico de
la medianai d": r - po.
Se ordenan los valores absolutos de las diferencias, de menor a mayor, asignando el rango 1 a la
rnenor diferencia absoluta, 2 a la siguiente diferencia rnenor, y as sucesivamente. Cuando las
diferencias son iguales, se asigna el rango promedio a los valores que son iguales.
Se obtienen, por separado, la suma de los rangos para las diferencias negativas (T-) y positivas
(7+).
286 Captulo 9. Pruebas de Hiptesis lVo Pararntricas
6.6 6.8 4.4 7.3 E.5 4.5 6.7 6.0 3.4 9.1 5.3 4.8.
6.7 +r.7 8
6.0 +1.0 5
3.4 - 1.6 65
9.1 +4.r 1,2
ID
U.J +0.3 2
4.8 -0.2 1
Total 63.5 I4,5
La prueba es
Al nivel de significacin del 10 %, probar qne la nediana de los pu.ntos acumulados es menor a
22.
donde Fo@) y,S,.(r) son las probabilidades acumuladas esperadas y observadas, respectivarnente.
Los valores de Dr(n) se encuentran tabnlados pua cliver-sos valor-es cle ay n. (Tabla 7)
Ejemplos
1. Tras jugar a los dados, nn apostador conrcnzci a sospechar qlle el casino haca trampa. Decidi.
por tanto, anotar las tiradas del dado corl cre.jugaba,, obteniendo la siguiente tabla:
Nmero 1 2 .) 4 5 6
Frecuencia 16 10 l6 11 32 15
I. Hiptesis NuIa. -I1: Los datos siguerr Llna Iey uniforme discleta coD p: If 6.
2. Hiptesi,s Alternat'iua. 111 : Los datos no sigucn una lcy nniforrne discreta con pt: !f g.
3. Estadstico de Prtteba. Ds : mx lF6(r) - S,,(r)l : 0.1362.
4. Regin de Rechazo. En Ia tabla del contrastc K-S encontramos que D6.65(100) :0.136. Se
define la regin de rechazo Dor,,, ) 0.136.
5. Dectsit. Como Dob,) D,r(n), se rcchaza 11 v concluimos clue el dado est cargado.
) En uua ellrpresa) el salario rnerisnal cle los t,raba.ja<lotcs se distribuye segn Ia siguiente tabla:
Comprobar si se puedc asegurar c-re el srlr,r'ic,r ureusul.l err clicha clnpresa puede considerarse LulI,
valiable /(306,58).
9,4, Pruebas sobr"e ura soJa rnuestra 289
Sohtcin: Completemos la tabl-L de frccucncirs relrtir'rs acurnuladas, calculando ias dos dis-
tribuciones (la muestral v Ia terica) , tcnicnclo en crreuta que para calcular F6(r) deberelros
utilizar la tabla de la lev nornal.
4. Regin d,e Rechazo. En la tabla encorrtrarnos clue D5(1 46): +:0.1126; etltonces,
,/ua
la regin es Do6,u > 0.1126.
5. Dec,is,in. No se rechaza 11; consectrelte[rente. los sa]arios siguen 1a ley,A/(306,58).
Definicin (de racha). Una racha es nna sucesin c1e vrloles por cncima o por deba.jo de ia
mediana.
La longitud de una racha es el nmero de observaciones consecutivas que tienen esta propiedad.
6.6 6.8 4.4 7.3 E.5 4.5 6"7 6.0 3.4 9.1 5.3 4.8.
ia rnediana es Q2 :6.3, luego de representar por ( ) Ios valolcs infcriorcs a la rnediana y por (+) a los
snperiores, obtenemos la secuencia: +, +. -, *, *, , +. , , *, . Existen 8 rachas de longitudes
2,7,2, r, r,2, 1,,2.
Scetn rn6" el nrmero de rachas enuna sucesicin or-dcrracll <-le observaciones; nr v n eI nmero de obser-
r.aciones que estn por debajo v por encima cle lr nrecliana cle los datos, r'espectivamente. Con estos
elernentos e1 contraste queda de la siguiente irtattcta:
1. Reqir tle Rech,o,zo. 't'ol.s 1 1,, (rrr, rr) {) ?',,," ) r,,, (lrr. tr ).
Los'r,rlorcs cle compa,racin para, esta pmeba se errcrrentr'ur tatrrlados (Tablzr 5).
Ejemplo. En nna prueba de aptitr-rd tomacla a 12 aspirautes a un puesto en una elnpresa sc oblnvielor
Ios siguientes punta.jes:
6.6 6.8 4.4 7.3 8.5 4.5 6.7 6.0 3.4 9.1 5.3 4.8.
Solucin: La mediana de estos datos es 6.3. Si a cada nno de los datos Ie restamos la mediana, queclr
Ia siguiente secuencia de signos: f , *, , +, +, -. +, , , *, ) .
4. Regin de Recho,zo. En la tabla, verfros los valores crticos con cy :\Tt 3 ( ro," ( 10.
5. Dectsin. Como robs :8 cae en la regin de aceptacin, podemos afirmar que los valores lpare(ier-
aleatoriamente.
Esta prueba permite identificar la presencia de r'rkrres extr-emos cn Lll conjunto de drtos. Par''
la deteccin de valores atpicos, en gelelal, se manejarr cliterios empr'icos; por ejempio, cllre Lu1r,
observacin est alejada una distancia dc nrs de 3 desviacioles estndar de ia media) pero esto:
criterios no tienen fundamento tcnico y descuidan la influcrcia del tamao de la muestra.
Este contraste detecta un valor atpico a la vcz y cada nno clebe letirarse de la rnuestra iterativrrnentc-
hasta que no se dctecten ms valores atpicos. La prr.reba fue desarrollada por Gnrbbs2 y se basa en
ia suposicir qrle los datos sigrten de una lcy normai o qlre prreden ser aproximados razorrablcrncntc
pol sta;i.
:
rnx{lz - rl}
3. Est,odsti,co de Pruela. gobs
La tabla de puntos porcentuales para la prueba dc Grubbs se encuentra en el Apndice (Tabla 8).
Ejemplo. En una prueba de aptitud tomada a 12 aspirantes a un puesto en Lrna empresa se obtuvieron
los sigrrientes puntajes:
6.6 6.8 4.4 7.3 8.5 4.5 6.7 6.0 3.4 9.1 5.3 4.8.
2. H'tptests Alternatzua. I11 : Hay al menos urr valor atpico en el conjunto de datos.
mx{lz - 7}
? Estadstico de Prueba. gobs: l-
19.1 - ''
- 6.1171 1.74.
s 1.776
4. Regi,ndeRechazo. EnlatabladelapuntosporcentualesseleequeG6.65(12):2.tylaregin
de rechazoS gobs > 2.4I.
5. Decis'in. Como 7.74 < 2.29, entonces r : 9.1 no es un valor atpico; es decir, la muestra no
contiene valores atpicos.
Las pruebas no paramtricas sobre dos muestras que examilaremos son anlogas a las paramtricas
para comparar dos medias; es decir, para datos emparejados y para muestras independientes. Tambin
se presentar una versin no paramtrica del coefi.ciente de correlacin.
Sea (r1,y1), (rz,Az), ..., (rrr,gr,,) una muestra aleatoria de pares de observaciones; donde (r,A)
representa dos mediciones tomadas de la misma ulidad nuestral. antes y despus de un tratamiento o
fennrenoquelaafect. Seconstruyeunamllestradelasdiferenciasdl , c12,..., dr,,,donde d:r-A
(z : 1, 2,. . . ,n) y se aplica la prueba del signo para Lrna muestra; es decir, contamos el nmero de
observaciones negativas y positivas y determinanos cul es el signo que menos aparece y cuntas
veces Io hace (k). Adems, llamaremos Q, ala mediana de la poblacin X y Qy a la rnediana de la
poblacin Y. Con sto, las pruebas son las siguicntes:
li;
n
Pr(X < A) :
3. Estorlstzco d,e Pru"eba. ptbs:
t
l':0
C'|,p'(7 - p)tl-l j clonde k <
t
4. Crzterio de Rechazo. 2po6" I a.
2. Se asignan rangos a la mucstra conbinrdr clc lrs dos mncstras. Si se prodr,rccn empates,
asignar el promedio de los rarlgos a las obselvaciolr:s cntpataclas.
Los valores de comparacin pala esta prueba se encnentlan tabulados (Tabla 10).
Ejemplo. EI dueo de nn ahlacn registr' lrs r.errtas scnranalcs de sus dos erlpleados y quier-e sabet'
si ellos pueden considerarse iguales como verrclcclores. En la siguiente tabla se numeran las'u,cntas cle
cada dependiente.
Empleado A t97 191 188 185 180 1-rt
1/J 169 169
Ernpleado B 190 166 175 172 1b/ 180 160
169 4.5
n:E 7 ! RLrngos : 77.5 Rangos : 42.5
1. R.egirL d,e Reclo.zo. Par'r cL:0.01, [/ooL(8,7) :8; crtorrccs, la, regin cs [/o6" ) 8.
5. Deciszn. Corno 14.5> 8. se lcchaza 110: cs rlccir. los clos cnrrleaclos venclen iguales canticl-rclcs
Captulo 9. Pruebas de Hiptesis No Paranttricas
Si disponernos de n parejas de obscrvaciones (r1, At), @2,y2), ,.., (",r,A") de dos variables X y Y
y asignamos rangos a la primeru (Rr.) y a la segunda courponent" (Ru) de las parejas, se define el
coeficiente de correlacin de Spearman como
cSr
-1- L
' t:l
r":1
ttltP 1)'
donde di: Rro - R.0,, es la diferencia entre los raugos asiguados a.T, y yi.
El procedimiento para su clculo es el siguiente:
" Cttando el valor del coeficiente cs cercarro -r ciero, inclica qrre hay poca o ninguna asociacin entre
las variables.
2. Hiptesis Alternatiua. H p l0
3. Estadstico de Prttebn. t'.s
Alumno 1 2 4
I
i) 6 7 8 I 10
Algebra I7 18 l9 72 OD
it)
.)2 o( 26 31 aa
.)< DO ,D
Clculo 2T I4 27 18 20 34 .)L 39 JJ
9.6. Ejercicios 295
t) o,
L 25 55 5 05
7 25
t^
,)+ 7 I -z
o
8 26 32 8 7 1
I 31 39 9 r0 -1
10
DD
r)r) tt 10 8 2
Do? :2e.5
rl:l
1A
c\-2
",/-*t
6 x 29.5
r-:7-
' ,i,l :l : 0.821.
tlQt-l) 1o(100 - 1)
2. H p l0
Hiptesis Alternatiua.
9.6. Ejercicios
17 15 20 20 25 32 28 25 35 12 26 24
Utilice un nivel de significacin del 570 para pr-obal clue la nediana del nrmero de denuncias no
es nayor a 20 por da:
2. En un estudio sobre las relDesas enviadas por los parientcs emigrantes a varias fanilias dio los
siguientes resultados (eu miles de dlares):
2.4 2.3 1..7 r.2 2.5 3.6 4.2 2.2 2.3 3.1
Con el empleo de o : 0.05, pruebe si la trediana de estas lemesas es diferente de 2700 dlares:
3. Para ingresar a Lula agencia balcaria se form una cola folmada por H (hornbres) y lVI (mu.jer:es),
que est formada as:
H \4 H N4 II H H N{ H H H N,f N4 H M
4. Un profesor registr el nirmero de estudiarrtes ausentes a sus clases durante 24das corrsecutivos.
38 31 32 27 28 30 26 33 36 30 28 35
32 29 35 3i 33 31 28 30 28 25 29 33
Enero 19 Julio 22
Febrero 23 Agosto 24
N4arzo 20 Septiembre 25
Abril 17 Octubre 28
Mayo 18 Noviemble 30
Junio 20 Diciembre 27
a) Aplique una prueba de rachas para decidir si los datos pueden considerarse aleatorios;
b) Es posible afirmar que la mediana es igual a 23?
6. Se desea ajustar la clistr-ibucin cle la canticlad cle corr-eos clectrnicos que recibe el serviclor cle
uDa empresa durante ltu ilterralo de cinco ninntos. Pala 400 intervalos de cinco minutos se
contaron la cantidad dc mensajes recibidos y se obtr-rvierou las siguientes frecuencias:
No. correos 0 1 2 ,) 4
I
O 6 7 8 I 10
Frecuencia I 11 47 76 68 74 46 39 15 o 8
Los datos pueden considelalse distribuidos con la distribucin de Poisson con ): 4.6?
7 Los siguientes datos collcspondcr a los tienipos clc clulacin (medidos en meses) de lmparas
malca Lucky:
3.33 6.71 2.53 7:5 16.82 3.56 0.17 2.r5 3.51 7.24.
a) Estudie si es razottablc suponer cLc los clalos colresponclen a Lrnr distlibucin exponencia.l;
il
9.6. Ejercicios 297
8. Los siguientes datos corresponden a los tiempos de vida (en semanas) de colonias de bacterias
criadas en un laboratorio bajo condiciones estables de temperatura y humedad:
9. Se registr el caudal promedio (en m3/s) que ingres a una central hidroelctrica durante 12
das consecutivos:
99.0 79,8 77.4 87.8 59.0 7r.0 5r.4 92.7 69"4 68.9 70.r 90.2.
11. Se dispone de una mquina para llenar latas con 10cm3 de aceite (las latas llenadas al borde
tienen una capacidad de 11cm3). Un operario afirma haberla ajustado de modo que la cantidad
de aceite Uue envla el pico ae laalrina e.nvasadora es de (10+e)cm3, donde es una variable
aleatoria con la distribucin U I -+,+1. Para verificar la afirmacin anterior se estudi el
contenido de 12 ratas out",.'i",') r"t*;-tl/"."::1J::':" ,,
0.098 0.068 -0.004 -0.026 -0.012 0.096 0.050 0.062 0.036 0.04 0 0.054.
\2. llrr falric:urtc ilc frrsiblcs asegura que) colr una sobrecarga del 207a,los tiernpos dc r.ida dc sri.
fusibles (descle (lue se conectan con sobrccarga hasta que se funden) se clistribuyen unifornenerrtL
cntrc 10 minntos y
15 minutos. Para probar esta afirmacin Lrna mlrestra de B fusiblcs fue
sometida a Llna sobrecarga del 20%. Los tiempos en quc tarclaron en fundirse dichos fusibles
firerorr los siguientes:
13. En una empresa operadora de tarjetas de crdito se est analizando el historial del ltimo an,,
de1 consumo mensual de un cliente. Se conoce que el promedio de sus conslrrrros es 645 dlares
y desviacin estndar de 148 dlares. Si se encontr' que este mes tuvo un consumo de 320t,
dlares, debe considerarse que el cliente tuvo un comportamiento atpico?
L4 La poblacin ecuatoriana adulta tiene una estatura promedio de 162 cm y desviacin estndal
de 7.5 cm. En una muestra de 25 personas) a partir de qu valores de la estatura podeno.
colsiderar que hay presencia de valores atpicos? (Use cr : 0.05).
Pruebas sobre dos muestras
15 En dos laboratorios se realizaron rnediciones del punto de ebullicin de nn compuesto de silicr,-
(en "C) de 8 muestras diferentes.
Muestra 1 2 3 4 5 6 7 8
Medic n1 99.78 99.17 100.06 100.14 99.43 100.60 100.59 99.98
Medic n2 100.16 100.09 99.91 100.36 99.77 101.09 99.93 100.06
1b Se presume que un tratamiento reduce el peso de las personas. Mediante una muestra aleatoli.
se seleccionan 10 personas que siguieron dicho tratarniento durante todo el tiernpo exigido. E:
la siguiente tabla se presenta el peso de cada paciente, antes y despus del tratamiento (rnedid
en kg).
o
Persona 1 2 r) 4 5 6 7 B o 10
Antes 108 72 B1 r04 69 /d n, tl4 86 92 98
Despus 95 76 69 B1 56 81 92 B1 77 97
Analice si hay diferencias entre las localizaciones de las dos muestras. Use a:570.
9.6. Ejercicios 299
19. Los siguientes datos son los tiempos de duracin (mcdidos en meses) de 10 lmparas marca
Luckv:
3.33 6"T1 2.bz r.rb 16.82 3.b6 0.r7 2.r5 3.b1 7.24.
Se dispone ahora de una nueva muestra, independiente de Ia anterior, de los tiempos de duracin
de Imparas de marca Wizard:
5.60 3.03 7.46 r.6.52 0.37 0.58 3.38 9.15 0.90 4.44.
Implernente una prueba de cornparacin de rluestras para concluir si es razonable suponer que
las nuevas imparas tienen la misma duracin que las anteriores.
20. Los siguientes datos corresponden a los tiernpos de vida (medidos en nanosegundos) de partculas
radioactivas emitidas por cierto material:
20.05 1.30 2.54 1.95 9.20 4.20 1.84 7.02 5.60 1.80.
rr,--\
\:L): Ilt-! r
si r>l;
|. 0. caso conl rario
2.60 4.81 12.79 3.82 7.2r 1.68 15.50 12.03 r.70 9.40.
2I. Se tienen dos muestras independientes entre s, correspondientes a los tiempos de duracin (en
aos) de sistemas electrnicos de marcas distintas. Se desea saber si los equipos de arlbas marcas
tienen niveles similares de Curacin o si alg.,rna de ellas presenta una duracin significativamcntc
lnaYor.
a) Aplique La prueba cie rachas a ias muestras para decidir si se pueden suponel aieatolias;
b) Aplique a ambas muestras las pruebas de siglros y de rangos signados de Wilcoxon para
decidir si los valores X^:0.69 y Yrn:A35 son vaLores aceptables para las medianas;
c) Pruebe si la mediana de la muestra X es mayor que Ia de la muestra Y.
22 En una investigacin de mercado se pidi a dos nios que calificaran a 10 juguetes en orden de
preferencia (de 1 a 10), obtenindose la siguiente tabla:
Juguete A B C D tr F G }I I J
Nio 1 B I 6 2 1 4
I
J 7 O
rJ r0
Nio 2 7 10 8 5 a 2 4 6 1 9
at
En un estudio sobre cor.ercio internacion.r1. sc orrlcnrron dc rnanerr decreciente a los principai,,-
socios comerciales sudanericanos de Ecurdor v Algcntina.
Calculc ei coeficiente de corleiaci<in rle Speannan v verifiqr-rc si hav asociacin entre Ias ordeu.-
crones.
24. Las siguientes son las calificaciones obtcuidtrs por 11 jtir.erres cluc se soneticlon a evalllacion.
en destreza rnanual v memoria rrislrrl.
D. manual 1 3 4 5 6 8 l0 11 13 I4 16
M. visual l8 j,J an
11 15 16 31 39 5ti 45 43 t) I
R.ealice una prueba para determinar si existe correlacin errtre las calificaciones en las dos er'.--
luaciones.
25. Un grupo de irn,estigadores desea er.alrlar si un nuevo equipo dc tratamiento aguas residual.
es efectivo para reducir Ios niveles de contaniracin de las agllas vertidas a rrn ro por 1.
curtiembres. A tales efectos se midi el nivel de contaminantes antcs v despns del tratarnient,-
Ios resultados fnelon los siguientes:
Planta I 2 3 4 5 t) 7 B I 10
Antes 1.52 2.92 4.44 4.24 t.72 3.70 3.64 4.82 2.72 2.08
Despus 2.08 303 0.80 096 2.7r 2.39 3.07 2.87 0.33 r.76
a) Detenliue si efcctivamcnte se lta proclnciclo rrna recluccin en los rrivcles cle contaminacic,:
b) Las dos muestras estn cor-relacionadas?
Ca ptu lo 1
Iuchas de las aplicaciones estadsticas requieren la estimacin de las relaciones existentes entre dos
' ms r'rriables; por ejcmplo, puede ser necesario responder a las preguntas cmo vara el prccio
:-,lomedio anual del ma2, segn la produccin a nivel nacional? o cmo vara el consunio de gasolina
le nn rulo. segn su peso y ia potencia del motor? trl inters se centra, entonces, en determinar una
.cnacin clue relacione Llna variable dada con nna o ms variables que contienen informacin sobre
.,i primera. A estos problemas dedicaremos los dos sigtr,ientes captulos; antes reviscmos algo de Ia
--istoria de esta parte dc la estadstica.
lio exactitud, quin y cundo empez a tratar de expresar algebraicamente las rclaciones
se conoce) con
.ltre dos o ms vanables, de las cuales solo se dispone de un conjunto de observaciones; pero eu los
-scritos de Leonardo da Vinci, cuando l trata de las proporciones del cuerpo humano, se encuentt'an
.:lpresiones aritmticas que relacionan las medidas de diversas partes del cuerpo.
-,-n
intento, que est bien documentado, data de 1755, cuando Boscovich y Christopher Maire estaban
-lcargados de medir la longitud del arco de meridiano qne pasa por Roma. Boscovich concibi nn
,todo para encontrar nn modelo que relacione los datos correspondientes a dos variablcs, mediante
., empleo de las llarnadas <<regresiones elementales>>. Esta tcnica fue mejorada por su autolen 1760
'' I.L-.esii.:l Lir.a crl,a iris csi,rticl.tir,j.e por Laplace) Linos alos ms tarCe.
rn 1805, Legendre public una obra de astronoma, en la que describi el mtodo de los mnirnos
- radrados y 1o aplic ai ajuste de datos observacionales. Tarnbin, hay una serie de artculos pre-
.-ntados por C. F. Gauss a Ia Sociedad Real de Gotinga en los que describe el mtodo de mnimos
Ladrados. Luego, en 1885, Sir F. Galton present en la rer.'ista IYature el desarrollo complcto de esta
-=cnica. aplicada a lo que l denomin modelos de regresitz. A partir de esta fecha se mejor y se
-,mpiet la tcnica, haciendo que ella sea la de nayor erlpleo en el ajuste de coniuntos clc datos"
301
Captulo 70. Regresin Lineal Simple
altura dada, o la frurula que nos indica el inters ganado por un capital, dados la tasa de inters y e1
Sin embargo, en la vida diaria, tara vez se presentan fenrnenos que reproducen con exactitud una Ie'.
ya sea porque existen errores en la medicin o porque hay otras variables que no son consideradas.
por stl escasa influencia, pero que son sufi.cientes para que el modelo propuesto no sea exacto.
1. Descripcin cuantitativa de las relaciones entre una variable dada y un conjunto de variables.
En lo que sigue, nuestro inters ser determinar una ecuacin clue relacione una variabie dada con otra
variable de respuesta, bajo el supuesto que ellas se vinculan mediante una ecuacin lineal de primer
grado, caso particular conocido como regres'in lineal si,mple.
lJ: l3ol7fl,
donde B es la intercepcin de Ia recta con el eje y y r es la pendiente de la recta. (Vase Figura
10.2)
Intercepcin
- Pendiente:p,
-{
! = fro
Este rnodelo es determinista porque no considera el error y los valores de g se obtienen, de manera
exacta, al sustituir los valores de r en la ecuacin de Ia recta.
Cuando se desea incorporar al modelo determinista ei efecto aleatorio de las variables se le aade una
componente que corresponde al error y el modelo queda como
a: 0ot Ap I e, (10.1)
donde
B1 la pendiente de la recta.
Para recoger el efecto aleatorio del error, harenos las siguientes hiptesis sobre e:
2. Los errores, correspondientes a dos observaciones distintas, son independientes entre s: E(e e) :
0.
Ejernplos de modelos de regresin que se presentan en la vida cotidiana son los siguientes:
,
u
Efecto del nivel socioeconmico,
Presupuesto de gastos Nmero de miembros
tenencia de la vivienda, servicios
de un hogar del hogar
que dispone, etc.
Efecto de la zona de ubicacin,
Precio de nn
Area de construccin trpo cie acabados, piso en el que
departamento
se encuentra, etc.
Efecto de las variaciones climticas,
Crecirniento anual
trdad del rbol variedad del rbol, fertilizacin de
de un .r1-.ol
Ia tierra, etc.
Nmero de pginas Efecto del tipo de papel, la encua-
Precio de un libro
del libro dernacin, nmero de ilustraciones, etc.
rn el anlisis de regresines necesario tener en cuenta los siguientes pasos que llevan a estimar un
'len modelo) que se ajuste a los datos:
Tener una visin clara de los objetivos del estudio, para determinar cul ha de ser Ia variable
respuesta y qu variables pueden incluirse como variables independientes.
Recopilar los datos correspondientes a las variables identificadas como dependiente e indepen-
dientes.
304 Captulo 70. Regresin Lineal Sirnple
3. Postular un modelo, al que se supone se a,justan los datos (en nuestro caso se presume que es -
Iineal simple).
4. Determinar la ecuacin de regresin; es decir, estimar los coeficientes del modelo propuesto.
I
L,. Comprobar estadsticamente la adecuacin del modelo. Esto incluye la realizacin de prueba..
estadsticas sobre los parrnetros, la ejecucin de transformaciones de las variables para obtene:
un mejor ajuste o retirar variables de nna ecuacin si su aporte no es signiflcativo en ia ecuaci-
de prediccin.
6, Cuando la ecuacin sea satisfactoria, usar el nodelo para efectuar estim.aciones o predicciones.
Una vez que se han curnplido los tres primcros pasos) nuestro objetivo ser estimar los coeficientes de
modelo y comprobar la adecuacin del modelo.
donde bo y h son los estimadores de B y B1, respecti-u'amerrte; ellos deben ser tales que la surla d
los cuadrados de las diferencias entre los valores observados de la variable respuesta y su estimacir-
por la ecuacin de regresin sea mnima.
Nosotros buscaremos los valores de y b1 eue minimicen la snma de los cuadrados cle los errores.
tarnbin llamada suma d,e los cuadrados de los res'idu,os:
scE : >,"::f,fun-\)2
: Llr, - (bo + lrr)12
i:7
305
70.3. Mtodo de los rnnitnos cuadrados
ecuaciones:
Dcrivando SCE con resPecto a b6 Y b1 , e igualando el resultado a cero se obtienen las
11
clya solucin es
1a
D@ -',)(tt'
i-l
- Y) gCru
(10.3)
h: TL
r) SCr"'
Llr - -rt )-
i:I
(10.4)
b6 : U-bti,
i",
TL
;,1
Dv
i:7
,iurrclcn-:-j--t'g: sonlospromecliosclclos\aloresdelasvariablesinclependientey
?.1 17
,-Lr:penclietite.
queda establecidr
u na vcz obtenidos los valores de bs y b1 se
los sttstituye en Ia ecuacin; de esta manera
ia recta cle prediccin pol m'nimos cuadrados:
i:bo*b1r'
se clebe tener presente la incorporacin de elroles
Observacin. En Ia estimacin cle los parmetlos de
ie lecloncleo en el clculo de sc", t- d'e scrr; se recotrriettcla el empleo de un nrrnero suficiente
-ifrassigrrificativasalrealizarlosclculosdeforrrrarnanllai.
de los automviles v stl con'sulllo
Ejemplo. En un estudio pala determinar la relacin entre el peso
con los sigttientes resultados:
ie combustible se escogi .,r,,a rl].,estra de 10 caIlos,
, )l I ilLl ]llf)
rrlra tabla:
?ara simplificar los clculos, Iestl]nalnos los componentes eu
z: 996.1; ?l :11.4.
.L '9 i-r
739 B -257.1 -3.4 66100.41 874.14
1187 16 190.9 4.6 36 442.8r 878.14
655 6 -341.1 -5.4 1t6349.2t 1841.94
729 rt75.24
7 -267.r -4.4 71342.4r 475.64
8BB 7 - 108.1 -4.4 11 685.61
797 I - 199.1 2.4 39 640.81 477.84
1.3.24
963 11 -33.1 -0.4 1095.61
802 12 - 194.1 0.6 37 674.87 - 116.46
1551 18 554.9 6.6 307 914.01 3662.34
1650 20 653.9 8.6 427 585.21 5623.54
1 115 830.9 14 905.6
Suma
Captulo 70. Regresin Lineal Simple
,- :
b-
sC,,
--*v 14 905.6
:f-).r-1131.
sc,.,- I 115 830.9
bo : A -bt7 :11.4-0.0134 x 996.1 : -I.9477.
0:-7.9477+0'0734r.
Ahora se puede, por ejemplo, predecir el consurno de un auto que pesa 1000 kg; esto es, z : 1000:
Una vez que se halla una estimacin de la recta de regresin) es necesario determinar si 1 ss11gir-:-
obtenida es un buen rnodelo para los datos y cuantificar el elror que se cornete cuando se emplea t:.-
ecuacin. sto se logra mediante el empleo de los coeficientes d.e correlacin y de d.eterminacin, - .,
travs de la realizacin de pruebas estadsticas sobre los parmetros.
Recordemos que si se tienen dos variables aleatorias) una medida de Ia relacin que existe entre ell-.
es el coeficiente de correlacin p. Anlogamente, para determinar si existe una reLacin lineal entre le-
variables predictora y de respuesta se utiliza el coeficiente de correlaczn I'ineal de Pearson, denotad
por r, que se define por
11
L,rA- nrA
3 Valores de r cercanos a 1 o a -1 indican que existe una fuerte relacin entre Ias dos variables.
En la Figura 10.4 se rnuestran diversos diagramas de la rclacin entre r y A, segrn los valores de r.
70.4. Cornprobacin de Ia adecttacin del rnodelo 307
f*e t
. * \
*
A%\
*aa
*&- g
Be **s
'd"s
I r r.;.ru1 7*
r = [1.7
: tgura 10.4: Diagratnas de dispersin de los datos y valores aproximados del coeficiente de correlacin.
:-empre debemos tener en cuenta que el coeficiente r solo aporta informacin cuando existe tura
-.-acin lineal entre las variables. Pudiera suceder que se tenga un valor de r cercano a 0 v, sin
.:.rbargo, haya una relacin no-lineal entre las variables.
308 Captulo 70. Regresin Lineal Sirnple
Tarnbin, se pueden conducir pruebas unilaterales sobre p, pero ellas solo tienen un valor estadstic-
y su valor prctico es restringido.
Ejemplo (Continuacin). Para los datos del consumo de gasolina de los automviles: a) caicr-rla--
el coeficiente de correlacin de Pearson; b) realizar una prueba para probar si p : 0 al nivel o=
significacin de 0.05.
Soluc'in: Los componentes de r son: ,SC"" : 1115 830.9, SCaa :224.4, $Cxu :14905.6.
$cw 14 905.6
:0.94197.
Como r es muy cercano a 1, existe una fuerte relacin lineal entre las variables.
b) Para la prueba bilateral consideremos un nivel de significacin del 5 %,
Otra medida de la relacin entre las variables es eI coeficiente de deterrn'inacin, 12. Su empleo st
debe a que da mayor frterza de interpretacin a la relacin entre las variables. Tenemos que
n n
er1
DUay :D@o - y)2 :Dr? - ne2,
i:). i:7
que se le conoce como surna de los cuadrados alrededor de la media de y o suma de cuadrados corregzd -
de y.
Si denotamos por:
70.4. Contprobacin de la adecuacin del rnodelo 309
SCE -- D(ao - fr)2, que se denomina como sttma, de uro,drados de los erT'ores. Este trmino
i:I
tambin se puede calcular mediante la relacin
l,(uo
i:1
-il' fi:I tvo -0)2 +L(9, -il2
i:1
2. Como rnedida de bondad de a.iuste. Clrando el ajuste es perfecto, t-2 :I y cuanclo no hery
ajuste, 12 : 0.
Cuanto rnayor sea el valor de 12, mejor ser el a.juste y mayor utilidad tendr corno instrumento
de prediccin.
Ejernplo (Continuacin). Para los datos dei consllmo de gasolina de los automviles, calcttlal el
:oeficiente de determinacin.
De rnodo que
25.287
t'2:l- : 0.8873.
224.4
Es decir. el 88.73 % de ia variabilidad de ios datos es recogida por la recta cle regresin
SCE
r-2'
Ejemplo (Continuacin). Calcular Ia estimacin de o2 para los datos del conslrrno de combustible
de los carros.
,,: SC E 25.287
:3
's' 161'
"
1: 10 J
Auuque s2 se puede considerar una medida de 1a calidad cle ajr.rste, su principal utilidad se encuentL.
en la determinacin de la bondad de ajr-rste, ya sea mecliante un intervalo de conflar^za o con Lrn-
prueba dc hiptesis.
En primer lugar se desea estudiar si existe o no existe relacin entre las variables r y A. Se dese-
coutestar a la preguuta aporta r informacin pala predccir 17? Esta pregr-rnta se refiere a Br, pues
afirmar que y no se lelaciona linealmente con z equivale a decir que B, : 6.
Eutonces, se desea probar la hiptesis nula <<r no contribuye con ilformacin para predecir y>>; contr:^
la hiptesis altelnativa, <<las valiables estn rclacionadas de forrna lineal con una pendiente distint
de ccro>>; es decir,
Ho, 0t:0,
Hr 0tlo.
Para efectuar Ia prueba habr que encontrar lr distribucil de lnuestreo de 1,1 .
Y
,i
70.4. Cornprobacin de la adecuacin del rnodelo 311
[,
i
Distribucin de muestreo de b1
1{,
Si los componentes del error son variables aleatorias independientes normalmente distribuidas con
nredia cero y varianza o2, la distribucin de muestreo del estimador b1 es norrnal con media B1 y
desviacin estndar
o
ubt
JSe;
sto quiere decir que b1 es un estimador insesgado para p1, pucs E(b1) : 0t y que la desviacin
estndar de b1 puede estimarse pol
5
q,
"ut
\/ /.d7'-,
JV, ,.
Entonces. la variable aleatoria :b'- Sbr A' sigue una ley a (n-2) grados de libertacl.
a) Prueba unilateral.
1. Hi,ptesis Nula. H6: B, : g.
2. Hi,ptesi,s Alternati,ua. Hr 0t < 0 (o bien .11: , > 0).
3. Estad,st'ico d,e Prtteba. tobs: --L
slt/Se -,'
4. Regin de Rechazo. Se rechaza 116 si tob" 1-to(n-2) (o bien o6" ) Lo,(n-2) cuando 111:
r > o')
b) Plueba bilateral.
1. Hzptesis Nula. Hs: Br: g.
2. Hiptesr,s Alternat'iua. HI 0t * 0.
Ejernplo (Continuacin). Para los datos del consumo de cornbustible de varios carros: a) probar
.i Br :0, a ttn nivel de significacin de 0.05; b) obtener el intervalo de confianza algSTo.
Solu,cin,: Antes se haba determinado los valores de s y de SCrr:
: r/3J61 : r.TTTS, sc",", :1 11b 830.g.
"
a) Realizaremos una prueba bilateral:
3I2 Captulo 70. Regresin Lineal Sirnple
4. Regin, tle Rechozo. Como tob" ) ioot(E) : 2.306 v la r-egin es lo,"1 > 2.306
5. Dectsi,n, Se lcchaza la hiptesis nnla.: es dccir, el consurno de combustible aument-
meclicla qlle se inclcrnrent-L el pcso de los carros.
/rs\
(Lr - r" "rr, :t ,r-: t't i i,, .{tt 2))
(.,.,,,,-r.30b-]j.I1::{l'(}13.lr.30+):(0.0095l0.0l73,).
\ vr11iE30.9 /rlr530.9/
Sr.rpongarnos c.lc se clesei rr-crigrral si {)s r$ ual. 1or cspecfico: ello se logra efectuando
prucba rle hiptesis o colr un intervalo cie r:olfi A\Z ncra sirnilar a la rlescrita para p1 .
O[.o: o\
\),,i
4. Regi,n r|,e Rech,azo. S.. rcclLr,za H si t,,1," { -Lr, 12(n. - 2) o tub, )> to2(rt - 2).
t.,,
i2(rt, 2') :lt!f ,,/:(n -
[,-
70.5. Anlisis de la vartanza 313
Ejemplo (Continuacin). Para los datos del consurno de combustible de varios carros: a) probar
si Bo:0, a un nivel de significacin de 0.05; b) obtener el intervalo de confi.anza al957a.
Soluc't,n:
b) El intervalo de confianza es
(
-, .rrr',- r.rouL]Zg./ffi : t roul3l@) : (-6.025; 2.130).
\ x 1115830 9 -r.()J77-
/10 v I 115830.9 J10 /
Significa que la suma de los cuadrados corregida es igual a la suma de cuadrados de los errores ms la
snrna de cuadrados debida a la regresin.
La suma de los cuadrados corregida tiene (n - 1) grados de libertad, Ia suma de cuadrados de los
errores tiene (n - 2) grados de libertad y Ia surna de cuadrados debida a la regresin tiene 1 grado de
libertad. Es decir, la igualdad correspondiente a los grados de libertad de la ecuacin (10.5) es
n-t:(n-2)+I (10.6)
314 Captulo 70. Regresin Lineal Sirnple
De las ecnaciones (10.5) v (10.6) se tiene la tabla de anlisis de Ia varianza) como la que se presen:
a continuacin.
La colnmna dcl <<cuadrado rnedio> (htC) se obtiene al dividir cada una de las suma de ios cuadrad,,
entre sus correspondientes grados de libertad.
El valor de 4a" r-esu.lta de la divisin del cnadrado medio de la regresin para el cuadrado med-
AIC R
resld.rtal: tobo: a .
5'
Una vez elaborada la tabla de anlisis de varianza, el valor de Fo" se emplea para conducir una pruet
de hiptesis sobre la razn de dos varianzas) qrre sirve para probar si r : 0. La prueba es Ia siguientt
LIna vez que el modelo es satisfactorio habr que emplearlo para reafizar estimaciones y predicciones
que servirn para analizar el comportamiento de la variable respuesta ante condiciones que no fueron
probadas empricamente.
Ntese que Ios valores de estimacin y de prediccin de Y son idnticos en los dos casos, la diferencia
radica en la precisin relativa de cada unar que se ven refleiadas en sus varianzas e intervalos de
confianza.
0p: bo I b1rp,
La varianza es
| (rp-r)2.-
(t t.;2, - 2)s
;-E::!r+t^2(n-2)s
0p:bo!b:rp,
La varianza es
oL-st:o'(t+1+Q--u)'\
\' "' sc,, )
y en su estimacin se emplea s2 en lugar de o2 en la expresin anterior.
Ejemplo (Continuacin). Para los datos del consumo de combustible de los carros, obtener Ic=
intervalos de estimacin y de prediccin para un carro cuyo peso es 1000 kg.
Solucin: Como se indic los valores estimado v pronosticado son los mismos:
La varianza o?v es
)
: 3161(++ (1000 -
1 115 830.9
996.1)2
: 0.316.
"v la varianza o?
\u-a^.
es
)
o'(t+;.ffi)
"/ r (r^-T)2\
El intervalo de prediccin es
Comoseve,elintervalodeprediccinesmsanchoqtreeldeestinracin.<
70.7. Formulacin rnatricial de Ia regresin lineal 3t7
Se deber tener Ia precaucin de no usar el modelo obtenido para estimar el valor medio de g o
predecir un valor particular de g, con valores de r que se encuentren fuera del rango de la variable
independiente que sirvi para su elaboracin.
E1 modelo podra ajustarse perfectamentea los datos recogidos para hallar la ecuacin, pero nada
garantiza que el mismo comportamiento se consiga fuera de tales lmites, pudiendo darse un ajuste
bastante malo. (Figura 10.5.)
-v Recta de t')Error de
minimos -
- \-
',-Jnrediccin
\
Relacin verdadera
entre y y x
x
Lmites de
Figura 10.5: Uso errado de un modelo para realizar predicciones fuera del rango de definicin de r.
a:0olPple.
at : B0 + Bp1+ e1,
az : BslBP2*e2, (10.7)
:-:
An : 0o-1 0p,, le,.
x- p: (i: )
X es Lrna rnatrizn x 2 de los valores de Ia variable independiente, cuya primera columna tiene la
particularidad que todos sus componentes son iguales a 1.
Y:Xte.
u:f ),
\01 /
ete : (y-Xb)(y-Xb)
YY-2bxY+bxxb.
\et e
:-2xtY+2xxb:o'
ab
cuyo resultado es el sistema de ecuaciones
XrX:l
l"D,,ll)ao\ y y:l I
n n h-
t'n D"?
I\ t:l i:t t\ :lt,,a,
Si la matriz XX es inversible, se llega a la ecuacin de estimacin de los parmetros
b: (xx)-1xY,
La matriz (XX)-1 es
(XX;_l :
n / n \2
"l)*?-(D",)
i:r \=l /
9: Xb.
tEn 1o que sigue se emplear la notacin A para indicar 1a matriz o vector transpuesto de A
70.7. Forrnulacin tnatricial de la regresin lineal 319
Up -- xlrb,
entes m
p-(;:) ,:(1)
)
, : / 1
x/x I t\ / to 9961
(tin 1187 1650 ) -\ I
ooor 11037983 )
I / l
rxlxl-I : 11 15830e (
1 037 983
-9961
--,--
x'Y: / t I 1\ ( ttt
(to 1187 rc50 ) \ 128 461 )
As,
b: qxtx-1xty
: _t
1 / 11037983 -9961 714 -1.906 \
11 158 309 \ -9961 10 )( L2B 467 ):( o.o34 )
Por ianto, ia ecuacin de regresin' ." g - -1 906+0 0134 r.
Recordemos que
TL
n2 \- -2
o2 'i-1
Var(b1) : TL , Var(b) : ,)L
2La diferencia en el valor del trmino independiente entle 1as formuiaciones algebraica y matricial, se debe al nrero
.le decimalesutilizados en el clculo de la formulacin algebrarca,
32O Captulo 70. Regresin Lineal Sirnple
D@
l.:l
- ")2
"2Dr? L- T
-o
-no"
TL
: ( .J,1,1,j..1,, .i.",,0,1', :
't t,
L\r - r)'
n
r?
\ 14 e\2
-'O
var(b, i:1
-
,i-7
) _o
-ro'
t
o-
t7 rL
D@
i.-1.
-r)2 D@
i:I
-r)2
Var(b) : o'(X'X)-t
Con el empleo de la formulacin rnatricial dc los componentes de la regresin se puede poner las sumas
de los cuadrados como
SCE: YY-brxY,
/ n \2
lrv,)
t" /
scR b1x/Y - n
,
/ ,,\2
(Iu')
\r -l
SCoo : YtY - '/
'rL
,
T-
sCro
Anlisis de la Varianza
Soluc'n: no de los t
: ((t -l I,
YY : (s
Drn :
;_1
r14.
Entonces,
En rnuchas ocasiones los modelos no lineales pueden ser tratados corno lineales si se efectan algunas
trattsformaciones a las variables, ya sea a la predictora, a la respuesta o a ambas.
322 Captulo 70. Regresin Lineal Sirnple
A.1 ernplear tales transformaciones se deber tener la precaucin de verificar que el modelo modificad
cr"rnple con la hiptesis sobre Ia distribucin que siguen los errores.
EI m.odelo es
'g - gSoI0tt:+e '
Ini/:3oilttIe.
Si poncmos z : In;r7 qucda z : Aoi 0fl * e. cre es utt rnodelo lineal simple, que se estirna
?: bo * hr,
2. Modelo recproco o inverso (Figur-a 10.7.)
1
Poniendo Ia ltima igualdad qr-rcda corno
a
-.)'1..-r-
':90iLll.t.
Y : o,r\'
InY:lna*)lnr*lns'
Haciendo z :lna, : ln r, 0o :lno y 0t : \, el modelo se escribe como
z:Jo_3rt+t.
que se estima por ei modelo lineal 2: bo I b.
Otros modelos no iineales comunmente utilizados son Ios siguientes:
Se recomienda que el lector realice las operaciones necesarias para linealizar estos modelos.
Ejemplo. En el desarrollo de un algoritmo de computacin, para ser usado con una gran cantidad de
-rformacin, se desea conocer Ia relacin que existe entre el nmero de datos y el tiempo que emplea
',na computadora en entregar resultados. Para cada una de las distintas cantidades de datos, se
;icieron 10 mediciones del tiempo empleado y Iuego se calcul el tiempo promedio, segn se resumen
-l Ia tabla:
icl,-tc'in: El modelo propuesto es de la forma A : c,r\.. Para transformarlo en uno lineal se deber
-- mar logarit mos:
i- suponemos que se cumplen las hiptesis bsicas, que permiten tener un modelo de regresin lineal
.-.rple, entonces se tiene la siguiente ecuacin de prediccin lnf : lna * blnr.
324 Captulo 70. Regresin LineaI Simple
Por tanto, se deber reaTzar una regresin lineal de 1ny respecto a lnr.
Tomando logaritmos en las dos variables:
lnr 0.0000 0.4055 0.6931 0.9163 1.0986 1.2528 1.3863 1.6094 2.0749 2.3026
lna 0.223r 0.4719 1.0986 r.48 16 1.9169 2.2727 2.6101 3.1046 3.6964 4.2822
Adems, se obtiene un coeficiente de determinacin muy alto, del 99 Y,t, para la ecuacin transformada.
A partir de la ecuacin se podra proponer que e1 tiempo de ejecucin de1 algoritmo es proporcional
al cuadrado del nmero de datos: A:0.8312. Para verificarlo es necesario realizar las pruebas de
hiptesis sobre los parmetros. Esta tarea se deja a1 lector.
10.9. Ejercicios
Modelos lineales
Ajuste un modelo lineal simple y calcule el coeficiente de correlacin lineal entre las variables.
2. Se realizun experimento pa,ra medir la velocidad del sonido en el aire a diferentes temperaturas.
Los resultados obtenidos se indican en la siguiente tabla:
Ventas 20 27 33 47
a) Realice r"rn grfico de los datos y diga si es recorrrendable ajustarlos a un modelo lineal
simple;
b) Halle la ecuacin de regresin simple que ajusta los datos;
c) Realice un anlisis de varianza y pruebe la significacin del ajuste;
d) Halle el coeficiente de determinacin del modelo. Interprete su valor.
e) Hay alguna manera de simplificar el modelo?
En una investigacin de las propiedades de un pegamento de secado rpido se midi el tiernpo
que se demora en cristalizarse en funcin de la cantidad de pega depositada sobre uria superficie
de material cermico de prueba.
Cantidad (g)
Tiempo (seg) 26.2 27.9 29.4 30.5 31.0 34.3
a) Realice Ia formulacin matricial del problema y ajr-rste los datos a un modelo lineal. Inter-
prete ios coeficrentes;
b) Calcule s y obtenga un intervalo de confianza, al 95 %, para los coeficientes de regresin;
c) Evale 12 e interprete su valor. Pruebe si p : g'
d) Realice una prediccin para cuando el nrmero de depsitos es 12;
e) Obtenga la tabla ANOVA y realice la prueba F' correspondiente.
En el mercado inmobiliario se realza el. avalo de una propiedad para luego efectuar su venta,
la diferencia constituye la ganancia del vendedor. En la tabla se dan los valores (en rniles de
dlares) de avalo y precio de venta de doce propiedades en Quito.
8. El nna entidad finarrciera se desea tenel nn mtodo que permita realizar pronsticos de las
ganancias obtenidas en base a inforrrracin cre pueda estar disponible de ulanera rpicla. trl
gerente de crdito plantea uu modelo qr-re relaciorra el lrrnero de prstamos realizados en Lln lres
v la ganancia obtcnida en el misrno perocio. Prr trl efecto recoge la siguiente informacin de
los 8 rltimos meses:
No. prstanos L25 131 r42 127 140 121 136 133
Ganancia 44 54 77 35 BO 47 66 ti5
9. La siguiente tabla muestra la captr-rra de anchoas (captnra, en millones cle toneladas mtricas)
v el precio de la harina de pescado (precio, en dlares por tonelada) para los rltimos 10 aos:
Ao 1 2 ,) 4 i_) 7 8 9 10
Precic 190 160 134 129 172 239 542 245 454 410
Captura (.,1 E,53 982 10.26 8.96 4.45 1.78 D'
t).r) 08 05
Construlra ios rnodelos lineales que lelacionen las variables (" - y) e interprete los coeficientes:
a) Precio 1' ao;
b) Captura y ario;
c) Precio y captura;
Con el modelo que tenga 1a mxima correlacin:
d) Realice la tabla ANfOVA e interprtcla;
e) Construya los interr.aios de confiallza para los coeficientes de regresin;
f) Realice la estimrcin de y cnrndo r: 5.5.
70.9. Ejercicios 327
_1. Los siguientes datos corresponden al ritmo cardiaco en reposo (Y) v el peso (X, en kg) de 6
personas.
90 62
86 45
67 40
89 55
81 64
75 53
Dr: 488, Dg:319'
Dr? : 40092, Drnan : 26784, Dy? :17 399.
a) Grafique los datos y examine si parece que hay una relacin lineal entre las dos variables;
b) Calcule los estimadores de los parmetros de regresin;
c) Obtenga la estimacin por intervalo de Ia media cuando r : 88, al nivel 95 %;
d) Obtenga el intervalo de prediccin de Ia media cuando z : 88, al nivel g5 %;
e) Calcule los coeficientes de determinacin y de correlacin entre las dos variables.
D(ao - 2 :832.
i:7
Se realiz un estudio para determinar el efectc que tiene la temperatura (r) sobre la crntitlad
de gas residual generado (y) un proceso qumico. Se analizaron 12 unidades nrnt:stlales y se
"r.
midieron las siguientes cantidades.
Uua teora financiera sostiene que hay uua relacin directa entre el riesgo de una inversil y el
rendimiento que promete. El riesgo de una accin se mide por su valor, Ilamado p. En Ia tabla
se muestran los rendimientos y valores de 12 acciones:
Rendimiento 89 .) 15 ,) / 82 53 05 13 59 68 72
Valor Beta 1.5 1.9 1.0 05 15 18 13 -0.5 05 IB 19 19
328 Captulo 70. Regresin Litteal Simple
a) Pruebe si los coefi.cientes del ruocleio son siguificativos. Escriba las pruebas .r, liruls c :
14. Suponga qlre se ha ajustado trna lnea r(x'ta a uu conjunto de 9 pare.jas de observaciones, dand,
a- x |l-
lJ - - -r '.L'
Adems, se obtnrrieron las siguientcs clcsr.iaciorres: (r;, - r): -4, -3, -2, -1, 0, I,2,3, 4 5"-
tabla de anlisis de la valianza:
Modelos no lineales
15 A continuacin sc presentan 7 mediciories dc clos variables
:L 05 10 15 20 25 3.0 3.5
a 06 27 12.2 54.6 244.7 1096.6 4914.8
Encuentre 1a ecuacirr de regresin cluc a.justa los datos, segn un modelo exponencial y calcul.
el coeficiente de determinacin.
17. Un ingeniero est investigando la relacin eritrc lr veloc:irl'rd clcl r.iento y la cantidad de electridad
generada. Luego de 10 nediciones obtttr.o:
.)
Velocidad del viento ti0 60 /1
61 10.0 97 96 3.1 B2 6.2
Corriente generada l.58 t82 1.06 1.93 2.24 2.39 2.29 0.56 2.17 1.87
18. El gerente de una ernpresa desea lelacional la evoluci<iu de Ias ventas y el gasto publicitario,
segrn los datos que aparecen en el cuadro:
o.)
Ventas (9) L(l 15 18 .a 25
Gasto (z) i9 22 4), 72 9B
f I T4 77 i1 8 10 5 7
20 A continuacin se presenta la evoluciri anual clcl srlario mnirno vital en nn pas con alto ndice
de inflacin.
Ao 1 2 J 4 5 6 7 B I l0 11 I2
S.M.V. 66 95 720 r20 I45 190 220 320 320 400 600 600
21. En astronoma se denomina ao sideral al niulero de arios tcrrestrcs qlre un plancta se demora
en completar nna revolucin alrededor del Sol y rlepencle de la distancia entre Ios dos astros.
En ia tabia se muestra la distancia promeclio ;' el arlo sideral para los planetas del Sistema
Solar. Emplear los datos para detelninal nrr modelo de legr-esin que relacione las dos variables,
330 Captulo 70. Regresin Lineal Sirnple
tomando com.o variable dependiente al rrio sideral. (Pala lealizar la transformacin adecuadr
refirase a la tercera ley de Kepler).
22. Los siguientes datos corresponden al precio de venta (en cientos de dlares) de un modelo de
automvil, segn los aos de uso
Aos de uso 0 1 2 J 4 5 6
Precio r0.2 B3 69 5.5 4.0 3.5 3.3
Ao Abonados
1 32 000
2 37 500
3 41 000
4 58 000
5 107 000
6 138 000
7 175 000
8 321 500
Regresin Mltiple
En el captulo anterior estudiamos el caso en el cual la variable de respuesta g depende de una sola
i-ariable predictora z, estableciendo el modelo de regresin lineal simple. Pero, podra suceder que
este modelo sea insuficiente y que sea necesario incorporar nlle\as variables explicativas del fenmeno
rnvestigado.
-\nalicemos el siguiente caso: el gerente de una empresa desea incrementar las ventas, para lo cual
lecide realizar gastos en publicidad y medir la variacin ell slrs ventas, Inicialmente, decide poner
rublicidad en televisin, pero posteriormente decidc tambin ponerla en la radio y los peridicos.
En la primera etapa la variable de respuesta, qlle es el incremento en las ventas, depende de una
.ola variable predictora (los gastos en televisin) y para realizar un anlisis es suficiente ernplear un
:lodelo de regresin lineal simple. Mas en la segunda etapa, la variable de respuesta depende de
--arias variables predictoras (los gastos en televisin, radio y prensa), consecuentemente para realizar
'rn anlisis ya no es suficiente la regresin lineal simpl.e.
Fu general, aunque hay rnuchos problemas prcticos clue ataen a variables predictoras rnicas, es
--tucho ms frecuente que la variable respuesta dependa de un conjunto de variables predictoras o de
:ausfolrnaciones de las mismas. De la estimacin de tales modelos y de su calidad de ajuste nos
cnparemos en el presente captulo.
331
332 Captulo 77. Regr"esin Mltiple
Al igual qlre en cl caso de una sola varirblc. se cor.sidera qr-le cl crror s tiene esperanza igual a cero v
rrarianza a2 y qne los errores ei) col-respondientcrs a cacli obserr'tcin. son no correlacionados.
clonde y denota el incremento en las ventas. u1 los gastos en tclevisin) 12 los gastos crr radio y z
Ios gastos en prensa. Los coefi,cientes p6, 0t, A' 1'.83 son parnctros que defineu cL moclelo, eLlos son
desconocidos y el problema inicial es detcrminat estos croeficicntcs'
Nlediante la tcnica de regresin Lineal mrltiple sc puccle rnalizar uua serie de modelos particulares
como el polinonial de ttna'r'ariable
Otros nodelos nis complejos pr-reden rcclucilse a rrn rrroclelo clc regresin linerl mrltiple necliaute
cambios de variable adecuados.
9 t:t :2 2rA
'!jt r rr :L 12 u 1A
donde bo , br , , . . , b* son tales que la sttrna cle los cuach-rclos cle lrs difcrerrcias entre los valores observados
cle la r,ariable respuesta y su estirlacil por la ecuaciu cle r-cgresirr sea mnima.
o en forma abreviada
c
i: bo +\brti,, i,:l.).....n.
j:t
li
a6c E) \-i..-.\-n
0b* -2D:,ik,(u,i. -00-
-A^ ) ojxij):v.
i-l j-1
Ltrego de simplificar las igualdades, se obtiene \as ecu,a,ci,oncs norma,l,es de rnnimos cuadrados:
boDr,, - f
bt-.J rl,r + b2f
'/-J
t,rr',, - . .' * bu I ).ir:xik : D',rro
i:1 i- 1
TL 1' 1L TL
Entonces, se dispone de uu sistema de k * 1 ecuaciones normales quc invoh-rcran a los coeficientes des-
conocidos. Su solucin permite conocel los estimaclorcs cle los parrnetlos del modelo lineal mrltiple.
alrnque debe observarse que tal tarea. en general, suele sel rrruy laboliosa.
334 Captulo 77. Regresin Mltiple
Formulacin matricial
De manera similar a Ia realizada cn el moclelo lineal sinrple, el linea,l mrltiple es factible ponerlo en
forma matricial. Por la cantidad de variables irn'olucradas csta formulacin es ms fcil de manipulal
que la forma algebraica. El proceso es idrttico a1 explicado en el captulo anterior; sin embargo, lo
repetiremos de manera simplificada.
Y:X0+e.
Los miembros de esta ecuacin se forman de 1a, siguiente lranera:
X es una matriz rtx (k+1) de los rralores cle la varirble inclcpendientc, cuya primera colunna tiene
la particularidad de que todos sus componerrtes son igr-r:rles a 1.
p es un vector (k + 1) x 1 de los parmetros cle la ecuacin.
Esta explesin es la forrna rnatricial cle las ccurtcioncs lolrlalcs clc regresin antcs deducidas.
tt D Drn T -..
1' ''tk \- u'
i:1. "t i-l i1
i-I
r r rL 11 rL
D r, \- -2
/r *iI D,or,o, )- J;r.1.;. D rrun
:1 i-I i-I i:1 i:T
rL r rL 1I TL
')
D rn^ D rnnro, D rnrz 5- z;r.u,
i.:1 _1 ; i-1 i.:1 i:r
Observemos la estructura especial de ta natrices X'Y y XX; sta riitima es simtrica de orden k * 1.
Ejernplo. Una compaa, con objeto de progranrar la produccin para e1 resto del ao, necesita un
plonstico de las ventas totales. En sus registros ticne las r.crrtas realizadas (en miles de dlares) v
los gastos en publicidad e insumos para sus productos en los irltirnos 10 meses como se muestra en la
sigr-riente tabla.
Encontrar la ecuacin de regresin que relacione las vcntas con los gastos en publicidad y en insunos.
Soluc'in: Nombremos la variable ventas cono y) los ga^stos en publicidad como ,r1 y los gastos en
insumos como 12. El modelo de regresin es
I,.
y,,-A tJO- u1r r J,.- .
- I -r u).t 2 c.
15596 tt.)
J J.)
15984 310
16974 311
16566 290
X- I7191 Y- 342
I67E6 348
77678 .)
-a
-I
15966 275
77767 311
I 64 7l,t 298
l.Xes
111 11 1 111
59 69 65 71 67 76 59 77 64,
84 74 66 91 86 78 66 67 75 )
336 Captulo 77. Regresin MItipIe
La matriz XX resulta:
662 783
XX: 44304 51 636
51 636 62 335 )
Su inversa (XX-t
".
27.07764 -0.18441 -0.11200
(x'x)-' :( -0 18441 0.002266 0.000438
-0.11200 0.000438 0.001059
Y el clculo de XY da
/ zr4s \
XiY : f zog oog I
\ zas 055 )
Finalmente, multiplicando los dos ltimos resultados llegamos aquebes
1x''':(i:,\ :( 37.30 \
1.717 I
Yu, I 2.088 )
Con todo sto, la ecuacin de regresin es
Propiedades de b
1. Es insesgado para p.
Puesto que E(e) - 0 y (X'X)-1 X,X : I se tiene:
Cov(b) : o'(X'X)-t.
La matz Cov(b) es simtrica; adems, el valor de o2 suele ser clesconocido, debiendo ser esti-
mado.
Estimacin de o2
SC E -- YY_bXY.
As, el cllol cuadr'tico meclio! cllre cs nn estimaclor- irrsesgaclo cIc o2, sc caicula pol
SCE
ItCE:.s2 : n-k'-I'
l0
YY : D, r? : 993 957.
'i:l
Pol lo t:tnto, SC E es
39()'37
.5
2
: llCE - - 55.7666.
I
-0.18441 -0.11200
clGr : 0 002266 0 000438
0.000438 0.001059
Crrando se realiza un mocielo de le-qrcsirr rtrrltirlc, gerrclirlrrrt:utc. las clc ureclicirr u.o sol
rLricli-Lrles
las ruislnas pala la valirblc cleperrclicrrlo l I)ar'1, las i'irri;ilrlr:s irr<lcpurrclit:rics. cle ltrrLrcLt qrrc los coe-
lir:icntcs dc regresin no se prrcclcn colnl)lr'\r dilcc:tun'rcutc. Pi'Lla srrrultl cstr clificultad. sc cnlk:an
Ios coc.fici,cntc,s de reqrcsi.n cstrnt,d,a't i,zrdo.s betr.
il,as rruiclrdes clc lnedic:in clc l"o<lrs 1;ts i'iliablcs sc lLirtsfrrrtnatt cst irrclrr'.
:rlividicnclo cada variablc 1rcl str dcsvi.,tcin cstittdar'.
i:bo*brl *b.:-..
338 Captulo 71. R.egresin Atltiltiple
se tiene
r-
5tt
:le,\1 - (u,-),,
,q.' -
('r-=),,
t,/,/
5,7
1 / \ 'sr.z
Los coeficientcs
.{ ..
beta - Itt:'-!
sll
sou los coeficientes de regrcsin parcral estinclar v srr intcr'prctrci<in es liL siguieutc: si hay uni r,uircirr
de ltna desviacin estinclat en ui) habr una clesr.ircin cle beta; dcsviaciones estndar en y.
Ejemplo. (Continuacin) Encontrar los cocficientes clc reglesin cstandarizaclos de los clatos clel
ejerlplo.
. s,.
i,r- 7.30
betal l.7l;-_^
')J
_.
;.::
;);)
0.53C3,
beta2
. s,,
b,-:-' - uSs-
^^ - 10.68
5t1 -'l '3.22 0.9604.
Iruesto c|re el vector de coeficientes B es clesconociclo. lo consiclcramos colro nna valiable aleator-ia
rrtrltivrriante, nornalmente clistlibnicla cou meclir b )'nratliz cle covarial"a o2(XtX) 1, por 1o clue
crda uno cle los estaclsticos
tt-j.t
,:0.1.....A;
t r/C.,t
sigrtc ttntr ley con (r1- l; - 1) graclos dc libeltacl r-clonclc C.i, cs cl j-sirno clcrnento clc la cliagonal
cle la uratriz (XX)-1.
Utr inter-r'alo de confianza al 100(1 - a)% para cl cocficientc clc regrcsn B (.i : 0,1,. . ., k), cs
Solu.c:i,n: El cstimador cle o2 cs s2 : 55.7666 l' /o ou(7) : 2.365; crttotLc:es, sc tieneu los siguierrtcs
intervalos:
77.3. Intervalos de confranza 339
1. Pala p:
(bs - tt(tt - k - 1) s r/Coo-; b1 I t,, ,2Qt, - k - 1) s /C0-;)
^
(ez.ro - 2.36b x T.4T x JlrtTT ,37.30 + 2.36b x 7.47 x ,f2tnn)
(-43.80: 118.40)
Par-a 6i:
(U, - t^r(n, - k- 1) srldrr; b1 I tn12(n - li - l) s\/e)
Q.rv - 2.365 xT,4T x,/0.0022:r,Tr7 + 2.36b x T.4T x /lrtrnl)
(0 888r2.546) .
3. Para P2:
(b2 - t
^
2(rt - k- \
Je 22: b2 + t,, t(r t, - k - t) s t/en)
s
1
Si se dcsea conocer el intelvaLo cle colfi,anza meclia cle un punto en palticulal uT1t
iI)
t2t . , ., Lpkt definitnos el I'ectol
xp
ip: xlpb'
IJstc cstiruaclor es insesgaclo (cs ,i..i', o (%) : x|r1) )' stt rrtt'itttzt cs
/^
lir-to'2(tt-A' i,, * tn,('tt - fu - 1) 5\ x,,(XX)-1x,,
\ )
IJn tnoclelo de reglesin se aplica eu la r-eaiizacin cle ploncisticos collcsponclientes a rrrlor-es particulares
clc las valirb1es incleperrdientes, xn. Lzr respncslr en cste ltuut,o es jr: yt.
te rrrrlo clc con fianza cle ni \e.I 100(1 - a)'7n Pu r la plccli cctot)1 ?/2
( j, - t,,,2(n' -l;-1)s I
xf (XrX t, !lt - l; - l) 'V 1+ xj,(XX)-Ix,,
340 Captulo 77. Regresitt Mltiple
Ejemplo. (Continuacin) Elabolar los inten alos clc confirnzr al 95 % para la r-espuesta rncdia y
para la prediccin, cuando los gastos en publiciclacl son de 72 mil y en insumos 90 l.r- il dlares.
-,: (*
)
La respuesta en el punto considerado es frr, : xf,b : 348.844.
La plueba global del modelo se enplea para corrocer si existe rclacin lineal entre Ia variable dcpen-
diente y y eI conjunto de las variables indcpendientes e-1 , L2, ..., lxk.
Pre'u'ianeute, desconpolgamos la suma total de los cuaclrados SCou en dos sllnras, una debicla a IL
donde
SCE: YY-bXY,
,
/11
,)
(D'')
SCR : b,x,Y_'t-L
\i r
/I .
n
_
/ t) \-
)
/S \
I ),Yl
SCoo : YY - \':t ,tL
'/
77.4. Pruebas de lptesis 34L
qtle llos siLrten para realizar de manera or-denada toclos los pisos involllcrados en la prueba de hiptesis,
con el ernpleo de una tabla de arrlisis de la va,lianza.
En el siguietrte cuadro se resunre los elenentos dc rur anlisis cle varianza para nna regresin miritiple:
ATCR
3. Estadst'tco de Prteba. LH, obs
- A,ICE.
4. Regin de Rechazo. Se rechaza Hs si For, > L(k,n, - k - I)
El rechazo de Ilo significa qr,Le al meuos una de las variables independientes r, contribuye signiflcati-
vamente al modelo lineal propuesto.
Calculemos el tercero:
/,, \2
(I'')
\ j-1 ,3145)2
' : -ll- : 989102'5'
''
Tanrbin. se calcul que SCE:390.36. Las restantes sllmas de cuadrados so
qr q93 :
""!J!J 957
JQt - JoJ 102.5
989 fW_,U _
4854.5.
SCR : 993 566.63 - 989102.5 : 4464.73.
5. Decistn. Conio 40.02 > 4.74, resulta que se rcchaz\ la liiptesis nula y se conclnye que las
t'elttaSestnrelacionadasconlosgastosenprrblicidaclyerrinstttrros.<
Con esta prueba estadstica nicamente se concluye la validez del rnodelo, en forma global; clla no
indica Ia importancia relativa de cada una de las variables predictoras sobre la variable respuesta.
b
3. Estadstico de Prueba. tobs :
s\/e;'
1. Reginde Rechazo. Serechazalls si tob"1-t,,2(n-A-1) oo6, )tu2Qt -4, -1)
Ejemplo. (Continuacin) Eu el modelo piantc:ido, realizar la pnreba para los parmetlos 6,.
I : 0. 1,2, al nivel deI95%.
b) Pzrra p1:
3. Pnreba. tobs:
7'717 :
Estadstico d.e
-+
.5vL il
- 7'47\/0n0'n
4.9.
77.5. Coefrcientes de deterntinacin y de correlacin parcial 343
Ir Deci,si,r. Como 4.9 > 2.365, se lcchaza -I1: entonc:cs, la variable <<gastos en publicidad>>
:rporta informacin al moclclo
c) Para p2:
El rnodelo final podra scr uno en el que no se considere cl trmino independiente: y - |flt I 0zrz.
Se recrouienda al iector que recalcule tal modclo.
EI cocficiente cle detcrninacin se emplea conro rlra mecliclr clc la rdecuacin clel rnodelo, cre infortua
sobre Ia fu.erza de la relacin cxistcnte entre 1as valiablcs indepenclientes y la dependiente.
n2 scR
' Se uo .
scE
b'C rr'
Puesto cre 112 tiencle a soblcstimar cl valor de la corlelacin entre las variables involucradas, se etlplea
,:l cocficicntc dc determinacin ajustado, -R1., cre cst cliserlrclo pala conpensar el sesgo optimista cle
R2.
ot
I1,t:
t>2 ,('t1 /lrl
lt
- -
t,-A; -l
,
SCEI(n A'- 1)
-
n.?,:t- SC,,rf(rt,-l'
-1 rango de variacin de 1l"2 es 0 < ,Rl < 1y su intcr'pretrci<irr cs ia misntr ctc h clcl coeficicutc clc
ietcrnirracin nniltiplc Ii2.
344 Captulo 77. Regresin Mltiple
Como el valor de R2 es alto) se concluye que el modelo se adecua a los datos y que el 9I.96% de
la variabilidad en las ventas se explica mediante las variables <<gastos en publicidad>> v <<gastos en
lnsunos>>.
R?": n'-JJJ4;
2(1 - 0.e1e6)
: 0.9196 - r0-2-r : 0.8966.
En canrbio, si interpretarnos ,Rl, podemos decir que la calidad del ajuste es de un 90Vo. Paru mejorar
el rnodelo se podra incluir una tercera variable explicativa y comprobar si ella es o no significativa.
Por ejemplo, con k regresores, el coeficiente de correlacin parcial entre rt V 12t que se denota 112,24...k;
se define como el coeficiente de correlacin Iineal entre ;r1 1r rr2 cuando se elirnina de ambas variables el
efecto de los otros k - 2 regresores, Se calcula obteniendo el coefi.ciente de correlacin en la regresin
donde er ...t y e2,g4...k son los residuos de la regresin rnrltiple de 11 y ,r2 respecto a las variables de
control rB , . . rk.
Si tuviramos el modelo A - l3o* gpt* Azrz *e, el coeficiente de correlacin parcial de y con 11,
cuando z2 permanece constante, se define por
Tyt - Ta2Tt2
Tvr,2:
(1- r?2)0 - r?z)
donde rsrt rs2 y r12 son los coeficientes de correlacin de Pearson de y con 11, de y corr 12 y de 11
con 12) respectivamente. De rnanera anloga, se tiene
Tt2 - I'utTa2
T12,a:
(r - rl)0 -,7r)
el coeficiente de correlacin parcial entre rt y 12.
Por Io complicado que puede resultar el clculo de las correlaciones parciales, sus valores se obtienen
rnediante programas est adsticos.
Ejemplo. (Continuacin) Caicular los coeficiertes de correlacin parcial para el modelo planteado.
77.6. Regresil politrcnal 345
SoLttcin: Terrernos los coefrcientes de corrclaciri rle Pcrlsou ctrtlc lrs vuiables:
Entonccs.
0,268-0807x(-0.283) :
TuL,2 : 0.876.
/(t - (0 807)2) (1 (-0.283)2)
(t - rl2)Q -,'?z) -
I'A2 - I'aI?-72 0.807-0.268x(-0.283) :
Ta2,l : 0.955.
(r - rf 1)(r -,'?) Jtt - (0.268)2) (1 - (-0.283)2)
T72,a
-0.283-0.268x0.807 : -0.878.
(t - rfl)(r -,lr)
El pr-imer paso para escoger un rlodeio que describa los clatos, es la realizacin de un grfico de
,lispcrsiu de las observacioucs. La rclacil srrgelicla por los clrtos cs la que permite escoger un
nodelo que los describa adecuadarnente.
G
lr, Cuando Ios datos presentau un csqlrema de comportaniento curvilneo puede ser rlecesario proponer'
# ,ur modclo de tipo polinonial para los datos. As lo obsen'arros cn la Figura 11.1.
&
.il1
Veatlos, con Lul ejemplo, cmo se puede trausfolnrar un modelo polinomial en uno de regresin mrlti-
ple.
1l:00-l 7fitl0zrz*e,
c-rc esrtti tnodclo de reglcsitr rnrltiple en dos variables. Err cslc urornelto cstanr<-s err posibiliclacl cle
rplicar la teora anteriorrnentc desclita.
Otros modelos polinomiales que incluyen ms de una variable, que pueden transformarse a uno lineai
mltiple, son los polinomios en varias variables. como el de segundo grado en dos variables:
Cuando se ajusta un modelo polinornial es preciso escoger el polinomio Ce menor grado posible.
consecuentemente se debern realizar reiteradas pruebas de hiptesis, en las que se fijarn aquellas
variables que se han de incluir y excluir en el modelo final.
Ejemplo. Consideremos los datos que relacionan el nirmero de pginas de un folleto y el costo de los
insumos utilizados en la impresin de 100 e.jenplares.
S oluct n:
a) Como se observa en el grfico de los datos, stos podran ajustarse a un rnodelo de segundo
grado de la variable independiente, entonces planteanos el nrodelo A : go -l pfl * l3zn2 I e.
2
1.8
1.6
a.t'
1
j <-J'J'a --ltt'
1.2 a
1
10 20 30 40 s0 60 70 80 90
1 90 8100 204
1 80 6400 170
7 75 5625 165
7 70 4900 155
1 65 4225 148
X- 1 60 3600 Y- 140
p:
1
r
50 2500
40 1600
130
726 G)
1 35 t225 t24
1 30 900 12l
r 25 625 100
r 20 400 98
Puesto eue Foa" : 6.91, que si se cornpara con el rralor de la tabla correspondiente a Foos(2,9) :
4.26, resulta que Fob" ) Fo.os(2,0). El resultado es significativo al nivel del 5%; es decir, al
meros uno de los parmetros pr o B2 es distinto de cero. Adems, -R2 :0.605? qne en este caso
indica que la calidad del ajuste es buena, pero no lo suficiente.
Sc sugiete que el lector reaiice los anlisis con el empleo de un paquete estadstico.
trtt los noclelos tratados se emple variables independientes cle laturrleza cuantitativa; es decir, que se
:\ptsall uumricamente y son el resultado de mecliciones iustnunentales. Pero si se desea incorporar
348 Captulo 77. Regresin Mltiple
en el modelo una variable cualitativa, es necesario intloducir uariables indicadoras (o ficticias), q:ue
permiten diferenciar los distintos niveles que toma tal variable; por ejemplo, una variable X que
indique Ia estacin del ao puede ser defi,nida conro
": { ?, :l :: ;il:T:
En general, una variable cualitativa con niveles se representa mediante t-I variables indicadoras, a
Ia^s cuales se les asignan valores de 0 y 1.
Ejemplo. En un estudio para determinar Ia relacin entre el peso y el origen de ios automviles y su
consumo de combustible se escogi una muestra de 10 carros, con los siguientes resultados:
Soluc'in:
a) Se va a ajustar el modelo
a:0ol7fitl0zrzle,
donde la variable peso es cuantitativa (rt) y la."'ariable origen es cualitativa (r2), con dos riveles:
USA y Japn, que Ia codifrcaremos de Ia siguiente manera:
'I': f 0.
<
si el origerr es Japn;
[ 1. si cl oligen es USA.
r 739 8
1 1187 16
1 655 6
7 729 7
X- 1 B8B
Y_ 7
7 797 9
1 963 11
1 802 t2
1 1551 18
1 1650 20
Y el modelo estim.ado es
El significado clel tI'tlino correspondiente al origen del aulonir,il es el sigr,riente: para dos antos,
de igual peso, Lulo clc oligen amelicano y otro clc oligen .japons, cl arncricano cousluuc, cu
promedio, 3.42 litlos ms que cl japons, al rccor-r'er 100 krn.
77.8. Probletnas en la regresin mItiple 349
Pol el alto valor de 4A, : 77.66, se deduce que al nlenos una de las dos variables consideradas
sirve para explicar el consumo de combustible de los carros.
Si comparamos los valores de o," con 1s.625(7) - 2.365. deducimos que los trminos correspon-
dientes al peso y origen son distintos de cero, mieltras que el trmino constante se puede conside-
rar nulo.
Para terminar, exarninerrios los valores a.justados, conparndolos con los datos originales y el
error respectivo:
A U ei
8 7.18 0.82
16 14.97 1.03
6 6.36 -0.36
7 7.08 -0.08
7 8.63 -1.63
9 7.75 t.25
11 12.79 -r.79
12 Lt.22 0.78
1B 18.53 -0.53
20 19.49 0.51
Cor'(e) :o2(I-V)'
Para comparar los residuos suele ser ms crnodo cambiarlos de escala, estandarizndolos o estuden-
tizndolos.
s()
que siguen una ley t con n grados de Iibertad; donde s() son los residuos de la regresiu cuando
- k -2
se excluye la i-sima observacin.
Anlisis grfico
IJnavez que se han construido los residuos (",r o ) es cmodo real\zar grficos como los siguientes:
Error de especificacin
Se comete error de especifi.cacin cuando establecemos ura depeldencia errnea de la respuesta en fun-
cil cle las variables explicativas: omitimos variables irnportantes, introducimos variables innecesarias
o snponemos una relacin lineal cuando la dependencia es no lineal.
La especificacin incorrecta del modelo conduce a que los lesicluos tengan esperanza no nula y que los
estimadores obtenidos sean sesgados.
Los estirladores de los parrnetros sern insesgados, pero sus intervalos de confiattza y las pruebas
de hiptesis sern incorrectas. Sin embargo, la prueba .F- es razonablemente robusta contla Ia no
normaiidad.
Para cletectar Ia normalidad de los errores es conveniente fi.iarse en los coeficientes de asimetr'a y de
cu.rtosis. Aderns, se pueden realizar grficos Q-Q o P-P de boudad de a.juste a Ia ley nornral.
77.8. Probtretnas en la regresin mItiple 351
-::-imnte se han desarrollado modelos que consideran clue los errores estn distribuidos segn
-f,,,-
H*i -:.'l. de un nirmero de grados de libertad desconociclo) corno una generalizacin de la hiptesis
-.r - ::rralidad.
:.-,:rrente, se espera, que los datos correspondientes a las observaciones se encuentren distribuidos
lr. -:gin ms o nrenos cercana? pero puede sucecler- qne una o varias observaciones estn alejadas
.:-- - ,Le los datos. Esta-s observaciones pueden influir mucho en el modelo final.
-::cto es rnuy importante: podemos disponer de 100 obselrraciones y, sin embargo, construir
-- : ',rn modelo cuyas propiedades son debidas irrricamente a dos puntos. Conocer si este tipo cle
- -:-lLrve perjudicialmente en el rnodelo permite mc,iorarlo.
- ,,tt'os tipos de distancias que permiten la deteccirr de valores atpicos y puntos influyentes,
--, 1 con distintas propiedacles) pero todas siguen el nismo priucipio para la identificar tales
-J11eS.
iento
-:- -,tcalizado un pnnto iuttsual, se estudiar su inflnencia eliminndolo del modelo, repitiendo el
-----ento para todos estos puntos. Aqu es necesario realizrl un anlisis de la estabilidad de los
;--es de regresin tlediante pruebas estadsticas o sus iltelvalos de confianza.
L.-- se han desarrollado mtod,os d,e regresirt robttsto, clue ateniran Ia influencia de las obsen'a-
---',-.uales en el modelo o que toman como nrcdicla cstadstica sobre la cual se basa la regresiu
ur - ana en lugar de tomal la media, couro 1o ltcrnos irecho chrlarrte este tratado.
77.8, Probtrenl.as en la regresin mItiple 351
La transformacin de la variable dependiente r rrnr forrla qr"re sea ms cercana a la normal es url
recrlrso mu.y empleado. Estas transformaciones suelen ser sugeridas por los grficos de los residuos.
Tambil, se puede utilizar e1 mtodo de Box-Cox de transfolmacin potencial.
Recientemente se han desarrollado modelos qlre consideran que los errores estn distribuidos segn
una 1ey , de un nrmero de grados de libertad desconocido, colrro una generalizacin de la hiptesis
de normalidad.
Generalmente, se espera que los datos correspondientcs a 1as observaciones se encuentren distribuidos
en Llna regin ms o nenos cercanar pero pu.ede snceder cpre Llna o varias observaciones estn alejadas
del resto de los datos. Estas observaciones pueden iufluir rlucho en el modelo final.
Este aspecto es muv importante: podemos disponer dc 100 observaciones y, sin embargo, construir
con ellos un modelo cuyas propiedades son debidas irrricamente a dos puntos. Conocer si este tipo de
puntos influye perjudicialmente en el modelo permite mejorarlo.
Identificacin
La primera forma para determinar si un valor es atpico es rnediante los residuos estudentizados. Se
colnpara con los valores de con los valores crticos de una lev I con n - k - 2 grados de libertad.
Otra folma de conocer cules son los <<puntos distantes>> es a trar's de la distancia:
,h
/)? : \-
t /J
i: I,2,.. . ,fr.
.l-L
Existen otros tipos de distancias qne perniten la deteccin de valores atpicos y puntos influyentes,
cada uua con distintas propiedades, pero todas siguen el mismo principio para la identificar tales
observaciones.
Tratamiento
Una localizado r-rn printo inusual, se estudiar su influencia elininndolo de1 modelo, repitiendo el
.u'ez
procedimiento para todos estos pr-rntos. Acr es lecesalio realizrr un anlisis de la estabilidad de los
coeficientes de regresin mediante pruebas estadsticas o sus intervalos de confianza.
Tanrbirr, se ]ran desarrollaclo mtodos de reqresi,r r'obttsta que atenran la ilfluencia de las observa-
ciones inusuales en e1 modelo o que toman como mcclida, cstacistica sobre la cnal se basa la regresin
a la rnediana en lugar de tomar la media, como 1o hemos hecho chllalte estc tratado.
352 Captulo 77. Regresitt MItipIe
no es aplicablc.
Lrs consecuencias de la heterocedasticidad en el modelo lineal son las siguientes: los estimadores sern
iusesgaclos, pero dejan de ser eficientes. Las frnulrs para las varianzas ro son correctas y las pruebas
de hiptesis dejan de ser aplicables.
Identificacin
^i
una prueba de a.juste a una lev. Pala el efecto se puede realizar el contraste de razl de
clLle es
verosinilitudes, que se basa en el estaclstico
Tratamiento
1. Si la heterocedasticidad est asociada cori la valiable respr-resta y crece con e1 increrrento cle
los valorcs de y. una posible forma de tratarla es rcalizar la regresin de log g en lugar de y.
Este caso suele aparecer cuando hay una forrnulacin errnea del modelo; por ejcrnplo cuando
el moclelo real. es r-nultiplicativo y se a,justzr rncdiante rrno lincal.
s-
dorrde, al cliviclir todos los tlminos pol' z/r, los lesicluos e* - tendrn valianza constantc.
Este procediniento es equivalcnte r utilizrr rlninos
",,u,lr,rdnrfencralizrclos.
77.8. Problernas en la regresitt rnItiple 353
11.8.5. Multicolinealidad
El los ploblemas de regresin mrltiple, algunas veces. dos o ms r,ariables independientes contribuyen
con iriforrnacin redundante, porque se encucntrrn bastante correlacionadas ertre s. En los casos
en que tal correlacin sea alta, se dice que existe rmt,lticol,ineo,Iidad. Por ejemplo, se desea formar
r.rn modelo para predecir el precio del metro cua<hado de tielra en Lln sector de la ciudad (g), como
funcin del ndice de irrflacin ("r) y del precio clel cllar en el mercado libre (r2). Aunque las dos
va,riables aportan informacin, es conocido qne las dos -"ariables independientes estn fuertemente
colrclrcionadas; por 1o tanto, ia informacin pol ellas aportada es redundante o se traslapa.
En este caso, J.a matriz XrX es casi singular. originando clue sea difcil encontrar su inversa.
clondc r
cs el coeficientc de colrelacin entle las dos variables. As, si aumenta (en valor absolu-
to) lzr correla in entre las variables explicativas. aumentarn las varianzas de las estimaciones y su
dcpeldencia.
Identificacin
Si un-L variable es combinacin lineal de las restantes variables. se debe analizar Ia matriz R-l. As.
sr: define el <<factor de inflacin de la varianza>> corro cl z-simo trmino de la diagonal de Ia matriz
Rt:
FIV: diagr (R-1) .
Por tanto, eiernentos diagonales glandes (mayores a 10) en la rnatriz R-1 indican alta colinealidad.
rnx{)i
nn {)}
Err La pr'ctica se adrnite clue existe alta multicolinealidad cuando el IC es rnayor que 30; una colinea-
iiclad modclada si el IC est entre 10 y 30; y, cnando el IC es merlor que 10 se considera que la rlatriz
est bicrr clefinida.
354 Captulo 77. Regresin MItipIe
Tbatamiento
11.8.6. Autocorrelacin
Una de las hiptesis iniciales para desarollar el modelo de regresin es que los errores, i) son variables
aleatorias no correlacionadas. Si esta hiptesis es violada, se dice que existe autocorrelacin.
Los efectos de esta dependencia son los siguientes:
Eu el caso de un modelo lineal simple, la varianza del estimador de la pendiente resulta ser
')/
var(b) :- !' -l,1_,rDit':-t)
'^/
D,? \' D"? )
'
.
2
Si p > 0, la varianza puede resultar sustancialmente mayor que $5,ri cle rnanera que el estimador es
ineficiente. L
Identificacin
Tbatamiento
Para explicar Ia evolucin de variables que tienen r.rn comportamiento en el que aparece autocorrelacin,
es conr.eniente utilizar mtodos del anlisis de series de tiempo, que permiten abordar de rnanera rns
global el problema de construccin de modelos para estas r.ariables. Tambin, se pueden utilizar
mtodos especiales de regresin) colrro los mninos cuadrados generalizados o los modelos lineales
generalizados.
Por Ia dificultad que entraa la realizacin mannal de los clcr-rlos, especialmente en la determinacin
de los potenciales problemas que el modelo pudiera prescltar, sto se hace mediante el empleo de pro-
lramas estadsticos especializados) que facilitan su clculo, correspondiendo al usuario la interpretacin
correcta de los resultados.
EI lector deber notar que los temas tratados aqu solo cubren la parte central del anlisis de regresin.
Existen textos especializados que lo tratan de manera detallada y en extenso. (Vase Rawlings y otros,
200 1. )
11.9. Ejercicios
Modelos de regresin mltiple
13bo*2b1-2b2 : 4
2bo*2bt-bz : 2
-2bo-bt*4bz : -1
a) Resuelva el sistema de ecuaciones y encuentre el estimador b de coeficientes. Escliba
explcitamente la ecuacin de regresin;
b) trscriba la forrnulacin nratricial del problema;
c) Si YY:6, encuentre s2;
d) Calcule los coeficientes de determinacirr mrltipl" R2 y arjustado Rl e interprtelos.
llna empresa de transporte ha tomado una m,uestra de los pesos de seis ernbarques, ia distancia
transportada y el gasto que erl ellos se ha incurriclo:
a) Estime los coeficientes B6, 0ty Fz del modelo de regresil lineal nltiple:
b) Use el nodelo para predecir el gasto cuando el embarque pesa 2.4Tm y se lo transporta a
1200 krn;
c) Calcule e interprete el coeficiente de deterninacin urirltiple y el coeficiente dc determi-
nacin ajustado. Conente los resultados.
Captulo 71. Regresin MItiple
Un economista est interesado en Ia relacin quc cxiste cntre Ia demanda de viviendrs, su precicr
y el ingreso rnedio anual de los hogares. Si denoniinrrlos por y Ia denanda de vivienda, medidtr
en unidades adecuadasi z1 al precio pronedio de las vivicndas; y, 12 el ingreso familiar promedio.
Los valores de estas variables se recogieror] para 6 periodos y se muestran en Ia siguiente tabla:
Periodo ?l :x7 r2
1 8 72 6.8
2 I IL) 7.2
12 1 74
4 I T4 77
a
r) 12 l4 7.0
6 15 l5 7.4
a) Asumiendo que el modelo de regresin es lineal rnltiple, estime los coeficientes Bs, 0t y 0z
y sus intervalos de confianza corresporrclientes (rrse g5 %);
b) Calcnle R2 y RZ. Intelprete los valores obteniclos;
c) Construya la tabla ANOVA y realice ltr prueba de adecuacin del modelo;
d) Use el modelo para realizar la estimacin y la prediccin de la venta semanal de un restau-
rante que ser instalado con una capacidad de 150 asientos y se espera que ingresen 1400
clientes.
5. De una encuesta de presupuestos familiares se han obtenido los siguientes datos rnensuales:
a) Construya interprete un modelo par-a explical el gasto en energa elctrica en funcin del
e
ingreso familiar y el tamao de Ia familia:
b) Caicule los coeficientes de deterrninrcin (mirltipie y ajustado) v la varianza residual;
c) Constluya un intelvalo de corfiauza corr nivcl 95 % par-a el efecto de Ia variable ilgleso
farniliar;
17.9. Ejercicios 367
6. Sear las variables: .L : latitud en grados, A : altura en metros sobre el nivel del mar y 7:
ternperatura media anuai.
L tt ,4
J(J.9 JJ.Z 31.3 29.5 26.8 26.5
A 722 145 195 124 t07 r30
T 139 14.9 16.4 77.2 18.0 18.0
b) Prevea Ia temperatura media para Lrra ciudad cuya latitud es 30.5 y la altitud es 150 m;
c) Calcule los coefi.cientes de deterninacin mriltiple y a.justado;
d) Realice la tabla de anlisis de la r.arianza e interprtela;
e) Contraste la nulidad de cada uno de los parrnetros de Ia regresin e indique si es posible
encontrar un modelo mejor que el plariteado.
En un estudio sobre la relacin entre tres varia,bles se cibtuvieron 11 mediciones con los siguientes
resultados
11 11 11
fi:1 11 : 66, D
i:7
r?o : 506, )--
i.-I
r19 : 85,
11 11 11
\-
Zr r"'
: -22, Dr3o: 484,
Drr,rn: r42,
,i:l t-1 i-I
1t 11 11
Regresin polinomial
10. En una entidad bancaria las tasas efectir.as de inters varan de acnerdo al monto del prstarno
que se concede) ya que se incluyen gastos administrativos e impuestos que cobra el estado. Para
encontrar un modelo, se recogieron los siguientes datos, de varios prstamos concedidos:
a) Grafique los datos ;' postule un rloclelo de regresin para los datos;
b) Ajuste los datos mediante el modelo de regrcsin de a);
c) Realice una prueba global de adecuacin del modclo;
d) Pruebe si los trminos individuales del rlodelo pueclen eliminarse.
11
t.t. Los datos que se presentan a continnacin corresponden a1 tiernpo de secado de un balniz y la
cantidad de cierto aditivo qunico anadido:
Cantidad de aditivo ( g) 1 2 ,) 4 5 b 7 B
Horas de secado B5 80 60 50 6.0 tt
(J r, n.5 7.0
a) Use el mtodo de ajuste a un modelo polinomial de segundo orden para modelizar los datos;
b) Realice una prediccin para e1 tienpo de sccado, cuando se han aadido 6.5 gramos de
aditivo qumico;
c) Calcnle los coeficientes de determinacin R2 y RZ e ilterprtelos.
12. En ttn estudio de la contaminacin por gases despcclidos por ios vehculos en las calles de Quito.
se midi la concentracin de plomo (en ppm) en cl aire y se registr la temperatura ambiente
(en "C) el momento de la medicin.
1D
t,) Sc cree que en ciertas enlprcsas cxiste discrirninaci<il scxual cn el trabajo y quc se paga ms a los
hombres clue a las mr-rjeres cuando rerlizan el misrno trabajo. Los datos de la tabla corr-esponden
a los aos de expeliencia, el sexo y 1u..11klrrs arrttales (err miles de dlares), de empleados que
tienen las misrnas funciones en 9 empresas dc consultor'a.
l.l Err lrna erl]presa que se dedica a la transpoltacin cle triristas, se sospecha que el constuno clc
c-:ornbnstible de los autos dcpende dc la aritigiicda<l clc stos y clel scxo cle crieu los c<l<lucre.
Para probal esta sospecha se r-ecogi la siguientc infonrrciriri:
Los siguientes datos corr-espon<lcu al tierrrpo d< sobrevirrerrcir, en horas. rle uuas ratas luego crt:
se les suministra cierta closis de veneno. En ci expcrinrernto se consicler 2 tipos de r.eneno (A I'
B) y la edad de la rata.
Edad (rneses) t 2
._)
J 4 1 2 3 4 2
D
()
Veneno A A A A B B B B A B
Sobrevivencia 45 8.2 63 7I 36 49 4.4 5.6 67 5.0
360 Captulo 77. Regresin MItipIe
Prrr cl anlisis cle las serics de ticrnpo existen varios cnfocres, ninguno de los cuales se puede decir
cllle es mejor clue los restatttes. Nosotros nos lefe-,-iremos al urs simple) qlre cs el de identificar los
pr-irrcipales factores qllc pal'ecen influil en los valoles inclividuaies de la misma y examilarcmos los
mtodos de prediccin que se agmpan bajo el nolrbrc genrico dc mtodos de suavizamiento o cle
aterruat:in.
L2.L. Introduccin
Pala cl anlisis de ttua valiedrd de fcnrlenos fsicos, econmicos o fi.nancieros disponcmos de una
cierta cantidad de observaciotres de una lrismr variable aleatoria numrica, tomadas en norncntos
ecluiclistantes; entonces, los datos analizados tienen plopiedades interesantes aigunas de las cuales las
vanlos a presentar.
Prinrero, definamos lo quc se ctrtiende por serie de tienrpo (c1uc tambin se denomina como serie
ltistrito. r serie cronolq ico,).
Defirricin (de serie de tiernpo) Una scrie dc ticmpo cs un conjunto de datos que estn
orcleu'rclos en el tietlpo y cllre lian sido tomados a intervrlos ecluiclistantes en el tiempo.
361
362 Captulo 12. Introdttccin a las Series de Tientpo
Si Ias observaciones de un fenrneno se han realizaclo a trars del tiernpo, es posible qrle preser]-
ten escluemas qr-le se repiten peridicaruente v que las obscrvaciones contiguas sean) probablernente.
dependientes.
A las series cronolgicas se las representa mediante diagramas de dispersin (grficos X -Y) donde las
observaciones se representan en e1 eje de las ordenadas y lar variable tcm.poral en el eje de las abscisas.
La r'rriable tiempo () es la variable indeperrdiente.
1. La variable tiempo (), que tomar \ralores en los entelos positivos: t:0, I,2, ..., n.
_a- La variable de las observaciones (Y), que 1a supondremos dependiente del tiempo: Yo, Yr, ...,
v
Para realizar el anlisis, en primera instancia, se aplicarn los rntodos tradicionales de la inferencia
estadstica para modelizar los datos y corocer la bondad del ajuste realizado.
Desde el punto de vista tradicional, los componentes de nna serie de tiempo son: la tendencia secular'.
y los conponentes estacional, cclico e irregr.rlar.
De los conponentes que afectan a los valores individuales en una serie clololgica, el ms inportante
es, getreraltnente, Ia tendenc'ia secttlar (o llamada sinplemente tendencia), que se define corlo el
mor.imiento caracterstico de crecimiento (o de declecimiento) a largo plazo de la serie. Por eso, Ia
tendencia solo se pu.ede determinar si se dispone de datos de la serie en Lrn periodo largo de aos.
La tendencia es la direccin subyacente (hacia arriba o hacia abajo) en la serie de datos, a largo
plazo.
Las ftterzas bsicas que producen o afectan la tendencia son: los cambios en la poblacin, la inflacin.
el ca,mbio tecnolgico, el incremento de Ia productividad y los ciclos de vida de los productos.
Para la modelizacin de este componente se ritilizan modelos lineales, polinomiales y otros. EI mtodo
ms simple, y ms ampliarnente usado pala describir- la tenclencia es la regresin lineal sirnple y las
transformaciones que pueden hacerse hacia este modelo. As, la tendencia puede ser lineal creciendo
a una cantidad absoluta constante a lo largo del tiempo- o puede ser exponencial, creciendo a una
tasa constrnte a lo largo del tiempo. Alternativamcnte, la tendencia puede ajustarse a un polinonio
o otlo modelo ms cornplejo.
El coupouente estacional de la serie es un patrn de carnlrio qlre se repite legularmente err el tienrpo.
Este movimiento debe courpletarse dentro del pcriodo de un ao y rcpetirsc, de rranera semejante ao
tras ario, a fin de consicleralsc un cambio estacional. As. ptrla identificar el conponente estaciolal cn
una scric histrica, es necesario recopilar los cltos para rrrils cle rrrr pelio<lo de un ar-ro.
Por eiemplo, si considerarros Ios registlos dc clemrncla clc liabitacioncs er los hoteles de los sitios
tursticos ms visitados, dnr-ante el ario. En los r]rcses rlc vacrciorres clc los regmer).es escolares de
la Costa ), de Ia Sicrra se procluce rlrayor derlanda cllle cn el lcsto cle mescs del ario. As, los datos
presentarn rrariacioncs estacionales) con Lula rllarcAdr tendeucia a aurtrentrr, durarrtc los pcriodos
sealados.
\{ientlas que ia tendencia se rttiliza pala la plalificacirr a largo plazo, el anlisis del componente
estacional dc una seric histrica tienc implicaciones a cor-to plazo, ms innieclirtas.
Las fluctuaciolles estaciolales sc preseltan tpictrniente err los clatos clasificados por rneses o trimestres;
Io clue conduce a qlre se deba crlcular Lln valol estacioual por sepalacio para cacla rnes (o trimestre)
clel aiio, por Io general en la folma de un nuler'c1 rrclicc.
Etr la Fignra 12.1 se grfica tura seric con collportalrierrto cstar:ional. La variacin estacional se
reprcsenta nrcdiaute .D.
Los coupouentes cclicos sc asctrejan a los estacionalcs erl que trmbil son movimientos ondulato-
rios lepetitivos, pero difieren erl que 1os rr.ovimielrtos son de duracin ms prolongada y sotl menos
predecibies en cluracin y en amplitud.
Un ejernplo dc variacirr cclica se presenta en el plecio clcl petrleo, que cll las rltirnas dcadas ha
tenido periodos largos de crecimiento sosteuido, segr.riclos cle perioclos cle fuelte cada.
El componente irreguiar puede deberse a fenrlerros como un clima poco usual, huelgas, guerras,
elecciones y cambios el las leyes, o por los errorcs qne se corneten al realizar Ias mediciones.
El principal uso de las series de tiempo es la realizaciu de pronsticos. En este captulo nos con-
centrarenros en Lrn conjunto de tcnicas de pronsticos conocidas como m,todos de atenuo,cidn de las
series, qne son fciles de implernentar y no requieren cle tcnicas matemticas sofisticadas.
Las tcnicas de atennacin o su"auizamtento se enplcan para reducir las irregularidades; es decir, las
fluctnaciones aleatorias) en una serie de tiempo, proveyendo una visin ms clara del comportamiento
subyacente en la serie de datos.
En algulas series cronolgicas la variacin estacional es tan pronunciada que no permite apreciar la
tendencir o los ciclos, que soL muy irnportantes para entender el proceso observado. El suavizamiento
pu.ede rerrover Ia estacionalidad y hace que las fluctuaciories a largo plazo aparezcan ms claras.
Adeurs, con frecuencia, el analista quiere actualizar los pronsticos diaria, semanal o mensualnente
de manera rpida, barata y sencilla, eso se puede lograr mediante los mtodos de suavizamiento de
los datos.
Las tcnicas ms cornunes son el suavizamiento por prom,ed,i,os m,ui:les y eI suaui,zami,ento erponencial.
Cono el tipo de estacionalidad vara de serie a serie, as debe variar el tipo de suavizamiento empleado.
Estas tcnicas se basan en promedios ponderados cle rnediciones anteriores. La explicacin consiste en
que los vaLores pasados contienen informacin de 1o que ocurrir en el futuro. Debido a que los valores
anteriores incluyen fluctuaciones aleatorias, as como informacin relativa al patrn subyacente de la
variable en estudio, se hace un intento de suavizar estos valores.
Ventajas
Precisin aceptable (pcro de ninguna lrlauera cxactitud total) en una amplia variedad de apli-
ca(:10tles.
Desventajas
2. No pronostican los pr,rntos cr-ucialcs, cu.ariclo ha1' '1m1,ius bluscos en cl patrn de los datos.
5. Pucclerr presentar problcmas tcnicos en 1- sclcccin del moclclo corlecto y en la seleccin de Ias
coustantes de snarrizamienlo.
El mtodo ms simple e intuitivo es usar el pronredio sirnple, consistentc cl cncontrar la media arit-
n'rtica cle todas las observaciones y tisarlo para pronosticrr el siguiente peliodo; es decir,
Vr.
1)''
rt+I : t:l
<>
?1,
Este ntodo, en gcneral, tiene una validez muy lirnitacla ya qr-lc es aplicable cuando 1os datos no
I)r'esentan tendencia, estacionalidad u otros patrones sisterntic<ts.
Ejemplo. En el Cuadro 12.1sc presentan las observacriorres qne corrcsponden alas ventas trimestrales
de una errpl'esa en el periodo 2003 a 2006.
El valol del pronstico puede parecer bzrjo ya clue cr1 los plimeros trimestres de los irltinos arios las
tentas fucron nayores que el valor pronosticaclo. Adcnis. si deseamos un pronstico para cada uno
clc ios trimestres dcl arlo 2007, no podcmos hacello. Vclrros que el mtodo propuesto es insuficiente
pma nucstros propsitos.
En tnuchos anlisis, 1os clatos clue prcsentan nlt\or intcrs sorr 1os nrs recicntes ya que ellos darn
lnayor informacin del actual estado del proceso que aclut:llos drtos que fucron tornados al inicio del
tnismo. P'Lra realizar sto sc puedc cralcular el pronreclio para lrs observaciones ms recientes. AI
cstar disponible una nlle\a observacin, se puecle calculu' r-lna nlieva media eliminando el valor rls
arrtiguo e incluyendo el rls recientc.
Prra describir este cnfoquc sc emplea el trrliuo rrorucrlio (o rur:dia) rnvil. Entonces, se usa est,e
1-rlon-iedio mr.il prra pronosticru el siguiente pclioclo.
366 Capttrlo 72. Introduccin a Jas Series de Tientpo
Ao Tbimestre Ventas
I 1 598
2 2 390
.l
3 267
4 +1 ra,
J/()
2004 1 5 588
2 6 425
3 7 371
1 8 609
2005 1 I 777
2 10 32
J 1l 433
4 \2 689
2006 1 13 855
2 t4 618
L) 15 460
4 16 720
Cuadro 12.1: Datos correspondientes a las ventas tlimestrales de nna elnplesa.
doncle
As, el promedio urvil para cl periodo es ir rnedir aritnrrl ic:r <lc las r obser\raciones ms recientes.
Obserrrcmos que el nittnero de perioclos que iuter\:ienerr clr cl cilculo dc nna media mvil palticuiar
no ciurbia al correr del tiernpo. Porsto, es inrportzrltr: cscoger ci nrrnero de periodos ??r qlre scl
clenoruina su orden. Para datos trimestrales es frecucnte clue se utilice rrn plomedio mvil de ordeu
4 y para clatos nensuales un promedio mrril <le orclen 12: cs clecir. se ernplea el misrno orden de la
estacionalidad dc la serie.
Ejemplo. (Continuacin) Realizar cl pronristico. urercliruttr nrcclirs mciviles. cle los clatos del Cuach'cl
72.7.
Solu,cin: Como los datos estn clados en forra tlirlestr'rl tonralemos una media mvil de or-clcl 11.
720+460+618+855
: 663.3.
Entonccs. para el primer trimestre del ao 2006 se espcr'r tener urr nivel de ventas igual a it :
663.3. Si comparanlos con las obsenaciones clc los riltimos airos, cl valor del pronstico es mucho ms
lazonable que el anteriormente obtenido, per-o persiste el problema de Ia realizacin de pronsticos a
mayor plazo.
72.3. Atenuacin de series de l,ienrpo 367
Pronostico de
Ventas Plomedio
Ao Trimestre t Y, rnovil, ?,
1198
22390
33267
44573
2003 15588 457.r
26425 454.5
t1
I Jf I 463.2
48609 489.3
2004 19777 198.2
2 r0 532 545.5
3 11 433 572.4
4 t2 689 587.7
2005 1 13 855 607.8
2 14 618 UT.J
3 15 460 648.8
4 16 720 655.6
2006 117 663.3
Cuadr-o 12.2: Pronstico mecliante pr:omeclio mvil.
Daclo que NIr:?r+t, se Lrsa esta nueva serie para calcular un segunclo conjunto d.e promedios
mviles:
: AI I A[-1 + A'[t 2+ "' + A'I;,,+t (t2.2)
^rl
3. Se calcula Ia diferencia entre los dos promedios rnviles:
at:2AIt AI (12.3)
y ttu factor de ajuste adicional, similar a la medicin de una pendiente que cambia a travs de
la selie:
,
b,: ;t_ tQt, - tt',) . (r2.4)
Y+y,:cr"lb1P, (12.5)
Ejernplo. (Continuacin) Realizar el pronstico, con la tcnica de la prornedio mvil doble, de los
:latos del Cuadro 12.1.
-\ continuacin se exponen los clculos para compr-ender el pronstico del trimestle 17.
368 Captulo 72. Introduccin a las Series de Tiempo
Promedio Pronstico
Periodo Verrtas Promedio mvil Valor Valor a+ W
t YL mvil doble de o de b (p: t)
598
390
267
tr73
457,1
588 454.5
42 463.2
37t 489.3 466.0 5t2.5 15.5
609 498.2 476.3 520.1 14.6 528.0
9 777 545.5 499.1 592.0 31.0 534.7
10 532 572,4 526.3 618.4 30.7 623.0
11 433 587.7 550.9 624.4 24.5 649.1
72 689 607.8 578.3 637.3 19.6 648.9
13 855 627.3 598.8 655.8 19.0 656.9
1.4 618 648.8 617.9 679.8 20.6 674.8
15 460 655.6 634.9 676.3 13.8 700.4
16 720 663.3 648.8 677.8 9.7 690.1
17 687.5
Cuadro 12.3: Pronstico por promedio mvil doble.
2. Una vez que se ha realizado el suavizaniento por promedios mviles simples de toda la serie se
emplea Ia ecuacin 12.2para calcular el segundo promedio mvil de cuatro trimestres:
3. Se usa Ia igualdad 12.3 para calcular la diferencia de los dos promedios rnviles:
El pronstico para el primer trimestre del ao 2007 es d,e?17: 687.5, que puede parecer ms razonable
que los dos resultados presentados anteriormente.
72.3. Atenuacin de series de tiempo 369
El rntodo plomediar los rralorcs anteriores de una serie, haciendo esto de forma decreciente,
se basa en
zrsigrrtruclo nlayor peso a las ms recientes. Las ponderaciones empleadas se designan cotllo a (0 <
rl < 1) para la observacin rns reciente, a(l - a) para la siguiente ms reciente, a(1 - q2 para la
signierrtc, y as sucesiva[rente.
?r*r:aY+(1 -.)?,,
clon<1e
i,*r : rme\o valol atenuado o valor del pronstico para el siguiente periodo;
v: colstante de atenuacin (0 < a < 1);
Uua mejor interpretacin de Ia ecuacin que define el suavizamiento exponencial se puede ver en la
siguiente dcscomposicin:
error (n - ?r\
r- antelior lfr)
\-'/ '"*" "'"..'^ \- -')'
Lr ttcrrtracin exponencial es sirnplemente
"- el
.-^ pronstico a veces el
"rr
ert el prortstico auterior'.
La coustante de suavizatlieuto a sirve como el factor para ponderar, El valor de cv determina el grado
llastr el cual 1a observacin ms reciente influye err el valor del pronstico. Cuando rr es cercano a 1,
ett el rruevo pronstico Ia observacin ms influyente ser Ia rns reciente. Inversamente, cuando a es
cercallo a 0, en el pronstico influirrr todas las observaciorres de rranera similar.
IJn rntodo para estimar cr consiste en encontrar aquel valor que minimiza el error cuadrtico medio
(ECM):
17
t
. ',
(r -?,)
ECM: t:I
1
11,
para diferentes valores de a. Para generar pronristicos firturos se clige el valor de a que prodr.rcc el
cr-ror ms pequeo.
370 Captulo 72. Introduccin a las Serjes de Tientpo
Err la siguiente tabla se preseutan los clculos clc los valores dc las ponderaciones para dos valores cle
o, En clla se puede observaL cmo influyen los valorcs pastrdos cr los pronsticos, en dependencia de
a.
a:0.1 a :0.6
Periodo Clculos Ponderacin Clculos Ponderacin
t 0.100 0.600
t-I 0.9x 0.1 0.090 0.4 x 0.6 0.240
L_: 0.9x0.9x0.1 0.081 0.4x0.4x0.6 0.096
!t
l,-L) 0.9x0.9x0.9x0.1 0.073 0.4x0.4x0.4x0.6 0.038
Los lestantes 0.656 0.026
Total 1.000 1.000
Solucin: Los resultados se presentan en el Cuadrc 12.4 con r.alores de la constante de ateuuacin de
0.1 y 0.6.
La serie atenuacla se calcula asignando iniciahnent r, ?, : 598, que cs el primer valor observildo, a
continnacin Los clculos se rerlizan de Ia siguiente ntaDera:
El cllor-de pronstico es
e2 : Y2 - ?, :3g0 - bg8 : -208.
?n : oY16l (1 - *)a
: (0.1)720 + (0.9)576.5 : 590.9.
Con sinrilares clculos, para una constante a:0.6 el pronstico del periodo 17 es?y:650.2.
Para definil cul de Ios dos plonsticos es el ms aceptable, se puedel comparar los errores cuadrticos
nrcdios cle lrs series.
Primero, conviene que tengamos en cuenta que debido a qlle los valores de la serie no son pronsticos
en s rnismos, Ias ecuaciones de actualizacin son ms comprensibles si se adopta la siguiente notacin.
-1. coltinuacin se pr-esentan Ios clculos correspondientes para el pronstico del periodo 17.
372 Captulo 72. Introduccin a las Series de Tietnpo
2. La ecuacin 12.7 se usa para calcular el valor doblemente suavizado exponencialmente (columna
4).
A','u
: .',&;J;; ;,, B:571 0
3. En la colunna 5 se calculan las diferencias entre los valores atennados exponencialmente, me-
dirnie Ia igualdad 12.8:
4. Con la ecuacin 12.9 se calcula el vaLor rdicional cle a.iuste (columna 6).
brc: ,L (Y
-
=(A,o-Aio)
0.1
(590.9 571.0) :2.2.
U 9
-
5. Finalurente, se empiea Ia igualdad 12.10 para hacer el pronstico en el futuro:
2 Se estima la tendencia:
Tt : 0 (A, - Ar_t)+ (1 - p)Tr*t. (r2.12)
donde
La primera ecuacin es similar a la igualdad original de atenuacin exponencial simple, con excepcin
de que se incorpora el trmino (") para la tendencia.
En la segunda ecuacin se toman dos valores sucesivos de atenuacin exponencial, ya que ellos se
atenuaron con fines de eliminar la aleatoriedad, su diferencia constituye una estimacin de la tendencia
local de los datos. Se atena esta tendencia con la constante B y se le suma la tendencia anteriormente
calculada multiplicada por 1 - B. EI valor obtenido es una tendencia atenuada que excluye cualquier
aleat oriedad.
La ecuacin del pronstico suma el nivel actual de los datos A y el producto de la tendencia T por
los p periodos.
2. La estilnacin de la tendencia:
Tz: 0 @z -
Az_l) + (1 - 0)Tz t
: 0.2(535.5-598) +(1 -0.2)0: -r2.5.
?t*, : AzrPTz
: 535.6 + (1)(-12.5) : 523.1.
1. Actualizacin de la seric:
Arc aY16 t
(t - r) (Arc-t +
"ro-r)
0.3(720) + (1 - 0.3)(625.8 + B.e) : 660.3.
2. Estimacin de la tendencia:
u*'
: !;;!?{^o)(1): 6T4s
72.3. Atenuacin de series de tiernpo 375
La atenr-racin por el mtodo de Winters es apropiada cuando la serie presenta una tendencia lineal
y una variacin estacional. Es una extensin del rnodelo de Holt, en la que se utiliza una ecuacin
adicional para estimar la cstacionalidad nediante un ndice estacional.
2. Se estima la tendencia:
Tt:0(Ar-At_t) +(1 - p)Tt_t. (12.15)
Se estina la estacionalidad:
c,- Y'
^,i*(1 -r)5-. (12.16)
donde
-L : longitud de la estacionalidad;
)i+p :
?.
proristico de p periodos en el futuro.
Ejemplo. (Continuacin) Realizar el pronstico, mediante el rntodo de Winters, de los datos del
Cuadro 12.1.
Para comenzar los clculos, verios que la longitud de la estacionalidad es -L : 4 y que se requieren las
estimacioncs inicialcs del valor atenuado, de la tendencia y cuatro estimaciones de la estacionalidad.
Para principiar el proceso de clculo, usaremos 598 como valor inicial de la actualizacin, 0 cono el
vakr de la estirnacin inicial de la tendencia y 1 como la estirnacin de la estacionalidad.
Analiceuros los clculos de los periodos 2 y 17, utilizando los r,'alores de a: 0.3, P:0.2 y ?:0.1.
376 Captulo 72. Introduccin a las Series de Tiernpo
1. Clculo del valor de la actualizacin de la serie. Para iniciar el proceso tomamos At : Yt, Tt : 0
Y Sz_,+: I:
A2 :
"3J24 + (1 - o) (Az-t -t Tz-t)
: o tfS + (1 - 0.3)(5e8+o) :53b.6.
2. La estimacin de la tendencia:
T2 : 0 @z - Az_t) + (1 _ p)Tz_t
: 0.2(5355-598)+(1 -0.2)0: -t2.5.
3. La estimacin de la estacionalidad:
1. Actualizacin de Ia serie:
2. Estimacin de Ia tendencia:
3. La estimacin de la estacionalidad:
a) De un periodo en el futuro, p : li
u*, : (1ro + Trcp),9ro-+r
1614.41 + (-1.6e8)(1)l (1.04) : 637.2.
El mtodo de Winters presenta la ventaja sobre los otros mtodos en que podemos realizar pronsticos
por ms periodos (por lo menos por un ciclo completo de estacionalidad).
Hemos expuesto varios mtodos sencillos de pronosticacin de series de tiempo. En este punto surge
la siguiente inquietud: cul mtodo ernplear?
Primero tengamos en cuenta que no existe un mtodo qtle sea el mejor en toda ocasin. La eleccin
del mtodo depender del conjunto de datos que se disponga y de la finalidad de los mismos.
La comparacin de las tcnicas de atenuacin se realiza rnediante el error cuadrtico medio que, como
.va se indic, se calcula por
n
2 t
t (t'-Y) >,"7 ^r2
t:7
ECM: tl
I
donde e es el error de pronstico para cada una de las observaciones de la serie. Entonces, podemos
enunciar la siguiente regla:
lAquel mtodo que proporcione el menor ECM ser el ms apropiado para la serie de tiempo que
lse analiza.
Ejemplo. (Continuacin) Para los datos del Cuadro 12.1 veamos cul es el mtodo ms apropiado.
378 Captulo 72. Introduccin a las Series de Tiempo
Solu,ci,n: En el siguiente cuadro se encuentra el resumerr de ios rntodos analizados con su ECM.
Mtodo Parrnetros ECM
Promedio mvil simple 20826.2
Promedio mvil doble 24834.8
Suavizamiento exponencial cv: 0.1 27 902.7
Suavizamien to exponencial a:0.6 33 991.3
Suavizamiento exponencial doble a:0.1 29 547.4
Mtodo de Holt a : 0.1, D
t): 0.2 31634.7
NItodo de Winters a : 0.1, a 0.2, 1 : Q.1 54548.9
De los resultados, aparenternente, el rnejor mtodo es el prornedio rnvil simple y el pronstico basado
cn l sera el apropiado.l
Respccto a Ios parmetros de suavizamiento debemos indicar que ellos siempre varan entre 0 y 1.
Para cada constante de atenuacin, cuanto mayor sea su valor, tanto mayor importancia se le dar
a la obselvacin ms reciente. Tngase plesente cre la mayora de Ios programas estadsticos que
disponcn de estos mtodos tienen implenentados algoritmos que escogen automticamente la combi-
nacin de parmetros que dan el ECM mnimo, lo que permite tener una estimacin apropiada a las
observaciones disponibles.
Se aconseja al lector que implernente las frurulas de los dir.ersos mtodos en una hoja electrnica, lo
que Ie facilitar la realizacin de los clculos.
L2.5. Ejercicios
1. Eu una academia de idiomas se sigue un sisterna trirlestlal. El nrmero de alumnos que estudian
el idioma esperanto en cada trirlestre, durante 4 aos, se resume en Ia siguiente tabla:
Las ventas trimestrales de casas que ha lealizado una cornpaa inmobiliaria en Ios ltimos aos
se presenta a continuacin:
Elementos de Muestreo
Pot'un per1ue,o ltcrl,o,zo tl,e tn,u.estru. pod,e'nr,os .ju,zqa,r a Lo" piezo, r:otn,'pleto,
Miguel clc Cervantes Saavedra
Ilstc ca1>tulo csti dcdicaclo a cxponel los mtoclos bsicos cmpleaclos cn lrs invcstigaciorlcs pol'
rrrLrcs'iLco. I)elo rlo solo en Io ciue tiele cluc vel con 1a par-te estaclstictr, tambin se clatr algtttrtrs
inclicaciorres par'r la realizrcin pr'cticir cle los sonclcos.
En las irivcstigaciorles cllyo objertivo cs la lecopila<:in c1e infonnrcin cslrrlstic sobrc rrn glullo cle
1 Lr cncucsta total o censo, cuvo objeto cs cruninar a toclos los eienrcnbos dc la pobiacin.
2 La cncuesta palcial () l)or- ruuestreo. cluc tir:nc por objeto examinal uua partc pequcrla rle la
poblacin, e infelil rcsullaclos pala aplicar'los r 1a poblacin conplcta.
Acrr apaleccn clos conccptos rluc fi'ccucntcncntc rrtilizalernos: la poblacitr (o univcrr-so rnucstlal) y Ia
rrrlostr t.
Dclinicin (de poblacin) Unir 1;oblacirirr cs rulr c:olcc:ciu cornplirlir clc pclsorts. uriuralcs,
plrrrt:rs o cosls de las cnrles se rlesea rccolccttl cltos.
Definicin (de muestra) Es un grlrpo de rrni<laclcs sclcccriourrlas <lc un grupo nrayor (la
pobltrcin).
En ilnchos casos la clcccin clc un:i mtLestr'r cs ficil: pol ejerlplo. prrl conoccl la plopoicicirt r.Ll
<lespclclicio cll llrl srco cle maz o parr colloccr cl nrinrclo cle piczars clcfcctlLr-slLs cn un lote clc plodlLtt,.-,s.
381
382 Captulo 73. Elententos de I\[uestreo
etc. Bastu mezclar bien los ploductos )' tourar ttna pcclttetia paltc cle ellos. Lo clue se deduzca de
cstir pecluea polcin (o muesir-a) ser-vir pala ,juzgar a la totalidad clel producto.
Par'r conocerla preferencia clc Llna rrarca de gaseosa por palhe dc los corrsumiclores, o el tiempo que
Iu poblacin declica a mirar Ia televisin o cl favoritismo por cicrto particlo poltico entre los votantcs,
cs rns complicaclo. Los elementos son ms hetelogneos )'serr imposible aplicar el mtodo clesc-.-ito
pala tomal una mnestr-a, como se hace con los plocluctos.
Aunque Ia muestra poclra tonralse corno Lul subcorrjunto cr.ralcluicra cle la poblacin, en una iuvcsti-
gacin es necesario que cr-rrnpla cor ciertos requisitos. parr c.lc rros pro\ea de inforrnacin colfiable
sobre Ia poblacin. La mlrestla ira de ser Llrla rcproduccin cn peqneo cle la poblacil. As. ha de
sel' nn Ecuador, un Guayas o un Quito en ruiniattua, si se tratr cle ul sondeo relativo al Ecttador, o
l:r. provincia clel Gr-rayas o a la ciudacl cle Qr-rito.
Pcro. cmo hacer para qlrc lr mncstra sea una copia. cn pcc.rco, de la poblacin? La respttesta cs
qrrc ln rluestla debe cstal coustituida por uu. nrmelo suficicntc cle elernentos, tomados al azi'tr', clc la
poblacin.
Pala lr correcta eleccin de la muestla, el] plirrel lugal cs necesalio hacel nna lista de los ob.jetos cle
lr c:ual se la seleccionar', hrego se proceder a sortearlos para incluirlos clr la nruestra.
Definicin (de unidad rruestral) Los objetos que se scleccionan dc una poblaciu se llauran
Luriclrdes mnestlales.
Definicin (de marco muestral) IJn malco muestral es nlla lista courpleta dc todas las uriclades
rnuestrales de la poblacin.
Por ejemplo, se desca conocel las prefer-encias electorales de toclos los rniemblos aclultos de Ia ciudacl
clc Arnbato. La poblacin esti constituida por todas 1as persorras cn capacidacl cle r:otal que viven eu
Ambato. El marco uruestlal es una lista complcta con los nolnbres de cada miembro de la poblacin
(cl pachn electoral). Una uuiclad uruestral cs tin residentc cr. Ambato y qnc cst crr capacichcl de
r.otAt.
Obselveuros que IIo siemplc cs posible tener nn lllarco rnuestlal pelfectameutc clcfinido) ya scr polqrle
st,c es urtty glaude) o l1o cxislc, o rlo se lo pucdc colfcccionar', \{1s arn, solo cr-ranclo la poblacirr cs
pcqrtcria o coutt'olablc por cl invcstigador, es posible corrtar con Lrr. rnarco muestral ideal. Preguut-
nronos: quiu podra clabolal nna lista de toclos los individuos, o dc toclas las falnilias, que vivcu cri
Grrayacril?
Anl-cs cle telurinal', tcLretnos cre t'cferirnos a las convcnicncias y a las liruitacioncs cle las rnneslr'rs) con
lcsJrecto a la reilizacin clc Lut cjenso.
1. Si se necesita ilfornacin cle todos los elenentos qrre conforman el ruriverso estadstico.
A corrliurracin expondrclllos ios plincipirlcs tipos cle iln'cstigrciorrcs pol rnrrcsl-r'co, qilc sorr cl alertoricr
sirnrlc. el cstrrtificirdo ' l clc conglornelados.
La mar-ora de sondeos tienc uno cle los tr-es ob,jetivos siguientcs: cstinal cl total poblacional r, o
c.stirn,r la mcclia de nna poblacil p, o cstimar la plopot'cin pol-rlacional p.
t:fu:Nt,
r.:1
Pol ejemplo, cn Ltra cncltcsl-l lcilizadr los grrstos cri salucl clc los habitantes clc uua
palr,L csbirrrrl
cir.iclacl. se investigara cl gersto mcclio por pcrsona, l, que lcalizan cn Lrn arlo; o tzrrnbin, ltucde scl cle
intcr's cl gasto tobal, r, cluc sc rcaliza en dicho pobiado por corccpto cle salucl.
Donrlc:
7 es el prornedio de la m.uestra.
s es la desviacin estndar de la muestra.
Q
zo2 eI coeficiente de la ley normal estndar1 para el cual el rea en el extrerno superior es igual a-
2
Tamarlo de Ia muestra
La cantidad clue hay que sr.rmalle o restarle a un estimador, en la coufeccin del intervalo de confianza,
se denomina error. En nuestro caso
De aqu, si se desea tener una estimacin al nivel (1 - .) x 100 % dc confianza, con un error E" dado.
a partir de una muestra obtenida de una poblacin de tamao l/, el nrmero de unidades a incluir en
el sondeo es
(r*21{ r)2
n] + (2,,z)' Nr'
trjernplo. Una empresa de telefona celular desea estimar el tiempo total que se emplean sus lneas
errun fin de semana. Se seleccion al azar una muestra de 420 clientes, de los 62000 que haban
hecho uso de sus telfonos y se registr el tiempo de uso. El tiempo proneclio y la desviacin estndar-
de la muestra fueron z:3.61min y s: 1.2Bmin. A un nivel del 95.5%: a) obtener un iltervalo
de confianza para el tiempo total de uso de ios telfonos ese fin de semana; b) Considerando una
desviacin estndar de 1.25. calcular el tamao de la muestra para qne el error sea menor o igual a
20 000 minutos.
Soluctt:
a) Para este ejemplo, ly' : 62 000, n: 420, T : 3.61, s : 1.28 y zo.ozzs:2. Entonces,
i : Nr: 62000 x 3.61 :223820
El intelvalo es
62 000 x ooo x
(,,,r,, -, 1.28
;223 B2o * ,62
\/ 420
1 '28
4N2 s2
'" E? t 4l\t s2
4(62 oo0)2(7.2q2
:60
(20 000)2 + 4(62 000)(1.25)2
Intervalo de confianza
Tamao de la muestra
El tamao de la muestra necesaria para tener rln error prefijado Er, a un nivel de confianza de nivel
(1 - r) x I00To, a partir de una poblacin de tamao Iy' es:
( :^.,,\2 N s2
,,_
NEu_\rq2)r"2.
Ejemplo. En un estudio ndico sobre el consumo de tabaco, por la poblacin adulta, en una ciudad
de nn r-nilln de habitantes aclultos, se consult a 120 personas. Los resultados de Ia investigacin
mostralon ttn consumo promcdio diario de 3.8 cigarriilos, por persona, col] una desviacin estndar
de 1.1, a) Deterrninar cl intervalo al97% pala el lrmeLo promedio de cigarrillos que se consumel; b)
A cuntos individuos ha de consultarse para que la estimacin del nrmero medio de cigarrillos quede
a rnenos de 0.3 del valor verdadero?, si se considera un nivel de confianza del g5 %.
Solucin:
I 000000
'--" - 720
--".o o n1n 1.1
-'' 1 120
r 000000 t/tzo
(3.8-0.22;3.8+0.22)
("o2)2 N 12
N E'zt, + (r*/r)2
"'
(1.e6)2 (1 ooo ooo) (1. i)2
:51.6
(1 000000)(0.3)2 + (1.e6)2(1.1)2
Este caso es, probablentente, el ms empleado en las investigaciones de rnercado y en los sondeos
polticos; as, frecuentemente se encuentra en peridicos y revistas datos como stos: el 70% de la
poblacin rechaza la decisin del gobiemo de aumentar el precio de los pasajes, o un 45 % de los
consumidores de gaseosas pr-efiere urra marca determinada.
Intervalo de confianza
Donde:
Tamao de la muestra
El tanrari.o de la r-iruestra necesaria para tener nn error prefij ado Ep, a un nivel de confianza del
(1 -.) x 100%, a partir de una poblacin de tarnao l/ es:
":ffiffi
Como nuchas veces se desconoce la estimacin f, se toma el tamarlo mximo de la muestr-a, que se
obtiene haciendo F: l: 0.5; entonces,
Qot)2 N
"
to:-
4N EB - (rntz)2'
Ejemplos
EI intervalo es
(u - ,^,, lf I z,,,lz
17:
Q^p)'tvlQ
I\r Ei + Q"d2f Q
: 207.6.
Q*t)'l'l
4Iv E3-r Q^t)2
(2.33)220 000
: 370.
4(20 U00)(0.06)2 + (2 33)2
Este segundo caso provee el tamao mximo de la muestra, igual a 370 hogares.
Una federacin de transpot'tistas pelmite clue ciertos gastos de sus afiliados (gasolina, iubricrntes
v lavado) se hagan mediaute Ia utilizacil dc la tarjeta de crdito expcclida para el pago en las
gasolineras locales. La ernpresa ha expedido 10 050 tarjetas.
Para realizar una investigacin sobre la utilizrcin cle la tarjeta. Se realiz nna encuesta pre-
lim.inar de 90 tarjetas y se encontr que 63 de ellas fueron utilizadas para pagar servicios en el
rrcs en referencia. Se determin clue el total de gastos cancclrdos con las tarjetas fue de 23 900
dlares y Ia desviacin estnclar- de 60. Se clescr detelminal el tamao de la muestra, con un
error del 2Voy una confiauza det 95.5% para estimar': a) la proporcin de afiliados que utilizan
Ia tarjeta; b) el gasto promeclio mcnsual cancelaclo con Ia taljcta; c) De los tamaos rluestrales
anter-iores, cul se aconsejara?
Solucin: Se tiene que ly': 10050 y rz:90.
rr) Calculemos toclos los elementos previos: t: #:0.7, ?:0.3, Ep:0.02. De aqu,
, .').,^^
lz..lt)'1\pQ
t{ Ei + Q"p)2fA
4(10 o5o)(0 7)(0.3)
: 1737.
(i0 050)(0.02)2 + 4(0.7)(0.3)
388 Captulo 73. Elententos de Muestreo
23 900
b) El gasto promedio de las 63 tar,jetas es dc r: : 379.37.
ti3
El error es de -8, : 0.02 x379.37:7.587vs:40" El tamao de la mllestra, es de
t- rl rv
n^2
\ ol: / 5
n:
-\'E? + (:^,"\2 s2
c) El tamao ptirno cle 1a m,uestra es de 1737 tarjetas, puesto quc es el mavor valor calculado.
13.3. Ejercicios
Se quiere estirnar cuntas balas se gastaron en Llna prctica de combate en la que intervinieron
8000 efectivos. Para tal efccto, se ton una mucstra de los registros del nrmero de balas
empleadas por 115 militares participantes, resr-rltando un promedio de94.7. Adems, en prcticas
sinilares, se ha medido una desviacin estndar c1e12.7. Para un rivel del 97%:
t
J. Ura empresa de alquiler de fotocopiadolas desea conocer el total de copias que sus clientes
lealizan en un rnes. De sus registrosr que indican que la enpresa tiene alquiladas 280 mquinas.
se seleccion 33. En stas cncontr que en Lrn nes se realizaron un promedio de 1228 copias.
con una desviacin estndar de 193.
trl dueo cle un restaurante de$ea onocer e1 consumo meclio cle los clientes de su negocio. De
entre las 1469 facturas correspondientes a las vcntas que tnvo la rltima semana seleccion, al
azar-, a 119. En e1las deterrnirL un gasto promedio de 4.5 dlarcs y una desviacin estndar de
0.93 dlares.
1r) Deternine cl tamarlo clc la mr-restra prla cre cl clr-or ser. rnorlol' a 270 cllales cn Ia cstilrrcin
del total;
c) Realice el intelvalo cle confianza, de nivel 99 %, pala el consumo tobal semrnal en el r-estalr-
lante.
0 En urr estudio clc nelcaclo sc tom nna mncstr'r cle 34 pclsolls cle clrsc rneclia. cluiencs inclicuon
c.re gastaban 48 cllrlcs rncnsuales eu clivclsiorres) coll clcsviacirr cstirrclar clc 1.76 cllales. Corr
rurr confiabiliclrcl clcl 98.5 %, halle:
ir) cl tzrmario mucstlal rnnimo para lcalizal el mismo esturlio crl Lln grLlpo sirnilal cltte cttcntar
con 5000 pcrsorlas, si cl lmitc palir la estimrcil clel cllol cs igual a 0.5 cllar-es;
lr) cl tamao mucstr-rl mnimo para cl totrl clel gasto pol cl glnpo de estuclio, si el luritc palzr
el error dc cstimacin cs cle 1500 dlales;
c) cl intelrralo clc confianza pala la meclia rlcl gasto, si los valoles clel gasto promeclio y cle Ia
clcsviacin estnclar se manticnen en 48 S, I.76 cllalcs, r'cspcctivrrmentc, y se encuesta r 67
pelsonas.
7. El gcrcntc de lcculsos hnmanos quiere estimar cl nrmer-o rueciio y el total clc horas anuales cle
cntrcnarniento pala los 280 cmpleados de una divisin de la compaa. Toma informacin cle
los lcgistlos del ao rntcliol cle 35 empleados y obtiene un promeclio cle 125 y una desviacin
cstrnclar-dc 20 horas de cerpacitaciu anual.
rr) CalcLrle los iltelr'rlos clc confianza, ttl 99.7ya, perla la nlcclia )/ cl tottl cle hor'rs enil>lcirrlirs
cn cntreuanicnto;
b) Corr Los datos urtcliorcs ), si la estimacirr cle ia meclir hr clc cstar ir t4.5 holas clcl r'rlor'
tcrclaclclo, o lr cstirnrcin clel iotal hr dc cstar a 41700 lrorts clcl valor r.crdaclelo, cu:il cs
cl tanarlo mucstr'rl rcclueliclo?
n) Si cl rtrmelo cle xitos fr.re de 40, calcule un intervalo cle confianza al 95.5% pala la propor-
cin clc xitos;
l>) Flallc cl tarnao cle lr nucstla pala clue el crrol mximo sca clel 6 %, cnplcanclo ia ploporcin
ruuestlrl hallada plcviaruente;
c:) ILillc cl taltairo nrixinro de la muestla, si no se tiene infolrnacin plelirninal clc ll proror
cin.
'.) Err itn cstrLclio sobr-c tncrlios c1c conrunicrcin sc cluicre cstinrrl la llorolcin dc los cslucliaut.cs
<.[c urt colcgio sccr-tuclrt'ii-r <tc rniLau legrrlalnrcrrtc las noLicirs. Eutlc los 3100 cstucliurl"cs clci
t:r>lcgio sc cscogiclon r 250 pr.r'r. (lue lesponclan Ia plegnnta. De stcls, 76 irrclicalorr cluo'llLir'ur
lrs nolicirs. Palr un nivcl dc confianzr clci 98%:
1r) fi.jc cl tamLricr tle lr tlLtcstla ueccsalia pul tencl un cllor'rncliol al 5% si, (i.) sc tonrr cl
valoi rlc 19cstirrlaclri rrnics. (ii.) si uo sc ticuc iclczr plcvirr clo lr ploi)orcitiu.
10. lll Sr. \/ugrs cst.rL Perrsirrrclo Post,ularr r lrr rlt;rl<lr clc Pclilco. Alrtcs clc folriralizal srr cirLrliclltlrr'r
<lccirlc lcalizrl unr crr'',ircstir clc orinin cn l locrliclrcl. Dll c-.1 c;rutlr hay 12 000 rolcrrciirlcs
clcc:torcs y sc rcaliz iurr L)-imela cousultr a 270 pclsonirs, clctocttinciosc un U)oyo clcl 30% clt:
los posibles elcctolcs.
390 Captulo 73. Elententos cle Mttestreo
ir) EncuentLe un intcLvalo de confianza aI gT 01, pzrrer la plopolcin dc votantcs que lpovarztn
al Sr. Vargas e intelpretc cl lcsultado,
Como el Sr. Valgas no estaba segluo de los lesultados de la pliurer'r consulta, decide contratar
a una errrpresa para que reaiice uu segundo estudio. La emprcsa i,rdica que Ia encuesta tienc
u.u costo fijo cle 5000 c1lales urs nn costo rrariable de 4 dlalcs pol czrda entlcrista. cunto 1e
costar- cstc tlaba.jo rl Sr. Var-gas si l qrrierc r('ner nn clror clc 4(% c'on nna confiabiliclad dei
98 %.
11. Urra empr-esl clc asesc.r-a poltica ha sicio crntrafLcla pulir clelclrrinal lr. populalidacl
cle uu
candidato L alcalcle clc una ciudad cle 215 000 habitantes rclultos. Eu ttn soudeo realizado cou
215 posibles votantes legistr un nivel de erceptacin del 34 % pala el poLtico.
a) Halle un inten'alo de conliartza al 96.5 7o para la proporcirr rlc sinpatizautes del candidato:
b) Si se quisiera lcaiizu otr-r cncrrcstr utilizando 1a ilfoln'rciu clispolible, eticttertire cl
tamao mximo dc la muestla a utilizal para crc ci c1'rol scr clc 0.03;
c) Si se collocc crc ci cancliclato, histricarnentc. tenrdo una accptarcin de alrededol clcl
hr
40 %, encncntlc cl taurario clc Ia rnnestltr a cmplealsc.
12. Pala efectos clc plane:Lcin econmica en la provincia clc Cotopaxi cs necesalio realizar un estudio
cntlc 2200 hatos ganacleros. Una cncuesta piloto alroj las siguicntcs estinaciones:
Prorneclio clc vacas por hirto, 46 y clesviacir estrrclar'. 2[J.
ll.cnclinienbo plonrcclio c1c lcchc por hato: 345 litros y r.ariarrrza rlc 9700.
DI 6A% clc los hatos tienc un r-enciimiento neclio cle iechc supcliol a 250 litros.
Con un errol del 8% r una coufi.arrza ctel 95.5%, cletclrnilLe los ttrru-ros de lrs irlllestrIS si se r,'t
r estimar-:
Lr seleccin de la muestra
Los proccdimicntos cxpuestos cr. csta scccin se basan en e1 principio cle cluc las rlnestr-rs clebtrri
colstitnirse pol elemenios tomacios al azar'. clc; suclte cre cacla.t",,r1r1.o cLc la poblacir, l,ergiL 1lr
r.Iisurt plobabiliciaci cie figulal en ia mncstr'r. Solo rs slzr pnedc lcplcselt rl a lr pobl:Lcirr, reploclr.rci r'
fielntcrttc los clirrersos calactelcs y cluedal soureticlr rr 1os Proc;ccliruielrlos t:sLrclsLicos clesclitos.
Dutonccs. nos plantcamos el signiente ploblerrizr pr'c;lico 'l soir.rcionu: hlllal nn rnedio clc rrsegnlarrsc
clc tre toclos los elementos cle la rnucstlLr seur tourados al rrzu.
l-er'icrmcntc. no hrbla problerla r-rlgnno. En u.na irrvestigacin icleal clispolcmos del malco ulLerstr-al,
,rs srbr:mos cuntos y cluines son trlcs clenrentos. nicanrclte habr'a cprc sor'lear'los y los favolcciclos
scr'arr irLcluiclos err iir irntcstla. llasta rrntcs clc 1zr 1-rollrlarizrcin clc lirs c:outprri-aclorits lr selcccil clc
ii..s l'llrcstlas sc realizirbt ccn cl crnPlco cl<: tlblas rle uiuneros rlct,oLios. l}r llr acl,Lirrlidacl r-'sia tlrc;l
73.4. Mttestreo aleatorio estratifrcado 391
la ayuda de plcigrarlrs informticc-is, eu los cnaies hay courrnclos especiales qlre BerreraII
se lctlizr corr
nirrnclos aleatorios y facilitan la seleccin de la muestra.
Sin embargo, no siemprc se puede realizar la extraccin de la ntuestra de Ia nanera descrita, ya sea
porcFre la poblacin es bastrnte glande y Ia localizacin de cada elernento elegido es muy laboriosa
o t)orcLr(.r cl rrrrrcr. rrrucstr'ri lo cstri brcrr definiclo. Ptrla srtper'rt'las clificultacles se han ideado otros
rri(:l,orlcs tlc: rnuestlco. (lue r r:rntinrracirr los velcrri()s.
LIn ploceclimiento adoptado par-a superal estos ploblemtrs es el cle fornal :u:na m'uestra estrat'ificuda
v al rzar'. Segrn este mtodo, sc subclivide la poblacin en varios grupos, llamados estro,tos, cada
nrro clc los cualcs debe'ser internamentc horlognco. En crcla cstrato, se cscogen al azal las unidades
rrruest,r'ales a inr-estigar. corfio ya se explic: es decir'. para cada estrato se aplica tnuestreo aleatolio
sirnl>1e.
Los estlatos pueclen fornrarsc paltiendo dc divisiorres geogr-ficas (provincias, ciudadcs, centros urbanos
Y mr'rlcs, etc.) o bicn del sexo clc las personas. su eclad, la profesin, el nivel socioeconmico, etttr-e
ot ros.
Lrr lazn clel crnpleo de estc ntodo reside eu el hecho de clue pelmitc obtencr', gencralnrente, resultados
rrrirs pr-ecisos c.re aquellos qucl se colsigucn cou cl mtodo alcrtolio simplc. Sin embalgo, es ttecesar-io
couo(icr' 1r cserrcia de crcla cstrato prr'r ploceder', en cada uuo dc ellos, -L la eleccirr al aztr dc los
clerrrrrrtos rle la rlnestra.
Al igr-rni clue hicimos en ir scccin anteriol, examinar-emos los crsos cle cstimrcin clel total. la mcclia
'n' Ia 1-rlt.,1-rorcirr pobia.cionales.
Suporrgarnos crc se clivide a lir poblaciu el .I est,ratts. crcia uuo clc los crrales constt de l elernerttos
(t:on ri :I,2,...,K), pollo clue ly': l{ri/z+".+A/( Dentlo clc cacla estlato elegilettros tt;
clcmentos crc constibuir-l la rnuestr-a.
(\-.)
l)onclc
,s; es ta valianza cle 1os clrlos cle la muestla en el estrato i, 'i : I,2,. . . ,I(.
') t
ro el:l tian]
trLl atICdo
Cr Ila oo llllt,restre I cie: los ? es peqnerio con respecbo r1 tanrrlo cle los estratos ly', lt-r, frnrulr
SC L'eclluc
Llce a
I i-
lr
.t\ )
"a/2' ? + zo2
Dri=
\
EjJel
E. llTlrplplo.t. LcOS clilec di
d ectlrtiros c1e LIIl. centl'(o edncatir.o desean conocer' el gasto total de los padres cle
Ier.Ini
Ie rili LArenrir tiltles
r ES escol
CS lrles. Pl
el )o1rr rla facilita
I r 1r investigacin se clii'idi r los tlumnos segiur su nivel. err
l)r
l)rc 'ep
rpli iur
I lio
ItIl' xi nli
,Lil
, I)l 'io
ralio
tla y
))SCtscc :tutcl io.
clu'i Un a tabla resLrrllen cle cmo se cstrbleci Ia muestr'r v los <latos
ltl
1i
r l lacl
1it l1 os) f
SC CXrh
:hi be I conti
CO rtin[raccint.
NIVtrL
Preplimalio Primalio Secunclario
No. cle aluuuros (Ar) 1569 832 647
Trmario mr.Les ilal (r r.
) 767 72r 95
Gasto promedio (dlaLes) (7;) 88.4 131.6 97.0
Varianza mucstral (s]) 525 468 700
A urr nivel clcl 95.5 %: a) Enconbrar el erLor rnrrestlal en la invcs[igaciu; b) Construit' cl inten'rlc., clc
r:orfi\rLzr perla cl gasto total clc los padres clc farnilia del plrrntcl.
E, : \.
.^,.,1f r't(N;-rr;\ si
\ 'v /.
6 910 295 + 2287 008 + 262632I: 6880.
lf ntolccs. sc cslima quc cl gasto tobi-il cn ritiles csc:olalcs, clc toclos los pachcs clc familir esti
cntrc los 304070 .1,-- 317830 cllalcs.
I t'"'' -
I
\
Cr.r'urcio cl lrnrao nrrcsir'l<lc los ?j cs pccluerio col respeclo al trruao clc los cstratos A,la f'rrttulr
sc r'cclLrcc lr
zo12
,:ol')
-^/
Ejcrrrplc. Una empresr cllrc rcrliza cstudios dc lr ru<licncir telerrisir'r dcscrt cstiurrl el tierrrpo medio
rlc: lroirs ciir.r'ias cllrc pasar frcltc al telcvisor'las frrnilias. ori urr carrt-rr cspci:lrco. Ll errprcsa diviciiir
lr zon clc cshuclio en ulllan;r y r:nti-ri y sc cscogi<i urLr lnrestrr clcl 2 pol rnil; es clecir'. 2 de cacla
rnil funilirs clc cacla hlcir pcrtcncccrhrr t ir mucstr'r. Con los clrtcis lcsumiclos elr la siguiente ttrbla,
circrrerrtrc rur inter-valo clc confialza rl 97.5% pi-lr'a cl tiernpo mcdio cluc cacla frrlilia pasa frcntc a lzr
( c.lcvisiolr.
Jc,r : (AtrJr+-\rrr2)
: |
_____ ,,, :
____ _
r ,+ 796)(2 93) + (42 188)(1 46)l 2 35
10f; 9s I"
Conrc, cl tarlarlo cle las submucstlas, eu cacla cstrato. cs pccrer1o con lclrcin rrl lcspectivo totaI rlc
t lcuIcrr[os. clrrplerremos 1r frurtila apioxirlacla
.- i).l2;.
39,1 Captulo 73. Elententos de -N4tresr'eo
Por tarrto,
Eutonces. el tienpo urcclio c1r.rc cacltr Irmilia girsta fientc r la Lelevisin cstri cnLlc las 2tr 13 miu r,- 2]r
29 rnin, aproxirlaclalncntc.
cle confia nz-L tl (t - ct) x l00r/o pirla lil ploporcil poblacional 1., cs
^. J.)
Z ct/
-
"'- lv
Dorrde
fi,"t
I .-^ i
: *(N,
/v it Ntf , +'..+ l/r,'lrr) : *r iiI,,',4,
i,-l
Cttallclo cl tamaito lnttcstriri clc los ?i cs pcquerio con tesllccto rl Lanrao clc los csblaios AI,, la frmtrla
sc tcclr.rcc tl,
f 8
--'----= rl)cst.
, zol2
tN
'tL
- L
Djemplo. Rcfilirtclonos al cjcmplo rrutelior', en trl estuclio tambin sc plcgunt si las frrnilias nilrilrn
regnlartneutc uua telcttovclr clacla. Las plopolciones uruestr'rlcs clc cpricnes tienen prelelcricia poi c.i
citrclo ploglaura sc clrn cr-r la siguicntc tabla:
llstirrrr lrt ptoporcill t[c toc[',s ]its f',rLuilirs crr cl cLnl-l (lllc rnir'u lr, tclcrror'<:lr. Usc I - cv:0.(t2:5.
73.4. Mttestreo aleatorio estratifr,cado 395
i",t:
1
(; lr.:.rIl\ t Lpl
\Y(sL Lp\1'sl (0 2097 - 0 0625;0 2097 - 0 0625)
(0.12172;0.2722)
i)ttsto qlrc cn cl mioclo clc csl,irrtificacin se folman r'rrios gr"l-rposr se acostuntltltr ir fijat'cle anteuratro
,rl rLivcl clcl crlor', clc rcrtcirl.o r -'slc sc cstablecc cl nrinrelo clc clcniorrl,os quc c:onst,i brrirn la rluestrir v
1r-Lcgo sc cletclrrrina cnirul-os clc clios sc iisignarn r carlr cstrrLo.
Sclrr , A'2, . . ., A'/i los clcrncriLos ilclLriclos cl crtlr cstLirl.o, srr slunt cs igual ii ,l/, cl tolal clc li'L
-\I1
lrolrlirciiirt Sc sclccciorar. j ,'t12, ..,,'n.ti clcnicrtos, tornrclos al lzar, clc caclr cst,r'ato. Tcnclicrrios
'/?
tlric cl totrl clc ltnicliclcs clc la trtncstla es '/ == ?t1 * 112]_ .. .* rr. Ntrestro ploltlcura seti c]etetrnirLal
el 1.rmiro cic Ia urttcstla v ci iir'ulcr'() clc uLriclacles qlre sc consrrlfar'n cl cacla csilabo.
Lrrtt'r ia rsiguacil clc Jn',rrtcsi:', sc rLtilizr nno clc los siguientcs 3 urloclos'. er1'u,i,tat'iu(L) pt'o'lorc,i,oretL s,
1;,: lttli,,t, inttn! (r! r' -' ,,,
A si gnacin cqrritativa
E;l lr fblna clc asignircirr crliiitltivi-, crt ctclt utro rlc los cstr-itos sc invcstigii cl nisnro ntimoli.r ciLr
clcirrcnt os.
,)'I ^t,"i
ii
L -\ -r {: .;: )'-\,'.'
't- I
Captulo 13. Elernentos de Muestreo
Una vez fijado el tamarlo total de la muestra se seleccionan, al azar) eI mismo nlrrero de unidadcs
muestlales en cada estrato. Este nrmero de unidades se calcula por:
,ro:
#, i : r,2,.. ., K.
Observacin, En este y en los siguientes casos se debe tener presente qlre en el caso de la estimacritili
cle lar proporcin Ia varianza se calcula mediante t? 0). : i -
Si en una investigacin se han generado submuestras de igual tamarlo, podr'a suceder que los estrat<;s
pequerlos estn sobrereplesentados, mientras aquellos con muchos elementos estn subrepresentados.
En la asignacin proporcional, la rluestra est constituida pol Lrn nrmero de elementos, en cada
estlato, proporcional al tarnao de stos, con relacin al total; es decir, los estratos [rayores sern los
clue tendrn subrnuestras de nayor tamalio.
-- n
rlr' : -A/r
__ ?l
llc' : -Ay'c-.
'N',
-. 'N',
Eri el nuestreo con asignacin proporcional el error es mnimo, pero por razones de economa o de
facilidad en la recoleccin de los datos en el sondeo, pudiera ser mejor no hacerlo de esta nanera.
Supougatlos que la poblacin a cxaminar est dividida en dos grandes estratos. Si el priurero de ellos
agllrpl a personas muy homogneas entre s, con lespecto a la calactei'stica que se considere, bastar'i
con intelrogar a Lrras pocas personas para dedrrcir, con Ia plecisin snlicieute, la magnitucl cre str
invesbiga. Si, por cl coutratio, el segr-rnclo estrato est fornaclo por personas hetelogneas, ser pleciso
iltcllogar a un nirmero rrajol' para obtener resultados que snpoilgan la misma exactitud que en cl
primel caso.
/ I{ \2
Q^/)2 (,e nt",)
I(
E2N2*("^/)2Dlr,17
i:L
Prr' r'crlizat- Ia zrsignacin clc los bamar'ios de las subrluestras sc ploccclc clc la siguiente lnancl'l:
73.4. Muestreo aleatorio estratifi.cado 397
1. Si s1, s2 , ..., sK son las desviaciones estndar de cada uno de los estratos. se determina el valor
? definido por
K
? : ly'rsr * l/zsz +'.' + ly'<sr : INrrl,
i:1
2. Con sto, Ios tamaos muestrales de los estratos se calcnlan as:
A n
n1 : l/1s17. A lI
nz: NzszT
n.
nI( - NNIKT.
En el siguiente cuadro se expone un esquema de rnuestra estratificada segn los criterios de asignacin
cquitativa, proporcional y no proporcional.
La rluestra con asignacin no proporcional est formada por un nrmero de elementos, en cada estrato)
qne supone dar un mayor peso relativo a los que presentan una mayor variabilidad. Por ello, el estrato
A, annque incluye eI 40% de los elernentos de Ia poblacin, figura en la muestra final con el tnismo
tamao que el ltimo (el D), que nicarnente comprende el 10 % de la poblacin total. Esto es debido
a que la variabilidad del estrato D es el cudruplo de la que tiene el estrato A.
tlna vez establecida la cornposicin de Ia muestra se proceder al sorteo de Ios individuos a ser
entrevistados) que por lo general se lo hace bajo el criterio de la no reposicin; es decir, qtte un
elemento de la muestra no puede ser consuitado ms qrle una sola vez.
Ejemplo. Para los datos del ejernplo sobre el tiempo promedio diario que gasta la poblacin viendo
la televisin) que a continuaciu se resllme:
Considerando un error de 0.1 h, a un nivel de confianza del 95.5%, deterrninar los tamaos mlrestrales
v de las snbrnuestras mediante asignacin: a) equitativa; b) proporcional; b) no proporcional.
Soltt,ci,n: Se tiene que N:106984, E:0.1 y zoo22s:2.
K
K(r*/r)t D x?'?
,j: I
K
E2N2i("ul)2DNo"?
i:1
:297 '34.
298
La muestra total es de 298 familias. En cada rea se consultar a 149 hogares.
2
398 Captulo 73. Elernentos de Muestreo
K
N(r,/r)'D N t?
i:l
K
E2N2*("*lz)2DNlt?
i:r
106 984 x x (64796 x 0.77 + 42 1BB x 0,58)
22
:277.3I.
(0.1)2 x (106 984)2 t 22 x (64796 x 0.77 + 42I88 x 0.58)
Qo/il' (*"')
n: K
E2N2i(r./)2Dru,"7
i:r
z2 x (a+796 x lotl + 42188 ,. u658)' :276.
(0.1)2 x (106 984)2 t 22 x (64796 x 0.77 + 42 188 x 0.58)
Calculemos el denominador T:
7: ly'rsr i N2s2:64796 * t/Of + 42188 * r/OS : 88988.
u : 1/rsr3
T
: 64796, Jolz " 2
88988
: 176.4,
n2 : Nzsz::
'T', 42188 . r/058 " :2:
88 988
99.7.
Lamuestradeberestarformadapor177farniliasdeIazon.atrrbanav100delazonaruraI.<
En esta seccin solo se presentaron las formas de fijar Los tam.aos muestrales basados en infornaciu
estadstica. Existen otras forrnas de realizar tal determinacin, tomaldo en cuenta los costos de
efectuar la investigacin, los costos fijos o el costo unitario de cada toma, stos no los expondlemos.
El estratificado es el rntodo ms utilizado por Ias empresas y entidades que se ocupan de realizar
sondeos, con adaptaciones prcticas que tienen en cuenta los costos y las posibilidades reales de la
investigacin.
Antes de la confeccin de la muestla conrriene tener en cLrenta, ante todo, los fines de la investi-
gacin y las caractersticas de Ia poblacin que interesen de nodo particular, y que pueden tener ttttt
impor bancia fundamental en las conclusiones qne se daru.
5. El rrivel edncativi-r.
6. El nivel socioeconlnico, cntle otros.
Pua files pr'cticos, el r-eldadelo y adecr-rado sorteo, en cada estrato, es frecnentemente impracticable
o inrplica gastos excesivos v pr:dida de tiempo. Por ello se recllrre aI nttoclo de las cuotas, cte
colsistc en asignar un cierto nunero de entrevistas qrie se deberr lealizar en cada estlato (cuotas), pol
crcla entLcvistador.
Compcte, entonces, al encalgaclo de la entrevista elegir al azar las personas clue han de ser interro-
grrclas c1cntro dcl nbito de cada cuota que Ie ha sido asignada.
Para disminuir, las distolsiones que callsara la falta dc alertorieclacl en estc mtodo, las eurprestrs
snelen urnentar la fiabilidad de sus estudios mediante el <sobremuestreo>>, o sea la realizacin de
nts encuestas qtle el nirmero oliginalmente planificado, as se collpensara e1 aumelto del error antes
iutroducido.
13.5. Ejercicios
, Par'restablecer rlrl sistema de s-rbsidios cn el consnmo de Ia cncrger elctrica se hizo una invcs-
bigacin por nrlrestreo cn Ltlta cindad. Se dividi a los hogales scgirn su nivel socioeconmico
(NSE) y se tom una muestra de\2Va. Los resultados se rcsrlnerl a continuaciu.
Suponga qlle sc clcsea lealizrL otro mnestreo en el clue se lendr un error en la estimacin de la
media de 3 dlares. Determine los tamarLos muestrales en cada estrato si Ia asignaciu se realiza
rnediante:
c) asignacin eqr-ritatir':i:
d) asignacin ploporcional;
e) asignacin no proporciorral.
3 En un sondeo para cieterninar el gasto anual de la poblacin de una cindad en arreglo persontrl.
se clasific a los consultados segrn sn sexo. Los datos se rl)uestr-an a continuacin:
SEXO
\.{asculino Femenino
Timro del estrato 2500 2300
Tamarlo mnestlal 250 150
Gasto promedio 70 740
Valialza rnuestral 25 169
4,. Se realiz Lrna elrclresta parr cstimar el total de rrentas scmanales de los locales de productos
naturistas cle Quito. De los 1415 negocios de este tipo, se escogierou al azar 135. A continuacin
se resttnen los clatos recogidos, segirn la ubicacin geogr'fica cle 1os locales.
Situacirin
No. de Locales err Venta
Varianza
Iocales la muestra promedio
Nolte 600 ,lr 478 204
Centro 265 45 4r3 358
Sur 550 45 394 513
a) Encuentle un intervalo de confianza al 99.7 % pala el total cle ventas de dichos locales;
Si se quielc lealizar uu cstudio en el crlal el error de estimaciu sea de 5000 dlares, encuentlc
los taulanos muestlales. cn cadr estrato, para que la muestla sea r-ealizada nediante:
b) afijaciu ccluitativa;
c) afijacin proporcional;
d) afi.jaciu de Neyman.
5. En uua universidad se decicli llevar a cabo un estudio soble cl aholr-o que mantiererl slrs elr-
pleados pala cr.tando ellos se retirel. Se tom nna muestrr aleatolia estlatificada del 10 % cle Ir
poblacin, pol gltlpos de cdad, con afijacin plopolciolal. Luego de proccsal lr informrcirr, sc
obturrieron los siguicltes rcsulbaclos:
Edad nlenos de 40 aos 40 a 55 aos ms de 55 aos
No. clc empleacios 280 150 220
N{eclia 800 1400 3200
Desr'. estndar 160 400 750
73.5. Ejercicios 401
Artculo /, r si
Calzado 450 800 200
Ropa 380 560 150
Juguetes 230 940 220
a) Encuentre un intervalo de confi,anza al 95.5 % pala el valor promedio y para el l'alor total
de la compra;
b) trl comerciante tiene un capital de 750 mil dlares para realizar la corlpr-a. de acuerdo con
el resultado anterior, puede decirse que 1 se decida a corlr.pr-ar el lote?;
c) asignacin equitativa;
d) asignacin proporcional;
e) asignacin no proporcional.
Estratos
II III
Tamarlo del estrato 1000 1200 700
Tamao muestral 100 100 100
Proporcin muestral 0.32 0.26 0.29
8 En un sondeo electoral para conocer la aceptacin de tur candidato a prefecto de una provincia se
entrcvist a un grupo de electores, previa clasificacin scgrn su zona de residencia. La sigr.riente
tabla da Lln resumen
Area /, rt,i, f
Urbana 92 000 250 0.43
Rural 88 000 150 U.5 t
a) Encuentr:e nna estilracin, con Lrn intervalo aI 947o, del porceirta.je de votacin que obtcn-
dra el candidato'
402 Captulo 73. Elententos de Muestreo
b) Segn el resultado, podra esperarse que el candidato gane las elecciones por una urayora?:
Si se desea que el error de estinacin sea del 5.5ya, encuentre la cornposicin de la rnucstra
para que ella sea seleccionada mediante:
c) afijacin equitativa;
d) afijacin proporcional;
e) afijacin no proporcional.
I Se desea establecer el porcentaje de habitantcs, en la provincia del Guayas, que tienen fe en San
Biritute2. Se dividi la zona de estudio en ciuclad y campo y se pregunt si crean o no en tal
deidad. A continuacin se resnmen los resultados.
-
-Lona Poblacin Tamario de Proporcin
total la muestra muestral
Ciudad 2 800 000 450 0.29
Campo 650 000 350 0.61
10. En una provincia. se realiz Llna encllesta, entre los nios en edad escolar, para couocer la
asistencia a las escuelas, Para el efecto sc seleccionaron 150 nios, 50 en cada estrato, y se
obtuvo los siguientes resultados:
de
Condicin Poblacin Propolcin
pobreza total muestral
Indigentes 12 000 0.45
Pobres 36 000 0.60
No pobres 27 000 0.74
11. El Sr. Vargas est pensaudo postular a la alcalcla del Pr-ryo. Antes de folrnalizar su candidrtura
decide realizar Llna encuesta de opinin err la localiclad. Prra ello se zonifrc el cantn en 3
sectores y se obtuvo los siguientes resultados
a) Encuentre la estimacin de intervalo errtle los cuales se podra considerar que se encnentra
la popularidad del precandidato;
:Sirr Bilitr,rte es ulr santo cle ll tradiciu popular clel Guayas a quien se Ie asignzr el podel cle hacer llovcr
1,
Si la encuesta tiene un costo fijo de 5000 dlares ms nn costo variable de 4 dlares por cada
entrcvista, cunto le costar este trabajo al Sr. Vargas si se quiere tener un error de 5.57o y Ia
selcccin ser
12. En una investigacir sobre Ia produccin de manzanas en Ia Provincia del Tungurahua se desea
cstimar la proporcin de agricultores que se dedican al cultivo de la mencionada fruta y la
pr:oduccin media, en miles de kg, de cada parcela. Se realiz un sondeo en 3 cantones de Ia
provincia, a continuacin se presenta un resulrlen de los datos obtenidos.
La elaboracin de uu muestreo aleatorio puede ser costoso y difcil de realizar porque la poblacin
cst clispersa en un rea extensa y la localizacin de cada elerlento de la muestra podra llevar mucho
tieurpo. En estos casos se practica el muestreo por conglomerados.
Definicin (de conglomerado) Los conglomerados son subconjuntos de la poblacin que tiencn
la propiedad de ser internamente lo ms heterogneos y entre ellos lo ms honogneos posible.
Por cjemplo) en Ltna inr.estigacin se desea conocer la opinin de las arlas de casa de una ciudad. Err
h,rgar cle sortcar a los individttos, se procede a muestrear aleatoriarnente las lttanzanas de Ia ciudad y
clcspus a entrevistar a todas las arlas de casa que viven en cada tura de las nanzanas seleccionadas.
As, cada manzarla conteudr ttu conglornerado de elementos y el nrmero de elementos variar de un
conglomerado a otro.
Eu este tipo de mLlestreo Ia construccin del marco muestral es fcil, porque se rlaneja elementos
nayores v los costos de la investigacin se rebajan. En cambio, se corre el riesgo de que los elementos
el cacla conglomerado sean rnuy homogneos; por e.jernplo, si en nna manzana viven rnicamente
faurilias de un nirrel socioecournico alto, Ias respuestas de las amas de casa consultadas pueden ser
mny parecidas. perdindose 1a heterogeneidad interna requerida.
404 Captulo 73. Elernentos de Muestreo
Para compensar estos problemas se necesita escoger el nmero suficiente de conglomerados para tener
Ia necesaria variacin en las respuestas.
Al igual que en las otras secciones, examinaremos los intervalos de confianza para el total, Ia media I'
Ia proporcin poblacionales.
Intervalo de confianza
El intervalo de confianza al (1 CS
(^
Doride
I
/ es el nmero de conglomerados en la poblacin
i,,o
i:t
rn es el tamao promedio del conglomerado en Ia muestra, que se calcula por ,: n
N
h[ es el nmero de elementos en la poblacin, que se calcula por M: D m.
i:r
M es el tamao prornedio del conglomerado para Ia poblacin, que se calcula po, M : +
/
ri es la surna de las observaciones correspondientes al i-simo conglomerado, con i:1,2....,rt.
i,o
o;t
T cs el promedio muestral, que se calcula por 7 =
D
i-7
nro
rL
L\r - rnr)''D
s es Ia desviacin estndar, que se calcula por s: i:7
n-l
rL
rD
iI \\r - r,nrl)' -
i,:l
i "? -
2z i "m
+t2 i m|.
Tarnao de la muestra
El nrmero de conglomerados a incluir er Llna muestra, obtenida de una poblacin conformad.a por l/
conglomerados, con un 95.5 % de confianza y un error -8, dado es
N
?16 (zo)2N2s2
/i ::------;. dutidc /?U: --------;6--.
/r0 -+- lv ,E
La frmula de evaluacin de r incorpola, en el denomilador, una correccin que se debe a que tratamos
con Llna poblacin finita.
trjemplo. En una ciudad viven 38 300 personas distribuidas en 10 500 farnilias. Se seleccionaron 12
fanilias para estimar el gasto mensual en transporte. Los datos se encuentran en la siguiente tabla:
I nz; : 31,
I"t : 1573.8.
i:T ;_1
\-
1, .,:,
:: 'n, :__;;_:iu.7u7,
1573.8
rr
\ ttt;
i:t
'r : Alt: x :
38 300 50.767 1944376,
?INrL
Corno
15 354.45
t--I 11
: 37.36.
"/' V Jrr
l0 500 - 12
: 2.43 x 10 500 x 37.36 x :275020.
l0 500 x 12
EI intervalo qr.reda:
As, el gasto mensual total de la poblacin en transpor-te est entlc los 1.67 y 2.22 millones de
cllares.
b) Para el clculo del tauao ruuestral usamos E":100000. Prirlero, obtengamos ns:
^^ Qn)2y2t2 e.$)2e0b00)2(37.36)2
rtr--
AA o,
E'l (100 000)2 -JU.O|.
Entonces,
tz6 ly'
11, :
ru6 f ltr
: 90.87 x 10 500
:90.1.
90.87 + 10 500
El tamao es de 91 conglomerados.
Intervalo de confianza
s
( a-2^t:.,," At V
F- ly'r
73.6. Muestreo por conglonterados 407
Tarlao de la muestr-r
El uttlero de couglomelaclos a incluil erl Lrna lllrestra, obtenida de una poblacin coltfolmacla por l
conglomerados, con tur 95.5 % de confianza y un errol Ep daclo es
rr l/ t - .^\2.2
(tolt(le l?n: --#
?o * ly''
'
( N\'2L-'2
'..., -ll
Ejemplo. Si en el ejemplo antclior', soble el gasto en tr-anspoltc de las fllilias clc na ciuclacl, sc
rlctscar't utta estitrrtcin clel gasl,o mensual pr-omcclio en tlanspolte pol persona. a) Encontr.ar Lln
itttctr'tlo cle confianza parr lr n-rcclia poblacionerl, rl 98.5%; b) \fantenielclo los mismos clatos, fi.jrrr.el
lrttrrrto clc la rluestrr pltlI lcrrel ul cllol de 5 cllales en la estimacin clc
r,.
Sol,tt,r:i.n:
t
I2 12
\- : :
) rrr J1' t 1573.8,
i:1 i:T
n : 2.583. M : 3.647.
i:50.767, J / .t).
El clrol clueda:
Ti
.^t)
-'/ - s, Il-.
_
V A/-r
2.43 x 37.36
: 7.782.
3.647
Lo cFte siguific:L clttc cl girsto meclio clc Ia poblacin en concepbo cle tlzlnspoltc csl,i et1e los 43.59
y los 57.95 cllrlcs nlcnsualcs.
lr) El tamao clc la mrLcstr'r pala tcncl Llrl clrol E,.:5 se calcull as:
)
zal2 s- (2.43)2(37 36)2
,r,I-
" :24.79
ytrt/\lI Lt
/,r lt'l (3.oaz;z 15;z
rt6 1V
rr * A
2J.79 x 10 500
: j-I. / J.
21.79 + 10 500
Intervalo de confianza
/ s.p
,U n-" :P^+ zonf;V
s.p tr-"\
\'- '", N" x" 1
Doncle
l r:s cl tarnao plomeclio clel conglomelado en Il muesbra, que se calcula por T7z :
,4'ir es el nrmero clc clemcntos cn lr poblacin, qlre se calcttla por 11.[ - i:lD rro.
,41 cs el tanrao plor-ncdio clcl conglomerado palir la poblacin, que sc calcula por A.[ : AI
F
/; cs el total de xitos cn cl i-sitlo colglomclado, cort 'i: I,2,. ..,tr,.
D'i
f cs la plopolcin rnucshral, qric se calcula por t: ;l-
I
;-1
rn'"
7l
s, r)
L\y _ ptrt)-
,s,, cs Ia desrriacirr csl,nclar, qne sc crlcula por ,sp : i:t
n -7
]L]I?LIL
D(y - f
v ,i.-). nr;)2 : D,L? - 2iD,tJnti * f D rr?.
i-t i:I i:1
Tama.iro de la rluestrt
El rlinrelo cle corglorner'rcios a inclrril crr Llua rnueslra, obl,eniclr de nna poblacin confoltnacla ror lY
c:onglonrer-aclos, cou rrn (1 - cr) x 100% clc corifianzr\ \ nn err-or -Eo claclo cs
,, : "o
A' clo'cle ,rn : &.
?s * Ar (M)2DB'
+
rl
,I
1 :].6. Muestreo por conglornerados 409
Eiemplo. el rtso de Internet por los ahrmnos de unl rrniversidad se seleccion aleato-
Prra conocer
rirmente 7 cle los.19E cnrsos de lr r:rt,iclircl. A los ahrmnos se les prepiunt si en la ltima semana
r .l
haban rrtilizado los st:rvi<:ios cle lntelnct. A continrrrcin se cla lr infornacin respecto al nmero de
alumnos t:onsultaclos ert r.:arla (:urso v cl nrnelo clc lcspuestas afirmatirras.
Ctrrso No. cle No. r'esplrestils CrLrso No. cle No. respuestas
(r) consultas (rn) alirrnntiv:is (y) (i) corsultas (m) afirmativas (y)
1 2i 13 10 66 45
2 J.1 1ti il7851
3 56 '2t) 12 29 19
4 87 .J
'J 13 35 20
5 2I 11 14 48 22
6 3Ci 2b 15 27 16
7 45 o.)
16 64 39
E
(l
4,1 1E 17 54 48
i1 LI
a) IJallat' el intclr.alo rle t:oufiartza al g7 Vo para la ploporcirjn cle estucliarrtes cle la universidad clue han
utilizar:lo Iuternet: lr) .A los alunlnos cle r:untos (:illsos hay que consultar para tener un elror del 47a
en la e-qtinra<:irin'/
Solu,cin; l)e los rlatos clc la talrla se olttiene que N : 498, r:77 y
1 7L
: 7.697.
Par't cl t'lt:ulo rlcl t'r'r'ol rr,:r sc clislrorur rlcl vlrlol clc 11, por'1o clue cnrrl<-.arcmos rrr.;
tr,
r7(r! rt
f,'
l1r'' : ().05216.
.11)8 . t7
4to Captttlo 73. Elernentos de Muestreo
Entoni:es, cl intervnlcl cs
Es dc<;ir' <1rre entlc <:l 47.4Va y el 64.3 % de los estudirntes hrn rccedido a Internet, la ltima
serIln.
t( : r
ry::i:
sz
(AtS'z
') ')
.06)2 (0.04)',2
rt1. *.\
78.73 x 498
: 67.98.
78.73 + 498
L3.7. Ejercicios
trstimacin del total y cle la media poblacionales
l. Conrcl lcsrrltrdo dr: rrn rnrrcstrc;o llor conglorner'rdos sc obtuvo Ia siguiente informrcin:
A: : 10 000. r : 100.
?tt : 'ttl.2 : .' . : tl100 : 15, .41 : 150 000,
II II
2 Err una r:irrrlarl pcr<rcr'rir. rlontlr: ha-v" 3200 lurga,r'es. sc lcaliz ur sonrleo para cstimar cl tiempo
rneciio (l1ro crl los lrt-rgrrlcs sc ve lr tclcvisiu <lirliarrrenbc, La cnrplesa dividi Ia ciuclacl en 450
rrrrnzrrris, l)or.'(luo rro tlispona clc una lista clc los hogarcs y selecciou 8 manzanas cle casas al
tzlr. En la sigrricntc trblr se inclicrn el nrirnelo cic hogares y el tiempo total (en minutos) clue
Ias familirs. en t:rclt rrrirrrzirur. rlr,'clicriu r rniLu lr televisin.
r) Hlle los intt:rr,rl<.,s clcl confirrnza tl 94 %, ptLltr el tienrlo toterl y el tiempo medio que los
hogarrcs cil: lr t:irr<lrrl clerlii:rn r vr-'L lir tclcvisin;
b) Enc:rrentre cl trn,rno rlc Ir rrnest,r'l pzrra tcner .,r, cle 19 rrrinrrtos en Ia estimacin ch.
lr nedir.
"rrnri
3. Err rtua acaclemia cletlicatla a la elseanza tlel iugis se clesea cstudial el nrmero de aos que los
alututros Ilevau aplcntlicnckr cstc icliontr. Sc. r'ealiz csta plcgunta cl 5 cle las 68 clases que tienc
l ac:aclemir con los lcsrrltaclos sigrricntr:s:
Clase 1: 5,4.7,,5, 6, 5.
Clase 2: E, 6, 8, 9,6,7,10, E, 6.
Clrse 3: E, 12,10, LI, 72,9, 13, 12.
Clase 4: 12, 9, 11, 10, 10, 8, 12, 10, 73,72
Clase 5: 14, 72,10, 11, 12, 13, 13.
a) Estirrrc t-'l llriutelo ltrcrlio rlc los arios rlrrr; llrrvrur cst,rrtlialrtLl iLrglcs Ios cst,udirnl,cs tlt: llr
rrt:rrrlclttilr. IJstl,r' :,17,;
b) Si sr: clttisicttr cstirtrrl cl plorucclio tlc airos <1rre llci'iru cstudirudo t.oclos los cstudiirntes <ur
sc cncuentlrtn <)r.r rcrrlcnilrs Llc crrscr'rrnzu rlt-'ingls c1r-rc fr-rnciorriltr cll la ciuclacl, col] Lrrr clt'or
rb 0.5 i.uos v <;onIirbiliclid tlcl g7%,. trtilizlrrlo r:oLlro ulucstlil Piloto l;r r:orrsnltt lcilizaclr
ir krs 5 (:ru'sos lrrrti:r'iolcs, crrc;uclllo cl trnrlriro rlc Irr rlrr-rcsLla, si sc csLiml crc Loclas Iirs
ar;irrlcrtrirs l,icucu trLicltrs rrri LoLal tl,e 725 clrscs.
10 000, rr : 100,
,Il
II 'ttt'2 : .. . : tit100 : 15, If : 150 000,
t
Dut:ttcnirc rur inl tttr,tl<) clt-'t:onfirruzr rl 95.5% 1,artr la proPort:il 1.roblr:iorri.rl 7.,.
5. Un inrrottirtlot tltt Lt.rlrit ttsittlir. rur (:llgllncrrt.o clc 500 ptrclueLcs, sclcr:r:ic.rrrti
tlcsptr<1s <lc rcr<:ilrir
alcll.otiarncr1,c 10 tlc rtlltts ),c()nt cl rtriru<tlo rk: ltlcrrrlas rlcl.c<:t,rrosrs 1.ror'ltirc1rrel,c, Drlsrclos cl
lc.,s <lrtc's rlr: lir sigrricrrtc trblt:
h\<1. rle No, clc plcrrclas . No. <lc Nu. tlc prendas
Pirrlrrct,c
cntlrrs l'lttlttcl.
pt clef'ct:t rrosrs 1;r'r:nclirs <lcfccIrrosrs
(,) (rrr,) (.y,) () (rr4) (y,)
L E5 'J:] 0615
24420 77825
;i 5ti 18 E5919
47723 95527
t- 61 2I 10 68 22
ir) Etrt:rtcrrtli' rttt itrtt'Lr'ilt.r rlc r:ortfirrtzii ril gU% l)rlrr lI lllopolcirr p <lc lrrcudrs tlcl'cct:rrosrs
cn cl t:rtrgztulctrto tlc rt-r1.rar:
b) Estrrblcztr rrl 14,,r,,,, nrninrr.r parit tcrrtr lur crlor'<lc lt cst,irriuriri rLcl .l%,.
4L2 Captulo 73. Elernentos de Muestreo
(t. Una empresa rgl'oexportadorr empaca melones en carjas que contienen 8 rrnidades cada una. Por
ploblernas cn el trunsrorte se estropc lrn (:rrganlento de.1000 ca,ias. Para conocer las prdidas
or:asionadrs se seler:<:ion rlertorirrnlente 20 cajas y se cont el nrimero de melones golpeados en
r:ada, ca.ja. l,os lesulttclos sr-l clan a ccntinurcin:
31 130
42 142
50 150
60 160
72 173
85 18 1
93 190
100 204
a) Encrrentre rrn intervalo rle confianzr. al 96.5%o para ler ploporcin de melones golpeados;
b) Si ei expoltrclor pier'<ie 1.7 dltrr'<:s por caclar fruta est,r'opeada, encuentre el intervalo de
al 96.5% ptu'ir la prdidar total del cargrr.nrento;
t:onfirnzr
t') ,Crrtil clebe scr el trrnrritc.r d<l lr mrrestrl parr tcner rrn error de 0.045?
7. Elr rur lralrir de lr c:irrclrd viven 200 faniilias. Unr muestra de I familias suministr informacin
n:latir'r al nrinrerrl <lc rnienll-rros, ingreso farliliar cluincenal (en dlares), gasto en alimentacir
(cu tkilarcs) r,si tierrc suscripcin zL algn reliclico. Los resultaclos fueron:
c) el inglr:so cluinrrcnal rromeclio cle las familias que tienen suscripcin, si se sabe que en el
lrltlio hw 75 srrscuitos. Compare con los lesnltaclos de a) ;
d) la proporci<irr cle fulilias suscliptoras a un peliclico. Compalc con el dato real;
e) Con los drtos de rr), b) y c), deterrninc el tamao ptimo de Ir muestra, si se desea tener'
lln cl r'()r' clc cstinra<ritin rlcl 15 %.
Captulo 14
Respuestas
Captulo 1
Seccin 1.7
4. a) categricos; c) el2l%.
5. a) tamao, peso, velocidad y agresividad son datos ordinales; funcin es nominal.
6. 2.5%.
8. c) 72.5%.
9.26%.
70. 20%.
77. 52.4%.
t2. 70%.
13. n:160.
)4. a) 880; b) 752.
15. n:50.
16. 76.
77.275.
18. 44.64%.
L9. r8%.
20.
lntervalo 0-40 40-80 B0 - 120 -
120 160 160 - 200
Frec. relativa 0.05 0.45 0.10 0.10 0.30
473
4L4 Captulo 74. Respuesas
Seccin 1.12
1. La mediana.
2. a)T:4.875,b)Me:5; c) s:1.553; d) R:b; e) As:-0.644;f)Ap:0.b92.
3. a) 7: 6;b) Qz: 5; c) s :2;d) R : 5; e) RIQ : 4;f) As :0.362; d Ap: -1.g26.
4. c) r: 0.75; Ilfed: 0.35; s : 7.789; h :2.33; Med, : L.75; s : 2.002.
5. 2.94%.
6. a) 6; c) 86%; d) 66%.
7. a) Cuantitativos: precio, proporcin de malta y tiempo de ae.jamiento, Cualitativos: cate.
gora y nota; c) Precio: r :87.56, Mo :70, Qz: 86, Malta: :48.96, Mo : I00, Q2: 49-
Tiempo:7:9.06, Mo:12,Qz:8.5; d) Precio: s:23.166, RIQ:28,CV :0.2646, Malta:
s : 30.114, RIQ :42.5, CV :0.615, Tiempo: s :2.697, RIQ :5, CV : 0.298; e) Precio:
As : 1.339, Ap :2.801, Malta: As : I.092, Ap : -0.542, Tiempo: As : -0.233, Apt : -1.406.
23. 8.
24. 101.
25. 19.
32. 80o/o.
33. 5r.
36. 6.27.
Captulo 2
Seccin 2.6
1. a) 6; b) 1; c) 3; d) 3.
2. a) 12; b) 1; c) 6; d) 30.
5. a) 40, b) 700.
8. a) Son 20 parejas sin reposiciny 25 parejas con reposicin; b) Son 30 parejas sin reposicin y
36 parejas con reposicin.
9. De 36 maneras.
10. 1330.
11. r20.
72. 720.
13. 504.
14. 84.
15. 0.5.
22. 84.
24. 77.
7
25. 26D36i:2.096 x 1012.
i:o
26. a) 4 x 75 : 67 228; b) 73 +3x 7a +4x 75 : 74774.
27. 6720.
34. O : {1C, lE,2C,2E,3C, 38, 4C, 48, 5C, 5E, 6C, 6E).
JJ, a) Pr(A) :0.4; b) Pr(AuB) :0.9; c) Pr(B") :0.4; d) Pr(AnB) :0.1; e) Pr(A\B) :0.3;
f) Pr(" n B") :0.1; s) Pr[(A n B)"] : 0.9; h) Pr(A U B"): 0.5.
36. a) f): {(I,I,I), (I,I,D), (I,D,I), (D,I,I), (I,D,D), (D,I,D), (D,D,I), (D,D,D)};
b) C : A \ B; c) B' : {(I,I,D), (I,D,I), (D,I,I), (I,D,D), (D,I,D), (D,D,I)};
BUC: {(1, I,I), (I,I,D), (I,D,I), (D,I,I), (D,D,n)}; AOB: {(I,I,I)};
A.ttB.: {(1, D,D), (D,I,D), (D,D,I)}.
37. a) Pr(A) : l; u) Pr(A u B) :3; c) Pr(A') :25.
38. 2:
4ll
39. a)
'or i
, (i)': $,
36
40. a) o)
64
417
1
47
15
Ctr
42. :- 1
q- I
tJ
3
43
38
44
cB c3 1-c c8u
c13.
: 0.e231.
23
45.
t14'
47.
.-
l--.
c?n c?o
cBo
48. ,l't 4,
C%
ul
",
309to, ao93u.
! u/
"l Cuno C?o
t7
49
33'
c c3, + cB c8 + cB c38
bo. ') f ; u)
51
52.
53.
54.
20
55. p- -1 'tT
Seccin 2.9
3. a) Pr(A lB) : l; r,) e,(rlA) : ); c) P,(AIB) : ]; a) er(a "lA) : ]; ") P,(,a" lB') : 5
g'
f) Pr(B'lA) : :
1
4. -.
4
11 : c) no son independientes.
5. a) Pr(A): i, b) Pr(B) ,;
7 1 11
6. a) Pr(B\A) : ,r, Pr(BlA): i,, Pr(Au B'):,r;a) Si son independientes.
1
8.
5
.)
9.
28'
10. Envo conjunto: a) 0.9; b) 0.9. Envo por separado: a) 0.81; b) 0.99.
,r. 20
n
72. 0.75
13. a)'
45 b) 99
-'46' ', -.
110
23. a)' *; l j;
15', 5' "; ,ro son ind.ependientes.
24. a) 80 %; b) 0.59; c) 0.8537.
25. 0.3806.
26. ?.
4
32.
y.
47
36. 0.4539.
n7p
DN
d,. Card(A) :
2
Captulo 3
Seccin 3.3
0, si r 10;
0.6, si 0<r<1;
X 0 1 2
a
J 4 0.92, si l1r<2;
p 0.0384 0.6 0.32 0.016 0.0256 0.936, si 2<r<3;
0.9616, si 3( r<4;
1, si r) 4.
X 0 1 2 3
p 0.00001 0.00167 0.07663 0.92169
3600. 1525.
a)k: b) Prrl < x <):
'5269',',\-5269
10 a) c:]; u) e.(x < 1) :
f,,Yr{x <2):f , e.{o < x <3) :;
11. b) 0.608e.
14. a) c: u) c: 1; c)
r;
a) !,f) c:1.
,rg; ": ]; ") ":
2
15.
'3'-:b )]; ") I' ol
a)
i
16.
X rt o 1
17.
b) Pr(X :0.2): 0, Pr(X < n14) : +,Pr(X > trll) : 0,Pr(trfI2 < X < r) : t.
23.u
r)
27.
]; u) i*, "l nosonindependientes; d) ffi
( o, si3r<o;
28. u) :{ \/a,si0(a<I;
ry(y)
( 1, sig>1.
b) P'(+ <x2<) :
i,r,(* .".;) :osbe
421
(T sr
29. (t): { to' si ;
|.0,
1
30 Pr(X2<l):;.
I zrr"'
( f: rr;
31 fu@): 4
-L.
I 0,
aJ'
14;
[ rario.
(0. si
Fr@):I;:, s z!!'t];
32. r z\&)
- z(*):Io'
- \ t,
rz\n)
I i; ",t
si z e [0,1]'
Seccin 3.6
6. a) E(X) :0, Var(Xl:X,b) E(X) :0, Var(Xl:|,c) n(x) :0, Var(Xl : *'
d) E(X) : 0, Var(X) :
;
7. a) e(x) - 2.5, o(x):0.866; b) E(x) :9r2,o(x):
$t OE(x) : '5,".}1:
;fo,
d) E(X) - -4, o(X) :0.556; e) c: #, tt") : #, o(X) : In 4 (ln 2)z
'
8. P:0.2, o : 11.
L Yar(Z): 0.09.
10.
72.
422 Captulo 74. Respuesas
22. a)
: i)
Pr(X
100 100 100 100 100 100 100 100 100 100
b) E(X) : 3.85; c) Var(X) : 5.527.
23. a) E(X) : 109.39, Var(X) : 33.19; b) 54.70 dlares.
24. a) E(X) : 3, o(X) : 0.7746; b) E(v) - 5.5, Var(Y) :
+
25. a) E(X) :2;Yar(X) : 0.2; b) 50.225%.
26. a) E(") :4.8h, Var(") :2.56h2; b) E(C) : 48, o(C):t6.
27. a) Pr(X > 60) : 0.334; b) E(X) -- 5r2 : 49.348m; c) Var(X) : 461.3 m2; o(X) :2L.478m.
28. Sugerencia: utilice las propiedades de las series geomtricas.
29. Sugerencia: utilice el ejercicio anterior.
30. E(xY +2Y -x) : #.
31. a) 2; b)
'"1 f;
32. E(^9,) :0, Var(,S",) :;.
33. E(S") : fret E(?l,.) : tupa, Var(S") : TLo2 V-(",) : np (o2 * o'O).
1
Captulo 4
Seccin 4.6
2. 25 dlares.
, :
3. .) i; ) E(X) : 109.5 110 Palabras.
18. a) 0.05631; b) si es efectiva, pues la probabilidad de que nadie se contagie es muy baja.
100
22. pr(x < 9b) :1- t cf00(0.0b)k(0.9stoo-r.
k:96
23. Al azar:0.17188; con informacin: 0.5.
24. 0.0504.
X b) 10 preguntas.
25. a)
-
p 0.1 0.09 0.081 0.1 x 0.
424 Captulo 74. Respuesas
26. b) 5 cartuchos.
0.2 0.16 0.128
3 gusanos.
a) 0.04087; b) 0,03564.
0.3188.
a) 0.032; b) 5.
a) 0.14653; b) 0.56653.
0.14288.
700 dlares.
0.14288.
Seccin 4"10
,)
t;
..).
i2'
4. L/,U.
B. 0.75.
9. 0.8.
10. 0.15.
!. si r o. u' B6t'
( sir<o; E(x) I var(x) _-
b) .\:3, l@) :1 o,
i"_*, ;; ;; i, ==
n;
1
\
c) ,\:0.5, f(d:Io' .r"-o't,, sir<o:
.t; i . E(x) :2,Yat(x):4;
t
: f o' si
: :
d) ,\ 0.25, I@) =-
I 0.2b"-r,r,, .t ;; 3" E(x) 4, var(x) 16'
OD
rt- 82.28%.
426 Captulo 74. Respuesas
27. 0.403.
Seccin 4.12
1. 0.023.
2. 0.0985.
3. 0.0003.
5. 0.0227.
6. a) 0.2375; b) 0.6657.
7. 0.04595.
10. 0.0207.
11. a) 0.0E23; b) 0.0446.
t2. a) 20; b) 0.1269; c) 0.8395.
427
Captulo 5
Seccin 5.6
X
D
Y 0 2 J
e) ^9
0 I2
PS 61 lr20 5rlr20 81r20 211120
1 29 cl) 55
3") 89; b)
*,") -:89', ', -:
89',
e)
X -1 01
PX 17 l8s t4189 t7 l8e 4718e PY 15/Be 27 l9e 47 l8e
4. a)
4
b)+ 01 2 X2 T2 c)
:'49
.40
49; 417 217 tl7 I 17 217 417 -.
X
Y 0 2 r) 4
5. -VJ 0.075 0.050 0.025 0.0375 0.0625
0 0.201 0.134 0.067 0.1005 0.1675
6 0.024 0.016 0.008 0.0120
v,) 0.0200
6. a) -3410 b) 0.1965.
Px 0.25 0.43 0.32 pv 0.55 0.45
7. a)
X 10 20 30 40 b) 0.7392.
PX 0.r4 0.42 0.19 0.25 0.7r
8. a) 1, b)
1 2 3
c) No son independientes;
60 115 31L0 215 PY 4lr5 rl3. 2/5
10
.
9. +(\ - 1); b) /(r) : "o"
r, fv( - coss.
JTa t' : fr
l0 lx\r) : *e '"'-'''; fv(a)
vrt "-'0";
no son indeperrdientes.
428 Captulo 14. Respuesas
4
11 4 b) si son indePendientes.
nrr
I2 a) fx@) : r) 0; fs,(y) : y > 0;b) (1 - (f +.lo)e ^") (t -" ^u);
^2tre-\',, ^e-\'!t,
c) 1 - (1 +.\a)e ^".
l3
p 1 o50 i3l50 21.150 7150 4150 p 3/50 22150 21150 4150
b)
t2 c)
xlv:o 1 2
rlrs 7 113 5113 213 113
t4. a)
X t2 4 5 1 2
0.22 0.25 0.23 0.20 0.10 0.30 0.24 0.t7 0.11 0.08 0.06 0.04
ut Pr(x :
r \ _____________::_ l
t2 45
klY :1) I 1bl30 gllo 4130 7130 rl30
( (20 000)3
20. a)
"f(rr ,rz.rs):1
(rr*100)3trritolt(rs+Loo)5' rt>.0' rz> 0' 13>0;
[ 0, caso contrario.
1
b) Pr(X1 < 100, X2 < 100, Xs > 200) -
16'
22 .)'256
3; a) fr(t):2t; c) Son independientes.
oa
") *;
l IxQ)-+,si 0( r12; Ivfu):+ si2( u<4;c) Cov(x.v) :-*.
,A a) a; b) fx@):2tre-'",ft(y):2!Je-!"; c) E(X) :E(y) :{,d) Soninclependientes.
ox
att a) :t r2r2+l si0((
"fx(r)
. 4 .,
1: h(u):iu(u't *2) si0<y< l:b) Cov(X.V): -2
r--,
209
c)trlX-Y)-' 350.E(X'-Y'\- 2527
429
'l t r\ ) t
26. a)fx(t):1(ur.."rt+'t\E-F*;),fv|):?(ur".unt+tt/L=P);rr)Noindependientes.
-\
( 2r-r17 ) si r)o.
' v'
27 a) 8; b) Ix@) 1 6(1 + z)a 'L
: c) No son independientes.
I O, caso contrario.
28. a) k:(n-I)(,n-2);
b) F(r.u\:
' \*,rt {I 0,
\- (r:_r)2-n - (a+r)2-" +(r+ a*r)2-''', si r ) 0; v> 0; n > 0;
caso contrario.
,,
b) f x@) :
f* * rr, fv(a): Gi l)s,
no son independientes'
33. a) 10; b) /x(r) -5"4,0 <r<1, fv(y): fr{t _ y3),0<y <1, nosonindependientes;
39. 0.02923.
/a -2 4\
40. I-z u -r)
\a -4 6/
47. Cov(S,,,, T,-) : rpo2.
/t 2 6\
42. Iz 6 18l.
\o 18 60)
430 Captulo 74. Respuesas
Captulo 6
Seccin 6.5
9. 0.06802.
11. t e (37.77;40.23).
12. a) 0.0456; b) 0.0228.
t4. 0.0036.
15. 0.923.
16. 0.8132.
17. a) Estadstico; b) 0.00361; c) Si.
18. a) Parmeto, P :0.8; b) El valor de cada estadstico, calculado a partir de las muestras, estar
ms cercano a 0.8, a medida que aumenta el tamao de la muestra; c) 0.9846; d) la probabilidad
es mayor.
0.785.
a) 0.9270; b) 2826.
0.0228.
0.0918.
0.09513.
p e (0.333;0.367).
p : 0.3679, Pr(f'> Il3) :0.758.
a) Pr(p'> 0.8) :0.1376; b) Pr(X > 20) :0.1935; c) La probabilidad de ganar debe mantenerse
constante durante el torneo.
43L
29. 0.95.
34. a) Pr(s2 > 150) = 0.9; b) Pr(s2 > 362) = 0.02b; c) E(s2) :225, Var(s2) : 3894.
35. o2 e (49.75;I6a37).
Jt. 0.8361.
39. 0.99.
4t. 0.025.
42. 0.05.
46. 0.0062.
47. 0.0104.
49. T - t(22),0.I.
50. 0.0207.
51. 0.9634.
52. 0.0322.
53. 0.9747.
432 Captulo 74. Respuestas
Captulo 7
Seccin 7.5
-2
: i-, u-2 Var(73) : o-2
3. a) Si; b) Var(?'1)
'/ 2nz'Var(?z) -
n2', \ u/ 3; Bnz
c) Mejor 73.
8. Es insesgado.
9. b) a:
oi+oi
10. b) c:
----
n\
' nt lnz
11. a) E(X.): g , Var(x ,l : {, b) Tn:x,,, ECM (7'd : *
t2. a)O :, (t - t, A :, (#+), ao,.a" k es el nmero de veces que aparece et valor 1.
*),
2
13. L(p) : rttozs (7 - P)2r, f:
74. a) E(x) : 1 * 0,AL:X + t; b) Es insesgado; c) 6, :X; d) d2; e) 1.
Seccin 7.8
9. 57.
13. 62.
t4. 43.
15. 31.
Seccin 7.10
1. a) (2.889; 3.a71);b) @5.27; a6.73); c) (-1.33; 6.33); d) (-176.58; -87.a2).
2. (O.ee; 2.30).
5. @0e.23;706.76).
6. (2793a;240.66).
Seccin 7.12
5. o e (3.30r8.40). si le conviene.
434 Captulo 74. Respuesas
Seccin 7.14
4. 2177.
7. a) (0.2475;0.3525); b) 276.
11.97.84%.
12. a) (0.812; 0.928); b) Ser ms estrecho; c) Ser ms ancho.
13. a) p: 0.5, n:77;b) Se necesitan ms estudiantes; c) Se necesitan ms estudiantes.
Seccin 7.16
Captulo 8
Seccin 8.6
72. a) 1{6: r : 18, HI F > 18; b) Rechazo Hs si t6t)s > 0.0b(10) : 1.812; c) toar:7.976, rechazo
Ho.
13. a) Son estadsticos; b) fIs: p : 26, HI Ir I 261' c) tobs :1.46, se rechaza Hs si t.6, > 2.069;
d) La edad de las novias no es diferente de 26 aos.
14. tobs :3.378; cl periodo medio de espera es diferente a ocho das.
27. a) H0:P:0.2, H7:pt0-2;b) cv:0.04;c) zot,":7.75, aun nivelde cv:0.05 se rcchaza Hs.
32. a) zou, - 1.16, a un nivel de a : 0.05 no se puede decir que la mayora aprueba el endurecimiento
de las penas; b) a:0.123.
33. a) zou" - 2.26, se rechaza llo; b) 0 :0.2655.
34. a) zob": -1.854, Ia diferencia no es significativa, se debe solo al azar;b) 0.30554.
35. a) zour: 3.0; b) Si es significativo alLVo; c) Las observaciones provienen de una ley binomial, son
obtenidas aleatoriamente y el tamao es lo suficientemente alto. Las hiptesis si se satisfacen.
Seccin 8.10
Captulo g
Seccin 9.3
5'
") xZu"6):19.009, xZu"Q):16.238; b) La empresa T dio un mejor resultado.
6' x1a":0.656' los clatos siguen ras probabilidades tericas.
12. i:2.642, X?0":7.737, no se rechazaque el nmero de Ilamadas sigue una Iey P(2.642).
13. XZa" :17.88. La temperatura no est uniformemente distribuida.
74. XZa":20257; no se acePta IIs.
15. l: 1/1000, XZa":14.53. La duracin no sigue la ley t(1/1000).
Seccin 9.6
8. a) rou":6, se acepta flo; b) Dobs:0.324, se acepta Ho;c) gou":1.907, no hay valores atpicos.
12. a) rou": 6, no se rechaza 110; b) Dobs:0.226, no se rechaza Hg; c) Toa": 16, no se rechaza ,F16.
439
14. r<I4lor)183.
15. 2pobr:0.289, los dos laboratorios entregan resultados iguales.
16. Prueba de los signos: 2pot":0.109, se acepta //6, Prueba de Wilcoxon:To,":6,'se rechaza Hs.
Captulo 10
Seccin 10.9
1. 0 : 2.852 *3.704r,r : 0.948.
2. a) i:332.11* 0.65r; b) r : 0.993; c) tou": t6.895;
d) E(r) e (33e.63;344.09), f, e (335.e7fia7.75).
Fuente g.l. SC MC F
3. a) 6 : -90.2, br :9; c) Regresin 1 810.0 810.0 54.24 d) 12 :0.948.
Residual 3 44.8 14.933
Total 4 854.8
4. b) g : -7.489 -10.r44r; c) F," : 17.83; 12 :0.69; e) No.
Fuente s.l. S.C. M.C. F
5. a) Cantidad :18.976 +7.27I Tiempo; b) Regresin 1 37.01 37.01 79.73
Residual 4 1.857 0.464
Total corregido 5 38.686
c) 0o < (15.50;22.45), B1 e (5.01;9.53).
Fuente g.l. SC MC F
Regresin 1 3.210 3.210 73.2I
:
13. a) En los dos casos se rechaza I/o; b) Residual 10 0.439 0.044 c) 12 0.88.
Total 11 3.649
0'0-136.
16. a) :6.66g7o.oso7;b) 0:0.0799 - I r]:0.834, r?:0.gro.
17. al :3.0348 - "jou, Lt)12 :0.9614.
" : ------:--:-----
1
'22. 'll t'2 :0.973.
-.
0.0852 -F 0.0375:r:
Captulo 11
Seccin 11.9
i a) A: 742t4
+ * Urr, b) X'X : XY: ( i, ); c) s2:0 602;
TS TSr,
/ -7.6e0 \
4. a) b: ( o.oso I po. (8.a7;8.09), B, e (0.0J2;0.r47),B, e (-0.3t;r.245);h) Ir2 :0.961,
\ 0.607 I
ye e (8.4;20.02).
a) G:1.083+0.011+ 10.749F; R2:0.856, RZ:0.76t, s2:303.99; c) (-0.055; 0.07a);
d) Solo el tamao familiar; e) 3.5; f) Fot":8.945, se acepta Ho, anivelsTo.
6. { f :92.074 - 0.576L r 0.r2A; b) 16.33; c) R2 :0.948, RZ:0.9r4;
Fuente e. l SC MC F
Regresin 2 13.521 6.76 27.438
d) 2 e) Mejor modelo: T :32.337 - 0.529L.
Error 0.739 0.246
Total 5 14.260
7. a) totr,o - 5.05, tobs,t :2.54, to6r,2:2.67, tor",3 : 0.90, tobs,4:1.11; b) 0@i : 12.917.
9. { D :
-125.56 - 4.71u i 0.046u2; b) R' : 0.948;
Fuente gl SC MC F
Rcgresin 2 43396.4 21695.2 45.37
c)
Error iJ 2391.1 478.2
f,'t:rl ' : t {..ri17.5
442 Captulo 74. Re.spuesas
Captulo L2
Seccin 12.5
1. : 31, ECM : 186.9; d r: 30.2, ECM : 19b.b; d) , :297, ECM :279;
u) ?tt
")
lr; : 33.7, ECM :2gg; f) ?t : 34.5, ECM :280.2;
e) z: 18.7, , : 42.8, ?1s :55, ?zo :23.g, ECM : 126.3.
2. b) ?zu : 57.5, ECM : 172.5; ?zs: 56.8, ECM :153.7; ) ?ru: 47, ECM :253.1;
59.7, ECM :243.7; il ?rt :57.4, ECM :224;
") %s -
e) ?2s:75,r, ?ru:54.6, ?27: 50.0, ?rr:71.9, ECM : 124.3.
3. b) ?tu - ll7, ECM : L32.7; ") ?rc - I27, ECM : 63.7; ) ?ro : 116.2, ECM -- t43.7;
?ro : 118..2, ECM : 39.8; f) ?tu : t26.6, EcM : 83.8;
")
s) ?ro :125.0, ?rr:L27.5, r: 133'4, ECM: 157.5.
Captulo 13
Seccin 13.3
1. a) r (81.23; 87.r7), r (32 493; 34 867);
b) 121.
443
Seccin 13.5
9. (30.e8 %;3e.08%).
Seccin 13.7
1. rr) r @756a6;a8$54); b) p (3.171;3.229).
2. a) r (889 546; III9228), p e (277.98;349.76); b) 28.
3. a) (7.31;11.64); b) 98 clases.
4. p e (0.1;0.3).
5. a) (0.2831;0.3733); b) 25.
6. a) (0.0677; 0.2448); b) (115; aI6); c) 79.
7. a) p, e (45.56; 85.12); b) pg e (20.32;37.L2); c) p (35.38; 106.89); d) p e (0.0272;0.2228);
e) no:26, n6:25, nc: 29. El tamao ptimo es de 29 familias.
Ta blas Estad sticas
. Nivel a :0.1.
. Nivel a : 0.05.
. Nivel a : 0.025.
. Nivel a : 0.01.
445
446 Tablas Estadsticas
z .00 .01 .02 .03 .04 .05 .06 .01 .08 .09
-3.5 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002
-3.4 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0002
-3.3 0.0005 0.000s 0.0005 0.0004 0.0004 0.0004 0.0004 0.0004 0.0004 0.0003
-3.2 0.0007 0.0007 0.0006 0.0006 0.0006 0.0006 0.0006 0.000s 0.0005 0.000s
-3.1 0.0010 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008 0.0008 0.0007 0.0007
-3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.00r1 0.0011 0.0010 0.0010
_to 0.0019 0.00r8 0.0018 0.0017 0.0016 0.0016 0.001s 0.0015 0.0014 0.0014
-2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
_7',l 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
-2.6 0.0047 0.004s 0.0044 0.0043 0.004r 0.0040 0.0039 0.0038 0.0037 0.0036
_t< 0.0062 0.0060 0.00s9 0.0057 0.00ss 0.0054 0.00s2 0.0051 0.0049 0.0048
-2.4 0.0082 0.0080 0.0078 0.007s 0.0073 0.007r 0.0069 0.0068 0.0066 0.0064
-2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
-2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0r16 0.0113 0.0110
-2.1 0.0179 0.0174 0.0170 0.0r66 0.0162 0.01s8 0.0154 0.0rs0 0.0146 0.0143
-2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
-1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.02s6 0.0250 0.0244 0.0239 0.0233
-1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
-1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.037s 0.0367
-1.6 0.0s48 0.0s37 0.0526 0.0516 0.0505 0.049s 0.0485 0.047s 0.0465 0.04ss
-1.5 0.0668 0.06s5 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.057r 0.0559
-1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.073s 0.0721 0.0708 0.0694 0.0681
-1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
-1.2 0.1151 0.1131 0.tttz 0.1093 0.1075 0.10s6 0.1038 0.r020 0.1003 0.098s
-1.1 0.13s7 0.133s 0.t314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
-1.0 0.1s87 0.1562 0.1s39 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
-0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.t7tt 0.1685 0.1660 0.1635 0.1611
-0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.r867
-0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
-0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2s14 0.2483 0.24s1
-0.5 0.308s 0.3050 0.301s 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
-0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121
-0.3 0.3821 0.3783 0.374s 0.3707 0.3669 0.3632 0.3s94 0.35s7 0.3520 0.3483
-0.2 0.4207 0.4168 0.4129 0.4090 0.40s2 0.4013 0.3974 0.3936 0.3897 0.3859
-0.1 0.4602 0.4s62 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
-0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641
447
z .00 .01 .02 .03 .04 .05 .06 .0't .08 .09
0.0 0.5000 0.5040 0.5080 0.5120 0.s160 0.5199 0.5239 0.s279 0.s319 0.s3s9
0.1 0.5398 0.5438 0.5478 0.s517 0.5557 0.s596 0.s636 0.5675 0.5714 0.5753
4.2 0.5793 0.s832 0.5871 0.5910 0.s948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.691s 0.69s0 0.6985 0.7019 0.70s4 0.7088 0.7123 0.715'l 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7s57 0.7389 0.7422 0.74s4 0.7486 0.7s17 0.7549
0.7 0.7580 0.7611 0.'t642 0.7673 0.7704 0.7'734 o-7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.799s 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.836s 0.8389
1.0 0.8413 0.8438 0.8461 0.848s 0.8508 0.8531 0.85s4 0.8577 0.8s99 0.8621
1.1 0.8643 0.866s 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.911s 0.9131 0.9147 0.9162 0.9177
74 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.934s 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0"9463 0.9474 0.9484 0.949s 0.9505 0.9s15 0.9525 0.9535 0.9545
1.7 0.9554 0.9s64 0.9573 0.9s82 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.96s6 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
7.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.97s6 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 {1.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.99r3 0.9916
2.4 0.9918 0.9920 0.9922 0.992s 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
1< 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.99s2
2.6 0.9953 0.995s 0.9956 0.99s7 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
,, ,|
0.996s 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.998s 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.999s
3.3 0.999s 0.9995 0.9995 4.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9991 0.9997 0.9997 0.9998
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998
00.0"0 f,BSO'0 TOBB'B r00'0 i0$0'0 i000"0 t00's [000'0 f,080-0 itsBB'$ It
r000"CI gB$B'S s$0fl'B r-fl0'0 ESfl0'fl t-s00"0 b-0^s 90'0.0'0 f&80'0 f0$s'0 y'
f00'0 t&08'0 F000'0 F00$'s F$0'B 00'0 f$8'0 s000'0 !=008"0 s0010 IL
ss00'0 s8s8'8 ss0g's 900s'0 90o'$ 900'0 9SSS"0 90s0.0 B*"0 000"0 rE
n00'0 ES0'0 8S0B'S 8000'0 800"$ -"'fl00'0 6CI0CI'0 60$0"s 60ts"0 0{0"0 1"r-
sf 00'0 6F80'S IEOE'O +S0'0 gil0'B 590"0 s0s'0 6t 0 0'0 09sB'CI [908'S _L-'t
F900'0 9988"0 s900'8 6900'0 rtfl0'g f00'0 9i&0'0 8i00'0 BE$F1O rgB0's Tt-
ISB'O i.qBB'0 6S0B' T6S8'0 9600'0 6608"fl 0r0'0 rsTB'0 i0T0'0 tr.
0TI0's T-T T B'O 9II0'0 T I0' ''6S'S
irfl'0 6rTS'0 ;gTCI.O I r-10"s 6EIS'tl
-r-T0"tl
r-tI[' 9FTg'0 s1$'8 F918'g EIfl'$ sIs'$ 99r" 0f.I0"s F{B'D 6r0'0 LL'
t8T0'0 8SIfl'B i6I0'0 6rfl'8 isi0' iflr0"0 [{i0'fl iIi0'0 crrU U 8ii' 0'r
filo'0 6rs'0 }FC'B BSifl'o 95E'S 90"0 89iG'0 il0"0 TStF'0 i8i0's 1
F6t'B TBr-0'0 r0t0'0 FIO'8 ;Ir-$' r-0'cr 9Er-0"0 f f r-0'0 I9t0'CI 6Sr8'CI *'r
9t0'0 gif0"0 f8Lfl.B 6ts'0 r0?0'0 6f0"0 BIFO^O [rCI'I 9gFD^ 9trF8"0 I-I
!EF'O S9F' 9F'0 ESt'0 96f fl.0 -cfl9fl'0 9rsCI'$ 9iE0'0 Lr-ECI'0 8rE0'8 9"1
6950'D TigB,O iggB'B rt'0 s9fl'B *T90'0 CI99 E'90"0 s59B"S s99S"
T890'S F690'0 s00'B EO'O sr-fl 0 6f;0'0 F90'0 8ii0"0 r-6B'S 8088"0 t"{
t-t80"0 8r-88'0 r--c8s'B 980'E s88fl'+ I O'O 8t0'0 1.960"0 TE681S s9s' &L
!8fl'0 I]BBT"g OTEI'B 8r:SI'& 9SSr'0 EOT"O r"dT'fl [T IT'O IgET"S T9II'O 7'T
0T r'0 &6{t' 0Tlr'$ 0t-i,r.I'0 TSTT'B Ii;I'S i6rT"$ FTI-T'O sgr-T'0 sr-T'0 T"T
6b-I"0 1BFI'0 giFl'(} 9tF{'0 69FilS r6FT'0 sn9z'0 tgr"0 egsT'0 i85r"0 0'{
ITFT'O grl9I'0 099r's E39r'0 IIT-8 917tr'0 t9r's 8rT"0 rlst'0 I'gT' 6'S
rssr.0 F68t' ;iE.B 6F6{'S 6r' sfl0i"0 btn'0 T9i'0 69r"CI 6ETt'$ 8'B
siTi'$ -l-,- LL U 90[t'B 9ft['0 99t['0 96'r'.['S f,rrf,'0 8E$iT 68r-9" 0f'9" o
TSf ['0 t-8h' FIgf,'B gtgrg 8Ei'S ET9['0 t-'9E"0 919f,'CI 68tt'0 f,ti'CI 9'
9ii'0 8r8t'0 r-F8r'S i8'0 t6r'B 9t6i's n86R sr0f'0 sE$r-'0 s80r-'0 s'B
TTIg'O 9gTt'0 6rt'0 8t;t'0 F9trg 0[-9"0 9gEg'o r-"0 60Fr-'0 9Frr-'0 f.s
[8Fr-'8 0i:l,f' t 99f'8 fr651-"g it-9b-" 699r-'0 rsD' 9fl.-"$ t-8b-10 r[8s'g g"s
6!'8S' 689'0 9S6!"8 f6g gIF'$ iE0t'0 f'8 6iTf'0 tgTF. 0f,.'r0 r0
itt'B 98ti' ssi'B 19r?'B F0Ft's r*}ti'0 r-stt"0 gF'0 [95F' i09f "0 {'0
rr9F"g rs9F'0 rtt-B T9i'0 IOBI'B 0tst'0 0889' 06''0 096r'0 00Bg'0 o'0
60' s0 0' 9S' 90' t0' t'8" i0' tB' 08' 7
serr+slPefsg selqeJ 8W
{4v
6 0.265 0.s53 0.906 1.134 1.440 1.943 2.447 3.143 3.707 4.3t7
7 0.263 0.549 0.896 l.l 19 1.415 r.895 2.36s 2.998 3.499 4.029
8 0.262 0.546 0.889 l.108 1.397 r.860 2.306 2.896 3.355 3.ti-l.l
9 0.261 0.s43 0.883 I .100 1.383 1.833 2.262 2.821 3.2s0 3.690
10 0.260 0.542 0.879 1.093 1.372 1.812 2.228 2.764 3.r69 3.581
1'l 0.260 0.540 0.876 1.088 r.363 1.796 2.201 2.718 3.106 3.497
t2 0.259 0.539 0.873 1.083 1.356 1.182 2.179 2.681 3.055 3.428
l3 0.2s9 0.53 8 0.870 1.079 L350 1.77 | 2.t60 2.650 3.012 3.372
t4 0.258 0.537 0.868 1.076 1.345 t.761 2.145 2.624 2.977 3.326
15 0.258 0.536 0.866 1.014 1.341 1.753 2.131 2.602 2.941 3.286
16 0.258 0.535 0.865 I .071 1.337 1.146 2.t20 2.583 2.921 3.252
77 0.251 0.s34 0.863 1.069 L333 1.740 2.t10 2.567 2.898 3.222
18 0.251 0.534 0.862 ll067 r .330 1,734 2.101 2.5s2 2.878 3.19i
t9 0.251 0.533 0.861 1.066 ll328 1.729 2.093 2.539 2.861 3.17 4
20 0.257 0.s33 0.860 1.064 1.325 t.t25 2.086 2.528 2.84s 3.153
21 0.257 0.532 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.1 3-i
)) 0.256 0.532 0.858 r.06r t.321 1.7t7 2.014 2.508 2.819 3.1l9
23 0.256 0.532 0.85 8 1.060 r.3r9 1.114 2.069 2.500 2.80'7 3.104
24 0.256 0.531 0.857 1.059 1.3t8 1.71I 2.064 2.492 2.197 3.091
t< 0.256 0.53 r 0.8s6 1.0s8 1.316 1.708 2.060 2.485 2.787 3.078
26 0.2s6 0.531 0.856 1.058 1.315 1.706 2.056 2.479 2.779 3.061
aa 0.256 0.531 0.85s 1.051 1.314 1.703 2.052 2.473 2.711 3.051
28 0.256 0.530 0.855 1.0s6 1.313 I .701 2.048 2.467 2.763 3.041
29 0.256 0.530 0.854 I .055 l.3l I |.699 2.045 2.462 2.756 3.038
30 0.256 0.530 0.854 1.055 I.310 L697 2.042 2.457 2.750 3.030
35 0.255 0.529 0.852 1.052 1.306 r.690 2.030 2.438 2.724 2.996
40 0.255 0.529 0.85 r 1.050 1.303 1.684 2.021 2.423 2.704 2.971
45 0.255 0.528 0.850 1.049 1.30 t 1.619 2.014 2.4t2 2.690 2.952
50 0.255 0.528 0.849 L047 1.299 1.616 2.009 2,403 2.678 2.937
60 0.254 0.527 0.848 1.045 1.296 1 .611 2.000 2.390 2.660 2.915
70 0.254 0.521 0.847 1.044 1.294 1.667 t.994 2.381 2.648 2.899
80 0.254 0.526 0.846 t.043 1.292 t.664 1.990 2.374 2.639 2.881
90 0.254 0.526 0.846 1.042 1.29t t.662 1.987 2.368 2.632 2.878
100 0.254 0.526 0.845 ]l042 1.290 t.660 1.984 2.364 2.626 2.871
oo 0.615 0.525 0.615 1.037 1.282 t.645 1.960 2.327 2.576 2.808
450 Tablas Estadsticas
6 0.68 0.87 1.24 1.64 1.94 2.20 t0.64 11 .41 12.59 14.45 l6.8 I 18.55
7 0.99 1.21 1.69 2.11 2.53 2.83 t2.02 12.88 14.01 I6.01 18.48 20.28
I 1.34 1.65 2.18 2.13 3.14 3.49 13.36 14.21 1 5.5 1 11 .53 20.09 21.95
9 1.13 2.09 2.10 3.33 3.18 4.17 t4.68 15.63 16.92 19.02 21.61 23.59
10 2.16 2.56 3.25 3.94 4.45 4.87 15.99 16 97 18.31 20.48 23.2t 25.19
lt 2.60 3.05 3.82 4.51 5.12 5.58 t].28 18.29 19.68 2t.92 24.73 26.16
12 3.07 3.5'7 4.40 s.23 5.82 6.30 18.55 I 9.60 21.03 23.34 26.22 28.30
l3 3.57 4.t'l 5.01 5.89 6.s2 t.04 19.81 20.90 22.36 24.74 21.69 29.82
t1 4.07 4.66 5.63 6.57 1.24 7.79 21.06 22.t8 23.68 26.12 29.14 31.32
l5 4.60 5.23 6.26 1.26 1.91 8.55 22.31 23.45 25.00 21.49 30.58 32.80
t6 s.l4 5.8 r 6.91 1.96 8.7 r 9.31 23.54 24.72 26.30 28.85 32.00 34.21
l7 5.10 6.41 7.56 8.67 9.45 10.09 24.',71 25.97 21.59 30.19 33.41 35.12
l8 6.26 Ljt 8.23 9.39 10.21 l0 86 25.99 27 22 28.87 3 t .53 34.81 31 .16
l9 6.84 1.63 8.9 r 10.12 10.91 11.65 21.20 28.46 30.14 32.8s 36.19 38.s8
20 7.43 8.26 9.59 0.85
I I 1.73 12.44 28.41 29.69 31 .41 34.t1 31.57 40.00
2l 8.03 8.90 r0.28 I I .59 12.50 13.24 29.62 30.92 32.61 35.48 38.93 41.40
22 8.64 9.54 10.98 t2.34 13.28 14.04 30.8I 32.14 33.92 36.18 40.29 42.80
t1 9.26 r 0.20 I t.69 13.09 14.06 14.85 32.01 33.36 35.11 3 8.08 41.64 44.18
21 9.89 r0.86 t2.40 13.85 r4.85 15.66 33.20 34.57 36.42 39.36 42.98 45.56
25 10.52 1t.52 13.12 t4.61 15.64 16.47 34.38 35.78 37.65 40.6s 44.31 46.93
1A IL l6 12.20 13.84 r 5.3 8 16,44 11.29 35.56 36.98 38.89 41.92 45.64 48.29
27 1l.8l 12.88 14.51 16.ls 11.24 |8.tI 36.14 38.t 8 40.1 1 43.19 46.96 49.6s
28 t2.46 13.56 15.31 16.93 1 8.05 18.94 31.92 39.38 41.34 44.46 43.28 s0.99
29 13 .12 t4.26 I 6.05 t] .11 I 8.85 19.11 39.09 40.57 42.56 45.72 49.s9 52.34
30 13.19 14.95 16.79 I 8 49 19.66 20.60 40.26 4r.76 43.11 46.98 50.89 s3.6'/
35 17 .t9 18.51 20.s7 22.47 23.16 24.80 46.06 47.66 49.80 53.20 51.34 ()0.27
40 20.1t 22.16 24.43 26.51 21.93 29.05 5 I .81 53.50 s5.16 59.34 63.69 66.77
45 24.3t 25.90 28.31 30.61 32.14 33.35 51.51 s9.29 61.66 6s.4r 69.96 73.11
50 21 .99 29.71 32.36 34.76 36.40 37.69 63.17 65.03 67.s0 11.42 16.15 19.49
60 3s.s3 31.48 40.-18 43.t9 4s 02 46.46 14.40 16.41 79.08 83.30 88.38 91.9s
70 43.28 45.44 48.16 5t.14 53.15 55.33 85.53 87.68 90.53 95.02 100.43 104.21
80 51.17 s3.54 s].15 60.39 62.s1 64.28 96.58 98.86 I 01 .88 106.63 t12.33 116.32
90 59.20 61 .7 5 65.65 69.13 '/ t.46 13.29 101 .57 t09.97 113.r5 r18.14 r24.12 128.30
r00 6t.33 70.06 14.22 71.93 80.41 82.36 118.50 t21.02 t24.34 129.56 135.81 140.t1
120 83.8s 86.92 91.51 95.10 98.46 100.62 140.23 t42.96 t46.57 152.21 158.95 163.65
45L
7tt
lt fitel ,{ 6 a\ I I13
6
i- .s5 9-5 :-j j-s j-9 fr
u+- +- ! ttt i tl
..,-n ltt tr{ f a ,n 1i
^ j-iLf L- t J- 1
: t:a
_r-11 :r-i-l
.
f:
tjf.= Lr u I 1 .i 4 to f 1t-t
_1-
tl l i-lt J-t; 4-t.1
I .-,- n 1
-i t-l
-1-Y
t-q J L} J-
lr _t I l1-
lr
LO
rx:i] $i l_i -i-; i-9 1- u _!- ! l 3 6-trJ A
_1
''! i l- lo l J I li
++- +
r --r-i J\-i A
L)--Ll ,-,
-' l-i j-l l-g j ti- 3 -. I l 8- A
1.1
r.= 'J J .t
.-
cr--r
1r 'a
)-> ) l1
-" 6- $
L4-,i. J -l r_i 1
{ A .: O r C
I:
ii= < r i r-l t -+- 1 'rf
452 Tablas Estadsticas
-4 .t\ f?t {{' *{ a.,t r-, cr !+ !p r.- (r cl \ct r.l crr i. ?,i 19\ r-. ,.r (fr rt L': r @ r y rr (tr r-. rr! rfr .4 ,:.1
.i \.1 1'l r-. .4 r'-. $il . -.d { 4t\ (tl 'r
q u) \t: qJ rt t.t t(t t.t r-r r/1 +t 'i "t $l
f-. r-. !(i w -t fr ..r a.l ..i r.i .'4 r.. ir
I
a{ sr af @ rrr r Cj} r,t q {r1 gtr "rf a
1. er r ' {: r. (.i r-- ,., ,., t.. (^ @ u, '-i $l rF! f.l +*d (1r ('1 idl -+ r (5 Cr at\
c.: "1 r -{ r-. r/1 arr (3 fJ @ m r-. r- r-. r- rC E W \O r-r rar ht ra) rr t(\ tr rt {:'f tq f fr rfl fq f. .*.
* \$
"(
C r'- r.r c:J ,tt r.-' rl r-' l. a1 5:r. r-. .{ r-. (i {tr \) .-l - . f)t r- qt \l .- D r- ql '/- qr it *{ @ tf: t- !I:'
".r * r.? *, .* tr, r. r.i ,tj Al c),i sJ ? 11 T:. rj r-: rq rf) \ri frdiI v) Q tn t(t tf\ ."t *i *f \
r7r .q (q rrr r
a-l a,'n f+! f.t -.{ r{ f-.1 -.1 .'l (-l *! !\i sr d d ri .-. d 'r* ',.-)
s .-1 +d < 4 Fr s.., r./. !4 4 f{ !r
@
i4 r" \4) cJ \() tr qrt rQ 'n d4 r (^ ef' ( '.r .-, @ r.t rt .". -^ rt \{) *:f f' T' c.: ch d r-. * s *l a{ qF +- @ c>
rriht--.@--{r-rf4r.{r\di)fl\f\@m@r".r-.r1r'..Q\o\6Js\\clst.ltftttira-l."tq\'l..fcrrfqrrr
rjo',ri
\
ri r.iririr..i"r..-i;*.ii^.j...;{*j.i;*i-.;;*; ;*i;;J**"i -.-
rP \CJ r-..{ r-. <> @ ' \ e4.*'\C:.-, -. q *{ \O s.l .t (1 ( r- w '-, *1 .., r.l s{ sl (> 4 q} \l '.1 f
rfrr.F'4*,?,n.r.1 *qqlql4?@.r".r"r:.r-r':\l\qtq!ci{lqtftt.\4r'.er.qih.ftl,/f'
...l('r'riltc.|f'"ff'r,l'.flf'l..|Ne.l4sd4+-q.qd!\s..qFl.q*q.{Fjfi4
\C5
*,1 {.t @ r:f N \:t r r{ cF J r'{ \p,. \o r ' r.ef d lh a q} e|f (p! r.. -q 1 (!, q rf" rq r-."cf* rr'.,q < ( rt
r-. rit +{ m llll m rrr s.l .r ., "*r <) c) qlr 'f, @ 4 --4 F{- r'-' T-. r'n f- r. r-. r.- \C! ! \tr \tX rrr r r In lflr .41' rd
E
f{ --i < ',i ri ri r.i ni r-l r.i r't ci r.i j
qJ
*' * "J *i *i *'i *q *i "*i ; ;; *i i * i..',i -'; "-"; .- *;... -
.'| rl () r-. 14 ra /rt x) nl \Y r- (2 .r -- r-. ()1 ..1 -., ( u:) t rr .* {) fi r' \() '- qf /r! a.l \4J r,1 q'"er r" \e' A 5
a't r.l f l a fl . \f) Sl /.r r.l -e :a cf c) a, o @ vJ @ 6 @ - r-' r-. r-- r. r-. r-. \c) \ (, r r^ rr r.r rt
qf}lt\t1?1.'lr{rlr,ll'r,'lr-l...|.*r!{*l4vdi.!ly4sq
\
4F
ql c-.frl '.' .F ^l r2 r. \.t f .l C, r-. s) r.t fn .q ") q m r- \4) r-r (J \ ql ..t - 4 (J1 r.
cJ *r ,-r r
c.,..tr.la{@0\1 '.' q E
rqr.{..-4)cJl}cJ\cllcl\JcoJ@q@@r-.r-r..r".r-.r".vJ\()Q\l'{Jr'r
tsd {;,
J
E
+'$ '\. (':7 r-. {:: r':. 4? tr @ ?.r rr .-.) ttt . rf,) 3f ..' ,.
r-. \:l
rl
r a.. rt, r-) rrt (.1 .l r-r c
. | '5 s 'rr ff1{ nr
1 q_tr
r r{ "*' .} f}q E-J r-.
q r-. r-. r'.
..*J @ lrJ -,at fa
r-, v.: l4:l tf,r (l)
.,1 -.,
\ (c ,'-
t-l
rl a! -.{ ..J dr @ @ .n vJ v @ o)
14 \f,
e
& f" <) .t -1 q? .t a rt <j ct rr' I- Ft r" -rl . t @ t.t i, -. {) m r' r-, "1 r.t ..1 a <}l t)' { i) @ '. rrt \.1 r-
E .l 11.r'f n1 rlfr\ t,f|-,-,cicl<>ol(l\..n<1 cr, m(tDr- t r-.{JtrqJ\(!'r
WA I,,..t -@Fp,anioi
!<}
O
,, qlf.l
,(r1 .frr:.()Y{>.rlf4f-lr-rmYl'{}uiJrqc4qJ1ta{((ffir-.{)r,1 .drdr--q..rh@r--\()u=.
\a.l(I..14tr-.tat.\1lri-'t?{rae{i:)C:\()(r!(}Ci!ftfrr@@@4bSr-.f-,r'-.r0(CtlrCE
'i& -
\S @ {f Yll t" \J +j.,- r-" rd{ \r..t cJr r{J r.r \) @ !!J',.Fr.-t 1d (} 9) r- r-- \df r- qrr !e 3)T f4 -.t r^l ch.-
'E
n r.1 S.J
a trt a.i.t1 ':,.| 4)1 r'-. r-, $1 .t 11. -'r *i C> (1 t) (J 4h cn (r1 q {:r @ @ @ 6 i c - r: r: r-l r- r:. \ \9
L
.. r:l ff t.t <1 eJ r- cjl r-. @ L-.: 'J C: '.' ri .J ., ,f,i @ (.t (5 f- E r., fl r.r --
r:t r' qf rtr
Q' r') rn tr- r.r +r .n .l ., i)
rf rl l ..r u\ r-. t.t t:l .t rr ...| (-1
^{ * ';: q} (}, r {h l <.h (ti .- {.}, (Jt <Jr
r o' ,i rr rj i -"i ":i ri -j r' rr r. r'i n{ - r.i ri ri ':'i ; '.t . .- *.,; .,.,, "',' ..; .-: -" *.i *i *i *; ; *,j ..'; -
o m r'-, r'. r-, r.:" r-. I
ftJ
- f, F) = 'ifl \e r- qo':\ xl E 593 Fi F1 Fi ri il Ii H !; fr ff +ff g F * 3 ;
R
= = = == l!
D$'E !i'T !'E SF'' gF'i ll'{ 9'i sg'E LL $ -'L UL *
gs'{ ss t +'T Fft';' 8g"i I[' t' i9 . $s g n.t'i m
ffi
f it s 6g' 8F' tS'$ ic' s9' LL 9 VL I i8' q$'1 68'I r-.'E ., [*' Et'u 6'i f [.i 9f,' 8i'r 6s'g i6't 0CIt
*t ni'T f*" A4,'l Ci t 65'X 69'E $'I $S'E ts' 98.tr s6'l i;i' F''I ItlL gi L. UiL LL F' 3 Ct 5 !6'5 0.6
!i {t ;t'c ?g-E s9-i s'{ st.c [8'n F8'T $8'E 16'! s6-rr ss'r 9*: t$'t [r.r Ef i 6F' il- 1't g$'i $E
t5'I 5!'i g!'i f' E9 'e'E !s.' Fs'i 98' 6s-I [6'I .6'! 0'E LU L f 1 L {'i.. sil[ ss'i F' 5I'5 86'! 0
c'l ef,." 9q- sg'l sg.t s'l F8' S$'T 68'[ t6'{ S6'g 66't fo'e {.'g L L L !{"[ g'e [E'r 9'E 5t'[ 0*'F ts
)f L: t s-E Eg't 69'{ 8L'{ i
LU
o'? aa-
VU
z
5'E !6-n 66' t#"[ s" [$'[ EE 6z Et' st'[ 6T 8g'g t$'f s
YE: ,69"1*9'I $-{ F.'T FS'C ffi't !6'g i -'g
LU t 8S'r ['[ 8{'e 5f'[
l-'7
VV L {rf}'I
?V L t5' sf' ng'E F8-e ff'5 E*F 0t
[9'5 S I 9'! 6{.'I FS'I l5.l IU L.
M'!
L 9$"C S"; [I'e 91'fl 3e t e'fl ggT LIL E\t 69'C {.6'[ [t 5 J.;'f B[
ES'C SC'i VI'[ 8f 't r" 8' s|.e
FI.
; F*' i't {'tr l$'r s$ r r.6'f t$'[ ss' t'c 5t'[ #T 96[ [g'5 8t"F 6t
g9' [ l s.'I cB' s'i 9'6'I *,s't *s'e s8't {{T 5t't 63't Fe'e 6{'t gtT E?" 9!'{ T'C !6'[ F['[ S{'} $E
t\ g'{ F'T I8"E F8-t 88't L6'{ 9S.[ S8"{ *1'C gN'E I'E sr'fl E{"[ lf-r i.t'c ,t" L i_! L t.'g 9-i Ef'l {c'F LL
E 69 E 9'i l.s'r s8'1 $6'1 66'E s'E 6S. i'[ g'fl BI'l .T?-?
T.LL
t.
LCL i5' 6S'e F'f, 6!'t t'r 86' 5 5 r'3 9t
ro
o
Ti-t
L S o/'r
DL fs-c 8'r 86.: t{}'U 60't [1'l ?:- gt"c or'c a--
}.L L
dt'7
OL. L F['T O}T 6t' 89'e 9L'7. 66 $['I i.i'] J"
tto
q st'1 $8'i gS'E 6S' fr'f L-n'i i{-'[ [1.i st't $[' w'[ !'r 0[T a'a
:'L -5'7
L$L $'t t9' B-g rs't sF'E gt'f Fi
9 l [s'{ 88'I E6'{ gS'C iS'[ ggT t'fl 8r'[ 8f? f['[ rr [t'I LN L IS L r!' t9. 88-t 5.S't [t'S 8',['F b
86'i $.[ s['t [{'{ 8f-t 5f.e gx'c !g' s'c s' _fE g fg''g s5'F
ie
ll Ea'E 58,'E ?#'8, y6'g E[-r sft st-t 9f i
Ed gs'3 8B' f6'I 96' $. ETT B"e s' fll't l' E['[ 'r f' T3'T, SF' r.f'c 89r f8T 0'5 r'g ig'F IE
r FS'S {6'S .r 't *3's j'?
AU L
,t't
LI. l. IJLL
^?'?
+-'a
ILL !r[ 8't'E If i 5g'u 6f'e !FL !L tfi L !i L t't 8I' 6F't !t'F s
o! E:8' F6'3 ffi'e ff [ 9i'
ts'[ $'E 9E'[ s['E xr-'[ tf'[ 8r- F' & L NL-? L?''
ts L :T't vi'f 6'[ f{'f t!'t 8['f 6t
OA s'3 86't s'{ 90'i !1'[ 6!"[ t"e 6r {E'[ St't L'[ *s' L :rf i!- !r! B'?
L 8E? slT i. 56'f 9$'t !!"5 {F'F $T
O'(
?4 s6'T C$'r ss't 0T'i cI. [e't Tg'c [E-i 5ffi 8fi trr !F't 6F e s!'t I9T 81" l8- 96' St't 65'[ ii'! T
IP 3S'[ 0'E 'e 5I'e 6'C 8["[ rr.a r a'? L L{ L
-M't
trl'(
rr', *'t
Lf L tf L 6?T F5'[ 6!' W'T *' s8' {0'[ tt'g t9'5 6F'f 9I
8'fl 0['[ gr[
-!.
Ha t
LU L
&'? ?t'7
L' L fg:i #'7
r-t' L
?&'T
L'' L fF'fl BfT TE'T rs-c 698 f$"e t'[ 6" E6' 9S'g 6e't 89'[ ]!'F 9I
o", g'[ 6I'[ w-v t7'7
E5'[ 6r'[ 9F'[ ig'E [q'e s'fl s"fl g9-[ st'[ 9'E s8'E 96 e {t"F Fg'[ F'g ffir FI
E YLL LIL trST
O-
oo r'T 9'(, Eg't F5'[ Er[ gF'e [5" S!' 85'[ W-[ [9'[ .s'E " .'[ t8'[ [6'C [S't Bg'[ F'5 f 8'[ 9'F EI
A. sE'u E5'e GFT ff" rg't
avL ta',
vtL 9't t*'t 99'E#'E LL'z. 5' S8' (s-[ [6't B0.f II'5 gt't 6f's 68'6' !'F TI
3Z ]v'[ 9]"[ Ig'e sE'l !'[ !9"[ 7l '7
LLL
Si 'Y
TL.L gE 6t'[ [S'e gsT 06" gst I8-g 6S'[ Se'F s['5 6!'S 86'g ]8"f II
F!'C 6g' $9't 99-t #'{ {.'[ !8t 98- 68"[ 6T F6"{ 8S'E eS'[ f
LU
{\'C
!
tY'r-
t I i 7F-f F't sF'f {'g $'? 96'F NI
tu 1 9L;7. s8'E 58" 98-e F6'[ TS'E [8'[ ss't $-5 0I'[ Ft't 8t:E 9Tt 'r [-5 8t'f [9'g 98-t 9['t tx's 6
<, f6T 6' es't w't 8$'[ E['[ t'g f'.-[ 9t'[ $rf t5'[ rf-r f'r F9'5 0g- ss'E 69't F8-5 *? gf't trs B
d a7'{
L i
f3'c
LL [5'tr Fg g er-l *'r- !s'5 5!'5 $'g !'5 ffi't F9-[ Sg't L-J l 'r- J A-l; t x-l- $'s [t'] *"'? 6t't I
rd
g',t I'f -tL S LL T E8'5 $'[ F6't $6'g ss-t Es'F
9S'[
f^-!
)r\, fr rit '!r
^f !$-F [E 8e''' 6rF $'v 9 F I't 66'9
Er t v F'F }F'F gF-F $i'F 9S'?' 9'F Fg'F 99'F 89'S $.'S' *:'* I f'1r [8'F 88'F s6'F 5S S 6T'9 IF'g 6'5 n9'9
[9'! 99'5 -t r'5 5'E 00't 96'5 r$'! 6$'5 16'! r.6'S g$'t 80'9 FS-g 09 9['9 9'9 6t'9 6t'9 F6'9 ['
t!'8 5E'8 8!'B 65-8 fl9'8 99'E $i'8 I.8 ['8 F'il gi'S 6'8 ;8'B sB'8 68'8 f.6'8 {$'6 '{6 8[.6 !i'6 5n'0f t
&! 6C 6F'68 a 9"'AT J +'J<?
$v-s Et'K *'ar
r-t vt
?*'F
L u* .?'6 C'6i F'{ 8F'6{ c'r ai't
Bg'67 f tt-61 st'si fi'sE 9{ r 80'6[ r!'si
t G I UlL V D.L s !t F'(Fi
igf fgr B'iEt t'tqr l'na ? 't:- n i *:" Jt ff:, t cb
o ttL \u''L 6'rtr 8'9[r 8't[f ['sF{ g'Fr[ I'Sir S'66t f']91
ffi 0I {H F 0f sE sI rI tI il II 0t 6 I A I S t r- [ I eu
.ropErurnu F ercd pElJsqll eF soFE$ :r ff
A
g\
r: Gradss de libertad para el numerdar A
tla l ? 3 -t 5 1 8 9 1$ n l: 13 14 15 ?* 3+ dt) 50 10 s
i I 9l: Lrt 1 *+s l 9.16.t 9-i 3 9t8.6 9l]. 9sr.l 9S.r.9 ggi ! ]{*} l!- -rt,
I .11.8 t99 s61 899 S 9.,S.' Yi: i ut_,s [LrLt i.U,-l -u:
_.4
a -:1 1a ?1 a1-- an-.ar t^ 11 1a a 4 {1 1a 1 -n i a d( 1^1 aa d in
_1__r ! -^
_r:t-Lfu .-1:t -. ._tlJ___r ltr-_\tI _1y._!-- _1Jq-_1{.t J:l J i -ly-J-q ,1:r_r iJ ]Y .+ z. _1y -+ I -1t i_ -r:/.+-r _1:t.-(J -ay.+_l 3Y.1v
^ft
-1Y.+ -l'.+ -1Y-+ir -r:/.J '
! a aa .,r
4t.4 j..*.U-
3 1t.4{ i6$4 1-- 4
:--
{i !^
--.tt/
Gt 6d
! t4l_; f4.61 i;_ _rd I +.+ _r
\l{-+-
r 1
-+_J. 1.{.t8 }4.1 :4.i1 !4.S8 l+-lja .t _1.9'll I _1-)u-
:l :.r:l 3$-Si c*a c4 ct6 Y.-.U 5-U r s.-qs s.9+ s.s* s t9 n rr-
-J-r
11
-.'- s.6s s.6,6 s.i6 $.{5 s.fl s.38 s.-1: s t6
{0.$l s .{l r,.,9 ._-ry I l_l *8 S.Si 6. Jl il s,i9 6.16 6..*_1 6.-il 6.1._1 s 8 s.t- 6.{ls 6 0l E
ssi "i)6 l] l] O
--r -r Y-+ i.st l.ts i6.8 jil i.4S :i.,t I i 1a
/
_ -_1 _r .-1_1 i.:r8 l.ll -\.1 I i.C'l i.8: .1.9,8 $.9': :r gI D
7 s.$r 6.i4 _i.g_c 5._11 i ]9 5.11 .r.99 .{,9* ,t.81 4.t6 .r tl + 6t $.6i .$.6$ '{.-l 4.41 S_16, +-_i : ^
+_<
a .! 1! a'!.,
^-
I I {t d.06 \-t
).+-
*-^i
-r-LJ
1
+-- .t.si .t.il +-+-1 +--i 1
+--1 J {4 +
\ t .{ 14
+-:u +.i tl4
lu +-t_r . ^ ,
+-tI,J +.Lrd
^^
t
J-:
+ 4
-+
1!
_:--L
4:{
r-:i
1aa
_1 {J.r
-r-+rLf
^
f f -1
-
l0 69+ j 96 a Ol
- d-r
-t -4':r
+-+ ' .+1l
---- + u., -\-:l-r i.8-\ -i.ig 3.ll _i_66 J-tl- -1--1
j.-il 3.l .l _1._;i i.t6 -i l: 1.15 3 0'3 5
ll 6.ll r.16 t.6, 4.:S 4 *1 i 88 1.t6 _;.d5 3._59 3.i_ i.'{ l 1..t3 :i.39 _.J,6 t.3_i 5.t,1 3.tl r-'JD i.V:r r.E6 l.BS -+
tl i-i 6 t ,n -"{l .{11 lOg _1 _1_t - n 1l n ., _t-_1_
I an
_1-,
14.
l.tt J i$ l $t 196
a
Y:
^4
a -
!- J :.s$ I ti J(n
Ox
-- ;.;
_1 - ., _1-_1 -1--: -
I3 C+. -1 tj :-_r _) +_,.fu -l - r j '! f,.J _" :
: --1:J --r I
\ ai a 1A
_1.:._! -4,_u
+ *--
I :-,
a t1
: :- 3.$S 3.Si l.ti l.${ r
-
to
.ro
a.i
I1 ..-
1 .l '1 .:-1
-1 -r
l.gs I i:, l.s4 I li 1 .: a t3 ') !
l.t 6.i* 4.$6 .4.t4 i.s9 _t 6
a
,a
*-^
_ru
-
_1,,1
-. 1fA
-1-=.Y
- 1a
-1 - i -\- 1 -!
r -'r
_l-tfi
1n.-_
_a-_r
^. t,t
_r.iJ:
\ A1 1 .
a 41
oo;J (!-AP
'u<w
t5 4a _t-"! -:
;-;_t
1 nn
_r-J
- i
_i.+: -i.t,i
r ni
_1,-il
a t1
_-. l 1.86 _;
rJt t.8s :.86 : l ?64 1 r_&
I S6 l..el a --\- 1 a'
- +! ') -
I S9 I9_i lS'S lSl l.Sl : 19 l.6S l.:'l =.-; ;,-
L'-d + . _a _]
l6 1a t AC + l-rs J, .: -r -1--1!i
jl4 _itl _1 l_ _r-t_) -rl -
!l 1 -rir
_-+u
1--1
Y_t-o ^.
:t] --;.st {.6 is6 -ii: _i19 ,i.:f j!_liJl a c: a Q' 1I tll f 0 I i ].fi,s _: 5l I +5 I _i5 .l r'9 I 15 11: I n
'lo.{
iJr^r+
il -- ftl_1
_r
.1
+-+- 1 _ _1_:
a lL-^
_r
a ar
-vY :.v . I St 1.8+ tti ts a.r a4 l.i6 I il l.l I il 1 1i a 1: 1l> <lr
-- f 4 . 1 s r
_a .
R J
_1 +:
: 11
_1-;-
1n-: 1^1 1Qt 144
ll+ l6r \A^ ai :.i_1 I i$ t.-ig I ll )a )'. l.l I 1a
-.>
a -^
= uu
il6'+
1 ,1.( l
1l J- -r a-f-) _r-,_l _r-Jl -1 -D
_
-r_r-
^1
1 i.^
,-3.i 1ar
;, 1
141
:. .'J :.6: I5: I -il l.:i- !-_,d
a1: a+a
_ + l
1:4 1lj 1
- ^
1 14
;-r- 1
:
34
\- 11
_l t
-
11
l-_1_
111
_t-.'-
. -
_\__1
- i--
l. 9:a l.Sl f :o
-.i
't t4
:-JV :J I t;! = -l+ -
1--d l aar 1 fr \ tt a ?l 111
lii -l'L' .lt3 ,t1_ i^.4
:-t+
-a)
f !-r
25 r.9 .19 J fly _1._i-1 _a.:-a
1 ir
-.J '
1n-:
___) 1.i ltQ
r6i :ir 1 -i: 1 .lQ r... a.ii f:'' 11Q '1 40
---'i-i r.Y-
?6 id .l 1l _r tr., _i._a_1 _1 -
a l.
-.j+
1a
--- L :-i 1.6-i :i9 :i4 1 l f .ia
:.l l.:3 l.16
:._rg 1
_ Liy
1--
_ u_,
i ilv' I
r.
n
{ 4: .{ 1.! - i-
_a t-r,
. ^+
_r _1 1
_
- 4
f l r1 :.9t t.s8 1 :1 1c; l.ll I i ::
1 ll
- +l
1rl
: -19 t.i6 l:i l.:_i 1.f,r
i u.'
1na
; U'-r
.
^^
--)
a
i--l
n^-
3fl -- <-
-1-_1,
t *
+-i
! 44
_1 _'v
- 1<
J--_'
- 4:
-1 i l.$t t.l-i I {:; I -il '\ ii 1 ,{ 1 t1
,-+ i
1r-
--_1.
1..*
--:'i
A_l
-.-rl
A1t
- -u
lrr-
-.U.. :. ri: !.91 88 119
N
{ i "t1 .+ !1-i
_r-+O _1 -_1 _ :'r
1 ':! r a .Aa t -:1
_-_,_i
n -:
- +_l I l? t._i:i 11C 1ai I l,: 1,.:s I 11 '_.;!. i.ss :.s,i : ':r.r '!L .'U+
_{
5fl ,r 1+ Jt,
.a 1A
-1 ,ly
a
_l_l.t_
^i
1+
- D_1 I 5t t.55 n :4 a ?Q
l.ll -:16
111 a:Q I t+ 1.1: 1.19 :.Sl iar :1i !.Dtr i _)_1
7 i tI i.89 _i-_ri.
1d-
:-:rr
a ---
j-.i_r 1 --1
-.-':
1 aa
^.+ |
'1 .-a!
* f
1 an
-__au
11.1 f iQ 1r
: -!+
.1 :
- ttr t.$* l.{Jl :,9i :.ls i.t l.+r
g0 5.tt i s6 + 1
-1.,
1<
-5-
a it
^ 1-r
a .-a
r--r I
1 (a-
--q-, ?._ri l.:$ r.t{ I i i.i11r !
'1rl
-.u.f l.'J_; :.s : ss :.r5 1.68 1.i t__'_ i-nu
9 i.t$ 1.8'{ l16 l.9l lr-j l._i5 :.'- a ---{ a aa 1.t9 Il.t .ldlo 1 t.$l !.9$ s6 1.1! - :.o I I.ie x Li?
t.f 3 l.sl --v t.fl* 1.9? 5.Si l.l: !.6= :.59 !.s$
-r .l.l
lf0 i ts 3.t5 t.gl
_r.83 : l$ 1 i* 1 -*'! a ]'\ fro 1 \ {1
-.Is 1.3i
s i $i -.69 i.il :.i9 I i; l4t tt9 ? t9 I t t.s5 [ 99 i.95 1.9$ n.s? [.8,1 1.]] !.i.1 .+5 i .qJ a i +
- -r!
{ n
U!
l I J 4 5 6 ? I I l{} ll D 13 14 l5 20 3$ 40 50 l*0
.{05t .1999 14$l _lc__l _l I Oj is-59 _*,913 59gi s8ll 68i6 6&8i 6tji 6t09 616? 61.$ I 63 r\i 6-i l4 6i
<t\A ia; f!.!:
9S.JS 99.0 99.l 99.1i 99.i0 Yy -i-i )/9-_1s YH.-1 r YY--1Y :l:/.+v :rf -i L qg.,{j s.4i gs..{l 99..{t 99.dS 99.49 85
Y-q.+ vt.1 yy.:{_1
3.1.il lS.Sl a a{ an 1{
39..r - J.if -.=+ tt.9t 1j.67 t?.49 ll.i5 2t.l-i:1.tr_ :l_*i :.9s t6.91 t6.s? 16.69 16.5$ t6.,Nr r.6..35 t6.14 16.t
l.Ls xs.0$ I6.69 35.9S ji.t: t_5.ii !+.98 I ir-
t4.8S t4. .+--rJ I I a
+.iJ
i +a ! ^l
l"+__1 .r .+._1 ! .:r*.jJ is.?$ t4.01 !3.3.1 i3.15 ii.s 3_1.58 I
t { 1r- _1_
i6.r6 13.tt il.$6 !,i9 10.9t ts.l !$.46 rs.39 ts.i6 !*.si 9.96 9.SS 9.Sr 9.?? 9.lt 9.J5 9.18 9.t9 9.t4 g.tJ B j
a1.15 9.5i 8.,t5 7.Si 1.46 i l:l g-Y! 6.$4 6.il 6.6] 6_i.1 6..? 6.4i 6.-TS 6.3 S.16 5.S j.gt j.S6 _i.t j i.6 p
11.]6 8.65 r'.ig t.*l 6.6_3 .-rt 6.1s 6.S3 i.91 i.s! i.l3 i.t 5.61 5.t I.it 5._16 5.t$ 5.!] 5.+i .$.96 4 P
10.56 s.St .99 6.41 6.S.6 i.ss 5-sc 5..*t 5.35 _.fs i. f g i.$ 5.i 5.s! "{.9{ 4.Str 4.65 .57 ,1.51. 4.4I !+.J
f s.&{ l.i6 6 j j 5.q9 5 64 5 l* i.ts ,t.7! ,6.1 4.6S 4.56 4.4n ,$.:5 a.{r'ttt {.
i.Sd 4.9,{ +.-
rr- -a
+., I
.{tf .an!
*.u ,1 !/t
9.6- l,:t 6 tl _5.61 _i.Jl i.sT s.39 's.14 d.6l '{.i'T 4.46 .*'ts 4.ij .1._:9 4.15 ..:S .94 3 S5 -1.8S i_11 zb
't 8: ,*.is 4.39 {-JV ,s. 4 i$ 4.$i .1.*1 i.86 3.lS 3.5? -1.11 l.4l J. a
9.1-i 6 9i 5.9i i..$t i.*6 +.f.t .4 ?fr .{ 1'l
+.L
olJ
9.8? 6.?S J.r4 5.tr 4.8d 4.{t) $,.*s .f._i 4.{9 .{1 1{r ,{ lra 1.96 1.91 1.8 -r.$l i.6 3.5n J.+-1 J.J a io - 1a
-1-- r _1 I
?.$8 {.gfi .* ri _1-0_t -1* _r_ _i t: t.gi I Sl f.-,r :.Si f.:jd :19 t._ri l ls 2.$3 $.9.* s.ss !.]i
t.i$ l{4
7.Si .{.9: .t.$l ifs 319 J
a t
-.
1^t
L.Y t t.78 l.6l :.i9 :.45 l.-$ l. j j 3.-3! r 15 i.9$ 4l-:in *.:..'5J
r.51
n i 1A
r. ru x
6.!6 .4 8E 4_0"{ 5._i6 i.?6 :1.S4 l.Sl r..l.i l_.6.$ t.:,j l,{8 t.41 1.36 2..?: t.tt t.i: i.g.t i.S! 1:-9 C.6,\ il
693 4S1 40i -\-,\t -)-;-r -i $: "t.s4 r.il I i 1 i'l !_-,
a .{i I 39 l.i3 l 19 1a.* 1n to') t.st 3 t6 1.61. 7a
!,4_ ia il-
I ll i -j: l.f- r rl 1..$l i s9 t 8l 1.;-i t..$ I -J-t
't Or
l0{ 6.9* 4.8: 3.98 _!_J: J - 1d-t
i.tY
1 a
:-- r:.69 I i9 1 .:fr -t: r
64 4. i.-$ -_1- -Ui_r _a
f Q. a .{ r.ji :.41 t._it. l.li r.t9 rfi t.$s t.{4 tss i70 I )g I 5i 1.3 I
456 ' Tablas Estadsticas
f
f;
tr
i
*
459
n2 z 3 4 s 6 7 8 e r0 li 12 13 t4 ls 16 t7 i8 le z0
2 00 00001111222223333
J 00 01223344556611889
4 00 | 2 3 4 5 5 6 7 8 9 10 11 t2 12 13 14 15
01 2 3 4 6 7 8 9 10 12 13 14 ls 16 r8 19 20 21
6 02 3 4 6 1 9 ll 12 14 15 11 18 20 22 23 25 26 28
7 02 4 6 I 9 ll 13 15 11 19 21 23 25 21 29 31 33 35
8 t3 5 7 9 11 t4 16 18 20 23 25 21 30 32 35 31 39 42
9 l3 5 8 11 13 16 18 2t 24 27 29 32 35 38 40 43 46 49
t0 l4 6 9 12 15 18 2t 24"21 30 34 31 4A $ 46 49 53 s6
ll l4 1 10 14 l7 20 24 21 31 34 38 41 45 48 52 56 59 63
t2 25 8 12 15 19 23 27 30 34 38 42 46 50 54 58 62 66 10
l3 25 9 13 lt 21 25 29 34 38 42 46 51 55 60 64 68 73 17
t4 26 l0 14 18 23 27 32 37 4t 46 sl s6 60 6s 10 ]s 19 84
l5 26 ll 15 20 25 30 3s 40 45 50 55 60 65 7l ',76 Bl 86 91
l6 27 12 16 22 21 32 38 43 48 54 60 65 11 13 82 87 93 99
\7 31 12 18 23 29 35 40 46 52 58 64 10 16 82 88 94 100 06 1
5 9 14 t9 24 29 34 39 45 50 s6 61 67 12 78 83 89 94
.:
t7 I
I
18 I 5 l0 15 20 25 31 37 42 48 54 60 66 71 77 83 89 95 101 rl
l9 2 5 l0 16 21 27 33 39 45 51 51 64 70 16 83 89 95 102 108 f
20 2 6 ll 17 23 29 35 41 48 54 6t 68 t4 81 88 94 101 108 115
&
:j,