Está en la página 1de 462

?

ESTAASVTCA
illtodos y Z\pficaciones

Iidtin Galinclo

I'3O CII:N CIA EDITOI3ES


20ll
Captulo 1

Anlisis Exploratorio de Datos

Nuestra fe en Dios. El resto debe produc'ir datos.


Annimo

En cualquier actividad de Ia ciencia, la tcnica, Ios negocios o de la vida cotidiana, que d como
resultado una serie de mediciones, se obtiene ms informacin que las simples cifras recolectadas. El
cmo conseguir la informacin, su anlisis e interpretacin se puede realizar de muchas maneras, pero
primero se debe tener una idea clara de las caractersticas ms importantes de los datos obtenidos.

Los datos pueden ordenarse en tablas; sin embargo, stas no muestran su comportamiento global.
Su representacin grfica ayuda a captar fcilmente tendencias y establecer modelos probabilsticos.
Conjuntamente con el empleo de mtodos numr'icos sencillos, se puede presentar datos, resumir in-
formacin y dar una respuesta rpida del comportamiento global de Ias unidades de donde provienen
dichos datos.

En este captulo examinaremos varios de estos mtodos, que son aquellos que frecuentemente aparecen
en los paquetes computacionales de estadstica.

1.1. Introduccin

En primer lugar, demos una definicin de la ciencia Estadstica que recoge mucho de lo que ella realiza.

La Estadstica es la ciencia cuyo objetivo es reunir una informacin cuantitativa concerniente a


individuos, grupos, series de hechos, etc. y deducir de ello, gracias al anlisis de estos datos. unos
significados precisos o unas previsiones para el futuro.

1.1.1. Divisin de la Estadstica

Para su mejor estudio, a Ia Estadstica se Ia divide en dos grandes ramas: la Descriptiva y la Inferencial.

La Estadst'ica Descriptiua -tambin conocida como An.lisis Erploratori,o de Datos- consiste, sobre
:odo, en la presentacin de datos en forma de tablas y grficos. Est diseada para resumir o describir
los datos sin factores adicionales; esto es, sin intentar inferir nada que vaya ms all de los datos, como
:ales.
Capitulo 7. AnIsis Exploratorio de Datos

se deriva de mur:stras, de observrciones hechas slo rcerca de una parte de


La Esto,dstica I'nferencial
un conjunto numeroso de elementos y esto irnplica qrre su anlisis requiere de generalizaciones que van
ms all de Ios datos. Como consecnerrcia, la caracter'stica ms importante del reciente crecimiento
de la Estadstica ha sido un cambio err el nfasis de los mtodos que describen a mtodos que sirven
para hacer generalizaciones. La Estadstica Inferencial investiga o analiza una poblacin partiendo de
la informacin obtenida a travs de muestras.

!.L.2. Algunos problemas que resuelve la Estadstica

Para aplicar los mtodos estadsticos a la informacin disponible, es necesario tener presente los tipos
de problemas que esta ciencia resuelve.

Descripcin de datos. El primer problema que, histricamente, aborda la Estadstica es la des-


cripcin de datos. Supongamos que se han tomado ciertas mediciones, que pueden ser los gastos de
alimentacin en las familias, la produccin de las mquinas de un taller, o las preferencias en un grupo
de votantes. Se trata de encontrar procedimientos para resumir Ia informacin contenida en los datos.

Anlisis de muestras. Es frecuente que, por razones tcnicas o econmicas? no sea posible estudiar
los elementos de una poblacin. Por ejemplo, para determinar Ia opinin de la poblacin ante las
elecciones solo se investiga a un grupo pequeo, ya que es imposible consultar a todas las personas
en capacidad de votar. Anlogamente, se acude a una muestra para estudiar la rentabilidad de un
proceso de fabricacin o para de terminar el nivel de ocupacin de la poblacin.

La Estadstica se utiliza para elegir una muestra representativa y para hacer inferencias respecto a la
poblacin a partir de lo observado en la muestra. Este es el procedimiento aplicado para, por ejemplo:

Decidir si un proceso industrial funciona o no adecuadamente, de acuerdo a las especificaciones.

Estudiar la relacin entre consumo de tabaco y cncer.

. hzgar respecto a la demanda potencial de un producto, mediante un estudio de mercado.

Orientar la estrategia electoral de un partido polltico.

Interpretar una prueba de inteligencia.

Medicin de relaciones. Los gastos en alimentacin de una familia dependen de sus ingresos, pero,
es imposible determinar con exactitud cul ser el ga.sto de una familia de ingresos dados. Entonces,
no existe una relacin exacta, sino estadstica. Determinar y medir estas relaciones es importante
porque, debido a los errores de medicin, las relaciones que observamos entre variables fsicas, sociales
o tcnicas son, casi siempre, estadsticas.

Preguntas como: Depende la calidad de un producto de las condiciones de fabricacin y transporte?


Cmo se relaciona el rendimiento escolar con variables familiares o sociolgicas? Cul es la relacin
entre desocupacin e inflacin?, se responden en trminos estadsticos.

Prediccin. Muchas variables econmicas y fsicas tienen cierta inercia en su evolucin y aunque
sus valores futuros son desconocidos, el estudio de su historia es informativo prra prever su compor-
tamiento futuro. Este es el mecanismo que se emplea para prever la demanda de un producto, la
temperatura en un horno industrial o las magnitudes macroeconmicas.
7.2. Definiciones bsicas

1.1.3. Obtencin de informacin


Cuando se examina un proceso o un fenmeno podemos producil una variada informacin, entonces
es preciso determinar cul es la de inters para Ios fines que tengamos y cmo conseguirla; as mismo,
se debe tener una idea del nmero de observaciones que son necesarias para disponer de informacirr
confiable.

Para la obtencin de informacin estadstica se emplean dos formas bien diferenciadas: los mtodos
de muestreo y los experimentos diseados.

Una investigacin por muestreo es un estudio cuya finalidad es la recoleccin de datos y en el que
el investigador no tiene control sobre las condiciones o los individuos participantes. Ejemplos de
muestreos son los censos, las encuestas electorales o de consumo de un producto.

Un experimento es cualquier proceso o estudio en el que se realiza una recoleccin de datos donde el
investigador, usualmente, tiene control sobre algunas de las condiciones bajo las cuales el experimento
tiene lugar. Por ejemplo, en el desarrollo de un nuevo medicamento, en la preparacin de una nueva
aleacin de acero para usar en los automviles, es necesario realizar experimentos para comparar su
efectividad con otros previamente existentes.

L.2. Definiciones b:sicas

Las que antes indicamos son las principales aplicaciones de la Estadstica, cuando esta ciencia se
utiliza para analizar procesos o fenmenos naturales a profundidad. Pero este no es nuestro caso, por
el momento, nosotros podemos pensar que la Estadstica es la ciencia de <<deducir hechos a partir de
datos y de figuras>>.

Aqu surgen varias ideas importantes en todo anlisis estadstico: la unidad muestral,la poblacin (o
uniaerso) y la muestra.

Definicin (de unidad muestral o experimental) Una unidad es una persona, animal, planta o
cosa que es examinada por un investigador; es el objeto bsico sobre el cual el estudio o experimento
se lleva a cabo.

Por ejemplo, una persona, un mono, un plato de semillas, un grupo de facturas.

Definicin (de poblacin o universo) Una poblacin es una coleccin completa de personas,
animales, plantas o cosas de las cuales se desea recolectar datos. Es el grupo entero al que queremos
describir o del que deseamos sacar conclusiones.

Definicin (de muestra) Es un grupo de unidades seleccionadas de la poblacin de acuerdo con


un plan o regla, con el objetivo de obtener conclusiones sobre la poblacin de la cual proviene.

EI nrmero de unidades que constituyen la muestra se denomina tamao muestral.

Generalmente, se selecciona una muestra porque la poblacin es demasiado grande para estudiarla
enteramente. La muestra debe ser representativa de la poblacin general, lo que se logra mediante
una seleccin al azar de las unidades. Tambin, es importante que el investigador defina, completa
y cuidadosamente, la poblacin antes de recolectar una muestra, incluyendo una descripcin de los
miembros a ser seleccionados.

A continuacin damos varios ejemplos:


4 Captulo 7. Anlisis Exploratorio de Datos

7. la estructula demogrfic4, pol edad, de lti poblacin ecuatoriana. El universo


Se desea establecel
Io forman los datos de nacimientos existentes en las ofi.cinas clel Registro Civil. Una mr-restra
puede ser tomada considerando las persolas cuyo apellido comienza con ia letra A.

2. En un estudio se quiere conocer el <<rating>> de sintona de los canales de teievisin de una


ciudad. La poblacin est constituida por los hogares que poseen televisor y una muestra Ios
hogares de 40 manzanas distribuidas en la ciudad.

3. Una duea de almacn desea estimar el gasto medio de compra de sus clientes en su almacn
en el ltimo ao. La poblacin es todas las facturas de compra en el indicado periodo. Una
muestra de ciento veinte facturas seleccionadas aleatoriamente, servira para tener una idea del
gasto medio de los clientes.

En los ejemplos anteriores solo se enunciaron posibles muestras para las distintas poblaciones, sin
importar que tan buena pudiera ser sta.1

I-.3. Datos y escalas de medicin


A Ias mediciones o valores obtenidos en un estudio estadstico se los denomina datos provenientes de
una variable estadstica.

1.3.1. Tipos de datos


Los datos pueden ser:

1. Cualitativos (Descriptivos o categricos): Cuando ellos describen caractersticas que no son


medibles; por ejemplo, el sexo de un animal, el color de los zapatos, la profesin de una persona.

2. Cuantitativos (Numricos): Cuando ellos describen caractersticas que son medibles; por ejem-
plo, la temperatura del ambiente, el nmero de hijos de un matrimonio, el salario de una persona.
A su vez, las variables cuantitativas se clasifican en discretas y en continuas.
Datos discretos. Un conjunto de datos se denomina discreto si los valores u observaciones
que pertenecen a l son distintas y separadas; es decir, ellas pueden ser contadas (1, 2,3, ...).
Ejemplos de datos discretos son: el nmero de clientes que ingresa a un almacn en un da, el
nmero de aos que vive una persona.
Datos continuos. Un conjunto de datos se denomina continuo si Ios valores u observaciones que
pertenecen a l pueden tomar cualquier valor en un intervalo considerado. Ejemplos de datos
continuos son: el tiempo que se demora en ejecutarse un programa en la computadora, el peso
de una persona.

L.3.2. Escalas de medicin

Definicin (de escala de medicin) Una escala de medicin es un instrumento de medida con
el que se asignan valores a las unidades estadsticas.

I
La eleccin apropiada de las muestras se explicar en profundidad en el Captulo 13
7.4. Caracterst,icas de los datos

Escala nominal' Un conjrrnto de clatos cst mecliclo en esca,l,a nomin,al si a los vaiorcs que pertcnccen
a 1 se lcs puedc asignar un cdigo, en la forma cle nn nrimero, clonde los nrmeros
sor simplemete ula
cticlueta' Los datos en escala nominal ptteclen ser contados, pcro no pueden ser orclenclos o medios.

Por ejemplo) elr Lln registro de pclsonas, los hornbres pueden ser codificados como 0 y las mujeres
como 1; el estado civil de un indirriduo puede codifi.carsc como "1" si es casado y como ,,2,'
si no lo es.
Escala ordinal. IJn conjunto de clatos cst medido <:n esca,la ord.inal si a los valores qne per.tenecen a
l se les puede asignar un orden o asociar una escala. Los datos en escala ordinal pueden
ser contados
y ordenados, pero no pueden ser medidos.
Las categoras, para un conjunto ordinal, deben tener un orden natural; por ejemplo, suponga que
a
ur grupo de personas se les pide que clasifiquen la calidad de la seal de las emisiones de radio, en
una escala de 5 a 1, que representan excelente, buena, regular, mala y psima. Un puntaje de
b indica
mejor seal que un puntaje de 4. As, los datos resultantes son ordinales.

Escala de intervalo. Un conjunto de datos est medid o en escala d,e interualo si los valores que
pertenecen a l pueden tomar cualquier valor dentro de un intervalo finito o infinito, con
la particula-
ridad de que existe un <<cero relativo>>. Los datos en escala de intervalo pueden ser contados, ordenados
y son vlidas las operaciones de adicin y sustraccin) pero no las de multiplicacin y divisin.

Ejemplos de datos en escala de intervalo son: la temperatura medida en grados centgrados (donde
hay un cero elegido arbitrariamente), los puntajes obtenidos en una pruebalaonae un puntaje
de cero
no significa que quien lo obtuvo no sabe nada).

Escala de razn. Un conjunto de datos est medido en escala d,e razn si los valores que pertenecen
a l pueden tomar cualqnier valol dentro dc un intcrvalo finito o infi.nito, con Ia particula'idad
de que
existe un <<cero absoluto>>. Los datos en escala de intervalo pueden ser coritados, ordenados y
son
vlidas las operaciones de adicin, sustraccin, multiplicacin y divisin.

Ejemplos de datos en escala de lazn son: la temperatura medida en grados Kelvin (doncle
hay un
cero absoluto), la estatura de una persona, cl tiempo de vida rtil de una mqnina.

1.3.3. Valoresatpicos

Un valor atpico -tambin denominado valor inusual o valor extremo- en un conjunto de datos,
es
t una observacin que es lejana, en valor, del resto de datos; es clecir, es un d.ato inusualmente
grande
o innsnalmente pequeo, cotriparado con Ios dernis.

Un valor atpico >uede ser el rcsultado de un error en una medicin, en cuyo caso distorsiona Ia
interpretacin de los datos al tetrer una influencia excesiva sobre los clculos a partir
de la muestra.
Si el valor atpico cs un lesultado genuino es importante, porque podra indicar nn
compoltamicnto
S extremo del proceso en estudio. Por esta razn, toclos los valores atpicos deben
ser exarniados
) cuidadosamente antes de rcalizar un anlisis formal y no se los debera eliminar
sin una.justificacin
pre\1a.

L.4. Caractersticas de los datos

Todo conjunto de datos presenta ciertas caractersticas que perrniten, en rlna pr.imera
aproximacin,
deducir el comportirmiento dcl proceso del cr-ral fueron obteniclos. Las tres principales
caractersticas
son: la localizacin, la dispersin y la simetra.
Captulo 7. AnIisis Exploratorio de Datos

o tr ocalizacin. La krcaliztcin <le nn conjrrnto clc clatos cs la Posicin lelatir'r cltic cllos lllesentan.
En gc'rrcr:rl, se rrricle L la localizrcin lror cl valcil que tiene el pLrnto mr:clio clel corrjurrto c.1e clatos.
Por cljernplo, r,:rr la rnedici<in cl<r la rstrttu'r rl<,r lrrr grlipo de personirFj) l)s medicioncs estrr'n
entre los trcirrta centrnetlos (clc los rccirr naciclos) y los cLos mctlos veinl,e centne-
localiza,cl.s
tros (clc los adultos muy altos), si se srrl>one qucl esta,turas rxayorcs no se prcsentar, y se pirede
caracterizal a todos ellos con una estatura prornedio de 1.70 mctros.
La iclea de localizacin fr-ic introcluci<la por R. A. Fisher er 7922.

Dispersin. Los valores obtenidos en url mnestra no son todos iguales. La valiacin cntre
estos valoles sc denomnzt dispe'rsin. Curndo sc mide la dispersin sc desea dctectar el grado
de disemirracin de los valores individuales alrededor del centro de ias observaciones.
En los procesos de manufactura o de medicin) una alta precisin est asociada con una baja
dispersin.
El concepto de dispersin fue introdr.rcido por F. Galton (en 1886) y por W. Lexis (en 1887) e
identificado como aqrrel en el que se reflejan las cliferencias entre las mediciones) provenientes de
una misma fuente o tomadas en condiciones semejantes.

Simetra y asimetra. Un conjunto de datos es sirntrico cuando los valores de los datos estn
distribuidos en la misma forma por encima y por debajo de su punto medio.
Los datos simtricos:

1. Son fciles de interpretar, pLles los dal;os cre estn por encima y por debajo del pr.rnto medio
pueden sel considelaclos con un misrrio critcrio;
2. Pelmitcn la fcii deteccin de valores atpicos;
d. Adrniten la comparacin con conjurrtos de datos similales, en tr'minos de la dispersin.

Figula 1.1: Forma csqucrntica cle clatos simtricos y asimtricos.

La asimctra cn un conjrtnto cie datos es el lgrtrpaniiento que ellos Jrresentan a un lado de su centro
Los valores situados a un lado de la rnitacl clc los datos ticnclen a estar rns alejados qrre 1os \rlores
clue se enclrerrtran cn ei otro lrdo.

1"5. Distribucin de f,recuenaias

La distribuci,nde ,f'rec'u,en"cias cs Lrrre herrarnicnta que se emplea para resurnir', mediantc una tabla,
nurnerosos dtos dc rnancra qlle sc ponga de maniliesto l locrlizacin y Ia clispersin de lrs olserva-
cloLcs.
7.5. Distrbucin de frecuencias

Con ltna tabla de frccuencia,s se puedcn resurnir- da,tos ctrtegr'icos, nominales u ordiuales. Si los clatos
son continrros se pr-rede lesumillos l.lnr \rez qlle se los ha dividido cn grupos serrsiltlcs.

Si se dispone (le un nrrnelo alto dc obsclvacioues) r, se procede r cstablccel cr,rntas vcccs se rcpite
cada nrta de ellas, pala cletelrninar sn frecu,en,ci,u o,bsolutct, n". A par:til dc esta informacin b,sicr se
puede obtencl o1,la, que es converriente poncrla etl nna tabla.

Par'r la confeccin de ltna tabla, de distribucin dc frecuencias es lecomcrrdablc segu.ir los sigrrientes
Pasos:

Procedirniento.

1. Se ordenan los datos tr7) :[2) . . ., rk en ur]a columna, de forma ascendentc, poniendo a continuacin
k
sus frecuencias absolutas n1, TL2 ... n. Ntese que D rLi: n.
i:r
2. Luego se forma una tercera columna en la que se pone Ia frecuenc'ia relat'iua; que resulta de
dividir la frecuencia absoluta n para el nrmero total de observaciones: / - 3. Xo es ms que
TL
la proporcin de aparecimiento de cada observacin.

3. Pueden, tambin, calculalse dos columrlas correspondientes a las fi'ecuencias acumuladas, tanto
absoluta como relativa, que resultan de sumar las frecuencias de todas las observaciones ante-
riores hasta la considerada inclusive. Muchas veces, a las frecuencias relativas se las pone como
porcentajes, en lugar de nmeros flaccionarios.

Una tabla de distribucin de frecuencias tiene cl siguiente aspecto:

Valor de la Frecuencia Fbec. absoluta FYecuencia Flec. relativa


variable (r) absoluta (n) acumulada (/,) relativa (/') acumulada (8,)
rI TL1 l/r : nr ft Ft: ft
tr2 n2 Nz: Nt * nz Jz Fz: Ft t fz

rk TLI, l/:l/-1 *n fr F*:Fn:I.fn


Total n 1

Ejemplo. En nna fbrica de muebles de rnaclera, se contlole1 tiempo (en minutos) neccsario para
completar un trabajo cle armado de ciertos anaqueles. Se obturrieron las siguientes mediciones del
tiempo empleado por los obreros:

32.9 JJ.4 33.9 tao JJ.J 32.8 J.).1 .1.). i ) J,]..) 33.5
Dt <
.)r).J 33.6 1') n .),). I 33.6 .4 33.6 33.8 33.9 t')
.)J. J
o

at o Dt( tto ,]to


33.6 r),).rl 34.4 JJ.I) J.4 J -L t).! 33.6
,ta 2q7 ot 1 .1.).) .lc r
JJ.r) JJ. I 33.8 33.0 JJ. / r)r).1 ,),). t) r)r).,)
to .'), - ,/ 1 '?a r) ,) .\ 1D
33.8 .),1. ') L)J.+

J.J. / J+.1 Ji.- 33.6 32.9 JJ.t
32.9 33.9 33.8 c.t o
.ltr-L
tD t
r).).r) 33.9 34.0 ,1.).J ,u q
.),)-i
tt 1
JJ. l-
33.1
.)
J+.1 1 '),)
JJ.A 33.6 J. i) JJ. / . i 1'),4 a.)
.).).,)
.) .)t
!)().+
^

34.0 il :'t3.0 tD OD D
. DD
rlJ.+ r',
,1,1. ,),).4^ JJ.J J.+ 33.6 33.6 /
.)t r '12 r) ,j.l 1
r)r).J 33.6 33.0 JJ.1 33.6 JJ.U 33.6 33.1 33.8
,),
J.J. / ,-),1., ) 33.8 JJ.
1
1 .),)..) 33.0 .).) ,.) 33.4 J. iJ 33.0
Capitulo 7. Anlisis Exploratorio de Datos

La sigr-riente taJrla rrnrestra li clistrilrrcin cle flecrrerrcits dc clatos illrliviclrtrlns (crr 17 r':rl,rres).

Tierrrpcr f,tecuencia F\'ec. rbsoluta Fl"ecuencia F!'cc. relrtiva


(rnin) absoluta (n) acurmrlada (;\) rela.tiva ( l ) acurnulada (,F,)
,t:.1 I t 0.01 0.01
32.8 I 2 0.01 0.02
e
32.9 5 003 0.05
33.0 5 10 0.05 0. 10
,t 1I 0.09 0.19
r)J. 9 19
aD o q 28 0.09 0.28
JJ.J 10 38 0.10 0.38
JJ.4 t2 50 0.12 0.50
I4 64 0.14 0.64
33.6 13 77 0.13 0.77
.)). r 8 85 0.08 0.85
33.8 6 9r 0.06 0.91
33.9 4 95 0.04 0.95
34"0 2 97 0.02 0.97
34.t 2 99 0.02 0.99
t a 0 99 0.00 0.99
34.3 0 99 0.00 0.99
34.4 1 r00 0.01 1.00
Total r00 1.00

Sc ha presentado una distribucin de frccuencias para 100 datos individuales, pero la tabla pr-rede
Ilegar a scr exterlsa; y si bicn prescnta la, informacin resunicla, puede ser conveniente resumirla arr.
rrrtis, c;r'eando clrses. La agrr-rpac:in cle clatos cn clrscs sirnplificir Ia presentacin y el estuclio cle la
distribucin) allnqlle se pierden algunos rleta,lles.
A continuacirr sc enLlnleran los ptrsos a scguir para constrllir una clistribr-rcin de fiecnencirs cle dat,os
agmpatlos en clrses:

Decida el nmero de clases (ft). La siguienl,e talrlr puccle clar rura olientacin adccuada cn
Ia rnayor'tr de los casos.

Nmero de Nmero de clases


observaciones recomendado
20-50 6
51 - 100 7
101 - 2U0 B

201 - 500 o
501 - 1000 10
rns clc 1000 t|-20
Calcule la iongitud de ia clase. La longitrrcl clc la cllsc cs igual a Ia obsclrracin rnayol menoil
dividido por cl nLilrrero de clases. Rcdonclcc este rcsulLado pala obtenel rrn rrrnrero
li1 ttrcnor,
cor)venicnte) que tenga el mismo nurelo de decimales qlre los drtos.
/nrx - frnn
.4
k

,) Construya las clases indicando los cxtremos de Ias misrnas. Corro ayllda parzr clculos
J)ostcIioICS:

a) El extremo inferior' (16) plimera clase ser cl lrrrrero ilrnediatarnentc rnerror- a1 r'alor'
de 1a
mnimo, quc tierle rrn clecirnrl rns y qlle terlnrna cn cnco-
7.5. Distribucin de frecuencias

b) f,os restantes extremos de las clases se obtienen ailadiendo repetidarnente la longitud de


clase al extrenro cle c1rse anterior, hasta cnbrir todo el rango cle valolcs.
L, : Li-t I A, .j : i,2,...,k.
4 Marque cada observacin dentro de la clase que le corresponda. Determine la frecuencia
absoluta, 7r,, corrspondiente a cada clase.

5. Calcule las columnas restantes. IJna vez que tiene la frecuencia absoluta, proceda a calcular
las frecuencias lelativa y acumuladas) como se explic anteriorrnente.

Observacin. El nmero de intervalos puede variar del inicialmente estimado al redondear el valor
de la longitud del intervalo y que se cumpla el paso 3 a).

Ejemplo. (Continuacin.) Construir una distribucin de frecuencias por clases de los datos de las
mediciones del tiempo necesario para armar anaqueles.

Solucin: De acuerdo a la tabla los datos se distribuirn en k:7 clases. Los mximos y los mnimos
son:
r^5* -- 34.4, rm. : 32.7, rmx - trni. : L.7,

1n
longitud de la clase : ::: :0.24,
7

que se redondea a A:0.2.


Fijemos los extremos de los intervalos: el extremo inferior debe ser el nmero inmediatamente menor al
valor mnimo, que termina en 5 y tiene un decimal ms que los datos; es decir, Lo:32.65. Luego, Ios
extremos siguientes se determinan sumando, sucesivamente, 0.2 al extremo inferior hasta sobrepasar
el mximo valor de las observaciones:
L1 : Lo * A: 32.65 * 0.2 : 32.85
L2 : Lt * A: 32.85 * 0.2 : 33.05
:

Ls : Le -l A:34.25 *0.2:34.45

Finalmente, se determinan las frecuencias de cada clase.

A continuacin se muestran los resultados.

Tiempo FYecuencia FYec. absoluta -tYecuencia Flec. relativa


(min) absoluta (n) acumulada (.11,) relativa (/) acumulada (fl)
JZ.ti5 - J2.E5 2 0.02 0.02
32.85 - 33.05 10 0.08 0.10
33.05 - 33.25 r8 28 0.18 0.28
33.25 - 33.45 22 50 0.22 0.50
33.45 - 33.65 27 77 0.27 0.77
33.65 - 33.85 t4 91 0.14 0.91
33.85 - 34.05 97 0.06 0.97
34.05 - 34.25 99 0.02 0.99
34.25 - 34.45 100 0.01 r.00
Total 100 1.00

Ntese que por efecto del redondeo en Ia longitud del intervalo ha dado un total de 9 clases. Queda
para el Iector realizar el mismo ejercicio redondeando la longitud de Ia clase a 0.3.
10
Captulo 7. Anlisis Exploratorio de Datos
1.6. Representaciones grficas
de los datos
una rnanera rntly eficiente cle co'oce.
grficamente' ya que permite
el cornlo.ta'riento de un conjunto
dar rtna descripciin a. cre datos es rerrese'tar.lo
-"r,lr" rpida y rit de entender. La importancia
i: ::rff ;Tfi:,::l il:T:T.5 f*13,T# l.:, :ll" : ".o an ,isis ". t J.t i"o de b e ir acomp aado

1.6.1. Diagrama de puntos


un di'aqrama d'e puntos es una
forma de resumir datos cuantitativos,

;'":T::1,1J*?ll""Til*'q,,:T: ffiJ: il#;' en ra que cad.a observacin


si se disponu a"'lo,"r,os datos, se
cada punro
El diagrama de puntos deja apreciar:

1' Larocarizacin general de ras


observaciones.
2. La dispersin de las observaciones.

3' La presencia de observaciones


inusuales o valores atpicos.

se aconseja utilizar este diagrama


para representar hasta
un mximo de 20 0bservaciones
individuales,
ffi :JJ.:ffi .H;.:".rTT:i :::il'Ji :* ::,,'*x;:::.: *. i;;#;, s e p ue d en combi
n ar

lli"t-,;,TJrij:"ffi"#::;HX'uu au ru"' i","n,",."iuJl'TT:#il"l'?;:X[::?l".;;


iT;':
cuando se construye un.diagrama de puntos se
deben toma dos decisiones.
La primera es determinar
;i,:JffffJil,:HTJ;:::il;.1*:: ;:;**:."","11fT1,,"*u,0" ;.;l;; ,,*u
"."u,u
apropiada que
Para datos nominales u ordinales,
un diagrama de puntos es.simirar
barras reemplazadas por a un grfico de barras, con
una serie de puntos. Para ras
a un histograrl&, con ros iatos contin,os, un diagiama
rectangurs ieemplazado, de puntos es similar
oorl.,-riior. (vcase r" ,'"*io" r.o.a
#:;::i:;"t;1:"::"t'"T"1il mediciones (en milmetros) de ros das de lruvia en er verano de 2006

6'4 4'0 3'2 4'6 3'2 8.2 6.0 0-2


4.6 5.2 0.6 2.0 11.8 16.4 3.2.
El diagrama de puntos est
dado en la Figura 1.2.

i'if?sii u.,n*
Figura 1.2: Diagrama de puntos.

En el diagrama observamos que:


7,6. Representaciones grficas de los datos 11_

1. Los datcs estn agnrpados ccrca del valor 3, antes que, digamos B o 10.

2. Las observaciones sc cxtiencleu en ah'ecledor clc 17 uriidacles) con Llua concentracin entre 0 y 8.
o
a 3. EI valor 16.4 puede ser calificado de atpico, porque se clcuentra alejado del grupo principal de
o datos.

L.6.2. Diagrama de tallo y hojas


El diagrama de puntos tiene algunas desventajas: es difcil regresar de los puntos a los datos y puede
hacerse confuso si se tiene un nmero alto de datos. Entonces, es conveniente utilizar otras herramien-
;e
to
tas para realizar su representacin grfica.

El diagrama de tallo g hojas, que es una tcnica semigrfica que se emplea para ilustrar las principales
caractersticas de los datos (localizacin, dispersin y simetra). Adems, tiene la ventaja de presentar
Ios valores de los datos. Por la forma en que se construye, se debe emplear para un conjunto de hasta
100 datos.

Mediante un ejemplo, veamos cmo se realiza el diagrama, p6o a paso.

Consideremos los siguientes datos:

08 19 77 01 07 09 05 16
13 04 15 02 00 o4 01 12
es)
tar A los datos los clasificaremos considerando las decenas; as tendremos dos grupos, uno que empieza
tr con 0 y otro que empieza con 1. Ellos forman el tallo, al colocarlos de manera vertical:
)o
0
rar 1

lue
A continuacin, para cada observacin anotamos el segundo dgito (de las unidades) a la derecha de
la barra vertical, que vienen a constituir las hojas. La primera observacin 08 da
las
ar
0
1
006
Al agregar la segunda observacin 19, da

0 8
1 9

Y as, se van aadiendo las observaciones hasta obtener:

0 8L79542041
1 976352

Los valores que forman las hojas pueden reordenarse de menor a mayor, as:

0 0LI2445789
1 235679
12 Captulo 7. Anlisis Exploratorio de Datos

Podemos crear dos categoras en cada una de las decenas, en las cuales los dgitos de las unidades del
0 al 4 formen un F,rupo y los dgitos del 5 a 9 foimen otro; de esta manera se tiene:

t) r42047
0 8795
1
to

1 9765

Cuando los datos constan de ms de dos cifras, se deben escoger los rangos para las agrupaciones
que se realizarn;luego aI llcnar las hojas se separan mediante una coma para evitar confusiones. Si
disponemos de los siguientes datos:

qD
DJ 55 79 106 188 47 118 248
47 58 82 113 208 60 88

Se pueden realizar dos diagramas de tallo y hojas:

0 33,47,47,55,58, 60, 79, 82, 88


1 06, 13, 18, BB
2 08, 48

que est agrupado por centenas. El siguiente diagrama est agrupado en intervalos de 50:

0 33,47,47
0 55,58,60, 79, 82,88
1 06, 13, 18
1 88
2 08, 48
2

Asimismo, se pueden usar diagramas mltiples para comparar dos conjuntos de datos, para ello se
coloca un tallo comn y las hojas de un conjunto se ponen a la izquierda del tallo y las hojas del
segundo conjunto a la derecha del tallo, de la siguiente manera:

4371 1 44
ft 9888655 1 5779
310 2 0L23344
99875 2 678
311 3 03
.) 5
4

Se observa que los datos de la izquierda estn ms agrupados en los valores bajos, con un rango mayor
y fuerte asimetra; mientras que el conjunto de la derecha es muy simtrico y con menor dispersin.

Tambin, se emplean estos diagramas para representar datos con decimales; por ejemplo, si tenemos
los datos:

1.3 0.8 1.6 2.0 r.7 7.2 0.5 1.9 0.6 2.2 0.5 1.6.
7.6. Representaciones grficas de los datos 13

El cliaglanra rcsrrltalte <rs:

0. 5568
1. 236679
2. 02

1.6.3. Grfico de sectores y grfico de barras


Los grficos de sectoles y de barras son dos formas de lrcsentar gr-tlficamente datos categricos.
Supongamos que los datos aparecen resumidos en una tabla como Ia siguierrte:

FYecuencias Fbecuencias
Categoras
absolutas (n) relativas (/)
Ct u f,
Cz n2 fz

Cn ;, ir
Total n, 1

Un grfico de sectores es un crculo dividido en segmentos, donde el rea de cada uno de los sectores
es proporcional a la frecuencia relativa de esa categora. El ngulo central de la categora es igual a
fi x 360".
Junto a cada uno de los sectores que constituyen el grfico, se suele indicar el nombre, el nmero de
elementos y el porcentaje de cada categora.

Tambin, se puede resumir datos cualitativos mediante rn gr.fi,co de baryas. En stos, los datos
se exhiben mediante rectngulos, del mismo ancho, cada uno de los cuales representa una categora
particular. La longitud (y por lo tanto el rea) de cada rectngulo es proporcional al nmero de casos
en la categora que representa.

Si los datos son nominales, las categoras se pueden colocar en cualquier orden; pero si los datos son
ordinales, las categoras deben estar ordenadas.

Los grficos de barras se pueden presentar de manera horizontal o vertical y usualmente hay un espacio
entre los rectngulos. Junto a cada uno de los segmentos que componen el grfico se coloca el nombre
el nmero de elementos y el porcentaje de cada grupo.
Con el grfico de barras se distinguen las principales caractersticas de los datos, como aquellas causas
que son ms importantes o que ms frecuentemente se presentan en un proceso. Tambin, tiene la
ventaja de que se pueden realizar gr,,ficos de barras agntpadas, que consiste en representar sobre el
mismo grfico ms de dos variables -siempre que estn medidas en las mismas unidades-, permitiendo
realizar comparaciones,

Ejemplo. En una empresa financiera, los empleados disponen de computadortrs porttiles de distintas
marcas. Un resumen del nmero de mquinas, de acuerdo a su respectiva marca, se presenta en el
siguiente cuadro.

Marca Nmero de % Marca Nmero de %


respuestas respuestas
Toshiba 135 42 Lenovo 43 13
Dell 76 23 No sabe 19 6
HP 53 16
t4 Captulo 7. AnIisis Exploratorio de Datos

Representar mediante grficos de sectores y de barras.

Solucin: Los grficos se encuentran err Ia Figura 1.3.

Toshiba

Toshiba Dell HP Lenovo No sabe

Figura 1.3: Grficos de barras y de sectores.

L.6.4, Histograma

Un histograrna es un conjunto de rectngulos, cada uno de los cuales representa un intervalo de


agrupacin. Sus bases son iguales al intervalo de clase empleado en la distribucin de frecuencias
y las alturas son proporcionales a la frecuencia absoluta,fi, o relativa / de la clase.

El histograma es apropiado para datos continuos, medidos con una misma escala y se lo emplea
cuando un diagrama de tallo y hojas es tedioso de construir. Igualmente, puede ayudar a detectar
observaciones atpicas y cualquier brecha entre los datos.
Ejemplo. (Continuacin.) El histograma correspondiente a la tabla de distribucin de frecuencias
de los tiempos de ensamblaje de anaqueles se presenta a continuacin.

Figura 1.4:

1.6.5. Polgono de frecuencias y ojiva

Un polgono de frecuencis es un grfico que se obtiene uniendo con segmentos de recta los puntos que
tienen proporcionalmente como abscisa a la marca de clase y como ordenada la frecuencia respectiva.
Se cierra en ambos extremos en las marcas adyacentes con frecuencia cero.
7.7. Ejercicios 15

La ojiua es un polgono de frecuencias acumuladas; es decir, en las abscisas se colocan los lmites
superiores de cada intervalo de clase y en Ias ordenadas se coloca la frecuencia acumulada (absoluta o
relativa) de la clase. La ojiva es til para:

1. Calcular el nmero o el porcentaje de observaciones que corresponden a un intervalo determinado


de Ia variable.

2. Calcular los percentiles de la distribucin de los datos.

Ejemplo. (Continuacin.) El polgono de frecuencias y la ojiva, correspondientes a la tabla de


distribucin de frecuencias de los tiempos de ensamblaje de anaqueles se presenta a continuacin.

Figura 1.5: Polgono de frecuencias y ojiva.

Una vez que se ha confeccionado una tabla de frecuencias y se ha realizado Ia representacin grfica
correspondiente, es necesario disponer de valores que permitan describir y compara los conjuntos de
datos, mediante nmeros que indiquen su posicin, su variabilidad y su forma. sto se realiza con las
llamadas medidas estadsticas o simplemente estadsticos.

L.7. Ejercicios
1. D ejemplos (preferentemente de su propio campo) de poblaciones y muestras.

2. Para cada uno de los distintos tipos de datos: discretos (categricos, ordinales y nominales) y
continuos, enuncie al menos dos ejemplos. Justifique sus respuestas.
3. En una encuesta de opinin acerca de las preferencias de bebidas gaseosas, por sus colores: negro
l
(N), blanco (B) V R (rojo), 20 consumidores dieron las siguientes respuestas:
i

N, B, B, N, R, B, B, N, N, B, N, B, B, R, N, B, N, R, N, B.
I
Construya el grfico de sectores circulares.

4. Los siguientes datos corresponden al porcentaje de alumnos de cuarto grado de escuela, clasifi-
cados segn su rendimiento acadmico en la materia lenguaje.

Calificacin %
Insuficiente 53
Regular 26
tre
Bueno 15

ta. Muy bueno 5


Sobresaliente 1
16 Captulo 7. Anlisis Exploratorio de Datos

a) ,Con qu tipo d<; datos esti ustcd tlalra,jauclo? Explique.


b) Retrlir:e los gr'ficos cle pastel y dc barrtr,s clc los drtos.

c) .Qu porcenta.jc de los alurnrros cle cuarto graclo tien<:u urr renclirnierrto <<bucno>> o mejor
que bueno?

E
i). En Ia siguiente tabla se describe diferentes razas d<r perros, segn varias caractersticas obser-
vadas.
R,aza Tamao Peso Velocidad Agresividad Funcin
basset 11 I 2 2
boxer' 22 2 2 I
bauceron 32 2 2 r)

bulldog 11 I 1 1

caniche 11 2 1 1

chiguagua 11 1 1 1

cocker 2I 2 2 1

colley 32 3 1 1

doberman 32 3 2 3
dogo 33 3 2 ,
r)

fox hound 32 3 2 2
galgo 32 3 1 2
labrador 22 2 1 2
mastin 32 3 2 3
pekins 11 1 1 I
podenco 22 2 1 2
pointer 32 3 1 2
san bernardo 33 1 2 3
teckel 11 1 1 1

teI'ranora 22 1 1 3

donde la codificacin es la siguiente:

Tamao: 1 tamao pequeo; 2 tamao mediano; 3 tamao grande.


Peso: 1 peso pequeo; 2 peso mediano; 3 peso grande.
Velocidad: 1 velocidad leve;' 2 velocidad mediana; 3 velocidad grande.
Agresividad: 1 agresividad leve; 2 agresividad grande.
Funcin: 1 comparia;2 caza;3 utilidad.
a) A qu tipo de datos pertenece cada caracterstica definida en la tabla?;
b) Para cada variable, realice el grfico de pastel o el grfico de barras;
c) Compare los distintos grficos y deduzca cules variables estn relacionadas. Explique su
respuesta.

6. Se tiene la siguiente informacin acerca de la composicin del cuerpo humano.

Figura 1.6: Distribucin de materiales en el cuerpo y distribucin de las proteinas.


7.7. Ejercicios t7

,Qu porcentaie del peso total del cuerpo humano corresponde al peso total de la piel?

7. Se registr Ia distancia diaria (en km) que el representante comercial de una empresa recorre
para visitar a sus clientes:

8.2 13.3 10.1 11.5 13.5 7.6 r0.4


4.6 10.5 72.6 13.0 t2.0 4.3 7.7
5.9 10.0 10.8 13.1 14.1 5.0 t2.0
6.5 L2.7 15.0 10.4 t3.2 8.3 13.6

a) Realice un diagrama de puntos para los datos;


b) Realice un diagrama de tallo y hojas;
c) Determine la tabla de frecuencias;
d) Dibuje el histograma;
e) Compare este ltimo con los diagramas de puntos y de tallo y hojas.
8. La inversin anual, en miles de dlares, de una muestra de 40 pequeas empresas fueron:

36 19 29 37 33 22 29 31 2L 35
2042534 24 27 27 24 26 31
27 77 31 10 28 15 41. 30 18 39
46 26 12 23 18 33 25 28 23 28
a) Elabore una distribucin de frecuencias con 7 intervalos de clase;
b) Realice el diagrama de tallo y hojas;
c) Determine el porcentaje de empresas con una inversin entre 14 mil y 20 mil dlares.

9. Los ingresos mensuales de una muestra de pequeos comerciantes se tabularon en una distribu-
cin de frecuencias simtrica de 5 intervalos de clase de igual amplitud, resultando como ingreso
mnimo 125 dlares, marca de clase del cuarto intervalo: 300. Si el 8 % de los ingresos son
menores que 165 dlares y el 70 % de los ingresos son menores que 275 dlares. Cul es el
porcentaje de los ingresos que son superiores a 285 dlares?

10. Se tiene la siguiente tabla acerca de las edades de los obreros de cierta empresa:
No. de
Edades
obreros
22-27 L4
27 -32 17
32-37 25
37-42 10
42-47 I4

Encuentre el porcentaje de obreros cuyas edades estn comprendidas entre 35 y 40 aos.

11. La siguiente tabla muestra la distribucin de las notas en un examen.

Nota No. alumnos


0-5 7
5-10 18
10-15 i5
r5-20 10

Qu porcentaje tuvieron una nota comprendida entre 8 y 17?


18 Captulo 7. AnIisis Exploratorio de Datos

12 Al clasifical las no+"as cle 0 a 100 cn un exarnen,se obtuvo una distribucin simt,rica, con 5
intervalos de clase de iglral ancho. Si el 10% desaprotr con rnenos de20, rnientra-s qurcel 40o/o
obtlrvo notas comprendidas entre 40 y 60, ,qrr porcentaje de alurrinos obtuvo una nota rnenor
de 60?

13. En la tabla se indi,can los tiempos de espera en las ventanilias de un banco.

Tiempo (rnin) Frec. absoluta Frec. relativa


03 32
3-6 0.30
6-9
9-12 8 005
12- 15 0.10

Halle el tamao de Ia muestra y complete la tabla de distribucin de frecuencias.

14. Los pesos de n artculos se ordenaron en una tabla de distribucin de frecuencias de 7 intervalos
de igual ancho de clase, donde: mn : 50 g, mx : 120 g.

Adems, ft : fz, fs: fs, fs t fa I fz :0.36, n1-l nz I n3 -r n4 -_- 560 y U. :64.

a) Determine el valor de n;

b) Cuntos de estos artculos tendrn un peso mayor o igual a 60 g y menor a 110 g?

15. Halle el tarnao de la muestra y reconstruya Ia siguiente tabla simtrica de distribucin de


frecuencias.
Frec. relativa
Intervalo Frec. absoluta Frec. relativa
acumulada
10- t2 7
12- 0.24
0.52
5
18-20

16. La tabla muestra la distribucin del ingreso familiar mensual de 80 familias.

Frec. absoluta
Intervalo Frec. absoluta Frec. relativa
acurnulada
640 - 680
680 - 720 48 60
720 - 760 0.r25
760 - 800 0.075
800 - 840

Determine el nmero de familias que tienen un ingreso menor a 800 dlares mensuales.

17. Dado el siguiente histograma de frecuencias relativas. Cuntas observaciones hay en el rango
[c, /], si el total de la rnuestra es de 400? 2(
7.7. Ejercicios 1_9

Figura 1.7:

i8. En el siguiente grfico se muestra el consumo de energa en una fbrica.

Qu porcentaje del consumo diario se utiliza desde las 19h hasta las 24h?

19 En la siguiente ojiva se representan los porcentajes de personas que componen un grupo de


personas) segn su edad.

100

55
45
25
10
12 17

Figura 1.9:

Determine qu porcentaje de personas tienen edades comprendidas entre 10 y 15 aos.

go
20. Dada la ojiva correspondiente a los gastos en servicios de los hogares de una ciudad.
20 Captulo 7. Anlisis Exploratorio de Datos

/D

Figura 1.10:

Reconstruya la tabla de distribucin de frecuencias.

1.8. Medidas de localizacin

Cuando se dispone de un conjunto de observaciones, es de inters encontrat el valor en torno al cual


se agrupan la mayora de ellas o el centro de las mismas. Las medidas descriptivas que permiten
especificar estos valores se denominan medidas de localizacin o md,idas de tendencia central.

Existe una amplia variedad de medidas de localizacin; nos concentraremos en las ms empleadas: el
promedio, la mediana, la moda, la media geomtrica y la media armnica.

1.8.1. La media muestral o promedio

Definicin (de promedio o media aritmtica) El promedio, notado como 7, de un conjunto


de n mediciones 21, r2t...,,rn es igual a la suma de sus valores dividido entre n; es decir,
n

rt*rz*.'.*rn Drn
i=l
&-
n

. Si las observaciones estn agrupadas en una tabla de frecuencias de datos individuales como la
siguiente:
Observacin Flec. absoluta
rI fLy
I2 n2

rk nk

donde n es la frecuencia absoluta de la observacin ,ri, el promedio se calcula por

k
Dnn'n
:t
&
sa
I: ---=-,
n
COn n: z_rn.
d:l
7,8. Medidas de localizacin 2L

. Si los datos se presentan en una tabla de frecuencias, agrupados por clases:


Clase LIC LSC Punto medio Frec. absoluta
1 l1 5t rl Tr1

2 I2 S2 r2 TL2

k t" 9p ;r rLk

se calcula el punto medio cle cacla clase rromo iri :; l I s' ' '
Q,:1,2,, .. , k) y el promedio es
k
I
i1
rr, r k

t con 7:l n.
n
i:7

Ventajas e inconvenientes del empleo del promedio:

1. Se expresa en Ias mismas unidades que la variable.


2. En su clculo intervienen todos los valores de la distribucin.
ual
ten 3. Es el centro de gravedad de toda la distribucin, representando a todos Ios valores observados.

4. Es nico.
;EI 5. Su principal inconveniente es que se ve afectado por la presencia de valores atpicos.

Ejemplos

1. Calcular el sueldo promedio de diez personas que ganan (en dIares):


170 r72 168 165 173 t78 180 165 767 172.

Soluci,n: Se dispone de n : 10 observaciones sin agrupar, entonces


11*rzl..'*rn
&-
n,
170 + 172 +168 + 165 + 173 + 178 + 180 + 165 + 767 + r72
10
: I7L.

2. Calcular la estatura promedio de 46 seoras, cuyas medidas se dan a continuacin.


ro la
1 It 1 ta
Estatura 1.45 1.48 1.50 t,du 1,55 L,(, f 1.60 i.63 1.65
t
Flecuencia 2 4 5 B 72 7 4 t) 1

Solucin: Como las mediciones estn agrupados en una tabla de datos individuales, aplicamos
Ia frmula que considera la frecuencia de cada una de ellas.
Tngase presente que el nmero de clases s k : 9 y el tamao de la muestra es n: 46.
I
I n'r
r:i:l
n,
2x I.45*4 x 1.48+... +3 x 1.63 * 1 x 1.65
46
r.545.

Los 46 seoras examinadas tienen una estatura promedio de 1.545 metros.


22 Captulo 7, AnIisis Exploratoro de Datos

3. En una cooperativa de ahorro y crdito se realiz Ia tabla de frecuencias de Ios montos de los
ahorros de sus socios (en dIares), segn se presenta en la tabla,

Desde Hasta Fbecuencia


0 100 72
100 200 28
200 30 46
300 400 77
400 500 186
500 600 224
600 700 209
700 800 r22
800 900 53
900 1000 19

Calcular el promedio de los ahorros de los socios de la cooperativa.


Soluci'n: Los datos estn agrupados en 10 clases. En primer lugar encontraremos el punto
medio de cada clase y los pondremos en la tabla:

Desde Hasta Punto medio (z) Flecuencia (n)


0 100 50 72
100 200 150 28
200 30 250 46
300 400 350 7r
400 500 450 186
500 600 550 224
600 700 650 209
700 800 760 722
800 900 850 53
900 1000 950 19

Ahora, empleamos Ia frmula que considera la frecuencia de cada una.


10
Tenemos que k : 10 y D n:970. Por tanto,
i:1
10

D'*n
t--l
TL

12 x 50*28 x 150+.,. +53 x 950* 19 x 950


970
: 555.155.

El ahorro promedio de los cooperados es de b5b.16 dlares.

1.8.2. La mediana
La mediana fue por primera vez utilizada, como una medida de localizacin, por A. A. Cournot en
1843 y redescubierta por F. Galton en L882, ao desde el cual su empleo se ha generalizado.

Definicin (de mediana) La mediana de un conjunto de datos xr, z2: .. ., rn es el valor que se
encuentra en el punto medio, cuando se ordenan los valores de menor a mayor.
1.8. Medidas de localizacin 23

Se la nota como Q2 o Med y tiene la propiedad de que a cada lado del valor se encuentra el 50 % de
las observaciones.

Si disponemos de un conjunto de datos individuales, para el cIculo de Ia mediana se procede de


Ia siguiente manera:

1. Se ordenan las n observaciones rt,12,. ..,rn de manera creciente.


2. Si el nmero de observaciones es impar, entonces n:2rnl1, La mediana es la observacin
que se encuentra en eI lugar m * I. As, si disponemos de r : 29 observaciones ordenadas
de manera creciente, m : 14 es decir, Ia mediana es la observacin que se encuentra en el
lugar14*1:15.
3. Si el nmero de observaciones es par, entonces n:2m. La mediana es igual a la suma de
las observaciones que se encuentran en los lugares m y rn * 1, dividido para dos. As, si el
nmero de observaciones es de n : 30, entonces rn: 15; Ia mediana es el promedio de Ias
observaciones que se encuentran en los lugares 15 y 16.

Si los datos estn resumidos en una tabla de distribucin de frecuencias de datos individuales.

1. Ordene las observaciones de manera creciente, con sus respectivas frecuencias acumuladas.
2. Calcule I2"v red.ondee al entero ms cercano. Determine en Ia columna de Ia frecuencia
acumulada a qu dato pertenece, comparando el valor obtenido con el valor de la frecuencia
acumulada que es igual o inmediatamente superior; ste valor es la mediana.

Si los datos estn resumidos en una tabla de distribucin de frecuencias por clases, la mediana
se determina por interpolacin, as:

1. Establezca en qu intervalo est el valor mediano. Para sto, se determina la primera


n
clase cuya frecuencia acumulad.a se
a mayor o igual a Dicho intervalo se denomina clase
5.
med'iana.
2. La mediana se calcula con la frmula
n,
; - nl-r
Med,: L_t-r
donde: =-A,
,L-1 es el lmite inferior de la clase mediana.
At-r es la frecuencia acumulada del intervalo inmediatamente anterior al intervalo de la
mediana.
n esla frecuencia absoluta de la clase mediana.
A es Ia longitud de la clase de Ia mediana.
La interpretacin grfica del clculo de la mediana se encuentra en la Figura 1.11.

Ntese que la mediana de un conjunto de datos no necesariamente pertenece a ste. La propiedad


fundamental de la mediana es dividir al conjunto de observaciones en la mitad.

Ventajas e inconvenientes del empleo de Ia mediana:

1. Es la medida mis representativa en el caso de variables que solo admitan la escala ordinal.

2. Es fcil de calcular.

.). En Ia mediana solo influyen los valores centrales y es insensible a la presencia de valores atpicos.

4. En su determinacin no intervienen todos los valores de Ia variable.


24 Captulo 7. AnIisis Exploratorio de Datos

L MC L
lal
Figura 1.11: Interpretacin geomtrica del clculo de la mediana.

Ejemplos

1. Determinar la mediana de los siguientes datos:

5.5 6.9 7.0 3.0 4.8 4.t 3.2 4.3 5 5 6.5 4.3.

Soluci,n: Se tienen n : IL observaciones, por Io que Tn : 5, entonces Ia mediana est en el


lugar 5*1. Ordenemos los datos

3.0 3.2 4.7 4.3 4.3 4.8 5.5 5.5 6.5 6.9 7.0.

La mediana es la observacin que se encuentra en el sexto lugart Qz:4.8.


2. (Continuacin.) Calcular Ia mediana de los sueldos de diez personas que ganan (en dlares):

t70 r72 168 165 L73 178 180 165 167 L72.

Solucin: Se tiene n: 10 observaciones, que ordenadas dan


1,
165 165 767 168 r70 772 772 773 178 180.
I
Por lo tanto, la mediana es el promedio entre las observaciones quinta y sexta: fi
I
^ 770+172
er: *
i:171. ET

la
3. (Continuacin.) Calcular la mediana de la estatura de 46 seoras, cuyas medidas son:

Estatura Fbecuencia FYecuencia


(r) absoluta (n) acurnulada (lr)
7.45 2 2
1.48 4 6
1.50 5 11
1.53 8 19
1.55 T2 31
r.57 nl 38
1.60 4 42
r)
1.63 J 45
1.65 1 46
7.8. Medidas de localizacin 21:

Soluci,n: Las mediciones estn agrupados en una tabla de datos individuales y el tama0,d,9,1,1i
muestra es n: 46. , . .iJ,riri,!
Calculamos 2 : ZZ y vemos en Ia columna de Ia frecuencia acumulada que hay los valoles 19 y
2
31, que cumplen que 19 < 23 < 31.
i"r;i'r;'irt:;'/
As, Ia mediana es el valor cuya frecuencia acumulada es 31; es d,ecir, Q2: 1.55-.i "
4. Para la liquidacin del impuesto a Ia renta, en una pequea empresa, se calcularon lcs'ingbesoS
anuales (en dlares) de todos los empleados. La tabla de distribucin de frecuencias es la
siguiente: ,i'_l-
Nmero de Fbecuencia
Ingreso anual
personas (n) acumulada (Nr)
,,,r.1 t,
2400 - 3000 3 3
3000 - 4200 20 23
,,r,; r ix llri.il
4200 - 5400 35 58
5400 - 7250 25 83
7250 - 9000 15 98
9000 - 12000 2 100

Solucin: Los datos estn dados en una tabla de frecuencias por clases con r: 100.

i-nel Entonces, ?2:50; por tanto, la mediana se encuentra en el intervalo (a200;500)';'de!t'nnera


que A: 5400 - 4200: 1200.
Ahora, tenemos que

* - *n-,
Med: L;I*TO
!{-es): : 4200 + tO:"rrg :5L25.7. 'i rr,','i;tr :'.i r1i','1,\q;?.
35
t;i ir1;({ l:
La mediana del ingreso anual de los empleados de la empresa oist25'.1lil*J]
'" -- 1--.\' lrii:Lli-'rr "i'j ..'ilrrrrrri
r

'rli;rl.lirll;l

1.8.3. La rnoda r"i I

Definicin (de moda) L" moda de un conjunto de ddob'es aquel valor que tiene la mayor
frecuencia absoluta.

Se la nota como Mo. Hay ocasiones en las cuales los datos pueden tener dos o ms modas, o no puede
existir, cuando todos los datos tienen igual frecuencia. Para su determinacin es til construir una
tabla de frecuencias de los datos.

. Si los datos estn resumidos en una tabla de distribucin de frecuencias por clases, la m'6dr
"e
determina mediante la frmula: ii ,,'t:) i, ri ) lfl;'{

I = :,(' i, ;i,
Mo:L* dt,O' trz, O
t li) il);jii-),1fli ii lfrli/.

donde:
tr-1 es el lmite inferior de la clase modal.
d1 es la diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior.
d,2 es la diferencia entre la frecuencia de la clase modal y la frecuencia de Ia clase siguiente.

A es la longitud de la clase de la mediana. , r ;iri:,rt ;,I


Captulo 7. AnIisis Exploratorio de Datos

Aunque la icler de <<valol rn1s fiecuente>> es mny trrrtigurr, no fue ernpleacla en estacistica, dc rnlnela
forrnal, hasta cre Ia polrlirliz K. Peu'son en 1894.

Ventajas e inconvenientes del empleo de la moda:

1. Es fcil de calcular e interpletar.

2. Es la nica medida de Iocalizacin que ptiede obtenerse en Ias variables de tipo cualitativo.

3. En su determinacin no intervienen todos los valoles de la distribucin.

Ejemplos

1. Supngase que las notas de un examen de estadstica fueron las siguientes:

9.4 8.1 9.0 5.6 7.0 9.0 6.5 9.0 3.8 7.0.

Soluc'in: La moda de este conjunto es Mo:9.0, que es el valor que ms veces se repite.

2. Calcular la moda de los siguientes datos:

Observacin 2.7 4.5 6.0 8.7 9.2


Fbecuencia 5 6 .) 2 4

Solucin: La mayor frecuencia es 6, correspondiente al valor 4, por lo tanto Mo:4.

3. Para la liquidacin del impuesto a la renta, en una pequea empresa, se calcularon los ingresos
anuales (en dlares) de todos los empleados. La tabla de distribucin de frecuencias es la
siguiente:
Nmero de
Ingreso anual
personas (n)
2400 - 3000 3
3000 - 4200 20
4200 - 5400 35
5400 7250 25
7250 - 9000 15
9000 - 12 000 2

Solucin: La clase modal es el tercer intervalo, ya que tiene la mayor frecuencia (hs : 35).
I
: 50; por tanto, la mediana estar el el intervalo
Entonces,,2I (4200; 5400), de manera que
dr :35 -20:15, d:35 - 25:10 y A:5400 - 4200:7200. l
:
Ahora, tenemos que

A[o : L.--t* ,O' ,O


d't -l d'z
: 4200+,,,15,.1200 : 4920. I
15+10
i,
La moda del ingreso anual de los empleados de la empresa es 4920 dlares. :-
7.8. Medidas de Iocalizacit't 27

1.8.4. La media georntrica

Definicin (de media geomtrica) La media geornt,rica, notaclzr corno .{lG, clc urr conjunto dc
n, meclicions r1, 12:.. ., nr es igrral a Ia taz r-sirna de su ltroclucto; es decir,

AIG: Vqxrrx-xrk.

Si las obselvaciones estn agrupadas en una tabla de fi'ecuencias de datos individuales,

MG: {r:7, x...xr'tlt.


"";,
Si las observaciones estn agrupadas en una tabla de frecuencias por clases, la expresin es la
misma, pero utilizando el punto medio de Ia clase z.

El empleo ms frecuente de la media geomtrica es el de promediar variables tales como porcentajes,


:asas, nmeros ndices; es decir, en los casos en los que se supone que la variable presenta variaciones
acumulativas.

Ventajas e inconvenientes del ernpleo de la media geomtrica:

1. En su clculo intervienen todos los valores de Ia distribucin.


2. Los valores extremos tienen menor influencia que en la media aritmtica.

3. Es rnica.

1. Su clculo es ms complicado que el de la media aritmtica y solo se la puede calcular cuando


todos los valores son positivos.
50s
;la
Ejemplo. Calcular la media geomtrica de la estatura de cinco personas que miden (en metros):

t.70 r.72 1.68 1.65 r.73.


Solucin: n:5 observaciones; por tanto,
Se dispone de

MG : (rx12x-xrn
: otT
11.70 x I.72 x 1.68 x 1.65 x I.73: 1.696.

La media geomtrica de las citadas estaturas es 1.696 m.

1.8.5. La rnedia armnica


que
Definicin (de media armnica) La media armnica, notada como NI H, de un conjunto de n
mediciones rrt r2t . . . , rt. es el recproco de la media aritmtica de los recprocos de esos n valores;
es decir,

Su empleo no es aconsejable en distribuciones de variables con valores pequeos. Se suele utilizar para
promediar variables tales como productividades, velocidades, tiempos, rendimientos, cambios, etc.
28 Captulo 7. AnIisis Exploratorio de Datos

Ventajas e inconvenientes del empleo de la media armnica:

1. En su clculo intervienen todos los valores de Ia distribucin.


2. Su clculo no tiene sentido cuando algn valor de la variable toma valor cero.

3. Es nica.

Ejemplo. Calcular la media armnica de la estatura de cinco personas que miden (en metros):

1.70 t.72 1.68 1.65 r.73.

Solucin: Se dispone de n:5 observaciones; por tanto,

11111 : 1.696.

L.70 I.72 1.68 1.65 r.73


-_r-r-_r-_L-
La media armnica de las citadas estaturas es 1.696 m.

1.8.6. Percentiles, cuartiles y quintiles


Antes de finalizar esta seccin, es conveniente referirnos a varios trminos que son de uso comn
en la prrctica estadstica: los cuartiles, Ios quintiles y los percentiles. Estas medidas estadsticas
corresponden a lo que se denomina medidas de posicin no central.

A un conjunto de datos ordenado se lo puede dividir en un nmero fijo de partes iguales; cuando se lo
divide en cien partes se tienen los percentiles.

Definicin (de percentiles) Los percentiles son cada uno de los 99 valores que dividen a la
distribucin de los datos en 100 partes iguales.

A los percentiles se les nota como P. Con ellos se puede encontrar regiones donde se acumulan los
datos; as, el 30 % de los datos estn por debajo del trigsimo percentil.

Para su clculo se procede de Ia siguiente manera:

. Si los datos no estrn agrupados o estn en una tabla de datos individuales, se efecta la siguiente
descomposicin:
nk
: j *r,
100
donde:
j es la parte enter u a" !.
100

r es la parte fraccionaria a. *.
100
Entonces, se tiene que
si r:
"+-,
rj+L, sir>0.
o;
7.8. Meddas de localizacin 29

Si los rlrtos i:sttirr rrJruprclos crr c:lascs, sc c:rlctila rucclirnt<r

,tk, _
l{r.
"
I'A,:LA-ta 1oo ',1,
,

7Lk'

rlor rcler:

,L 1 es cl lrrrite inferior del intervalo (cuva fi'ecucrrcia rcurnulada es la primera mayor o igr.ral
tt,A:
a _).
100'
l-l cs la fi'ecuencia acumulada hasta .L-1.
n es la frecuencia absohrta del intervalo h.
A es la longitud del intervalo h.

Ejemplos

1. Calcular los percentiles de orden 20 y 33 de la estatura de diez personas que miden (en cm):
165 165 167 168 170 L72 r72 r73 178 180.

Solu,c'in: Tenemos eue n: 10.

. Par-a P2g, k :20


nk
: j *r
100
10x20 : 2+0
100
Entottces,r':0y j:2;
P,

Pzo

. Para P33, li; : 33


10 x33 :3+0.3.
n los 100
Entonces, r:0.3 y j:3.
P : rj+t
PS : r:168.
ente
2. (Continuacin.) Calcular el percentil de orden 86 de los ingresos anuales de los empleados de
Lrna enlpresa.

Nmero de FYecuencia
Ingreso anual
personas (n) acumulada (/r)
2400 3000 3 ,)

3000 - 4200 20 23
4200 - 5400 35 58
5400 - 7250 25 83
7250 9000 15 9B
9000 - 12000 2 100

Soht,cin: Teuemos qlte ? : 100.


30 Captulo 1. Anlisis Exploratorio de Datos

Parzr,l)66. k :86 y n,k: 100 x 86 : 86.


100
- 100
-
EI intcrrrrio h cloncle se cricu<rutrrr P5; cs (7250, 9000) y Lt-t:7250.
Tarnlritt, sc tierre qr,tc ly',-1 :83, r*.:15 y A:9000 -72;.0:1750
Con estos datos, obtenemos:

'k n,.
,I)A, . - 100 -
L-I
nk
D-
rSri 72to +
tLUv |
uu - 83 trrn
15
: 7600.
--'l

Dos casos particulares, y muy utilizados, resultan cuando al conjunto de datos se Io clivide en cuatlo
o cinco partes iguales, que corresponden a los cuartiles y a los quintiles, respectivamente.

Definicin (de cuartiles) Son valores que dividen a la distribucin de los datos en 4 partes, cada
una de las cuales engloba eI25% de los mismos.

Los cuartiles son 3:

. El cuartil inferior (Qr), qre deja a su izquierda el 25% de los ctatos v se curnple eue Qr : P2.

. El cuartil medio (Qz), qre deja a sr.r izquierda el 50 % de Ios datos, coincide con la mediana y se
cttmple que Q2 : Pso.

. El cuartil superior (Q3), que deja a su izquierda el 75 % de los datos y se cumple eue Qe - Pz.

As, para el clculo de los cuartiles solo se deber tener en cuenta que ellos son los percentiles de orden
25, 50 y 75, respectivamente (Figura 1.12).

500 500

mln Qt Qt Q max

Figura 1.12: Disposicin de los cuartiles en un conjunto de datos.

Definicin (de quintiles) Los quintiles son valores que dividen a la distribucin de Ios datos en
cinco grupos, cada uno de los cuales contiene el 20% de las observaciones.

Los quintiies son 4:

. El primer quintil (qr), q.t" deja a su izquierda el 20% de los datos y se cumple que qr - P2o.

El segundo quintil (qz), qrr" deja a su izquierda el 40% de los datos y se cumple eue 9z - P4o.

. El tercer quintil (qs), qn" deja a su izquierda el 60% de los datos y se cumple que qB - Poo.
r El cuarto quintil (g), qr" deja a su izquierda el 80% de los datos y se cumple que q4 - P80.
7.8. Medidas de localizacin 31

Ejernplos

1. (Continuacin.) Dctcrrniuar los cuartilcs infcliol y surcliol cle las estaturas de 46 seoras,
cuyas ntedidrs son:

Estatura Fbecuencia Frecuencia


(r) absoluta (n) acumulada (i,)
r.45 2 2
1.48 4 b
1.50 5 11
1.53 E 19
1.55 72 31
L.57 7 3B
1.60 4 42
1.63 .)
,,1 l

1.65 1 46

Sohtcin: Tenemos que n : 46.

. Para el cuartil inferior, Q1 : P25, por tanto, k:25 y


nk ,
Pz. i00
lr
46x25 :
)'se
11 + 0.5.
100

De manera que, r: 0.5 y


Pn.
p, : r j+t
rrden
PZs : rn: I.53.

. Para el cuartil superior, Q : Pzs, k :75 y


nk
100
tlr
46x75
35 + 0.5.
100

Es decir, r: 0.5 y

P, * l-rt
Pzs : rsa : 1.57.

2 (Continuacin.) Determinar Ios cuartiles inferior y superior de los ingresos anuales de los
empleados de una empresa.

Nmero de FYecuencia
Ingreso anual
personas (r) acumulada (Nr)
2400 - 3000 t) J
3000 4200 20 23
D'lu.
4200 - 5400 Jd
DT
58

P+0.
5400 - 7250 25 83
7250 - 9000 15 9B

'60. -
9000 12000 2 100

D-^
EU' Solu,cin: Tenemos que n : 100.
32 Captulo 7. AnIisis Exploratorio de Datos

109ri.25
. Cuartil inferior: Qt : Pz;, k::25 J, Y: : Z.
100 100
El irrtelr'rlo l doncle se enc:uentra Q1 es @200;5a00) y Lt-t:4200.
Tambirr, se tiene que N- t : 23,nt :
35 y A :54U0 - 4200 : 1200.
Entonces, lesrrlta que:
t'/t
- Ar,.-,
P, : Lt-tI loonk "'
t<_t?
Pzs : 4200 +'",;;'" 1200
Ji)
: 4268.6.

:75 tO?tt : tt.


Cuartil superior: Qs: Pzs, k t #:
El intervalo h donde Lxt:540A.
se encuentra P75 es (5a00; 7250) y
Tambin, se tiene que N-1 : 58, n :25 y A :7250 - 5400 : 1850.
Con estos datos, obtenemos:
nb
- e-t,
P : Ln-t-t r nk
: 75;58raso
Pzs b4oo+
25
: 6658.

1.9. Medidas de dispersin

Luego de determinar Ia localizacin de las observaciones, es conveniente medir su grado de clispcrsin


alrededor del centro. Las medidas que permiten especificar esta caracterstica se denomnan nedidas
de dispersin.

Estas medidas deben tener la propiedad de que si los datos estn ampliamente extendidos, la medida
ser alta; y cuando los datos se encuentren muy agrupados, ser baja.

Existen varias medidas de dispersin, nosotros vamos a analizar la desviacin estndar, el rango y el
rango intercuartil.

1.9.1. La desviacin estndar


llna vez que se ha calculado el promedio de las mediciones, un indicador de su variabilidad es la
desviacin de cada medicin particular corr respecto al promedio, r- r. Pero sta da r.rna informacin
vlida para cada medicin y no para toda la muestra. Para tal efecto se emplea la desviacin estndar,
medida de dispersin fue introducida por K. Pearson en 1894.

Definicin (de desviacin estndar o desviacin tpica) La desviacin estndar, notada como
s, de nn corljunto de n mediciones 11, 12, ... 2,, es la raz cuadrada de la suma de los cuadrados
de Ias desviaciones de las mediciones, respecto al promedio z, di'l'idida entre n - 1; es clecir,

n-I D,@,
i:l
7.9. Medidas de dispersin 33

\tese que la desviacin estndal es siempre positiva y sus nnicladcs de medicla son las rnisnrrrs clrLt:
aquellas que corresponden a los datos originales.

Para su clculo tambiu se cnrplea la frnrula equivalente

- n \r)'
n-I

De la misma manera que para Ia media aritmtica se consideran los siguientes casos:

' Si las observaciones estn agrupadas en una tabla de frecuencias de datos individuales:

Observacin FYec. absoluta


Il TL1

r2 n2

x) te ;o
la desviacin estndar se calcula por

k
DnnrT
i:I
- n(T)2 k
o s: con n:, ni.
n-7 i:r

in ' Si los datos se presentan en una tabla de frecuencias, agrupados por clases:
as
Clase LIC LSC Punto medio Flec. absoluta
1 ly Sl I1 TL1

ida 2 l2 S2 I2 n2

: : : :

rel k l" Sk rk nk

s se calcula por

k
Lnr - nlI)'
O /-\
k
la o 8: i:l
con n: \-nr.
in -itn(r-r)2
i:7 n-I /-;-l

ilar,

Ventajas e inconvenientes del empleo de la desviacin estndar:

l. Se expresa en Ias mismas unidades que los datos originales.

2. En su clculo intervienen todos los valores de la distribucin y por ello puede ser complicado.

3. Es nica.

4. Se ve muy afectada por la presencia de valores atpicos.


34 Captulo 7. Anlisis Exploratorio de Datos

Ejemplos

1. (Continuacin.) Calcular la clesviacin estrrdar cle los srreldos cle diez l)crsonrrs que ganan
(en dlares):
r70 t72 168 165 173 178 180 165 167 t72.

Solu,cin: Previamente se haba calculado el promedio 7: L7I. Con sto, resulta que:

*i@n-,'
(170 - t7L)2 + (I72 - I7r)2 +...+ (167 - tTL)2 + O72 - LTr)2
10-1
1.

Esos sueldos tienen una desviacin estndar de 5.1 dlares.

2. (Continuacin.) Calcular la desviacin estndar de Ia estatura de 46 seoras, cuyas medidas


son:
Estatura t.45 1.48 1.50 1.53 1.55 L.57 1.60 1.63 1.65
Frecuencia 2 4 5 8 t2 7 4 3 1

Solu,c'in: Anteriormente se determin que :46, k - 9 y r:1.545.


71.

Para realizar el clculo, obtengamos el valor a. f nor'n,


i:t
k

D"nr? :2(t.+s)2 + 4(t.458)'+'" + 3(1'63)2 + 1(1.65)2 : 109.9615


i:1
Entonces, se tiene que

Dn *?-n@)2 ffi
o:, , :.@:0.04627.
n-r
D-
n-l V o-t
La estatura de las seoras analizadas tiene una desviacin estndar de 4.6 cm.

3. (Continuacin.) Calcular la desviacin tpica de los montos de ahorros de los socios de una
cooperativa de ahorro y crdito:

Desde Hasta Punto medio (r) FYecuencia (ni)


0 100 50 12
100 200 150 28
200 30 250 46
300 400 350 77
400 500 450 186
500 600 550 224
600 700 650 209
700 800 750 r22
800 900 850 53
900 1000 950 19

Solucin: Antes se determin que n : 970, k : 10 y V -- 555.155.


7.9. Medidas de dispersin 35

Calculemos lzr siguiente sumatona:

I,,r r,l : 12(rtQ2 + 28(150)2 +'. . + b3(850)2 + 19(950)2 : 330025000


'i-7

De manera que la desviacirr tpica es

k
D ro"? - "(")2
,i.:1

n-7
:V/33002ffiro-i :riY'

tlonjuntamente con la desviacin estndar se suele definir la uarianza muestral de un conjunto de


ratos, notada s2, como Ia suma de los cuadrados de las desviaciones respecto a su promedio, dividido
:or el uno menos que el nmero de observaciones en el conjunto de datos y se calcula mediante

las "ln: {'o - 7)2


" ;\f ,;-1

r,9.2. EI rango y el rango intercuartil

Definicin (de rango o recorrido) El rango de n mediciones es igual a la diferencia entre los
'.'alores mayor y menor de las mismas:

Rango : T..'x

Ei rango se puede utilizar para hallar una aproximacin de la desviacin estndar mediante las si-
--rrientes relaciones :

R.anso
s = ---) para n 176, para 16 q 7 ( 100,
1/n
R,anso
para100<n(400, para n > 400.
"=--,

Ventajas e inconvenientes del empleo del rango:

1. En su clculo solo intervienen los dos valores extremos de Ia distribucin y por ello se ve muy
afectado por Ia presencia de valores atpicos.

2. trs fcil de calcular.

Definicin (de rango intercuartil) EI rango intercuartil, notado por RIQ, de un conjunto de
latos es igual a Ia diferencia entre ios cuartiles superior e inferior; es decir,

RIQ: Qs - Qt.

Las definiciones de los cuartiles superior e inferior y del rango intercuartil fueron dadas por F. Galton
en 1882.
36 Captulo 7. AnIisis Exploratorio de Datos

Ventajas e inconvenientes del empleo del rango intercuartil:

1. Es fh<:il cle calcul.rr'.

2. Se vc Poco afectrcio por la Plerselcia dc r,r.lores atpicos.

3. En su deterrninacin no intclvierre lr totiliclad cle los clatos.

Ejemplo. (Continuacin.) Calcular' la desviacin estrrdrl de lr cstrturr clc 46 seoras, cllvas


meclidas sc reslrmen en la siguierrtc ttblr:

Estatura r.45 r.48 r.50 1.53 1.55 1.57 1.60 r.o.) 1.65
Fbecuencia 2 4 Ir 8 12 7 4 3 1

Solucin: Antes se dctermin que Q1 :1.53 Y Qs:I.57. Adems, zm':7.45y r,'*:1.65.


Entonces,

Rango Tmx - fnrn : 1.65 - I.45 : 0.20.


RIQ Qs - Qt : 1.57 - 1'53 : 0.04.

Adems, podemos calcular una aproximacin de la desviacin estndar de los datos:

Rango 0.20
sFr : 0.05.
4 4

Como se ver el valor aploximado cs bastante cercano al exacto, calcuiado con la frmula respectiva.

1.9.3. El coeficiente de variacin


Definicin (de coeficiente de variacin) El coeficiente de variacin, notado y>ot CV, es ig-ual
a la desviacin estndar- divididr por la medir, rrritmtica; es riecir,
s
CT':1
T

Esta rnediclr se utilizr l)lra conlpr'rr las rnccliciones de tunr misrna magnitrici rclizrrir cn distintas
unidades o por distintos individuos.

Si u.rr conjurrto de clrtos es honrog(rneo, CV < 1; si Cf/ > 1.5. los dzrtos poclran ser hctclogncos.

Ventajas e inconvenientes dei empleo clel coeficiente de variacin:

1. Es urrr medida rdimensioual.

2. En sn clculo interviencn toclas las obscrvaciones. pr-rclicnclo ser nluv iufluido pol valoles atpicos.

3. Puede ser difcil de interpretar.

4. Picrde su significtrdo si el prorredio es iguai a cero.


7.7A. Medidas de fornta Dta
JI

Ejernplo. (Continuacirr.) Crlcrrlrr r:l c:oerficrierrtc clc r'rriacirr clcrl srrclclo clc cliez pcrsorrrs clllc
-irr1rr (crL ckilzrrcs) :

170 rT2 168 165 r73 r78 180 165 167 r72.

: :,1 uc,iir: Pleviarrx:rrtc s<t Itrba cirlculaclo clur: r: 177 1' ,s - 5.1. Con sto, r'esulta que:

5'1 :0.02982.
CV:! T - 777

--omo
el valor de coeficiente es muy ba.jo, los datos son homogneos.

1.10. Medidas de forma

-{asta ahora, heruos arralizado la localizacin y la dispersin cle una distribucin, pero necesitamos
. r'locer ms sobre el comportamiento de los datos. En esta seccin, analizaremos las medidas de
-,)
- )inla'.

- as medidas de forma de ttna distlibucin se clasifican en dos grllpos: medidas dc asinietr'a y medidas
-- cttrtosis.

1.10.1. Asirnetrra

coet'czente d,e a,s'intetra, dc nrra variable midc cl grado de asimetr'a de la distribucirr r,le sus datos
tolno r sti meclia. Es aclirncnsional v se definc corno srg=Lre:

\-1.r, _ ,):t ln,


/_-' ' '
I
,i.:
As: t

,s3

--,--.
crtl,o,s cle nnL variable cstrr coltstituidas por los r.alores alejaclos de la meda (r,a.1oles cxtrcmos).
--:,a l'rriable es l,sini:tricr si srr
col ;r nn 1rclo cs rns larga que sr1 colr al otro y sinrtricr si ambrs
-es solr igual cle largas.

si As > 0. la clistribui:in seri asiurtiicr a lr clcrcclir. La cola a la clerechr es ms lirrga que 1a


cola a la izquierrl:r.

. si As - 0la distlilncicin ser' sirntticr. AnLbas colas son igual dc luugirs.

. si As < 0 la clistribrrcirt seri rsirntlica a ltr izcluicrcla. La cola a lur izqnierdl es ms lrrrgir que
la cola a Ir clelechr.
rEn la definicin cle las trrecliclrs rte tirma no hal,'unidac.l cle criterios cntre los especi:rlista,s, por lo clrLc hay una amlrlia
r i cclacl
38 Captulo 1. AnIisis Exploratorio de Datos

L,lO.2. Apuntamiento o curtosis


EI coeficiente de apuntamiento o curtosis de una variable sirve para medir el grado de concentracin
de los valores que toma en torno a su media. Se elige como referencia una variable con distribucin
normal, de tal modo que para ella el coeficiente de apuntamiento es cero.

ir", - *)n l,
i:t ,
Ap: e4 -J.

Segn su apuntamiento, una variable puede ser:

Leptocrtica, si Ap ) 0; es decir, es ms apuntada que Ia normal. Los valores que toma la


variable estn muy concentrados en torno a su media y hay pocos valores extremos.

Mesocrtica, si Ap:0; es decir, es tan apuntada como la normal.

Platicrtica, si Ap ( 0; es decir, es menos apuntada que la normal. Hay muchos valores extremos,
Ias colas de la variable son muy pesadas.

Figura 1.13: Curtosis de curvas simtricas.

Ejemplo. (Continuacin.) Calcular los coeficientes de simetra y apuntamiento de los sueldos de


diez personas que ganan (en dlares):

t70 172 168 165 r73 178 180 165 t67 172.

Solucin: Previamente se haba calculado que 7 : l7l y s : 5.1. Adems,

i@n-e)'
i:7 (170 - 171)3 + 072 -171)3 + .
+ (167 - i71)3 + O72 - t7D3
10
55.8.

i{,n-n)n
i:l - LTDA + $72 - I7I)4 +. . . + (167 - LTD4 + G72 -
(170 I7D4
n 10
1191.
7.77. Otras representaciones grfrcas 39

- ntOnCeS,

In
\-.
T).

\ r; - ( T\'' lr,
1J"
'i-I 55.8
)11
As: t
so (5.1)3
0.42r.

ir", - ,)n l,
i:t 1191
Ap: s4
-J-
t
(5.1)n -.)
-t.239.
Ia
-,cs datos son levemente asimtricos, con asimetra hacia la derecha; tambin, son platicrticos,
;,,rsible presencia de valores atpicos.

x) 1.11. Otras representaciones grificas


-
os grficos analizados anteriormente no requieren realizar clculos de medidas estadsticas. Los
==ficos que a continuacin se presentan, s los emplean; por tanto, son ms poderosos al realizar un
'-nlisis.

1.11.1. Diagrama de balanza


FI di,agrama de balanz fue introducido en el ao 2000, como una herramienta que muestra, en un
lismo grfico, la forma de los datos, su valor central y su variabilidad al representar el promedio, el
:-nimo, el mximo y Ia desviacin estndar de los datos.

?ara su construccin se procede de la siguiente manera:


de
1. Se calcula el promedio, la desviacin estndar, el mnimo y el mrximo del conjunto de datos que
se analiza.

) Sobre una recta se ubican los valores del promedio, el mnimo y el mximo. Los segmentos que
unen el promedio con el mnimo y con el mximo se denominan brazos de Ia balanza.

3 Sobre la misma recta se ubican dos puntos -uno a la izquierda y otro a Ia derecha de la media-,
a una distancia igual a la desviacin estndar.

I Debajo del valor del promedio se dibuja un tringulo.

EI diagrama queda as:

x .x+.s

Figura 1.14:
40 Captulo 7. AnIisis Exploratorio de Datos

El rliagrarrir clc. brrlrnzir st: iritc:r'pletr clc 1a sigrricrrtc luirrrcr'r:

1 Si los cltos solL sinrrtlic:os, r:l valor del plonreclio se sitr rrr r:l <:c:rrtLo rlci grlico.

2 Si los drtcs estilr agrrrptrdos en torno ri ccntlcl. los lr-Lzos rlr: l,r balrnz ser'ilr cortos; pr"u cl
contrzlricl, si ir"rs tlat,os estiirr dispclsos eu tor-rr<l r.l coutlor lt-,s lrr'rzos clc lr balrnza s<)r''rir liilgos.

,) Si nno dc los rlos blrzos clc 1r brlarrz es muchr rlrs largo crc r:l otlo, nos inclica (llre los (l1tos
sorl asirr)tricos y clue hay posible prcsencia cle r'rloles atpicos en ls obselvciones.

Puede ser irtil combinrr' (solrre el mismo gr'fico) con un cliagrzrma clc prrni;os pzrra visualizrl Ia, Irillr(:lr'&
en que se distlibuycn ias observaciones.

Ejemplo. Realizal el diagrama de balanza de los siguientes datos:

5 5 5 5 1010202027 35
39 55 55 60 60 60 68 75 90 90

Soluci,n,: Estos datos tieneu las siguientes carac;ter'sticas:

rnrr:5, rnx:90, r:39.7, s:29.3

Entonces,

:L
-S 39.729.3:10.4.
-
T *s 39.7+29,3:69.0.

El ciizrglirlrr <lc balarrzr ie nurstlt it crorrtirn.rrcirjn:

st0 28 3 4C 5S 60 1fi 80 gCI

Figura 1 .15;

Scgirrt sc obscrvit crr i'i gilico, el prornedio no se encuentra crr cl centro del ralgo. entonces sc dr:drrc<:
quc los cltrtcs sotr asirtrtricros. Arlcrris, lcs br'rzrs cie ir blrnza rro ticrierr ig'ral longitnri, lo <1rri.r ri<rrtotr
la posrble plcserrcia cle vakrrcs atpicos elr cl ex1 r'errro clcrecho.

1.11"2. Diagrarna de ca.ja

El rli,o,qt'ant,a" de c:o,.jo, fr-re irrtroduciclo r:n 1977, pol JoLrn \\I. Tuliey conLo lurl herranrierrtzr quc rrurcslr'tr,
er Lrn misuro gr:ific:o, lr foltna de los clatos, sn r'r,lol ccntlal y srr rrariabiliclrcI irl rcprr:sentar ir rne<lirrra.
los crrrtilcs) el r'1rlgo intercualtil y el rango c1e las observacicxrcs.

Para su constluccin se procede de la sigr.riente rnInera:

l. Soble lrn lnel holizontal se locrlizrn l mcdiana. Ios cuartiles inferior y supr:rior 'los clatos
nrnilro I'mixirno.
7.77. Otras representaciones grfrcas 4L

,l
Se constrrtye rtna ca..ja angosta qlre une a Qt y Qz; a continurcin, se clivicle estar caja cn clos
mecliatrte una lnea qne pase por Qz.

t
.J. Finalrnente, se ttazan las uallas, que son dos rectas, una desde cada extremo de la ca.ja, hacia el
valor rnnimo y hacia el valor mximo de los datos.

:n la Figura 1.16 se mnestra un diagrama de caja.

I trt I
min Qt Qz Qr max

Figura 1.16: Diagrama de caja.

;--n diagrama de caja es especialmente til para examinar la simetra de los datos, la presencia de
-"-:lores atpicos y para comparar dos conjuntos de muchos datos.

Ejemplos

1. (Continuacin.) Trazar el diagrama de caja correspondiente a los datos de la estatura de 46


seoras, cuyas medidas son:

Estatura r.45 1.48 1.50 1.53 1.55 L.57 1.60 1.63 1.65
Flecuencia 2 4 5 8 12 7 4 3 1

Solucin: Antes se determin que Qr : 1.53, Qz : L.55, Qs : t.57, rrnn: I.45 y z16* : 1.65.

El diagrama de caja es el siguiente:

. -lttc:cr
, lr rti

I I

t.4s 1.55 r.60 1.65

: .tliI) Figura 1.17:


.l(lIJIr

Como se observa, los datos son bastante simtricos, con una fuerte concentracin en torno al
centro y -puesto que las vallas son largas- con la posible presencia de valores atpicos (el mnimo
y el mximo).
clirlos
Se recogieron los datos de los ingresos mensuales de 200 hombres y 250 mujeres, que realizan
42 Captulo 7. Anlisis Exploratorio de Datos

tlab:r.jos rro c:llificaclos, olrtcniudosc ltr sigtticttto tabl:

Ingreso flombres Mujeres


180 10
190 5 55
200 20 75
270 ')ri)
.f 25
AN
220 40
230 75 45
240 20

Comparar los ingresos de los dos grupos mediante sus diagramas de caja.
Solucin: Se tiene la siguiente tabla que resume las medidas descriptivas reqtteridas:

mIn Qt Qz Qs max
Flombres i90 270 220 230 240
Mujeres 180 190 200 220 230

Con todos estos elementos, los diagramas de caja son

240

230

22O
o
ut
fl
s zro
tr
200

190

'180

Sexo

Figura 1.18:

En el diagrama correspondiente a las mujeres, observamos que la mediana no se encuentra en Ia


mitad de la caja, denotando una asimetra, con fuerte concentracin hacia valores bajos. Como
Ias vallas son cortas, podemos inferir que no hay presencia de valores atpicos.
En el diagrama que corresponde a los hombres, se observa que Ia mediana est en Ia mitad de la
caja, indicando que Ios datos son simtricos. Como la valla inferior es ms larga qr-re la superior,
rros indica que rlrl valor de 190 es atpico para los hombres.
De acuerdo a las posiciones de los diagramas, se observa que) en general, las mujeres tienen
ingresos menores. Tarnbin, se aprecia que los ingresos de los hombres estn ms concentrados
alrededor de la rnediana qne los de las mujeles, denotando que aquellos son ms homogneos.

L.1-2. Ejercicios
i. Una persona est rnanejando un carro en una autopista a 70 km/h y nota que el nmero de autos
a los que pasa es igual al nmero de autos que a ella le pasan. Los 70 km/h son el promedio, la
mediana o la moda de las velocidades de los autos en la carretera. Por qu?
7.72. Ejerccios 43

2. Dadas r : 8 nrccliciones: 4, 2, 6. 5, 7, 5, 4, 6.

Deterrnine: rr) f; lr) lr niecliarrr; c) ,s; cl) el lango; e) la asimetra; f) Ia cr-rrtosis.


3 Dadas n : I mediciones: 5, 8, 8, 4, 4, 9, 7, 5, 4.

Deterrnine: a) 7, b) la mediana; c) s; d) el rango; e) el RIQ; f) la asimetra; f) curtosis.

1. En 1904, Cushny y Peebles publicaron en el artculo <The action of optimal isomers>> (Journal
of Physiologg), un estudio sobre el efecto de dos ismeros de Ia molcula hidrocinamida hidro
bromida en prodrtcir sueo. Se present la variacin en el nrmero de horas de sueo por noche
al usar las dos versiones de Ia droga:

Paciente Dextro Levo


1 +0.7 +1.9
2 -1.6 +0.8
.) -0.2 +1.1
4 -L2 +0.1
5 -0.1 -0.1
6 +3.4 +4.4
7 +3.7 +5.5
8 +0.8 +1.6
I +0.0 +4.6
10 +2.0 +3.4

a) Realice un diagrama de puntos para cada uno de los dos tipos de drogas y comparrelos.
Cul de los dos ismeros es ms efectivo en producir aumento en las horas de sueo?
b) Realice un diagrama de tallo y hojas con los datos.
c) Calcule el promedio, la mediana y la desviacin estndar de los datos de las dos drogas.
Cul es ms efectiva? Explique.

. Un inversor tiene ahorros repartidos en 3 depsitos con 2000, 5000 y 10000 dlares, respectiva-
mente. Si el primero le rinde un 5To anual, el segundo un 4To anual y el tercero un 2To anual.
Cul es el tipo de inters que recibe?
tenla
En una empresa se registr la edad (en aos completos) de sus empleados, resultando la siguiente
Como
tabla:
31 49 36 39 56 29 57 4t 40 51
Idela 45 61 40 39 47 27 36 37 16 37
)ertor, 51 18 29 42 38 62
34 31 28 25
36 40 46 37 49 25 2r 39 35 37
trenen 56 35 48 44 42 43 49 22 25 28
trados
teos.
a) Determine el nmero de clases que se debe utilizar en la distribucin de frecuencias;
b) Construya la tabla de frecuencias y el histograma;
c) Qu porcentaje de los empleados es menor que 50?;

: autos
d) Qu porcentaje de los empleados es mayor que 35.5?
dio, la
7. En una bodega de venta de licores se registr las principales. caractersticas de 25 marcas de
44 Captulo 7. AnIisis Exploratorio de Datos

rn'hiskys:
No. de Precio Proporcin Tiempo de Nota de
Categora
whisky de venta de malta aejarniento calidad
.,
I 70 20 1 5 J

2 60 20 1 5 2
, 65 20 1 7.5 2
4 74 25 I I2 2
5 70 25 I t2 3
6 ,J 30 1 5 0
7 70 30 1 8 0
8 55 30 I 5 2
9 93 J,l 2 6.5 I
tt
Jd 2 8 3
10 62
tt
JJ 2 8.5 3
11 87
T2 78 35 2 8.5 2
13 83 40 2 8 4
t4 90 40 2 5.5 2
15 110 40 2 T2 1

16 113 40 2 8.5 1

t7 96 40 , T2 dt
18 82 45 2 12
,
d

19 r27 45 2 8.5 4
20 160 100 3 L2 3
2I 90 100 3 12 4
22 86 100 3 12 2
23 100 100 3 10 3
q
24 100 i00 3 11 d

25 95 100 3 T2 0

a) Identifique el tipo de dato que representa a cada una de las variables;


b) Realice un diagrama de talloy hojas para el precio de venta y ei tiempo de aejamiento;
c) Calcule el promedio, la moda y la mediana del precio, la proporcin de malta y el tiempo
de aejamiento;
d) Encuentre la desviacin estndar, el RIQ V el coeficiente de variacin del precio, la propor-
cin de malta y el tiempo de aejamiento;
e) Calcule los coeficientes de asimetra y de apuntamiento del precio, la proporcin de malta
y el tiempo de aejamiento;
f) Realice un grfico de barras de Ia categora y de la nota de calidad.

8. Calcule el promedio, la mediana y la moda de las edades de 25 personas:


32 33 34 31 32 31 34 32 34 32 31 34 31
31 32 32 34 34 32 33 34 33 33 34 31
9. Dados los datos y sus frecuencias:

Halle: a) e; b) Mo; c) s; d) el rango.


10. Dados los datos v sus frecuencias:

Halle: a) Qz; b) 7; c) s; d) RIQ.


7.72. Ejercicios 45

il. Sc rcirlizti rttta irrr'<rstigacirn sobtc cl prccic'r rlc zapzrlos <lcportivos. clcr sirnilarets <:rrrctetrsticrs
crr rlivrtlsos tllutr:ctttts clc lr trirrrlrcl, ob1<:ni:rrr[os<t los sigrricnt<:s cLttos (cl<ilarcs):

50 4:l 39 43 40 38
,)-
r),J oi
,l
.)-
r) I
.)o
r)i
49 43 39 44 40 38 33 26 36 30
49 43 39 44 4U 38 33 27 36 30
+t 41 39 45 40 37
.).)
,),)
,)a
,l ') E
,)r)
J)^
.)t,

46 47 38 46 40 37 32 28 35 28

a) Determine la dislribucin de frecuencias inclivicluales de los datos;


b) Elabore la distribucin de frecueucirs con datos agnrpaclos l)or clases;
c) A partir de la distribucin obtenida, trace el histograma.

-2. A continuacin se dan los resultados de la estatrrra de 100 estudiantes:

Esratura (en cm) | 155 160 165 170 \75 180 185
No. de eslrrdiantes I 10 14 26 28128
Halle:

a) Ia estatura promedio y Ia desviacin estndar;


b) la media armnica y la media geomtrica;
c) Ia mediana y eI RIQ.

A partir de la siguiente distribucirr de liecuencias,

o;

lpo

ror- Encuentre:

rlta a) los cuartiles inferior y superior y la mediana;


b) Ia media armnica;
c) la media geomtrica.

-=. La siguiente tabla muestra la temperatura nocturna (en "C) clr.rrantc 200 das:

Intervalo Flecuencia Intervalo Frecrrencia


qA
21 12-14 I4
4-- b 16 74 16 20
6-B 15 16 18 22
8-10 26 18 20 1E
l0 12 OD
L 20 22 :,-)

a) Deterrrile: cl plomedio, Ia mecliana y los cuartiles inferior y superior;


b) Constmya el cliagrama de ca.ja de los datos.

Los siguientes datos se obtuvieron de una encuesta sobre las condiciones de vida, en el rea nrral
dc los cantones dc Zapotillo y N{zrcar y corresponden al nrrnero de hornbres y de rnujeres que
Captulo 7. AnIisis Exploratorio de Datos

intcgran las frmilias encuestadas.

Hombres \4ujeres Hornbres X4ujercs Hombres X4ujercs Homblr:s \tlujercs


4 2 2 2 7 4
c .) t
5 4
1 .) t) .) 2 2
2 , 2 4 4 4
1 4 4 6 5 4
4 4 b 7 2 4
I 7 4 2 5 2
t
2 .) 2 d 4 J
8 3 5 4 4 1

a) Realice un diagrama de puntos de los datos, clasificados por sexo;

b) Realice la tabla de frecuencias y el histograma de los datos, segn el sexo de los encuestados;

c) Construya el diagrama de caja de los datos;

d) Interprete y compare los resultados obtenidos en a), b) y c);

e) Determine el nmero total de miembros en cada familia. Con estos nuevos datos trace eI
diagrama de puntos, el diagrama de tallo y hojas, la tabla de frecuencias, el histograma y
el diagrama de caja. Interprete lo obtenido.

16. Las siguientes temperaturas fueron tomadas al medio da en Quito (en 'C) durante una semana:

22, 24, 2r, 24, 20, 22, 19.

a) Calcule el promedio y la desviacin estndar de dichas temperaturas;


b) Para transformar los grados Celsius (c) en grados Fahrenheit (/) ." usa la ecuacin / :
1.Bc * 32. Determine el promedio y Ia desviacin estndar de las temperaturas en grados
Fahrenheit;
c) Encuentre alguna relacin entre los promedios y las varianzas calculados en a) V b).

17. En una investigacin sobre la razn por Ia que frecuentemente haban colas muy largas en las
cajas de un banco, se obtuvo informacin del tiempo (en minutos) requerido para atender a los
clientes. Se tomaron 50 mediciones en una caja, las cuales se dan a continuacin:

6.0 5.9 4.0 3.1 1.9 5.3 2.7 5.2 2.9 5.2
4.8 4.8 5.1 6.0 4.2 4.4 5.3 7.4 4.4 4.1
5.2 2.8 4.7 1.8 5.1 5.8 2.9 5.7 3.8 5.8
3.6 4.4 2.0 2.8 4.8 3.1 1.5 5.9 3.6 4.6
3.7 4.5 3.9 2.3 5.5 5.3 5.8 2.4 5.5 3.7

a) Calcule la desviacin estndar y su aproximacin a partir del rango;


b) Determine (,' * s), (r I2s) y (e + 3s);
c) Determine el nmero de observaciones que se encuentran en cada uno de los intervalos;
d) Construya el diagrama de caja de los datos y compare con los resultados de la parte b).
Qu observa?
7.72. Ejercicios 47

18. La siguientc tabla muestra los tiempos de duracin (en minutos) de las versiones en DVD de 22
pelculas dirigidas por Alfred Hitchcock:

Pelcula Tiempo Pelcula Tiempo


The Birds 119 Dial M fbr Murder 105
Family Plot 120 Foreign Correspondent 120
Frenzy 116 I Confess f08
The Man Who Knew Too Much 120 X4arnie 130
North by Northwest 136 Notorious 103
The Paradise Cane 116 Psycho 108
RearWindow 113 Rebecca 132
Rope 81 Shadow of a Doubt 108
Spellbound 111 Strangers on a Train 101
To Catch a Thief 103 Topaz 126
Under Capricorn Il7 Vertiso 128

ios;
a) Construya un diagrama de tallo y hojas de los datos;
b) Calcule la mediana de los tiempos;
c) Calcule los cuartiles inferior y superior. Use esta informacin para detectar algn valor
:e el y
atpico para trazar el diagrama de caja;
ray
d) Determine el promedio y la desviacin estndar;
e) Represente los datos mediante un diagrama de balanza. Cules datos influyen ms en los
valores calculados?
f) Calcule los coeficientes de asimetra y de apuntamiento.

19. Las notas de un examen de 6 alumnos son: 6, 5, 9, 19, 3 y 18. Un alumno aprueba si su nota es
mayor o igual que el promedio y que Ia mediana de las notas. Qu porcentaje de los alumnos
aprobaron el examen?
+-
J-
ados 10. Un automvil ha recorrido los 832 km que separan Loja de Esmeraldas, permutando regularmente
las 5 llantas (incluida la de emergencia) para que todas tengan igual desgaste. Cul es el
recorrido promedio de cada llanta?

11. El kilometraje que marca un auto, luego de 4 aos de uso, es 100 mil kilmetros. Si el dueo
r las lo compr nuevo y lo hace descansar 1 da, luego de usarlo 4 das seguidos, cul es el recorrido
a los promedio diario de los das manejados, considerando aos de 365 das?

')2. De 400 alumnos de un colegio, cuya estatura promedio es 165 cm, 150 son mujeres y su estatura
promedio es 160 cm. Cul es la estatura promedio de los varones?

13 Se tiene cuatro nmeros. AI aadir el promedio de tres de ellos al nmero restante, se obtienen
los nmeros 17, 2I, 23 y 29. Si se excluye al mayor de estos nmeros) cul es el promedio de
los tres restantes?

)/ El promedio de 53 nmeros es 600. Si se eliminan 3 nmeros consecutivos, se observa que el


nuevo promedio aumenta en 5To. Cul es el mayor de dichos nmeros consecutivos?

25. Calcule la mediana de las siguientes temperaturas:


6:

e b). Temp. ("C) 20.5 20.0 19.5 19.0 18.5 18.0 t7.5
No. das 2 4 3 13 3 4 2
48 Captulo 7. Arlisis Exploratorio de Datos

26 Calculi: Ir mecliatrr v Ir urocla <lc krs sigrri<lrtcs clatcls

Iutclrrlo I'r'ccucucia
10 - 2i) 3
.)
20 -30 'J
30 - 4i) 12
40 50 B
50 60 5

27. Los sueldos en una emprcsa son las siguierrtes:

1 gelente: 10 000
1 secretaria: 650
3 empleados: 500 (cada uno)
2 ayudantes: 400 (cada uno)
1 conserjc: 300

Cul es la medida de localizacin ms representativa?

28 En una reunin hay 50 varones con una edad media de 20.5 aos y 25 mu.jeres, las que en
promedio ,or, ] mis jvenes qne los \arones. Halle el nrmero entero ms prximo a la edacl
'10
media de las personas de dicha leunin.

29. Un ftrmador dice que su vicio empez con un cigarrillo en la primera sernana, 2 en la segunda,
4 en la tercera, 8 en la cuarta, y as sucesivamente; hasta fumar casi 2 ca.jetillas diarias de 20
cigarrillos cada una, en promedio.

a) ,A cuntas semanas de habcl empezado ocnrri sto?;


b) Cuntos cigarr-illos diarios, cn prornedio, fum hasta la primera ser)ana que lleg al nlximcr
de su consumo?

30. Si cada uno de los 28 millones de habitantes de cierto pas come) el promedio, 12 kg de pescadcr
al ao, entre conservas enlatadas y pescado fresco, siendo este rubro 4 veces el de conserva.
Cuntas toneladas de pescado fresco se consumen? en promedio, por ao?

31. En una muestra de 20 empresas florcolas se obtuvieron los siguientes datos sobre el nrnero de
empleados y sus ingresos anuales, en miles de dlares:

No. dc Ingresos anlrales


empleaclos 50 - 100 100 - 250 250 - 1000
10 30 6 2 0
30 s0 i 1 0
50 - 100 0 0 10

Calcule:

a) el ingreso medio anual de las ernprcsrrs;


b) el nmero de empleados promedio.

32. De los datos de rrna tabla de distribucin de frecuencias, con 5 intervalos de clase ;r ancho de
clase corntn, se observ que: Qz:24, x: : l$, 13 :24, nB : 2'n,r, n5 : )71r. .Qu porcerrtaje
del total sor nrenores de 30?
7.72. Ejercicios 49

cunto es igual la suma de cifras dc la media aritmtica de la siguiente serie de nmeros'/

r cifrrs n cifrrs r <rifils r cifrrs

34. La siguiente tabla muestra la distribucin de sueldos de 210 trabajadores de una empresa.
Sueldo Trabajadores
600 700 100
700 800 20
800 - 900 60
900 1000 20
1000 1100 10

a) Halle Ia moda de los sueldos;


b) Debido al aumento de Ia productividad, los sueldos sufrieron un incremento del 70%o y,
adicionalmente, un aumento de 50 dlares. Halle el nuevo sueldo promedio.

35. En una muestra de 1000 trabaiadores, se registr sus sueldos en una tabla de frecuencias:
Sueldo Trabajadores
ue en 0 400 150

, edad
400 - 800 300
800 - 1200 200
1200 - 1600 250

rnda,
1600 2000 100
de 20
a) Calcule la moda de los datos;
b) Qu porcentaje de los trabajadores tiene sueldos comprendidos entre el promedio y la
mediana?

irimo 36 En la siguiente ojiva se muestran los sueldos de Ios traba.jadores de un organismo estatal.

scado
lser\4.

rero de

Figura 1.19:

Halle la diferencia entre el promedio y Ia mediana.

37 En Ia seccin de pediatra de un hospital, Ios nios atendidos se clasifi.caron segn su edad,


obteniendo la siguiente tabla:
Frec. absoluta Frec. relativa
Edad Frec. absoluta Frec. relativa
acumulada acumulada
03 0.2
rcho de 3-6 20
centaje 6-9 0.85
9-12 80
50 Captulo 7. Anlisis Exploratorio de Datos

Calcrrle el pronrr:clio, la rnecliarrr v la clesvircil estnclar cle la cclacl de los niuos rtcndirlos.

38 Err la sigr.rierite tabla se rnuestr'r ir clistlilnciu ck: frecnencias clc lrs vcntas rcrlizadls pol' lcs

60 locales de uu ccntro comelcial popr-tlal de Ia ciudad cle Quitrt.

Punto Frec. absoluta


Frec. relativa
medio (r)

Si Ios intervalos tienen igual longitud, halle el promedio, la mediana y la desviacin estndar de
Ias ventas.

39 En Ia siguiente tabla se muestra la distribucin de frecuencias de los pesos de 100 personas:

Peso Frec. relativa


Frec. absoluta Frec. relativa
(t e) acumulada
0-24 0.18
24-48 26
48-72 0.78
72-96

Calcule la mediana del peso de estos individuos.

40 La siguiente tabla incompleta muestra Ia distribucin de frecuencias de los dcpsitos bancarios


realizados por 50 clientes, siendo el ancho de clase es constante e igual a 200.

Punto Frec. absoluta Frec. absoluta Frec. relativa


Intervalo
medio (r) ("0) acumulada (l/r) (f)
9
0.22
I 100 t2

7
0.06

Luego de completar la tabla, calcule:

a) cuntos clientes realizaron depsitos menores a 1000 dlares?;


b) qu porcentaje de clientes realizaron depsitos entre 1200 5' 1600 dlares?;
c) el promedio, la mediana y la moda de los depsitos.
Captulo 2

El Concepto de Probabldad

Las preguntas ms importantes de Ia uida son, para la


tnaAor parte, realmente solo problemas de probabili,dad
Pierre Simon Laplace

-r la naturalezay en la vida cotidiana se presentan fenmenos cuyo resultado se determina antici-


-.damente mediante la aplicacin de ciertas leyes o frmulas; por ejemplo, los resultados de mediciones
:-rmtricas, los clculos financieros o ciertos procesos fsicos.

-enrbin existen fenmenos cuyo resultado no puede ser anticipado con cetteza, sino que existe una
:tbabi,Iidad de que un cierto resultado se d; por ejemplo, la ganancia que obtendr un inversionista
-=-pus de dos aos, el tiempo que sobrevivir un cnyuge a la muerte de su pareja o el nmero de
;-ros eu pasan por una esquina durante una hora determinada. Es evidente que nadie puede dar
-, resultado certero con anticipacin a los tres euentos considerados, entonces si se da una respuesta,
-:'iste una incertidumbre en el resultado.

?ara dar una explicacin matemtica a aquellos resultados que aparecen en experiencias en que est
-r'olucrado el azar, se desarroll la teora de probabilidades.

2.L. Resea histrica


-
a presencia del hueso de astrgalo de oveja, que constituye el antecedente inmediato del dado, en las
=-<cavaciones arqueolgicas ms antiguas, parece confirmar que los juegos de azar tienen una antigedad
-: ms de 40mil aos. En Ia India, en el Rig-Veda (aproximadamente 1000 aos a.C.), se menciona un
;:ego de dados como un intento de medir la probabilidad. En Grecia, Sfocles atribuye a Palmedes
-= invencin del juego de dados, durante el sitio de Tloya. As, en casi todas las culturas antiguas
= posible encontrar referencias que nos indican que el estudio de los fenmenos aleatorios (dados,
-Jresencia de lluvia, el clima, etc.) fue muy importante.

=n el Renacimiento se produjo un abandono progresivo de explicaciones teolgicas, lo que condujo a


';a reconsideracin de los experimentos de resultado incierto, y los matemticos italianos del siglo
\VI empezaron a interpretar los resultados de experimentos aleatorios simples. Por ejemplo, Cardano,
:n 1526, estableci, por condiciones de simetra, la equiprobabilidad de aparicin de las caras de un
jado. Por su parte, Galileo (1564 - 7642), respondiendo a un jugador que le pregunt por qu es
ns difcil obtener 9 tirando tres dados que obtener 10, razon que de las 216 combinaciones posibles

51
52 Captulo 2. El Concepto de Probabilidad

ccluiplobables, 25 coticltrcett a 9 y 27 a 10. Galileo public estos rcsultrcios en un tlatrclo liarnaclo


C o n,si, d, eraz'i, o ne. s o'p'ra,'il q i,r t, oco d,e,t, d,o,rli.

El desarrolio clel anilisis rnatenrtico los juegos dc azal se produjo durrnte los siglos XVI y XVII.
c,le
Algunos autores consideran como origen del clculo de probabilidades la lesolucin del prolrlema de los
puntos en la correspondencia entre Pascal y Fermat en 1654. El problema planteado a estos autores
por Chevalier de Mer, fue cnro debera repartirse el dinero cle las apuestas, depositado en la mesa,
si los jugadores se ven obligados a finalizar la partida sin que existiera un ganador. Aunque ningur<-r
de estos dos matemticos public al respecto, s lo hizo Huygens en su tratado Ratioci,n'iis 'in In,do alae
(Razonamientos relativos al juego de dados). Su escrito tiene Ia trascendencia de ser el primer liblo
de probabilidades de la historia.

Durante el siglo XVIII, el clculo de probabilidades se extendi a problemas fsicos y de seguros


martimos. El factor principal de su desarrollo fue el conjunto de problemas de astronoma y de
fsica que surgieron ligados a la constatacin emprica de la teora de Newton. Un primer problerna
fue el tratamiento de los errores de medicin: se dispona de varias medidas independientes de una
determinada magnitud fsica y se presentaba el interrogante de cmo combinarlas para obtener un
resultado ms preciso. Daniel Bernoulli (1700 - 1782) proporcion la primera solucin al problema de
calcular una cantidad desconocida a partir de un conjunto de mediciones de su valor que) por el error
experimental, presentan variabilidad.

Pierre Simn Laplace (I749 - 7827), introdujo la primera definicin explcita de probabilidad y desar-
roll la ley normal como modelo para describir la variabilidad de los errores de medida. En esta poca
tambin hubo importantes contribucfones de matemticos como Legendre (1752 - 1833) y Gauss (1777
- 1855) para tratar de realizar predicciones del comportamiento de ciertos fenmenos.
Durante el siglo XIX, los matemticos y astrnomos continuaron ampliando la teora, de manera que
a mediados de este siglo ya existan Ias herramientas que permitieron su consolidacin como una rama,
cientfica. A pesar de ello, la aplicacin de estos principios se restringa a Ia Fsica y la Astronoma.

Una descripcin axiomtica de la idea de probabilidad fue dada en 1933, por A. N. Kolmogorov. Ello
constituy la base de la moderna teora, tal como hoy la conocemos. Con sto, se consigui elaborar
modelos complejos y aplicar las probabilidades a muchas ciencias y campos de Ia vida.

En las ltimas dcadas, el empleo de la teora de probabilidades en las modernas ciencias naturales,
en las ciencias sociales y en ramas de aplicacin, como la ingeniera, el clculo actuarial o la economa
ha crecido enormemente y su conocimiento es una necesidad imprescindible.

Antes de iniciar el estudio de la probabilidad, revisemos los principales conceptos del anlisis combi- E
natorio.
_I--

: .

2.2. Fundamentos de anlisis combinatorio

Primero, definamos eI factori,al de un nmero entero positivo z como el producto

n!:nx(n-1) x x2xl. con0!:1

Ahora, consideremos un conjunto finito compuesto por n elementos diferentes: {a1,a2,...,a,-}. Se


desea formar una coleccin constituida por k elementos (k I El nmero de estos subconjuntos
").
depende de si los conjuntos son ordenados o no. Las colecciones ordenadas se llaman uariaciones y
las no ordenadas combinaci,ones.
2.2. Fundantentos de anlisis contbinatorio 53

Definicin (de variacin) Se clenorninr variaci(rrr a cr.cla nrro cle los irrrcgJ,os orclcrrrrlos clc /'
lenreutos, tornaclos cle otlo cle n r:lernentos (k ( n). cle rnanel'l cluc estos arrcrglos rlificrcrL cn algur
.-enientr.i o en el orden de colocacin.

r- rrrrnero cle r'rrirciones de A; elementos qne pueden obtenelsc a partir: de rin coujlurto rl<r it, clcrrtcutos,
--.lotado por Vf,, es igual a
Wn:-
,nl
'n (n-A:)!

Definicin (de combinacin) Se denomina combinacin a cada uno de los subcorr.juntos de k


.-ementos, tomados de otro de n elernentos (A: ( n), sin tener eu cttenta el ordcn de los rnismos, de
--.anera que no pueden haber dos combinaciones con los mismos elernentos.

:- nmero de combinaciones de k elementos que pueden obtenerse a partir de un conjunto de n


.-:mentos, denotado por Cf., es igual a

nl.
kt(n - k)t'

{ Cf se le denomin a coef.ciente bi,nomi,al.

E.jemplo. Encontrar el nrmero de variaciones y de combinaciones de dos elementos que se pueden


-.'tener a partir del conjunto {a,b,c}.

-:'lucin: Se tiene n : 3 y lr : 2.

V! : .--
3! : 6 :
a) Se pueden formar
(3-2)! ;1 6 variaciones, qlle soII:

(a, b), (b, a), (a,r), (c,a), (b,c), (c,b).

'o) Se pueden formar 3! :


^2
"3 - 2(3 - 2)! ^-L
2.r 3 combinaciones:

{o,b}, {o,"}, {b,r}.

Definicin (de permutacin) Una permutacin de n elementos es cada una de las variaciones
r: los n elementos distintos.

=- nmero de permutaciones de n elementos es igual a

Pn: n!'

Ejemplo. Encontrar Ias permutaciones que se pueden forurar a paltir del conjunto {a,b,c}.
I 'iuc'in: Son P3 : 3! : 6 permutaciones; stas son:

(a,b,c), (a,c,b), (r,o"b), (c,b,a), (b,c,a), (b,a,c).

-dirora, consideremos dos conjuntos de rn y n elementos, respectivamente:

A: {at,a2,.".,a,r} y B : {h,bz,...,brr}.
54 Captulo 2. El Concepto de Probabilidad

Parejas. Con los n elementos <.lc A y los tr elerucntos cle B cs posible forrnrl nt,xTt ptrlejirs (rt,,lt,)
<rr: contcngan lln cleniento rle c:rdr con.jrrnto.

Ejemplo. En uur fibrica cle calzrc,lo se confcccirnrn 4 Lnodcl<s de zapatos lttlla. clirmas, en 6 tztrrrarius
cliferentes. Por lo tanto, se pr-reden fabricar 4 x 6 : 24 distintos tipos de zapatos.

Gencralicemos estc concepto a arreglos mrltiplcs.

Arreglos mltiples. Consideremos los conjuntos A: {at,a2,...,a,rr} de n elementos, B :


{,b2,...,b,r}dcnelementos,yassucesivamentehastaG:{g,g2,...,g"}deselementos. Con
ellos es posible formar rnxn x...x s arreglos (a,b,...,gr) que contienen un elemento dc cada
corr.lunto.

Otra forma de ver este concepto es considerar un procedimiento A que se puede realizar de m maneras;
un procedimiento B de n maneras; y as sucesivamente, hasta un procedimiento G de s rnaneras.
La accin consistente en realizar el procedimicnto A, seguido del procedimiento B, hasta llegar al
procedimiento G; se puede efectuar de m x n x - -' x s maneras diferentes.

Ejemplo. Suponga que se clasifica a un grupo de estudiantes universitarios segn su sexo, estado
civil y la carrera que estudian. El sexo puede ser masculino o femenino; el estado civil puede ser
soltero, casado o divorciado; y, digamos que hay 7 carreras. Entonces, hay un total de 2 x3 x7 : 42
clasifi.caciones diferentes.

Anteriormente, se examin las permutaciones de elementos de un conjunto, pero sin repeticin; si ahora
queremos determinar las permutaciones con repeticin, bastar considerar en los arreglos mltiples el
mismo conjunto.

Definicin (de perrnutacin con repeticin) llna permutacin con repeticin, de k elementos
obtenidos a paltir de un conjunto de n elementos, es un arreglo de k elementos ordenados en el que
los elementos pueden repetirse arbitrariamente.

El nmero de permutaciones con repeticin es igual a

P,\, : nk

Ejemplo. Con los elementos del conjunto A: {a,b,c}, cuntas permutaciones con repeticin, de
dos elementos, se pueden formar?

Soluc'in: Se van a formar parejas considerando dos veces el conjunto A, por Io tanto se tiene n:
y k :2; entonces, hay un total de 32 : 9 permutaciones con repeticin; ellas son:
(a, a), (a,b), (a,c), (b,o), (b,b), (b, c), (c,a), (c,b), (c,c).

2.3. Eventos y espacios muestrales

Examinemos un ejemplo: el lanzamiento de un dado una sola vez. Como resultado de la prueba se
pueden producir diferentes resultados: <<sale dos>>, <<sale cinco)>, <<l nmero que aparece es par>>, etc.
Esto nos conduce a definir \os euentos.
Definicin (de evento) Se llama evento, notado como (r, a cualquiera de los resultados posibles
de un experimento u otra situacin que involucre incertidumbre.

Los eventos se clasifican en: elementales, aquellos que constan de un solo resultado: r compuestos,
que consisten de ms de un resultado. Por ejemplo, <<sale dos>> es un evento elemental: mientras
2.4. Defrnicin axiotntica de la probabilidad bl)

llre <<cl nrimcro qrre aparece es pal>> es un evento conpuesto, l)orque cst conformado de Los cventos
-lementales <(sale dos>>, <srle c;uatro>> y <<sale seis>.

,Jbselvernos que todo cvento relacionado con una pn,reba se pr"rede desclibir en trminos de evertos
.lenrenta,les.

Definicin (de espacio muestral) La coleccin de todos los eventos elementales, notirdo por Q,
-e denomina espacio muestral:

A: {rl o es evento elemental}.

lntonces, un evento no es ms que un subconjunto del espacio muestral O.

Sealemos que el concepto de espacio muestral fue introducido por Gaiileo para resolver el problema
-e por qu en el lanzamiento de tres dados "10" y "11" aparecen ms frecuentemente qr-re "9" y "72" .
?ara resolverlo list todos los casos posibles.
-,
olviendo al ejemplo, si consideramos el nmero de puntos que aparecen al arrojar un dado, tenemos:

Espacio muestral: Q : {1, 2,3,4,5,6}.

A-- { el nmero que sale es par }: {2,4,6}.


-''rmo los eventos se asocian a conjuntos, es natural pensar que sus operaciones tienen algn significado
rmo eventos.

::an A y B dos eventos de O, en el siguiente cuadro se presentan 1as equivalencias entre las proposi-
--rnes de las teoras de probabilidades y de conjuntos y en la Figura 2.1 se encuentran los diagramas
-r Venn correspondientes.

lnterpretacin en la teora Interpretacin en la teora


Notacin
de conjuntos de probabilidades
Elemento o punto Evento o suceso
0 Conjunto de puntos Espacio muestral (suceso seguro)
0 Conjunto vaco Evento imposible
.4r B Unin de conjuntos Por lo menos uno de los eventos A o B ocurre
-4. B Interseccin de conjuntos Ambos eventos A y B ocurren
.4\B Diferencia de conjuntos A ocurre y B no ocurre
-4':CI\A Conjunto complementario No ocurre A
A)B:A Conjuntos disjuntos A y B se excluyen mutuamente (incompatibles)
,4C B A es subconjunto de B Si A ocurre, tambin B

:s claro que estos conceptos se extienden a cualquier sucesin de eventos.

:
2.4. Definicin axiomtica de la probabilidad
Lna probabilidad provee una descripcin cuantitativa de la posibilidad de ocurrencia de un evento
;,articular y se puede pensar que es su frecuencia relativa, en una serie larga de repeticiones de una
-rrueba, en la que uno de los resultados es el evento de inters.
s

IS Formalmente, la probabilidad de un evento ,4 se define como una funcin que cumple:


56 Captulo 2. EI Concepto de Probabilidad
i

ii

Figura 2.1: Interpretacin de los conjuntos como eventos: a) Ocurre eI evento A. b) Ocurre A u ocurre
B (A U B). c) Ocurre A y ocurre B (An B). d) Si A ocurre, tambin B (A e B). e) Eventos
incompatibles (A ) B :0). f) No ocurre A (ocurre A").

. A1. Para todo evento A: 0 < Pr(A) S 1.

. A2. Pr(Q) : r.
. A3. Si A y B son incompatibles: Pr(A U B) : Pr(,a) + Pr(B).

De aqu, no es difcil demostrar que en general se cumple la relacin:

Pr(A u B) : Pr(A) + erla - Pr(. B) (2.1)

conocida como frmula de Ia probabilidad para Ia unin.

Ejemplos

1. Dados los eventos A, B y C del espacio muestral f). Expresar mediante las operaciones entre
conjuntos los eventos:

a) Tan solo ocurre A.


b) Si ocurre A, no ocurre B.
c) Por lo menos dos de los eventos ocurren.

Solucin:

a) Puede ocurrir A, y simultneamente no ocurre B y no ocurre C; es decir que el evento es


r E AA B" NC".
b) Si no ocurre B entonces ocurre B"; es decir que <<si ocurre A, tambin ocurre -8">>, el evento
esc AcB".
c) Ocurrirn (Ay B) o (Ay C) o @ V C) o (Ay B y C), pero el ltimo evento est contenido
en los tres primeros. El resultado es: (,4n B)U(AnC) U (BnC).

2. Demostrar que:

a) Pr(") - 1- Pr(A).
2.5. Clculo de probabilidades :)t

b) Si A C B errtorices PL(A) < PL(ll).

Soht,cin,:

a) 0: AA' (conAyA"disjuntos), entoncesi)or A3.. PL(O) :Pl(A) +Pr(A") vpolA2.,


Pr(O) : 1; corr lo que se obtiene: 1 : Pr'(A) + Pr(") v el lesultaclo es inrnediato.
b) Si A C B entonces B: AO(A' tl.B) siendo Ay (A ttB) incompatibles; por lo tanto, por'
A3. Pr(B) : Pr(A) + Pr(4" n B).
Por ,A1., Pr(A n B) > 0, entonces Pr(B) > Pr(A).

.A. continuacin damos varias definiciones de mucha utilidad:

1. Dos eventos son igualmente probables si Pr(,4) : Pr(B).

2. El evento A es ms probable que B si Pr(A) > Pr(B).

3. Euento c'ierto.- Es el que siempre aparece en la realizacin de un experimento, su probabilidad


es igual a 1.

4. Euento zmpos'ible.- Es aquel que jams puede ocurrir, su probabilidad es igual a 0.

2.5. Clculo de probabilidades


-\l realizar el clculo de Ias probabilidades es necesario distinguir de qu tipo de espacio muestral
Cisponemos; ellos pueden ser: fi.nito, infinito numerable o continuo.

2.5.L. Espacios muestrales finitos


Si consideramos el evento A: {rtru)2...,o}, su probabilidad est completamente determinada si
conocemos sus valores en cada elemento Pr({r,,,1}), Pr({a.'2}), . . ., Pr({c,.',}); entonces,

k
Pr(A) : DPr({a.'}). (2.2)
i:t

Un caso particularmente importante se presenta cuando todas las probabilidades Pr(c.r) son iguales.

Si convenimos en designar Card(A) el nmero k de elementos del conjunto ,4 y Card(O) el nmero l/


de elementos del espacio muestral; entonces,

Casos favorables de A
Pr(A) :
Casos posibles
Card(A) k
Carcl(A) /

Es decir, la probabilidad de un evento aleatorio A es igual a Ia relrcin cntre el nrmero de everrtos


eiementales favorables (cuando A sucede) y el nirmero total de eventos elementales del espacio mues-
rral. Esta definicin es satisfactoria en ploblemas referentes a jr,regos de azan',loteras o experimentos
sencillos.
58 Captulo 2. EI Concepto de Probabilidad

En el ejemplo clel lanzamicrtto cle rrn dado cortsicleremos el evcnto A <<salc rtn nrimero rar>>:

O : {1, 2,3,4,5,6}, Card(O) : 6,


A : {2,4,6}, Card(A) :3.

Pr(A) :ffi
Card(A)
:-:-31
62
En los siguientes ejemplos, consideraremos espacios mnestrales finitos y aplicaremos los conceptos de
anlisis combinatorio al clculo de probabilidades.

Ejemplos

1. En un estante hay 2 libros de historia y 3 de biologa. ,Ll azar, se toma un libro y luego se toma
un segundo libro. Encontrar la probabilidad de que un libro de biologa sea seleccionado: a) la
primera vez; b) ambas veces.
Soluci,n:

a) Por defi.licin, O : {11r, Hz,Bt,Bz,Bs}.


Sea A el evento <<escoger un libro de biologa>>; es decir, A: {Bt,Bz,Bs}. Por tanto,

Pr(A)
'-' :9'1!9 :I
Card(f^)) 5'
b) Que ambas veces se seleccione un libro de biologa significa:
. que la primera eleccin es un libro de biologa, entonces se tiene 3 casos favorables; y
. que la segunda eleccin tambin sea un libro de biologa, entonces hay 2 casos favorables.
As, el nmero de casos favorables es igual a 3 x 2 : 6.
El nmero de casos posibles, de todas las parejas sin repeticin, es 5 x 4 :20.
Entonces, la probabilidad buscada es
63
u- 20 10'

2. En la final de un concurso escolar de matemtica participan 6 alumnos, de los cuales 3 pertenecen


al colegio A. Si se premia a los dos primeros con regalos diferentes, cul es la probabilidad de
que los alumnos del colegio A obtengan los 2 premios?
Solucirt: El conjunto f) est constituido por las parejas que se pueden formar con los 6 parti-
cipantes. El nmero total de parejas es Vfr : fr : tO.

Sea el evento B: <<ganan los alumnos del colegio A>>.

El nmero de casos favorables en el cual 2 de los 3 alumnos del colegio A ganan los premios es:
V3 : o. Luego,
Pr(B) :*:0.,
3. Entre 100 fotografas de un sobre se encuentra la foto buscada. Del sobre se extraen aI azar 70
fotos. Hallar la probabilidad de que entre ellas resulte la foto necesaria.
Solucin: Ei espacio muestral Q est formado por los conjuntos de 10 elementos que pueden
formarse a partir de 100: Card(A) : Cl8o.
2.5. CIculo de probabilidades 59

El nrmero de resultados favorables que nos interesa es igual al total de formas como pueden
escogerse 9 fotos de las 99 restantes; es d'ecir, Card(A) : CBg'
La probabilidad buscada es
CP^
:e';:10. 1
Pr(A)

4, En el Consejo Universitario cada una de las 10 facultades est representada por el decano y
el subdecano. Se nombra una comisin de 10 miembros elegidos aI azar. Determinar Ia pro-
babilidad de que:
de
a) una determinada facultad est representada;
b) todas Ias facultades estn representadas.

Solucin:
)ma
a) Considerando el evento complementario A': facultad dada no est representada>>, y
<<una
i) la
calculemos su probabilidad. Hay 20 representantes, 18 de ellos no son de la facultad
en

cuestin, por Io tanto existe" C18 casos favorables'


EI nmero de comisiones diferentes de 10 miembros que se pueden formar con los 20 miem-
bros es C|$, entonces
r_rlq g
Pr(a") :;ifr : s,
finalmente,
Pr(A) -1-*:# x0.7632.

b) EI nmero de maneras diferentes en que pueda estar un representante de cada facultad en la


s'Y
comisin es 210. La probabilidad del evento B: <<todas las facultades estn representadas>>
bles.

Pr(B) : 0.00554.
#ry
Se arrojan dos dados. Hallar la probabilidad del evento : {al menos en uno de los dos dados
salen ms de dos puntos).
Solucin: EI espacio muestral puede describirse como
reCen
rd de
cl: {(i, j)li, j: L,2,...,6},
j
donde el evento elemental (i,j) corresponde a los puntos aparecidos en un dado y los puntos
rarti-
aparecidos en el otro. Consecuentemente, Card(Q) : 36.
Designemos como 81 el evento consistente en que en el primer dado salen ms de dos puntos y
con B2 el evento anlogo para el segundo dado:

Bt : {U,j)l i-_ 3,4,5,6; i :1,2,-..,6},


Bz : {(i, j)l i -- L2,. . . ,6; i :3,,4, 5,6}

u10 por lo tanto, card(B1) : card(Bz) :21. Puesto qrue B1l\82: {(i, i)l i,i :3,4,5,6}, entonces
Card(B1 B) :42 :16. Ahora bien,

: :'! : ?, y Bz):#:
Leden
Pr(81) Pr(Bz) Pr(81
36
60 Captulo 2. El Concepto de Probabilidad

Dc la fr'rnula dc probtrbilidacl para la nrrirr se obtiene:


Pr(A) : Pr(l]1 Bz): Pr(Br) + PL(82) - Pr(81 Bz)
2248
: 5-5-9:b
Se recomienda que el lector resuelva este ejercicio rnediante el ernpleo del evento complernentario.

2.5.2. Espacios muestrales infinitos numerables


Sea f) : {cur, u)2...run,...} un espacio muestral infinito numerable; entonces, resulta que

ie,1i,,,)) :1,
i:l

luego, si A es un evento de Q, su probabilidad se calcula por

Pr(A) : t Pr({a.'}).
u,A

Para el clculo de las probabilidades, generalmente, se utilizan series numricas infinitas.

Ejemplo. Juan y Andrs juegan tenis con la misma habilidad. Deciden jugar una secuencia de sets
hasta que uno de ellos gane 2 sets seguidos. Halle la probabilidad de que se necesite jugar nmero
par de sets para terminar el juego.

Solucin: Sean los eventos: J: <<gana el set Juan>> y A: <<gana el set Andrs>>.

Segrn el enunciado, el espacio muestral est conformado por los siguientes eventos elementales:

rL Empieza Juan ganando Empieza Andrs ganando


1. JJ * AA
2. JAA AJJ
3. JAJJ * AJAA
4. JAJAA AJAJJ
5. JAJAJJ * AJA.IAA

El evento B: jugar hasta que uno de ellos gane 2 sets consecutivos>> es la unin de los eventos
<<se
que estn sealados con una estrella (*) en el espacio muestral.

Se tiene que

Pr(AA) :
1
Pr(JJ) +
i'
Pr(JAJJ)+ Pr(AJAA) : 1
=.
8

Las restantes probabilidades,on l,32', l12g'etc'


Entonces, la probabilidad de B est dada por la suma

Pr(B) : [Pr(JJ) + Pr(AA)] + [Pr(JAJJ) + er(e;eA)] +...


1111
_ _ _
_l_ _l_ _-!- -.
1
:
2'8'32'128 -
-.t-
')2tt-l
_.1_ _l_

-
2.5. Clculo de probabilidades 61

La srrlrr cle est selie geornritrir;r es igual a ?, ,r,,r'Io clrrc Pr(B) : ?.


33

2,5.3. Espacios rnuestrales continuos


Sttpongamos cte sc tienc rtna" figura rltrna f) v <lcntro de ella sc encucrrtr'1 otrr figura A (Figura 2.2).
Sobre Ia figura Q se hr rrrrlCrdo uu pttnto al azar'. Suponiendo <1ue la prolrabilidtrcl clc que el punto
':aiga en A es rropolcional al ilea de Ia figula y no de su forrna o posicid-rn, la prolrabiliclad de quc el
'r-ttlto caiga en la figu'a A cs:
r-ca de A
l'r'(-4) :
Area de f)

O -.

ItS Figura 2.2: Interpretacin geomtrica de Ia probabilidad.


)ro

En general, si A es un evento cle un espacio mnestral continuo O, tal que su rnedicla (longitud, ',rotrr*"r.,
,iempo, etc.) existe; entonccs, su probabilidad cs

\{edida cle ,4
Pr(A):
\tledida de O'

Ejemplos

1, Sobre un plano se trazaron circunferencias concntricas de radios 5 cm y 10 cm, respectivamente.


Halle Ia probabilidad de que un punto marcado aI azar en ia circunferencia mayor caiga tambin
en el anillo forrnado por las dos circunferencias (Figura 2.3).

Figura 2.3:

Sol:ucir: El r'ea del crculo lnayol es ,5: I02rcm2: 100ir<'rrr2.


El rea del anillo comprendido entre las dos circunferencias es igual a la diferencia entre las dos
reas: 7: (702n - 52n) cm2 : 75tr cnt2; entonces,

T
:s:loo;"-t:o'75'
75r cttt2
Pr(A)
62 Captulo 2. El Concepto de Proba'bilidad

2. Sr:L l) :
{(:r;. !l) I () <:t; I 1; il :l I ii (i,';grui.2"4) ci i:sirir.<:io irirrstliil ,i,:r rrrr fcririrrrcro akrirtolir
v sitP<ttticrttlo c.irrr: io<lrl prulto <l<r (l'itrrr,'l;r risrirr rlolrrrlrilirltlrl ilc sLl 1r".rLtLo clL r;rrerL1a.

Jr

il 4 x
,,4n8 E
117

Figura 2.4:

Detclrninar' la probabilidacl de los evcntos:

.d) A: {(r,y)/0 I r < tl2; 0< y < t};


lr) B : {(",y)10 ( r { 1; 0 < y < lla);
c) An B;
d) A B.
Solttctr:

a) rca O: 1 x 1 : 1.
cle

re.r cle A:! * t: 1. eutrnces pr(.,{) - !12 :!.


22 1:
l,) rcu de B - * j,,,,rto,,,", Pr(1J) :+ =
' 1: i
:; :
I " I: j,
.,) r'ea rt: A B pr.(A n B)
"r,tou.", *
cl) Por la fr'inula dc la unirr,

Pr(A u a) : Fr(,a) + Pr(B) - Fr( n IJ)


111ir
2488

2.8" ;i!e::cir:ios

Anlisis cornbinatorio

l" Culcuie lcis siguierri,cs (ioccitintcs bilorrrilcs Cf,: n) Ci; b) C1]; r) Ci:
2. C.lc.le Vf eri l<,rs sigrricrrtcs cr:jos: ,r) Vl; lr) V!; ,r) V3; cl) \.].

3. Dctcrtrtirc r:1 tttirnclo tle lrr:ilruiar.:i'rn('s ( lr rilr,,,,l.iiurt' lg 1 r)]r:rrrr:irr r

it) rt,:3 1r) n :4 c) rt:5: 'l)'t t


:(t
4. Dci,clttiilrt cL rrirrrcro <1r: rarr:iils fllrtrarl,Ls i;r-,i los crlctrretrtos rlc los,
2.6. Ejercicios t-).)

a) Carrl(,'l) I Clar <l(13)-.) C:) CaLcl(,'l)- 8, CaLri(lJ) : lj;


b) CaLrt(A) f,
,). Car rl(ll) I ,t) Card(.,1) : 1ij. Clald(t: - 5.
-
Cr-rntcls alrcglos se prrerlcu forrnu corr los eleurcntos de los cou.lrurtos cuvr cardinrliclrd sc in<lica:

a) Card(A) : 4; Card(13) : 2 Crrrd(C) - 5.


b) Card(A) :5; Ctrrcl(B) :7; Carcl(C) :4; Card(D) : 5.

6. Cnntas palejas con rclposicrn pueden formar-se con conjuntos crtya crlclina.lidad es:

a) n:3; b) rz:5; c)rt:T; d) rr,:8.

l. Ftxure todas las combinaciones y valiacioncs qlre se pnerlen obtener a parl,ir de los cortjuntos:

a) A: {a,,e,'i,o,z} cn grLlpos de tres elementos;


b) B : {I,2,3,4, 5,6} en grupos de tres elementos.

8. Para los conjuntos indicaclos forme todas las pa,r'ejas sin reposicin y parejas con reposicin:

A: {a,e,i,o,u}; b) B: {I,2,3,4,5,6).
^)
r;r cortrruc uv.r-iu!ar--- -, .--:. eiirr-'131. ql.- -.-:iir::-,i', , $:rL)iici y [1 silllg:r'ente; debe elegi' un
presidente y r-rn vicepresiderr c. De cuntas maneras se pueclerr elcgrr esr,e par dc fiutcrorrilios
si el presidente debe ser nn ;:iente?

Ul hospital cuenta con 21 ci r.ijanos (ion ri)s, ,,'-.ies hay que folrnar ter-uas para relizar guardias.
.Cunttrs ternas sc pueclen f:rrnar?

Un amigo le quiere regalar a tro 3 cliscos y los quiele clegir cntre los 10 que ms Ie gustan. .Dc
cuntas marreras pucde hace'lo?

') Al c,iirs, r'ccolclando quc stas


marc:ar urr nrniero telcfnico lula persona olvid las trcs rltimas
sorr difclentes, J.as malc al azar-. Halle la probabilic.lad de que se haya marcado las cifras
correctts.

De entre 9 empleados se deben selecciorrar a 3 para viajar a 3 Jrlar,'s A, B y C fuera dc la


ciuclad. Cacla empleado ir a una planta. De cuntos modos se puede iracer la seleccin de los
ernpleaclos que via.jarn?

Eu cl ejcrcrcio rntelior considresc qrre los 3 enrpleirclos \an a ir l l misrna planta. .D<: curintas
rnaneras se puede hacer la seleccicin?

Si cn el ejelcicio antcrior, cle los 9 ernplcaclos, 7 son homl>res. Cul es Ia probabilidacl de


entrc los tr<ls cscr-lgiclos'/
sclecciorra: cxrcta,rnentc r.rrrtr nrr-er

_)
.Currtos nrirneros de 6 cifras pucderr haccrse con los dgitos {I,2,3.4, 5, 6}:

rr) sin rcstliccin algrrua'/; b) sin rcpctil ling;'.url cifra?; c) maStolcs crc 500000?

Sicte pcrsonrs h1n soiicitado empleo para lleuar dos r.acantcs. De currtos modos se puerclen
llcrrar lts vat:rrrtcs si:

rr) la pr:irncrl i)crlsoul selcccionaclr tecibr,r nr:tyor salario que la s,)grul(ia?;


b) no hay clifer'<lrrcil cntre las racan1 cs'/
64 Captulo 2. EI Concepto de Probabilidad

18. i',Cttrrtos partidos sc .jucgatt cII ull cirruptxrrrato. crrr cl qrre prrlticipan 20 cqrripos y en el quc
.iuegan toclos contla to<[os. rul{) crr crsa V otlo <lc visil rlrte?

19. Etr tttr lestattrarttr: cie cotnicla rtipicla se inclir:a al clicrrtc (lrrc sri harnbrrlgr-resa. a rns del pan 1,
la catne, puede ir cou todo lo siguiente r sin ello: salsr clc tornatc, nrostaza, rnayollesa) lechuga,
cebolla, tomate o queso. .Crt:intos tipos difercnt<,rs <1r: hirrnburguesas son posibles?

20. La produccin de una rnqnina cronsta de 4 frses. Ilirl' 6 lneas cle montajc pala la primera fase,
3 para la segunda, 5 para l:t telcrerir, y 5 para la irltirrrr. Detelmine de cnntas forrnas distintas
se puede montar Ia mquina en este proceso de produccirr.

21. Eu un plano hay 15 puntos de los cuales rro hay tles que sean colineales. Cr-riintas rectas
determinan?

22. Cuntos tringulos determinan los vrtices de un polgono regular de 9 lados?


23. Una heladera tiene 16 sabores disponibles. De cuntas formas se pueden pedir 6 helados si:

a) no se elije el mismo sabor ms de una vez?;


b) se puede pedir un mismo sabor hasta 6 veces?;
c) un sabor no se puede pedir ms de 5 veces?;
d) la mitad debe ser de fresa?
24. Un entrenador de frtbol debe seleccionar a 11 jugadores de entre los que haba conocado
anteriormente para Ia concentracin. Si puede hacer su seleccin de 72376 maneras, .cuntos
jugadores estuvieron preserrtes en Ia concentracin? (Se supone que ningirn .jugador tiene un
puesto fijo de juego.)

25 En un Ienguaje de computacin, un identificador consta de una Ietra o de una letra seguida de


hasta siete smbolos, qrte ptteden ser letras o dgitos. (En este lenguaje son indistinguibles las
letras maysculas y minrscrrlas, hay 26 letras y 10 dgitos.) ',Cuntos identificadores diferentes
se pueden utilizar en el lenguaje de computacin?

26. En cualquier set de un partido de tenis, el oponente X puede vencer al oponente Y de siete
maneras. (Con el marcador 6 - 6, se juega uu desernpate: tie breaker) El primer tenista que
gane tres sets obtiene la victoria. De cuntas maneras se pueden registrar los resultados si:

a) X gana en cinco sets?;


b) para ganar el partido se necesita jugar como mnimo tr.es sets?

27. De cuntos modos se pucden poner 5 anillos diferentes en los dedos de una narlo. omitiendo el
pulgar?
Definicin de probabilidad
28 Sean Q un espacio muestral y A, B y C eventos cualesquiela) exprese las siguientes afirmaciones
conro uniones e intersecciones de A, B y C y de sus conrplementos.

a) Ninguno de los eventos ocurre; c) No ocurre ms que un e\-ento:


A, B, C
b) Por Io menos uno de los eventos A, B, C d) Ocurlert exactanlellte cios eveutos;
ocnrre; e) Ocrrrren no ms de dos e\-entos.

29. Con el empleo de Ia definicin de probabilidad, dernuestre:


2.6. Ejercicios

a) Pr(0) : o; c) Pr(A u B) < Pr(A) + Pr(B);


b) Pr(AuB) : Pr(A) +Pr(B) -Pr(Ana); cl) Pr(A) : Pr(-4nB) +Pr'(AnB').

aj 30. Se arrojan dos dados, sean A el evento <<la suma de las caras es impar>>, y B el evento <<sale por
Io menos un tres>>. Describa los eventos A a B, Atl B, A l\ 8". Encuentre sus probabilidades
si se supone que los 36 eventos elementales tienel igual probabilidad.
i,
AS 31. Se consideran dos eventos A y B, tales que Pr(A) : 1 r PrlB) : 1. Determine el valor de
3" 2
Pr(A'O B) en los siguientes casos:

a) A y .B son incompatibles; b) A C B; c) Pr(A n B) : :1


8

:32. Se consideran dos eventos Ay B, con Pr(A) : 0.375, Pr(B) : 0.5 y er(AnB) :0.125. Calcule:

a) Pr(") y Pr(B"); c) Pr(" ) B");


b) Pr(A u B); d) Pr(" n B) y Pr(A. Bc).

'),). Sean A y B dos eventos tales que Pr(A) :0.9 y Pr(B) :0.8. Demuestre quePr(AnB) > 0.7.

34. Un experimento aleatorio consiste en arrojar una moneda y un dado a la vez y observar el
resultado. Escriba el espacio muestral del experimento.
rdo
tos ,JD Una empresa tiene dos tiendas distribuidoras, una en el norte y otra en el sur de la ciudad. De
utl Ios potenciales clientes, se sabe que el 30% solo compra en la tienda norte, el 50% solo compra
en la tienda sur, el 10 % compra indistintamente en las dos tiendas y el 10 % de los consumidores
no compra en ninguna de las dos. Sean los eventos A: <<el cliente compra en la tienda norte>> y
de B: <<el cliente compra en la tienda sur>>. Calcule las probabilidades (e interprtelas):
las
tes a) Pr(A); d) Pr(A n B); g) Pr[(A n B)"];
b) Pr(,A u B); e) Pr(A \ B);
ete c) Pr(B"); f) Pr(" B"); h) Pr(A u B').
lue
: 36. En la interseccin de una autopista, los automviles pueden girar a Ia derecha (D) o a la izquierda
(1) Desde un puesto de observacin se registra el sentido de la maniobra de los tres primeros
vehculos.

a) Cul es el espacio muestral del experimento?;


rel b) Sea A el suceso <<a lo ms uno de Ios coches gira a la derecha>>, B: <<todos los vehculos
giran en Ia misma direccin>> y C: <<exactamente uno de los coches gira a la derecha>>.
Qu relacin existe entre Ios sucesos B y C?;
c) Enuncie y halle los elementos de los sucesos B', BUC, A)8, AcaB".

Clculo de probabilidades
.)/. Un gerente de compras desea hacer pedidos a proveedores diferentes, a los que nombra corno A,
B y C. Todos los proveedores son iguales en lo que respecta a la calidad por lo que escribe cada
letra en un papel, rnezcla los papeles y selecciona a ciegas a uno de ellos. Se har el pedido al
vendedor que salga seleccionado. Calcule las probabilidades de los eventos:
66 Captulo 2. El Concepto de Probabilidad

a) SC scloc:r:iorr<i itl plovrtr:clor' /l; c) cl proverr:clor ,,1 rro sc sclc<:cionr


l,) s(l s<rlc<:r:ioLra ttl 1>r'ovccrlr.rt A c ():

Sttpong:t quo cll ttn soLt(:o itr lrrolrirlrilicltcl rlc galiar prirner prcrrric-r.,,
f v
38 c1 1a,1" girnzrr cl
3^Si 1a
:. 3
r.cgLttLc[,r rt.'tnio,'s
i irrolrabilirlrr1 r[c Bur:r1 rl nretrros rrrro clc los rlrs ltlcrnios es ;-l . ;.r:irlcrrlc
la probabiliclrcl clc garrrl solo rrrro dc los rlos plenrios'/

39 Sc enr'rtt 3 oficios a 3 personas diferrentcs. Sin ernbrr'lo, una secretria distr'rcla levrir:lvc los
oficins v sc pttccle consitlelal clttc los lnalr(l rl z1r. Si turr coirrcidencria <rs el hcchri rle rlrrc rrna
persona recil-,a el oficio correcto. cak:ule la probabilidad de que haya:

a) ninguna coincidcricia;
b) exactarrrente rrna coincidencia.
40 La fbrica errsarnbladora ha dcterminado que Ia demanda clel arrto Honda Civic es igual para
cada uno de los colores azul, blanco, verde y rojo. Se haceu tres pedidos sucesivos de autos de
ese rnodelo. Deterrnine la probrrbilidad rle que:

a) se piclan uno azul, uno blanco y uno rojo;


b) se piclan dos azules;
c) se pida por lo menos rrno vcrde;
d) exactarnente cios rle los cluc se pidicron tengan el rnisnro color.

4I Lr-icgo dc las 1>ntel)ls tr)I a ocupar un puesto a los 6 aspir;r.rrtes se lcs clasifica de a<rrrerclo al 1>untaje
obtenido. Los rcsrtltr<los uo le llegtrn al empleador pol lo quc l contlatr a clos aspirantes al
azar'. ,Cul cs ia ltrobabili<lad tle quc haya contratado a los dos aspirantes me,jor crlificados?
r)
,1
Un pacltrete cle 6 focos tienc 2 rrnidacles clefectuosas. Si se cscogen 3 focos para su uso, calcrrle
la probabilidad cle qr-re ninguno tenga clef'cctos.

43 En ttna caja hay 20 fotografas en la cual htry 6 mal tomadas. ,Cul es la probabilidrd de
selecciorrar 2 fotografas clefectuosas'/

44. Entre 100 artculos de ttn lote hay 5 <iefectuosos. Halle Ia probabilidad de que entre 10 altculos
escogidos aI azar, no sc tenga ms cle un artculo defectnoso.

45 Un distribuiclor de electrodomsticos recibe un euvo de 20 pianchas, cie las curles hay 3 defcc-
tuosas. Para conocer si el lote est buerro pmeba 6 aparatos. trl distribuidor aceptari el lote
si cltcttetitra a lo rns ltn aparato dcfec:tnoso cntrc los prolrados. Cul cs lt pl'ollabili<lad cle
rechazar el envo'/

46. De un ttft-rrir, quc contietre 100 boletos. se extrerr tres bolctos ganadores. ;.Crr1 cs la lrrob:r-
biliclad de que gane una persona que conrlrr:

a) 4 boletos?; lr) solo un bolcto?

47. Entt'e 1as 80 t:stacioncs de sen,ir:io qrrc hay ell nnA cindarl, 10 errtrcgan unr ca:i-i'la,l merrol clue
la que el cliente comprr. tlu inspect,or clc la Dircccin de Hiclrocarbrrros r-i..it:r aiertorirmente
cinco de ellas para velificar si la cantidad'n'enrlidr cs correctt. ,CLrl es la p:'',rt,airrliclad rle que
descubra al nenos una fiaudulenta?

48. En el juego del <<cuarenta>> se reparten 5 cartas, al azar, a cada jugador. a palil' ,Le rrn mazo de
40 cartas. ,Cul es la probabilidad de que un jugador tenga:
2.7. Independencia y condicionalidad 67

r) urr as) rur dos, un trr:s, un cuatLo y un c:irrro, clel rnisnio pnlo'/;
l,) 4 cu'tas <lel rnismo pirlo'/;
t:) rrua <<rorrcla>>; cs rlecir', 3 calt.rs rle ia rnisrna clelornillci<in (as, clos, etc.)?

i9 En nrr closet hay 6 pales cle zrpatos. Se escogcn 4 zapatos al azar. Encuentre la probabilidad
rle de qnc haya pol io rnenos lrn par de zapatos errtre los 4 zapatos escogidos.

50 Err los pases europeos existe una forma muy popular de lotera, llamada Lotto, que consiste en
OS seleccionar'6 nmeros de una cartilla que contiene 44 nrmeros (del I aI 44). El da del sorteo
na se seleccionan 6 bolas al azar y sin reposicin. Una persona gana el premio principal si los
6 nmeros sorteados coinciden con los seleccionados; tambin se puede ganar prernios si 4 o 5
nrmeros sorteados coinciden. Determine la probabilidad de:

a) ganar el premio principal; b) ganar al menos un premio.

rra 51. Una persona presiona, aI azar, 8 cifras en una calculadora. Cul es la probabilidad de los
de eventos siguientes:

a) ,4.: <todas las cifras sean distintas>?;


b) B: <<el producto de las 8 cifras es un nmero par>>?;
c) C: <<las 8 cifras forman un conjunto creciente>?;
d) D: <<la suma de las cifras es igual a 3>>?
i2. En un crculo de 20 cm de radio se encuentra un crculo menor de radio 10 cm. Halle la
aje probabilidad de que un punto marcado aI azar en el crculo mayor caiga tambin en el crculo
,al menor.
,
=.)
.1.J. Dentro de un cancha de baloncesto, cuyas dimensiones son 20 m por 12 m, se encuentran dos
ule charcos que tienen forma de crculos, de 8 y 5 m de dimetro respectivamente. Cul es la
probabilidad de que una pelota lanzada a la cancha caiga dentro de uno de los charcos?
de .J+
=1 Dentro de un rectngulo de base 10 cm y altura 6 cm se encuentra un crculo que es tangente
a 3 de los lados. Si se marca un punto al azar dentro del rectngulo, calcule la probabilidad de
Llos
que el punto no se encuentre dentro del crculo.

Dentro del rectngulo limitado por las rectas , : -L,, :;, A : -7, A : l, se tiene el
bc- grfico de la funcin trigonomtrica seno. Sobre el rectngulo cae una gota de tinta. Cul es
ote la probabilidad de que Ia gota de tinta haya cado dentro del rea comprendida entre el eje r y
de la curva A: sel:x? (Observacin: Suponga que el rea, de Ia mancha de tinta es despreciable.)

2.7. Independencia y condicionalidad

Fn la teora de probabilidad un concepto muy til es el de independencia de eventos, que significa que
-a ocurrencia de uno de los eventos no da informacin sobre si otro evento ocurrir o no; es decir, Ios
lue -r-entos no influyen uno sobre otro.
nte
lue
Definicin (de independencia) Dos eventos A y B se llaman independientes si la probabilidad
de que ambos ocurran es igual al producto de las probabilidades de los dos eventos individuales.
Es decir,
,de Pr(A n B) :Pr(A) x Pr(B).
Captulo 2. El Concepto de Prcbabilidad

Esta dcfinicin se puede extender a cualquier nrmero de eventos.

Observacin.- Si A y B son independientes, se puede dernostrar que sus respectivos complementos


son independientes; es decir, que se cumple:

Pr(An B'): Pr(A) x Pr(g").


Pr(A n B) : Pr(A') x Pr(B),
Pr(A" n B') : Pr(A') x Pr(g").

No se debe confundir los conceptos de eventos independientes y de mutuarnente incompatibles (dis-


juntos).

Ejemplos

1. Sea Q: [0,1]x [0,1] y dados los eventos: A: {(r,a)10 S r 5ll2; 0 < y < I}, B : {(",A)10 <
r 1I;0 <y <Il ). Probar si A y B son independientes.

Figura 2.5:

Soluc'in: Segn la Figura 2.5 se tiene que Pr(A) : 1


\/4 :
PrlB) l.
1
entonces
i,
Pr(A) x Pr(B) :+" 11
48'

Por otro lado, antes se calcul que Pr(A n B)


I
Como se cumple que Pr(A n B) : Pr(A) x Pr(B), entonces los eventos A y B son independientes.
2. En una mquina, para la sealizacin de emergencia se han instalado dos indicadores que fun-
cionan independientemente. La probabilidad de que el indicador funcione durante una avera es
de 0.95 para el primero y 0.9 para el segundo. Hallar la probabilidad de que durante una avera
solo funcione un indicador.
Soluctn: Sean A: {funciona el primer indicador} y B: {funciona el segr,rndo indicador}.
El evento f, : {funciona solo un indicador} puede expresarse como C : (-{ i B')U (A l\ B).
Calculemos cada una de ellas:

Pr(AnB") : Pr(A) xPr(B') :(0.95)(1 -0.9) :0095.


Pr(A'n B) : Pr(A') x Pr(B) : (1 - 0.95)(0.9) : 0.045.
2.7. Independencia y condicionalidad 69

Pcu lo trutto.
Pr(C) : Pr'(,4 a 13") * Pr(4" . 13) :0.095 + 0.045 : 0.14.

Tles bicllogos, irr<lepcnclierrtcrncutc uno clel otlo, nriclielon el c:<rrtcniclo <,1<'l suero c1t tllll tttttestra.
La proba.bilidacl cle <-re cada uno cometr Lln el'ror eu Ir lcctur:r dol apzrlato cs igutrl a 0.1, 0.15 y
0.2, r'r:srectivarrrente. Hallal la probabilidad de que cll ttna s<,rla rneclicitt pol lo meros ttno de:
Ios investigrclores coureta Lrrl erlor.
Soluc,i,n,: Ser el evento : {por lo menos uno de los investigaclolcs coniete urr crror}, el
complerrento es A" : {ninguno de los investigadores comete un error}.
CaiculrrernosPr(4"), considerando que las medicioltcs son evctttos inclcpendientcs.
(dis- Sean p la probabilidad de que el i-simo investigador cometa un error (i: I,2,3), entonces

Pr(A') : (1 -pr)(t-pz)(I-pz)
: (1 - 0.1)(1 - 0.15)(1 - 0.2) :0.612.
/0< Resulta que Pr(A) - 1- 0.612 : 0.388.

r-n concepto estrechamente relacionado con la independencia es el de condicionalidad de eventos, que


.e lo puede enunciar de la siguiente manera: <<se tiene fijo un cierto evento B, se desea conocer cul
- la probabilidad de que ocltrra un evento A, sabiendo que ocurri B>>.
?or ejemplo, suponga que usted va a almorzar al mismo Iugar todos los viernes y que su almuerzo
- sirve en 15 rninutos (evento A) con probabilidad 0.9. Sin embargo, daclo que usted nota que e1
_rstaurante est excepcionalmente lleno (evento B, fijo), la probabiliciad de clue sirvan su almuerzo en
-5 minutos pnede reducirse a 0.7. sta es la probabilidad condicional de ser servdo en 15 mirr.utos,
rado qne el restartrante est excepcionalmente lleno.

Definicin (de probabilidad condicionada) Consicleremos un espacio tnttestral Q y un evento


3 e Q tal que Pr(B) 10. La probabilidad condicional de que un evento A octtrra, en el supuesto
:,-re B ha ocurlido) se representa por Pr(AlB) (que se lee <<probabilidad de A, dado B>>), se define

Pr(AlB):HF

Ejemplos

-. En nn estudio sociolgico sobre Ia fidelidad en el matrimonio sc obtu'u,o el siguiente modelo


probabilstico, calificando al hombre y a Ia mujer como fiel (,F) o iufiel (/).
entes.
Mu.jer
e fun- Hombre F I
lra es F 0.22 0.24
avera I 0.31 0.23

r). a) .Cul es Ia probabilidad condicional de qtte ttrr esposo seir fiel, clirclo qr-re sll esposa es fiel?
b) '.Cul es Ia probabilidad de ctrr-te ttl)a esposa sea fiel, claclo
(luc srr csposo es infiel'/
n B).
Sol'u,cin; Corrvengarnos en la siguiente notcirr de los ercrrtos:
.f1F: Hornbre fi.el, 111: Hombre iuficl,
,41F: N{u.ler fiel, 11,/1: \4Lr.jer infiel.
70 Captulo 2. El Concepto de Probabilidad

a) Dcseamos calcular
PI(II I-IAI F) : f'r(II F. n{F)
Pr(r1F)
De 1a tabla se obi:ierrcr cllle

trL(i1F . AI F) ),
Pr(n1F) 0.22 + 0.31 :0.53.
Con sto,
0.22
Pr(111lrt{F) : : 0.415.
0.53
b) Calculcmos
n HI)
Pr(A,I FIH i) : Pr(MF
Pr(H/) )

con
Pr(MFnf{f) :0.31 y PI(III): 0.31 + 0.23 : 0"54.

Entonces,
g'31
pr.(,41 FIHI\:
' 0.54
:0.bT4.

2. En un taller trabajan 7 hornl)res y 3 mujcles. Se escogen al azar 3 personas. Hallar la proba-


bilidad de que todas las pcrsonas selcccionadas sean hombres.
Solucin: Designemos los siguienfes eventos:
A: el primcr selcccionado es hombre,
B: el scgundo seleccionado es hombr-e,
C: el tercer selecciorraclo es honiirre.

* La probabiliclad cle que el primelo s<-.r


\/
hombre es Pr(A) - :10
u La probabiliciad de <+re el seguriclo sea hombre a ccndicin de qrre el primelo f.,e hornbre
ES:

Pr(BlA\:9:?
__\_r--l
9 3
u La pI'rbabilidad de que el tercero sea hombre sabir:rrdo que los dos primeros trnrbin lo son,
es la probabiiidacl dc C dado A y B:

:'r(C An : !.
ll),E
tr-ir pr"obabiiidrci buscacla tlc clrrc las i,lcs i)crsonrs escc.rgiclirs sean holrlrres es

?, (,{ I B. C): PL(,,t) x P: (13lri) x Pr(Cl4 i', ::


B)'1(l,i: : I:

2.8. Frobabilidad coxmpleta y fnrutula de Bayes

La probabilidrd clc: A, que puccic ocrrriir sclo rl lllrlecel uno rl,:.'. . .1 ,,< r-trLrtuarnerLtr:
Lttt cvonto
f:xclltt'giss B t, 82, .. , 8,, (Figura 2.6), talcs (llre sli unirr es el espacio rri,r.:j r.- j ,'1 (lada por

Pr (A) : I'r(131)Pr(,,t1-ts1) * Iri(82)Fr(Al1l2) + .."+ I'r,!,, i - : (2 3)


lt
\- n,.r /? ' nr / 1'|r \
1r'.\L.tt_
2.8. Probabilidad cornpleta y frtnula de Eayes 77

donde Pr(81) + Pr(82) + .. . + Pr(B,,) : 1.

La igualdad (2.3) se clenornirra la fr'rnttl,a dc la prolttt,bi,lidad com,pleta.

Figura 2.6: Particin del espacio muestral fl.

Supongamos que el evento A puede ocurrir a condicin de que aparezca uno de los eventos Bt, Bz,
..., Bn. Si A ya ocurri, la probabiiidad (condicional) del evento B es igual a

Pr(B6lA) :ffi:g;ffi
Pr(AnB) Pr(B)Pr(AlB)

i:I

Fsta ieualdad se denomina frmtil,a de Bayes.

?ara e1clculo mediante la frmula de Bayes puede resultar conveniente disponer las probabilidades
:t rn diaqrama de "'rbol como el siguiente'.
A
Pr(81)Pr(Al81)
A'
Pr(81)Pr(A'lB1)
A
Pr(82)Pr(AlB2)
Ac
Pr(82)Pr(A'lB2)
A
Pr(8,)Pr(AlB")
Pr(8")Pr(A'lB")
rsta dispctsicirr de los datos facilita la rcaiizacin de los clculos ya que
nicamente se debe realizar
-na slrma de los resultados en las ramas de inters

Ejer.:rIos

l. En una oficina hay 6 computadorrs de marca y 4 ciones. La probabiliclad de que al utilizar una
mc1lrina, sta encienda correctameirte es 0.95 para las de marca y 0"8 para las clones. Un em-
pleado utiliza aI azar una computadora, hallar la probabilidad dc que se encienda correctamente.
.4oluci,n: Definamos los eventos:

.3)
A: el empleado ul,iliza una mquina de marca,
B: el crnpleado utiliza una mquina cin,
C: la mquina enciende correctarnente.
72 Captulo 2. EI Concepto de Probabilidad

Sc ticrrc,
4
PL(A) :*:,,0, Pr(ll) :r0:,,.n.
Pr(ClA): 0.95, Pr(ClB): 0 8.

Si reprcsentrmos las probabilicladcs crr un ditrglama cle rbol se tiene:


C
PL(A) Pr(ClA) : (0 6)(0.e5)

Pr(B) Pr(ClB) : (0.4)(0.80)

Por la frmula de la probabilidad completa,

Pr(C) : Pr(A)Pr(ClA) + Pr(B) Pr(ClB)


: 0.6 x 0.95 * 0.4 x 0.8 : 0.89.
2. Dos mquinas envasan gaseosa de manera automtica, resultando que la primera envasa el doble
qrre la segunda. La primera mquina envasa el 60% de las botellas con Ia cantidad exacta y
la segunda el84%. Una botella tomada del transportador result llena con Ia cantidad exacta.
Hallar la probabilidad de que haya sido envasada por:
a) la primera mquina; b) Ia segunda mquina.
Sohtcin: Designenos por eventos:
A: la botella est llena con la canticlad exacta;
81: Ia botella ha sido envasacla por Ia primera rnqr-rina;
82: la botella ha sido envasada por la segunda rnquina.

a) Se tiene
Pr(81) : j,2I Pr(82) : :.
La probabilidad condicional de que la botella contenga la cantidad exacta, si ha sido en-
vasada por Ia primera mquina es

Pr(AlB1) :0.6.

La probabilidad de clue la botella contenga la cantidad exacta, si ha sido envasada por la


segunda mquina, es
Pr(AlB2): 0.84.

Por tanto, la probabilidad de que la botellr tomada aI azar contenga la cantidd exacta es

PL(A) : Pr(81)PL(Al81) +Pr(82)Pt(AlBz)


: 21
5x0.6+j"0.84:0.68.
La probabilidad del evento <<se escogi nna botella con Ia canticlad e\acta llcna<ta por la
plimera mquina>> es igr-ral tr
2
Pr (81) Pr(Al81) _ =3 X 0.6 _ ri-,
rLl
Pr(.ts114):
Pr(A) 0.68 i;
2.8. Probabilidad cornpleta y frmula de Bayes 73

1-,) Ltr prcibttbilidtrd del crcnto <se escogi unr botcllr r:on la cantidad exacta llcuada poi' Iir
segurrcla m<rirrir>> es

Pr'(82) Pr(AlI]2)- o'84


Pr(BzlA): ''
'l i "
- " o.o, -
T

17.

Este resultado tarnbin se puede calcular eurpleando cl concepto dc evento cornl lerlentario.

Err trna ciudad, el 25% de los habitantes son ancianos, el 35 % adultos y ei 40 % sorr lios. Se
sabe que la glipe afecta al5% cle Ios ancianos, al4To de los adultos y al2% de los rrios.

a) Calcular la probabilidad de que un habitante, seleccionado aleatoriamente, tenga gripe.


b) Si un habitante tiene gripe, cul es Ia probabilidad de que ste sea anciano o nio?

Solucin: Designemos los eventos:


A: el habitante es anciano. D: el habitante es adulto.
l/: el habitante es nio. G: la persona tiene gripe.

oble a) Si utilizamos el diagrama de rbol tenemos:


tay
G
cta. Pr(.4) Pr(GlA) : (0.25)(0.05)

Pr(D) Pr(clD) : (0.35)(0.04)

Pr(N) Pr(GlN) : (0.40)(0.02)

Ahora, basta sumar los resultados parciales en las ramas para obtener el resultado deseado:

Pr(G) : Pr(A)Pr(GlA) +Pr(D)Pr(clD) +Pr(r/)Pr(clr/)


: 0.25 x 0.05 + 0.35 x 0.04 + 0.4 x 0.02: 0.0345.

La probabilidad de que un habitante de la ciudad tenga gripe es del3.45r/o.


r Ia b) Por la frmula de Bayes:

: Pr(A)Pr(GlA) _ 0.25 x 0.05 t25


Pr(,alc)
ta es
Pr(G) 0.0345 345'
Pr(r/lc) : Pr(.n)Pr(Gl.nr) _ 0.40 x 0.02 80
Pr(G) 0.0345 345
Consecuentemente,

or lr
Pr(,4u/lG) : Pr(AlG) +Pr(.n/lc)
r25 80
345+3*:0'594'
La lrlobabilidad de que si urt habitante tiene gripe, ste sea anciano o rriiro, es clel 59.4%.
74 Captulo 2. EI Concepto de Probabilidad

4 EI 35'/r, clc los ct'clitos clttrt rtt<-ltger rtrr banc<l es parr vivicncla, eI 50%, ltara pr.ochrc:ciu y el r'esto
(r()llsittlllo. R,cstrltrrr lltot()sos r:l 20(X, tk: krs cl'rtlit,cts
l)r1 i ltrua vivicr,la, el l5%, rlc los clrlitgs
lrillrr >r'orlrrcrcin y t>l 70c,4, r[c Ios cr'ditos I)i,t'a c:orrsurr]o.

a) Dr:tcrrnine la probabilidad de quc uu crdito elegido al azar', sc pague a tieurpo.


1;) La plobabilidad de que urr crdito c-re ha resnltrdo en rnora) haya siclo otorgaclo para Ia
ploduccin.

Solucin: Designemos los eventos:


1/: el crdito es para vivienda. P: cl crdito es para produccin.
C: el crdito es para consumo. A,[: e] crdito est en mora.

a) Tengamos presente que el evento <<el crdito se paga a tiempo> es el complemento del
evento <el crdito est en mora>; entonces, buscamos Pr(M.).
Por la frmula de la probabilidad total,

Pr(M) : Pr(MlV) Pr(y) +Pr(MlP)Pr(P) +Pr(MlC)Pr(C)


: 0.2 x 0.35 + 0.15 x 0.5 * 0.7 x 0.15 :0.25.

De manera que Pr(M") : t - Pr(M) - 1 - 0.25 : 0.75.


b) Por la frmula de Bayes,
Pr(P)Pr(MlP)
Pr(PlM)

2.9. Ejercicios
1. Sean A y B dos eventos con Pr(A) # 0 V Pr(B) 10. Demuestre que

Pr(A n B) : Pr(B)Pr(,alr) : Pr(/) Pr(BlA).


2. DemuestrequesiAyBsoneventosindependientesysiAeBentonces,pr(B) :lopr(A) :0.
,
.). Se consideran los eventos Ay B tales que Pr(,4) : pr(a) : p.(A aB):i.catcule:
]; ];
a) Pr(AlB); c) Pr(A"lB); e) Pr(,4'lB"):
b) Pr(BlA); d) Pr(B"lA); f) Pr(8" --l').
4. Srrponga que un punto es elegido aleatoriamente en el cuadrado unitario. Si se conoce que el
pttntoestenelrectngulolimitado porgl - 0,A:I,tr:0y r:]. autteslaprobabilidad
"
cle que el punto est en el tringulo limitaclo por y:i,,*:IU,*.:
l,
5. Sea Q: {(r,a)/0 <r 1I;0<g < 1} el espacio rnuestral de un fennrerro aleatorio. Calcule
Ia probabilidad de los eventos:

a) A:{(",101r <t; 0<a<Ll2};


b) B: El tringulo limitado por las rectas r:0;A:0; g:I - t:
2.9. Ejercicios 75

.StO c) .Son indepcndicntes los cvenlos A v B?


tOS
En el crrachrdo uniclacl ser crrrsi<leran los siguientcs cventos:
A: El tringulo lirnitado por z:0, A: L, A: x: +713.
B: E1 tringulo limitado por r :0, a :0, !,/ : 7 - r.
rla
a) Halle PL(B \ A), Pr(BlA) y Pr(A I B'');
b) Pruebe si A y B son independientes
Un inspector debe seleccionar a un trabajadol cle entre 4 aspirantes numerados del 1 al 4. La
seleccin Ia lleva a cabo mezclando los nmeros y tomando uno aI azar. Sean: A el evento <<se
seleciona al trabajador 1o al 2>>; B, el evento <(se selecciona al trabajador 1o al 3>>; y C, el
del evento <<se selecciona el trabajador 1>. Son independientes: Ay B?;b) Ay C?
")
Se lanzan dos dados, cul es la probabilidad de que en los dos dados salga el 3, si se sabe que
la suma es 6?

En una biblioteca hay B libros de literatura de ciencia fi.ccin, 3 de los cuales son de Isaac Asimov.
La bibliotecaria toma al azar 2 libros. Determine la probabilidad de que ambos libros resulten
ser de Isaac Asimov.

10 La Empresa de Correos ha determinado que el 70% de los paquetes enviados al exterior no llegan
a su destino. Dos libros se pueden enviar separadamente o en un solo paquete. Para cada una
de las dos formas de envo postal, encuentre:

a) la probabilidad de que ambos libros lleguen a su destino;


b) la probabilidad de que al menos un libro llegue a su destino.
11. Suponga que el 5% de todos los hombres y el 0.25 % de todas las rnnjeres sufren daltonismo.
Una persona escogida al azar resulta ser daltnica. Cul es la probabilidad de que esta persona
sea un hombre? (se considera que la cantidad de hombres y mujeres es igual).

t2. El 35% de los crditos de un banco es para vivienda, el 50%o para industrias y el 15 % para
consumo. Resultan morosos eI 20To de los crditos para vivienda, el 15% de los crditos para
industrias y el 70 % de los crditos para consumo. Calcule Ia probabilidad de que se pague un
crdito elegido al azar.
1t
1J En una exhibicin de arte hay 12 pinturas de las cuales 10 son originales. Un visitante selecciona
una pintura al azar y decide comprarla despus de escuchar la opinin de un experto sobre la
autenticidad de la pintura. El experto est en lo correcto en 9 de cada 10 casos, en promedio.

a) Dado que el experto decide que la pintura es autntica, icul es la probabilidad de que l
no se equivoque?;
b) Si el experto decide que Ia pintura es una copia, entonces el visitante la devuelve y escoge
Le el
otra, cul es Ia probabilidad de que Ia segunda pintura escogida sea original?
dad
14. Hay una epidernia de clera (C). Consideramos como uno de los sntomas la diarrea (D), pero
este sntoma se presenta tambin en personas con intoxicacin (1) , e incluso en algunas que no
tengan nada serio (N). Las probabilidades son:
cule
Pr(DlC): 0.99; Pr(Dl1) : 0.5; Pr(Dl,n/) : 0.004

Se dan los siguientes porcentajes: el 27odela poblacin tiene clera y el 0.5% intoxicacin. Si
una persona tiene diarrea calcule la probabilidad de que tenga clera.
76 Captulo 2. EI Concepto de Probabilidad

15. Urta pru<tlril cl vitrts del SIDA eu la sangle cl el cliagnstico correcto coll urra pro-
l)tlr rlctct:trt
babiliclrcl rlcl 9ll %. Sogrin clatos mdicos) lrrio clc carla 2 000 habitantes cl<ll pas. en prornr:clio, es
poltaclol rlrtl virtts. Da<lo qrte la pnrebzr fire positivtr I)arr una persorl1) 1',clril es la proira.lriliclacl
cle que cllr, r'elnrcrrte tcnga Ia enfermedrd?

16. Utra emplesa financiera opera en las tles regiones del pas: Costa, Sierra y Arnazona. El 50 %
de las opeLaciones se realizan en la Costa, el 40 To er Ia Sierra y el resto en la Amazona. Se
ha estimaclo, derlrido a la larga experiencia, el porcentaje de clientes qne no pagan sus deudas en
cada una cle las regioues. Para Ia Costa es del I%o, para la Sierra deI 2To y para la Amazona
del 8 %. Si la empresa tiene 1000 clientes, determine cuntos pagan sus deudas puntualmente.

17. Una encuesta revela que el 70% de la poblacin tiene estudios secundarios, de los cuales eI 72%c
no tiene trabajo. Del 30 '70 q:ue no tiene estudios secundarios , eI 25 % no tiene traba.jo. Calcule:

a) El tanto por ciento de la poblacin que no tiene trabajo;


b) La probabilidad de que una persona elegida al azar tenga estudios secundarios entre las que
no tienen trabajo.

18. De 200 aspirantes a un cargo se conoce Ia siguiente tabla respecto a experiencia en funciones
similares y la formacin acadmica necesaria

Con formacin Sin formacin


Con experienc a 16 32
Sin experienc a 24 128

Halle las probabilidades de encontrar una persona:

a) con experiencia y con folmacin; d) sin formacin dado que no tiene experien-
b) con experrencra; cia.
c) con experiencia dado que tiene formacin;

19. En una investigacin sobre el crdito bancario a trabajadores agrcolas se obtu\o el siguiente
modelo, en el que se califica al campesitto como propietario o no propietario del terreno que
cultiva y si mantiene o no mantiene deudas con los bancos.

Propietario
Deudor SI NO
SI 12 28
NO 20 64

Calcule la probabilidad de quc:

a) un campesino mantenga deudas con Ia banca;


b) un campesino sea dueo dei terreno que cultiva;
c) un carnpesino sea propietario, dado que no es deudor;
d) un campesino sea deudor, dado que es propietario del terreno.

20 A 100 empleados se les hizo un examen para determinar su destreza mar,'.,:-- C''ralenta clc los
ernpleados ern hombles. Scsenta de los empleados pasaron el exameli 1., _: .. .lcanzaron rurl
2.9. Ejercicios 77

ro- calificrciu rriayot que cicrto rrivcL Pledetr:r'ruilrdo cle arr'<x,'eclrarnictrtci. Lr clrsific-Lcin entre
CS
hornll'ers y rnujer-cs fue Ia sigrrielrte:
[cl
Honrlrr.cs (11) N{u,lcres (,4'1)
Pasaron (P) '24 36
)% No pasarou (.Ay') r6 24
Se
ien Sr-rponga que se selecciona al azar un eurpleado dc los 100 que hicielon el examen.
lna
Lte. a) Calcule la probabilidad de que el empleado Laya ptrsado y sea hornbre;

2%
b) Calcule la probabilidad de que el emplead., sea hombre dado ctrtrc pas el examen;

ule: c) Son independientes P y H?;


d) Son independientes P y M?

q.ue
2I. Los empleados de la compaa Crrz del Sur se encuentran distribuidos en 3 divisiones: Admi-
nistracin, Operacin de Planta y Ventas. La siguiente tabla indica el nrmero de empleados en
cada divisin, clasificados por sexo.

ones Mujeres (M) Hombres (-F1)


Administracin (A) 20 30
Operacin (0) 60 r40
Ventas (V) 100 50

Si se elige un empleado al azar,

a) cul es la probabilidad de que sea mujer?, y de que trabaje en ventas?;


b) cul es la probabilidad de que sea hombre y trabaje en la divisin de Administracn?;
c) cul es la probabilidad de que trabaje en la Operacin de Planta si es mujer?;
d) ,cul es la probabilidad de que sea mujer si trabaja en Ia divisin de Ventas?;
e) Son los sucesos V y H independientes? y los sucesos Ay M?

ente 22. Dada la siguiente tabla que indica el comportamiento respecto del hbito de fumar en un grupo
) que de 100 estudiantes que fueron averiguados.

Hbito
Sexo No fuma Fuma Ex-fumador TOTA
Hombre 16 10 24 50
Mujer 30 16 4 50
TOTAL 46 26 28 100

a) Encuentre las distribuciones de las variables <<sexo>> y <hbito de fumar>>;


b) Encuentre las probabilidades de los eventos: <<la persona fuma>> y <<la persona fuma, dado
que es mujer>>;
c) Son independientes los eventos <<ser rnujer>> y <<fumar>>? Por qu?

23. Del total de socios de un b, son hornbre, u ? .on profesionales. Adems,


"lt I *0" las mu.jeres
J
soll lro rrofcsiorrtrlcs. S" a? azal' uu ,r'ri"rntrr'3 a"l .tut-,,
"lig"
de los a) calcule la probabilidacl de que sea hornbre y profesional;
lt Lulr b) calcule la probabilidad de qne sea hombre, dado que es profesional;
'"' r ii-- -I. - -. ar

78 Ciptuto 2. El Concepto de Probabilidad

c) Deterrline si sott irrdcpendierttes los evcntos <sel mujcr>> y <<no ser'profesional>>.

24 Ertttttfbric;a. el 707o clcloscmpleadossonlojanos. Decntrcloslo.jtrnos, cl 50%sonhombrcs,


mientras qr.re de los no lojanos, slo son hombres el 207o.

a) Qu porcentaje de empleados no lojanos son mujeres?;

b) Calcule la probabilidad de que un empleado de Ia oficina sea mujer;


c) Fernando trabaja en dicha oficina. Cul es la pfobabilidad de que sea lojano?

25. En un pas hay 4 partidos polticos que se dividen la opinin pblica. Se sabe que:

El 35% de la poblacin adhiere al partido I.


EI SI% adhiere al partido II.
El28% adhiere al partido III.
El6% adhiere al partido IV.

Entre los adherentes al partido I, un 36 % corresponde a personas con ingresos inferiores a dos
salarios mnimos. Entre los adherentes al partido II, esa proporcin es del 52'/o. Para el partido
III es un 42V0, y para el partido IV es 11%. Si se elige una persona al azar y resulta tener un
ingreso mayor a dos salarios mnimos, calcule la probabilidad que sea adherente al partido I.

26. La seora Sonia se fue de viaje y encarg a su hijo, Pablo, que riegue el rosal. La probabilidad
El rosal est en un estado inseguro:
", ].
de que Pablo olvide regar el rosal durante su ausen"iu
3
si se riega tiene igual probabilidad de secarse que de no secarse) pero solamente tiene un 0.25 de
probabilidad de no secarse si no se riega. Despus del viaje Sonia encuentra el rosal seco, cul
es Ia probabilidad de que Pablo no lo haya regado?

27. Se estima que slo un20To de los que compran acciones en Bolsa tienen conocimientos burstiles.
De ellos el 80 % obtienen beneficios. De los que compran acciones sin conocimientos burstiles.
slo un 10% obtienen beneficios. Se desea saber:

a) El tanto por ciento de los que compran acciones en Bolsa que obtienen beneficios;
b) Si se elige al azar una persona que ha comprado acciones en Bolsa y resulta que ha obtenido
beneficios, cul es la probabilidad de que tenga conocimientos burstiles?

28. En un supermercado el 70 % de las compras las realizan las mujeres; de las compras realizadas
por estas, el 80 % supera los 20 dlares, mientras que de las compras realizadas por hombres slo
el 30% supera esa cantidad.

a) Elegido un comprobante de compra al azar, cul es la probabilidad de que supere los 2C


dlares?;
b) Si se sabe que el comprobante de compra no supera las 20 dlares, cul es la probabilidac
de que Ia compra haya sido hecha por una mu.jer?

29. En una universidad existen tres facultades: A, B y C. En A hay matriculadas 150 chicas y 5[
chicos; en B, 300 chicas y 200 chicos; y en C, 150 chicas y 150 chicos.

a) Calcule la probabilidad de que un estudiante, elegido al azar, sea chico;


b) Si un estudiante elegido al azar resultara ser chico, cul es su facultad ms probable?
)r-i;!:..r-rnr.- -;t j\--ii-r5v:--r- i_--: -:-=-rr-- l-
-.'

-i-
2.9. Ejercicos

30. Etr.e los cinco rrstirantes a un calgo cle geleute, a <los se ios considera excelentes y a los rierns
se les consicler'r bucnos. Para una entrevista se escoge al azal a dos de los cinco. Calcule lr,
probabiiidacl de que se esco.ia:

a) a los dos excelentes;

b) por lo menos a uno de los excelentes;


c) a los dos excelentes dado que se sabe que por lo menos uno de los seleccionados es excelente.

31 Se dispone de dos mtodos A y B para ensear una destreza manual. El ndice de reprobados es
del 20 To para el mtodo A y 10 To para el mtodo B. Sin embargo, el mtodo B es ms caro por
Io que solo se le usa el 30 % del tiempo y el A el otro 70 %. A un trabajador se le adiestra con
uno de los d.os mtodos, pero no puede aprender en forma correcta. Cul es Ia probabilidad de
que se le haya adiestrado con el mtodo A?

32 En los exmenes de ingreso a una universidad cada candidato es admitido o rechazado de acuerdo
a si l ha aprobado o reprobado la prueba. De los candidatos que realmente son capaces' el 80 %
pasa la prueba; y de Ios que no son capaces, el 25To pasan Ia prueba. Dado que el40% de los
dos candidatos son realmente capaces, encuentre Ia proporcin de estudiantes capaces que ingresan
ido a la universidad.
un
JJ Segn datos de investigaciones genticas se ha establecido que: los padres de ojos claros y los
hijos de ojos claros constituyen el 5To de las personas estudiadas; los padres de ojos claros y loB
dad hijos de ojos oscuros el 7.9 %o; los padres de ojos oscuros y los hijos de ojos claros el 8.9 %; los
padres de ojos oscuros y los hijos de ojos oscuros eI78.2Vo. Halle la probabilidad de que:
uro:
5de a) el hijo sea de ojos oscuros, si el padre es de ojos oscuros;
cul
b) el hijo sea de ojos claros, dado que el padre es de ojos claros.

,iles. :l-1 Como un acto de buena vecindad Dios y Satans acordaron un intercambio cultural entre el
:iles, Cielo y el Infierno. Demonios del Infierno van a vivir en el Cielo, mientras que ngeles del Cielo
van a vivir en el Infierno. Los demonios tienden a no decir la verdad ms frecuentemente que los
ngeles. Los demonios mienten el 80 % de las veces y los ngeles mienten el20% de las veces (en
estos das es difcil encontrar ngeles buenos!). Despus del intercambio, la proporcin entre los
demonios y ngeles en el Cielo es 2:3. Mi amigo Jos muri y fue al Cielo. l encuentra a una
rnido
persona en la calle y Ie pregunta donde encontrar un bao para hombres. Desafortunadamente,
Ios demonios y los ngeles no se pueden distinguir por su aspecto fsico. Deseamos determinar:
:adas
; slo
a) Cul es la probabilidad de que Ia respuesta haya sido una verdad a la pregunta de Jos?
b) Dado que la respuesta fue una mentira, cul es la probabilidad de que haya sido dada por
un demonio?
os 20
.)=
)'J Una compaa de tarjetas de crdito encuentra que cada mes el 50% de quienes poseen la tarjeta
ilidad cubren totalmente sus deudas.

a) Si se seleccionan dos usuarios al azar, cul es la probabilidad de que ambos paguen total-
;y50 mente su deuda ese mes?;
b) Si se selecciona un cliente al azar, cul es la probabilidad de que dicha persona pague
totalmente sus deudas en dos meses consecutivos?
c) En qu hiptesis se apoy para responder a los dos apartados anteriores? Le parece que
ef alguna de ellas no es razonable?;
80 Captulo 2. El Concepto de ProbabIidad

<1) Urr cxarrrerr rnis <1etrllaclo der los rcgistlos cle la conipaa rnuestr'r quc el 90 % cle los clicutcs
que l)agau t<it.rllneut,e unr cLr<lrrtl nrensual tarnbin lo hacen al mes siguiente v <1uc slcr
eI 70%, clc los cluc l)o l)ag]lr totr.lrnente en llrl rnes cttl-ren totalmente srr dcrrcl al mes
siguierrte. Calculc, cn este cso. la probabilidad pedida en b).
e) Con las hiptesis de d), calcule la probabilidad de que un cliente seleccionado al azar no
pague totalmente ningr-rna cle las dos cuentas rnensuales consecutivas;
f) Calcule Ia probabilidad de que slo pague una de las dos cuentas.

36 Basndose en varios estlrdios, una compaa ha clasificado, de acuerdo con Ia posibilidad de


crrcorrtrar petrleo, las formaciones geolgicas en 3 tipos. La compaa pletende perforar tr.n
pozo en un determinado lugar, al que le asignan las probabilidades de 0.35, 0.40 y 0.25 para
los tres tipos de formaciones, respectivamente. De acuerdo con la experiencia, se sabe que el
petrleo se encuentra en Lrn 40% de las formaciones de tipo I, en un 20% de las de tipo II y en
un 30 % de las de tipo III. Si tras perforar el pozo, la compaa descubre a su pesar que all no
haba petrleo, determinar Ia probabilidad de que ese lugar se corresponda con una formacin
del tipo II.

37. El cardinal de un espacio muestral finito es rn. Los eventos A y B son independientes y cumplen
que:

Pr(A) +Pr(B):p y Pr(A n q :+


Halle la cardinalidad de A.

38. Demuestre que si se tienen Bt, Bzr..., B, eventos mutuamente excluyentes, tales que su unin
es el espacio muestral, ertonces se tiene que

fi,:r e'1ana) : t.
Captulo 3

Variables Aleatorias, Esperanza y Varianza

(Jna uariable aleatoria es el alma de una obseruacin


(Jna obseruacin es el nacimiento de una uariable aleatoria
D. G. Watts, (1991)

:- este captulo introduciremos el concepto de l'ariable aleatoria, que nos facilitar


Ia realizacin del
.-lisis de las principales caractersticas de los experimentos aleatorios y permitir definir las Ieyes de
::,,babilidad que ellos siguen, de manera muy general'

3.1. Variables aleatorias


de una
- resultado de una prueba aleatoria no siempre es un nmero; por ejemplo, en el lanzamiento
de los eventos Ie podemos
-:,neda los resultados son <<cara>> y <<escudo>>. Sin embargo, a cada uno
que rigen Ia probabilidad.
-.rciar un nmero y sobre ellos aplicar las leyes
l.-,nsideremos la definicin clsica de funcin real, donde la cantidad y se llama funcin
del nmero
: si a tod.o valor z de la variable independiente, le corresponde un valor 3r de la variable dependiente'
j- esta idea la extendemos, se define una funcin donde la variable independiente no sea un nmero
:=l sino que, en nuestro caso, sea un espacio muestral'

Definicin (de variable aleatoria) Se llama variable aleatoria a cualquier funcin definida en
':: espacio muestral f) con recorrido en un subconiunto finito o infinito de R.

- decir, Ia funcin

X:Q --) R
u F-f X(r)

--,nd,e a es un evettto) es Ltna variable aleatoria' Figura (3'1)'

81
82 Captulo 3. Variables Aleatorias, Esperanza y Varianza

Figrira 3.1:

Ya hemos estado trabajando con variables aleatolias sin leferirnos cxplcitarncnte a ellas; por ejernplo,
al arrojar un dado son posibles seis casos. Designando por o ei evento elementl consistente en saiir
puntos, tenemos:
CI : {cuf ,u)2,u)Srw4rrr'5rw6}.

Lavariable aleatoria X(rn): i identifica al nrmero z de puntos obtenidos al lanzar cl dado, se define
as:

X(rt) : 1, corresponde al evento elemental {aparece un punto},


X(rz) : 2, corresponde al evento elemental {aparecen dos puntos},
X(rs) : 3, corresponde al eveuto elemental {aparecen tres puntos},
X(rs) : 4, corresponde al evento elemental {aparecen cuatro puutos},
X(rs) : 5, corresponde al evento elemental {aparecen cinco puutos},
X(ra) : 6, corresponde al evento elemental {aparecen seis puntos}.

Al arro,jar una rnoneda tenerlos dos eventos: C: <<sale cara>> o -E: <<sale escudo>>; definimos la variable
aleatoria X, que cuenta el nmero de caras aparecidas en una serie de lanzamientos, de la siguiente
manera:

x(r) : 1, si <<sale cara>>;

x(r) : 0, si <<sale escudo>>.

La definicin de la variable aleatoria depende del fenmeno a investigar.


Notacin. Para evitar una escritura engorrosa, a los cu tales que X(cr-,) : se los notar como X : t.
La probabilidad Pr({o I X(r) : }) se pondr como Pr(X : ). De manera anloga se escribir
la Pr({c..'/ X(u) e (o,b]}) como Pr(n < X < b). Y as para cualquier intervalo convenierrtemente
defiuido.

Las variables aleatorias se clasificanten d'isc'retas y co'nti,rtuas, de acuerclo a los vlores qne ellas tomen.

3.1.1. Variables aleatorias discretas


Definicin (de variable aleatoria discreta) La variable aleatoria en cLr\ro recorrido el conjrlrrto
de los pr-rntos que tieuen probabilidad estrictarnente positiva es finito o infinito nunrerable se llarna
valiable aleatoria discreta.

Si el recorrido de la variable aleatoria X es el conjunto de nmeros {rr,rr,....x,....}, ." tiene que


Pr{X:z}>0.
3.7. Variables aleatorias 83

\rkrtniis, ti p,, : Pr'(X : x:). cs lir ytt'tillzrlrilirlrrl <lc tlrtc X tonrc <rl vtlol ru, sc ctuttplc <ue

'PI +'P)+ "' -1-


1),, l "' - 1.

rn ottas palablas, X os disc:r'cta si rrna unirlarl rkr urlsr clc plobabiliclrd csti <listribrricla sobre el e.ie
-=al, cc'rrLcerrtrnclose rrril rnrsr I)ositi\'1 err cacla prrut,o <le c:ielto c:on.jrrnto finito o infinito nrrrnerable y
.:- los restaltes purrtos uo l)ry lnasr.
-,-r'iables
aleatorias discretas sorr usualmente (pelo no rrecesariamente) conteos de ciertos elementos'
- -,r ejemplo, el nirmero de hi.jos de una familia, el rniulcro de ventas realizadas por Lrn almacn, etc.

- la vez qlre se ha determinado las probabilidades isociadas a cada uno de los rralores de nna variable
-:atoria discreta, es ritil ponerlas en forma dc una distribu.ci,n de probabilidad, que es una tabla con
:,,ios sus posibles valores y sus correspondientes probabilidades, como la siguiente:
f 1 2 n
Pr(X : r) Pt PZ P,,

Ejemplos

- Consideremos la prueba consistente en arrojar tres monedas. Tenemos qr.re

a : {{ccc}, {cc E}, {c E E}, {E E E}}.


Si X es la variable aleatoria que cuenta el nirmero de escudos resultantes, X puede tomar los
valores 0, 7, 2 y 3. De rnanera que

Po : :0) : PL({CCC}): 1
Pr(X
8'
t
J
Pt : Pr(X: 1) : PL({CCE}): g'
3
Pz : Pr(X : 2) : Pr({C EE}) :
8'
Ps : Pr(X : 3) : Pr(iE EEI) : 1
-:.
8

Se tiene que su ley de probabilidad es

T 0 1 2 3
Pr(X : r) 1/8 318 318 r18

y se cumple que
1331
Po*h-lPz+Pt : B + d + S + g : 1

Consideremos la sigrriettte plueba: se dispara corr nna pistola a un blanco situado a cierta dis-
tancia. Nos interesa analizal los eventos uJ: <<rlmero de balas empleadas por un tirador hasta
(lne se da en el lrlarrco por prirnelavez>,.
Definimos la variable aleatoria X: <<nrnero de balas gastadas>>:

EI corrj nnto de posibles valores que puede tcmar Ia variable aleatoria es { 1, 2,3, . . .} .

Este es un conjunto infinito numerable, pues no se conoce un mximo para el nmero de balas
empleadas que pudiera ser extremadamente grande para una persona con muy mala puntera-;
es decir, X es una variable aleatoria discreta definida sobre un conjunto infinito numerable.

Ms adelante se demostrar que tambin se cumple que i p: I col p: Pr{X : }.


i:r
84 Captulo 3. Variables Aleatorias, Esperanza y Varianza

Definicin (de funcin de distribucin) Sea X una variable aleatoria discreta, la funcin leal
-F tal que
V e R, F(t): Pr(X < )

se denomina funcin de distribucin de Ia variable aleatoria X.

Propiedades

1. La funcin F es creciente, con : 0V : 1.


,fT.".F() ,ffL,P(t)
2. F() : Pr(x S t) :
Prp
3. Pr(a< X<b):F(b) -f.(o).
4. Pr(o ( X <b): F'(b) - F(") *Pr(X: a)'

Observacin. La probabilidad Pr(X: a) se calcula mediante Pr(X: a): F(a) - F(o_), donde
F("-) es el lmite, por la izquierda, de la funcin de distribucin en el punto a. Este concepto tiene
importancia para el clculo de las probabilidades en los puntos donde ,F tiene saltos.

Ejemplos

1. Continuando con el ejemplo del lanzamiento de tres monedas, se tiene que


1
F(0) : Po: ,-,
F(1) : po+pr:j*::;,
F(2) : potpttpz:*.:*: :;,
F(3) : po:-pt-rpz+o.::*3*3** :t
Con esto, Ia funcin de distribucin es

0, si <0;
Il8, si 0(<1;
F(t) : Il2, si L<t<2;
718, si 2(<3;
1, si 23.
Los grficos de las funciones de probabilidad y de distribucin se dan en la Figura 3.2:

F(t)
0.4 I F
H
0.3 0.75
0.2 0. H
0.1
o

Figura 3.2:
3.1. Valial-ies aleatorias 8r

Elr rrrLr lltrr<:l-,ir rkt c:tli<lr<l rk. ttrr ltLorltt, l,r sl tillrr'(lllr'{'n tLrt [o1<: tlt l') Piczas lrn'!i ].,1[tttttt.
t .1 rlcf<r<:tlrosrs. L)rr cl rkrP;uliunollt() rlc <:rrrtlol tlt' r:irlir[rrI st: lrrrrt turt nrttcsl tl tlc ]] lriczits
Clorrstlrril lr lct'rkr lr r'rriirlrlc alcrtoLir <<Lrirrrr:Lo rl<r lrir:z;ts lrlrcLr,lsr,.
Sol,tLr:irin,: La r'ilialrlr: a,lcrtolia crL crLcstirilr prr<rrlc torrrar'krs r'rlolr.s 0. 1.2 \,J: rIctr:nnirolnos
srrs prol)rl )ilir [<ics.

El llrill<:r'<.1 r[c srrbc:onjrrrrtos cl<l 3 c]crnerrtos rilrtcrrilrlcs rlc rrrr c;ou,jrtrtto <[c 12 clrlurcrrtos cs C:fr.
que es Card(O).

r Si X:0, cutolrccs toclrs las Piczas sou dcfcctuosas, lriv C[ lorrnirs clc <:scogctlirs.
. Si ,Y : 1, crrtorrc:es 1 es lrucrrr y 2 sorr clefcctrrosrs. c\istcu Cl f.rlrn,rs cle csc:ogt:t l:rs Piclzirs
buenls v Cl de cscoger las clefectnosas) crrton(ies lrv CC; forurts clc: cornlrilrrr lrs lrttettrs
y las defectuosas.
. Si X : 2,ltay C! conjuntos de las piezas buenrs y C] dc dcfcctuosas) prr'-r, rrn total cle
Cl|6C| formas cle combinarlas.
. Si X: 3, hay C! cornbinaciones de piezas bueuas.

Entclnces,

Pr(X: O) : g: *, Pr(r : 1) : 9A9? ::.


ciz 55'
Pr(X: \:W:#, Pr(X:t):#:#
Lo qrre se lesune etr slr clistlibucirirt cle probabilicl;rcl:
A; loll l2l3

Para clefinir urrr variablc alertoriir no cs nccesario cxhil.il urr fcrtcirrrcrto rleat<lrio pat'ticttltrr',
es suficiente clar ulla funcin cle probabilictad o cle clistlibucicln rre cr-rrnpla las plopic<lrclcs
enunciadrs.

3. La funciu cle distribucin de una


"'ariable
aleatorir Y se clefine rnoclirute:

si l,<-3;
si -3<<0;
si 0(t<2;
si >2,
Coustruil Ia tal-la de clistribucin de probabilidacl clc )'.
Sol'ucit: De acuerdo a la definicin de la ftrnciu cle clistribucirr roclenlos \'ol cluc lr r-rrirblc
aleatoria tornr los valoles -3,0 y 2.

/(-3) : Pr:(Y: -3) : F(-3) - F(--) : + -,, :;,


,i(0) : Pr(Y:0) :r(0) -F.(0-):;- j:j,
.f (2) : Pr.()', : 2) : F(2) - F(2-) : 1 j: j
De rnttcrr <te lrr trbl-L clc clistliltrci<in cle rt'olrtrl riliclacl cs

r l-rlo l2
Pr()':trlIl2 lll4lIl4
86 Captulo 3. Variables Aleatorias, Esperanza y Varianza

4. Unr variable rleatoria X est dcfinida medirnte lir siguierrte lcy de plobabilidacl

Jr l rlzl | qI s

a) Determinar F(r).
b) Graficar f(r)y F(r).
c) Hallar: Pr(X:1), Pr(X < 1), Pr(X < 1), Pr(1 < X < 2), Pr(1 < X < 2), Pr(1 < X <2).

Soluci,n:

a) Evidentemente, f'(r) :0pararlI,ahora


oSi11r12, F(r): pr : 0.3.
o Si2(r(3, F(r) : pt -f pz: 0.5.
Si3{r14, F(r):pL+p2*ps:0.6.
Si41r15, F(r) : h I p2* ps + p+ : 0.75.
o Sir)5, F(r) : h I p2 * ps + p+ I ps : I.
Es decir,
0, sir<1;
0.3, si 1( r 12;
F(r): 0.5, si2(r13;
0.6, si3<r14;
0.75, si4(r{5;
1, sir)5.
b) Los grficos son:

Pr
F
0.
0. H
H
0.1 H
0.1 H

Figura 3.3:

c) Se tiene:

Pr(X: f) : F'(1) - F(1-) : 0.3 - 0: 0.3,


Pr(X < 1) : .P(1) : 6.3,
Pr(x < 1) : F(1) - Pr(X : 1) : 0.3 - 0.3 : 0,
Pr(l <X<2): F(2) - '(1) : 0.5 - 0.3 :0.2,
Pr(1 < X<2) : F(2) -F(1) +Pr(X : 1) : - 0.3 + 0.3 :
0. 0.5,
Pr(1 < X <2) : F(2) - F(1) - Pr(X : 2) :0.2 - 0.2 : 0.
3.7. Variables aleatonas 87

3,1.2. Variables aleatorias continuas

Definicin (de variable aleatoria continua) La variable aleatoria ouyo recorrido es un intervalo
inito o infinito de R se llama variable aleatoria corrtinua.

Tambin, se dice que Lrna variable aleatoria X es continua si para todo valor real r se tiene que

Pr(X: z) :0.
- sualmente, lasvariables continuas representan mediciones; por ejemplo, la estatura de una persona,
-l tiempo que se demora un programa en buscar un registro en una base de datos, la cantidad de
:ngre que tiene un animal.

Definicin (de funcin de distribucin) Sea X una variable aleatoria continua, Ia funcin real
F tal que
V R, F(t): Pr(X < )
=e denomina funcin de distribucin de la variable aleatoria X.

Fropiedades

F es creciente, con .Im F() :


/+-oo
0y . lm
- l-*m F(t) : 1.

l. Pr(a< X <b):Pr(<X <b) :Pr( < X < b) :Pt(a <X < b) :f'(b) - F(").

Definicin (de funcin de densidad) La funcin de densidad de una variable aleatoria continua
-'t es una funcin real / que cumple:

)
") f (r) 0 Para cualquier valor z.

b) /A f@)dr:r.
c) Para cualquier intervalo A: lo,b], se tiene que

Pr(A) :Pr(<X<b) : f {') o'


.l.o

-,
-amos cmo estrr relacionadas las funciones de distribucin y de densidad. (Ver Figura 3.4)

Teorema. Si F y son las funciones de distribucin y de densidad de la variable aleatoria


/
:.spectivamente, ellas estn ligadas mediante las igualdades

F(r):
l"*r@ot y f (*): F'(r).
88 Capt,tttra 3. VaranJes Aleadorias, Espet'anza I \-ariattza

f {t}

Figura 3.4: Relicin cntr-c las firncion<:s clc clclsidaci y c1e clistrilruc:irr.

Tengamos presente qtte para el clculo de plobabilidrdes se emplea la siguiente equivalencia:

b
Pr(a<X<q: I I(r)dr:F(b) -F(").

En las valiables aleatorias continuas es suficiente indicar la funcin de densidad o Ia funcin de dis-
tribucin para que la variable aleatoria qr-rede completamente definida.

Ejemplos

1. Unr variable aleatoria X est defirriclr mediante Ia funcin de distribucin

plrir z < -1;


3 1
jt parr -1(r(;i
1t
uara .r: ) -.
' -3
/ 1\
Hallrr la probabilidaci cle clue la varialle aleatoria X torne un valor en el t'
interva ('' j/
Solrc'in: La probabilidad de que X tome un valol en (a,b) es Pr(a < X <b): F(b) - F(").
Sia:0.b:1obt"r,"rnu,

"'(0.".1)

2 Lr fiurcin de densidacl de una valirble aleatoria est clada por /(z) : (\.e-s:L cn el intern,alc
(0,-) v f @): 0 fitera cle cste itttetvalo. Hallar' el vrlor de la constante cv para que /(z) as-
clefilriclr scl unA funcin <le densidld.

Sol.rt,ci,n: Primero verifi<lrremr)s clue ./(r) > 0.


. En (-oo,0l no Lay plobleml Pucs /(r) : 0.
3.7. Variables aleatorias

. En (0, oo) se debe tener f (") >- 0, es decir (\e-3* ) 0. Pero Vr (0, rc), e t" > 0; entouces,
se dobe tener que a ) 0.

Ahora, verifiquemo. or,"


' /'* f (r)ctr:
.l-o."'
1, o
"". .lo/'- .,e-3*d.r: l.
La integral
/. f
o" -3"d, o
.lo "_J*d.r: lj"
: l'* .,
,lo* L3
-o.
3 [o-lJ
:T. a.

Consecuentemente, : tt entonces a : 3.

Dada la funcin de densidad de la variable aleatoria continua X:
( o, sic(o;
f(*): { cosr, si0(r<rf2;
r dis-
I o, sir>rf2.
a) Hallar la funcin de distribucin F'(r).
b) Determinar: pr (t = *. ;), e, (x ,;),"'(; <x <
#)
Solucin:

a) Utilizando la frmula F(z) : d,t:


.l:*JQ)
o Si r < 0, "f(r) :0, de manera que
rr
F(r): l_*Odt:0.
o Si 0 1r 1r12, f (x): cosr, ento ces

F(r) : Io Oat+ |fE costdt:senr.


'(n). J-a Jo
o Si r > 7r/2, f (r) :0.,
n/2
F(r): 0d: senr - 1.
l_*t+ Io"/'costd,t* I_,, 0

La funcin de distribucin es:

( o, sir(o;
F(r):l ';" ', si o < '<X,
I r, six>[.
b) Para calcular las probabilidades emplearemos Ia funcin de distribucin.
r Pr(a < X <b) :F(b) - F("). Si : I y U:[,
erval< 6" 3
(r) as
: -"()
"'(=".) "()
: *" () : rfr1
2 -5
'"" () -
: 0.36603.
90 Captulo 3. Variables Aleatorias, Esperanza y Varianza

o Pr(X ) n) : 1- Pr(X . o) : 1- F(a).


,4Si o: 1'

"("'i) : '-'(;)
1-sen/1):
\ 4/
r-Jt2
_ 0.29289.
r 17tr
e Pr(a < X < b) : F'(b) - F(o), con : vb-_.
3" t2

t.(;/ r s*<;) 112\


:'(#) -.(;)
:1-sen(;) :t-+
: 0.13397.

4. La funcin de densidad de una variable aleatoria ? est dada por f (t) : t-f, y /() : O
"n(1,2)
fuera de este intervalo. Hallar las probabilidades:

a) Pr(0<?<1.8); c) Pr(? t 1.);


b) Pr(1.2<T<1.5); d) Pr(1.4<7<3).

Solucin: Para el clculo de las probabilidades utilizaremos la funcin de densidad.

a) Pr(0<?<1.8):

Pr(O<7<1.8) : l" Iudt:,loftot*.1, f(t)


"I.8 rl 11 8
dt

: lo' * .1," (, - ;) dt: t iQ' -


oo, o ql,',"

: j lltt al' - 1.8) - o) : o.zz.


b) Pr(1.2<?<1.5):

Pr(1.2<?<1.5) : l' r 1.5


f{ua'
: l,',' (' -;) " : LQ'-',1,;
: ] lltr sl' - 1 b) - ((1.2)' - t.z)) : 0.255.

c) Pr(T > 1.5):

Pr(? > 1.5) : 1-Pr(?<1b) -1- ([:_odt+ ,,)


[," (t-;)
,-;U'-t) r-
] frrr ul'- r.s) - (1'- 1)]
l,':
t-f,O.rrl:o62b
3.2. Distribuciones de funciotres de variables aleatorias 91

,t) Pr(r.4<7<3):
r.1 r

PL(1.4 <I < 3) : I fUl,tL: .lIt. J()rt ),Lt


.l t.

_ t)',n+o
[,'^('-;)"* 1,'o
1.. ..

ilt'-2)-({r+)2- 72.

5. Hallar la funcin de densidad /(r) de una variable aleatoria cuya funcin de distribucin es

'17

4'

Soluctn: Utilicemos la relacin f (") : F'(").


):0
. Si r : 0, entonces /(r) : F'(r) : 0.
< 0, F(r)
. Si 0 1r 1I, ,@): sen 2r, entonces f (r): F'(r):2cos2r.
+
. Si r ,\,4' 16:1, entonces /(r) : F'(r):0.
Es decir,

f (r): { zcoszr' si 0 < 'lTn,


|. 0, caso contrario.

6. La vida til de un elemento electrnico est dada por la funcin de densidad

( !"-,,r, si > o;
f (t): \ 0, '2

|. en Io dems;

donde es el tiempo (en horas). Calcular la probabilidad de que un elemento dure ms de tres
horas, dado que ya ha estado en uso mis de dos horas.
Solucin: Nos interesa Pr(? > 3lf > 2), que segn Ia frmula de la probabilidad condicional se
tiene:
Pr(?>3lT>rl :#fi;
porque Ia interseccin de los eventos (7 > 3) y (T > 2) es el evento (" > 3). Entonces,

l'* | -rtz
Pr(? > s) _ ./r rt :- "-t1," _ e-rlz:
Pr(I > 2) -
0.606.
[* !"-* r'
.lz 2

3.2. Distribuciones de funciones de variables aleatorias

Sea g una funcin real cuyo dominio contiene el recorrido de la variable aleatoria X, podemos definir
-l-na nueva variable aleatoria Y mediante
y: g(X),
92 Captulo 3. Variables Aleatorias, Esperanza y Varianza

lo que quiere decir que, si la variable aleatoria X est definida segn

X:O ---r ACR


u r-+ X(r)

y9por
gtB ------+ R conAe B
r r---' g(r)

la variable aleatoria Y se define por

Y : Q ------+ R
ul-----' Y(u): s6@)).

Si conocemos la ley de distribucin F de X, vamos a determinar la ley de distribucin Fy de Y.

Si X es variable aleatoria discreta,

Pr(I/: A):Pr(X : n),

donde A: g(r).

Si X es una variable aleatoria continua. Supongamos que g es una funcin continua y estricta-
mente creciente en todo el eje real; entonces, existe la funcin inversa de g que la llamaremos l.
sta tambin es continua y estrictamente creciente, por lo que

A: g@) si, y solo si r: h(A).

Examinemos la definicin de Fy:

Fv(t): Pr(Y < ) : Pr(e(X) ! t).

Aplicando la funcin inversa a los dos miembros de la desigualdad del argumento de la ltima
expresin se obtiene
Pr(e(X) () :Pr(X<h()) : Fx(h(t)).
Luego, se tiene la siguiente equivalencia entre las funciones de distribucin de X y de Y:
Fv(t): k(h()).

Si las funciones F y h son derivables, se pueden derivar ambos miembros de la igualdad anterior,
empleando la regla de Ia cadena:

Fi@ : Fk(h(t)) .h'(t).


Ello nos conduce a la siguiente relacin entre las funciones de densidad:

fv(t) : f x(h(t)) . h' (t).

Observacin. Si la funcin g no es montona en el intervalo de los posibles valores de X,


hay que dividir este intervalo en subintervalos tales que g sea montona v aplicar el resultado
anterior.
3.2. Distribuciones de funciones dc valiables aleaorias 9:]

Ejernrlos

1. Da<[a ll [rrrrc:it <lc <listlilrrr<:in F clc lr varitll]cr rlcrtolit -\. hallrl l.rs ftttt<:i<.trcs rl<r rlisl tilrrrt iritr
<lc rkrusiclir<l d<l \" : u,X * b,
r' pala: a) rr, ) 0; lr) tr, < 0.
Soht.r:i.titt:

a) Sca \" : aX *b, o > 0. Tenenros:

Fv'() : Pr(Yl) :Pr(aX+b<)


: n'(" =+):r"(?)
Aclerns,
g(t) : at t b, h(L) : +, h'1t : !,
Tambin,
!t.(t):;r"(?)
b) Si y : aX *b, con a ( 0, resulta que g() : at* b, que es continua, pero estrictamente
decreciente; sin embargo, podemos hallar Ia ftrncin de distribucin de Y rnediante su
definicin:

Fy(t) : Pr(Y<) :Pr(X+b<t)


: p,(x>-)-1-p,(x.4)
a) a)
\ \
a-
h.
: r - Fx"\ fL!)
a / +p, \ x: '-')
(
e' /
.

La funcin de densidad es

ft.o): F,(: -!,r* (")


Corrsidere la variable aleatoria Y : X2. Hallar su funcin de distribrrcin.
Solu,cir: Aqu, 9(r) : 12, funcin que no es stt'ictamente creciete. Por clefinicin tenemos:
Fv(t): Pr(Y ( ) : Vr(Xz < t).
. Si < 0, el evento <<X2 >> es vaco; por tanto, Pr(X2 < ) : 0, lo que implica que
Fl,() :0.
r Si20,

: -r/t).
Si F.v es coutiuua SC

<0;
>0.
Si lr.v <s rl<lrivable er rlcusiclad:

<0;
>0.
94 Captulo 3. Variables Aleatorias, Esperanza y Varianza

3. Detelntinar la ley de distribucin de la variablc aleatoria Y : X2, si X est definidr ruerliarrte:

x I -s I -21 o | 2

Sol'ucin: Como Ia variable aleatoria es discreta, basta aplicar la relacin Pr(Y : A) : Pr(X :
ri), a cada uno de Ios valores que toma Y : X2. Entonces, tenemos que

v2 l(-)rl(-z)rlo, lz,

Es decir,
Y lglq lol+

Como el valor Y : 4 se repite 2 veces, unificamos sus probabilidades y la tabla queda as:

4. Hallar la funcin de distribucin de la variable aleatoria Y : e-X, si X est definida mediante

( 0, si <-1;
k():{ +,sisi>1.
-1<<1;
( t,
Solucin: Se tienen las siguientes igualdades:

Fv(t) : Pr(Y < ) : Pr ("-* < t)


: Pr(X > -ln) - 1- Pr(X < -ln)
: 1-f(-ln).
Por otro lado,

0, si -lnt<-I;
F(- ln) :{ -ln*1 si - 1< -ln <
2' 1;

1, si -lnt>L.

:t 0,
-ln*1
1,
2'
si>e;
si e-l 1t 1 e:
si < e-1.

Por tanto,
1, si>e:
+ ln
- 1- Fx? ln) :
1
Fv(t)
2
sie-'1t1e:
0, si<e-1.
3.3. Ejercicios 95

3.3. Ejercicios
1. Irrclique si las siguierrtes variables aleatolias son discretas o corrtiuuas y su rarrgo cle <lefinicin:

a) El nrrnero de bytes defectuosos en el disco duro de una computadora de 100 Gb;


b) La distancia de lanzamiento de Ia jabalina por un atleta;
c) EI nirmero de goles que anota un equipo de fiitbol en Lln partido;
d) La cantidad de dinero, en dlares, ganada (o perdida) por un apostador;
e) trl tiempo de nso diario de una computadora;
f) El tiempo de espera del autobs en una parada;
g) El nrmero de aos que sobrevive una persona a la muerte de su cnyuge;
h) La variacin en el tiempo de sueo de una persona sometida a un tratamiento.
2 Indique al menos tres variables aleatorias discretas y tres variables aleatorias continuas. Especi-
fique su rango de definicin.

,l Se arroja un dado y se designan por : {el nmero de los puntos aparecidos es par} y por
6 : {el nmero de los puntos aparecidos se divide por 3}. Para los dos eventos, halle Ia Iey de
distribucin y grafquelas.

4. Determine Ia funcin de distribucin de la variable aleatoria X que est definida por la ley que
se presenta en la tabla.
-2 rt
rl4 213 rlL2
. Un escritor ha lanzado al mercado una nueva novela. La probabilidad de que Ia novela sea muy
exitosa es 0.6, de que sea medianamente exitosa es 0.3 y de que sea un fracaso es 0.1. Los bene-
ficios esperados son: si la novela es muy exitosa, 100 mil dlares; si la novela es moderadamente
existosa, 50 mil dlares; y, si es un fracaso, 10 mil dlares. Forme la ley de distribucin de los
beneficios esperados por el escritor.

6 Una agencia automotriz recibe un embarque de 20 automviles nuevos; entre stos, 2 tienen defec-
tos. La agencia debe seleccionar, aleatoriamente, 3 automviles de entre los 20 para venderlos.
Forme la ley de distribucin de la variable aleatoria <<nmero de carros defectuosos entre los
escogidos>>.

7 IJn apuesto prncipe visita a un rey que tiene cuatro hijas casaderas, con la intencin de integrarse
en la familia. Las probabilidades que tiene el prncipe de ser aceptado por cada una de las
princesas son 0.6, 0.8, 0.2 y 0.4. El prncipe pide la mano de cada una de ellas de forma
consecutiva y se casa con la primera que acepte. Sea X la variable aleatoria definida como
X:i si se casa con Ia i-sima hija (i - 1,.. .,4) y X:0 si todas le rechazan. Calcule la ley
de probabilidad de X y su funcin de distribucin.

8 Una chapa para puertas consta de tres piezas mecnicas. Suponga que las probabilidades de que
Ia primera, la segunda y la tercera piezas cumplan con las especificaciones son 0.95, 0.98 y 0.99,
respectivamente. Determine la distribucin de probabilidad del nmero de piezas que cumplen
las especificaciones en una chapa.

9. Sea X una variable aleatoria discreta cuya funcin de probabilidad es p(r) : :1,2,3,4,5.
#,r
a) Encuentre el valor de & para que la funcin p(r) sea la funcin de probabilidad de X;
b) CalculePr(l < X34).
C)a>tulo 3. Varitltl:s Aleatorias, Esperattza y Varianza

l(. l,r lr:.'i,irr ,lr'rrol,irlrilirl:r<1 ./'cl<: rulr r'uiirllc rl<rtlotir -f <:s rrttlt srh'o cn lr.rs lrtttrtos /.:0. f .i'
'1. lirr cl[r, l()nrr lr)s vitl()los:

.l'(0) : 4,":. /(l) :'k:- 1011. .[(2) : 4r:- I.


l)iu ir nlr cictlcl \'tlot' (lc r'.

;r) l)t,t<:rrrrire c.l valot ,lc c:


lr) (':rk'rrlo: PL(X < l). Pr(-X < 2). t'r'((l < .{ < 3).

il. t':r,r r''u'ialllc r,leatoli:r -Y se dicc <ur: sigrr<: lrr lcy cle B<rnfot'cl si se cttrnple qtte

Pr'(x : ft) : .,*,0 (t . i) , k: r,2,...,s.


a) \'irrifirue que es rtrra firncirr rle rt'oba,bilidad;
b) Calcrrle la probalriliclrd ctc obtcner utitnero impares;
c) Grati<rrc la funcirr de rrobabilidad.
t'2. Urra r'rinble leatoria )'se dcfine l)lra un errtero positivo fijo c (a > 1) cualquiera mediante

I'r(Y : A) : ;\- i, k : a*r,a*2,...


rt) \'i.r'ifitrre que cs utut funciu de probabilidad;
lr) l)crrrucstl'e cluc Pr()' > tr) : !* pat'tr A; : e, (L* 1, ...i
r:) Fije ur valor >ara <'l rtrr-rnctrrr ( !'gl'aficlue la fuucin de probabilidacl.

1:l Iirr,r r''rti,tlll<,aktrtorir clit't'cta X csti clefinida segittt la ley


Pr(.f : A;):p(l -p)r', A; :0. 1,2,.. .y p (0, 1).
rr )
\i,r ilirrre clue es ulll funcin clc probalrilidir<t:
lr) l)r:rcrrrrine la ftrncin de distribttcitr;
r') (';rk'ttlc: Pr(X > 2), Pr(X > ). Pr(.f, < 3).
11. l)rr<ls ls funciones de derrsidad /, errcuerrtre el valor de la constante c de tal manera que ellas
t:st r':rr lien definidas.

a) /(c) : ;," - t,' ::::.ffii,,


{
b) ./(r) - 1- cll- rl. si 0 ( r( 2;

,:) /(t ) =
{iZ;:, :i ;: l]
15. Dncla la fttttciu de distlillrrt:ititr rk: r: r'tt'ia,lrlc alertori .{:
0. si z(0;
L 14. si 0lr(1;
F(.r:) =
t l:J. si | 3r <2;
:r fr.t. si 2(1t14;
(t: -').)/3. si 4l:r. ( 5;
l. si ;u)5.
C)al<:r tlc lits rt'o! r;.l,rriidul<ts:
3.3. Ejercicios 97

lr a) Pr(l . X. S)' c) Pr(O.X.)'


b) Pr(2<X<+); d) Pr(a<x<6).

16. Se tiene la funcin de distribucin de una variable aleatoria definida por

0, si r<-J2;
Il8, si -J2<r10;
215, si 0(r1I;
Il2, si t <, < J2;
314, si t/2<r<512;
1, si r>512.
Determine la funcin de probabilidad asociada y grafquela.

77. La funcin de densidad de una variable aleatoria X est definida mediante


( o, si r<I;
te
(r):
fr\/ I sr"r,3", si + .0" =+t
[0, .iit;'
a) Halle la funcin de distribucin .F;
b) Determine: Pr(X :0.2), Pr(X < rl4),Pr(X > n13),Pr(nlL2 < X < n).
5 Una variable aleatoria X tiene distribucin continua F, siendo
( o. si (o:
FQ): I ct, si 0< t<I;
t 1, si >1.
a) Determine la constante c y halle la funcin de densidad /;
b) Calcule las probabilidades Pr(X: Il3),Pr(X < ll3), Pr(lxl <ll4).
9 Considere una variable aleatoria continua Z con densidad de probabilidad
( (t+b)zb, si z [0, o];
: ellas /('):{ o, siz(lo,al.
a) Calcule los valores de los parmetros a y b sabiendo que p, (Z 1) : 1,
\ -2)
= 8',
b) Encuentre la funcin de distribucin de Z.

Una variable aleatoria X tiene por funcin de distribucin a

10, sir<-2;
F(r):l ar+b, si -2Sr<2;
I t, sir>2.
a) Determine los valores de a y b; c) Halle: Pr(X
b) Encuentre la densidad /; Pr(lxl > 1.2).

El tiempo en minutos que una persona espera un autobs es una variable aleatoria cuya funcin
de densidad viene dada por las frmulas: /() : j ouru 0 < < t, f(t) : o.ru I < t < 4,,
(t):0 I
para los dems valores de . Calcule Ia probabilidad de que el tiempo de espera sea:
f
98 Captulo 3. Variables Aleatorias, Esperanza y Varianza

a) rnayor qu<l nn minr.rto; c) rnayor que tres mirrutos.


b) rnenor que clos miuutos;

22 Los registros de ventas diarias de una empresa que comercializa computadoras muestran que
vendern 0, 1 o 2 computadoras de acuerdo a Ia siguiente tabla:
No. de ventas 0t1t2
Probabilidad

a) Determine la distribucin de probabilidad de X, el nmero de ventas;


b) Calcule la probabilidad de que al menos se realice una venta en el da.
23. Un blanco circular de radio 1 se divide en 5 anillos,circulares por medio de 5 discos concntricos
1234
-, -;,;, i t t. Un jugador lanza un dardo al blanco, si el dardo alcanza el anillo
de radios: -.
b
circular comprendido entre los crculos de radios : y tl]. '\'"-v'L)L\v'
(k:0.7.2.3.4), tiene k puntos y
o 5
gana 5 - ,k dlares. Determine las distribuciones de probabilidad:

a) del puntaje del jugador; b) de Ia ganancia del jugador.

24. Una empresa alquila el tiempo de cmputo de un tipo especial de computadora a una universidad.
La empresa debe planear su presupuesto, por lo que ha estudiado el tiempo de empleo de Ia
computadora. El tiempo semanal de alquiler (en horas) sigue la funcin de densidad dada por:

si o( t<4;
*U'n-U'
f(t):{ 0,
[ caso contrario.

a) Determine la funcin de distribucin del tiempo de empleo de la computadora;


b) Calcule la probabilidad de que el tiempo de uso de la computadora, en una semana, sea
mayor que 2 horas;
c) EI presupuesto de la empresa solo cubre 3 horas de tiempo semanal de uso de la computa-
dora. Con qu frecuencia se rebasar ese lmite de presupuesto?;
d) Cunto tiempo de alquiler se debe presuponer por semana si esta cifra solo se puede rebasar
con una probabilidad de 0.1?

25. La cantidad de pan (en cientos de kilogramos) que vende una panadera en un da es una variable
aleatoria con funcin de densidad
c, si 0Sr13;'
c(6-r), si 3l r16;
0, caso contrario.

a) Encuentre el valor de c;
b) Cul es la probabilidad que el nmero de kilos de pan que se vende en un da sea: (i) ms
de 300 kg?, (ii) entre 150 y 450 kg?;
c) Denote por A y B los eventos definidos en (i) e (ii), respectivamente. Son independientes
Av B?

26. La cantidad (en gramos) de fertilizante qumico que una planta puede recibir es una variable
aleatoria cuya funcin de densidad es

f srla z;
(r): { ff, - si r [o' 8];
f
0,[ caso contrario.
Ejercicios 99

a) Halle la probabilidad de que Ia planta reciba merlos de 3 gramos;


b) Si la planta n)Ltere si recibe nlis dc 6 g, ,cul es la ltlobabilida<l de qne la planta muela por
exceso de fertilizante?;
c) Si se trata de establecel para Ia cantidrd de fertilizante utilizada, cul es Ia
Lrna norrrla
cntidad mxima recomendada utilizar para qne solo se sobrepase esta cantidad el 35 % de
las veces?

l;. Se extrae una bolita al azar de un bolillero que contiene 3 bolitas numeradas de 1 a 3. Llarnamos
X al nmero de la bolita extrada. Una vez conocido el valor de X, extraemos una nueva bolita
alazardeotrobolilleroquecontiene4-XbolitasnumeradasdeXa3(porejernplo: siX:2,
la segunda bolita se extrae de un bolillero que contiene dos bolitas con los nmeros 2 y 3).
Llamamos Y al nmero de la bolita extrada en el segundo bolillero.

a) Calcule Pr(Y : 3lX : 1);


b) Calcule Pr(Y :3);
c) Son X yY independientes? Justifique;
d) Halle la distribucin de probabilidad de Y.

-1. Una variable aleatoria X tiene densidad

f(n\:Ir'siz[o'1];
\"/-lo, sizl[0,t].
a) Si Y - X2, halle la funcin de distribucin de Y;

b) catcule las probabilidades: < x2 <i) r . t . :)


"'(+ "' (
-i. Una variable aleatoria Z tiene funcin de densidad
(L
si z e
f Q): i'
l 0, (
[-1' 1];

[ si z [-1,1].
Halle Ia ley de la variable T : -52.
i.'. IJna variable aleatoria X tiene funcin de densidad

rf") : (! sirl-z,Z);
I o1 si n ( l-2,21.
Halle la probabilidad Pr(X2 < 1).

Una variable aleatoria Y est distribuida segn Ia ley

5,
sigl-t,Z];
0, caso contrario.

Halle Ia funcin de densidad de la variable U : Y2.


-') Una variable aleatoria X tiene densidad f x(") : s-t, si r ) 0. Encuentre las funciones de
distribucin y de densidad de la variable aleatoria Z : e-x.

Una variable aleatoria X tiene funcin de distribucin Fy(r) - 1 - e-o', si r ) 0. Halle las
funciones de densidad de:
100 Captulo 3. Variables Aleatorias, Esperanza y Varianza

{Y:f7; b) Z :1tnt.

En las secciones precedentes vimos que una variable aleatoria queda definida por su funcin de dis-
tribucin, pero muchas veces solo se desea tener una idea del comportamiento general de las variables
aleatorias, sin dar detalles de su distribucin de probabilidad; para tal propsito, examinaremos dos
caractersticas tericas de las variabtes aleatorias: la esperanza y la varianza, que son dos parmetros
que miden la Iocalizacin y la dispersin de Ios valores que toma la variable.

3.4. La esperartza materntica

La esperanza matemtica -o simplemente espernz&- de una variable aleatoria X, se simboliza por


E(X) y su definicin es la siguiente:
Definicin (de esperanza de una variable aleatoria discreta) Sea X una variable aleatoria
discreta, la esperanza es un nmero real que se calcula segn:

1. Si X toma un nmero finito de valores rr 12, ..., rn con probabilidades h:Pr(X : rt),
pz : Pr(X : r2), . . ., pn: Pr(X - ,n)t

E(x) : f,o*rr.
l^-1

2. SiX toma un nmero infinito de valores rr, 12, .. . con probabilidades p : Pr(X : rk),
k:I,2,-..; oo
E(X) : ln*"r.
/c: f

Definicin (de esperanza de una variable aleatoria continua) X


una variable aleatoria
Sea
continua, cuya funcin de densidad es /(r), la esperanza es un nmero real que se calcula segn:

E@:
l: rf (r) dr.

A la esperanza tambin se la denomina media poblacional o ualor esperado de la variable aleatoria y


se la suele notar como p.

Observacin. Si /(r) toma valores distintos de cero en un intervalo [a., b], Ia esperanza se calcula
como
Fj(x): rf (r)d,r.
L
La esperanza posee varias propiedades, independientes del tipo de la variable aleatoria. A continuacin
vamos a enunciarlas y demostrar algunas de ellas, en el caso de una variable aleatoria continua, los
otros dos casos quedan como ejercicio para el lector.

Propiedades

1. La esperanza de una eonstante es el valor de la constante:


E(c) :6, cconstante.
3.4, La esperanza rnaterttica 101

D enostt'o,cir:

E(c) : I t'.[ (r) rlr : ,t Ir@ .l'(t') tl,.r :


[@
(:' L : c.
.l _- ./ _m

dis-
2. Aditividad. La esperanza de la suma de dos variables aleatorias es igual a la suma de la^s
bles
esperarrzas de los dos surnandos:
dos
tIoS E(x+Y) :E(X) +E(Y).
3. Un factor constante c se puede sacar del smbolo de la esperanza matemtica:

E(cX) : cE(X).

Demostracin:
l'c. f@
E(cX) : (r) O, : (r) dx : cE(X).
.l_*crf " .l_*rf
4. Sea g una funcin real, la esperanza de la variable aleatoria Y : S(X) est definida por

E(Y) : E(g(x)) : [* s@)f (r)d,r.


J_a
En particutar si g(r) : 12 se tiene

E (x,) : l:,2q,d,.
5. Si X y Y son dos variables aleatorias independientes
E(xv) : E(x)E(r).
Observaciones:

1. Por las propiedades 2. y 3., si Y: aX t b, entonces

E(Y):aE(x) +b.
1 2. Si la funcin de densidad es simtrica respecto a Ia recta
3.5)
r: rr, entonces E(X) : rn. (Figura
rria y

cula

aclon
a, los

Figura 3.5: Funcin de densidad simtrica respecto a la recta n : TrL.

Dos variables aleatorias con la misma esperanza pueden tener distribuciones diferentes. Para diferen-
-iarlas es lecesario introducir otra caracterstica terica que informe sobre la dispersin de su posibles
r-alores.
LO2 Captulo 3. Variables Aleatorias, Esperanza y Varianza

3.5. La varianza

Lr iclea de <lspelanza no ittclica ctuo csti clistlibuicl Ia mtsr en torrro su <l<ntro; sto sc explrcs)
rrreclirnte la Ia valiable alertoria X, que se nota Var(X) o o2.
uari,an,zo, de

Definicin (de varianza) La varianzt de nnt variable aleatoria X es rrn nrmero no negrrtivo que
se calcula por:
Var(X) : E(X -E(X))',
o, equivalentemente, por
Var(x) :E(x2) - (E(x))''

Segrn el tipo de variable aleatoria, se calcula de la siguiente manera:

1. Para una variable aleatoria discreta que toma un nmero finito de valores rtt r2t .) trn con
probabilidades p1 : Pr(X : rt), pz:Pr(X : rz), ..., pn: Pr(X : r,-)i

var(x) :ilrr-E(x))2pn o var(x) :ir*r\- (E(x))2.


k:t k:L

2. Para una variable aleatoria discreta que toma un nmero infinito de valores rr, 12, .. . con
probabilidades p : Pr(X : rk), k : L,2,. ..:

Var(X) : !["r - E(X))2pt o - (E(x))'.


lc=1

3. Para una variable aleatoria continua con funcin

var(x) : - E(x))'f (r) d.r o r) dr - (E(x))'z


|lO
Observacin. Al igual que en la esperanza, si /(z) est definida en [a, b]:

var(x) : l'o@- E(x)12/ @)d,r.


.la

La varianza da la idea de cun ampliamente dispersos se encuentran, en torno de la media, los valores
que toma Ia variable aleatoria:

1. Una mayor varianza indica que Ios valores tienden a estar ms alejados de la media.

2. Una menor varianza indica que los valores tienden a estar ms concentrados alrededor de la
media.

Defrnicin (de desviacin estndar) La desviacin estndar de una variable aleatoria X es


igual a Ia raz cuadrada de la varianza:

o:\@.
3.5. La varianza 103

Propiedades

]. Lr variarLzr de unr, corrstrrrte es cero. Es decir, para tocla constante c:

Var(c) : g, c constante.

Denostracin:

var(c) : V - E(c)]2 f (r) dr : V - c]2 @) ar


[* [*
: l'* oqrd"r:0.
_*
.l

2. Un factor constante c se puede sacar del smbolo de la varianza, elevndolo al cuadrado:


Var(cX) : c2Var(X).
Dernostracin:

var(cx) : l* O" - E(cx))2 f (r) d,r :


17r", -
cnr.)12 f (r) d"r
/'oo
: I "'1" - e(x)l/(r) dr : c2yar(X).
J-* '

3. Aditividad. La varianza de la suma de dos variables aleatorias independientes es igual a la


suma de las varianzas de los dos sumandos. Es decir, si X y Y son independientes

Var(X +Y) : Var(X) + Var(Y).


D emostracin: En efecto,

Var(X + Y) : E[(X + Y) - E(X +Y\2


: E[(x - E(x))+ (r - E(y))]2
: Var(X) + Var(Y) + 2Bl(x - E(x))(y - E(y))l
Como las variables X y Y son independientes, tambin lo son las cantidades X - E(X) y
Y - E(Y), por lo tanto,
E[(x - E(x))(y - E(y))] : EIX - E(x)l .Ely - E(r)l : s.

En consecuencia, Var(X + y) : Var(X) + Var(Y).

,lbservacin. De las propiedades 1- y 2. se verifica que

Var(oX + b) : a2 Yar(X).

Fj,emplos

de la
-. La variable aleatoria discreta X est definida segn Ia ley

x I -41 6 10
p10.2 10.3 0.5

Hallar la esperanza y la varianza de: a) la variable aleatoria X; b) Ia variable aleatoria Y :


0.5x +2.
Solucin:
LO4 Captulo 3. Variables Aleatorias, Esperanza y Varianza

3
a) E(X) : D : -4 x0.2 +6 x 0,3 * 10 x 0.5 : 6.
A:1 "xp*,
Calculemos E(X2):

n62): I ,?,p*,: (-q2e.2) + (6)2(0.3) + (10)2(0.b) :64.


k:1

Entonces,
Var(X) : P(X2) - (E(x))2 :64 - (6)2 :2a.
b) Vamos a aplicar las propiedades de la esperanza y la varianza para calcularlas:

E(v) : E(0.5X +2) :0.5E(X) + E(2)


: 0.5x6*2:5.
Var(Y) : Var(O.5X + 2) : (0.5)2 Var(X)
: 0.25 x 28 -- 7.
2. En una rifa se venden 300 boletos, a un dlar cada uno. El primer premio es 100 dlares, el
segundo premio es 50 dlares y hay otros cinco premios de 10 dlares. Cul es la ganancia
esperada de una persona que compra un boleto?
Soluci,n: Sea X la cantidad ganada por un boleto premiado; entonces, X sigue la siguiente ley

xl 1oo I so I ro I o
p | 1/Boo | 1/3oo I sTaoo I zoaTaoo
As,

293
E(X) rooxfr*5ox #.rox.*I+ox 300
0.67.

Como la persona paga 1 dlar por el boleto, Ia ganancia (total) esperada es E(G) : 0.67 - 1-
-0.33 dlares; es decir, una prdida.
3. Una persona quiere abrir una puerta y tiene 5 llaves, de las cuales solo una corresponde a la
cerradura. La persona va eligiendo al azar y probando abrir Ia puerta. Calcular la esperanza y
la varianza del nmero de intentos si separa las llaves que prob anteriormente.
Solu,cin: Como cadavez separa las llaves utilizadas, cada llave tiene la misma probabilidad de
abrir la cerradura; por lo que la variable aleatoriaX: <<nmero de llaves utilizadas>), sigue la
siguiente ley:
xl1 I 213 I 4l b

Entonces,

515
E(x): D*ou:;I/c:3,
l--1 t- r

515
E(x') : Dk'rr:;tk2:rr,
l': I [:1
Var(X) : lI - 32 :2.
3.5. La varianza 105

4. Una variable aleatorir X toma solarnente dos valores rt- y r2t tales que 12 > r1. La probabilidad
de que X tome el valor zl es 0.6. Hallar la ley cre sigr.re X, si la esperanza rnatemtica y la
varianza son conocidas: E(X) :1.4 y Var(X) :0.24.
Sol'uci,n: Esclibamos Ia ley de X:

Explesemos la esperanza y Ia varianza en funcin de 11 y 12:

E(X) : 0.6rr + 0.412 : 1.4.

La ley de X2 es

Entonces,
E(X') :0.6r? + g.arl
v
Var(X) : n(X2) - [E(X)]2 : 0.6r? + g.arl - r.42 : 0.24

De aqu, se obtiene el sistema de ecuaciones

I o.aq t olq:1.4
\ o.o"l -t o.4r| :2.2

Resolviendo eI sistema se obtienen dos pares de soluciones:

It : l, 12:2 y z1 : 1.8, rZ:0.8.


Puesto qLLe 12 ) 21, hallamos Ia ley de clistribucin de X:

.6 t.4
(,1. z

a) Hallar Ia esperanza y Ia varianza de lealtoria


ble ale X que tiene funcin de distribucin:

si t<, -1;
F(r) : si -1l<r 3;
si r,) ' .).

b) Se deflne la variable aleatoria Y : rrsJU CSIper anza y su varlalza.


Hal lar
Soluczn:

a) Hallamos 1a funcin de densidad

(r): si -1(r(3;
f
caso contrario.

De manera que

E(x) : (,)l_,
rf
1)
o":
e (x') :
[_,
r2r@ (i) r"
106 Captttlo 3. Variables Aleatorias, Esperanza y Varianza

Pot lo turto,
v.u(-K) : p (x') - (E(x))2 :: - r' :: .)
J

b) Tenerrros la varirblc lertor-ir Y :5X *2, cuyzr. funcin de densiclad no la corrocerno$. pero
podenos enrplezrr' las propiedacLes cle Ia esperanza y de Ia varianza:
E(Y) : :5E(X)+E(2) :5 x It2:7,
E(5X +2)
Var(Y) : Var(5X + 2) :25 Var(X) :25 x * : +
.) .)

b. Una valiable aleatoria X est definicla por slr densidad J'@):r+l2 el intervalo (0, 1), fuela
"n
de este intervalo f (r):0. Hllar la esperanza matemtica de la variable aleatolia Y : X3.
Soluctn:

E(v) : rs f @) o, : ,t (, **) o,
.lo'
,)ar:1" *1 4l '

)"- ls 2 a)o
u--.40I3
7. Determinar la esperanza y lti ', ' a valiable aleatoria 7 cr.rya fnncin de distlibrrcin
csF() -1-e2t,t>0.
Soluczn: La funcin de deusidad es:,/(/) : F'(t):2"-2t, > 0; y 0, caso contrrrio.
Calculemos Ia esperarrzn:
fx
tr(x) : /.oo
2re-2''d,r.
.l_,"r.tb)nt: .lo
Irrtcgrando por partes, ponicriclo rL: :1. rl,u : e-2'cl,r; pol lo tanto: ilu,: dn, Lu : _
'r"-r',
: -rc2 l-*1 l'n
2'
l'*
.lo r".,,rh
ln'2.1u "-r."rl,
,"-" l* 1 __r,.1-
z io-4c l.

;'^'^
Entonces,
E(X): , lo*
,"-'2'rL*:r(i) - I
Necesitamos el clculo cle E(X2):

E(x') : [:,2 q,a, :, .lo* ,2. 2"


tlr

Integrando por partes, clos veces. se llega a

2 ln ,,', "r!, = ?:!


4 2
Io
La varialza buscada es

var(X) : E (X,)
1 tt/1\2 1
- (tr(.Y))2
o \ol
\o /

"
S.S. La varianza
Etr ttlt slll)crlriercacro se ro,,.1,. ,,-.-
ro7
-.
crescrir,e ; ;;;;'.,". .:ff:fii:::;1ij,."":J1,*,:,i:"..T;"^,jj,f,:i,,ililTjc arcaroria quc

.f(r):[;*'sjo<'<5o;
I o, caso contrario.
a) ;.Crrl es Ia cnt jdact
de calnc quc se esr)
l)el'a vender diariamente
llin, halle ia desviaci" en el supermercaclo?
Tam_
"r*0""..oq
b) Si la ganancia en el producto
se expresa
-r"4vvu por
ganancia esperada. vvL la ecuacin
r'L ccuacln C:
).

fiX2 + 10. Calcrile Ia


Soltt,cin:

a) Calcularemos l
de la variable aleatoria
efectra ,ro"r.lr,lifjlllza como er indicador
de las ventas que
",

E(x): ['o
to " Gil o*: # fo,o
,, o,

,hl#]; :3333
As' el supernrercatro
espe.ara
-- vender
Calcrrlernos E (X2): 'v'uL 33.33 kg diarios cre car'e.

La r.ar.iarrza es

Val(X) : - (E(x))2:1250 _ (33.33)2


: ?(x'z)
138.89.
La desviacin estndar
s d:
b) Entonces, vC(D : i,/138.80 : 11.79 kg.

-\v'/ :
E(c) n(2.-, \
"rl*o" *'o):
.r

IEE (x2) +to


:
1E(1250) + I0 :24.29.
Por' la 'r'enta cre la cirrle, cr supermer-caclo
csr)era ganar 24.2g
crrares diarios.
-- uontinucin, se cla
ulr ejernltlo de valiable
- r l<.rrlo dc ia alcato
cs
valiatrza dc cs ro iltfinito cle valores.
enl>
::tc1.l1 c1
dc anlisis ma
-= s,rrn,inie*;';;;; artificios qrre
leatorias geont
ruatollas ]::? l"empleado
rtodo
::omtricas,
mtricas: geom ruLoclo emrle,rdo por
rttrlttetldes lrsicas .lu
las sci ics
satrr ar r icgo. F i I 992 , -Et.f.l[]11".[.o,,.
of Georrre ric: Xlouets, ,,
Tle Atuerialt
Stattstician, 46, 10g-10g
r08 Captulo 3. Variables Aleatorias, Esperanza y Varianza

P,_1
Propiedad 1. Va (0,1), , It,
41,-
l.;:0 | - (L

Plopieclad 2. Ya (0,1), i lr - a,)ak : a'''.


k:r

9. Una variable aleatoria X toma valores I,2,3,. . .) con probabilidades

I (1 -P)A
po,:-7, h:I,'2,..,;
L- 1.' P (0,1).

Determinar sll esperanza y su vattatza'


Soluc'in:

: io-,k:i(-#) (r -P)k
E(x)
A=1 A:1 '
: l-r) i,'- :- (*)
\ I'p)3' ir, -or*
\nP/7_o
p)k

Si p (0, 1), entonces I - p e(0, f) y aplicando la propiedad 1:

E(x) : (#) r-i-r:-(#) (")


prr-a el cilculo d.e la varianza varrios a calculal E (X'), usando Ia notacin Q: l- p; pol tanto

: ( *t) *n-:(-#) ',i'ronr


Veamos a qu es igual la surnatoria:
oo oo oo oo

Dt rnr :\nar +lnuk + lrek + '

k:7 k:r k:2 lc:3

Por la propiedad 2, se tiene que

: L-p
Dttono
: ct + q2 + q3 +... - Dnr
k:1 k:r

Consecuenternente, E (X') queda como

E(x,) :-(#) (;)+: I-p


p2 in;r

: /. r,\\

'P)
3.6. Funcin generadora de rnornentos 109

3.6" F\rncin generadora de momentos

Los momentos de una variable aleatoria son nmelos que representan algunas calactersticas de la
jistribucin de probabilidad asociada. Bajo ciertas condiciones el conjunto de momentos determinan
ie manera nica a la ley de probabilidad.

Definicin (Mornentos) Sea X una variable aleatoria y sea r un nmero natural. Cuando existe,
el ntrnero pr:E (Xk) es el k-simo momento de X.

f ntonces, tenemos que Ia media p es el primer momento de la variable aleatoria; es decir, F: lJt.

-isociada a cada variable aleatoria podemos encontrar una funcin que permite calcular sus rnomentos.
fsta funcin tiene Ia propiedad de que, al igual que la funcin de distribucin, caracteriza de manera
:rica a la ley de probabilidad de la que proviene

Definicin (Funcin generadora de momentos) La funcin generadora de momentos (f.g.m)


ie la variable aleator"ia X es la funcin

M(t):E("t"),
iefinida para valores reales de tales que la esperanza existe.

- . funcin generadora de momentos se utiliza tanto para variables aleatorias discretas como continuas.
alrt o

Ejemplos

- Encontrar l funcin generadora de momentos de la variable aleatoria cuya funcin probabilidad


CS

x I -4 I 6 I 10
p 102 | 0.3 | 0.5
Solucin: Resulta que

I[(t) : E("t"):|pr"tr
k
: 0.2 e-at * 0,3 e6 f 0.5 e1o

Hallar la funcin generadora de momentos de una variable aleatoria cuya funcin de densidad es

rI si
r, ' I
f\L;): \ -.
4 -1<r(3;
[ 0. caso cont rario.

Solttcir: Tenernos que

M(t) : E ("'') : lt f @) o' :


l:, "t'!d,, : t:
^!)
-(
4t
^- L

,et' 4

r- siguiente resu.ltado nos indica crno se pueden obtener los momentos de cualquier orden con el
:-:rpleo de la f.g.m.
110 Captulo 3. Variables Aleatorias, Esperanza y Varianza

Teorema. Sea X con furrcin generaclora de rnomentos,4f (rl), con derivadas continuas dc cualquier
orden; entonces,
.,_
I-Ik-L qlxu):
j-nt,,,l
tr,,,=o
\-'/- dj",

Es decir, el k-simo momento de una variable aleatoria se calcula como la derivacla de orden k de la
f.g.-., evaluada en cero.
Observacin. Se tiene que E(X) : Ft y Var(X) : Fz - F?.

Ejemplos

1. Hallar la varianza de la variable aleatoria cuya funcin probabilidad es

x I -4 I 6 I r0
p10.2 10.3 10.5

Soluc'in: Antes calculamos que il{() : 0.2 e-4t * 0.3 e6 * 0.5 e10; por tanto,

.1
: _0.8e-at * 1.8e6 * belo
aual
t,)
o.-
AI ft) : 3.2e-at * 10.8e6 f 50e10.
dt2

Entonces,

ltt :
ftnup: -0.8e-a(o) + 1.8"u(o) - 5"10(0) : 6,

ltz : #* ro, : 3,2e-_4(o) + 10.8e6(0) f b0e10(0) : G4.

Por tanto, Var(X) : p2 - u?:64 - (6)2 :29.


2. Hallar la varianza de la variable aleatoria cuya funcin de densidad es

(l
I@):l q,'si -1<r(3;
[ 0,
conrrario. caso

Solucin,: Ya calculamos que


eJL _ e-L
M(t):

Por tanto,

!u,rt (3t-1)e3*(1-t)e-r
dt t2
+t,
(st' - 6t + 2) e3t - - l:
.-)
',:r
#,u,
3,7. Ejercicios 111

2
Puesto que 1,1() no est definida para l, : 0. para hallar M (0) aplicaremos la
*r*r|, ,ljz
regla de L'Hospital; entonces,

trt : 4*g: Im ((st-1)e3+(t+t)e-) -1,


CN f+0
*Lurn*l
3

ttz : #*ror: ls w(Q* - 6t + ?r"" - (t2 + zt + 2) et) :- 56


24
@t) ors

Por lo tanto,
Var(X) : pz- Lr?: 56.4
243

3.7. Ejercicios
l. Halle la esperanza y la varianza de las variables aleatorias discretas definidas por

xl-0.7t10.24 10.61 Yt 2 t 4 t 5 I 6
pl 0.2 10.5 10.3 p 10.3 10.1 10.2 10.4
Se escoge aleatoriamente un nmero de conjunto $ : {-1;0; 1}. Sea X el nmero escogido.
Encuentre su valor esperado, La varianza y la desviacin estndar de X.

Existe una variable aleatoria X que cumple qLre E(X - 2) :8 y que E ((X + 1)2) : 120?

Si X es una variable aleatoria con E(X) : 50 y Var(X) : 15. Encuentre:

a) E (x2); c) Var(-X); e) E(3x + 10);


b) E(-x); d) o(-2x); f) Var(3x + 10).
Sean X, Y y Z tres variables aleatorias independientes, cada nna con media p, y varianza o2.

a) Encuentre la esperanzay la varianza de,S: X -lY 1- Z;


b) Encuentre Ia espera\za y la varianza de ? : 3X;
c) Calcule la esperanza y Ia varianza d.e A: \IjA,
3
d) Encuentre la esperanza de 52 y de A2.
SeaX una variable aleatoria definida en el intervalo l-1;11 y sea f x(") su funcin de densidad.
Encuentre P(X) V Var(X) si:

a) Jx\r): r;
I b) fy(r):lrl. c)fx@):t-lzl. d) f x@) :t '.
Encuentre la esperanza y desviacin estndal de las variables aleatorias definidas mediante las
leyes:

f 0. si r ( l;
.) r(,) :{ +, si 1(.c14;
t,I sir>4.
t12 Captulo 3, Variables Aleatoras, Esperattza y Varianza

(o sir!1;
l:lr): {L2-r'
,
t2 - si11.r.<2;
b)

I t. sir)2.
c) r,-..:l I Zr. si z e (0. l):
/(rt o. sir((0, 1).
d) ' ))' * Br - l2). si r (-5. -3):
..\ < - *frt
f,(t:):
--
I O, caso contrario.

(t. si re [1,2]:
e) f(r):1 '
I o, si zl11.2l.
(Determine primero el valor de c.)

8 Una variable aleatoria X toma los valores 4, 6 y o con probabilidades Pr(X - 4) : 0.5, Pr(X :
6) : 0.3 y Pr(X : a) : p. Si se sabe que 1a esperanza de X es igual a 6, halle los valores de p
ya.
q Halle la varianza de una variable aleatoria Z q:ue solo puede tomar dos valores, el uno el doble
del otro, con la misma probabilidad, si se sabe que E(Z) :0.9.

10 I-a variable aleatoria discreta X tiene solamente dos posibles valores: rr y fr2, adems 11 1 12.
La probabilidad de que X tome el valor 11 es igual a 0.2. Halle Ia ley de distribucin de X.
conociendo la esperanza E(X) :2.6 y la desviacin estndar o : 0.8.

11. Una variable aleatoria X puede tomar tres valorest r,1 : -I, 12:0 y 13:1. Si se conocen las
esperanzas matemticas E(X) :0.1y E(X') :0.8, enci-r.entre las probabilidades Pt,Pz yp, de
los I'alores rt, 12 y 13) respectivamente.

12. La variable aleatolia X tiene tnicamente tres posibles'u.alores rr:1,:x2 y x3 (rt < rz <'J4).
Las probabilidades de que X torne los valores rr y 12 son respectivamente iguales a 0.3 ,'
A.2. Determine la ley de distribucin de X, conociendo Ia esperanza E(X) :2.2 y la varianza
Var(X) :0.76.
i3. La variable aleatoria X tiene funcin d e distribucin

0, parar12l
F(r) : arlb, para21r14;
1, parar>4.
a) I{alle e1 valor de las constantes cr y b;

b) Determine su funcin de densidad;


c) Halle 1as probabilidades: Pr(1 < X < 3) y Pr(X ,2.5);
d) Encuentre su esperanza y sr-l varlanza.

74. Suponga que se escoge un nrmero real X en el intervato [2; 10] con urra funcin de densidad de
Ia forma f (r) : Cz, donde C es una constante.

a) Halle el valor de C;
b) Calcule Pr(D), donde 1 : 13;71;
c) Encuentre Pr(X > 5), Pr(X < 7) y Pr(X2 - 72X * 35 > 0):
d) Encuentre la espera\za y la varianza de X.
3.7. 4jercicios 113

15. Uu cstudiante rinde ttnil plr-reba consisterrte en 2 probleuras de eleccin mrltiple. La primcra ticrrc
3 posiblcs resprtest:rs y la scgurrda 5. El estrrcliante cscoge las 2 r'espuestas al rzrr. Encuentl-e:

a) La ley qr,re ciescribe cl nrmero de respuestas cortcctas X del estucliantc;


b) El nrmero esperado, E(X), de respr-restas correctas;
c) La valianza. Vur (.Y).

6 tlna organizac:n benfica realiza una rifa para conseguir fondos. cn la que sc vendieron 10000
boletos, a 4 dlales cada uno. E1 prerrio es un antomvil de 12 000 dlares. Si un ciudadarro
compra 2 boletos, cul es la ganancia esperada del comprador de los boletos?

IJna persona participa en un concurso de la televisin. Le hacen una pregunta con 5 respuestas
(solo una es verdadera) si acierta, gana 10 000. Si falla le vuelven hacer otra pregunta con tres
posibles respuestas de las cuales solo una es verdadera. Si acierta, gana 1000 y si falla se le
vuelve hacer otra pregunta con solo dos respuestas si acierta, entonces no gana nada y si falla
pierde 500. El juego termina cuando la persona acierta c despus de fallar la tercera pregunta.

a) Indique cui es el espacio muestral;


b) Calcule la probabilidad de que d una respuesta correcta;
c) Halle la ganancia esperada;
d) Halle la esperanza y la varianza de Ia variable aleatoria que describe el nmero de preguntas
realizadas al concursante.

Se asegura un vehculo de 50 000 dlares por su valor total, pagando una plima de C. Si la
probabilidad de robo en un ao es de 0.02, cul es el valor de la prima que debe cobrar la
compaa de seguros, si espera ganar 200 dlares?

9 Si Roberto termina sus estudios en Junio, podr disfrutar de una beca para poder realizar un
curso de especializacin con todos los gastos pagados. Si aprueba en Septiembre, la beca slo le
cubrir el 40% de los gastos. Si no consigue aprobar, tambin realizar el curso pero abonando
50000 dlares, que es 1o que cuesta. Roberto sabe que la probabilidad de aprobar en Junio es
slo de un 10%, mientras que la de aprobar en Septiembre es de:un 4ATa.

a) Halle la distribucin de probabilidad del costo del curso de especializacin;


b) Determine el valor esperado de dicha variable.

:0, Una agencia que renta autos tiene disponibles 4 carros todo terreno, para alquilarlos. El precio
de alquiler de cada carro es 60 dlares diarios. En un estudio de mercado el propietario ha
determinado el siguiente modelo probabilstico sobre la demanda de estos autos:

Demanda Probabilidad
0 0.05
1 0.10
2 0.20
c
r) 0.25
4 0.20
5 0.15
() 0.05

Adems, en el mismo estudio ha encontrado que sus gastos diarios son: 20 dlares por alquiler
del local y 15 por pago a ul empleado.
lL4 Captulo 3. Variables Alcatarias, Esperanza y Vatiai;za

a) Crlcttltt r:l tLtrrtelo csp<:r'aclo dc carlc-'s tocl,r tellerro <re la agencia alqr-',il.rrri urr rla (;Lralquiera;
l,) CalcrLl<-r ltr girrrnirciir clirli csperad a:
,') Caicule Ia <l:sviacin cstinclal cle lii gzrrranr;iir

'21 Urr poltafolio r-lc invcrsi<irr sig-ue r:l .,iguicltc: (iselrr1ir lrlolrabilstic:o:

Cornpaa Ganancia Probabilidad , Cornpaa Ganancia Probabilidad


0.0r02 F 250 0.2r23
0.0346 G 350 0.1542
0.0860 H 450 0.0860
0.rs42 I 55t) 0.0346
0.212:1 .I 650 0.0156

Calcule Ia esperanza y la dcsviacin cstJrndar de la ganancia de una invcrsin en este portafolio.

22.Uncrculoderaclio1eszonificaclcen10"rculoscorclrtricosd.eradios "' 10
10' 10"
lanza un dardo sobre el crculo, si stc cac en la zona ccmprerdida ertre los cr'culos de radios
i^"lJellar:zad.organa10-idlalcs, i:0,l,...,g.SeaXlacantidaddedineroganaclo,
i0 10
a) Halle Ia ley de la variable aleatolia X;
b) Calcule su esperanza y su varianza.

23. EI espesor del recubrimiento de unos cables tiene funcirr de densidud ry, corr 100 l1rn <:r <
'r'
2ao tm.
a) Determirre la media y la varianza del espesor del recublimiento;
b) Si el costo del recubrimiento es de 0.5 dlares por micrmetro de espesor, ,cul es el costo
medio por recubrir los cables?

24. Un supermercado tiene una dcmanda dialia variable X de la cantrdad de caile que vende, de
tal manera que X (medida en cientos de krlogramos) tiene una funcrn cie densidad
(
f@):1oq1r'. sio( r<4'
|. 0, caso contrario.

a) Calcule eI valor esperado de Ia cantidad de carne demandada y su desviacin estrrdar;


b) Si la ganancia est dada por Y :2X - 0.5. Calcule Ia ganancia esperada y su varianza,
25. La longitud de ciertos gusanos se distribuye segn la funcin dc densidad

z - 1)(3 - 'c)' si 1 ( ''( 3:


I@): I @
L 0, crso contrarirt.

a) Calcule la esperanza y la varianza dc la longitud clc los gnsanos:


b) Si para un estudio se considerarn aqrrellos eje:nplares clue ierrrr.n una longitud entre 1.7
cmy 2.4 cm, calcule el porcentaje cle gusanos que tienen es1-a calacter'stica.

26. El tiempo de uso diario de la red Internet en Lrna oficina tiene p,-r1 :r,;r-cin cie densidad (medida
en horas) a
( gr2(g - ,\
f("):{'-r-' sio((s:
0, [ carco conira:- .
3.7. Ejercicios r-15

a) Calcrrle cl vrlot eslrclaclo y la virriarrza rlcl tieurpo <.lialio clc rlso de lr lecl Intelnel,.
lt) El tictlitct cle ttso ilc Irrtcrrrcl' crlcsta 2 cllares pol hora. CLlcule el vr,lor esperiiclo v lzl
clesviat:iu estrrdat ck:l costr scur-nri (cn 5 clas laLorablcs) por el citilrio rrso.

La lcy cle 1tloltabiliclacl rlue rlesclibc la clistarrr'lia (cn inctros) a Ia. <-re un atletr lanza la,jabirlina
CS

[. *t ,.,, (+) . si : c [0, lon2];


,[(t': { 20zr \10n/
I O. caqo corrtr.flrio.

a) Halle la probairiliclrd de qLre rula jal;alir'a lanzidr llcgue a nna distrncia mayor quc 60 m;
b) Determinc el valor esperado dc Ia distancia a la que llr:ga la jabalina;
c) Halle Ia varianza y la desviacin estndar de la distancia cubielta por la jabalina.
:3 Dcmuestre quc la ebperanza y la valianza de Ia variable aleatoria discreta definida por

Pr(X : k) :pqk, h : 0,1,2,...


con q: L -p,r.ieren claclas por E(X) :! y Var(X) : +.
pp'
I Sea X una variable aleatoria discrcta que pucde tomar valores enteros, definicla por

Pr(X: r-l a' Pata'r_-1;


I ft - a)2n', ?' :0.7,2,,..
para

para elgn a cn (0,1).

a) Pruebe que la funcin de probabilidad est bien definida.


b) Demuestre que E(X) : g
:'-. Sean X y Y dos variables aleatorias independientes. Si X toma los valores 3, 1y 2 con pro-
babilidacles que son los 3 trminos de una progresin aritmtica cuya diferencia es j; mientras
tanto, Y tonta los valores 2,7 y 0 con probabilidades que forman una progresin geomtrica de
I
razn.r. Calcule la esperanzade XY +2Y - X.
:'- . Dadas las variables aleatorias independientes X y Y, cuyas funciones de densidad son:

: : { t^' ..-l]l ''


rx(,)
{3:' LJ"'"ik*," rv(v)
[ 0, caso contlario.

Calcule:

a) E(x t Y); b) E(2x - 3Y + 5); c) Yar( X -2Y -3).


Las variablcs aleatorias X1, X2, . . . , X,, son independientcs e igualmente distribuiclas, tales que

Pr(X- 1) : Pr(X: -f) : *,


Pr(Xn : O) : *, i: I,2,...,fr.
z

Halle la esperanza matemtica y la varianzadela variable aleatoria Sn: Xrt Xz*... * Xr.
116 Captulo 3. Variables Aleatorias, Esperanza y Varianza

33. Las variablcs aleatolias X1 , X2, . .. , Xrr,Y,Yz,. . . ,Y,, son independicntes. Pongamos

Sr,: Xt t Xz + "'I Xr,,,

7,, - X1Y1 I X2Y2+ -. . + X,,Y,,.

Halle E(,5,,,), E(7',), Var(.9,,) y Var(T,,) si

E(X,) : a, Var(X) : s2

Pr(Y :1) :p, Pr(Y -0) : q:l-It, k:I,2,'..,n.


:14. Para las variables aleatorias que tienen las siguientes Ieyes, encuentre Ia funcin generadora de
momentos v, mediante esta funcin, halle la esperanza y la v rtanza".
1
d) /(") : I ;. si z 1-2,4):
I o. si r ( (-2,4).
Yl2l4l5 I 6 ( e-3'. siz)0
e) /(r) :
b)
p 1 0.3 1 0.1 1 0.2 10.4 I o, sir<o
si tt"tI'
c)
p 10.2 10,5 10.3
t) f(r):f[. tsen3r'
0, caso contrario.

35. Sean XyYdos variables aleatorias independientes e idnticamente distribuidas con f.g.-. M(t)
Demuestre qtte Myy(t): Mx(t)llv(t) y qlue My-Y(t): Mx(t)M\'(-t)-

36. sea X con f.g.m. Mx(t), y sean a y b dos constantes. Demuestre que Moy6(t):"'btwx(ot).
Captulo 4

Principales Distribuciones de Probablidad

Hay que erplorar sistemticamente el azar.


Facultad de Letras, Pars.

:r este captulo se presentan, en detalle, algunos tipos de leyes que siguen las variables aleatorias, que
:f,arecen frecuentemente en problemas prcticos y cuyas propiedades deben ser conocidas.

-{ una variable aleatoria X que sigue una ley L de parmetros (pr,pz) Ia notaremos como X - L(pt,pz).

{.1. Distribucin uniforme discreta


lla variable aleatoria X, que puede tomar un nrmero finito de valores, 7,2, ..., n, cada uno de
tiene la misma probabilidad de ocurrir, se dice que sigue una ley de distribucin uniforme
-,,-. cuales
:':creta. Es decir,
Pr(X: k): -,1 k- L,2,''',n'
TL

E(X) : n*7
: :U Vaflanza
^2 -'t
VarlX)
t2
-
' equiprobabilidad es la forma ms obvia de asignar probabilidades dentro de un fenmeno aleato-
:-,- cuyo comportarniento es desconocido. Esta ley aparece en los jr.regos de azar en los que todos
r,s jugadores tienen iguales posibilidades; adems, esta ley es la bsica en la simulacin de eventos
u,=atorios mediante comput adora.

Eemplos

-. octaedro, considerando la variable ale-Ltoria que describe el nrimero


Se lanza rrn dado en folmr de
de puntos que aparece. Detelnlirrar su esperanza y varlarlza.

717
118 Captulo 4. Principales D istr ibttciones de P rob abilidad

Sol,tt,c'i,n: Sc tir:rre que ? - B )' sr: asigrtzr lir probabilitirl Pt (X : i),8: 1; ,,trt,rt,""r,

(l
r-F1 8+1
E(,Y)
2
,2
,
Var(X) :
n,2 -I 64-r 27
12 1')

2. Una mquina registra, en rninutos conipletos, la di.felencia de tiernpo en e1 paso cic crrrriones
por cierto lugar de la carretera. Se sabe clue ia diferencia mxima puede ser 9 rninutos. Si se
asrlme qne los arril-ros son aleatolios, calculal cl tiempo qlle se es1;erara exista errtlc dos rniJos
consecutivos, su varianza y desviacin estndar.
Soluci,n: La variable aleatoria puede tomar los valores 7,2, ..., 9, que suponemos tiene dis-
tribucin uniforme, por Io tanto,

E(x) : '+]:nrt:5min,
22
Var(X) : +: \/:6.62min2,
o : J6.6? : 2.58 min.

3. Un reloj est descompuesto y suena) aleatoriamente, a la hora en punto; es decir, puede sonar
a Ia una, a las dos, . .., a las doce; dando ese mismo nmero de campanadas. Determinar la
esperanza y varianza de la varirble aleatoria que describe el nrmero de campanadas que se habr
de esperar que d el relo.j.
Solttcin: Encontremos la esperanza y la varianza, considerando n: 12:

E(x) nll : 12+l


22 - 6.5 h,

n2 -r L44-I
Var(X) : 11.92 h2
72 72

4.2. Distribucin hipergeomtrica

Nos planteamos el siguiente problema: en una urna se tienen ly' bolas, n de las cuales son rojas y las
N -n restantes negras, de las cuales se extraen al azar r bolas; investigaremos la probabilidad de qne
el grupo eiegido contenga exactamente k bolas rojas. Aqu, k puecle ser cualquier entero entrc cclo l
TL A T.

l,a probabilidad es

Pr'(X : : Cf,C'f!,,
/,')
ci
Si consideramos l proporcin de irolas rojas en la composicin incial de bolas contenidas en la urna
n,
p : I y q : I- p, la frmula de Ia probabilidad puede expresalse colno
' N"
Ck,,,Ch-"*
Pr(X: tt): ff, A:0. 1,...,mn{Np,r},

por Io que la probabilidad p de obtener una bola roja se puede introducir como un parrnetro que
define la ley.
4.2. Distribucin hipergeorntrica 119

-\ ttrta variable rlctotir X c-rer sigue una ley hipelgeorntlica cle lral,rnetlos (Iy',n,r) se la uota
.rrcr li;rItl c tl(A'. r.r').

Lir csp<rlauza cs

EIX) :'"' -,'n.


i\/

'.' la rrarianza

vartx\:rL(l_
,u\-, i,
/A/-r\ : rr(,
" ' (,^,, /l/-r\
/ \' 1,,) _ r) -ttt (v _ r/

Esta distribucin de probabilidad surge en el anlisis de muestras en control de la calidad de lotes


ie productos (en Ios cuales hay artculos tiles y defectuosos), en estudios censales de poblaciones
:nimales y al realizar muestreo sin reposicin.
- a siguiente
frmula de recurrencia facilita el clculo iterativo de las probabilidades de la leyl:

(,n-n)!(N-r)!
Po: /!(/ -n-r)l
n'll-k r-17-k
Pk : Pn-r f _n_r+k, k : I,2,.. .,T.

Ejemplos

-. En ttn grupo de 12 estudiantes 8 son sobresalientes. Por Iista se escogieron 9 al azar. a) Cul es
la probabilidad de que entre los estudiantes seleccionados hayan 5 sobresalientes?; b) Cuntos
estudiantes sobresalientes se espera encontrar entre los seleccionados?
SoIucin:

a) Si consideramos la variable aleatoria Z: <<Nmero de estudiantes sobresalientes entre los 9


escogidos>>, se tiene:
Total de estudiantes, N :72;
Total de estudiantes sobresalientes, n:8;
Total de estudiantes escogidos, r :9;
Nmero de estudiantes sobresalientes escogidos, k : 5.
Por Io tanto, Z - 11(72,8,9) y

8! 4l

Pr(Z :5) :
elqi : 5!3t4CI 14
c?, 12t - 55
9!3!

b) Calctrlemos la esperanza de Z:

E(Z): rn 9x8
' 12
Se esperara encontrar 6 sobresalientes.

Drane, J. W., Cao, S., lVang, L. y Postelnicu, T. (1993), "Limiting Forms of Probability \,Iass Functions via Recur-
-:- re Formulas," T he American Statist'icia'n, 47, 269-27 4.
L20 Captulo 4. Pncipales Distribuciones de Probabildad

En trn contlol de calidacl inch.rstlirl se tonr un lote dc 10 lriezas l)lra nna irrsirelcin. ELr el lotc
Luy 8 piczas correctrs. Sr: tottiart al azat2 piezas. Formrr lil lcy clc clistlil.,rrcirin clel nrrnero clc
picz:rs corlcctas cntrc 1rs escogi<lir"s .y calcrrltrl su esl)eranz1.
Scht,c'i'r: La variable l'(nirmcro
aleatorir. c-le piezas correctas entre las escogiclas) tiene los
siguientes r,lores: zt : 0, L2:7, :t:3 : ).
Ernplearerrios la ley hipergeomtlica con A:10 (rrrmero total cle piezas), : B (nrrncro total
de piezas correcta^s) y r :2 (tarnairo de Ia muestra); es decir, Y - ft(10,8,2), obteniendo:

C3C3
Pr'()/ : 0) : 1
- 10x9 -
1

c?n 4,)
7x2
Pr(Y: 1) : cc 8x2 16
c?o 45 45
Bx7
Pr()':2):W Ix2 28
45 45

Formemos la ley de distribucin buscada:

w Yl o | 1 | 2

La esperanza es

E(Y) :6 116 28
+'2x-:1.6.
45
-+1x- 45 45

4.3. Distribuciones de Bernoulli y binomial


Si al realizar un experimento una vez, solo hay dos resultados posibles, se tiene una prueba de Bernoulli.
Se acosttrmbra referirse a uno de los resultados corno <<r'ito>>) qlle aparece con probabilidad p, y al
otro resultado como <<fracaso>>, que sucede con probabilidad g. Es evidente que p y q sol no negativos
y que Pl q: L.

Generalmente, se define la variable aleatoria que sigue una ley de Bernoulli as:

La ley de probabilidad es

Pr(X:r):p, Pr(X:0) :t-p:q.

La esperanza y la varianza son iguales a:

E(X) :'p, Vat'(X): pq.

La ley de Belnoulli desempea un papel fundamental en el anlisis de fenmenos en los cuales solo se
tienen dos resultados mutuamente excluyentes, como es el caso de muchas preguntas en todo tipo de
encuestas o Ia cleterminacin del sexo de los recin nacidos.
4.3. Distribuciones de Bernoulli y binomial L2L

Ejernplos

':. El mis ciolrocido es r:1 clel ltrrzaruiicnto I


de una monecla hornog:tr<tir, acr 2r 'I
,
Si Lay

desequiiiblio en Ia monecla p v .1 son clistintos cle I.2


Consi<lr'cse el experimento cousistente en Lanzar un dado y la variabie aleatorir X: <<el nrmero
de Jrnntos es nr.ayor que 4>>. Entorrces.

v : I t. si c*., t5. tj):


^ 1 o, si c..r {1,2,3,4}.

y las probabilidades son


Pr(X : o) : 3, Pr(X : t) : 1.
Segn datos censales se ha establecido que en la poblacin ecuatoriana el 52% lo constituyen
Ias mujeres y eJ. 48 % restante los hombres. Si se toma una persona al azar y se quiere conocer
su sexo, se tiene
t,
X- ! 0, si es mujer;
I si es hombre
v
Pr(X : 0) :0.48, Pr(X : 1) :0.S2.

: -pongamos que se reah.za una sucesin de n pruebas de Bernoulli e interesa conocer el nmero de
-ritos>> obtenidos, al margen del orden en que ellos se presenten. EI nirmero de xitos puede ser 0,
'- 2'
"', n'
:- ilama binomial a la ley de distribucin de una variable aleatoria discreta X
que describe el nmero
' ie xitos en una sucesin de n pruebas de Bernoulli independientes, en cada una de las cuales la
-:.,babilidad de xito es igual a p.

-'t-';ley de distribucin binomial fue descubierta por James Bernoulli, quien Ia dej escrita en su obra
Conjectandi,, ptblicada en 1713, despus de su muerte ocurrida en 1705.

-' probabilidad se calcula mediante


Pr(X : k) : Ckpkq'"-k, k :0,I,...,fr.
tr-
-a variable aleatoria X que sigue una ley binomial de parmetros n y p se la notar como X-
3ir(.n,p).
:- -\ - Bin(n,p), se tiene que

E(X) : n'P, Var(X) - nPQ'

,iistribucin
--'-:ra binomial tiene amplia aplicacin en Ia teora de mr.restreo cuando se puede contestar
r pregunta rnicamente con dos opciones (por ejemplo SI-NO).
; -lculo de ias probabilidades puede ser un proceso difcil porque los factoriales en los coeficientes
--- -,rriales crecen muy rpido, mientras que las potencias de p y q decrecen rpidamente. Por estas
:-r-)nes se utiliza la siguiente frmula recursiva para su clculo2:

Po : (l-p)"
pk :
n-._l-l;
pk,I--------;-
p
ff : I. Z)... jll.
K l--,
I-P
-)rane, J. U/. y otros (1994), op. cit
122 Captulo 4. Principales Distribuciones de Probabilidad

Ejemplos

1. Su>ongamos que en r,rna poblacin existen igual nirmero cle holnbres y de rnqjeres y consideremos
aquellas familias que tienen 4 hi.jos.

a) Formar Ia ley de Ia variable aleatoria que describe el nrmero de hijos varones en dichas
familias.
b) Calcular la probabilidad de que en una de estas familias haya mis de un hijo varn.
c) Cuntos hijos varones se espera que haya en una familia que tiene 4 hijos?
1
Soluci,n: )emos que p :
Sat y el nmero total de hijos es n : 4. Entonces, Ia variable
t
aleatoria X: <<Nmero de hijos varones>>, sigue una ley binomial de parmetros (4,|f 2); o sea,
X - Bin(4,t12).

a) Determinemos la probabilidades correspondientes.


o Si en la familia no hay ningn varn, k : 0:

Pr(x: o) : c3 (;)'(;)'-': *
o Si hay un varn, k: I:

Pr(x:1) : cl (;)'(;)^-': i
o Si hay dos varones, k:2:
n-'
Pr(X :2) : (;) :z
"1(;)'
o Si hay tres varones, /c : 3:

Pr(X:3) : cl (;)'(;)'-': i
o Si hay cuatro varones) le:4:

Pr(X : 4) : ct(;)' (;)*^: *


De manera que
xl o I r I z ls |
e Llt6 I rl4 tto
l114l3lB I |
b) Debemos calcular Pr(X > 1) : Pr(X :2) -f Pr(X:3) +fr(X: a;. Esta probabilidad,
tambin se puede calcular mediante el evento complementario:

Pr(X>1) : 1-Pr(X<1) :1-[Pr(X:0) *Pr(X:1)]


/r 1\ 11
'\to't)-tc'
lfrl

c) EI nmero esperado de hijos varones se calcula mediante la esperanza de Ia variable aleato


ria:
/'2 nP:4'1:Z'
E(X):
De manera que se esperara que en una familia que tiene cuatro hijos, dos sean varones.
4.3. Distribuciones de Bernoulli y binornial L23

Un dispositivo esti cornpuesto 1>or tres elementos que traba.jan independientemente. La pro-
labiliclad cle frlla de crda elemento en Lrrr da es igual a 0.1. Formar la ley de distribucin del
rrmero de elementos qr-re fallan en r-ru da.
Solucirt: La variable aieatoria X (<nirmero de elernentos que fallan>>) puede tomar los siguientes
valoles:
z1 : 0 (ningn elemento fall), 12: I (fall un solo elemento), 13 : 2 (fallaron dos elementos),
fr4:3 (fallaron tres elementos).
Las probabilidades de fallo de cada uno de los elementos son iguales entre si, entonces es aplicable
la ley binomial; por lo tanto, X - Bin(3,0.1):
pt : Pr(X : 0) : c3(o.t)o(0.9)' : 1. (0.1)0. (0.9)' :0.729,
pz : Pr(x : 1) : cl(o.t)t(0.9)' : 3.0.1. (0.9)2 :0.243,
ps : Pr(x : 2) : c3(o.t)'(0.9)t : 3. (0.1)2 .0.9 : 0.027,
p+ : Pr(X : 3) : c3(0.l)t(0.9)o : 1. (0.1)3. (0.9)0 :0.001.

Bn resumen,

3. Un examen consta de ocho preguntas de eleccin mltiple, cada una de ellas ofrece cinco al-
ternativas, de las cuales solo una es correcta. Para aprobar ei examen es necesario contestar
correctamente al menos tres preguntas. Si un estudiante se propone responder a las preguntas
al azar.

a) Cul es la probabilidad de que conteste correctamente todas las preguntas?;


b) Cul es la probabilidad de que el estudiante apruebe el examen?

Solucin: La probabilidad de responder correctamente a cualquier pregunta es p: Ib : o.r.


Sea Z: <<nmero de pregurrtas correctamente contestadas>>, con Z -Bin(8,0.2).
a) Debemos determinar la probabilidad del evento Z :8:
Pr(Z :8) : C3(0.2)t(O.g)t-t : 1 . (0.2)8 . 1 : 0.00000256.

Lo que nos indica que es muy difcil que adivine todas las respuestas.
b) Para aprobar se debe contestar correctamente al menos tres preguntas, por lo tanto Z > 3-

Pr(Z>3): I-P(Z<3)
: r - lPr(Z : 0) * Pr(Z : I) +Pr(Z :2))
: 1 - c3(0.2)o(o.e)t - cA(0.2)1(0.8)' - c!10.2210.s6
: 0.20308.

Una agencia de turismo ofrece viajes a la amazona. La utilidad mnima que le reporta uno
de estos viajes es 6 dlares por cliente. Ademiis, ofrece dos planes especiales, A y B. Por un
plan de tipo A, obtiene una ganancia adicional de B dlares y por un plan de tipo B, 13 dlares.
Adems, se sabe que el 60% de los clientes que contratan planes especiales prefieren uno de
tipo A. Si una semana, la agencia vendi 25 viajes a la amazona, 20 de los cuales no fueron
especiales, cul es la ganancia esperada?
Solucin: La agencia vendi 25 planes: 20 normales y 5 especiales.
f24 Captulo 4. Principales Distribuciones de Probabilidad

Sea X la irariable <<nrrnero de planes de tipo A venclidosrr, X - Bin(5,0.6).


Lr utilidacl [/ cre le producen los via.jes vendiclos es:

U : ?5 z b.t .EX. + t3(5 - X).


,, Pi,, ,t *;*
',1,
Dado que E(X) : np : 5 x 0.6 : 3, la utilidad espe'acla es:

E(U) : 150+E(BX) +13E(5-X) :215-5E(X)

4.4. Distribuciones geomtrica y binomial negativa

Consideremos una secuencia de pruebas de Bernoulli, con probabilidad de xito p, pero en lugar de
contar el nmero de xitos, nos interesa conocer el nmero de intentos hasta obtener el primer xito.
Una sucesin de pruebas de este tipo se dice que forman un erperimento geomtrico.

Una variable aleatoria discreta X que puede tomar un nmero infinito de valores I,2, . .., se dice que
sigue una ley de distribucin geomtrica de parmetro p (0 < p < 1), si la probabilidad de que X
tome el valor k es
Pr(X : k) : p(I - dk-t, k: I,2,. . .

A esta variable aleatoria se la nota como X- A(p). Su esperanza y su varanza son iguales a

E(X) : p
1

Var(X) :
L-p
p2

La distribucin geomtrica se aplica en investigaciones de mercado y en muestreo, para conocer cuntas


compras se han de realizar en una promocin para obtener un premio.

Ejernplos

1. Si la probabilidad de que un estudiante pase una prueba de ingreso a una universidad es 0.25.
cul es la probabilidad de que el estudiante pase la prueba en el cuarto intento?
Soluc'in: En nuestro caso p : 0.25 y el nmero de intentos es k : 4, por lo que

Pr(X:4) : p(L-p)a-1
: 0.25(1 - 0.25)3 : 0.105.

2. En una promocin una marca de papas fritas incluye, en cada una de las fr"rndas, una de las
figuras de los tres chiflados. Si un comprador cree que hay igual nmero de figuras cle cada uno
de los personajes en Ia promocin, cuntas fundas ha de esperar comprar para obtener las tres
figuras?
Solu"ci;n: En Ia primera compra) siempre obtiene una figura que no se tena, por Io tanto
E(X1) :1.
Para la segunda compra se tiene una probabiiidad de p2: I O" .orrr"*uir rrna figura nueva; as.

el nirrnero de compras que se debe realizar para obtenerla es E(-Y3; : 1: I


l)1
4.4. Distribuciones geonttrica y binotttial negativa 125

I
Un) r'cz (luo sc ticrrcrr rlos figruirs, la Prolrabilirlad <lc crLr:(rrtr'll la figrrtzr clrc fallrr es p.l : -\cl
,)
r)

lrlirlrolo rlc <:on)l)ras (1uo sc osl)ett lcalizrr'palir olrtc:rrcllr cs E(-Yr) : l:3.


,P:I

El rrtirrrclc-, tc.rtrl rlc courl)rls qtle sc elsl)e1 r r'lrlizal cs

E(x) : E(xr) +E(X2) +E(x;r) : I -r- 1.5 +3 : 5.5.

As,seeSI)erarea]izar.altncrios6cotriprasc1elproc1ttcto])araobte1leI'lacoIeccirrcclrtlpleta.<

-\hora, gclrcr'rlicernos la iclea de lr lev geomtrica )/ nos intcresa cl nrrnero de pnrebtrs cle Bemoulli
:recesarils hast obtencl exactanlente r' xitos.

-ua variable aleatoria cliscreta X que puede tomar nn nrmero infinito de valores r, r]_7,r'12,...,
=: dice que sigue una ley de distribucin binomial ncgativa de parmetros (r, p) (r > 1,0<p<1),si
-r probabilidad de que X tome el valor k es
Pr(X : x) : C'r--tpr'(t - rn-t, k : r','t" + l)r *2,...
:l parmetro r es el nirmero de xitos que se desea obtener y r es la probabilidad de obtener un xito.

-\ esta variable aleatoria se la nota como X - BN(r,p). Su esperanza y su varianza son iguales a

E(X) : L
p
l-n
Var(X) : ,;

\ la ley cle distlibucin l;inornial negativtr tamJrin se le llama distr"ibttczn d,e Pa,sco,l y tierre las nrisrnas
.:licaciones que la ley georntlica.
Ejemplo. Una mquina. que est claacla) ellvasa latrs cle collserva de una en una y de rnauela
--,lependiente. Se considera que el 5% de lo envasado resulta defectuoso. Si Ia mquina se detiene
::lenas produce el tercer defectuoso:

a) Cul es el nirmero de Iatas producidas hasta qlle se detiene Ia mquina?


b) Cul es Ia probabilidad de que la mquina se detenga en la novena lata producida?
c) Cul es Ia probabilidad de que se detenga sin producir ninguna lata buena?

: 'l.uci'n: Definimos la variable aleatoria X: <<nmero <le latas producidas hasta que hayan 3 clefec-
--rsas>>; X BN(3,0.05).
-
a) Calculemos la esperrnza de X:
E(X) :l:,1
p 0.05 --Or-t.

Se espcrartr ploclucir 60 latrs htrsttr quc sr: detenga la mquirra.


b) Calcrrlemos Pr(X : 9):

Pr'(X : O; : CN I(0.05)3(1 - 0.Os;0-'r : 0.00257.

c) Quc ningunl lata ploducidr fuc bLrcna, significa qr.re las 3 plirueras lLts fueron defectuosas; es
decir, A; : 3.
Pr(X : 3) : C3_1(0.05)3(1 - 0.OS;:-;t : 0.000125.
t26 Captulo 4. Principales Distribuciones de P robabilidad

4.5. Distribucin de Poisson

Uria r'rriable lertoria <liscret X quc puedc tonrrr rin nrrneLo infinito de valor.<ts 0, 1, 2, .,., sc dice
quc sigue una ley cle Poisson de pirrmetro ) () > 0), si la probabilidd cle qrre X tome el r,lor k es

)' sl':
Pr(X: :
k) "-
k! , k:0,r,2,...
A esta variable aleatoria se Ia nota como X - P(^).
Su esperanza y su varianza son, respectivamente, iguales a

E(x)
Var(X) ^,
^.

La distribucin de Poisson se aplica a sucesos que se presentan en el tiempo o en el espacio, tales como
nmero de accidentes de trfico, nmero de llamadas telefnicas a una central, nmero de goles que
marca un equipo en un partido, nmero de bacterias en una placa, entre otros.

El significado del parmetro ,\ es el promedio de aparecimiento del evento en n pruebas.


Esta ley de probabilidad es una bttena aproximacin a la binomial cuando n es relativamete grande
(n > 30) y p pequeo (p < 0.05), poniendo ),:np
Puesto que muchas aplicaciones de esta ley dependen del tiempo, es conveniente ponerla en la siguiente
forma
^-).1r rrk
Pr(X : *) : : 0,I,2,...,
\-111|, A;

que se la interpreta como la probabilidad de que sucedan exactamente k eventos en un intervalo de


tiempo fijo de duracin .

Para la ley de distribucin de Poisson tambin existe una frmula de recurrencia para el clculo de
las probabilidades3, dada por

PO
:e -,\

Pt : P*-t x ^ k: L,2,. . .
k'

Ejemplos

1. En la construccin de ttn edificio el nnlero de accidentes es de tres por mes. Calcular l.


probabilidad de que en un mes: a) hayan dos accidentes; b) hayatr menos de 2 accidentes; c
hayan ms de 3 accidentes.
Solucin: si x es la variable <<nmero de accidentes en un mes>>) x -p(s).
a) La probabilidad solicitada es:

e-3:12
Pr(X:2):;:0.224.
3Drane,
J. W. y otros (1994), op. cit
D istribucin de Poisson t27

b) La plobabilidad PL(X < 2) es:


Pr(X < 2) : Pr(X : 0) + Pr(X : 1)

: e-330 e-331
0! 1!

c) Esta probabilidad cs ms crnodo calcularla mediante el evento complementario:

Pr(X > 3) :2) .' Pr(x : 3)l

:i t-(
'rii,i I--;;; f :li; "J'";f_:^'].: "''"
1r 2! * o " i:o'352'
"
El promedio de llamadas que pasan por una central telefnica en un minuto es igual a dos.
Hallar la probabilidad de que en tres minutos se hagan: a) 4 llamadas; b) menos de 4 llamadas;
c) al menos 4llamadas.
Solucin: En este caso es necesario utilizar la segunda forma de la ley de Poisson con )- 2y
+
L
D.
.
--

Pr(X: a) ^ll"-
a) La probabilidad de que en 3 minutos se hagan 4 llamadas es

3)n _ .-66a
Pr(X:4) : "-z's(2.
41 24
:0.1339.

b) La probabilidad buscada es:

Pr(X < 4) : Pr(X : 3) +Pr(X :2) +Pr(X : L) +Pr(X :0)


63e-6 62e-6 6re-6
:J!-21-I!-u! 60e-6

Lr=
: 0.1512.
c) Los eventos <<se hicieron menos de 4 llamadas> y <<se hicieron al menos 4 llamadas>> son
complementarios; por eso, su probabilidad es:

Pr(X > 4) : t- Pr(X < 4) : 1 - 0.1512 : 0.8488.

Un libro se edita con un tiraje de 1000 ejemplares. La probabilidad de que un libro est en-
cuadernado incorrectamente es igual a 0.01. Hallar la probabilidad de que el tiraje contenga
exactamente cinco libros defectuosos.
Solu,cin: Segn los datos del probleman:1000, p:0.01 y k:5. El nrmero z es grande yp
pequeo, por lo que utilizaremos la distribucin de Poisson. Estimamos ),: np: 1000 x 0.01 :
10.

La probabilidad buscada es

0.000045 . 105
Pr(X:5) : "-10195
< : : 0.0375.

El gerente de una fbrica planea comprar una mquina r.ueva de entre dos tipos A y B. Por
cada da de funcionarniento, el nrmero de reparaciones X que necesita Ia mquina A es una
variable aleatoria de Poisson cuya media es 0.1, siendo el tiempo de funcionamiento diario
(en horas). El nmero de reparaciones diarias Y de la mquina B es una variable aleatoria de
Poisson con media 0.12t. El costo diario de operacin de A es C(t): 10 +30X2 y para B
128 Capitttlo 4. Principales Distribtrciones de Probabilidad

as Cp() : + 301'2. 'Cul cle las rni'rcluirra,s clr cl rnerror (:osto esPclackr, si iur clr clr: tralrtr.icr
S
corrsisl c crL: a) 10 lror'is'/ 1r) 20 Lolas'l
Sol,u,t:irit,: El costo cspr:raclo pzrlrL;t os

E(C.1()) E(10 + 30X2) - 10 + 30E (X2)


: 10 + 30 lvar(x) + (E(-x))'?]
: 10 + 30 [o u + (0.1)'?]
: 13/ - 0.3/r.

Igualrnente,

E(cB(t)) : E(sr + 3oY2): 8r * 3oE ()'2)


: 8 + 30 [Var(Y) + (E(Y))'?]
: 8 + 30 lo.rzr + (0.12)21
: 11.6 + 0.432*.

a) Calculemos E(C(10)) y E(Cs(t0)):

E(CA(10)) : 13(10)+0.3(10)2: 160


E(CB(10)) : 11.6(10)+0.432(10)2 :159.2.

Si /, : 10, el menor costo tiene Ia mquina B.


b) Ctrlculemos E(C(20)) y E(C6(20)):

E(C.4(20)) : 13(20) +03(20)2:380


E(CB(20)) : 11.6(20) +0.432(20)2 :404.8.

Si : 20, la mquina A tiene una operacirr rns econmic.

4.6. Ejercicios
Ley uniforme discreta

I IJn leloj automtico registra la hora a la cual llegan los empleados de una oficinzr, err troras 1'
minutos completos. Una persona puede atrasarse irasta 59 minutos luego de la hora prefijada
para entrar, caso contrario se le corrsidera corno falta. Por cada minuto de rtlaso se le colra
trua multa de 50 centavos. Si los tiernpos de atraso se consideran aleatorios:

a) Cunto esperar una persona que se lc ciescuente por un da que se atras?;


b) Si en ia oficina hay 8 persoDas) que se atlasaron 2 r'eces al mes cada nna, .cunto ser' el
descuento global esperado r estos ernpleados de la oficina?

2. Pala el sen'icio de transporte entre dos ciudades hay 10 buses, cle los cuales 5 son de tiPo normai
(costo clel ptrsa.le 2 dlares) y 5 sou clc tipo r:spocial (costo clel pasa.je 3 dlales). Una pclsorra
tietre que rir.iar etrtre las dos ciudades (ida y vuelta) durante los 5 das la.borables clc Ir senranr.
y prr'r tLrutsroltalse tonta el primcr lms c-re apalece en esr mtl) sin difelencir' el tilto; .cntinto
(:)Spelzlli gastar esta lrelsona en la semrua?
li.

'

4.6. 4jercicios t29

Eu ttna escuela prirnaria se registr el nrimero de palabras por minuto que lcan los estucliantes,
cricontr'irrclose qtle lean r-rrr rnnirno de B0 palablasi y Lrrr mximo dc 139. Ba.jo la suposicin cle <rc
la variable aleatoria clrte clcsclibe el nrrnero rlc palabrtrs lec,lls esti uuiformcmente clistribuicla.

a) Halle la probabilidad de qlle un estudiante, seleccionado al azar', 1ea l menos 100 paltrbras;
b) Determine el nrinero de palabras qlre se esperar'a lea nn estudiante selcccionaclo al azlr..
Sea X una varia,trle aleatoria que sigue una ley uniforne sobre {-1,0,1}. Calcule: a) E (Xa)
para k : I,2,... ; b) Var (X*)
Ley hipergeomtrica
Una variable aleatoria X tiene distribucin hipergeomtrcaH(7,4,5). Calcule:

a) Pr(X:3);
b) la esperanzartllzando la definicin y verifquela empleando la frmula de E(X);
c) la varianza de X.
En una lnea de control de calidad se revisan 10 artculos, determinndose que hay 3 que no
cumplen con las especificaciones. Si se escogen al azar dos artculos, identifique los parmetros
de la ley y halle la esperanza de la variable aleatoria X, que describe el nmero de piezas correctas
entre las dos escogidas.

Para llenar 4 vacantes de contador se presentan 10 personas, 7 hombres y 3 mujeres. Salen


seleccionados 3 hombres y 1 mujer. Las mujeres aclrsan a1 empleador de discriminacin sexual,
por lo que le llevan a juicio. Si el juez supone que la eleccin fue al azar, puede decirse que
existi discriminacin al hacer la eleccin?

El examen de graduacin de los abogados consta de 50 temas. La forma de examinar es la


siguiente: por sorteo se eligen 6 temas de los que hay que contestar 3 para aprobar. Si el
estudiante ha estudiado solo 30 temas:

a) Cul es la probabilidad de los 6 temas sepa contestar correctamente a 3?;


b) Cul es J.a probabilidad de aprobar el examen?
Un auditor comprueba la contabilidad de una empresa y toma como muestra 3 cuentas de una
lista de B cuentas por cobrar. Calcule la probabilidad de que el auditor encuentre por Io menos
una cuenta vencida, si hay:

a) 2 cuentas vencidas entre las 8 seleccionadas;


b) 4 cuentas vencidas;
c) 7 cuentas vencidas.

Una empresa renta autos, a los que no les da el mantenimiento clebido, por lo que algunos
funcionan mal. IJn da tiene disponibles B autos para ser rentados, de los cuales 3 funcionan
mal. Ese da se rentaron 4 autos. Calcule la probabilidad de que:
a) ningn cliente haya recibido un auto que funcione mal;
b) por lo menos un cliente reciba un auto que funcione mal;
c) tres clientes reciban autos que funcionen mal.
Leyes de Bernoulli y binomial
Una variable aleatoria X tiene distribucin binomial Bin(4,0.2). Calcule:
130 Captulo 4. Principales Distribuciones de Probabilidad

a) Pr(X :2); c) Pr(X < 2); r.) Var(X).


b) PL(X > 2); d) E(x);

t2 Urra rnquinr llena las ca.jas cle palillos de fsforo. En una Jrroporcin del 10 % la rnquina no
llena las cajas por completo. Se toman al azar 25 ca.jas de fsforos, calcule Ia probabilidad de
que no haya ms de dos cajas incompletas.

13 IJna encuesta revela que el 20%o de la poblacin es favorable a un poltico y el lesto es desfavo-
rable. Si se eligenseis personas al azar, se desea saber:

a) La probabilidad de que las seis personas sean desfavorables;


b) La probabilidad de que cuatro de las seis personas sean favorables.
t4 Una determinada raza de perros tiene cuatro cachorros en cada camada. Si la probabilidad de
que un cachorro sea macho es de 0.55, se pide calcular:

a) la probabilidad de que en una camada dos exactamente sean hembras;


b) la probabilidad de que en una camada al menos dos sean hembras.
15. En una investigacin sobre el <<rating>> de los programas de televisin se detect que se vea una
telenovela en el canal 6 en un 28% de los hogares. En una muestra aleatoria de diez hogares,
halle Ia probabilidad de que:

a) en cinco hogares se vea Ia telenovela del canal 6;


b) ningn hogar est sintonizando la novela.
c) al menos en dos hogares se vea la novela.
16 En una instalacin militar que dispone de 5 radares, Ia probabilidad de que un solo radar descubra
a un avin de combate es de 0.7.

a) Cul es la probabilidad de que sean exactamente 4 radares Ios que descubren al avin?;
b) Cul es la probabilidad de que por lo menos uno lo descubra?;
c) De cuntos radares ha de constar la instalacin para asegurarse en detectar aviones al
menos en un 98 % de las veces?

17 IJna aeronave dispone de 4 motores que funcionan independientemente, la probabilidad de que


falle un motor durante el vuelo es 0.01. Cul es la probabilidad de que en un vuelo dado:

a) no se observen fallas?;
b) no se observe ms de una falla?
c) Si un avin puede seguir volando si al menos 2 motores continran funcionando, cul es la
probabilidad de que el avin se accidente?

18 Supngase que ia tasa de infeccin de una enfermedad contagiosa es del 25 %. En una oficina
hay 10 personas que se vacunaron contra la enfermedad y ninguna se contagi.

a) Determine la probabilidad de que ninguna pelsona se hubiera contagiado a pesar de que no


se hubiera vacunado;
b) De este resultado, deduce usted que la vacuna es efectiva?

19. La probabilidad de que un estudiante obtenga el ttulo de arquitecto es de 0.3. Calcule Ia


probabilidad de que de un grupo de siete estudiantes matriculados en primer curso:
4.6. Ejercicios 131

a) los siete finalicen la calrera;


1.,) l rnenos dos rcaben Ia carlr:r'a;
c) .De currtos rh.rmnos ha de ccinst-ir nna pronlocin para rsegurarse de qtte al rnenos uno
culmine sll carrera) corr una probabilidact clel 99 %?

En un estudio rnedioarnbiental se deterniin que la plesencia de mercurio en el agua enveneua al


207o de los peces en 24 holas. Para confirmar el resultado se colocaron 20 reces en un tanque
con agua contaminada. Calcule ia probabilidad de que en 24 horas:

a) sobrevivan exactamente 14 peces;


b) sobrevivan por Io menos 10 peces
c) sobrevivan cuando mucho 16 peces;
d) Calcule el nrmero de peces que se espera que sobrevivan;
e) Calcule la varianza del nmero de sobrevivientes.

Una compaa petrolera va a perforar 29 pozos, cada uno de ellos tiene una probabilidad de 0.1
de producir petrleo de manera rentable. A la compaa Ie cuesta 100 mil dlares perforar cada
pozo. Un pozo comercial extrae petrleo por un valor de 5 millones de dlares. Calcule:

a) la ganancia que espera obtener Ia compaa por Ios 29 pozos;


b) la desviacin estndar del valor de Ia ganancia.

Una lnea area, habiendo observado que el 5% de las personas que hacen reservacin no se
presentan para el vuelo, vende 100 boletos para un avin que tiene 95 asientos. Cul es Ia
probabilidad de que, el momento del vuelo, haya un asiento disponible para cada pasajero?
tl En un examen se plantean 10 preguntas a las que debe responderse verdadero o falso. Un alumno
-)
aprobar el examen si aI menos 7 respuestas son acertadas. Qu probabilidad de aprobar tiene
un estudiante que responde todo al azar? Y uno que sabe el 30 % de la asignatura?
Leyes georntrica y binornial negativa
Cuando se graba un comercial de televisin, la probabilidad de que un actor recite correctamente
0.3. Cul es la probabilidad que el actor recite correctamente su dilogo
el dilogo de su toma es
en la sexta vez?

'l En un examen el profesor real\za varias preguntas a un estudiante. La probabilidad de que el


estudiante responda correctamente a cualquier pregunta es igual a 0.9. El profesor interrumpe
el examen apenas el estudiante manifi.esta el desconocimiento de la pregunta hecha. Se reqr-riere:

a) formar la Iey de distribucin de la variable aleatoria que describe el nmero de preguntas


que realiza el profesor;
b) hallar el nmero esperado de preguntas que ha de realizar el profesor.

-'a. La probabilidad de que un tirador haga blanco en un solo disparo es igual a 0.2. Al tirador se
le entregan cartuchos hasta tanto no yerre el tiro.

a) Forme la ley de distribucin que describe el nmero de cartuchos utilizados;


b) Cuntos cartuchos se espera que utilice el tirador?

En un examen, en el que se realizan preguntas sucesivas, para aprobar hay que contestar correc-
tamente a 10 preguntas. Suponiendo que el alumno sepa el 80 % de las respuestas, cul es la
probabilidad de que apruebe en las 12 primeras preguntas?
t32 Captulo 4- Principales Distribuciones de Probabilidad

28 Urra.jr,rgacloladctenisgarracl 33%delosrartidosqucrealiza. Ella.jrrgtrrtienLrntornr:omientlas


rro sea eliminacla por peldel r.rn partido.

a) Halle la probabilidad de quc sca elirninacla en cl segr-rndo particlo;


b) Si para ganar el torneo se deben ganar 5 paltidos consecritivos, ,cul es la probabilidad de
que la.jugadola pierda en la final del tornco?;
c) .Cuntos partidos se espela que 11egue a jugar durante cl torneo'?

29 {Jna marca de refrescos tiene impresas, en cada una de las tapas, una de las fi.guras de los 4
jinetes del apocalipsis, y quien retina la coleccin completa ganar' un premio. Si nn comprador'
cree qlre hay igual ntnero de figulas de cada uno de los pelsona,jes en la promocin, cuntos
refrescos ha de esperal comprar para ganar el premio?

30. Un pjaro de cierta especie come gusanos de una poblacin muy grande. Estos glrsanos pueden
comer) a su vez) de una planta venenosa) de manera que si el pjaro come un gusano envenenado,
deja de comer gusanos ese da. Suponiendo que el 33% de la poblacin de gusanos come de ia
planta venenosa) hallar el nmero medio de gusanos comidos por un pjaro en un da.

31. Un lepidopterista solo est interesado en los ejemplares de una clase de mariposas, que consti-
tuyen el75To de todas las mariposas de la zona. Hallelaprobabilidad de que estapersonatenga
que cazar 8 mariposas de las que no le interesan antes de encontrar:

a) un ejemplar de la clase deseada; b) tres ejemplares de la clase deseada.

32. En una fbrica, el departamento de contlol de calidad, revisa los lotes de piezas que entran, de
acuerdo con el siguiente criterio: se van extrayendo piezas sucesivamente y el lote es rechazado
si se encuentra Ia primer pieza defectuosa antes de la vigsima extraccin. Si conocemos que el
2% de piezas son defectuosas, cul es la probabilidad de que un lote sea rechazado?
t.f En una fbrica, se examinan las piezas que salen de una determinada mquina. Supongamos que
si en una hora salen mas de 5 piezas defectuosas, la mquina debe ser recalibrada. Si suponemos
qrre la probabilidad de que una pieza sea defectuosa es 0.2, y es la misma para todas las piezas
fabricadas ; encontrar:

a) la probabilidad de que se tenga que recalibrar Ia mquina cuando se han inspeccionado 20


piezas;
b) la probabilidad de que se recalibre la mquina sin haber producido ninguna pieza buena;
c) El nmero esperado de piezas que se deben inspeccionar.
QA
Se sabe que) aproximadamente, el 20 % de los usuarios de Windows no cierran el programa
adecuadamente" Supongamos que el Windows est instalado en una computadora pblica que
es utilizada aleatoriamente por personas que actan independientemente nnas de otras.

a) Cul es ia probabilidad de que el terccr usuario sea el primero que cierra adecuadamente
el Windows?;
b) Cul es el nmero medio de personas que usan Ia computadora desde el momento en qlle
se enciende hasta que alguien no cierra el programa adecuadamente?

Ley de Poisson
35. Sea Y una variable aleatoria que sigue una distribucin de Poisson de meda ),:2. Calcule:
4.6. Ejercicios 133

a) Pr-(Y :4): c) Pr()' > 4);


lr) Pr'(\/ 14): d) PL(l' > 4lY > 2),

16. El prornedio cle llrnaclas clue recibe urra ccntlal telcfrrica cn Lur rninuto es cle 1.5. Halle la
plolrabilidad de que en cuatro rninntos se rec:il;rn:

a) 3 llamadas: c) rro mouos tle crratLo y no rns rle sjclr'.


b) rnenos de 3 llarnadas;
J-
)1. Snponga quc el nir.rnelo de pilcientes que ingrcsan a Il sala de emergerrcia de trn hospital cn la
noche del viernes tiene una distribucin de Poisson con media igual a 4. Evale las probabilidades
de que:

a) durante una noche haya exactamente 2 pacientes en la sala de emergencia;


b) durante la noche hayan ms de 3 personas.
38 En un hotel, el promedio de pedidos de servicio a la habitacin es igual a 2 cada media hora.
Halle la probabilidad de que en una hora se reciban:

a) 3 pedidos; b) menos de 3 pedidos; c) no menos de 3 pedidos.

19. Una fbrica de gaseosas recibi 100 botellas vacas. La probabilidad de que al transportarlas
resulte una botella rota es 0.03. Halle la probabilidad de que Ia fbrica reciba rotas:

a) exactamente dos botellas; b) ms de dos; c) por lo menos una.

El lrromedio de automviles que entran en un trnel en una rnontaa es de un carro cada 2


minrrtos. Si un nrmero excesivo de autos entra al trnel en un perodo corto de tiempo se genera
una situacin peligrosa. Encuentre la probabilidad de que el nrmero de autos que entran al
tirnel en un perodo de 2 minutos exceda de tres.

Se supone que el nrmero de bacterias por mm3 de agua en un estanque es una variable aleatoria
X con distribucin de Poisson de parmetro ) : 0.5.

a) Cul es la probabilidad de que en 1mm3 de agua del estanque no haya ninguna bacteria?;
b) En 40 tubos de ensayo se toman muestras de agua del estanque (1mm3 de agua en cada
tubo) . ,Qu distribticin sigue la variable Y: <<nmero de tubos de ensayo, entre los 40,
qlre no contienen bacterias>>? Calcule Pr(I' > 20);
c) Si sabemos qlre en un tubo hay bacterias, cul es la probabilidad de que haya menos de
tles?

Urra planta ernbotelladora de refrescos tiene una mquina vieja para llenar botellas. La mquina
produce una ganancia de 100 diares por da de traba.jo; sin embargo, se descompone en promedio
2 r'eces cacla 10 das. Si )' replesentr el nrrnero de descompostur-as clurante el funcionamiento
de la rnquina y es el nrmero de das que traba.j lzr mquina, la ganancia generada por Ia
mqr.rina se expresa por G : 100 -50Y2. Dctermine Ia ganancia esperada en 10 das de trabajo.

En un poblacin el I por ciento de la poblacin sufi'e de daltonismo, cul es Ia probabilidad


de quc entre 100 personas:

a) ninguna padezca de daltonismo;


b) 2 o ms Io padezcan;
134 Capitulo 4. Principales Disribciorres de Probabiliclul

<:) , CLtiirr grarrrlc <leltt scl lttrl lrrtt<lstlr alertolia (c:orr lecrrrl,lrrzo) lr,rrir (iri,, i,r lrlrrlr;rlrili,l'1, I ,lr,
rlttc al ltren()s turI l)oISorrr tcrrgl <lll rtrrisrrro sor llrirl()r o igrral t ().1.1i'

44 ]llt tttt lrosrltte rlc c;eclt'o t:l rrru<:ro rk: ir'l>olcs <;orr plirgrr pol lrcclr'cr )' tj(,rlr, rrrr;r <[istr ilrrr i,,rr
c-lr:Poissorr 2(10). Los itlolcs c:ort 1.,lir1r'r. se trrtrn con insccticiclt r urL co:jt() (lo 3 rlcilrr(.: l)()r
t'lol; rrlcrns. clr: urt costcl fijo. por rlso del r:quipo y tr'lir,jl)otte. igual r 50 clrilrr<ts. I{rllr,,'l
vaiol cspcrrclo y la dcsi'itciu estrLclrr'<.lel cost,o total C de firrnigai'5 hectilcirs rlc lrosrlrrr'.

45 Para cl control cle calidacl de discos para corrrplrtadora se errrl)le un dispositivo clcctr'rrico <rrc
cltentr cl nirmelo de bytes defectuosos. Una marca de discos de computadora tierie rrrL plouLcr lio
<1e 0.1 bytes defectlLosos pol disco. Calculc el porcenta.je clc <liscos que:

a) rro tienen defectos;


b) tienen algrn defecto;
c) Halle la probabilidad de que ninguno de dos discos inspeccionados, rringuno tcnga defcctos.

46 EI nrmero de automviles que llegan a un estacionamiento, que tiene una capacidad de 12 rLrtos.
es una variable aleatoria que sigue r-rna Iey de Poisson, con Lln promedio de 4 pol hora. Si al
inicio del da el estacionamiento est r'aco,

a) cul es la probabilidad de que se llene durante la primera hcra?;


b) Calcule la probabilidad de que lleguen menos de 30 vehculos en un turno de 8 hor-as.

47. Si hay en promedio, un 1 por ciento de zurdos, cul es la probabilidad de tener porlo menos 4
zrirclos entre 200 personas?

48. En una investigacin de mercado se detelmin que el 2 por ciento de Ia pobiacin torna regultrr-
rnente Llna marca de yogurt. Se escogi una muestra de 300 personas, determine Ia prolrabiii<ltrti
de que:

a) exactamente 5 personas tomen yogurt de esa marca;


b) a Io ms tomen 3 personas;
c) al rnenos tomen 5 personas.
49. La tasa mensual de suicidios es de 4 por un milln de personas. En una ciudad cle 500 000
habitantes, halle probabilidad de que:

a) en un mes dado, hayan menos de 5 suicidios;


b) Ser sorprendente que durante nn ao, al menos en dos meses ocurran ms de 4 suicidios.'

50 En estudios demogrficos sobre matrimonios que tienen algrn tipo de planificacirr farniliar. c,i
nmero X de hijos por matrimonio es igual a 2, salvo ciertas clesviaciones debidas al azar. St'
ha comprobado que, o bien
X:2-(Y+1),
donde Y es nna variable de Bernoulli de parm etro p - 0.3, y sto ocurre con probalriiiclact 'p ::
(pues se cr.rmple en el 50% cie ios matlimonios), o bien es

X:2* Z,

dorrde Z sig:ue una distribucirt de Poisson de parmetro ,\; v esto seguudo ocul'r'e <:ou tarnbi(ll-
con probabilidact p::. Halle:
2

a) el valor de ), sabiendo que E(X) : 2;


b) la probabilidad de clue tur matrimonio terrga Lrno o d.rs hijos.
4.7. Distribucin unifornte 135

4.7. Distribucin uniforme


-,r k)\' rlc <listiilnrc;irirr cle Plolralrilitiacl tLut'"'aliablc aleatoliir (:olItllIltt
cler X sc llrrrr rr,rtli.fornte si e.t
L irrtcrr''-rlo lr. bl la funcirr rle clensirlad es constaute e igual a

rl,
I b-" si z e 1".]
f(r): 4 =-1.
I o, sirf [o.]

-i esta r.rriable aleatoria se la nota como X -Ula,bl.


-
r funcin de distribucin es
( 0, siz<a;
,-o,
F(r) : ) si(r <b;
b-o"'
1, siz>b.

Figura 4.1: Funciones de densidad y de distribucin de una variable aleatoria uniforme.

a esperanza y la varianza son iguales a:

E(x) a* b
2'
Var(X)
(b - ")'
t2

Esta ley es ei anlogo continuo de la distribucin uniforme discreta, que asigna igual probabilidad a
-da resultado de un experimento. Tiene amplia aplicacin en problemas de simulacin estadstica
-,-en fenmenos que presentan regularidad en su aparecimiento, pero qne no es posible usar variabies

-iscretas, como cuando dependen dei tiempo. Tambin, el error originado por el redondeo de un
---imero se describe satisfactoriamente mediante una ley unifbrme en el interv.t" [-:,:l
L 2 2l

Ejemplos

i. Una variable aleatoria X sigue una distribucin uniforme sobre [-2,3].


a) Calcular Pr(X : 1), Pr(X < 1.3), Pr(lXl < 1.5);

b) Hallar un valor de tal que Pr(X > ) : 1.


3'
Solu,cin:
136 Captulo 4. Principales Distribttciones de ProbabIidacl

a) Estirnernos Ia funcin cle clensicla<I.


Salrcrnos <rer ./(r:) : 0 si t: ( l-2,31.

Se ticrren los lnriters a,: -2, :3; por 1o c|re,/(z)


11 | .) .)l
l-:, 'l '
3-(-2) 5
La funcin cle densiclacl qr-recla as:

I
,f (r) : I t.sir-2,31;
I 0, sir(l-2,3).
r pr(X - r) : f ,rrd.r:0. porque X es una variable aleatoria continua.
.[,'
o Pr(x < 1.g) : l'" f (r)d.r: dr :0.66.
-m .t L,'!,
o Pr(lxl < 1.5) : Pr(-1.5 < X < 1.5) : ['
rtr[(r)dt
: l'
r'rtr^,
:l : 0.6.
b) Calculemos Pr(X > ):
/'oo ' ,'3 /m
Pr(X >L)
' I
.lt tf"ld.*:l)ar+l
,lt s .ls
o*
lrl3
t-l
3 -t
Lblr.

bntonces.
3- :",corr 1
lo crr l r:
4
b 3.

2. Dos amigos, Roberto v Fernando, deben encontrarse en una parada de bus entre las 9:00 r
10:00 h. Cada uno esperar r-rn mximo de 10 minutos. Cul es la probabilidad cie que rro se
encuentren, si Fernando llegar a las 9:30 en punto?
Soluci.n: La variable aleatoria X que describe el tiempo de llegada de Roberto puede tomar
cualqniervalorentrelas9:00y 10:00hoentre0y60minutos. DemaneraqueX -Ula,b] ysu
f'ncin de densidad es
( :, si o ( < 6o;
/(f) :{ t'0
( 0. caso contrario.

Puesto que Fernando llegar a las 9:30 o a los 30 minutos despus de las 9 y esperar a lo ms
10 minutos, Roberto no se encontrar con Fernando si llega de g:00 a rnenos de 9:20 o si llega
despus de las 9:40.
Entonces, la probabilidad de qne no se encrrentren es

Pr[(0 < x <20) o (40 < X < 60)]


r -,, fuo d'
: l,l''o 6sdt t
- .lno oo
: 11
5+5:o'667'
3. En una empresa falmcutica Lln proceso se detiene cnando deja de funciorrar un esterilizado:
hasta que llegue su repuesto. El tiempo de entrega f est uniformernente distribuido en nr-
inten'alo de uno a ciuco drs. El costo C de esa falla ' la parada complende un costo fijo d.
200 dlales de Ia refaccin v uri costo valiable que arlr-nenta en ploporcin a T?, de modo que

C :200 + l2T2
4.8. Distribucin exponencial r37

a) Ctrlculirr la probabilidrcl de qrre el tiempo de espela sea cle: clos <las o rrts.
b) Calcrrlar el costc esperirclo cle r-rna falla.
Soht,ci,<i'n:

a) trl tiempo de entrega est uniforme distribnido cle trno a ciuco clas, de rnodo que
o":lyb:5:
si1(<5;
f(t):
caso contrario.

As,
Pr(r > ,):
l, f (L)dt: .[r'Lor:1,r - 2):X
b) Por las propiedades de la esperanza, E(C) : 200* I2F,(f\. Calculemos E("2) : Var(?)*
(E("))2:

E(r'): ry.(+)'
(5-1)2-/r+s\':I
: r2-r\, :T
)
As,
E(c) : 2oo + t, (+) : 2oo + t24: r24.
EI costo esperado de una falla es de 324 dlares.

{.8. Distribucin exponencial


Se dice que una variable aleatoria continua X sigue una ley de distribucin erponencial de parrnetro
,, si su funcin de densidad es
sir(0;
f(r)-l lo,
)"-^', sir)o;
-rnde ) es una constante positiva. Notaremos como X - t(,\).
I a funcin de distribucin correspondiente es

F(r): sir(0
{ ?'- -\r, si r ) 0
"

Figura 4.2: Frurciones de densidad y de distribucin de urra r'rlirble rlcrtolia expoueucitrl.


138 Captulo 4. Principales Distribuciones de Frobabildad

La esperanza y la'r'arianza son iguales a:

E(x) : +,

Var(x) : I.\l'
Esta ley sLlrge en problemas de gentica, duracin de aparatos electrnicos o desintegracin lacliactiva
Tambin, es Ia principal en la teora de los procesos ie Markov.

Relacin entre las distribuciones cxponencial y de Poisson

Sea X la variable que cuenta el nmero de eventos que ocurren en el tiempo [0,] , con media ):
entonces,

Pr(X: k) :+. k_ 0,t,2,...

Sea ? eI tiempo que transcurre hasta que sucede el primer evento de Poisson. El rango de 7 es el
intervalo [0, -[ y su funcin de distribucin es

F7(t) :Pr(? < t) : t- Pr(? > t) :1 - Pr(X - 0) : I-


"-^t,

donde el evento Q > t) indica que el primer evento de Poisson ocurre despus de , o lo que es io
mismo, que no ocurre ningn evento en el intervalo [0,];es decir, (T > t): (X:0).

Tambin, se tiene que


fr(t): F+(t): \.-t, > 0.
Ejemplos

1. Una variable aleatoria continua Y est distribuida segn una Iey exponencial t(3).

a) Hallar la probabilidad del resultado de la prueba: Y est en el intervalo (0.13;0.7);


b) Determinar su esperanza y su desviacin estndar.
Soluc,in: Como Y - t(3),
: ( 0, siy<0;
/(v) Je-3a, si y )
{ 0.

a) Determinemos Pr(O.13 < Y < 0.7):


0'7
PL(0.13 <Y <U.7) : 3e-3'! ily
.13

.55

b) Se tiene que

E(v)
11
) 3'

"(Y)
: \;(n:
D ist r ibucin exp onenc ial 139

El tiernpo dut'ante el cual las bateras para telfono cehrlar trabajan en folma efectir,a hasta que
frllan se distribuye sr:gur un modelo expouencial, cr)n Lrn tiempo promcdio de falla cle 500 holas.

a) Calcular la probabilidad de que una bater'a funcione por rns de 600 horas;
b) Si una batera ha trabajado 350 horas, cul es la probabilidad de que trabaje ms de 300
horas adicionaies?

Solucin: Consideremos la variable aleatoria X: <<tiempo que dura Ia batera hasta que falla>>.

E(X) :500: ): X
# r -E(#). Sufuncindedistribucines:
Como
], ".'to'ces
( o, sir<o;
F(r): siu )0,
{,_ "_rlsoo,
a) Calculemos Pr(X > 600):

Pr(x>600) : 1-Pr(X<600) :l-F(600)


: I - ( t- e-6oo/500'\ : 0.301.
\/
b) Si la batera ya trabaj 350 horas, queremos conocer la probabilidad de que trabaje ms
de 650:

Pr(X > 350 + 3001x .---/


> 350)
Pr(X>650): 1-F(650)
: :J;-;+
Pr(X>350) 1-F'(350)
1-(1 '-650/500\
:
1-(116:o'54e'
El nmero de clientes que llega a una ventanilla de un banco sigue una distribucin de Poisson
con media de 4 personas por minuto. Cul es Ia probabilidad de que el primer cliente llegue:

a) dentro de los 30 segundos despus de haber abierto Ia ventanilla?


b) mrs de dos minutos despus de abrir la ventanilla?

Soluc'in: Tenemos las siguientes variables aleatorias:


X: <<nmero de clientes que llegan a la ventanilla>>, X - P(4).
T: <<tiempo que transcurre hasta que llega el primer cliente>>, T - (4), con funcin de densidad

.fr(t):4"-nt, >0.
a) La probabilidad de que eI primer cliente llegue en los primeros 30 segundos es

,.0.5
Pr(?<0.5)' : | +"-n':0.86b.
.lo

Obsrvese que tambin se cumple que

Pr(? < 0.5) : 1 -Pr(T > 0.5) - 1 -Pr(?: 0) : t -e-4(0'5) :0.865.


b) Se tiene que

Pr(? > ,): I, 4e-atdt: o.ooo335.


I4O Captulo 4. Principales Distribuciones de P robabilidad

4.9. Distribucin normal

La ley de probabilidad de una variable aleatoria continua X se llama nortnal si s:.:t funcin de densiclad

f (') : -!'-''-u)212o2 r e (-oo, oo)


,/2tro '

donde es un valor real cualquiera yd es positivo. A tal variable aleatoria se notar como X
.M(p,o').
La funcin de distribucin correspondiente es la integral

F(r): t.
t/2"" "-(t-2lzo2

Figura 4.3: Funciones de densidad y de distribucin de una variable aleatoria normal.

La esperanzay la varianza son iguales a

E(X): p, Yar(X) :62

Por esto, se dice que es una ley normal de media t y varianza o2. Obviamente o es la desviacil
estndar de X.

Observemos que la funcin de densidad de una variable aleatoria X - Jt(p,o2) es simtrica respect,
a Ia recta r: IL.

Esta ley tiene amplia aplicacin en fsica, economa, ingeniera y biologa, pues como una primer,
aproximacin- se asume que los fenmenos siguen una ley normal. Tambin, juega un papel mr-l-.'
importante en toda Ia teora estadstica ya que, bajo amplias suposiciones, el comportamiento de l-
sumas de magnitudes aleatorias es aproximadamente normal, lo que constituye el Teorema del Lmir-
Central.

El nombre de normal fue aplicado a esta ley de distribucin por F. Galton en 1889, no sin reparos p-l
otros cientficos, porque este nombre puede hacer pensar a las personas que las otras distribuciont:
son) en uno Ll otro sentido, anormales. En el plano anecdtico, remitmonos a lo que se dice en =-
libro de Mosteiler, Rourke y Thornas (1970, p. 226) respecto al nombre de esta ley: <Algunas vecr:
la distribucin normal es llamada gaussiana, especialmente en la ingeniera y la fsica. En Francia =-.
llamada laplaciana. Estos nombres son usados, probablemente, porque la distlibucin fue inventac"
por de Moivre.>>

Un caso importante de esta ley de probabilidad se tiene cuando F:0 y o2 :1, que se denomi-:
4.9. Distribucin norrnal t4t
,tttnol. cstti,tdot'(^/(0. 1)), sus funcicues cle clcusidrci y distlibucicilr sorr

L
7\:'/
^t-.\
,ryi.
n-"'2. ., (-co. rc)
.1. <

o(,) : t'/2
cu,
h [__"
:espcctir,aruente. Obsrvese qlre) en este caso particular, la funcin de densidad se nota mediante cp y
-a ftrncin clc clistribucin por .

Si se ticnc urra variable aleatoria X - N(p,,o2), pr-redeu calcularse los valores de su funcin de dis-
:rilucin lncdiante el empleo de la ley normal estndar aplicando la trausfolmacin

F(r\ :o l" - P\ .

\o /

distribucin de la ley normal estndar no se puede dar como una funcin explcita, sino
li-a funcin de
=tlamente en forma de una integral, por lo que se emplean tablas, como la que se encuentra en la
Tabla 1 del Apndice, para calcular los valores de O(z).

Si X - Jt[(p,o'), se puede dar la siguiente regla emprica que da el rea bajo Ia curva limitada por
-na, dos y tres veces la desviacin estndar (ver Figura 4.4).

Figura 4.4: reas bajo la curva de la distribucin normal.

l. El rea limitada por el intervalo lp - o, p+ ol contiene un rea igual a 0.682.

2. El rea limitada por el intervalo lp-2o,tj-2ol contiene un rea igual a 0.954.

3. El irea lirnitada por el intervalo lp-3o,p"*3ol contiene un rea igual a 0.997.

Ejemplos

l. La esperanza cle una variable aleatoria X normal es igual a 6 y su varianza es 16. Escribir la
ley cle la variable aleatoria y calcular:
a) Pr(X < 3); b) Pr(X > a); c) Pr(4.5 . * .r)t
d) Encontrar el valor de de manera que se cumpla que Pr(X { ) : 0.9264.
SoLu,c'in: La espelanza es E(X) - lL:6 y la valianza .s 02 :16, por lo que o:4; etttottccs,

r@) :
#r""p ( g#) : #".' (-q#)
L42 Capitulo 4. Principales Distribuciones de Probabilidad

a) Calculenros Pr'(X < 3):

Pr(X < 3) : F(3) :. l+)


\4 )
: (D(-0,75) :0.2266.

b) Calculernos Pr(X > 4):

Pr(X>4) : 1-Pr(X <4):1-F(4)


1-o(4-6) :t-o(-o.b)
,-o.s\aJ:o6er5.
c) Calculemos Pr(4.5 < X <7):
Pr(4.5 < X < 7) : F(7) -F(4.5)

(.:,'*) :'{0 ") - o(-0 375)


: ;f/)#
d) Se tiene que

Pr(x < ): rl-j)


\4)
:0.e264.

Por otro lado, en la tabla de Ia ley normal, se encuentra que (D(1.45) :0.926q; es decir, se
cumple que
t : t'nu'
Entonces, t: 1.45 x 4 * 6: 11.8. ^u
2. El permetro craneal de los hombres, en una ciudad, es una variable aleatoria de media 60 cm '
desviacin estndar 2 cm.

a) Qu porcentaje de los hombres tienen un permetro craneal entre 57 y 64 cm?;


b) Qu permetro craneal debe tener un hombre para que el 16.6 % de sus paisanos <<tengan
mis cabeza que l>>?;
c) Y cunto para que el 35.2 To tenga menos?

Solucin: Se tiene la variable aleatoria X: <<permetro craneal de un individuo>> , X - N(60,22).

a) Buscamos Pr(57 < X <64):


Pr(57<X<64) : F(64) -^F(57)
:'"'
:;,*-,);:fr) -o(-1 5)

El9L% de la poblacin tiene un perfmetro craneal entre 57 y 64 cm.


b) Debemos hallar el valor de c de manera que Pr(X > n) - 0.166.
Pr(X >z) : 1-Pr(X (r) - l-f'(r) :0.166,
F(") : 1-0.166:0.834,
o l" .60\ = 0.8s4.
\2/
4.9. Distribucin normal 143

Por otro lado, eu la tabla de la ley norm,rl estinclar se observa que Q(0.97) : 0.834.
Entonces,
r-60 : 0.97.

De donde, z:61.94cm.
c) Ahora, hallemos z tal que Pr(X < z) :0.352.

Pr(X < r) : F(r) :0.352,


o l" ,60\ : 0.352.
\2)
En la tabla leemos que O(-0.38) :0.352. Entonces,

z-60 :
-0.38.

Por tanto, r :59.24cm.

En una fbrica de autos un ingeniero est diseando autobuses pequeos. Sabe que la esta[ura
de la poblacin est normalmente distribuida con media 1.70 m y varianza 02, con o :5cm.
Qu altura mnima debern tener los autobuses para que no ms del l% de las personas golpee
su cabeza con la parte superior del autobs?
Solucin: Sea X la variable aleatoria <<estatura de las personas>, X - N(t.70, (0.05)2). De-
nominemos h ala altura mnima para que la probabilidad de que una persona golpee su cabeza
con el techo del autobs sea del LTo; es decir,

Pr(X>h) : 0.01

Pr(X > h.) : 1- Pr(X < h) : 1- F(h) - 1-. (%*p) ,

donde .F es la funcin de distribucin de la variable aleatoria X. Ahora bien,

1-oln;=t:to)
0.05
: o.or.
\ /
oft-1'70\
-\ o.o5
: v'v! :o.ee.
r1-0.01
)

Igualando los argumentos de la funcin da:


h - r.70 : 2.33.
0.05
: 1.70 + (0.05)(2.33) : 1.817.

Es decir, el ingeniero deber disear el autobs con una altura de 1.82 m.

En una ciudad habitan 150 mil familias, cuyo ingreso anual sigue distribucin normal con media
de 8000 dlares y desviacin estndar de 1200 dlares.

a) Cuntas familias tendrn ingresos anuales menores a 6600 dlares?;


b) El SRI dice que pagarn sus impuestos aquellas familias que se encuentren en el ltimo
quintil. A partir de qu ralor una familia debe pagar impuestos?

Solucin: Se tiene la variable /: <<ingreso familiar anual>>, X -.A/(8000,12002).


l+J Captulo 4. Principales Distribuciones de Probabilidad

a) I)clrr:rlos hrllrl lrr prol-ral-riliclacl Pr'(1 < 6600).

pL(1 6600) : F(6600) :*(6otlg---!0t10


\ 1200 )
o(-1.17) :0.12t.

EI 12.1% clc las faltrilirs tictrc ingresos anuales menores a 6600 cllares. Eso quir,.r'c clccir
que sorr 0.121 x 150 000 : 18150 farnilias.
b) Si buscarnos el riltino quintil de ingreso, qniere decir aquellas farrrilias r,re tienen el 207,
dc los inglesos nrs altos; o sea) tenem s que encontral rrn valor :: de nlancla que Pr(I >
r) :0'2'
>r) : 1-Pr(/ 1r):0.2,
Pr(I
I r) : F(r) : 1- 0.2 : 0.8,
Pr(/
o l" -,99!o) : 0.8.
\ 1200 )
En la tabla de la ley normal, \emos que se velifica que iD(0.84) : 0.8. Por tanto,
z - 8000
: 0'84'
1200
Al resolver esta ecr.tacin, nos da r : 9008. Consecuentemente, el 20 % de las familias tiene
un ingreso superior a 9008 dlares anuales

Se tomaron <Ios exmencs sobre 100 puntos, crr el .rrimero se obtur,'o r1 :80, ot:4 y en e-
segundo p2 : 65, 02 : 5. Un cstrrdiante sac 84 en el primer exalnen y 75 en el segrrnclo
Cornparativamcnte, en cul de los exrncnes obtu.r'o rnejor resultado?
Sol'u,cirt: Deterrnincrllos, ptl'a cada examen, el porcentaje cle cornrarleros (lue src]r'on rnclroi
nota que 1, sabiendo qr.re

r : 80, ot, : 4, FZ:65, 02 :5.

Pr(X<8a) : F,(84) :t(91#) :.,t, :0.8413,

Pr(X < 75) - F2(75): O (7S - 0S) : .(r) :0.9772.


\b/
Conro en el primer exarnen el porcentaje de compaeros que obtuvo menor nota es 84.73%o y e:
el segundo 97.7270, tuvo, comparativamente mejor resultado en el segundo examcn.

Una empresa ernbotella t'efrescos rnediante una mquina que envasa el lquiclo, con un nredia r -.

desviacin estndar de 10crn3. Calcular el valor de Ia media prra que solo se lebase la cantida-
de 310cm3 en elSTo cle Ias lrotellas, si se supone que la canliclad de lquido ernl-otellaclo tierr.
distribucirr nonn1.
Sol'ucin: Sea X: <<la cntidad de lquido embotellado>>, corr X - N(F,(10)2). Se brrsca el,r,rlc,:
de r tal que
Pr(X > 310) :9.65.
Ahola bien,

Pr(x > 310):


',(+, -#) :v,(z, Y) ,
4.70. Ejercicios L45

clorrde Z - N(O,I). Por la tabla de la ley normal, Pr'(Z > 1.645) : 0.05, debindose cumplir
que
310-p:1.645.
10

As,
: 310 - 10(1.645) : 293.55.

ElmarcadorqueindicaIacantidadmediadelquidodebeestarposicionadoen293.5cm3.<

En el Cuadro 4.7 se encuentra un resumen de las leyes de probabilidad analizadas en este captulo.

Uniforme discreta, r

'lt(N,n,r) -r
Hipergeomtrica
# #(t-#) N-1
Bernoulli Ber(p)
Binomial Bin(n,p) np

Geomtrica
r-p
9(p)
p2

Binomial negativa BN(r,p) ,,,L-p


P(^)

l/(a,b) (b - o)'
Uniforme continua
+ L2
I I
Exponencial r(r) ;
^2
Normal N(t",o")
Normal estndar
^/(0,1)
Cuadro 4.1: Principales leyes de distribucin de probabilidad

4.10. Ejercicios
Ley uniforme

1. Una variable aleatoria X tiene distribucin uniforme sobre [-3,1]. Calcule:

a) Pr(X:0); d) Pr(lxl > 0.5)


b) Pr(X < 0); 1
c) Pr(lxl < 1); e) Halle un valor de tal que Pr(X )):-.

Realice el ejercicio anterior considerando que X - U[-3,2].


Un reloj de manecillas se detuvo en un punto que no sabemos. Determine la probabilidad de
que se haya detenido en los primeros 25 minutos luego de sealar Ia hora en punto.
t46 Captulo 4. Principales Distribuciones de Probabilidad

4. Los utobrrses de cierta lner salcrr c:on holario estricto cada cinco minutos. I{alle la plolrabilicliLrl
ckr cluc 1ul l)asa.jero c1r-rc llcga n lzr pzrraclzr tenga que esperar el rutobris nlclros cle tlcs rrtintrtos.

r
L,. Al cstrrcliu' las ofertas de contlatos cle ern'o, un fablicante de coml>utdoras ve que los cxlrtr'rtr.,-
clc los intelesados tienen ofertas que se distribuyen ltniformemente entre 20 nril y 25 nlil dlarcs
Calcule lil plobabiliclad de que el siguiente contrato sea:

a) menor qre 22 mil dlares; c) Estime el costo medio de las ofertas cr

b) mayor qre 24 mil dlares; contratos de este tipo.

6. Sqrngase que Ia velocidad de los autos en un sector de una carretera sigue urta ley uniforntt
entre 60 y 120 kmlh. Cul es la probabilidad de que un auto:

a) tenga una velocidad de 80 kmlh?;


b) tenga una velocidad menor que g5 km/h?;
c) tenga una velocidad menor que 70 km/h o mayor que 100 kmlh?
7. El dimetro, z de un crculo se mide aproximadamente 5 1 r ( 6 cm. Considerando el dimetrc
como una magnitud aleatoria X distribuida uniformemente en el intervalo (5, 6). Halle:

a) la probabilidad de que el dimetro sea mayor que 5.8 cm;


b) la esperanza matemtica y la varianza del rea del crculo.
8. Una llamada telefnica lleg a un conmutador en un tiempo, al azar, dentro de un periodo de
un minuto. El conmutador estuvo ocupado durante 15 segundos en ese minuto. Calcule la
probabilidad de que la llamada liaya llegado mientras el conmutador no estuvo ocupado.
9. A partir de las 12:00 de la noche un centro de cmputo trabaja dos horas y para una. Une
per-sona llama al centro Lrn momento aleatorio entre las 12:00 y las 05:00 horas. Cul es Ia
probabilidad de que el centro est trabajando cuando llama la persona?
10. En una prctica de precisin area se deja caer una bomba a lo largo de una Inea de un kilmetrc
de longitud. El blanco se encuentra en el punto medio de la lnea. El blanco se destruir si la
bomba cae a una distancia menor que setenta y cinco metros del centro. Calcule la probabilidad
de que el blanco se destruya si la bomba cae al azar a lo largo de la lnea.
Ley exponencial
11. Escriba las funciones de densidad y distribucin y los valores de la esperanzay la varianza para
Ias variables aleatorias que siguen una ley exponencial:

a) t(6); b) r(3); c) (0.5); d) t(0.25).

12. Se prueban dos elementos que trabajan independienternente. El tiempo de trabajo del primer
elemento tiene distribucin (0.02) y el segundo elemento t(0.05). Halle la probabilidad de que
en el tiempo de duracin t :6 horas:

a) ambos elementos fallen; c) solo falle un elemento;


b) ambos elementos no fallen; d) falle por lo menos un elemento.

13. La duracin (en minutos) de las llamadas telefnicas de larga distancia desde Quito es una
variable aleatoria con densidad

r(t): {o;-,,,, :l ;:3f


Determine el valor de c y calcule la probabilidad de que una llamada dure:
4.70. Ejercicios t47

rr) rnenos clc 3 rrrirmtos;


b) rrrs dc 6 rrriuutos:
c) errtre3y6nlinutos.
d) Calcule lzr esperanza de la variable aleatoria e interprete su significado;
e) Si el ccsto clel minuto de las llarnadas telefnicas es de 40 centavos, cunto esperara un
usuario pagar por una llamada?

14. La duracin (en aos) de la vida de los individuos de una poblacin humana se puede modelar
mediante una'r,ariable aleatoria con funcin de densidad

si > o;
f (t) :{ {oe-.t/ao,
0, si10.
a) Determine la vida media de la poblacin;
b) Cul es la probabilidad de que un individuo no llegue alos 42 aos?;
c) Cul es la probabilidad de que una persona que tiene ms de 50 aos, supere los 65?

-o Suponga que la duracin, en minutos, de una conversacin telefnica sigue una ley exponencial
eOlS). Encuentre la probabilidad de que Ia duracin de una conversacin telefnica:

a) exceda los 5 min;


b) dureentre3y6min;
c) dure menos de 3 min;
d) dure menos de 6 min, dado que ha durado ms de 3 min.

6 Se prueban tres elementos que trabajan independientemente entre s. La duracin del tiempo
de trabajo sin fallo est distribuida segn una ley exponencial: para el primer elemento h(t) :
0.1e-0'1, para el segundo elemento fz(t) :9.2"-o'2t, para el tercer elemento /s() : g.3"-0'3t.
Halle la probabilidad de que en el intervalo de tiempo (0,10) horas, fallen:

a) por lo menos un elemento; b) no menos de dos elementos.

La escala Richter para medir la magnitud de los terremotos sigue una ley exponencial de media
2.4. Calcule la probabilidad de que un sismo sea:

a) mayor que 3 grados en la escala de Richter;


b) entre 2 y 3 grados en la escala de Richter;
c) El sismo producido en Ia India el 30 de septiembre de 1993 tuvo la intensidad de 6.4 grados,
cul es la probabilidad de que un sismo supere esta intensidad?

-5. El tiempo de duracin, en meses. de un tipo de resistencia elctrica se expresa mediante una
variable aleatoria X que sigue una ley exponencial (0.5).

a) Cul es la probabilidad de que una de tales resistencias elctricas dure ms de 4 meses?


b) Si se prueban 10 resistencias elctricas, cul es la probabilidad de que ninguna dure ms
de 4 meses?
c) Cuntas resistencias se probaran para que con probabilidad igual a 0.9 se tenga al menos
una resistencia que dure mis de 4 meses?
148 Captulo 4. Principales Distribuciones de Probabilidad

cl) Si el costo de produccin cle una resistencia es C : 2 + (30 - X)' , cul es el costo espelaclo
de una resistencia?

19 El tiernpo 7 que se demora para completar una reparacin elctrica es una variable aleatoria
distribuida exponencialmente, con media 10 horas. El costo C de llevar a cabo este trabajo se
relaciona con el tiempo empleado mediante la frmula

C:100 +40T' +3T'2.

a) Calcule el costo esperado de la reparacin;


b) Con qu frecuencia el tiempo ser mayor que 20 horas?

20. La duracin de los neumticos de una marca determinada siguen una ley exponencial cuyo
promedio es 30 (en miles de kilmetros). Calcule la probabilidad de que un neumtico dure:

a) ms de 30 mil km;
b) ms de 30 mil km, dado que ha durado 15 mil km.

Ley normal
21. Se tiene una variable aleatoria Y con media 5 y varianza 16.

a) Determine su funcin de densidad.


b) Halle las probabilidades: Pr(Y < 6), Pr(Y > 4) y Pr(lYl < 3).
22. Una variable aleatoria Z est distribuida normalmente, Z - Calcule:
^f(1,16).
a) Pr(Z < 0); b) Pr(Z > 3); c) Pr(lZl < 3); d) Pr(lzl > 2).

23. cigarrillos es, para los fumadores, de 5 dlares diarios por trmino medio.
Se sabe que el gasto en
y que la desviacin estndar es de 0.8 dlares. Suponiendo que el gasto sigue una distribucin
normal, qu proporcin de los fumadores gastan entre 4 y 6.2 dlares diarios?

24. Se experimenta con un medicamento que produce variacin en el peso de las personas que lo
toman. Pruebas de laboratorio han demostrado que al cabo de un mes la rrariacin del peso
sigue una distribucin gaussiana de media 2 kg y desviacin estndar 1.25 kg. Determine la
probabilidad de que una persona:

a) haya aumentado al menos 1 kg; c) haya aumentado menos de 3 kg.


b) haya rebajado de peso;

25. La compaa area Helios sabe que el tiempo de retraso de sus vuelos sigue una ley normal, con
un retraso medio de 10 minutos y desviacin estndar 5 minutos. Calcule la probabilidad de
que:

a) un vuelo no tenga ietraso;


b) el prximo vuelo llegue con no ms de 12 minutos de retraso;
c) el prximo vuelo llegue con ms de 15 minutos de retraso.

26 La Cruz Roja ha determinado que tiempo necesario para que una de sus ambulancias llegue al
sitio donde hay una emergencia se distribuye segn una variable normal de media 17 minutos y
desviacin estndar 3 minutos.
4.70. Ejercicios t49

ir) (-i;rlr:rrlc lir


rrolral.,ilirlir,Irlc: <Lrr: cl tictttpo cle llcgrrcltr est cornplCncliclo cntrc 12 y 21 rnirrntos;
lr) .1:'iLLirrrrrvirloltIr:1 tir:rrr-rri/. Iiiplol-rabi]iclrcl clcrlucIaarnbrriancizrempleerlsclc/rrtitrlrtos
r:rr llr:girr r:t rlcl ir',2 /

Los r:r'r'olcs rlc clc pcso cle Ltna balanzl obeclccelr a una ley normal con desviacirt
lr nrcclir:i<irr
y
cst inclrr' 20 nrg csl)cr irrza 0 rng. Hzrlle Ia probabiiidad cle clue cle tres niediciones iridcpendientcs,
el clrol tlc por lo rncnos una cle ellas no sea mayor) en valor absoluto, que 4 mg.

Se aplic rrrrzr plueba clc fluiclez ver-bal a 500 alumnos de Educacin Bsica. Se supone que las
rtrrrtnaciones obtcnidas se clistlibr.ryen segrn Lrna rrornlal de media 80 y desviacin estndar 12.

a) Qu puntuacin separr cl25% de los alumnos con menos fluidez verbal?;


b) .A partir de qu puntuacin se enclrentr a el 45 % de los alumnos con mayor fluidez verbal?;
c) Cuntos alumrros tienen una fluidez menor que 76 puntos?

l9 El per'metro craneal de los hombres, en medido en cm, es una variable aleatoria normal /(60, 4) .

a) Qu permetro craneal debe tener un hombre para que el 16.6% de sus paisanos <<tengan
ms cabeza que l>>?

b) Y cunto para que el25.2Vo tenga menos?

rl. Se llama cociente intelectual(C.I.) al cociente entre la edad mental y la edad real. Se sabe que
Ia ley de distribucin del C.I. es normal con media 0.95 y desviacin estndar 0.22. En nna
poblacin con 2600 personas se desea saber:

a) .Cuntas tendrn un C.I. superior a 1.3'/; c) Cultas tendrn un C.I. entre 0.8 y 1.15?
b) .Crrntas tendrn un C.L inferior a0.77?;

l1
JI Se va construir nn n)arco para montar una puerta. Qu altura mnima ha de tener el rrrarco
para que el 7%o de Ia poblacin tenga riesgo de chocar su cabeza al atravezarla, si la estatura de
la lroblacin estadistribuiclanormalmente, con media F:1.72m y varianzao2, con o:12cm?
i2 La cstattrra de la poblacin masculina est normalmente distribuida con F : L67 cm yo : 3 cm.

a) Cul es la probabilidad de que un hombre tenga una estatura:

(i) mayor que 167 cm?; (ii) mayor que 170 cm?; (iii) entre 161 y 173 cm?

b) En una muestra aleatoria de cuatro hombres, cul es la probabilidad que:


(i) todos tengan estatura mayor que 170 cm?
(ii) dos tengan estatura menor que la media (y dos mayor que Ia nredia)?

El peso de las fundas de papas fritas producidas por una fbrica sigue una distribucin rrolmal
con media 12.8 onzas y desviacin estndar 0.6 onzas.

a) .Qu proporcin de las fundas pesan ms de 12 onzas?;


b) .Qu proporcin de las fundas pesan entre 13 y T4onzas?;
c) Determine el peso tal que el 12.5 % de las fundas pesen ms qr-re ese peso;
d) Si el falricante dcsea rnantener la media en 12.8 onzas) pero ajusta la desviaciu estndar
tal que solo el ITo de las fundas pese rnerros de 12 onzas, .cul debe ser el valor cle la
desviacin estndar-?
150 Capitulo 4. Principales Dstribuciones de Probabilidad

34. La <:strtr-rr't ct: lzr pobla,cin rnascrrlina y femcnina siguen leyes de distlibucin nclrrnal. La
rtascrtliut tirtnc t,1 - I.67 trl y 01 : 12crn v ]a fcnlr:nina" p2:1.55 In y 612 :10c1r. Se tice
urra 1rarcjir ert lt c:ual cl varlr rnicle 1.70tn y Ia rtru.ler 1.60rn. Cornparil,tir/amente) .cul cle los
dos es rns rlto Li:spccto a los miembros cle su sexo?
OE
Ji, Los conductoles quc se fabricrn para utilizar en las computadoras deben tenel resistencias clue
varan entre 0.12 y 0.74 ohm. Las medidas de las resistcncias que produce Lrna compaa siguen
una ley de distribucin normal de media 0.13 ohm y desviacin estndar 0.005 ohm.

a) Qu porcentaje de Ia produccin de la compaa cumple con las especificaciones?;


b) Si se usau cuatro de esos conductores en una computadora, cul es la probabilidad de qne
los cuatro cumplan con las especificaciones?

36. Los tiempos de Ia primera avera de una mquina de cierta marca tienen distribucin gaussiana
con un promedio de 1500 horas de uso y desviacin estndar de 200 horas.

a) Qu fraccin de esas mquinas fallarn antes de 1000 horas?;


b) Cul debe ser el tiempo de garanta que deba dar el fabricante si desea que solo se presentr
el \Vo de las averas dentro del tiempo de garanta?

37. El promedio de las calificaciones de los estudiantes universitarios se distribuye normalmente co-
media 5.4 y desviacin estndar igual a 0.5 puntos.

a) Qu porcentaje de los estudiantes tiene un promedio de calificaciones superior a 6?;


b) Si los estudiantes que tienen un promedio inferior o igual a 4.9 abandonan la universidac
qu porcenta.je de alumnos desertar?;
c) Se seleccionanal azar tres estudiantes, cul es la probabilidad de que los tres tengan r-:
promedio de calificaciones superior a 6?

38. En el grupo tnico A, la estatura de las personas (en cm) sigue una distribucin,Af(t6S;25): .,-
el grupo tnico B sigue una,A/(170;25) y en el grupo C una N(175;25). Los tres grupos tnio-
son muy numerosos.

a) Si elegimos una persona del grupo A, cul es la probabilidad de que mida ms de 160 cn
b) Si elegimos 10 personas al azar del grupo tnico A, independientemente unas de otras, ct-
es la probabilidad de que 5 de ellas midan ms de 160 cm?;
c) En una ciudad, el 50 To de Ia poblacin pertenece a la etnia A, el 20 % pertenece a la E '
el30% r'estante a la C. Si elegimos una persona al azar en esta ciudad y mide ms de ---
cm, cul es la probabilidad de que pertenezca al grupo tnico C?;
d) Si elegimos 10 pelsonas al azar del grupo B, independientemente unas de otras, icul a -"
probabilidad de que al menos 5 midan ms de 172 cm?

39. Una mquina para llenar cajas de cereal tiene una desviacin estndar de 25 gramos sobrt *r
peso de llenado de lascajas. Qu medida debe indicar el marcador de llenado de las cajas p--.
que permita que ha5,a cajas de 450 gramos o ms durante elI% del tiempo? Se supone qu iiu
cantidad de cereal por caja sigue una ley normal.

40. La anclrura, en mm, de una poblacin de colepteros sigue una distribrcin N(p,;o2). Se esti
que el 77% de la poblacin mide menos de 12 mm y que el 84% mide ms de 7 mm. Halle
parmetros de Ia ley.
4.77. EI teoretna del Lmite Central 151

4.11. El teorema del Lmite Central


Exantiucrrtos el sigtrierttc teorcrua. clue tielc rrna importaucia fuu<lrmcntal. ya crc constitrrye el nexo
le cornuniclcin entre las teoras dc Ia probabiliclad y la cstac-lstica.

Teorema (del Lmite Central) Sean Xt, X2, .. ., X,,, n r'rriables aleatorias independientes,
,listribuidas con media t y varianzd 02, y que signen una ley de probabilidad cualquiera -no nece-
sariamente la misma-. Se forma Ia variable suma

Y:Xt]-Xz-+..-tX,,,
que tiene esperauza E(Y) varianza Var(Y) : no2. Entonces, la distribucin de la variable
aleatoria
Y -E(Y) Y -np
Jv*@ o{n
riende hacia una ley de distribucin normal estndar, cuando n tiende al infinito.

ii teorema implica que si n es grande, se puede aproximar las probabilidades de Y utilizando que

pr(y r) : pr (t * (T#)
=';#) = ,

.: la que Z es una variable aleatoria normal estndar.


:" Ia prctica, se asume que la aproximacin es buena si n ) 25.

-
= formulacin de este teorema es, en su forma ms elemental, debida a P. S. Laplace y fue demostrado
:--a-rlrosamente, en primer lugar, por Liapunov en 1901.

Ejemplos

-. Sean X1, Xz, ..., X1o, cincuenta variables aleatorias independientes que siguen la ley

r 0 1 2
Pr(X : r) rl8 3i8 t/2

Calcule la probabilidad Pr (Xr + Xz + .. . * Xso > 70).

Solucin: La esperanza y la varianza de las variables aleatorias son

E(X):
+, Var(X,) : #
Entonces, si Y : Xt * Xz*.'. *X0,
E(v) : 50x+:T,
Var(Y) :
31 775
bux6a:E'
I irl l'tittt it:ri,'.s fij.,l tilttt it;cs rlc l't,!.ltilitl;t'l

I'ri) i{) i

l-,1'

l-l t'osto rlitti,r rlc orcliu llll iullrltis lir,tl,) rurt'rrsto li.irr r[t: ]J0,l,rlalcs v rrn \alol \'uirl]le rlcl 30:.-
rlr: los ittgl'r's<ls. EI itrglt'so lier<'r ttrr,lisl Iilrrrr i,ilr unilr,r nrc t'r1r'r:5r0 l'250 dlales. a) Cirlt:rr1;r:
la rr,rltr,lrili,la,l rle (luc ('l ('()sto ([r: <lret.;rL rur :rrt()l)ris. rlruarrtr,S[ <lias. sllpele los 2500 cllares
lr) ;.C'rrrrtos rls rle ort'ta<:irirr s<:r'tr no('('s;uios r;tt;r (,lll(\ (()lr llrrir l)tol)l)ilidad cle 0.95. cl c()st,-
,li,,rlrct';u:ir'll sea .lo it,l Irrclr()s 2.li() d<'larcs.'

.j,,lut:ittt: l)r.filtltu,'s l;ts sigrtir,ltlls \':lt';rl,lcs;rlr':rlorrrs:

-\ : ltr;rt'so rli;rtir r rol r )l)('t;r( irlrr .lt:l rutol)rij: .\' - /i;(). 2;01 .

('' f'..1,r !i;rl i,,,lt',,)t 't ;t,'iritr,lr,l ;rrl,rlris: C..' : .i0 : 0.:1.\.
Sr: t it'trt' rttc

l-tti,,!tt,'..

E(C:, :,ll -- l).J :< 150 = iir.


Vrrr(Cl;) ((l .t)r ;< :'r:l:3:J.:J:J : .jlll l.

ii
;t) Slrr l' : I l',. r'l r'rtsl,r r[t,olrt'l:tci,ilr trr,.tisrrrl ilcl ittol)tis. l:,rttctrrccs,
r=l

Pr'()'>2j00) = i- 1500 - 31 x 75 - o (r.815)


\/300\,67
= l- 0.964S : 0.0352.

lr) Sctr U cl costo dt: ort'r';t<'irirr eu rr rls: r:rtorr('es. ll valirlrk: rleatotia

z:ry_^/(o,t).
t/300{u,

.5r: rL,l,r'rlllr,r rrirrr,r'eI r,;rlot rlc lr. tal (llrc [)l(.i > 2350) :0.95:

|,t({'>.]:l..-l(l)=i,,(z'ffi):'_*(,loo#'',):o.n'.
I'l'I;tttlrl.
3i(l - i l
yf.rt)tttT = -1'645'
i, 'r. rlsrrltil rlil(, ,r : .f:l ;:j. Ls rktcir'. sr: lrcfirsiti\Il 34 clrs.
4.77. El teoretna del Lrnite Central 153

til de uu componertte elcctr'uico se clistribuye exporencirlrnente con rnedia


StLportga qr.re la vicla
dc 100 iror'rs. Apenas falla un cornponcrite, sc Io rcemplzrza con otro par:a contiulral'cl trtrbajo.
a) Caicular' la plobabiliclrcl c]e cre clurarrrte 210 clas sc necesiterr ms cle 36 cle esos cou]poncltes;
b) CLrntos de estos cornponeutes se necesitan para (lue duren al menos 4600 holas, con Llna
probabilidad dei 99 %?
Soluci,n: Definamos las siguientes variables aleatorias:
X: <<Duracindeloscomponenteselectrnicos>>; X-t(llI00) yE(X) :o(X):100.
Y,r: <Tiempo total de duracin de n componentes>>; Yr: i Xo.
,i:L

a) Se necesitan ms de 36 componentes durante 210 das, si la vida til es menor a 5040 horas
(210 das por 24 horas). De manera que

too) :
Pr(Y36 < bo4o) = r Itot,==tuj
\ 100y'36
a Q'4)
: 0.9918.

b) Se debe encontrar n tal que P.(% > 4600) :0.99, luego

Pr(Y-< 4600) = r (ffi) : o.ot.

Luego,
4600 - 100n
: -2.33

Lasolucindelaecuacirresn:64.5;esdecir,65componerrtes.<

-{proximacin de la ley binomial por la normal

l.n caso particular del Teorema del


Lmite Central -conocido como teorema de Moivre-Laplace-, se
::esenta cuando todas las variables X son independientes, idnticamente distribuidas segn una ley
:t Bernoulli con parmetro p. Como sabemos, la variable

,:j*, i=l

a.e una distribucin Bin(n,p), con media np y varianza npq) corr Q : I - p. Por el Teorema del
- -:cite
Central, la variable
Z_ Y-np
J"w
ii:re apl'oximadamente una ley normal estndar, cuando n es suficientemente grande; es decir,

pr()'<) :pr (ttffi) =r (ffi)


:r la Figura 4.5 se muestra los valores de Ia distribucin binomial para n : 20 y p : 0.5. Para
:s:a distribucin, p:np:20x 0.5: I0y o2: np(l-p):20 x 0.5 x 0.5:5. Sobrepuestaa
; listribtrcin binomial se encueltra una distribucin normal con media F : !0 y varianza o2 : 5.
l'-ramos qne la curva de la normal se aproxima mucho al histograrna de la binomial.
r54 Captulo 4. Principales Distribuciones de Probabilidad

Figura 4.5: Aproximacin de la ley binomial por la ley normal.

En la siguiente tabla se presenta una relacin entre los parmetros n y p para que la aproximacin
normal a la ley binomial sea vlidaa.

p n requerido p n requerido
0+ 22t 0.25 74
0.01 214 0.30 51
0.05 188 0.35 32
0.10 757 0.40 16
0.15 728 0.45 13
0.20 100 0.50 13

pq
Otro criterio para escoger n es que el intervalo (o ,Pl2 T)
\ -
Z se encuentre completament
n
dentro del intervalo (0, 1).

Ejemplo. La Superitendencia de Bancos cree que el 32% de los crditos al sector agrcola estn e-
mora. En un estudio se tomo una muestrade2T0 crditos a la agricultura. a) Hallar la probabilida-
de que ms de 80 de ellos estn en mora; b) Cul es la probabilidad de que exactamente 95 cliente.
estn en mora?

Solucin: Sea X el nmero de clientes con crditos en mora; X - Bin(270,0.32).

a) La probabilidad de que ms de 80 clientes estn en mora es

270
pr(X > 80) : pr(x > 81) :
I
/r:81
clro(0.32k10.68270-k,

cuyo clculo puede ser muy complicado. Aplicando la aproximacin de la ley normal a la l.n
binomial, se tiene

p : np :270x 0.32 : 86.4, o : \MA :1mV 068 : 7.665.

Luego,

pr(x>80): ,,(t' *q-#) =r-*(tt#3-)


: 1-0.2033:0.7967.
aUna amplia discusin del tema se encuentra en
Samuels, M. y Lu, T.-F.C. (1992), "sample Size Requirements f
the Back-of-the-Envelope Binomial Confidence Interval," The Americon Statistician, 46, 228-23L, de Ia cual se extre!il
la tabla.
4.72. Ejercicios 155

b) La probabilidad buscada es Pr(X : 95) : C8?0(0.32)e5(0.68)270-e5


Si emplearnos el teorelna de Moivre-Laplace, resulta:

pr(X :9b) : pr(94.b < x < 95.b) =o 195!:96a)


\ 7.665 )
: 0.8829 - 0.8554 :0.0275.
Como se observa, la diferencia entre el valor exacto y el aproximado es mnima.

1.L2. Ejercicios
1. En una caja se empacan 100 latas de conservas. Segn los datos de la fbrica, cada lata tiene
un peso promedio de 1 oz con desviacin estndar de 0.1 oz. Cul es la probabilidad de que
una caja pese ms de I02 oz?

Un borracho camina de forma aleatoria de la siguiente forma: cada minuto da un paso hacia
adelante o hacia atrs con igual probabilidad y con independencia de los pasos anteriores. Cada
paso es de 50 cm. Calcule la probabilidad de que en una hora avance ms de 5 metros.

.). Los clientes de cierto banco efectan depsitos con media 157.92 dlares y desviacin estndar
30.20 dlares. Aparte de sto no se sabe nada ms acerca de Ia distribucin de estos depsitos.
Como parte de un estudio, se eligieron aI azar e independientemente 75 depsitos. Cul es la
probabilidad de que la suma de estos 75 depsitos sea 12 750 dlares o mayor?

Los vehculos que cruzan un puente tienen pesos cuya media es de 4675 kg y cuya desviacin
estndar es de 345 kg. Si hay 40 vehculos sobre el puente en un instante dado, halla.r el nmero
o tal que la probabilidad (aproximada) de que su peso total no supere a o sea del 99 %.

La empresa Rapid Express enva paquetes de distintos pesos, con una media de 1.5 kg y una
desviacin estndar de 1.0 kg. Teniendo en cuenta que los paquetes provienen de una gran
cantidad de clientes diferentes, es razonable modelizar sus pesos como variables aleatorias inde-
pendientes. Calcule la probabilidad de que el peso total de 100 paquetes exceda de 170 kg.

6. El propietario de una copiadora ha determinado que el nmero diario de copias que se realizan
en su local tiene una media de 1250 con una desviacin estndar de 350. Halle Ia probabilidad
de que en un mes de trabajo (25 dfas) el total de copias:

a) sea menor a 30 000;


b) se encuentre entre 25000 y 32000.

7 Una radiloga que trabaja en el servicio de traumatologa de un hospital ha comprobado que el


tiempo, en minutos, que tarda en atender a cada paciente es una variable aleatoria con media
7 y desviacin estndar 2. Durante su jornada laboral trabaja 6 horas atendiendo pacientes
sucesivamente y sin interrupcin. Calcule, aproximadamente, la probabilidad de que durante un
dla pueda atender hasta 55 pacientes dentro del horario de su jornada laboral. Se supone que
todos los pacientes estn en la consulta con suficiente antelacin y que no hay <<tiempos vacos>>
entre dos pacientes consecutivos.

8 La resistencia de un hilo metlico es una variable aleatoria cuya media es 3 kg y su desviacin


estndar 1 kg. Suponiendo que la resistencia de un cable es igual a la suma de las resistencias
nr de los hilos que lo forman.

a) Calcule la probabilidad de que un cable de 100 hilos sostenga 280 kg;


156 Captulo 4. Principales Distribuciones de Probabilidad

b) Cultos hilos se rrecesital pala qr-re el cable sosterrga 300 kg corr urr gg% cle seguriclrci/

9. Utr jugador de baloncesto encesta urr lanzrrniento de 3 puntos con plobal,'ilidacl 0.3.

a) Aproxime la distribucin del nirmero cle canastas corrseguidas ert 25 lanzamientos;


b) Calcule Ia probabilidad de encestar ms de 10 canastas.

10 En promedio, de las personas que ingresan a una librera solo el 25o/o realiza una compla. Si
en un da entraron 80 clientes, calcule Ia probabilidad aproximada de que se hagan al menos 28
cornpras.

11. Se ha encontrado que el 70% de las personas que entran en un centro comercial lealizan cuando
menos una compra. Para una muestra de 50 personas,

a) cul es Ia probabilidad de que cuando menos 40 de ellas realicen una ms compras?;


b) cul es la probabilidad de que menos de 30 de entre 50 personas muestreadas realicen
cuando menos una compra?

12 En una fabrica microcircuitos se ha comprobado que el 4% de estos son defectuosos. Un cliente


compra un paquete de 500 microcircuitos procedentes de la fbrica. Determine:

a) el nmero esperado de microcircuitos no defectuososl


b) la probabilidad de que se encuentre ms de 25 microcircuitos defectuosos;
c) la probabilidad de que el nmero de microcircuitos defectuosos est entre 16 y 30.

13. Se conoce, por estudios previos, que Ia proporcin de vacas que enfer-marn despus de su-
ministrarles la vacuna contra la fiebre aftosa es del 2To. Una granja tiene 600 vacas qtre sor
vacunadas. Determine:

a) el nmero esperado de animales que no enfermarn;


b) Ia probabilidad de que el nirmeio de reses que enferman sea) como mximo, 17;
c) la probabilidad de que el nmero de reses que no enferman seaT como mnimo, 590.
t4. Un zologo estudia cierta especie de ratones de campo. Para ello captura ejemplares de una
poblacin grande en la que el porcentaje de dicha especie es 100p.

a) Si p :0.3, halle la probabilidad de que en 6 ejemplares capturados haya al menos 2 de lo.


que le interesan;
b) Si p : 0.05, calcule la probabilidad de que en 200 haya exactamente 6 de los que le interesan:
c) Si p :0.4, calcule la probabilidad de que en 200 haya entre 75 y 110 de Ios que le interesan

15. Sea ^9a5


el nmero de fracasos que preceden al 45" xito en un proceso de Bernoulli con proba-
bilidad de xito P : 0.36. Sea ,5a5 : Xr * ' ' '* Xu, donde X1 representa el nmero de fracaso.
que preceden al primer xito, X2 es el nmero de fracasos entre el primer y el segundo xito. r
as sucesivamente. Las X son independientes.

a) D el nombre de la distribucin de una rnica X, obtenga tambin su media y su varianzar


b) Cul es el valor esperado y la varianza de ,9a5?;
c) Aproxime la probabilidad de que Sa5 est a una distancia no superior a 20 de su uredia.
Captulo 5

Distribuciones Multidimensionales de
Probabldad

EI supuesto errneo de que la correlacin irnplica causalidad es probablemente


uno de los dos o tres errores m,s serios g conlunes del pensam'iento humano
Stephen Jay Gould

;-, muchos casos) un fenmeno aleatorio no depende de una sola variable, sino de dos o mi; por
- =:rplo, algo tan simple como el tiempo que empleamos en trasladarnos desde la casa a la universidad
l':!e61s, entre otras cosas, de Ia velocidad media del carro y del nmero de veces que nos detengamos
: -: los semforos en luz roja. Es decir, el resultado en la prueba descrita depende de, al menos, dos
--=:l ables aleatorias.

;- .o que sigue, trataremos con conjuntos de varias variables aleatorias que se manifiestan simultnea-
- --te en un fenmeno y determinaremos si ellas estn o no relacionadas. Para simplificar la exposicin,
-jzaremos eI caso bivariante ya que Ia generalizacin a ms variables es inmediata.

Variables aleatorias bidimensionales

fefinicin (de variable aleatoria bidimensional) Sean X y Y dos variables aleatorias unidi-
-=:rsionales deflnidas sobre un mismo espacio muestral f,); entonces, la funcin

RxR
r_F
-+
LD r------ (X (r) ,y (r)),
-'--,de w es un evento elemental, es una variable aleatoria bidimensional.

\,-rtacin. ParareferirnosalosoQtalesque X(u):ayY(w):b,simplernenteloharemoscomo


l: cL,Y :b y a Ia probabiidad de este suceso corno Pr(X : a,Y :b).
-e -,rrma anlogase definen y notan las probabilidades Pr(X < a,Y 1 b) y Pr(a < X < c,b <Y < d).
,LJ I
158 Captulo 5. Distribuciones Multidimensionales

5.1.1. Variables bidirnensionales discretas


Definicin (de variable aleatoria bidirrrensional discreta) Sean X y I/ clos rrrlialrlcs rlcrtorirs
tlis<:r'etrs. La fur,cil dc 1-nobrrbilidaci conjrrrrta de X y Y est clacla por

f @,a): Pr'(x : r,Y : Y)'

A Ia variable aleatoria (X,Y) se le denomina bidimensional discreta.

Sea? : {(r, eFr2l @,y) > 0}; es decir, el conjunto de puntos con probabilictad positiva, es finito
o infinito numerable y se cumple que

I
(x,v)eT
f (r,a) : L.

Supongamos quezl, 12...y At,Uzr... son los valores posibles deX y Y, respectivamente, ysea

Pt :Pt(X : ri,Y : Ai)'

La probabilidad del evento (X,Y) .E es igual a la suma de todos los p para los cuales (r,y) E:

Pr[(X,Y)eE): t Pr(X:ri,Y:yj): t p,j.


(t,v)eE (r4,y)eE

Definicin (de funcin de distribucin conjunta) La funcin de distribucin conjunta de la


variable aleatoria bidimensional (X, Y) se define por

F(*,: Pr(X I r,Y < a) : | | nti


r1r y1y

La funcin de distribucin conjunta cumple qrru


,IToo rfT."
F(r,a) : 0 y q"e
,lgg rlIg
(", u) : r.

A partir de las p,; se pueden encontrar las funciones de distribucin de X y de Y.

Definicin (de funcin de probabilidad marginal) Las funciones de probabilidad marginal


deX y de Y estn dadas por las frmulas

fx(r) : i"r," :r,y:uj) :DPo'


j:r j:r
@ oo

fy@) : f erlX:r,y:aj) :DPn'


i:l i:L

Las fnnciones de distribucin marginal Fx y Fv se calculan por

Fx(t): t Drnt y Fy(t) : llnt


x,4t j:l A<t i:I

Observacin. Si los espacios muestrales son finitos, las series deben reemplazar,je por sumas finita-s
5.7. Variables aleatorias bidimensionales 159

,l'on rq,1161 cle r'rriallcs ak:torias bicliurcnsiouales se ruecle clal uut defrrricin cle iuclependerrcitr e<1tti-
"rlerrtc r lr autetiot'trlclttc clrclir:

Definicin (de iudependencia) Lrs vrlirbles rleatolias clis<:r'clt,rs X y Y son inclepenclientes si


Pr'(X : r.Y : y) :Pt'(X : z) x Pr(Y : 9;.

Ejemplos

1. Determine el valor de k para que la funcin

f @,A) - krA, para r : !,2,3; A :1,2,3,


pueda servir como una funcin conjunta de probabilidad.
Solucin: Sustituyendo los valores de z y de y, encontramos que:

/(t, t : , f (I,2) :2t, /(1,3) : 3P,


f (2,t) :2t, (2,27 :4, f (2,3) :6t,
(3, t : 3, f (3,2) :6, ,f (3, a) : 9.
"f

Para que / sea una funcin de probabilidad, la suma de todos los trminos que acabamos de
calcular deben dar 1; es decir,

k +2k+ 3k + 2k + 4k + 6k + 3k + 6k* 94. : 1.

Resolviendo esta ecuacin, resulta que /c : :


36
Pongamos en una tabla la funcin de probabilidad resultante:

X
Y I 2 3
1 r/36 2136 3136
2 2136 4136 6136
3 3136 6136 e136

2. Las probabilidades de la distribucin conjunta de las variables aleatorias S y T se dan por

s
T -1 0 1

-1 r/8 r/t2 7124


1 5124 116 Llg

La interseccin de las filas y Ias columnas da la probabilidaA p : Pr(S : i,T : j) (i : -I,


0,l; j - -1, t). u) Calcular Pr(S I 0.5, ? a 0.9); b) Hallar las leyes de las variables aleatorias
svT.
Solucin:

a) De acuerdo a la frmula de la funcin de distribucin conjunta de ^S


y ?:

F(s, ) : Pr(^9 1 s,,T < t) :lln,i


i<s j<t
160 Capitulo 5. Distribuciones Multidirnensionales

Entonces,

F(0.b,0.3) : I tPr(^9:i,T:
j<0,3
<0.5
: Pr(S : -l,T - -1) + Pr(S :0,7 - -1)
: 115
8-12:i4'
b) Por la frmula de la funcin de probabilidad marginal tenemos: f s(i) : ! Pr(S : 'i.,7 : j):
J
por lo que

/s(-t) : Pr(.9: -7,7- -1) +Pr(S- -1,7 :l)


151 I

B' 24 3'
/s(o) : Pr(,s: 0,7 :-1)+Pr(S:0,?: 1)
111 I

12' 6 4'
/s(t) : Pr(S : l,T :-1) +Pr(,$: I,T :I)
7r5
: %- E: 12'
De manera anloga, se obtiene la ley de ?:

/r(-t) : Pr(^9: -l,T: -1) +Pr(^9:0,7: -1) +Pr(^9:1,7: -1)


1171 ll

8-12-24-t
fr!) : Pr(.9 : -1,7 :1) + Pr(S :0,7: 1) f Pr(^9 : 7,7 :1)
: 24-
5 *1*1:1
6- 8- t'
Entonces, las variables aleatorias S y T siguen las leyes:

-1 01 T l-r 1

Pr(T: j) I rl2 rl2

5.L.2. Variables bidimensionales continuas


Definicin (de variable aleatoria bidimensional continua) Sean X y Y dos variables aleato-
rias continuas, a la variable aleatoria (X,Y) se le denomina bidimensional continua si para cualquier
punto (r,a) < R2 se cumple
Pr(X : T,Y :9) :0.

A la variable aleatoria (X,Y) est asociada una funcin no negativa /, denominada fu,ncin, de densida,:
conjunta, que cumple con Ias siguierrtes propiedades:

1. f (", es no negativa; es decir, V(z,g) e R', f @, >_ 0.

2. .J_-.l_*" ' " d,y d.r :


[* l'* I@,y) t.

3. La probabilidad del evento ,r(X,Y) -B>> se calcula mediante

Pr[(X, Y) e E]: f @,a) d,y d,r


l.l
E
5.7. Variables aleatorias bidrnensionales 161

Definicin (de funcin de distribucin conjunta) La ftrncin de clistribucitt corr.juntr de la


.-riable aleatoria lidinrerrsioral (X. Y) sc clefine por

F(r.y): Pr'(X 1.r.Y < s) : (tLd's'


l_*rr',t)
:1.
,IToorIT." F(r,y): ,ULJIL F(r,u)
-. funcin de clistribncin conjr,Lnta curnple q.l" 0 y que

-. funcin de densidad conjunta puede obtenerse a partir de la funcin de distribucin mediante

tI4
.l \&r Y
,
'tl J --
o2 F(r,y)
- or oa

-.i E : [a, b] x lc,d),la probabilidad del evento (X,Y) E es igual a

db
Pr(a<X<b,c<Y< o): @,y)d,rdy: J ,o,fid,rd,y
Il"f I

Definicin (de funcin de densidad marginal) Las funciones de densidad marginal de las
-.-ariables aleatorias X y Y estn dadas, respectivamente, por las relaciones

/'oo f
fx@):l .l
l@,a)da v fv(a):l,l f@,a)tu.
-a -*

-\ partir de stas, se calculan las funciones de distribucin marginal Fy y Fy:

toooo
Fx(t):
I f@,y)dyd.r y Fy(t):
I If@,s)d,rd,y
"[

lon este tipo de variables aleatorias tambin se puede reformular la definicin de independencia.

Definicin (de independencia) Las variables aleatorias continuas X y Y son independientes si


rara todo par de valores (",a) e R2 se cumple

F(r, : Fx(r) Fv(a),


r equivalentemente,
f (r,v) : f x(r) fv(v).

Ejemplos

1. Un crculo de radio o est inscrito dentro de un cuadrado cuyo lado tiene una longitud de 2a
(vase Ia Figura 5.1). Se supone que Ia probabilidad de que un daldo arrojado hacia el cuadrado
es idntica para cualquier punto. a) Calcular la probabilidad de que el dardo impacte dentro
del crculo; b) Encontrar las leyes marginales de X y de Y.
L62 Captulo 5. Distribuciones Multidirnensionales

Solucin:

a) La probabilidad de impacto esta definida por la densidad

f xv(r,o) : { *"'' si (r'a) e l-o'o) x l-a'a);


[ 0, si (r,a) (,1-o,o] x l-a,a).
La probabilidad de impacto dentro del crculo *2 + y2 -- a2 se calcula como

Pr(x2 +Y2 < o2): f @,a)d,rdy:#:;


ll
,2y2-q2
b) Por simetra, las funciones de densidad de X y de Y son idnticas; calculemos la de X:

f x(d : l'" L *'r:


_o 4az
:,
2a'
r e l-a,a).
J

2. Dada la funcin de densidad conjunta de Ia variable aleatoria bidimensional (X, Y)


(t
si r ) L'Y'- li
fxv(r, : I r\2'
I O, caso contrario.

Determinar: a) las funciones de densidad marginal de cada una de las variables; b) la funcin de
distribucin asociada.
Solucin:

a) Las funciones de densidad marginal son

f x(r) : [*t f *r(r,y)


J
da : .lt[* + :
rU' ay 4.
fv(a) : lr* *rlr,e)
dr :
lr* h o, :
i.
Adicionalmente, podemos deducir que las variables aleatorias son independientes.
b) La funcin de distribucin es

F(*,y) : .lr' Ir"


,*r(s, )ds or:
Ir' Ir" * oro,

: (#) (")
Consecuentemente, la funcin de distribucin queda como

f (t-Xt-v).
Fxv(x,y)={ ra ' sir)1, y2L;
I O, caso contrario.
5.2. Dstribucin condicionada 163

5.2. Distribucin condicionada

Definicin (de probabilidad condicionada) Sean a y b dos nmeros reales cualesquier a y X


y Y dos variables aleatorias de manera que Pr(Y < b) + 0. La probabilidad condicionada de que
X 1 a, dado que Y < b, se representa mediante Pr(X < alY < b), y se defi.ne mediante la igualdad

: Pr(X < a,Y <b)


Pr(X < alY < b)
Pr(Y < b)

r Para variables aleatorias discretas, Ia probabilidad condicionada de r, para un valor fijo de la


variable y, est dada por

: : at : u)
Pr(X rlY
' ,, -P'(I:^!'Y
Pr(Y:Y
.

. Para variables aleatorias continuas, la funcin de densidad condicionada de r, para un valor fijo
de la variable g, se calcula por

f @la) : f
,@)',) .
TY\A )

Como fv(a) :
l*_rr",a)
d,r : l_ f (al")f x@) dr; entonces,
I
f (alr)f x(")
f(,(rga) f@1

J
I f (al")f x@) dr
-'x
que puede interpretarse como el teorema de Bayes para funciones de densidad.

Ejemplos

1. (Continuacin) Un vector aleatorio bidimensional sigue la ley:


X
Y 1 2 3
1 1136 2/36 3/36
2 2136 4136 6136
3 3/36 6136 s/36
Hallar la distribucin condicionada de X cuando Y :2"
Solucin: Ladistribucinmarginalde)- e
Y I t 2 3

La distribucin condicionada de X cuando Y :2 ser:


2

Pr(X : LIY :2) : - 36:1


1 - 6'
3
4
: :2 : Pr(X : 2,Y :2) 1
Pr(X 2lY -361
Pr(Y :2) 3'
3
6

Pr(X :3lY :2) : Pr(X :3,Y :2) : -AO.


1

Pr(Y: 2) 1 2'
5
164 Captulo 5. Distbuciones Multidimensionales

2. La 1ey de densidad conjurrta de una variable aieatoria bidirnensional (X, Y) es

, f 2, si0(r1).,0<y<r,rly<r;
r'\r \ /: I .0,
"fxr'(r,ll) L casoconl,r'ario.

Hallar la ley de distribucin condicional de Y cuando : 20.

Soht,c'in: Se tiene que

dr :2(I _ y).

La distribucin condi

f@lao) , Para0(rlr-ao;
caso contrario.

5.3. Esperanza y co\arianza de una rariable aleatoria bidimensional

Al igual que en el caso de las variables aleatorias unidimensionales, en las bidimensionales es posible
calcular la esperanza y la varianza, previa la realizacin de una transformacin de variables.

Definicin (de esperanza) Sean (X, Y) un vector aleatorio bidimensional y g(r,y) una funcin
real

g iPt2 --J R
@,a) g(r,a).
'-
1. Si (X,Y) es un vector aleatorio discreto, cuya funcin de probabilidad es /(z,g), entonces

E(g(X, Y)): ttri s(ri,yj) f (*,a): tD,s@,,a)p.


aj ri yj

2. Si (X,Y) es un vector aleatorio continuo, cuya funcin de densidad conjunta es /(r, A), en-
tonces
E(g(x,Y)) : r@,a)d,vd,r
l:l:s@,a)
Observemos que si XyY son independientes, se deduce que

als@)n( )l : E[g(x)]Eth(Y)1.

Para las variables aleatorias bidimensionales se tiene una medida estadstica nueva, ia covarianza) que
permite evaluar la relacin entre Ias variables aleatorias X y Y.

Definicin (de covarianza) Sean X y Y dos variables aleatorias, Ia covarianza entre XyY se
calcula por
Cov(x, Y) : E[(x - E(x))(Y - E(Y))].

Equivalentemente, la covarianza se puede calcular como Cov( X,Y) : E(XY) - E(X)E(y).


Propiedades. (Solo se demostrar una de ellas, se recomienda al lector verificar las restantes)
5.3. Esperanza .y covarranza 165

1. Cor'(-X. )') - Cor-()', I).


2. Cor'(X,,{) : VaL(X).
jJ. Si rt v (2 sorr dos colrstaltcs Positiv:rs, cutouccs

Cor'(a1X1 : o,t Cov(X1,l') * a,2Cov(X2.\/),


I^:?,Yr,\')
1. Si 1rs r'rriables aleatorirs son independientes, Ia covaliarrza entre elias es igual a cero.
En cfc<;to,

Cov(x,Y) :E(xY) - E(X)E(Y) : E(x)E(v) - E(x)E(v) : 0.

lCov(X,}/)l < 1/Yar(X ) Var (Y)

-\ contirmacin, se deduce una expresin para la varianza de la suma de dos variables aleatorias
'.ralesquiera.

Var(X +Y) : E(x+Y)' -[e(X+Y)]2


: E(X') + E(v2) + 2E(XY) - [E2(x) + E2(v) + 2E(x)E(v)]
: [E(x') - E'(x)] + [E(y2) - E'(v)l + 2[E(xv) - E(x)E(v)]
: Var(X) +Var(Y) *2Cov(X, Y).
.is. partr dos variables aleatorirs cualescluiera se tiene que

Var(X + y) : Var(X) + VaL(Y) * 2Cor'(X, Y).

le ruarrcrr sinrilar', la 'n'arianza del producto de dos varialles alertorirs X y l' es

var'(Xl') : pf..Var(X) + pk|X)Var(Y) t2tyt.,..Cor,(X, Y) +2prD [," - /-x)(l'- tr.)']

[t" - rtt) (X - ui')+ 2E i(x - ttx)2 (\' - r,t-t2] - [co"{ x,Y))2


-t2r.,-E ,

--,trde r_y: E(X) y Fv: E()').


-',.-,n la covarianzay Ia varianza se define el coeficiente de correlacin, que es una medida
base en de
- dependencia entre las variables aleatorias X y Y.
Definicin (de coeficiente de correlacin) Sean X y Y clos variables el coeficiente
r: colrelacin entre X y Y se calcula por

p(x,v : Cov(X, Y)

Fropiedades. (Se lecoinienda que el lectol verifique algunzr cle cllirs)

-. p(x,\') : p(\" X).


l. El r,'rlol clel cocficieute cle con'elciu varr entre -1 .y 1; cs clecir', -l < p(X,y) < 1.

-r. Si )' st: cxprcsa lincrlnrenbe err funcin de X, pol Y : a,X f , donde cr, y b son dos constantes,
crltorICCS lf(X )-)l : f .
166 Captulo 5. Distribuciones Multidirnensionales

4. si lp(X,Y)l :1, errtottces cxiste clePeudc:ncia lirreal entlc X y Y-.

5. si X ), \' sorr vr'iablcs rlcrtolir.s irrcleP<tnrlicntes, entou<;us p(X,l') :0.

Observacin. Se debc tener en cucnta cre si clos rraliables aleatolias sorr independientes, cntoncc.
son no correlacrionadas; pero la afirmacin rccrroca no es correcta; es decir', si dos variables aletoriar.
no estn <rorrelacionadas, uo son obligatoriamente inclependientes.

Ejemplos

1. Las variables aleatorias ,S y 7 tienen funcin de probabilidad conjunta dada por


s
T -1 0 1

-1 r/8 r/12 7 /24


1 5124 116 rl8
Calcular: a) las esperanzas y las varianzas de S y de T; b) el coeficiente de correlacin.
Solucin:

a) Anteriormente habamos calculado las leyes marginales de ^9 y de ?, que son:

s l-r 0 1
-1 1

Sus correspondientes esperanzas son

E(s): ,-', () * ror (i) *


E(s2) : (-t)' (i) * (o)' (i)
E(") : (-') (;) * (') (;) :
E(r\ : (-')' (;) * (')'(;) _1 I.
-

En consecuencia,

Var(s) : E(^9') -E'(s) :#-(+)' :H,


Var(") : E(T') -E'g)- 1 -02 : 1.

b) Calculemos, en prirner lugar, la covarianza entre S y T, para ello determinemos E(^9?):

E(S") : ftiip(i,i) (i:-r,0,1; ,:-t,t)


?,J

: (-1)(-1)(*) . (-1)(,) (;u) . (o)(-') (#)


+(0)(,) () . (1)(-1) (h)* ('x') (*)

:
157t1
8 24 24'8 --I
4'
5.3. Esperanza y covarianza 1.67

Por Io tiurt,o,

Cov(S',7) : E(sr) - E(S)E( T) : _'i_ ( ;) (o) :-1


Con toCo esto.

Cov(.S,7)
p(s,ll) :

-+:
-?
-0.29.
(i#) .'
t/toz

2. La funcin de densidad conjunta de las variables aleatorias S y T est definida por

I
/ Y), : 12, si0(r.-I,0<y<!,r*a<L;
txv\r,
t o, caso contrario.
Hallar la correlacin entre X y Y.
Soluci,n: Anteriormente determinamos que

f x(") :2(I - r) y fv(y) :2(t - a).


Sus esperanzas y varianzas son

E(x) :E(Y) :* y Var(X) :vur(Y):*


Tambin,

E(xY) : 2ry d"y d,r : n1

lo' .[ot-'
Entonces,
: 111
Cov(X, Y) E(XY) - E(X)E (n : + - 3"3- 36
De manera que

Cov(^9, T)
P(S,T) : 1

2'

Notemos que estas dos variables no son independientes.

Determine la correlacin entre las variables aleatorias X y Y, cuya densidad conjunta es

x,y. (r, : L2"ffie


-L"-G'2 \-'o -2RLa) / QQ- ,
+u2 R2D .@<r<oo, m(g(m,

donde lRl < 1 (a esta ley se le denomina normal biuariante).


Solucin: Calculemos Ias funciones de densidad de cada una de las variables aleatorias.

: l: -u2/2 l'* dr.


2n 1ffi" J-*""-@-no)2/eG-R2D
168 Captulo 5. Distribuciones MultidimensionaJes

IJrr:irtrrrLo :-. ll Lt
: t' r/,r' - ,/ t - ll.2dz. crtcotttrarLtrs:
,/ t tt: -
I .'tt..2t:., / - .: /, , 7 ,,.,.tz.
l-./,,\-
) tt t I Ct/-,la:-, t :t -)O<r< \.
't ' - )tT' .l -^ rf-'l-

AniiLogarrrente, se clcteluritirqrrc./tt) : j:e 'tt12, -co < r < oe.


v !7t
A p;rltir <[e sto, es ficil I'ctificar que E(X) : E(y) :0 y que Var(X) : Var(]') :1
Encorttlerrros la cor'rlirttzr:

Y) : E(Xi') - :
Cor'(X. E(X)E(Y)
l:l:rurxv (r,y) rlr d'y - 0

=
h'[- o"-o'''(l: J';I _H 1
- r- Ry)2 I Q(1-R2)) ar\ y.
/
La integral interior es igual a Ry; por lo tanto,

Cov(X, \: ]-Jr; d,a: R.


.[*_r'"-t"/2
Con todo esto,
p(x,Y): Cov(X, Y)
: R :R.
vry"rEtrcn 1.1

5.4. Variables aleatorias multidimensionales

Los corrceptos descritos, r'liclos prrra variables aleatorirs biclirnensionales, se pneden generalizar r.
vcctorcs aleatorios de cnalcriel dimcnsirl; por lo tanto, solo vamos a exponer las definicioles d.
mrnerl r-esumida.

Definicin (de variable aleatoria multidimensional) Sobre un mismo espacio muestral l)


estn defrnidas lasl'ariables aleatorias Xt, Xz, ..., Xn, entonces, se dice q.ue Z :(Xt,Xz,...,Xn)
es un vector aleatorio o una variable aleatoria n-dimensional.

Si Xl , Xz, ..., X, son variables rleatorias discretas, el vector aleatorio Z es discreto y su funcin ci

r'obabilidad es
.fz(r, "',r,'.) : Pr(Xt : t7.'.,X,, : r,,).

Si Xl. ... ,X, son r'rriablcs rlcrlolias continttas, el vector aleatorio Z es cotttittuo y la probabilida.-
dcl cvento u(Xr, ...,X,,) e E C R">> se calcula por

PL[(X1,... , X,,) E] : I l' .[z(rt,...,r,,) d.r1...dr,,.


'.1.1""'
E

La frurcirr ./ se derrotnirta /crt,st]la,d, co'n,,jn,rtto, de X1 , Xz, .... X,.


La frrrrr:iu cle distlibrrcirr <lc. lr r'rrirlle aleatotia rnttltivat'iar:te Z esti definidtr por

F7(r:,.,.,0,,) :Pr(Xr ( zt.. ...X,, ( r,,).


5. 5. AIguna.'^ distr-i b rrciones rnultidilne-nsior?ales inrportantes 169

Lrs r.ilirlrlcs rlcrtolirs X1. X2, ..., X,, se llarll"rr ilclel-lctrrclicrrtes si

l''7(,:t, , ,iLt,,) : Ff (:t1) " '4x,, (2,,),


'

-, eqtrivzrlentcntertte,
J'z@,,.. . ):t:t) : .frr(tr) . .' [x,,(L:,,.).

Sea g urra fitncin clefinicla de R" err R, la espcrtrnza nrrtemticr cle tL(Xt,...,X,,), segrin l:r lc' [s
Z. sc calcrrla por

E((g(Xr, X2,....X,,)) :t tn g(rt,...,r,,)fz(rt,...,r,,,);


J:7

:rlando Z es discleta, y por

E((g(Xr ,X2,.. .,X,)) : -- ,r)f z(rt,.. . ,r,,) dr1 "'dr,,,,


.l Rn
.f O@r,

:uando Z es continua.

La covarianza entre dos componentes cualesquiera X, y Xrn deZes


Cov(X,, X,n) : e [( - E(&-))(X," - E(X"'))] : E(X,X, ) - E(X'.)E(X,,),

..i.rre tambin se la suele lotar colrro o,.?,r.

ii coeficiente de correlacin entre ellas es

Cot,(X,,., X,,r)
P(X,,X,n):
Var(X,.) Var(X,")
:.-

asocia su matriz de varianza-covar-ianza (o siurplernente

:-
*=

la

de eda como

5.5. Algunas distribuciones multidimensionales importantes


l.iigr,rtrl que en el caso unidinrcnsional, lrlr:sentrrlros lrs clistlibucliorres rnnlticlirnensionales cle rnayor
-'-poltancitr; ellzrs son: la multirrornirl, Itr uuifolrne y la nor-ntrl bir,rlirulc.
L70 Captulo 5. Distribuciones Multiditnensionales

5.5.1. Distribucin multinornial

Se dice que el vector aleatorio -k (Xt,...,X*)


k-dinensioual X sigue una distribucin rnultinomia-

de parmetros (n; pt,...,p), (dond" 0 1pu < 1, D p : 1), si


z:l

Pr(X : N) : Pr(X t : rlr. . ., Xt" : nk) : p'1",


*!-r.pT''''
k
para N : (u,...,n*), donde D no : r.
i:l
A un vector aleatorio X que sigue una ley multinomial se lo nota X - M(n;Pt, ... ,Px).

La esperanza, varianza y covarianza son, respectivamente, iguales a:

E(X) : n(h, "' ,Pk),


Var(X') : nPi(L-Pi), i:1,...,k,
Cov(X,X) : -npps, i,+ j.

La distribucin multinomial es la generalizacin multivariante de la distribucin binomial. La dis-


tribucin marginal de cada una de las componentes X es binomial de parmetros (n,p) y cualquier
distribucin condicionada es tambin multinomial.

Esta Iey de distribucin tiene aplicacin en el anlisis estadstico de datos cualitativos.

Ejemplo. En una empresa operadora de tarjetas de crdito se registr las causas para la renovacirr
de las tarjetas. Se estableci que 60 % es por prdida, el25'/o por vencimiento y el 15 To por deterioro
Un da se recibieron 28 solicitudes de renovacin de tarjetas. Evaluar la probabilidad de que 15 sean
por prdida, 7 por vencimiento y 6 por deterioro.

Solucin: Sean:

Xy : nmero de renovaciones por prdida,


X2 : nmero de renovaciones por vencimiento,
X3 : nmero de renovaciones por deterioro.

Se desea evaluar la probabilidad para nr :15, n2:7,r:,'s:6, (rt+rz-ln3:29'

:15,Xz:7,Xs:6) 151o.zs; 710.


Pr(X1
ffi
0.021.
to.u rs6

5.6.2. Distribucin uniforme


Un vector aleatorio X: (Xr, ...,Xn) tiene distribucin uniformeen S: [ot,br] x. ..xlan,b,r] C Rn
si la funcin de densidad de probabilidad "f("r,. .., r,,) es
5.6. Ejercicios 171.

Esta distribucin es el anlogo rnultiva,riante de la distribucirr uniforme. Las distlibuciones marginales


de las valiables aleatolias X (i:1,..,,ri) son uniformes con densidad
{1
si r lo'b);
.f*,(r) : I bo -
I o. ^' si "r'I lo,,b,].

5.5.3. Distribucin norrnal bivariante


Un vector aleatorio Z : (X, Y) tiene distribucin normal bivariante no degenerada si su funcin
densidad conjunta es
p)
r@, ;cfu."r{-^l%t _2p(, - t4@ -
oto2
(y - !2)21
---A-)J' \

donde p es el coeficiente de correlacin entre X y Y.

Figura 5.2: Funcin de densidad de la distribucin normal bivariante.

as leyes marginales de X y de Y son: X - N(pr,o?) Vy - N(pz,oZ).


En un ejernplo de la seccin anterior se calcul que el coefi.ciente de correlacin entre X y Y es p.
trxiste un mayor nmero de variables aleatorias multidimensionales, pero su tratamiento sale fuera del
j,rminio de esta obra.

5.6. Ejercicios
1. Si la funcin conjunta de probabilidad de X y Y est dada por
r*u
J lr,a) : -30=, para : 0, I,2,3; A :0,I,2.
Construya una tabla que muestre los valores de la funcin conjunta de probabilidad de las dos
variables aleatorias.
2. Las variables aleatorias ,9 y 7 tienen Ia funcin de probabilidad conjunta que se resume en la
siguiente tabla:
s
T 0 1 2
0 rlr2 Llg rl24
1 114 rl4 tl40
2 rl8 rl2o
3 r/20
Encuentre:
t72 Captulo 5. Distribttciones Multidimensionales

a) Pr(S' :1,7 :2); ci) 1'r(5 > ?);


lr) Pr(S:0. l<I<:J):
c) Pr(S *T <2): c) ias clistlilrucion<rs nralgirralcs cic ,9 ), <lc I

3. La funcin coljunta clc plobabiliclad cle X y Y est clacla por


l@,y) : c(:r2 + ?r2), prra t: -- -7,0, 1,3; !,/ : -r,2,3,
Encuentrc:

a) el valor de c; d) Pr(X >2-Y);


b) Pr(X :0,Y < 2);
c) Pr(X l,Y > 2); e) las distribuciones marginales de X y de l-.

4. La distribucin conjunta de las variables aleatorias X1y X2 es

X1
Xz 012
0 p p12 pl4
1 2p p pl2
2 4p 2pp
a) Halle el valor de p;
b) Halle las leyes marginales de X1 y de X2. Son independientes?;
c) Sean Y : Xt x X2, calcule la esperanza de Y.

5. Las variables aleatorias X y Y son independientes ente s y sns funciones de probabilidad son

z 0 1 2 .l 4 J
_V 0 t/z
Pr(X : Z) 03 0.2 0.1 0.15 0.25 Pr(Y :.i 0.25 0.67 0.08

Encuentre la funcin conjunta de probabilidad de (X,Y).

6. Dada la distribucin de probabilidad de una variable aleatoria bivariante discreta

x
Y -3 4 10
2 0.15 0.13 0.27
4 0.10 0.30 0.05
a) Halle las leyes de distribucin de X y de Y;
b) Calcule el coeficiente de correlacin cntrc X r,' }, .

7. Dada la distlibucin cle 1>robabilidacl clc uur variable aleatoria bidimcnsional cliscreta

X
Y l0 20 30 40
0 0.05 0.1.2 0.08 0.04
1 0.09 0.30 0. r1 0.21

a) Detcrmine las le1,ss . distribrrcin cle X y l';


b) Calcule el coeficiente cle corlelrciu r:ntre lrs r'rrirblcs alertorirs.
5.6. Ejercicios 173

3. Sc r:ousicl<trzr 1a sigtLictrtc f\urciri de plolrabili<1acl corrjrLrrta. rlc la,s r'rlirbles rlcrtotiLs XyY
1. , ,
./.\)'('lt: I ', Qr -,1. .i .r' {0 I 1.3}. // c {1.?.3}:
\ tt. (.;rO r.(rull.al.iu.

a) Hallar A; pala qne ./11' sea funcin dc probabiliclacl puutual conjrutta;


b) Halle lrs funciones clc pr:obabiliclad malginal cle X v clc )';
c;) X y )' son inclepenclientes'/ Justificlue 1a resprtesta;
c1) CalculePr(1 <X<3;2<Y <3) vPr(X+y<3).
9. Drcl la funcin de distribucin de ia variable aleatolia bidimensiortal contitrua

nt , f senrser\y1 si 0( r'1
rw'lJ):l rf2, 0<y<rf2;
o, si r(0, y<0.
a) Halle la probabilidad de que el punto aleatorio (X,Y) caiga en el rectngulo limitado pol
las rectas r -- 0,, :;, y : :
[,, tt
b) Deterrnine las fr-rncioues de densidad marginal de cada una de las variables aleatorias.

,1. Dada la funcin de densidad coniunta

f (r, a) : ! *" Y+5a2) ' 12 _.'x) < r {N, -oo(lJ<(n.


1T "-\"
Encuentre las funciones de densidad de cada ttna de las conrponentes. ,Son independientcs'/

Lr 'r'ariable aleatoria bidirnensional (X, Y) tiene funcin cle densidacl

[ ?,u') : (1 + r;2) (t6 + a2)'


:r.y F'.

zr) Halle la constantc c; b) Detcrmine si X y Y son independientcs.

La clerrsiclad conjunta dc X y Y es /(r; U) : A3ne )(z+e) para r > 0 y ;/ > 0.


a) Halle las densidades marginales y demuestre que X y Y son independientes;
b) Haile Pr(X < a;Y 1b) para cualesquiera nrmeros positivos ct y b;
c) Halle Pr(X < o) para a > 0.
En una irrvestigacin sobre la utilizacin clel crciito institucionai pol palte cle los canrpesiuos s('
registra e1 nr'rmero de cultivos que tiene ei campesirro en slr uniclacl proclr-rctiva (variable -X) v cl
nrimero de pr'stamos que ha obtenido en los riltimos aos (variablc I). En 1a siguiente labla
se pleserrt;ru ios resultac-los cle Ja irrvestigacirt:

v
-,\
.l
Y L ) ,) 4 5
0 2150 r ls0
1 3/5n 7150 12150
') 5150 e l50 41 50 :t 150
3 3ltt) \ 150

a) Olrterrga lrs distlibucioucs nrarginales de ,Y y cle )'-;


b) Dctclrnine la cListtibLrcitin probabilsticir dc: crclitos olrtenicl<s, r-lado que cultir'r clos plo-
rIn<:ios:
174 Captulo 5. Distribuciones l\[ulticlinterr.sjorrr/es

c) Olrtcrrgir l distribrrr:i<irL plol-ralrilstica cle 1>r'och-rctos. \::l (ln(' rlr ticrur prstirrrr<ls.

T4 Uu soc:icikrgo irrvr:stigrr cl c:<lrrrrortirnrietrto <lcliuttrcrr<:irl <[c los irrtcr rros <lc trrr pr.rral. Lr r'rrial
X relltcscutr c-.1 ruirrrcro rle voccs rlue ha cstulo clctcrri<lo v lr r'rriabkr )'- cl uliurclro rlc rlcll-
c[istitrtcls llor los (rc] ha siclcl s<lrrtcucir.clr. Srrs r1rtos sc reslrrl)clr crr Ia sigrriorrte talrla:

.Y
.)
Y i 2 .) 4 5
1 15/100 e/100 41r00 1/100 1/i00
2 5/100 1 1/ 100 51700 21r00 1/100
3 21r00 41t00 7 1100 3/100 1/100
4 rlrc} 3/100 5/100 21r00
I
tJ 21r00 41r00 211.00
6 21r00 3/100 1/100
7 21r00 21t00

a) Obtenga las distr-ibuciorres rnalginales de X y cle )":


b) Determine la distribucin del nrmero de veces que h estado detenido, si solo ha cometi,:-
un delito.

15. Sea X
una variable aleatoria que sigue una ley ul)ifolure sobre {1,2,...,n}. Sea Y la variab-.
aleatoria definida ror Y : (X + l)2. Calcule la cor'rianza entre X y Y .

16 Sea X
una lariable aleatoria qne sigue una ley unifornre sobre {-1,0, 1}. Calcule el coeficiel,:.
de colrelacin cntre Xtn y X'tL.

17, En nna urriversidad se toma, a los aspirantes, pmebas de ingleso en ciencias y en humanidades. S
X y Y sou, rcspectivamente, Ias ploporciones de rcspuestas correctas que un estudiante alcaui..
en las pruebas r su funcin de densidad conjurta viee dada por'

r 4r -l6u
,,^ ^.t
IV,A):- \ J
5
[ 0. caso corrtrario.

.Qu rorcentaje cle estudiantes conseguirn:

a) nrenos del 40% de respuestas correctas en cada una de las pluebas?;

b) rrrs del 80% de respuestas correctas en ciencias r,. rnenos de 50% en hurnanidades?

18. La c'arrtidad en rniligramos de dos componentes con[enidos er] un producto es nrra valial.'--
aleat<ria hrir,ariantc. cuya fttncin de densidad viene dada pol Ia expresin

o<v < r;
r@,:
{ ;:r, ::j:":;:,;''
a) Errcucrrtre el valol cie la constante c;
lr) I{rlle Ia ley condicional /(zlys):
C:) Ctlt:ule la rrobabilidad de <ue la cntidacl clcl primer componente sea menor que 0.3:
rrritigramos cuando la del segundo cs 0.8 nriligramos;
d) ;.S,ru irr,lrendientes los dos <.:omponentes'?
5.6. Ejercicios L75

19. Si X cs l;r pr'oilorc:i<itt rlc pcrsonas que I'csl)ontlcrr r ulra cnclrostr lerlizacla por correo y )'' t:s
la rtopor< iritr <lcl l)0lsorras cllre resl)onclen a otla errr:rrestr rr:aliz<lll)ol correo, y la ftLrrciirn r1<''
rlcnsirlrrl <:orr.jrurtit <lc X y )/ esti dada por

r| -*'-!,
2ri8t
.lb,v): I 5
para 0(r(1; 0<yl1;
[ 0, caso colrl r'trio.

Eucueutle:

a) la funcirr cle densidad marginal de X;


b) Ia probabilidad de que aI menos un 30 % de Ias personas responda a la primera encuesta;
c) Ia probabilidad de que menos de un 40% de las personas responda a la primera encuesta y
que ms de 50 % de las personas responda a la segunda.

20. La vida de uso (en horas) de cierta clase de circuitos integrados es una variable aleatoria con
funcin de densidad
I 20000
st z ) u;
l@): { G+ looF'
I O, caso contrario.

Si tres de estos circuitos operan independientemente, encuentre:

a) la densidad conjunta de X1, Xz y Xs, que representan la duracin de cada uno de los
circuitos;
b) la probabilidad Pr(X1 < 100,X2 < 100,X3 > 200).

2r Sean .9 y T dos variables aleatorias cuya funcin de densidad conjunta est dada por

f(",t):{ *' si o(sl8; o<t<7;


t 0, caso contrario.

a) Encuentre el valor de k;
b) Obtenga las densidades marginales de ^9 y de ?;
c) Determine la funcin de distribucin F(s, ).
22. Una funcin de densidad conjunta est dada por

' t/
f(r,a,-,, I l6ryzt' si 0( r1I; 0<y<1; 0<z1I; 0l11;
- I 0, caso contrario.

a) Calcule la probabilidad cle que X ,i, t .;y r >2s,


=X,,
b) Obtenga la densidad marginal de ?;
c) Son las variables aleatorias X, Y , Z y T mutuamente independientes?

La densidad conjunta de (X, Y) es

- r - u)' <a< 4;

l.;}]
r(*,v):
{ i:t :'-: ;ffi?,I'
a) Halle el valor de k;
b) Obtenga ls densidades marginales de X y deY;
176 Captulo 5. Distribuciones Multidimensionales

c) l)cterrniue 1a covarianza entre X y 7'.


24. Sr'r r ,2 .2.
c^Ye-\r'-+tt- )''r' ) 0;'Y > 0;
.f (r, : I
L 0. err otros casos.

a) Halle el valol de c;

b) Obtenga las densidacles marginales de X y de Y:


c) Calcuie las esperanzas dc X v de Y;
d) ,Son independientes X 1, )/'/

25. Sean X y Y dos variables aleatolias cuya densidad conjunta es

f
. ( !6rr+yr)y,
(r,a):1 5
sio( r1r; o1y< l;
|. 0. caso contrario.

a) Obtenga las distribuciones marginales de X y de Y;


b) Halle la covarianza entre X y Y;
c) Calcule las esperanzas de X +Y y de X2 +Y2.

26. Sea (X, Y) distribuido uniformemente sobre el sernicrculo del diagrama. Entonces, f (r,y):
si (r,y) est en cl semicrctilo.

a) Determine las distribuciones marginales de X y de Y


b) Son independientes X y Y?
27 Para la distribucin bivariante
c*rly
(r, v) : (1+Z)4(1 +y)4',
si r)Q; a>0;
.f
0, en otros casos.

a) c) .Son independientes X v Y?
b) al de X;

28. Pala :

si z 0, y>0; conn),2,
+ YY
caso contlario.
5.6. Ejercicios L77

a) Determine la constirnte k; lr) Obtenga lr funcin de distribucin.

29 Son indepcn<lientes las valiables alcatoritrs X y Y, si la frurcin de densidrd conjunta es

,)
h
a) l?,a) :3 a"",
at:-
0 ( r 1y 1 l?; b) "f(r,A): (r+r ta)4
r) 0; rr>0?

30. Dada La funcin de densidad dei vectol aleatorio (X.)')


( 6r, para 01r1Y<1;-.
(r.t):
rf \*'Y I
[ 0, caso contrario.
Encuentre las funciones de densidad marginal de X y de Y.
.1 l- Si(X,Y) es un vector aleatorio con funcin de densidad conjunta rf (r,y)
\ )
:!6'+ysi 0 < r 1l
y0<y<L(y0enotrocaso).CalculelacovarianzayeIcoeficientedecorrelacindeambas
variables.
r)
Dada la funcin de densidad de (X, Y):
.?

s I 1;
r@,a):
{3:r' :ff"h;,s
a) Encuentre el valor de k;
b) Calcule ias funciones de densidad marginal deXydeY;
c) Calcule las esperanzas de X y de Y;
d) Calcule Pr(X < 0.51Y : 0.6);
e) ,Son XyY independientes?

')t
'),) Sca (X, Y) una variablc aleatoria liidirnensional con funcin dc densidad conjunta
0<g<r<1.
Calcule:

a) el valor de la constante k;
b) Ias ftrnciones de densidad rnalgiual cle X y Y. Son independientes?;
c) la corrarianza entre X y Y;
cl) la funcin clc clensicla<l <tc )''lX : 1;
2'
e) la csperanza de YIX ::.
'2
ji. Si (X, Y) est uniforrnemente distribuido en cl tringulo limitado por las rectas t :0, A :0 y
r + lJ :2, encuentre:
a) iafuncin cie densida"d de (X,Y); c) lacovarianzaentre X yY.
b) las funciones de densiclrd clc X y de Y;

l;. La distribrrcin coljnnta cle las r.ariables alertolirs X :,Y es uniformc en el cnadrado con vrtices
en (1, 0), (-1, 0), (0, 1) v (0, -1).
178 captulo E. r)istribuciones Multidimensionales

tr) Escrilra
l,1 frrrrcirr clc clensicltcl conjrrnta cle X y y;

lr) calcule la firrrc:i<irr clc cle'sicl,rrl nargi'al ck: x y dibtrjela;


r;) Hallc E(X) V Var(X);
<l) Czrlcule E(XY);
e) Caicrrlc la crtr'r.ianza y la corrclacin eutre X y y.
36. El clellzrrtanlento dc sealizacin clel municipio registr el por.centaje de focos cre tiene clpt
Ieentrlazar en los scmforos, segt I] el colol que ellos ilnminan. Se detect que
el 45 % so de-
color verde,20To del color amarillo y 35% clel color rojo. En una muestra aleatorir
cle 1b focos.
,crrril es Ia probabiLiclad cle que:

a) hayan 10 r'erdes, 1 amarillo-r 4 ro.jos?; b) havan 5 focos de cada color?


DN
r) f . Entre las operaciones qlre se realizan en un banco se ha registraclo que a lo largo del
tiempo se
tienen los siguientes porcentajes <le retiros, depsitos y cambios de cheques,
3l%, 40% y 25;-:
respectivamente. Un ca.jero reali:: 20 operaciones en una hora. Determine la probabilidad
de
que se hayan hecho: a) 5 retiros, 1(ldepsitos y 5 cambios de cheques;
b) 10 r.etiros y 10 depsitos
38 Segrrr el Registro Civil, la poblaciin ecuatoriana entre los 18 y
6b airos cle edacl tiene la siguicnt.
composicin:30Vo son solteros,4ltTo son casados, I5%o son clivorcitrclos y 10%
son viudos. E:-
una oficina labotan 18 personas, ,cur es Ia probabilidad d.e que haytrn:

a) 6 solteros, 6 casados, 3 divor:iados y 3 viudos;


b) 7 solteros, 8 casados, 2 divor:iados y 1 viuclos?
39 De rctterdo a la teora de la here tcia de \4enclel, si plantas con sernilla rmar.illi
lis se cl.Llz-l
con plantas de sernillt t'erde rtl8os, se obtiene los siguientes resultados
con sus r.espectir.;..
prolrabilidades:
Probrl-iiiclrcl
rarilla y iisa el16
rarilla y lllgosa 3l16
'de y lisa 3l16
'de y rlrgosa 1176

'Cul es Ia probabilidad de que e rtre 9 plantas as obtenidas, 4 sea cle semillr amarill lisa. _
sean de semilla amarilla rugosa, 3 de semilla vercle lisa y ninguna
cle semilla vercle rugosa?
40' Las variallles aleatorias Xt, Xz y X3 siguen las siguientes leyes de probabilidad: X1 I
Xz - N(20, 1) y X -.A/(30,4). le definen -
^f(10.
Zt: XtlX2- X3, Zz: XtlXzlXz, Zs: Xt_Xz- X.
Si X1 , Xz, Xs son independietrtes calcule la nlatriz cle covarianzas cle (21,22,2;).
4r' Las variabies aleatorias xt, X2, . ., Xr, yt, y2, - . ., y, son inclepenclientes. porrgamos
*

Halle la covar.ianza entre


,,t:'
"rlr'
: ;:;. i',",
$, y T, ;i
lt(Xk) : a, Yar(X,1 : 6,2,

Pr(Y:7) :p, Pr(Y-0) : e:l-p, k :I,2,...,T.


42. Sea X - N(I,1), halle la matriz ce covarianza de (X, X2, XB).
T

Captulo 6

Distribuciones de Muestreo

En c'ierto sentido, Ia estadstica y la probabilidad tratan con problernas inuersos:


si el objetiuo b,sico de la probabi,lidad es calcular las probabi,lidades
de euentos compl'icados que siguen un modelo probabilstico,
Ia estadstica trata de clarificar Ia estntctura de modelos probabilstico-estadst'icos
rnediante la obseraacin de uarios euentos complicados.
A. N. Shiryayev

La ley de distribucin normal es el modelo probabilstico ms empleado en Ia Estadstica, debido a


ia aplicacin del Teorema del Lmite Central; sin embargo, este resultado no es aplicable en todos
-os casos. En el presente captulo examinaremos las leyes de probabilidad que siguen ciertas medidas
,rtadsticas, obtenidas a partir de las muestras, que nos permitirn construir modelos inferenciales
.obre los datos.

n-as distribuciones de muestreo, constituyen el punto de transicin desde la Probabilidad a Ia Estads-


:ica.

6.1. Resea histrica


La Estadstica actual es el resultado de la unin de dos disciplinas que evolucionaron independien-
-emente hasta confluir en eI siglo XIX: la primera es el clculo de las probabilidades, la segunda es
- <Estadstica>> (o ciencia del Estado, del latn status), que estudia la descripcin de datos, y tiene
:arces ms antiguas. La integracin de ambas lneas de pensamiento dio lugar a una ciencia que estudia
-'imo obtener conclusiones de la investigacin emprica mediante el uso de modelos matemticos.
I os comienzos de la estadstica se pueden hallar en el antiguo Egipto, cuyos faraones recopilaron,
:acia el ao 3050 antes de Cristo, datos relativos a Ia poblacin y la riqueza del pas. De acuerdo a
lerdoto, dicho registro de riqueza y poblacin se hizo con el objetivo de preparar la construccin de
-rs pirmides.

L,c chinos, tambin efectuaron censos hace ms de cuarenta siglos. Los griegos realizaron censos
;eridicamente con fines tributarios, sociales y militares. La investigacin histrica revela que se
:o-alizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia
SUerrera.

Fero fueron los romanos quienes mejor supieron emplear los recursos de la estadlstica. Cada cinco
m realizaban un censo de la poblacin y sus funcionarios pblicos tenan la obligacin de anota

179
1ECI Cayttulo 6. Distribucior:es de M-esreo

defnnciolres 1- rna.1 r'iurorrios) sin olviclar los iecurr:ntos peticlictos clcl g;lnarlo
nr<:itnicni<-s, I' de lirs
licluezils contcnic,lrs crr lrs tict rrs colctisladas. li
lp
Durante los rnil aos sigrrientcs a. la cada del impclio Rornaro sc rcilizrron rruy po.irs irn'estigaciones
I
estrdsticas. E1 primel intento de aplicar un razonamicrrtu propiirmentc cstadstico, en el seul,ido actua. tt
del tr'mino, a datos clernoglzificos es clebido r John Granrrt, err 1662, quien sc plarrte el problem:r de
l',
I
estirnar Ja pol-rlacirr inglcsir de la poca.

Goclofredo Achenu'all, prof<:sor de la Universidad dc Gotinga, acu en 1760 la pzrlabra estadstica. Er


qtre extrajo del trmino italiano sta,t'ista (estadista) . Crea, y oon sobrada razl, que los datos de la
nlre\/a ciencia seran el aliacio ms eficaz de los gobernantes conscientes.

Durante el siglo XVIII y 1a mayor parte del siglo XIX, Ia Estadstica evolucion como ciencia separada
del Clculo de Probabilidades. Una contribucin importante al desarrollo de la Estadstica es debid
a A. Quetelet (1846), quien sostuvo la importancia del clculo de probabilidades para el estudio de
datos humanos. Quetelet demostr que la estatura de los reclutas de un regimiento segua una le'
probabilstica, e introdujo el concepto de <<hombre medio>>.

A finales del siglo XIX, Sir Francis Galton ide el mtoclo conocido por correlacin, que tena por
objeto medir ia influencia relativa de los factores. Sus irrvestigaciones se dirigieron a aplicar mtodos
cuantitativos en el estudio de la herencia humana. La importancia de Galton radic no solamente en
el nuevo enfoquc que introdujo en los problemas de estadstica, sino tambin en su influencia direct-
sobre W. Weldon, K. Pearson y Edgcworth, entre otros. Adems, fund el primer departamento de
Estadstica. E
'de
Pero, talvez qu.ien rns ha influido en ei desarrollo de la Estadstica moderna es R. A. Fisher (1890 - po
-En
1962). Fisher se interes plimero por la eugenesia, Io que le condujo, siguiendo ios pasos de Galton, :.
la investigacin estadstica. Sus trabajos culminaron con la publicacin del libro,9listi,cal Method:
Por
t'or Research Workers. En esta obra aparece el cuerpo mctodolgico bsico de la Estadstica actual. Iup
A partir de 1950 se puede considclar que comienza ia poca moderna de la Estadstica. tln aspect,-
Ger
clifercncial respecto a ios periodos rnterioles es La aparicin cle las computadolas) que revolucionalor,
par
1a metodologa estadstica y abren enormes posibilidades para 1a construccin de modelos complejos

En la actualidad, ia trstadstica es una discipiina que actira como pncnte entre los modelos matemtico- Den
y los fenmenos reales. IJn modelo es una abstraccin sirrrpliflcada de una realidad ms compleja - ns
siempre existir discrepancia entre lo observado y 1o previsto por el modelo. La Estadstica proporcioni- por
una metodologa para evrluar y jr.rzgar estas discrepancias entre la realidad y la teora.
Los

6.2. befiniciones bsicas


A contiuuacin damos varias ilefi,niciones de inter's, qr-rc permitirn entendcr la terminologa c1'r..
emplearemos. Algr-rnas definiciones ya se dio con anterioliclacl, pero las repetiinos para rrna rrra-\'.
claliclad cle los couceptos

Defi.nicin (de poblacin) Una poblacin (o universo) es una coleccin completa de pelsonas.
anirnalcs, plantas o cosas de las crrales se desea recolectar datos. Es el glr-rpo cutero al que querernos
dr:scribir o del que deseanros sacar conciusiones.

La poblacin debe tener caractersticas medibles o cntables, cle rraturaleza cuarrtitativa o cualitatir'
A la r:aracterstica nredible sc denomina uar-iabl,e estadstica t a los r-rloles ciue tomr se los llal
ol s cr-ur,ciorcs.
6.2. Definiciones bsicas 181

Definicin (de muestra) Es un grupo de unidades seleccionadas de un grupo mayor (la


poblacin) . Por el estudio de la muestra se espera obtener conclusiones sobre Ia poblacin.

Definicin (de parmetro) Un parmetro es un valor, usualmente desconocido (y que por lo


tanto tiene que ser estimado), usado para representar cierta caracterstica de la poblacin.

Entre otros, los parmetros poblacionales son:

. La media, /_;

r El total, r;

. La varianza, o21

. La desviacin estndar, o;

. La proporcin, 7T o p.

Definicin (de estadstico) Un estadstico es una cantidad que se calcula a partir de una muestra
dedatos. Se los emplea para dar informacin sobre los valores desconocidos correspondientes a la
poblacin.

Por ejemplo, el promedio de Ios datos de una muestra, se usa para dar informacin sobre Ia media de
-a poblacin, de la cual se extrajo Ia muestra.

leneralmente, a los estadsticos se les asigna letras latinas (por ejemplo, m y s); en cambio, a ios
:armetros poblacionales se les asigna letras griegas (por ejemplo, ,t,y o).

Jentro de una poblacin, un parmetro es un valor fijo que no vara; mientras que es posible extraer
-'s de una muestra de la misma poblacin y eI valor de un estadstico variar de muestra a muestra.
lr ello, un estadstico es una variable aleatoria que sigue una ley de probabilidad.
-..rs
estadsticos ms importantes y sus valores, calculados a partir de una muestra de tamao ?) son:

i"n
. La media muestal o promedio , T : L;
m

. El total muestral, i: Nr, donde,Ay' es ei tamao de la poblacin;

'ln
La r.arianza mucstral, s'2 - ---:- T.@, - )2;

'rL
1
. La desviacin estndar muestral. s : D@, - r)";
n-I i-I

. La proporcin rnuestral, f : Lt
, donde y es el nmero de xitos entre n intentos.
n,
182 Capitulo 6. Distribuciones de Muestreo

6.3. Distribuciones de muestreo

Si decirnos que un estadstico es Lrna vrlialrlc aleatoria, entonces tendr' una Icv de lrrobabilidad
asociada.

Definicin (de distribucin de muestreo) A la ley de probabilidad que sigue un estadstico se


Ie denomina distribucin de muestreo.

La derivacin de la distribucin de muestreo es el primer paso en la realizacin de inferencias sobre el


valor del parmetro asociado al estadstico quc se estudia.

6.3.1. Distribucin de muestreo de la media


Supongamos que se obtiene una muestra X1, X2, . . ., Xn de una poblacin que tiene media p,y varianza
o2. A partir de la muestra calculamos el promedio, X. Entonces, se cumple que:

1. E(x) : l-L;

o2
2. Var(X) -
-1TL

X-u,
3. '+
ol\/n
sigue aproximadamente urla ley normal estnclar (por el Teorema clel Lrnite Central).
Es decir,

Pr(x < L) =v, (zs +) :o ( ++\


\ -ol'/")
.

\"11")'
donde Z es tna variable aleatoria normal estndar.

Tngase en cuenta qlre) para la mayora de aplicaciones, ya se obtiene una buena aproximacin cor-
un tamao de muestra de n:25.

Observacin. La desviacin estndar de la media muestral se denomina er"ror est,ndar y se le not;-


oTi
o
OV
\/n

Ejemplos

1. Supongamos que se selecciona una muestr a de n : 36 observaciones de una poblacin con pt - -


yo:0.9.
a) Hallar Ia probabilidad aproximada de que la media muestral sea menor que 6.9.
b) Obtener la probabilidad aproximada de que el promedio X sea mayor que 6.82.
c) Hallar la probabilidad para que X est en el intervalo (6.8;7.29).

Solucin: La distribucin de la media muestral X sigue una ley normal con media p: 7:
. o2: (0.9)2es declr' 0 0.9
:
varlanza u'rc'
; 36 ; ,fr: ,,/g6
6.3. Distribuciones de ntuestreo 183

a) As,

Pr(X < 6.9) x ,r(t 6.9 - 7\


0.15 )
: 0.2515
b) Tenemos que

Pr(X > 6.82) : 1-Pr(X 1- v, ( z= u?''lt)


<6.82) =
\- 0.15)
a- : 1-O(-1.2) :l-0,1151
: 0.8849.

c) La probabilidad de que la media muestral est entre 6.8y 7.29 es

Pr(6.8 '^\(8:J
<X <z.zs : e, o.lb <\z\z <7'2e-7)
o,lb )
- o(-1 33) :0 e732 - 0 0e18
: i:iffl
El nmero de clientes que ocupan un cajero automtico) en un lapso de 5 minutos, es una variable
aleatoria distribuida segn la siguiente ley de probabilidad:
k 0 1 2 3 4 5
PI, r/tz 2/72 3l12 3lt2 2lt2 r/72

a) Halle la media y la varianza de la variable aleatoria; b) Se escogieron 46 muestras, de 5 minutos


de duracin, y se cont el nmero clientes que utilizaron el cajero. Cul es Ia probabilidad de
que el promedio de clientes est entre 2.2 y 3?
Soluc'in:

a) La media y la varianza son:

tt : D,,r*:ox i*r"3*r"i*3x i*n"l*r"i


5
2'
o2: Dt'or- :o " # * 1 x l*n"
tr2
l*n " i*16 x ,?r*r, " +- (;)'
23
t2'
b) Sea X la media de clientes que ocupan el cajero en muestras de tamao 46. Se tiene que
23
5oo2111
lt.z:l-t:5 y oi:i::.
. /5 1 \
Entonces, X-N por lo tanto,
\;,
^);

: aQ.45) - o(-1.47)
: 0.922L.
184 Captulo 6. Distribuciones de Muestreo

3. En una plania pasteurizadora se ha observado que la mquina que llena las fundas de leche.
envasa el lquido con una media p y una desviacin estndar de o:20cnr3. Si un da se llevarL
a cabo 25 mediciones de la cantidad de leche en cada funda. a) Caicular Ia probabilidad de que
el promedio medido difiera a lo mucho en 8 cm3 de la media terica que debe tener el volumen
de leche envasado; b) cuntas mediciones deben realizarse para que 7 difiera dc r, en menos de
Bcm3, con una probabilidad de 0.99?
Solucn: Como n : 25, se puede asumir que la distribucin de X es aprc:,i-:ladamente normal.

a) Entonces,
Pr(lX-/rl <B) : Pr(-8<X-p<8)
: /88\
"'|.-rE<zsn/6)
: Pr(-2.2.2),
donde Z : X -# sigue una distribucin normal estndar. La probabilidad buscada es
olt/n
Pr(-2 < Z <2) : o(2) - o(-2)
0.9772 - 0.0228 : 0.9544.

b) Se tiene que
Pr(lX - pl l8) : P'(-s <X -p S 8) : 0.99.
Como o:20,

\ -Y Y)
,, (
20 ,X ,-1,_
-olr/n-
:pr(-0.4J
--\ --v < z < 0.4Jn): o.ee.
= 20)
Mediante la tabla de la ley normal se encuentra que
Pr(-2.57 < Z < 2.57) : 9.99,
por lo que se deduce qne 0.4Jn:2.57, o sea

":(#):40e6'
Se necesitan al menos 41 mediciones para que el promedio de la nuestra est a 8 cm3 de ,

rnedia poblacional con probabilidad deI99%.

6.S.2. Distribucidn tle rmlestreo de la proporcin


Supngase que tenemos una muestra alcatoria Xy, X2, ..., Xn, proveniente de una poblacin qne s-:
una ley dc Beriroulli, Ber(p). Definimos

n:irn
i-r
donde X:7 con probabilid^'r p y X:0 con probabilidad Q: I - p, i : I, 2, ..., n. Entonce.
cuenta el nmero de xitos en . intentos. La proporcin de <<xitos>> en la muestra es

f:Y: li",
TL 7I4;- 1

La variable aleatoria Y tiene distribucin binomial de parmetros (n,p). Por lo eu, py:
o2" : npe, y se cumple que:
6.3. Distribuciones de muestreo 185

r E(i) : 1
: p;
n-E(Y)

l. 1

Var(f) = I Var()')
rL'
:?3:
n

l. + sigrre aproximadarnente Lrna ley normal cstnclar' (por el Teorema del Lrnite Central)
\/ pq ln
Es decir.
./ \ / \
P,(Fsl) =Pr(z1l!) :of '-1 )
\ - t/pql" ) \r/pql" )
dorrde Z es tna variable aleatoria normal estndar.

Ejemplos

-. En un proceso de produccin el 20% de los productos tienen algn defecto. Se selecciona


una muestra de 100 unidades y se cuenta el nmero de artculos defectuosos. Determinar la
probabilidad de que la proporcin de defectuosos se encuentre entre el IS%a y el29%.
2-\^=0 B
Solucin: Tenemos que p : 0.2 y on :0 : 9 rtu.
n 100 100'
Se desea evaluar la probabilidad Pr(0.15 <0 < 0.29); sto es,

Pr(0.15 <0 < 0.29) : P.(0< 0.29) -Pr(p'l 0.15)

o(!zg::2.\-rlors-oz\
\v/0.16/loo/ \v/0.16/1oo/
aQ.25) - O(-1.25) : 0.9878 - 0.1057
0. BB2 1.

Eu lrna investigacin por muestreo interesaba saber el nivel de sintona, en los hogares, de un
partido de frtbol. Se realiz nna encllcsta en Qr-rito a 213 hogares y se encontr' qr-re el 53% de
los hogares haban visto el nencionaclo partido. Srrpongamos clue la proporcin 7r de hogares
en los que se vio cl partido fue realmente igual a 0.5. ,Cul es la probabilidad de observar una
proporcin muestral f igual o mayor qr.re la observada 0.53?

solucin: Tenemos n:2r3 v p:0.J; por lo tarrLo,


T - +#
: 0.001174.

Por 1o que,

pr(f )0.s3) - t-pr(f<0.53)' =1-pr (=.9)


\ t/Pql" '/o'oottz+ 1
= 1-0(0.88) -1-0.8105
: 0.1895.
Es decir, con una muestr' de 213 hogares Ia iirobabilicld de que la proporcin olselvad sea
mayol'o igual a 0.53 es del l8.95o/a.

Hzq qrre totnar Lrr.i nltcstla. alcrt,or'a para estimar Ia proporcirr de artculos defcctnosos p de lur
ploceso de prochrccin. a) Establecer el tanrao mnirnc de ia rnr-restla de modo que la proporcin
observrda difiera de la propolcin velda,clcrr' on irrerios cle 0.1, oon riua 1>robabi iclad c,le al rnenos
eI 957o; b) Realizar el inciso antelior si se conoce qr.re la ploporci<in dc artculos defectuosos es
mcnor clue c1 12 %.
Soht"ci,rin,;
186 Captulo 6. Distribuciones de Muestreo

zr) Deseanros cletermirtar el ta,rnao nruirno cle 1a mrrestrr clc tal moclo quc Pr(lp tl < 0.1)
0.95:

P'(lp-tl <01) : P'( 0.1 <p-t<01)


: P,f+ <z< o' \
- \r/pql,,- r/nul,,1
olq$)
\/psl
<,(_otJ) -on,
\ '/ps/-
Igualando con los valores de la distribucin normal y haciendo uso de su propiedad
simetra,

0.I{"
,/w
n

En esta ltima expresin, el valor de n depende de p, que a su vez es desconocido. Pa:.


asegurarnos de tener un tamao de muestra confiable, se maximiza el producto pq. T;
producto es mximo cuando p: q:0.5; entonces,

n > (1e.6)2(0.5)(0.5) : e6.

La muestra tiene que ser de al menos 96 artculos.


b) Antes habamos determinado que ? > (I9.6)2pq.
Como p <0.L2, se tiene quepq > 0.I2 x 0.BB:0.10b6; entonces,

n > (r9.6)2(0.1056) : 40.57.

EI tamao de la muestra es de al menos 41 artculos.

6.3.3. Distribucin de muestreo de la varianza


En el Teorema del Lmite Central la convergencia de la ley de 7 est asegurada y es independie--"
de la ley que siguen las observaciones. Para otros estadsticos, se necesitan hiptesis adicionales p,:r
asegurar su convergencia hacia una ley de distribucin, este es el caso de Ia varianza muestral.

La ley de distritucin y2

Sean X1 , X2, .. ., Xrr., fr variables aleatorias,independientes que siguen una distribucin normal e. . .,.
dar, la variable aleatoria definida por T : D X? tiene una distribucin X2 (jl-cuadrado) con n gr1-ul
,i-I
de libertad (g.1.), denotada y2(n).

Su funcin de densidad es
,(n-2) lz lz
"-r , siz)Q;
f(r):
i; 2"trt (;)
sir(0.

La ley de distribucin y2 fue dada en pprl


rime r lugar, aparentemente, por Abbe (1863) y redescu,
por Helmert (1875) y K. Pearson (1900l).
6.3. Distribuciones de ntuestreo 187

2.
z@)

Figura 6.1: Funciones de densidad de la ley X2.

:sta distribucin est definida para valores mayores que cero y viene tabulada. La Tabla 3 del Apndice
--,ntiene los valores X?qrre cortan un rea a en el extremo derecho de la distribucin (Figura 6.1).
- a lectura de la tabla se realiza de la siguiente manera:

i. Escoja el nmero n de grados de libertad (margen vertical).


'1. Considere Ia probabilidad a en el extremo derecho de la distribucin (margen horizontal).
3. Proceda a localizar el valor X?@) en el cuerpo de la tabla, donde se cruzan las lneas vertical y
horizontal antes encontradas.

Ejemplo. Se desea conocer el valor de la ley X2 a 4 g.l. para el cual el rea en el extremo superior es
-.ral a 0.025.
-' .lucin: Se busca Xl.ozs(a) : ll.l4. Esto quiere decir que el rea a la derecha del valor t : II.I4
-= Ia ley y2 cor. 4 g.l. es igual a 0.025: Yr (X2 > 11.14) :0.025.

XLa ley de distribucin de s2

:;pongamos que se obtiene una muestra Xy, X2, ..., Xn de una poblacin que sigue una ley normal
-'i ri,.t,o2). A partir de la muestra calculamos la varianza muestral, s2 : ' n-rl-t
-i (X, -X)2; entonces,
- cumple que:

-. E(s2):oz'
)n4
l. '*'\"Ls2),,
Var
n_1,
(n
J # - 1\.s2
sigue una ley 2(n - t;.
=jemplo. Un jugador profesional de dardos decide tratar de mejorar su tcnica de lanzamiento y va
. -stndial la varianza de Ias distarrcias al centro del blanco a las que cae el dardo. Para una cierta
-rrnica de lauzamiento se sabe que esas distancias tienen una distribucin normal cuya desviacin
+ ndar es 4 cm. Realiza 30 lanzamientos y calcula la varianza de Ias distancias entre el sitio de
--pacto del dardo y el centro del blanco. a) Calcular Ia probabilidad de que Ia desviacin estndar
-. los lanzamientos sea myor a 3 cm.; b) Hallar Pr(10 < s2 < 27), aploximadamente; c) Calcular Ia
:--dia y la varianza de s2.

l.lucin: Sea u : +I, IJ - x2Qq para n : 30.


188 Captulo 6- Distribuciones de Muestreo

a) Se quiere buscar Pr(s > 3); cs clecir, Pr(s2 > 9):

pr(s2 > 9) : p, (" r' r 3r) : pr.(t/ > 16.312)


\o' -rt Iro)
En la tabla de la ley X2 para 29 g.1., se ticne que Pr(t/ > 16.05) : 0.975 y Pr(U > 17.7f): 0.95
Por lo tanto, Pr(s2 > 9) es algo menor- que 0.975.

b) Calculemos Pr(10 < s2 < 27),

pr(10 < ,2 < 2T : v, (!rc <n _ut ,' t}rr\: pr(18.13 < u< 48.s4)
\16 o -16 /
: Pr(U < 48.94) - Pr(U < 18.13)
: [1 - Pr(U > 48.e4)] - [1 - Pr(U > 18.13)]
: Pr(U > 18.13) -Pr(U > 48.94).

De acuerdo a Ia tabla y2, para 29 g.l. se tiene:

c Pr(i/ > 17.77):0.95 y Pr(U > 18.85) :0.925.


c Pr(t/ > 45.72): 0.025 y Pr(t/ > 49.59) : 0.01.
Entonces, Pr(10 < s2 < 27) x 0.95 - 0.01 : 0.94.
Observemos que, por la forma de lectura de Ia tabla, tnvimos clue realizar Lrrla transformaci:-
para encontrar Pr(18.13 < U < 48.94) y su valor se determina de forma aproximada.

c) Sal-,emos que E(s2) :62 :1ti y quc Var(s2) : : tT.G6.


#:'#

6.4. Otras distribuciones de muestreo

En csta seccin presentaremos distirrtas distribuciones cle muestrcoT qlre se presentan cuando tratantc,.
con transformaciones adecttadas cle los estadsticos. Estas transformaciones son rlecesarias para oJtene:
leyes clc probabilidad que permitan traba,jar adecuadamente.

6.4.1. Distribucin de muestreo de Ia media, cuando la varianza es desconocida


Se pr-rcde srtponer qrre -ciebido al Teolema del Lmite Central , siempre sc tienc la convergcncia haci .
1a lcy rrolmal; pelo sto no siempre srrcedc; cjomo) por ejemplo, crrando la varirnza poblacional e.
desconocida.

La ley de distribucin t de Student

trn 1908, \ /. S. Gosset, esclibieldo c:on cl nornbre de Studcnt, public en la rcvista Biont,ett"i,ka s'
dccluccin cle la distribucin e inclrry tlrblas cle probtrbiliclrd acurnr-rlacla de la ley.

trl grfico de la funcin de densidad de la Ie5, / 1i"t n rrna forrna parecida al de la ley rrormal, simtric
rcspecto a 0 y se extiende a Io largo clel eje leal.

Los valores de probabiliclad clue tona vienen tabulclos. La Tabla 2 del Apnclice contienc los vrlole:
dc o qrte coltlrr nn rea igrral a o err cl extlemo clelecho clc la distribucin (FigLrrrr 6.2).
6.4. Otras distribucones de ntuestreo 189

Figura 6.2: Funcion de densidad de la ley .

Los valores tabulados dependen de los grados de libertad, porque la ley de probabilidad cambia si n
;ara. Cuando n aumenta, la distribucin se aproxima a la normal estndar.
La lectura de la tabla se realiza de la siguiente manera:

1. Escoja el nmero n de grados de libertad (margen vertical).


2. Considere Ia probabilidad o en el extremo derecho de la distribucin (margen horizontal).
3. Proceda a localizar el valor to(n) en el cuerpo de la tabla, donde se cruzan las lneas vertical y
horizontal antes encontradas.

Ejemplo. Encontrar el valor de Ia ley a 6 g.l. para el cual el rea en el extremo superior es igual a
_.t125.

jolucin: Se busca fo.ozs(6) :2.447.Esto quiere decir que el rea a la derecha del valor t:2.447 de
--,Iey t es igual a 0.025: Pr (? > 2.447) : 0.025.

La ley de distribucin de X

Srpongamos que se obtiene una muestra X1, X2, . . ., Xn de una poblacin que sigue una ley normal
-l'(p,,o2), donde o2 es desconocida. Entonces, se cumple que la variable aleatoria 7: j
s/\/n "igu"
.ra ley de Student con (n - 1) grados de libertad. Es decir,
/ t- \
Pr(X < ):
' Pr (r.- Z- 41
sl'/n)
\
Ejemplo. IJn fabricante de cigarrillos asegura que el contenido medio de nicotina, en una de sus
-arcas) es de 0.6 mg por cigarrillo. Una organizacin independiente mide el contenido de nicotina
-e 16 cigarrillos de esta marca y enclrentra que el promedio y la desviacin estndar son de 0-744 y
-.i75 mg de nicotina, respectivamente. Si se supone que la cantidad de nicotina de estos cigarrillos
= una variable aleatoria normal, qu tan probable es el resultado obtenido por la organizacin
- Cependiente?

i'.,iucin: Se tiene que p:0.6, s:0.175, n: L6. Encontremos la probabilidad de hallar un valor
::omedio igual o superior a 0.744.

pr(x > 0.744) : y, ( r ro^'-!j, Y) : e, (r > B.2s)


\ - 0.175 l,/to 1
.

) Ia lectura de la tabla de la ley con 15 g.1., resulta que Pr (" > 3.29) : 0.0025. De manera que el
-'Lto proporcionado es muy poco probable.
190 Captulo 6. Distribuciones de Muestreo

6.4.2. Distribucin de muestreo de la diferencia de dos medias, con varianzas


conocidas

SLrl>orrgtrrnos qLlc se clispone de dos pol-rlaciones que tienen rriedias Ft y lrz y varianza, ol v o)r.
respcctivarnente. Sean X1 y X2 ias lreclia muestrales de dos muestras leatorias indepenclientes de
tarrrros TLr y rL2l seleccionadas lesrcctivarnelte de las poblaciones 1 y 2. trntonces, X1 - X2 cunlple
qr.le:

1. lLrl-,2: E(Xr - Xz): l-tt - llz,

2. o7r-r: Var(Xr
o?-l- oZ
-2): TL1
-
I

-ln2

3. Para n1 y n2 suficientemente grandes, Ia variable aleatoria

7-
(Ft -x2) - (pr- t'z)

sigr"re aproximadamente una ley normal estndar. Es decir,

Pr(xr -xz < a =e, (z t-(tq-pz) t-(tq-pz)


<
):.(

Para la mayora de aplicaciones, ya se obtiene una buena aproximacin si n1 >_ 25 y n2 2 25.


Ejemplo. Una marca de automviles tiene dos plantas que ensamblan el mismo modelo de autos
El rendimiento medio de estos automviles debe ser de 40 km por galn, con una desviacin estndar
de 5 km por galn. La empresa tiene la poltica de regularmente comparar los rendimientos de ios
carros ensamblados, escogiendo muestras aleatorias en las dos plantas. Se tomaron sendas muestras de
tamao 30 y se control el consumo promedio de cada una. Hallar la probabilidad de que la diferencia
entre los promedios sea menor a 2 km por galn.

Soltcin: Se tiene eue r


: lL2: 40, o1 - 02 : 5, ny : nz : 30. Por tanto,

<z< 2-(40-40
r:d------'=t
t5'
tl-L-
Vro go
o(1.55) - o(-1.55) : 0.9394 - 0.0606
0.8788.

6.4.3. Distribucin de muestreo de la diferencia de dos medias, con varianzas


desconocidas

Supongamos que se dispone de dos poblaciones que siguen una ley normal: la poblacin 1 sigue una le-
.M (lrr, ol) y la poblacin 2 sigue una ley ,A/( 12, 03) . Sean X 1 y X2 las media muestrales de dos rnuestras
aleatorias independientes de tamaos Uy n2, seleccionadas respectivamente de las poblaciones 1y 2.
6.4. Otras disribuciones de ntuestreo 191

Caso 1. Las varianzas poblacionales son igualesz ol : o'3,: o2.

Lr r'r'irbkr alcat<llia

sigue una ley corr

Caso 2. Las varianzas poblacionales son diferentes: ol I o|.


La variable aleatoria

sigue una ley con g 9.1., donde

(*.*)'
9-

Cuando g no es un nirmero natural, se redondea al entero ms cercano.

6.4.4. Distribucin de muestreo de la diferencia de dos proporciones


Supongamos que se dispone de dos poblaciones independientes, que siguen distribuciones de Bernoulli
de parmetros p1 y p2, respectivamente. De Ia primera poblacin escogemos una muestra de tamao
n1:Xy,Xzr...rXrrrydelasegundapoblacinescogemosunamuestradetamaorl2iY1,Y2r-..rYnr-
Construimos las proporciones muestrales de <<xitos>>:

1ntlft2
Ft:Lfx,
fl,'t a
y Fz:!fy,.
nt- u
- i:l i:t

Entonces, F, - Fz cumple que:

p,-Or: E(i'r - fz) : pr - p2;

, 1r ,^ ^\ pt(J-pt).pz1-pz)
2 -Pt-P2
va - '*-\rr
vaLtul
- r''/
tt)t T )
- - TL1 n2
3 Para n1 y n2 suficientemente grandes, la variable aleatoria
- -
.
t-.-
-rr

\- -.
L92 Captulo 6. Distbuciones de Muestreo

sigue aproximadamente una Iey normal estndar (por el del Lmite Central). Es decir,

t-(pt-pz) t-(pt-pz)
Pr(Fr - lt) =rr( , t
Fz

\
ffi
U"r-rr" Un2

Ejemplo. Una-6rma especializada en sondeos polticos afirma que el 30 % de las mujeres y el20%
de los hombres estn a favor de la reeleccin del actual alcalde. Si se hace un sondeo aleatorio a 150
personas de cada sexo, con qu probabilidad la diferencia entre las proporciones muestrales de las
mujeres y de los hombres es, en valor absoluto, menor a 0.19?

Solucin: Tenemos eue Pa : 0.3 y P^:0.2, rlh: rlm: 150. Ademrs,

n1o
-pt-rn
0.3(1 - 0.3) , 0.2(1 - 0.2):0'00247' A

150 '* ff
Buscamos la probabilidad Pr (lfn - f^l < 0.19):
pt(10
-0^l < 0.19) : Pr(-0.19 <Fn-A' < 0.19)

: (0.3-0.2)) _* l_0.le- (0.3-0.2)\


o r0.le-
\ \/0.00247 / \ r/0.00247 )
: o(1.81) - o(-1.81) : 0'9648 - 0.0352
: 0.9296.

6.4.5. Distribucin de muestreo de la razn de dos varianzas

La ley de distribucin F

Sean X1 y X2 dos variables aleatorias independientes que tienen distribucin y2 con nL y n2 grados
de Iibertad, respectivamente; entonces la variable aleatoria

,, xrlnt
' - Vrln,
sigue una distribucin F (de Snedecor) con (n 1, n2) grados de libertad, que se Ia notar como F(n1,n2)
(Vase la Figura 6.3)

Figura 6.3: Funcion de densidad de la distribucin F


6.4. Otras distribuciones de ntuestreo 193

Su funcin de densid

-??2\ n,/2
I (-)n'i"'n,
-/rt n2f2

rl-\ _ / ,'nt/2-1(n2 I n1r)-('nrtnz)lz, si z > 0;


J\.1 )-
.(?) ,G)
0, sir(0.
La esperanza y la varianza son:

: 2n|(n1+ n2 - 2)
E(Y) "^,sin2>2
TL2-
y Ya{V1: nt(nz-2)z(n2-4)' sn2>.4.

Ntese que esta ley depende de dos parmetros (nt,nz) que corresponden a sus grados de libertad del
numerador y del denominador, respectivamente.

Los valores de las probabilidades vienen tabulados. En la tabla 4 del Apndice se presenta el valor r
para el cual la variable aleatoria V - F(n1,n2) es igual a una probabilidad a: Pr(V ) r) : q.

Para la lectura de los valores porcentuales del extremo inferior de la tabla de la ley -F se emplea la
siguiente relacin:
F1r-,"(u,nil p,()r,nr)

Ejemplos

1. Determinar el valor de r ) r):0.05, donde V - F(6,9). En la tabla de la ley F


tal que Pr(V
correspondiente a a : 0.05, se localiza los valores de n1 - 6 y ,z: 9, para los grados de libertad.
Donde se cruzan la columna y la fila correspondientes se lee el valor z : Fo.os(6,9) : 3.37.

2. Hallar el valor de r tal que Pr(V { r):0.05, donde V - F(6,9). Aqu, n1 :6, TL2:9 y si
Pr(V < z) : 0.05, entonces Pr(V > r) : 0.95. Por la relacin anterior,

Fo.gs(6,9) : 1L :
,. ou.g,
^:0.244.
^2
La ley de distribucin d" 1
si

S rpongamos que se dispone de dos poblaciones que siguen una ley normal: la poblacin 1 sigue una
ol) y Ia poblacin 2 sigue una ley J!'(pr,"}). Sean sl y s2rlas varianzas de dos muestras
-.r-,A/(21,
ieatorias independientes de tamaos n).y n2t seleccionadas respectivamente de las poblaciones 1y 2.
trntonces, Ia variable aleatoria

'n- '?1"?
'31"3
:-3-ue una distribucin -F' con (rt - I,n2 - 7) g.I.
t
fengamos presente que si o?: o3: 02, entonces f' : 3 - F(n, - !,n2 - I).
D2

Ejemplo. Una marca de automviles tiene dos plantas que ensamblan el mismo modelo de autos.
=l rendimiento de estos automviles debe tener la misma media y desviacin estndar. La empresa
--ene Ia poltica de regularmente comparar los rendimientos de los carros ensamblados, escogiendo
t94 Captulo 6. Distrbuciones de Muestreo

rnrr<lstlas aiertorirs en las clos plarrta.s. Se tonluorr serx.ls mrrestr'lrs cLc tarriro 30 y se controlrj lr
clcsvircicin estirrclar clc:l corrsumo clc c:acla urrr. Hallar' 1zr probabilicLrd clc quc lr clesvircicin cstrrc1-rr
cle una rnucstr] ser al rnenos 1.5 r't:<;es nravor qrtc lir clt: l:r seguncla.

SoLttcin: Se tiette c-rc:

- :.,( p,.r^)
", (; ")
Como F : t: - F(29,29); entonces.

/.?
001<r.( > 2.25) < o.o2b,

La probabilidad exacta cs Pr (#a2.25) :0.01632t

6.5. Ejercicios
Distribucin de la media

1. Para una prueba de aritmtica se sabe, con base en Ia experiencia, que la puntuacin media es 7[t
puntos con una desviacin estndar de 12.5. Si se aplica la prueba a 90 personas seleccionadas
al azar, aproxime las siguientes probabilidades:

a) Pr(68.5 < X <71..5); c) Pr(X > 72);


b) Pr(66 < X <74); d) Pr(X < 67.5).

2. En una ciudad, el peso de los recin nacidos se distribuye segrn una ley de media : 3100 g :
desviacin estndar o : 150 g, Halle los parmetros de la distribucin que siguen las medias de
las muestras de tamao 100.
o
!). Un actuario estableci el siguiente modelo probabilstico sobre los sueldos que reciben los traba-
jadores en el sector de la agroindustria:

Sueldo 200 300 400 500 600


Pr 01 0.2 0.4 0.2 0.1

Si de este sector, se toman 30 sueldos, aI azan,

a) Halle la esperanza y Ia varianza de Ia media muestral;


b) Calcule la probabilidad cle que la rncdia mnestral se ubique entre 360 y 430 dlares.

4. Las normas internacionales de calidad indican que los neumticos deben durar al menos 33 m:l
km. Un fabricante de neumticos seala qlre su producto tiene una dulacin promedio de 34 nr-
km y desviacin estndar de 4 mil km. En un iaboratorio que controla la calidad de fabricacin s=
probaron 36 llantas de esta marca. .Cul es la probabilidad de que, en promedio, los neumticc'.
probados no cumplan con las normas internacionales?
IEste valor se obtuvo mediante el empleo de r.rn proglama conputacional.
Nosotros) por la lirnitacir-r cle las tabla-.
solo podemos acotar el valor de la probabilidad.
6.5. Ejercicios 195

5. El tierripo qne los usurios dc nna emplcsl intcrlplovirrcial de transpolte esperan l)ar'r cpre stl
brrs salga clel telrninr1 es rrn r'ariabk: alcatolia con mcclia. rle 8.2 rnin y clesr.'iacin estnclrr cle
5.5 rnin. Sr-rporrga qnc err uri lus se ernl;arc:trorr 49 p:rstr.jeros. Halle lr probabiliclacl cle clue el
tienipo plorneclio quc ellos turrielori cllre esl)elal sel:

a) rnenor a 10 mirr. b) entre 7 y 10 rnirr; c) mayor a 7.5 rnirr.

[1. La gente que freclrenta cierto bar tiene una probabilidad de 0.001 de salir y cantar con el grupo
que est actuando. En una noche de fin de semana hay 150 personas en el bar. Cr-rl es la
probarbilidad de que al rnenos una pelsol1a salga y cante con el grr-rpo? (Suponga que cadr
persona en el bar toma la decisin independienternente del resto. Halle el verdadero valor y erl
aproximado)

7 El tiempo de permanencia de los automviles en un gran parqueadero es una variable aleatoria de


media 176 minutos y desviacin estndar 40 minutos. Calcule, aproximadamente, la probabilidad
de que el tiempo medio de permanencia en el parqueadero de 100 automviles, elegidos al azar)
sea superior a 180 minutos.

8. La estatura de los varones de 18 aos de Quito sigue una distribucin normal de media 162 cm
y desviacin estndar 13 cm. Se toma una muestraalazar de 85 de estos chicos encuestados y
se calcula el promedio. Cul es Ia probabilidad de que este promedio se encuentre entre 159 y
164 cm?

9. EI centro de cmputo de su universidad dispone de un servidor para gestionar las pginas web
personales de profesores y alumnos. Supongamos que la cantidad de memoria ocupada por una
de estas pginas puede considerarse como una variable aleatoria con una media de 1.3 Mb y
una desviacin estndar de 0.3. Si el servidor va a gestionar un total de 500 pginas, calcnle,
aproximadamente, la probabilidad de que la cantidad promedio de memoria necesaria supere los
1.32 Mb.

10 Se efectu un anlisis sobre Ia duracin de las mquinas impresoras, de una cierta marca) que
tienen las empresas prblicas. Se eligi una rnuestra de 179 mquinas utilizadas en una empresa
elegida al azar. La vida media de las impresoras result ser de 3.33 airos y una desviacin
estndar de 2.05 aos. Con una probabilidad del 99.7%o, en qu intervalo de tiempo puede
considerarse que se encnentra la vida media de las impresoras de tal marca?

Con una muestra de 160 entrevistas realizadas a mujeres que trabajan, result que el gasto
promedio mensual en arreglo del cabello fue de 39 dlares y desviacin estndar de 5.2 dlares.
Con una probabilidad del 99.7To, entre qu lmites variar el gasto medio en arreglo del cabello
para las mujeres que trabajan?

Un proceso automtico llena fundas de chifles cuyo peso medio es de 450 g y una desviacin
estndar de 3 g. Pala controlar el proceso, cacla hora se pesan 36 fundas escogidas al azar'; si
el peso neto est entre 449 g y 451 g se continlra con el proceso, en caso contrario se detiene el
proceso para recalibra,r la mquina.

a) Cul es la probabiliclad de detener el proceso cuando el peso neto medio realmente es 450
b')

b) Cul es la probabilidad de aceptar que el peso neto promedio es 450 g, cuando realmerite
es de 448 g?

_.f
-'f . La vida til de cierta rarca de llantas sigr-re unt-r distribucin normal X con media 38 mil km y
desviacin estndar 3 mil km.
196 Captulo 6. Disribuciones de Muestreo

a) Si Ia utilidad Y (en dlares) que produce cada llanta est dada por Ia relacin Y :0.2X -f
100, cul es la probabilidad de que la utilidad sea mayor que 8900 dlares?;
b) Determine el nmero de tales llantas que debe adquirir una empresa de transporte para
conseguir una utilidad media de al menos 7547 dlares, con una probabilidad de 0.996.

14. En Manab, el peso de los esDosos y de las esposas se distribuye segn las leyes
y N(64,69), respectivamente, y son independientes. Si se eligen 25 matrimonios, ^/(80,100)
al azar, de
Manab, calcule la probabilidad de que el promedio de los pesos sea a lo ms 137 kg.
Distribucin de la proporcin
1
15. Se extrae una muestra aleatoria de 150 elementos de una poblacin binomial corr pt :
4' cul
es la probabilidad de que Ia proporcin muestral satisfaga
*=U= *t
16. El suceso A tiene una probabilidad de 0.4. Esto significa que esperamos que la frecuencia relativa
de A est cercana a 0.4 en una larga serie de repeticiones del experimento que se est modelando.
Cul es la probabilidad de que en 1000 experimentos, la frecuencia relativa est entre 0.38 y
0.42 (inclusive)?

17. La FIFA est interesada en conocer si las selecciones nacionales ganan ms de la mitad de
los partidos que juegan en casa. Suponga que se escogen aleatoriamente los resultados de 80
partidos, efectuados en las ms recientes eliminatorias para el Mundial de Ftbol, y se encuentra
que 65% de ellos fueron ganados por el equipo local.

a) Es el 65% un parmetro o un estadstico? Explique;


b) Asumiendo que no hay ventaja de campo, y por lo tanto que los equipos locales ganan el
50 % de sus juegos, determine la probabilidad de que los equipos locales hubieran ganado
el 65% o ms de sus partidos en una muestra de 80 resultados;
c) La informacin muestral (que el 65%de los juegos fueron ganados por el equipo de casai
provee fuerte evidencia que Ios equipos locales ganan ms de la mitad sus partidos? Ex-
plique.

18. Supongamos que el 80 % de todos los residentes en Guayaquil celebran la fiesta de Navidad (el 25
de diciembre.) Se planea seleccionar una muestra aleatoria de 300 guayaquileos y determinar
la proporcin de ellos que celebran la Navidad.

a) Es el 80% un parmetro o un estadstico? Qu smbolo usa para representarlo?;


b) De acuerdo al Teorema del Lmite Central, cmo variar la proporcin de quienes celebrarr
la Navidad, de muestra a muestra?;
c) Determine la probabilidad que menos de las tres cuartas partes de la muestra celebre la
fiesta;
d) La probabilidad calculada en c) sera mayor, menor o igual si el tamao de la muestra
fuera de 800 personas? (Usted no necesita realizar clculos.) Explique,

19. En un canal de transmisin de datos Ia probabilidad de que un bits se reciba con un error es
1 x 10-5. Si en una transmisin se envan 16 millones de bits, cul es la probabilidad de que
no ocurran ms de 150 errores?

20. Segn las estadsticas de trnsito, se ha establecido que en una noche de viernes, en promedio.
1 de cada 10 conductores est ebrio. Si un fin de semana la polica realiza 400 pruebas de
alcolemia, cul es la probabilidad de que el nmero de conductores ebrios detectados:
6.5. Ejercicios L97

a) menos de B %?; c) al menos 10 %, pero menos de 73%?


b) ms de 12.5Vo?;

21. Supongamos que el 40% de los votantes est a favor de Ia reeleccin del actual alcalde.

a) Si se selecciona una muestra de 600 electores de la ciudad, cul es la probabilidad de que


la proporcin muestral de votos a favor del alcalde est entre eI37To y el4570?;
ie
b) Cul debe ser el tamairo rruestral para terrer una probabilidad det 97 % de que la proporcirr
de votos a favor del alcalde en la muestra no se diferencie de la proporcin supuesta en ms
deI2%?
a_
22. La mediana de la edad de los habitantes del Ecuador es de 26 aos. Si se seleccionan 100
residentesenEcuador aIazar, calculelaprobabilidaddequeporIomenos el 60% deellostenga
menos de 26 aos.
.tD
1.,-, ,
Lt) Se ha estimado que eI 437a de los estudiantes de leyes considera que es
muy importante que se
imparta un curso de tica en la abogaca. De una poblacin de 800 estudiantes se tom una
muestra de 80. Calcule la probabilidad de que ms de la mitad de ellos opinen de ese modo.

24. En la segunda vuelta electoral los resultados clan que el candidato ganador obtuvo el 55 % de
los votos. Cul es la probabilidad de que en una encuesta realizada a 169 personas el resultado
no muestre una mayora a favor dei candidato?
o
En una encuesta realizada con una muestra de 3000 personas adultas escogidas al azar, ha
resultado que el 35 % toma caf al menos una vez al da. Con una probabilidad del 95.5 %,
entre qu lmites variar esta proporcin para Ia poblacin completa?

26 El tiempo que esperan los peatones para crllzar una va muy transitada se distribuye en forma
exponencial con media de 1 minuto. Si en una hora llegan 95 peatones, calcule la probabilidad
<i de que por lo menos la tercera parte de ellos tenga que esperar ms de un minuto.
-.-
Lr--

27 IJnajedrecistaexperimentadohaganado eI70% delaspartidasquehajugado. Sienelprximo


mes va a participar en un torneo en el que va a jugar 25 partidas,

a) calcule la probabilidad aproximada de que gane por lo menos el 80 % de ellas;


b) calcule la probabilidad binomial exacrta de que gane por lo menos 20 partidas;
c) qu hiptesis son necesarias para que sean vlidas Ias respuestas a) v b)?

Distribucin de la varianza
28 Con el empleo de Ia tabla de la ley X2 Iocalice Ios siguientes valores y represntelos, aproximacla-
mente:

u) rBss(e); ) xSgg(12); c) xfrorr(20); a) xfrou(to).

rr 29 Si X1 , X2,...,X9 son nueve variables aleatorias independientes y distribuidas segn una ley
l.- !-
It[(t2,32), calcule la probabilidad de que la varianza muestral sea menor o igual que 56.28.

30 Calcule Ia probabilidad de que una muestra de tamao 13 seleccionada de una poblacin normal
con varianza 4 tenga una varianza muestral:

a) menor que 7.01; b) entre 1.I9 v 2.7.


198 Captulo 6. Distribuciones de Muestreo

31. Encuentre la probabilidad de que una muestra aleatoria de 20 observaciones, de una poblacin
normal con varianza o2 :5, tenga nna varianza nuestral s2: a) rrayor a 8.1; b) entre 2.66 y
9.52.
ta
L, En los ltimos 5 aos, las califlcaciones del exarrren de aptitud para el ingreso a la universidad,
siguen urra distribucin nolmal con variarrza o2 :8. Considerara usted o2 :8 como un valor
vlido de la varianza de las notas de los exmenes que se rindieron este ao, si una muestra
aleatoria de 20 calificaciones arroj un valor de s2 : 16?

J.t. En una oficina de seieccin de aspiral.tes para optar por una beca se estudia Ia varianza de las
calificaciones para identificar fcilmente a los mejores aspirantes. Para una prueba de matemti
cas se supone que las calificaciones se distril)uyen normalmente con desviacin estndar de 10.
Hay 15 aspirantes a optar por una beca. Calcule Ia probabilidad de que la desviacin estndar
de las calificaciones de clichos aspirantes sea mayor clue 7.
q/
t)1. En una granja pisccola se mide la varialrilidad en el peso de los peces capturados. Las normas
internacionales indican que el peso est distrilruiclo segn la ley normal con varianza o2 : 225 82 .

Se pesan 27 peces y se calcula su vatiarrza s2.

a) Estime aproximadamente Pr(s2 > 150); c) Calcule E("') y Var(s2).


b) HaIIe Yr(s2 > 362);
o<
JU. El sueldo anual de los ernpleados cle urra iristitucin se supone que sigue una distribucin norrnal
con desviacin estndar de 100 dlares. Si en una inspeccin Ia oficina de irnpuestos toma una
muestra de los sueldos de 17 empleados, determine un intervalo en el que quedarlavarianza,
de los sueldos anuales, con una probabilidad de 0.9.
Otras distribuciones de muestreo
36 Con el empleo de la tabla de Ia ley localice los siguientes valores y represntelos, aproximada-
mente:

a) s 1(9); b) 1(12); c) o.ozs (20) ;


d) o05(16).

.)/ Si X1, Xz, ..., X9 son nueve variables aleatorias independientes y distribuidas segn una Iey
/(8, 4), calcule la probabilidad Pr (f ST < 9; 1.09 < t2 < 10.045) . (X v s2 son independientes)
38 En la ciudad capital. el precio rredio de venta de las casas nlrevas es 115mil dlares. Se toma
una rnuestra aleatoria de 10 casas nuevasr resultando una desviacin estndar de 25 rril dlares.
Cul es la probabilidad de que la media muestral de los precios de venta sea:

a) menor de 104mil dlares?; b) mayor de 110500 dIares?

39 Se tom una muestra de 16 directores de oficinas de una ciudad con el fin de estimar el tiempo
medio diario que emplean en desplazarse hasta su trabajo. Si Ia media cle los tiempos es de 87
minutos y Ia desviacin estndar de 20 minutos, calcule la probabilidad de clue la media muestral
sea menor de 100 minutos.

40 Con el empleo de la tabla de la ley F localice los siguientes valores y represntelos, aproximada-
mente:

a) ,Fo r(9,5); b) ro o1(t2,t2) c) 'P 025(20,7)r d) b05(15,4).

47. Dos muestras aleatorias inclependientes de tamaos 27 y g, respectivamente, se toman de una


misma poblacin normalnente distribuida. Cul es la probabiiidad de que la varianza de la
primera muestra sea r,l menos el cudruplo de la varianza de la segunda?
6.5. Ejercicios 199

72 Dos nruestras alertotias irrclependicntcs cie tanraos 7 y 13, r'cspcc:tivarnente, se totu] dt: ula
rnisrna poblacin rronrrlrnente clistribrriclr. .Cul cs lir probabiliclid cle que la variarrz cle lr
llirnela rnrestla scl rr)r-\/or igrral zrl tliplc clc lr r'rlianza cle lrr strgrrndr mucstra?

- \2(20) ), l': Halle los valores <lc r y b tales


1.f
f'J Sean X1 - X2(9) , X2
#fr
qr.re

Pr(o(Y<b):0.925 y Pr(Ylg) :0.05.


14 Sean X1 y X2 Ltna mlrestrr cscogida cle una poblacin normal cstn<lar.
/ \, -. r 2
a) Determine la ley cle distribucin de p : (*f# )
\Xr - Xz/ '
b) Calcule la probabilidad Pr(F < 16).

Una muestra aleatolia de tarnao 16 sc seleccion a partir de una poblacin normal de media 75
y desviacin estndar B. Una segunda muestra alcatoria de tamao 9 se tom a partir de una
pobiacin normal de media 70 y desviacin estndar 12. Sean X1 y X2 dos medias mrrestrales.
Halle:

a) la probabilidad de que Xt - Xz sea mayor que 4;


b) Ia probabilidad que 3.5 1 Xt - X2 < 5.5.

6 Una firma comercializaclora afi.rma que el peso medio (en gramos) tq y pz de dos marcas de
atrr enlatado, A1 y Az, es el mismo. Para verificar la afirmrcin se escogen dos muestras
independientes de tarnaos 36 de cada marca. Si la rnedia mlrestlal de A1 es mayor que la
media muestral de y'.2, sc rechaza gue Fr : 11,2, e\ caso contrario, se accpta gue Fr : 1tr. Cl'l
es la probabilidad de aceptar eue lr : lt2, cuando realmeute p : ll2 l2? Suponga que las
poblacionales son o?:9 y o2n : 4.

Para comparar la duracin media (en rneses) Ltt y ltz de dos marcas de bateras , A y B, se
tomaron dos muestlas aleatorias independicrrtes de tamarlos 32 y 36, respectivamcnte. Si Ia
duracin promedio (mrrestral) de ,4 es mayor que la de B en ms de dos rneses, se acepta que
ltt ) l-tz; caso contrario, se acepta qlre /t : 1t,r. Calcule la probabilidad de aceptar q:ue 17 ) r"2,
cuando realmente Ft: ltz. Suponga que las varianzas de las duraciones son o2: 16 y o2B: g.
,i
EI administrador dc r-tn edificio quiere decidir la compra de lmparas fluorescentes de mrca 7
o [/. Pala ayudarle a lealizar su decisin) se escogen dos muestras de tamaos 10 y 9 lmparas,
respectivamente, rcsultando las desviaciones estndar de s1 : 200 y sz : 150. Si la diferencia
entre los promedios es rllayor que 173 horas, se acepta eue pt I pz; de 1o contrario se acepta que
l-Lt: llt. Cul es la ltrobabilidad cle aceptar cre /t f -t"2, ctando realmente pr: p2? (Asuma
que Ia vida irtil dc ambas narcas tiene distribucin normal con valianzas iguales.)

Para cornparar los salarios que pagan a sr.rs empleados dos fblicas cle cobijas, San Lucas y
Cebra, se escogen dos muestras aleatorias cle tamaos 16 y 13, respectivamente, de las dos
fblicas. Result que la^s desviaciones estindar filerori sr: I20 dlales y sc : 55 dlares. Si
la difer-encia entre las rnedias rnnestrales no es tr]yor a 65 dlares, sc acepta que ,r,1 - /-2; caso
contrario, se accpta eue /r,1 I Itz. Cul es la probabilidad de aceptar que /1 I p,z, cuando
lealrtretrte Ft : I,tz7 Suporrga que los salarios, cn ambas empresas, siguerr una distlibucin
nornral con valianzas difeleutes.

;c Dos plogramas de televisin tienen como latings 40% y 20Vo, t'espectivamente. Se tom una
muestra de 300 hogales qne poseen televisor, durante Ia transmisin del programa A y otra
muestra de 100 hogar"es durante Ia transmisin de B. Cul es la probabilidad de que los
resultados muestren qr:e el programa A tiene un rating mayor al de B, en un 70%?
Captulo 6. Distribuciones de Muestreo

51. Un frbricarrte cl 30% de mrrjcrcs y ei 20% de hornbres prcficren su jabn dc tocador.


-ifirulr que
a 200 pelsonr^s d<: crda sexo) .colr qrr pr<,rbabilidad ia proporciu
Si se realiza lrna crrclresta
muestrai de mujercs rrelros la propolcirr nrrrestral de valoncs estin en el interrralo (-19 %.
Is%)?

52. Se escoge una mnestra de 600 electores crrc acaban de votar, entre la,s 9:00 h y las 15:00 h, pare,
estimar la propolcin cle votantes a favor de los canclidatos H y M. En una encuesta rerlizada l.
vspera, se estim en 30% y 35% los polccntajes cle apoyo de los dos candidrtos, respectivanielte.
.Cr"rl es la probabilidad cle clue la proporcirr rnuestral de B excecla a la proporcin rnuestral de
A en al menos I0%?

53. La msica romntica es preferida por el 30% de mujeres y eL25 % de hombres. En una encuesta
realizada a 300 personas de cada-sexo, cul es la probabilidad de qne la proporcin muestral de
mujeres que prefieren la msica romntica, sea mayor a la de los hombres?
Crptulo 7

Estlmacin de Parnnetros

Todos ltentos estado lo,cie'rd,r esto,dst'ica, todo, La ui,elo,.


er el sentido que cada u"no ha estado octrpado sacando concltsiones
a parti,r de obserua,ciones empr'icas, casi desde el nac'im'icrto
W. Kruskal

:n el Captuio 1 se expusieron varios mtodos qr-re permiten descrilrir un conjurrto de datos de rna-
,-era r'pida, generai y efi.caz; estos mtodos son grtficos y su intelpretacin es fcil, pero tienerr el
:-cortverrieute cte la dcscripci<in cle los datos no es rnica y no sc plcstan para realizar Jrreclicciorres.
:l rtso clc la ittforrnacin que se obtiene a partir dc unr muestra pa.la sacar corrcinsiones soblc lr

rllacin de la quc ella 1>roviene, se cleuomira itt.ferenci,a esto,d,,stica.


- la inferettcia estLdstica que se clescribiln cn ste y los sigrrientes captnlos sc leficlerr
s rntoclos de
. ia r:stitnrcin de ltarrrtetros, ltr formulacil y verificaciiin c1e hipcitesis soblr: estos ptrlzintctlos 1; l
-antearrrierlto cle rnodelos aclecuaclos pzrra krs drtos.

;.1. Estirnacin

-. teora de 1r estirnacin de parmetros fue clesarrollacla en las primeras dcadas clel siglo XX,
Ilo rurt parte de otra teora (las pruebas de hiptcsis) y sistematizaclir por J. Neyrnarr cu 1934.
-- tualmente, esta teora es la basc de cr-ralquier estudio estadstico.

-"tartclo sr toma ttna nutestra de una poblacirr, e1 olljetivo es tenel un indicio cle los valoles cle los
.-rrnetros descorrocidos de sta. Tal proceso se dc:nomirta est'imarcin y a los valoles crlculrclos
'. inladores.
Definicin (de estimador) IJu cstimador es rlua nieclida estrdsticr qrre permite conocer o
-:,a idea del valol de ttn paliimetro dcsconocido, basndose en la informacin de la mr-rcstra.

- :' ejcrnplo, si disponerrtos cle una poblacirr cr-rya rneclia .r, es desconocida, es natulal cscogcl el
:. rrnedio r conro estirnador clr-. r,.
,:,,selvemos que un estirnar,lol es nna variable aleatolia; rnientras que Llua estirnacirr es nn nrrnct'o.

:--lr.ttrs veces)
los estirnadorcs dc los parzmetros poblacionales se distingr"ren clel verdadero r'rlol
:'--diante el empleo del smbolol Por ejenplo,

20r
202 Captulo 7. Estimacin de Parrutetros

p : verclrclcro rralol clc la propotciri ltoblaciottal.

f : proltorcin poblzrciorral cstirrracla, ir partir cle una rnnestr-r.

Las siguientcs secciones lrs declicalenros r cono(icll las plopiecl:rclcs cle los cstinrrdores clc los pnr'metr,,-
poblacionales, a evaluar su r.aliclez \' r cxporlcr s'.is aplicaciones.

7.2. Clases de estimadores

Cuando sc obticrre una rnuestra de nua poblacin, el objetivo es tomar una decisiti cu brse de I

estadsticos calculaclos a partir de los datos rnuestlales; luego ellos se resumen en frascs como I..
siguientes:

1. trn 2930 de los 10 000 hogares de Ia ciudad se sintonizaba cierto prograrna de televrsrn.

2. EI nivel dc desocupacin en el pas es ei 14 % de la poblacin en edad de trabajar.


t
.). La mtrestra usando el Material A tiene, en promedio, una fortaleza a la tensin 3.2 unidade.
mayor que aquella empleando el \4aterial B.

Los estimadores anteriores dan una idea concisa de los resultados de la muestra, pero no inform.:
de su precisin. As, pudiera haber gran diferencia entre tales estimaciones, calculadas a partir C=
una muestra, y Io que uno podra obtener si dispusiera de una cantidad ilimitada de datos. Pr::
ejemplo, 74Vo sera una estimacin razonable (o prediccin) de la desocupacin el prxirno mes; per'(,,
',cun <<buen>> estimador es? Teniendo en cuenta Ia variacin en el mercado laboral, sabemos que e:
improbable que el prximo mes haya un nivel de desocupacin de eractamente el 74%. Sin embargc
podemos esperar que su valor sea <<cercano>> alI4To, y qu tan cercano? Podemos esperar que se:-
dentro del 10.1% el estimador?, o dentro del tl Vo?, o dentro del +I0%?

A partir de la discusin anterior podemos deducir que existen dos tipos de estimadores: uno que ci:-
un valor numrico qlre resume lo observado en la muestra; y otro que, adems, expresa la incertidunr-
bre debida a Ia variabilidad en los (generalmente limitados) datos. A continuacin definimos m-.
formalmcnte estos tipos.

Definicin (de estirnador puntual) Sea X1, Xz, ..., X,"Ltrra muestra aleatoria seleccionada de
poblacin con distribucin de parmetro 9. Se denomina estimador puntual del parmefto 0 a
r.rna
cualquier estadstico que proporciona una estimacirr del verdadero valor de 0.

Al estimador puntual cle d se le nota d,,.

Por ejemplo, si la media poblacional es p : 6, obtenemos ttna muestra 5r determinamos Lrn promedi,-
z : 5.85. sta es una estimacin puntual de 1.
Tambin, mencionamos que la estimcin puede realizarse mediante Lrn r-ango de valolcs entre lo.
cuales se encontrar cl verdadero','alor con alta pr-obabilidad.

Definicin (de estimador por intervalo) Un estimador por intervalo de un parmetro descono-
cido est dado por clos puntos, qne pretenden abarcar el valor leal del parmetro.

Por ejemplo, si la media poblacional es p : 6, obtenemos Lrna muestra y determinamos el intervalc'


: (5.4;6.2), este intervalo es una estimacin de -r,. Posteriormente, indicaremos cmo construir tales
intervalos y evaluaremos su exactitud.
7.3. Estimacin puntual 203

7 "3. Estimacin puntual


No tocio estirnrclor'reliza rrrra Lrnen estirir-cirr clel par'rnr:t,ro Un buerr estimaclor e-q rquel clue est
cerc clcl parmetlo estirnado; para lo crial clebr: cr.rmplil cieltas propiccladcs) clLle \anios a examinarls
a continuacin.

7.3.1. Propiedades de los estirnadores puntuales


Lo irnportante de urr estimaclor es qrie 1 pueda ernplealse de manera confiablc; por cjcrnplo. que no
difiera de manela aprcciable del verdadero valol dcl parmetro poblacional.

Definicin(de estimador insesgado) IJn estirnarlor I es insesgado para cstimar d

E(6):e
De otra manera ? se llama sesgado.

La Figura 7.1 muestra un estimador insesgado y un estimador sesgado

D--
L -_

:-'
i::

Figura 7.1: Estirnadores insesgado y sesgado.

\otemos que la rlistribucin muestral para el estimador sesgado est desplazada hacia la derecha de
4. Este estimador sesgado, probablemente, sobrestima 0.

E1 sesgo de un estimador se mide corno

sesgo(?) :E(A) - a

Ejemplos
l
1. La media muestral X es r,rn estimador insesgado de ;, ya que E (X) : p
,n

>a x?
,i-t
\/ -X2 :
'
El estaclsti c< no es un estimador insesgado de r, ya quc E (t/F) + u
17

.'l- disponemos de dos estimadores insesgados de , interesa tener nn criterio para elegir uno de ellos

Definicin(de estirnador eficielte) SeaL?1 y ?2 dos estimadores insesgados de d; ?2 se


que es ms efi.ciente que d1 si Var(d2) < Var(d1). (Ver Ia Figura 7.2.)
204 L)ttptrtlo 7. Estitnacin de Partnetros

E(0:) = 0

l-igrrla 7.2: Estirnrcloles insesga<,los corr clistirrti valiarrza: Var(d2) < Val(91)

lDados dos estimaclores iusesgados de un misnro par'rnetro, es irrcferibl escoger_'el nrs eflciente. I

A vcces se prcsenfa el problema de elcgir entre dos est.irnaclorcs corr propiedades contrapr-restas: Llno
de cllrs es iusesgado y el otro es sesgado, per-o con nrcnor valianza. En estos ca,sos cs necesario dcfinir
una mcdida qrle Dos pcrmita lcaiizar tal conrl>aracin.

Definicin (de error cuadrtico medio) El error curdrtico medio debido a la estimacin de
d nrediante D cs ECM(D) - P lf e -hV].
L' l

Pol las propiedades de la esperanza se tiele quc

trCM(a) - val(D) + (.".s-oi0;)'


\/
As, paia los estirn.dores insesgaclos, ECM(?; - Varl?;.

-1r*it*rt-tcr,"rpr'"f erilrt."r....lg",=1.1,r.'t"rrgn ei rnenor ECM.I


Ejemplo. Seir X1 , X2,. .. . X5 Lllta rtmestla alcrtotir cle rrna ltoblar.in par.il la cr-ral E(X) : Lr t
: 02, i,: 1, ?, . . . .5. Se tienen los siguieul,cs cstinrrclores clc -r:
Var(X)

v
u]
-
14 1, ir: ,r(Xr +,Y.r + xr;,
^t
0t: )(xr
'2- * 2_Y), 0q:-Y:
I
F-Y2-r- Xtr-Xq-X).
r("t
a) Segrn el criterio de la eficiencia, cul es el rnejor?; b) Cornparar los estimaclores0zy ?3 rnecliantc
el ECM.

Sol,ttc'in,: Calcnlemos lzrs esperanzas y las variarrzas de <:aclr r.uro de los esl.imadores:

E(01) : .r, n(6r: ,,, B(?r) : *r,,


)' EqBn : ,.

Var'(?1) Vzrr(X1) :62.


')
VaL(02)
1
Var(X3) - Var1X5) :- o'.1
n(Var(.Yr)- D
1

I )
tar'(0) ;(Var (X) + 4 Var'(Xs)) : a,
DO-
44
,2
Var(?a) VallX,) : --.
r-
7.3, Estitnacitt tuttLual
205
r) Elcstinta'<[,r03css.sgirclo,rttictrtt1s.1,,,r?,.i.t:,/,usr.rrrirscsgrtles;
estinlldor
aclenrs,04:Xcsel rrc.loI
<[e 1, lol'rrte ticnr ll nrcrror r'rr'irrLzt (r,s cl rrriis <rfir:i.rrtc).
l,) Crlctrlcrtr<-s los scsg<_ls clc los dos cstiru;r, lorcs

sesgo(2) : E(0!)-g-. r, - t :0.


te.gu(?,r) 31 :ttr.
=: ll(),) - 0 : ,lt-lt
Entonces, el ECM es

ECM(ar) : Var(?2) +(r"r_,u102)2 :=-*0


o2 o2
.t 3'

l') :
ECM(as) : Var(?3) +(."rgu1D3)2 :-Tii:o' /7 \2

El mejor estimador ?2 porq,re tienct <ll nrcuor. er.roL cu;rrh-iti< :o nredio.


".

7.3.2. Estimacin de la media poblacional

que el p|orncclio cs rLlI cstiuraclol iuscsgcto


de la media poblacionz y
ffiffj::ffii1,1;Tl:::T]emos
Supongamos qr-le se obtiene una muestr a X1,
.... x,, de una poblacin que tiene media y varia.za
,x2.

o2. La merlia nluestral se clefine pol X - :--t


I ,\,"
'tL

. La esperanza de X es

E(X) : --E
I
_1 ttt'' : !@r')
lt ?t
f
De manera que T es un estimaclor insesgtrcl r.t <I<: t.

La varianza de X es

Vrrr(,{) : Var -;t.'I var (') :* : \qro,


? !
:-
var(x)
Tt.

o-,
77

;.3.3. Estimacin de la varianza poblacional

) _lpongamos (lnc sc oltieue rurr nlrrestl,a


-\-1. .\-2.. . . . .{,, (l() lurr
.1. El estimador. r<;,lrlerci,iu gut: bit:ue rtredia l y variatLzir

5"*l --,,,
206 Captulo 7. Estinacin de Parntetros

os rlll cstirlrrclor'lrrrrrlrral ci<r o2. rerro lirtuc cl irLc:orrvclricrrl.c clc s<:r scsgado. pol Jo (rc sc rkrfinc

s,2 - --1-f r-ru _ x)r,


,, - 1/-t--'
t.-1

clr.re e,s ulr estimr<.lor irrscsgirclc, par',t rr2

. Lt esJrer'lnza de .92 es

D(xu -x)'
,i.:t
rt-7

: -1=e (>.r-,"') : ,_-l-rlir(x,,) -


\t:1 / li=I

Corno E(Xi) - tL2 E(-') : t,' - *,sc t icne


+ o2 y

', f "
E(s2) : fr' + o") -, ,lI (r'- #)l
" - L=l ' )
I.).)r.)1,)
: -i-(npt
11
+ no2 - ,, r2 - o2) : n-l (n - l)o:
-t
: o2.

2oo
L r'arianza de ,S2 es Vzrr'(52) : (este resultaclo no se clernostr-ar' ya qLle su complejida,J
TL- a
|
sale del alcarrce dc esta obrz-r) .

7.4. Mtodos de estimacin puntual

Para detelrniual la cstimacin cle rLn pirrmetro poblacional existen varios nitodos, los dos ms im-
roltantcs son el de los rnomentos y el de mxinra verosimilitud.

7.4.I. Mtodo de los rnonr.entos

EI rntoclo de estiniacin de los tnornentos fire dcsarrollado pol K. Pealson en 1880. Es r.rn mtodo
gcller'rl t1c estiulrcirr de uuo o ms pirlzinreltos y se brsa cn lr idea de tornrr conro estimadol cle la
media a la rneclir rnuestlal. colrro estirntclol de It rtaliarrza r Ir valianza rnnestlal, y as succsivmente.

Err genelirl, si derrotrrnos fr,: E(X'), denominrdo el A-simo nn'ntento teri,co clr larrariable X. EI
/i;-siro nt,cnett,to nnt,e,stra,L es 1r valirble

rrl
i^ : L, rL
A, : 1.2.3.. . .

Entonces, igualamos los correspondientes momentos terico 1'muestrali pk: p. y resolvemos Ia


ecuacin resultante para d.
7.4. Mtodos de estitnacin puntual 207

El itcorrvcuicnte cl<,r cste rrrtoclo es (lrre los estirrrr,:loles olrtclri<[os, rnnc:hzrs \eces sou sesgt(los.

Ejerrrplo. Disp<trrcrrros <le rrtrt lnllestr'r Xt, X2,.. ., I,,. ixovtrtriculr: clc ttttt irrtblaciu t:orr rlistlilrrr<:itr
Ul-9,l , rlorr<lc d > 0 cs clcsc:ouociclo. Hlirr'li cstirnrcirr clc .

Soluc'i'n: Teuemos que/:tr(X) -0y I,b:E(X') :Var'(X) +(E(X))2 :+ Pot r,,tr'olaclo.


3
n
D X;,
:1
t0') - n,

Si igtralarno s ltz y p2, obtenem.. :


+
Entonces, el estimador de I es d :

7.4.2. Mtodo de m:ixirna verosinilitud


El mtodo de estimacin pol mxima velosirnilitud fuc desarrollado por R. A. Fishel en 1920. La
rentaja de este mtodo es que utiliza Ia informacin sobre la Iey de distiibucin de Ia que proviene la
muestra.

Sea X1, Xz, ..., X,, una mnestLa proveniente de una distribr-rcin con par'rnetro 0 y ley ,f (r;0). El
procedimiento a seguir es el sigttiente:

1. Determinar Ia fn:nc'in de uet-osi'milittt,d de la muestra en sLrs valores lespectivos: Esta fuucin


del parmetro d est dada por

L(0): f (Xt;0) x,f (X2;0) *...x.f (X,,d) : lI'i,:t f l].;e).


2. Encontrar la .funcin de log-uerosi,mi,litud tomando el logaritmo de la funcin de r.erosimilitud.

L(0) :log(l,(d)) :i ros.f (x;0).


'i:7

3. Hallal el valor cle d que maximiza Ia log-r'erosiniilitud. En este casoT es el valor'?, q.," cs solucin
de Ia ecuacirr
dt
-:n
d0

Observacin. Si lr distribucin de probabiiiclad contierre k lrarmetros, 01. 02, . . ., d., la estinracin


ie rnxirna verosiniilitucl de crda uno ser Ir solucin dc las ecuaciones lespcctivas:
ar, _at, _ t) at _ /l
00t 002 0o*

Ejemplo. X2, ..., Xr, Llna muestla provenierite de tirra poblacin con distribucirt
Sea X1 , N(p,o2).
Hallar los estimadoles de p. y de o2.
(X=
SoLuctn: La funcin cle densidad de la ley es /(X; p,o2) : +"*O-'v (- f)'\
2o2 )
/2tro \
208 Captulo 7. Estimacin de Parutetros

Dc ttrurcrr clrtc la fruiciciu ck: r'clr-silrrilil rr<l cs

r,(r.o2) : (1*, t,,o2))" : ( r-g)


h"*
: )""*n(-Dry)
La funcin de log-verosimilitud es

1'r
t(p,o'): Iog(.1(r, o2)): -|bgQno2) - *f(xo-,)'
O' i_1
-

Derivando I esta funcin respecto 11, e igualando a cero da

p):0,
#:-o* # lrx,-

de doncle p : - x.
Por ctlo laclo.
nI 1
-t7 +;VDtx' - p)2 :o
0t, 'L

o(ot) i:l

IL

Drxn-X)'
cuya solucin es o2 : l-1
: S*2.

l.D. Ejercicios

1. <El pr-incipio subyacente etr todas las tcuicas de inferencia estadstica es que nllo Llsa estads-
ticos rnuestrales para aprendel algo (es decir, para inferil algo) acerca de los partirnetros pobla-
cionales>>. Si usted entendi Io qr.re quiere decir esta afir'macin, escriba uu 1>iillafo en el que
describa una situacin en la que se pueda emplear un estadstico muestlal para irrfelir algo sobre
uu palrimetro poblacional. En su ejemplo, identifique claramente Ia rnuestrtr, Ia poblacin, el
estadstico y el patrnetro. Sea trn especfico como sea posible y no use cjelnplos clad<ls en el
Iibro.

2. Se tomr Lrrta muestla cle tamairo 4 de una lroblacin de rnedia t" y varianza o2. Sc lrroptnre los
siguientes estimadores de I media:

Xt -l Xz + 3X4 -f
0,: , 02: Xr Xz + 2XJ
4'
03: Xt'l Xz * Xs * Xq Xt*Xz*X+X+-J
, 6n:

lndique su orden de prefelettc;ia (clel me.jor al peor) 1, explic$re los motivos dc su <rlrsificrli,irr.
7.5. Ejercicios

3. Dos muestras alcatorias independientes se extraen de una poblacin con media p, y varanza o2.
Los tamaos nruestraleS Sor ??,1 y rL2 : ? v tu. meclias muestrales son X1 y X2, respectivamente.
2'
Para estimar a lL se proponen tres estimadores,

\'t : Xt. Tz:X', Tr: Xt ! Xz


2

a) Diga si 1os estimadores son insesgados;


b) Encrrentre su varianza;
c) ,Cul de los tres estimadores es mejor?

4. Si se dispone de una muestra Xt , Xz, X3 de observaciones que siguen una ley exponencial e Q' 1 0) .

Considere los siguientes estimadores

0,
*t .
: .yr, 0., : ', :2"2 a, : IJ:3!2, :x an .

a) Cules estimadores son insesgados para d?;


b) trntre los estimadores insesgados de 0, crl estimador escogera usted y por qu?

5. Si se dispone de una muestra Xt , Xz, X3, Xs, Xs de observaciones que siguen una ley de Poisson
P(^). Considere los siguientes estimadores:

Xt -f2Xz * X: * 2Xq -f Xs
a,

0n :xl+xl.
a) Cules estimadores son insesgados para )?;
b) trscoja el mejor estimador insesgado de ).
A partil de una poblacin que tiene media p, y varianza o2 se tomalon tles muestras de tamao
rtr : 7, n2 : 74 y nz : 9. Sean sl, tS V t:3 las varianzas muestrales calculadas a partir de las
muestras. Compruebe que
t tsl+usi?r+osl
30

es un estimador insesgado de o2.

El nmero de clientes que ingresan a una librera en una hora es una variable aleatoria X que
sigue una distribucin de Poisson con media ). Se dispone de una muestra aleatoria Xt, . .., Xn
del nmero de clientes por hora.

a) Determine un estimador inscsgado dc );


b) Las ventas en Lrna hora se da por V : 4X + X2. Demuestre que E(V) : 5) + tr2;
c) Determine un estimador insesgado de E(lz) empleando toda la muestra Xt,. . . , Xr,.

SiXl y X2 son dos variables aleatorias independientes tales que E(Xr) : E(Xz) : p y
Var(X1) : Var(Xz) : 02 j determine si el estimador.

es un estimaclor insesgado para o2


2LO Capitulo 7. Estirnacin de Parrnetros

a estirnaclores insesgados cl<: d y (lue Var(Dr; - o1 y V.Lr(2) :


0r y 0, ,uu
Suronga q,r,r Se
formr rrn rrLlcvo estirladol cle meclirntc d3 - a?t + (1 - a)02, (0 ( a ( 1). Si ?r v 0'2 Sott
"i
indepenclicntcs,

a) velifique .1.," 03 es insesgado;


b) Cmo seleccionar cl pal'a reclucir Var(?3) al mnimo?

10 Suponga qr-re X1 y X2 son dos medias muestrales caLculadas a ptrrtir de dos nurestras dc tarnao
n,r y n2, respectivamente, obtenidas dc una poblacin normal de media r, y varianza o2.

a) Se define un estimador de p: Xs : aX t+(1- a)X,, (0 < rl ( 1). Pruebe que es inscsgado


b) Halle el valor de cy que minimiza Ia varianza.

11. Considere una sucesin de variables aleatorias Xr, Xz, ..., X", independientes e idnticamente
distribuidas que siguen Lrna ley uniforme en el intervalo l0 -7;0 +tl, donde I es un parmetro
desconocido. Denotamos por X," el promedio de estas variables.

a) Calcule E(X") y Var(X,,);


b) Construya un estimador 7,, del parmetro d qrre sea consistente e insesgaclo y calcule su
error cuadrtico medio.

12. Sea X1, .. ., X,, una muestra aleatoria de una poblacin con la siguiente distribucin discreta

Pr(x: t):2#, Pr(X - 2): 2e' e (0,1)

r) Halle el estiniadol de d por el mtodo de los momentos;


b) Halle el estimador de d por mxima verosimilitrrd;
c) Dernuestle que los clos estimadolcs encontrados coinciden.

_1. ) Sca X1, .. ., X2s una mnestra aleatoria de tamao 25 una poblacin binomial de
r e (0, 1).
Pr(X: r): Cp'"(1 - r2-z
Determine estimador de mxinia el valor 0 ocurre 5 veces, el valor 1 ocurre
11 veces y valor2ocnrre9veces.

14. Sea X,, una mr-icstra aleatolia de

(,): sir)0, (0e


f caso crntrario.
{"n-,'*'
a) Calculc E(X) V obtenga un esl,inrrdor de g meclirnte el rntodo cle los
b) Determine si el estirnrclor cs insesgzrdo;
c) Obtenga el estimaclor de 0 por el mtodo de nrxima verosimilit,.rd:
d) Cui cle los dos estirladores es ms eficiente?
e) Calcule cl ECM d,eiz.

15. EI tiempo, eu ltoras, que dura un elemento electlcinjco es Llna vtrriable aleatoria ? que tienc.
distribucin exponencial de 1:irrmetro ). Pala estimrr ) se pruebzrn 30 elemerrtos y sc enclrentLa
que 18 fallan antes de Ias 600 horas de uso.
7.6. Estintacit) pof intervtlo 217

rL) \lr'<li;tLrl,: r'l Lrri'rtr.rr-[<l <l.c rulxiLrlt vctosiurililrr<1. <rstirnar I;r lrLo1>or'{:irjn <l<r t<t<los ]os clcrrrclrtos
rrtt' Irll;ur ;r]l1r' <lc l;ts 0()() lrrlr'rs
lr) tltilir r: r'I tt'ru]ttrlo rlt ii) I)u r ol rltrrrt'l lul osl irrrr,-lor rlr: ).
10. A lr.' l;trgo rlc rttL tio, lr ltcnrl rrr rlc tigrillo prrctlc tcrrcr rurr o rLos r:r'its. o lr() t<:rrct rrttrgrtrr;r.
I)
Scg-rirr tllr ('sl ttrIio ttrt]iztclr-' pot lllr grrrl)o tl<r zorilogos. lir plopolr:iirr rle lrcnrllrls slll (:llts os -..)
.)

lt cl<: Irts c()II turii t:rrt t-'s l..)


rlicr,tr.rs (lrrc la l)l(rl)olci()rr il<t Irs lLcrnlrr's c:orr clos (:rrsoijl-1,,
r)
rlorrclc cl palrinrctro ?) torll un \'llol'ctrtlr:0 v 1.

t) IJrillc <,'l urirnr:Lo mc<iio csl)cllirclo clr: cr'as pol lrcrnlrrir r lo lalgo clc un rrio:
lr) AI lcllizar un cstrldio de 200 henrlrr's chrlantc nu o, cl ccripo cle cientfir:os nlcliciorri(lo
cncontr' 55 hembras quc rlo hur tenido crt.rs, 106 quc h.u) telido urra cra y 39 clue han
tcnido <1os. Eshirrrc el par'rnctro p l)or el rntodo cle lrs lnomentos.

L7. EI control tle r.rna paltidzr de loclillos se rcalizr clasificardo las piezas en leqneas, rrormales y
glatrdes. Ltrs propolciones tet'icrs sc stlporel) pr : 0.05; pz : 0.90; ps : 0.05. Pero sc sospeclta
clLte h'r. aumentado la dispersin y, por tanto, las piczas siguen las ploporciones: pr : 0.05 f ;
pz : 0.90 - 3n; ps : 0.05 + 2r. Se anrlizal 5000 riezas obteninclose n1 : 7278; n2 : 2928;
?B : 794 cle cacla clase. Obtenga una estimaciu cle ntxirna verosimilitud cle .

7.6. Estimacin por intervalo


?ccorclerrros lo cue se indic elr Llna scccin ntelior': Ios intervalos estadsticos exrresru la incer-
irlLunlrrr: clcbicla r la variabiliclad cle los datos mrrestrrles. Aderns. l)ara c{ue ellos tengarr validez eu
.,r rltlic:acitt Pr'cticrr, ticnett cltte crtrnJllil con alguntrs hiptesis l;risicras, como que la rnuestra se clebr:
irteuct de lrrncta alcatoria, irrdepeudientc y debe estr'iclnticrmerrt<l clistliltuida, lo qne llo siempl'c
.= logla. increnrentanclo ia rncnciorrada incertidumlre.

-is. por ejcrnplo, con base eu ula rl)uestr'r cle hogirres crr los quo se est r'icndo televisin, podemos
Itrstruir urt inten alo qlre coltenga, corl un glado cspecfico de coufirbilidad, la rnedia o la desviaciu
,-.tnclal clel tierrrpo clue ia roirlacir'r consrrltacla vc tclcvisilr .

-rtltes cle aulliz1r los r-lifclctrtes crsos) cxnrincrnos zrlgrrntrs icletrs irrclirninrlos.

Dcfinicin (de intervalo de coufiatrza) Uu interr'rlo cle r;onfianzl cs nn rango cle valores,
llcttlrclo zr par [it de ios clatos rnuestrarles, el clral 1-rrobablcrnento incluye cl verdadero vrlor cle nn
-,
r irrret,r'o r lescorrocido.

.-, cadr intcrr,'alo cle confiattzr se Ie rsocit rrna 1l'obtrbiliclacl (l - o) clc clue corrtenga el veldrrlero \/alor
-'llratiirnctlo . A tal ptolrabilidarl se lt: clclirnitn t,tc,l d,e cort,fia,ttzn, y a los cxtrernos cltl irLtelvalcr
tie i.n,.feri,tt v Litn'ittt srtltel"ior'<l<t c:<trrfiurza: (LIC:.LSC). Esto s<: r'esLunc cll

r\(LIC<0<LSC',):l ri.

-',- irrtt:tr'rkr <1ur: c:rttnllle cstrs c:ottdicioues se <ierLorlinit'i,tttet'uo,l,o d,e co'n,tiarr cle rrivcl (1-or) xI00(/r.
- :t t<:ucr tr,'sultitclos firlrl<s. ci rrivc] clc r;orrlirnzr <lcbr: ser'rlto, lo rnis cercir.lro a ruro: gc:trt-.rtrlnrerrtc
., f ornr 0.9. 0.95 o 0.99.
:- rtrcho de tLl iltten'alo clc crttfirrtzr nos da lr icier clc curnta inc;cltidumble existe, alredcdor del
,:iurctlo rlesc:onociclo. Uu inbelvalo muy rncho prrede inclicrr qtre deber'arnos recolectar ms datos
-"-tes clc dt:cil algo tlefinitivo solre el partinretro.
212 Captulo 7. Estitnacin de Parntetros

7 "7 " Estimacin de ia rnedia cuando la varianza es conocida


Supongir (llre se deser estinrar 1r nrcclia r c1e rina irolrltic:irirr crlr.a r.llirrLzr-i o2 c-.s c,o,rcrc:iclrr y <rc pala
tal efecto se dispone cie una rrLueslla clc r, rnecliciones: z1, :L2., ...1 :L:,t1.

Ulr intervaio cle conlianza para lir mcclia poblacional vcl clel 100(1 a) %, cst cla,:,lo por
o
(t- ttt/,2 r1r
.; L (7 1)
vn
Dondc:

a n es el tamaio de la rnuestla"

E o Ia, desviacin estndar de la pobiacin.

zo2 eI valor z que colresponde al .",- I en el extlerno superior de tra distribucirt norrnai
2
estrrdar; es decir, 7 - (z*2)
\ttl.,/2,
: : (Figura 7.3).

Figula Intervaio de estimr.cin

Acln se aplicir el Teorerra del Lmite Central y es aconsejable tencr un tamro rnucstlal n) 25.

Iln Xrr siguiente tabla se preserrta ios intervalos de confirnza ms corrLrrrtnente usaclos:

Nivel de
cor:fiarlza
0.90 0.10 1.6.15 I.6a5 oI /n ;) 1.645 o l1/n,
0.95 0"05 1.96 T. 1.96 o I yE 4), t.s6 oI l
0.99 0.01 2.58 '-u 2.58 o I y, ;I 2.58 o I y.

Observaciones

1 Si cl tamro de l rnucstrt cs suficicttcmentc gltrrrcLc (rt / 25) 'se <lescorioce 1r r'rri-Lrrza. -.


i)uecle rrtilizar el intervalo 7.1. r'eeuLplazar.Lclo {r }lol'su i:stirnrclor',s) siri piclicla cle cxrctitlLcl

2. Prresto (llre Para urr valol de znr2:3 sc tierie un rtir.cl cle r:ou{ianza clcl 99.7%- crr las zrPlicacionc..
prcticas sc supone que nrl intelvalo <le conlianz al 99.7% conticne el r'rlol cle lir rnediir, co
I rttltt ttO'"'''O o O '
Estirnacin de la rnedia cuando Ia varianza es conocida 2L3

Ejernplos

Deterrninar un intervakt cle confianza cle nivel 95 % pala Ir rneclir poblacional p" s n: 36,r : 15
y o2 :3.24.
Sol'uci,n: Sabemos cuie :3.24, o sea o:
o2 1.8,

La corrfiabilidad es 7 - a :0.95; entonces) o : 0.05 y ol2: 0.025. De la tabla de Ia distribucicirr


norml Za/2: zO.OZS: 1.96.
De rnanera que el intervalo es

/ o=) : /
(r- - .. o .o,' 'atz
'o/2
^ o\ ''rw
I.B
ltt-1.96{;1b+t ''' go 1.8\
| ''"" ^=-=
)
\- lE1" n) \'" 76t J36)
(L4.4t2;15.588).

En un estudio a trabajadores informales se seleccion una muestra aleatoria de 50 individuos


en una semana dada. Para cada uno, se determin el nmero de horas semanales de trabajo
efectivo y se obtuvo un promedio de 46 horas. Si se asume que la desviacin estndar es 3.64
horas, estimar la media del nmero de horas trabajadas por todos los informales, con un nivel
de confianza del 98 %.

Solucin: Se tiene que n : 50, r : 46 y o :3.64.


Adems, 1- c:0.98, a:0.02, (lf2:0.01 y zoot:2.33.
EI intervalo resulta:

/- o o\ : ( qA 3.6+ / 3.64\
In- z,2J-;T
*," + z*2:71 - - 2$:=;46+
- "- 2.33"'";
""
\ r/r,, ",. t/n ) \ ,/ JrT )
I

@6-1.2;46+t.2)
(aa.8; a7.2).

Ello significa que, con una probabilidad del gB %, la media del nmero de horas trabajadas
aquella semana se encuentra entre 44.8 y 47.2.

Segn los consumidores, las empresas pasteurizadoras de leche no entregan la cantidad exacta
de producto. Para verificar esta denuncia, se tom una muestra de 45 fundas, cuyo contenido
terico era de 1 litro de leche. Se encontr un promedio de g72cm3 y una desviacin estndar
de 51cm3. Sobre la base de un intervalo de confianza al 99.7 Vo, se puede clecir que Ia denuncia
de los consumidores tiene fundamento?

Solucin: Tenemos que :45, r:972 y s :


z?. 51.

Si 1 - a : 0.997, entonces zo/2 : 3.


Aunque el valor de Ia varianza es desconocida, podemos emplear el intervalo de confianza, yai
que el tarnao de la nluestra es suficientemente alto. De manera que el intervalo es

(- s - s\ : (n',t _3-a, sT2 +39\


r -
zolz
;r
+ zUz
g) \ ' r/s ,/+s 1
(eae.2; ee4.8).

Como el nivel de confiabilidad es del 99.7%, podemos decir qlre con toda seguridad,),a denuncia
de los consumidores es verdadera.
2t4 Captulo 7. Estimacin de Parutetros

Deterrniuacin del tamao do la muestra

errrtlc str r,rlor vttrclaclclc> v 1.r cstiuracitirr: 17 t-Ll. Sus vrlorr:s rrrr'arr en1 rc 0 y zr, 12!-.
Pc-,clerrnos planl<:iunos erl ploblcnra r1e enc:outlal erl trrnro cLe 1r rtLr<rstla rle rrrur()I r clrLe el error rlr-
r:stirrrr:i<in DO sc1 rnayor' <re E.

El irrterr,rlo de confianzl para ia rneclia pol)lacionrl tierre Ii forrnr @ - n;r + E), cloncle p: lt - L
<rs el cu or err li estimcirr dc 1r rneclia pala el uivci cle confirbilirlad dado. Si el irrtcn'alo tierrr: 1r
- / o o\ o
Irrnrfa {:r'- 3. /.) -;Ll zo2 f , elt1.e1p5 f'::,r.2--7.
\ Vn -
\/n / \/?l
Si de esta igualdad despejamos n, obteucmos

za/2o\2
n,: |/ ------
\E/ |

que es el tamairo de Lr muestra, necesario para tener un error de estimacin -E a nn nivel de confianza
7-c..
Ejernplo. Se desea conocer la distancia media que cor-ren scmanalmente un grlipo de atletas de fonclo.
Por estrrclios anterioles se conoce qr.re la desviacin estndal de esas distancias es cle 3 knr. ;A cunto
atletas habr quc muestrear si la estimacin debe quedar a rnenos de 0.5 km de la media verdadela.
con rur rrivel cle confi.anza deI g5a/a?

Sohtczn: El irrtervalo de confianza es cle Ia forrna (Z - 0.S;r + 0.5), entonces E : 0.5 y za/2: 1.96

Aplicanclo 1ir fr'nruJ.a,

,r: ('n/'o'?- (1'90 x 3) :,ru.r.


\E/ \ 0.5 )
Consecrteutemente, se debe tene un tamao de muestra mnirno de 139 atletas. Si la mnestra c.
demasiado alta, se deber aumentar el error admisible E o disminuir el nivel de confianza 1 - cv.

Se sr-rgiele que el Iectol a,juste los parrnetlos, para tenel nna rnnestra aproxirnada cle 50 rtletas, y lo.
llrteIi)rete.

7.8. Ejercicios
1. Deternine los intervalos de corrfinza al 95 To para t:I media pciblacional desconocid
l
si

n:45, r:5,
tt) o : 6.8; c) l : 13(). 7 - 1d.5. o2 : 4.2:
b) n, : 100, r:37, .,2
D
-
-L<)
q<.
d) n : 169, 7: -22, o2 : 14.

2. Dctermiue la iongitud del iutervalo dc confiarrza pala la rrreclia poblaciorral si:

rr)1- cv:0.96, n:25, o:0.86; c) 1- o:0.955, n:7I, () _ t tr-

b) 1 - a:0.99, n:152, o : L2B; cl) o : 0.03,


'n: I20, o'2 : 49.

3. Obtenga un intervalo de confi.anza de 100(1 - a)Tc para la media poblacional si


7.8. Ejercicios 2t5

a) cv : 0.01. 7L: 26, i:120, o:4; c) rr : 0.1, r : 90, t : 66, s2 :2.5;


b) cr : 0.05, TL: 65, r :222, o2 :57; rl) cr:0,04, n:55, :r= - 37. o2 : lE.

Dctcrminc rtri intervtlo en el que se pueda dccir que se encuentla el valor de la rncdia con casi
toda seguridad si

a) n:36. 7:100, o:4.2; 7:86. s2 :22.5'.


c) rr, - 81.
b) n: 44, 7 -- 53, o2 :7I; cI) n:\2I, T:-37, o2:84.I.
5. La cantidad mnirna requerida par que un arrestsico surta efecto en una intcrvencin qr.rirrgica
fue, por trmino medio, de 50 mg, con Lrna desviacin estndar de 10.2 ntg, en una muestra de
60 pacientes. Obtenga un intervalo de confianza para la media, aI g7 Vo, suponiendo que la
muestra se extrajo mediante rnriestreo aleatorio simple sobre una poblacin normal. Interprete
el resultado.

6. En cierto barrio se seleccion, al azar, una muestra de 100 personas cuyo promedio de ingresos
mensuales es z:460 dlares y una desviacin estndar de o : 200 dlares.

a) Si se toma un nivel de conflanza del 97To, Lcul es el intervalo de confianza para la media
de los ingresos rnensuales de toda la poblacin?;
b) Si se toma un nivel de confianza del g9 %o, el tamao muestral necesario para
cuI es
estimar la media de ingresos mensuales con un error menor a 30 dlares?

7 Se tom tlna muestra aleatoria de BB individuos a Ios que se midi el nivel de glucosa en la
sangre, obteniendo una media rnuestral de 110mg/cm3. Se sabe que Ia desviacin estndar de
la poblacin es 20 mg/ cm3.

a) Obtenga un intervalo de confianza para el nivel de glucosa en sangre cie Ia poblacin, al


90% de confianza;
b) Qu error mximo se comete con la estimacin anterior?

8 La media de edad de los alumnos qne se presentan a las pruebas de acceso a la universidad es
de 18.1 aos y la desviacin estndar 0.6 aos. De los alumnos se elige, aI azar, una muestra de
720"

a) Cul es lir probabilidad de que la media de edad de la muestra est comprendida entre
17.95 y 18.25 airos?;
b) Qu tamao debe tener rrna muestra de dicha poblacin para que su media est compren-
dida entre 77.9 y 18.3 ahos, con uua conflanza del99.5%'l

9. Una fbrica produce varillas de hierro con Lra desriacin estndar de 25 cm. La empresa recibe
tin pedido de rrarillas que inclica que la longitud promcdio debe tener Lrna des\/iacin mxima de
10 cm de la longitud requerida. Cuntas varillas se tendrn que prodncir para cumplir con la,
especificacin, con crsi toda seguridad?

10 Se realizaron 169 mcdiciorres del voltaje de ia recl de alurnbrado prblico y se registr un promedio
de 108 voltios y desviacin estnclar de 5 voitios.

a) Cules son los lrnites de confianza, a un nivei del 987o, para el voltaje medio de red dc
alumbrado pblico?;
b) A qu nivel de confianza puede decirse que la estimacin de la media incluye el valor 109
voltios?
2L6 Captulo 7. Estimacin de Parntetros

11. En una regin geogrfica, la estatura de los individuos varores (en cm) sigue r-rna N (U;7.52).

a) Halle el intervalo de confianza al nivel 92To para estimar .r,, a partir de una mnestra aleatoria
de tamao 36, cuya estatura promedio es 167.2 crn;
b) Para la rnisma poblacin, determire el tamao mnimo de la muestra para estimar LL con
un error inferior a !2 cm con un nivel de confianza de| g4%.

r2 A partir de la informacin suministrada por una muestra aleatoria de 90 locales comerciales de la


citrdad se determin el intervalo de confianza aI96%: I :(42,58), para el gasto medio mensual
por familia (en dlares) en electricidad. Determine (justificando las respuestas):

a) La estimacin puntual que daramos para el gasto mensual por familia en electricidad en
esa ciudad;
b) Qu nmero de familias tendramos que seleccionar aI azar como mnimo para garanti-
zaros) con una confianza del 96 To, wa estimacin de dicho gasto medio con un error
mximo no superior a 3 dlares?

13. La vida activa (en das) de cierto frmaco sigue una distribucin A/ (tZOO;402). Se desea enviar
un lote de medicamentos de modo que Ia vida media del lote no sea inferior a 1190 das, con
probabilidad 0.95. Halle el tamao mnimo del lote.

l4 Se desea conocer el nivel de consumo medio con una determinada tarjeta de crdito con un error
mximo de 15 dlares y un nivel de confranza de 0.97. Cul debe ser el tamao mnimo de la
muestra que se debe tomar, si se ha estimado una desviacin estndar de 45 dlares?

15 Se sabe que el contenido de fructosa de una variedad de manzana sigue una distribucin normal
cuya varianza es conocida teniendo un valor de 0.25. Se desea estimar el valor de la media
poblacional mediante el valor de la media de una muestra, admitiendo un error mximo de 0.18.
con Llna confianza del 95.5 %. Cul es el tamao de la muestra?

16 Suponga que se midi la longitud del pie dereciro a 41 estudiantes de su universidad. EI promedio
de todas las mediciones fue de28.4 cm y la desviacin estndar fue 5.1 cm.

a) Encuentre un intervalo de confianza al96% para la longitud media del pie derecho de todos
los estudiantes de su universidad;
b) Esperara usted que alrededor del 96% de todos los estudiantes tengan longitudes de pies
en este intervalo? Explique;
c) Si usted hubiera encontrado un intervalo de confranza al 907o, cmo habra diferido del
intervalo antes obtenido?;
d) Si Ia muestra hubiera constado de 141 estudiantes (los restantes datos se mantienen iguales),
cmo habra variado el intervalo de confianza?;
e) Si Ia desviacin estndar hubiera sido de 3.7 cm (sin variar los dems datos), cmo se
hubiera visto afectado el intervaio de confi.anza?;
f) Si la media mLrestral hubiera resultado ser de 25.4 cm (sin variar los dems datos), qu
habra sucedido con el intervalo de confianza?

7.9. Estimacin de la media cuando la varianza es desconocida

Srrpngase qLrc se desea estimar la media p para r.rna poblacin cuya varianza o2 es desconocida y que
se dispone de una muestra de n mediciones que siguen una ley normal: rt t2 ..., rr..
7.9. Estirnacin de Ia tnedia cuando Ia varianza es desconocida 217

Un irrtetvalo cle confianza para la media poblacional r, a un nivel del 100(1 - a)Ta, est. daclo por

(z - t.r1n - r)ft, r-t to12(n- t,#)


Donde:

s es la desviacin estndar muestlal.

tr,/z(n - 1) es el valor, de Ia distribucin de Student a (rz - 1) grados de libertad, para e1 cual


ct
el rea en el extremo superior es igual a
2

Ejemplos

1. La cotizacin diaria de una moneda frente al dlar sigue una distribucin normal de media y
varianza desconocidas. Se eligieron 9 das aI azar, Ia cotizacin fue:

65.3 66.2 65.8 66.0 66.1 64.5 65.2 67 .r 64.2.

a) Determine tln intervalo de confianza, al g9 7o, para la cotizacin media de la citada moneda'
b) Con qu confiabilidad se estima la media en un intervalo cuya longitud es 1.116?

Solu"c'n: De acuerdo a los datos, n : 9,T : 65.6y s : 0.9.

Aclems, 1- a:0.99; de modo que *z :0.005 y ooos(B) :3.355.

a) trl intelvalo es

(z - t''1' - 16:T-t to/z(n - I )+)


'r/"/ : ( ur.u -3 bbT: 65 6 + 3 3biry)
\ /9 ,/9/
(64.59;66.61).

1.116
b) Si la longitud del intervalo es 1.116, entonces el en.or.mximo es -E : : 0.558 y como
E : t,"2(n - f)*; entonces, sustituyend.o valores:
\/n

0.558 : t,n6)9.
\/9

De donde, t^pg): *#44 : 1.86.

Si examinamos en la tabla de la ley a 8 g.1., verros clue /sos(8) :1.36. De maner.a qnc
a
; : (-).05; por lo tanto, ci:0.1 y I - d:0.9. El nivel de confianza es del 90%.
El tiempo qlle un aparato de televisin perrnanece encendido sigue una ley nolmal. Por meclio
de rtn audmetro se registr este dato en 10 hogares dulante Llna senrana y se calcul el promedio
dialio (en rninutos). Los resultados son los siguientes:

248 r77 110 200 135 i85 224 155 180 166.

a) Deterrnilrar un intet'valo de confialza para el tiempo promedio diario que los hogares rlilarr
. televisin, a un nivel del g5 %;
218 Captulo 7. Estitnacin de Parnreros

(lll(,'ol t,:ILol clu la csl irLlacitil s(rr lr)clror'L 2[) rrirr

,9ol,ttt:irit:

tr) El lrlr>ine<lio v 1r rlcsvirc:in crslilrclrl son igrrakrs ti - I77.(i v s - 39.92. r'r:spr:irtiviurrorrtci


y si I - ci: : 0.95. /o.o:(9) :2.262.
lll irrterr.alo r cclueri<[o (lllcda cc)nro

(trr.a_ ) )()2'-143:)77 t - . "u2t)[) :,,4e.0Li;206.14).


\ /10 ,/10 /

b) Aqu no se puede aplicar dircctrmente la fr'mr-rla del clculo del tamao muestral, ya clu
Ios vrlores de la lev / raran scgrin el nirmcrr cle grados cl< libertad) pcro el plincipio cs e-
nusnlo.
Se -B : tot(n - l+ y como ste debe sel nrcrtol que 20, se tiene to/z(n - yJ < ztt
\/lt Vn
Entonces.

t'o2@ - 1)

to2(n - I)
Folmemos una tal:>lr en la que se tenga los dos miernblos de la desigualdad. El tamr
mriirno cle la rnuestra es el corlespondiente al nenol valor cle ? para el cr.ral se cunple I
desigrraldrrd.
n 0.51n 1,,12(n - L)
10 1.581 2.262
16 2.000 2.\37
17 2.061 2.r20
18 2.r2L 2.1 10

Se observa qne rala el valor de n : 18 se empieza a cr.rrnplir la desigr-raldad; es decrr'.


trnao rnninro <le la mnestla es 1B liogares.

7.LO. Ejercicios
I. Encuentle ul intervrlcr ctc confianza cle nivel (1 - cr) pala la rncclia si

a) n : 12. i: 3.1bj, S'


,)
:0.21, a:0.05; c) r:1S, T:2.5, s2 : 31.5, cr : 0.Lr
lr) rr : 26, : s : 58. cr : 0.05
.)
46. ,5'- : 4.8. i1 : 11) rt : 9, -I:32,

Se d<,.scr estucliar cl girsto scrnanrl rlc fotocopiirs, crr cllarcs, clc L.ls eslucli:urtcs ulrivelsitli
Se eligiti una rnnestr'i <lc 9 cstur,litlrrtcs, elegidos l rzrr'. r'csrLlt,r.rrclo los gastos:

2.0'2.5 1.9 0.7 1.I 2.1 :j.0 0.8 0.7.

Se srrpouc que la r,tliable rrleatolir oll.jeto clc cstuclio siguc rurir clistlibrrcir). rrorlral <tc nrc.,.
dcsc;onocicLr,. Detolrnine el interr'k clc confi.urza clcl 95 % par',r lr rneclia clel grusto semauirl
fotocopiirs pol estuclizrnte.
7.70. Ejercicios 2l-9

Err los crrllcrrtrrriorLtos rlc lrn rrar[Lclor sc rrrirk: cl tierLrlr<t <re crrrplr:a elr |ecoller los 10() lrrctr os
lilrl<ts tIirr'rrrtc sttis <lLs r:onst)<]1rfl\.()s. S<r ltarr olrtcrriclo los siglrirtrrt,'s ticrrrl>os pr orrcclio rlc caclr
Luro clc los clrs rlt: lt sclr;ilrr c)lr (fllo rrrrll<)rrri:

Tiernpo I 51.2 49.8 51.6 50.4 50.8 50.5

) Si scr <:rtnsi<icLir clrrt' los 1;icrrrpos sr: clistrilrrLyclr liol'rn1lrnrlrrte. etr<rncntre rur interlvalo cle
corrfi)nzI. <lc ttivcl 91.-) %,. 1>irlrr el ti<:nrpo pt'onrr:clio irlvcltickr:
l,) ,Puccle csl)cr'r'sc cre cl la<lrclol leba.jc srr ticrnpo dc 50 s<-.gunclos? ,Por qrr?

4 Lrs tensiotrr:s dc totur'r (cu Iip) clc 5 cables cle acelo fuctolt

660 460 540 580 550.

Suponicndo normalidad para las tcnsioncs, estinre la tcnsin mcdia de lotura rnediante lrn in-
telvaio c1e confianza al nivel 99 %.

5. Se desea estimar ei tiernpo medio de e.jccr-rcin de un programa. Para ello sc ejecut dicho
programa B veces utilizando conjuntos clc datos elegidos aleatoriamentc, obtenindose que Ia
media mlrcstral y la desviacin estndar- rnriestr-al son, r'espectivamente, 230 ms y 14 ms. Obtcnga
un intervalo de confianza aI90% para la rncdia. (Suponga normalidad.)

6 En una entidad de crdito para la rnicroempresa se desea conocer la dcuda media de los clientes
que tienen prstarnos. Los siguientes datos corresponden a la dcuda, en dlares, de 16 clientes
que se seleccionaron de manera aleatoria.

306 508 299 537 404 2r0 347 529


514 255 343 476 536 521 659 438
Si el rnonto de cacla pr'stirrno es nna r.'aliabie aleatoria normal. obtenga los intervalos de confianza
dcl 90 %o, g5% y 997o, para la deuda medir.

I Al fumigal los rrodr-rctos agr'colas existe cl riesgo de qr-re se coloque demasiada canticlrcl dc
irgroqunricosi cou cl consignieute riesgo pala el consurniclor. De nl lote se extra.jo una muestra
de 10 tomates y se midi la concentracin (cn g/ kg de producto) cle fosfatos qr-re ellos contenan,
resultanclo:

24.9 23.5 26.7 28.2 26.4 23.8 25.r 25.3 27.7 26.6.
a) Determine Lrn intelvalo de confiarrzr del 95 To pata la concentlacin;
b) Si la concentlacin mxiurr permiticla es cle 24 LLgl kg, puede esperarse que el lote sea
aceptaclo pirla cl corlslrmo hr,rrrrano'/

8. Elr una filrrica cle corrselras se micie ias irrrPulczas cn rrn lotc ck:stinado a la exPortaci<in. En
ur1l nlnestrr do 12 frscos de mernielaclr sc obtr-rvo los siguientes polcelta.jes de inrpr-uezrrs:

2.:3 1.9 2.7 2.8 2.3 3.6 1.4 1.8 2.\ 3.2 2.0 1 L
a) Asurnier.rclo c1r.Le las medicioncs estn normalrneDte clistliluidas. ertcuerrtle el interr,rlo de
confjurzr tI 95%,:
b) Si cl polceuttr.je rrrixinro c1e inrpulczirs peruriticlo pzt,r'zi la r:xpor-tacirr es c.le 1.5%, .sc,rccp-
tari cl lote par a scl (lxpoltrclo/

9. El r,ic'rnpo cLe virlr cn c;rrtivelio de B cspecmenc.s cle urr tipo clc insec;to fue cle 228 hot'zrs, con
uu des\il(:in estir.cll cle 7 holas.
220 Captulo 7. Estimacin de Parntetros

zr) Estimc ol tiernpo cle viclr promedio l)ara un nivel clel g9 %;


lr) Resporr<ltr Ia pregunia srrponiendo <re ls muestr'rs frreron de 72 v 100 especnicncs.

10 IJrra mqr-rirra ploduce artr:ulos cuya dirnensin se corrtrclla rnediante Ia torna de unrr rruestr.1
aieatorir. Un cla se obtuvieron las sigrrientcs rnediciou<:s:

:3.7 3.4 3.5 3.5 3.4 3.7 3.9 3.7 3.5 3.7 3.8.

a) Halle el intervalo de corrfianza para ia niedia a un nivcl de confiabilidad de nivel 90 %;


b) Si la meclia terica del proceso es de 3.5 y sin cambiar los otros drtos. Cul es el tamarlo
mnimo de la muestra, para que a un nivel del g0 %, se pueda asegurar que Ia mquina
produce artculos con dimensin igual a la media terica?

11 Los siguientes son los tiempos, rnedidos en das laborables, que demoraron 16 trmites de jubi-
lacin en cl IESS, elegidos al azar:
Das
159 280 362 222 264 224 101 2t2
t70 485 250 379 779 168 260 149
a) Bajo Ia suposicin de que los tiempos se distribuyen nolmalmente, detelmine urr intervalo
de confianza ai 9970 para el tiempo medio de nn trmite de jubilacin;
b) El director del Instituto ha indicado que ios trmites no se demoran ms de 180 das. Es
razonable suponer que e1 tiempo meclio verdadero es mayol que lo indicado por cl director'/

12 La siguiente lista contiene la longitud (rrrmero de letras en las pala)rras) para rrna muestra clc
26 palabras del libro Rayuela cle Julio Cortzr

102 3 7 2E 4821752
54 '12294252347
a) Calcule el promedio y la clesviacin cstndar cle lr longitud de las palabras;
b) Constmya un interr'lo cle confianza al 99 % para Ia longitud rnedia de las palabras el
Rayueltr;
c) Si el tamairo muestral fuera mayor' (v el prorneclio y Ia desviacin estndar fueran los
mismos), ,cmo cambir,rr el intervrlo cle confianza?;
d) Si el prornedio fuera mayor (rnantenindose el tamro muestral y la desviacin estndar).
cmo cambiar'a el intervalo de confianza?;
e) Un intcrvrlo de confianz al g5 % cs (3.655; 6.037). Qu proporcin de las 26 palabras de la
muestra estn dentro clcl intelvalo? ,Su lesPuesta scr siempre ccrclnl aI 95%il Explique.

T.IL Estimacin de Ia varianza (distribucin normal)


Suptrgase que se rlesea estimrr la vr'ianza polrla.ciontrl ;' r|rc 1-rzrrir el efecto sr: clispone de urrr ri-ruestra
de n ntccliciones crc siguen unzr ley rtolnral: :1, lL2) ..., r.n.

Un intctvalo de confianz par:r ir valianza polrlirciorrirl 02, ,r ,1lr rrivcl del 100(1 - cl) %, cstri dado
por
( (rr - I ).'2 (rr - 1)s2 \
\,(,,-Df"d-D)
7.77. Estimacin de Ia varianza (distribucin norrnal) 22t

T s2 es la varianza muestlal.

f)r(n- 1) es el valor, de la clistribucin 2 a (n- 1) graclos de libertacl? para el cuai el r'ea en


,'2 u
el extremo srrperior cs ig'ral f .

\?
\j,o/z^,"(n - 1) es el valor, de la clistribucin X2 a (, - 1) grados cle libertacl) para el cual el rea
en el cxrlemo inlerior os igual a
].

X,-o,,
z,_o,, Latz

Figtrra 7.4:Localizacin de los valores de la ley X.2 en el intervalo de confi.anzaparao2

Ejemplos

1. Hallar un intervalo de confianza para la varianza poblacional, al 90 Yo, para una muestra de
tamao n : 10, si s2 : 196.
si 1-cv:0.9, a:0.1,
]:o.osy 1- |-o.os. Los valoles d" x8o y
Sol,ucin: entonces
Xfr n, correspondientes a n - 1.: 9 g.1. son

x?.z@'- t) : xB os(9) : 16.919,

\?-,,z(n - r) : x|.gs(9) : 3.325'

El intervalo de confianza es
( (n_ t)s2 (n_ r)s2 \ /9x196 9x196\
:
\q," - tl';-ql" 1) ) \ reoro' n% )
: Q0a.26; b30.b3).

2. IJn hombre de negocios est interesado en invertir en un instrumento que piensa le puede dar
altos rendimientos. lrlo obstante, sabe que, en general, a mayor rendimiento se tiene mayor riesgo.
Al considerar instrumentos sirnilares se observaron los siguientes rendimientos porcentuales, que
suponemos siguen una ley normal:

8.7 15.5 21.0 18.9 17.3 22.r 18.6.

El inversionista considera que si se tiene un riesgo mayor-a 10 (desviacin estndar'), no 1e


conviene invertir. Construir el intervalo de confianza del 95 t/a y decir si este hombre har Ia
inversin o no.
Soluci,n: A partir de los datos, se obtiene que s2 :19.67, n:7 y 7 - a: 0.95.
En la tabla de la ley X2 a 6 g.1. se lee:

x?.z@- r) : x3 oz(6) :74.45,


x?-.z(n - t) : x|3zs$) :1.24.
222 Captulo 7. Estimacin de Parntetros

El iLttclr'r.lo <-lc corLfianzt cs:

(t,t tliJ. (r-1)s2 \


: /rlJ.6;6., 19.67\
[C,,, - t, -,-,, -r )/
(' LrL; ' n4 )
: (8.17;95.18).

ls rlecir. o2 e (8.17; 95.18); por lo que o e (Vo.1Z, vOSlS) : (2.86;9.76).


Corrro el lrnite srrrcrior clcl intervrlo de confianza es rnenol a 10, posiblernentc si le corrvicne
inr<l tir.

7.t2. Ejercicicrs

1. Halle un intervalo cle confi.anza al 90 To si s'2 :225 para los siguientes tamaos de muestra:

a) n,: 4; b) n, : 8; c) n: 13; cI) n:20.

2. La valianza de la presiri sangunea es impor-tante porqr-re ella permite conocet la resruesta


ante el esfuerzo. Se llevaron a cabo 12 rnediciones de la presin de urr iudir.icluo, clue
car'<lirca
dieron los siguientes resultrdos:

116 105 t2r 119 110 105 108 t02 107 t02 104 116.
Detclminc los intcrvalos clc confi.abilidad dcl 90 "/c y cleI95%: para o2.

3. En los rnrrrualcs de fbricr cle un lpar'rto pala cleterrninar- el rrivel de alcohol cn la strugle.
sc irrdica que las niediciones tienen una clcsviacirr estndal de 5 ulidacles. Pala p-t-obar estL
afilruacin, cn la oficina de normas se reaiizarol mediciones clcl contenido de alcoiroi en Ia szrnrc I
LL

cle 10 r'oluntarios, con los siguientes resultrdos:

83 75 92 79 60 85 92 77 76. i

Basndosc crt LlD ilrtervalo cle confirrrza dc 95 %, cleterminc si Ia afirrnacin <lel fabricarrte
cs cortecta.

4. Sc rnliz Llr)t nlalca c1e rnirrgarinr rlietticr pzrlir dcterminar el nivei cle acic,los gl'l,sos ltolisatr-r-
raclos (en lrorcenta.jc). Un,r ntuestr't de scis paquel;cs ltrovcy ltr siguientc informa<rirln.

16.E 17.). t7.4 16.9 1t'.5 17.1.

Asrrutiendo <lrre los rlirtos sigrren uu'r lev rrrr'nral. hrlle:

a) el intcrr'rlo clc confianza para cl contenido medio de glasa. con rln nirrcl del g9 %;
b) r:l irrtelr'rlo clc <;onfianzr par'r Ir vaLirrrza del conteniclo dc g1 lsa, corr Lrn nivr:l del 95%.

5. En nrra mncstra alcrtoria cle 15 cuentas bancarias que realizaron depsitos la rltirna serrralta sc
encontr que la desviacin estndar era de 73.6 dlares. Se supone que los depsitos siguen una
ley normal. Estime Ia varianza y la desviacin estndar de los depsitos mediante un intervalo
de confianza al g5To.
7.72. Ejercicios 223

Ir Urr httrribre clc nr:gor:ios est, intercsrdo crr ilrutil err bcnos cle un pirs lrrtinorrrnclicauo, qrrc
lticttszr lc rueclcu <lu altos t'euclinientos. No obstiurte, s1be ouo. en gcuerzrl, a nryor rcnclirnicnto
se tietrcr IIl1yot lictsgo. AI cotrsiclctal ptrpcles similarr:s sc obsel'r'alorr los sigrricrit,cs lcndirnicntos
( ')/,t):
9.7 21,5 17.0 16.9 13.4 20.7 24.6 15.8.

El invelsionista corrsiclela que si sc tierre un licsgo ruayol a 10 (desrriacin estrrdar'), no le


comierre invertir. Coustnryir el intclvrlo clc corifianza dei 95 % v cliga si esta persona har' la
inversin o no, .justificariclo su respuesta.

7. El conteniclo cn nicotini de los cigarlillos de unl nralc) dcterrnirrada sigue uua distriliucirr
N (U;"2). Sc torn urta mucstr:a cle 5 cigarrillos, obtenindose en cstr muestra un ccntenir-lo
medio de 27.2 rng y varianza rmestral 4.2025. Obtenga:

a) el intcrvalo de confirnza para con Lln nivel del 90 %;


/,)

b) el intervalo de confiarrza para o2, con un nivel del g5%.

8. Se desea ptobar ttn nnevo mtodo de embalaje de rnercaderas, para Io cual se registra el tiempo
(en segtindos) quc un misrno tlaba.jador emplea err realizar la tarea:

Procedimiento Procedimiento
tradicional alternativo
31 36
36 32
34 30
27 26
40 O

4,f 4I
AA
28
30 33
,t
Jt)

Si el tiempo empleado es similal en los dos casos, entonces se decidir emplear aquel mtodo
qtre presente la menol r'rliacin. Mediante un intervalo de confianza a). 9570, ,cu.l de los dos
mtoclos escogcra, el traclicional o el alternativo?

9. Se micie el tiempo (en segundos) de duracin de un proceso qumico realizado 20 veces en


condiciones sirnilarcs, obtenindose Ios siguientes resultados:

93 90 97 90 93 91 96 94 91 88
93 95 91 89 92 87 88 90 86 91

Strponiendo que la dnlacin sigue una distribucin noLmal, hallar los intervalos de confianza aI
90 % para la rneciir y Ia r.arianza.

Etr el enibrlajc dc fi'rtta pala ltr cxporttrcin es importante conocer Ia variabilidaci del caliJre
cle la fruta (que es el clirnetro mxirno de Ia fmta). Una fruta con Lrn calibre bajo se cotiza
a l:a.jo prercio y una con calible alto da ploblemas en el embalaje. Las siguientes mediciones
corlesponderr rl calibr-c plorncclio (en cm) de los rnclones contenidos en 113 ca,jas:

20.8 19.3 19.5 22.4 27.3 19.6 20.5


2r.2 2r.4 19.0 19.8 22.2 20.6

a) Determine los intervalos de confianza, al g0To, para la media y la varianza del calibre;
224 Captulo 7. Estirnacin de Parrnetros

b) Si el calibre promedio es nlenor que 20 crn o mayor que 21.5 cm, o si Iavatianza es mayor o
igual a 3, se recomienda el cambio de Ia variedad de meln. Cree tisted que ser necesario
hacer tal cambio? Por qu'/

l1 Una ernpresa de venta de cosmticos est interesada en introducir una nueva lnea de artculos.
para ello se examina Ia ganancia (en dlares) que le dejaran cada uno de los productos:

23 38 15 7 t2 10 10 11 18 13 9 10

a) Calcule un intervalo de confi.ar'zapara la ganancia media, a un nivel deIgS%;


b) Calcule un intervalo de confiatzapara la varianza de la ganancia, a un nivel del 90%;
c) La empresa introducir la nueva lnea de productos si la ganancia media es mayor que 20.5 o
si la varianza es menor que 40. En base a los intervalos antes encontrados, se introducirn
al mercado los nuevos productos? Explique por qu.

7.L3. Estimacin de la proporcin (distribucin binomial)


Histricamente, este intervalo de confianza es, con seguridad, el primero propuesto para un parmetro:
en los escritos de Laplace (Thorie Analytique de Probabzlzts, 1872, pp. 283) ya se lo encuentra
analizado.

Strponga que se dispone de una muestra rt 12, ..., rrr., de n observaciones que siguen una ley de
Bernoulli, cuyo parmetro p (la proporcirr poblacional) deseamos estimar.

Un intervalo de confianza aproximado para la proporcin7t, a un nivel de 100(1 - a)% viene dado
por

Donde:

,n
. p:- 9 , siendo y : D r el nrmero de xitos en las n pruebas.
TL i.:1

' za/2 el valor z que corresponde a,l rea 9 en el extremo superior de la distribucin normal
2
estndar.

Determinacin del tarnao de la muestra

Si notamos como.E :ll0- pl al erlol en Ia cstimacin de Ia proporcin, para el nivel de confiabilidad


dado; entonces, ,E : Za12
0G-0)

EI tamao de la muestra necesaria para tener Lrn error -8, a un nivel de confianza (1 - a) es

n: Qo/)'0Q - A)
E2

Observacin. Si no se conoce de antemano una estirnacin de p como sucede cuando se realiza una
investigacin por primeravez , se toma fr:0.5, porque este valol permite obtener el tamao mximo
de rnuestra.
7.73. Estimacin de Ia proporcin (distribucin binomial) 225

Ejemplos

1. Cott cl ob.jcto rle estirrra,t'la Jrroporcin clc televiderrtes qr-re han visto el anuncio de un proclucto,
se enl,rcvist 400 tek:spectacloles y result,ri que 344 de ellos lo habarr visto.

a) Ertcuentrc un intcrvalo de c:onfianza clc g7'% para la proporcin de todos los espectadores
que harr visto la ltublicidacl r.[el producto;
b) Obtenga el tanrao cle rrnrestra indispensable para que cl intervalo del inciso a) terr.ga una
Iongitud mxima cle 67a corr la misrna confianza.

lJ:344, n:400, 1- a:0.91 y zoo45:1.695.


Solu,cin,: Por el enrtnciado se tiene:

' !lt :t"11:0.86.


La rroporcin de espectadores en la mlrestra es t-
400

a) El intervalo de confi.anza es
/
- z"rz
\n
(0.86)(0.14)
(o ;0.86 * : (0.8306; 0.8894).
400
'u
b) Si la longitr rd del intervalo es 6 %, quiere esdecir,E:0.03.
El ta mari.o le la rrmestra
< es

'F2
("n/.)'2 fr(t - i) (r.695)2(0.86)(0.r4) .){, ?(
_ roa'rJU'
- (obz- -
Habr' qr-rer consuJ.tr a 385 tcle','id<tutes.

2. En unr encuesta piloto, plevitr 1>ara la lcalizrcin cle la encnesta clcfinitiva) se encontr que el
630, de lir poblacin (ircle que el plirrcipal problerna clel pas cs la colrupcin. La ficha tcnica
de la cncuesta definitiva indica cre ci sonclco tendr un 97 % de confirlrilidad y el error estimado
clel 4(%. A cuntos cirrcladanos se debel cousultar si:

a) se usa el valor estinrrdo de p mediante Ia encnesta piloto;


b) no se enrplea una estimacin previa de p.
Srhtcin:

a) Segrn los datos: 1 - a: 0.97, E: 0.04 y 0: 0.63. Entonces,

r: @#f:@*ffi@
(2.i7)2(0 63) (0.37)
: 686.
0.0016
La eucnesta deber ser realizda a Lrrr mnirno de 686 personas.
b) Como no se tiene iriforrnaci<irt previa soble p, se toma 0: 0.5 y el clculo del tarnao queda:

r: @#r:e%l&i#e
: 7:35.77 .

Sin urr conocirnieuto previo de Ia proporcin, se deber muestrear al menos a 736 pelsonas.

::i el Curdto 7.7 se encnentra un resLrilren de los intervalos de confianza de una muestra analizados
-- este captulo.
226 Captulo 7. Estimacin de Parntetros

Hiptesis Parmetro Intervalo


Distribucirr o
o conocido media r, t L -/2--=
general \/n
Distribucin s
o desconocido media r r t Lo 2.1n-y
'\/rL
normal -
Distribucin (n-l).s2 (n 1)t2
vatiat,.- o2 ,2 1
normal -.2
\n /'2:(n-1) \ | o2,1n t)

Distribucin
proporcron p f! rulz F0-)
binomiai

Cuadro 7.1: Intervalos de confianza comunmente empleados

7 "L4" Ejencicios
1. Determine Ios intervalos de confianza para la proporcin, de una muestra de tamao 200 en la
cual se han obtenido 150 xitos, segn los siguientes niveles:

a) a:5To; b) a:12To; c) a:7To; d) a:20To.

2. En esta pregunta no realice clculos, responda mediante una frase que explique su razonamiento

a) Tres investigadores, Luis, Juan y Edgar, seleccionaron independientemente muestras de una


misma poblacin. Los tamaos de las muestras fueron de 4000 para Luis, 1000 para Juan
y 250 pu.u dgat. Cada uno construy un intervalo de confianza para p a paltir cle sus
datos. Los errores E para los tres intervalos son 0.015, 0.031 y 0.062. Asigne cada uno de
los errores a los investigadores;
b) Dos investigadoras, Diana y Oliva, seleccionaron dos muestras de tamao 1000 a partir de
diferentes poblaciones y constmyeron los intelvalos de confianza al 95 7o para p. El errol
para el intervalo de Diana fue de 0.030 y el error para el de Oliva fue de 0.025. Dado que las
proporciones muestrales fueron def : 0 2 y F:0.4, asigne a cada una de las investigadoras
su proporcin;
c) Un investigador seleccion aleatoriamente 100 sujetos de una poblacin, observ 50 xitos
y calcul tres intervalos de confianza. Los niveles de confiabilidad son 907a, 95% V 99%.
y los intervalos son A: (0.402; 0.598), B: (0.371; 0.629) y C: (0.418; 0.582). Asigne a cada
intervalo su nivel de confianza;
d) Dos investigadores) un hombre y una mujer, trabajan .juntos para estudiar una muestra
aleatoria de individuos de una poblacin. Ellos encuentran que la proporcin muestral e,.
de p: 9.6. Cuando ellos construyen el intervalo de confiarrza basado en Ia proporcin, el
varn obtiene (0.532; 0"668), mientras que Ia mujel obtiene (0.552; 0.688). Indique quin
se equivoc.

J. llna muestra realizada a los clientes de un supermercado dio que 120 de 300 clientes usan
regularmente tarjeta de crdito o cheques para sus compras. Encuentre un intervalo de confi.anza
aI 98% para el porcentaje de personas qlre usan efectivo en sus cornpras.

4 Un partido poltico que concurre a las elecciones mr-rnicipales en la ciudad quiere encargar una
encuesta para estimar su porcentaje de votacin mediante un intervalo de la forma P +1.5%.
cuyo nivel de confianza sea 95 %. Qu tamao muestral debe utilizarse en la encuesta para
alcanzar aproximadamente este objetivo, sabiendo que en una muestra piloto el porcentaje de
votacin estimado fue del 75%?
7.74. Ejercicios 227

5. La efectividad cle tut trtcclictnrcrrto oorrlla cl dolor dc cabez se examirra deterrninando si ste
elirnin o tro r:l sntonra. St: arlrrriuistr'<i <r1 mcclicrurerito a 225 pacientes voluntarios, de los ctLaies
en 170 crns el efr:cto rlr-'scrclo. El rrrcclicLrento se trr:epta l)ara, su u,<jo general si ticnc uur
efectividad en al menos cl 80 % clc los crsori.

a) Basndose en Ltn intervalo de confianza c-lel 98 %, .puede recomendarse el uso dei meclica-
mento'/;
b) Sin variar la propolcin estimacla, .qr-r tan grande deber ser Llna muestra si se clesea tener
una confianza del 96(% de que el error mximo de estimacin es 0.05?

6. Segrrrrtn estudio sobre los nios que padecen clolor de pecho, realizado por Selbst, Ruddy y
Clark (Cli,nical Ped'iatrics,1990), se encontl que de 137 nios que tenan dolor de pecho, 100
daban radiografas de trax normales.

a) Obtenga un intervalo de confianza del 957a pata la proporcin p de nios con dolor de
pecho que dieron radiografas normales;
b) Halle el mnimo tamao muestral para que el error cometido en la estimacin de p sea
inferior a 0.07, al nivel de g5%.

7. En una poblacin, nadie es indiferente respecto a la iniciativa propuesta por el alcalde de construir
un nuevo parque en el norte de la ciudad. Cada habitante adulto o bien est a favor, o bien en
contra de la iniciativa. Se desea conocer el porcentaj" (P) de las personas que estn en contra.
Entre 250 habitantes adultos elegidos al azar,75 afi.rmaron que estaban en contra (v los 175
restantes a favor).

a) Halle el intervalo de confi.anza al 93 7o para P;


b) Cul es el nmero mnimo de encuestados necesario para que el error cometido en Ia
estimacin sea) como mucho, de 0.05?

S. En una lnea de control de calidad en un da se examinan 250 piezas de un lote, de las cuales 25
tienen algn tipo de defecto.

a) Construya un intervalo de confi.anza aI g37o para la proporcin de piezas buenas y de piezas


defectuosas;
b) I-ln lote se acepta si Ia proporcin de piezas defectuosas es menor o igual al 5a/a. Ser
aceptado el lote en cuestin?;
c) Qu tamao deber tener una rnuestra si se desea tener una confianza del g7% de que Ia
estimacin estar dentro del1% del porcentaje real?

9. Para la introduccin al mercado de una nue\a variedad de semilla de naz la empresa productora
estima que deben germinar al menos eI 73u/o de1 total de semillas sembradas. En una prueba de
laboratorio se sembraron 745 semillas, de 1as cuales germinaron 518. Con base en un intervalo
de confianza de nivel igual a1 97T0, [,poclr la empresa introducir al melcado la nueva variedad?

-0. Err un sondeo sobre la preferencia deportiva de la poblacin masculina ecuatoriana, realizada a
1000 personas, se determin que eI 72% de 1os encuestados gustaba ver regularmente partidos
de ftbol por televisin. Con una seguridad del g5 a/o, se puede decir que los resultados son
iguales, con Lrn margen de ms o menos 3 puntos porcentuales, a los que se habran obtenido si
se hubiera consultado la opinin de la poblacin masculina completa?

:1. Una noticia de prensa dice que, de 1200 persorras encnestadas sobre la conveniencia de hacer
reformas a la ley de trnsito, 756 se muestru a favor y 444en contra, y concluye afirmando que
eI 63% de la poblacin se mltestra a favor, con un rnargen de error de t3 %. Cul es el nivel
de confianza de esta afirrnacin?
228 Captulo 7. Estirnacin de Parmetros

72. En ttna errtlevista realizrc.la a 130 rnujercs casadas, 113 de ellas indicaron qlle haban sido r.ctirnas
clc zrlgrin tilto de agresi<in ltor parte de su cnyuge.

a) Asumieudo qtle estas nnrjeles form:ur una nnrestra aleatoria, calcule r,rn intelvalo r-le con-
fi.anza de nivel 95% para la proporcin de las mujeres casadas que han sicio agrediclas;
r) Si se hubiera consultado a 520 mujercs, .cree usted qrre el intervalo hubiera sido rnis ancho,
ms estrecho o de igual ancho? Explique y no realice clculos;
c) El intervalo hubiera sido ms ancho) ms estrecho o de igual ancho si 73 de las 130 mujeres
hubieran respondido afir'mativamente? Explique;
d) Realice una interprctacin del intervaio.

13. Se desea estimar la proporcin de estudiantes universitarios a favor de sustituir el actual himno
nacional por otra cancin.

a) Para estimar esta proporcin con una precisin de 0.10 a un nivel de confianza del 92Vo,
a cuntos estudiantes se necesitar preguntar? (Para determinar el tamao de mnestra
necesario, fije su propia proporcirr rnuestral, identificndola claramente.)
Para responder las siguientes preguntas, usted no necesita realizar clculos. Explique sus
respuestas.
b) Si se deseara estimar la proporcin con nna precisin del 0.05, a un nivel del 92 To, es
necesario muestrear a ms o menos estudiantes que en a)?;
c) Si se cleseala estirnar Ia proporcin con una precisin del 0.02, a un nivel del 95 To, ,es
necesalio muestrcar r mis o trtenos cstudiantes que en a)?

7.15. Intervalos de coyrfranza para dos muestras


Los intervalos de confianza qr.re se presentan a continuacin involucran a clos rnuestlas y, en gcneral,
son utilizados para compalar errtre Ios valores que tierien los parmetros de dos poblaciones o para
determinar si las muestras provienen de la misma poblacin.

7.L.L, Interl'alo de confiarrzapara la diferencia entre dos medias

nr y rL2 seleccionadas cle dos


Suporrga clue disponemos cle dos mnestras independientes dc tamaos
poblaciones con medias h y ttz. Nnestro inters es encontrar un intervalo de confianza para la
diferencia de las medias y para ello considerarenlos 3 casos:

Caso 1. Las varianzas poblacionales son conocidas

Supondlernos que las varianzas de las poblaciorres 1 y 2 son conocidas: V


"? "3.
Unintelvalodeconfianzapat'. ladiferenciadernediaspoblacionalcs11 -1,12,aunniveldel 100(1-
rv)%, cst dado por

(,t, - r) - .,,/2ffi,r,(;, - zz) r za/2rF-)


7.75. Intervalos de confianza para dos rnuestras 229

Caso 2. Las varianzas poblacionales son iguales; o'l: oZ: o2

Un intervalo de conhan za par a la diferencia de medias poblacionales r, - F2, d un nivel del 100(1-
a)To, est dado por

I
| (zr - rz) - t../z(nt -t nz - 2) @t - rz) + /z(nt t nz - r
lE=-;
t

\
*
rE=-)
^r_(ra-t)"?+(n2-r)sl
U+n2-2

Caso 3. Las varianzas poblacionales son diferentes: ol I ol


Un intervalo de confianza para la diferencia de medias poblacionales p1 - p2, a un nivel del 100(1 -
a)To, est dado por

(,t' - ,) -t.tz(s)rm *; @t -rz) +t,/z(s)r{-.t)

Donde g : + slln2)2
('?1",
("?1",)' , G3/"r)'
u-L - nr-r

Ejemplos

1. Se pretende comparar la duracin de dos marcas de pilas alcalinas. Para ello se escogieron dos
muestras de cinco piias cada una. Los datos se presentan a continuacin.
Marca A 100 96 92 96 92
Marca B 76 80 75 84 82

Si suponemos que las varianzas poblacionales son o2A: II y q2B :15, determine, basndose en
un intervalo de confianza de nivel g5 %, si las dos marcas de pilas tienen igual duracin.
Soluctn: Se tiene que
nl :5, r1 :95.2; o?: l!,
TL2: 5, rZ :79.4; 03: 15.
Entonces,

(,r,-,
- - zat2U
la* o" \r,'- - rz) - ,"/r\,1@:
\,,,
"'2) ; , ;' _ ):
: (11.33; 20.27).

Si las dos medias fueran estadsticamente iguales, su diferencia sera igual a cero. Como cero no
se encuentra en el intervalo de confianza, podemos afirmal que las dos marcas no tienen igual
durabilidad.
230 Captulo 7. Estimacin de Parntetros

2. Lhr irgr:nir:r'o desea cletelrninrl si los automrj.lles a,nrcricrrros ), los japorreses tienen igual consrrmcr
rl<corirrstible. Par'relloescogoliirtrnrrest,rrcle10cr.r'rosarnclicarros), 12,jaPcrresesrlesinrilrlr.:s
crr',rctersticas y rnidi cl ccrisurrro por 100 hrn cle recolrickr, con los siguicirtcs r-csultrclos:

4rnenicanos 60 58 74 7{j 85 a)o


JL 7.6 ()/ 100 9s I

Japoneses 48 51 5iJ {i2 i"r"7


t-/
6.7 7.2 8 r') 5 (;.'.j | 5.!l

Estinrar, mediante un intelvalo de confianza a,l 95'%,).a cliferencia eirtle las clos rnedias de con-
sllrllo. ,Se puede decir el conslrilro de cornbustible no depende del oligen clel ruto?
SoLuciu. Supondremos que las poblaciores son norrnales con varianzas desconocidas, supuestas
iguales. Adems, se tienen los siguientes resultados:

nt: 10, rI : 7.86; s?:2'2t6


n2: 12, rZ :6.C4; s3:0.879

El estimador de la vananza es

2
5:
(n1 -1)sl +(n2-I)s2; (10 - r)2.216 + (t2 - 1)0.87e : 1.481.
n1 +n2-2 10+12-2

Entonces, el intervalo es

rz) tn/z(nt + nz -
(,', - - 2)

1.4811.481
(,t.uu - 6.04) - ts s25(20) *
,o i, (7.86 - 6.04) + o.ozs(20)

Como el valor cero no se encuentra en el intervalo de la diferencia de medias, deducimos que Ia


media de los consumos no es igual. Entonces, el consumo de combustible si depende del pas de
origen del carro.

7.L5.2. Interralo de confianza para larazn entr dos varianzas

Suponga que disponemos de dos muestras independientes de tamaos TLt y n2. seleccionadas de dos
poblaciones que siguen leyes normales con varianzas o? y o3, respectivarnente. Deseamos construir
un intervalo de confia\zapata la razn de las dos varianzas.

o?
Un intervalo de confianza para la razn de las varianzas poblacionales i,oi aun nivel del 100(1-c)%,
est dado por

(#r',-",^u - r,nz - r); #'-,r(n, - L,n2 _,))


7.75. Intervalos de confi.anza para dos muestras 231r

4,,, 4-otz

Figura 7.5:Localizacin de los valores de la ley F en el intervalo de confianza para larazn entre dos
rrarianzas.

Ejemplo. LIn inversionista quiere comparar, en trminos de las varianzas, los rendimientos de las
acciones de dos compaas del sector servicios. Calcul los rendimientos mensuales del ltimo semestre
de las dos compaas, como se muestra a continuacin.

Compaa A 1.8 0.3 2.4 0.1 1.5 1.9


D7
Compaa B 2.6 3.8 -l 4.7 3.2 d. tJ

Con el empleo de un intervalo de confi.anza de nivel 95To para las varianzas, determine si los rendimien-
tos tienen igual variabilidad.

Solucin: Tenemos que


U:6, s? : 0'859,
172: $, sZ:0.278.

EI intervalo queda:
/^2 \
(?rFr-*p(n "?
- r,nz - r); 3F-tr@, - t,n2- 1) ) :
\si si /
(3#"-' ozs(5, 5);
.iz8q!ryFo
oru(5, 5)) : (0'433; 22'082)'

Si las varianzas son iguales, su cociente es igual a uno. En este caso, el valor 1 se encuentra dentro
iel intervalo; por tanto, las varianzas de los rendimientos de las dos compaas son iguales.

7.15.3. Intervalo de confianza para la diferencia entre dos proporciones

Sean f1 y f2 Ias proporciones de xitos de dos muestras aleatorias independientes, de tamaos rLr y n2,
:rovenientes de dos poblaciones de Bernoulli, Ber(p1) y Ber(p2), respectivamente. Ahora, deseamos
-timar, mediante un intervalo, la diferencia de esas proporciones poblacionales.
:--n intervalo de confi,anza aproximadc-r para la diferencia de proporciones pr a \rr
l-r:
- p21
-00(1 - a)To viene dado por

l,,rnde 0r : 1 - y lz : I _ fz.
Ejemplo. Un fabricante cree que su marca de yogurt es ms preferida en la Sierra que en la Costa.
?ara probar su sospecha escogo dos muestras aleatorias de 500 consumidores en la Costa y 300 en
232 Captulo 7. Estirnacin de Parrnetros

la Sierra. Las muestras revelaron que 210 consurnidores en la Sierra y 320 en la Costa consumen su
producto. De acuerdo a un intervalo de confianza al 98T0, se puede inferir que el fabricante tiene
razn?

Solucin: Se tiene que


320
Costa: n1 :500, pt : :0.64,
500
2t0
Sierra: nz:300, Fz: : 0.7.
300

Por tanto, el intervalo es

_ or)-2rJ 0.64 x 0.36 0.7 x 0.3


(,o.un

ComoceroestdentrodeIintervalo'noSepuedeafirmarquelasospechadelfabricanteseacierta.<

En el Cuadrc 7.2 se encuentra un resumen de los intervalos de confianza de dos muestras analizados
en este captulo.

Parmetro Intervalo
Distribucin oi o3
general
o7 y o2 conocidas (rt - rz) t 2,,
/2 r\ n2

Distribucin or y o2 desconocidas sZ
normal supuestas iguales
(t t - iz) tt o/2,(ntrn2-2)l * 'lL2

I'O
Distribucin ot y 02 desconocidas (t-r)It,,/2,nrl! .9
normal distintas Ft- Pz '" nt r2
V t2

Distribucin ^\, lPtQt PzQz


- P2l L'a/2\l-
'
binomial V TL n2

Cuadro 7.2: Intervalos de confi.anza sobre dos muestras comunmente empleados

A lo largo de este captulo la idea de que los intervalos estaclsticos reflejan la in-
se ha enfatizado
cer-tidumbre debida a la variabilidad de los datos, pero en la mayora de casos prcticos, a ms de
que las hiptesis bsicas sobre la muestra (como aleatoriedad, independcncia y normalidad) son vio-
1adas, influyen otros factoles cuya magrritud es incuantifi.cable, por ejemplo, el comportamiento de las
personas y los equipos, el medio ambiente, etc.

Entonces, en la correcta interpretacin de los intervalos estadsticos habr qlle tomar en cuenta que
ellos no leflejan la incertidumbre total presente en las rnediciones y solo proveer wa cota'inferior de
la verdadera incertidumbre; por lo tanto, son una cruda aproximacin a Ia realidad.
t
7.76. Ejercicios 233

7.16. Ejercicios
1. El gercrrte de una empresa quc tiene dos locales de ferretera cree cre las venlas en el local del
norte son mayores que en el Iocal del sur. Para verificarlo, tom una muestra de 200 facturrs
en el local del sur v 250 facturas del local del norte, resultando un promedio de 13 y 15 cilares
y desviaciones estndar de 3 y 4 dlares, r'espectivamente. Mediante un intervalo de confianza
de rrivel 95To, ,se puede concluir que e1 gerente tiene razn?

2 Una organizacin de defensa de los derechos civiles afirma que en la industria de Ia construccin
el salario r4edio semanal de los hombres supera en 13 dlares al de las mu.jeres. Una muestra
aleatoria de 20 hombres y otra de 25 mujeres revel promedios de 110 y 100 dlares, respecti-
vamente. Si Ias dos poblaciones de salarios son normales con varianzas de 100 y 64, mediante
un intervalo de confiarrza para la diferencia de medias, de nivel 98 %, se puede decir que la
afi.rmacin es cierta?

Se cree que el precio de arriendo de las casas es mayor en Cuenca que en Ambato. Estudios
anteriores revelan que las dos poblaciones de arriendos tienen distribucin normal con varianza
homognea. Dos muestras aleatorias de tamao 16 revelaron lo siguiente: z1 : 138, sr : 6 y
Tz:135, s2:4. Con el empleo de un intervalo de confianza al 957o, se puede concluir que Ia
suposicin es correcta?

4 Un inversionista hizo un estudio para determinar en qu ciudad, Manta o Loja, podra abrir un
supermercado. En una muestr a de 2I hogares de la ciudad de Manta hall un ingreso promedio
de 500 dlares y una desviaciri estndar de 120 dlares. En otra muestra de 16 hogares de Ia
ciudad de Loja hall un ingreso promedio de 480 dlares y desviacin estndar de 60 dlares.
Suponiendo poblaciones normales con varianzas diferentes y con el empleo de un intervalo clc
nivel 957o, en cul de Ias ciudades le conviene abrir el supermercado?

El dueo de dos restaurantes que verrde pollo a la brasa quiere dcterminar si sus dos locales
venden Ia misma cantidad de pollos diarios. Dos muestras de las ventas de 12 das dieron los
siguientes nmeros de pollos vendidos:

Local A 12 17 I4 1B I 10 20 l5 72 1ti B 74
Local B 72 L4 13 11 12 15 21 l4 13 14 22 15

Adems, Ias muestras revelaron que las dos poblaciones de muestras son normales con valianzas
diferentes.Se puede inferir que en los dos locales las ventas diarias de pollos son Ias misrnas?

Una manera de comparar el riesgo de dos inversiones es a travs de sus varianzas. Para una
itrversin en Ia industria electrnica se tom una muestra de 10 datos y result una desvicin
estndar de 52. Para una inversin en la industria siderrgica se tom una muestra de 15 datos
y result ttna desviacin estndar de 31. Si se asume que cada una de las invcrsiones sigucn
leyes normales, cul es su conclusin si utiliza un intervalo de confianza al 90% para la razn
de varianzas?

IJn investigador sospecha que los hombres y las mujeres difieren significativamente en ticmpcr
diario de utilizacin del telfono. Entrevista a 25 sujetos de cada sexo obteniendo ios siguientes
resrrlt ados:
Mujeres: :38; or:6,
Ffornbres: : 31; 02:5.
Utilice un nivel de confianza del g5 7o para:

a) construir un intervalo para larazn entre las varianzas. Se puede decir que son
234 Captulo 7. Dstimacin de Parmtetros

lr) cortstruil utt irttetvalcl pi-Lla la difi:r'cncia cle nrcclirs rclccrrrclo.

El ctrtrclaclol clc rtu cqrLipo cle fiitbol quietc (jor]'lprar li r:fcctir,'iclrri cle srrs.jrrgaciolcs al c<tlrlar'
trn tiro pena1. En los cntrenarnicntos, Ios jr-rgaclores n:rcrionalcs, clc 120 tilos intcnta<ftrs, accrta,r'on
91, tnientras que krs extlaqjelos rle 90 tiros lea,lizados, accltaiolt 78. N,Icdiant.: rrn iutelvakr de
corrfiauza de nivel 90 %, se puede infcrir que rro hay diferencia cntle los jrrga<lores ritrciorrirlcs 1'
extran jeros a,l colrar un tiro penal'?

I En lur estudio epidemiolgico, se tonr una rnuestra alcatoria de 300 hombres y 27 de ellos
padecicron o padecen Llna determinada variedrd de gripe. Tambin, se torn una rnlrestr:a de
400 rnujeres y a 32 les oculra lo misrno. A la vista dc cstos datos, se pucde consideral que estc
tipo de gripe afecta a hornbres y mujeles por igual? (Usc 1 - cl : 0.96)
10. Se quiere comprobal la efectividad de una vacuna contra una enfermedad y para ello, tras
contagiar a 200 animales, se Ia suministra a 100 y se compara con otros 100, a los cuales no se les
suministr. De entre los vacunados, mueren 8 a causa de la enfermedad y de los no vacurrados
20. A un nivel de confiabilidad del 93%o, podemos decir que la vacuna es eficaz pala reducir la
tasa de mortalidad?

I
4
a
C*pstulo I
Pruebas de Hiptesis

Dudar sobre todo o creer en todo: estas son dos


estrategias'iqual,m,ente conue'ni,entes. Con ambas nos
eui,tamos la neces'idad de refl.erionar
flenry Poncair

En el captulo anterior se vio que se puede realizar inferencias acerca de un parmetro poblacional
estimando su valor, ya sea de manera puntual o como un intervalo de confianza. Pero en muchas
ocasiones no interesa conocer o tener una idea dcl valor del parmetro, sino comprobar (o rechazar)
una afirrnacin sobre el valor que tiene el parmetro, sin mportar la longitud o la localizacin del
intervalo.

Suporrgamos que un investigador desea probar que actualmente, el ingreso mensual de los ecuatorianos
es mayor que el ingreso que tenan 5 aos atrs. Par-a verificarlo, recolecta los datos mediante una
muestra tomada al azar. El investigador podra desear cornprobar la hiptesis de que el aumento del
ingreso es rnayor que un cierto valor prefijado. Un intervalo de confianza de la variacin media del
ingreso proporcionar menor informacin que una prueba de hiptesis sobre la variacin del ingreso.

Las hiptesis son, en general, afirmaciones sobre los parmetros poblacionales, como 1a media y la
tarianza; as, se pudiera desear probar que el ingreso medio actual no es diferente de aquel que los
ecuatorianos tenan hace 5 aos. Una hiptesis tambin puede ser una afirmacin sobre la distribucin
de una caracterstica de inters; por ejemplo, que el ingreso mensual sigue una distribucin normal.

La teora de las pruebas de hiptesis sobre parmetros poblaciont.:.les fue desarrollada en los primeros
aos del siglo XX y sistematizada por R. A. Fisher, E. S. Pearson y J. Ncyman. stos ltimos la
formalizaron e introdujeron el vocabulario actua,lmentc en uso) en una publicacin realizada en 1933.
-\qu se expondrn los casos de mayor uso e importancia.

8.1. Elementos de una prueba de hiptesis

Para probar una hiptesis estadstica es necesario tcner en cuenta cicrtos elementos que conducirn
a aceptar o rechazar la hiptesis planteada, de manera correcta. Ello 1o ilustraremos con el e.jemplo
anterior.

El investigador cree qLle) en condiciones normales, el aumento dcl ingreso medio d debe ser menor que
un nivel prefijado do :60 dlares. y decide probar esta afirmacin; pero en el curso de Ja investigacin

235
236 Captulo 8. Pruebas de Hiptesis

se podraconclllir que Ia variacin del ingreso es mayor que 60 dlares. Para tornal cnalquier drcisin
es necesario que el investigador compare cori Lrn valor que le informe de la validez o irn'alidez de su
liiptesis.

En la terminologa de las pruebas de hiptesis, aquelLa que especifica un valor particuJ.ar del par'metlo
que se estudia se llama hzpteszs nula, que se representa por 11g. trsta hiptesis, usualmente, corres-
ponde al procedimiento de operacin normal de un sistema de especificaciones corrocidas. En el
ejemplo, d < 60 es la hiptesis nula, pues representa Io que debera suceder cuando ha habido un
incremento del ingreso, en condiciones normales; o sea) Hg: 0 < 60.

La hiptesis que especifica aquellos valores de1 parmetro que representan un cambio importante del
procedimiento normal o de las especificaciones conocidas, se llama hiptesis alternatiua y se repre-
senta por 111 . En el ejemplo los valores mayores que 60 indicaran un comportamiento anmalo o
extraordinario; as, la hiptesis aiternativa es -111: e > 60.

La cantidad, calculada a partir de la muestra, que permite decidir si la hiptesis nula ser o no
ser rechazada se denomina estadst'ico de p'rueba. La distribucin de probabilidad del mencionado
estadstico debe ser conocida para poder realizar Ia prueba.

EI conjunto de valores del estadstico de prueba que conduce al rechazo de la hiptesis nula, en favor de
la hiptesis alternativa, se llama regi,n de reclazo o regin crtica de la prueba. La dec,istn consiste
en rechazar la hiptesis nula en favor de la alternativa si el valor del estadstico de prueba cae en la
regin de rechazo; caso contrario no se descarta fIs.

En las pruebas de hiptesis, el resultado se da en trminos de la hiptesis nula. Nosotros o <<rechazamos


Ilo en favor de Ir>> o <(no rechazamos f/s>>; nuncaconcluimos <<rechazamos [t>> o <<aceptamos fI1 >>.
Luego, y en base del anlisis del valor del estadstico de prueba, se podra sacar otras conclusiones
sobre fI1, pero sto depender de cada caso particular.

A continuacin se resumen los elementos de una prueba de hiptesis:

1. Hiptesis nula, .FI6.

Hiptesis alternativa, I11

Estadstico de prueba.

4 Regin de rechazo.

5. Decisin.

Errores de tipo I y de tipo II

Al tomar una decisin sc puede cometel dos tipos de errores: rechazar Ia hiptesis nula cuanclo es
verdadela, lo que se llama error de tipo I; o bien, no rechazar la hiptesis nula cuando en realidad es
falsa, lo que se denomina error de tipo II. Ello se resllme en el siguiente cuadro:

Hiptesis Nula
Decisin Verdadera Falsa
Rechazar 1 I
Error tipo Decisiu col-recta
No rechazar 116 Decisin correcta Error tipo II

Entonces, tenemos Ias siguiente defini:iones:


8.7- Elernentos de una prueba de hiptesis 237

1. La probabilidad de cometer Lln error de tipo I se denota po a y se fija al escoger la regin de


rechlzo. Este valor se denomina niueL de s'iqnzficacin de la prueba estaclstica:

Pr(error de tipo I) : nivel de significacin : a.

2. El niuel de signifi.ca,ci,n obseruado o p-valor', es el mnimo valor del nivel cle significacin para
el cual los datos observados irrdican que Ia hiptesis nula debe ser rechazada.
Este valor se utiliza cuando se trabaja con paquctes computacionales para detelrninar si se
rechaza Hs. La regla es la siguiente:
Si el valor de p ( a, entonces se rechaza 116. Caso contrario, no se rechaza (se acepta).

3. La probabilidad de cometer un error de tipo II se denota por B y depende de la hiptesis


alternativa que se escoja:
Pr(error de tipo II) : B.

1. La potenc'io de una prueba es la probabilidad de tomar la decisin acertada, de rechazar Il


cuando sta es falsa, y es igual a 7 - P.

Figura 8.1: Probabilidad de cada tipo de error al realizar una prueba.

probabilidades a y B tienen las siguientes propiedades:

Para un tamao de muestra frjo, al aumentar la regin de rechazo (y por lo tanto a), B disminuye.

Al atrmentar el tamao muestral n, las probabilidades a y 13 dccrecen a la vez.

--- error de tipo I es considerado ms serio, por lo tanto


v ms importante dc evitar, que un error
-. lipo II. Consecuentcmente, el proccdimiento de probar una hiptesis se ajusta de manera que se
: -antice una <<baja>> probabilidad de rechazar erroneamente la hiptesis nula.

l:.:ttentemente, se determina el nivel cv de manera arbitlaria, pero si no se lo especifica, habr que


- :ular el p-valor del cotrtraste. Esto permite rechazar 116 para valores pequeos de a. Nosotros
- r:raremos, de preferencia, valores para o de 0.1, 0.05 o 0.01.

s de pruebas de hiptesis

pruebas de hiptesis se clasifican en unilatelales y bilaterales.


238 Captulo 8. Pruebas de Hiptesis

Definicin (de prueba estadstica unilateral) Una prueba estadstica urrilateral es aquella en
Ia que la regin de rechazo se localiza solamerrte en un extrerno cle la distribucin de probabilidad
del estadstico de prueba.

Para detectar si 0 I 0o la regin de rechazo se sitra err el extrerno superior de la distribucin del
estimador d (Figura 8_.2). Para detectar si d ) d6 la regin de rechazo se sita en el extremo inferior
de la distribucin de d.

eo 0o+C
Acentar Hn I Rechazar Hn

Figura 8.2: Distribucin de ? cuando se cumple Hs: 0 { 0s.

Definicin (de prueba estadstica bilateral) Una prueba estadstica bilateral es aquella que
sita la regin de rechazo en ambos extremos de la distribucin de probabilidad del estadstico de
prueba.

Las pruebas bilaterales se utilizan para detectar 0 < d6 o bien 0 > 0ol es decir, 0l0o (Figura 8.3).

Horla Aceptar Ho Ho,


aRechazar ,laRechazar

Figura 8.3: Distribucin de ? cuando se cumple Hs:0 : gs.

8.2. Pruebas de hiptesis sobre la media, cuando la varianzaes cono-


cida

Uno de los casos ms comunes en la realizacin de pruebas de hiptesis es hacerla sobre el valor de
la media poblacional, cuando se dispone de una muestra de dicha poblacin. El parmetro 0 que se
desea probar es LL y el estimador d es la media muestral 7.

A continuacin se exponen -de manera sucinta-, las pruebas estadsticas, bilateral y unilaterales,
cuando deseamos probar que el valor de la media poblacional l es igual a un valor prefijado -r,s.

Prueba bilateral para la media.

1. Hiptesis Nula. Ho: p: po.


8.2. Pruebas de hiptesis sobre Ia ntedia, cuando la varianza es conocida

2. Hi,ptt:si,s Al,terrtotduu Hl -L I ro.

3. Estadsti,co de P'rureba. Zobs : x:- lro


" IJ
4. Re.gin de Rechazo. zobs I -zol2 o Zor, ) z,r2.

Ejemplo. IJna empresa farrnacutic ha estatlecido qlre un compriniido dcbc tcncr Ltn peso
nredio igual a lo:0.5g y una desviacin estndar de o:0.11g. Se tom una muestradeT44
comprimidos de un lote de frmacos, cuyo peso promedio fue de Z:0.53g.

a) Para un nivel de significacin de 0.01, ,el peso de los comprimidos en e1 lote se diferencia
del admisible por Ia empresa'/;
b) Determinar el p-valor de la prueba.

Solucdn:

a) La prueba de hiptesis es bilateral:

1. Hiptesi,s Nula. Ho: F: 0.5 g.


2" Hiptesis Alternat'ua. HI tt l_0.5 e.

3. Estad,sti,co d,e Prueba. zobs : ?:+ - 0'53 - 0'5 :3.273.


o I \/n
0.11 I \/ 144
4. Regi,n de Rech,azu Para a:0.01,
Ia regin de rechazo es zobs < -2.57 o zo6") 2.57.
5. Deci,s'in. Como el valor zobs cae en la regin de rechazo, se descarta la hiptesis de que
/ : 0.5. La probabilidad de rechazar -16, suponiendo que sea cierta es solo 0.01; por lo
tanto, en al menos el 99 % de las veces la decisin es la correcta.

b) Determinemos el nivel de significacin mnimo de la prueba.


Como Zobs:3.273, el valor de probabilidad correspondiente es (D(3.273) :0.9995. Por ser
una prueba bilateral, se cumple que 0.9995** : t, por Io tanto, a:2(l-0.9995) : 0.001;
2 ','
que significa que llegaremos a una conclusin errnea en menos de I de cada 1000 veces, lo
que verifica la conclusin anterior.

b) Prueba unilateral para la media.


1. Hiptesis Nula. Ho: F: lto.
2. Hiptesis Alternat'ua. HI F] l-ro (o bien Ht F < po).
3. Estad,stico d.e Prueba. zobs :
r - tlo

4.
"l\,' zo6"
Regi,n de Rechazo. Zobs > zo (obien { -zat cuando HI F < ttd.
Ejemplo. Si en el ejemplo anterior, el peso mximo admisible para que el medicamento no sea
txico es igual'd LLo:0.52g.

a) Se desea saber si los comprimidos del lote son aptos para el consumo humano, a un nivel
de significacin del 5 %;
b) Determinar el nivel de significacin de la prueba.

Solucin:

a) Los datos son los mismos que antes se usaron, solo debindose cambiar las hiptesis.
24O Captulo 8. Pruebas de Hiptesis

1. Hiptesis Nula. Ho: F :0.52 g.


2. Htptesis Alternatiua. HI F > 0.52 g.

3. Estadstico d,e zors:' , F - 0'53-0'52:1.0909.


Prueba.
" I rt
o.lJt44
4. Regin :
de Rechazo. Para cl 0.05 la regin de rechazo es zob.s > 1.65.
5. Dec'isi,n. Como el valor zobs Lo cae en la regin crtica, no existe razn para descartar
la hiptesis nula, de manera que se podra asegurar que el medicamento es apto para el
consumo humano.

b) El nivel de significacin de la prueba es 1- 0(1.0909) - 1- 0.8621 : 0.1379. Como


p :0.1379 > 0.05, no se rechaza Hs.

Observacin. Si el tamao de la muestra es suficientemente grande (n > 25) y se desconoce la


vatianza, es posible utilizar estas pruebas, reemplazando o por su estimador s, sin prdida de exactitud.

Clculo de Ia potencia de la prueba

La probabilidad de cometer un error de tipo II se nota como B y se define por

: Pr(error de tipo II) : ptl""eptar flslr, ),

donde suponemos verdadera la hiptesis Hl F: l-rt.

Errtonces, por el Teorema del Lmite Central, la variable 7 : !-4 sigue una Iey normal estndar.
ol\/n
Ejemplo. En el ejemplo anterior, calcular Ia potencia de Ia prueba si el verdadero valor de la media
es 0.54 mg.

Solucin: Veamos qu signiflca <<aceptar -16>> en trminos de los valores que puede tomar el promedio,
r.
Aceptamos Hs si+ < 1.6b; es decir, ,01.?,, < 1.65, o seaz < 0.53b13.
o I \/n - 0.rll\/144
=u-- -
Por tanto, la probabilidad B la podemos poner de la siguiente manera:

Pr(aceptar Holp) : Pr(z < 0.535131p1 : 0.b4)


("- p, - 0.53513-0.54\
"\"lr/i' o.lrl\n44 )
: Pr(Z < -0.53127) :0.2976.

La correspondiente potencia de la prueba es Pot - 1- 13


:0.7024.

8.3. Pruebas de hiptesis sobre la media, cuarido la varianza es des-


conocida

Cuando la varianza es desconocida, no es posible aplicar el Teorema del Lmite Central; en este caso,
para que sea posible aplicar esta prueba es necesario que la muestra provenga de una poblacin que
sigue una ley normal, de manera que el estadstico de prr"reba sigue una ley de distribucin . Entonces
la prueba estadstica es la siguiente:
8.3. Pruebas de hiptesis sobre la rnedia, cuando Ia varianza es desconocida 24L

a) Prueba bilateral para la media.

1. Hipteszs Nula. Ho: Lt: l-to.


2. Hiptess Alternatiua. Hr p I p,o.

3. Estadstrco d,e Prueba. trrbs :


r- Po

4. 'l'F,
{ -to/z(n -
Regi,n de Rechazo. tob" 1) o tob" ) t^2(n - I).

Ejemplo. Segn un estudio del Ministerio de Educacin, el costo medio de la lista de tiles
de los escolares de educacin bsica es 87 dlares. Para verifi.carlo, un investigador tom una
muestra con los siguientes resultados:

Cesto (ri) | 68 7b 93 101 r23

Para un nivel de significacin de 0.05, verificar la hiptesis de que la mquina cumple con la
especificacin.
Solucin: Previamente hallamos eL promedio y la desviacin estndar: :97.7 y s : 18.728
(los clculos se dejan como ejercicio para el lector).
Con sto planteamos el contraste:

1. Hiptesis Nula. Hs: p : $1.


2. Haptesis Alte,rnatiua. H; p,l87.

3. Estad,stico de Prueba. tobs: !;+ - 87 -


97'7 o
slfr, --
<,=<
L'')'
t|tn@-
4. Regi'n de Rechazo. Para el nivel de significacin a :
0.05 y por el nmero de grados ile
libertad ("- 1) : 19 se encuentra el valor de s.625(19) : 2.093. La regin de rechazo es
tobs 1-2.093 o to6" ) 2.093.

5. Dectsin. Como el valor o6" s encuentra en Ia regin crtica, ya que 2.555 > 2.093, se
rechaza la hiptesis nula; es decir, el precio medio de las listas de tiles es distinto al que
afirma el Ministerio.

b) Prueba unilateral de la media.

1. Hiptesis NuIa. Ho: Lt.: l.to.


2. Hiptesi,s Alterno,tiua. Ht F > po (o bien I11: F < tli.
3. Estadstico d,e Prueba. tobs : " , 4.
"1rfr"
4- Regi'n de Rechazo. tob,) t.(n.- 1) (o bien tob, 1-to(n - 1), cuando H t < tto).

Ejernplo. Segn las previsiones del gobierno, la inflacin para este ao ser de 3.g %. Un
economista, desconfiado de Ia cifra, realiz una investigacin por su cuenta y registr la variacin
de los precios en los 22 artculos que a su juicio tienen la mayor incidencia en Ia economa popular.
Obtu'r'o una variacin de 4.5 7o y una desviacin estndar de 1.3 %. Pruebe si la cifra de inflacirr
del investigadol ser mayor que la del gobierno.
Solucin: Se tienen los siguientes datos del problemai rL:22, r:4.5 y s: 1.3. La prueba es:

1. Hiptesis N'ula. Ho: p: 3.9.


2. Hipteszs Alternat,iua. HI H > 3.9.
242 apu,Ia 8. -Fruefas de -fipCesis

3 E,lnLlis!i'o d, pr,,"5,,. 1,,t,. +


O' ''t:: 2.lLii.
'lJ't t.:j/ \/2')
flegt,ri, tle Si tornarllos Lv : [J 01 y l,o or(21) - 2.518, la legin cr'tica es
trlec:la,zo. 1.,,,,,, )>

2.518; pcto si sc tonta r-v:0.1-J5 y ls5(21) - I"721,1:r reg,in ur'tir-' es ..,,, > 1.72]1.
Dec:i,si,n, Prla cr - 0.01 no se rechaza H; cs dccir, no existe evidencia quc indiqu,,rl{'ia
ciflr clacla, pol cl gobierno est subestirrrada. Srn embargo, si sc torna r-v - 0.05, resulta que
Lob., ) ... se rechaza Ho; es decir, 1a infla',n cs inayor que la estimada por el gobici"no.

ltpaltirdelosclosrcsultadossedednce qr-ielaaceptacin orec:hazode-r,:3.9noesconchryente.


puesto qlle con o : 0.05 se rechaza y con ! : 0.01 se acepta. En este caso se debera arrmentar
el nmero de observaciones.

8.4" Pruebas de hiptesis sobre la varia.nza

Para realizar una prueba de hiptesis sobre la varianza, supondremos que las observaciones provienen
de una distribucin normal) para que el estadsti * @# siga una distribucin y2 con (n - t)
grados de libertad. Bajo este supuesto, las pruebas de hiptesis son las siguientes.

a) Prueba bilateral para la varianza.

1. Hiptesis NuIa. Hs: o2 : of;.


2. Hzptesr,s Alternat'iua. H o2 I o2r.
(n
3. Estad,stico d,e Prueba. X3,,": -])s2 .
o
4. Regi,n de Rechazo. X?"u" > X?.p(n - 1) o XZt < Xl .,r(n - t.
"
h) Prueba unilateral para la varianza.

1. Hiptesi,s Nula. Hs: o2 : of,.


2. Hiptesr,s Alternatiua. H o2 > @ bien 111: o' < oZ).
"3
(n - !)s2
3. Estad,sti,co d,e Prueba. XZu": .
o2o

4. Regin de Rechazo. XZu"> x?,(n- 1) (o bienyf;o"<x?_,(n- 1), cuando Ho2 <"2i.

Ejemplo. Un fabricante de cables de cobre afirm que su producto tena una resistencia a la ruptura
relativamente estable y que se ubicara en un rango de 40 kilogramos-fuerza (kgf) . IJna muestra de
16 mediciones arroj una varianza igual a s2 : 195.

a) Hay evidencia suficiente para rechazar Ia afirmacin del fabricante?;

b) Encontrar el p-valor de la prueba.

Soluci,n: Como el fabricante da el rango de variacin de la resistencia, podemos estimar la desviacin


estndar mediante la relacin aproximada
" - ry99 (dada en el Captulo 1), por lo qne se puede
asumir que o : 10 kgf.
8.5. Pruebas de hiptesis sobre Ia proporcin 243

a) Lrr prlreba t:s:


1. Hiqtlr:s'is Nrr,lo. H'. 62 : 102 :10C).
2. H'i1ttt:srs Altentat,i,ua. Ht'. o2 > 100.

3. Estadst'ic:o tle Prtrcbo,. X?,., : (n, - t)s'2 (16 - 1) x 195


:29.25
100

4. R.egir'r de Reclazct. Prra nn rrivel cle significacin o:0.05 y 15 g.1., fSoo(15) :25.00. La
regin crtica es Xlo" > 25.
5. Decisin. Como 29.25 > 25, se conch.r.yc qrre la hiptesis es falsa y qtle la variacin de la,s
mediciones excede ias especificacioues del fablicante.

b) Para encontrar el nivel de significacin aproximado de la prueba examinamos) en ia tabla de la


distribucin X2,elrenglncorrespondientea15g.l. Sevequeelvalor d.XZt":29.25 esmayor
eue XZ.ozs :27.49 y menor eue X3.or:30.58. As, el nivel de significacin observado es menor
que 0.025, Io que quiere decir que se rechazar la hiptesis nula para cualquier cr mayor o igual
al2.5%.
El valor exacto, obtenido mediante un programa informtico) es 7.45%.

8.5. Pruebas de hiptesis sobre la proporcin

Supongamos que se dispone de n observaciones


provenientes de una poblacin con distribucin de
Bernoulli y deseamos probar que el parmetro p es igual a un valor prefijado ps. Recordemos, tambin,
:1ue si entre las n observaciones hay y xitos, Ia proporcin se estim a por f; : !.
n
Para la realizacin de estas pruebas, utilizaremos la aproximacin de la ley binomial mediante la ley
:rormal.

a) Prueba bilateral para la proporcin.


1. Hi,ptests Nula. Hoi p : po.
2. Hiptesi,s Alternatiua. Ht p I po.
p-po
J. Estad,stico d.e Pr-ueba. zobs --F o0
-po - --Ft OonCte p- -a
lPoqo n
tl-
un
4. Regi,n de Rechazo. zobs I -2.2 o 2o6" / zt/2'

b) Prueba unilateral para la proporcin.


1. Hiptesis NuIa. Ho: p: po.
2. Hiptesis Alternatiua. Hr p > p0 (o bien I11: p < po).
3. Estadstico de Pru,eba. Zobs : f-po
po qo
n
4. Regin de Rechazo. zobs ) zo (o bien zor, I - Zat cuando Ht p < po).

:jemplo. Una empresa realiz una investigacin de mercado para determinar el nivel de consumo de
- refi'esco, para lo que consult a200 consumidores, de los cuales 28 expresaron sll preferencia por
.-:roducto. El fabricante, de acuerdo a sus ventas, cree que tiene el 10% del mercado de refrescos.
244 Captulo 8. Pruebas de Hiptesis

a) Son los resultados de Ia investigacin consistentes con los datos del fabricante?;

b) Determinar el nivel de significacin del contraste.

28
Soluczn: Se tiene Po : 0.1 Y el estimador de Ia proporclon es p - :0.14.
200

a) La prueba queda as:

1. Hi.ptesis Nula. H0: p: Q.1.


2. Hi,ptesis Alternatiua. Hr.p + 0.1.

.J. Estad,stico d,e a' Zobs:P - Po


Prueb 0.14 - 0.1
:1.886.
lposo: 0.1 x 0.9
tl n
4. Regin de Rechazo. AI escoget (r:0.05, 26.s25:1.96, la regin es zobs > 1.96.
5. Dec'isin. Como zobs Lo cae en la regin de rechazo, no se puede descartar Ilg; entonces,
no hay evidencia de que la proporcin de consumidores sea distinta del 10 %.

b) Como zobs :1.886, el valor de probabilidad correspondiente es A(1.886) : 0.9706. Por ser una
prueba bilateral, se cumple que 0.9706 +;:1; por lo tanto, a:0.0588.

Clculo de la potencia de la prueba

La probabilidad de cometer un error de tipo II se nota como B y se define por

,6 : Pr(error de tipo II) : prlu"eptar I1slp1),

donde suponemos verdadera la hiptesis Ht: p: pt. Entonces, Iavariabl.e Z: srgue

una ley normal estndar.

Ejemplo. En el ejemplo anterior, calcular la potencia de Ia prueba si el verdadero valor de la


proporcin es 0.12. '

Solucin: Veams qu significa <<aceptar f/s>> en funcin de p.

< 1.96, o sea 0.05842 < A< 0.14159.

Por tanto, la probabilidad B la podemos poner de la siguiente manera:

Pr(aceptar fo br) : Pr(0.05842 < 0 < 0.I47591p1: 0.12)

0(0.93958) - O(-2.6799) : 0.8226.

La correspondiente potencia de la prueba es Pot - 1- 0 :0.1774. <


En el Cuadro 8.1 se presenta un resurnen de las pruebas de hiptesis col muestra nica.
8.6. Ejercicios 245

Hiptesis Hiptesis Estadstic<-r Regin de


nula (I{) alternativa (,F11 ) cle prueba rechazcr

3,i,"Ti3:.fi;TH' i
grarrcle) =
i;i r,lli , t!
-ro/\/n
,
t4,"'),,,'
(rrruestra Lt,2 tt,o lt { I,t,o z4 -zo
Distribucin riorrnal : l1,o F I H, ,'- i - l"o lt > t^/,
va'iarrza lt1. po Fllro slJn- tltu
clescolocida y,) l.ro lt 1 fto (n - 1) g.l. t { -to

Distribucin p: po Plpo l-l r


ll 2 zo/2
-

binornial P<Po P>Po z-


(rnuestra grande) P> Po P 1Po L\-40

Cuadro 8.1: Pruebas de hiptesis con una sola muestra.

8.6. Ejercicios

Pruebas sobre la media poblacional (varianza conocida)

Se sospecha que los varones de las nuevas generaciones tienen, en promedio) mayor estatura que
las antiguas. En un estudio realizado hace clos dcadas se determin que la poblacin adulta
masculina tcna una cstatura media de 167 cm, con desviacin estndar de 10 cm.

a) Si se <lesea verificar Ia suposicin anterior, formule, en smbolos y en palabras) la-s hiptesis


nula v alternal iva;
b) Recientemente se tom una rnuestra de 35 reclutas del servicio militar y se observ una
estatula promedio de 171 cm. Qr.r conclusin se puede sacar con a : 0.01?

Un fabricarrte de fertilizantes afirma que el uso de su producto dar por resultado una cosecha
de por lo rnenos 3.5 toneladas de trigo por hectrea, como media, con una desviacin estndar
de 0.5 toneladas. La aplicacin del fertilizante a un lea de 37 hectreas dio una cosecha de
3.35 toneladas por hectrea.

a) Al nivel de significacin del 5Vo, ,serecltaza la afirmacin del fabricante?;


b) Se rcchaza la afirmacin al nivel del TVo?
Una balanza sc encltcntra descalibracla y no siempre registra el peso rxacto. Cuando se pesan
454 g la desviacin estndar es de 10 g. Para averiguar si es necesario recalibrar 1a balanza se
realiz una scrie de 50 pesajes de cantidades iguales de <<una libra>>, resultanclo un peso promedio
de 451 g.

a) A urr nivel del 10 %, es necesario lecalibrar la balanza?.


b) Calcule el nivel de significacin cle la prticba.

Una emplesa qlle elabora plarrchas plsl,icas puso en prctica un nlrevo rntodo de fabricacin
tal que el costo medio por rnetro cuadrado sc distribuye rrormalmente con va,rianza poblaciorral
4. Se obtuvo una muestra aleatoria simple de tamao 100, resultando un costo promedio de 2.4
dlares. Verifique la hiptesis de que el costo medio es dc 3 dlares, con rrn nivel de significacin
del4.5%.
246 Captulo 8. Prttebas de Hiptests

5. Pol cstudios rrrt<:Liorcs, scr srrbc crer lir" rrcrlir dr: I eclrd rle los tlclirrcrrcrrt<:s crr cl pzrs cs rlc 23
aos: sirr cnrl.,argo. crr un estrrclio rer:icnt<r (ioll Llnt unrcstLr rlc: 80 clr:tcrriclos. sc obtrrvo r-rrr 1>rorrrc<1io
clc 21.5 arlos y urrt <lesviar:irirr estirlrlrr' <lc i-J. Crl rrn nivcl rle sigrriic:ir<:irirr cl<:1 '2 %, r:r.,ur1.,nLelrc
ia, hipritcsis clc quo lr rneclir cie ecla,cl cle los clelirrcrrcntes sc hr lc<hrciclo sigrrific:rtivirrle:lr(,c.

(i LLr lrbor'rtorio frlrrrrcuti<:o asegura qllc rrn nrcdicrriertto crc fal rricr ti<rrre nrr <rolrtenirlo rrreclio
dc 10 000 unidadcs cln ca(la dosis. Para corrl"rol.rrr si c1 lrl-ior'itolio cs de fial se torn<i uua
mur:stla cle 40 dosis, obterricnclo una rucclia <le 9940 uuirirrles ) ulla desvircin ostinclar clc 120
unida<les.

a) .Poclcrnos aceptal la iuclicacin clel Irboratori<.r cou ulr rrivcl cle significacitit r.IeI I%il:
b) Calculc ei nivel de significacin de la prueba.

7 En un restaurante se haia tenido una media de 160 consumiclores diarios y nlla dcsviacirt
estrrclar clc 17.5. Se aumerrrt los precios cle la cornida y el propietalio not que 1os 30 riltimos
das haba un prornedio de 151 clientes diarios. trI propietario pnede pensar que efectivament<:
ha descendido el nmero de clientes o que la variacin es debida aI azatrl

B IJna emprcsa exportadora de camarn el ao pasado embarc una media de 10500 c:rjas por'
sernana) corr una desviacin estndar de 1500. Eu los primeros seis rneses (26 sernanas) dc estc
ao export un plornedio cle 11200 cajas cada semana.

a) Puecle asegurarse que ha habido un cambio en la demanda de camarn?;


b) Halle el nivel de significacin de la pmeba
I En una fbrica, la produccin por hora dc botones de tagua sigue nrra distribrrcirl nornlll
con desviacin estndar de 16. Se extrae de dicha poblacin Lrna mnestra de tmairo 81, para
contrastar la hiptesis de clue la produccin medir por hora del citado producto es 100, a1 nivel
de significacin del 5 %. Si la hip<itesis alternativr es 105, calcule la prolrabilidacl de ccrrneter urr
error de tipo II.

10 Una sociloga afirma que cl tiempo que los nios cle tres r cinco riros dedican a ver la televisirr
cada semana se distribuye normalmente con media 22 horas y desviacin estndar 6 horas. Frentc
a este estr-rclio, una ernpresa de investigacin de mercados cree que la media es mayor y pala
probar su hiptesis tom una mucstra de 64 observaciones procedentes de la misrna poblacirr.
obtcniendo como resultaclo una meclia dc 25. Si se utiliza un nivel de significacirr del 5 %:

a) Verifique si la afirmacin del investigador es realmente cierta;


b) Determine la potencia de ese contraste, si 1a verdadera media poblacional fuera 24.

11. Urr rnicroernpresario est considerando la posibilidad de administrar cl bar clc uu colcgio. trl
adrrrinistradol actual del brr afilma quc r:l inglescr diario sigue una distrilrucin nolrnal rle rnedia
87.5 dlares y una desviacirr estndrr di: 7.5 dlares. Para comprobar si decr la verclld) torn(i
Lurr rnlrestra de treinta das y :sta revel<i r-ru ingreso dialio promedio dt: 82.5 dlrres. Utilizarrck
o: 0.1,

a) ,hay evidencir de quc cl iirgreso diario promcdio sel nenor clcl que rfir'ma el clueo actrral'/;
b) Calcule la potcncia clcl contraste si lr verdaclera rncdia fucra pr,:85.

Pruebas sobre la media poblacional (varianza desconocida)


12. Una muestla de n : 11 observaciones de una poblacin distribuida rlolmalmente dio corno
resultado un promedo T : 19.5 y una desviacin estndar s : 2.4. ,Proporcionan los datos
suficiente evidencia para probar que > 18?
t
t
fi
i.
8.6. Ejerci.cios 247

a) Enuncie las hiptcsis nula v altelnativr clc lr pmcl)r;


b) C)lrtcuga la legin clc reclLazo ltrrra la prtrr:lrir si a:0.05;
c) Llcvc r cabo la 1;rneba e interpr:tela.

Se dcsca saber si la cdad promedio a la cual sc clesposan las rlujeres en la ciudacl cle Cuenca es
diferente cle los 26 aos de edad. Sc torn rrna muestraclc24 registros dc rnrtrimoriio, resultandcr
las sigr-ricntcs edades de las novias:

18 28 46 21 29 23 47 43 23 32 20 56
26 40 19 35 20 18 16 65 22 19 24 32

La edad promedio de estas edades es 29.83 aos y ia desviacin estndar es 12.86.

a) Son ios 29.83 y 12.86 parmetros o estadsticos?;


b) Plantee las hiptesis nula y aiternativa para verificar el argumento arriba indicado;
c) Calcule el estadstico de prueba y la regin de rechazo para esta prueba de hiptesis;
d) Explique su conclusin sobre si la edad promedio de Ias desposadas en la ciudad de Cuenca
difiere de los 26 aos.

14. Una compaa de televisin por cable anuncia que el periodo medio de espera desde la solicitud
hasta la conexin a la red de sus nuevos clientes es de ocho das. Una asociacin de consumidores
desea verificar dicha hiptesis, para lo cual tom urra rnuestra del periodo de espera (en das) de
15 clientes con los siguientes resultados:

11 r0138 10 721281011 l07B


Verifique si el periodo medio de espera es igual o diferente a ocho das. (Use a : 0.05.)

\5. La resistencia, en kgf crn2, de Ia fibra de carbono se distribuye normalmente. Se tom una
mnestra de 10 elementos fabricados con este material, obteniendo:

203 229 275 220 223 233 233 208 228 209

Contraste la hiptesis de que la muestra proviene de una poblacin de media 275 kgf cm2.

6 Segrn los datos de una universidad, sus estudiantes obtienan en el examen de evaluacin clel
ingls como segunda lengua una media de 50 puntos. Un profesor de ingls quiso comprobirr
si sus alumnos tenan un promeclio rns alto, para ello seleccion una muestra aleatoria de 20
alumnos y les envi a examinarse. Los resultados dieron una nota promedio de 54 y desviacin
estndar dc 7 puntos. A qu conclusin llegar el profesor, con un nivel de significacin del
f,(Yn
/a:

En una ciudad se quiele hacer un cstr-rdio rpido para'r,'alorar el consunlo de agua en los domicilios
palticulares dulantc los meses de mayor seqntr. Para ello sc seleccionalon, al azar, 15 domicilios y
se midieron slrs consumos (r) en metros crbicos durante el mes de agosto. Los resultados fueron
Dr :280.5, Dr? :5308.35. En vista cle estos clatos, hay suficiente evidencia estadstica, al
nivel 0.05, r favor cle la hiptesis de que el conslrmo medio de los particulares durante el mes de
agosto es llayor clue 18m3 (q,-,e es el consnmc considerado como <sostenible>>)?

El consumo de gasolina (en litros por 100 km) de los automviles de 3 puertas sigue una distribu-
cin normal con rnedia 8. Se introdujo una modificacin en el motor con objeto de disminuir el
248 Captulo B. Pruebas de Hiptesis

corrslrnlo y se probaron 10 rutos corr el motclr modificaclo, obtcrrirrclose los siguierrtes esta,rlsticos
por' 100 krrr:
10 10

f
,.-r ",:77'5, T,r;i -
i.- I
(i01.33

Srrponiendo qr-re la modificacin urrntienr: 1a nor-nalidirrl, ,hay suficiente evidr:lrcia csticlsticr


(al nivel clc significacin 0.05) ptrra porlel afirmll cre la rnodifir:rcirin ha reduciclo el colrsllrno
meclio?

19 El ticrripo al disco drrro cn un c;icrto mocielo dc computarloras es una variable rleatorir


<le acceso
con rnedia 15 milisegundos. Se propuso una modificacin tcnica con objeto de dismirruir cste
ticrnpo de acceso. Se prueba el nuevo sistema crr 10 cornputarloras obtenindose una medir
muestral de 14 ms y una desviacin estndar de 2.286.

a) Hay suficiente evidencia estadstica, al nivel 0.05, a favor de ia hiptesis de que el rruevo
modelo disminuye el tiempo dc acceso'/;
b) Calcule el p-valor.
c) Indique un par de valores de 7 y de s que hubiesen llevado a un p-valor de 0.005. Qu
decisin se dcbera tomar eri este caso respecto al nucvo rnoclelo?

20 Una muestra de 25 traba.jadores informales, que sc dedican a vender golosinas en los buses.
ganan un promedio de 17.5 dlarcs diarios con una desviar:in estndar de 2.5 dlares.

a) Estime la ganancia pr:ornedio diaria r-le es1,c tipo cle trabtrj:rdores informales, usa,ndo nn
intervalo de confianza aI g57a;
b) trs Ia ganarrcia promedio de 17.5 cl<ilares significativmente inferior a los 18.5 dlares qrrc
ganan los vencledores qne tienen un prresto fijo en los cines? (Utilice nn nivel del 5%.)

Pruebas sobre la varianza poblacional


2r. Unr muestra de r : 25 observaciones cle una Poblacin distriluida rrormalmente clio corno
rcsrrltaCo una variatrza lullestrIl dc.s2:23.4. Proporcionan los clatos srrficiente eviclencia que
indirrre q',r o2 > i5?
22 Urr muestra aleatoria de 14 est,ucliantes de enfcrrnera participan en Lrna plLreba ptrra meclir
su destreza mannal. una vez obtenidas las purrtutrciones, la varianza de lr muestr es cle 7221.
Contrastc con cv : 0.05 que la varianza poblacionirl es de 2500"
t'l I a lrrecisin del tr"bajo dc una niquntr urtom.tica se nlide por: la r..aLirnza clc-. la cliuiensirr
coutrolaclr clc los productos, que llo debr: ser rrli\yor,,c ofr :0.18. Se torrr<i nna rLruestr;r
ak:lLtclia cl<r rrtculos quc hrr daCo la,s sigriicnte-s rledici<tri<ts:

Verilique si la nrqrrinir gartrrrtiza lir prer:isin neer:salia p;rlzr el uivel cle significirr:irin ck: (-).05.

24. estndar-de un proceso ir.ciustLirl (irrc plo(hlce valillas, <:l concliciones nolrnirles,
Lr c{esvia,cicin
es clc 3 crn. Se dispone de una nnestra ck: tarnairo 15, con los sigr-rientes valores:

12; I i7 115 130 l1; 112 11it 1


I
0')
:, I 121 177 116 122 r20 126 115.
Su1-ronierclo clue las longitudcs sigr-rcrr tlltl lc_1, r, illr)r'rl . contrastc Ia hiptcsis dc cre erl ploccso
furrciona correct alnente.
8.6. Ejercicios 249

25. Una mquina de crnpaquetado automtico deposita en cada paquete una ciclta cantidad de papas
fritas. Se scleccionan 20 paquetes, se pesa su contcnido y se obtienen los sigr.rientes resultados:
49 50 49 t10 50 50 49 50 50 50
49 50 50 51 52 48 50 51 51 51

A partir de esta informacin y suponiendo que la variable se distribuye normalrnente:

a) Verifique si la media de esa variable es 51, con un nivel de significacin del 1%;
b) Verifique si la varianza es la unidad, con un nivel de significacin clel 5 %.

Prueba sobre la proporcin poblacional


26. Una muestra de n : 1000 observaciones de una poblacin binomial produjo A :280 xitos. Si
la hiptesis de la investigacin es que la proporcin es menor que 0.3.

a) Es una prueba bilateral o unilateral? Por qu?;


b) Fbrmule las hiptesis nula y alternativa de la prueba;
c) Realice la prueba e interprtela. Utilice a : 0.05.

27. Una marca de aceite comestible cubre actualmente el 20 % de los rotencialcs clientes. Para
incrementar las ventas se estructura una campaa pubiicitaria intensiva. AI final de la misma se
realizar una investigacin a 400 consumidores potenciales para determinar si tra tenido xito.

a) Enuncie Ho y Ht en trminos de p, Ia probabilidacl qrre el consumidor prefiera la marca cle


aceite;
b) La empresa concluir que la campaa tuvo xito si al menos 94 de los 400 entrevistados
prcfieren su prochrcto. Encuentre a;
c) Realice la plueba e interprtela.

r8 En una encuesta a 300 taxistas, 132 contestaron que utilizan el cinturn de segulidad. {Jtilizanclo
un nivel de significacin del 5 %, podemos concluir que la mitacl de los conductores utilizan el
cinturn?
')9 De acuerdo con sns registros, una clnica ha establecido que la probabilidad de curacin completa
de un enfermo que ha tomado el medicamento A es 0.8. La clnica experiment con un nuevo
medicamento B en 700 pacientes, de los cuales 575 se cllraroll totalmente. Se puede considelar
que el nuevo medicanrento es ms eficaz que el tradicional, al nivel dc significacin de 5To?

Una agencia dedicada a1 cobro de cheques encontr <re el 5 % de toclos los cheques remitidos
a la agencia eran cle cuentas sin fondos. Despus de implantar nn sistema de verificacin, pa,r'a
disminuir sr"rs prdidas, se hallalon solarnente 50 cheques sin fonclos erl Lrna mncstra aleatoria cle
1124 cheques. Existe suficientc evidencir, estadstica para concluil quc el sistema de verificacin
ha reducido la proporcin de cheques sin fondos?

Un proveedor ascgura que los artculos que 1 snnrinistra sorr defectu.osos en un 1% cle los casos.
Se realiz r-rna pmeba r 200 de sus artcnlos y resr-rltaron 3 r-lefectllosos.

a) A un nivel cle significacin del 1 '%, ;t:s falsa o cierta la afir'macin del ploveedor?;
b) Halle el nivel de significacin observado de la plueba.
En una encuesta en Quito se entrevist a 850 adlrltos. A la pregunta de que si ellos estaban a
favor del endurecimiento de las penas por ciertos delitos, eI 52% respondi afi.rmativamente.
250 Captulo 8. Pruebas de Hiptesis

r) .Sc Pucclc ccttr:lttil ctct lir rtit\rorr clet los rdultos estn r favol del enchrrc<tirrLierrto rle lrs

l) ollrs ?i

l,) l}lcrrcrrl.r'i: cl nivr:l clc sigrrific:acin cle la y>nrcbzr.

33. Utt ecortornista clcl Battco Cerrtral est intcreslclo err conrl)ar'rr cl uilice cle arrsentisrno labolal
crr (.)rrito con el dcl rcsto del pas, doncle se sitria <n eI 77(%. Corr estc plopsito se:ieccionci, al
azar') urra rnuestra cle 200 tlaba.jaclores de dicha, ciuclad, la cual proporcion rur porcenta.je de
ausentisnro del \6(Vo.

a) Se pr-rede sacar la conclusi,n de que el arrsentisrno es rnayor en Qr-rito qlle cn el lesto de1
pas, al nivel de significacin a : 0.025?;

b) Calcule [3, p: 0.17;


"i

34. Una agencia de publicidad trat de convencel a un industrial para que hiciera propaganda
televisada de uno de sus productos, asegurndole que el programa en el que se incluira su
aruncio era visto por el 2A% de las familias. trl industrial quiso hacer un experimento por su
cuenta. Llam por telfono, durante Ia hora del programa, a 220 familias y hall que en 33 de
ellas se vea el programa.

a) La diferencia entre la proporcin de la agencia y la obtenida por el industrial es significa-


tiva? Es decir, se debe nicamente al azar o es sustancial? Use a:7'7a;
b) Calcule la potencia del contraste, si p : 0.15.

35. En un programa periodstico de opinin se pidi que los televidentes Ilamaran al canal y respon-
dan a la pregunta << ,cree usted que es necesario que se hagan reformas en el sistema educativo
del pas?>> De 812 llamadas recibidas, 790 se expresaron afi.rmativamente.

a) Use esta informacin para realizar Lura prueba de que ms del 95% de los ecnatorianos
adultos cree que se deben hacer reformas en el sistema educativo;
b) trs el resultado de la prueba estadsticamente significativa al nivel 0.01?;

c) Liste las hiptesis requeridas para que Ios resultados de Ia prueba sean vlidos en esta
situacin. En este caso, ,se satisfacen tales hiptesis?

Al igual que en el caso de observaciones realizadas sc\bre una misma poblacin, cuanclo se dispone
de varias muestras provenientes de poblaciones distintas, se podra desear conocer si ellas compalten
irlgurra caracterstica o si son totalmente diferentes. En Io que siguc nos ocuparemos de las pmebas
de hiptesis que involucran dos mllestras.

8.7. Pruebas de hiptesis para Ia diferencia entre dos medias

Igual a lo que se hizo en la seccin cledicada a las pruebas de hiptesis sobre la rnediir, se deben
considerar los casos en qne es posible aplicar el Teorema del Lmite Central y aquellos erl que no es
posible. Adicionalmente, se deber terrer en cuenta un tercer caso, cuando las muestr-irs provienen de
una misma unidad muestral, mediante mediciones repetidas.
8.7. Pruebas para Ia diferencia entre dos rnedias 25t

8.7.1. Caso 1: Varianzas supuestas conocidas

Sr-rporrgarnos !1[te sc) clispone r[c clos poblaciorres, rlrri: liLs rrr)rnl-,r'rlcn]os conlo I -y 2, y se clescr 1rrt.r]rzrl si
la difcreucia entre lrs clos rnccUas polrl:rcionales es igual l nrra crnticlad 1); cs clecir, H1: 1 - lLt - Do,
o se clesei lrlobal el caso lrirlticular cLe ltr igualclic.l dc talcs rnedirs, o scA) H'. t1 - ,t,.r.

De la pobltrcin 1 se extrae irnt rnrtestta de tarnao rL y de la pobl:rcit 2 sc extrrc unl mlrestlr (le
tarlao n2. Si lrs colrcsporrdientes r,'arianzas poblaciontrles son corrociclas. las 1>nrebas de hiptcsis
son las signientes:

a) Prueba bilateral para la diferencia de dos rnedias.

1. Htptests Nula. Ho: (g - p,z) _n


- uu.
2. Hiptesis Alte'rnatiua. Ht (pt -P)lDo.

3. Estadstico de Prueb&. Zobs:


(t1- :r2) - Ds
I '' 't
loi
,i/-t-
o.1

Y n'' n2
4. Regin de Rechazo. zobs 1 -zryl2 o zobs > za/2.

b) Prueba unilateral para la diferencia de dos rnedias.


1. Hipte.sis Nula. Ho: (h - F) : Do.
2. Hptesis Alte'rnat'iua. Ht (pt - t ) > Do (o bien I11: (pr - p) < Do).

2 F"r-,r"!in ,lo
3. Estadstico p,"",.t,^ z.ts: (rt -z) - Do
de P'rueba. - l,
loi o;"
U^--q
4. Regin de Rechazo. zobs> zo (oltierr zo," -zat cuarrdo H (t1 - pz) < Do).

Ejernplo. Una inversionista tiene dos hoteles en la ciudad, uno en el norte y otro en el sur. El
sospecha que el conslrmo medio en el restaurante del norte es menor que en el del sur. Del primer'
-ocal se obtuvo una muestra de 30 facturas, r'esultando un consumo medio de 59 dlares. Del segunclo
-ocal se tom una muestra de 50 facturas, con Lln consunlo medio de 63 dlares. Las varianzas de los
: onsumos en los clos locales son conocidas e iguales a 60 y 80, respectivamente.

a) Para un nivel de signiflcacin de 0.05, r'erifque si es cierta la sospech.a del duer-ro cle los hoteles;

b) Determine la signifrcacin de la pmeba.

Soluctn: Por el enunciado del problema:


Local norte: Tt : 59, o2I:60, nt : 30.
Local sur: 72 :63, o'i: 80, nz : 50.

a) Es urra prueba unilatclal con D6 : Q;

1. Hiqitesis Nula. Hs; 14: 11,2.

2. Hiptesis Al,tt'tt;,o,ti,ua. H7: [t1 1 [t2.


252 Captulo 8. Pruebas de HiPtesis

E,stad'st'ico de, Prueba.


(r1 -22) - Do (59 - 63) - 0
: -2.I1-.
"?
-j+i
'tLI
"3
n2

4. Ile.qi,n de Rechq,zo. Para el nivel clc significacirt o : 0.05, 1a regirlrr cle rechazo es z,'," {
-7.645.
cl loca1 del nortc
Dccisi,,n. Corno zobsl (:aceu la rcgin cle rechazo; se concluye qlle cn
e1
5.
conslrmo es menor.

b) Puesto qtLe zobs: -2.17, entonces o(-2.11) :0.0174; es decir', el p-valor <:s 7'74o/c''

de las muestras es suficientemente grande (n > 25) y se desconocen


las
observacin. si el tamao
varianzas, se puede utilizar estas pruebas, sustituyendo o! y o?rpot sus
estimadot"s, sl y
"!'

8.7.2.Caso2:Varianzasd'esconocidas'Supuestasiguales

Se dispone de dos poblaciones y se desea probar si la diferencia


entre stls correspondientes mcdias
poblacionales es igual a D0; es decir' 'FIs: ut- Fz- Ds'
poblacionales son desconocidas'
Disponemos de dos muestras de tamaos nt y n2. Si las varianzas
pero supuestas iguaies; entonces, calcuiamos ei estimad.or ponclerado de o2 mediante

- 7t 'i-,"1'-2'
, (nr- r)r? - - ls|: it'
s-:-
qn2

"
ntln'-2
n,.-2

cloncle t? V tZ son las varianzrs rnuestrales de las rnuestras 1 y 2.

Corr toclo esto, las pmebas dc hiptesis son las siguientes:

a) Prueba bilateral para la diferencia de dos rnedias'

1. Itiptesis Nula. Hot (ttt- Fz) : Da'


2. Hiptesis Alternati,ua. Ht (pt - tq) I Do'
(i.'-rt\-D
3. Estadstico de Pr"u,r:btt" tobs :

4. lieqin, tJe Rechazo. Lnb"


",1 ^* - 2) ol'r,r) tu2(n1+rLz-2)'
{ -tolz(n. +.n2-

b) Prueba unilateral para la diferencia de dos r1ledias.

1. Hpteszs Nrila. H1: (P1- Fz) : Do'


2" Hiptests Alterrto'tzua- Htt (Pt - t't) > Do (o bicrr f/1: (pt - tt) a Do)'
(i. -Tt\ - Do
3. Estad'sti'co de Pr"ueba' tobs :
^lr-
"V
tt n2

4. Regi,n d.e Rechazo. tob, ) t,,(rr1 + n'2 - 2) (o bicn tot," { -to(U I nz - 2), cuando
Hr (h - P) < Do)'
8.7. Pruebas para Ia diferencia entre dos medias 253

Observacin. EI supuesto que realizamos de igualdad entre las varianzas poblaciones--, debe ser
comprobado meclirnte la prueba cle hiptesis cor'r'espondiente, qr.re Ia explica cn la Seccin 8.8.

Ejemplo. Un irrversionista no sabe si invertir en bonos ernitidos por un pas A o por un pas B.
Para realizar Lrna decisin, seleccion dos muestras correspondientes a los rendimientos de los bonos
emitidos por los dos pases, obteniendo los siguientes resultados:

Pas A
Rendimiento (%) 12.3 t2.5 r2.B 13.0 13.5
Frecuencia

Pas B
Rendimiento (7o) U 12.2 72.3 13.0
Flecuencia rn;

A un nivel de significacin del 0.01, verificar si el rendimiento de los bonos de los dos pases es el
mismo. (Asumir que los rendimientos siguen una distribucin normal y tienen igual varianza.)
Solucin: Se tiene que
.1, 12.80, s7:0.71, n" : 70,
a-
-
12.35, s? : 0.07, nv : 16.

(n,-l)s2,*(na-t)t? 9 x 0.11+ 15 x 0.07 1


EI estimador de la varianza es s2 :
nt*nu-2 L0+16-2 l2
EI contraste es bilateral:

1. Hzptests Nttla. Ho: F": Fa.

2. Hiptesis Alternatiua. Ht p,l lla.

3. Estadstico de Prueba. tob" : @-v) 12.80 - 12.35


: 3.87.
0.2887

4. Regin de Rechazo. Como to oos(24) : 2.797 , la regin crtica es o" > 2.797 o to6" 1 -2.797 .

5. Decis'in. Como to6" ce en la regin de rechazo) se puede asegurar que los bonos de los dos
pases tienen rendimientos diferentes.

Queda como ejercicio para el lector determinar en cules bonos se recomienda invertir.

8.7.3. Caso 3: Varianzas desconocidas, supuestas distintas

Sr-rpongamos que se dispone de dos poblaciones y se desea probar si la diferencia entre sus correspon-
lientcs medias pobltr,cionales es igr,ral a r0; es decir, 11: h - lrz - Ds. Para ello. admitiremos que
.as poblaciones sorl normales, cuyas varianzas poblacionales sorr desconocidas y distintas.

a) Prueba bilateral para la diferencia de dos medias.

1. Hiptesis Nula. Ho, (tq - Fz) : Do.


254 Captulo 8. Pruebas de Hiptesis

2. H ip te si s A It ernat'iu a.

3. Estadstico de Prueba.

4. Regin de RecLo,zo. tob, 1-trtzG) oto,, ) t.lz(g), donde cl nirmero de grados de libcrtad
, ,) ,2
/","i\
'
\tt n.r)
se calcula pot g -

Cuando g no es un nmero natural, se redondea al entero ms cercano.

b) Frueba unilateral para la diferencia de dos rnedias.


1. Hiptesi,s NuIa. Ho: (pt - : Do. pz)
2. H'i,ptesi,s Alternatiua. Ht (h- t-r) > lo (o bien f11: (tt, - td a Do)"
Estad,stico d,e Pr.ueba. tobs : @r -
12) - D0
3. .

l'? , s]

4. Regin de Rechazo. tob.,) t"(il


Y^-- < -1.(g), Hr (pt- t") < Da).
@ bien o6" cuando

Ejemplo. Se desea conocer el efecto delfro extremo sobre la realizacin de operacioncs manuales.
Fara ello se eligieron al azar 20 voluntarios, clivididos en dos grupos de 10. Al primer grupo se le
expuso a una temperatura de 4oC, rnientras que al otro se le mantuvo a temperatura ambiente. Se
contabiliz el nmero de veces que los voluntarios podan abrir y cerrar Ia mano en un lapso de 15
segundos, con los siguientes resultados:
No expuestos al fro 54 tr1
, a 40 45 48 46 45
(o 49 50
Expuestos al f,ro 32 29 3B 33 34 tt
r)rJ 36 o 29 o.)
Lt)

Probar Ia hiptesis que el estar expuesto al fro reduce la capacidad de abrir y cerrar la mano en ms
de 12 veces.

Soluc'in: Este es un contraste unilateral donde Do: \2 y


rr : 48.0, s? : 16.89, n,t:70,
rz :32.4, s3: 19.16, nz:10.

1. I{i,ptesis NuLa. H0: [t1 - Fz : 12.

2. Hiptests Alternat'iua. Ht: ttt - Fz> 12.

(rt - "z) - Ds _ (48 - 32.4) - 12


:
3. Estadstico dc Prueba. tobs : 1.8961.
16.89 19.16
10 ' 10
-I_
4. Reqin de Rechazo. El nmero de grados de libertad es

/ L6.Bg 19.16 \ 2

9:
(ro**) : 17,9 v 18.
8.7. Pruebas para Ia diferencia entre dos rnedias 255

Etrtonces, 0.0b(18) :1.734 y la regin crtica es r" > I.734.


5. Dec'isi'n. Como Lo6" C'd.e en ia regin de rechzo del contraste se ruede admitir que el fro reduce
la capacidad dc realizar operaciones manuales.

8.7.4. Caso 4: IJna varianrza conocida y otra varianza desconocida

Supongamos que se dispone de dos poblaciones y la diferencia entre sus medias


se desea probar si
poblacionales es igual a Ds; es decir, f16: L\ - p,z - Ds. Admitiremos que las pobiaciones son
normales y, sin prdida de generalidad, supondremos que la varianza ol es conocida y que la varianza
o! es desconocida.

a) Prueba bilateral para la diferencia de dos medias.

1. Hipteszs - t z) : Do.
Nula. Ho: (h
2. H'iptesis Alternat'iua. Hr (fq - LL) I Do.
(lt - - no
3. Estad,sti,co d,e Prueba. tob, :
l"? , sl
U^--
4. Regin de Rechazo. tob" 1-t^tzj) oto6") t,/z(g), donde el nmero de grados de libertad

nz-l
Cuando g no es un nmero natural, se redondea al entero ms cercano.

b) Prueba unilateral para la diferencia de dos rnedias.

1. Hi.ptesis - Fz) : Do.


Nula. Ho, (l"t
2. Hi,ptesis Alternat'iaa. Ht (h- p) > Do (o bien f11: (t"r- ttz) a Do).
3. Estad,sti,co d,e Prueba. Lot s :

4. Regin de Rech,azo. tob" )


l;*;
,(g) (o bien o," < -t"(g),cuando Hr (h - p) < Do).

8.7.5. Caso 5: Diferencia por parejas

Las pruebas para las diferericias de las medias, realizadas anteriormente, se aplican cuando las dos
muestras son independientes, pero existen casos en los que Ia informacin recogida no es independiente
(como cuando se Ia toma de un mismo individuo de manera repetida) .

Sea (r1,y1), (rz,Az),..., (rn,an) una muestra aleatoria de pares de observaciones; donde (r,y)
representa dos mediciones tomadas de la misma unidad muestral, antes y despus de un tratamiento
o fenmeno que Ia afect. Se desea conocer si Ia poblacin cambi de manera apreciable despus
del fenmeno indicado; para ello se emplea la prueba de diferencias por parejas de la manera que a
continuacin se describe.
256 Captulo 8. Pruebas de Hiptesis

Se construye una muestra aleatoria de las diferencias dt, d2, .. ., dn, donde d: r-Ai (i :1,2,. .. ,n),
que las supondremos siguen una ley normal de media p,,1 y varianza o2(1. Para estos parmetros
poblacionales se calculan sus estimadores:

lft1lL
,I: ! r, y s7.: -- . r(n - )r.
i.:1 i.:1

Prueba bilateral para la diferencia por parejas.

1. Hiptesis NuIa. Ho: Fa - Ds.

2. Hiptesis Alternatiua. HI F* Do.

3. Estad.stico d,e Pru,eba. Lob, : !-,D:


sd/ \/n
4. Regin de Rechazo. tob" I -to/z(n - 1) o tob" ) t-2(n - L).

Observacin. Tambin, se pueden realizar los contrastes unilaterales considerando las hiptesis alter-
nativas F 1 Do o F ) Dg; para cada caso se escoger, de Ia manera antes indicada, la correspondiente
regin de rechazo. Se recomienda que el lector formule tales pruebas.

Ejemplo. En una investigacin clnica se realizaron mediciones de la frecuencia cardiaca a 9 indivi-


duos antes y despus de que ellos se hubieran sometido a un programa de entrenamiento fsico. Los
resultados son los siguientes:

Antes (r) 81 85 82 82 90 83 It) 93 92


Despus (g) 76 77 87 79 90 89 t6 75 89

Para un nivel de significacin de 0.05, establecer si el acondicionamiento fsico vari de manera signi-
ficativa la frecuencia cardiaca, suponiendo una distribucin normal de las diferencias.

Solucin: El promedio y Ia desviacin estndar de las diferencias son:

A:2: :3.22,
r_l
sa,:8.2r.

Ademis, Do : 0 y la prueba bilateral queda como sigue:

1 Hiptesis Nula. Hs: p,: Q.

2. Hiptesi,s Alternatiua. H p,10.

3 Estad.sttco de PnL,eba. tobs:


-4-= : ^!=',2 :1.177.
sdl{n 8.2I1\/9
= =
4. Regin d,e Rechazo. Como o.ozs(B) : 2.306, entonces Ia regin es o," > 2.306 o tor" 1-2.306.

5. Deci,sin. Como to6" r1o est en la regin crtica, no se rechaza Hg; es decir, no hay por qu
considerar que hubo una variacin apreciable en la frecuencia cardiaca.
8.8. Pruebas de hiptesis para la razn entre dos varianzas 257

8.8. Pruebas de hiptesis para Ia razn entre dos varianzas

Supongamos cllre se desea probar la igualclad de las varianzas dc dos poblaciones normalmente dis-
tlibuidas, de las que se han extrado dos muestras independientes; es decir, se desea probar Hg: ol : 6/.
Las pruebas de hiptesis son las siguientes:

a) Prueba bilateral para la razn entre dos varianzas.


1. Hiptesi,s NuIo,. Hs: ol: 6f.
2. Hlptesi,s Alternatiua. H ol I of.
o2
3. Estadstico de Prueba. Fobs: l,si donde sf es Ia mayor varianza muestral.

4. Regin de Recltazo. Fob" ) Fo2(n1- I,n2 - L).

b) Prueba unilateral para la razn entre dos varianzas.


1. Hiptesis Nula. Hs: ol: 61.
2. Hiptesis Alternatiua. H ol > o?r.
a?
3. Estadstico de Prueba. Fobs : ], donde sf es la mayor varianza muestral.
si
4. Regi,n de Rechazo. Fobs ) Fu(rt - l,n2 - I)
Ejemplo (Continuacin). IJn inversionista no sabe si invertir en bonos emitidos por un pas A o
por un pas B. Para realizar una decisin, seleccion dos mLrestras, correspondientes a los rendimientos
de los bonos emitidos por ios dos pases, obtenierrdo nnas varianzas rnuestrales iguales a sl:9.11
y s:0.07. A un nivel de significacirr del 0.05, verificar si las varianzas poblacionales cle los
lendimientos de los bonos de los dos pases son iguales.

Solucin: La prueba es bilaterai:

1. Hi,ptesis Nula. Hs: o'2, : 62.

2. Hiptesis Altentatzua. H ol I ol.

3. Estad,stico d,e Prueba. Fobs:g : : I.57I.


S H
4. Regi,n de Reclazc. Segn el nivel de significacil 0.05, y los grados dc libertad TLy-I : 10- 1 : 9
y nz- 1:16 - 1- 15, cl punto crtico es F625(9, 15) :3.12 y define Ia regin For")3.I2.

5. Deciszn. Prtesto que 1.571 < 3.12, no se debe rcchazar la hiptesis de la igualdad cle las
variarrzas. Entonces, fite correcto rsumir que las varianzas elan igrrales, cuando realizamos la
prueba sobre la igualdad de las me<lias.

3.9. . Pruebas de hiptesis para la diferencia entre dos proporciones

:--ipongamos qnc se han scleccionado dos muestras, de rnanera aleatolia e irrdependiente, de dos pobla-
.-rnes binorniales, cr.tyos tantarios, llr y'r2 sorr sufi.cierrtemente altos palir que las distribuciones rnucs-
-:ales de Ft y fz sealt aproxirnadanrente norrnales. Se desea probal si Ir difclencia de las proporciones
:'nestrales es igual a un valor D6. Se deben tomar en cuenta dos casos: cr-rndo Do : 0 (igualdad de
-is proporciones) y cuando Do 10.
258 Captulo 8. Pruebas de lliptesis

8.9.1. Prueba para pr - pz cuando Do : 0

Etr pt'irner l.ga'se estirnan las proporciones p1 y p2,'a,partir


de ras rn.estras, por p1 v f2, re:spectir,,a-
mente, luego sc calcula el estimad,or ponde,ado de ta proporctn
p por
:: --nt/t
l):
-f nzfz
n1tn2

Prueba bilateral para la diferencia entre dos proporciones.

1. Hiptesis NuIa. Hot (pt


- pz) :0, es clecir Ho, pt: p2: p.
2. Hiptesis Alternatiua. Ht (pt - p 10.
3. Estadstico de Pr-ueba. : pL-p2
zo6"

io(!
\nr
.;)
4. Reqin de Rechazo. Zobs { -zo/z o 2o6" } zo2.

Observacin' Tarnbin, se pueden realizar las pruebas unilaterales para probar


que 'Fl1: pr <p2, camlliando las regiones de rechazo segn
que 11r: pt ) pz o
cacla caso partic.,lar.
Ejemplo' El dueo de un supermercaclo cree que el porcentaje de cheques
pr.otestados, con que
los clientes han pagado stts cueutas, ha aumentad.o con respecto
ar ao anterior. En una rn'estra
corlesporrdiente al primer trimestre del ao pasado, encontr
b cheques protestados de B0 cheques
admitidos; con otra muestra cle 68 cheques, correspondientes
al primer trimestre del presente ao, el
ntmero dc cheques prote'stados fue de 6. Con estos c-latos,
hay evidencia suficiente que indique urr
rnclemento en el porcenta.je de cheques protestados?

SoLuci'r: Sean p1 y p2 las proporciones de cheqlres protestados


en el pr.imer trimestre del ao anter.ior
y del presente. Estimemos las proporciones muestrales:

Pt:go :
5
0.0625, Fz:
6
: 0.0882,
6B

5+6
0: 80+68 :0.0743.

Ya que se desea determinar si existe un aumento en Ia proporcin,


la hiptesis alternativa es H p2 _
pr) 0, y la prueba es la siguiente:

l. Hiptesis Nula. Hs:'p1 - pr.


2. Hiptesr,s Al,tern,at,iua. Ht p1 1p2.
3. Estadstico de Pr-ueba. : Pt-Pz 0.0625 - 0.0882
Zobs
: -0.594.
a(! +1)
0 '\rrt
71..> J
(00743)(0 s25T\(!*a\
'\80 C'8)
4. Regi,n de Recltazo. Tomemos a : 0.0b; erltonces, ia regin es zobs < _1.64b.
5' Decisin' Como -0'594 >
-1.645' no se puede rechazar la hiptesis nula; o sea) no hay evidencia
que indique un aumento en el t'mero cle cheques protestacios,
con respecto al ao anterior..
U

8.9. Pruebas para la diferencia entre dos proporciones 259

8.9.2. Prueba para pr - pz cuando Do l0


En el caso en qlle se desec probar que las dos ploporciorres sorr distintas y qlre su cliferencia es igual a
un valor dado, D6, se tiene la siguiente prueba:

Prueba bilateral para la diferencia entre dos proporciones.

1. Hiptesrs Nula. Hot (pt - pz) : Do.


2 Hi,ptesis Alternatiua. Ht (pt - pz) I Do.

3. Estadsti,co de Prueba. zobs : (Fr-Fz)-Do

4. Regi,n de Rechazo. Zobs 1 -zolz o zobs > zol2.

Observacin. Tambin, se pueden realizar las pruebas unilaterales para probar que I11 : (pt-pz) > Do
f11 : (pt - pz) < Do, cambiando las regiones de rechazo segn cada caso particular.
o qtre

Ejemplo. En el deporte del balonmano) en un partido est permitido sustituir al portero solo
para que detenega los tiros penalties. El entrenador de un equipo, al definir su estrategia para un
partido, examina las estadsticas individuales de los porteros titular y suplente. En una muestra de
los registros cle los entrenamientos del ltimo mes, el titular ha detenido 128 de 510 penalties y el
suplente ha detenido 183 cle 480 tiros. El cntrenador decidir sustituir al portero titular, el momento
de parar un penalti, si el suplente ha detenido al menos un 10 Va :ms de tiros que el titular. A un
nivel de significacin del 5 7o, qr decisin tomar el entrenador?

Solu,cin: Calculemos las proporciones correspondientes a cada uno de los porteros:

128 183
'Pl : =-:=:0.21, T)t:- :0.381.
510 480

Se realizar la prueba unilateral con D6 : 0.1.

Hiptesis Nula. Ho, pz - pr : 0.1.

Hiptesis Alternat'iua. Ht: pz - pr > 0.1.

3. Estadstico de Pruteba. Zctbs : (fz-fr)-D,, (0.381 -0.251) -0.1 :1.023.


0.25I x 0.749 0.381 x 0.619

1. Regi,n de Recha,zo. AI nivel de significacin 0 05, la regin de rechazo es zobs > 1.645.

5. Decisir. Conio zobs:1.023, no cae en 1a legin de lechazo, no hay razn para pensa. que la
diferencia es mayor qr-re 0.1; entonces, e1 cntrcnador no debela decidirse a sustituir al portero
titular.

in el Cuadro 8.2 se presenta Lrn resumen de las pruebas de hiptesis con dos muestras.
260 Captttlo 8. Pruebas de Hiptesis

Hip<itcsis FI iptr:s is Estaclstic<r Rcgin cle


Polrlar:in
nrLla (/^I) altcnratir.a (,lr/r ) clc pnielra rec:h ir.zo

lrr thz: Do t,.,-t,rfDct .- -/2


C cer'l.l ccl
r'Lr itr zas igLrales
t,r- t,,, l Dct t., - r,r) Do
l1t ltz ) Dt lrt tt, I Do z< 2,,

(t:r -rz) - Do
Normal lrt : Do
[L' r'r- Prf Do Itl > t.i't
anzas desconocidas
vrri trtt -ttIDo t, - t,2 ) D t) t.,,

srrpuestas iguales llt - F') Do Irt Fz { Do "ffi!n"


n7+fr2 2 sl t< ^

\it-rz)-Do
Norrnal Ft Fz: Do ut-t-LtlDo Itl > t,,z
varianzas desconocidas 11't-Fz{Do t1,,,-Fz)Do tlto
supuestas clistintas LIt - Fz) Do r.r-t"{D6
Normal Fn: F,o,, H o I trtn,, D-u^ Itl > t.t"
observaciones llo I Ho,, l-Lo) 11n,, sdlJn t>t-
empareiadas ILn ) Fo,, lto { 11o,, n-1g1, t<-t^
o I :o 2 olo
2, F:5st F ) F,/z
Noma1 o 21 1o 2
2 01)02 2
F>T-.
o 1 )o 2
2 < ur:nr-I,u2-n2-I F I Ft-o
"? "',

P7:P2 pt I p'z ^^/ r 1


pql-+-
t,\- 2 o/2
l
Binomial PtlPz Pr>P2 \nr n2 Z}Za
PtlPz Pt 1Pz uit I niz
u*nz
Binomial Pt-Pz:Do Pt-PzlDo 2 .^/2

(Do + o) Pr PzlDo Pt-Pz>. Do


Pr-Pz:- Ds Pt-Pz{Do Prqr 'P2q2

Cuadro 8.2: Pmelras cle hiptesis con dos muestras

8.10. Ejercicios
Pruebas sobre la diferencia de dos medias (varianzas conocidas)

1. Dos mquinas envasan cereal en ca.ias. De la prirnera rnquina se obtu\o una muestra dc 30
cajas) resrlltando un peso promedio de 130 g y de la segunda mquina se tom Lrna muestla
de 50 cajas) con un peso promedio cle 125 g. Las varianzrs de los pcsos envasados por las dos
rlqlrinas son conoci(las e igr-raIes a 60 y 80, respectivamentc. Para un nivel clc significacirr rle
0.C5, velifiqlle si laij clos mquinas er]\asan iguales canticlirlcs de ccreal.

2 En del Minist,erio de SrhLcl se rnicli el conterriclo clc nicotirra c-le clcs rnarcrs
unr iuv<:s1,igacirr
de cigallillo. Err un experinlentocorr 50 cigarrilkrs de la priruer' nralcr se elrr:ontrci que tielre
un corrtenido promeclio de 2.47 nlg corr clesviacin estrrclar de 0.12 rng; mierf,ras quc p1ra 40
cigarrillos de lzr segurrda mrrca el crorrterriclo 1)rorncdio fuc <le 2.39 mg colr clesvii.rcin estinclar rle
0.14 mg. Prr.rcbe la hiptesis rlula //,1 - I,L2 - 0.12 contr1 la tltettatiya /r - l, 10.12, tisarlo
cv : 0.05.

En unt ciuclarl operan 2 elrpresas dc telerfonr cclular: Flirius y Qualli. Por los registros ltrs
c[]plesrs sal)cn que cl gasto inenslr11 de slrs borrrdos ticrren clcsrriaciorrcs cstilrclar'<lc 6.5 y 5
cllares, iespectivamerlte. Parrr conrpalal ol gasto nreclio dc los c:lientes cle las <los enrplesas, se
tom una rnuestra) aI azar, de 34 clierrtes dc Sirius y otra ullrestrr de 41 clientes de Quark. Los
corresl)ondientes conslrmos mensuales fueron 35 v 38.5 dlares.
8.70. Ejercicios 26r

a) Proporcionan estos datos evidencia estadstica, al nivel 0.04, a favor de la hiptesis de que
el gasto de los clientes de Sirir-rs es menor que es gasto dc los clicntes de Quark?;
b) Halle el p-valor de la prueba.

4 Los ingresos del primer ernpleo de los ingenieros informticos, egresados de cualquier universidad,
siguen una distribucil normal con desviacin estndar de 3800 dlares. Se tom una muestra
aleatoria de 15 ingenieros procedentes de la Universidad Nacional, resu.ltando que en su plimer
empleo los ingresos medios anuales fueron de 12000 dlares. Otra muestra independiente de
12 ingenieros de Ia Universidad Tcnica dio como resultado unos ingresos medios en el primcr
empleo de 13 200 dlares. Se pide, con un nivel de significacin dei 2'/o, probar Ia hiptesis dc
que las medias son iguales frente a la alternativa de que la media de la Universidad Nacional es
menor que Ia de la Universidad Tcnica.

5. Una cooperativa agrcola produce cierto atroz con fertilizante natural y con abono qumico. En
las parcelas donde se emplea fertilizante natural se obtienen plantas cuya altura tiene varianza
de 47 cm2. En los terrenos donde se usa abono qumico la altura de las plantas tiene un varianza
igual a 39cm2. Para comprobar las medias se toma aleatoriamente una muestra de 65 plantas,
31 correspondientes al primer tipo de tierras y 34 al segundo; obtenindose en las muestras 92
cm y 86 cm de alturas medias, respectivamente. Para un nivel de significacin del 6 %, contraste
Ia hiptesis de que los fertilizantes son igualmente eficaces, frente a Ia hiptesis alternativa de
que es ms eficaz el natural.

Se quiere comparar el rendimiento acadmico en matemtica de los alumnos de ltimo ao de


dos colegios; A y B. Elegidas dos muestras aleatorias de cada una de estos colegios (30 alumnos
de A y 36 de B), se obtuvieron los siguientes resultados en cuanto a la calificacin obtenida en
dicha asignatura:
Prornedio Varianza
Colegio A 138 , 1.1
Colegio B t4.3 16

Basndose en estos resultados, verifique la hiptesis de igualdad de rendimientos acadmicos de


ambos colegios, con un nivel de significacin del 3 %.

En un proceso qumico para producir oxgeno (O2) se emplea un catalizador. Durante treinta
das se midi Ia cantidad promedio de oxgeno producido luego de haber colocado el catalizador
y cuatro horas despus, resultando que, en el primer caso se producan 1000 litros de 02 en una
hora, con una desviacin estndar de 90 litros y en el segundo caso se producan 880 litros de Oz
con una desviacin estndar de 140 litros. Existe evidencia que indique que el catalizador se
degrada, produciendo una merma de al menos 100 litros de 02, cuando han transcurrido cuatro
horas?

Se efectu un anlisis sobre la duracin de las mquinas computadoras que se utilizan en las
empresas prblicas. Se eligieron dos muestras de computadoras, de marca y de clones, cada una
constituida por 80 mquinas. Para las de marca, result una vida promedio de 4.8 aos y una
desviacin estndar de 1.7 aos. Para las clones, dio una vida promedio de 3.3 aos y desviacin
estndar de 1.2 airos. Puede considerarse que la vida media de las computadoras de marca es
superior en al menos un ao a las que son clones?

La FIFA realiz un cambio en la forma de puntuacin en los partidos de ftbol ganados: se otorg
tres puntos al equipo ganador, en lugar de los dos puntos usuales. Para examinar la efectividad
de la nueva norma) se examin los resultados de los partidos jugados en 1995 y 1996 (ao en
el que entr en vigencia la nueva norma) . En 45 partidos examinados, jugados el ao 1995, se
encontr un promedio de 2.87 goles por partido y una desviacin estndar de 0.21; en los 38
partidos examinados de 1996, se hall que se haban ploducido un promedio de 3.05 goles con
Captula E. .Fruebas de {iptesis

dcsviacirjn estridal cle 0.18. Fuede decirse c-re irr rrlreva rrolrrra pelrniti<i unlr:n1,ar t:l prornoclic-r
cl: goles por partido'/
10 Una persona desea comprar un automr'il nr-revo y toma conro factor de decisin el consumo meclio
de cornbustible que tienen dos nlodelos de calactersticas similarcs, uno fabricraclo en Europa v
otro en Corea. Consulta una rerrista especiahzada y encuentra qr.rc e1 auto eulopeo tiene nn
recorrido prornedio de 28.3 krn por gain de cornbustible. con nna desriacin estndar de 6.2
km; para el auto coreano encucntra qr-re el rccorrido es dc 26.7 krn por ga1ll una desviacicirr
"v
estndar de 5.1 km; adems, la revista indica que los datos estadsticos fuerorr tomados a partir
de las mediciones realizadas en 50 autos de cada oligen. Cutr de los dos aritos cieber'i cornl-iral?
o deber tornar en consideracin otras calactersticas, distintas clel renclirniento del combustible.
para tomar su decisin'/
Fruebas sobre la diferencia de dos rnedias (varianzas desconocidas)
11. Se realizaron pruebas para conocer la cantidad de plomo en la sangre de personas expucstas a
la contaminacin en ia ciudad. Se tomaron muestras aleatorias de 24 nios y 18 adultos que
dieron los siguientes resultados (en ppm):
Adultos Nios
rt : 0.043, rz:0.028,
sr : 0.018, sz : 0.007.

Asumiendo que las varianzas poblacionales son iguales, pruebe la hiptesis de que no hay dife-
rencia entre el contenido medio de plomo en la sangre de los nios y de Ios adultos, contra ia
hiptesis de que los adultos tienen mayor cantidad que los nios.

12. En un estudio sobre un nuevo programa piloto para el aprendizaje a distancia mediante com-
putadora, se eligieron al azar,21 estudiantes de una clase para seguir el nuevo prograna (grupo
piloto) mientras que los 23 restantes seguan el mtodo tradicional (grupo control). Finalizado
el curso, se realiz un examen obtenindose los siguientes resultados:
Grupo piloto Grupo control
Nota promedio 51.48 47.52
Desv. estndar 11.01 14.15

Suponiendo igualdad de varianzas, contraste si hay evidencia (a nivel del 5 %) de que el nuevo
mtodo piloto da mejores resultados que el mtodo tradicional.

13. En el Departamento de Gentica de una universidad se realiz un estudio donde se cont el


nmero de surcos en las huellas dactilares de dos grupos de voluntarios: uno de aborgenes
amaznicos y otro de estudiantes mestizos de Ia universidad. Los promedios y la desviacin
estndar del total de surcos contados se dan a continuacin:
aborgenes: : 17, r :
TL" 125.9, s2, : (SO.ZO)2,
mestizos: ny L7, A :
: 754.3, sl : QS.OI)2 .

Pruebe la hiptesis de que no existe diferencia entre el total de surcos) contra una triptesis
adecuada a los datos, asumiendo igualdad en las varianzas.

74. Se probaron 2 medicamentos A y B para la eliminacin de los hongos en la piel. En pruebas de


laboratorio se tomaron muestras de Ia cantidad de medicamento requerido para la eliminacin
de un mismo tipo de hongo, obteniendo los siguientes resultados:
Medicamento A Medicamento B
Tamao 13 15
Promedio (g) 4.5 3.1
Desv. estndar (g) 1.8 I.7
8.70. Ejercicios 263

tr) Pruebe Ia hiptesis de que los dos medicarnentos tienen igual efecto, contla la hiptesis de
que el mec.licamento B es rns efectivo. Qu conclusin saca?;
b) Encuentre el nivel de significacin arroximado de la prueba.
15 Dos empresas competidoras (S y T) que venden implementos deportivos han puesto en marcha)
casi simultrreamente, pginas de internet para la venta electrnica. Se eligieron, al azar) ocho
clientes que visitaron la pgina S y, de manera independiente, otros ocho que visitaron la T y sc
midi el tiempo (en minutos) de la duracin de ia visita de cada cliente. Los resnitados fueron
los siguientes:
Pg naS oa c).tr tJ 42 3.2 44 21 16 d"t) .)

Pe naT 1t
IJ z-,1 44 2B ri.5 3.6 /t

Proporcionan estos datos suficiente evidencia (al nivel 0.05) para afirmar que los tiempos medios
de duracin de las visitas en ambas pginas son diferentes?

16. Para los tres primeros meses del ao, 15 vendedores de la Costa tuvieron ventas semanales
promedio de 300 dlares con una desviacin estndar de 50 dlares; en tanto, 10 vendedores de
ia Sierra tuvieron ventas semanales promedio de 260 dlares, con una desviacin estndar de 16
dlares. Si consideramos que las desviaciones estndar de las ventas son diferentes, determine
si los vendedores de la Costa tienen mayores ventas semanales.

t7. Se compararon los tiempos (en segundos) que realizan atletas escolares, masculinos y femeninos,
al recorrer una distancia de 500 metros. Para el efecto, se registraron las marcas de 9 nios y 7
nias, obteniendo lo siguiente:
Nios 187 223 235 r92 259 775 206 t94 247
Nias 248 366 223 326 274 369 301

Determine si la diferencia en el tiempo medio entre hombres y mujeres es mayor que un minuto.
Use rr : I0'7a.

18. Se sospecha que Ia concentracin media de dixido de carbono es mayor en la capa de aire ms
prxima a la superficie. Para contrastar esta hiptesis se analiz el aire en 20 puntos elegidos
aleatoriamente a un metro de altura del suelo, resultando una media muestral de 580 p.p.m.v.
(partes por milln en volumen) y una desviacin estndar de 60. Tambin, se realizaron 16
mediciones de la concentracin, a una altura de 18 metros, resultando una concentracin de 365
p.p.m.v. y una desviacin estndar de 110. Suponiendo norrnalidad para las mediciones y que
Ias varianzas son diferentes, proporcionan estos datos sufi,ciente evidencia, al nivel 0.01, a favor
de la hiptesis de que la concentracin es mayor cerca del suelo?
Pruebas sobre Ia diferencia por parejas
19 Se hizo un estudio para comparar los tiempos de acceso, en diferentes momentos del da, a
internet desde computadoras domsticas con mdem. Para ello, se cargaron 8 pginas web por
la tarde en el periodo de 14 a 15 h. y, con Ia misma mquina, Ias mismas 8 pginas por Ia noche
en el periodo de 22 a 23 h. Los respectivos tiempos de acceso en minutos fueron:

De14a15h 2.3 1.5 1.0 2.7 T4 1.9 0.8 1.1


De22a23h 2.9 r.4 t.2 3.4 1.3 2.5 1.6 1.8

Se puede concluir, al nivel 0.01, que el acceso es ms lento en el horario nocturno?


20. Para poner a prueba un nuevo mtodo de estudio, se seleccion a 10 sujetos que fueron sometidos
a una prueba antes y despus de entrenarse con el nuevo mtodo. Las calificaciones fueron:

Antes 19 T4 23 25 18 24 17 19 20 11
Despus 20 15 26 24 t7 26 18 22 26 11
264 Captulo 8. Pruebas de Hiptesis

A un nivel clc significacin dei 5'%, ,se prrecle decir <re el nrtevo mtodo es efcctivo'?

2L Urr glnpo dc invcstigaclores afirma haber dcscrrbiclto un ti1.ro clc alirncnt,acin pzua las gallinas,
ba.jo la cual stas prodricen hnervos que rlo aumcnl,rrr cl c;olcsterol en Li,s personas que los q)n-
slrrten. Parzr cornprobal dicha teora, sc seleccionaron al azar 36 personas a las <,rte se les rnicli
su nivel de colesterol habitual (z ) . Desprrs sometcr' r estas rnismas pcrsolas a ulla dieta r base
de los huevos en estudio, se micli cn ellas cle nu.cvo dicho nivcl (y). Los resultaclos fiterort:

l Ji -., :
I =2a3. s -200, ;t1\ 4) . (d,-d)- ls6
r.- 1

Suponiendo normalidad en la variable, contraste la hiptesis de que los huevos modifican el


colesterol, a un nivel de significacin del 1%

22. Se quiere comparar dos mtodos rpidos para estimar la carga elctrica en Ltn circuito. En
un laboratorio se midieron B circuitos, mediante los dos mtodos, obteniendo los siguientes
resr-rltados:

Circuito 1 2 3 4 r
d 6 7 B

Mtodo A 10.7 t7.2 i5.3 14.9 13.9 15.0 15.6 L5.7


Mtodo B 11.1 TI.4 15.0 1 l-r. 1 t4.3 15.4 r5.4 16.0

Contraste si los dos mtodos proporcionan, en media, las mismas estimaciones.


OD
L En el artculo <p-trndorphin: A Factor in'Fun Ruu'Collapse>> (British Medical Journal (1987),
294, 1002), se reportan las siguicutes mediciones de Ia concentracin en la sangre <le p-enclorfina,
err picornoles por litro, realizadas a 11 corredores antes y clcspus de haber participado en una
media maratn:
Corredor 1 t r)
J 4 5 6 7 8 I 10 11
Antes de
la carrera
,4D
+rJ 46 :
r_) tro
L n6 72 B4 90 r0.4 14.0 17.8
Despus de
29.6 25.r 15.5 29.6 24.1 37.8 20.2 2r.9 14.2 34.6 46.2
la carrera

Si se sospccha que luego de realizar un esfuerzo prolongaclo, la concentr.acin de la horrlona se


eleva en 25 picomoles. Veriflque) a Lrn nivel de significacin del 5 %, si se curnpie ia hiptcsis.
Pruebas sobre la razn de dos varianzas
24. Sc selecciorLar"on dos muestras rleitoi'ias 1r-ovenieritcs cle poblaciones normales:

Poblacin Tamao de la mucstra Varianza muestral


X 16 56.7
Y 20 30.5

- a) Ha, suficiente evic,lcncia l)r.ra pertri)r q,re al. : o?.?, -r q nirrcl cle significacirr cle 0 05;
lr) Encucntre el rtivcl dc siguificacin dc la plr,rebtr, c inter'lrrete el lcsultaclo.

25. Unr fbrica cle refrcsctos tiene clos mquirrirs enrbotcllrclorrs qrre eDvasan el lqr-rid<; err las botcllas.
Los expencledores hrtt irrfor-nirdo rl fabticrrrte quc lrr.s botellrs ltrcsentirl clemasirclr yali-Lltiliclad
eu la cantidacl de lquido que cortlienert. llala exanrinar la que.ja se nidiri la var.irza clel vrlmeir
clc 1quido crnbotellado ltol cacla ttna de las maic.rirras, resrrltanclo qrre con rrnr rqcstra c1e 18
botellas cle la mquirta 1, se obtrtvo una varianza clc 700 y ciou una mucstla de 15 botellas clc lr
rrtquirra 2, se obtuvo ttna valinza de 210. L1 vuial)ilidad err los volirmenes crrvasaclos
ser atribuida a una o a las dos r,rquinas? Utilice a : 0.05. 'r-rcclc
8.70. Ejercicios 265

26. Dos estaciones rneteorolgicas predicen Ia temperatura a medio da en la ciudad con seis horas de
anticipacin. Se tornaron dos muestras independientes de los datos de cacla estacin, resultando:

Estacin 1 n1 : $, rt :21.2, sl : 1.68,


Estacin 2 n2:19, Tz:19.2, sl :0.81.

a) Verifique si las varianzas de las temperaturas pronosticadas son distintas. (Tome c:0.1);
b) Empleando el resultado anterior, pruebe si las dos estaciones pronostican iguales tempera-
turas, a un nivel de significacin de 0.1.

27. Se van a probar dos medicamentos A y B contra una enfermedad. Para sto se trataron 21
ratones enfermos con A y otros 21 con B. EI nmero medio de horas que sobreviven con A es
1200 y el nmero medio con B es L225. Suponiendo normalidad en ambos casos:

a) Se puede aceptar igualdad de varianzas si se sabe que D@o - ,)" :9800 y D(An - y)' :
3500? (Tomeo:0.05);
b) Es ms efectivo el medicamento B? Plantee el contraste adecuado para estudiar esto con
un nivel de significacin del 5 %.

18. Una compaa petrolera est considerando Ia posibilidad de introducir un aditivo en su gasolina,
esperando incrementar el kilometraje medio por litro. Los ingenieros del gupo de investigacin
probaron 10 autos con la gasolina habitual y otros 10 autos con la gasolina con el aditivo. trl
resumen de los resultados es:

Kilometraje sin aditivo: tr: 14.2, s" :3.24,


Kilornetraje con aditivo: a: 15.4, ss : 5.56.

a) Es razonable suponer que las varianzas son iguales? Use a : 0.1;


b) La introduccin del aditivo incrementa el kilometraje medio por litro?

Pruebas sobre la diferencia de dos proporciones


En una investigacin en Guayaqull,264 de 1140 mujeres y 274 de 1200 hombres respondieron
que ellos no ingieren alcohol. Realice la prueba de hiptesis apropiada para asegurar si los datos
muestrales proveen evidencia para afirmar que las mujeres guayaquileas se abstienen de tomar
alcohol en una proporcin mayor que los hombres guayaquileos. En Ia resolucin:

a) Especifique las hiptesis nula y alternativa, a la vez err smbolos y en palabras;


b) Calcule el estadstico de prueba;
c) Compare con el valor de 1a tabla y saque su conclusin.

ll. IJn economista del Instituto Nacional de Censos desea conocer si las tasas de desocupacin
urbanas son iguales en las dos principales ciudades del pas. Con base en sendas muestras de
500 personas en cada ttna de las ciudades, el economista encontr 46 personas desocupadas en
una ciudad y 35 en la otra. A un nivel de significacin del 3 %, puede snponerse que las tasas
de desempleo en las dos ciudades son diferentes?

,1. De una muestra de 300 televidentes escogidos al azar, que tenan sus televisores encendidos en la
hora del noticiero, 50 indicaron que tenan sintonizado el canal 4y 70 que sintonizatotr el canal
8.

a) Puede afirmarse que los dos canales tienen igual nivel de sintona a Ia hora del noticiero?
(Utilice un a:2To);
266 Captulo 8. Pruebas de Hiptesis

b) Halle el nivcl de significacin de la prueba.

.Jo
L Dos ernpresas encrrestadoras realizan investigaciones para determinar el porcenta.je dc pcrsonas
que votarn a favor de una pregunta en Lrn plebiscito. La primera cnrplesa etrtrevist a 1000
pelsonas de las cuales 367 contestaron afirrnativamente. La segunda empresa entrevist a 300
personas y obtuvo 121 r'espuestas afirmativas.

a) Puede considerarse que las dos empresas entregan resultados similares respecto del nrmero
de electores que votarn SI a la pregunta. Utilice a : 0.05;
b) Encuentre el nivel de significacin de Ia prueba.

.).) Se seleccion,al azar,500 usuarios de correo electrnico que trabajan en empresas pblicas -
result que 32 de ellos haban recibido virus informticos a travs del correo en eI ltimo ao.
Se realizotro muestreo independiente eligiendo, al azar, 300 usuarios que trabajan en empresas
privadas, resultando que 9 de ellos haban tenido este mismo problema.

a) Proporcionan estos datos sufi.ciente evidencia estadstica, al nivel 0.04, a favor de la hipte-
sis de que la incidencia de los virus es mayor en las empresas pblicas?;
b) El p-valor del contraste, es mayor o menor que 0.01?

34. Un estudio indicaba que las hijas de madres fumadoras durante el embarazo tienen mayor proba-
bilidad de ser ellas mismas fumadoras. El estudio se Ilev a cabo con nias, preguntndo si ellas
haban fumado el ltimo ao y a la vez se consult a las madres si ellas haba fumado cuando
estaban embarazadas. Solo el 4% de las hijas, de 200 madres que no fumaron cuando estaban
embarazadas, haban fumado el ltimo ao, comparado con el26% de las hijas, de 500 madres
que haban fumado, tambin lo haban hecho. En la investigacin se propone que el hecho que
una madre haya fumado en estado de embarazo, aumenta Ia proporcin de hijas fumadoras en
w 20To.

a) Qu hiptesis necesita usted para determinar si Ia diferencia indicada es estadsticamente


significativa?;
b) Realice una prueba de hiptesis para establecer si la propuesta de la investigacin sobre el
incremento en Ia proporcin es plausible;
c) Establece el estudio que si una madre embarazada fuma, hay una mayor tendencia a fumar
por parte de las hijas? Explique.

35. Se desea comparar Ia proporcin de viviendas con servicio de alcantarillado en las reas urbana
y rural de Pastaza. Se hizo un muestreo en las dos reas con los siguientes resultados:

Zona rural: De 500 viviendas elegidas al azar,230 disponan de alcantarillado.


Zona urbana: De 1000 viviendas elegidas al azar,680 disponan de alcantarillado.

Hay suficiente evidencia para concluir, con un nivel de significacin del 3 %, que en Pastaza,
la proporcin de viviendas con alcantarillado en la zona urbana excede en ms del 15 %o a la
proporcin de viviendas con alcantarillado en la zona rural?

36. Para estudiar el efecto de una nueva terapia sobre el cncer de seno se tomaron dos muestras,
una de 300 pacientes que no recibieron Ia terapia y otra de 200 que si lo hicieron. De Ias que
no recibieron, L7L pacientes murieron y de las que si recibieron, 66 murieron. Un tratamiento
se considera efectivo si rebaja en ms del 18 % el porcentaje de los pacientes fallecidos. A un
nivel de significacin de 0.05, es efectivo el nuevo tratamiento?
Captulo I
Pruebas de Hiptesis No Paramtricas

KISS Keep It Simple, but Scientific


Emanuel Parzen

En las pruebas de hiptesis que utilizan Ias distribuciones normal, t o F, se supone que la ley de
probabilidad de la poblacin de la cual se extrae la muestra tiene determinada forma y que sus
parmetros verifican ciertas condiciones de manera que el estadstico muestral correspondiente tiene
una distribucin de probabilidad conocida, por lo que se llaman pruebas paramtricas. Por ejemplo,
para la aplicacin de Ia prueba , se debe suponer que Ia poblacin es normal. Adems, para la
aplicacin de las pruebas paramtricas se requiere que el nivel de las mediciones sea al menos de escala
de intervalos.

Sin embargo, existen muchas aplicaciones en las ciencias y Ia ingeniera donde no es posible conocer las
distribuciones de las poblaciones de las que se extraen las muestras o los datos se reportan como valores
en escala ordinal. En estos casos, se utilizan mtodos alternativos equivalentes a los paramtricos,
denominados mtodos no paramtricos o de distribucin li,bre.

Con frecuencia se utilizan las pruebas no paramtricas cuando se tratan de inferencias con muestras
pequeas y distribucin desconocida de la poblacin, ya que en estos casos no se puede utilizar el
Teorema del Lmite Central. La aplicacin de los mtodos no paramtricos no requiere conocimientos
matemticos avanzados, debido a que la tarea matemtica consiste en ordenar por rangos Ios datos
observados.

Si se verifican Ias condiciones exigidas para el uso de una prueba par-amtrica, entonces, es siempre
preferible utilizar sta y no su equivalente no paramtrico. EIlo se debe a que si se utiliza el misrno
nivel de significacin en ambas pruebas, Ia potencia de una prr.reba no paramtrica es siempre menor
a la de su equivalente pararntrico. Por otro lado, con los mtodos no paramtricos se pierde gran
7)
cantidad de informacin al no operar explcitamente con los valores sino con sus rangos.

Ventajas y desventajas de los mtodos no paramtricos

Las pruebas no palamtricas tienen varias ventajas sobre las pruebas paramtricas:

1. Por lo general, son de usar y entender.

2. la necesidad de suposiciones restrictivas de las pruebas paramtricas.

267
268 Captulo 9. Pruebas de Hiptesis lVo Paramtricas

3. Se pueden usar con muestras pequeas.

4. Sc plreden usar con datos cualitativos.

Tambin, las pruebas no paramtlicas tienen desventajas:

1. A veces, ignoran, desperdician o pierden informacin.

2 No son tan eficientes como las paramtricas.

3. Llevan a una mayor probabilidad de no rechazal una hiptesis nula falsa (error de tipo II).

Las pruebas no paramtricas se dividen en dos grupos: sobre una sola muestra y sobre varias muestras.
Tambin, hay un grupo de pruebas que se basarr en la ley de distribucin ji cuadrado.

En este captulo examinaremos un conjunto bsico de pruebas no paramtricas, que permiten con-
trastar hiptesis sobre la independencia de variables, el ajuste a una ley de distribucin dada, la
aleatoriedad de las observaciones, entre otras. En la prirnera parte examinaremos aquellas pruebas
que emplean la ley ji-cuadrado, mientras que la segunda parte dedicaremos a otro tipo de pruebas.

9.1. Pruebas X2 de bondad de ajuste a una ley

En esta seccin analizaremos procedimientos cuyo objetivo es determinar si un conjunto de observa-


ciones sigue cierto esquema probabilstico. Estos constrastes comparan las frecuencias observadas con
las fi'ecuencias tericas de1 modelo probabilstico corr que se cotcja a trar,s de un estadstico cle prueba
qrre sigrre rrna ley 12.

9.1.1. Prueta sobre los parmetros en un experirnento rnultinornial


Srrpongzrmos que en urra investigacin se establecen ciertas categoras en las cuales se dividc la
poblacin; por ejernplo, el nivel socioeconmico, el nivel dc instruccin, etc. Cacla observacin puede
perterrecer solo a una de las k categoras prefijaclas.

Si eu Ia investigacin se realizarr n observaciones: zl1 de cllas estin en la primcra, n2 estn en 1a segunda,


..., n'k estn en la k-:sima cateplora; y se cumple que zt |-n2-1 ..-ln- n. Una inrestigacin que
prescnttr esta carrcterstica se dcnornina erperinten,to mttltinom,ial, cuyas particularidades son:

t. EI experimento consta de n cnsayos idrrticos e indepenclientes unos dc ctros.


2 E1 resrrltado clc cada ensayo se locaiiza en lrna y solo una de las catcgoras.
')
(). La probabilidrcl de que tin ensry'o se localicc en la i-sirna categora es p, (i : 1,2, ,k);yse
cirnrple eue p1 -l pz + ---* pn: L.

Esto sc rcsLlnte etr Lut] talila como la siguiente:


Categora C1 Cz C*, Total
Frecuencia 'rL1 112 TLl 'n
trrobabilidad Pt P2 'pk 1

Itrteresa. conocer si el nmero cle cbservaciones clue se ubican en cada categor'a se ajusta a un esqlle-
rna cle probabilidnd <lado; es clccir', si las probabilidadcs dc rertenencia a cada gr,r-rpo tiencn valores
especficos: pr : pro p2: p20, . . ., pk : pk. Entonces la pruebzr queda as:
9.7. Pruebas X'2 de bondad de ajuste a una ley 269

1. Hi,yttes'is l{ula. Ho'. 1,t1


: Plot P2: P2o, . . . , 'Pk: Pko.

2. Htpteszs Alte'r'no,t'rua,. I11 : Al rnenos uncl cle los r, es <listirrto c.Ic., p,g,'i - I,2,...,k.
, (rr-ttp)2
3. Estad'st'ico de Prtt,ebo^ '\r/r'\ -
7-t nPo
4. Regi,rr de Reclazo. Se rechaza 11 cuando X?"1,, > XZ@ - l).

Ejemplo. En un periodo de un ao, se registraron 100 nacimientos de gemelos en la Maternidad


lsidro Ayora de Quito. La distribucin de los recin nacidos, de acuerdo al sexo, es la siguiente:

2 varones 2 mu.jeres 1 varn, 1 mujer

Se supone que los datos esLn distribuidos segn una ley trinomial de parmetros (100;p1,Pz,Ps)
: P2: I
4Y Pt: I2
Pt Probar Ia hiptesis a un nivel de significacin del 5 %.

Soluczn: Se tiene nt : 29, n2 : 38, ns : 33 yn : 100, con esos valores Ia prueba es

1. Hrptesis Nula. Ho: pI : n, Pz: n, Pz: ,'


2. Hi,ptesis Alte'r'natiua. f11 : Al menos uno de los p es distinto del enunciado

3. Estadstic:o d,e Prueba.


r2
(rn - 11
* ,oo)'
+
("-i x 1oo)
+
("-]"'oo)'
1 I lxtoo
-4 x l(X) -4 x 100 2

4. Regin de Rechazo. Tenemos que XSos(2) :5.99 y la regin crtica es XZt" > 5.99.

5. Deciszn. Como 13.18 > 5.99, se rechaza 116, o sea, los nacimientos de los gemelos no siguen Ia
Ley indicada.

Se recomierrda que el lector cambie las probabilidades de pertenencia a cada grupo) de manera que se
acepte la hiptesis nula.

9.L.2. Prueba de bondad de ajuste a una ley dada


Este caso es una generalizacin del anterior. Ahora, supondremos que no podemos asignar de antemano
1as probabilidades de pertenencia a cada grnpo, silo que se las debe calcular a partir de una ley de
distribucin terica (uniforme, normal, Poisson, etc.), cuyos parmetros son conocidos o deben ser
estimados a partir de las observaciones de la muestra.

Disponemos de un conjunto de n observaciones, que se supone siguen una ley de probabilidad dada y
que estn agrupadas en k clases o categoras.

Por otro lado, sea X una variable aleatora que sigue Ia indicada ley probabilidad, que toma valores
.r:r) tr2). . .; entonces. Pr(Y : r.) : p.
270 Captulo 9. Pruebas de Hiptesis lVo Paramtricas

Por e-.jemplo, X podr'a seguir una lcy de Poissou,

Pr(X:r):P ="-tr)'"
,l
donde el par'metro ) puede estar previamente especificado o debe ser estimado.

A partir de las probabilidades tericas se calculan las frecuencias esperadas de cada clase como ei : np,i.

Cuando alguna clase tiene una frecuencia observada menor que 5 se Ia puede unir con alguna clase
adyacente y sumar las probabilidades correspondientes. Luego de agrupar las observaciones que lo
ameriten, se dispondr de una tabla de frecuencias con k clases, como Ia siguiente:

Grupo o FYecuencia FYecuencia


Observacin
clase observada (n) esperada (e
1 1 nl et: npr
2 r2 n2 e2: nP2

k ;r ;* ek: nplr
Total n

El estadstico de prueba, para comprobar si los datos siguen una ley especfica, es

k .o
,"0
xZu":
I
L=I "n",,"
,

que sigue aproximadamente una distribucin y2 con [(k - I)-(nmero de parmetros esti,mados)]
grados de libertad. As, si se supone una ley de Poisson, de parmetro ,\ conocido, entonces Xlr" sigue
unaley X2(k-1);perosiseestimaelparmetro),elestadsticoXl6"sigueunadistribuciOny2(k-2).
La prueba de hiptesis queda como sigue:

1. Hi,ptesi,s NuIa. fls: Los datos siguen una \ey L(p) dada.
2. Hiptesi,s Alternatiua. I11: Los datos no siguen la ley 4(p) dada.
(' -
.). Estad,stico d,e Prueba. XZn. : ! ")2 ,
i:t ei
donde &: es el nmero de clases que se forman luego de agrupar los datos.

4. Regi,n de Rechazo, Se rechaza Hs si XZt" > X?"@ - 1- l), donde I : nmero de parmetros
estimados a partir de la muestra.

Ejemplos

1. En una agencia bancaria hay cinco cajas para atender a los clientes. Un da, el encargado de la
agencia contabiliz el nmero de clientes que escoga cada una de las cajas, obteniendo:
o
Caja 1 2 4 5 Total
FYecuencia 34 54 39 48 45 220

De acuerdo a estos resultados, se puede concluir que ha'preferencia por alguna de las cajas?
9.7. Pruebas X2 de bondad de ajuste a una ley 27L

Sohtc'in,: La hiptesis nnla es sriponel que no hay l'eferrencia por una caja palticular o, lo que
es 1o rnismo, que los datos siglren Lrna ley uniforrne con

p.:Pr(Y: i) :;, i__ r,...,5.

Entonces, las frecueucias esperadas son:

ei : npi :220 , !: nn, i: I,. . . ,5.


Notemos que aqu no es necesario estimar parmetro algrrno; de manera qr.re la prueba es:

1. Hi,ptesis NuIa. 116: Los datos siguen una ley uniforme.


2. Hiptesi,s Alternat'ua. Ht: Los clatos no siguen una Iey uniforme.
t). Estadstico de Prueba.

xza" : f@t-"t)2
ei
i.:r
: (34-4q2 _64-4q2 _Q9-44)2 _gB-4q2
44=44.44=44-44 -(+S-+q2
4. Regi,n rl,e Rechazo. Como X3.os(5 - 1) : 9.49,\aregin es XZt"> 9.49.
5. Deci.szn Aqu, XZa"no est en la regin de rechazo; de manera que se puede decir que no
hay preferencia por ninguna caja.

2 En una ensambladora de carros se registr el nmero de defectos por unidad en una muestra de
100 unidades que se inspeccionaron durante una semana dada, dando la siguiente distribucin
de frecuencias:
Nmero de defectos 0 1 2 .) 4
Nmero de carros 63 20 8 5 4

Contrastar Ia hiptesis de que los datos se ajustan a una distribucin de Poisson.


Soluci,n: El estimador del parmetro .\ de la ley de Poisson es el promedio:
.A-.t/
\ _=_ 0 x 63 t- 1x 20f 2 x 8*3 x 5 -14x4 _tt(n
- 100 -u.ur.

Calculemos las probabilidades de peltenencia a cada grupoT segn la ley 2(0.67):

_0.67(0.67)o
Po : Pr(X:Q) : : 0.512,
0!
-0.67(0.67)1
Pt, : Pr(X: 1) : : 0.343,
1!
67
e_o (0.6n2
Pz : Pr(X :2) :
2t'
:0.115,
6T
e-o (0.67)3
P3 : Pr(X:3) : ol
JI
:0.026,
e-0.67 (0.6n4
P+ - Pr'(X:4) : : 0.004.
4

Las frecuencias esperadas son

eo : 100 x 0.512
-- 51.2, et: 100 x 0.343 :34.3,
ez:100x0.115-11.5, e3: 100x0.026-2.6,
et : 100 x 0.004 :0.4.
272 Captulo 9. Pruebas de Hiptesis lVo Paratntricas

Crk:rllcrrros cl cstrclstico r.l.e pruebir:


4,
.,
-z s- @-e)2
\ rt.s /_
,i_'_.o ei
: (63-51.2)2
+ (t0-34.3)2 + (8- 11.5)2
_6-2.q2 0.4)2 _
+g- ,J4 !1 7'
5r2 - 34i - lli - 2.6 - -+"L'
La prueba estadstica es:

1. Hiptesis NuIa. 11: Los datos siguen una ley de Poisson P(0.67).
2. Hi,ptesis Alternatzua. 11r: Los datos no siguen una ley de Poisson P(0.67).
3. Estadsti,co de Prueba. X?ot":4I.72.
4. Regi,n de Rechazo. Como x3.os(5 - 1- 1) :7.81 y la regin es XZu" > 7.81.
5. Deci,si,n Se cumple que 4I.72 > 7.81; entonces, se rechaza Ia hiptesis nula. El nmero
de defectos no siguen la ley de Poisson P(0.67).

Se midi la duracin de trabajo de 200 elementos electrnicos, segn se resume en Ia tabla. La


primera columna muestra los intervalos de tiernpo (en horas) y la segunda est la cantidad
"tr
de elementos que han trabajado el tiempo entre Ios Imites del correspondiente intervalo.

Tiempo de FYecuencia Tiernpo de FYecuencia


duracin (hr) (rn) duracin (hr) (rt)
0-5 133 15-20 4
5-10 45 20-25 2
10 15 15 25-30 1

Para el nivel cle sigrrificacin 0.01, 'i'erificar la hiptesis de que el tiempo rnedio de trabajo de Ios
elementos est distlibuido segn una Iey exponencial.

Solu,czn: El parmetro .\, que sigue la ley exponencial, se estima po, 1 : ! : O.r.
T
Calculemos las probabilidades de que la variable aleatoria tome valores en cada inten'alo:

pr : Pr(O < X < 5) :.-o2xo - e-o2x5 : 0.6321.

Anlogamente, se obtienen

pz : 0.2326, pJ :0.0855, p : 0.0315 , p5 :0.0116, po : 0.0043.

Con sto, se encuentran Ias frecuencias esperadas, ei: npii

et : I26.42t e2 : 46.52, es : 17.I0, e+ : 6.30, es : 2.32, eo : 0.86.

Como las tres rltimas frecuencias son pequeiras, se las puede agrlrpar en una sola clase, obtenin-
dose k : 4 clases. De esta manera, se dispone de Ia siguiente tabla que muestra el grupo, la
frecuencia observada y la frecuencia terica.

1 133 t26.42
2 45 46.52
D 15 17.10
4 7 9.48
Total 200

Por lo tanto, la prueba es:


9.7. Pruebas X2 de bondad de a.juste a una ley 273

1 fI'iptcs'is Nrtla. 11: Las obserr,ciorres sigucrr rrrrrr lcy <rxporrcuciul t(0.2).
2 Htptes'is Altr:tra,ti,tstt,. H1: Los clrtos u<l sigucrr rrrrir Icy r:xponencial ,(0.2).
3 Estct,dst'i,co de Prtebu.

f
,
rlr., : rl
)
(rt,
.-:
- c,)'2 (133 - 126.4D2 (45 - 46.5\2
+
(15 - 17.10)2
e i 126.42 46.s2 17.70
-,:,
: 1.299.

4. Regin de Rechazo. Como previamente se estim \, I :1 y se debcr examinar la Iey 12


con (4 - 1- I):2 grtrdos de libertad) cuyo valol es Xl.otQ):9.2I, se define la regin de
rechazo XZt" > 9.27.
5. Decisin Puesto que 1.299 < 9.21,, no hay razn para rechazar la hiptesis de una ley
exponencial (0.2) para los datos.

4. Se midi la estatura de un grupo de nios de 12 aos de edad, con los resultados:

Estatura Nmero de nios


135 - 140 6
740 - 745 l8
oo
145 - 150 t)!

150 - 155 61
155 160 22
160 165

Velificar si los datos de esta mnestr provienen de una distrilrucin nornral.


Soh',ci,n: Err primer lugar se cleben estimar Ios parrnc'tlos de Ia ley nolmai:

fr: r: 150.625, ? :31.425.


probabilidades de pertenencia a cada intervalo, segrin una ley son:
^/(150.625;31.425)
i pt : 0.026, p2 : 0.129, ps : 0.298, p : 0.327, ps : 0.170, pe : 0.042.
ilL

i Y Ias frecuencias esperadas son:

et : 4.I8, ez : 18.55, et : 42.88, e+ : 47.06, es : 24.77, ea : 6.48.

Entonces, la pmeba es:

l. NuIo. ,F16: Las observaciones sigueu r-ura ley normai


H'i'ptes'is
^/(150.625;31.a25).
2. Hiptesis Altentatiua. 11: Los datos no siguen una ley normal^/(150.625;31.425).
3. Estadstico de Pr"ueba. X|,r":8.349.
4. Regin de Rechazo. Como se estimaron dos parrnetlos, entonces I : 2, el estadstico de
prueba se debe comparar con Xfr.or(6 - 1- 2):7.81. La regin crtica es X?ou, > 7.81.
5. Deci,sin Corno 8.349 > 7.81, se rechrza I1o; por tanto, las estaturas de los nios de la
muestra no siguen la ley normal enunciada.

-\ cotrtintiacitt se rresenta ttn resurnen de los estirnrdoles cle los prrr'rnetros de las Ieyes ms comLlrl-
rlentc enipleaclas.
274 Captulo 9. Pruebas de Hiptesis -lVo Paratntricas

Ley Estimador
Binomial Bin(n,p) p- -u
TL

Hipergeomtrica 11(N, p, r) p- -rT


a
Poisson 2()) A:T
1
Geomtrica Q(p) D:_
&

Uniforme U(a,b) a:r-VJs/;


i:r+/3s
1
Exponencial t()) A_-
T
Normal J{(p,o2) F:r
o-:s'
^t,

9.2. Pruebas sobre tablas de contingencia

Cuando tenemos la informacin de 2 variables de tipo cualitativo, se la resume en Lrna tabla de cont'in-
gencia, que es una tabla de frecuencias de doble entrada, donde en las filas se ponen las modalidades
de una variable, y en las columnas las modalidades de la otra; en las celdas resultantes del cruce de
las filas y las columnas se coloca el nmero de elementos que presentan ambas modalidades.

Si se tiene informacin de.l elementos acerca de las variables Ay B, de tal forma que prescntarl r y
c modalidades respectivamente, Ia tabla de contingencia r x c (r filas y c columnas) es de la forrna:
Variable B
Variable -4 B1 B, B. lbtal
At ??"TI nli n C nL

A, nil Ttrzt Li.c TLx

A, frr'l TL'r TLra TLr

Total n.7 n1 nc

donde,

rL. : D"o, (total de Ia frecuencia de la fila'i),


j:r
T

n : D"n, (total de la frecuencia d.e la columna 7).


i:r
Por ejemplo, los jefes de familia que viven en una ciudad pueden clasificarse en dueos o arrendatarios
de la casa donde residen y segn su nivel de instruccin en primario, secundario y superior; es decir,
se los podra clasificar en una tabla de contingencia 2 x 3.

9.2.L. Prueba de independencia


Considrese las probabilidades p,., de encontralse en Ia fila i; p., de encontrarse en Ia collrmna j; y
p;r Ia probabilidad de encontrarse en Ia celda (i, j).
9.2. Pruebas sobre tablas de contingencia 275

Debe ctrrrtplirse que iO, :f


i:r
V i p.j : l,y
j:r
pueden ser estimada,s por

ni.
f: N' 7r. . . ,T,

f : n.i J

y'' r
;-
lr''' ,c'

Bajo la hiptesis de independencia entre filas y columnas, se tiene que la frecuencia esperada en la
celda ubicada en la i-sima fila y j-sima columna es

ej: NF.0t:U#

El estadstico que permite probar la hiptesis de independencia es

xZa":iiry,
i:l j:L "Ll

que sigue aproximadamente una distribtcin y2 con [(r - 1)(" - 1)] grados de libertad.

Entonces, la prueba para la independencia es la siguiente:

1. Hiptesis Nula. Hoipij:pi.p.j (la variable A es independiente de la variable B).

2. Hiptesi.s Alternatiua. Ht: pt * p.p., para al menos una celda de la tabla (la variatlles A y B
no son independientes).

@ e')2
3 Estad,sti,co d,e Prueba. XZu,: i - .

i:t j:r eii

4. Regi,n de Rechazo. La hiptesis de independencia se rechaza si X?"t"> X?"1(, - t)(c- t)].

Ejernplo. En una investigacin se desea revelar si existe relacin entre el consumo de combustible y
el origen de los carros que circulan por la ciudad.

Origen
Consumo EE.UU. Europa Japn Total
Bajo 76 56 70 202
Alto 160 t4 9 183
Total 236 70 79 385

Al rrivel 5%0, verfrcar si las dos variables estn asociadas.


Solucin: Calculemos las frecuencias esperadas) eiji

en
nt.n.r 202 x 236 : !23.82,
nL.n.2 202 x 70
:36.72,
N 385 / 385

etg :
nt.n.s 202 x 79
:4I.45, e2l:
n2.n.l
-----;=-
183 x 236
: 112.18,
N 385 /v 385
n2.n.2 183 x 70
:33.27, (,.r.!
n2.n.3 183 x 79
: 37.55.
385 - A,/ 385

-
276 Captulo 9. Pruebas de Hiptesis lVo Pararntricas

Clou cllrs forrrrclros lr t,rblr clc frecuerrcirrs csperaclas:

Origen
Constlmo EE.UU. Europa Japn
Bajo 723.82 36.72 4\.45
Alto 112.18 33.27 37.55

Entonces, la plueba queda como

1. H,i;ptesis N,ula. /16: El origen del crlro y el consurno de combustible sou iudependientcs.

2. Hi,ptesis Alternat'iua. .F1r: EI origen del carro y el consumo de combustible estn relacionados.

3. Estadstico de Prueba.
(76 - t23.s\2
xZt
" r23.82
(160 - 112.18)2
112.18
: 101.51.

4. Regi'n de Rech,azo. El nrmerode grados delibertades u: (2- 1)(3- 1) :2 ysi a:0'05, se


tiene que x|,sQ): 5.99. La regin de rechazo es XZu, > 5.99.

5. Deci,si,rin. Como 101.51 > 5.99, se rechazr ltr hiptesis nula. Coucluinros qtte ltal'relaciIt entre
el consurno de combttstible y eI origen de los carros.

Tablas de contingencia de 2 x 2

Para el caso especial de la tabla de contingencia de 2 x 2, se ha desarrollado una frmula de clculo


d" X'.|u" que no requiere l-r determinacin de las frecuencias esperadas. Supongamos que se dispone
cle ula tabla de contingencia de dos variables, cada una de las cuales solo pueden tomar dos valores,
como la siguiente:

Variable ll
Variable A 81 132 Total
A1 ab a*b
A2 cd ctd
Total aic b+d n,

El estadstico de prueba se calcula como

t{ad - bc)2
xZt* = (a b)(c d)(a c)(b d)'
+ + + +

clue sigue una ley X2 a 7 glado de libertad.

El resto de Ia prueba de hiptesis queda igual a lo enunciado anteriormente.


Ejemplo. El siguiente cuadlo muestra la reaccin de los espectadores ante un comercial de televisin
clasificaclos por sexo.
-v

9.2. Pt'uelas sobl'e tablas cle cotttittg,etrcia. 277

Sexo
R.crccin HorrrlrLr-'s \Irrjcles Tolal
Dcsfavorable 1t) ,] 15
Favolablc 3 7 10
Total 13 72 o-
:

,Depencle la aceplacitin clcl corrcrcial clcl sexo rlcl tclcvirlcnt,c'?


Sol,ttcin: La prueba de ILiptcsis clrrccla clc la siguicrrlc rrrrrela:

1 Iiptesis AluLa. fI6: La lcrcciri rntc el corr,:rrtrirl crs inclcpcrrclicntc clel sero.
') Hi,ptcs'is tlltent,otiuo. 111 : l,a rccr:icirr rltr cl c:orrrcr'<:irl y cl ,5cxo cstitr rclacionacios.

Esto,dsl"ico tle Pt"ucl,ta,. .lt,, ,, n(o,rl,-1.'r:')2,


_ 25(10 x y 3)2
7-5 :3.2i].
J. - (rr+)(c:1 r|,)(atr:)(1.,*d) 15 x 10 x 13 x 12

Rngzn de Reclo.zo. Si escogcrrlos rr:0.05, \'crrros,1,,e lo,(l) :3.34. La legin cle lecliazo cs
\;i,, > 3.84.

5. Decis'itl Como 3.23 < 3.81, no sc lechrza la hiptcsis lula. Se concluye clue hay inclepenclencia
entre el sexo del espectacLol y la accptacirr clel comcrcirl.

Sc srLgiele cre cl leciot rerlicc cl c.jeLcicio niecliante el r:ilc:rLlo cle las ficcLrcricias cspeladas

9.2.2. Prueba de homogeneidad


Sr-'clice qLrc lura ntttestLr es lt,ortt.o.tt3,rr:r si lr)rlrs srrs t)bsrrlr'rc:iorrr:s lr.rrr sirlo gcrrelrrclrrs pol cl rnisnrr.r
rtrodrtlo cle ciisl,ribucin dc lrlobr'rl.riliclzrtl o pcltorrtrc(rrrr r, rrLrr rrrisrrrrr poltlzrcitin. La metodologa cle lrs
pLttclt:rs <le iticlependelrcia tarnbirr n.reclc aplicalsc lralii trr.cLigrLu si exisl,c honrogeneidrd eutrc clos o
rr ris unrcsh as inclepenclicntes.

i\s. la prueba estaclsticr cs ltr sigrrieutc:

i. Hi,ptesi,s Nrtla. Is: Lts tltLLcstlzts ptttvir-'rrcrL rlc rrrra rLrisrr:r toltlurcirr (lers llLlest,tirs sttrr lro-
nrognears).

') Alternatiua.
H t'ptes i,s 11 : Las nttlcstras no ptovicncrr clcl rurr nrisrua ltoblarcin (lars rnucstlz-rs
son hetelogneas),

(tt'j
Estn,dst'ico dc PrtteLto, \I\, r/,.r -.-
- r-1- 1-
r- ' ',t)
itt ('j

4 R, qin ,le Rcc'l,azo. l.t hipcitesis cie inclepcrrrlcnc:i,r sc lcc:hrrzr .i 13,,., > X3l(?'- t)(c- i)].

trjemplo. En uua Facultacl sc clasific i las rrolas obfr:niclis L)or sus alumnos, luego cle lenclil cl
luisllo exalren Fsica. conro )ra.jas. rlcclirs v allrs. 'fanbin. sc rcgislr' cl plofcsol clue clictirba la
cle
rlater-ia. obtenienclo:
Cililicrcic'rrr
Plofcsoi lia.a i\lc<liir,,\ll lLbral
tl 1,2 23 l .12

1) 2 r7 r! .16
,)
lirl rl ,l 0 ll ,!8
278 Captulo 9. Pruebas de Hiptesis No Paranttricas

Se puede decir que la diferencia en las notas es debida al profesor?

Sohrcin: La tabla de frecuencias esperaclas es:

Calificacin
Profesor Baja \'Iedia AIta
A .7 19.1
t7 5.3
t)
l) 19.3 20.9 5.8

La plueba estadstica es:

1. Hiptests Nula. 11: Las difer-elcias eu las notrs no son debidas rrl plofesor de la materia.

2. II'iptesis Alternatiuu,. ,F11 : Lrs cliferencias crr las notas se debelr al profesor.

.) Estadsrico d.e prueba. r?.-:


\ o
(12_ rT'7)2
-._
(23
--I9'l)2 *...-r- (a -5'B)' :6.12.
fi .7 lg,I b.B

4. Regin d,e Recho,zo. Se tiene.1.,e xfror(2) :5 99 v la regin es,\3" > 5.99.


5. Deci.si,n. Como 6.12 > 5.99. sc rcchazrr 110: es rlecir, ei profesor de la materia si influye en las
notas obtenidas en su materir.

9.3. Ejercicios

Pruebas de bondad de ajuste a una ley

1. En un cluce de carretelas los aulos pueden gir-al a 1a izquierclrr, l Ia derecha o seguir de frentc.
Se supone que la rnitad de los autos scgr-rir'irr de fi-ente, la nna cutrta parte ir a Ia izquielda 1-
Ia cuarta parte restante a la clclecha. Sc rerliz urr colteo cle los autos segn la direccin quc
ellos siguen:
De fi'ente A la izqr-rierda A la derecha
Frecuencia 29 149
Pruebe Ia hiptesis indicada a un nir.cl clc significircirr de 0.1.

Cuando el naturalista francs del siglo XVIII Georgcs Louis llrLflbn realiz 4040 lanzamientos
cle una rnoneda observ 2048 calas. Cclncuerrlarrr estos datos coL la hiptesis de que la rlonedr
cs simtrica?

Una zona de \4indo es cl hbitat natur'rl <le tles cspccics dc colibres. Se cree (hiptesis nula)
qlle ulla quinta parte de los colibr'es pcltcrrecc tr la prirrrera cspccie, dos quintas partes a l;r
segunda especie y otlas dos quintas part<rs r la tercera. En una nnestr"a aleatolia de 34 colibr'cs
de la zona, se observalol 12 cle Ia priirrcr-er especle. 15 clc la scgrLnda" y 7 de la telcera. IIav
suficiente evidencia estadstica (al nrvcl 0.05) pala acepterr Ia hiptesis propuesta?

4 Segirn los datos de un estudio c-rhaustivo rle rrrercado qlle se lc;iliz en la ciudad, las ventas clc
irnpresoras para comptltadoras lrersonalcs der uso clomstico sc ciividen entre cuatro marcas (4,
B, C y D) cuyos porcenta,jes dcl total de las vcntas son 18 c/o,22Vu.35% y 25To, respectivamentc.
Un ario despus, se quiere analizal de urrcro lr situacin pcro sc cree qrle no se debe repetir ur
estudio de mercado a gran escalr. Se clccicte obserr.ar Ia narcr adquil-ida por 200 compradores
cle inrpresoras elegidos al azar. obtcnienclo cpre c1e cllos 28 habalr clegido la marca 4,48 LaR,77
Itr C y 47 LaD. Hay suficientc cvidencir. ..1 rrivcl 0.05, para tl[iL'r,-rzrr clue el reparto del mercacio
yr no es el mismo quc el arlo rnl-eriol'/
9.3. Ejercicios 279

5. Dos empresas S y T especializadas en lealizar sondeos polticos condujeron dos investigaciones


sobre la intencin de voto a un partido poltico. Tambin. se disponen de Ios resultados de 1a
eleccin lievada a cabo das despus

Partido Emplcsa S Ernprcsa T Elcccrn


A 416 1EE 32.9
B 62 :: 5.1
C 193 83 15.9
F 139 76 12.4
\,{ 95 36 10.6
V 151 77 14.0
Z 76 ?o 9.1
1 1.)n
Total I1,J- 508 100.0

a) Compare los resultados de la eleccin con cada Llna de las investigaciones de las empresas;
b) Se puede determinar cul de las ernpresas dio el resultado ms certero? Explique.

6. Cuando Gregor N4endel realiz sus experinrcrrtos clc cnlzarniento de guisantes, obserr, las fre-
cuencias de varias semillas producidas por hbriclos dc guisantes amarillos Lisos y guisantes verdes
mgosos. Estos datos y sr-rs respectivas probabilida,cles, segirn las predicciones de la teora de la
herencia de Nlendel, se dan en la siguientc tab1a.

Sernillas Frecuencia Probabilidad


.) 1 a
Amarilla v lisa r),Lr) s 116
Amarilla y rugosa 101 3116
Verde y lisa 108 3116
Verde y lugosa 31 1l16
Total r, - 555

Para un nivel de significacin del 1%, erarline si las frecuencias rle los datos son consistentes
con las probabilidades tericas.

7. En el desarrollo decimal de z- entle los 10 03E primeros dgitos aparecen 968 ceros, 1062 unos,
1021 dos, 974 tres, 1014 cuatros, 1046 cincos. 1021 seis, 970 sietes. 948 ochos y 1014 nueves.

a) Se puede considerar clue los dgitos apa,recen nniformementc distribuidos, a un nivel de


significacin a : 0.05?;
b) A qu nivel de significacin rechazarii ln hiptesis'/

8. Entre 2000 familias que tienen 2 hijos. 522 frnulias lienen dos r.alones, 471 dos mujeres y 1007
de los dos sexos. A un nivel de significacirr de 0.05. ,se puecle consiclerar que el nrmero de hijos
\rarones en las familias es rlna variable alcatoria binomial?

9. En nn estudio a 107 familias qr-re tienen 5 hi.jos. sc coutaliliz el nrmcro de hijas que tienen tales
fanilias, con el siguiente resultado:

Nmero de )
t) I .) 4 5
hijas
Frecuencia 5 17 28 to
L 19 6

Puede afi.rmarse que) para las fanilias estucliaclas. el rrrrler-o cle hijas sigue una ley binonial?
(Use a : 0.05.)
280 Captu.Io 9. Pluebrs de Hiptesis No Pararntricas

10. Para estudiar la delilcueucir ol] Llrr1 r:irrrlacl se rrrotr'on lr-s clcuulcias lol lobo rle automr.iles
recibidas en los riltinros 575 r1as. obttnirrrrlose krs siguicritcs losrrltaclos:

No. denuncias 0 L 2 3 4 5
Frecuencia 23t) 210 90 JiJ 8 2

Contraste la liii.rtcsis clc crc los cltos plocorlcrr cic rrna <listribuciu rle Poisson con ) : 1.
(a : 0.05)
i1 Se registr la cantiriacl cle goles colsegrrirli.rs uu 1,19 p;rr'1 iclos <lisprrbados por r-rn ecluip o profesiottzrl
de fiitbol
No. cler golc.s
en Lur priti(lo
01234
Frectterttc,it 50 64 23 84
Verifique la hiptesis dc que ol uiruero rlcr golcs Pt.,r llarticlcl csti distribuido segrr una ley dc
Poisson. para el nivcl clc sig-nificircin 0.l)5.

12 En el transcurso de dos holits, cl nrirlcto dc llaulrrlas pol rrrinuto, solicitadas r una cetittal
telefnica ftre:
No. llarnadas/min 0 i ') J tl 5 t)
Frecuencia 6 18
.)
,)-)
,)
JJ
- I7 10 2

,Se puede aceptar que e1 nrnrelo clc llrrrrrrlrs pol rrrirnrto signc una distlibucin clc Poisson'J

13. En cierta regin sc registr la temperirtur'r ck:l rilc chrrantc 300 clas. Lrs medicioncs se rcsruneu
cn Ia siguiente tabla (en la plinrcla cohurLnr se inrlic:l el intclvalo de tr,.nperatnrr en grados 1'
en la segunda el nrmero de clis cuvr fclrrL)clratLrLa rrrecli,r collcsponclc l cse intervalo). Ver-ifi<.re
clue la tenperatura rrreclir esti clistribuiclr rLrrifolnonrcnte r un livel cle significzrcin dc 0.05.

Rango cle R iurgo clc


tetlpelatnlil Fr'c<;rrerrcia lerrrpcltt t nrit Flecrrenc;ia
(-t0) a (-5) : 10a15 40
(5) a0 40 15 a 2i) 46
0a5 30 20a25 48
5a10 ,15 25a30 26

14. Un estudio realizado iuclica cre el ticnrpo clc cspera cri lr crola rlc la, ca,ja de un banco se pucclc
rnodelizar con Ltlla distribucin cxporrcrrcirl clc rreclia 3 rninr,rtos. Para cornprobar si este noclclo
sigue siendo r'liclo, sc tom la sigrricrrtcr ntrrcstLa:

3 2 6 ,,t 1 3 2 1 1. 4.
\erifiquc si los drtos Jloccclcn clcl rrroclckr ospecrifir::rrlo cn cl cstrrclio (cr:0.05).

15. Se probaron 450 focos, t-egistlrindose e1 ticrtrpo crc <lulitlon enccncliclos hasta que ftrilaron:

Nrirnclo Niunelo
Tiernpo Ticrnpo
clc firr:os clc focos
0a40u 131 L6(X) a 20t10 i)
400 a 800 95 2000 a 24U0 3ij
800 a 1200 76 2'100 a 2E00 )1
1200 a 160i) 5(i

Pala un nivel de significacin de 0.01. r-clifc1ue la hiptesis clc clue el ticrlpo de dulacin clc los
focos est distlibuicla segrn rrrrrr ic). exlrrIttcucirl.
9.3" Ejercicios 287

16. En la Facultad de Ciencias se quiere averiguar los conociurientos sobre Fsica que tienen los
alurnnos matriculados por primera \ez en dicha Facultad, para lo cual se realiz el primer da
de clase una prueba genera,l. Los resultados correspondientes a rlna nnestra de 211 alumnos se
recogerl en la siguiente tabla:

Puntuaciones Frecuencia
50.5 55.5 4
55.5 60.5 77
b(J.b bli.l) 45
65.5 70.5 67
70.5 75.5 It
dL)

75.5 - 80.5 15
80.5 85.5 10

Determine la normalidad de la variable qlre representa la puntuacin obtenida. (Use o : 0.05)

Pruebas sobre tablas de contingencia

17. En una investigacin sobre el hbito de fumar por lur grupo de estudiantes universitarios se
obtuvo Ia siguiente tabla, en la cuaL se relaciona el sexo del entrevistado y si l o elia es un
funador.
Fuma?
Sexo SI NO
Masculino 26 10
Femenino 11 15

Pruebe si existe asociacin entre el hbito de fumar y el sexo del investigado.

18. En un estudio mdico a 300 pacicntes que fueron opcradas por cncer de ovario, se clasificaron
en quienes han sobrevivido 10 aos despus tl.: la operacin y quienes no lo hicir:i.rn, y el estado
del tumor al momento de la operacin.

Estado del Sobrevivi?


cncer No Si
Terlprano 32 r27
Avarrzaclo r18 23

La sobrevivencia de Ia paciente es independientc del estado del tumor el momento de Ia ope-


racin?

l9 A firr de probar el supuesto de que una persona desernpleada rcpresenta un alto riesgo crediticio,
en nn banco se realiz un estudio de 100 c:nentas escogidas aleatoriamente con los siguientes
resultados:
Situacin laboral
Situacin actual del cliente
del prstamo Ernpleado Desempleado
En mora 16 10
No en mora 55 19

a) Calcule el vaLor d. XZa" para estos datos, usando Ia frnula usual;


b) Calcule el valor d" XZt" para esta tabla mediante la fnnula alternativa;
c) Cul es el resultado de esta prueba al uivel de significacin de 5 por ciento?
282 Captulo 9. Pruebas de Hiptesis lo Pararntricas

20. Se realiz un anlisis de sangre de un grupo de 1000 habitantes (elegidos al azar) cie una ciudad
con la siguiente distribucin, segn el grupo sanguneo y el factor Rh:

C A B AB
t7-
Rh+ 3r7 81 39
Rh 96 82 29 10

Segn estos datos. puede aceptarse la liiptesis de inclependencia, del factor Rh de1 grupo san-
guneo? (Use cr : 0.05)

2I Se ejecut un estudio sobre la utilizaciu de ciertas fuentes de financiamiento externas para 1as
pequeas y medianas empresas (PYN'ItrS), Fara e1lo, se seleccion aleatoriamente 500 PYMES a
nivel nacional. Las empresas se clasifi.caron segr1n su tarlao en tres categoras (micros, pequeas
y medianas) I' segn hayan utilizado o rLo a).gr.rna fi.relte de financiacin. Los datos obtenidos
fueron:
Con financiamiento Sin financiamiento
Nlicros 115 o
Pequeas 20 20
Medianas 15 5

a) Existe alguna relacin entre el tamao de la empresa y el hecho de recurrir o no a fuentes


de financiacin? Utilice un nivel de significacin del 10%;
b) ,Puede aceptarse. a un nivel. de significacin del 5 %, clue ttn20To de las empresas <<micros>>
utilizan fuentes de financiacin frente a que J.a proporcin sea mayor?

22 Se realiz un sondeo en ia ciudad paradetenlinal 1as posibles relaciones entre el nivel educativo
(superior, medio o primario) de las persolras y el consumo (bajo, medio o alto) de productos
electrnicos. Los resultados, para 400 personas seleccionadas al azar, ftteron:
Nivel Consurno
Educativo Bajo \'Iedio Alto
t)1 4.4
Superior .)-L 47 ++
\4edio 2B 79 125
Primario 16 17 19

Contraste Ia inclependencia entre el nivcl educatir.o v el consumo de productos electrnicos.

23. En una investigacin sociolgica a un grupo de pcrsonas casadas, se desea saber si el nivel so-
cioeconmico de los encuestados incide sobre el xito o fracaso de su matrimonio. Los resultados
se dan en la siguiente tabla:

NSE
FYacas? I II III IV V
Si 28 62 79 181 724
No t27 230 443 850 582

,Se puede concluir que la diferencia en el ndice de fracaso se debe al nivel socioeconmico de
los matrinonios?'

24. trl Consejo Directivo cle una universidad cluer'a determinar la opinin de cl.iversos grupos en
relacin con el calendario docente propuesto. LIna muestra aleatoria selecciolada entre 100
estudiantes, 50 empleados y 50 profesores dio 1os siguientcs resultados:
Estudiantes Ernpleados Profesores
Favorakle 63 27 30
Desfavorable JI z,\ tn
9.4. Pruebas sobre rna soJa ntuestra 283

Si se desea saber si hay prucbas dc una difcrr:ucia, rrrr la rctitucl hacia el calendario entre los
diversos grrpos:

a) Indique cul es Ia prueba adecuada para la realizacin de este contraste, y especifique las
hiptesis a contrastar
b) Realice el contraste corrcspondiente, con un livcl de significacin del 1 %.

25. Un estudio sobre tabaquismo cn tres ciuciadcs, rnediante tres muestras aleatorias de tamao 100,
proporcion los siguientes resultados:

Ciudad 1 Ciudad 2 Ciudad 3


n
Fumadores 13 18
No furnadores 87 7'
t),) 82

Se pueden considerar homogneas las tres poblaciones respecto a sus hbitos fumadores, al nivel
0.05?

Esta parte del captulo la dedicaremos al anlisis de la,s prucbas no paramtricas que involucran una o
dos muestras y cuyo objetivo es probar si los parmetros de los que provienen las muestras adquieren
ciertos valores particulares. EI lector notar la sinilitud con las pruebas desarrolladas en el captulo
anterior.

9.4. Pruebas sobre una sola muestra

En las pruebas no paramtricas sobre Lrna nuestLa se distinguel dos clases: aquellas que contrastan
el valor de una rnedida estadstica (de localizacin, de clisper-sin, etc.) y las que contrastan una
caracterstica general de los datos (ajuste a una lcy, aleatoriedacl, etc.).

Existe una amplia variedad de estas prnebas, nosotlos solo exarninarenos los contrastes ms comlrn-
mente utilizados y que generalmente se presentan en los plograrlas estadsticos.

9.4.1. Prueba de los signos


El contraste de los signos es la prueba no pararlltrica ms antigua y en ella se basan muchas otras.
Se utiliza para contrastar hiptesis sobre ei pariirnetro de localizacin y en el anlisis de comparacin
de datos pareados. Consideremos Lrrra mnestra aleatoria dc tamao n tal que sus observaciones estn
o puedan estar clasifi.cadas en dos categoras: 0 v 1, * y -, etc.

Podemos establecer hiptesis acerca de la mediana: sabemos cluc la mediana deja por encima de s el
nrisrno nrmero de valores que por derbajo. Considcrando c.re r- A'Ied > 0, darn signos positivos
(+) y - Med { 0 signos negativos (-), en la poblacirr original tendremos tantos (+) como (-). S"
tratar"ode ver hasta que punto el nrrlero de sigrios (+) esta dentro de Io que cabe esperar que ocurra
por azar si el valor propuesto cono mediana es verdaclerol .

Teniendo en cuenta que se trabaja con dos clases de valores, Ios que estn por encima y los que estn
por debajo de la mediana, los estadsticos de contraste sigucn ura distribucin binomial Bin(n,0.5),
si se supone independencia y constancia c.e la plobabilidad el el lnuestreo, ya que la probabilidad de
qne Lur valor se encuentre por encirna (o por deba.jo) rle la urediarra es p : 0.5.
ILo misr-no se puede decil lespecto a los cualtiles, qrrintrles o clecilcs
284 Captulo 9. Pruebas cle Hiptesis lVo Pararntricas

Si X es la variable aleatoria que cuenta el nrmelo de ocur-rencias del signo menos frecuente; entonces.
su probabilidad se calcula por

Pr(X : k) : Cf,pk(I -p)"-k, e :;, k :0,I,...,h.

Como nos interesa la ocurrencia de valores tan extrernos o ms extremos que el observado, la proba-
bilidad deseada es Pr(X < k).

Observaciones

1. Si al determinar los signos de las diferencias, obtenemos un valor cero, a ste no se lo considerar
el momento de contabilizar el nmero de signos.

2. Si n < 30, se utiliza la ley binomial; en carnbio, si n ) 30, se utiliza la aproximacin mediante
x-n
la ley norm al Z : --J - ,A/(0, 1).
\/n
2

3. Si se desea realizar un contraste para un percentil de orden 100qVo, distinto de la mediana, se

carnbiar el valor d" p -] Ou el valor q correspondiente.

A continuacin se exponen las pruebas bilateral y unilateral sobre la mediana.

a) Prueba bilateral para la mediana.

1. Hiptesis NuIa. Ho: Qz: po.


2. Hiptesis Alternatiua. Ht Qz I po.
k
3. Estadstico de Praeba. pobs : Pr(X < k) : Dc;o'G-p)n-'dondek< TL

r:0 ,'
4. Cri,teri,o d,e Rechazo. 2po6, 1 a.

Ejemplo. En una prueba de aptitud tomada a 12 aspirantes a un puesto en Lrna empresa se


obtuvieron los siguientes puntajes:

6.6 6.8 4,4 7.3 8.5 4.5 6.7 6.0 3.4 9.1 5.3 4.8.

Determine si la mediana de las notas es 5.


Soluc'in: Tenemos que p0 : 5; entonces, si restanos a cada dato el valor de prueba, tenemos

1.6 1.8 - 0.6 2.3 3.5 - 0.5 r.7 1.0 - 1.6 4.7 0.3 _ 0.2.
Lasecuenciadesignos queseobtiene es + + - + +- + + -+ + -. Elsignomenos frecuente
es ( ), que aparece 4 veces; de manera que la prueba es

1. Hi.ptesis Nula. Hs: Q2:5.


2. Hi,ptesis Alternat'iua. H Q215.

3. Estadstico de Prueba. po6, : Pr(X <4):*"r,(;)'(;)"-' : 0.194.


9.4. Pruebas sobre una sola muestra 285

4. Crzterto de Rechazo. 2pob" < 0.05.


5. Decisin. Como 2 x 0.194: 0.388 > 0.05, no se rechaza la hiptesis nula; por Io que se
puede asumir que la mediana de las calificaciones es igual a 5.

b) Prueba unilateral para Ia mediana.

1. Hi,ptesis l{u,la. Ho: Qz: tto.


2. Hi,ptesi.s Alternatiua. Ht Qz ) ,lo o bien fl1: Qz { lto.
k
n
3. Estad,sti,co d,e Prueba. pobs : Pr(X < k) : t C!,,p'(I - p)'"-' donde k < =,2
t:0
4. Cri,teri,o de Rechazo. pobs I a.

Ejernplo. En un campeonato de ftbol, en que participan muchos equipos se escogi una


muestra de 11 equipos. EI nmero de puntos que acumularon estos equipos es el siguiente:

248912147721222426.

AI nivel de significacin del 10 %, probar que Ia mediana de los puntos acumulados por los
equipos en el campeonato es menor a 22.
Soluczn: Tenemos eue o : 22; entonces hay B signos negativos, 2 positivos y un cero. Por
tanto, n: l0 y k :2; de manera que la prueba queda as:

1. Nula. Hs: Q2:22.


Hi,ptesi,s

2. Hiptesis Alternatiua. H Q2 < 22.


2

3. Estad,sttco d,e Prueba. pobs: Pr(X < 2) : tClop'(l -o10-r :0.0547.


r':0
4. Criterio de Rechazo. pobs < 0,1.

5. Deci,sin. Como 0,0547 < 0.1, se rechaza -FIs. La mediana es menor a 22.

9.4.2. Prueba de los rangos con signos de Wilcoxon

Esta prueba, tambin conocida como contraste T de Wi,lcoron, se utiliza para comprobar que la
mediana es igual a un valor dado y para su aplicacin es necesario que los datos vengan dados en
escala ordinal o de intervalo. EI procedimielto es el siguiente:

Se determinan las diferencias entre cada uno de los valores observados y el valor hipottico de
la medianai d": r - po.

Si alguna de las diferencias es igual a cero, se elimina la observacin correspondiente. De esta


lrranera se reduce el tamao efectivo de la muestra a ?J el nrmero de diferencias no nulas.

Se ordenan los valores absolutos de las diferencias, de menor a mayor, asignando el rango 1 a la
rnenor diferencia absoluta, 2 a la siguiente diferencia rnenor, y as sucesivamente. Cuando las
diferencias son iguales, se asigna el rango promedio a los valores que son iguales.

Se obtienen, por separado, la suma de los rangos para las diferencias negativas (T-) y positivas
(7+).
286 Captulo 9. Pruebas de Hiptesis lVo Pararntricas

5. Si n ( 20 se utiliza la tabla de puntos porcentuales de la prueba de Wilcoxon (Tabla 6); si n > 20

se aprovecha q:ue Z: - .A/(0, 1).


n(n -r 1)(2n +

Entonces, el contraste queda as:

a) Prueba bilateral para la rnediana.

1. Hiptesis Nula. Hs: Q2: ur.


2. I{iptesis Alternat,iua. Ht Qz I po.
3. Estadstico de Prueba. Tobs : mn{T-,7+}.
4. Regin d,e Rechazo. Tob" < T"/z(n).

Ejemplo. En una prueba de aptitud tomada a 12 aspirantes a un puesto en una empresa se


obtuvieron los siguientes puntajes:

6.6 6.8 4.4 7.3 E.5 4.5 6.7 6.0 3.4 9.1 5.3 4.8.

Determine si la mediana de las notas es 5, para a:5To.


Solucin: Para ,r : 5, la asignacin de rangos se resurne en la siguiente tabla:

Valores d: :x - Ho Rango f Rango -


6.6 +1.6 6.5
6.8 +1.8 I
4.4 -0.6 4
n,
f .L) +2.3 10
6.b DI
-f o. L, 11
4.5 -0.5 a

6.7 +r.7 8
6.0 +1.0 5
3.4 - 1.6 65
9.1 +4.r 1,2
ID
U.J +0.3 2
4.8 -0.2 1
Total 63.5 I4,5

La prueba es

1. IIzptesis Nula. Hs: Q2:5.


2. Hipteszs Alternatzua. H1: Q215.
3. Estad,stico de Prueba. Tobs: mn{14.5,63.5} : 14.5.
4' Regi'n d'e Rechazo. En Ia tabla de los puntos porcentuales de este contraste se observa que
Ts.s25(I2) : l!.La regin de rechazo es [" < 14.
5. Dect'si'n. Se cumple que 14 14.5; por lo tanto, no se rechaza Ho. La mediana de las
calificaciones es igual a 5.

b) Prueba unilateral para la mediana.


9.4. Pruebas sobre rura sola ntttestra 287

1. Hrptests Nula. Ho: Qz: l-ro.


2. Hiptesis Alternatiua. H Qz ) plo o bien -[11 : Q2 I ls.
3. Estadstico de Pruebo,. Tob" : mfu{T-, T+ }.
4. Regin de Rechazo. Tobs <7"(n).
Ejemplo. En un campeonato de firtbol los 11 ecluipos participantes acurnularon el siguiente
nirmero de puntos:

2, 4, 8, g, 12, 14, 77, 2r, 22, 24, 26.

Al nivel de significacin del 10 %, probar qne la nediana de los pu.ntos acumulados es menor a
22.

Sohtci,n: Pongamos Fo:22 y calculenos los valores de T- y de 7+:


Valores d:iu-l-Lo Rango - Rango f
2
-20 10
4 q
-18
B
-14 B
I -13 7
72 -10 6
74 -B 5
77 -5 4
2t -1 1
22 0
24 2 2
26 4 J
Total 50 5

Con esto elementos, la prueba es:

1. Hiptesis Nu,la. Hs: Q2: 22.


2. Alternatiua. H7: Q2 <22.
Hi,ptesi,s
3. Estadstzco de Prueba. Tobs: mn{50,5} : S.

4. Regin de Rechazo. Aqu, 7or(10) :15,


la regin es [," ( 15.
5. Deczs'n. Se rechaza 1g y deducirlos qr-re la uedia'a es menor a 22.

9.4.3. Prueba de Kolmogorov-Smirnov de ajuste a una ley de probabilidad


El rntodo de Kolmogorov-Suriruov es un proceclinriento utilizado para comprobar la hiptesis nula de
qr-re la nruestra procede de una poblacin que est distribuida segrn una ley de probabilidad especfica.

trl estadstico de prueba, que se denota por Dorr, se define por

Dob": nx lF6(z) - S,,(")l ,

donde Fo@) y,S,.(r) son las probabilidades acumuladas esperadas y observadas, respectivarnente.

La prueba estadstica es la siguiente:

l. Htptesr,s NuIa. 116: La poblacin sigr.re tura 4(p) dada.


288 Capitulo 9. Pruebas cle Hiptesis -AIo Paranttricas

2. Hiptesis Alterno,tiutt. HLa poblacin rio siguc urra Ie!'4(p) clada.

3. Estadsti,co d,e Prrteba, Dub": uix lF(:r) - ,5,,(r)1.

4. Regin de R,ech,azo. Dob, > D"(n).

Los valores de Dr(n) se encuentran tabnlados pua cliver-sos valor-es cle ay n. (Tabla 7)

Ejemplos

1. Tras jugar a los dados, nn apostador conrcnzci a sospechar qlle el casino haca trampa. Decidi.
por tanto, anotar las tiradas del dado corl cre.jugaba,, obteniendo la siguiente tabla:

Nmero 1 2 .) 4 5 6
Frecuencia 16 10 l6 11 32 15

,Se puede afirmar que el dado es incorrecto'/


Solucin: Formemos la tabla de fiecuencias lelati'r.as acumulaclas, adjuntando las colunnas de
Ia probabilidad terica v de la difelencia:

FYecuencia FYecuencia Fl-ec. relativa


rx Fo(ri) lFo("r) -,9,.(zr)
absoluta (n) relativa (./;) acurnulada (,9,,("i))
1 16 0. l6 016 0.1667 0.0067
2 10 010 026 0.3333 0.0733
L) l6 016 0.42 0.5000 0.0800
4 1i 011 053 0.6667 0.1367
5 32 0.32 0.85 0.8333 0.0167
6 15 015 100 1.000 0

La prueba de ajuste clueda de Ia siguiente nanera:

I. Hiptesis NuIa. -I1: Los datos siguerr Llna Iey uniforme discleta coD p: If 6.
2. Hiptesi,s Alternat'iua. 111 : Los datos no sigucn una lcy nniforrne discreta con pt: !f g.
3. Estadstico de Prtteba. Ds : mx lF6(r) - S,,(r)l : 0.1362.
4. Regin de Rechazo. En Ia tabla del contrastc K-S encontramos que D6.65(100) :0.136. Se
define la regin de rechazo Dor,,, ) 0.136.
5. Dectsit. Como Dob,) D,r(n), se rcchaza 11 v concluimos clue el dado est cargado.

) En uua ellrpresa) el salario rnerisnal cle los t,raba.ja<lotcs se distribuye segn Ia siguiente tabla:

Desde flasta No. ernpleados


150 190 6
190 230 l6
230 270 47
270 310 55
310 3510 3B
350 390 19
390 430 L4
430 470 5

Comprobar si se puedc asegurar c-re el srlr,r'ic,r ureusul.l err clicha clnpresa puede considerarse LulI,
valiable /(306,58).
9,4, Pruebas sobr"e ura soJa rnuestra 289

Sohtcin: Completemos la tabl-L de frccucncirs relrtir'rs acurnuladas, calculando ias dos dis-
tribuciones (la muestral v Ia terica) , tcnicnclo en crreuta que para calcular F6(r) deberelros
utilizar la tabla de la lev nornal.

Desde FIasta No. empleados 5,, (., ) (ri) lFo(r) - S(")l


150 190 3 ,l 0.0205 0.0241 0.0036
r90 230 13 Iri 0.1096 0.1089 0.0007
,J1
230 270 Jl- 47 0.3219 0.2976 0.0243
270 310 44 91 0.6233 0.5636 0.0597
310 350 30 121 0.E288 0.8001 0.0287
350 390 I4 1 ')
IJU 0.9247 0.9348 0.0101
390 430 o 144 0.9863 0.9826 0.0037
430 470 2 14ti 1.00t) 0.9935 0.0065

De manera que la prtteba es:

1. Hiptesis Nula. I{: Los sueldos sigucu rlua 1ey /(306,58).


2. Hiptesis Alternatiua. f11: Los sttelclos uo siguen ttna ley /(306,58).
J. Estadstico de Prueba. Dob": mx f 6(r) - ,5,,(r)l - 0.0592.

4. Regin d,e Rechazo. En la tabla encorrtrarnos clue D5(1 46): +:0.1126; etltonces,
,/ua
la regin es Do6,u > 0.1126.
5. Dec,is,in. No se rechaza 11; consectrelte[rente. los sa]arios siguen 1a ley,A/(306,58).

9"4.4. Prueba de la aleatoriedad de la muestra


En mrchos estudios experimentales es necesalio corroccl si la.s mnestras obtenidas son aleatorias o.
por el contrario, si ellas mantienen algirn tipo de collelacin o si han sido alteradas. La prueba que
nos permite realizar esta identificacin tambin se colloce corno cotsf raste de rachas. Por extensiu.
ester prr-reba es indicada para probal la indepcndencia entre obserrraciones.

Definicin (de racha). Una racha es nna sucesin c1e vrloles por cncima o por deba.jo de ia
mediana.

La longitud de una racha es el nmero de observaciones consecutivas que tienen esta propiedad.

Fol ejemplo, si las observaciones son

6.6 6.8 4.4 7.3 E.5 4.5 6"7 6.0 3.4 9.1 5.3 4.8.

ia rnediana es Q2 :6.3, luego de representar por ( ) Ios valolcs infcriorcs a la rnediana y por (+) a los
snperiores, obtenemos la secuencia: +, +. -, *, *, , +. , , *, . Existen 8 rachas de longitudes
2,7,2, r, r,2, 1,,2.

Scetn rn6" el nrmero de rachas enuna sucesicin or-dcrracll <-le observaciones; nr v n eI nmero de obser-
r.aciones que estn por debajo v por encima cle lr nrecliana cle los datos, r'espectivamente. Con estos
elernentos e1 contraste queda de la siguiente irtattcta:

l. Hiptes'is Nula. //: Las observaciones aprtcccrl do tnartt:ra aleatolia.


2. H,iptesi.s Alternatiua. 111 : Las obselrracioucs no al)are(ie)n cle rnartera aleatoria.
290 Captulo 9. Pruebas de Hiptesis lo Paranttricas

3. Estaclst'ico d,e Prttebo,. 't'ob,s.

1. Reqir tle Rech,o,zo. 't'ol.s 1 1,, (rrr, rr) {) ?',,," ) r,,, (lrr. tr ).

Los'r,rlorcs cle compa,racin para, esta pmeba se errcrrentr'ur tatrrlados (Tablzr 5).

Ejemplo. En nna prueba de aptitr-rd tomacla a 12 aspirautes a un puesto en una elnpresa sc oblnvielor
Ios siguientes punta.jes:

6.6 6.8 4.4 7.3 8.5 4.5 6.7 6.0 3.4 9.1 5.3 4.8.

Determine si los datos aparecen de manera aleatoria, para cy : 5To.

Solucin: La mediana de estos datos es 6.3. Si a cada nno de los datos Ie restamos la mediana, queclr
Ia siguiente secuencia de signos: f , *, , +, +, -. +, , , *, ) .

Entonces, el nmero de rachas es robs : B y rL : n: 6.

1. Hiptesis NuIa. ,116: Las observaciones aparecen de rnanera aleatoria.

2. Hr,ptesis Alternatiua. 111 : Las obselr'rciones ro aparecen de rranera aleatoria.

3. Estadstico de Prueba. ro,s : 8.

4. Regin de Recho,zo. En la tabla, verfros los valores crticos con cy :\Tt 3 ( ro," ( 10.

5. Dectsin. Como robs :8 cae en la regin de aceptacin, podemos afirmar que los valores lpare(ier-
aleatoriamente.

9.4,5. Prueba para identificar valores atpicos

Esta prueba permite identificar la presencia de r'rkrres extr-emos cn Lll conjunto de drtos. Par''
la deteccin de valores atpicos, en gelelal, se manejarr cliterios empr'icos; por ejempio, cllre Lu1r,
observacin est alejada una distancia dc nrs de 3 desviacioles estndar de ia media) pero esto:
criterios no tienen fundamento tcnico y descuidan la influcrcia del tamao de la muestra.

Este contraste detecta un valor atpico a la vcz y cada nno clebe letirarse de la rnuestra iterativrrnentc-
hasta que no se dctecten ms valores atpicos. La prr.reba fue desarrollada por Gnrbbs2 y se basa en
ia suposicir qrle los datos sigrten de una lcy normai o qlre prreden ser aproximados razorrablcrncntc
pol sta;i.

La prueba de hiptcsis es la siguiente:

1. Hptesis Nula. 19: No hay valores zrtpicos en el conjr.rnto de clatos.

2. Hiptesis Alterno,tiua. ,1t: Hay al menos un valor-a,tpico en el conjurto de datos.

:
rnx{lz - rl}
3. Est,odsti,co de Pruela. gobs

1. Reqin de Recha,zo. gobs > G..(t).


I
Crrrlrbs, F E (1969), "Ploceclules for Deterctirrg Orrtlyirrg Obscrvatiorrs in Samples," Ter:h.rotnetrics, 11, 1-2i
'-{,.rnc.re ste es uu contraste pulamtlico, se lo inclu,'e en estc captulo polque no se lerliza soblc cl valor cle ul
narnLetr-o sino sobre una car-acter'stica gencral cle los clatos
9.5. Pruebas sobre dos muestras 291

La tabla de puntos porcentuales para la prueba dc Grubbs se encuentra en el Apndice (Tabla 8).

Ejemplo. En una prueba de aptitud tomada a 12 aspirantes a un puesto en Lrna empresa se obtuvieron
los sigrrientes puntajes:

6.6 6.8 4.4 7.3 8.5 4.5 6.7 6.0 3.4 9.1 5.3 4.8.

Determine si existe algn dato atpico. Use a :504.


Solztc'in: El promedio y Ia desviacin estndar son r: 6,717 y .s : 1.716 y el dato que est ms
alejado del promedio es 9.1.

Con estos elementos, Ia prueba queda as:

1. Hiptesi,s Nula. -EIs: No hay valores atpicos en el conjunto de datos.

2. H'tptests Alternatzua. I11 : Hay al menos urr valor atpico en el conjunto de datos.

mx{lz - 7}
? Estadstico de Prueba. gobs: l-
19.1 - ''
- 6.1171 1.74.
s 1.776
4. Regi,ndeRechazo. EnlatabladelapuntosporcentualesseleequeG6.65(12):2.tylaregin
de rechazoS gobs > 2.4I.

5. Decis'in. Como 7.74 < 2.29, entonces r : 9.1 no es un valor atpico; es decir, la muestra no
contiene valores atpicos.

9.5. Pruebas sobre dos muestras

Las pruebas no paramtricas sobre dos muestras que examilaremos son anlogas a las paramtricas
para comparar dos medias; es decir, para datos emparejados y para muestras independientes. Tambin
se presentar una versin no paramtrica del coefi.ciente de correlacin.

9.5.1. Prueba de los signos para datos emparejados


Esta prueba se aplica cuando se tienen dos muestras relacionadas y se quiere probar la hiptesis de
que las dos poblaciones tienen medianas iguales, pero no se quieren realizar suposiciones acerca de Ia
normalidad de los datos. Los datos deben presentarse en al rnenos escala ordinal.

Sea (r1,y1), (rz,Az), ..., (rrr,gr,,) una muestra aleatoria de pares de observaciones; donde (r,A)
representa dos mediciones tomadas de la misma ulidad nuestral. antes y despus de un tratamiento o
fennrenoquelaafect. Seconstruyeunamllestradelasdiferenciasdl , c12,..., dr,,,donde d:r-A
(z : 1, 2,. . . ,n) y se aplica la prueba del signo para Lrna muestra; es decir, contamos el nmero de
observaciones negativas y positivas y determinanos cul es el signo que menos aparece y cuntas
veces Io hace (k). Adems, llamaremos Q, ala mediana de la poblacin X y Qy a la rnediana de la
poblacin Y. Con sto, las pruebas son las siguicntes:

a) Prueba bilateral para la diferencia de rnedianas.

1. H'rpteszs Nula. Ho, Q": Qu.


2. Hi,ptesis Alternatiuo,. Ht Q,
292 Captulo 9. Pruebas de Hiptesis No Paramtricas

li;
n
Pr(X < A) :
3. Estorlstzco d,e Pru"eba. ptbs:
t
l':0
C'|,p'(7 - p)tl-l j clonde k <
t
4. Crzterio de Rechazo. 2po6" I a.

b) Prueba unilateral para Ia diferencia de medianas.


1. Hi,ptesi,s l{tr,la. Ho, Qr: Qa.
2. Hi,ptesi,s Alternatiua. HI Q, > Qu o bieu Hr Q, < Qa.
k
3. Estadstico rl,e Prueba,. pobs: Pr(X < k) : t C',,p'(l - p)'tL-r ) donde k <:.2
r':0
4, Cri,terio de Rechazo. pobs 1 a.
Ejemplo. En un estudio para determinar la aceptacin de un tipo de yogurt, se pidi a 8
voluntarios que calificaran a dos versioues (antigua y nueva) del producto. Las calificaciones v
sus diferencias se resumen en la tabla.
Versin Versin Signo de
Individuo Diferencia
antigua nueva la diferencia
6 o
1 B
2 4 I -5
D
r) 5 4 +1 +
4 8 7 +1 +
ct
5 3 -tr
6 6 I t
-.)
7 7 7 0 0
8 5 I -4
Verificar si hubo incremento en Ia calificacin al presentar la nueva versin.
Solucin: Tenernos qlre r - 7 y k -- 2. Entonces, la prueba queda as:

1. Hi,ptesi,s Nula. Hot Qr: Qa.


2. Hi,ptesi,s Alternati,ua. Ht Q, < Qy.
k
3. Estadsti,co d"e Prueba. pobs: Pr(X < 2) -- >,Cip'0 - p)7-" :0.2266.
r':0
4. Criteri,o de Rechazo. pobs < 0.05.
5. Deciszn. Se tiene gue Pobs :
0.0226 > 0.05 y se acepta 11s. No hubo cambio significativo
en la apreciacin de las dos versiones del producto.

Observacin. Tambin la prueba de Wilcoxon a datos emparejados, mediante la


se puede aplicar
aplicacin de este contraste a la diferencia entle ios valores de las dos muestras. Se recomienda que
el lector formule esta prueba.

9.5.2. Prueba de Mann-Whitney para dos muestras independientes


La prueba U de Mann-Whitney se emplea para probar que dos rnuestras independientes provienen de
Ia misma poblacin o de poblaciones que siguen Ia nisrla ley de probabilidad.

Supongamos que se dispone de dos muestras inclependientes, X y Y, cuyas funciones de distribucin


sori F(r) y Fv(r), respectivamente. Diremos, tambin, que el tarnao de la muestra X es rn y que
e1 tarnao de la muestra Y es n. Entonces, pala realizar el contraste se realizan los siguientes pasos:
Pruebas sobre dos nruesras 293

1. Sc corlbinarr las dos nruestlas en una sola.

2. Se asignan rangos a la mucstra conbinrdr clc lrs dos mncstras. Si se prodr,rccn empates,
asignar el promedio de los rarlgos a las obselvaciolr:s cntpataclas.

J Se snman los rangos de las dos rnlrestris y se crlcnlan los estadsticos

(Jt - nlrl- - !norrsos(.y) . (J2:t11t. 4+! - !n"r'gos(y).


+{
Con estos elernentos, se realiza la siguiente ptueba

1. Hiptesi,s Nttl,a. Hs: F(r) : Fl,(")


2. Hipteszs Alternatiua. H Fy(r) I Fy@)
3. Estctd,stico de Prueba. (Jobs: run{t/1, U2}.

4. Regin d,e Rechazo. Uot," 1Un(nt.rt).

Los valores de comparacin pala esta prueba se encnentlan tabulados (Tabla 10).
Ejemplo. EI dueo de nn ahlacn registr' lrs r.errtas scnranalcs de sus dos erlpleados y quier-e sabet'
si ellos pueden considerarse iguales como verrclcclores. En la siguiente tabla se numeran las'u,cntas cle
cada dependiente.
Empleado A t97 191 188 185 180 1-rt
1/J 169 169
Ernpleado B 190 166 175 172 1b/ 180 160

Solttc'in: Los rangos asigrrados r lrs lmestr'ls solr:


Empleado A Ernpleado B Rangos A Rangos B
rg7 190 15 13
194 166 74 2
188 t75 72 8
185 t72 11 ti
180 t6T 9.5 J
r73 180 7 9.5
169 160 4.5 1

169 4.5
n:E 7 ! RLrngos : 77.5 Rangos : 42.5

Los cstadsticos U1 )' Ur son

(Jt :,,,,,*d!f4 -fnu,,s-os(;r) :s x z+Lf T7 b :r4.5,

Lrz : nttt4+! -IRo,,s-'s(B) :8 x -*+ -42,b:41.5.


Dc ruanela qrre ia pmeba creclir zrs:

1. Hiptesis Nula. Ho'. lLr: lL)


2. Hipte..sis Al,ter"no,tiuu. H q f t,,2

3. Estr.d'stico de Pruebo^ UoL,s: mn{t/1 , ti2} : 14.5.

1. R.egirL d,e Reclo.zo. Par'r cL:0.01, [/ooL(8,7) :8; crtorrccs, la, regin cs [/o6" ) 8.

5. Deciszn. Corno 14.5> 8. se lcchaza 110: cs rlccir. los clos cnrrleaclos venclen iguales canticl-rclcs
Captulo 9. Pruebas de Hiptesis No Paranttricas

9.5.3. Prueba de correlacin de rangos de Spearman


El coefi,ci,ente de correlaci,n de rangos ordenados de S'pearntan ftre el primer estadstico basado en
rangos que se desarroll. Se lo emplea para determinar la existencia de asociacin entre dos varilbles
de tipo ordinal.

Si disponernos de n parejas de obscrvaciones (r1, At), @2,y2), ,.., (",r,A") de dos variables X y Y
y asignamos rangos a la primeru (Rr.) y a la segunda courponent" (Ru) de las parejas, se define el
coeficiente de correlacin de Spearman como

cSr
-1- L

' t:l
r":1
ttltP 1)'

donde di: Rro - R.0,, es la diferencia entre los raugos asiguados a.T, y yi.
El procedimiento para su clculo es el siguiente:

1. Se asignan rangos a las observac:iones clc las rrariables X y Y.


2. Si hubiera empates, se asigna el promedio de los rangos a los individuos empatados.

3. Se determina el valor de d para cada indir.iduo y aplique la frrnula de rr.

El coeficiente de correlacin de Spearman tiene una interpretacin similar al de Pearson:

Toma valores entre -1 y *1.


Cuando el valor absoluto de este coeficiente e,! cclcuro a 1 inclica que hay asociacin entle las
dos variables.

" Cttando el valor del coeficiente cs cercarro -r ciero, inclica qrre hay poca o ninguna asociacin entre
las variables.

La ventaja de este coeficiente es que no rec,rir:re rca,lizrr srrposicioues clc nolrnalidad.


E1 contraste correspondientc rl cocficicntc clc Spcar'n)ur cs:

1. Hiptesis Nu"Ia. Hs: p: Q

2. Hiptesis Alternatiua. H p l0
3. Estadstico de Prttebn. t'.s

4. R.egi,n d,e Rechazo. r, > r'.r(n)

La tabla para realizar este contraste se errcnentrr en la Tabla I dcl Apndice.


Ejemplo. Se examin el regisblo de notrs de 10alulrnos en las materias de lgebra y Clculo. Las
calificaciones correspondientcs a cada uri(i se r1r en la, siguicntc tabla.

Alumno 1 2 4
I
i) 6 7 8 I 10
Algebra I7 18 l9 72 OD
it)
.)2 o( 26 31 aa
.)< DO ,D
Clculo 2T I4 27 18 20 34 .)L 39 JJ
9.6. Ejercicios 295

Verificar si existe asociacin entre las notas en las dos materias.

Soht"cin: Formemos Ia tabla de rangos y su difelencia:

Alurnno Algebra Clculo Rangos A (R,, ) Rangos C (Rr,) Diferencia d


r)
1 17 2I 2 4
2 1B L4 3 1 2
.)
J 19 27 4 6 -L
4 12 IB 1 2 -1
5 23 20 5.5 c
J
o
L

t) o,
L 25 55 5 05
7 25
t^
,)+ 7 I -z
o

8 26 32 8 7 1

I 31 39 9 r0 -1
10
DD
r)r) tt 10 8 2

Do? :2e.5
rl:l

Entonces, el coeficiente de correlacin es

1A

c\-2
",/-*t
6 x 29.5
r-:7-
' ,i,l :l : 0.821.
tlQt-l) 1o(100 - 1)

La prueba de hiptesis de nulidad de Ia correlacin CS:

1. Htptesis Nula. Hs: p: Q

2. H p l0
Hiptesis Alternatiua.

3. Estadstzco de Prueba. rs : 0.821.


4. Regin de Rechazo. En Ia tabla del corltraste tenemos que r'6.65(10) : 0.648. La regin de
rechazo es rs > 0.648.
5. Decisin. Se tiene que 0.821 > 0.648 y se rechaza 11s. Entonces, hay asociacin entre las notas
de las dos materias.

9.6. Ejercicios

Pruebas sobre una sola muestra

1. En una cornisara se registraron el lrmero de denuncias diarias por robos:

17 15 20 20 25 32 28 25 35 12 26 24

Utilice un nivel de significacin del 570 para pr-obal clue la nediana del nrmero de denuncias no
es nayor a 20 por da:

a) mediante la prueba de los signos;


296 Captulo 9. Pruebas cle Iliptesis -AIo Pan-anttricas

b) mcdianbe la prucbtr clo Wicoxou.

2. En un estudio sobre las relDesas enviadas por los parientcs emigrantes a varias fanilias dio los
siguientes resultados (eu miles de dlares):

2.4 2.3 1..7 r.2 2.5 3.6 4.2 2.2 2.3 3.1

Con el empleo de o : 0.05, pruebe si la trediana de estas lemesas es diferente de 2700 dlares:

a) rnediante la prueba cle los signos;


b) mediante la pruebir cle Wicoxon.

3. Para ingresar a Lula agencia balcaria se form una cola folmada por H (hornbres) y lVI (mu.jer:es),
que est formada as:

H \4 H N4 II H H N{ H H H N,f N4 H M

Determine la aleatorieclrcl en la colfomracirr cie la cola.

4. Un profesor registr el nirmero de estudiarrtes ausentes a sus clases durante 24das corrsecutivos.

38 31 32 27 28 30 26 33 36 30 28 35
32 29 35 3i 33 31 28 30 28 25 29 33

a) Estudie la aleatoliedad de la muestra con un nivel de significacin de 0.05;


b) Se puede asegurar clue la mediana es igual a 27.

5. Un corredor de bolsa obscrr' Ia siguiente venta de bonos a lo largo de un ao:

Enero 19 Julio 22
Febrero 23 Agosto 24
N4arzo 20 Septiembre 25
Abril 17 Octubre 28
Mayo 18 Noviemble 30
Junio 20 Diciembre 27

a) Aplique una prueba de rachas para decidir si los datos pueden considerarse aleatorios;
b) Es posible afirmar que la mediana es igual a 23?
6. Se desea ajustar la clistr-ibucin cle la canticlad cle corr-eos clectrnicos que recibe el serviclor cle
uDa empresa durante ltu ilterralo de cinco ninntos. Pala 400 intervalos de cinco minutos se
contaron la cantidad dc mensajes recibidos y se obtr-rvierou las siguientes frecuencias:

No. correos 0 1 2 ,) 4
I
O 6 7 8 I 10
Frecuencia I 11 47 76 68 74 46 39 15 o 8

Los datos pueden considelalse distribuidos con la distribucin de Poisson con ): 4.6?

7 Los siguientes datos collcspondcr a los tienipos clc clulacin (medidos en meses) de lmparas
malca Lucky:

3.33 6.71 2.53 7:5 16.82 3.56 0.17 2.r5 3.51 7.24.

a) Estudie si es razottablc suponer cLc los clalos colresponclen a Lrnr distlibucin exponencia.l;
il
9.6. Ejercicios 297

b) Se puede suponer que la mediana de la muestra es igual a cuatro?

8. Los siguientes datos corresponden a los tiempos de vida (en semanas) de colonias de bacterias
criadas en un laboratorio bajo condiciones estables de temperatura y humedad:

3.31 5.48 7.37 7.44 2.73 4.r9 3.18 2.23.

En todas las pruebas use el nivel de significacin del 10 %:

a) Estudie Ia aleatoriedad de la muestra;


b) Es razonable suponer que los datos corresponden a una distribucin exponencial?;
c) Existe algn valor atpico en la muestra?

9. Se registr el caudal promedio (en m3/s) que ingres a una central hidroelctrica durante 12
das consecutivos:

99.0 79,8 77.4 87.8 59.0 7r.0 5r.4 92.7 69"4 68.9 70.r 90.2.

a) Es razonable suponer que los datos son aleatorios?;


b) Es razonable suponer que los datos tienen distribucin normal?;
c) N{ediante la prueba de Wilcoxon, determine si la media de la distribucin es 75m3/s;
d) Determine si existe algl valor atpico.
t - l"l' si - 1 (r(
f(r) :{
1;
10. Se tiene la funcin densidad dada por r'\-/
L 0, casocontrario.
Se dispone de una muestra de mediciones de esta variable aleatoria:

0.03 0.01 0.32 0.88 -0.4t -0.18.

Utilizando las herramientas estadsticas adecuadas responda a las siguientes preguntas:

a) Es razonable suponer que la muestra es aleatoria?;


b) Es razonable suponer que Ia distribucin de la muestra corresponde a la densidad dada
anteriormente?;
c) Independientemente del resultado de !a parte anterior, se puede suponer que los datos
roviener C_e ,rrr Cistribr:cln rentrada en 0?

11. Se dispone de una mquina para llenar latas con 10cm3 de aceite (las latas llenadas al borde
tienen una capacidad de 11cm3). Un operario afirma haberla ajustado de modo que la cantidad
de aceite Uue envla el pico ae laalrina e.nvasadora es de (10+e)cm3, donde es una variable
aleatoria con la distribucin U I -+,+1. Para verificar la afirmacin anterior se estudi el
contenido de 12 ratas out",.'i",') r"t*;-tl/"."::1J::':" ,,
0.098 0.068 -0.004 -0.026 -0.012 0.096 0.050 0.062 0.036 0.04 0 0.054.

a) Determine si la muestra es aleatoria;


b) Es razonable suponer que la distribucin de la muest ra es l,l (-*
,01)?'
c) Si la distribucin d.el error fuese l,l
(-+,r1) " error medio sera 0cm3. Los datos
experimentales confirman la afirmacin anterior?
298 Captulo 9. Pruebas de Hiptesis -Ao Paranttricas

\2. llrr falric:urtc ilc frrsiblcs asegura que) colr una sobrecarga del 207a,los tiernpos dc r.ida dc sri.
fusibles (descle (lue se conectan con sobrccarga hasta que se funden) se clistribuyen unifornenerrtL
cntrc 10 minntos y
15 minutos. Para probar esta afirmacin Lrna mlrestra de B fusiblcs fue
sometida a Llna sobrecarga del 20%. Los tiempos en quc tarclaron en fundirse dichos fusibles
firerorr los siguientes:

13,34 10.69 13.37 77.r4 13.87 13.75 10.76 12.63.

a) Analice 1a aleatoriedad de la muestra;


b) la distribucin de la muestra es U[10,15]?;
,Es razonable suponer que
c) Si la distribucin de los tiempos de vida fr.rese U[10,15], el tiempo medio de vida sera cl'
12.5 min. Los clatos experimentales confirman Ia afirmacin anterior'/

13. En una empresa operadora de tarjetas de crdito se est analizando el historial del ltimo an,,
de1 consumo mensual de un cliente. Se conoce que el promedio de sus conslrrrros es 645 dlares
y desviacin estndar de 148 dlares. Si se encontr' que este mes tuvo un consumo de 320t,
dlares, debe considerarse que el cliente tuvo un comportamiento atpico?

L4 La poblacin ecuatoriana adulta tiene una estatura promedio de 162 cm y desviacin estndal
de 7.5 cm. En una muestra de 25 personas) a partir de qu valores de la estatura podeno.
colsiderar que hay presencia de valores atpicos? (Use cr : 0.05).
Pruebas sobre dos muestras
15 En dos laboratorios se realizaron rnediciones del punto de ebullicin de nn compuesto de silicr,-
(en "C) de 8 muestras diferentes.
Muestra 1 2 3 4 5 6 7 8
Medic n1 99.78 99.17 100.06 100.14 99.43 100.60 100.59 99.98
Medic n2 100.16 100.09 99.91 100.36 99.77 101.09 99.93 100.06

Determine si los dos laboratorios entregan igr-rales resultados, usando a : 0.05.

1b Se presume que un tratamiento reduce el peso de las personas. Mediante una muestra aleatoli.
se seleccionan 10 personas que siguieron dicho tratarniento durante todo el tiernpo exigido. E:
la siguiente tabla se presenta el peso de cada paciente, antes y despus del tratamiento (rnedid
en kg).
o
Persona 1 2 r) 4 5 6 7 B o 10
Antes 108 72 B1 r04 69 /d n, tl4 86 92 98
Despus 95 76 69 B1 56 81 92 B1 77 97

Verifique si el tratamiento es efectivo. (Use o :5%)


I7 Se tienen dos muestras, X y Y, independientes entre s, qne corresponden a mediciones de nivele-
de contaminacin sonora en las ciudades de Quito y Guayaquil. Se desea saber si arlbas ciudade=
tienen similares niveles de contaminacin o si alguna de ellas presenta niveles significatir.'anert.
rnayores.
X 70.1 70.4 75.8 67.5 68.4 7 76.9 I 75.7 77.4 7U.J 72.7 69.E
Y 74.3 74.1 75.4 67.4 69.3 70.5 I 70.1 69.9 68.7 70.3 70.7 7t.7 74.4 7^1

l8 Para caLcular la velocidad de clculo de dos computadoras A y B, se realizaron en arlbas


operaciones. Los tiempos invertidos, en milisegundos, fueron:
A 110 125 74r 113 IB2
B r02 120 135 7r4 775

Analice si hay diferencias entre las localizaciones de las dos muestras. Use a:570.
9.6. Ejercicios 299

19. Los siguientes datos son los tiempos de duracin (mcdidos en meses) de 10 lmparas marca
Luckv:
3.33 6"T1 2.bz r.rb 16.82 3.b6 0.r7 2.r5 3.b1 7.24.
Se dispone ahora de una nueva muestra, independiente de Ia anterior, de los tiempos de duracin
de Imparas de marca Wizard:

5.60 3.03 7.46 r.6.52 0.37 0.58 3.38 9.15 0.90 4.44.
Implernente una prueba de cornparacin de rluestras para concluir si es razonable suponer que
las nuevas imparas tienen la misma duracin que las anteriores.

20. Los siguientes datos corresponden a los tiernpos de vida (medidos en nanosegundos) de partculas
radioactivas emitidas por cierto material:
20.05 1.30 2.54 1.95 9.20 4.20 1.84 7.02 5.60 1.80.

Para un nivel de significacin del 10%, estudie:

a)la aleatoriedad de Ia muestra;


b) si es razonable suponer que los datos corresponden a nna ley de Pareto, caracterizada por
la siguiente funcin de distribucin:

rr,--\
\:L): Ilt-! r
si r>l;
|. 0. caso conl rario

c) Se dispone ahora de una nueva muestra independiente de la anterior correspondiente a los


tiempos de vida de partculas radioactivas emitidas por otro material:

2.60 4.81 12.79 3.82 7.2r 1.68 15.50 12.03 r.70 9.40.

Realice una prueba de comparacin de rnuestras para concluir si es razonable o no suponer


que los nuevos datos tienen la misma distribucin que los anteriores.

2I. Se tienen dos muestras independientes entre s, correspondientes a los tiempos de duracin (en
aos) de sistemas electrnicos de marcas distintas. Se desea saber si los equipos de arlbas marcas
tienen niveles similares de Curacin o si alg.,rna de ellas presenta una duracin significativamcntc
lnaYor.

Ir'Iuestra X 2.00 0.67 0.58 r.46 0"28 0.43 r.02 0.96


Muestra Y 0.20 r.73 0.30 0.02 0.05 7.57 1.46 0.14 0.32 0.60

Utiiizando un nivel de significacin del 10 %:

a) Aplique La prueba cie rachas a ias muestras para decidir si se pueden suponel aieatolias;
b) Aplique a ambas muestras las pruebas de siglros y de rangos signados de Wilcoxon para
decidir si los valores X^:0.69 y Yrn:A35 son vaLores aceptables para las medianas;
c) Pruebe si la mediana de la muestra X es mayor que Ia de la muestra Y.
22 En una investigacin de mercado se pidi a dos nios que calificaran a 10 juguetes en orden de
preferencia (de 1 a 10), obtenindose la siguiente tabla:

Juguete A B C D tr F G }I I J
Nio 1 B I 6 2 1 4
I
J 7 O
rJ r0
Nio 2 7 10 8 5 a 2 4 6 1 9

Determine si las calificaciones estn correlacionadas.


300 Capitulo 9. Pruebas de Hiptesis -h[o Paranttricas

at
En un estudio sobre cor.ercio internacion.r1. sc orrlcnrron dc rnanerr decreciente a los principai,,-
socios comerciales sudanericanos de Ecurdor v Algcntina.

Socio Col. Per. Bra. Ven chi. Bo1. Par.


Ecuador 1 2 3 4 r
(J 6 7
Argentina J ,1 1 o 2 7 6

Calculc ei coeficiente de corleiaci<in rle Speannan v verifiqr-rc si hav asociacin entre Ias ordeu.-
crones.

24. Las siguientes son las calificaciones obtcuidtrs por 11 jtir.erres cluc se soneticlon a evalllacion.
en destreza rnanual v memoria rrislrrl.

D. manual 1 3 4 5 6 8 l0 11 13 I4 16
M. visual l8 j,J an
11 15 16 31 39 5ti 45 43 t) I

R.ealice una prueba para determinar si existe correlacin errtre las calificaciones en las dos er'.--
luaciones.

25. Un grupo de irn,estigadores desea er.alrlar si un nuevo equipo dc tratamiento aguas residual.
es efectivo para reducir Ios niveles de contaniracin de las agllas vertidas a rrn ro por 1.
curtiembres. A tales efectos se midi el nivel de contaminantes antcs v despns del tratarnient,-
Ios resultados fnelon los siguientes:

Planta I 2 3 4 5 t) 7 B I 10
Antes 1.52 2.92 4.44 4.24 t.72 3.70 3.64 4.82 2.72 2.08
Despus 2.08 303 0.80 096 2.7r 2.39 3.07 2.87 0.33 r.76

a) Detenliue si efcctivamcnte se lta proclnciclo rrna recluccin en los rrivcles cle contaminacic,:
b) Las dos muestras estn cor-relacionadas?
Ca ptu lo 1

Regnesin Linea N 5mple

Tod,os los 'modelos estrt, eryr:tuocodns, pe'ro o,lqun"os sot, ttiles


G. E. P. Box

Iuchas de las aplicaciones estadsticas requieren la estimacin de las relaciones existentes entre dos
' ms r'rriables; por ejcmplo, puede ser necesario responder a las preguntas cmo vara el prccio
:-,lomedio anual del ma2, segn la produccin a nivel nacional? o cmo vara el consunio de gasolina
le nn rulo. segn su peso y ia potencia del motor? trl inters se centra, entonces, en determinar una
.cnacin clue relacione Llna variable dada con nna o ms variables que contienen informacin sobre
.,i primera. A estos problemas dedicaremos los dos sigtr,ientes captulos; antes reviscmos algo de Ia
--istoria de esta parte dc la estadstica.
lio exactitud, quin y cundo empez a tratar de expresar algebraicamente las rclaciones
se conoce) con
.ltre dos o ms vanables, de las cuales solo se dispone de un conjunto de observaciones; pero eu los
-scritos de Leonardo da Vinci, cuando l trata de las proporciones del cuerpo humano, se encuentt'an
.:lpresiones aritmticas que relacionan las medidas de diversas partes del cuerpo.
-,-n
intento, que est bien documentado, data de 1755, cuando Boscovich y Christopher Maire estaban
-lcargados de medir la longitud del arco de meridiano qne pasa por Roma. Boscovich concibi nn
,todo para encontrar nn modelo que relacione los datos correspondientes a dos variablcs, mediante
., empleo de las llarnadas <<regresiones elementales>>. Esta tcnica fue mejorada por su autolen 1760
'' I.L-.esii.:l Lir.a crl,a iris csi,rticl.tir,j.e por Laplace) Linos alos ms tarCe.
rn 1805, Legendre public una obra de astronoma, en la que describi el mtodo de los mnirnos
- radrados y 1o aplic ai ajuste de datos observacionales. Tarnbin, hay una serie de artculos pre-
.-ntados por C. F. Gauss a Ia Sociedad Real de Gotinga en los que describe el mtodo de mnimos
Ladrados. Luego, en 1885, Sir F. Galton present en la rer.'ista IYature el desarrollo complcto de esta
-=cnica. aplicada a lo que l denomin modelos de regresitz. A partir de esta fecha se mejor y se
-,mpiet la tcnica, haciendo que ella sea la de nayor erlpleo en el ajuste de coniuntos clc datos"

-,ctualilente, la construccin de modelos lineales es Ia base de todas las tcnicas estadsticas de


rtriraleza predictiva y su aplicacin se ha extendido a prcticamente todas las ciencias.

10.1-" Vlodelos deterrlinistas y probabilsticos


I,tisten aplicaciones en las que se dispone de un modelo que presenta nna relacin exacta entre las
.riables cie inters; por ejemplo, 1a ley que desclibe el tieilpo que tarda en caer un objeto dcsde nnr,

301
Captulo 70. Regresin Lineal Simple

altura dada, o la frurula que nos indica el inters ganado por un capital, dados la tasa de inters y e1

periodo de la inversin. Tales modeios se denominan determ'intstas.

Sin embargo, en la vida diaria, tara vez se presentan fenrnenos que reproducen con exactitud una Ie'.
ya sea porque existen errores en la medicin o porque hay otras variables que no son consideradas.
por stl escasa influencia, pero que son sufi.cientes para que el modelo propuesto no sea exacto.

Un modelo en el que una o ms variables es de naturaleza aleatoria se denomina probabi,lsti,co y a


Ia determinacin y examen de la calidad del modelo encontrado se llama anIis's de regresr,ru

Figura 10.1: Modelos determinista y probabilstico.

Destaquemos algunas de las ms importantes aplicaciones del anlisis de regresin:

1. Descripcin cuantitativa de las relaciones entre una variable dada y un conjunto de variables.

2. Interpolacin entre valores de una funcin.

3. Prediccin v pronstico de datos.

En lo que sigue, nuestro inters ser determinar una ecuacin clue relacione una variabie dada con otra
variable de respuesta, bajo el supuesto que ellas se vinculan mediante una ecuacin lineal de primer
grado, caso particular conocido como regres'in lineal si,mple.

LO.2. Modelo lineal simple


R,ecordemos que ia ecuacin de Ia recta es

lJ: l3ol7fl,
donde B es la intercepcin de Ia recta con el eje y y r es la pendiente de la recta. (Vase Figura
10.2)

Intercepcin
- Pendiente:p,
-{
! = fro

Figtrra 10.2: Recta de ecuacin ?J


: 0o-l /tn.
70.2. Modelo lineal sirnple 303

Este rnodelo es determinista porque no considera el error y los valores de g se obtienen, de manera
exacta, al sustituir los valores de r en la ecuacin de Ia recta.

Cuando se desea incorporar al modelo determinista ei efecto aleatorio de las variables se le aade una
componente que corresponde al error y el modelo queda como

a: 0ot Ap I e, (10.1)

donde

g es la variable a ser modelada o uariable dependiente.

r es la variable que se Llsa como predictor de g o uariable independiente.

e el componente aleatorio del error.

Bg ia ordenada del punto donde la recta interseca al eje y.

B1 la pendiente de la recta.

A Ia variable indepenciiente, tarnbin, se Ie denomina pred'ictoru y a Ia variable dependiente se llarna


respuesta.

Para recoger el efecto aleatorio del error, harenos las siguientes hiptesis sobre e:

1. Se distribuye normalmente con media cero y varianza o2'. - A[(0,o21 .

2. Los errores, correspondientes a dos observaciones distintas, son independientes entre s: E(e e) :
0.

Ejernplos de modelos de regresin que se presentan en la vida cotidiana son los siguientes:

,
u
Efecto del nivel socioeconmico,
Presupuesto de gastos Nmero de miembros
tenencia de la vivienda, servicios
de un hogar del hogar
que dispone, etc.
Efecto de la zona de ubicacin,
Precio de nn
Area de construccin trpo cie acabados, piso en el que
departamento
se encuentra, etc.
Efecto de las variaciones climticas,
Crecirniento anual
trdad del rbol variedad del rbol, fertilizacin de
de un .r1-.ol
Ia tierra, etc.
Nmero de pginas Efecto del tipo de papel, la encua-
Precio de un libro
del libro dernacin, nmero de ilustraciones, etc.

rn el anlisis de regresines necesario tener en cuenta los siguientes pasos que llevan a estimar un
'len modelo) que se ajuste a los datos:

Tener una visin clara de los objetivos del estudio, para determinar cul ha de ser Ia variable
respuesta y qu variables pueden incluirse como variables independientes.

Recopilar los datos correspondientes a las variables identificadas como dependiente e indepen-
dientes.
304 Captulo 70. Regresin Lineal Sirnple

3. Postular un modelo, al que se supone se a,justan los datos (en nuestro caso se presume que es -
Iineal simple).

4. Determinar la ecuacin de regresin; es decir, estimar los coeficientes del modelo propuesto.
I
L,. Comprobar estadsticamente la adecuacin del modelo. Esto incluye la realizacin de prueba..
estadsticas sobre los parrnetros, la ejecucin de transformaciones de las variables para obtene:
un mejor ajuste o retirar variables de nna ecuacin si su aporte no es signiflcativo en ia ecuaci-
de prediccin.

6, Cuando la ecuacin sea satisfactoria, usar el nodelo para efectuar estim.aciones o predicciones.

Una vez que se han curnplido los tres primcros pasos) nuestro objetivo ser estimar los coeficientes de
modelo y comprobar la adecuacin del modelo.

1-0.3. Mtodo de los mnimos cuadrados


Para estimar los coeficientes de la ecuacin de regresin se emplear el mtodo de los mn'imos cnadro-
dos, consistente en minimizar la suma de los cuadrados de los errores; esto es, que si se nota a l.
ecuacin de prediccin por
i : bo I btr, (10.2

donde bo y h son los estimadores de B y B1, respecti-u'amerrte; ellos deben ser tales que la surla d
los cuadrados de las diferencias entre los valores observados de la variable respuesta y su estimacir-
por la ecuacin de regresin sea mnima.

Figura 10.3: Interpretacin del mtodo de los mnimos cuadrados.

Si se dispone de n pares de observaciones de las variables independiente y dependiente (r1;yt), @z;yzl.


..., (rn;A"") y si fr son los valores de las predicciones de y:
0: bo * bp.

Entonces, los residuos de la prediccin (errores) se calculan por e: U - i.

Nosotros buscaremos los valores de y b1 eue minimicen la snma de los cuadrados cle los errores.
tarnbin llamada suma d,e los cuadrados de los res'idu,os:

scE : >,"::f,fun-\)2
: Llr, - (bo + lrr)12
i:7
305
70.3. Mtodo de los rnnitnos cuadrados

ecuaciones:
Dcrivando SCE con resPecto a b6 Y b1 , e igualando el resultado a cero se obtienen las
11

a6c E) : -z\(ur - bo - b1r) :0,


0bo i:r
TL

a6c E) : -2|u.(s. - bs - b1r) : Q,


0bt .i,-1

clya solucin es
1a

D@ -',)(tt'
i-l
- Y) gCru
(10.3)
h: TL
r) SCr"'
Llr - -rt )-
i:I
(10.4)
b6 : U-bti,

i",
TL

;,1
Dv
i:7
,iurrclcn-:-j--t'g: sonlospromecliosclclos\aloresdelasvariablesinclependientey
?.1 17
,-Lr:penclietite.
queda establecidr
u na vcz obtenidos los valores de bs y b1 se
los sttstituye en Ia ecuacin; de esta manera
ia recta cle prediccin pol m'nimos cuadrados:
i:bo*b1r'
se clebe tener presente la incorporacin de elroles
Observacin. En Ia estimacin cle los parmetlos de
ie lecloncleo en el clculo de sc", t- d'e scrr; se recotrriettcla el empleo de un nrrnero suficiente
-ifrassigrrificativasalrealizarlosclculosdeforrrrarnanllai.
de los automviles v stl con'sulllo
Ejemplo. En un estudio pala determinar la relacin entre el peso
con los sigttientes resultados:
ie combustible se escogi .,r,,a rl].,estra de 10 caIlos,

Co"s.,mo (l/100 krn)

leterminar Ia ecuacin de regresin lineai simpie'


jolu,cin: prirlero, establezcamos que la variable independiente es el peso y la dependiente
es el

, )l I ilLl ]llf)

rrlra tabla:
?ara simplificar los clculos, Iestl]nalnos los componentes eu
z: 996.1; ?l :11.4.

.L '9 i-r
739 B -257.1 -3.4 66100.41 874.14
1187 16 190.9 4.6 36 442.8r 878.14
655 6 -341.1 -5.4 1t6349.2t 1841.94
729 rt75.24
7 -267.r -4.4 71342.4r 475.64
8BB 7 - 108.1 -4.4 11 685.61
797 I - 199.1 2.4 39 640.81 477.84
1.3.24
963 11 -33.1 -0.4 1095.61
802 12 - 194.1 0.6 37 674.87 - 116.46
1551 18 554.9 6.6 307 914.01 3662.34
1650 20 653.9 8.6 427 585.21 5623.54
1 115 830.9 14 905.6
Suma
Captulo 70. Regresin Lineal Simple

Sustituyendo los valores de las slrrrras en las frmulas (10.3) y (10.4):

,- :
b-
sC,,
--*v 14 905.6
:f-).r-1131.
sc,.,- I 115 830.9
bo : A -bt7 :11.4-0.0134 x 996.1 : -I.9477.

Entonces, la recta de ajr.rste por el mtodo de los mnimos cuadrados es

0:-7.9477+0'0734r.

Ahora se puede, por ejemplo, predecir el consurno de un auto que pesa 1000 kg; esto es, z : 1000:

i: -7.9477 +0.0134 x 1000 : Lt.45.

LO.4. Comprobacin de Ia adecuacin del rnodelo

Una vez que se halla una estimacin de la recta de regresin) es necesario determinar si 1 ss11gir-:-
obtenida es un buen rnodelo para los datos y cuantificar el elror que se cornete cuando se emplea t:.-
ecuacin. sto se logra mediante el empleo de los coeficientes d.e correlacin y de d.eterminacin, - .,
travs de la realizacin de pruebas estadsticas sobre los parmetros.

10.4.1. El coeficiente de correlacin

Recordemos que si se tienen dos variables aleatorias) una medida de Ia relacin que existe entre ell-.
es el coeficiente de correlacin p. Anlogamente, para determinar si existe una reLacin lineal entre le-
variables predictora y de respuesta se utiliza el coeficiente de correlaczn I'ineal de Pearson, denotad
por r, que se define por
11

L,rA- nrA

El coeficiente de correlacin tiene las siguientes propiedadcs:

1 El rango de variacin de r est entre -1 y 1, siendo su signo el mismo que el de br.


2 Un valor de r cercano a cero indica que no existe o hay poca relacin (lineal) entre r y y.

3 Valores de r cercanos a 1 o a -1 indican que existe una fuerte relacin entre Ias dos variables.

4. Si r : I o r - -1, todos Ios valores caen exactarnente en la recta y se tiene un model,-


deterninstico.

En la Figura 10.4 se rnuestran diversos diagramas de la rclacin entre r y A, segrn los valores de r.
70.4. Cornprobacin de Ia adecttacin del rnodelo 307

f*e t
. * \
*
A%\
*aa
*&- g

Be **s
'd"s
I r r.;.ru1 7*

r = [1.7

: tgura 10.4: Diagratnas de dispersin de los datos y valores aproximados del coeficiente de correlacin.

:-empre debemos tener en cuenta que el coeficiente r solo aporta informacin cuando existe tura
-.-acin lineal entre las variables. Pudiera suceder que se tenga un valor de r cercano a 0 v, sin
.:.rbargo, haya una relacin no-lineal entre las variables.
308 Captulo 70. Regresin Lineal Sirnple

Como el coeficiente r es un estimador de p, se pueden efectuar pruebas sobre la significacin de


coeficiente de correlacin muestral.

Prueba de hiptesis sobre p

1. Hipteszs Nula. Hs: p: Q.

2. Hiptesi,s Alternatiua. H1: p 10.

3. Estadstico de Prueba. tobs :


rJn=2
JT -7
4. Regi,n de Rechazo. Se rechaza I1s si tob" 1 -tolz(n - 2) o tob" ) t.2(n - 2) .

Tarnbin, se pueden conducir pruebas unilaterales sobre p, pero ellas solo tienen un valor estadstic-
y su valor prctico es restringido.
Ejemplo (Continuacin). Para los datos del consumo de gasolina de los automviles: a) caicr-rla--
el coeficiente de correlacin de Pearson; b) realizar una prueba para probar si p : 0 al nivel o=
significacin de 0.05.

Soluc'in: Los componentes de r son: ,SC"" : 1115 830.9, SCaa :224.4, $Cxu :14905.6.

a) trl coeficiente de correlacin es

$cw 14 905.6
:0.94197.

Como r es muy cercano a 1, existe una fuerte relacin lineal entre las variables.
b) Para la prueba bilateral consideremos un nivel de significacin del 5 %,

1. Htptesis Nula. Hs: p: Q.


2. Hi,ptesi,s Alternatiua. HI p + 0.

3. Estadsti,co d,e prueba. tobs :'F= -


Q'9419n\n0 -?: 7.g4.
JT -F v/T -@.s're
4. Regr,n de Rechazo. Tenemos que s.25(8) :2.306 y Ia regin es lr"1 > 2.306.
5. Decisin. Corno 7.94> 2.306, se rechaza llo; es decir, hay evidencia que indica que exist-
correlacin entre el consumo de combustible y el peso del carro.

LO.4.2. El coeficiente de deterrninacin

Otra medida de la relacin entre las variables es eI coeficiente de deterrn'inacin, 12. Su empleo st
debe a que da mayor frterza de interpretacin a la relacin entre las variables. Tenemos que
n n
er1
DUay :D@o - y)2 :Dr? - ne2,
i:). i:7

que se le conoce como surna de los cuadrados alrededor de la media de y o suma de cuadrados corregzd -
de y.

Si denotamos por:
70.4. Contprobacin de la adecuacin del rnodelo 309

SCE -- D(ao - fr)2, que se denomina como sttma, de uro,drados de los erT'ores. Este trmino
i:I
tambin se puede calcular mediante la relacin

SCE : SCr, - b1SC,y : SCo,


W
" SCR: i:r
i@o - 2,se designa como suma tle los c'uo,dlrod,os d,ebid,o a la reqres'ir.

Se puede demostrar que

SCro SCE + SCR,


l7 1L 17

l,(uo
i:1
-il' fi:I tvo -0)2 +L(9, -il2
i:1

Entonces, tenemos que

^2 (5C,,,)2 scua - scE


sc,, sclu SC,,
: r- SCE
sc,
Tambin, se puede expresar como
scr, - scg _ scR
' _-
^,
sciu -sc*
Interpretacin. El coeficiente 12 tor.ra valores entr-e 0 ;, 1 y se puede interpretal de vrrias maneras:

1. Como medida de reduccin el error total. Cuando SC E : 0, 12 : 1 y cutrndo SClt : 0,


12 : 0 Luego, 12 r"pte.er.ta la reduccin lclativa en la suma de ,SC, cuando se lia ajustaclcr
nna recta de regresin.
Por ejemplo, un valor de 12 -- 0.7 significa que el 70% de la variacin total es explicada por Ia
recra qrle ajrrsta los datos y el 30% restantc es atribnible al error de a.juste.

2. Como rnedida de bondad de a.iuste. Clrando el ajuste es perfecto, t-2 :I y cuanclo no hery
ajuste, 12 : 0.

Cuanto rnayor sea el valor de 12, mejor ser el a.juste y mayor utilidad tendr corno instrumento
de prediccin.

3. Como rnedida de la linealidad de los puntos. Cualdo 12 se aproxima a 1, el gr:ifico de los


datos se acerca a una lnea recta. Si la relacin entre dos variables no es lineal, 12 : 0.

Ejernplo (Continuacin). Para los datos dei consllmo de gasolina de los automviles, calcttlal el
:oeficiente de determinacin.

Solu,c'itt,: Se tiene que

SCE scau-W _ r-ta4 A


-
t, 14 905.6)2
1115830.9
25.287.
310 Captulo 70. Regresir Lineal Simple

De rnodo que
25.287
t'2:l- : 0.8873.
224.4

Es decir. el 88.73 % de ia variabilidad de ios datos es recogida por la recta cle regresin

10.4.3. Estimacin de la variayrza de la regresin

Al ploponer el modelo probabilstico


a:00-lp.rlt
se estableci que elerror aleatorio est distribuido segirn una ley normal de media cero y varianza o2.
Entonces, cada valor obseru'ado de g est influido por tal error. Aderns, a los errores asociados con
distintas observaciones se los considerar mutuamcnte inclepcndientes.

La varianza o2 del error es desconocida y su estimador insesgado es

SCE
r-2'

A s. que es la desviacin estndar de Ia regresin muestr-al, tarnbin se la denonina error est"nd,ar dt


estim.o,cin.

Ejemplo (Continuacin). Calcular Ia estimacin de o2 para los datos del conslrrno de combustible
de los carros.

Solucir: Anteriormente se obtuvo que ,SCE :25.287. De rnodo qr,re

,,: SC E 25.287
:3
's' 161'
"
1: 10 J

Auuque s2 se puede considerar una medida de 1a calidad cle ajr.rste, su principal utilidad se encuentL.
en la determinacin de la bondad de ajr-rste, ya sea mecliante un intervalo de conflar^za o con Lrn-
prueba dc hiptesis.

LO.4.4, Inferencias acerca de Ia pendiente de Ia recta, Pr

En primer lugar se desea estudiar si existe o no existe relacin entre las variables r y A. Se dese-
coutestar a la preguuta aporta r informacin pala predccir 17? Esta pregr-rnta se refiere a Br, pues
afirmar que y no se lelaciona linealmente con z equivale a decir que B, : 6.

Eutonces, se desea probar la hiptesis nula <<r no contribuye con ilformacin para predecir y>>; contr:^
la hiptesis altelnativa, <<las valiables estn rclacionadas de forrna lineal con una pendiente distint
de ccro>>; es decir,
Ho, 0t:0,
Hr 0tlo.
Para efectuar Ia prueba habr que encontrar lr distribucil de lnuestreo de 1,1 .
Y

,i
70.4. Cornprobacin de la adecuacin del rnodelo 311
[,

i
Distribucin de muestreo de b1
1{,

Si los componentes del error son variables aleatorias independientes normalmente distribuidas con
nredia cero y varianza o2, la distribucin de muestreo del estimador b1 es norrnal con media B1 y
desviacin estndar
o
ubt
JSe;
sto quiere decir que b1 es un estimador insesgado para p1, pucs E(b1) : 0t y que la desviacin
estndar de b1 puede estimarse pol
5
q,
"ut
\/ /.d7'-,
JV, ,.

donde s es el error estndar de la estimacin.

Entonces. la variable aleatoria :b'- Sbr A' sigue una ley a (n-2) grados de libertacl.

Prueba de hiptesis acerca de Ft

a) Prueba unilateral.
1. Hi,ptesis Nula. H6: B, : g.
2. Hi,ptesi,s Alternati,ua. Hr 0t < 0 (o bien .11: , > 0).
3. Estad,st'ico d,e Prtteba. tobs: --L
slt/Se -,'
4. Regin de Rechazo. Se rechaza 116 si tob" 1-to(n-2) (o bien o6" ) Lo,(n-2) cuando 111:
r > o')
b) Plueba bilateral.
1. Hzptesis Nula. Hs: Br: g.
2. Hiptesr,s Alternat'iua. HI 0t * 0.

3. Estad,stico d.e Prueba. tobs:


--L
sl\/Se;,'
4. Regi,n de Rechazo. Se rechaza ,116 si 'tob, I -t,,lz(n - 2) tobs ) t.2(n - 2).
"
Intervalo de confianza de 100(1 - o)% para p1

Lin intervalo de confianzapar'" Ia pendierite 0t, a nivel 100(1 - ct)7o es

'\tl'\ - 2)-+; u/L\ - 2)-:-)


t L.2(n
(0,
y - r^n(n 'JSC, b1
',r/sc,; ) .

Ejernplo (Continuacin). Para los datos del consumo de cornbustible de varios carros: a) probar
.i Br :0, a ttn nivel de significacin de 0.05; b) obtener el intervalo de confianza algSTo.
Solu,cin,: Antes se haba determinado los valores de s y de SCrr:
: r/3J61 : r.TTTS, sc",", :1 11b 830.g.
"
a) Realizaremos una prueba bilateral:
3I2 Captulo 70. Regresin Lineal Sirnple

1. Hiptr:sis Nu,la. Hs: i3, : g.


2. Hzpte.sis Altuno,ti.t,a.. Ht: Br l0.
0'0134
3. Estodstico d,r; - -:=1/se"., l.TTT\-1,rtr1r5i.yag : -7 9615'
P,uelu,. 1,,b" ^j
I s

4. Regin, tle Rechozo. Como tob" ) ioot(E) : 2.306 v la r-egin es lo,"1 > 2.306
5. Dectsi,n, Se lcchaza la hiptesis nnla.: es dccir, el consurno de combustible aument-
meclicla qlle se inclcrnrent-L el pcso de los carros.

b) trl intervalo cle confiarrzr es:

/rs\
(Lr - r" "rr, :t ,r-: t't i i,, .{tt 2))
(.,.,,,,-r.30b-]j.I1::{l'(}13.lr.30+):(0.0095l0.0l73,).
\ vr11iE30.9 /rlr530.9/

L0.4.5. Inferencias acerca de la intercepcin de Ia reca, p,

Sr.rpongarnos c.lc se clesei rr-crigrral si {)s r$ ual. 1or cspecfico: ello se logra efectuando
prucba rle hiptesis o colr un intervalo cie r:olfi A\Z ncra sirnilar a la rlescrita para p1 .

Se pttcrlc clentosl rar qlre la cLr-.svir<:irr est i.rtclrl cle

O[.o: o\

(l,o iloil Se;


El cstaclsti c,o l, - sigrro rrrra clist'ribucin / con (n, 2) grados de libertad.

Prueba de hiptesis acerca de o

1. f{i.ptesis lfu"l.o,. Hs: Bs : lJoo.

2. Hi,ptesis Alterno,ti,t:o,. H P I 0ou.


3. Ptuclt,t.
b iJao rt 5C,,,
Este,d,.stir:o tle lo[,., - IL

\),,i
4. Regi,n r|,e Rech,azo. S.. rcclLr,za H si t,,1," { -Lr, 12(n. - 2) o tub, )> to2(rt - 2).

lntervalo de confianza de 100(1 a)% para Bs

t.,,
i2(rt, 2') :lt!f ,,/:(n -

[,-
70.5. Anlisis de la vartanza 313

Ejemplo (Continuacin). Para los datos del consurno de combustible de varios carros: a) probar
si Bo:0, a un nivel de significacin de 0.05; b) obtener el intervalo de confi.anza al957a.

Soluc't,n:

a) Realizamos una prueba bilateral.

1. Hi,ptesr,s Nula. Ho: B.: g.


2. Hi,ptesi.s Alternat'iua. HI Bs 10.
3. Estadstico de Prueba.

n SC,, _ -L9477 - 0 10 x 1115830.9


:
11
1.7779 11 037 983
-1.101.

4. Regin de Rechazo. La regin crtica es lo6"1 > o.oz(B) :2.306.


5. Decisin. Como |- 1.1011 < 2.306, no se rechaza Hs; es decir, B6 pudieraser igual a cero.

b) El intervalo de confianza es

(
-, .rrr',- r.rouL]Zg./ffi : t roul3l@) : (-6.025; 2.130).
\ x 1115830 9 -r.()J77-
/10 v I 115830.9 J10 /

10.5. Anlisis de la varianza


El procedimiento del anIzsis de Ia ua,rianzc, (ANOVA) es una metodologa estadstica que permite
1a comparacin de dos o ms rnedias poblacionales midiendo la variacin dentro de las muestras.
En nuestro caso emplearemos el anlisis de la rraria\za para efectuar pruebas sobre los parmetros
estimados del modelo y as conocer su exactitud.

Anteriormente establecimos que se cumple Ia siguiente igualdad:

l(ao -' : Ljr, -0)' +\(0' - 2 (10.5)


i:t i:\ i:I
SC,o : SCE+SCR,

Significa que la suma de los cuadrados corregida es igual a la suma de cuadrados de los errores ms la
snrna de cuadrados debida a la regresin.

La suma de los cuadrados corregida tiene (n - 1) grados de libertad, Ia suma de cuadrados de los
errores tiene (n - 2) grados de libertad y Ia surna de cuadrados debida a la regresin tiene 1 grado de
libertad. Es decir, la igualdad correspondiente a los grados de libertad de la ecuacin (10.5) es

n-t:(n-2)+I (10.6)
314 Captulo 70. Regresin Lineal Sirnple

De las ecnaciones (10.5) v (10.6) se tiene la tabla de anlisis de Ia varianza) como la que se presen:
a continuacin.

Tabla de Anlisis de la Varianza


Fuente de Grados de Suma de Cuadrado
F
variacin litrertad (9.1.) cuadrados (.9C) medio (I[C)
R.egresin 1 SCR AnCR.: SCRII p,
Lobs- ,
D
Elror o residi-rrl r-2 SCE s2: SCEI("-2)
Totirl corregido n-I SC uu

La colnmna dcl <<cuadrado rnedio> (htC) se obtiene al dividir cada una de las suma de ios cuadrad,,
entre sus correspondientes grados de libertad.

El valor de 4a" r-esu.lta de la divisin del cnadrado medio de la regresin para el cuadrado med-
AIC R
resld.rtal: tobo: a .
5'
Una vez elaborada la tabla de anlisis de varianza, el valor de Fo" se emplea para conducir una pruet
de hiptesis sobre la razn de dos varianzas) qrre sirve para probar si r : 0. La prueba es Ia siguientt

1. Hiptesis l{tila. Ho: p, : g.

2. Hiptesi,s Alternat'iuo,. Ht 0t 10.


ATCR
3. Estadsttco de Prueba. Fobs : ,
4. Regin de Rechazo. Se rechaza H6 si f ,,- > 4,(1, rr - 2).
Ejernplo (Continuacin). Para los datos del consumo de combustible de varios calros: a) realiza:
la tabla de anlisis de la varianza: b) probar si p, : 0, a nn nivel de significacin de 0.05.
Soltci,n,: Las sumas de los cuadrados colrespondientes son

SC,oo - 224,4, SC E : 25.287. SC R : 199.113.

a) La tabla de anlisis de Ia varianza queda como sigue:

Tabla de Anlisis de la Varianza


t-uente de Grados de Suma de Cuadrado
variacin libertad (g.1.) cuadrados (,5C) medio (I[C) F
Regresir'r 1 199.113 199.113 62.99
Error 8 25.287 3.1609
'lotal corregido 0 224.4

b) Realizamos la prueba de hiptesis:

1. Htptes"tsNula. H6: Br: g.


2. Hiptesis Alternetiua. H p110.
3. Estadstico de Prueba. Fobs :62.99.
4. Regin de Rechazo. Corro Fo" ) Foos(1,8) :5.32, Ia regin es Foa" > 5.32.
5. Deczsi,n,. Se rechaza 1a hiptesis nula. Es nrs, por la magnitud del estadstico de prr-reba.
se declttce que el nivel de significacin del contraste es sumamente bajo.
70.6. Uso del ntodelo para estintacin y prediccin 315

10.6. IJso del modelo para estimacin y prediccin

LIna vez que el modelo es satisfactorio habr que emplearlo para reafizar estimaciones y predicciones
que servirn para analizar el comportamiento de la variable respuesta ante condiciones que no fueron
probadas empricamente.

Previarnente establezcamos Ias diferencia entre intervalos de estimacin y de prediccin:

1. Un intervalo de estimacin se utiliza para estimar la media de Y, dado un valor de z; es decir,


estimar el valor lrro mediante un intervalo, cuando :[ : :x0. Un investigador puede desear
conocer el consumo medio, para un peso dado del auto.

2. Un intervalo de prediccin se utiiiza para estimar ur valor particular de Y, cuando n : ro;


es decir, estimar el valor Y0 mediante un intervalo de confianza. El investigador puede desear
conocer el consumo de un auto que tiene un peso dado.

Ntese que Ios valores de estimacin y de prediccin de Y son idnticos en los dos casos, la diferencia
radica en la precisin relativa de cada unar que se ven refleiadas en sus varianzas e intervalos de
confianza.

10.6.1. Intervalo de confianza para la estirnacin, E(Y), cuando X: Xp

En el caso de la estimacin se trata de calcular

E(Yr): Bst Bp,p,

donde r, es el valor particular de r para el cual se est haciendo Ia estimacin. El estimador es

0p: bo I b1rp,

por tanto, las fuentes de error para estimar E(f) son b6 y b1 .

La varianza es

ol: o'(; - -ffi)


-2 -r(I,
("rr-;r2\

La varianza estimada correspondiente a f emplea s2 en lugar de o2 en la expresin anterior.

Lin intervalo de confianza aL100(1 - a)7o para la estimacin, E(Yr), en el punto x, es

| (rp-r)2.-
(t t.;2, - 2)s
;-E::!r+t^2(n-2)s

10.6.2. Intervalo de confianza para Ia prediccin, y, cuando X : Xp

ln el caso de la prediccin el objetivo es calcular

Ap: l3ol l31ry,l p,


31-6 Captulo 70. Regresin Lineal Simple

el valor pronosticado cuando ro es el valor particular de r. EI estimador es

0p:bo!b:rp,

pero las fuentes del error de prediccin son bo, b1 y t).

La varianza es

oL-st:o'(t+1+Q--u)'\
\' "' sc,, )
y en su estimacin se emplea s2 en lugar de o2 en la expresin anterior.

EI intervalo de confianza de nivel 100(1 - a)Tc para Ia prediccin) Ap) es:

Ejemplo (Continuacin). Para los datos del consumo de combustible de los carros, obtener Ic=
intervalos de estimacin y de prediccin para un carro cuyo peso es 1000 kg.

Solucin: Como se indic los valores estimado v pronosticado son los mismos:

ip : bo * b1r, : -7.9477 + 0.0134 x 1000 : 71.45.

La varianza o?v es

)
: 3161(++ (1000 -
1 115 830.9
996.1)2
: 0.316.

"v la varianza o?
\u-a^.
es
)

o'(t+;.ffi)
"/ r (r^-T)2\

(t+ (1ooo - ee6'l )2\


z.rct
\ 1o-
-1
1r1b830.e ):t'n"'
EI intervalo de estimacin correspondiente es

-\/ : (tt.+s- 2.306v6]16;r1.45+ 2.306/0i16)


te
: (10.lb;12.75).

El intervalo de prediccin es

Ie (rr.+s - 2s06\E.4TT ; 11.45 + z.zoe/z.+n)


(7.15; 15.75).

Comoseve,elintervalodeprediccinesmsanchoqtreeldeestinracin.<
70.7. Formulacin rnatricial de Ia regresin lineal 3t7

Se deber tener Ia precaucin de no usar el modelo obtenido para estimar el valor medio de g o
predecir un valor particular de g, con valores de r que se encuentren fuera del rango de la variable
independiente que sirvi para su elaboracin.

E1 modelo podra ajustarse perfectamentea los datos recogidos para hallar la ecuacin, pero nada
garantiza que el mismo comportamiento se consiga fuera de tales lmites, pudiendo darse un ajuste
bastante malo. (Figura 10.5.)

-v Recta de t')Error de
minimos -
- \-
',-Jnrediccin
\
Relacin verdadera
entre y y x
x
Lmites de

Figura 10.5: Uso errado de un modelo para realizar predicciones fuera del rango de definicin de r.

7O.7. Formulacin matricial de la regresin lineal


Si se tiene n observaciones de las variables independiente y dependiente: (r1;at), (rz;Uz), ..., (*n;yn)
.' la ecuacin lineal que las relaciona es

a:0olPple.

=ntonces, se tienen las siguientes igualdades:

at : B0 + Bp1+ e1,
az : BslBP2*e2, (10.7)

:-:
An : 0o-1 0p,, le,.

x- p: (i: )

Y es un vector n x I de las observaciones.

X es Lrna rnatrizn x 2 de los valores de Ia variable independiente, cuya primera columna tiene la
particularidad que todos sus componentes son iguales a 1.

es un vector 2 xI de los parmetros de Ia ecuacin.


318 Captulo 70. Regresin Lineal Simple

e es un vector n x 1 de los errores aleatorios.

EI sistema de ecuaciones (10.7) es equivalente a la igualdad

Y:Xte.

Y si se nota como b al vector de los estimadores de Ios parmetros de regresin


/L
0o \

u:f ),
\01 /

se tiene el sistema de estimacin de los parmetros 9: Xb.


EI vector de errores es igual a e : Y- Xb.
Con ello se tienel

ete : (y-Xb)(y-Xb)
YY-2bxY+bxxb.

Derivando esta ltima igualdad respecto a b, e igualando el resultado a cero

\et e
:-2xtY+2xxb:o'
ab
cuyo resultado es el sistema de ecuaciones

xxb: XY. (10.:

Las matrices XX y XY son:


/n/tt\

XrX:l
l"D,,ll)ao\ y y:l I
n n h-
t'n D"?
I\ t:l i:t t\ :lt,,a,
Si la matriz XX es inversible, se llega a la ecuacin de estimacin de los parmetros

b: (xx)-1xY,

La matriz (XX)-1 es

(XX;_l :
n / n \2
"l)*?-(D",)
i:r \=l /

Con sto, Ios valores ajustados Y se obtienen evaluando

9: Xb.
tEn 1o que sigue se emplear la notacin A para indicar 1a matriz o vector transpuesto de A
70.7. Forrnulacin tnatricial de la regresin lineal 319

;. la ecuacin de prediccin de un valor gp correspondiente a un rralor zo dado es

Up -- xlrb,

Con los consnnro de combustible de varios carros) plantear la


gresin contrar Ia ecuacin de regresin.

entes m

p-(;:) ,:(1)
)
, : / 1
x/x I t\ / to 9961
(tin 1187 1650 ) -\ I

ooor 11037983 )

I / l
rxlxl-I : 11 15830e (
1 037 983
-9961

--,--
x'Y: / t I 1\ ( ttt
(to 1187 rc50 ) \ 128 461 )

As,

b: qxtx-1xty
: _t
1 / 11037983 -9961 714 -1.906 \
11 158 309 \ -9961 10 )( L2B 467 ):( o.o34 )
Por ianto, ia ecuacin de regresin' ." g - -1 906+0 0134 r.

LO.7.l. Matriz de covarianza entre bo y br

Recordemos que
TL

n2 \- -2
o2 'i-1
Var(b1) : TL , Var(b) : ,)L

D@, - nl(n - r)2


i.-1 ")2 rl

2La diferencia en el valor del trmino independiente entle 1as formuiaciones algebraica y matricial, se debe al nrero
.le decimalesutilizados en el clculo de la formulacin algebrarca,
32O Captulo 70. Regresin Lineal Sirnple

Adems, la covarianza entre b6 y b1 es

: lr'r), br] - -ro'


-D
Cov(bs, br) Covl(! - IL

D@
l.:l
- ")2

Entonces. Ia matriz de varianza-covarianza del vector b es

"2Dr? L- T
-o
-no"
TL

: ( .J,1,1,j..1,, .i.",,0,1', :
't t,

L\r - r)'
n
r?
\ 14 e\2
-'O
var(b, i:1
-
,i-7
) _o
-ro'
t
o-
t7 rL

D@
i.-1.
-r)2 D@
i:I
-r)2

Si sacamos fuera de la matriz el factor o2, resulta que

Var(b) : o'(X'X)-t

La varianza a2 se estima rnediante


2 }\-_btX\.
i:
-2

tO.7.2. Forrnulacin matricial del anlisis de la varianza

Con el empleo de la formulacin rnatricial dc los componentes de la regresin se puede poner las sumas
de los cuadrados como

SCE: YY-brxY,
/ n \2
lrv,)
t" /
scR b1x/Y - n
,

/ ,,\2
(Iu')
\r -l
SCoo : YtY - '/
'rL

As. el coeficicnte de determinacin, en formulacin matricial, es igual a

,
T-
sCro

Tarrrbin, se puede reconstruir Ia tabla de anlisis de la va,rianza en su forma matricial:


7O.8. a)ansforrnacin de modelos no-Iineales a lineales 32t

Anlisis de la Varianza

libertad (g.1.) medio (ll[C


scR:bf xY -
1
; ( r,)
n-2 SCE:YfY-bXY
IL
Total corregido SCao :"'t - * La
Ejemplo Con los da truir la tabla de anlisis
de la vari

Soluc'n: no de los t

: ((t -l I,

YY : (s

Drn :
;_1
r14.

Entonces,

SCR : bx l4gg.n - !10 Q1q2: 199.11,


SCE : YY 4ggjr:2529,
SCro : YrY z+ - fi@al 2 :224.4.

Ccrr tc.lo lo anterior, se tiene la. t

Tabla de anlisis de la varianza


Fuente de Grados de Suma de Cuadrado
variacin libertad (g.i.) F
cuadrados (SC) nedio (I4C)
Regresin 1 199.11 199.11 62.99
Error 8 25.29 3.16
Total corregido I 224.40

Obviamente, la tabla coincide con Ia elaborada rnediante la formulacin algebraica.

10.8. Transformacin de modelos no-lineales a lineales

En rnuchas ocasiones los modelos no lineales pueden ser tratados corno lineales si se efectan algunas
trattsformaciones a las variables, ya sea a la predictora, a la respuesta o a ambas.
322 Captulo 70. Regresin Lineal Sirnple

A.1 ernplear tales transformaciones se deber tener la precaucin de verificar que el modelo modificad
cr"rnple con la hiptesis sobre Ia distribucin que siguen los errores.

1. Modelo exponencial (Figura 10.6.)

Figtrra 10.6: \'Iocielo erponerrcial g :


"i3g+0'tr+e

EI m.odelo es
'g - gSoI0tt:+e '

Tomarido logaritmos cn ambos rrrielrbros,

Ini/:3oilttIe.
Si poncmos z : In;r7 qucda z : Aoi 0fl * e. cre es utt rnodelo lineal simple, que se estirna
?: bo * hr,
2. Modelo recproco o inverso (Figur-a 10.7.)

Figr.rra 10.7: \'Iodclo recproco 17 :


Ac) -l pp -l e

El modelo recproco o iriverso es


1
U D)-.
Jg-f l)1:t f t

Tonando los inversos en ambos micmbros.


1
l)
JO -ft uQ I.r... t t c-
v

1
Poniendo Ia ltima igualdad qr-rcda corno
a
-.)'1..-r-
':90iLll.t.

qlre es un modelo lineal usual.


70.8. hansforrnacin de rnodelos no-Iineales a lineales 323

3, Modelo multiplicativo o potencial (Figura 10.8.)

Figura 10.8: Modelo multiplicativo y : er,\.

El rrodelo multiplicativo, tambin conocido como potencial, es

Y : o,r\'

Tomando logaritmos en ambos miembros de la igualdad:

InY:lna*)lnr*lns'
Haciendo z :lna, : ln r, 0o :lno y 0t : \, el modelo se escribe como

z:Jo_3rt+t.
que se estima por ei modelo lineal 2: bo I b.
Otros modelos no iineales comunmente utilizados son Ios siguientes:

4. Logartmico. a: a* 01nr, en el que se utiliza Ia transformacin : lnr.


D. Compuesto. A: aB", qre se linealiza mediante Ing: lna*lnBr.

o. Curva S. y - a-lg/t, que se transforma en lng : a, I pt, con t: !.


T

Se recomienda que el lector realice las operaciones necesarias para linealizar estos modelos.
Ejemplo. En el desarrollo de un algoritmo de computacin, para ser usado con una gran cantidad de
-rformacin, se desea conocer Ia relacin que existe entre el nmero de datos y el tiempo que emplea
',na computadora en entregar resultados. Para cada una de las distintas cantidades de datos, se
;icieron 10 mediciones del tiempo empleado y Iuego se calcul el tiempo promedio, segn se resumen
-l Ia tabla:

No. de datos (millones) 1.0 1.5 20 25 3.0 3.5 4.0 5.0 t 10


Tiempo promedio (""S.) 0.8 2.r 3.0 4.4 6.8 9.7 i3.6 22.3 40.3 72.4

ijustar los datos a un modelo multiplicativo.

icl,-tc'in: El modelo propuesto es de la forma A : c,r\.. Para transformarlo en uno lineal se deber
-- mar logarit mos:

InY: lna * )lnr * lne'

i- suponemos que se cumplen las hiptesis bsicas, que permiten tener un modelo de regresin lineal
.-.rple, entonces se tiene la siguiente ecuacin de prediccin lnf : lna * blnr.
324 Captulo 70. Regresin LineaI Simple

Por tanto, se deber reaTzar una regresin lineal de 1ny respecto a lnr.
Tomando logaritmos en las dos variables:

lnr 0.0000 0.4055 0.6931 0.9163 1.0986 1.2528 1.3863 1.6094 2.0749 2.3026
lna 0.223r 0.4719 1.0986 r.48 16 1.9169 2.2727 2.6101 3.1046 3.6964 4.2822

Efectuando la regresin lineal propuesta resulta la ecuacin

Ini : -i'866 * 1'956 in r'

A continuacin, si tomamos antilogaritmos en la igualdad obtenida, da como resultado:


-1"0 e 1,866+1 956ln z
: e I 866e1 956In
'u: 0.829 21
e56.

Adems, se obtiene un coeficiente de determinacin muy alto, del 99 Y,t, para la ecuacin transformada.

A partir de la ecuacin se podra proponer que e1 tiempo de ejecucin de1 algoritmo es proporcional
al cuadrado del nmero de datos: A:0.8312. Para verificarlo es necesario realizar las pruebas de
hiptesis sobre los parmetros. Esta tarea se deja a1 lector.

10.9. Ejercicios
Modelos lineales

1. Se desea estudiar la relacin entre la intensidad de regado (r) y 1a productividud (y) de un


cierto cultivo. Se obtuvieron los siguientes resultados:
trL I 10 13 l5 18 13
At 36 44 4B 63 70 45

Ajuste un modelo lineal simple y calcule el coeficiente de correlacin lineal entre las variables.
2. Se realizun experimento pa,ra medir la velocidad del sonido en el aire a diferentes temperaturas.
Los resultados obtenidos se indican en la siguiente tabla:

Tcmperatura cn 'C (r) 1.)


1L) 0 I 20 .).f 50
Velocidad en m/s (y) 2qo tDt tr-
.)J 346 tro
r)r)tJ / L 365

a) Estime la funcin de regresin lineal de g sobre r. Interprtelos;


b) Calcule e1 coeficiente de correLacin lineal entre las variables;
c) Pruebe si fr : 6'
d) Encuentre los intervalos de estimacin y de prediccin cuando J.a temperatura es 15'C.
a
Para detelminar Ia relacirr entre el nrmero cle vendedores y 1as ventas anuaies (en rniles de
dlares) que tiene una empresa, se obtuvieron los siguientes datos:

Ventas 20 27 33 47

Se postul que los datos se ajustan a un modelo 1inea1 simple.


70.9. Ejercicios 325

a) Determine las estimaciones de los parmetros 0oy 0t y escriba el modelo de regresin;


b) Grafique los puntos y la recta de ajuste;
c) Construya la tabla de anlisis de la varianza y pruebe si Bt : g'

d) Se ajustan bien los datos a la recta?

En un estudio para describir la relacin entre la exposicin al ruido y la hipertensin se realizaron


ias siguientes mediciones:

a) Realice r"rn grfico de los datos y diga si es recorrrendable ajustarlos a un modelo lineal
simple;
b) Halle la ecuacin de regresin simple que ajusta los datos;
c) Realice un anlisis de varianza y pruebe la significacin del ajuste;
d) Halle el coeficiente de determinacin del modelo. Interprete su valor.
e) Hay alguna manera de simplificar el modelo?
En una investigacin de las propiedades de un pegamento de secado rpido se midi el tiernpo
que se demora en cristalizarse en funcin de la cantidad de pega depositada sobre uria superficie
de material cermico de prueba.
Cantidad (g)
Tiempo (seg) 26.2 27.9 29.4 30.5 31.0 34.3

a) Ajuste los datos a un modelo lineal simple;


b) Realice un anlisis de varianza y pruebe la significacin del ajuste;
c) Construya los intervalos de confianza para los parmetros de regresin.
En una agencia bancaria se registr el nrmero de depsitos realizados y el monto total de estas
transacciones. en una hora de trabajo, con 1os siguientes resultados.

Monto total (en cientos de dlares) 10 5 7 l9 11 8


Nmero de depsitos 1t) I ,-) 25 7 AD
l,)

a) Realice Ia formulacin matricial del problema y ajr-rste los datos a un modelo lineal. Inter-
prete ios coeficrentes;
b) Calcule s y obtenga un intervalo de confianza, al 95 %, para los coeficientes de regresin;
c) Evale 12 e interprete su valor. Pruebe si p : g'
d) Realice una prediccin para cuando el nrmero de depsitos es 12;
e) Obtenga la tabla ANOVA y realice la prueba F' correspondiente.
En el mercado inmobiliario se realza el. avalo de una propiedad para luego efectuar su venta,
la diferencia constituye la ganancia del vendedor. En la tabla se dan los valores (en rniles de
dlares) de avalo y precio de venta de doce propiedades en Quito.

Avalo Venta Avalo Venta


46.5 59.0 67.4 108.0
43.5 56.5 70.7 95.0
52.2 65.2 74.0 84.0
62.5 74.0 57.4 106.0
85.7 109.0 103.8 154.0
326 Captulo 70. Regresin Lineal Sirnp.le

a) Grafique las variabics en un diagrania de dispersin;


b) Realice Ia formulacin rnatricial del problerna y encuentre los estimadores de los parrnetros
del modelo;
c) Aporta el valor de avalo informacin para conocer el precio de venta y?;
d) Calcule 12. Amerit:r realizar una prueba de hiptesis para probar si p: [?'
e) Obterrga tur interr.alo dc confianza de 95 % par:a el precio rnedio de una propiedad con un
avalo de 72 mil clcilares. Interprete el intervalo;
f) Encuentre un intervalo de confi.anza al 95 % para el precio de venta de una propiedad
arraluada en 65 mil dlares. Interprete el intervalo.

8. El nna entidad finarrciera se desea tenel nn mtodo que permita realizar pronsticos de las
ganancias obtenidas en base a inforrrracin cre pueda estar disponible de ulanera rpicla. trl
gerente de crdito plantea uu modelo qr-re relaciorra el lrrnero de prstamos realizados en Lln lres
v la ganancia obtcnida en el misrno perocio. Prr trl efecto recoge la siguiente informacin de
los 8 rltimos meses:

No. prstanos L25 131 r42 127 140 121 136 133
Ganancia 44 54 77 35 BO 47 66 ti5

Los valores de las ganancias estn en cientos de dlares.

a) Encuentle la ecnacicln de reglesiu linerl sirnplc que relaciona'el nrmero de prstamos y la


ganancia;
b) Es saiisfactorio el urodelo obteniclo'l Por cr'/;
c) Realice un anlisis de la varianza;
d) Haga una prediccin para un nles en el clue se otorgaron 123 prstamos y constrrlya un
intervalo aI95% para tal prediccin;
e) Cree que podra mejorarse el ntoclcio propuesto? 7,Cmo?

9. La siguiente tabla muestra la captr-rra de anchoas (captnra, en millones cle toneladas mtricas)
v el precio de la harina de pescado (precio, en dlares por tonelada) para los rltimos 10 aos:

Ao 1 2 ,) 4 i_) 7 8 9 10
Precic 190 160 134 129 172 239 542 245 454 410
Captura (.,1 E,53 982 10.26 8.96 4.45 1.78 D'
t).r) 08 05

Construlra ios rnodelos lineales que lelacionen las variables (" - y) e interprete los coeficientes:
a) Precio 1' ao;
b) Captura y ario;
c) Precio y captura;
Con el modelo que tenga 1a mxima correlacin:
d) Realice la tabla ANfOVA e interprtcla;
e) Construya los interr.aios de confiallza para los coeficientes de regresin;
f) Realice la estimrcin de y cnrndo r: 5.5.
70.9. Ejercicios 327

_1. Los siguientes datos corresponden al ritmo cardiaco en reposo (Y) v el peso (X, en kg) de 6
personas.

90 62
86 45
67 40
89 55
81 64
75 53
Dr: 488, Dg:319'
Dr? : 40092, Drnan : 26784, Dy? :17 399.

a) Grafique los datos y examine si parece que hay una relacin lineal entre las dos variables;
b) Calcule los estimadores de los parmetros de regresin;
c) Obtenga la estimacin por intervalo de Ia media cuando r : 88, al nivel 95 %;
d) Obtenga el intervalo de prediccin de Ia media cuando z : 88, al nivel g5 %;
e) Calcule los coeficientes de determinacin y de correlacin entre las dos variables.

En un laboratorio de prueba de automviles se mide la distancia de frenado en relacin ctrn la


velocidad que lleva el auto, dando los siguientes resultados de 20 observa,ciones.
n
:
rL

7: 50, D@n -z)2 : 1600, D@n -r)(y - e) 800,


i:7
a :30, rL

D(ao - 2 :832.
i:7

a) Calcule Ia ecuacin de ajuste para el modelo de regresin lineal simple;


b) Realice una tabla de anlisis de la varianza;
c) Determine los intervalos de confianza de la estirnacin y de la prediccin al 95%o, para el
valor de Ia distancia de frenado, cuando la velocidad es ro : 69.

Se realiz un estudio para determinar el efectc que tiene la temperatura (r) sobre la crntitlad
de gas residual generado (y) un proceso qumico. Se analizaron 12 unidades nrnt:stlales y se
"r.
midieron las siguientes cantidades.

n:12, r:7.5, y:55.7,


72 72 12
Dr? : 42s0, Da? :279360, Droao: -23707.5.
i:l i:r i:7
a) Encuentre la ecuacin de regresin lineal que explica la cantidad de gas por Ia ternperatura
del proceso;
b) Calcule el coefi,ciente de determinacin;
c) Realice un anlisis de varianza. Interprtelo.

Uua teora financiera sostiene que hay uua relacin directa entre el riesgo de una inversil y el
rendimiento que promete. El riesgo de una accin se mide por su valor, Ilamado p. En Ia tabla
se muestran los rendimientos y valores de 12 acciones:

Rendimiento 89 .) 15 ,) / 82 53 05 13 59 68 72
Valor Beta 1.5 1.9 1.0 05 15 18 13 -0.5 05 IB 19 19
328 Captulo 70. Regresin Litteal Simple

Al a.justar un modelo de regr-esin a cstos clrtos. se obtuvo las siguientes salidas:

Predictor Coef. Error Est. toh"


Intercepciiru 0.44 0.r22 3.62
Pendientc 0 L9 0.022 8.56

Fuente de variacin g.l. SC MC F


R cgrcsirt
Residrrrl 0.439
Total 11 3.649

a) Pruebe si los coefi.cientes del ruocleio son siguificativos. Escriba las pruebas .r, liruls c :

sus valores y las regiones de rechazo;


b) Complete la tabla ANOVA e intcrpr'tela;
c) Calcule cl coeficielte de deterniinrciri e irrterprtelo.

14. Suponga qlre se ha ajustado trna lnea r(x'ta a uu conjunto de 9 pare.jas de observaciones, dand,

a- x |l-
lJ - - -r '.L'

Adems, se obtnrrieron las siguientcs clcsr.iaciorres: (r;, - r): -4, -3, -2, -1, 0, I,2,3, 4 5"-
tabla de anlisis de la valianza:

Fuente de variacin g.l. SC IIC F


Rcgtt'sititt
R cs it lrrtl
Totrl 3il0

a) Complete ia tabla AI{OVA;


b) R.ealicc rlna prueba cle adccuacin del modelo.

Modelos no lineales
15 A continuacin sc presentan 7 mediciories dc clos variables

:L 05 10 15 20 25 3.0 3.5
a 06 27 12.2 54.6 244.7 1096.6 4914.8

Encuentre 1a ecuacirr de regresin cluc a.justa los datos, segn un modelo exponencial y calcul.
el coeficiente de determinacin.

16. En la siguiente tabla se encuerrtra el nrnrero de aos para el vencimiento y el rendimiento d=


unos bonos.

Aos para el vencimiento 1 2 5 l0 15 1B 23 25


Rendimiento 0.067 0.072 0.076 0.079 0.081 0.077 0.082 0.07E

a) Ajustc un modelo rnultiplicativo a los datos;

b) Ajrrsle un tnoclelo j :_uu


l,n r
-\t t.
c) ,Cul de los dos modelos cree cs mcjor? Por qu?
70.9. Ejercicios 329

17. Un ingeniero est investigando la relacin eritrc lr veloc:irl'rd clcl r.iento y la cantidad de electridad
generada. Luego de 10 nediciones obtttr.o:

.)
Velocidad del viento ti0 60 /1
61 10.0 97 96 3.1 B2 6.2
Corriente generada l.58 t82 1.06 1.93 2.24 2.39 2.29 0.56 2.17 1.87

a) Ajuste los datos a un modclo de tipo lt -lr: +';r (.


/r t-t

b) Calcule e interprete el coeficiente de deter-miuacin del modelo transformado.

18. El gerente de una ernpresa desea lelacional la evoluci<iu de Ias ventas y el gasto publicitario,
segrn los datos que aparecen en el cuadro:

o.)
Ventas (9) L(l 15 18 .a 25
Gasto (z) i9 22 4), 72 9B

a) Realice un ajuste de tipo rlultiplicativo y encuentre la calidad del ajuste;


b) Ajuste los datos mediante urra funcirr lirreal sinrle y compare con el ajuste anterior;
c) Cul de los dos modelos es mejor? Expliquc.

19 Considrese los datos que se presentan a corrtiuurc:il

f I T4 77 i1 8 10 5 7

v 0.34 0.26 0.18 0.30 0.40 0.27 0.48 0.42

a) Grafique los datos;

b) Suponga que las variables r, yy se vinculan mediante la relacin y : En-


Ps 1- {3rr + e
cuentre los coeficientes de regresin.
c) El modelo es adecuado para los datos'/ Por: c1u'/

20 A continuacin se presenta la evoluciri anual clcl srlario mnirno vital en nn pas con alto ndice
de inflacin.

Ao 1 2 J 4 5 6 7 B I l0 11 I2
S.M.V. 66 95 720 r20 I45 190 220 320 320 400 600 600

a) Grafique los datos;


b) Ajuste los datos mediante un modelo cxponencial;
c) Qu se puede ciecir de la calidad de a.jrrstc de 1os datos a la cnrva de regresin?;
d) Realice una estimacin del valor del S.N'f .V. en julio de 1994;
e) Si el S.M.V. en el ao 13 ascendi a 900, .es bueua la predicciu r-ealizada'? Explique.

21. En astronoma se denomina ao sideral al niulero de arios tcrrestrcs qlre un plancta se demora
en completar nna revolucin alrededor del Sol y rlepencle de la distancia entre Ios dos astros.
En ia tabia se muestra la distancia promeclio ;' el arlo sideral para los planetas del Sistema
Solar. Emplear los datos para detelninal nrr modelo de legr-esin que relacione las dos variables,
330 Captulo 70. Regresin Lineal Sirnple

tomando com.o variable dependiente al rrio sideral. (Pala lealizar la transformacin adecuadr
refirase a la tercera ley de Kepler).

Duracin del ao sideral


Praneta
r,.t*fililli"Tl", (7: aos terrestres)
Mercurio 58 0.24r
Venus 108 0.615
Tierra 150 1.000
Marte 228 1.880
Jpiter 778 11.862
Saturno 7428 29.458
Urano 2877 84.018
Neptuno 4500 764.780
Plutn 5913 248.400

22. Los siguientes datos corresponden al precio de venta (en cientos de dlares) de un modelo de
automvil, segn los aos de uso

Aos de uso 0 1 2 J 4 5 6
Precio r0.2 B3 69 5.5 4.0 3.5 3.3

Ajuste a los datos un modelo recproco y calcule el coeficiente de deterrninacin.

23 IJna empresa de telefona celular ha registrado la siguiente evolucin en el nmero de abonados


a su servicio en sus primeros 8 aos de operacin:

Ao Abonados
1 32 000
2 37 500
3 41 000
4 58 000
5 107 000
6 138 000
7 175 000
8 321 500

a) Grafique los datos;


b) Se plante que el modelo lineal simple. Realice Ia estimacin de los coeficientes;
c) Qu se puede decir de la calidad de ajuste de los datos?,
d) Efectue las pruebas de hiptesis sobre los coeficientes del rnodelo. Si es posible excluir
alguno de ellos, cmo quedara el nodelo finai?;
e) Los datos sugieren una relacin del tipo exponencial, Realice un ajuste de los datos al
modelo propuesto;
f) Encuentre el coeficiente de determinacin y comprelo con el del rnodelo anterior. Cul
es mejor? Por qu?
Captulo 11

Regresin Mltiple

The Ballade of Multiple Regression


lf you want to deal best with your questions,
Use rnulti-regression technicres;
A computer can do in a minute
What, otherwise done, would take weeks.
For'predictor selection' procedures
Will pick just ones best for you
And provide the best-fitting equation
For the data you've fitted it to.
Tom Corlett, 1963

En el captulo anterior estudiamos el caso en el cual la variable de respuesta g depende de una sola
i-ariable predictora z, estableciendo el modelo de regresin lineal simple. Pero, podra suceder que
este modelo sea insuficiente y que sea necesario incorporar nlle\as variables explicativas del fenmeno
rnvestigado.

-\nalicemos el siguiente caso: el gerente de una empresa desea incrementar las ventas, para lo cual
lecide realizar gastos en publicidad y medir la variacin ell slrs ventas, Inicialmente, decide poner
rublicidad en televisin, pero posteriormente decidc tambin ponerla en la radio y los peridicos.

En la primera etapa la variable de respuesta, qlle es el incremento en las ventas, depende de una
.ola variable predictora (los gastos en televisin) y para realizar un anlisis es suficiente ernplear un
:lodelo de regresin lineal simple. Mas en la segunda etapa, la variable de respuesta depende de
--arias variables predictoras (los gastos en televisin, radio y prensa), consecuentemente para realizar
'rn anlisis ya no es suficiente la regresin lineal simpl.e.

Fu general, aunque hay rnuchos problemas prcticos clue ataen a variables predictoras rnicas, es
--tucho ms frecuente que la variable respuesta dependa de un conjunto de variables predictoras o de
:ausfolrnaciones de las mismas. De la estimacin de tales modelos y de su calidad de ajuste nos
cnparemos en el presente captulo.

331
332 Captulo 77. Regr"esin Mltiple

11.1. Modelo de regresin mItiple


Definicin (de modelo de regresin lineal rnItiple) El urodelo dc regresin cre liga a una
valiable dependiente y con k variablcs indeperrrlientes urecliante la ecuacin

g:[Jo*,1111 li'Jttt +"'+i'ir'*e (11.i)

se llama modelo de regresin lineal nrltiple corr A; variables reglesoras.

Los parmetros 3, j :0,1,..., k se denominau ctleficit:trtcs de regr-esil'

Al igual qlre en cl caso de una sola varirblc. se cor.sidera qr-le cl crror s tiene esperanza igual a cero v
rrarianza a2 y qne los errores ei) col-respondientcrs a cacli obserr'tcin. son no correlacionados.

Un modelo plausible para el ejentplo exatlinaclo cs

lJ : do -F,6111 -l /zt:z | $3t:;11 e.

clonde y denota el incremento en las ventas. u1 los gastos en tclevisin) 12 los gastos crr radio y z
Ios gastos en prensa. Los coefi,cientes p6, 0t, A' 1'.83 son parnctros que defineu cL moclelo, eLlos son
desconocidos y el problema inicial es detcrminat estos croeficicntcs'

La ccuacin (11.1), geomtricanrente lepresenta un hipcrplano cn un cspacio de k dirnensiortes. El


c:oeficicnte lj 0 : 0, 1, . . . , k) evidencia la r.arircirin rrnitaria dc la respttesta y cuando vi , v las
restantes variables permanecen constantes.

Nlediante la tcnica de regresin Lineal mrltiple sc puccle rnalizar uua serie de modelos particulares
como el polinonial de ttna'r'ariable

o de dos o ms variables: por cjcrnplo. cl dc scgrrnclo grnclo con clos r.ariables

1t : 0o t \pt I \zt, + lSzrll + i+r3* B5rp2 I e.

Otros nodelos nis complejos pr-reden rcclucilse a rrn rrroclelo clc regresin linerl mrltiple necliaute
cambios de variable adecuados.

1L.2. Estimacin de los parrnetros


Al igr-ral que en el mtodo de regresin lincal simple, para ler estinracin de los parmetros se aplica el
mtodo de mnimos cuadrados.

Snponga que disponemos de n ) k obscr'\'aciones. 1' si se cletrota como r al valor de la i-sima


obser-r'acin de la variable rj, como se obsclva cll la siguiente tabla:

9 t:t :2 2rA

'!jt r rr :L 12 u 1A

A2 r2t- :t:22 r2k

;,, 't'n t 't t,2


77.2. Estimacin de los parntetros 333

Si f es la prediccin de y, la ecuacin de regrcsirr <rcclrr c:orncr

i: bo * b1r7 I b2:rl2 i' " * bt:.. (11.2)

donde bo , br , , . . , b* son tales que la sttrna cle los cuach-rclos cle lrs difcrerrcias entre los valores observados
cle la r,ariable respuesta y su estirlacil por la ecuaciu cle r-cgresirr sea mnima.

Esclibarnos la igualdad (11.2) para cada urra de las clbsen'ac:iorrcs:

: bsIblr !1ry:t:121... lbr.


0z : bo i btt:zt I b'2:r22 l "' *lL.:t:2-

,,,: bo+br",,r Ib2r',,.2+' '+ bk'r,,,k',

o en forma abreviada
c

i: bo +\brti,, i,:l.).....n.
j:t

Se minimizar la surna de los cuadrados de los errores

scE :irr, - i)2


i:I
:i 1,,
- (-. ,,',,)]'
Derivarrdo SCE con respecto a cada b, e igual.auclo el resultado a cjero se obtienen las ecuaciones
tt k:
a(scE) :
0bo -z\(ui- bo -I brr;;r) o,
i-t i-l
rA
o(scE)
0bt -2Drs(y- bo - lbiri) : 0,
i:l t-I

li
a6c E) \-i..-.\-n
0b* -2D:,ik,(u,i. -00-
-A^ ) ojxij):v.
i-l j-1

Ltrego de simplificar las igualdades, se obtiene \as ecu,a,ci,oncs norma,l,es de rnnimos cuadrados:

nbo*r rttbzi,r,rr+"'+ ooir,r : ir,


i:l ri:1 'i-).
17 tL TL

boDr,, - f
bt-.J rl,r + b2f
'/-J
t,rr',, - . .' * bu I ).ir:xik : D',rro
i:1 i- 1

TL 1' 1L TL

uoi,nr a ot f rkLta ar I rit t-i2+ "' + b*D,r?r D*orro'


i:I i-I i:\ i-1

Entonces, se dispone de uu sistema de k * 1 ecuaciones normales quc invoh-rcran a los coeficientes des-
conocidos. Su solucin permite conocel los estimaclorcs cle los parrnetlos del modelo lineal mrltiple.
alrnque debe observarse que tal tarea. en general, suele sel rrruy laboliosa.
334 Captulo 77. Regresin Mltiple

Formulacin matricial

De manera similar a Ia realizada cn el moclelo lineal sinrple, el linea,l mrltiple es factible ponerlo en
forma matricial. Por la cantidad de variables irn'olucradas csta formulacin es ms fcil de manipulal
que la forma algebraica. El proceso es idrttico a1 explicado en el captulo anterior; sin embargo, lo
repetiremos de manera simplificada.

Si se ponen las matrices


1 rtr rI2
,' ,':,
Y-
I rnt Tn2

se obtiene Ia ecuacin rnatricial del modelo

Y:X0+e.
Los miembros de esta ecuacin se forman de 1a, siguiente lranera:

Y es un vector n, x 1 de las observaciones.

X es una matriz rtx (k+1) de los rralores cle la varirble inclcpendientc, cuya primera colunna tiene
la particularidad de que todos sus componerrtes son igr-r:rles a 1.
p es un vector (k + 1) x 1 de los parmetros cle la ecuacin.

e es un vector n x I de los errores aleatorios.

b es el vector de los estimadores de los parr

el sistema de estimacin de los parmetros cs Y : Xb.


El'r,ector d,e errores es igual a 6 : Y -?: Y- Xb.
Por lo tanto,

SCE t : (y - Xb) (y - Xb)


YY - 2bxY+b'x'xb.

Derivando ,9CE respecto a b, e igualando el resultado a ccro da

xxb -XY ( 1 1.3)


77,2. Estintacin de Jos parntetros 335

Esta explesin es la forrna rnatricial cle las ccurtcioncs lolrlalcs clc regresin antcs deducidas.

Si la rnatriz XX es invcrsiblc se obticne cl estirnidor b c:omo Ia solrrcin del sistcrna (11.3):

b: (xx) lxrY (11.4)

Desan olleuros la ecuacirr (11.3):


rL tt 1L 17

tt D Drn T -..
1' ''tk \- u'
i:1. "t i-l i1
i-I
r r rL 11 rL

D r, \- -2
/r *iI D,or,o, )- J;r.1.;. D rrun
:1 i-I i-I i:1 i:T

rL r rL 1I TL
')
D rn^ D rnnro, D rnrz 5- z;r.u,
i.:1 _1 ; i-1 i.:1 i:r
Observemos la estructura especial de ta natrices X'Y y XX; sta riitima es simtrica de orden k * 1.

Ejernplo. Una compaa, con objeto de progranrar la produccin para e1 resto del ao, necesita un
plonstico de las ventas totales. En sus registros ticne las r.crrtas realizadas (en miles de dlares) v
los gastos en publicidad e insumos para sus productos en los irltirnos 10 meses como se muestra en la
sigr-riente tabla.

Ventas Publicidad Insumos Ventas Publicidad Insurnos


333 55 96 348 67 b
310 59 84 )qn /t) 78
311 69 74 _alo 59 bt)
290 65 66 t11
r)-11 77 67
342 71 91 298 64 nt
I t)

Encontrar la ecuacin de regresin que relacione las vcntas con los gastos en publicidad y en insunos.

Soluc'in: Nombremos la variable ventas cono y) los ga^stos en publicidad como ,r1 y los gastos en
insumos como 12. El modelo de regresin es
I,.
y,,-A tJO- u1r r J,.- .
- I -r u).t 2 c.

La matriz X y el vector Y son

15596 tt.)
J J.)

15984 310
16974 311
16566 290

X- I7191 Y- 342
I67E6 348
77678 .)
-a
-I

15966 275
77767 311
I 64 7l,t 298

l.Xes
111 11 1 111
59 69 65 71 67 76 59 77 64,
84 74 66 91 86 78 66 67 75 )
336 Captulo 77. Regresin MItipIe

La matriz XX resulta:
662 783
XX: 44304 51 636
51 636 62 335 )
Su inversa (XX-t
".
27.07764 -0.18441 -0.11200
(x'x)-' :( -0 18441 0.002266 0.000438
-0.11200 0.000438 0.001059

Y el clculo de XY da
/ zr4s \
XiY : f zog oog I
\ zas 055 )
Finalmente, multiplicando los dos ltimos resultados llegamos aquebes

1x''':(i:,\ :( 37.30 \
1.717 I
Yu, I 2.088 )
Con todo sto, la ecuacin de regresin es

0 : 37.30 + 7.717 rt * 2.088r2.

Propiedades de b

El estimador de mnimos cuadrados b tiene las siguientes propiedades:

1. Es insesgado para p.
Puesto que E(e) - 0 y (X'X)-1 X,X : I se tiene:

E(b) : El(x'x)-1 x'y] :n[{x'x) 'x'tx+e)]


: L\ / x,xp'- + (xi
n [x'x-' x;
\-- --l
-t
x,rl
-- -l : p.
r'

2. La matriz de covarianza de b viene dada por

Cov(b) : o'(X'X)-t.
La matz Cov(b) es simtrica; adems, el valor de o2 suele ser clesconocido, debiendo ser esti-
mado.

Estimacin de o2

Consideremos ahora Ia suma de los cuadrados de los errores

scE :irr, - io)2 : et,


i:l
77.2. Estintacin clc los palrnrer'os oon
JJ T

que despus de sustituir el valol cle e se llega a

SC E -- YY_bXY.

quc tieue 'n - k - 1 grados de libertad.

As, el cllol cuadr'tico meclio! cllre cs nn estimaclor- irrsesgaclo cIc o2, sc caicula pol
SCE
ItCE:.s2 : n-k'-I'

Ejernplo. (Continuacin) Estin'Lal la r'rrianzr clel errol o2 \, la nratriz de r.aritrtza-


",r.o,'{,rrl
covaliauzr de b.

Sohtcin: Utilizando el vectol cle estitlacin clc los btiene

bxY : ( 37.30 r.7t7 2.08E : 093 566.63

l0
YY : D, r? : 993 957.
'i:l

Pol lo t:tnto, SC E es

SC D : YY-I)/XIY : 993 fI57 - 993 566.63 : ili)0.37.

CorrLo n. - A; - 1 : 10 - 2- 7: 7, cl clrol crrrclr'rrlo lreclio cs

39()'37
.5
2
: llCE - - 55.7666.
I

Lr matriz cle covarianza

-0.18441 -0.11200
clGr : 0 002266 0 000438
0.000438 0.001059

IL.2.L, Coeficientes de regresin estandarizados

Crrando se realiza un mocielo de le-qrcsirr rtrrltirlc, gerrclirlrrrt:utc. las clc ureclicirr u.o sol
rLricli-Lrles
las ruislnas pala la valirblc cleperrclicrrlo l I)ar'1, las i'irri;ilrlr:s irr<lcpurrclit:rics. cle ltrrLrcLt qrrc los coe-
lir:icntcs dc regresin no se prrcclcn colnl)lr'\r dilcc:tun'rcutc. Pi'Lla srrrultl cstr clificultad. sc cnlk:an
Ios coc.fici,cntc,s de reqrcsi.n cstrnt,d,a't i,zrdo.s betr.

il,as rruiclrdes clc lnedic:in clc l"o<lrs 1;ts i'iliablcs sc lLirtsfrrrtnatt cst irrclrr'.
:rlividicnclo cada variablc 1rcl str dcsvi.,tcin cstittdar'.

Pol clcrrrplo, cn la ccrra<:in ck: r'cglcsirirr

i:bo*brl *b.:-..
338 Captulo 71. R.egresin Atltiltiple

se tiene
r-
5tt
:le,\1 - (u,-),,
,q.' -
('r-=),,
t,/,/
5,7
1 / \ 'sr.z

Los coeficientcs
.{ ..

beta - Itt:'-!
sll

sou los coeficientes de regrcsin parcral estinclar v srr intcr'prctrci<in es liL siguieutc: si hay uni r,uircirr
de ltna desviacin estinclat en ui) habr una clesr.ircin cle beta; dcsviaciones estndar en y.

Ejemplo. (Continuacin) Encontrar los cocficientes clc reglesin cstandarizaclos de los clatos clel
ejerlplo.

Sol'ucin: Se tiene que


o :37.30, b1 :1.717. r2 :2.088.

Las desrriaciorres estnc1ar clc las variables son

s, : 23.22. sr, : 7.30, s,"z : 10.68,

Los c:ocficierrtes belr sor.l:

. s,.
i,r- 7.30
betal l.7l;-_^
')J
_.
;.::
;);)
0.53C3,

beta2
. s,,
b,-:-' - uSs-
^^ - 10.68
5t1 -'l '3.22 0.9604.

11.3. Intervalos de confianza


En la t'egresin nrltiple se pr-teclen folmulrl cstimacioncs pol inlclralo par'\ los valoles de los coefi-
cientes cle leglesiu, para los rtaloles estimaclos y para nLre\as 1r'eclicciones.

11.3.1. Intervalos de confiaraza para {3

Iruesto c|re el vector de coeficientes B es clesconociclo. lo consiclcramos colro nna valiable aleator-ia
rrtrltivrriante, nornalmente clistlibnicla cou meclir b )'nratliz cle covarial"a o2(XtX) 1, por 1o clue
crda uno cle los estaclsticos
tt-j.t
,:0.1.....A;
t r/C.,t

sigrtc ttntr ley con (r1- l; - 1) graclos dc libeltacl r-clonclc C.i, cs cl j-sirno clcrnento clc la cliagonal
cle la uratriz (XX)-1.

Utr inter-r'alo de confianza al 100(1 - a)% para cl cocficientc clc regrcsn B (.i : 0,1,. . ., k), cs

(U, -t^,.(rr - l.; - 1)",/Qr;l,t,I t,,,2Qt- A- I)t,/e;)


Ejemplo. (Continuacin) Elaborar un irrtel'alo cle confirriza rl 95% para los parmetlos B, p1 r'
62, estiruados anteriolrlente.

Solu.c:i,n: El cstimador cle o2 cs s2 : 55.7666 l' /o ou(7) : 2.365; crttotLc:es, sc tieneu los siguierrtcs
intervalos:
77.3. Intervalos de confranza 339

1. Pala p:
(bs - tt(tt - k - 1) s r/Coo-; b1 I t,, ,2Qt, - k - 1) s /C0-;)
^
(ez.ro - 2.36b x T.4T x JlrtTT ,37.30 + 2.36b x 7.47 x ,f2tnn)
(-43.80: 118.40)

Par-a 6i:
(U, - t^r(n, - k- 1) srldrr; b1 I tn12(n - li - l) s\/e)
Q.rv - 2.365 xT,4T x,/0.0022:r,Tr7 + 2.36b x T.4T x /lrtrnl)
(0 888r2.546) .

3. Para P2:
(b2 - t
^
2(rt - k- \
Je 22: b2 + t,, t(r t, - k - t) s t/en)
s
1

(z.oss-2.36b xT.47 x y6l0r;2.088+2.365 x T.,IT x r/otot;


(1.515: 2.647).

71-,3.2. Intervalo de confianza para E(Y)

Si se dcsea conocer el intelvaLo cle colfi,anza meclia cle un punto en palticulal uT1t
iI)
t2t . , ., Lpkt definitnos el I'ectol

xp

La rcspuesta en este punto es

ip: xlpb'

IJstc cstiruaclor es insesgaclo (cs ,i..i', o (%) : x|r1) )' stt rrtt'itttzt cs

u^. (t,) : o2xl,(xLx)-t*r.

Ulr intelrralo cle confianzr cstirrracin, E(\1,), eu el 1;ulto x, es

/^
lir-to'2(tt-A' i,, * tn,('tt - fu - 1) 5\ x,,(XX)-1x,,
\ )

11.3.3. Intervalo de confianza para Ia prediccin, y,,

IJn tnoclelo de reglesin se aplica eu la r-eaiizacin cle ploncisticos collcsponclientes a rrrlor-es particulares
clc las valirb1es incleperrdientes, xn. Lzr respncslr en cste ltuut,o es jr: yt.

te rrrrlo clc con fianza cle ni \e.I 100(1 - a)'7n Pu r la plccli cctot)1 ?/2

( j, - t,,,2(n' -l;-1)s I
xf (XrX t, !lt - l; - l) 'V 1+ xj,(XX)-Ix,,
340 Captulo 77. Regresitt Mltiple

Ejemplo. (Continuacin) Elabolar los inten alos clc confirnzr al 95 % para la r-espuesta rncdia y
para la prediccin, cuando los gastos en publiciclacl son de 72 mil y en insumos 90 l.r- il dlares.

Soluci,n: El punto sobre el cnal deseamos realizar Ia precliccin es

-,: (*
)
La respuesta en el punto considerado es frr, : xf,b : 348.844.

El intervalo de confi.anza para la estimacin lesnlta:


tt-
li, - to2(t- A - t) s/x!(xrX)-'xp,ip - tn,(rt - A - 1, s
(sas.s - 2.865 x T.4T x i/0i81;348.8 + 2.36b x T,4T x r/o.ggt
(337 9r 359 7). -LL

EI intervalo de confianza para la plediccin es

(0, - to2Qt. - k - 1)"\+ *ilxX)-1xp; 0, t to2Qr- l" - 1)s I + xf (XX)-t*o


)
(aaa.s - 2.36b x 7.47 x yT381; 348.8 + 2.365 x T.4T x \,fim)
(32s 0;369.6)

LL.A. Pruebas de hiptesis


Las pruebas de hiptesis en la regresin lineal nrrltiple se emplean de dos ltlaneras: pala detelminar
la significacin de Ia regresin, es decir', si globalmente las variabies aportan informacin al modelo; y,
para realizar pruebas sobre los valores de los coeficientes individuales para exarninar si una variable
particular es significativa cn el modelo y merccc sel incluidr cn lr ecnaciu.

1-L .L. Prueba de hiptesis para la significacin del modelo

La plueba global del modelo se enplea para corrocer si existe rclacin lineal entre Ia variable dcpen-
diente y y eI conjunto de las variables indcpendientes e-1 , L2, ..., lxk.

Pre'u'ianeute, desconpolgamos la suma total de los cuaclrados SCou en dos sllnras, una debicla a IL

regresin, SCR, y otra debida al eLror, SCE:

SCao: SCE + SCR,

donde

SCE: YY-bXY,
,
/11
,)
(D'')
SCR : b,x,Y_'t-L
\i r
/I .
n
_
/ t) \-
)

/S \
I ),Yl
SCoo : YY - \':t ,tL
'/
77.4. Pruebas de lptesis 34L

qtle llos siLrten para realizar de manera or-denada toclos los pisos involllcrados en la prueba de hiptesis,
con el ernpleo de una tabla de arrlisis de la va,lianza.

En el siguietrte cuadro se resunre los elenentos dc rur anlisis cle varianza para nna regresin miritiple:

Tabla de Anlisis de la Varianza


Fuente de Suma de Graclos de Cr,radrado
F
variacin cuadrados libertacl medio
1\IO'H
Regresin SCR t^
LIC R LH. o,s
- AICE
Error o residual SCE 'n-l-I s'2 : LICE
Total 5C,,, n,-)

Entonces, se plantea la siguiente prueba de hiptesis:

1. Hrptes'rs Nula. Ho, l3t :...: l3n:0.


2. Hzpteszs Alternati,ua. Hr l3r, f 0 para al rnenos una A;.

ATCR
3. Estadst'tco de Prteba. LH, obs
- A,ICE.
4. Regin de Rechazo. Se rechaza Hs si For, > L(k,n, - k - I)

El rechazo de Ilo significa qr,Le al meuos una de las variables independientes r, contribuye signiflcati-
vamente al modelo lineal propuesto.

Ejemplo. (Continuacin) Realizar un anlisis de adecuacin del moclelo, a un nivel cr : 0.05.

Sol,u,ci,'n,: Anteriormente habamos calculado dos componentes de las slrmas de cuadrados:

YY : gg3 gbz, bxy : gg3 566.63.

Calculemos el tercero:
/,, \2
(I'')
\ j-1 ,3145)2
' : -ll- : 989102'5'
''
Tanrbin. se calcul que SCE:390.36. Las restantes sllmas de cuadrados so
qr q93 :
""!J!J 957
JQt - JoJ 102.5
989 fW_,U _
4854.5.
SCR : 993 566.63 - 989102.5 : 4464.73.

La tabla de anlisis de la varianza queda as:

Tabla de anlisis de la varianza


Fuente de Suma de Grados de Cuadraclo
F
variacin cuadlados Iibertad nredio
Regresin 4464.73 2 2232.07 40.02
Error o residual 390.37 7 55.76
Total 4E54.50 I
342 Captulo 77. Regresin Mtiltiple

La prueba de hiptcsis de adecuacin del modelo es:

1. IIi,ptesi,s Nula. Ho: {3t : 0z : 0.

2. Hiptesi,s Alternati,ua. Ht: 0t * 0 o 0z # 0.

3. Estadstico de Pru,eba. Fobs: 40.02.

4. ReqindeRechazo. EIvalorFo.os(2,7):4.7+definela,regincrtica Fu,"),4.74.

5. Decistn. Conio 40.02 > 4.74, resulta que se rcchaz\ la liiptesis nula y se conclnye que las
t'elttaSestnrelacionadasconlosgastosenprrblicidaclyerrinstttrros.<

Con esta prueba estadstica nicamente se concluye la validez del rnodelo, en forma global; clla no
indica Ia importancia relativa de cada una de las variables predictoras sobre la variable respuesta.

LL.4.2. Pruebas acerca de los pa-rmetros B individuales


En el modelo pueden estar incluidas variables que son redundantes o que no aportan significativarnente
a la respuesta, eso se puede comprobar realizando una prueba sobre los parmetros individuales de
regresin. Entonces, se tiene la siguiente prueba de hiptesis para un parmetro 13fr,jo.

1 Hiptesis Nula. Hs: Br: g.


2 Hi,ptesi,s Alte'rnatiua. H B I 0.

b
3. Estadstico de Prueba. tobs :
s\/e;'
1. Reginde Rechazo. Serechazalls si tob"1-t,,2(n-A-1) oo6, )tu2Qt -4, -1)

Ejemplo. (Continuacin) Eu el modelo piantc:ido, realizar la pnreba para los parmetlos 6,.
I : 0. 1,2, al nivel deI95%.

Sohc'i,n: Se tienen las siguientes pruebas:

a) Para el coeficiente B6:

1. Hiptesis NuIa. Ho: Br:Q.


2. Hiptesis Alternati,ua. HI t3o 10.
3, tnb":
37 30 :
Prueba. -uu -L
s\rcoo-
Estad"stico d,e 1.088.
7 .47 OL077
4. Regi.n de Rechazo, Cotno to.ozs(7):2.365, la regin es l,,"1 > 2.365.
5. Deczsin. No se techaza fo; por tanto. la constantc podra excluirsc de Ia regresin.

b) Pzrra p1:

1. Hiptesis NuIa. Ho: pr: g.


2. Hi,ptesi,s Altertati,uu HI 0t 10,

3. Pnreba. tobs:
7'717 :
Estadstico d.e
-+
.5vL il
- 7'47\/0n0'n
4.9.
77.5. Coefrcientes de deterntinacin y de correlacin parcial 343

4 Rerttn Rech,azo. lln,,rl > 2.365.


d,e

Ir Deci,si,r. Como 4.9 > 2.365, se lcchaza -I1: entonc:cs, la variable <<gastos en publicidad>>
:rporta informacin al moclclo

c) Para p2:

1. Hiptesr,s !,lLtkt,. Hs: lJr: Q.


2. fIrpte,sis Altc'rrati,ua. H p210.
b.,
:1. Estoistino de Pru,eba. t,(,s = E.593.
ffir:
4. Rcq'in d,e R.eclazo. Lob.sl > 2.365.
5. Deci.sitt, Dado quc 8,593 > 2.365, sc rechaza Ho; por tanto, la variable <gastos en it.L-

sllnlos>> aporta informacin al nodelo.

El rnodelo final podra scr uno en el que no se considere cl trmino independiente: y - |flt I 0zrz.
Se recrouienda al iector que recalcule tal modclo.

11.5. Coeficientes de deterrninacin y de correlacin parcial

EI cocficiente cle detcrninacin se emplea conro rlra mecliclr clc la rdecuacin clel rnodelo, cre infortua
sobre Ia fu.erza de la relacin cxistcnte entre 1as valiablcs indepenclientes y la dependiente.

11.5.1. Coeficientes de deterrninacin mltiple


E1 cocficricnte de detenriirircin mltiple se define como

n2 scR
' Se uo .
scE
b'C rr'

El larrgo de variacicjl cle 1?2 es 0 (


R2 < I. Un rrrlor'LIto de R2, cercano a 1, signifi.ca que el ntodelo
rLclegrcsiu es Jneno y si 112 cs cercano a 0. el a.jr-rste es malo. Si 112:0 clttiere clecir que falta por
crolrpleto el al.jrrstc del moclelo a los datos y si Il2 - 1 se tienc rur a.jr.rste pelfecto.

Puesto cre 112 tiencle a soblcstimar cl valor de la corlelacin entre las variables involucradas, se etlplea
,:l cocficicntc dc determinacin ajustado, -R1., cre cst cliserlrclo pala conpensar el sesgo optimista cle
R2.

E1 coeficiente de detclminacin a.justaclo, se

ot
I1,t:
t>2 ,('t1 /lrl
lt
- -
t,-A; -l
,

EclrLir,'aleuterrrentc, Rl sc crlcula nrecliarrte

SCEI(n A'- 1)
-
n.?,:t- SC,,rf(rt,-l'

-1 rango de variacin de 1l"2 es 0 < ,Rl < 1y su intcr'pretrci<irr cs ia misntr ctc h clcl coeficicutc clc
ietcrnirracin nniltiplc Ii2.
344 Captulo 77. Regresin Mltiple

Ejemplo. (Continuacin) Calcular R2 V RZ para el rnodelo planteado.

Solucin: Se tiene que


n2 scR
It
4464.r3
: 0.9196.
JUua 4854.5

Como el valor de R2 es alto) se concluye que el modelo se adecua a los datos y que el 9I.96% de
la variabilidad en las ventas se explica mediante las variables <<gastos en publicidad>> v <<gastos en
lnsunos>>.

R?": n'-JJJ4;
2(1 - 0.e1e6)
: 0.9196 - r0-2-r : 0.8966.

En canrbio, si interpretarnos ,Rl, podemos decir que la calidad del ajuste es de un 90Vo. Paru mejorar
el rnodelo se podra incluir una tercera variable explicativa y comprobar si ella es o no significativa.

1-t.5.2. Correlacin parcial


El coeficiente de correlacin parcial rnide Ia correlacin entre dos variables, manteniendo las derns
con valores constantes; es decir, dado un conjunto rtt T2t . . ., rk, el coeficiente de correlacin parcial
entredoscualesquieradeellas, riy:xjtesunamedida(adimensional) desurelacinlineal,cuandose
elimina de ambas los efectos debidos al resto de las variables.

Por ejemplo, con k regresores, el coeficiente de correlacin parcial entre rt V 12t que se denota 112,24...k;
se define como el coeficiente de correlacin Iineal entre ;r1 1r rr2 cuando se elirnina de ambas variables el
efecto de los otros k - 2 regresores, Se calcula obteniendo el coefi.ciente de correlacin en la regresin

eti4..k:pe2,sa..., + u; (rn3+ x),

donde er ...t y e2,g4...k son los residuos de la regresin rnrltiple de 11 y ,r2 respecto a las variables de
control rB , . . rk.

Si tuviramos el modelo A - l3o* gpt* Azrz *e, el coeficiente de correlacin parcial de y con 11,
cuando z2 permanece constante, se define por

Tyt - Ta2Tt2
Tvr,2:
(1- r?2)0 - r?z)

donde rsrt rs2 y r12 son los coeficientes de correlacin de Pearson de y con 11, de y corr 12 y de 11
con 12) respectivamente. De rnanera anloga, se tiene

Tt2 - I'utTa2
T12,a:
(r - rl)0 -,7r)
el coeficiente de correlacin parcial entre rt y 12.

Por Io complicado que puede resultar el clculo de las correlaciones parciales, sus valores se obtienen
rnediante programas est adsticos.

Ejemplo. (Continuacin) Caicular los coeficiertes de correlacin parcial para el modelo planteado.
77.6. Regresil politrcnal 345

SoLttcin: Terrernos los coefrcientes de corrclaciri rle Pcrlsou ctrtlc lrs vuiables:

I'rU : -0.283, rrt : 0.268, t'!J2: 0.807.

Entonccs.

0,268-0807x(-0.283) :
TuL,2 : 0.876.
/(t - (0 807)2) (1 (-0.283)2)
(t - rl2)Q -,'?z) -
I'A2 - I'aI?-72 0.807-0.268x(-0.283) :
Ta2,l : 0.955.
(r - rf 1)(r -,'?) Jtt - (0.268)2) (1 - (-0.283)2)

T72,a
-0.283-0.268x0.807 : -0.878.
(t - rfl)(r -,lr)

11.6. Regresin polinomial

El pr-imer paso para escoger un rlodeio que describa los clatos, es la realizacin de un grfico de
,lispcrsiu de las observacioucs. La rclacil srrgelicla por los clrtos cs la que permite escoger un
nodelo que los describa adecuadarnente.
G
lr, Cuando Ios datos presentau un csqlrema de comportaniento curvilneo puede ser rlecesario proponer'
# ,ur modclo de tipo polinonial para los datos. As lo obsen'arros cn la Figura 11.1.

&
.il1

Figula 11.1: N4odelo de segturdo glado pala los datos.

Veatlos, con Lul ejemplo, cmo se puede trausfolnrar un modelo polinomial en uno de regresin mrlti-
ple.

Sr-rpongarlos que escogernos Lln modelo de scgundo grado en nna variablc:

,U: 0o* gfl + B2r2 + e,

si hacemos las sustituciones de variables rt : r V 12 : 12 , la ecnacin de regresin queda corno

1l:00-l 7fitl0zrz*e,
c-rc esrtti tnodclo de reglcsitr rnrltiple en dos variables. Err cslc urornelto cstanr<-s err posibiliclacl cle
rplicar la teora anteriorrnentc desclita.

Ett gcnctal. si se tiene un moclelo polinomial con Lrna r.ariablc explicativa

lJ :0o-t/flt[32t:2 +...+ Bt:k*s,


Captulo 77. Regresin MItiple

se lo convierte en uno de regresin mrltiple mediante la transformac\t r: z', quedando:

U : 0o* 0{t I 132t2+ .'. + p, * e.

Otros modelos polinomiales que incluyen ms de una variable, que pueden transformarse a uno lineai
mltiple, son los polinomios en varias variables. como el de segundo grado en dos variables:

u : 0o * 7fit I 0zrz + 7nr? + 0zzrZ I Bprp2 I e.

Cuando se ajusta un modelo polinornial es preciso escoger el polinomio Ce menor grado posible.
consecuentemente se debern realizar reiteradas pruebas de hiptesis, en las que se fijarn aquellas
variables que se han de incluir y excluir en el modelo final.

Ejemplo. Consideremos los datos que relacionan el nirmero de pginas de un folleto y el costo de los
insumos utilizados en la impresin de 100 e.jenplares.

No. de pgs. Costo No. de pgs. Costo


90 204 50 130
80 770 40 726
75 165 35 724
70 155 30 72r
bi) 148 25 100
60 r40 20 98

a) Ajustar un polinomio de segundo orden a los datos;

b) Probar la significacin de Ia regresin;

c) Probar Ia hiptesis de que 0t:0.

S oluct n:

a) Como se observa en el grfico de los datos, stos podran ajustarse a un rnodelo de segundo
grado de la variable independiente, entonces planteanos el nrodelo A : go -l pfl * l3zn2 I e.

2
1.8
1.6
a.t'
1
j <-J'J'a --ltt'
1.2 a
1
10 20 30 40 s0 60 70 80 90

Figura 11.2: Relacin entre el lrmero de pginas y el costo de una publicacin.


77.7. Regresin con var iables cualit ativas 347

Lantatriz X, el vector Y y el vector B son:

1 90 8100 204
1 80 6400 170
7 75 5625 165
7 70 4900 155
1 65 4225 148

X- 1 60 3600 Y- 140
p:
1
r
50 2500
40 1600
130
726 G)
1 35 t225 t24
1 30 900 12l
r 25 625 100
r 20 400 98

Resolviendo las ecuaciones normales XXb : XY se obtiene el modelo estimado

i: L37 4.4 - 12,373t; * 0.2IBr2 .

b) Los resultados se resumen en la siguiente tabla:

Tabla de anlisis de la varianza


Fuelte de Grados de Surna de Cuadrado
F
variacin Iibertad cnadrados medio
Regresin 2 6622.24 3311.12 6.91
Residual I 4314.68 479.41,
Total 11 10 936.92

Puesto eue Foa" : 6.91, que si se cornpara con el rralor de la tabla correspondiente a Foos(2,9) :
4.26, resulta que Fob" ) Fo.os(2,0). El resultado es significativo al nivel del 5%; es decir, al
meros uno de los parmetros pr o B2 es distinto de cero. Adems, -R2 :0.605? qne en este caso
indica que la calidad del ajuste es buena, pero no lo suficiente.

c) Veamos si es posible la eliminacin del trmino de primer grado de la ecuacin.


Se tiene la prueba de hiptesis:

L. Hiptesis Nula. Hs: pr:9.


2. Hiptesi,s Alternatiua. H p 10.
3. Estadst'ico de Prueba. tobs : -2.318.
4. Regi,n de Rechazo. Tomemos a : 0.05. Conro oozs(9) :2.262, se tiene la regin de
rechazo lo,"1 > 2.262.
5. Decisin Cotno l- 2.3181 > 2.262, no se puede climinar el trmino de primer grado.

Sc sugiete que el lector reaiice los anlisis con el empleo de un paquete estadstico.

IL.7. Regresin con variables cualitativas

trtt los noclelos tratados se emple variables independientes cle laturrleza cuantitativa; es decir, que se
:\ptsall uumricamente y son el resultado de mecliciones iustnunentales. Pero si se desea incorporar
348 Captulo 77. Regresin Mltiple

en el modelo una variable cualitativa, es necesario intloducir uariables indicadoras (o ficticias), q:ue
permiten diferenciar los distintos niveles que toma tal variable; por ejemplo, una variable X que
indique Ia estacin del ao puede ser defi,nida conro

": { ?, :l :: ;il:T:
En general, una variable cualitativa con niveles se representa mediante t-I variables indicadoras, a
Ia^s cuales se les asignan valores de 0 y 1.

Ejemplo. En un estudio para determinar Ia relacin entre el peso y el origen de ios automviles y su
consumo de combustible se escogi una muestra de 10 carros, con los siguientes resultados:

Consumo (l/100 km) 8 16 6 7 7 I 11 12 18 20


Peso (kg) 739 1187 655 729 888 797 963 802 1551 1650
Origen Japn USA Japn Japn Japn Japn USA USA USA USA

Determinar la ecuacin de regresin que ajusta los datos y probar su significacin.

Soluc'in:

a) Se va a ajustar el modelo
a:0ol7fitl0zrzle,
donde la variable peso es cuantitativa (rt) y la."'ariable origen es cualitativa (r2), con dos riveles:
USA y Japn, que Ia codifrcaremos de Ia siguiente manera:

'I': f 0.
<
si el origerr es Japn;
[ 1. si cl oligen es USA.

Con sto la matriz X y el vector Y quedan:

r 739 8
1 1187 16
1 655 6
7 729 7

X- 1 B8B
Y_ 7
7 797 9
1 963 11
1 802 t2
1 1551 18
1 1650 20

Y el modelo estim.ado es

0: -0.036 * 0.0111 -13.42Ir2.

El significado clel tI'tlino correspondiente al origen del aulonir,il es el sigr,riente: para dos antos,
de igual peso, Lulo clc oligen amelicano y otro clc oligen .japons, cl arncricano cousluuc, cu
promedio, 3.42 litlos ms que cl japons, al rccor-r'er 100 krn.
77.8. Probletnas en la regresin mItiple 349

b) Veamos la tabla de anlisis de Ia varianza y las estirnaciones de los parmetros:


Tabla de anlisis de la varianza
Fuente de Grados dc Snrrrr de Cuadrado
F
variacin Iibertad cuadraclos medio
Regresin 2 213.95 106.975 77.66
Error 7 10.45 1.493
Total I 22.40

Pol el alto valor de 4A, : 77.66, se deduce que al nlenos una de las dos variables consideradas
sirve para explicar el consumo de combustible de los carros.

Trmino Valor tobs


Constante l.16
-0.036 -0.027
Peso b1 0.01 6.012
Origen ,2 3.242 3.153

Si comparamos los valores de o," con 1s.625(7) - 2.365. deducimos que los trminos correspon-
dientes al peso y origen son distintos de cero, mieltras que el trmino constante se puede conside-
rar nulo.
Para terminar, exarninerrios los valores a.justados, conparndolos con los datos originales y el
error respectivo:
A U ei
8 7.18 0.82
16 14.97 1.03
6 6.36 -0.36
7 7.08 -0.08
7 8.63 -1.63
9 7.75 t.25
11 12.79 -r.79
12 Lt.22 0.78
1B 18.53 -0.53
20 19.49 0.51

11.8. Problemas en la regresin mltiple


En la estimacin de los parmetros etl un modelo lineal nrltiple se plesentan varios problemas que se
deben teuer en cuenta al realizar un ajuste de los datos; ellos son la multicolinealidad, la presencia de
valoles extrernos, la autocorrelacin y Ia no normalidad de los errores.

11.8.1. Anlisis de los errores


Utta vez construido el modelo de regresin se rleber conrprobar si lrs hiptesis de iinealidad. de
norrnalidad y de independencia se curnplen.

La matriz de covarianzas de Ios errores es

Cor'(e) :o2(I-V)'

:loude v: X(XX)-lX; as,


Var(e) : o2 (l - 1t.,),
350 Captulo 77. Regresin Mltiple

donde el trmino u mide la distancia entre el punto x y 1a media x.

Para comparar los residuos suele ser ms crnodo cambiarlos de escala, estandarizndolos o estuden-
tizndolos.

Los residuos estandarizados se definen por

y los residuos estudentizados mediante

s()

que siguen una ley t con n grados de Iibertad; donde s() son los residuos de la regresiu cuando
- k -2
se excluye la i-sima observacin.

Anlisis grfico

IJnavez que se han construido los residuos (",r o ) es cmodo real\zar grficos como los siguientes:

1. Histograrnas o grficos de probabilidad normal.

2. Grficos de los residuos respecto a los valores estitlados, e: f (i)'


3. Grficos de los lesiduos respecto a las variables expliczitivas. e : f (rn).

Error de especificacin

Se comete error de especifi.cacin cuando establecemos ura depeldencia errnea de la respuesta en fun-
cil cle las variables explicativas: omitimos variables irnportantes, introducimos variables innecesarias
o snponemos una relacin lineal cuando la dependencia es no lineal.

La especificacin incorrecta del modelo conduce a que los lesicluos tengan esperanza no nula y que los
estimadores obtenidos sean sesgados.

11.8.2. No-normalidad de los residuos


La srrposicin que los residuos e estn normahlente distriburdos no es necesaria para Ia estimacirr de
los parmetros de regresin ni para la particir'r de la variabilidad total. La normalidad es necesaria
para Ia constlnccin de las pruebas de hiptesis e intervalos de confianza sobre los parmetros.

El irnpacto de la no normalidad en los mnimos cuadrados depelde del grado de desviacin de la


norrnalidad y de la aplicacin especfi.ca.

Los estirladores de los parrnetros sern insesgados, pero sus intervalos de confiattza y las pruebas
de hiptesis sern incorrectas. Sin embargo, la prueba .F- es razonablemente robusta contla Ia no
normaiidad.

Para cletectar Ia normalidad de los errores es conveniente fi.iarse en los coeficientes de asimetr'a y de
cu.rtosis. Aderns, se pueden realizar grficos Q-Q o P-P de boudad de a.juste a Ia ley nornral.
77.8. Probtretnas en la regresin mItiple 351

-. .ansformacin de la variable dependientc a lLna forrna que sca ms cercana a la norrrral es un


' --so tluy empleado. Estas transformaciones sneler ser sugelidas por los gr'ficos de los residuos.
l=- :,iu, se puede utilizar el mtodo de Box-Cox de transformacin potencial,

: -- ichos casos) la desviaciu de la normalidad se debe a la presencia de valores atpicos, en cuyo


ur- :: convniente examinar Ia influencia de los rnismos.

-::-imnte se han desarrollado modelos que consideran clue los errores estn distribuidos segn
-f,,,-
H*i -:.'l. de un nirmero de grados de libertad desconociclo) corno una generalizacin de la hiptesis
-.r - ::rralidad.

Presencia de puntos inusuales

:.-,:rrente, se espera, que los datos correspondientes a las observaciones se encuentren distribuidos
lr. -:gin ms o nrenos cercana? pero puede sucecler- qne una o varias observaciones estn alejadas
.:-- - ,Le los datos. Esta-s observaciones pueden influir mucho en el modelo final.

-::cto es rnuy importante: podemos disponer de 100 obselrraciones y, sin embargo, construir
-- : ',rn modelo cuyas propiedades son debidas irrricamente a dos puntos. Conocer si este tipo cle
- -:-lLrve perjudicialmente en el rnodelo permite mc,iorarlo.

forma para determinar si un valor es atpico es mediante los residuos estudentizados. Se


n los valores de , cou los valores crticos de una ley I con n - k - 2 grados de libertad.

I r---:. d conocer cules son los <<purr.tos distantes> es a trrvs de Ia distancia:

/)?:+ (b(r-r)\2 t:1.!.....n.


; _1,
",: h\-ffi-/
-trriento consiste en ajustar el modelo. calcular los Dl , 'i : 7,2, . . . ,n, y despus ordenarlos
ascenclente de rcuerclo con eI D!. Los pr,rntos con alto D.f son inusnales.

- ,,tt'os tipos de distancias que permiten la deteccirr de valores atpicos y puntos influyentes,
--, 1 con distintas propiedacles) pero todas siguen el nismo priucipio para la identificar tales
-J11eS.

iento

-:- -,tcalizado un pnnto iuttsual, se estudiar su inflnencia eliminndolo del modelo, repitiendo el
-----ento para todos estos puntos. Aqu es necesario realizrl un anlisis de la estabilidad de los
;--es de regresin tlediante pruebas estadsticas o sus iltelvalos de confianza.

L.-- se han desarrollado mtod,os d,e regresirt robttsto, clue ateniran Ia influencia de las obsen'a-
---',-.uales en el modelo o que toman como nrcdicla cstadstica sobre la cual se basa la regresiu
ur - ana en lugar de tomal la media, couro 1o ltcrnos irecho chrlarrte este tratado.
77.8, Probtrenl.as en la regresin mItiple 351

La transformacin de la variable dependiente r rrnr forrla qr"re sea ms cercana a la normal es url
recrlrso mu.y empleado. Estas transformaciones suelen ser sugeridas por los grficos de los residuos.
Tambil, se puede utilizar e1 mtodo de Box-Cox de transfolmacin potencial.

En la desviacin de la nolmalidad se debe a la presencia de valores atpicos, en crlyo


mr-rch.os casos)
caso es conveniente examinar la influencia de los mlsmos.

Recientemente se han desarrollado modelos qlre consideran que los errores estn distribuidos segn
una 1ey , de un nrmero de grados de libertad desconocido, colrro una generalizacin de la hiptesis
de normalidad.

11.8.3. Presencia de puntos inu.suales

Generalmente, se espera que los datos correspondientcs a 1as observaciones se encuentren distribuidos
en Llna regin ms o nenos cercanar pero pu.ede snceder cpre Llna o varias observaciones estn alejadas
del resto de los datos. Estas observaciones pueden iufluir rlucho en el modelo final.

Este aspecto es muv importante: podemos disponer dc 100 observaciones y, sin embargo, construir
con ellos un modelo cuyas propiedades son debidas irrricamente a dos puntos. Conocer si este tipo de
puntos influye perjudicialmente en el modelo permite mejorarlo.

Identificacin

La primera forma para determinar si un valor es atpico es rnediante los residuos estudentizados. Se
colnpara con los valores de con los valores crticos de una lev I con n - k - 2 grados de libertad.

Otra folma de conocer cules son los <<puntos distantes>> es a trar's de la distancia:

,h

/)? : \-
t /J
i: I,2,.. . ,fr.
.l-L

El procecliliiento consiste en ajustar el modelo, calcnlal los Df , : 1, 2,....n, y despus ordenarlos


en forrnr ascenclentc cle acuerdo con el Dn2. Los puutos con alto D| son inusuales.

Existen otros tipos de distancias qne perniten la deteccin de valores atpicos y puntos influyentes,
cada uua con distintas propiedades, pero todas siguen el mismo principio para la identificar tales
observaciones.

Tratamiento

Una localizado r-rn printo inusual, se estudiar su influencia elininndolo de1 modelo, repitiendo el
.u'ez

procedimiento para todos estos pr-rntos. Acr es lecesalio realizrr un anlisis de la estabilidad de los
coeficientes de regresin mediante pruebas estadsticas o sus intervalos de confianza.

Tanrbirr, se ]ran desarrollaclo mtodos de reqresi,r r'obttsta que atenran la ilfluencia de las observa-
ciones inusuales en e1 modelo o que toman como mcclida, cstacistica sobre la cnal se basa la regresin
a la rnediana en lugar de tomar la media, como 1o hemos hecho chllalte estc tratado.
352 Captulo 77. Regresitt MItipIe

11.8.4. Varianza heterognea

La heterocedasticidad en los errores irnplica que la hiptcsis

Var(e) :o2: costa.tc

no es aplicablc.

Lrs consecuencias de la heterocedasticidad en el modelo lineal son las siguientes: los estimadores sern
iusesgaclos, pero dejan de ser eficientes. Las frnulrs para las varianzas ro son correctas y las pruebas
de hiptesis dejan de ser aplicables.

Identificacin

La lreterocedasticidad se identifica mediarrte la graficacin de los residuos. El grfico : /(fr)


".
rti1 para detectaria y los grficos : f @n) para identificar si la variabilidad es causada por alguna
de las valiables independientes en particular.

Tambin es posible realizar una prueba de hiptesis del tipo

Hs: ei - (0. 02) ,

H1: e - ^i (0, 07) ,

^i
una prueba de a.juste a una lev. Pala el efecto se puede realizar el contraste de razl de
clLle es
verosinilitudes, que se basa en el estaclstico

2log )- rz log G' - r.rt,IogGl,

qlle se distribuye segn una ley X2 con k - 1 gr":rdos de libertad.

Tratamiento

1. Si la heterocedasticidad est asociada cori la valiable respr-resta y crece con e1 increrrento cle
los valorcs de y. una posible forma de tratarla es rcalizar la regresin de log g en lugar de y.
Este caso suele aparecer cuando hay una forrnulacin errnea del modelo; por ejcrnplo cuando
el moclelo real. es r-nultiplicativo y se a,justzr rncdiante rrno lincal.

2. Si Ia lieterocedasticidacl est asociada corr rrur variable inclependiente particular y la desviaciri


estndar est ligada linealmente con el crecin-riento de z.. ur procedimiento de evitarla es estimar
cl moclelo
a r J'l r ^* '
J'k -Bo
'J; k
-
-'''u-T" -P'rL

s-
dorrde, al cliviclir todos los tlminos pol' z/r, los lesicluos e* - tendrn valianza constantc.
Este procediniento es equivalcnte r utilizrr rlninos
",,u,lr,rdnrfencralizrclos.
77.8. Problernas en la regresitt rnItiple 353

11.8.5. Multicolinealidad
El los ploblemas de regresin mrltiple, algunas veces. dos o ms r,ariables independientes contribuyen
con iriforrnacin redundante, porque se encucntrrn bastante correlacionadas ertre s. En los casos
en que tal correlacin sea alta, se dice que existe rmt,lticol,ineo,Iidad. Por ejemplo, se desea formar
r.rn modelo para predecir el precio del metro cua<hado de tielra en Lln sector de la ciudad (g), como
funcin del ndice de irrflacin ("r) y del precio clel cllar en el mercado libre (r2). Aunque las dos
va,riables aportan informacin, es conocido qne las dos -"ariables independientes estn fuertemente
colrclrcionadas; por 1o tanto, ia informacin pol ellas aportada es redundante o se traslapa.

En este caso, J.a matriz XrX es casi singular. originando clue sea difcil encontrar su inversa.

Crrando hav rnulticolineahdad se tiene dos efectos:

I Los estirnadores b,; tienen varianzas rnuv altrs.


) Las cstimaciones b son muy dependientes crrtrc s

Por e.jenrplo. n un modelo con dos variables independientes,


n2
Var(b) : -o;;l
silL-r')n'' )

clondc r
cs el coeficientc de colrelacin entle las dos variables. As, si aumenta (en valor absolu-
to) lzr correla in entre las variables explicativas. aumentarn las varianzas de las estimaciones y su
dcpeldencia.

Identificacin

Lr iclentificacin de variables colineales se efectira examinando:

1. La natriz de correlacin entre Ias variabies explicativas, R, y su matriz inversa, R-1


2. Lrs races y vectores propios de las matrices XX. o de su matriz de correlacin.

Si un-L variable es combinacin lineal de las restantes variables. se debe analizar Ia matriz R-l. As.
sr: define el <<factor de inflacin de la varianza>> corro cl z-simo trmino de la diagonal de Ia matriz
Rt:
FIV: diagr (R-1) .

Por tanto, eiernentos diagonales glandes (mayores a 10) en la rnatriz R-1 indican alta colinealidad.

Tunbin. se puede calcr.rlar el ndice de condicionarnierrto (IC) de XX o R:

rnx{)i
nn {)}

ilonde ) son los valores propios de las nencionadas matrices.

Err La pr'ctica se adrnite clue existe alta multicolinealidad cuando el IC es rnayor que 30; una colinea-
iiclad modclada si el IC est entre 10 y 30; y, cnando el IC es merlor que 10 se considera que la rlatriz
est bicrr clefinida.
354 Captulo 77. Regresin MItipIe

Tbatamiento

Las tres soluciones a la multicolinealidad son:

1. Eliminar regresores) reduciendo el nrlero de parrnetros a estimar.


2. Transformar las variables mediante componentes principales y elimirnar los menos importantes,
3. Incluir informacin externa a los datos, mediante nn enfoque bayesiano.
4. Utilizar regresin a travs de componentes principales, que es similar al mtodo de eliminar
regresores, con la diferencia de que se eliminan combinaciones lineales de stos, manteniendo
aquellos cuya contribucin en trminos de informacin es significativa.

11.8.6. Autocorrelacin
Una de las hiptesis iniciales para desarollar el modelo de regresin es que los errores, i) son variables
aleatorias no correlacionadas. Si esta hiptesis es violada, se dice que existe autocorrelacin.
Los efectos de esta dependencia son los siguientes:

1. Los estimadores de los parmetros sol insesgados, pero no son eficientes.


2. Los contrastes sobre los parmetros no son viidos y estn sesgados hacia Ia deteccin de reia-
ciones inexistentes.

.) Las predicciones son ineficientes.

Eu el caso de un modelo lineal simple, la varianza del estimador de la pendiente resulta ser
')/
var(b) :- !' -l,1_,rDit':-t)
'^/
D,? \' D"? )
'
.

donde p es el coeficiente de correlacin entre 1as observaciones.

2
Si p > 0, la varianza puede resultar sustancialmente mayor que $5,ri cle rnanera que el estimador es

ineficiente. L

Identificacin

Para ia deteccin de la autocorrelacin se emplea el estadstico de Durbin-Watson:


D"t"r-n
D"?
Para la realizacin de las pruebas estadsticas sobre la autocorrelacin existen tablas, pero podemos
dar la siguiente regla emprica para detectar la antocorrelacin de orden 1.
Construimos el estadstico
d:2(l - rt)
y si stt valor es prxino a2, no existir autocorrelacin; si d tiene un valor entre 0 y 2, habr correlacin
positiva; si el valor de d est entre 2 y 4, la correlacin sel negativa. En los programas informticos
se sttele calcular el valor de este estadstico y el nivel de significacin de Ia prueba.

Alternativamente, se puede aplicar el estadstico de Box-Ljung pala detectar la autocorrelacin.


77.9. Ejercicios 355

Tbatamiento

Para explicar Ia evolucin de variables que tienen r.rn comportamiento en el que aparece autocorrelacin,
es conr.eniente utilizar mtodos del anlisis de series de tiempo, que permiten abordar de rnanera rns
global el problema de construccin de modelos para estas r.ariables. Tambin, se pueden utilizar
mtodos especiales de regresin) colrro los mninos cuadrados generalizados o los modelos lineales
generalizados.

Por Ia dificultad que entraa la realizacin mannal de los clcr-rlos, especialmente en la determinacin
de los potenciales problemas que el modelo pudiera prescltar, sto se hace mediante el empleo de pro-
lramas estadsticos especializados) que facilitan su clculo, correspondiendo al usuario la interpretacin
correcta de los resultados.

EI lector deber notar que los temas tratados aqu solo cubren la parte central del anlisis de regresin.
Existen textos especializados que lo tratan de manera detallada y en extenso. (Vase Rawlings y otros,
200 1. )

11.9. Ejercicios
Modelos de regresin mltiple

Snponga que un inrrestigador est usando el modelo estadstico Y : X,6 f e, donde n : 73 y


k :2. Result el siguiente sistema de ecuaciones, que permiten estillar el vector p:

13bo*2b1-2b2 : 4
2bo*2bt-bz : 2

-2bo-bt*4bz : -1
a) Resuelva el sistema de ecuaciones y encuentre el estimador b de coeficientes. Escliba
explcitamente la ecuacin de regresin;
b) trscriba la forrnulacin nratricial del problema;
c) Si YY:6, encuentre s2;
d) Calcule los coeficientes de determinacirr mrltipl" R2 y arjustado Rl e interprtelos.

llna empresa de transporte ha tomado una m,uestra de los pesos de seis ernbarques, ia distancia
transportada y el gasto que erl ellos se ha incurriclo:

Peso (Tm) 40 30 16 t.2 3.4 4.8


Distancia ot
(miles de km)
L r) 22 10 2.0 0.8 Iti
Gastos
320 224 138 180 246 372
(dlares)

a) Estime los coeficientes B6, 0ty Fz del modelo de regresil lineal nltiple:
b) Use el nodelo para predecir el gasto cuando el embarque pesa 2.4Tm y se lo transporta a
1200 krn;
c) Calcule e interprete el coeficiente de deterninacin urirltiple y el coeficiente dc determi-
nacin ajustado. Conente los resultados.
Captulo 71. Regresin MItiple

Un economista est interesado en Ia relacin quc cxiste cntre Ia demanda de viviendrs, su precicr
y el ingreso rnedio anual de los hogares. Si denoniinrrlos por y Ia denanda de vivienda, medidtr
en unidades adecuadasi z1 al precio pronedio de las vivicndas; y, 12 el ingreso familiar promedio.
Los valores de estas variables se recogieror] para 6 periodos y se muestran en Ia siguiente tabla:

Periodo ?l :x7 r2
1 8 72 6.8
2 I IL) 7.2
12 1 74
4 I T4 77
a
r) 12 l4 7.0
6 15 l5 7.4

Si el economista supone que el modelo apropiado es uno de regresin lineal mltiple:

a) estirne los coeficientes de regresin del modelo;


b) calcule el coeficiente de determinacin;
c) realice la tabla de anlisis de la varianza e intelprete su resultado;
d) efecte las pruebas para determinar la significacin de los parmetros individuales.
4 En la tabla se dan los datos soble las ventas senranales promedio (en cientos de dlares) de cada
turo de los restaur-antes que tiene una caclena cle coruicla rpida, su capacidad cle asientos y cl
nrmero de clientcs (en cieutos) que ingresan a ca<la locrl.

Nmero de Nmero Ventas


asientos declientes semanales
120 19 13.8
200 8 14.2
150 t2 14.0
180 l5 r8.2
240 t6 oc f
.t)

a) Asumiendo que el modelo de regresin es lineal rnltiple, estime los coeficientes Bs, 0t y 0z
y sus intervalos de confianza corresporrclientes (rrse g5 %);
b) Calcnle R2 y RZ. Intelprete los valores obteniclos;
c) Construya la tabla ANOVA y realice ltr prueba de adecuacin del modelo;
d) Use el modelo para realizar la estimacin y la prediccin de la venta semanal de un restau-
rante que ser instalado con una capacidad de 150 asientos y se espera que ingresen 1400
clientes.

5. De una encuesta de presupuestos familiares se han obtenido los siguientes datos rnensuales:

Gasto en energa elctrica ($) 30 40 50 /Ll 70 130


Ingreso familiar ($) 300 800 1500 2400 1200 3000
Tarnao familiar 2 4 Jo t) 4 8

a) Construya interprete un modelo par-a explical el gasto en energa elctrica en funcin del
e
ingreso familiar y el tamao de Ia familia:
b) Caicule los coeficientes de deterrninrcin (mirltipie y ajustado) v la varianza residual;
c) Constluya un intelvalo de corfiauza corr nivcl 95 % par-a el efecto de Ia variable ilgleso
farniliar;
17.9. Ejercicios 367

d) Indique qu coeficientes son significativos:


e) Si el tamao de Ia familia permanece constante, calcule la variacin del gasto esperado para
un incremento de renta de 350 dlares.
f) trfecte la prueba sobre Ia significacin de la reglesin.

6. Sear las variables: .L : latitud en grados, A : altura en metros sobre el nivel del mar y 7:
ternperatura media anuai.

a) Explique ? en funcin de tr y A con base err la informacin obtenida en varias ciudades:

L tt ,4
J(J.9 JJ.Z 31.3 29.5 26.8 26.5
A 722 145 195 124 t07 r30
T 139 14.9 16.4 77.2 18.0 18.0

b) Prevea Ia temperatura media para Lrra ciudad cuya latitud es 30.5 y la altitud es 150 m;
c) Calcule los coefi.cientes de deterninacin mriltiple y a.justado;
d) Realice la tabla de anlisis de la r.arianza e interprtela;
e) Contraste la nulidad de cada uno de los parrnetros de Ia regresin e indique si es posible
encontrar un modelo mejor que el plariteado.

Se estim un modelo de regresin rnrltiple a, partir de 25 observaciones y se obtuvo:

Coeficiente Estimacin Error estndar


0o 10.6 2I
bt 2E.4 L1 2
it,t 40 15
12.7 14.7
[]n 0.E4 0.76

a) En el rrroclelo propuest,o: 11 : 0o I 0f * p2t2 I 111:r:s t Asr+ * e, ,qu regresores son


estadsticamente significativos? (Use r.ur nir.el dcl 5 %);
l,) Usando los resultados de a) , prediga el valor de la respnesta para rp : (1,2,7, -7)t mediante
un intervalo.

En un estudio sobre la relacin entre tres varia,bles se cibtuvieron 11 mediciones con los siguientes
resultados
11 11 11

fi:1 11 : 66, D
i:7
r?o : 506, )--
i.-I
r19 : 85,

11 11 11

\-
Zr r"'
: -22, Dr3o: 484,
Drr,rn: r42,
,i:l t-1 i-I
1t 11 11

IY:33, D,r?: 2Be, \-.,


/J
;t,>; : _ 346
i:1 'i:r i,-I

a) Halle la ecuacin de regresin lileal clue ajusta los datos;


b) Realice la tabla de anlisis de la varianza e interrrtela;
c) Encuentre los intervalos de confianza de los par'rnetros del rnodelo e interprtelos. (Use
1-a:0.9);
d) Halle el coeficiente de determinacin errtre las va.riables.
358 Captulo 77. Regresin MItiple

Regresin polinomial

9. En el laboratorio de una empresa automotriz se rnidi la distancia que tarda un automrril en


frenar, de acuerdo a la velocidad que lleva el n-iomento qrie aparece Llna seal. Los datos se
muestran en la siguiente tabla:

Velocidad (krn/h) 30 40 60 80 90 100 110 r20


Distancia (m) l0 20 30 50 90 150 250
^l

a) Ajuste una ecnacin polinomial de segr-rndo grado a los datos;


b) Determine la calidad del ajuste:
c) Realice una prueba global de la bondad de a.juste mediante la tabla ANOVA.

10. En una entidad bancaria las tasas efectir.as de inters varan de acnerdo al monto del prstarno
que se concede) ya que se incluyen gastos administrativos e impuestos que cobra el estado. Para
encontrar un modelo, se recogieron los siguientes datos, de varios prstamos concedidos:

Monto (miles de $) 05 10 1.5 o


3 t) 40 6.0 90 12.0
Tasa ( %) o.)
i,) -J 21 17 15 l6 19 27

a) Grafique los datos ;' postule un rloclelo de regresin para los datos;
b) Ajuste los datos mediante el modelo de regrcsin de a);
c) Realice una prueba global de adecuacin del modclo;
d) Pruebe si los trminos individuales del rlodelo pueclen eliminarse.
11
t.t. Los datos que se presentan a continnacin corresponden a1 tiernpo de secado de un balniz y la
cantidad de cierto aditivo qunico anadido:

Cantidad de aditivo ( g) 1 2 ,) 4 5 b 7 B
Horas de secado B5 80 60 50 6.0 tt
(J r, n.5 7.0

a) Use el mtodo de ajuste a un modelo polinomial de segundo orden para modelizar los datos;
b) Realice una prediccin para e1 tienpo de sccado, cuando se han aadido 6.5 gramos de
aditivo qumico;
c) Calcnle los coeficientes de determinacin R2 y RZ e ilterprtelos.

12. En ttn estudio de la contaminacin por gases despcclidos por ios vehculos en las calles de Quito.
se midi la concentracin de plomo (en ppm) en cl aire y se registr la temperatura ambiente
(en "C) el momento de la medicin.

Temperatura 80 10.1 12.6 1,1.3 15.6 76.2 17.r lB.7


Concentracin nt ii8 74 88 (\7
l!) 107 115 118

a) Encuentre una ecuacin de segunclo orden qr,re a.juste las observaciones;


b) Realice un anlisis de varianza de la regresin y pn.rebe la significacin del ajuste;
c) Es posible simplificar el modelo elinilando una c1e las conponentes? ,Por qu?

Regresin con variables ficticias


77.9. Ejercicios 359

1D
t,) Sc cree que en ciertas enlprcsas cxiste discrirninaci<il scxual cn el trabajo y quc se paga ms a los
hombres clue a las mr-rjeres cuando rerlizan el misrno trabajo. Los datos de la tabla corr-esponden
a los aos de expeliencia, el sexo y 1u..11klrrs arrttales (err miles de dlares), de empleados que
tienen las misrnas funciones en 9 empresas dc consultor'a.

Exoeriencia Sueldo anual


(anos) (miles)
.) lrlllJ er' 12.9
4 nruJer' 13.0
5 nrlrJ er 13.8
6 nIll.Jer 74.4
8 mrrler 15.7
4 hombrr: 73.4
5 fiorribrc 14.7
hombr-e 1.7
a .1A
7
B homble 2r.\

a) Ajuste un modelo de regresin a los clatos;


b) Pruebe la significacin de la regresin;
c) Pruebe las hiptesis Hs: p:0 para los coeficientcs clcl nodeloi
c-l) Utilizando el resultado anterior, se pucde colchrir clrrc existe discliminacin? Por cg'?

l.l Err lrna erl]presa que se dedica a la transpoltacin cle triristas, se sospecha que el constuno clc
c-:ornbnstible de los autos dcpende dc la aritigiicda<l clc stos y clel scxo cle crieu los c<l<lucre.
Para probal esta sospecha se r-ecogi la siguientc infonrrciriri:

Consumo Sexo del Antigedad


(gal/100 krn) conductor del auto
4.7H3
5.0 \I 4
4.6 \I 3
4.0H2
5.2 \I 1
4.7 XI 4
3.5H4
4.7H1
a) Cion Ia ayuda cle variables indicadoras ar.jrrste rrrr rrroclelo de reglesin a los datos;
b) Elabore una tabla de anlisis de la r'u'ialzr y c:alcnlc el coeficiente de deterninacin mrlti-
ple;
c) Realice pruebas sobre los parmetlos de ler lcgresin v cletermine crrl de ellos debe ser
excluido del modelo;
cl) Interprete los resulbados obtcnidos.

Los siguientes datos corr-espon<lcu al tierrrpo d< sobrevirrerrcir, en horas. rle uuas ratas luego crt:
se les suministra cierta closis de veneno. En ci expcrinrernto se consicler 2 tipos de r.eneno (A I'
B) y la edad de la rata.

Edad (rneses) t 2
._)
J 4 1 2 3 4 2
D
()

Veneno A A A A B B B B A B
Sobrevivencia 45 8.2 63 7I 36 49 4.4 5.6 67 5.0
360 Captulo 77. Regresin MItipIe

a) Realice un ajuste de los datos con la ayuda de variables indicadoras;


b) Pruebe la significacin de Ia regresin y calcule el coeficiente de determinacin mltiple;
c) Calcule los estadsticos para los coeficientes del modelo y examine si alguna de las variables
puede excluirse;
d) De acuerdo a lo obtenido en c) , encuentre el modelo definitivo.
Captulo L2

lntroduccin a las Series de Tiempo

El protstico es el, arte d,e establecer Io que hu,bzero, suced'irlo


s'i, Lo clue suced,i to hubi,era su,cedlid,o.
David Myddleton

Prrr cl anlisis cle las serics de ticrnpo existen varios cnfocres, ninguno de los cuales se puede decir
cllle es mejor clue los restatttes. Nosotros nos lefe-,-iremos al urs simple) qlre cs el de identificar los
pr-irrcipales factores qllc pal'ecen influil en los valoles inclividuaies de la misma y examilarcmos los
mtodos de prediccin que se agmpan bajo el nolrbrc genrico dc mtodos de suavizamiento o cle
aterruat:in.

L2.L. Introduccin
Pala cl anlisis de ttua valiedrd de fcnrlenos fsicos, econmicos o fi.nancieros disponcmos de una
cierta cantidad de observaciotres de una lrismr variable aleatoria numrica, tomadas en norncntos
ecluiclistantes; entonces, los datos analizados tienen plopiedades interesantes aigunas de las cuales las
vanlos a presentar.

Prinrero, definamos lo quc se ctrtiende por serie de tienrpo (c1uc tambin se denomina como serie
ltistrito. r serie cronolq ico,).

Defirricin (de serie de tiernpo) Una scrie dc ticmpo cs un conjunto de datos que estn
orcleu'rclos en el tietlpo y cllre lian sido tomados a intervrlos ecluiclistantes en el tiempo.

Como cjemplos de series cronolgicas podernos rnelcional los sigrricntes:

1. La tempcratura dialia proruedio tomada cn Iugal cspecfico, dulantc un

2. Ei fudice mensual de precios al consnnricloL (IPC).

3. Los precios de venta de cieltos at-tculos, clc tenporacla.

4. El caudal diario promeclio de rlo) cn sitio clcterrninarlo.

5. El nirrlero de empleados en ramas relacionrdas co]r el tnlisrrro.

361
362 Captulo 12. Introdttccin a las Series de Tientpo

Si Ias observaciones de un fenrneno se han realizaclo a trars del tiernpo, es posible qrle preser]-
ten escluemas qr-le se repiten peridicaruente v que las obscrvaciones contiguas sean) probablernente.
dependientes.

A las series cronolgicas se las representa mediante diagramas de dispersin (grficos X -Y) donde las
observaciones se representan en e1 eje de las ordenadas y lar variable tcm.poral en el eje de las abscisas.
La r'rriable tiempo () es la variable indeperrdiente.

Nosotlos llcvaremos la siguiente notacin:

1. La variable tiempo (), que tomar \ralores en los entelos positivos: t:0, I,2, ..., n.

_a- La variable de las observaciones (Y), que 1a supondremos dependiente del tiempo: Yo, Yr, ...,
v

Para realizar el anlisis, en primera instancia, se aplicarn los rntodos tradicionales de la inferencia
estadstica para modelizar los datos y corocer la bondad del ajuste realizado.

L2.2. Componentes de una serie de tiempo

Desde el punto de vista tradicional, los componentes de nna serie de tiempo son: la tendencia secular'.
y los conponentes estacional, cclico e irregr.rlar.

L2.2,L. La tendencia secular

De los conponentes que afectan a los valores individuales en una serie clololgica, el ms inportante
es, getreraltnente, Ia tendenc'ia secttlar (o llamada sinplemente tendencia), que se define corlo el
mor.imiento caracterstico de crecimiento (o de declecimiento) a largo plazo de la serie. Por eso, Ia
tendencia solo se pu.ede determinar si se dispone de datos de la serie en Lrn periodo largo de aos.

La tendencia es la direccin subyacente (hacia arriba o hacia abajo) en la serie de datos, a largo
plazo.

A la tendencia se la identifica mediante el smbolo 7.

Las ftterzas bsicas que producen o afectan la tendencia son: los cambios en la poblacin, la inflacin.
el ca,mbio tecnolgico, el incremento de Ia productividad y los ciclos de vida de los productos.

Para la modelizacin de este componente se ritilizan modelos lineales, polinomiales y otros. EI mtodo
ms simple, y ms ampliarnente usado pala describir- la tenclencia es la regresin lineal sirnple y las
transformaciones que pueden hacerse hacia este modelo. As, la tendencia puede ser lineal creciendo
a una cantidad absoluta constante a lo largo del tiempo- o puede ser exponencial, creciendo a una
tasa constrnte a lo largo del tiempo. Alternativamcnte, la tendencia puede ajustarse a un polinonio
o otlo modelo ms cornplejo.

Pol sr-r natnraleza e1 anlisis de la tendencia tiene implicaciones en la planificacin administrativa a


lalgo plazo.
72.2. Contponentes de una ser-ie de tientpo 363

L2,2.2, La variacin estacional

El coupouente estacional de la serie es un patrn de carnlrio qlre se repite legularmente err el tienrpo.

Este movimiento debe courpletarse dentro del pcriodo de un ao y rcpetirsc, de rranera semejante ao
tras ario, a fin de consicleralsc un cambio estacional. As. ptrla identificar el conponente estaciolal cn
una scric histrica, es necesario recopilar los cltos para rrrils cle rrrr pelio<lo de un ar-ro.

Por eiemplo, si considerarros Ios registlos dc clemrncla clc liabitacioncs er los hoteles de los sitios
tursticos ms visitados, dnr-ante el ario. En los r]rcses rlc vacrciorres clc los regmer).es escolares de
la Costa ), de Ia Sicrra se procluce rlrayor derlanda cllle cn el lcsto cle mescs del ario. As, los datos
presentarn rrariacioncs estacionales) con Lula rllarcAdr tendeucia a aurtrentrr, durarrtc los pcriodos
sealados.

\{ientlas que ia tendencia se rttiliza pala la plalificacirr a largo plazo, el anlisis del componente
estacional dc una seric histrica tienc implicaciones a cor-to plazo, ms innieclirtas.

Las fluctuaciolles estaciolales sc preseltan tpictrniente err los clatos clasificados por rneses o trimestres;
Io clue conduce a qlre se deba crlcular Lln valol estacioual por sepalacio para cacla rnes (o trimestre)
clel aiio, por Io general en la folma de un nuler'c1 rrclicc.

Etr la Fignra 12.1 se grfica tura seric con collportalrierrto cstar:ional. La variacin estacional se
reprcsenta nrcdiaute .D.

Figura 12.1: Serie cle tiernpo con fluctnrcioncs cstaciolales.

12.2.3. La variacin cclica

El coutponente cclico cs la flnctuacin en for-tr. a, de on<lLs cl ciclos, de urs cle un ao dc duracin,


proclr.rciclo por cambios en las concliciones ccounricas.

Los coupouentes cclicos sc asctrejan a los estacionalcs erl que trmbil son movimientos ondulato-
rios lepetitivos, pero difieren erl que 1os rr.ovimielrtos son de duracin ms prolongada y sotl menos
predecibies en cluracin y en amplitud.

El anlisis del compouente cclico es de impoltrncia en la planificacin a Iargo y mediano plazos ya


cluc petruite prcveer los periodos en los que estas variacioncs afectarn las actividades.

Un ejernplo dc variacirr cclica se presenta en el plecio clcl petrleo, que cll las rltirnas dcadas ha
tenido periodos largos de crecimiento sosteuido, segr.riclos cle perioclos cle fuelte cada.

La valiacin cclica se la identifica por C.


364 Captulo 72. Introduccin a las Series de Tiernpo

12.2.4, La fluctuacin irregular

El componente irregular corresponde a fluctuaciones causadas por sncesos irnpredecibles o no pe-


ridicos.

El componente irreguiar puede deberse a fenrlerros como un clima poco usual, huelgas, guerras,
elecciones y cambios el las leyes, o por los errorcs qne se corneten al realizar Ias mediciones.

EI conrponente irregular de la serie histrica se identificr con el smbolo 1.

El principal uso de las series de tiempo es la realizaciu de pronsticos. En este captulo nos con-
centrarenros en Lrn conjunto de tcnicas de pronsticos conocidas como m,todos de atenuo,cidn de las
series, qne son fciles de implernentar y no requieren cle tcnicas matemticas sofisticadas.

L2.3. Atenuacin de series de tiempo

Las tcnicas de atennacin o su"auizamtento se enplcan para reducir las irregularidades; es decir, las
fluctnaciones aleatorias) en una serie de tiempo, proveyendo una visin ms clara del comportamiento
subyacente en la serie de datos.

En algulas series cronolgicas la variacin estacional es tan pronunciada que no permite apreciar la
tendencir o los ciclos, que soL muy irnportantes para entender el proceso observado. El suavizamiento
pu.ede rerrover Ia estacionalidad y hace que las fluctuaciories a largo plazo aparezcan ms claras.

Adeurs, con frecuencia, el analista quiere actualizar los pronsticos diaria, semanal o mensualnente
de manera rpida, barata y sencilla, eso se puede lograr mediante los mtodos de suavizamiento de
los datos.

Las tcnicas ms cornunes son el suavizamiento por prom,ed,i,os m,ui:les y eI suaui,zami,ento erponencial.
Cono el tipo de estacionalidad vara de serie a serie, as debe variar el tipo de suavizamiento empleado.

Estas tcnicas se basan en promedios ponderados cle rnediciones anteriores. La explicacin consiste en
que los vaLores pasados contienen informacin de 1o que ocurrir en el futuro. Debido a que los valores
anteriores incluyen fluctuaciones aleatorias, as como informacin relativa al patrn subyacente de la
variable en estudio, se hace un intento de suavizar estos valores.

Estos mtodos son apropiados cuando:

Hay que realizar pronsticos de muchas series.

2 Solanente se requieren pronsticos a corto plazo (hasta Lrnos cuantos meses)"


.)
Es aceptable una precisin razonable, rrras no exacta.

4. Desde el punto de vista costo/beneficio. no se justifican procedimientos ms complicados.

Teniendo en cuenta lo anterior, se pueden enumerar brevemente las ventajas y desventajas de


ntodos de pronstico por suavizamiento:

Ventajas

1. Simplicidad, facilidad de comprensin.


72.3. Atanuacin de series de tiernpo

Precisin aceptable (pcro de ninguna lrlauera cxactitud total) en una amplia variedad de apli-
ca(:10tles.

Fcil inplementacin infonntica.

Desventajas

1. Por k general, requicreri de un sistema horrrbre/r.nh<rirra, cclu vigilarrcia mannal y posibilidades


de invalidacin.

2. No pronostican los pr,rntos cr-ucialcs, cu.ariclo ha1' '1m1,ius bluscos en cl patrn de los datos.

3. Sc aplican solo cn 1os pronsticos a corto plazo.

4. Puedcn reaccionar cxcesivanente al azar-. calrsando oscilaciones destructivas.

5. Pucclerr presentar problcmas tcnicos en 1- sclcccin del moclclo corlecto y en la seleccin de Ias
coustantes de snarrizamienlo.

12.3.1. Suavizamiento por promedios rnviles


Los datos histricos se pucden aterrlrar en rnuchrs forrnils, pero siempre con el objetivo de usar los
cltrtos disponibles para desarlolirr un modelo dc plonstico para pcriodos ftttulos.

El mtodo ms simple e intuitivo es usar el pronredio sirnple, consistentc cl cncontrar la media arit-
n'rtica cle todas las observaciones y tisarlo para pronosticrr el siguiente peliodo; es decir,

Vr.
1)''
rt+I : t:l
<>
?1,

Este ntodo, en gcneral, tiene una validez muy lirnitacla ya qr-lc es aplicable cuando 1os datos no
I)r'esentan tendencia, estacionalidad u otros patrones sisterntic<ts.

Ejemplo. En el Cuadro 12.1sc presentan las observacriorres qne corrcsponden alas ventas trimestrales
de una errpl'esa en el periodo 2003 a 2006.

Pronosticar las ventas par-a el ro 2007.

Soluctn: El promedio de l<s 16 datos es igual a 556.6. Es clecir'. ?rr:556.6.

El valol del pronstico puede parecer bzrjo ya clue cr1 los plimeros trimestres de los irltinos arios las
tentas fucron nayores que el valor pronosticaclo. Adcnis. si deseamos un pronstico para cada uno
clc ios trimestres dcl arlo 2007, no podcmos hacello. Vclrros que el mtodo propuesto es insuficiente
pma nucstros propsitos.

En tnuchos anlisis, 1os clatos clue prcsentan nlt\or intcrs sorr 1os nrs recicntes ya que ellos darn
lnayor informacin del actual estado del proceso que aclut:llos drtos que fucron tornados al inicio del
tnismo. P'Lra realizar sto sc puedc cralcular el pronreclio para lrs observaciones ms recientes. AI
cstar disponible una nlle\a observacin, se puecle calculu' r-lna nlieva media eliminando el valor rls
arrtiguo e incluyendo el rls recientc.

Prra describir este cnfoquc sc emplea el trrliuo rrorucrlio (o rur:dia) rnvil. Entonces, se usa est,e
1-rlon-iedio mr.il prra pronosticru el siguiente pclioclo.
366 Capttrlo 72. Introduccin a Jas Series de Tientpo

Ao Tbimestre Ventas
I 1 598
2 2 390
.l
3 267
4 +1 ra,
J/()
2004 1 5 588
2 6 425
3 7 371
1 8 609
2005 1 I 777
2 10 32
J 1l 433
4 \2 689
2006 1 13 855
2 t4 618
L) 15 460
4 16 720
Cuadro 12.1: Datos correspondientes a las ventas tlimestrales de nna elnplesa.

La expresin matemtica de la rnedia mvil es

A,[t: y+t Y + Yt-t iYL z + "' + Yt +r


1L

doncle

A,,It promedio mvil en el periodo ;

?,*, valor del pronstico pala el siguiente pr:r'ioclo;

Y \alor real en el periodo tl y,


nirmero de tnninos err el promedio mr'il.

As, el promedio urvil para cl periodo es ir rnedir aritnrrl ic:r <lc las r obser\raciones ms recientes.

Obserrrcmos que el nittnero de perioclos que iuter\:ienerr clr cl cilculo dc nna media mvil palticuiar
no ciurbia al correr del tiernpo. Porsto, es inrportzrltr: cscoger ci nrrnero de periodos ??r qlre scl
clenoruina su orden. Para datos trimestrales es frecucnte clue se utilice rrn plomedio mvil de ordeu
4 y para clatos nensuales un promedio mrril <le orclen 12: cs clecir. se ernplea el misrno orden de la
estacionalidad dc la serie.

Ejemplo. (Continuacin) Realizar cl pronristico. urercliruttr nrcclirs mciviles. cle los clatos del Cuach'cl
72.7.

Solu,cin: Como los datos estn clados en forra tlirlestr'rl tonralemos una media mvil de or-clcl 11.

En el Cuadro 1,2.2 se encuentran los pronsticos pala la sr:r'ie completa.


Examinemos los clculos del plonstico del periodo 17:

A':rc : ?r, : hn -F Y15 I Y1a * Yi3

720+460+618+855
: 663.3.

Entonccs. para el primer trimestre del ao 2006 se espcr'r tener urr nivel de ventas igual a it :
663.3. Si comparanlos con las obsenaciones clc los riltimos airos, cl valor del pronstico es mucho ms
lazonable que el anteriormente obtenido, per-o persiste el problema de Ia realizacin de pronsticos a
mayor plazo.
72.3. Atenuacin de series de l,ienrpo 367

Pronostico de
Ventas Plomedio
Ao Trimestre t Y, rnovil, ?,
1198
22390
33267
44573
2003 15588 457.r
26425 454.5
t1
I Jf I 463.2
48609 489.3
2004 19777 198.2
2 r0 532 545.5
3 11 433 572.4
4 t2 689 587.7
2005 1 13 855 607.8
2 14 618 UT.J
3 15 460 648.8
4 16 720 655.6
2006 117 663.3
Cuadr-o 12.2: Pronstico mecliante pr:omeclio mvil.

L2.3.2. Suavizamiento por la rnedia mvil doble


Es una vari.ante del mtodo expuesto) que tiene rrayor efectividad cuando se dispone de una serie de
tiempo cuya tendencia es lineal. EI mtodo consiste en, primero, calcular un conjunto de promedios
urviles; y luego, se calcula un segundo conjunto colno plorrledio mvil del primero. La tcnica de
atenuacin por promedio mvil doble se realiza de la forma siguieute:

1. Se calcula el pronedio mvil (simple) de los clatos:

A,It : Y+Y:-fY z+"'+Y-r+t (12.1)


n

Daclo que NIr:?r+t, se Lrsa esta nueva serie para calcular un segunclo conjunto d.e promedios
mviles:
: AI I A[-1 + A'[t 2+ "' + A'I;,,+t (t2.2)
^rl
3. Se calcula Ia diferencia entre los dos promedios rnviles:

at:2AIt AI (12.3)

y ttu factor de ajuste adicional, similar a la medicin de una pendiente que cambia a travs de
la selie:
,
b,: ;t_ tQt, - tt',) . (r2.4)

4. Se forma Ia ecuacin que servir para realizar el proustico en p periodos en el futuro

Y+y,:cr"lb1P, (12.5)

Ejernplo. (Continuacin) Realizar el pronstico, con la tcnica de la prornedio mvil doble, de los
:latos del Cuadro 12.1.

Solttcin; Los resultados se presentan en el Cua,dro 12.3.

-\ continuacin se exponen los clculos para compr-ender el pronstico del trimestle 17.
368 Captulo 72. Introduccin a las Series de Tiempo

Promedio Pronstico
Periodo Verrtas Promedio mvil Valor Valor a+ W
t YL mvil doble de o de b (p: t)
598
390
267
tr73
457,1
588 454.5
42 463.2
37t 489.3 466.0 5t2.5 15.5
609 498.2 476.3 520.1 14.6 528.0
9 777 545.5 499.1 592.0 31.0 534.7
10 532 572,4 526.3 618.4 30.7 623.0
11 433 587.7 550.9 624.4 24.5 649.1
72 689 607.8 578.3 637.3 19.6 648.9
13 855 627.3 598.8 655.8 19.0 656.9
1.4 618 648.8 617.9 679.8 20.6 674.8
15 460 655.6 634.9 676.3 13.8 700.4
16 720 663.3 648.8 677.8 9.7 690.1
17 687.5
Cuadro 12.3: Pronstico por promedio mvil doble.

1. Se calculan los promedios mviles de cuatro trirnestres mediante la ecuacin 12.1:


Yrc*Ytr.lYtslY:n
A/[rc
4
855+618+ 460+720 : 663.3

2. Una vez que se ha realizado el suavizaniento por promedios mviles simples de toda la serie se
emplea Ia ecuacin 12.2para calcular el segundo promedio mvil de cuatro trimestres:

Mu : lV[rc * N[rc + N[t+ -f N[n


4
663.3 + 655.6 + 648.8 + 627.3
: 648.8.

3. Se usa Ia igualdad 12.3 para calcular la diferencia de los dos promedios rnviles:

&16 : 2L'1rc- A'I!6


: 2 x 663.3-648.8 :677.8.

La ecuacin 12.4 ajusta Ia pendiente:

bro : :- (16 - /6)


n- I
: 2
_, (6Of.f - 648.8) :9.7.
4

4. Realizarnos el pronstico de un periodo a futuro (ecuacin 12.5 con p: l):


u*r : a16l b16p
: 677.8+ 9.7 x 1:687.5.

El pronstico para el primer trimestre del ao 2007 es d,e?17: 687.5, que puede parecer ms razonable
que los dos resultados presentados anteriormente.
72.3. Atenuacin de series de tiempo 369

t2.3.3, Suavizamiento exponencial


El suavizamiento o atenuacin exponencial es un mtodo que se utiliza para revisar cr-rnstantemente
la estimacin de los coeficientes de un modelo de pronsticos con base en cada observacin sucesiva
real.

El rntodo plomediar los rralorcs anteriores de una serie, haciendo esto de forma decreciente,
se basa en
zrsigrrtruclo nlayor peso a las ms recientes. Las ponderaciones empleadas se designan cotllo a (0 <
rl < 1) para la observacin rns reciente, a(l - a) para la siguiente ms reciente, a(1 - q2 para la
signierrtc, y as sucesiva[rente.

El rnboc1o de clculo de los pronsticos es el siguiente:

nlrevo pronstico: cv x (nueva observacin) + (t - cv) x (pronstico anterior),

de rnanera qr.re la ec;uacil de la atenuacin exponencial cs

?r*r:aY+(1 -.)?,,

clon<1e

i,*r : rme\o valol atenuado o valor del pronstico para el siguiente periodo;
v: colstante de atenuacin (0 < a < 1);

Yl : qs1' obsenacin o valor real en ei periodo ;

?, : .rulo. atenuado anterior o experiencia promedio de la serie atenuada al periodo - 1.

Uua mejor interpretacin de Ia ecuacin que define el suavizamiento exponencial se puede ver en la
siguiente dcscomposicin:

?,*, aYt + (1 - a)Y, : a)' iY - aY


?,+ *(v,-?,\.
\ '/

error (n - ?r\
r- antelior lfr)
\-'/ '"*" "'"..'^ \- -')'
Lr ttcrrtracin exponencial es sirnplemente
"- el
.-^ pronstico a veces el
"rr
ert el prortstico auterior'.
La coustante de suavizatlieuto a sirve como el factor para ponderar, El valor de cv determina el grado
llastr el cual 1a observacin ms reciente influye err el valor del pronstico. Cuando rr es cercano a 1,
ett el rruevo pronstico Ia observacin ms influyente ser Ia rns reciente. Inversamente, cuando a es
cercallo a 0, en el pronstico influirrr todas las observaciorres de rranera similar.

IJn rntodo para estimar cr consiste en encontrar aquel valor que minimiza el error cuadrtico medio
(ECM):
17

t
. ',
(r -?,)
ECM: t:I
1
11,

para diferentes valores de a. Para generar pronristicos firturos se clige el valor de a que prodr.rcc el
cr-ror ms pequeo.
370 Captulo 72. Introduccin a las Serjes de Tientpo

Err la siguiente tabla se preseutan los clculos clc los valores dc las ponderaciones para dos valores cle
o, En clla se puede observaL cmo influyen los valorcs pastrdos cr los pronsticos, en dependencia de
a.

a:0.1 a :0.6
Periodo Clculos Ponderacin Clculos Ponderacin
t 0.100 0.600
t-I 0.9x 0.1 0.090 0.4 x 0.6 0.240
L_: 0.9x0.9x0.1 0.081 0.4x0.4x0.6 0.096
!t
l,-L) 0.9x0.9x0.9x0.1 0.073 0.4x0.4x0.4x0.6 0.038
Los lestantes 0.656 0.026
Total 1.000 1.000

Ejemplo. (Continuacin) R,ealizar el pronstico, rnediantc suavizamiento exponencial, de Ios datos


clel Cuaclro 12.1.

Solucin: Los resultados se presentan en el Cuadrc 12.4 con r.alores de la constante de ateuuacin de
0.1 y 0.6.

Vaior Errol cle Valor Errol de


Ventas suavizado prortostico stravizado pronostico
Yt ?, 1": o.r ?, 1o : O.O; ei
1 598 598.0 598.0
2 390 598.0 -208.0 598.0 -208.0
3 267 577.2 -310.2 473.2 -206,2
1A <-t
JIJ 546.2 26.8 349,5 223.5
5 588 548.9 39.1 483.6 t04.4
6 425 552.8 -r27.8 546.2 -L2L.2
7 37t 540.0 -169.0 473.5 -102.5
8 609 523.7 85.9 4r2.0 197.0
I 777 531.7 245.3 530.2 246.8
10 532 556.2 -24.2 678.3 -146.3
11 433 553.8 -120.8 590.5 -I57.5
12 689 54r.7 t47.3 496.0 193.0
13 855 556.4 298.6 611.8 243.2
14 618 586.3 3t.7 757.7 -739.7
15 460 589.5 - 129.5 673.9 -213.9
16 720 576.5 143.5 545.6 774.4
17 590.9 650.2
EMC: 27902.7 EMC: 33 991.3
Cuadro 12.4: Valolcs atenuados exponerrciahneute.

La serie atenuacla se calcula asignando iniciahnent r, ?, : 598, que cs el primer valor observildo, a
continnacin Los clculos se rerlizan de Ia siguiente ntaDera:

?r-, : nY1_(f -.t)Yt


?, : (0.1)598 + (0.9)598 : 598.

El cllor-de pronstico es
e2 : Y2 - ?, :3g0 - bg8 : -208.

Pr'r cl pcrioclo 17, rcsrrlta


72.3. Atenuacin de series de tientpo 37L

?n : oY16l (1 - *)a
: (0.1)720 + (0.9)576.5 : 590.9.

Con sinrilares clculos, para una constante a:0.6 el pronstico del periodo 17 es?y:650.2.
Para definil cul de Ios dos plonsticos es el ms aceptable, se puedel comparar los errores cuadrticos
nrcdios cle lrs series.

L2.3.4. Suavizamiento exponencial doble


La tcnica de suavizarliento exponencial doble. tarnbin conocida como mtodo de Brown, se emplea
prra pronosticar series que tienen una tendencia lineal y cs semejante al atenuamiento por la media
mr'il doble.

Primero, conviene que tengamos en cuenta que debido a qlle los valores de la serie no son pronsticos
en s rnismos, Ias ecuaciones de actualizacin son ms comprensibles si se adopta la siguiente notacin.

-{ : valor (simple) suavizado exponencialmente de Y er el periodo .

--li : valor doblemente suavizado exponencialmcnte de Y cn el periodo .

La tcnica de suavizamiento exponencial doble se realiza de la forrna siguiente:

1. Se calcula el valor sirnple suavizado exponencialmente, con el mtodo antes expuesto:

At+t: aYt,r t (l - a)At. (12.6)

2. Se calcula el valor doblerlente suavizado exporencialmente, realizando otro suavizarniento ex-


poncncial a los datos recin obtenidos:

Alt+t: aAt+t + (t - a)Atr. (72.7)

3. Se calcula la diferencia de los valores atenuados exponencialnente:

at:2At - Al. (12.8)

y un factor de ajuste adicional, sirnilar a la pendiente:

u,: f(At - A') ' (12.e)

l. Se folna la ecuacin para realizar el pronstico de p periodos en el futuro:

Yr*o: ct I bp. (12.10)

Ejemplo. (Continuacin) Realizar el prorstico, mediante suavizamiento exponencial doble, de Ios


i,rtos clel Cuadro 12.1.

:,llLtc'i,n,: Los resultados de los clculos se encuentran en el Cuadro 12.5.

-1. coltinuacin se pr-esentan Ios clculos correspondientes para el pronstico del periodo 17.
372 Captulo 72. Introduccin a las Series de Tietnpo

Valor Vrior Pronostico


Ventas suavizado suavizado Vr,lor Valor a I bp
t Y At A', dea de (p-t)
1 598 598.0 598.0 598.0 0.0
2 390 577.2 595.9 558.5 -2.r 598.0
3 267 546.2 590.9 501.4 -5.0 556.4
r+ o /.1 548.9 586.7 511.0 -4.2 496.4
5 588 552.8 583.3 522.2 -3.4 506.8
6 425 540.0 579.0 501.0 -4.3 518.8
-
/
q-1
,)/l
(ot 1
573.1 472.8 -5.6 496.7
8 609 531.7 569.2 494.1 -4.2 467.2
I 777 556.2 567.9 544.5 -1.3 490.0
10 532 553.8 566.5 541.1 -r.4 543.2
il 433 541.7 564.0 519.4 -2.5 539.7
12 689 556.4 563.3 549.6 -0.8 516.9
13 855 586.3 565.6 607.0 2.3 548.8
14 618 589.5 56E.0 611.0 2,4 609.3
15 460 576.5 568.8 584.2 0.9 613.4
16 720 590.9 571.0 610.7 2.2 585.1
I7 612.9
Cuadro 12.5: Pronstico por suavizamiento exponencial doble con cv : 0.1.

1. \''lediante la ecuacin 12.6 se calcula el valor de la atenuacin exponencial simple de la serie


inicial (columna 3):

Arc: aY16]_ (1 - cr)415


(0.1)720 + (0.9)576.5 : 590.9

2. La ecuacin 12.7 se usa para calcular el valor doblemente suavizado exponencialmente (columna
4).

A','u
: .',&;J;; ;,, B:571 0

3. En la colunna 5 se calculan las diferencias entre los valores atennados exponencialmente, me-
dirnie Ia igualdad 12.8:

arc: 2A16 - A'6


2(590.9) -571.0:610.7

4. Con la ecuacin 12.9 se calcula el vaLor rdicional cle a.iuste (columna 6).

brc: ,L (Y
-
=(A,o-Aio)
0.1
(590.9 571.0) :2.2.
U 9
-
5. Finalurente, se empiea Ia igualdad 12.10 para hacer el pronstico en el futuro:

u*r a16 i b6p


: 610.7 + 2.2(1) :612.9.
72.3. Atenuacin de series de tiernpo 373

12.3.5. Mtodo de Holt


El mtodo de Holt es una tcnica que se emplea para manejar series de datos que tienen una tendencia
Iineal pero que no presentan estacionalidad. La tcnica atena en forma directa la tendencia y la
pendiente utilizando diferentes constantes de suavizamiento para cada una de ellas. Por esta razn,
el rntodo presenta mayor flexibilidad al seleccionar los modelos.

La tcnica consiste de los siguientes pasos:

l. Se suaviza la serie mediante el mtodo exponencial:

At : aY + (1 - a) (At-t + Tt_t) . (12.11)

2 Se estima la tendencia:
Tt : 0 (A, - Ar_t)+ (1 - p)Tr*t. (r2.12)

3 Se realiza el pronstico de p periodos en el futuro:

Yt+p: At * PTt, (12.13)

donde

A : nuevo valor atenuado;

a: constante de atenuacin exponencial de los datos (0 < r < 1);


Y : nueva observacin o valor real en el periodo ;

: constante de atenuacin para la estimacin de la tendencia (0 < 0 < I);


7r : estimacin de la tendencia;

i+o: pronstico de p periodos en el futuro.

La primera ecuacin es similar a la igualdad original de atenuacin exponencial simple, con excepcin
de que se incorpora el trmino (") para la tendencia.

En la segunda ecuacin se toman dos valores sucesivos de atenuacin exponencial, ya que ellos se
atenuaron con fines de eliminar la aleatoriedad, su diferencia constituye una estimacin de la tendencia
local de los datos. Se atena esta tendencia con la constante B y se le suma la tendencia anteriormente
calculada multiplicada por 1 - B. EI valor obtenido es una tendencia atenuada que excluye cualquier
aleat oriedad.

La ecuacin del pronstico suma el nivel actual de los datos A y el producto de la tendencia T por
los p periodos.

Notemos que para iniciar la iteracin, se toma At:Yt y Tt:0.


Ejemplo. (Continuacin) Realizar el pronstico) con el mtodo de Holt, de los datos del Cuadro
72.7.

Solucin: Los resultados de los clculos se encuentran en el Cuadro 12.6.

Examinemos cmo se realiza el pronstico en los periodos 2 y 77 con a : 0.3 y 0 :0.2.


374 Captulo 72. Introduccin a las Ser"jes de Tientpo

Valor tle Ia Valor de la Pronstico


Ventas actulizacin terrdenci
" lAp
Yt At TLY
1 598 598.0 0.0
2 390 535.6 -L2.5
3 267 446,3 oaa 523.1.
4 573 464.8 -18.6 4t8.4
5 588 488.8 - 10.1 446.2
6 425 462.6 - 13.3 478.7
7 371 425.8 -r8.0 449.3
8 609 468.2 -5.9 407.8
I 777 556.7 13.0 462,3
l0 o32 558.4 t0.7 569.6
11 433 528.2 2.5 569.1
t2 689 578.3 t2.0 530.8
13 855 669.7 27.9 590.3
T4 618 673.7 23.t 697,6
15 460 625.8 8.9 696.9
16 720 660.3 14.0 634.7
t7 674.3
Cuaclro 12.6: Pronstico mediante el ntodo de Holt.

1. Clculo de1 valor de la actualizacin de la serie. Para iniciar el proceso tomamos Ar : }i :


ft:0:
A2 : cvYz I - ") (Az-, -l Tz_t)
(1
: 0.3(390) + (1 - 0.3)(598 + 0) : 535.6.

2. La estilnacin de la tendencia:

Tz: 0 @z -
Az_l) + (1 - 0)Tz t
: 0.2(535.5-598) +(1 -0.2)0: -r2.5.

3. El pronstico de un periodo en el futuro:

?t*, : AzrPTz
: 535.6 + (1)(-12.5) : 523.1.

Con el mismo proceso para el periodo 17 tenemos:

1. Actualizacin de la seric:

Arc aY16 t
(t - r) (Arc-t +
"ro-r)
0.3(720) + (1 - 0.3)(625.8 + B.e) : 660.3.

2. Estimacin de la tendencia:

Tte : 0 (Arc Aro-r) + (1 - 0)Tu


: 0.2(660.3 - 625.8) + (1 - 0.2)8.9 : 14.0.

3. Pronstico de un periodo en el futuro:

u*'
: !;;!?{^o)(1): 6T4s
72.3. Atenuacin de series de tiernpo 375

12.3.6. Mtodo de Winters

La atenr-racin por el mtodo de Winters es apropiada cuando la serie presenta una tendencia lineal
y una variacin estacional. Es una extensin del rnodelo de Holt, en la que se utiliza una ecuacin
adicional para estimar la cstacionalidad nediante un ndice estacional.

Los pasos que se siguen en este rntodo son:

1. Se suartiza la serie exponenciahnente:


Y
A': oiJ- (1 - s)(At r +?r-r) (12.14)

2. Se estima la tendencia:
Tt:0(Ar-At_t) +(1 - p)Tt_t. (12.15)

Se estina la estacionalidad:
c,- Y'
^,i*(1 -r)5-. (12.16)

Se realiza el pronstico de p periodos en el futuro:


Yt+p : (At + TtP) St-r+p, (12.77)

donde

A : ttr,evo valor atenuado;

cv: constante de atenuacin (0 < a < 1);

Y : 1111s1r observacin o valor real en el periodo ;

, : constante de atenuacin de la estimacin de la tendencir (0 < 0 < l);


4: estirnacin de la tendencia;

7: constante de atenuacin de Ia estimacin de la estacionalidad (0 < f < 1);


S : estimacin de la estacionaiidad;

-L : longitud de la estacionalidad;
)i+p :
?.
proristico de p periodos en el futuro.

Otsrvesc que el ndice estacional ^9


se calcu.la tornando en cuenta el ndice estacional S-, corres-
pondiente a tr periodos anteriores, y gue para iniciar la iteracin se toma Ar:Yt, ?r:0 y Si.:1,
cuando el ndice k no es positivo.

Ejemplo. (Continuacin) Realizar el pronstico, mediante el rntodo de Winters, de los datos del
Cuadro 12.1.

Soltctt: Los resultados de ia aplicacin de la tcnica se encuentran en el Cuadro 12.7.

Para comenzar los clculos, verios que la longitud de la estacionalidad es -L : 4 y que se requieren las
estimacioncs inicialcs del valor atenuado, de la tendencia y cuatro estimaciones de la estacionalidad.
Para principiar el proceso de clculo, usaremos 598 como valor inicial de la actualizacin, 0 cono el
vakr de la estirnacin inicial de la tendencia y 1 como la estirnacin de la estacionalidad.

Analiceuros los clculos de los periodos 2 y 17, utilizando los r,'alores de a: 0.3, P:0.2 y ?:0.1.
376 Captulo 72. Introduccin a las Series de Tiernpo

Valor de la Valor de la Valor de la Pronostico


Ventas actualizacion tendencia estacionalidad a* bp
Yt A TtStY
1 598 598.0 0.0 1.00 598.0
2 390 535.6 -r2.5 0.97 598.0
3 267 344.4 -48.2 0.98 598.0
4 573 325.0 -+.4. 1.08 598.0
5 588 547.8 10.6 1.01 282.6
6 425 550.1 8.9 0.95 543.2
7 37r 4I7.6 -19.3 0.97 546.4
8 609 415.9 -15.8 Lt2 428.6
I 777 646.6 33.5 1.03 403.0
10 532 734.8 44.4 0.93 648.0
11 433 C Lll -3.9 0.95 754.8
12 689 485.7 13.5
- 1.15 595.1
13 855 722.7 36.6 1.04 484.9
t4 618 823.5 49.4 0.91 706.0
15 460 612.r -)7 0.93 831.3
16 720 508.7 -22.9 I.I7 698.0
l7 637.2
18 556.0
19 566.7
20 698.8
Cuadro 72.7: Pronstico mediante el mtodo de Winters.

1. Clculo del valor de la actualizacin de la serie. Para iniciar el proceso tomamos At : Yt, Tt : 0
Y Sz_,+: I:

A2 :
"3J24 + (1 - o) (Az-t -t Tz-t)
: o tfS + (1 - 0.3)(5e8+o) :53b.6.

2. La estimacin de la tendencia:
T2 : 0 @z - Az_t) + (1 _ p)Tz_t
: 0.2(5355-598)+(1 -0.2)0: -t2.5.
3. La estimacin de la estacionalidad:

Sz: ^,*,*(1 -r)Sz-a


390
= O t"rr" +(t -0.1)I:0.97.
De manera setnejante, tenentos para el periodo 16 y los sucesivos pronsticos:

1. Actualizacin de Ia serie:

Arc: ",;]Yrc + (1 - a) (Aro-r + ?ro-r)


0 J2 + (1 - 0.3)(612.1 + (-2.7)) :614.4t.
1.15

2. Estimacin de Ia tendencia:

Trc: 0 (Arc - ,4ro-r) + (1 - p)Trc,,


0.2(.614.4r - 612.1) + (1 - 0.2)(-2.7): -1.698.
72,4, Cornparacin de los rntodos 377

3. La estimacin de la estacionalidad:

,5ro : t#1It6 +(1 -.y)Sro-


: -
,,
u.t
720
+ (1 - 0.1)(1.15) : 1.15.
6rL4r
4. Pronsticos:

a) De un periodo en el futuro, p : li
u*, : (1ro + Trcp),9ro-+r
1614.41 + (-1.6e8)(1)l (1.04) : 637.2.

b) De dos periodos en el futuro, p:2:


?ru*, : (Aro + Trcp) Src-++z

1674.41+ (-1.6e8)(2)l (0.e1) : 556.0.

c) De tres periodos en el futuro, p:3:


u** : (ro * Trcp)^9ro +s
1674.4r + (-1.6e8)(3)l (0.e3) : 566.7.

d) De dos periodos en el futuro, p: 4:

Yta+a : (Aro + Trcp) Src-+++


: 1614.4r + (-1.6e8)(4)l (1.15) :698.8.

El mtodo de Winters presenta la ventaja sobre los otros mtodos en que podemos realizar pronsticos
por ms periodos (por lo menos por un ciclo completo de estacionalidad).

Hemos expuesto varios mtodos sencillos de pronosticacin de series de tiempo. En este punto surge
la siguiente inquietud: cul mtodo ernplear?

L2.4. Comparacin de los mtodos

Primero tengamos en cuenta que no existe un mtodo qtle sea el mejor en toda ocasin. La eleccin
del mtodo depender del conjunto de datos que se disponga y de la finalidad de los mismos.

La comparacin de las tcnicas de atenuacin se realiza rnediante el error cuadrtico medio que, como
.va se indic, se calcula por
n
2 t
t (t'-Y) >,"7 ^r2
t:7
ECM: tl
I

donde e es el error de pronstico para cada una de las observaciones de la serie. Entonces, podemos
enunciar la siguiente regla:

lAquel mtodo que proporcione el menor ECM ser el ms apropiado para la serie de tiempo que
lse analiza.

Ejemplo. (Continuacin) Para los datos del Cuadro 12.1 veamos cul es el mtodo ms apropiado.
378 Captulo 72. Introduccin a las Series de Tiempo

Solu,ci,n: En el siguiente cuadro se encuentra el resumerr de ios rntodos analizados con su ECM.
Mtodo Parrnetros ECM
Promedio mvil simple 20826.2
Promedio mvil doble 24834.8
Suavizamiento exponencial cv: 0.1 27 902.7
Suavizamien to exponencial a:0.6 33 991.3
Suavizamiento exponencial doble a:0.1 29 547.4
Mtodo de Holt a : 0.1, D
t): 0.2 31634.7
NItodo de Winters a : 0.1, a 0.2, 1 : Q.1 54548.9

De los resultados, aparenternente, el rnejor mtodo es el prornedio rnvil simple y el pronstico basado
cn l sera el apropiado.l

Depeldiendo de las observaciones se sugiere que se utilicen los modelos:

Exponencial. Si la serie no tiene una tendencia marcada y no muestra variacin estacional.

Holt. Si Ia serie tiene tendencia lineal pero no muestra estacionalidad.

Winters. Si la serie tiene tendencia lineal y nuestra variacin estacional.

Respccto a Ios parmetros de suavizamiento debemos indicar que ellos siempre varan entre 0 y 1.
Para cada constante de atenuacin, cuanto mayor sea su valor, tanto mayor importancia se le dar
a la obselvacin ms reciente. Tngase plesente cre la mayora de Ios programas estadsticos que
disponcn de estos mtodos tienen implenentados algoritmos que escogen automticamente la combi-
nacin de parmetros que dan el ECM mnimo, lo que permite tener una estimacin apropiada a las
observaciones disponibles.

Se aconseja al lector que implernente las frurulas de los dir.ersos mtodos en una hoja electrnica, lo
que Ie facilitar la realizacin de los clculos.

L2.5. Ejercicios
1. Eu una academia de idiomas se sigue un sisterna trirlestlal. El nrmero de alumnos que estudian
el idioma esperanto en cada trirlestre, durante 4 aos, se resume en Ia siguiente tabla:

Ao Tbimestre No. alumnos Ao Trimestre No. alumnos


1 110 3113
2 31. 234
343 348
476 479
2 1 11 4 115
.) t.) t-
tJ ,)l
345 351
417 427
a) Grafique los datost
N'Iediante los ntodos qlre se indican, realice el suavizamiento de la serie y el pronstico al
periodo serlalado. Tambin, calcule el ECM respectivo.
tConlc.' cl objetivo del ejemplo es ilustlal cl funcionamiento cle
las tcnicas, los valoles cle los palruett'os cle suaviza-
tuiento sc tonlar-on cle tlanela albiti'aria; ellos r-ro son los ptimos pala ninguno cle los lr-rtodos
72.5, Ejercicios 379

b) promedios mviies de orden 4 y p: I;


c) rnedia mvil doble dc orden 4 y p : I;
d) suavizamiento expolencial con cv :0.2 y p : l'.
e) suavizarniento exponencial doble con a:0.2 y p:1;
f) mtodo de Holt coll cv :0.2,0 : 0.3;

g) rntodo de Wintels para cuatro trimcstres, con cv : 0.1, 0 :0.3 V ^/ :0.4.

Las ventas trimestrales de casas que ha lealizado una cornpaa inmobiliaria en Ios ltimos aos
se presenta a continuacin:

Ao TYirnestre Ventas Ao Tbimestre Ventas


1 1 50 4 1 55
DF
2 Jd 2 35
.) 25 25
4 40 4 55
2 1 45 1 55
2 35 2 40
J 20 35
4 30 4 60
o<
3 1 L)d 6 1 75
2 20 2 50
e 1r
1J J 40
4 40 4 bl)

a) Grafique los datos;


N4ediante los mtodos indicados, realice el suavizamiento de la serie y el pronstico al
periodo sealado,
b) promedios mviles de orden 4 y p : 7;
c) media mvil doble de orden 4 y p : I;
d) suavizamiento exponencial con a : 0.1 y p: l;
e) suavizamiento exponencial doble con a : 0.3;

f) rntodo de Holt con rl - 0.3, 13


:0.25;
g) mtodo de Winters para cuatro trinestres, con cv:0.4, 0:0.7 y ?:0.3;
h) Encuentre el rnejor rntodo de ajuste nediante el criterio ECM.

En una universidad se implant el sisterna de estudios cuatrimestral. EI nmero de alumnos


matriculados en la materia de geometra se presenta a continuacin:

Periodo Alumnos Periodo Alumnos


1
r/l I 101
2 58 l0 103
a
d rlD li r02
4 72 t2 110
5 fJ 13 IT2
6 7r 14 111
I 93 15 728
8 94
380 Captulo 72. Introduccin a las Series de Ternpo

a) Grafique los datos;


Mediante los mtodos indicados, realice el suavizamiento de la serie y el pronstico al
periodo sealado.
b) promedios mviles de orden 3 y p : 1;
c) rnedia mvil doble de orden 3 y p:7;
d) suavizamiento exponencial con a : 0.4 y p: L;

e) suavizamiento exponencial doble con a:0.4 y p: I;


f) mtodo de Holt con 0 : 0.35, F :0.15;
g) mtodo de Winters para tres trimestres, con a :0.2, 0:0.15 y 7:0.1;
h) Encuentre el mejor mtodo de ajuste mediante el criterio ECM.
Captulo 13

Elementos de Muestreo

Pot'un per1ue,o ltcrl,o,zo tl,e tn,u.estru. pod,e'nr,os .ju,zqa,r a Lo" piezo, r:otn,'pleto,
Miguel clc Cervantes Saavedra

Clonro sc inclic en el Captulo 1, en mnchos estrrclios cstadsticos lr lccoleccin cle la infolmacirr


sc lealizr mediintc Ia invcstigacin pol nruestLcc.l )/ sc sacan colclr-rsionos con brse cu la <<ilfeleucia
cstrclsticr>>.

Ilstc ca1>tulo csti dcdicaclo a cxponel los mtoclos bsicos cmpleaclos cn lrs invcstigaciorlcs pol'
rrrLrcs'iLco. I)elo rlo solo en Io ciue tiele cluc vel con 1a par-te estaclstictr, tambin se clatr algtttrtrs
inclicaciorres par'r la realizrcin pr'cticir cle los sonclcos.

13.1. Conceptos bsicos

En las irivcstigaciorles cllyo objertivo cs la lecopila<:in c1e infonnrcin cslrrlstic sobrc rrn glullo cle

l)orsor)rs o cosas) sc clist.irtgnen rlos tipos clc cstuclios:

1 Lr cncucsta total o censo, cuvo objeto cs cruninar a toclos los eienrcnbos dc la pobiacin.
2 La cncuesta palcial () l)or- ruuestreo. cluc tir:nc por objeto examinal uua partc pequcrla rle la
poblacin, e infelil rcsullaclos pala aplicar'los r 1a poblacin conplcta.

Acrr apaleccn clos conccptos rluc fi'ccucntcncntc rrtilizalernos: la poblacitr (o univcrr-so rnucstlal) y Ia
rrrlostr t.
Dclinicin (de poblacin) Unir 1;oblacirirr cs rulr c:olcc:ciu cornplirlir clc pclsorts. uriuralcs,
plrrrt:rs o cosls de las cnrles se rlesea rccolccttl cltos.

Definicin (de muestra) Es un grlrpo de rrni<laclcs sclcccriourrlas <lc un grupo nrayor (la
pobltrcin).

Pol el estrrdio clc la rrnrcstrl so csper'r obtcncl'uorrt:ltrsiorrcs soblc lir pol-ililr:i1 .

En ilnchos casos la clcccin clc un:i mtLestr'r cs ficil: pol ejerlplo. prrl conoccl la plopoicicirt r.Ll

<lespclclicio cll llrl srco cle maz o parr colloccr cl nrinrclo cle piczars clcfcctlLr-slLs cn un lote clc plodlLtt,.-,s.

381
382 Captulo 73. Elententos de I\[uestreo

etc. Bastu mezclar bien los ploductos )' tourar ttna pcclttetia paltc cle ellos. Lo clue se deduzca de
cstir pecluea polcin (o muesir-a) ser-vir pala ,juzgar a la totalidad clel producto.

Par'r conocerla preferencia clc Llna rrarca de gaseosa por palhe dc los corrsumiclores, o el tiempo que
Iu poblacin declica a mirar Ia televisin o cl favoritismo por cicrto particlo poltico entre los votantcs,
cs rns complicaclo. Los elementos son ms hetelogneos )'serr imposible aplicar el mtodo clesc-.-ito
pala tomal una mnestr-a, como se hace con los plocluctos.
Aunque Ia muestra poclra tonralse corno Lul subcorrjunto cr.ralcluicra cle la poblacin, en una iuvcsti-
gacin es necesario que cr-rrnpla cor ciertos requisitos. parr c.lc rros pro\ea de inforrnacin colfiable
sobre Ia poblacin. La mlrestla ira de ser Llrla rcproduccin cn peqneo cle la poblacil. As. ha de
sel' nn Ecuador, un Guayas o un Quito en ruiniattua, si se tratr cle ul sondeo relativo al Ecttador, o
l:r. provincia clel Gr-rayas o a la ciudacl cle Qr-rito.

Pcro. cmo hacer para qlrc lr mncstra sea una copia. cn pcc.rco, de la poblacin? La respttesta cs
qrrc ln rluestla debe cstal coustituida por uu. nrmelo suficicntc cle elernentos, tomados al azi'tr', clc la
poblacin.

Pala lr correcta eleccin de la muestla, el] plirrel lugal cs necesalio hacel nna lista de los ob.jetos cle
lr c:ual se la seleccionar', hrego se proceder a sortearlos para incluirlos clr la nruestra.

Ilntonces, tenenlos las siguientes clcfiniciones:

Definicin (de unidad rruestral) Los objetos que se scleccionan dc una poblaciu se llauran
Luriclrdes mnestlales.

Definicin (de marco muestral) IJn malco muestral es nlla lista courpleta dc todas las uriclades
rnuestrales de la poblacin.

Por ejemplo, se desca conocel las prefer-encias electorales de toclos los rniemblos aclultos de Ia ciudacl
clc Arnbato. La poblacin esti constituida por todas 1as persorras cn capacidacl cle r:otal que viven eu
Ambato. El marco uruestlal es una lista complcta con los nolnbres de cada miembro de la poblacin
(cl pachn electoral). Una uuiclad uruestral cs tin residentc cr. Ambato y qnc cst crr capacichcl de
r.otAt.

Obselveuros que IIo siemplc cs posible tener nn lllarco rnuestlal pelfectameutc clcfinido) ya scr polqrle
st,c es urtty glaude) o l1o cxislc, o rlo se lo pucdc colfcccionar', \{1s arn, solo cr-ranclo la poblacirr cs
pcqrtcria o coutt'olablc por cl invcstigador, es posible corrtar con Lrr. rnarco muestral ideal. Preguut-
nronos: quiu podra clabolal nna lista de toclos los individuos, o dc toclas las falnilias, que vivcu cri
Grrayacril?

Anl-cs cle telurinal', tcLretnos cre t'cferirnos a las convcnicncias y a las liruitacioncs cle las rnneslr'rs) con
lcsJrecto a la reilizacin clc Lut cjenso.

Ventajas de tomar muestras:

1. Sorr urs ccorrrui('ns.

2. Se emplea rrenor ticmpo cn la rccolcccin de Ios clatos.

3. Sc obticnc rrna rncjor caliclacl cic infolnrcirln

Se ernplea cuanclo la lioblacirr es glanclc o prrede consiclcr'rlsc iufinita.


I
rJ Sort aplopiaclas clranclo cl ploceso clc rriediclr cle cada elcmcnto cs clestlucbivo o conllcvrr riesgos
r la salud.
73.2. Muestreo aleatorio sitnple 383

Limitaciones de torlar mucstras:

1. Si se necesita ilfornacin cle todos los elenentos qrre conforman el ruriverso estadstico.

2. Si se rec-riere informaciu rnny clesagregaclr) prrl reas lntr\' pccluciras.

3. eristcn los clcruorrl,os tcriicos


CLrarrclo no v luniuros qr.re girutruticerr Lul Jrucn cliseo lnueshr'rl v
rura buena ejecuc:in clcl sorrdco.

A corrliurracin expondrclllos ios plincipirlcs tipos cle iln'cstigrciorrcs pol rnrrcsl-r'co, qilc sorr cl alertoricr
sirnrlc. el cstrrtificirdo ' l clc conglornelados.

I3.2. Muestreo aleatorio simple


Conro se dijo, un bucn cliseno nruestlal lequierc cluc los elernentos cscogiclos sean tomaclos al azar'.
Con sto garantizanros c.rc la mucstra leplesentc a 1:r poblaciu v clue las infelcncias a lealizal searr
r'iliclas. Al cxanen cle cste l,ipo de investigacin dcclicarerlos csta seccin.

La mar-ora de sondeos tienc uno cle los tr-es ob,jetivos siguientcs: cstinal cl total poblacional r, o
c.stirn,r la mcclia de nna poblacil p, o cstimar la plopot'cin pol-rlacional p.

13.2.1. Estimacin del total poblacional


Si urrir poblacirr csb1 c:onst,i hLicltr por'lV uniclrcles, cle las cuales intclesa rncclir el calacber':u clc cacla
nno: 21. i2, ..., i,JN. Dl tttrl Po)tllciontrl sc clcfinc 1-rclr'

t:fu:Nt,
r.:1

clonclc ,u cs Ia, mcdia poblaciorral.

Pol ejemplo, cn Ltra cncltcsl-l lcilizadr los grrstos cri salucl clc los habitantes clc uua
palr,L csbirrrrl
cir.iclacl. se investigara cl gersto mcclio por pcrsona, l, que lcalizan cn Lrn arlo; o tzrrnbin, ltucde scl cle
intcr's cl gasto tobal, r, cluc sc rcaliza en dicho pobiado por corccpto cle salucl.

Intelvalo cle confiauzr

ilrtcn'alo palir cl total Tr l rlc corrfiurza r-lcl (1 - a) x 100 % cs

Donrlc:

-\ cs el lrllelo cle clcurentc's c.rr la poblacin.


r cs cl nrlmelo clc clcmcltos cu la ulrestra.

? es la cstinacin clcl toLl roblacional: ? : ly'z


384 Captulo 73. Eletnentos de Muestreo

7 es el prornedio de la m.uestra.
s es la desviacin estndar de la muestra.
Q
zo2 eI coeficiente de la ley normal estndar1 para el cual el rea en el extrerno superior es igual a-
2

Tamarlo de Ia muestra

La cantidad clue hay que sr.rmalle o restarle a un estimador, en la coufeccin del intervalo de confianza,
se denomina error. En nuestro caso

De aqu, si se desea tener una estimacin al nivel (1 - .) x 100 % dc confianza, con un error E" dado.
a partir de una muestra obtenida de una poblacin de tamao l/, el nrmero de unidades a incluir en
el sondeo es
(r*21{ r)2
n] + (2,,z)' Nr'
trjernplo. Una empresa de telefona celular desea estimar el tiempo total que se emplean sus lneas
errun fin de semana. Se seleccion al azar una muestra de 420 clientes, de los 62000 que haban
hecho uso de sus telfonos y se registr el tiempo de uso. El tiempo proneclio y la desviacin estndar-
de la muestra fueron z:3.61min y s: 1.2Bmin. A un nivel del 95.5%: a) obtener un iltervalo
de confianza para el tiempo total de uso de ios telfonos ese fin de semana; b) Considerando una
desviacin estndar de 1.25. calcular el tamao de la muestra para qne el error sea menor o igual a
20 000 minutos.

Soluctt:

a) Para este ejemplo, ly' : 62 000, n: 420, T : 3.61, s : 1.28 y zo.ozzs:2. Entonces,
i : Nr: 62000 x 3.61 :223820

El intelvalo es

62 000 x ooo x
(,,,r,, -, 1.28
;223 B2o * ,62
\/ 420
1 '28

o sea (216 100;231 540).


Por lo tanto, se estima que el tiempo total de uso de los telfonos est entrc los 216 mil y 231
mil minutos.
b) Con s :7.25 y E,:20000, se tiene:

4N2 s2
'" E? t 4l\t s2
4(62 oo0)2(7.2q2
:60
(20 000)2 + 4(62 000)(1.25)2

Se uecesitar consultar al menos a 60 clientes.


lllrr la prctica se utilizan valoles d.e :o12 igr-rales a 2, cuanclo se tlabaja con ru)a confiabilidad clel g5.5 r/o, o a'i,
ctrar.c1o la confiabiliclacl es clcl 99.7%.
73.2. Muestreo aleatorio simple 385

L3.2.2. Estimacin de la media poblacional


Como se dijo, puede ser necesario estirnar la rnedia poblacional, mediante la inforrnacin obtenida en
un sondeo; por ejemplo, cuando se afilura que el nivel medio de escolaridad en el Ecuador es de 7.5
aos, o si se desea conocer el consumo medio anual de caf de la poblacin adulta en una localidad.

Intervalo de confianza

El intervalo para la rnedia poblacional i, a un nivel de confianza del (1 - CI) x 100% es

-, : ;o/2 " /F:7\


V t ttl - )

Tamao de la muestra

El tamao de la muestra necesaria para tener rln error prefijado Er, a un nivel de confianza de nivel
(1 - r) x I00To, a partir de una poblacin de tamao Iy' es:

( :^.,,\2 N s2
,,_
NEu_\rq2)r"2.

Ejemplo. En un estudio ndico sobre el consumo de tabaco, por la poblacin adulta, en una ciudad
de nn r-nilln de habitantes aclultos, se consult a 120 personas. Los resultados de Ia investigacin
mostralon ttn consumo promcdio diario de 3.8 cigarriilos, por persona, col] una desviacin estndar
de 1.1, a) Deterrninar cl intervalo al97% pala el lrmeLo promedio de cigarrillos que se consumel; b)
A cuntos individuos ha de consultarse para que la estimacin del nrmero medio de cigarrillos quede
a rnenos de 0.3 del valor verdadero?, si se considera un nivel de confianza del g5 %.

Solucin:

a) Tenemos que -|y':1000000, n - 120,7:3.8, s:1.1 y zoots:2.17.


El intervalo es

I 000000
'--" - 720
--".o o n1n 1.1
-'' 1 120
r 000000 t/tzo
(3.8-0.22;3.8+0.22)

Entonces, el intervalo es (3.58; 4.02).

b) Con Ios datos previos y Er: 0.3 y zo ozs : 1.96:

("o2)2 N 12

N E'zt, + (r*/r)2
"'
(1.e6)2 (1 ooo ooo) (1. i)2
:51.6
(1 000000)(0.3)2 + (1.e6)2(1.1)2

Pol lo tanto, se ha de iurestigal al menos g2 persorras) pal-a tener el error cleseado.


386 Captulo 73. Elementos de Muestreo

13.2.3. Estimacin de la proporcin poblacional

Este caso es, probablentente, el ms empleado en las investigaciones de rnercado y en los sondeos
polticos; as, frecuentemente se encuentra en peridicos y revistas datos como stos: el 70% de la
poblacin rechaza la decisin del gobiemo de aumentar el precio de los pasajes, o un 45 % de los
consumidores de gaseosas pr-efiere urra marca determinada.

Intervalo de confianza

EI inter-r,alo para la proporcin p a un nivel de confianza del (1- CI) x 100% es


(^- zorzV
ff T*-,, * zolz
\P
n_ IV
;F

Donde:

es el nmero de elementos en la poblacin.

77 es el nrnero de elementos en la muestra.

f es la estimacin de la proporcin, que se calcula por O: 1, siendo g es el nmero de individuos


?I
que responde favorablenente er la encuesta y f : I -0.

Tamao de la muestra

El tanrari.o de la r-iruestra necesaria para tener nn error prefij ado Ep, a un nivel de confianza del
(1 -.) x 100%, a partir de una poblacin de tarnao l/ es:

":ffiffi
Como nuchas veces se desconoce la estimacin f, se toma el tamarlo mximo de la muestr-a, que se
obtiene haciendo F: l: 0.5; entonces,

Qot)2 N
"
to:-
4N EB - (rntz)2'

Ejemplos

1. Una empresa pr-oductora de comida deshidratada desea introducir al mercado su ploducto


Sopainstaut. Se lealiza un estudio para determinar la propolcin de hogares que preparan
al tlenos ulla vez al rles sopa deshidratada. La muestra fue de tamao 240 et una ciudad
de 20 rnil hogares, resultando 40 respuestas afi.rmativas. Si se considera un nivel de confianza
del 98 %: a) Encontrar el intervalo de confianza para la proporcin; b) Utilizando la proporcin
prerriamente calculada, a cuntos hogares se ha de encuestar, si se desea tener un error de 0.06
en la estimacin?; c) Calcular el tamao mximo de muestra.
Sol,ucin:
73,2. Muestreo aleatorio sintple 387

a) Se tiene que l/:20000, r:240,'g:40 y zo.or :2.33. Etonces,


u40
i:!:2n -0'167'

EI intervalo es

(u - ,^,, lf I z,,,lz

0.167 x 0.833 0.167 x 0.833


(0,u, -2rB
(0.111; 0.223).

Es decir, corl Lur 98 % de confianza, Ia pr-oporcin de potenciales compradores del producto


est entre el 11.170 y el22.3% de los hogares de la localidad.

b) Consideremos que f: 0.167 y Ep:0.06.

17:
Q^p)'tvlQ
I\r Ei + Q"d2f Q

: 207.6.

Lo que quiere decir que se debern cncuestar al menos 208 hogares.


c) Si suponernos qne pes desconocido y tonanos 0: 0.5, obtenemos:

Q*t)'l'l
4Iv E3-r Q^t)2
(2.33)220 000
: 370.
4(20 U00)(0.06)2 + (2 33)2

Este segundo caso provee el tamao mximo de la muestra, igual a 370 hogares.

Una federacin de transpot'tistas pelmite clue ciertos gastos de sus afiliados (gasolina, iubricrntes
v lavado) se hagan mediaute Ia utilizacil dc la tarjeta de crdito expcclida para el pago en las
gasolineras locales. La ernpresa ha expedido 10 050 tarjetas.
Para realizar una investigacin sobre la utilizrcin cle la tarjeta. Se realiz nna encuesta pre-
lim.inar de 90 tarjetas y se encontr que 63 de ellas fueron utilizadas para pagar servicios en el
rrcs en referencia. Se determin clue el total de gastos cancclrdos con las tarjetas fue de 23 900
dlares y Ia desviacin estnclar- de 60. Se clescr detelminal el tamao de la muestra, con un
error del 2Voy una confiauza det 95.5% para estimar': a) la proporcin de afiliados que utilizan
Ia tarjeta; b) el gasto promeclio mcnsual cancelaclo con Ia taljcta; c) De los tamaos rluestrales
anter-iores, cul se aconsejara?
Solucin: Se tiene que ly': 10050 y rz:90.

rr) Calculemos toclos los elementos previos: t: #:0.7, ?:0.3, Ep:0.02. De aqu,

, .').,^^
lz..lt)'1\pQ
t{ Ei + Q"p)2fA
4(10 o5o)(0 7)(0.3)
: 1737.
(i0 050)(0.02)2 + 4(0.7)(0.3)
388 Captulo 73. Elententos de Muestreo

23 900
b) El gasto promedio de las 63 tar,jetas es dc r: : 379.37.
ti3
El error es de -8, : 0.02 x379.37:7.587vs:40" El tamao de la mllestra, es de
t- rl rv
n^2
\ ol: / 5
n:
-\'E? + (:^,"\2 s2

4(10 050) (60)2


:244.1.
10 050(7 587)2 + 4(60)2

c) El tamao ptirno cle 1a m,uestra es de 1737 tarjetas, puesto quc es el mavor valor calculado.

13.3. Ejercicios

Estimacin del total y de la rnedia poblacionales

1. Se seleccion nna muestra aleatoria de r : 65 de una poblacin de 400 individuos. La rnedia y


la varianza resultarolr 7 : 84 .2 y s2 : 170.8. Para un nivel de confianza del 95.5 %,

a) calcule los intervalos para el total 1r para la rnedia poblacionales;


b) Encuentre el tamao de muestra necesario para tener un error mximo de 2 cuando se
estime la media.

Se quiere estirnar cuntas balas se gastaron en Llna prctica de combate en la que intervinieron
8000 efectivos. Para tal efccto, se ton una mucstra de los registros del nrmero de balas
empleadas por 115 militares participantes, resr-rltando un promedio de94.7. Adems, en prcticas
sinilares, se ha medido una desviacin estndar c1e12.7. Para un rivel del 97%:

a) Encuentre ei intervalo de confianza para el total de balas empleadas en ia prctica;


b) Determine el tamao de la llruestra para qrlc ei error mximo sea de 15 000 balas.

t
J. Ura empresa de alquiler de fotocopiadolas desea conocer el total de copias que sus clientes
lealizan en un rnes. De sus registrosr que indican que la enpresa tiene alquiladas 280 mquinas.
se seleccion 33. En stas cncontr que en Lrn nes se realizaron un promedio de 1228 copias.
con una desviacin estndar de 193.

a) Calcule un intervalo de confianza para e1 total de copias de nivel 95 %;


b) A cuntas mquinas habr que incluir en la mucstra para tener un error de 21000 copias'?
4 En un estudio sobre el gasto rnedio mensual en rnedicinas y salud, en una ciudad de 25 000
familias se encontr, a travs de una ericuesta a 201 farnilias, que el.las teuan un gasto promedio
de 84.4 dlares, con Lrna desviacin estndar cle 5.6 dlares. Para nn nivel de confianza del 98 %:

a) encuentre el intcrvalo de confianza para el gasto famiiiar en salud, e interprtelo;


b) calcule el tamairo de la nuestra para tener nn error menor a 1.3 dlares en la estimacin.

trl dueo cle un restaurante de$ea onocer e1 consumo meclio cle los clientes de su negocio. De
entre las 1469 facturas correspondientes a las vcntas que tnvo la rltima semana seleccion, al
azar-, a 119. En e1las deterrnirL un gasto promedio de 4.5 dlarcs y una desviacin estndar de
0.93 dlares.

a) Halle el interr'rlo de confi.anza al 94.5'% para el gasto meclio de los clientes;


73.3. Ejercicios 389

1r) Deternine cl tamarlo clc la mr-restra prla cre cl clr-or ser. rnorlol' a 270 cllales cn Ia cstilrrcin
del total;
c) Realice el intelvalo cle confianza, de nivel 99 %, pala el consumo tobal semrnal en el r-estalr-
lante.

0 En urr estudio clc nelcaclo sc tom nna mncstr'r cle 34 pclsolls cle clrsc rneclia. cluiencs inclicuon
c.re gastaban 48 cllrlcs rncnsuales eu clivclsiorres) coll clcsviacirr cstirrclar clc 1.76 cllales. Corr
rurr confiabiliclrcl clcl 98.5 %, halle:

ir) cl tzrmario mucstlal rnnimo para lcalizal el mismo esturlio crl Lln grLlpo sirnilal cltte cttcntar
con 5000 pcrsorlas, si cl lmitc palir la estimrcil clel cllol cs igual a 0.5 cllar-es;
lr) cl tamao mucstr-rl mnimo para cl totrl clel gasto pol cl glnpo de estuclio, si el luritc palzr
el error dc cstimacin cs cle 1500 dlales;
c) cl intelrralo clc confianza pala la meclia rlcl gasto, si los valoles clel gasto promeclio y cle Ia
clcsviacin estnclar se manticnen en 48 S, I.76 cllalcs, r'cspcctivrrmentc, y se encuesta r 67
pelsonas.

7. El gcrcntc de lcculsos hnmanos quiere estimar cl nrmer-o rueciio y el total clc horas anuales cle
cntrcnarniento pala los 280 cmpleados de una divisin de la compaa. Toma informacin cle
los lcgistlos del ao rntcliol cle 35 empleados y obtiene un promeclio cle 125 y una desviacin
cstrnclar-dc 20 horas de cerpacitaciu anual.

rr) CalcLrle los iltelr'rlos clc confianza, ttl 99.7ya, perla la nlcclia )/ cl tottl cle hor'rs enil>lcirrlirs
cn cntreuanicnto;
b) Corr Los datos urtcliorcs ), si la estimacirr cle ia meclir hr clc cstar ir t4.5 holas clcl r'rlor'
tcrclaclclo, o lr cstirnrcin clel iotal hr dc cstar a 41700 lrorts clcl valor r.crdaclelo, cu:il cs
cl tanarlo mucstr'rl rcclueliclo?

Estirnacin de la plopolcin poblacional


8. Sc seleccion nnr nlrcst,r't alcrtolia cle 121 obsclr,rciones, sicnclo caclr rrrrr lur xito o r-rn fracirso,
clc rLrrt pobltrcin clc tI40 elcrncntos.

n) Si cl rtrmelo cle xitos fr.re de 40, calcule un intervalo cle confianza al 95.5% pala la propor-
cin clc xitos;
l>) Flallc cl tarnao cle lr nucstla pala clue el crrol mximo sca clel 6 %, cnplcanclo ia ploporcin
ruuestlrl hallada plcviaruente;
c:) ILillc cl taltairo nrixinro de la muestla, si no se tiene infolrnacin plelirninal clc ll proror
cin.

'.) Err itn cstrLclio sobr-c tncrlios c1c conrunicrcin sc cluicre cstinrrl la llorolcin dc los cslucliaut.cs
<.[c urt colcgio sccr-tuclrt'ii-r <tc rniLau legrrlalnrcrrtc las noLicirs. Eutlc los 3100 cstucliurl"cs clci
t:r>lcgio sc cscogiclon r 250 pr.r'r. (lue lesponclan Ia plegnnta. De stcls, 76 irrclicalorr cluo'llLir'ur
lrs nolicirs. Palr un nivcl dc confianzr clci 98%:

rr) cncnentrc cl intclvirlo rlc confianztl par'\ ?r:

1r) fi.jc cl tamLricr tle lr tlLtcstla ueccsalia pul tencl un cllor'rncliol al 5% si, (i.) sc tonrr cl
valoi rlc 19cstirrlaclri rrnics. (ii.) si uo sc ticuc iclczr plcvirr clo lr ploi)orcitiu.

10. lll Sr. \/ugrs cst.rL Perrsirrrclo Post,ularr r lrr rlt;rl<lr clc Pclilco. Alrtcs clc folriralizal srr cirLrliclltlrr'r
<lccirlc lcalizrl unr crr'',ircstir clc orinin cn l locrliclrcl. Dll c-.1 c;rutlr hay 12 000 rolcrrciirlcs
clcc:torcs y sc rcaliz iurr L)-imela cousultr a 270 pclsonirs, clctocttinciosc un U)oyo clcl 30% clt:
los posibles elcctolcs.
390 Captulo 73. Elententos cle Mttestreo

ir) EncuentLe un intcLvalo de confianza aI gT 01, pzrrer la plopolcin dc votantcs que lpovarztn
al Sr. Vargas e intelpretc cl lcsultado,

Como el Sr. Valgas no estaba segluo de los lesultados de la pliurer'r consulta, decide contratar
a una errrpresa para que reaiice uu segundo estudio. La emprcsa i,rdica que Ia encuesta tienc
u.u costo fijo cle 5000 c1lales urs nn costo rrariable de 4 dlalcs pol czrda entlcrista. cunto 1e
costar- cstc tlaba.jo rl Sr. Var-gas si l qrrierc r('ner nn clror clc 4(% c'on nna confiabiliclad dei
98 %.

l,) si se iomr como polccntaje clc r.otautes favor'rbles r lr cancliclatur'r rl 30%'l:


c) si no sc tienc unl idea previar clc Ia popr-rlrliclacl cllel Sr'. Vargas?

11. Urra empr-esl clc asesc.r-a poltica ha sicio crntrafLcla pulir clelclrrinal lr. populalidacl
cle uu
candidato L alcalcle clc una ciudad cle 215 000 habitantes rclultos. Eu ttn soudeo realizado cou
215 posibles votantes legistr un nivel de erceptacin del 34 % pala el poLtico.

a) Halle un inten'alo de conliartza al 96.5 7o para la proporcirr rlc sinpatizautes del candidato:
b) Si se quisiera lcaiizu otr-r cncrrcstr utilizando 1a ilfoln'rciu clispolible, eticttertire cl
tamao mximo dc la muestla a utilizal para crc ci c1'rol scr clc 0.03;
c) Si se collocc crc ci cancliclato, histricarnentc. tenrdo una accptarcin de alrededol clcl
hr
40 %, encncntlc cl taurario clc Ia rnnestltr a cmplealsc.

12. Pala efectos clc plane:Lcin econmica en la provincia clc Cotopaxi cs necesalio realizar un estudio
cntlc 2200 hatos ganacleros. Una cncuesta piloto alroj las siguicntcs estinaciones:
Prorneclio clc vacas por hirto, 46 y clesviacir estrrclar'. 2[J.

ll.cnclinienbo plonrcclio c1c lcchc por hato: 345 litros y r.ariarrrza rlc 9700.
DI 6A% clc los hatos tienc un r-enciimiento neclio cle iechc supcliol a 250 litros.
Con un errol del 8% r una coufi.arrza ctel 95.5%, cletclrnilLe los ttrru-ros de lrs irlllestrIS si se r,'t

r estimar-:

a) cl nirnero cle r'rcrs lechcras por hato;


b) el rendimiento rrcciio cie leclie por hatol
c) ll propolcin cic irirtos cou urr re-rrclinricrrto plt.rrneclicl clc lccirc, sllpcliol a 250 lit,los:
d) QLr tamao clc rrruestla ustcrl recorncrrdarr'/

Lr seleccin de la muestra

Los proccdimicntos cxpuestos cr. csta scccin se basan en e1 principio cle cluc las rlnestr-rs clebtrri
colstitnirse pol elemenios tomacios al azar'. clc; suclte cre cacla.t",,r1r1.o cLc la poblacir, l,ergiL 1lr
r.Iisurt plobabiliciaci cie figulal en ia mncstr'r. Solo rs slzr pnedc lcplcselt rl a lr pobl:Lcirr, reploclr.rci r'
fielntcrttc los clirrersos calactelcs y cluedal soureticlr rr 1os Proc;ccliruielrlos t:sLrclsLicos clesclitos.

Dutonccs. nos plantcamos el signiente ploblerrizr pr'c;lico 'l soir.rcionu: hlllal nn rnedio clc rrsegnlarrsc
clc tre toclos los elementos cle la rnucstlLr seur tourados al rrzu.

l-er'icrmcntc. no hrbla problerla r-rlgnno. En u.na irrvestigacin icleal clispolcmos del malco ulLerstr-al,
,rs srbr:mos cuntos y cluines son trlcs clenrentos. nicanrclte habr'a cprc sor'lear'los y los favolcciclos

scr'arr irLcluiclos err iir irntcstla. llasta rrntcs clc 1zr 1-rollrlarizrcin clc lirs c:outprri-aclorits lr selcccil clc
ii..s l'llrcstlas sc realizirbt ccn cl crnPlco cl<: tlblas rle uiuneros rlct,oLios. l}r llr acl,Lirrlidacl r-'sia tlrc;l
73.4. Mttestreo aleatorio estratifrcado 391

la ayuda de plcigrarlrs informticc-is, eu los cnaies hay courrnclos especiales qlre BerreraII
se lctlizr corr
nirrnclos aleatorios y facilitan la seleccin de la muestra.

Sin embargo, no siemprc se puede realizar la extraccin de la ntuestra de Ia nanera descrita, ya sea
porcFre la poblacin es bastrnte glande y Ia localizacin de cada elernento elegido es muy laboriosa
o t)orcLr(.r cl rrrrrcr. rrrucstr'ri lo cstri brcrr definiclo. Ptrla srtper'rt'las clificultacles se han ideado otros
rri(:l,orlcs tlc: rnuestlco. (lue r r:rntinrracirr los velcrri()s.

13.4. Muestreo aleatorio estratificado


llrr el cliserlo cl mti-rdo rlertolio simple, sc plcsentau valios ittcouvcnieutes
cle una mticstra, meclianie
r:uiriclo 1a poblacin es bastante heter:ognea o si esth distribuicla utuy anplitrntente; por lo tanto. el
nrlelo cle consultas necesarias 1-laln obIcncr infolmacin coufirble es ztlto, cort cl cousigtticntc aullcllto
cri cl costo de Ia iuvestigacirr y crr el tierrrpo de ejecucin.

LIn ploceclimiento adoptado par-a superal estos ploblemtrs es el cle fornal :u:na m'uestra estrat'ificuda
v al rzar'. Segrn este mtodo, sc subclivide la poblacin en varios grupos, llamados estro,tos, cada
nrro clc los cualcs debe'ser internamentc horlognco. En crcla cstrato, se cscogen al azal las unidades
rrruest,r'ales a inr-estigar. corfio ya se explic: es decir'. para cada estrato se aplica tnuestreo aleatolio
sirnl>1e.

Los estlatos pueclen fornrarsc paltiendo dc divisiorres geogr-ficas (provincias, ciudadcs, centros urbanos
Y mr'rlcs, etc.) o bicn del sexo clc las personas. su eclad, la profesin, el nivel socioeconmico, etttr-e
ot ros.

Lrr lazn clel crnpleo de estc ntodo reside eu el hecho de clue pelmitc obtencr', gencralnrente, resultados
rrrirs pr-ecisos c.re aquellos qucl se colsigucn cou cl mtodo alcrtolio simplc. Sin embalgo, es ttecesar-io
couo(icr' 1r cserrcia de crcla cstrato prr'r ploceder', en cada uuo dc ellos, -L la eleccirr al aztr dc los
clerrrrrrtos rle la rlnestra.

Ot,leL snbrnncstt'as de los estr-trtos,


r.euttrja del mtodo es que adems cle cornbinal la infolnraciu rle lrs
p:rit obterrel inferencias de la poblacil completa. tambin permitc utilizar la inforrlacin cle las
subtrnrcstr'rs para corrocer cl conrportamiento de cada, estrato en particular') y corl]pararlos cntre s.

Al igr-rni clue hicimos en ir scccin anteriol, examinar-emos los crsos cle cstimrcin clel total. la mcclia
'n' Ia 1-rlt.,1-rorcirr pobia.cionales.

Suporrgarnos crc se clivide a lir poblaciu el .I est,ratts. crcia uuo clc los crrales constt de l elernerttos
(t:on ri :I,2,...,K), pollo clue ly': l{ri/z+".+A/( Dentlo clc cacla estlato elegilettros tt;
clcmentos crc constibuir-l la rnuestr-a.

L3.4.I. Estimacin del total poblacional

Ill inteir'rio de confianza al (1- cv) x 100% pala el total pobltrciolrl r cs

(\-.)

l)onclc

:\r cs cl rrirrrrero cle elcmcntos el lr poblacin.


392 Captulo 73. Elententos de Muestreo

lI es el nrmero dc clcnrcntos en el cstrato t,. i, : 7.2. ..., I( .

?? es el nrmero cic elemcltos cle ir mnestla i.:1,2.....Ii. cr el estrrto i.


7 es e1 prorredio de Ia muestra seleccionrda en el estlato i., 'i: 7,2,. . . ,I{.

,s; es ta valianza cle 1os clrlos cle la muestla en el estrato i, 'i : I,2,. . . ,I(.
') t

?esla estinracin clel total poblacional cono ?e"t : A7.".


:t65 eS Cl prolreclio cstlatificrclo. que sc calclllr l)or'
_ .1i

csL :f {rattr * Ar2i2 + ... + ArT) : aNL\-,r,,o,


i:7

ro el:l tian]
trLl atICdo
Cr Ila oo llllt,restre I cie: los ? es peqnerio con respecbo r1 tanrrlo cle los estratos ly', lt-r, frnrulr
SC L'eclluc
Llce a

I i-
lr
.t\ )

"a/2' ? + zo2
Dri=
\
EjJel
E. llTlrplplo.t. LcOS clilec di
d ectlrtiros c1e LIIl. centl'(o edncatir.o desean conocer' el gasto total de los padres cle
Ier.Ini
Ie rili LArenrir tiltles
r ES escol
CS lrles. Pl
el )o1rr rla facilita
I r 1r investigacin se clii'idi r los tlumnos segiur su nivel. err
l)r
l)rc 'ep
rpli iur
I lio
ItIl' xi nli
,Lil
, I)l 'io
ralio
tla y
))SCtscc :tutcl io.
clu'i Un a tabla resLrrllen cle cmo se cstrbleci Ia muestr'r v los <latos
ltl
1i
r l lacl
1it l1 os) f
SC CXrh
:hi be I conti
CO rtin[raccint.

NIVtrL
Preplimalio Primalio Secunclario
No. cle aluuuros (Ar) 1569 832 647
Trmario mr.Les ilal (r r.
) 767 72r 95
Gasto promedio (dlaLes) (7;) 88.4 131.6 97.0
Varianza mucstral (s]) 525 468 700

A urr nivel clcl 95.5 %: a) Enconbrar el erLor rnrrestlal en la invcs[igaciu; b) Construit' cl inten'rlc., clc
r:orfi\rLzr perla cl gasto total clc los padres clc farnilia del plrrntcl.

S'olu,cin,: Prla nncstlos clatos tenenros A:3[J48 l'1:3.

r.r) EI cr-r'..rl clc la cstirlacin cs

E, : \.
.^,.,1f r't(N;-rr;\ si
\ 'v /.
6 910 295 + 2287 008 + 262632I: 6880.

lr) Calculcmos cl plomeclio cstrati ficado:

(l/rr r -l N2T2 + l/z:)


: 1. :
3e4s
l(ts0o)(ss,4) + (832)(131.6) + (647)(e7)l 102 0t

El lotal sc csbirra lror'


:r esr : .r\r=
_r \ "r,csr : (3U18)(102.01) : 3 t0 950.
73.4. l\[uestreo aleatorio esttatificaclo 393

Con todo lo eurtcrior, cl inbcn'alo buscado es

(i""t - ll"ii""t + E") : (310 950 - 6880; 310 950 + 6880)


: (30a 070; 317 830).

lf ntolccs. sc cslima quc cl gasto tobi-il cn ritiles csc:olalcs, clc toclos los pachcs clc familir esti
cntrc los 304070 .1,-- 317830 cllalcs.

L3.4.2. Estirnacin clc la medil poblacional

Ii,l int,ol'\'rlo cle col al (1 - a) x 100% paltr nrcclia lroblircionrl l cs

I t'"'' -
I
\
Cr.r'urcio cl lrnrao nrrcsir'l<lc los ?j cs pccluerio col respeclo al trruao clc los cstratos A,la f'rrttulr
sc r'cclLrcc lr
zo12
,:ol')
-^/

Ejcrrrplc. Una empresr cllrc rcrliza cstudios dc lr ru<licncir telerrisir'r dcscrt cstiurrl el tierrrpo medio
rlc: lroirs ciir.r'ias cllrc pasar frcltc al telcvisor'las frrnilias. ori urr carrt-rr cspci:lrco. Ll errprcsa diviciiir
lr zon clc cshuclio en ulllan;r y r:nti-ri y sc cscogi<i urLr lnrestrr clcl 2 pol rnil; es clecir'. 2 de cacla
rnil funilirs clc cacla hlcir pcrtcncccrhrr t ir mucstr'r. Con los clrtcis lcsumiclos elr la siguiente ttrbla,
circrrerrtrc rur inter-valo clc confialza rl 97.5% pi-lr'a cl tiernpo mcdio cluc cacla frrlilia pasa frcntc a lzr
( c.lcvisiolr.

No. clc Tanuro cle Ticnrpo \/aliauzr


f'anrilias lr rnucstla plonrerclio r ultes tla I
')
Alcu A'; 't Li :l:i s:
Urbanr 64 796 130 2.93 0,77
Iturai 42 18S a/1
1.46 0,53

S'cl,t.r:i t: Crlcilleiros cl lrloi Lrcrlio csilatificlclo:


I

Jc,r : (AtrJr+-\rrr2)
: |
_____ ,,, :
____ _
r ,+ 796)(2 93) + (42 188)(1 46)l 2 35
10f; 9s I"

Conrc, cl tarlarlo cle las submucstlas, eu cacla cstrato. cs pccrer1o con lclrcin rrl lcspectivo totaI rlc
t lcuIcrr[os. clrrplerremos 1r frurtila apioxirlacla

.- i).l2;.
39,1 Captulo 73. Elententos de -N4tresr'eo

Por tarrto,

(T""t- E,"izest+ Et,) (2.35 - 0.t27 6;2.35 + 0.1,276)


(2.22;2.a8).

Eutonces. el tienpo urcclio c1r.rc cacltr Irmilia girsta fientc r la Lelevisin cstri cnLlc las 2tr 13 miu r,- 2]r
29 rnin, aproxirlaclalncntc.

13.4.3. Estimacin clc la proporcin poblacional

cle confia nz-L tl (t - ct) x l00r/o pirla lil ploporcil poblacional 1., cs

^. J.)
Z ct/
-

"'- lv

Dorrde

N es cl nmclo cr,c clcnrciitos cn Ia poblircin.

ff cs cl nlimcro clc clcltcntos cn cl cstlato i, i: I,2,, , . ,I(.


?z cs el utimclo clc clcmentos clc Ir rntrestla cn el csblato 'i. i : L,2, ... ,I( .

j) cs la plorolcirr riitrcstr'rl clcl cstlato 'i, i:1,2,.. .,I(.


frest cs la ltlopotcin csLlat,ificircla, quc se calcula por'

fi,"t
I .-^ i
: *(N,
/v it Ntf , +'..+ l/r,'lrr) : *r iiI,,',4,
i,-l

Cttallclo cl tamaito lnttcstriri clc los ?i cs pcquerio con tesllccto rl Lanrao clc los csblaios AI,, la frmtrla
sc tcclr.rcc tl,

f 8
--'----= rl)cst.
, zol2
tN
'tL
- L

Djemplo. Rcfilirtclonos al cjcmplo rrutelior', en trl estuclio tambin sc plcgunt si las frrnilias nilrilrn
regnlartneutc uua telcttovclr clacla. Las plopolciones uruestr'rlcs clc cpricnes tienen prelelcricia poi c.i
citrclo ploglaura sc clrn cr-r la siguicntc tabla:

No. <lc liirnriro clc Plorolcir r r ricsi


r r'ri
frrn ilias lr rrmcstr'r clcl cstr'to
r\t'cr Ar 1t i D
Ur'brtrr 64796 1ii0 0.19
j-lur'rI 42 183 8,,t 0.2,1

llstirrrr lrt ptoporcill t[c toc[',s ]its f',rLuilirs crr cl cLnl-l (lllc rnir'u lr, tclcrror'<:lr. Usc I - cv:0.(t2:5.
73.4. Mttestreo aleatorio estratifr,cado 395

SolLtci,n: El pliurel hrgiu' calcnlcuros lir plopolcil estratificrclr:

i",t:
1

[(61796)(0.19) + (412188)(0 24)] : 0 2097.


",,,*
Cornolosl.ulrlosrnncstlalcs,soupc.llleiros,conr-espectoalosesllrtos, l{.1)\; =1,pzrra i:'I ,2,
\ /
rrtilizrlcrnos la frmnh i'rproxinrac[a

:^/.t lr: 1)iqi


Ep: A \I /- ?l;-1
\ i:r
(6,17e6),Cle# !!) ,t I l') l RRlr
r0.21)'' 0.:
1l:oou:s
s3

M int.ctr.'rlo clc confitttzr cs:

(; lr.:.rIl\ t Lpl
\Y(sL Lp\1'sl (0 2097 - 0 0625;0 2097 - 0 0625)
(0.12172;0.2722)

i\s. crrr'c 14,72/ov cl 27.22% rl,.l i.s farlilirs irriLau la tclcnovcla.

!3.4.4. lb.n-^ ao y asignacin cle la nurestra

i)ttsto qlrc cn cl mioclo clc csl,irrtificacin se folman r'rrios gr"l-rposr se acostuntltltr ir fijat'cle anteuratro
,rl rLivcl clcl crlor', clc rcrtcirl.o r -'slc sc cstablecc cl nrinrelo clc clcniorrl,os quc c:onst,i brrirn la rluestrir v
1r-Lcgo sc cletclrrrina cnirul-os clc clios sc iisignarn r carlr cstrrLo.

Sclrr , A'2, . . ., A'/i los clcrncriLos ilclLriclos cl crtlr cstLirl.o, srr slunt cs igual ii ,l/, cl tolal clc li'L
-\I1
lrolrlirciiirt Sc sclccciorar. j ,'t12, ..,,'n.ti clcnicrtos, tornrclos al lzar, clc caclr cst,r'ato. Tcnclicrrios
'/?

tlric cl totrl clc ltnicliclcs clc la trtncstla es '/ == ?t1 * 112]_ .. .* rr. Ntrestro ploltlcura seti c]etetrnirLal
el 1.rmiro cic Ia urttcstla v ci iir'ulcr'() clc uLriclacles qlre sc consrrlfar'n cl cacla csilabo.

Lrrtt'r ia rsiguacil clc Jn',rrtcsi:', sc rLtilizr nno clc los siguientcs 3 urloclos'. er1'u,i,tat'iu(L) pt'o'lorc,i,oretL s,
1;,: lttli,,t, inttn! (r! r' -' ,,,

A si gnacin cqrritativa

E;l lr fblna clc asignircirr crliiitltivi-, crt ctclt utro rlc los cstr-itos sc invcstigii cl nisnro ntimoli.r ciLr

clcirrcnt os.

iii tlrruliio clc i.L inucstlrr r scl ilr..'rstigrcl,. sc crrlcrrl,r iror

,)'I ^t,"i
ii
L -\ -r {: .;: )'-\,'.'
't- I
Captulo 13. Elernentos de Muestreo

Una vez fijado el tamarlo total de la muestra se seleccionan, al azar) eI mismo nlrrero de unidadcs
muestlales en cada estrato. Este nrmero de unidades se calcula por:

,ro:
#, i : r,2,.. ., K.
Observacin, En este y en los siguientes casos se debe tener presente qlre en el caso de la estimacritili
cle lar proporcin Ia varianza se calcula mediante t? 0). : i -

Asignacin proporcional al tamao del estrato

Si en una investigacin se han generado submuestras de igual tamarlo, podr'a suceder que los estrat<;s
pequerlos estn sobrereplesentados, mientras aquellos con muchos elementos estn subrepresentados.

En la asignacin proporcional, la rluestra est constituida pol Lrn nrmero de elementos, en cada
estlato, proporcional al tarnao de stos, con relacin al total; es decir, los estratos [rayores sern los
clue tendrn subrnuestras de nayor tamalio.

El tamao de la muestra se calcula por


K
N(".7)" D /V,"7
.i:1
tL
- I(
E2N2i(.^t)2DNut?
i:r

Los tamaos de las submuestras de cada estlato se calculan por:

-- n
rlr' : -A/r
__ ?l
llc' : -Ay'c-.
'N',
-. 'N',

Eri el nuestreo con asignacin proporcional el error es mnimo, pero por razones de economa o de
facilidad en la recoleccin de los datos en el sondeo, pudiera ser mejor no hacerlo de esta nanera.

Asignacin no proporcional al tamao del estrato (o asignacin de Neyman)

Supougatlos que la poblacin a cxaminar est dividida en dos grandes estratos. Si el priurero de ellos
agllrpl a personas muy homogneas entre s, con lespecto a la calactei'stica que se considere, bastar'i
con intelrogar a Lrras pocas personas para dedrrcir, con Ia plecisin snlicieute, la magnitucl cre str
invesbiga. Si, por cl coutratio, el segr-rnclo estrato est fornaclo por personas hetelogneas, ser pleciso
iltcllogar a un nirmero rrajol' para obtener resultados que snpoilgan la misma exactitud que en cl
primel caso.

En lir rrsignacin clc Ncymau, el tamao de la nr-restra sc calcula pol

/ I{ \2
Q^/)2 (,e nt",)
I(
E2N2*("^/)2Dlr,17
i:L

Prr' r'crlizat- Ia zrsignacin clc los bamar'ios de las subrluestras sc ploccclc clc la siguiente lnancl'l:
73.4. Muestreo aleatorio estratifi.cado 397

1. Si s1, s2 , ..., sK son las desviaciones estndar de cada uno de los estratos. se determina el valor
? definido por
K
? : ly'rsr * l/zsz +'.' + ly'<sr : INrrl,
i:1
2. Con sto, Ios tamaos muestrales de los estratos se calcnlan as:
A n
n1 : l/1s17. A lI
nz: NzszT
n.
nI( - NNIKT.

En el siguiente cuadro se expone un esquema de rnuestra estratificada segn los criterios de asignacin
cquitativa, proporcional y no proporcional.

Proporcin de Desviacin N{uestra Nluestra Muestra no


Estratos
los estratos (N,//) estndar (s) equitativa prororcional proporcional
A 0.40 1 500 800 400
B 0.30 2 500 600 600
C 0.20 .) 500 400 600
D 0.10 4 500 200 400
TotaI 100 2000 2000 2000

La rluestra con asignacin no proporcional est formada por un nrmero de elementos, en cada estrato)
qne supone dar un mayor peso relativo a los que presentan una mayor variabilidad. Por ello, el estrato
A, annque incluye eI 40% de los elernentos de Ia poblacin, figura en la muestra final con el tnismo
tamao que el ltimo (el D), que nicarnente comprende el 10 % de la poblacin total. Esto es debido
a que la variabilidad del estrato D es el cudruplo de la que tiene el estrato A.

tlna vez establecida la cornposicin de Ia muestra se proceder al sorteo de Ios individuos a ser
entrevistados) que por lo general se lo hace bajo el criterio de la no reposicin; es decir, qtte un
elemento de la muestra no puede ser consuitado ms qrle una sola vez.

Ejemplo. Para los datos del ejernplo sobre el tiempo promedio diario que gasta la poblacin viendo
la televisin) que a continuaciu se resllme:

^ No. de Tiernpo Varianza


Area
familias promedio muestral
Urbana 64796 2.93 0.77
Rtrral 42188 I.46 0.58

Considerando un error de 0.1 h, a un nivel de confianza del 95.5%, deterrninar los tamaos mlrestrales
v de las snbrnuestras mediante asignacin: a) equitativa; b) proporcional; b) no proporcional.
Soltt,ci,n: Se tiene que N:106984, E:0.1 y zoo22s:2.

a) Equitativa. El tamao de la muestra es

K
K(r*/r)t D x?'?
,j: I
K
E2N2i("ul)2DNo"?
i:1
:297 '34.

298
La muestra total es de 298 familias. En cada rea se consultar a 149 hogares.
2
398 Captulo 73. Elernentos de Muestreo

b) Proporcional. El tamao de la muestra es

K
N(r,/r)'D N t?
i:l
K
E2N2*("*lz)2DNlt?
i:r
106 984 x x (64796 x 0.77 + 42 1BB x 0,58)
22
:277.3I.
(0.1)2 x (106 984)2 t 22 x (64796 x 0.77 + 42I88 x 0.58)

El nmero de familias a consultarse es de 278.


Por la frmula de la asignacin proporcional:
278
rlt :NrL' :64796 x : 168.34,
N 1069E4
n
n2 : -. : 42 188 t
278
: 109.63.
tOOgg4
^ri
Entonces, se deber tomar una muestra de 169 hogares en la zona urbana y de 110 en la rural.
c) De Neyman. EI tamao de la muestra es
t

Qo/il' (*"')
n: K
E2N2i(r./)2Dru,"7
i:r
z2 x (a+796 x lotl + 42188 ,. u658)' :276.
(0.1)2 x (106 984)2 t 22 x (64796 x 0.77 + 42 188 x 0.58)

Calculemos el denominador T:
7: ly'rsr i N2s2:64796 * t/Of + 42188 * r/OS : 88988.

Ahora, apliquemos las frmulas correspondientes:

u : 1/rsr3
T
: 64796, Jolz " 2
88988
: 176.4,

n2 : Nzsz::
'T', 42188 . r/058 " :2:
88 988
99.7.

Lamuestradeberestarformadapor177farniliasdeIazon.atrrbanav100delazonaruraI.<

En esta seccin solo se presentaron las formas de fijar Los tam.aos muestrales basados en infornaciu
estadstica. Existen otras forrnas de realizar tal determinacin, tomaldo en cuenta los costos de
efectuar la investigacin, los costos fijos o el costo unitario de cada toma, stos no los expondlemos.

Determinacin de los estratos

El estratificado es el rntodo ms utilizado por Ias empresas y entidades que se ocupan de realizar
sondeos, con adaptaciones prcticas que tienen en cuenta los costos y las posibilidades reales de la
investigacin.

Antes de la confeccin de la muestla conrriene tener en cLrenta, ante todo, los fines de la investi-
gacin y las caractersticas de Ia poblacin que interesen de nodo particular, y que pueden tener ttttt
impor bancia fundamental en las conclusiones qne se daru.

Las clasificaciones que ms comnrlente se consideran en la elaboracin de ias muestras son:


73.5. F,.iercicios 399

t. El sexo de las persollas.

-: Los grupos de edad.

.). La regin y la dispersin geogrfica.

4. El ulbanisno o luralismo cle ia localidad.

5. El rrivel edncativi-r.
6. El nivel socioeconlnico, cntle otros.

Pua files pr'cticos, el r-eldadelo y adecr-rado sorteo, en cada estrato, es frecnentemente impracticable
o inrplica gastos excesivos v pr:dida de tiempo. Por ello se recllrre aI nttoclo de las cuotas, cte
colsistc en asignar un cierto nunero de entrevistas qrie se deberr lealizar en cada estlato (cuotas), pol
crcla entLcvistador.

Compcte, entonces, al encalgaclo de la entrevista elegir al azar las personas clue han de ser interro-
grrclas c1cntro dcl nbito de cada cuota que Ie ha sido asignada.

Para disminuir, las distolsiones que callsara la falta dc alertorieclacl en estc mtodo, las eurprestrs
snelen urnentar la fiabilidad de sus estudios mediante el <sobremuestreo>>, o sea la realizacin de
nts encuestas qtle el nirmero oliginalmente planificado, as se collpensara e1 aumelto del error antes
iutroducido.

13.5. Ejercicios

Estirnacin del total y de la rrredia poblacionales

1. Utilice los datos ile la siguiente tabla par-a:

zr) hallar un intcr-r'alo clc confi.anza al 95.5 % para e1 total poblacional r;


b) haliar un inten'alo de confianza al 95.5 % para la media poblacional r,.

No. de unidades Tamao de Promcclio Valianza


lnrlestrales ia mucstla mrrestral muestral
Estr-ato /, 11.i Ii s:)
I 2000 200 ro1
:T 24r0
II 3000 200 402 2938
III 1000 200 tqr
t) -!t ) 2047

, Par'restablecer rlrl sistema de s-rbsidios cn el consnmo de Ia cncrger elctrica se hizo una invcs-
bigacin por nrlrestreo cn Ltlta cindad. Se dividi a los hogales scgirn su nivel socioeconmico
(NSE) y se tom una muestra de\2Va. Los resultados se rcsrlnerl a continuaciu.

No. total No. de hogar-es Consumo Varialza


NStr
cle hogarcs nluestreados promedio nuestral
I t2 425 30 r25 232
II 34 871 70 g7 r75
III 69724 140 48 124

Para un nii'el clc confianzr dcl 96.5 %. hallc:


400 C.:ptulo 73. Elernentos de Muestreo

a) una estimacin por intcr'\rrlo para el consnrlo tledio de los hogirles;


b) una estiuracin cor Lrn inten'alo para cl consumo cle todos los hogates cle la ciudLd.

Suponga qlle sc clcsea lealizrL otro mnestreo en el clue se lendr un error en la estimacin de la
media de 3 dlares. Determine los tamarLos muestrales en cada estrato si Ia asignaciu se realiza
rnediante:

c) asignacin eqr-ritatir':i:
d) asignacin ploporcional;
e) asignacin no proporciorral.

3 En un sondeo para cieterninar el gasto anual de la poblacin de una cindad en arreglo persontrl.
se clasific a los consultados segrn sn sexo. Los datos se rl)uestr-an a continuacin:
SEXO
\.{asculino Femenino
Timro del estrato 2500 2300
Tamarlo mnestlal 250 150
Gasto promedio 70 740
Valialza rnuestral 25 169

a) Determinc el gasto prornedio y el gasto total. mediante un intervalo de confianza de g3 %:


Encuentrc el tLmao de cada estrato. para tener Lur crlor de 1.5 y para que la mllestra sea
realizada rlediante:
b) asigriacin ccluitativa;
c) asignacirr proporcional;
d) asignacin no proporcic-inal.

4,. Se realiz Lrna elrclresta parr cstimar el total de rrentas scmanales de los locales de productos
naturistas cle Quito. De los 1415 negocios de este tipo, se escogierou al azar 135. A continuacin
se resttnen los clatos recogidos, segirn la ubicacin geogr'fica cle 1os locales.

Situacirin
No. de Locales err Venta
Varianza
Iocales la muestra promedio
Nolte 600 ,lr 478 204
Centro 265 45 4r3 358
Sur 550 45 394 513

a) Encuentle un intervalo de confianza al 99.7 % pala el total cle ventas de dichos locales;
Si se quielc lealizar uu cstudio en el crlal el error de estimaciu sea de 5000 dlares, encuentlc
los taulanos muestlales. cn cadr estrato, para que la muestla sea r-ealizada nediante:
b) afijaciu ccluitativa;
c) afijacin proporcional;
d) afi.jaciu de Neyman.
5. En uua universidad se decicli llevar a cabo un estudio soble cl aholr-o que mantiererl slrs elr-
pleados pala cr.tando ellos se retirel. Se tom nna muestrr aleatolia estlatificada del 10 % cle Ir
poblacin, pol gltlpos de cdad, con afijacin plopolciolal. Luego de proccsal lr informrcirr, sc
obturrieron los siguicltes rcsulbaclos:
Edad nlenos de 40 aos 40 a 55 aos ms de 55 aos
No. clc empleacios 280 150 220
N{eclia 800 1400 3200
Desr'. estndar 160 400 750
73.5. Ejercicios 401

a) trstime el ahorro medio de los empleados, mediante un intervalo, y obtenga el error de


estimacin para un nivel de confiabilidad del 96 %;
b) Estime el total ahorrado por los empleados de la uni.,'ersidad.
Si se deseara realizar otro estudio, a nn nivel del 94To, en el cual se quiere tener un error
de 100 dlares en la estimacin de la media. Encuentre 1os tamaos rnuestrales en cada
estrato mediante:
c) afijacin equitativa;
d) afijacin de Neyman.
6. LIn comerciante plane comprar los remates de productos que reafiz Ia aduana. Para obtener
nn valor aproximado del lote, el comerciante seleccion aleatoriamente 100 artculos de cada tipo
de producto puesto a remate. En la siguiente tabla aparecen el nrmero de artculos segtn su
tipo, el costo promedio de las rrruestras y sus desviaciones estndar.

Artculo /, r si
Calzado 450 800 200
Ropa 380 560 150
Juguetes 230 940 220
a) Encuentre un intervalo de confi,anza al 95.5 % pala el valor promedio y para el l'alor total
de la compra;
b) trl comerciante tiene un capital de 750 mil dlares para realizar la corlpr-a. de acuerdo con
el resultado anterior, puede decirse que 1 se decida a corlr.pr-ar el lote?;

El comerciante decide que seleccionar una mnestra utilizando la informacin anterior y se ha


fijado un error de 15 000 dlares en la estimacin del total. Encuerrtre los tamaos de crda
estrato para que la muestra sea con:

c) asignacin equitativa;
d) asignacin proporcional;
e) asignacin no proporcional.

Estimacin de la proporcin poblacional


7. Utilice los datos de la siguiente tabla para hallar un intcr.,'alo cle confianza al 98 % para la
proporcin poblacional.

Estratos
II III
Tamarlo del estrato 1000 1200 700
Tamao muestral 100 100 100
Proporcin muestral 0.32 0.26 0.29
8 En un sondeo electoral para conocer la aceptacin de tur candidato a prefecto de una provincia se
entrcvist a un grupo de electores, previa clasificacin scgrn su zona de residencia. La sigr.riente
tabla da Lln resumen
Area /, rt,i, f
Urbana 92 000 250 0.43
Rural 88 000 150 U.5 t

a) Encuentr:e nna estilracin, con Lrn intervalo aI 947o, del porceirta.je de votacin que obtcn-
dra el candidato'
402 Captulo 73. Elententos de Muestreo

b) Segn el resultado, podra esperarse que el candidato gane las elecciones por una urayora?:
Si se desea que el error de estinacin sea del 5.5ya, encuentre la cornposicin de la rnucstra
para que ella sea seleccionada mediante:
c) afijacin equitativa;
d) afijacin proporcional;
e) afijacin no proporcional.
I Se desea establecer el porcentaje de habitantcs, en la provincia del Guayas, que tienen fe en San
Biritute2. Se dividi la zona de estudio en ciuclad y campo y se pregunt si crean o no en tal
deidad. A continuacin se resnmen los resultados.

-
-Lona Poblacin Tamario de Proporcin
total la muestra muestral
Ciudad 2 800 000 450 0.29
Campo 650 000 350 0.61

Encuentre un intervalo de confianza al 97.5 % para el porcentaje dc la poblacin de Ia provirtcia


del Guayas qlre es creyente en San Biritnte.

10. En una provincia. se realiz Llna encllesta, entre los nios en edad escolar, para couocer la
asistencia a las escuelas, Para el efecto sc seleccionaron 150 nios, 50 en cada estrato, y se
obtuvo los siguientes resultados:

de
Condicin Poblacin Propolcin
pobreza total muestral
Indigentes 12 000 0.45
Pobres 36 000 0.60
No pobres 27 000 0.74

a) Calcule el intervalo de confianza al g8 7o para la proporcin de nirios de la provilcia que


asisten a la escuela;
Si la estimacin debe tener nn error dcl 3.5ya, cncuentre los tamaos muestrales para que:
b) La muestra sea mediante asignacin equitatirra:
c) Ia muestra sea mcdiante asignacin propurcional;
d) la nuestra sea por asignacin cle Nevnrn.

11. El Sr. Vargas est pensaudo postular a la alcalcla del Pr-ryo. Antes de folrnalizar su candidrtura
decide realizar Llna encuesta de opinin err la localiclad. Prra ello se zonifrc el cantn en 3
sectores y se obtuvo los siguientes resultados

Total de Nmero de Pobladores


Zona
habitantes consultados a favor
Norte 15 000 200 40
Centlo 5000 100 27
Sur 25 000 200 60

A un nivel de confiabilidad del g5 %:

a) Encuentre la estimacin de intervalo errtle los cuales se podra considerar que se encnentra
la popularidad del precandidato;
:Sirr Bilitr,rte es ulr santo cle ll tradiciu popular clel Guayas a quien se Ie asignzr el podel cle hacer llovcr
1,

nejolal las coseciras.


73.6. Muestreo por conglornerados 4O3

Si la encuesta tiene un costo fijo de 5000 dlares ms nn costo variable de 4 dlares por cada
entrcvista, cunto le costar este trabajo al Sr. Vargas si se quiere tener un error de 5.57o y Ia
selcccin ser

b) asignacin equit ativa;


c) asignacin ploporcional;
d) asignacin no proporcional?

12. En una investigacir sobre Ia produccin de manzanas en Ia Provincia del Tungurahua se desea
cstimar la proporcin de agricultores que se dedican al cultivo de la mencionada fruta y la
pr:oduccin media, en miles de kg, de cada parcela. Se realiz un sondeo en 3 cantones de Ia
provincia, a continuacin se presenta un resulrlen de los datos obtenidos.

Tamarlo de Tamao de Proporcin Varianza


Cantn Promedio
la poblacin la muestra muestral rnuestral
Arnbato 5135 75 0.65 6 000 640 000
Patate 2773 50 0.7r 8 000 722500
Pelileo 3472 50 0.52 5 000 518 400

a) Encuentre el intervalo de confianza al 96Vo para la proporcin de agricultores que se dedican


al cultivo de la rnanzana;
b) Encuentre el intervalo de confianza al 96 Vo para la produccin media de rnanzanas en Ia
zona de estudio;
Si en un estudio sc rlanea realizar 175 etcr-restas, detcrmine los tamalios rnuestrales en cada
estrato, de mancra que la forma de asignacin de los estratos sea:
c) ecluitativa;
d) proporcional al tanao del estrato;
e) no proporcioual al tamao del estrato.

13.6. Muestreo por conglomerados

La elaboracin de uu muestreo aleatorio puede ser costoso y difcil de realizar porque la poblacin
cst clispersa en un rea extensa y la localizacin de cada elerlento de la muestra podra llevar mucho
tieurpo. En estos casos se practica el muestreo por conglomerados.

Definicin (de conglomerado) Los conglomerados son subconjuntos de la poblacin que tiencn
la propiedad de ser internamente lo ms heterogneos y entre ellos lo ms honogneos posible.

Por cjemplo) en Ltna inr.estigacin se desea conocer la opinin de las arlas de casa de una ciudad. Err
h,rgar cle sortcar a los individttos, se procede a muestrear aleatoriarnente las lttanzanas de Ia ciudad y
clcspus a entrevistar a todas las arlas de casa que viven en cada tura de las nanzanas seleccionadas.
As, cada manzarla conteudr ttu conglornerado de elementos y el nrmero de elementos variar de un
conglomerado a otro.

Eu este tipo de mLlestreo Ia construccin del marco muestral es fcil, porque se rlaneja elementos
nayores v los costos de la investigacin se rebajan. En cambio, se corre el riesgo de que los elementos
el cacla conglomerado sean rnuy homogneos; por e.jernplo, si en nna manzana viven rnicamente
faurilias de un nirrel socioecournico alto, Ias respuestas de las amas de casa consultadas pueden ser
mny parecidas. perdindose 1a heterogeneidad interna requerida.
404 Captulo 73. Elernentos de Muestreo

Para compensar estos problemas se necesita escoger el nmero suficiente de conglomerados para tener
Ia necesaria variacin en las respuestas.

Al igual que en las otras secciones, examinaremos los intervalos de confianza para el total, Ia media I'
Ia proporcin poblacionales.

13.6.1. Estimacin del total poblaciona


A continuacin presentaremos el estimador por intervalo del total poblacional T y una frmula apro-
xirnada para el clculo del tamao de la muestra.

Intervalo de confianza

El intervalo de confianza al (1 CS

(^

Doride
I
/ es el nmero de conglomerados en la poblacin

1L es el nmero de conglornerados en Ia muestra.

nti cs el nmero de elementos en el conglomerado i, con i: L,2,. . .,fr.

i,,o
i:t
rn es el tamao promedio del conglomerado en Ia muestra, que se calcula por ,: n
N
h[ es el nmero de elementos en la poblacin, que se calcula por M: D m.
i:r
M es el tamao prornedio del conglomerado para Ia poblacin, que se calcula po, M : +
/
ri es la surna de las observaciones correspondientes al i-simo conglomerado, con i:1,2....,rt.

i es la estimacin del total poblacional corno ? : Mr.

i,o
o;t
T cs el promedio muestral, que se calcula por 7 =
D
i-7
nro

rL

L\r - rnr)''D
s es Ia desviacin estndar, que se calcula por s: i:7
n-l
rL
rD
iI \\r - r,nrl)' -
i,:l
i "? -
2z i "m
+t2 i m|.

Nota. Si uo se dispone de M se utiliza m.


73.6. Muestreo por conglonterados 405

Tarnao de la muestra

El nrmero de conglomerados a incluir er Llna muestra, obtenida de una poblacin conformad.a por l/
conglomerados, con un 95.5 % de confianza y un error -8, dado es

N
?16 (zo)2N2s2
/i ::------;. dutidc /?U: --------;6--.
/r0 -+- lv ,E

La frmula de evaluacin de r incorpola, en el denomilador, una correccin que se debe a que tratamos
con Llna poblacin finita.

trjemplo. En una ciudad viven 38 300 personas distribuidas en 10 500 farnilias. Se seleccionaron 12
fanilias para estimar el gasto mensual en transporte. Los datos se encuentran en la siguiente tabla:

No. de personas Gasto Gasto total


Familia
por familia (nz) mensual ($) por familia (r)
1
r
t) 25.2; 54.0;22.0 107.2
2 4 35.0; 18.6; 61.3; 18.0 132.9
3 2 46.2;45.3 91.5
4 1 53.9 53.9
I
L, 71.0; 69.3; 84.0 224.3
a
b 94.0; 78.8; 16.0 188.8
7 2 83.4; 19.3 702.7
B 4 27.7:94.8;38.1; 43.0 203.6
I 1 48.6 48.6
10 2 23.3; 58.9 82.2
?
11 d 73.6; 63.4; 31.0 168.0
12 3 68.5; 65.5; 42.1 176.r

a) Encoutrar un intervalo de confianza para el gasto total de la poblacin en transporte, al g8.5 %;


b) \4anteuiendo los datos cle a) , detelrninar el tamarlo de la mnestra pala tener un error d.e 100 llil
dlares en Ia estimacin de r.
Solucitt': De los datos del enunciado, el nrmero total de conglomeraclos es l/ : 10 500 y el nulero
total de habitantes en la ciudad es,4,1 :38300; adens, zolo7s:2.43.
De la tabla se obtiene que ?? : 12 y

I nz; : 31,
I"t : 1573.8.
i:T ;_1

ir) Carlcr.rlemos los conpolcntes del i'tervalo cle confianza para r:


1a

\-
1, .,:,
:: 'n, :__;;_:iu.7u7,
1573.8
rr
\ ttt;
i:t
'r : Alt: x :
38 300 50.767 1944376,
?INrL

>,r? :245491.5, I",rrn : 4576.5, fi-7 rrl : Ot


i:7 i:I
406 Captulo 73. Elententos de Muestt'eo

Corno

D,@o --;.)2 : i,l - ruirnri tr2i,,?


i:7
245 4sr.5 - 2(50.767)(4576.5) + (50.767)2 (e1)
15 354.45,

15 354.45
t--I 11
: 37.36.

Sustituyendo los rralor-es antes encontlados en Ia flmula:


T^r
tr-' : z^t.N.stlt\ -1r .

"/' V Jrr
l0 500 - 12
: 2.43 x 10 500 x 37.36 x :275020.
l0 500 x 12

EI intervalo qr.reda:

(i - E,;i + E,) : (1944376-275020;7944376+275020)


: (1 669 356; 2 219 396).

As, el gasto mensual total de la poblacin en transpor-te est entlc los 1.67 y 2.22 millones de
cllares.

b) Para el clculo del tauao ruuestral usamos E":100000. Prirlero, obtengamos ns:

^^ Qn)2y2t2 e.$)2e0b00)2(37.36)2
rtr--
AA o,
E'l (100 000)2 -JU.O|.

Entonces,

tz6 ly'
11, :
ru6 f ltr
: 90.87 x 10 500
:90.1.
90.87 + 10 500

El tamao es de 91 conglomerados.

13.6.2. Estirnacin de la media poblacional


En Io que sigue se presenta el intervalo de estimacin de la meclia poblacional y una forna aploximercla
de cleterminar el tamao muestral.

Intervalo de confianza

El interrralo de confianzr al (1-


") x 100%
para la mcdia poblacional r cs

s
( a-2^t:.,," At V
F- ly'r
73.6. Muestreo por conglonterados 407

Tarlao de la muestr-r

El uttlero de couglomelaclos a incluil erl Lrna lllrestra, obtenida de una poblacin coltfolmacla por l
conglomerados, con tur 95.5 % de confianza y un errol Ep daclo es

rr l/ t - .^\2.2
(tolt(le l?n: --#
?o * ly''
'
( N\'2L-'2
'..., -ll

Ejemplo. Si en el ejemplo antclior', soble el gasto en tr-anspoltc de las fllilias clc na ciuclacl, sc
rlctscar't utta estitrrtcin clel gasl,o mensual pr-omcclio en tlanspolte pol persona. a) Encontr.ar Lln
itttctr'tlo cle confianza parr lr n-rcclia poblacionerl, rl 98.5%; b) \fantenielclo los mismos clatos, fi.jrrr.el
lrttrrrto clc la rluestrr pltlI lcrrel ul cllol de 5 cllales en la estimacin clc
r,.

Sol,tt,r:i.n:

a) Hirbirmos cletelminaclo <-rc lV : 10 500, 1 : 38 300 y n: 72. Aclcmiis,

t
I2 12
\- : :
) rrr J1' t 1573.8,
i:1 i:T
n : 2.583. M : 3.647.
i:50.767, J / .t).

El clrol clueda:

Ti
.^t)
-'/ - s, Il-.
_
V A/-r

2.43 x 37.36
: 7.782.
3.647

Cortsccuenterrenl,c. cl inl,clvalo clc confirlza l)rr.r l cs

(r - Dt,;r -f D,) (50.767 - T .1.82: 50.767 + 7. 182)


(43.585;57 e4e).

Lo cFte siguific:L clttc cl girsto meclio clc Ia poblacin en concepbo cle tlzlnspoltc csl,i et1e los 43.59
y los 57.95 cllrlcs nlcnsualcs.
lr) El tamao clc la mrLcstr'r pala tcncl Llrl clrol E,.:5 se calcull as:

)
zal2 s- (2.43)2(37 36)2
,r,I-
" :24.79
ytrt/\lI Lt
/,r lt'l (3.oaz;z 15;z

l}rfonccs. cl trrnaiLo rLe 1r runestr,r cs

rt6 1V
rr * A
2J.79 x 10 500
: j-I. / J.
21.79 + 10 500

DI trrnario 1cc-lcl iilo cs ric 25 lrruiliirs


Captulo 73. Eletnentos de Alttestreo

13.6.3. Estimacin de la proporcin poblacional


Pr-esentamos ahora la forna de establecer el intervalo de confianza y el tamao de la muestta cuando
se estima la proporcin poblacional rnediante congiornerados.

Intervalo de confianza

El intervalo de confianza al (1 - a) x 100 % para la proporcin poblacional p es

/ s.p
,U n-" :P^+ zonf;V
s.p tr-"\
\'- '", N" x" 1

Doncle

Ar es el nmercl de conglornerados en la poblacin.

r es el nmero cle conglorlerados en la rlttestra.

???.i es el nmero clc elcmcltos cu el conglotnerado i, con 'i: I,2,...,t't.

l r:s cl tarnao plomeclio clel conglomelado en Il muesbra, que se calcula por T7z :

,4'ir es el nrmero clc clemcntos cn lr poblacin, qlre se calcttla por 11.[ - i:lD rro.

,41 cs el tanrao plor-ncdio clcl conglomerado palir la poblacin, que sc calcula por A.[ : AI
F
/; cs el total de xitos cn cl i-sitlo colglomclado, cort 'i: I,2,. ..,tr,.

D'i
f cs la plopolcin rnucshral, qric se calcula por t: ;l-
I
;-1
rn'"

7l
s, r)
L\y _ ptrt)-
,s,, cs Ia desrriacirr csl,nclar, qne sc crlcula por ,sp : i:t
n -7
]L]I?LIL

D(y - f
v ,i.-). nr;)2 : D,L? - 2iD,tJnti * f D rr?.
i-t i:I i:1

Nota. Si no se disponc dc ,41 sc utiliza ru.

Tama.iro de la rluestrt

El rlinrelo cle corglorner'rcios a inclrril crr Llua rnueslra, obl,eniclr de nna poblacin confoltnacla ror lY
c:onglonrer-aclos, cou rrn (1 - cr) x 100% clc corifianzr\ \ nn err-or -Eo claclo cs

,, : "o
A' clo'cle ,rn : &.
?s * Ar (M)2DB'
+

rl
,I
1 :].6. Muestreo por conglornerados 409

Eiemplo. el rtso de Internet por los ahrmnos de unl rrniversidad se seleccion aleato-
Prra conocer
rirmente 7 cle los.19E cnrsos de lr r:rt,iclircl. A los ahrmnos se les prepiunt si en la ltima semana
r .l

haban rrtilizado los st:rvi<:ios cle lntelnct. A continrrrcin se cla lr infornacin respecto al nmero de
alumnos t:onsultaclos ert r.:arla (:urso v cl nrnelo clc lcspuestas afirmatirras.

Ctrrso No. cle No. r'esplrestils CrLrso No. cle No. respuestas
(r) consultas (rn) alirrnntiv:is (y) (i) corsultas (m) afirmativas (y)
1 2i 13 10 66 45
2 J.1 1ti il7851
3 56 '2t) 12 29 19
4 87 .J
'J 13 35 20
5 2I 11 14 48 22
6 3Ci 2b 15 27 16
7 45 o.)
16 64 39
E
(l
4,1 1E 17 54 48
i1 LI

a) IJallat' el intclr.alo rle t:oufiartza al g7 Vo para la ploporcirjn cle estucliarrtes cle la universidad clue han
utilizar:lo Iuternet: lr) .A los alunlnos cle r:untos (:illsos hay que consultar para tener un elror del 47a
en la e-qtinra<:irin'/

Solu,cin; l)e los rlatos clc la talrla se olttiene que N : 498, r:77 y
1 7L

I "', : 5t)(l \ tti : JJi '


i-1 i- t

Pol tanto. la cstimacriril clc lir rlcllloli;irli r r:s


n
\-,
- ll
^ ;-r lJ/t-
A
I): n
\) - rlti
' St)t)
.i=)

tr) Cak:rrk:mos los otr'os clcnrcnt,os ckrl in bclrrakr:


1I n, tL

D,r? :74245, I,Yr''u :24006, D"'? : 43336'


'i-l i:I i:\
llnton r:es,

\ty, - ilrtr)' : D,ri 2frD,tliltti+i\r,ii


i-1
zrol'sr)lrzooelT'ro s5e)2(4s836)
: ::l;t:,

: 7.697.

Par't cl t'lt:ulo rlcl t'r'r'ol rr,:r sc clislrorur rlcl vlrlol clc 11, por'1o clue cnrrl<-.arcmos rrr.;

tr,

r7(r! rt
f,'
l1r'' : ().05216.
.11)8 . t7
4to Captttlo 73. Elernentos de Muestreo

Entoni:es, cl intervnlcl cs

(i - Ep;f + Er) : (0.5588-0.0846;0.5588+0.0846)


: Q.47 2;0.6434).

Es dc<;ir' <1rre entlc <:l 47.4Va y el 64.3 % de los estudirntes hrn rccedido a Internet, la ltima
serIln.

b) En el clculo clel tarrtao enpleamos Ep: 4a/o:0.04. as,

t( : r

ry::i:
sz
(AtS'z
') ')

' ' . .6t)7 ,.:79.73.


(2.t7\'2 (7
= (47
\',z

.06)2 (0.04)',2

EI tanrrri<i cle La rnrrcst,r'r es


rr1 .|y'

rt1. *.\
78.73 x 498
: 67.98.
78.73 + 498

Errtour:cs. sc clel-lt-' r:orisrrltal err 68 c:r.rlsos cle lr univer-siclacl.

L3.7. Ejercicios
trstimacin del total y cle la media poblacionales

l. Conrcl lcsrrltrdo dr: rrn rnrrcstrc;o llor conglorner'rdos sc obtuvo Ia siguiente informrcin:

A: : 10 000. r : 100.
?tt : 'ttl.2 : .' . : tl100 : 15, .41 : 150 000,
II II

I,t, : 48otl, !{"r _ rtr)2 :474.

a) Enr:u<;ntlt; uu intclvalo tle r;orrfianza al 95.570 para el total poblacional r;


li) Eru:rrcLrtrc rrn irrtclvirlo tlcr r:onfianzr 1 95.5%,paltr ltr rnedia r.

2 Err una r:irrrlarl pcr<rcr'rir. rlontlr: ha-v" 3200 lurga,r'es. sc lcaliz ur sonrleo para cstimar cl tiempo
rneciio (l1ro crl los lrt-rgrrlcs sc ve lr tclcvisiu <lirliarrrenbc, La cnrplesa dividi Ia ciuclacl en 450
rrrrnzrrris, l)or.'(luo rro tlispona clc una lista clc los hogarcs y selecciou 8 manzanas cle casas al
tzlr. En la sigrricntc trblr se inclicrn el nrirnelo cic hogares y el tiempo total (en minutos) clue
Ias familirs. en t:rclt rrrirrrzirur. rlr,'clicriu r rniLu lr televisin.

t[tr Ti.trlr. No. rlc Ticmpo


^\I;rrrzrrr;r .N'r'
Iro1irri's l ol rl
i\lrrzrrril
liogarcs total
(,) (rri) (,r,) () (nt) (")
1 5 7120 U 8 2610
2 6 1350 6 7 2780
:i E 2720 I 7 2550
1L 72 35titj 8 I 2770
73,7. Ejercicios 4Lt

r) Hlle los intt:rr,rl<.,s clcl confirrnza tl 94 %, ptLltr el tienrlo toterl y el tiempo medio que los
hogarrcs cil: lr t:irr<lrrl clerlii:rn r vr-'L lir tclcvisin;
b) Enc:rrentre cl trn,rno rlc Ir rrnest,r'l pzrra tcner .,r, cle 19 rrrinrrtos en Ia estimacin ch.
lr nedir.
"rrnri

3. Err rtua acaclemia cletlicatla a la elseanza tlel iugis se clesea cstudial el nrmero de aos que los
alututros Ilevau aplcntlicnckr cstc icliontr. Sc. r'ealiz csta plcgunta cl 5 cle las 68 clases que tienc
l ac:aclemir con los lcsrrltaclos sigrricntr:s:

Clase 1: 5,4.7,,5, 6, 5.
Clase 2: E, 6, 8, 9,6,7,10, E, 6.
Clrse 3: E, 12,10, LI, 72,9, 13, 12.
Clase 4: 12, 9, 11, 10, 10, 8, 12, 10, 73,72
Clase 5: 14, 72,10, 11, 12, 13, 13.

a) Estirrrc t-'l llriutelo ltrcrlio rlc los arios rlrrr; llrrvrur cst,rrtlialrtLl iLrglcs Ios cst,udirnl,cs tlt: llr
rrt:rrrlclttilr. IJstl,r' :,17,;
b) Si sr: clttisicttr cstirtrrl cl plorucclio tlc airos <1rre llci'iru cstudirudo t.oclos los cstudiirntes <ur
sc cncuentlrtn <)r.r rcrrlcnilrs Llc crrscr'rrnzu rlt-'ingls c1r-rc fr-rnciorriltr cll la ciuclacl, col] Lrrr clt'or
rb 0.5 i.uos v <;onIirbiliclid tlcl g7%,. trtilizlrrlo r:oLlro ulucstlil Piloto l;r r:orrsnltt lcilizaclr
ir krs 5 (:ru'sos lrrrti:r'iolcs, crrc;uclllo cl trnrlriro rlc Irr rlrr-rcsLla, si sc csLiml crc Loclas Iirs
ar;irrlcrtrirs l,icucu trLicltrs rrri LoLal tl,e 725 clrscs.

Dstirnacin de la rroporcin poblacional


zl. Como lcsultrclo tk: rrrr lrnrcsLrco lror r:orrglomclaclos sc ha olr[crriclo Ir siguicntc informar:itilr:

10 000, rr : 100,
,Il
II 'ttt'2 : .. . : tit100 : 15, If : 150 000,
t

L,,,, 3oo, !lu, - fr,,.,)z: 5628.


i: I

Dut:ttcnirc rur inl tttr,tl<) clt-'t:onfirruzr rl 95.5% 1,artr la proPort:il 1.roblr:iorri.rl 7.,.

5. Un inrrottirtlot tltt Lt.rlrit ttsittlir. rur (:llgllncrrt.o clc 500 ptrclueLcs, sclcr:r:ic.rrrti
tlcsptr<1s <lc rcr<:ilrir
alcll.otiarncr1,c 10 tlc rtlltts ),c()nt cl rtriru<tlo rk: ltlcrrrlas rlcl.c<:t,rrosrs 1.ror'ltirc1rrel,c, Drlsrclos cl
lc.,s <lrtc's rlr: lir sigrricrrtc trblt:

h\<1. rle No, clc plcrrclas . No. <lc Nu. tlc prendas
Pirrlrrct,c
cntlrrs l'lttlttcl.
pt clef'ct:t rrosrs 1;r'r:nclirs <lcfccIrrosrs
(,) (rrr,) (.y,) () (rr4) (y,)
L E5 'J:] 0615
24420 77825
;i 5ti 18 E5919
47723 95527
t- 61 2I 10 68 22

ir) Etrt:rtcrrtli' rttt itrtt'Lr'ilt.r rlc r:ortfirrtzii ril gU% l)rlrr lI lllopolcirr p <lc lrrcudrs tlcl'cct:rrosrs
cn cl t:rtrgztulctrto tlc rt-r1.rar:

b) Estrrblcztr rrl 14,,r,,,, nrninrr.r parit tcrrtr lur crlor'<lc lt cst,irriuriri rLcl .l%,.
4L2 Captulo 73. Elernentos de Muestreo

(t. Una empresa rgl'oexportadorr empaca melones en carjas que contienen 8 rrnidades cada una. Por
ploblernas cn el trunsrorte se estropc lrn (:rrganlento de.1000 ca,ias. Para conocer las prdidas
or:asionadrs se seler:<:ion rlertorirrnlente 20 cajas y se cont el nrimero de melones golpeados en
r:ada, ca.ja. l,os lesulttclos sr-l clan a ccntinurcin:

No. de frrrtas No. de frutas


\,
"
11 1
golpeadas "
Llrr t
golpeadls
10 11 0
2I 12 1

31 130
42 142
50 150
60 160
72 173
85 18 1

93 190
100 204
a) Encrrentre rrn intervalo rle confianzr. al 96.5%o para ler ploporcin de melones golpeados;
b) Si ei expoltrclor pier'<ie 1.7 dltrr'<:s por caclar fruta est,r'opeada, encuentre el intervalo de
al 96.5% ptu'ir la prdidar total del cargrr.nrento;
t:onfirnzr

t') ,Crrtil clebe scr el trrnrritc.r d<l lr mrrestrl parr tcner rrn error de 0.045?

7. Elr rur lralrir de lr c:irrclrd viven 200 faniilias. Unr muestra de I familias suministr informacin
n:latir'r al nrinrerrl <lc rnienll-rros, ingreso farliliar cluincenal (en dlares), gasto en alimentacir
(cu tkilarcs) r,si tierrc suscripcin zL algn reliclico. Los resultaclos fueron:

Nr.r. cle J ngreso Ciasto en Suscripcin


Frrnilir
micrnblos crinc:cnnl irlirncnta,cin reridico
1 2 262 82 si
2 ') 184 96 no
.)
3 D 193 101 no
4 5 145 76 no
5 4 283 722 si
b I 301
'113 si
7 2 247 104 no
cS 4 255 123 no
()
2 22r 1,02 si

Con rrn confinbilidrcl clel g5 %, estime:

a) el ingteso <rirrr:errll merlio dc los miemlrros de las fan-rilias;


]r) cl cn rlirlrclrtric:itirr pol l)ersona;
gasl,r.r prorrirrrlio

c) el inglr:so cluinrrcnal rromeclio cle las familias que tienen suscripcin, si se sabe que en el
lrltlio hw 75 srrscuitos. Compare con los lesnltaclos de a) ;
d) la proporci<irr cle fulilias suscliptoras a un peliclico. Compalc con el dato real;
e) Con los drtos de rr), b) y c), deterrninc el tamao ptimo de Ir muestra, si se desea tener'
lln cl r'()r' clc cstinra<ritin rlcl 15 %.
Captulo 14

Respuestas

Captulo 1

Seccin 1.7

3. N: 40 Yo, R:75To, B: 45To.

4. a) categricos; c) el2l%.
5. a) tamao, peso, velocidad y agresividad son datos ordinales; funcin es nominal.

6. 2.5%.
8. c) 72.5%.
9.26%.
70. 20%.

77. 52.4%.

t2. 70%.

13. n:160.
)4. a) 880; b) 752.

15. n:50.
16. 76.

77.275.

18. 44.64%.

L9. r8%.

20.
lntervalo 0-40 40-80 B0 - 120 -
120 160 160 - 200
Frec. relativa 0.05 0.45 0.10 0.10 0.30

473
4L4 Captulo 74. Respuesas

Seccin 1.12

1. La mediana.
2. a)T:4.875,b)Me:5; c) s:1.553; d) R:b; e) As:-0.644;f)Ap:0.b92.
3. a) 7: 6;b) Qz: 5; c) s :2;d) R : 5; e) RIQ : 4;f) As :0.362; d Ap: -1.g26.
4. c) r: 0.75; Ilfed: 0.35; s : 7.789; h :2.33; Med, : L.75; s : 2.002.
5. 2.94%.
6. a) 6; c) 86%; d) 66%.
7. a) Cuantitativos: precio, proporcin de malta y tiempo de ae.jamiento, Cualitativos: cate.
gora y nota; c) Precio: r :87.56, Mo :70, Qz: 86, Malta: :48.96, Mo : I00, Q2: 49-
Tiempo:7:9.06, Mo:12,Qz:8.5; d) Precio: s:23.166, RIQ:28,CV :0.2646, Malta:
s : 30.114, RIQ :42.5, CV :0.615, Tiempo: s :2.697, RIQ :5, CV : 0.298; e) Precio:
As : 1.339, Ap :2.801, Malta: As : I.092, Ap : -0.542, Tiempo: As : -0.233, Apt : -1.406.

8. r :32.54; Me:32, Mo:34.


9. a) r :6.56; b) Mo : 7; c) s : 2.727; d) E : 8.

10. u) Qz:6; b) r:5.046; c) s:2.63; d) RIQ:3.


11. b) Sugerencia: Use Lo:24.5 y A: 4.

72. a) r:167.5, s:7.265;b)TTH: 167.189, MG:t67.J44;c) ez:t6T.S, RIe:5.


13. a) Qt : : 5.4, Q : 8.05; b) M H : 3.715; c) MG:
2.9, Qz 4.5837.

L4. a) T : 12.29, Qt : 7.73, Qz : LI.SI, Qr :17.36.


15. mn : 0, Qt :2, Qz : 3, Qs :4, mx : 8.
16. a) r":2I.57L, s":2.149; b) ft:70.829, s/:3.8685; c) rf :I.8r"132, s:1.8s".
17. a) s : 1.348, s = 1.15; b) (2.28;5.52), (1.48; 6.82), (0.t3; 8.22); c) n1:82, n2:49, ns:50.
18. b) Qz:116; c) Qt:107.25,Qs:121.5; d) r:114.59, s:12.43;f) As: -0.602, Ap:t.2IB.
19. 33.3%.

20. 665.6 km.


21. 85.62 km/da.
22. 168 cm.

23. 8.
24. 101.

25. 19.

26. Med : 37.92, Mo :36.92.

27. 500, la mediana y moda.


28. 20.
4L5

29. a) rr : 9; b) 8.1 cigarrillos.

30. 268 800 Tm.

31. a) 356 mil dlares; b) 49.5.

32. 80o/o.
33. 5r.

34. a) 850; b) 900.71.

35. a) 640; b) 2%.

36. 6.27.

37. r:6, Qz:6.375, s:2.94.


38. , : 47, Qz : 48.33, s : 13.75.
39. Qz:52.23.
40. a) 20; b) 30 %; c) r : 1108, Med: 1083.3, Mo : 1040.

Captulo 2

Seccin 2.6

1. a) 6; b) 1; c) 3; d) 3.

2. a) 12; b) 1; c) 6; d) 30.

3. a) 3! : 6; b) ! :24; c) 5! : 120; d) 6! : 720.

4. a) 12; b) 20; c) 40; d) 65.

5. a) 40, b) 700.

6. a) 9; b) 25; c) a9; d) 64.

7. a) Combinaciones: 10, variaciones: 60; b) Combinaciones: 20, variaciones: 120.

8. a) Son 20 parejas sin reposiciny 25 parejas con reposicin; b) Son 30 parejas sin reposicin y
36 parejas con reposicin.

9. De 36 maneras.

10. 1330.

11. r20.

72. 720.

13. 504.

14. 84.

15. 0.5.

16. a) r20; b) 50a0, c) 2160.


4L6 Captulo 14. Respuesas

17. v? : 42; b) C? :2t.


")
18. 380.
19. r28.

20. 450 formas diferentes.


27. 105.

22. 84.

23. a) Cfo; b) 166; c) 15 x 165; d) 153

24. 77.
7
25. 26D36i:2.096 x 1012.
i:o
26. a) 4 x 75 : 67 228; b) 73 +3x 7a +4x 75 : 74774.

27. 6720.

28. a) r e Ac ) B' ) C"; b) r e Au B u C ; c) r e (A ) B') u (8" rt C") u (A o C');


d) r (A'.8 nC) u (A.'8" nC) u (Ane.C"); e) r (AnB^C)'.
29 Sugerencia: Utilice los axiomas de la probabilidad.

30 Pr(,4 n il :, Pr(A u B) : ,r{a n B') :


*4. 1.
1
a)'2-: b)'6',',8
1.3
31. -: c) -.
ao a) Pr(A") : 0.625, Pr(B') : 0'5; b) Pr(A u B) : 0.75; c) Pr(A' ) B") : 9.25'
d) Pr(A'n B) : 0.375, Pr(A n B') :0.25.
33. Sugerencia: Utilice Ia frmula de la probabilidad de Ia unin.

34. O : {1C, lE,2C,2E,3C, 38, 4C, 48, 5C, 5E, 6C, 6E).
JJ, a) Pr(A) :0.4; b) Pr(AuB) :0.9; c) Pr(B") :0.4; d) Pr(AnB) :0.1; e) Pr(A\B) :0.3;
f) Pr(" n B") :0.1; s) Pr[(A n B)"] : 0.9; h) Pr(A U B"): 0.5.
36. a) f): {(I,I,I), (I,I,D), (I,D,I), (D,I,I), (I,D,D), (D,I,D), (D,D,I), (D,D,D)};
b) C : A \ B; c) B' : {(I,I,D), (I,D,I), (D,I,I), (I,D,D), (D,I,D), (D,D,I)};
BUC: {(1, I,I), (I,I,D), (I,D,I), (D,I,I), (D,D,n)}; AOB: {(I,I,I)};
A.ttB.: {(1, D,D), (D,I,D), (D,D,I)}.
37. a) Pr(A) : l; u) Pr(A u B) :3; c) Pr(A') :25.
38. 2:
4ll

39. a)
'or i
, (i)': $,
36
40. a) o)
64
417

1
47
15

Ctr
42. :- 1
q- I
tJ

3
43
38

44
cB c3 1-c c8u
c13.
: 0.e231.
23
45.
t14'

46. al L c?nn' "' ' c?oo'


a)1_.-3u,b)1--$,.

47.
.-
l--.
c?n c?o
cBo

48. ,l't 4,
C%
ul
",
309to, ao93u.
! u/
"l Cuno C?o

t7
49
33'
c c3, + cB c8 + cB c38
bo. ') f ; u)

51

52.

53.

54.
20

55. p- -1 'tT

Seccin 2.9

3. a) Pr(A lB) : l; r,) e,(rlA) : ); c) P,(AIB) : ]; a) er(a "lA) : ]; ") P,(,a" lB') : 5
g'

f) Pr(B'lA) : :
1
4. -.
4
11 : c) no son independientes.
5. a) Pr(A): i, b) Pr(B) ,;
7 1 11
6. a) Pr(B\A) : ,r, Pr(BlA): i,, Pr(Au B'):,r;a) Si son independientes.

7. a) A y B son independientes. b) Ay C no son independientes'


4L8 Captulo 74. Respuesas

1
8.
5

.)
9.
28'
10. Envo conjunto: a) 0.9; b) 0.9. Envo por separado: a) 0.81; b) 0.99.

,r. 20
n
72. 0.75

13. a)'
45 b) 99
-'46' ', -.
110

7a. Pr(ClD) : 0.7557s.


19
15.
2018
16. 979

t7. a) 75.9%; b) 0.5283.


18. a) 0.08; b) 0.24; c) 0.a; d) 0.842I.

19. a) 0.322; b) 0.258; c) 0.238; d) 0.375.

20. a) 0.2a;b) 0.4; c) Si son independientes; d) Si son independientes.

27. a) Pr(M):0.45,Pr(Iz) :0.375; b) 0.075; .) ) rro son independientes.


i; l, ")
Sexo Hombre Mujer Hbito No fuma Fuma Ex-fumador
22. a)
p 0.5 0.5 p 0.46 0.26 0.28

- 0.26,Pr(FlM) :0.32; c) no son independientes.


b) Pr(-F)

23. a)' *; l j;
15', 5' "; ,ro son ind.ependientes.
24. a) 80 %; b) 0.59; c) 0.8537.

25. 0.3806.

26. ?.
4

27. a) 2a%;b) 0.667.


28. a) 0.65; b) 0.4.

29. a) 0.a; b) La B: Pr(BlH) :0.5.


.1 b)
7 c)
1
-"' *,t
30. a)
-:
L0,
', I0'", -7'
-:
31. 0.8235.

32.
y.
47

33. a) 0.898; b) 0.39.

34. a) 0.56; b) 0.7273.


4t9

35. a) 0.25; b) 0.25, c) independencia; d) 0.45; e) 0.45; f) 0.1.

36. 0.4539.
n7p
DN
d,. Card(A) :
2

Captulo 3

Seccin 3.3

1. a) discreta, {0,1,...,100 x 10e}; b) continua, 10, *[; c) discreta, {0,1,2,...};


d) discreta, {0, 1, 2, . . .}; e) continua, 0,24 horas]; f) continua, [0, -[;
g) discreta, {0,L,2,.. ., 100}; h) continua, ] - -, -[.
2. Sugerencia: Procure que sus ejemplos estn relacionados con su actividad diaria.

3. a) Pr(X A) : ], erlx # A):|,vr1x B) : |, er{x # A):?


0, si r<-2;
ll4, si -2<r10;
IIll2, si 0( r<t/3;
1, si r>t/3.
X 5 50 100
0.1 0.3 0.6

68/95 51/190 3/190

0, si r 10;
0.6, si 0<r<1;
X 0 1 2
a
J 4 0.92, si l1r<2;
p 0.0384 0.6 0.32 0.016 0.0256 0.936, si 2<r<3;
0.9616, si 3( r<4;
1, si r) 4.
X 0 1 2 3
p 0.00001 0.00167 0.07663 0.92169

3600. 1525.
a)k: b) Prrl < x <):
'5269',',\-5269
10 a) c:]; u) e.(x < 1) :
f,,Yr{x <2):f , e.{o < x <3) :;
11. b) 0.608e.

t2. Sugerencia: utilice las propiedades de las series telescpicas.


( l'l
13. u) r(r) :{ Dnn(J-dk siz)Q;
I o sir(O.
c) Pr(X >2): (1 -p)3, Pr(X > 4) : (1 -p)a, Pr(X < 3):p(p2 - 3p+3).
420 Captulo 74. Respuesas

14. a) c: u) c: 1; c)
r;
a) !,f) c:1.
,rg; ": ]; ") ":
2
15.
'3'-:b )]; ") I' ol
a)
i
16.
X rt o 1

17.

b) Pr(X :0.2): 0, Pr(X < n14) : +,Pr(X > trll) : 0,Pr(trfI2 < X < r) : t.

18 a)c:r,f(x): b) pr(x :rt3):0,pr(".1) :],r.(rxr .i):i


{; ;F[3:i]: :l

19. a) a: r; b:2; b) .F(t) : I t,lr, :lsi)1.


=.?'. ,,
I
20. a) a:tu, u:f,; a) f @) : lilij;i"fj;
{to,,n,
c) pr(X < 0) : er1x < 1.b) : l, er1xlr r.2):?.
|,
27. a) Pr(" > 1) : j; u) er(r <2):l; er(r t ) :01.
")

22. b) Pr(X 2 1) :0.3.

23.u

r(1 > z) : c) El 26 % de las veces; d) : 3.43.


i*'

25. a) c: ]; u) (i ) j, {tt.l l; .) er(a n B) : 3,


, , B son independientes.
26. a) Pr(X < 3) : 0.316; b) Pr(X > 6) : 0.156, c) n: 4.8t.

r)
27.
]; u) i*, "l nosonindependientes; d) ffi
( o, si3r<o;
28. u) :{ \/a,si0(a<I;
ry(y)
( 1, sig>1.
b) P'(+ <x2<) :
i,r,(* .".;) :osbe
421

(T sr
29. (t): { to' si ;

|.0,
1

30 Pr(X2<l):;.

I zrr"'
( f: rr;
31 fu@): 4
-L.
I 0,
aJ'
14;
[ rario.

(0. si
Fr@):I;:, s z!!'t];
32. r z\&)
- z(*):Io'
- \ t,
rz\n)
I i; ",t
si z e [0,1]'

: b) fz(,)- o2exp(- o("o'-'))con -oo < n < oo


^) fv(,) {Z:,,
33.
; : 3:

Seccin 3.6

1. E(X) : 0.161, Var(X) : 0.2153, E(y) : 4.4, Yar(Y) : 2.84'

2. E(X) :0, Var(X) : 1, o(X) :1.


3. Si, Var(X) > 0.

4. a) 2515; b) -50; c) 15; a zJts; e) 160; f) 135.

5. a) E(^9) :3lt,Var(S) : 3o2;b) E(") : 3p, Var( T) :9o2;c) O(A) : Yar(A :


1.,
t,
: :
d) E (S'z)
* * r'.
3o2 *9t"2, E (A')

6. a) E(X) :0, Var(Xl:X,b) E(X) :0, Var(Xl:|,c) n(x) :0, Var(Xl : *'
d) E(X) : 0, Var(X) :
;
7. a) e(x) - 2.5, o(x):0.866; b) E(x) :9r2,o(x):
$t OE(x) : '5,".}1:
;fo,
d) E(X) - -4, o(X) :0.556; e) c: #, tt") : #, o(X) : In 4 (ln 2)z
'

8. P:0.2, o : 11.

L Yar(Z): 0.09.

10.

11. pr : 0.35, Pz:0.20, Ps:0.45-

72.
422 Captulo 74. Respuesas

13. a) a:0.5, b: t; b) /(r) :0.5, si 2 < r 14; f ("):0, caso contrario;


c) Pr(l < X <3) : 0.5, Pr(X > 2.5) :0.25; d) E(X) :3, Var(X) :
].
r4 a) c:fi; t) *,q Pr(X > 5):2;,Pr(X < D:#,,Pr(x2 -rzx+Bb > 0)
3
4'
d) E(x) :T,var(x): #
15. a)
X
p 8lL5 6175 rl15 b) E(x) : fi, c) var(x) : #
16. E(X) : -1.6 (prdida).
91
17. a) 0 : {A, FA, FFA, FFF}; ) c) E(c) : 1766.4; d) E(X) : Var(X) :0,62
*' 15'
18. C : L200

19. b) E(c) :37000.

20. a) E(X) : 3 autos. b) E(G) : 151 dlares; c) o(G): 90.8 dlares.


2t. E(X) : 202.94; o(X) :178.91

22. a)
: i)
Pr(X
100 100 100 100 100 100 100 100 100 100
b) E(X) : 3.85; c) Var(X) : 5.527.
23. a) E(X) : 109.39, Var(X) : 33.19; b) 54.70 dlares.
24. a) E(X) : 3, o(X) : 0.7746; b) E(v) - 5.5, Var(Y) :
+
25. a) E(X) :2;Yar(X) : 0.2; b) 50.225%.
26. a) E(") :4.8h, Var(") :2.56h2; b) E(C) : 48, o(C):t6.
27. a) Pr(X > 60) : 0.334; b) E(X) -- 5r2 : 49.348m; c) Var(X) : 461.3 m2; o(X) :2L.478m.
28. Sugerencia: utilice las propiedades de las series geomtricas.
29. Sugerencia: utilice el ejercicio anterior.
30. E(xY +2Y -x) : #.
31. a) 2; b)
'"1 f;
32. E(^9,) :0, Var(,S",) :;.
33. E(S") : fret E(?l,.) : tupa, Var(S") : TLo2 V-(",) : np (o2 * o'O).
1

34. a) M(t): :3, Var(X):2;b) M(t):0.3e-2t +


,("-,*e-2t*e-Stte-4t+e-'t), E(X)
0.7e-at * 0.2e-5t r 0.4e-6t , n1l;!;!, var(x) : 2.84; c) M (t) : e.5"-2t t 0.Je2t , E(x) - 0.4,

Var(X) :3.04; d)M(t):+,E(x) :1,Var(X) :3; e)M(t):*,E(x) :*,


Var(X) : |; rl M(L):r!+#:, E(x) : i," - 1), Var(x) :; - *
423

Captulo 4

Seccin 4.6

1. a) t5 dOlares; b) 240 dlares.

2. 25 dlares.
, :
3. .) i; ) E(X) : 109.5 110 Palabras.

4. a) n(xk) : !-,+1-l; b) sik espar, var(xk) :f, ., /c esimpar,vr,(xk) :I.


5. 42020
b) c)
") i; 7; *.
6. '11(t0,7,2),57

7. Pr(X:3) :0.5, no porque la probabilidad es alta.


8. a) 0.2913; b) 0.8357.
e E h,u ]]; " r
10 q i,ur li' q k
11. a) 0.1536; b) 0.1808; c) 0.9728; d) E(X) : 0.8; e) Var(X) :0.64.
L2. 0.537.

13. a) 0.26214; b) 0.01536.

L4. a) 0.36754; b) 0.609.


15. a) 0.083e; b) 0.0374; J o.sro.

16. a) 0.36; b) 0.997; c) a.

17. a) 0.9606; b) 0.9994; c) 3.97 x 10-6.

18. a) 0.05631; b) si es efectiva, pues la probabilidad de que nadie se contagie es muy baja.

19. a) 0.0002187; b) 0.67058; c) 13.

20. a) 0.109; b) 0.999a; c) 0.5885; d) 16; e) 3.2.


2L. E(G) : 11.6 millones de dlares. b) o(G) : 8.08 millones de dlares.

100
22. pr(x < 9b) :1- t cf00(0.0b)k(0.9stoo-r.
k:96
23. Al azar:0.17188; con informacin: 0.5.

24. 0.0504.

X b) 10 preguntas.
25. a)
-
p 0.1 0.09 0.081 0.1 x 0.
424 Captulo 74. Respuesas

26. b) 5 cartuchos.
0.2 0.16 0.128

a) 0.22II; b) 0.007946; c) 3 partidos.

E(X) : 8.33, es decir 9 refrescos.

3 gusanos.

a) 0.04087; b) 0,03564.

0.3188.

a) 0.04364; b) 0.00032; c) 25.

a) 0.032; b) 5.

a) 0.0902; b) 0.9473; c) 0.0527; d) 0.2405.

): 6, a) 0.089235; b) 0.061969; c) 0.59278.

a) 0.14653; b) 0.56653.

a) 0.1954; b) 0.2381; c) 0.7619.

a) 0.224; b) 0.5768; c) 0.9502.

0.14288.

a) 0.60653; b) Binomial: 0.937; c) 0.96343.

700 dlares.

a) 0.3679; b) 0.2652; c) al menos 300.

E(C) : 200 dlares, : 47.43 dlares.


"(C)
a) 90.48%;b) 9.52%; c) 0.8187.

a) 0.0006415; b) ) :32, Pr(X < 30) : 0.338.

0.14288.

): 6, a) 0.1606; b) 0.1512; c) 0.715.

a) po : 7e-2 - 0.94735; b) 0.12896.

50. a)' .\ : 4, b) 0.4863.


20"
425

Seccin 4"10

1. a) 0; b) 0.75; c) 0.5; ct) 0.75; e)


1

2. a) 0; b) 0"6; c) 0.a; d) 0.8; e) t : ;. 1

,)

t;
..).
i2'
4. L/,U.

a) A.4; b) 0.2; c) E(jf) : 22500 diares.


71
6. a) 0; b)
n;q;
7. a) 02; b) E(A) : lr'l
frn, Var(A) :6.223.

B. 0.75.

9. 0.8.

10. 0.15.

11. a).\:6, f(r):a' u"-u',


^ sir10; E(x) : 1 var(x) : 1

!. si r o. u' B6t'
( sir<o; E(x) I var(x) _-
b) .\:3, l@) :1 o,
i"_*, ;; ;; i, ==
n;
1

\
c) ,\:0.5, f(d:Io' .r"-o't,, sir<o:
.t; i . E(x) :2,Yat(x):4;
t
: f o' si
: :
d) ,\ 0.25, I@) =-
I 0.2b"-r,r,, .t ;; 3" E(x) 4, var(x) 16'

72. a) 0.03; b) 0.66; c) 0.31; d) 0.34.


1
13. a) 0.6321; b) 0.1353; c) 0.2325; d) E(?-) :3h; e) E(C) :L20 centa.os.
": 3'
1.4. a) 60; b) 0"5034, c) 0.7788"

15. a) 0.368; b) 0.248; c) 0.451; cl) 0.2152.

16. a) 0.9rj; b) 0.35.

17. a) 0.287; b) 0.148; c) 0.0695"


10
ao. a) 0.13534; b) 0.2:336; c) 16; d) 790.

19. a) I t00; b) 0.135.

24. a) 0"368; b) 0.6065.


i ,"
21. a) /(r) : b) Pr(i,<5) :0.bg8,iJi(Y;,4) :0.598,p1(lyl <3) :0.28b.
{2nu(r-5)2132.
22. { A.4A2.; b) C.309; c) C.276 d) 0.tt28^

OD
rt- 82.28%.
426 Captulo 74. Respuesas

24. a) 0.71i8: b) 0.055; ci) 0.733.

25. a) 0.02275; b) 0.65542; c) 0.15866.

26. a) 0.titi1: lr) 22 rnin.

27. 0.403.

28. a) 72; b) 8a.6; c) 185.

29. a) 62 crn; b) 58.7 cm.

30. a) 145; b) 537; c) 7484.


31. h:2metros.
32. a) (i) Pr(X > 167) :0.5, (ii) Pr(x > 170) :0.16; b) (i) Pr(l' - 4): (0.16)4:0.0007,
(ii) Pr(}, - 2) : ctrQ.5)4: 0.375.

33. a) 0.9088; b) 03a67; c) 13.49; d) Pr(X < 12) :0.01, o : 0.34335.

34. Pr(Iz) : 0.5987, Pr(M): 0.6915, Ia mujer es relativamente ms alta.

35. a) 95.45 %; b) 0.83.

36. a) 0.0062; b) t : I772h.


37. a) 11.5%; b) 15.8%; c) 0.00152.
38. a) 0.8413; b) 0.01068; c) 0.6658; cl) 0.2367.

39. Pr(X > 450) : 0.01, r : 391.75g.

40. n) l.t : 70.72, o2 :3.

Seccin 4.12

1. 0.023.

2. 0.0985.

3. 0.0003.

4. 192 083.99 kg.

5. 0.0227.

6. a) 0.2375; b) 0.6657.

7. 0.04595.

8. a) 0.97725; b) n > 108.

9. a.) ,A/(7.5,5.25); b) 0.1379.

10. 0.0207.
11. a) 0.0E23; b) 0.0446.
t2. a) 20; b) 0.1269; c) 0.8395.
427

13. a) 5BB; b) 0.92758; c) 0.2330.

74. a) 0.2557; b) 0.05593; c) 0.78636.

15. a) 9(0.36), E(X) : 2.778, Var(X) :4.938;


b) E(S4s) : 80, Var(,9s) :222.22;
c) 0.8324.

Captulo 5

Seccin 5.6
X
D
Y 0 2 J

l. 0 0/30 t/30 2/30 3/30


1 tl30 2130 3/30 4130
2 2/30 3/30 4/30 5130
23
n_ 1
;b)
3
a)
20 B' ") [; 120'

e) ^9
0 I2
PS 61 lr20 5rlr20 81r20 211120

1 29 cl) 55
3") 89; b)
*,") -:89', ', -:
89',

e)
X -1 01
PX 17 l8s t4189 t7 l8e 4718e PY 15/Be 27 l9e 47 l8e

4. a)
4
b)+ 01 2 X2 T2 c)
:'49
.40
49; 417 217 tl7 I 17 217 417 -.
X
Y 0 2 r) 4
5. -VJ 0.075 0.050 0.025 0.0375 0.0625
0 0.201 0.134 0.067 0.1005 0.1675
6 0.024 0.016 0.008 0.0120
v,) 0.0200

6. a) -3410 b) 0.1965.
Px 0.25 0.43 0.32 pv 0.55 0.45
7. a)
X 10 20 30 40 b) 0.7392.
PX 0.r4 0.42 0.19 0.25 0.7r

8. a) 1, b)
1 2 3
c) No son independientes;
60 115 31L0 215 PY 4lr5 rl3. 2/5

d) Pr(1 < X<3;2<Y 5a) :*, Pt(X +Y <3) : 1

10

.
9. +(\ - 1); b) /(r) : "o"
r, fv( - coss.
JTa t' : fr
l0 lx\r) : *e '"'-'''; fv(a)
vrt "-'0";
no son indeperrdientes.
428 Captulo 14. Respuesas

4
11 4 b) si son indePendientes.
nrr
I2 a) fx@) : r) 0; fs,(y) : y > 0;b) (1 - (f +.lo)e ^") (t -" ^u);
^2tre-\',, ^e-\'!t,
c) 1 - (1 +.\a)e ^".

l3
p 1 o50 i3l50 21.150 7150 4150 p 3/50 22150 21150 4150

b)
t2 c)
xlv:o 1 2
rlrs 7 113 5113 213 113

t4. a)
X t2 4 5 1 2
0.22 0.25 0.23 0.20 0.10 0.30 0.24 0.t7 0.11 0.08 0.06 0.04
ut Pr(x :
r \ _____________::_ l
t2 45
klY :1) I 1bl30 gllo 4130 7130 rl30

15. Cov(x, t' : (n - 1)(t + 3)("' + r).


L2

16. Si rn y r son pares: p(X^,X") : L; si m y r son impares: p(X^,Xn) :1; si rn y n tiene


distinta paridad: p (X^, Xn) : 0.

77. a) 0.064; b) 0.102.

18. :2r; c) 0'1089; d) Son independientes.


a) a; b) f ("lvo)
r 2rI4
' Para w\e\r'
-,'t)ola 0(r(1;
19
")fx(r):1 [ 0, b caso contrario.
b)0.7a2:c) 0.04.

( (20 000)3
20. a)
"f(rr ,rz.rs):1
(rr*100)3trritolt(rs+Loo)5' rt>.0' rz> 0' 13>0;
[ 0, caso contrario.
1
b) Pr(X1 < 100, X2 < 100, Xs > 200) -
16'

2r. a) k:1; b) /s(s) :{* si 0( s(8; h(,):{ +' si 0<L<7:


0,
[ caso contrario 0, caso contrario. |.
(0 si s(0; <0;
c) F(s,r) :i #, si 0(s(B; 0<t<7;
t, I si s)8; L>7.

22 .)'256
3; a) fr(t):2t; c) Son independientes.

oa
") *;
l IxQ)-+,si 0( r12; Ivfu):+ si2( u<4;c) Cov(x.v) :-*.
,A a) a; b) fx@):2tre-'",ft(y):2!Je-!"; c) E(X) :E(y) :{,d) Soninclependientes.

ox
att a) :t r2r2+l si0((
"fx(r)
. 4 .,
1: h(u):iu(u't *2) si0<y< l:b) Cov(X.V): -2
r--,
209
c)trlX-Y)-' 350.E(X'-Y'\- 2527
429

'l t r\ ) t
26. a)fx(t):1(ur.."rt+'t\E-F*;),fv|):?(ur".unt+tt/L=P);rr)Noindependientes.
-\
( 2r-r17 ) si r)o.
' v'
27 a) 8; b) Ix@) 1 6(1 + z)a 'L
: c) No son independientes.
I O, caso contrario.

28. a) k:(n-I)(,n-2);
b) F(r.u\:
' \*,rt {I 0,
\- (r:_r)2-n - (a+r)2-" +(r+ a*r)2-''', si r ) 0; v> 0; n > 0;
caso contrario.

29. fx(r): i,t - r'), fv(a): 1, no son independientes;


a)

,,
b) f x@) :
f* * rr, fv(a): Gi l)s,
no son independientes'

30. fx(,): 3,," - *') ' #:"3;;; t' fv(: f 3a',


para 0<y1I;
{ I O, caso contrario.
31. Cov(X,Y) : -0.0f , p: -0.1306.

32. a) 8; b) f x(") : 4(r - r3), fv( : 4a3; c) E(X) : 9, : j,


15',E(v) 5', a; o.oon4; e) No son
independientes.

33. a) 10; b) /x(r) -5"4,0 <r<1, fv(y): fr{t _ y3),0<y <1, nosonindependientes;

c) Cov(X, rl : #, d) IvV::/z@lx : Il2): Bs, 0 < y < i'


I ",

34. a) I@,:;,si r ) 0,a ) 0, rts < 2; b) Ix(r):+, Iv(:?rc)


I
Cov(X, n: -I
35. a) f (r,r):; 11si lzl + lgl < 1; ) /(") - 1- lrl, si lrl < 1; ") E(x) :0, Var(X) : '
d) E(XY) : 0; e) Cov(X, Y) : 0, p(X,V : g.

36. a) 0.0153; b) 0.0234.

37. a) 0.025; b) 5.344 x 10-4.


38. a) 0.007; b) 0.013.

39. 0.02923.

/a -2 4\
40. I-z u -r)
\a -4 6/
47. Cov(S,,,, T,-) : rpo2.

/t 2 6\
42. Iz 6 18l.
\o 18 60)
430 Captulo 74. Respuesas

Captulo 6

Seccin 6.5

1. a) 0.7457, b) 0.9976; c) 0.0645; d) 0.0289.


2. rr: 3100 g, ov:1.5g.
3. a) p:400, ov: 20; b) 0.9104.
4. 0.0668.
5. a) 0.9890; b) 0.9257; c) 0.81351.
6. 0.13936 exacto, 0.73929 aproximado.
7.0.15866.
8. 0.9053.

9. 0.06802.

10. p, e (2.87 3.79).

11. t e (37.77;40.23).
12. a) 0.0456; b) 0.0228.

13. a) 0.0228.; b) 100.

t4. 0.0036.

15. 0.923.
16. 0.8132.
17. a) Estadstico; b) 0.00361; c) Si.

18. a) Parmeto, P :0.8; b) El valor de cada estadstico, calculado a partir de las muestras, estar
ms cercano a 0.8, a medida que aumenta el tamao de la muestra; c) 0.9846; d) la probabilidad
es mayor.

0.785.

a) 0.0918; b) 0.0485; c) 0.4772.

a) 0.9270; b) 2826.

0.0228.

0.0918.

0.09513.

p e (0.333;0.367).
p : 0.3679, Pr(f'> Il3) :0.758.
a) Pr(p'> 0.8) :0.1376; b) Pr(X > 20) :0.1935; c) La probabilidad de ganar debe mantenerse
constante durante el torneo.
43L

28. a) 3.33; b) 3.57; c) 34.17; d) 26.30.

29. 0.95.

30. a) 0.95; b) 0.09.

31. a) Pr(s2 > 8.1) = 0.0b; b) pr(2.66 < <9.52) x0.94.


"2
oo
. Pr(s2 ( 16) < 0.01, no es un valor vlido parao2.

33. Pr(s>7) =0.95.

34. a) Pr(s2 > 150) = 0.9; b) Pr(s2 > 362) = 0.02b; c) E(s2) :225, Var(s2) : 3894.

35. o2 e (49.75;I6a37).

36. a) 1.383; b) 2.681; c) 2.086; d) t.746.

Jt. 0.8361.

38. a) 0.1; b) 0.75.

39. 0.99.

40. a) 3.32; b) a.76; c) 4.47; d) 5.86.

4t. 0.025.

42. 0.05.

o: ,Lg4: 0.34, b:2.84.


1
43.

44. a) F - f'(1,1); b) 0.95.

45. a) 0.5885; b) 0.1759.

46. 0.0062.

47. 0.0104.

48. ? - (17), 0.05.

49. T - t(22),0.I.

50. 0.0207.

51. 0.9634.

52. 0.0322.

53. 0.9747.
432 Captulo 74. Respuestas

Captulo 7

Seccin 7.5

2. Mejor -6r,3r,3r,3n - Peor.

-2
: i-, u-2 Var(73) : o-2
3. a) Si; b) Var(?'1)
'/ 2nz'Var(?z) -
n2', \ u/ 3; Bnz
c) Mejor 73.

4. 6t02 y ?* .o.r estimadores insesgados; b) El estimador de menor varianza es34.

5. 101,32 y0, ror, estimadores insesgados; b) El estimador de menor varianza es ?3.

7. a) l:r; b) E(V) :48(X)+E(X\:4.\*)2+):5.\* \2;c)?:1


n
r|+tt.
7=t

8. Es insesgado.

9. b) a:
oi+oi
10. b) c:
----
n\
' nt lnz
11. a) E(X.): g , Var(x ,l : {, b) Tn:x,,, ECM (7'd : *
t2. a)O :, (t - t, A :, (#+), ao,.a" k es el nmero de veces que aparece et valor 1.
*),
2
13. L(p) : rttozs (7 - P)2r, f:
74. a) E(x) : 1 * 0,AL:X + t; b) Es insesgado; c) 6, :X; d) d2; e) 1.

15. a) F: #' o, F: t -"-oooi, I : -uooatt (rtr)


16. a)
' 2-9:b\t : 81
3', "' 100'
17. 6,:0.10129.

Seccin 7.8

1. a) (3.013; 6.986); b) (36.02; 37.98); c) (18.147; 18.852); d) (-22.564;-21.436).


2. a) L:0.7052 b) :53.572;c) L:1.662;d) t :2.773.
3. a) (117.98; 122.02); b) (220.26 2%.7\; c) (65.73; 66.27); d) (-38.17; -35.83).
4. a) (97.9; 102.t); b) (ae.1e; 56.81); c) @a.a2;87.58); d) (-39.5;-34.5).
5. (a7.7a 52.86)

6. a) (416.60; 503.40); b) 295.

7. a) (106.49; 113.51); b) 3.51.


8. a) 0.9938; b) 72.
433

9. 57.

10. a) (107.1; 108.9); b) 99.068%.


11. a) (165.01; 169.3e); b) 50.

72. a) 50 dlares; b) 490.

13. 62.
t4. 43.

15. 31.

16. a) (26.77;30.04); c) El intervalo hubiera sido ms estrecho; d) El intervalo hubiera sido ms


estrecho; e) El intervalo hubiera sido ms estrecho; f) El intervalo hubiera sido de igual longitud,
desplazado hacia Ia izquierda.v

Seccin 7.10
1. a) (2.889; 3.a71);b) @5.27; a6.73); c) (-1.33; 6.33); d) (-176.58; -87.a2).
2. (O.ee; 2.30).

3. a) (50.05; 51.38); b) No.


4. a) (16.46, 77 .57); b) (0.0396,0 .6724).

5. @0e.23;706.76).

6. (2793a;240.66).

7. 90%: (375.24; 485.0I);95 %: (363.40; 496.85);99% (337.87; 522.38).

8. a) (24.66;26.86); b) El lote no se acepta.


9. a) (1.89; 2.68); b) El lote no es aceptado.
10. a) (2793a;236.66); b) n: t2 (221.72;234.28); n:100: (226.79;229.8I).
11. a) (3.527;3.709); b) n : 8.
72. a) (169; 314); b) Si, el tiempo es mayor que el indicado.
13. a) T : 4.846, s :2.949; b) (3.234; 6.458); c) El intervalo sera ms estrecho; d) EI ancho del
intervalo se mantendr y se desplaza a la derecha; e) p:8126. La muestra posiblemente no
proviene de una poblacin rrormal.

Seccin 7.12

1. a) (86.43; 1928.57); b) (111.94; 725.87); c) (128.39; 516.25); d) (141.8a; 422.43).


2. 90%: (25.35; 109.17); 95%: (22.76; 130.61).

3. oe (6.61: 17.55). La informacin no es corlecta.

4. o2 e (2903.54: t3473.29); o e (53.88; 116.07).

5. o e (3.30r8.40). si le conviene.
434 Captulo 74. Respuesas

6. a) (19.245; 23.155); b) (1.51; 34.70).


7. Trdicional: (ft.16; 89.70), Alterlativo: (9.99; 94.60). Mejor es el nrtoclo traclici<rral.

B. r (90.115; 92.385); o2 e (5.43;16.19).


9. ) / (20.0A;2r.13); o2 e (0.69;2.76); b) No se recomienda el cambio de variedacl.

10. a) p(9.23;20.10);b)o2(40.89;176.08); c) Noseintroducirlanuevalnea.

Seccin 7.14

1. a) (0.69; 0.81); b) (0.702a;0.7976); c) (0.6711; 0.82se); d) (0.7108; 0.78e2).


2. a) Luis: 0.015, Juan 0.031, Paco, 0.062; b) Diana 0.4, Oliva, 0.2; c) 90To: C, 95To: A, 99To: B;
d) La mujer.
3. (0.5341; 0.6659).

4. 2177.

5. a) (0.688; 0.821), no se recomienda su uso; b) 311.

6. a) (0.6556; 0.80a3); b) 155.

7. a) (0.2475;0.3525); b) 276.

8. a) Bucnas: (0.865; 0.934), rnalas: (0.065, 0.134); b) No se aceptar; c) 4238.

9. (0.6587; 0.7319), no se puede introducir la nue'ua variedad.

10. E :0.0278 < 3%; si son estadsticrmente iguales.

11.97.84%.
12. a) (0.812; 0.928); b) Ser ms estrecho; c) Ser ms ancho.
13. a) p: 0.5, n:77;b) Se necesitan ms estudiantes; c) Se necesitan ms estudiantes.

Seccin 7.16

1. (1.35;2.65), si tiene razn.

2. (4.033; 15.967). La afirmacin es cierta.

3. (-0.68;6.68), son los mismos.


4. (20 - 61.08;81.08). En cualquiera de las dos ciudades.

5. (-3.93; 2.10), son iguales.


6. (0.93;7. \, varianzas iguales.
7. a) (0.635; 3.267), son iguales; b) (3.86; 10.14), es mayor el de las mujeres.
8. (-0.0211; -0.1956). No son iguales.
9. (-0.0339; 0.0539). Si afecta igual.
10. (0.0325; 0.2075). Si es eficaz.
435

Captulo 8

Seccin 8.6

1. a) H0: p':167, Ht F> 167;b) zo,":2.366, se rechaza.116.

2. zotts: -1.825. a) A a:0.05 se rechaza 10; b) A cr:0.01 no se rechaza -FIs.

3. a) znb":2.123, se rechaza 11, s debe recalibrar Ia balanza; b) a: 3.4%.

4' : -3; el costo me<lio no es 3.


zobs

5. Zobs : -4'47, se rechaza fl6-


6. a) zob": -3.16, se rechaza Ho; b) 0.0008.

7. zobs: -2.82. Con c:0.01 se rechaza Hs,ha descendido el nmero de clientes.


8. a) zoa": 2.38; con a : 0.01, ha cambiado la demanda; b) a : l.72To.
9. :0'1963.

10. a) znu":4,|a afirmacin de Ia sociloga es falsa; b) Pot:0 - 8485.

11. a) zob": -3.65, se rechaza Ilo; b) Pot :0.7088.

72. a) 1{6: r : 18, HI F > 18; b) Rechazo Hs si t6t)s > 0.0b(10) : 1.812; c) toar:7.976, rechazo
Ho.

13. a) Son estadsticos; b) fIs: p : 26, HI Ir I 261' c) tobs :1.46, se rechaza Hs si t.6, > 2.069;
d) La edad de las novias no es diferente de 26 aos.
14. tobs :3.378; cl periodo medio de espera es diferente a ocho das.

15' tobs: -I'4785, no se rechaza Ho.

16. tobs:2.56, se rechaza H6.


77. tobs : l'278, no se rechaza Hs.
18. tobs: -2'8247, se rechaza f16.
19. a) tou": -1.383; b) a:0.1; c) r:12.65 o s:0.973.
20. a) p. (10.65; 18.36); b) oo" :2,la ganancia si es menor que 18.5.
2I. a) Hs: o2 :15, H o2 > 15; b) Se rechaza Ho s y!"0" > Xfi.or : 42.98;
c) XZu":37.44, no se rechaza Hs. La varianza es igual a 15.

22. XZa" : 37.44, no se rechaza Hs.

23. XZa":26.33. La mquina si garantiza la precisin.

24- XZu":31'97, se rechaza -F16.

25. d) toar: -4.843, la media de la variable no es 51; b) XZu":16.84, la varianza es la uniclacl.


26. zr) .F16: p : 0.3, HI p < 0.3; b) Prueba unilateral; c) 2,,b" - -1.38, no se rechaza Hs.
proporcin es igual a 0.3.
Captulo 74. Respuestas

27. a) H0:P:0.2, H7:pt0-2;b) cv:0.04;c) zot,":7.75, aun nivelde cv:0.05 se rcchaza Hs.

28. zotts: -2.0785, se rechaza -1.

29. zrbs : I.417, el medicamento B no es ms efectivo.

30. zobs : -0.84852, no se rechaza H0.


31. a) zor'":0.771,Ia afirmacin del proveedor es cierta; b) a:0.2386.

32. a) zou, - 1.16, a un nivel de a : 0.05 no se puede decir que la mayora aprueba el endurecimiento
de las penas; b) a:0.123.
33. a) zou" - 2.26, se rechaza llo; b) 0 :0.2655.
34. a) zob": -1.854, Ia diferencia no es significativa, se debe solo al azar;b) 0.30554.

35. a) zour: 3.0; b) Si es significativo alLVo; c) Las observaciones provienen de una ley binomial, son
obtenidas aleatoriamente y el tamao es lo suficientemente alto. Las hiptesis si se satisfacen.

Seccin 8.10

1. Zobs:2.635; se rechaza fIs, las dos mquinas no envasan iguales cantidades.

2. Zobs : -L.434, no se rechaza Hg.


3. a) zob" : -2.572, se rechaza f1o; b) 0.005.
4. Zobs: -0.82; Ia media de la Universidad Nacional no es menor que la de Ia Universidad Tcnica.
5. zobs : 3.677, se rechaza 116.
6. lroorl : 1.756; se acepta la igualdad de rendimientos acadmicos.
7. zobs :0.658' no existe evidencia.
8. zobs : 2.149, para a : 5To, se rechaza 116.
9. l"o,r"l : 4.205, se rechaza la igualdad. La norma si permiti el aumento del promedio de goles.
10. zobs:1.409, el consumo es similar.

11. tobs :3.735, si hay aumento en el nivel de plomo.

12. tobs :2.588; se rechaza fls, si hay evidencia.


13. tobs :2.544. EI nmero de surcos de los mestizos es mayor que el de los aborgenes.

74. a) loa"l :2.II5, el medicamento B es ms efectivo; b) a = 0.025.

15' tobs:0.435. No hay diferencia.


16. tobs:2.885, para a : 0.01, se rechaza 11.

17. tobs:1.190. No se rechaza Hg, la diferencia no es mayor a un minuto.

18. tc,bs:3.939, la concentracin a nivel del suelo es mayor.

19. lorl:3.254; se rechaza 11s, si es ms lento en Ia noche.


20. tobs : 2.236; se rechaza -16.
437
21' ltot,"l : I.29, no existe diferencia significativa en los ni'eles de
colesterol.
22' ltot'.rl:7'79, a nivei b 7o,Ios dos mtodos dan ig'ales resnltaclos.
23. tobs: -2.494, se rechaza /J6.
24. a) Fou,r:1.86, las varianzas si son iguales; b) Nivel de
significacin a :20To.
25' a) Fra" : 3'33, las varianzas no son iguales. La variabilidad
puede atribuirse a Ia mquina 1.
26. a) Foa, : 2.074, Ias varianzas si son iguales; b) r" : 3.864, las dos estaciones no pronostican
temperaturas iguales.

27. a) Fo*:2.8, las varianzas son diferentes; b) tobs:4.44. Si es ms efectivo.


28. a) Fou":2.945, se puede asumir varianzas iguales; b) oa":0.5g97, no se rechaza Hs.
29' a) Hs: pr - p210; Ht pt - pz > 0; b) Zobs:3.193; c) para a : 0.0b se rechaza rrs.
30. l"ou"l:7.275; no se rechaza Hs, ias tasas de desocupacin son iguales.
31'
^) l".u"l:2.041; no se rechaza Hs,los 2 canales tienen igual nivel de sintona; b) 0.0a1.
32' a) zob": l'l2g,las dos empresas entregan resultados similares;
b) a: 0.256.
33. rechaza 10; b) p: O.0IT4.
^) l""u"l -
2.1I, se
34' a) Las proporciones muestrales se calculan a partir de dos
muestras seleccionadas de manera
aleatoria e independiente, de dos poblaciones binomiales,
cuyos tamaos son suficientemente
altos para que la distribucin muestral sea aproximadamente
norrnal; b) 116: pt pz < 0.2;
Ht: Pt - Pz ) z"u": 0'833; c) Para a : 0.05, el incremento en el hbito " -
!'f;
mayor que el20T0. r.,irr-"" *
o. Zobs :2.619, se rechaza Hg.

36. zobs:1.368, la diferencia es menor que el 18 %.

Captulo g

Seccin 9.3

1. XZa":1,.654, no se rechaza Hs.


2' XZu":0'776' a un nivel de significacin del r7o seacepta r{6. La moneda
es simtrica.
3. XZu" : 7 .324, se rechaza fI6 .

4. XZt ,: 3.021, no se recha za Hs.

5'
") xZu"6):19.009, xZu"Q):16.238; b) La empresa T dio un mejor resultado.
6' x1a":0.656' los clatos siguen ras probabilidades tericas.

7' a) xlu": 12'346, se acepta -116. Los ntmeros si aparecen


uniformemente; b) a:0.1945.
8' XZa":2'699. Ei nirmero de hijos varones sigue una ley Bin(2,0.5).
9. XZu": J.I9. El lrimero de hijas sigue una ley Bin(b,0.b).
438 Captulo 74. Respuesas

10' XZu":4' Se acePta f16.


11. i:L.027, X?oar:5.506, no se rechazaqve el nrmero de goles sigue una ley P(7.027).

12. i:2.642, X?0":7.737, no se rechazaque el nmero de Ilamadas sigue una Iey P(2.642).
13. XZa" :17.88. La temperatura no est uniformemente distribuida.
74. XZa":20257; no se acePta IIs.
15. l: 1/1000, XZa":14.53. La duracin no sigue la ley t(1/1000).

16' XZu":4'9; se acePta I/e'


17. XZa":5.6L4; con o : 0.05, si hay asociacin.

18. XZu":122.33, no son independientes.


19. u) xZu,: I.528 b) x?"a": 1.528; c) No se rechaza IIs.
20' XZa": I'726; se acePta f/e.
27. u) xZa": 30.032, se rechaza Ilo; b) zobs:3.146, se reara FIs.
22' XZu": Ig'L2, se rechaza .[/s.
23' XZu": 4'876, se rechaza Ils'
24' b) xZa" : l'L25; se acePta f/s'

25' XZu":35'031; se techaza Hs.

Seccin 9.6

1. a) pot'":0.1719; b) ?ra" :42.5' No se rechaza H.

2. a) 2poa": 0.3438; b) Tou" : 20.5. No se rechaza Hs.


3. robs :12, no se rechaza f/g.

4. a) rou":9, no se rechaza la aleatoriedad; b) 2pob":0.00028, se rechaza fIs.


5. a) rour:5, no se rechaza Ilo; b) 2pob":0.388, no se rechaza Hs.

6. Dobs:0.0268, no se rechaza Hs.

7. a) Dou": 0.233, se acepta Ho; b) 2pob":0.754.

8. a) rou":6, se acepta flo; b) Dobs:0.324, se acepta Ho;c) gou":1.907, no hay valores atpicos.

9. a)roa":5,seaceptaflo; b) Dob":0.147,seacepta Ho;c)Tobs:33,noserechazaIl;


d) goa" : L-767, no hay valores atpicos.

10. a)rou":4,norechazollo; b) Dob":0.1766,norechazo Ho;c)Tobs:0.344,norechazo11.


11. u) ,otr:7, no se rechaza lJo; b) Dobs:0.287, no se rechaza Hs; c) pot": 0.1938, no se rechaza
Ho.

12. a) rou": 6, no se rechaza 110; b) Dobs:0.226, no se rechaza Hg; c) Toa": 16, no se rechaza ,F16.
439

13. gobs : 77.264, si es un valor atpico.

14. r<I4lor)183.
15. 2pobr:0.289, los dos laboratorios entregan resultados iguales.
16. Prueba de los signos: 2pot":0.109, se acepta //6, Prueba de Wilcoxon:To,":6,'se rechaza Hs.

17. Uobs:73, se acepta la igualdad de niveles de contaminacin.


18. Uobs:11, se acepta la igualdad de velocidades.
19. Uobs:4J, los dos tipos de lmparas tienen la misma duracin.
20. a)roa":T,seaceptaIlo; b) Dobs:0.2444, seacepta Ho;c)Uobs:40,seaceptaIls.

21. a) Muestra X: ro6": 5, no se rechaza fIg, MuestraY: ro6":6, no se rechaza Hgl


b) Muestra X: 2po6, : L, Tob, : 4, to se rechaza fI, MuestraY: 2po6" : 0.754, Tobs :5, no se
rechaza HO; c) Uob" :25.5, se rechaza Hs, la mediana de X es mayor que la de Y.

22. r" : 0.818, si estn correlacionadas.

23. rs:0.429, no hay asociacin.


24. r" : 0.864, se rechaza .F16.
25. a) Prueba de los signos: 2pob" : 0.344, Prueba de Wilcoxon: To6": 9, se acepta 11;
b) r" : 0.018, no estn correlacionadas.

Captulo 10

Seccin 10.9
1. 0 : 2.852 *3.704r,r : 0.948.
2. a) i:332.11* 0.65r; b) r : 0.993; c) tou": t6.895;
d) E(r) e (33e.63;344.09), f, e (335.e7fia7.75).
Fuente g.l. SC MC F
3. a) 6 : -90.2, br :9; c) Regresin 1 810.0 810.0 54.24 d) 12 :0.948.
Residual 3 44.8 14.933
Total 4 854.8
4. b) g : -7.489 -10.r44r; c) F," : 17.83; 12 :0.69; e) No.
Fuente s.l. S.C. M.C. F
5. a) Cantidad :18.976 +7.27I Tiempo; b) Regresin 1 37.01 37.01 79.73
Residual 4 1.857 0.464
Total corregido 5 38.686
c) 0o < (15.50;22.45), B1 e (5.01;9.53).

(-3.55;11.258 e (-0.021;1.031); c) 12 : 0.64,

tobs:2.667; d) t(12) (0.06; L9.77); e)


440 Captulo 74. Respuesas

7 b) b c) S, Fobs : 29.87; d) 12 : 0.BBB, tobs : 74.57; .) E(azz) e (88.09;110.43);


f) aa 43).

8. a) G 5.245 + 2.746 Prstamos; b) S, r: 0.934;


Fuente g.l. S. C. C. M. F
Regresin 1 1735.53 1735.52 41.33 d) i(123) :
c) 38.70, a023) e (29.54:47.89).
R,esidual 6 25I.97 4I.996
Total 7 1987.50
9. a) A : 70.87 + 35.75r, r : 0.735; : II.47 - I.07r, r : -0.848; c) a:459.12-34.45r,
.Fue.-+te.. .S.1, - *SC MC F
: Regresin 1 156 965.6 156 965.6 32.63
r -0.896; d) Residual 8 38 478.9 4809.9
Total I 795 444.5

e) o (366.7;551.5), Bt e (-487.35;-20.54); r) e(y) e (21e.0e;320.25).


10. b) b0:4.799, br:0.595; c) (44.53;69.73); d) (30.09; 8a.I7); e) r :0.569, r2 :0.323.
Fuente g.l. S. C. C. M. F
Regresin 1 400 400 16.66
11. a) 0: 5 + 0.5r; b)
Residual 18 432 24
Total 19 832
E(yoo) e (32.36; 37.64), yao e (24.38;45.63).
")
Fuente g. L S. C. C. M. F
12. a) g 8.02r; b) 12 : 0.946; c)
Regresin I 229867 229867.0 176
= 115.25 - Residual 10 13 061 1306.1
Total 11 242928

Fuente g.l. SC MC F
Regresin 1 3.210 3.210 73.2I
:
13. a) En los dos casos se rechaza I/o; b) Residual 10 0.439 0.044 c) 12 0.88.

Total 11 3.649

Fuente de variacin g.l. SC MC F


14. a) Regresin 1 240 240 12
b) Se rechaza Hs.
Residual 7 I40 20
Total 8 380
15. a : e-2+3r, r2 : L.

0'0-136.
16. a) :6.66g7o.oso7;b) 0:0.0799 - I r]:0.834, r?:0.gro.
17. al :3.0348 - "jou, Lt)12 :0.9614.

18. u) 0 :15u 1'0588' b) t: -12 + 20.8r; c) rl:0.881, ri : 0.938.

19. b) : 0.5113, :0.27473; c) EI modelo es adecuado pues 12 :0.916.


b0

20. b) y: exp(4.0657+ 0.1983r); c) 12 :0.984; d) 0:258; e) La prediccin no es buena.

2L. ln ? : -7.5I3 -F 1.5 ln r o T2 : 2.9805 x 10-713.


44L

" : ------:--:-----
1
'22. 'll t'2 :0.973.
-.
0.0852 -F 0.0375:r:

2:1. b) 0: -49857*36357r; c) r'2 :0.811;(t) t: 27559:r;e) y: cxlr(9.83f 0.:3352); f) t:2 :0.901.

Captulo 11

Seccin 11.9

i a) A: 742t4
+ * Urr, b) X'X : XY: ( i, ); c) s2:0 602;
TS TSr,

d) R' : 0.2396, RZ:0.0875.


/ zs:z+'
2. a) b: I z+.szz I'ul a:202.8;c) R2 : 0.920, RZ :0.866.
\ 60.218 /
/ \ FuenteI. SC MC Fg.
-+o.tz Regresin 2 24.22 I2.I 3.42
3. a) b:{ r.sz f;u) fi'?:o.6eb; c)
Residual 3 10.62 3.5 se acepta 116;
\ 4.587 ) Total 5 34.84
d) 0: -L.562, tt:1.447, z:1.085. En los 3 casos se acepta.Fls.

/ -7.6e0 \
4. a) b: ( o.oso I po. (8.a7;8.09), B, e (0.0J2;0.r47),B, e (-0.3t;r.245);h) Ir2 :0.961,
\ 0.607 I

RZ:0.92I; c) d) 0: 14.23,E(yr) e (1L44;L7.02),

ye e (8.4;20.02).
a) G:1.083+0.011+ 10.749F; R2:0.856, RZ:0.76t, s2:303.99; c) (-0.055; 0.07a);
d) Solo el tamao familiar; e) 3.5; f) Fot":8.945, se acepta Ho, anivelsTo.
6. { f :92.074 - 0.576L r 0.r2A; b) 16.33; c) R2 :0.948, RZ:0.9r4;
Fuente e. l SC MC F
Regresin 2 13.521 6.76 27.438
d) 2 e) Mejor modelo: T :32.337 - 0.529L.
Error 0.739 0.246
Total 5 14.260

7. a) totr,o - 5.05, tobs,t :2.54, to6r,2:2.67, tor",3 : 0.90, tobs,4:1.11; b) 0@i : 12.917.

8. d) i : 14. 186- 2.0 4Ir 1 -0.53121 b) Fot


"
: 6.918; c) 0t e (-2.968; -L.t74), B2 e (-1.654; 0.59a);
d) fi2 :0.634.

9. { D :
-125.56 - 4.71u i 0.046u2; b) R' : 0.948;
Fuente gl SC MC F
Rcgresin 2 43396.4 21695.2 45.37
c)
Error iJ 2391.1 478.2
f,'t:rl ' : t {..ri17.5
442 Captulo 74. Re.spuesas

10. a) N'loclelo cuadrtico; b) f : 24.14-'2.l0Al *0.2L1\4; c) Fnu":9.93;


cl) /,6.,rr" : 18.63, Lt,ob" : -4.46, L.,,,t s: 4.'.J2.

i1. a) Tiempo: 10.55 -2.02 Cant. +0.199(Cant.)2;b) f :5.87; c) R2 :0.853, R.,2,:0.794.

12. a) Concentr:103.79 - 8.29 Temp. f 0.50(Temp.)2;


-".-''.,*-
-Fuente de
e. l. SC MC F
varlaclon
b) Regresin 2 257I.25 7285.62 40.49
Residual 5 158.75 31.75
Total 7 2730.00
c) Si, modelo final: Concentr :4I.334+ 0.236(Te-p.)2.
13. Sexo: 1 si es hombre; 0 si es mujer. a) Sueldo : 7.997 + I.147 Experiencia *1.748 Sexo;
b) F"" : 9.8; c) to,ou" - 4.48, tt,ob" : 3.64, t2,o6" : 1.61; d) Puede decirse que no existe
discriminacin.

t4. Sexo: 0 si es hombre; 1si es mujer. { A:4.63+0.911Sexo-0.223Aio; b) ,R2:0.817


F\rente s. l. SC MC F
Regresin 2 1.826 0.913 11.15
c) o,o" : 17.90, tt,ob" : 4.4L, t2,or" : -2.58.
Error 5 0.409 0.082
Total 7 2.235

15. Veneno: A:0, B:1. a) Sup:5.226+0.556 Edad-I.971Ven; b) Fobs:6.55, R2:0.652;


c) to,ut": 6.33, tr,ob":1.88, 2.o6" : -3.26; d) Sup: 6.56 - 1.86 Ven.

Captulo L2

Seccin 12.5
1. : 31, ECM : 186.9; d r: 30.2, ECM : 19b.b; d) , :297, ECM :279;
u) ?tt

")
lr; : 33.7, ECM :2gg; f) ?t : 34.5, ECM :280.2;
e) z: 18.7, , : 42.8, ?1s :55, ?zo :23.g, ECM : 126.3.
2. b) ?zu : 57.5, ECM : 172.5; ?zs: 56.8, ECM :153.7; ) ?ru: 47, ECM :253.1;
59.7, ECM :243.7; il ?rt :57.4, ECM :224;
") %s -
e) ?2s:75,r, ?ru:54.6, ?27: 50.0, ?rr:71.9, ECM : 124.3.
3. b) ?tu - ll7, ECM : L32.7; ") ?rc - I27, ECM : 63.7; ) ?ro : 116.2, ECM -- t43.7;
?ro : 118..2, ECM : 39.8; f) ?tu : t26.6, EcM : 83.8;
")
s) ?ro :125.0, ?rr:L27.5, r: 133'4, ECM: 157.5.

Captulo 13

Seccin 13.3
1. a) r (81.23; 87.r7), r (32 493; 34 867);
b) 121.
443

'). a) (73J 153;777 017); l>) t9')

3. a) (326 523;361 757); tt) 24.

4. a) (83 48:85.32); b) 10i.

5. a) @.34;4.66); b) 89; c) (6301;6920).

6. a) 73; b) 196; c) @7.a8,48.52).

7. a) r e (115.aa;134.56), r e (32323;37 677); b) 110.


B. a) (0.251;0.410); b) 153; c) 1,64.

L a) (0.238;0.370); b) (i.) 400, (ii.) 461.

10. a) (0.2a;0.36); b) 7684; c) 8160.

11. a) (0.272;0.408); b) 1228; c) t779.


12. a) 113; b) 50; c) 351; d) 351.

Seccin 13.5

1. a) r e (2558 604;2587396); b) p e @26.a3 43t.23).

2. a) (69.4a;72.11); b) (8126172;8438556); c) rr1 : TL2:7t: 31; d) n1 : B, n2:23, ns:45;


e) n1 : 10, n2:24, nz:4I.
3 a) p e (102.61;104.48), r e (492512;501488); b) nt: n2: 65; c) nt :70, n2:65; d) n1 : J3,
nz:79.
4. a) (608289;617601); b) nt : n2 : n3 : 79; c) n1 : 93, n2 : 42, n3: 86; d) nt : 70, n2 : 41,
n : 101.

5. a) (L632.79; 1868.75); b) (1061313; 1 21a687); c) n1 : n2 : n3 : 25 d) n1 : 9, n2 : L3,


ns:34.
6. a) p e (725.29;763.38), r (768812;809188); b) No; c) u: n2 - rL3:149; d) nt: I82,
nz : 154, ns : 93; e) n1 : I90, n2 - l2l, ns : I07.
7. (0.34e;0.455).

8. a) (0.4209; 0.5173); b) no; c) n1 : nz : I45 cl) n1 : I48, n2 : I42; e) ny : L47, n2 : I43.

9. (30.e8 %;3e.08%).

10. a) (0.5705;0.6823); b) n1 : n2: ?r3: 378; c) n1 - I57, n2 - 469, nz:352; d) n1 : 173,


nZ:502, 7:':302.
11. a) (21 .48%,;31.19%);t>) 6292; c) 5972; d) 5976.

72. a) pe (0.5a 7;0.6969); b) pe (5972;6202);c)ny:rL2:ttr:58; d) nt:84,n2:35,ns:56;


e) z1 : 86, n2: 38, ns : 51.
444 Captulo 74. Respuesas

Seccin 13.7
1. rr) r @756a6;a8$54); b) p (3.171;3.229).
2. a) r (889 546; III9228), p e (277.98;349.76); b) 28.
3. a) (7.31;11.64); b) 98 clases.
4. p e (0.1;0.3).
5. a) (0.2831;0.3733); b) 25.
6. a) (0.0677; 0.2448); b) (115; aI6); c) 79.
7. a) p, e (45.56; 85.12); b) pg e (20.32;37.L2); c) p (35.38; 106.89); d) p e (0.0272;0.2228);
e) no:26, n6:25, nc: 29. El tamao ptimo es de 29 familias.
Ta blas Estad sticas

1. Probabilidad acumulada de la ley de distribucin normal estndar.

2. Probabilidad acumulada de 1 - AQ) para la ley de distribucin normal estndar.

3. Puntos porcentuales de la ley de distribucin de Student.

4. Puntos porcentuales de la ley de distribucin X2.

5. Puntos porcentuales de la distribucin del nmero de rachas.

6. Puntos porcentuales de la ley de distribucin F.

. Nivel a :0.1.
. Nivel a : 0.05.
. Nivel a : 0.025.
. Nivel a : 0.01.

7. Puntos porcentuales de la distribucin de los rangos signados de Wilcoxon.

8. Puntos porcentuales de la distribucin de la prueba de Kolmogorov-Smirnov.

9. Puntos porcentuales de Ia distribucin de la prueba de Grubbs.

10. Puntos porcentuales de la distribucin del coeficiente de correlacin de Spearman.

11. Puntos porcentuales de Ia distribucin de la prueba de Mann-Whitney.

445
446 Tablas Estadsticas

Tabla 1. Probabilidad acumulada de -crc a z

para la distribucin normal estndar

z .00 .01 .02 .03 .04 .05 .06 .01 .08 .09
-3.5 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002
-3.4 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0002
-3.3 0.0005 0.000s 0.0005 0.0004 0.0004 0.0004 0.0004 0.0004 0.0004 0.0003
-3.2 0.0007 0.0007 0.0006 0.0006 0.0006 0.0006 0.0006 0.000s 0.0005 0.000s
-3.1 0.0010 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008 0.0008 0.0007 0.0007

-3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.00r1 0.0011 0.0010 0.0010
_to 0.0019 0.00r8 0.0018 0.0017 0.0016 0.0016 0.001s 0.0015 0.0014 0.0014
-2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
_7',l 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
-2.6 0.0047 0.004s 0.0044 0.0043 0.004r 0.0040 0.0039 0.0038 0.0037 0.0036

_t< 0.0062 0.0060 0.00s9 0.0057 0.00ss 0.0054 0.00s2 0.0051 0.0049 0.0048
-2.4 0.0082 0.0080 0.0078 0.007s 0.0073 0.007r 0.0069 0.0068 0.0066 0.0064
-2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
-2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0r16 0.0113 0.0110
-2.1 0.0179 0.0174 0.0170 0.0r66 0.0162 0.01s8 0.0154 0.0rs0 0.0146 0.0143

-2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
-1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.02s6 0.0250 0.0244 0.0239 0.0233
-1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
-1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.037s 0.0367
-1.6 0.0s48 0.0s37 0.0526 0.0516 0.0505 0.049s 0.0485 0.047s 0.0465 0.04ss

-1.5 0.0668 0.06s5 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.057r 0.0559
-1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.073s 0.0721 0.0708 0.0694 0.0681
-1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
-1.2 0.1151 0.1131 0.tttz 0.1093 0.1075 0.10s6 0.1038 0.r020 0.1003 0.098s
-1.1 0.13s7 0.133s 0.t314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170

-1.0 0.1s87 0.1562 0.1s39 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
-0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.t7tt 0.1685 0.1660 0.1635 0.1611
-0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.r867
-0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
-0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2s14 0.2483 0.24s1

-0.5 0.308s 0.3050 0.301s 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
-0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121
-0.3 0.3821 0.3783 0.374s 0.3707 0.3669 0.3632 0.3s94 0.35s7 0.3520 0.3483
-0.2 0.4207 0.4168 0.4129 0.4090 0.40s2 0.4013 0.3974 0.3936 0.3897 0.3859
-0.1 0.4602 0.4s62 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
-0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641
447

Tabla 1. Probabilidad acumulada de -oo a z


para la distritucin norrnal estndar(continuacin)

z .00 .01 .02 .03 .04 .05 .06 .0't .08 .09
0.0 0.5000 0.5040 0.5080 0.5120 0.s160 0.5199 0.5239 0.s279 0.s319 0.s3s9
0.1 0.5398 0.5438 0.5478 0.s517 0.5557 0.s596 0.s636 0.5675 0.5714 0.5753
4.2 0.5793 0.s832 0.5871 0.5910 0.s948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.691s 0.69s0 0.6985 0.7019 0.70s4 0.7088 0.7123 0.715'l 0.7190 0.7224

0.6 0.7257 0.7291 0.7324 0.7s57 0.7389 0.7422 0.74s4 0.7486 0.7s17 0.7549
0.7 0.7580 0.7611 0.'t642 0.7673 0.7704 0.7'734 o-7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.799s 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.836s 0.8389
1.0 0.8413 0.8438 0.8461 0.848s 0.8508 0.8531 0.85s4 0.8577 0.8s99 0.8621

1.1 0.8643 0.866s 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.911s 0.9131 0.9147 0.9162 0.9177
74 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.934s 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441

1.6 0.9452 0"9463 0.9474 0.9484 0.949s 0.9505 0.9s15 0.9525 0.9535 0.9545
1.7 0.9554 0.9s64 0.9573 0.9s82 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.96s6 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
7.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.97s6 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817

2.1 0.9821 0.9826 0.9830 0.9834 0.9838 {1.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.99r3 0.9916
2.4 0.9918 0.9920 0.9922 0.992s 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
1< 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.99s2

2.6 0.9953 0.995s 0.9956 0.99s7 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
,, ,|
0.996s 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.998s 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990

3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.999s
3.3 0.999s 0.9995 0.9995 4.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9991 0.9997 0.9997 0.9998
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998
00.0"0 f,BSO'0 TOBB'B r00'0 i0$0'0 i000"0 t00's [000'0 f,080-0 itsBB'$ It
r000"CI gB$B'S s$0fl'B r-fl0'0 ESfl0'fl t-s00"0 b-0^s 90'0.0'0 f&80'0 f0$s'0 y'
f00'0 t&08'0 F000'0 F00$'s F$0'B 00'0 f$8'0 s000'0 !=008"0 s0010 IL
ss00'0 s8s8'8 ss0g's 900s'0 90o'$ 900'0 9SSS"0 90s0.0 B*"0 000"0 rE
n00'0 ES0'0 8S0B'S 8000'0 800"$ -"'fl00'0 6CI0CI'0 60$0"s 60ts"0 0{0"0 1"r-

0T0B'0 0T00'0 1r0s'8 iI00'fl lTtl8"0 g{00'0 t-98'8 r-I&8',0 s'L-


1TOfl' rr0s"8
FT0' FTB$"$ sI0fl'0 sI0'0 9I00' ir0"s 8r0'0 sraS' 6I08"0 6.
9rss's
6r00' fl',ffs'8 r09'* Ttsg'0 ttfl's r-i00"0 r-ts0 il Fi00"0 s[88'0 9i0B'0 fL
9t00'n t00'0 8r00'B 6ilS0'8 sr-0'B If0s'fl r-00R sgo0'0 rt-Ee'0 st-98'0
9[08'0 l[80's sL-ff0'B 6f0$'s sFo{l"B If 00'fl r-F00'0 f t00'0 EFB'O F00'0 9"

sf 00'0 6F80'S IEOE'O +S0'0 gil0'B 590"0 s0s'0 6t 0 0'0 09sB'CI [908'S _L-'t

F900'0 9988"0 s900'8 6900'0 rtfl0'g f00'0 9i&0'0 8i00'0 BE$F1O rgB0's Tt-
ISB'O i.qBB'0 6S0B' T6S8'0 9600'0 6608"fl 0r0'0 rsTB'0 i0T0'0 tr.
0TI0's T-T T B'O 9II0'0 T I0' ''6S'S
irfl'0 6rTS'0 ;gTCI.O I r-10"s 6EIS'tl
-r-T0"tl
r-tI[' 9FTg'0 s1$'8 F918'g EIfl'$ sIs'$ 99r" 0f.I0"s F{B'D 6r0'0 LL'

t8T0'0 8SIfl'B i6I0'0 6rfl'8 isi0' iflr0"0 [{i0'fl iIi0'0 crrU U 8ii' 0'r
filo'0 6rs'0 }FC'B BSifl'o 95E'S 90"0 89iG'0 il0"0 TStF'0 i8i0's 1
F6t'B TBr-0'0 r0t0'0 FIO'8 ;Ir-$' r-0'cr 9Er-0"0 f f r-0'0 I9t0'CI 6Sr8'CI *'r
9t0'0 gif0"0 f8Lfl.B 6ts'0 r0?0'0 6f0"0 BIFO^O [rCI'I 9gFD^ 9trF8"0 I-I
!EF'O S9F' 9F'0 ESt'0 96f fl.0 -cfl9fl'0 9rsCI'$ 9iE0'0 Lr-ECI'0 8rE0'8 9"1

6950'D TigB,O iggB'B rt'0 s9fl'B *T90'0 CI99 E'90"0 s59B"S s99S"
T890'S F690'0 s00'B EO'O sr-fl 0 6f;0'0 F90'0 8ii0"0 r-6B'S 8088"0 t"{
t-t80"0 8r-88'0 r--c8s'B 980'E s88fl'+ I O'O 8t0'0 1.960"0 TE681S s9s' &L
!8fl'0 I]BBT"g OTEI'B 8r:SI'& 9SSr'0 EOT"O r"dT'fl [T IT'O IgET"S T9II'O 7'T

0T r'0 &6{t' 0Tlr'$ 0t-i,r.I'0 TSTT'B Ii;I'S i6rT"$ FTI-T'O sgr-T'0 sr-T'0 T"T

6b-I"0 1BFI'0 giFl'(} 9tF{'0 69FilS r6FT'0 sn9z'0 tgr"0 egsT'0 i85r"0 0'{
ITFT'O grl9I'0 099r's E39r'0 IIT-8 917tr'0 t9r's 8rT"0 rlst'0 I'gT' 6'S
rssr.0 F68t' ;iE.B 6F6{'S 6r' sfl0i"0 btn'0 T9i'0 69r"CI 6ETt'$ 8'B
siTi'$ -l-,- LL U 90[t'B 9ft['0 99t['0 96'r'.['S f,rrf,'0 8E$iT 68r-9" 0f'9" o
TSf ['0 t-8h' FIgf,'B gtgrg 8Ei'S ET9['0 t-'9E"0 919f,'CI 68tt'0 f,ti'CI 9'

9ii'0 8r8t'0 r-F8r'S i8'0 t6r'B 9t6i's n86R sr0f'0 sE$r-'0 s80r-'0 s'B
TTIg'O 9gTt'0 6rt'0 8t;t'0 F9trg 0[-9"0 9gEg'o r-"0 60Fr-'0 9Frr-'0 f.s
[8Fr-'8 0i:l,f' t 99f'8 fr651-"g it-9b-" 699r-'0 rsD' 9fl.-"$ t-8b-10 r[8s'g g"s
6!'8S' 689'0 9S6!"8 f6g gIF'$ iE0t'0 f'8 6iTf'0 tgTF. 0f,.'r0 r0
itt'B 98ti' ssi'B 19r?'B F0Ft's r*}ti'0 r-stt"0 gF'0 [95F' i09f "0 {'0
rr9F"g rs9F'0 rtt-B T9i'0 IOBI'B 0tst'0 0889' 06''0 096r'0 00Bg'0 o'0
60' s0 0' 9S' 90' t0' t'8" i0' tB' 08' 7

'Jtrpue+sa IEurJou ugrrnqrrlsrp e e"red

?)O - 1 e.red epelnurnc pprlrqeqord 'Z BIqBJ

serr+slPefsg selqeJ 8W
{4v

Tabla 3. Puntos porcentuales de la distribucin -Student

Nivel de probabilidad (o)


0.4 0.3 0.2 0.r s 0.1 0.0s 0.02s 0.01 0.005 0.002
I 0.32s 0.721 L3'.76 1.963 3.078 6.314 12.706 31.821 63.656 12',7 .32t
1 0.289 0.617 1.06 t 1.386 r.886 2.920 4.303 6.965 9.925 14.08c)
3 0.271 0.584 0.978 1.250 1.638 2.3s3 3.182 4.54t 5.841 7.45 r
4 0.271 0.569 0.941 l .190 1.533 2.132 2.776 3.141 4.604 5.59R
5 0.267 0.s59 0.920 1.156 1.4'76 2.01s 2.57 t 3.365 4.032 4.1i)

6 0.265 0.s53 0.906 1.134 1.440 1.943 2.447 3.143 3.707 4.3t7
7 0.263 0.549 0.896 l.l 19 1.415 r.895 2.36s 2.998 3.499 4.029
8 0.262 0.546 0.889 l.108 1.397 r.860 2.306 2.896 3.355 3.ti-l.l
9 0.261 0.s43 0.883 I .100 1.383 1.833 2.262 2.821 3.2s0 3.690
10 0.260 0.542 0.879 1.093 1.372 1.812 2.228 2.764 3.r69 3.581
1'l 0.260 0.540 0.876 1.088 r.363 1.796 2.201 2.718 3.106 3.497
t2 0.259 0.539 0.873 1.083 1.356 1.182 2.179 2.681 3.055 3.428
l3 0.2s9 0.53 8 0.870 1.079 L350 1.77 | 2.t60 2.650 3.012 3.372
t4 0.258 0.537 0.868 1.076 1.345 t.761 2.145 2.624 2.977 3.326
15 0.258 0.536 0.866 1.014 1.341 1.753 2.131 2.602 2.941 3.286

16 0.258 0.535 0.865 I .071 1.337 1.146 2.t20 2.583 2.921 3.252
77 0.251 0.s34 0.863 1.069 L333 1.740 2.t10 2.567 2.898 3.222
18 0.251 0.534 0.862 ll067 r .330 1,734 2.101 2.5s2 2.878 3.19i
t9 0.251 0.533 0.861 1.066 ll328 1.729 2.093 2.539 2.861 3.17 4
20 0.257 0.s33 0.860 1.064 1.325 t.t25 2.086 2.528 2.84s 3.153

21 0.257 0.532 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.1 3-i
)) 0.256 0.532 0.858 r.06r t.321 1.7t7 2.014 2.508 2.819 3.1l9
23 0.256 0.532 0.85 8 1.060 r.3r9 1.114 2.069 2.500 2.80'7 3.104
24 0.256 0.531 0.857 1.059 1.3t8 1.71I 2.064 2.492 2.197 3.091
t< 0.256 0.53 r 0.8s6 1.0s8 1.316 1.708 2.060 2.485 2.787 3.078

26 0.2s6 0.531 0.856 1.058 1.315 1.706 2.056 2.479 2.779 3.061
aa 0.256 0.531 0.85s 1.051 1.314 1.703 2.052 2.473 2.711 3.051
28 0.256 0.530 0.855 1.0s6 1.313 I .701 2.048 2.467 2.763 3.041
29 0.256 0.530 0.854 I .055 l.3l I |.699 2.045 2.462 2.756 3.038
30 0.256 0.530 0.854 1.055 I.310 L697 2.042 2.457 2.750 3.030

35 0.255 0.529 0.852 1.052 1.306 r.690 2.030 2.438 2.724 2.996
40 0.255 0.529 0.85 r 1.050 1.303 1.684 2.021 2.423 2.704 2.971
45 0.255 0.528 0.850 1.049 1.30 t 1.619 2.014 2.4t2 2.690 2.952
50 0.255 0.528 0.849 L047 1.299 1.616 2.009 2,403 2.678 2.937
60 0.254 0.527 0.848 1.045 1.296 1 .611 2.000 2.390 2.660 2.915

70 0.254 0.521 0.847 1.044 1.294 1.667 t.994 2.381 2.648 2.899
80 0.254 0.526 0.846 t.043 1.292 t.664 1.990 2.374 2.639 2.881
90 0.254 0.526 0.846 1.042 1.29t t.662 1.987 2.368 2.632 2.878
100 0.254 0.526 0.845 ]l042 1.290 t.660 1.984 2.364 2.626 2.871
oo 0.615 0.525 0.615 1.037 1.282 t.645 1.960 2.327 2.576 2.808
450 Tablas Estadsticas

Tabla 4. Puntos porcerrtuales cle ir clistlil-ucin.ii-cuadrado

Nivel de probabilidad (o)


0.995 0.99 0.975 0.95 0925 0.9 0.1 0.07s 0.05 0.025 0.01 0.0c5
I 0.00 0.00 0.00 0.00 0.0 r 0.02 2.71 3.11 3.84 5 .02 6.63 7.88
2 0.01 0.02 0.05 0. t0 0 16 0.2t 4.61 5.18 5.99 7.38 9 2t 10.60
3 0.01 0. r I 0.22 0.35 0.41 0.58 6.25 6.90 7.81 9.35 I1.34 t2.84
4 0.21 0.30 0.48 0.11 0.90 1.06 1.18 8.50 9.49 11 .t4 13.28 r 4.86
5 0.41 0.55 0.83 l.l5 1.39 I.61 9.24 r0.01 11.07 12.83 1 5.09 r 6.7_s

6 0.68 0.87 1.24 1.64 1.94 2.20 t0.64 11 .41 12.59 14.45 l6.8 I 18.55
7 0.99 1.21 1.69 2.11 2.53 2.83 t2.02 12.88 14.01 I6.01 18.48 20.28
I 1.34 1.65 2.18 2.13 3.14 3.49 13.36 14.21 1 5.5 1 11 .53 20.09 21.95
9 1.13 2.09 2.10 3.33 3.18 4.17 t4.68 15.63 16.92 19.02 21.61 23.59
10 2.16 2.56 3.25 3.94 4.45 4.87 15.99 16 97 18.31 20.48 23.2t 25.19

lt 2.60 3.05 3.82 4.51 5.12 5.58 t].28 18.29 19.68 2t.92 24.73 26.16
12 3.07 3.5'7 4.40 s.23 5.82 6.30 18.55 I 9.60 21.03 23.34 26.22 28.30
l3 3.57 4.t'l 5.01 5.89 6.s2 t.04 19.81 20.90 22.36 24.74 21.69 29.82
t1 4.07 4.66 5.63 6.57 1.24 7.79 21.06 22.t8 23.68 26.12 29.14 31.32
l5 4.60 5.23 6.26 1.26 1.91 8.55 22.31 23.45 25.00 21.49 30.58 32.80

t6 s.l4 5.8 r 6.91 1.96 8.7 r 9.31 23.54 24.72 26.30 28.85 32.00 34.21
l7 5.10 6.41 7.56 8.67 9.45 10.09 24.',71 25.97 21.59 30.19 33.41 35.12
l8 6.26 Ljt 8.23 9.39 10.21 l0 86 25.99 27 22 28.87 3 t .53 34.81 31 .16
l9 6.84 1.63 8.9 r 10.12 10.91 11.65 21.20 28.46 30.14 32.8s 36.19 38.s8
20 7.43 8.26 9.59 0.85
I I 1.73 12.44 28.41 29.69 31 .41 34.t1 31.57 40.00

2l 8.03 8.90 r0.28 I I .59 12.50 13.24 29.62 30.92 32.61 35.48 38.93 41.40
22 8.64 9.54 10.98 t2.34 13.28 14.04 30.8I 32.14 33.92 36.18 40.29 42.80
t1 9.26 r 0.20 I t.69 13.09 14.06 14.85 32.01 33.36 35.11 3 8.08 41.64 44.18
21 9.89 r0.86 t2.40 13.85 r4.85 15.66 33.20 34.57 36.42 39.36 42.98 45.56
25 10.52 1t.52 13.12 t4.61 15.64 16.47 34.38 35.78 37.65 40.6s 44.31 46.93
1A IL l6 12.20 13.84 r 5.3 8 16,44 11.29 35.56 36.98 38.89 41.92 45.64 48.29
27 1l.8l 12.88 14.51 16.ls 11.24 |8.tI 36.14 38.t 8 40.1 1 43.19 46.96 49.6s
28 t2.46 13.56 15.31 16.93 1 8.05 18.94 31.92 39.38 41.34 44.46 43.28 s0.99
29 13 .12 t4.26 I 6.05 t] .11 I 8.85 19.11 39.09 40.57 42.56 45.72 49.s9 52.34
30 13.19 14.95 16.79 I 8 49 19.66 20.60 40.26 4r.76 43.11 46.98 50.89 s3.6'/
35 17 .t9 18.51 20.s7 22.47 23.16 24.80 46.06 47.66 49.80 53.20 51.34 ()0.27
40 20.1t 22.16 24.43 26.51 21.93 29.05 5 I .81 53.50 s5.16 59.34 63.69 66.77
45 24.3t 25.90 28.31 30.61 32.14 33.35 51.51 s9.29 61.66 6s.4r 69.96 73.11
50 21 .99 29.71 32.36 34.76 36.40 37.69 63.17 65.03 67.s0 11.42 16.15 19.49
60 3s.s3 31.48 40.-18 43.t9 4s 02 46.46 14.40 16.41 79.08 83.30 88.38 91.9s

70 43.28 45.44 48.16 5t.14 53.15 55.33 85.53 87.68 90.53 95.02 100.43 104.21
80 51.17 s3.54 s].15 60.39 62.s1 64.28 96.58 98.86 I 01 .88 106.63 t12.33 116.32
90 59.20 61 .7 5 65.65 69.13 '/ t.46 13.29 101 .57 t09.97 113.r5 r18.14 r24.12 128.30
r00 6t.33 70.06 14.22 71.93 80.41 82.36 118.50 t21.02 t24.34 129.56 135.81 140.t1
120 83.8s 86.92 91.51 95.10 98.46 100.62 140.23 t42.96 t46.57 152.21 158.95 163.65
45L

'fabla 5. Prrntos porcentuales <le la distribucirr del ntinrelc de rachas

7tt

lt fitel ,{ 6 a\ I I13

C\=iir il -r { r ,a\q r'l i ;;- I J-_r


tl 1_i
'?
-,-t't l[t t,
J-1I 1i s-j J-l --r
^,J ni
3
u=i!'J]
.L-)
fl(
-
f -
!- ' 10 Itr 3-S
tl -i-Y -1-9 -1-Y
n: l -ls 'lJ
^,_Al1f lr- _t 4-, -Lr r_-y -:
iJ.=S $i S-i l-;- :-S i-B i-9 i-9 _i- fiifnM
d +-iu +-i
rf,"=U.Ut il.5 &-7 S-S ]-g l-E+ 2-1] :- ! J- ir_t ,1- tI

6
i- .s5 9-5 :-j j-s j-9 fr
u+- +- ! ttt i tl
..,-n ltt tr{ f a ,n 1i
^ j-iLf L- t J- 1
: t:a
_r-11 :r-i-l
.
f:

--r.j."J -l '1 i 1 _r-Y +- Lrai11 \-11

tjf.= Lr u I 1 .i 4 to f 1t-t
_1-
tl l i-lt J-t; 4-t.1

I s.:s l.5 li )-Y 3- Lr +- I - )


I
: )-L) A
_l

^,_n nI ;-|-_r n I 1i- 1 l f


.) +-] + I
-l
1i
j--r a:
j-. + l]t L _\-
a5 ) I

I .-,- n 1
-i t-l
-1-Y

t-q J L} J-
lr _t I l1-
lr

LO
rx:i] $i l_i -i-; i-9 1- u _!- ! l 3 6-trJ A
_1

''! i l- lo l J I li
++- +
r --r-i J\-i A

u--J tj,l 11 i j-Y +t .l _1-


l -l
irl ! Alf
-1
11
u=11,.?t _l
1t J 4 -+ +-
U._IJ 'J J
)1 _1 +-v .f j\ f.
_r u- I
:-l-r 6
1: jl\
-- 4 ,1f
_1-Y _1 1-l _1 + < td 5
]A
t:' - t
I l ri
J-t- fi
LL- .J. L -l +
13
1l l-l . !: e1

L)--Ll ,-,
-' l-i j-l l-g j ti- 3 -. I l 8- A
1.1
r.= 'J J .t
.-
cr--r
1r 'a
)-> ) l1
-" 6- $

L4-,i. J -l r_i 1
{ A .: O r C
I:
ii= < r i r-l t -+- 1 'rf
452 Tablas Estadsticas

Tabla 6. Puntos porcentuales de la distribucir F'(n1,rry)


Nivel de probabilidad cr : 0.1

-4 .t\ f?t {{' *{ a.,t r-, cr !+ !p r.- (r cl \ct r.l crr i. ?,i 19\ r-. ,.r (fr rt L': r @ r y rr (tr r-. rr! rfr .4 ,:.1
.i \.1 1'l r-. .4 r'-. $il . -.d { 4t\ (tl 'r
q u) \t: qJ rt t.t t(t t.t r-r r/1 +t 'i "t $l
f-. r-. !(i w -t fr ..r a.l ..i r.i .'4 r.. ir
I
a{ sr af @ rrr r Cj} r,t q {r1 gtr "rf a
1. er r ' {: r. (.i r-- ,., ,., t.. (^ @ u, '-i $l rF! f.l +*d (1r ('1 idl -+ r (5 Cr at\
c.: "1 r -{ r-. r/1 arr (3 fJ @ m r-. r- r-. r- rC E W \O r-r rar ht ra) rr t(\ tr rt {:'f tq f fr rfl fq f. .*.
* \$
"(

C r'- r.r c:J ,tt r.-' rl r-' l. a1 5:r. r-. .{ r-. (i {tr \) .-l - . f)t r- qt \l .- D r- ql '/- qr it *{ @ tf: t- !I:'
".r * r.? *, .* tr, r. r.i ,tj Al c),i sJ ? 11 T:. rj r-: rq rf) \ri frdiI v) Q tn t(t tf\ ."t *i *f \
r7r .q (q rrr r
a-l a,'n f+! f.t -.{ r{ f-.1 -.1 .'l (-l *! !\i sr d d ri .-. d 'r* ',.-)
s .-1 +d < 4 Fr s.., r./. !4 4 f{ !r
@
i4 r" \4) cJ \() tr qrt rQ 'n d4 r (^ ef' ( '.r .-, @ r.t rt .". -^ rt \{) *:f f' T' c.: ch d r-. * s *l a{ qF +- @ c>
rriht--.@--{r-rf4r.{r\di)fl\f\@m@r".r-.r1r'..Q\o\6Js\\clst.ltftttira-l."tq\'l..fcrrfqrrr
rjo',ri
\
ri r.iririr..i"r..-i;*.ii^.j...;{*j.i;*i-.;;*; ;*i;;J**"i -.-
rP \CJ r-..{ r-. <> @ ' \ e4.*'\C:.-, -. q *{ \O s.l .t (1 ( r- w '-, *1 .., r.l s{ sl (> 4 q} \l '.1 f
rfrr.F'4*,?,n.r.1 *qqlql4?@.r".r"r:.r-r':\l\qtq!ci{lqtftt.\4r'.er.qih.ftl,/f'
...l('r'riltc.|f'"ff'r,l'.flf'l..|Ne.l4sd4+-q.qd!\s..qFl.q*q.{Fjfi4
\C5

*,1 {.t @ r:f N \:t r r{ cF J r'{ \p,. \o r ' r.ef d lh a q} e|f (p! r.. -q 1 (!, q rf" rq r-."cf* rr'.,q < ( rt
r-. rit +{ m llll m rrr s.l .r ., "*r <) c) qlr 'f, @ 4 --4 F{- r'-' T-. r'n f- r. r-. r.- \C! ! \tr \tX rrr r r In lflr .41' rd
E
f{ --i < ',i ri ri r.i ni r-l r.i r't ci r.i j
qJ
*' * "J *i *i *'i *q *i "*i ; ;; *i i * i..',i -'; "-"; .- *;... -
.'| rl () r-. 14 ra /rt x) nl \Y r- (2 .r -- r-. ()1 ..1 -., ( u:) t rr .* {) fi r' \() '- qf /r! a.l \4J r,1 q'"er r" \e' A 5
a't r.l f l a fl . \f) Sl /.r r.l -e :a cf c) a, o @ vJ @ 6 @ - r-' r-. r-- r. r-. r-. \c) \ (, r r^ rr r.r rt
qf}lt\t1?1.'lr{rlr,ll'r,'lr-l...|.*r!{*l4vdi.!ly4sq
\

l- .t s @ t.t @ 4+ q t \Q 4 ..t r- at ("1 ' r.t (J @ uJ rr (.t *


C:1.1r\tl@\P*l"tft-"^-ac)(ac),(:rolci\4@@@@r-.t-.r--r..r-.r-\:)r4jrr,rtt.tt.\tf.
t+) m r' vJ 'rr' Et @ 1 tq $) (i m r- --

4F
ql c-.frl '.' .F ^l r2 r. \.t f .l C, r-. s) r.t fn .q ") q m r- \4) r-r (J \ ql ..t - 4 (J1 r.
cJ *r ,-r r
c.,..tr.la{@0\1 '.' q E
rqr.{..-4)cJl}cJ\cllcl\JcoJ@q@@r-.r-r..r".r-.r".vJ\()Q\l'{Jr'r
tsd {;,
J
E
+'$ '\. (':7 r-. {:: r':. 4? tr @ ?.r rr .-.) ttt . rf,) 3f ..' ,.
r-. \:l
rl
r a.. rt, r-) rrt (.1 .l r-r c
. | '5 s 'rr ff1{ nr
1 q_tr
r r{ "*' .} f}q E-J r-.
q r-. r-. r'.
..*J @ lrJ -,at fa
r-, v.: l4:l tf,r (l)
.,1 -.,
\ (c ,'-
t-l
rl a! -.{ ..J dr @ @ .n vJ v @ o)

14 \f,
e
& f" <) .t -1 q? .t a rt <j ct rr' I- Ft r" -rl . t @ t.t i, -. {) m r' r-, "1 r.t ..1 a <}l t)' { i) @ '. rrt \.1 r-
E .l 11.r'f n1 rlfr\ t,f|-,-,cicl<>ol(l\..n<1 cr, m(tDr- t r-.{JtrqJ\(!'r
WA I,,..t -@Fp,anioi
!<}
O
,, qlf.l
,(r1 .frr:.()Y{>.rlf4f-lr-rmYl'{}uiJrqc4qJ1ta{((ffir-.{)r,1 .drdr--q..rh@r--\()u=.
\a.l(I..14tr-.tat.\1lri-'t?{rae{i:)C:\()(r!(}Ci!ftfrr@@@4bSr-.f-,r'-.r0(CtlrCE
'i& -
\S @ {f Yll t" \J +j.,- r-" rd{ \r..t cJr r{J r.r \) @ !!J',.Fr.-t 1d (} 9) r- r-- \df r- qrr !e 3)T f4 -.t r^l ch.-
'E
n r.1 S.J
a trt a.i.t1 ':,.| 4)1 r'-. r-, $1 .t 11. -'r *i C> (1 t) (J 4h cn (r1 q {:r @ @ @ 6 i c - r: r: r-l r- r:. \ \9
L

.. r:l ff t.t <1 eJ r- cjl r-. @ L-.: 'J C: '.' ri .J ., ,f,i @ (.t (5 f- E r., fl r.r --
r:t r' qf rtr
Q' r') rn tr- r.r +r .n .l ., i)
rf rl l ..r u\ r-. t.t t:l .t rr ...| (-1
^{ * ';: q} (}, r {h l <.h (ti .- {.}, (Jt <Jr
r o' ,i rr rj i -"i ":i ri -j r' rr r. r'i n{ - r.i ri ri ':'i ; '.t . .- *.,; .,.,, "',' ..; .-: -" *.i *i *i *; ; *,j ..'; -
o m r'-, r'. r-, r.:" r-. I

-. .r r-. ql r-. 4 .1 *A .q ql @ r.r 1 r} fq q: p. r- r.t rn t -. \f q


--{
ft1 rr 4) r-. \(J rfr r.f rr' a.l f.l ?..
!! El ".1 a{
(5 <J q5 5 c;) q., (r Jr ( ( ( (t\ (f a FJj @
0\ 4 r-. {J i.r t{ cn D @ -r
t--.
<,.rr
' *; r.f
,ri r., r.i r*i ri r.i r r,i ri r ri ri r,i ri ri r.i .;i r,i r.i r,i .-j j *; ..., ..; ..,.; -..; . ,i *," *,i
r-. r,
.,,.; ; * -
r-.i-.
'
C- r a q{ q) r-r rq r-. t.t \ q1 rrr o .tr .",m r ri -a q) .:l . ^, {) c: Crr @ r.t +' r: \{) .t \1 r., --
rl rr' 1.{ q} ql > \EJ trt il .r l.r f l a! t{ .- D.\
(p rF V)
(J '
(} {p Cr c} {:: rn ( {)\ 6, ra c m ffJ pa --
\ m d 'n "t:r., "i r r.;i ri .{ r"t ..i r.i ..i rj rj r;i .. rri r.i r.i r.i r.i ri ..i ,:.1 r.i r.i *^; ** *' d ; *.i *; ...,
^"-; -
i.l ol .{ t.t t.t ,i. q r. e., r{ Jr rr J, r-. .l . <) @ \C, af fe (:t |J\ @ r1 r{"J W r. ft r-. rrt Ft *t .r 1-
..1 r.{ ft (;> *:f .{ r'. \f) r. 'rr
it {Yi .. ..r r{ rt r{ f. - (! c: c,} 4: c:1 (.:l (-, , 'r-,
ftr (^ (1 c} f, t
-l qi rri *x r.i ri r' ':.:
rt l .1 ."i .i ri r'l r't r"ii r.;i ,i r ri r.i r.i r.ii .:i ,:;i .i rt r.i r, ri *.i *j -.....; .-;.,, -
rrr al' qf {{ Cl @ \+ .. (J -]:4 $:t q? r.l 4h \dJ ':t 4{ '1 r-. r.r rr, ..,{ *R r r4 r-. r- i t vl. <rl {4) 4r' frr .l .... (> !-
}f..\wl.''{Ole\f)t:||\ti1l'r.tfftrt..r..i.-r.'i.-"tr'{.a4\{.)?\|i
,r, c. ,i .+ <q ..i ri r..r .t r .{ ri rr i ri rl ri ri r i ri ri -{ rt rr ri ri ,_-i .l -i r ,:.1 ri rt i rt -
"i
c. \ar ' *1 aJ cJr r.-. rl elr ir rcr r*{ rc cl (t \i Yr a.l c m qr r-r rY f -.{ c: ch 4 @ fi *) @ r4, r-r r- il r
r.r 4 tri .* \ f I () <' @ r-. l(: $ rr r, ti e .:i, <r'$f rrr rq (rr rrr .r all.i f. rr a,l r{ a.j r.l : w- "ii u.r * ,*l -
.r t, ,i a* ri .F; r'i rj r,i r;i ri rj r,i r.i r-q ri ri rt ri ri ri ri ri ri rj ri ri ci ri r{ ri .l rq r.i rr -.i r{ -.
c) i \Q r'l m t{) \l .{ .:t a:j i.cl ."{ t$ (p r.'r ..1 r.r r- \(] '.r "al fq .-..t d a.!a +1 O\ rf' +*" t_ rD r,-. v) E =
(> *;t .r' r"-. 'J r *r (ts +\ 4 a r-. ':r'T-. r'-' \{J . i.t
EJ \A '3rar rrj ta tf I ta\ rr) r.i '.-t 'i tr *f +j, *.f (r' *.r t.r rq r.i --
t{ '-r
cl o: 'r.:r c.,.., .i ,i,,i ri ri r i rri rirr rr ri ri e r ri . -t.. rrir r riri r rt ri rt i rt -,
at' ':i
\ f"r e$ \:1" @ illt ,,t a ri L--a r+ r .. e-r r.- \"J r.r .-l r r. * ( qf1 ,7i @9- *
cJ1'1 'rl v. ( -,. lr $.)
qy' V:
frr rt .l .1 .a .: qi (:: t q c. r q l, (n r : l\ fl qJ\ ct - q nq ec Q.,
@ r,-- Vl D
r., r'-" r-. r'-: r- ---
1 @ i \t sjl' .ft tn .r1 (Ft ffr r'.t I'r .Ff f .fr iq fr tf| r a.. a1 r. --l r, l-.1 ajl frt r{ r{ .1 .. a..{ al f.{ r.{ -:t r -t

ftJ
- f, F) = 'ifl \e r- qo':\ xl E 593 Fi F1 Fi ri il Ii H !; fr ff +ff g F * 3 ;
R
= = = == l!
D$'E !i'T !'E SF'' gF'i ll'{ 9'i sg'E LL $ -'L UL *
gs'{ ss t +'T Fft';' 8g"i I[' t' i9 . $s g n.t'i m
ffi
f it s 6g' 8F' tS'$ ic' s9' LL 9 VL I i8' q$'1 68'I r-.'E ., [*' Et'u 6'i f [.i 9f,' 8i'r 6s'g i6't 0CIt
*t ni'T f*" A4,'l Ci t 65'X 69'E $'I $S'E ts' 98.tr s6'l i;i' F''I ItlL gi L. UiL LL F' 3 Ct 5 !6'5 0.6

!i {t ;t'c ?g-E s9-i s'{ st.c [8'n F8'T $8'E 16'! s6-rr ss'r 9*: t$'t [r.r Ef i 6F' il- 1't g$'i $E
t5'I 5!'i g!'i f' E9 'e'E !s.' Fs'i 98' 6s-I [6'I .6'! 0'E LU L f 1 L {'i.. sil[ ss'i F' 5I'5 86'! 0
c'l ef,." 9q- sg'l sg.t s'l F8' S$'T 68'[ t6'{ S6'g 66't fo'e {.'g L L L !{"[ g'e [E'r 9'E 5t'[ 0*'F ts
)f L: t s-E Eg't 69'{ 8L'{ i
LU
o'? aa-
VU
z
5'E !6-n 66' t#"[ s" [$'[ EE 6z Et' st'[ 6T 8g'g t$'f s
YE: ,69"1*9'I $-{ F.'T FS'C ffi't !6'g i -'g
LU t 8S'r ['[ 8{'e 5f'[
l-'7
VV L {rf}'I
?V L t5' sf' ng'E F8-e ff'5 E*F 0t
[9'5 S I 9'! 6{.'I FS'I l5.l IU L.
M'!
L 9$"C S"; [I'e 91'fl 3e t e'fl ggT LIL E\t 69'C {.6'[ [t 5 J.;'f B[
ES'C SC'i VI'[ 8f 't r" 8' s|.e
FI.

; F*' i't {'tr l$'r s$ r r.6'f t$'[ ss' t'c 5t'[ #T 96[ [g'5 8t"F 6t
g9' [ l s.'I cB' s'i 9'6'I *,s't *s'e s8't {{T 5t't 63't Fe'e 6{'t gtT E?" 9!'{ T'C !6'[ F['[ S{'} $E
t\ g'{ F'T I8"E F8-t 88't L6'{ 9S.[ S8"{ *1'C gN'E I'E sr'fl E{"[ lf-r i.t'c ,t" L i_! L t.'g 9-i Ef'l {c'F LL
E 69 E 9'i l.s'r s8'1 $6'1 66'E s'E 6S. i'[ g'fl BI'l .T?-?
T.LL
t.
LCL i5' 6S'e F'f, 6!'t t'r 86' 5 5 r'3 9t
ro
o
Ti-t
L S o/'r
DL fs-c 8'r 86.: t{}'U 60't [1'l ?:- gt"c or'c a--
}.L L
dt'7
OL. L F['T O}T 6t' 89'e 9L'7. 66 $['I i.i'] J"
tto
q st'1 $8'i gS'E 6S' fr'f L-n'i i{-'[ [1.i st't $[' w'[ !'r 0[T a'a
:'L -5'7
L$L $'t t9' B-g rs't sF'E gt'f Fi
9 l [s'{ 88'I E6'{ gS'C iS'[ ggT t'fl 8r'[ 8f? f['[ rr [t'I LN L IS L r!' t9. 88-t 5.S't [t'S 8',['F b
86'i $.[ s['t [{'{ 8f-t 5f.e gx'c !g' s'c s' _fE g fg''g s5'F
ie
ll Ea'E 58,'E ?#'8, y6'g E[-r sft st-t 9f i
Ed gs'3 8B' f6'I 96' $. ETT B"e s' fll't l' E['[ 'r f' T3'T, SF' r.f'c 89r f8T 0'5 r'g ig'F IE
r FS'S {6'S .r 't *3's j'?
AU L
,t't
LI. l. IJLL
^?'?
+-'a
ILL !r[ 8't'E If i 5g'u 6f'e !FL !L tfi L !i L t't 8I' 6F't !t'F s
o! E:8' F6'3 ffi'e ff [ 9i'
ts'[ $'E 9E'[ s['E xr-'[ tf'[ 8r- F' & L NL-? L?''
ts L :T't vi'f 6'[ f{'f t!'t 8['f 6t
OA s'3 86't s'{ 90'i !1'[ 6!"[ t"e 6r {E'[ St't L'[ *s' L :rf i!- !r! B'?
L 8E? slT i. 56'f 9$'t !!"5 {F'F $T
O'(
?4 s6'T C$'r ss't 0T'i cI. [e't Tg'c [E-i 5ffi 8fi trr !F't 6F e s!'t I9T 81" l8- 96' St't 65'[ ii'! T
IP 3S'[ 0'E 'e 5I'e 6'C 8["[ rr.a r a'? L L{ L
-M't
trl'(
rr', *'t
Lf L tf L 6?T F5'[ 6!' W'T *' s8' {0'[ tt'g t9'5 6F'f 9I
8'fl 0['[ gr[
-!.

Ha t
LU L
&'? ?t'7
L' L fg:i #'7
r-t' L
?&'T
L'' L fF'fl BfT TE'T rs-c 698 f$"e t'[ 6" E6' 9S'g 6e't 89'[ ]!'F 9I
o", g'[ 6I'[ w-v t7'7
E5'[ 6r'[ 9F'[ ig'E [q'e s'fl s"fl g9-[ st'[ 9'E s8'E 96 e {t"F Fg'[ F'g ffir FI
E YLL LIL trST
O-
oo r'T 9'(, Eg't F5'[ Er[ gF'e [5" S!' 85'[ W-[ [9'[ .s'E " .'[ t8'[ [6'C [S't Bg'[ F'5 f 8'[ 9'F EI
A. sE'u E5'e GFT ff" rg't
avL ta',
vtL 9't t*'t 99'E#'E LL'z. 5' S8' (s-[ [6't B0.f II'5 gt't 6f's 68'6' !'F TI
3Z ]v'[ 9]"[ Ig'e sE'l !'[ !9"[ 7l '7
LLL
Si 'Y
TL.L gE 6t'[ [S'e gsT 06" gst I8-g 6S'[ Se'F s['5 6!'S 86'g ]8"f II
F!'C 6g' $9't 99-t #'{ {.'[ !8t 98- 68"[ 6T F6"{ 8S'E eS'[ f
LU
{\'C
!
tY'r-
t I i 7F-f F't sF'f {'g $'? 96'F NI
tu 1 9L;7. s8'E 58" 98-e F6'[ TS'E [8'[ ss't $-5 0I'[ Ft't 8t:E 9Tt 'r [-5 8t'f [9'g 98-t 9['t tx's 6
<, f6T 6' es't w't 8$'[ E['[ t'g f'.-[ 9t'[ $rf t5'[ rf-r f'r F9'5 0g- ss'E 69't F8-5 *? gf't trs B

d a7'{
L i
f3'c
LL [5'tr Fg g er-l *'r- !s'5 5!'5 $'g !'5 ffi't F9-[ Sg't L-J l 'r- J A-l; t x-l- $'s [t'] *"'? 6t't I

rd
g',t I'f -tL S LL T E8'5 $'[ F6't $6'g ss-t Es'F
9S'[
f^-!
)r\, fr rit '!r
^f !$-F [E 8e''' 6rF $'v 9 F I't 66'9
Er t v F'F }F'F gF-F $i'F 9S'?' 9'F Fg'F 99'F 89'S $.'S' *:'* I f'1r [8'F 88'F s6'F 5S S 6T'9 IF'g 6'5 n9'9
[9'! 99'5 -t r'5 5'E 00't 96'5 r$'! 6$'5 16'! r.6'S g$'t 80'9 FS-g 09 9['9 9'9 6t'9 6t'9 F6'9 ['
t!'8 5E'8 8!'B 65-8 fl9'8 99'E $i'8 I.8 ['8 F'il gi'S 6'8 ;8'B sB'8 68'8 f.6'8 {$'6 '{6 8[.6 !i'6 5n'0f t
&! 6C 6F'68 a 9"'AT J +'J<?
$v-s Et'K *'ar
r-t vt
?*'F
L u* .?'6 C'6i F'{ 8F'6{ c'r ai't
Bg'67 f tt-61 st'si fi'sE 9{ r 80'6[ r!'si
t G I UlL V D.L s !t F'(Fi
igf fgr B'iEt t'tqr l'na ? 't:- n i *:" Jt ff:, t cb
o ttL \u''L 6'rtr 8'9[r 8't[f ['sF{ g'Fr[ I'Sir S'66t f']91
ffi 0I {H F 0f sE sI rI tI il II 0t 6 I A I S t r- [ I eu
.ropErurnu F ercd pElJsqll eF soFE$ :r ff
A
g\
r: Gradss de libertad para el numerdar A
tla l ? 3 -t 5 1 8 9 1$ n l: 13 14 15 ?* 3+ dt) 50 10 s
i I 9l: Lrt 1 *+s l 9.16.t 9-i 3 9t8.6 9l]. 9sr.l 9S.r.9 ggi ! ]{*} l!- -rt,
I .11.8 t99 s61 899 S 9.,S.' Yi: i ut_,s [LrLt i.U,-l -u:
_.4
a -:1 1a ?1 a1-- an-.ar t^ 11 1a a 4 {1 1a 1 -n i a d( 1^1 aa d in
_1__r ! -^
_r:t-Lfu .-1:t -. ._tlJ___r ltr-_\tI _1y._!-- _1Jq-_1{.t J:l J i -ly-J-q ,1:r_r iJ ]Y .+ z. _1y -+ I -1t i_ -r:/.+-r _1:t.-(J -ay.+_l 3Y.1v
^ft
-1Y.+ -l'.+ -1Y-+ir -r:/.J '
! a aa .,r
4t.4 j..*.U-
3 1t.4{ i6$4 1-- 4
:--
{i !^
--.tt/
Gt 6d
! t4l_; f4.61 i;_ _rd I +.+ _r
\l{-+-
r 1
-+_J. 1.{.t8 }4.1 :4.i1 !4.S8 l+-lja .t _1.9'll I _1-)u-

:l :.r:l 3$-Si c*a c4 ct6 Y.-.U 5-U r s.-qs s.9+ s.s* s t9 n rr-
-J-r
11
-.'- s.6s s.6,6 s.i6 $.{5 s.fl s.38 s.-1: s t6
{0.$l s .{l r,.,9 ._-ry I l_l *8 S.Si 6. Jl il s,i9 6.16 6..*_1 6.-il 6.1._1 s 8 s.t- 6.{ls 6 0l E
ssi "i)6 l] l] O
--r -r Y-+ i.st l.ts i6.8 jil i.4S :i.,t I i 1a
/
_ -_1 _r .-1_1 i.:r8 l.ll -\.1 I i.C'l i.8: .1.9,8 $.9': :r gI D

7 s.$r 6.i4 _i.g_c 5._11 i ]9 5.11 .r.99 .{,9* ,t.81 4.t6 .r tl + 6t $.6i .$.6$ '{.-l 4.41 S_16, +-_i : ^
+_<
a .! 1! a'!.,
^-
I I {t d.06 \-t
).+-
*-^i
-r-LJ
1
+-- .t.si .t.il +-+-1 +--i 1
+--1 J {4 +
\ t .{ 14
+-:u +.i tl4
lu +-t_r . ^ ,
+-tI,J +.Lrd
^^
t
J-:
+ 4
-+
1!
_:--L
4:{
r-:i
1aa
_1 {J.r

q t.t ! i.i ! 5 +8 lt. .$ +.9S .{ :1 t 1,


+_iu +-u.-l J --+ -1.! l
:
J- ,r
a 1 0-
-1.0_1 i.s* i.I i 6i l.is i _1__1 J.s r
i

-r-+rLf
^

f f -1
-
l0 69+ j 96 a Ol
- d-r
-t -4':r
+-+ ' .+1l
---- + u., -\-:l-r i.8-\ -i.ig 3.ll _i_66 J-tl- -1--1
j.-il 3.l .l _1._;i i.t6 -i l: 1.15 3 0'3 5
ll 6.ll r.16 t.6, 4.:S 4 *1 i 88 1.t6 _;.d5 3._59 3.i_ i.'{ l 1..t3 :i.39 _.J,6 t.3_i 5.t,1 3.tl r-'JD i.V:r r.E6 l.BS -+
tl i-i 6 t ,n -"{l .{11 lOg _1 _1_t - n 1l n ., _t-_1_
I an
_1-,
14.
l.tt J i$ l $t 196
a
Y:
^4
a -
!- J :.s$ I ti J(n
Ox
-- ;.;
_1 - ., _1-_1 -1--: -
I3 C+. -1 tj :-_r _) +_,.fu -l - r j '! f,.J _" :
: --1:J --r I
\ ai a 1A
_1.:._! -4,_u
+ *--
I :-,
a t1
: :- 3.$S 3.Si l.ti l.${ r
-
to
.ro
a.i
I1 ..-
1 .l '1 .:-1
-1 -r
l.gs I i:, l.s4 I li 1 .: a t3 ') !
l.t 6.i* 4.$6 .4.t4 i.s9 _t 6
a
,a
*-^
_ru
-
_1,,1
-. 1fA
-1-=.Y
- 1a
-1 - i -\- 1 -!
r -'r
_l-tfi
1n.-_
_a-_r
^. t,t
_r.iJ:
\ A1 1 .
a 41
oo;J (!-AP
'u<w
t5 4a _t-"! -:
;-;_t
1 nn
_r-J
- i
_i.+: -i.t,i
r ni
_1,-il
a t1
_-. l 1.86 _;
rJt t.8s :.86 : l ?64 1 r_&
I S6 l..el a --\- 1 a'
- +! ') -
I S9 I9_i lS'S lSl l.Sl : 19 l.6S l.:'l =.-; ;,-
L'-d + . _a _]

l6 1a t AC + l-rs J, .: -r -1--1!i
jl4 _itl _1 l_ _r-t_) -rl -
!l 1 -rir
_-+u
1--1
Y_t-o ^.

ll O.l .r{ f,a * L : -1-Sil -1


:: 3.LS 3 '26
a^
,\ r
1n
-
:t t9t :s? --o_
f 01 't ta
l.li lll :ll li{ r-+ 1 iri '1.+1
--a!
1 a1
-. l_1
'r -11
11--
- -)
'! ta
DFFN
:. U)
l8 I !i *._!s _i9_l _1-31 _r_.U -i t: -r is _1Ui
1ta
;Y_l
10t 1a1 t.il I t: 1li: 1l'l r -i4 'l 1 'n .4Q
-
_a
1 5r-
, J-l
AP
:i.
t9 -- 41 t- -lr
-i.99 -i.:; : j,i ^|r.4.- :36 I B$ t8t t16 1?1 16Q :.6i l 6t :.i 1 1..;q 1 11
- -1-i
1 :f,
*.-ru
a 11 1 !: lJ-
\-tD'
L.

:t] --;.st {.6 is6 -ii: _i19 ,i.:f j!_liJl a c: a Q' 1I tll f 0 I i ].fi,s _: 5l I +5 I _i5 .l r'9 I 15 11: I n
'lo.{
iJr^r+

il -- ftl_1
_r
.1
+-+- 1 _ _1_:
a lL-^
_r
a ar
-vY :.v . I St 1.8+ tti ts a.r a4 l.i6 I il l.l I il 1 1i a 1: 1l> <lr

-- f 4 . 1 s r
_a .
R J
_1 +:
: 11
_1-;-
1n-: 1^1 1Qt 144
ll+ l6r \A^ ai :.i_1 I i$ t.-ig I ll )a )'. l.l I 1a
-.>
a -^
= uu
il6'+
1 ,1.( l
1l J- -r a-f-) _r-,_l _r-Jl -1 -D
_
-r_r-
^1
1 i.^
,-3.i 1ar
;, 1
141
:. .'J :.6: I5: I -il l.:i- !-_,d
a1: a+a
_ + l
1:4 1lj 1
- ^
1 14
;-r- 1
:
34
\- 11
_l t
-
11
l-_1_
111
_t-.'-
. -
_\__1
- i--
l. 9:a l.Sl f :o
-.i
't t4
:-JV :J I t;! = -l+ -
1--d l aar 1 fr \ tt a ?l 111
lii -l'L' .lt3 ,t1_ i^.4
:-t+
-a)
f !-r
25 r.9 .19 J fly _1._i-1 _a.:-a
1 ir
-.J '
1n-:
___) 1.i ltQ
r6i :ir 1 -i: 1 .lQ r... a.ii f:'' 11Q '1 40
---'i-i r.Y-
?6 id .l 1l _r tr., _i._a_1 _1 -
a l.
-.j+
1a
--- L :-i 1.6-i :i9 :i4 1 l f .ia
:.l l.:3 l.16
:._rg 1
_ Liy
1--
_ u_,

i ilv' I
r.
n

{ 4: .{ 1.! - i-
_a t-r,
. ^+
_r _1 1
_
- 4
f l r1 :.9t t.s8 1 :1 1c; l.ll I i ::
1 ll
- +l
1rl
: -19 t.i6 l:i l.:_i 1.f,r
i u.'
1na
; U'-r
.
^^
--)
a
i--l
n^-

28 iA1 .l 1l i 5_i -i t9 _i.,$s


a
,-:^l'
1 r
-_.,d t.s9 I 5! 1 ii a .3 t.t< 'l J'
:.1i t 1.$ t ti l1: r ^i r X. ! 41
r Y-
t 1
r -r
:
?9
r_ .-a
_r ,ry
< 1^
{_-tt -r- - -1-- l
rtG alf, 1.67 I i9 1--1
___r_1 _ r
1 {
t -^i l.:ig t._i t.31 :.li l.sg - u-l r.YY
. 4n
: :/- ! ni
-. -

3fl -- <-
-1-_1,
t *
+-i
! 44
_1 _'v
- 1<
J--_'
- 4:
-1 i l.$t t.l-i I {:; I -il '\ ii 1 ,{ 1 t1
,-+ i
1r-
--_1.
1..*
--:'i
A_l
-.-rl
A1t
- -u
lrr-
-.U.. :. ri: !.91 88 119
N

{ i "t1 .+ !1-i
_r-+O _1 -_1 _ :'r
1 ':! r a .Aa t -:1
_-_,_i
n -:
- +_l I l? t._i:i 11C 1ai I l,: 1,.:s I 11 '_.;!. i.ss :.s,i : ':r.r '!L .'U+
_{

5fl ,r 1+ Jt,
.a 1A
-1 ,ly
a
_l_l.t_
^i
1+
- D_1 I 5t t.55 n :4 a ?Q
l.ll -:16
111 a:Q I t+ 1.1: 1.19 :.Sl iar :1i !.Dtr i _)_1

60 -l --> -1-Y.l -1Ji -ii;: i.y I 6-i =l :;t a t


--r!
141
-:!_1
t.t; t:l L.ii l.iJ -t.flg th f .94 : sl
:. -.,+ I-i I ft, f .lC

7 i tI i.89 _i-_ri.
1d-
:-:rr
a ---
j-.i_r 1 --1
-.-':
1 aa
^.+ |
'1 .-a!
* f
1 an
-__au
11.1 f iQ 1r
: -!+
.1 :
- ttr t.$* l.{Jl :,9i :.ls i.t l.+r
g0 5.tt i s6 + 1
-1.,
1<
-5-
a it
^ 1-r
a .-a
r--r I
1 (a-
--q-, ?._ri l.:$ r.t{ I i i.i11r !
'1rl
-.u.f l.'J_; :.s : ss :.r5 1.68 1.i t__'_ i-nu

9 i.t$ 1.8'{ l16 l.9l lr-j l._i5 :.'- a ---{ a aa 1.t9 Il.t .ldlo 1 t.$l !.9$ s6 1.1! - :.o I I.ie x Li?
t.f 3 l.sl --v t.fl* 1.9? 5.Si l.l: !.6= :.59 !.s$
-r .l.l
lf0 i ts 3.t5 t.gl
_r.83 : l$ 1 i* 1 -*'! a ]'\ fro 1 \ {1
-.Is 1.3i
s i $i -.69 i.il :.i9 I i; l4t tt9 ? t9 I t t.s5 [ 99 i.95 1.9$ n.s? [.8,1 1.]] !.i.1 .+5 i .qJ a i +
- -r!
{ n
U!

ftu*N 4*,Flr &ir'r:r.! i *: *! w


fl r: GrudoE de libertad para el nuterador

l I J 4 5 6 ? I I l{} ll D 13 14 l5 20 3$ 40 50 l*0
.{05t .1999 14$l _lc__l _l I Oj is-59 _*,913 59gi s8ll 68i6 6&8i 6tji 6t09 616? 61.$ I 63 r\i 6-i l4 6i
<t\A ia; f!.!:
9S.JS 99.0 99.l 99.1i 99.i0 Yy -i-i )/9-_1s YH.-1 r YY--1Y :l:/.+v :rf -i L qg.,{j s.4i gs..{l 99..{t 99.dS 99.49 85
Y-q.+ vt.1 yy.:{_1
3.1.il lS.Sl a a{ an 1{
39..r - J.if -.=+ tt.9t 1j.67 t?.49 ll.i5 2t.l-i:1.tr_ :l_*i :.9s t6.91 t6.s? 16.69 16.5$ t6.,Nr r.6..35 t6.14 16.t
l.Ls xs.0$ I6.69 35.9S ji.t: t_5.ii !+.98 I ir-
t4.8S t4. .+--rJ I I a
+.iJ
i +a ! ^l
l"+__1 .r .+._1 ! .:r*.jJ is.?$ t4.01 !3.3.1 i3.15 ii.s 3_1.58 I
t { 1r- _1_

i6.r6 13.tt il.$6 !,i9 10.9t ts.l !$.46 rs.39 ts.i6 !*.si 9.96 9.SS 9.Sr 9.?? 9.lt 9.J5 9.18 9.t9 9.t4 g.tJ B j

tJ. i_t tv_5i v- ^9.1i 8.ti $.4? $.16


ld
J s.t$ l-gs l.st
v.t9 t.i3 1.&6 l.5S l.i i..{0 7.:i ?.14 l.9 fi'.Sg 6.8 P

a1.15 9.5i 8.,t5 7.Si 1.46 i l:l g-Y! 6.$4 6.il 6.6] 6_i.1 6..? 6.4i 6.-TS 6.3 S.16 5.S j.gt j.S6 _i.t j i.6 p
11.]6 8.65 r'.ig t.*l 6.6_3 .-rt 6.1s 6.S3 i.91 i.s! i.l3 i.t 5.61 5.t I.it 5._16 5.t$ 5.!] 5.+i .$.96 4 P
10.56 s.St .99 6.41 6.S.6 i.ss 5-sc 5..*t 5.35 _.fs i. f g i.$ 5.i 5.s! "{.9{ 4.Str 4.65 .57 ,1.51. 4.4I !+.J
f s.&{ l.i6 6 j j 5.q9 5 64 5 l* i.ts ,t.7! ,6.1 4.6S 4.56 4.4n ,$.:5 a.{r'ttt {.
i.Sd 4.9,{ +.-
rr- -a
+., I
.{tf .an!
*.u ,1 !/t

9.6- l,:t 6 tl _5.61 _i.Jl i.sT s.39 's.14 d.6l '{.i'T 4.46 .*'ts 4.ij .1._:9 4.15 ..:S .94 3 S5 -1.8S i_11 zb
't 8: ,*.is 4.39 {-JV ,s. 4 i$ 4.$i .1.*1 i.86 3.lS 3.5? -1.11 l.4l J. a
9.1-i 6 9i 5.9i i..$t i.*6 +.f.t .4 ?fr .{ 1'l
+.L
olJ
9.8? 6.?S J.r4 5.tr 4.8d 4.{t) $,.*s .f._i 4.{9 .{1 1{r ,{ lra 1.96 1.91 1.8 -r.$l i.6 3.5n J.+-1 J.J a io - 1a
-1-- r _1 I

I 8.86 S.5r i.i6 1.84 4.69' .{ t6 .{ '\Q a n


i.9s t.B6 i C8 -1.;-l 3.lD 3.,6 3.ii -i 35 ;.1.1 ;.I1. 3. ! s J.i./l ^aro
r-'l

I 9.68 &.36 i.+: {.89 '$.56 a 11


{.-l- { t,
+-L+ .{ f} t aa U _1. _1. Joi -1.9i _r._]s, i.i: 3.31 i.)1 _3.t3 3,$S 1.98 r.,,
., _1
,rr5
I $._i,r 6.:3 i.tq +- r +.++
-,
-+
i iu
'lfi -d
+_uJ ef l.Sq i.-S _i.6* l.tl -i._i5 'l,i' 3.i j .t -.16 l.!$ i.$l t.gi t.s ll :-
#0J
I 8.4* S. ! i.ts 4.61 .f .ij +_iu a lrn
_\--{-r i.i9 -r.6s J--ry
a --a i a1
-r--l- +o +{i J.JJ_a J 51 -i-i0
_1 -1-1ft, t.El 1..81 I 16 1 v!
DO
I s.tg 6.s i 09 +.5S 4li ,{ S1 3.$.3 l.lt i * _1-_r. J.+_r'n J-J, -1-1i J.:t i t.t 3 $8 t.9? :84 1.lS 2.68 t.)1.4 I
? --1 . a 11 114
-a
.i"$ r.93 i.*! { aA
+--lU
q al
i- l ) i-L -\- J I 3.63 i.i2 -i-+i -j.-.0 j is i.r4 3.r9 i.ti _3.#] Ls4 t.?6 r.?i l.$ oo
s 5 s5 +.9j t a
1 0a f titJ"
+ a^
:ri6 3+6 --1--1 11n,
-1.S9 :.9{ t.7$ l,.sf 1..64 .1.54
'1 D-
s +- +-+-1 D! _\-)u _r ^la J ),;i _i .iJ _r.-: U J. !_a op
$.st i.is 4.sl l-_1 - +-Vr+ :i.8f -3-# ,r-J -1-+U
J ra
! J.-4 _1_J J. !. i J. J -1.Lr .. l.*i t.ss l.7l \ a.4 'l i0 'l .40 '1 l
Qa.
i.S-\ l.ll .C

Sl +-_1i -1.y>r na
IO
1 An.
J__jy 3.45 l.3i I.16 i. t8
_1 -1 ril J i,i.i
a 1
J.U-. 2.98 l.gi ?.67 : i$ 1.5i l.4l ilLn
ll +
t.88 -i.66 4-16 $.]6 3.94 a atI 1*-{ f.{^t a \1
).,
-1_ |
I t t
J- l+ _r__r+
t l a 1d
-1--1Ll
_1-\J J J. J-
11
:.' I ?.9i l.r$ :.61 1i4 :.49 l.il bd
ai 1
-J -- t
J-Ut 4 a1
+, Ji 4.:t -t.9$ i.6t _i.i$ -i.i 316 -i. I J.UY :i03 1.98 ].9-1 r..s9 t.?$ r.58 ? $9 :..$.1 l.3l :.: I
o
l.?l 55t +s $. t 8 i.8i _1.S_{ 4C 3.J] l.f,l -i-lr -l.LJu _{ t-99 t.s4 l.sg 1.85 l.?$ l.i* 1 .{i 1 .{n 1 'rca
t.i
l --
l.ll _i.53 4.64 {..t 3.81 J.J;q a 1
J-+ :_t9 i-c ,1_tIt J.u_ 2.96 t.g$ :.$6 2.8 E l. d.6 L.5S 1.{1
.li
1: u
!
-,
11i Li
?.6$ i..f+ 4-6S +_t -r-
t.i6 3.39 3,:,6 i.ii 3.{t'6 : 9E
I I a
1 t_93 l.sl ).81 I ls :.3 3...11 I38 ?.3-i l.:l f1
i. I \

?.4 i.si 4.,\l +_l^1
n a{-
J_ l_r -i-],'r -t--{0 r lJ 3.tl l.*J : 96 :.9S l$.1 ll9 l.l5 2.ds 2.=t4 l i5 r..rs I l9 '1 {t :
5
;.6 i..$l 4.i4 r f a1
+_\.+ J. . _1
1i
J-JU
\+f
J.JJ
af
J-!U
1m
-1.d')l _r.fflf -
y_1 l.$? t.st t.l? : ?3 :..51 1.4t ).33 2.Ij r1.l -

l.i6 J.i$ 4.5! ^41
1a
J.+ J a!^
J-,tv
a la
3 zf
>
^a
-l-Ll/ :.9S :.91 ? 94 I :-9 l.i-t t.i8 :.-\5 :.39 3 is t.t5 l.:l
a 1r -- i
I__1_t _r-;.
1a
+-_13"
1na
_l-J_1
1 *-l
J__r i
{ a-4
J--:
1 }a
_r- [ I99 ]..r9 1 &
- IJ
1 a-
-l-1 : 6 t.61 l.i r 5; 1...3j l.:$ : $" l.6 :.94
l.j,l -r.0 4.lS i aa
f- r;
+ t
-a.i t
1 t
_r t:f
1
i_u-
^1 t.s9 1...lg t.l* t.6! l.i6 l.it 1..-i6
a {a
4-+! a 1l
;.*. 1ln
. lV I *i r.95 !.Sl ?

?.$8 {.gfi .* ri _1-0_t -1* _r_ _i t: t.gi I Sl f.-,r :.Si f.:jd :19 t._ri l ls 2.$3 $.9.* s.ss !.]i
t.i$ l{4
7.Si .{.9: .t.$l ifs 319 J
a t
-.
1^t
L.Y t t.78 l.6l :.i9 :.45 l.-$ l. j j 3.-3! r 15 i.9$ 4l-:in *.:..'5J
r.51
n i 1A
r. ru x

6.!6 .4 8E 4_0"{ 5._i6 i.?6 :1.S4 l.Sl r..l.i l_.6.$ t.:,j l,{8 t.41 1.36 2..?: t.tt t.i: i.g.t i.S! 1:-9 C.6,\ il
693 4S1 40i -\-,\t -)-;-r -i $: "t.s4 r.il I i 1 i'l !_-,
a .{i I 39 l.i3 l 19 1a.* 1n to') t.st 3 t6 1.61. 7a
!,4_ ia il-
I ll i -j: l.f- r rl 1..$l i s9 t 8l 1.;-i t..$ I -J-t
't Or
l0{ 6.9* 4.8: 3.98 _!_J: J - 1d-t
i.tY
1 a
:-- r:.69 I i9 1 .:fr -t: r
64 4. i.-$ -_1- -Ui_r _a
f Q. a .{ r.ji :.41 t._it. l.li r.t9 rfi t.$s t.{4 tss i70 I )g I 5i 1.3 I
456 ' Tablas Estadsticas

Tabla 7-. Puntos porcentuales.de la distribucin


de los rangos signados de-Wilcoxon

Nivel de probabilidad (o)


n 0.005 0.01 0.02s o.0s 0.r
4 0 t, 0 0l
5 0 U 0 l3
6 0 0 I 34
7 0 I J 46
8 I 2 4 69
9 2 4 6 9 11
10 4 6 9 l1 15
ll 6 8 1l 14 18
t2 8 10 14 l8 22
13 l0 13 l8 22 27
t4 13 t6 22 26 32
15 16 20 26 31 37
16 20 24 30 36 43
l7 24 28 35 42 49
1s 28 JJ 41 48 56
19 33 38 47 54 63
20 38 44 53 61 70
2t 44 50 59 68 78
11 49 s6 67 76 87
23 55 63 74 84 95
24 62 70 82 92 105
25 69 11
90 101 114
26 '76 82 99 lll 125
27 84 94 108 120 135
28 92 t02 117 i3 I 146
29 101 1ll t2l 141 158
30 110 121 138 152 ll0
3l 119 131 148 164 182
32 129 141 160 t76 195
33 139 t52 171 188 208
34 149 t63 183 201 222
35 160 115 t96 214 236
36 t72 187 209 228 251
37 184 199 222 242 266
38 196 2t2 236 257 282
39 208 225 250 272 298
40 221 239 26s 281 314
4t 235 253 280 303 33 1

42 248 267 295 320 349


43 263 282 3ll 337 366
44 217 297 328 354 385
45 292 313 344 372 403
46 309 3?9 JOZ 390 423
47 324 346 319 408 442
48 340 363 391 428 463
49 3s7 38r 416 441 483
50 374 398 435 467 504
+o(

Tabla 8. Puntos porcentuales de la distribucin de la


prueba de Kolmogorov-Smirnov

Nivel de probabilidad (a)


n 0.1 0.0s 0.02 0.01 0.005 0.002 0.001
5 0.509 0.563 0.627 0.669 0.705 0.750 0.781
6 0.468 0.5 19 0.577 0.617 0.653 0.696 0.725
7 0.436 0.483 0.53 8 0.576 0.610 0.651 0.679
8 0.410 0.454 0.507 0.542 0.574 0.614 0.641
9 0.3 87 0.430 0.480 0.5 l3 0.544 0.582 0.608
10 0.369 0.409 0.456 0.489 0.5 19 0.555 0.580
11 0.352 0.391 0.437 0.468 0.495 0.531 0.556
12 0.338 0.375 0.419 0.449 0.477 0.510 0.534
13 0.325 0.361 0.404 0.432 0.459 0.492 0.515
t4 0.314 0.349 0.390 0.418 0.444 0.475 0.498
15 0.304 0.338 0.377 0.404 0.429 0.456 0.482
t6 0.29s 0.327 0.366 0392 0.4t6 0.446 0.468
l7 0.286 0.318 0.355 0.381 0.405 0.434 0.455
18 0.279 0.309 0.346 0.371 0.394 0.422 0.442
l9 0.271 0.301 0.337 0.361 0,384 0.412 0.431
20 0.265 0.294 0329 0.352 0.375 0.402 0.421
2t 0.2s9 0.287 0.321 0.344 0.366 0.392 0.411
22 0.253 0.281 0.314 0.337 0.35 8 0.384 0.402
23 0.247 0.275 0.307 0.330 0.350 0.376 0.394
24 0.242 0.269 0.301 0.323 0.343 0.368 0.386
25 0.238 0.264 0.295 0.317 0.337 0.361 0.377
26 0.233 0.259 0.290 0.310 0.330 0.354 0.371
27 0.229 0.254 0.284 0.305 0.324 0.348 0.365
28 0.225 0.250 0.279 0.300 0.3 19 0.342 0.358
29 0.221 0.246 0.275 0.29s 0.313 0.336 0.3s2
30 0.218 0.242 0.270 0.290 0.308 0.331 0.347
31 0.214 0.238 0.266 0.285 0.303 0.326 0.341
32 0.211 0.234 0.262 0.281 0.299 0321 0.336
33 0.208 0.231 0.258 0.276 0.294 0.3 16 0.33 1

34 0.215 0.227 0.254 0.2v3 0.290 0.31 l 0.326


35 0.202 0.224 0.251 0.269 0.286 0.306 0.322
36 0.1 99 0.221 0.247 0.265 0.282 0.303 0.318
l7 0.1 96 0.218 q 244 0 252 0.278 0.?99 0.31 3
38 0.194 0.215 0.241 0.258 0.275 0.295 0.309
39 0. l9l 0.213 0.23 8 0.255 0.271 0.291 0.305
40 0.1 89 0.2t0 0.235 0.252 0.268 0.288 0.302
4l 0.1 87 0.208 0.232 0.249 0.265 0.284 0.298
42 0.1 85 0.205 0.229 0.246 0.262 0.281 0.295
43 0.1 83 0.203 0.227 0.243 0.2s9 0.278 0.29t
44 0.181 0.201 0.224 0.241 0.2s6 0.275 0.288
45 0.179 0.1 98 0.222 0.238 0.253 0.272 0.285
46 0.177 0.1 96 0.219 0.235 0.250 0.269 0.282
47 0.175 0.194 0.217 0.233 0.248 0.266 0.279
48 0.173 0.192 0.215 0.231 0.24s 0.263 0.276
49 0.171 0.r90 0.2't3 0.228 0.243 0.261 0.273
50 0.170 0.1 88 0.21t 0.226 0.240 0.258 0.271
1.22 1.36 1.52 1.63 1.73 r.85 : l.es
.,t, .,1, ^'1" 'ln .,tn "ln ^'ln
458 Tablas Estadsticas

Tabla 9. Puntos porcentuales para la prueba de Grubbs

Nivel de probabilidad (o)


n 0.10 0.05 0.02
3 Ll5 1.15 Ll5
4 1.46 1.48 1.49
1.61 1,71 t.75
6 1.82 1.89 |.94
7 1.94 2.02 2.10
8 2.03 2.13 2.22
9 2.11 2.21 2.32
l0 2.18 2.29 2.4t
ll 2.23 2.36 2.48
l2 2.29 2.41 2.55
13 2.33 2,46 2.61
t4 2.31 2.51 2.66
t5 2.41 2.55 2.71
l6 2.44 2.59 2.75
t7 2.4',7 i-i
2.62 2.79
;l
18 2.50 2.65 2.82
l9 2.53 2.68 2.85
20 2.56 2.7 t 2.88
2l 2.5 8 2.73 2.91
tt 2.60 2.16 2.94
23 2.62 2.18 2.96
24 2.64 2.80 2.99
25 2.66 2.82 3.0 r

30 2.7 5 291 3.03



t
i

f
f;
tr

i
*
459

Tabla 10. Puntos porcentuales de la distribucin


del coeficiente de correlacin de Spearman

Nivel de probabilidad (o) - bilateral


n 0.005 0.01 0.02 0.05 0.1
4 1.000
5 1.000 1.000 0.900
6 1,000 L000 0.943 0.886 0.829
7 0.964 0.929 0.893 0.786 0.714
8 0.905 0.881 0.833 0.738 0.643
9 0.867 0.833 0.783 0.700 0.600
r0 0.830 0.794 0.745 0.648 0.564
1l 0.800 0.755 0.709 0.618 0.s36
12 0.776 0.727 0.671 0.587 0.503
13 0.747 0.703 0.648 0.560 0.484
l4 0.723 0.675 0.622 0.538 0.464'
l5 0.700 0.654 0.604 052t 0.443
l6 0,679 0.63 5 0.582 o.sp3 0.42e
t7 0,662 0.615 0.566 0.485 0.414
t8 0.643 0.600 0.550 0.472",,0.401
19 0.628 0.584 0.535 0.460 ' 0.391
20 0.612 0.570 0520 0.447 0.380
2t 0.599 0.556 0.508 0.43s' 0.370
22 0.586 0.544 0.496 0,425 0.361
23 0.573 0532 0.486 0.415 0.353
24 0.562 0.521 0.476 0.406 0.344
25 0.551 0.51 I 0.466 0.398 0.337
26 0.541 0.501 0.457 0.390 0.331
0.531 0.49t 0.448 0.382 0.324
28 0.522 0.483 0.440 0.3 75 0.317
29 0.5 l3 0.475 0.433 0.368 0.312
30 0.504 0.467 0.425 0.362 0.306
31 0.496 0.459 0.418 0.356 0.301
32 0.489 0.452 0.412 0.3s0 0.296
33 0.482 0.446 0.405 0.345 0.291
34 0.475 0.439 0.399 0.340 0.287
35 0.468 0.433 0.394 0.335 0.283
36 0.462 0.427 0.388 0.330 0.279
37 0.4s6 0.421 0.3 83 0.32s 0.27s
38 0.450 0.415 0.378 0.321 0.271
39 0.444 0.410 0.3'73 0.317 0.267
40 0.439 0.405 0.368 0.3 3
1 0.264
4l 0.433 0.400 0.364 0.309 0.26t
42 0.428 0.395 0.359 0,305 0.257
43 0.423 0.391 0.3 55 0.301 0.254
44 0.419 0.3 86 0.351 0.298 0.25t
45 0.414 0.382 0.347 0.294 0.248
46 0.410 0.378 0.343 0.291 0.246
47 0.405 0.374 0.340 0.288 0.243
48 0.401 0.370 0.336 0.285 0.240
49 0.397 0.366 0.333 0.282 0.238 -
50 0.393 0.363 0.329 0.279 0.235
460 Tablas Estadsticas

Tabla 11. Puntos porcentuales de la distribucin


del coeficiente de Mann-Whitnev

Nivel de probabilidad cr: 0.025

n2 z 3 4 s 6 7 8 e r0 li 12 13 t4 ls 16 t7 i8 le z0
2 00 00001111222223333
J 00 01223344556611889
4 00 | 2 3 4 5 5 6 7 8 9 10 11 t2 12 13 14 15
01 2 3 4 6 7 8 9 10 12 13 14 ls 16 r8 19 20 21
6 02 3 4 6 1 9 ll 12 14 15 11 18 20 22 23 25 26 28
7 02 4 6 I 9 ll 13 15 11 19 21 23 25 21 29 31 33 35
8 t3 5 7 9 11 t4 16 18 20 23 25 21 30 32 35 31 39 42
9 l3 5 8 11 13 16 18 2t 24 27 29 32 35 38 40 43 46 49
t0 l4 6 9 12 15 18 2t 24"21 30 34 31 4A $ 46 49 53 s6
ll l4 1 10 14 l7 20 24 21 31 34 38 41 45 48 52 56 59 63
t2 25 8 12 15 19 23 27 30 34 38 42 46 50 54 58 62 66 10
l3 25 9 13 lt 21 25 29 34 38 42 46 51 55 60 64 68 73 17
t4 26 l0 14 18 23 27 32 37 4t 46 sl s6 60 6s 10 ]s 19 84
l5 26 ll 15 20 25 30 3s 40 45 50 55 60 65 7l ',76 Bl 86 91
l6 27 12 16 22 21 32 38 43 48 54 60 65 11 13 82 87 93 99
\7 31 12 18 23 29 35 40 46 52 58 64 10 16 82 88 94 100 06 1

l8 38 13 19 2s 31 37 43 49 56 62 68 11 81 87 94 100 107 113


t9 38 14 20 26 33 39 46 53 59 66 73 19 86 93 100 r07 114 120
20 39 15 2t 28 35 42 49 56 63 70 11 84 91 99 106 113 r20 128

Nivel de probabilidad c = 0.01


nr
n2 2 3 4 5 6 7 8 9 l0 11 t2 13 t4 15 t6 t7 l8 19 20
1 0 000000000011111122
J 0 000011222333445ss6
4 0 0 0 1 2 2 3 4 4 s 6 6 7 8 8 9 10 l0 tl
5 0 0 l 2 3 4 s 6 I 8 9 l0 11 12 13 t4 ls 16 17
6 0 0 2 3 4 5 7 8 9 l0 t2 13 14 16 16 19 20 2t 23
7 0 1 2 4 5 1 8 10 12 13 ls 17 18 20 22 24 25 21 29
8 0 1 3 5 7 8 10 12 14 16 18 2t 23 25 21 29 31 33 35
9 0 2 4 6 8 10 t2 ls 1',7 19 22 24 27 29 32 34 37 39 41
10 0 2 4 7 9 t2 t4 17 20 23 25 28 31 34 31 39 42 45 48
ll 0 2 5 8 10 13 t6 19 23 26 29 32 35 38 42 45 48 51 54
t2 0 3 6 9 12 15 182225293236394341 50 54st 6l )i
{
13 1 3 6 10 13 17 21 24 28 32 36 40 44 48 s2 s6 60 64 68
t4 1 3 I 11 14 18 23 27 31 35 39 44 48 52 51 64 66 72 14 *
15 I 4 8 12 t6 20 25 29 34 38 43 48 s2 57 62 61 71 76 8l
t6 I 4 8 13 17 22 27 32 31 42 41 52 57 62 61 12 t1 83 88 ,

5 9 14 t9 24 29 34 39 45 50 s6 61 67 12 78 83 89 94
.:

t7 I
I
18 I 5 l0 15 20 25 31 37 42 48 54 60 66 71 77 83 89 95 101 rl

l9 2 5 l0 16 21 27 33 39 45 51 51 64 70 16 83 89 95 102 108 f
20 2 6 ll 17 23 29 35 41 48 54 6t 68 t4 81 88 94 101 108 115

&
:j,

También podría gustarte